VocĂȘ jĂĄ se perguntou se o texto que vocĂȘ estĂĄ lendo em algum lugar da internet (como esse aqui mesmo), foi gerado pelo ChatGPT? Um grupo de pesquisadores criou um novo mĂ©todo para estimar se um texto foi gerado por uma inteligĂȘncia artificial ou nĂŁo.
Com o sucesso das inteligĂȘncias artificiais generativas e dos modelos de linguagem (large language model ou LLM), essas tecnologias sĂŁo empregadas em quase tudo. Elas sĂŁo utilizadas para a produção de biografias, vĂdeos, e atĂ© mesmo filmes.
Assim, pesquisadores da Universidade Northwestern, nos EUA, e da Universidade de TĂŒbingen, na Alemanha, desenvolveram um mĂ©todo para analisar a frequĂȘncia que certas palavras sĂŁo repetidas em textos cientĂficos.
Eles descobriram que algumas palavras se tornaram mais frequentes em resumos de artigos cientĂficos nos anos de 2023 e 2024, perĂodo em que as LLM se popularizaram. O mĂ©todo desenvolvido pelos autores sugere que pelo menos 10% dos resumos foram processados utilizando IAs sĂł em 2024.
O mĂ©todo foi inspirado em pesquisas e estudos realizados no decorrer da pandemia do coronavĂrus, que mediram o impacto do nĂșmero de mortes por Covid 19 durante e apĂłs a pandemia.Â
Eles analisaram 14 milhĂ”es de resumos de artigos cientĂficos publicados no banco de dados do PubMed entre os anos de 2010 e 2024. Nos resumos, foi observada a frequĂȘncia relativa que determinadas palavras apareciam a cada ano.Â
Depois dessa etapa, eles analisaram a frequĂȘncia que essas palavras apareciam antes e apĂłs 2023, ano que marca o surgimento dos modelos LLM.
Os resultados mostraram que vĂĄrias palavras atĂ© entĂŁo incomuns em resumos cientĂficos começaram a aparecer de forma constante. A palavra delves (aprofundar, em inglĂȘs), por exemplo, apareceu pelo menos 25 vezes mais em artigos em 2024 do que costumava aparecer antes.
Jå palavras como showcasing (exibindo) ou underscore (ressaltar), apareceram nove vezes mais. Outras palavras também tiveram aumento, como potential (potencial), que aumentou em 4,1%, findings (descobertas) que cresceu em 2,7%, e crucial (crucial) que subiu 2,6%.
O aumento da utilização de determinadas palavras Ă© algo relativamente comum, e pode acontecer independente do uso de IAs. Entretanto, o aumento grande e repentino de um ano para o outro geralmente estĂĄ ligado a grandes eventos mundiais, como eventos de saĂșde, como o ebola em 2015; a zika em 2017; e coronavĂrus, bloqueio e pandemia, no perĂodo de 2020 a 2022.
Enquanto as palavras que cresceram durante a pandemia eram substantivos, as mais comuns apĂłs ao surgimento das IAs foram âpalavras de estiloâ, como verbos, adjetivos e advĂ©rbios. Alguns exemplos sĂŁo palavras como across (atravĂ©s), additionally (adicionalmente), comprehensive (compreensivo), crucial (crucial), enhancing (melhorado), exhibited (exibido), notably (notavelmente), particularly (particularmente), e within (dentro).
Veja como Ă© possĂvel identificar essas palavras e de que forma elas costumam aparecer nos resumos:
âA comprehensive grasp of the intricate interplay between [âŠ] and [âŠ] is pivotal for effective therapeutic strategiesâ (Uma compreensĂŁo abrangente da interação intrincada entre [âŠ] e [âŠ] Ă© crucial para estratĂ©gias terapĂȘuticas eficazes.)
Com a utilização cada vez maior de IA generativas, Ă© importante que as pessoas passem a notar essas palavras, jĂĄ que essas ferramentas Ă s vezes inventam referĂȘncias, fornecem resumos imprecisos ou fazem afirmaçÔes falsas que parecem convincentes.
Fonte: abril