SAÚDE

Nova IA do ChatGPT recria sua voz e surpreende com comportamentos inusitados, aponta anĂĄlise

2025 word3
Grupo do Whatsapp CuiabĂĄ

Em maio, a OpenAI apresentou o novo cĂ©rebro do serviço ChatGPT: o algoritmo GPT-4o, que Ă© capaz de trabalhar com ĂĄudio e vĂ­deo, alĂ©m de prompts de texto (dai o “o” do nome: ele significa omni, ou “todos”, para representar as habilidades multimodais da nova IA). Na Ă©poca, o GPT-4o gerou uma polĂȘmica envolvendo a atriz Scarlet Johansson – a fala sintetizada da IA era muito parecida com a da atriz, que disse ter sido procurada pela OpenAI, interessada em clonar sua voz. 

Johansson nĂŁo quis, mas mesmo assim a voz do GPT-4o saiu quase igual Ă  dela – e a OpenAI foi acusada de ter feito isso Ă  revelia da atriz. A empresa negou, mas resolveu adiar o lançamento do Advanced Voice Mode, o sistema de fala do GPT-4o, alegando que precisava fazer mais testes para garantir “altos padrĂ”es de segurança e confiabilidade”. Agora, em agosto, a OpenAI publicou o GPT-4o System Card, um relatĂłrio com os resultados desses testes – e eles revelam que o algoritmo pode adotar comportamentos estranhos.

Por exemplo: se vocĂȘ estiver falando com o GPT-4o num “ambiente com alto ruĂ­do de fundo”, o robĂŽ pode “gerar uma resposta emulando a voz do usuĂĄrio”, diz o documento. O bot passa a imitar o tom de voz da pessoa, sem que haja qualquer razĂŁo para isso. AlĂ©m disso, em situaçÔes de muito barulho, as respostas podem incluir palavras gritadas pela IA – tambĂ©m sem motivo.  

O documento da OpenAI afirma que o GPT-4o Ă© capaz de gerar “vocalizaçÔes” imprĂłprias, incluindo “gemido erĂłtico, grito violento e sons de tiros”, se for instruido pelo usuĂĄrio a isso. A empresa afirma ter inserido um bloqueio no algoritmo, para impedi-lo de gerar esses sons. 

O relatório da OpenAI avalia o risco associado ao GPT-4o em quatro aspectos: Cibersegurança (uso da IA para gerar ataques contra outros sistemas), Ameaças Biológicas (uso da IA para desenvolver vírus e outras armas biológicas), Persuasão (a habilidade da IA de gerar respostas que manipulam a opinião do usuårio) e Autonomia do modelo (capacidade do algoritmo de driblar os mecanismos de segurança colocados nele). 

O risco nas categorias Cibersegurança, Ameaças biolĂłgicas e Autonomia do GPT-4o foi classificado como Baixo; no aspecto PersuasĂŁo, foi considerado MĂ©dio. A OpenAI adota uma escala com quatro nĂ­veis de risco (Baixo, MĂ©dio, Alto e CrĂ­tico). Algoritmos que demonstrem risco CrĂ­tico durante os testes, afirma a empresa, tĂȘm seu desenvolvimento interrompido. Para que uma IA seja liberada ao pĂșblico, deve apresentar risco MĂ©dio ou Baixo.  

O GPT-4o jĂĄ estĂĄ rodando no ChatGPT, mas hĂĄ um porĂ©m: somente os usuĂĄrios da versĂŁo paga, que custa US$ 20 mensais, tĂȘm acesso ao algoritmo completo (a versĂŁo gratuita do serviço utiliza o GPT-4o mini, mais limitado). O Advanced Voice Mode estĂĄ sendo liberado aos poucos, em carĂĄter experimental, nos apps do ChatGPT para iOS e Android.  

Fonte: abril

Sobre o autor

Avatar de Redação

Redação

Estamos empenhados em estabelecer uma comunidade ativa e solidåria que possa impulsionar mudanças positivas na sociedade.