Startup alemã inova ao desvendar os segredos da Caixa Preta do ChatGPT

A atualização da Aleph Alphas torna os modelos de IA geradores de sua família Luminous explicáveis. Isso abre novos aplicativos para IA geradora, mesmo em tarefas críticas.

A startup alemã de IA Aleph Alpha está introduzindo um novo recurso para sua própria família Luminous de modelos geradores de IA que visa tornar suas saídas explicáveis e verificáveis.

Índice

1 Modelos atuais de IA geradora falham em fornecer “IA explicável”

2 O Luminous agora pode reter a saída sem fontes confiáveis

3 Como funciona o AtMan?

Modelos atuais de IA geradora falham em fornecer “IA explicável”

Enquanto modelos de IA geradores, como ChatGPT ou GPT-4, estão transformando indústrias inteiras, eles têm um grande problema: suas saídas não são explicáveis. Embora eles ainda possam ser úteis em áreas críticas, como a medicina, sua falta de explicabilidade representa muitos perigos.

Os métodos de IA explicáveis (XAI) tentam resolver esse problema e tornar as saídas desses modelos de IA explicáveis e verificáveis.

No início de 2023, pesquisadores da startup alemã de IA Aleph Alpha, da TU Darmstadt, do centro de pesquisa Hessian.AI e do Centro Alemão de Pesquisa de Inteligência Artificial (DFKI) apresentaram o AtMan, um método XAI que torna explicáveis as gerações de tais modelos baseados em transformadores para texto e imagens.

O Luminous agora pode reter a saída sem fontes confiáveis

O AtMan está agora disponível para modelos Luminous e pode ser aplicado a texto e imagens, de acordo com Aleph Alpha. Este é um passo importante para uma maior explicabilidade e verificabilidade – um requisito regulatório para modelos de IA geradores que provavelmente virá em breve com a Lei de IA da UE.

“Essa transparência permitirá o uso de IA generativa para tarefas críticas em direito, saúde e bancos – áreas que dependem fortemente de informações confiáveis e precisas”, disse Jonas Andrulis, CEO e fundador da Aleph Alpha.

Com o novo recurso, a Aleph Alpha diz que pode inferir fatos na saída do modelo, mas também reter diretamente a saída sem fontes confiáveis apropriadas.

“Nossos clientes muitas vezes têm conhecimento interno verificado de grande valor. Agora podemos aproveitar isso e garantir que um assistente de IA use com sucesso apenas esse conhecimento e sempre forneça contexto ”, disse Andrulis.

Como funciona o AtMan?

O AtMan da Aleph Alpha usa um método de perturbação para analisar o efeito de um token na geração de outro. Isso é feito usando perturbações para medir como a síntese de um token muda devido à supressão de outras palavras. Um exemplo ilustrativo mostra como a frase “Ben gosta de comer hambúrgueres e” é continuada com a palavra “batatas fritas”.

O valor de entropia cruzada calculado pelo AtMan é usado para determinar o quanto a frase como um todo influenciou a geração da palavra “batatas fritas”. Em seguida, cada palavra é sistematicamente suprimida para ver como o valor da entropia cruzada muda. Neste exemplo, o valor aumenta significativamente quando a palavra “hambúrguer” é suprimida. O método XAI identifica com sucesso a palavra que tem maior influência na síntese de “batatas fritas”.

Com os reguladores de privacidade da UE analisando mais de perto o ChatGPT da OpenAI e a iminente lei de IA da UE, a empresa norte-americana provavelmente terá que adaptar tecnologias semelhantes para garantir que seus modelos permaneçam disponíveis no mercado da UE.

Fonte: andrelug