Sophia @princesinhamt
Tecnologia

para revolucionar o futuro da tecnologia: o que Ă© e como funciona?

2025 word3
Grupo do Whatsapp CuiabĂĄ

I-JEPA mostra como o chefe de IA da Meta, Yann LeCun, enxerga o futuro da IA – e tudo começa novamente com os benchmarks do ImageNet.

HorĂłscopo chinĂȘs 2023 ano do coel


Please enable JavaScript

HorĂłscopo chinĂȘs 2023 ano do coelho de ĂĄgua preta

var cid = ‘8108194658’;
var pid = ‘ca-pub-2532350215540740’;
var slotId = ‘div-gpt-ad-andrelug_com-box-3-0’;
var ffid = 1;
var alS = 1002 % 1000;

var container = document.getElementById(slotId);
var ins = document.createElement(‘ins’);
ins.id = slotId + ‘-asloaded’;
ins.className = ‘adsbygoogle ezasloaded’;

ins.dataset.adClient = pid;
ins.dataset.adChannel = cid;

ins.style.display = ‘block’;
ins.style.minWidth = container.attributes.ezaw.value + ‘px’;
ins.style.width = ‘100%’;

ins.style.height = container.attributes.ezah.value + ‘px’;

container.style.maxHeight = container.style.minHeight + ‘px’;
container.style.maxWidth = container.style.minWidth + ‘px’;

container.appendChild(ins);

(adsbygoogle = window.adsbygoogle || []).push({});

window.ezoSTPixelAdd(slotId, ‘stat_source_id’, 44);
window.ezoSTPixelAdd(slotId, ‘adsensetype’, 1);

var lo = new MutationObserver(window.ezaslEvent);
lo.observe(document.getElementById(slotId + ‘-asloaded’), { attributes: true });

HĂĄ menos de um ano, o pioneiro da IA e chefe de IA da Meta, Yann LeCun, revelou uma nova arquitetura de IA projetada para superar as limitaçÔes dos sistemas atuais, como alucinaçÔes e fraquezas lĂłgicas. Com o I-JEPA, uma equipe da Meta AI (FAIR), Universidade McGill, Mila, Instituto de IA de Quebec e Universidade de Nova York apresenta um dos primeiros modelos de IA a seguir a “Arquitetura de PrevisĂŁo de Incorporação Conjunta”. Os pesquisadores incluem o primeiro autor Mahmoud Assran e Yann LeCun.

O modelo baseado no Vision Transformer alcança alto desempenho em benchmarks que vão desde classificação linear até contagem de objetos e previsão de profundidade, e é mais eficiente em termos de computação do que outros modelos de visão computacional amplamente utilizados.

var cid = ‘8108194658’;
var pid = ‘ca-pub-2532350215540740’;
var slotId = ‘div-gpt-ad-andrelug_com-medrectangle-3-0’;
var ffid = 1;
var alS = 1021 % 1000;

var container = document.getElementById(slotId);
var ins = document.createElement(‘ins’);
ins.id = slotId + ‘-asloaded’;
ins.className = ‘adsbygoogle ezasloaded’;

ins.dataset.adClient = pid;
ins.dataset.adChannel = cid;

ins.style.display = ‘block’;
ins.style.minWidth = container.attributes.ezaw.value + ‘px’;
ins.style.width = ‘100%’;

ins.style.height = container.attributes.ezah.value + ‘px’;

container.style.maxHeight = container.style.minHeight + ‘px’;
container.style.maxWidth = container.style.minWidth + ‘px’;

container.appendChild(ins);

(adsbygoogle = window.adsbygoogle || []).push({});

window.ezoSTPixelAdd(slotId, ‘stat_source_id’, 44);
window.ezoSTPixelAdd(slotId, ‘adsensetype’, 1);

var lo = new MutationObserver(window.ezaslEvent);
lo.observe(document.getElementById(slotId + ‘-asloaded’), { attributes: true });

O I-JEPA aprende com representaçÔes abstratas

O I-JEPA Ă© treinado de forma auto-supervisionada para prever detalhes das partes nĂŁo visĂ­veis de uma imagem. Isso Ă© feito simplesmente mascarando grandes blocos dessas imagens cujo conteĂșdo o I-JEPA deve prever. Outros mĂ©todos muitas vezes dependem de dados de treinamento muito mais extensos.

Para garantir que o I-JEPA aprenda representaçÔes semùnticas de nível superior dos objetos e não opere no nível de pixel ou token, a Meta coloca uma espécie de filtro entre a previsão e a imagem original.

Além de um codificador de contexto, que processa as partes visíveis de uma imagem, e um preditor, que usa a saída do codificador de contexto para prever a representação de um bloco-alvo na imagem, o I-JEPA consiste em um codificador-alvo. Este codificador-alvo fica entre a imagem completa, que serve como sinal de treinamento, e o preditor.

if(typeof ez_ad_units != ‘undefined’){ez_ad_units.push([[336,280],’andrelug_com-medrectangle-4â€Č,’ezslot_4â€Č,113,’0â€Č,’0â€Č])};__ez_fad_position(‘div-gpt-ad-andrelug_com-medrectangle-4-0’);

O modelo I-JEPA
Para Revolucionar O Futuro Da Tecnologia: O Que É E Como Funciona? 2

Assim, a previsĂŁo do I-JEPA nĂŁo Ă© feita no nĂ­vel de pixel, mas sim no nĂ­vel de representaçÔes abstratas Ă  medida que a imagem Ă© processada pelo codificador-alvo. Com isso, o modelo utiliza “metas de previsĂŁo abstratas em que detalhes desnecessĂĄrios em nĂ­vel de pixel sĂŁo potencialmente eliminados”, afirma a Meta, levando o modelo a aprender caracterĂ­sticas mais semĂąnticas.

if(typeof ez_ad_units != ‘undefined’){ez_ad_units.push([[580,400],’andrelug_com-box-4â€Č,’ezslot_6â€Č,911,’0â€Č,’0â€Č])};__ez_fad_position(‘div-gpt-ad-andrelug_com-box-4-0’);

I-JEPA se destaca no ImageNet

As representaçÔes aprendidas podem entĂŁo ser reutilizadas para diferentes tarefas, permitindo que o I-JEPA alcance Ăłtimos resultados no ImageNet com apenas 12 exemplos rotulados por classe. O modelo com 632 milhĂ”es de parĂąmetros foi treinado em 16 GPUs Nvidia A100 em menos de 72 horas. Outros mĂ©todos geralmente requerem de duas a dez vezes mais horas de GPU e obtĂȘm taxas de erro piores quando treinados com a mesma quantidade de dados.

O I-JEPA alcança altas pontuaçÔes no ImageNet com uma sobrecarga computacional relativamente baixa.
O I-Jepa Alcança Altas PontuaçÔes No Imagenet Com Uma Sobrecarga Computacional Relativamente Baixa. | Imagem: Meta

Em um experimento, a equipe utiliza um modelo de IA generativo para visualizar as representaçÔes do I-JEPA e mostra que o modelo aprende conforme o esperado.

Durante o treinamento, o preditor deve prever o conteĂșdo na caixa azul. Os resultados visĂ­veis aqui foram produzidos usando um modelo de IA generativa conectado ao mĂłdulo de Preditor.
Durante O Treinamento, O Preditor Deve Prever O ConteĂșdo Na Caixa Azul. Os Resultados VisĂ­veis Aqui Foram Produzidos Usando Um Modelo De Ia Generativa Conectado Ao MĂłdulo De Preditor. | Imagem: Meta

O I-JEPA Ă© uma prova de conceito para a arquitetura proposta, cujo elemento central Ă© uma espĂ©cie de filtro entre a previsĂŁo e os dados de treinamento, que por sua vez possibilita representaçÔes abstratas. De acordo com LeCun, tais abstraçÔes poderiam permitir que os modelos de IA se assemelhem mais ao aprendizado humano, façam inferĂȘncias lĂłgicas e resolvam o problema de alucinação na IA generativa.

O JEPA poderia viabilizar modelos do mundo

O objetivo geral dos modelos JEPA nĂŁo Ă© apenas reconhecer objetos ou gerar texto – LeCun deseja viabilizar modelos abrangentes do mundo que funcionem como parte de uma inteligĂȘncia artificial autĂŽnoma. Para isso, ele propĂ”e empilhar os JEPA de forma hierĂĄrquica para possibilitar previsĂ”es em um nĂ­vel mais alto de abstração com base em previsĂ”es de mĂłdulos inferiores.

“Seria especialmente interessante avançar os JEPA para aprender modelos mais gerais do mundo a partir de modalidades mais ricas, por exemplo, permitindo fazer previsĂ”es espaciais e temporais de longo alcance sobre eventos futuros em um vĂ­deo a partir de um contexto curto e condicionando essas previsĂ”es a prompts de ĂĄudio ou texto”, afirma a Meta.

Portanto, o JEPA serĂĄ aplicado a outros domĂ­nios, como pares de imagem-texto ou dados de vĂ­deo. “Este Ă© um passo importante para aplicar e escalar mĂ©todos auto-supervisionados para aprender um modelo geral do mundo”, afirma o blog.

LeCun fornece mais insights sobre a motivação, desenvolvimento e funcionamento do JEPA em uma palestra no Instituto de IA Experencial da Universidade Northeastern.

Mais informaçÔes estĂŁo disponĂ­veis no meta-blog do I-JEPA. O modelo e o cĂłdigo estĂŁo disponĂ­veis no GitHub. Com conteĂșdo do The Decoder.

if(typeof ez_ad_units != ‘undefined’){ez_ad_units.push([[728,90],’andrelug_com-large-leaderboard-2â€Č,’ezslot_7â€Č,116,’0â€Č,’0â€Č])};__ez_fad_position(‘div-gpt-ad-andrelug_com-large-leaderboard-2-0’);

Fonte: Andre Lug

Sobre o autor

Avatar de FĂĄbio Neves

FĂĄbio Neves

Jornalista DRT 0003133/MT - O universo de cada um, se resume no tamanho do seu saber. Vamos ser a mudança que, queremos ver no Mundo