O Futuro da Informação

GPT-5, Claude e Gemini ficam abaixo de 1% no ARC-AGI-3

DEV Community: análise detalhada dos resultados iniciais mostra que todos os LLMs de fronteira falharam no novo benchmark.

|

26/03 às 09:00

Pontos principais

GPT-5, Claude e Gemini marcaram menos de 1%
CNNs simples alcançaram 12,58%
Competição oferece mais de $2 milhões em prêmios
Submissões até 2 de novembro de 2026

Mencionado nesta matéria

Pessoas

François Chollet

Organizações

ARC Prize

Fonte

Ver matéria original

Dev.to • 26 mar, 09:00