GPT-5, Claude e Gemini ficam abaixo de 1% no ARC-AGI-3
DEV Community: análise detalhada dos resultados iniciais mostra que todos os LLMs de fronteira falharam no novo benchmark.
|
26/03 às 09:00
Pontos principais
- GPT-5, Claude e Gemini marcaram menos de 1%
- CNNs simples alcançaram 12,58%
- Competição oferece mais de $2 milhões em prêmios
- Submissões até 2 de novembro de 2026
Mencionado nesta matéria
Pessoas
François Chollet
Organizações
ARC Prize
