ARC-AGI-3: o primeiro benchmark de raciocínio interativo
ARC Prize: página oficial apresenta o formato interativo do benchmark e os critérios de avaliação.
|
26/03 às 09:00
Pontos principais
- Benchmark mede inteligência ao longo do tempo, não apenas respostas finais
- Captura horizontes de planejamento e compressão de memória
Mencionado nesta matéria
Pessoas
François Chollet
Organizações
ARC Prize
