Benchmark de questões acadêmicas de nível especialista para avaliar capacidades de IA
Nature: Publicação do HLE como ferramenta permanente para medir progresso da IA contra a fronteira de expertise humana.
|
14/03 às 09:00
Pontos principais
- 2.500 questões em 100+ disciplinas
- Benchmark disponível publicamente em lastexam.ai
- Publicado como Nature 2026; 649(8099): 1139
Mencionado nesta matéria
Pessoas
Tung Nguyen
Organizações
Texas A&M UniversityOpenAIAnthropicGoogle DeepMind
