Daily Journal

O Futuro da Informação

Benchmark de questões acadêmicas de nível especialista para avaliar capacidades de IA

Nature: Publicação do HLE como ferramenta permanente para medir progresso da IA contra a fronteira de expertise humana.

Daily Journal
|
14/03 às 09:00

Pontos principais

  • 2.500 questões em 100+ disciplinas
  • Benchmark disponível publicamente em lastexam.ai
  • Publicado como Nature 2026; 649(8099): 1139

Mencionado nesta matéria

Pessoas

Tung Nguyen

Organizações

Texas A&M UniversityOpenAIAnthropicGoogle DeepMind