Anthropic lança BioMysteryBench para testar Cl...

A Anthropic, empresa de inteligência artificial, anunciou o lançamento do BioMysteryBench, uma nova ferramenta de benchmark projetada para testar as capacidades de bioinformática do seu modelo de IA, o Claude. O objetivo é comparar o desempenho do modelo com o de especialistas humanos em tarefas complexas da área.

Nos testes iniciais, o modelo Mythos da Anthropic conseguiu resolver cerca de 30% de um conjunto de 23 questões que haviam sido consideradas insolúveis por especialistas humanos. Este resultado destaca o potencial da IA em auxiliar na resolução de desafios científicos complexos, especialmente em campos como a bioinformática.

O Futuro da Informação

Anthropic lança BioMysteryBench para testar Claude em bioinformática

Pontos principais

Tópicos relacionados

Fontes

Anthropic unveils BioMysteryBench to test Claude's bioinformatics skills against human experts, and says Mythos solved ~30% of 23 questions that stumped experts (Anthropic)

Leia também

Anthropic destaca Claude como ferramenta para profissionais criativos

IAs da Anthropic resolvem 97% de tarefa de alinhamento; humanos ficam em 23%

IA Mythos da Anthropic expõe vulnerabilidades de cibersegurança

Meta lança Muse Spark, primeiro modelo do Superintelligence Labs sob Alexandr Wang

Anthropic lança Claude Sonnet 4.6 e Opus 4.6 com melhorias em IA