A Anthropic apresentou o BioMysteryBench, uma ferramenta para avaliar as capacidades de bioinformática do seu modelo de IA Claude, revelando que o Mythos resolveu 30% de questões que desafiaram especialistas.

A Anthropic, empresa de inteligência artificial, anunciou o lançamento do BioMysteryBench, uma nova ferramenta de benchmark projetada para testar as capacidades de bioinformática do seu modelo de IA, o Claude. O objetivo é comparar o desempenho do modelo com o de especialistas humanos em tarefas complexas da área.
Nos testes iniciais, o modelo Mythos da Anthropic conseguiu resolver cerca de 30% de um conjunto de 23 questões que haviam sido consideradas insolúveis por especialistas humanos. Este resultado destaca o potencial da IA em auxiliar na resolução de desafios científicos complexos, especialmente em campos como a bioinformática.
28 abr, 13:04
15 abr, 09:00
12 abr, 12:02
9 abr, 09:00
26 mar, 15:03