Novo modelo supera GPT-5.4 em programação e uso de computador, com salto de quase 7 pontos em correção de bugs em projetos reais.
A Anthropic lançou o Claude Opus 4.7 com avanços significativos em programação e uso autônomo de computador. No SWE-bench Verified, que mede a capacidade de corrigir bugs em projetos reais de software, o modelo atingiu 87,6% — salto de quase 7 pontos em relação ao Opus 4.6 (80,8%). No uso de computador (navegar tela, clicar, preencher formulários), completou 78% das tarefas, contra 72,7% antes.
O Opus 4.7 introduz o nível de esforço 'xhigh' e suporta resolução de imagem 3x maior (3,75 megapixels). A Anthropic ressaltou que o modelo é 'menos amplamente capaz' que o Claude Mythos Preview, que lidera a maioria dos benchmarks com 93,9% no SWE-bench Verified.
2 abr, 09:00
28 mar, 09:00
26 mar, 09:00
14 mar, 09:00
5 mar, 09:00