Benchmarks do Claude Opus 4.7 explicados
Vellum AI: Análise detalhada dos benchmarks do Opus 4.7, mostrando avanço em programação, uso de ferramentas e computador.
|
17/04 às 09:00
Pontos principais
- SWE-bench Verified salta de 80,8% para 87,6%
- Lidera MCP-Atlas com 77,3% em uso de ferramentas
- Preço mantido em US$5/US$25 por milhão de tokens
Mencionado nesta matéria
Organizações
AnthropicCursorRakuten
