Daily Journal

O Futuro da Informação

Daily Journal

Benchmarks do Claude Opus 4.7 explicados

Vellum AI: Análise detalhada dos benchmarks do Opus 4.7, mostrando avanço em programação, uso de ferramentas e computador.

Daily Journal
|
17/04 às 09:00

Pontos principais

  • SWE-bench Verified salta de 80,8% para 87,6%
  • Lidera MCP-Atlas com 77,3% em uso de ferramentas
  • Preço mantido em US$5/US$25 por milhão de tokens

Mencionado nesta matéria

Organizações

AnthropicCursorRakuten