GPT-5.5 está disponível — o que os números realmente dizem
DEV Community: análise dos benchmarks do GPT-5.5, incluindo Terminal-Bench 2.0 (82,7%) e OSWorld-Verified (78,7%).
|
24/04 às 09:00
Pontos principais
- Terminal-Bench 2.0: GPT-5.5 82,7%, GPT-5.4 75,1%, Claude Opus 4.7 69,4%
- OSWorld-Verified: GPT-5.5 78,7%, Claude Opus 4.7 78,0%
- Lançado seis semanas após o GPT-5.4
Mencionado nesta matéria
Pessoas
Sam Altman
Organizações
OpenAIAnthropicMicrosoftNvidia
