Modelo supera humanos em benchmark de navegação desktop e iguala profissionais em 83% das comparações de trabalho cognitivo.
A OpenAI lançou o GPT-5.4 em 5 de março com uso nativo de computadores, janela de contexto de 1 milhão de tokens e um sistema de Tool Search que reduz consumo de tokens em 47% em sistemas de agentes. No benchmark OSWorld-Verified de navegação desktop, o modelo marca 75% — superando os 72,4% dos humanos — enquanto o GPT-5.2 ficava em 47,3%.
No GDPval, que avalia trabalho de conhecimento em 44 profissões, o modelo iguala ou supera profissionais humanos em 83% das comparações. Alucinações caíram 33%. A cadência de lançamentos é acelerada: dois dias entre versões maiores, enquanto usuários cancelam assinaturas em protesto contra o contrato com o Pentágono.
8 mar, 09:00
7 mar, 09:00
7 mar, 09:00
5 mar, 17:01
1 mar, 13:19