OpenAI traz raciocínio de classe GPT-5 para voz em tempo real — e isso muda o que agentes de voz podem realmente orquestrar
A OpenAI lançou três novos modelos de voz especializados que utilizam raciocínio de classe GPT-5 para otimizar a orquestração de agentes de voz em ambientes corporativos.
|
08/05 às 18:41
Pontos principais
- A OpenAI introduziu os modelos GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper.
- O modelo Realtime-2 oferece raciocínio de nível GPT-5 para conversas naturais e complexas.
- A nova arquitetura separa tarefas de tradução, transcrição e raciocínio em modelos especializados em vez de um sistema único.
- A mudança visa reduzir custos operacionais e limitações de contexto enfrentadas por empresas ao implementar agentes de voz.
- Os novos modelos competem diretamente com a linha Voxtral da Mistral no mercado corporativo.
- Empresas são orientadas a avaliar suas arquiteturas de orquestração para gerenciar melhor o fluxo de dados em janelas de contexto de 128K tokens.
Mencionado nesta matéria
Organizações
OpenAIMistral

