OpenAI traz raciocínio de classe GPT-5 para voz em tempo real — e isso muda o que agentes de voz podem realmente orquestrar

A OpenAI lançou três novos modelos de voz especializados que utilizam raciocínio de classe GPT-5 para otimizar a orquestração de agentes de voz em ambientes corporativos.

08/05 às 18:41

Pontos principais

A OpenAI introduziu os modelos GPT-Realtime-2, GPT-Realtime-Translate e GPT-Realtime-Whisper.
O modelo Realtime-2 oferece raciocínio de nível GPT-5 para conversas naturais e complexas.
A nova arquitetura separa tarefas de tradução, transcrição e raciocínio em modelos especializados em vez de um sistema único.
A mudança visa reduzir custos operacionais e limitações de contexto enfrentadas por empresas ao implementar agentes de voz.
Os novos modelos competem diretamente com a linha Voxtral da Mistral no mercado corporativo.
Empresas são orientadas a avaliar suas arquiteturas de orquestração para gerenciar melhor o fluxo de dados em janelas de contexto de 128K tokens.

Mencionado nesta matéria

Organizações

OpenAIMistral

Faz parte de

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

8 mai, 09:07 • Daily Journal • 3 fontes

Fonte

Ver matéria original

Venturebeat • 8 mai, 18:41