OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

A OpenAI apresentou três modelos especializados da família GPT-Realtime, focados em raciocínio avançado, tradução e transcrição de baixa latência.

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real — Foto: Techmeme

08/05 às 09:07 · atualizado há 1m

Pontos principais

A nova linha inclui o GPT-Realtime-2, com raciocínio de nível GPT-5, além dos modelos especializados em tradução e transcrição.
A arquitetura separa tarefas de processamento para otimizar custos e eficiência em aplicações corporativas.
Os modelos suportam janelas de contexto de 128K tokens, visando a orquestração complexa de agentes de voz.
A iniciativa compete com soluções como a linha Voxtral, da Mistral, no mercado de agentes de IA.

A OpenAI anunciou o lançamento de três novos modelos de voz da família GPT-Realtime, projetados para operar em tempo real e transformar a interação com interfaces de inteligência artificial. Disponibilizados via API, os modelos permitem que desenvolvedores criem aplicações que reagem dinamicamente às conversas. O GPT-Realtime-2 destaca-se pelo raciocínio avançado, com capacidade de nível GPT-5, enquanto o GPT-Realtime-Translate oferece tradução em mais de 70 idiomas e o GPT-Realtime-Whisper foca em transcrição de baixa latência.

Além das capacidades técnicas, a nova arquitetura da OpenAI separa as tarefas de tradução, transcrição e raciocínio em modelos especializados, em vez de utilizar um sistema único. Essa mudança estratégica visa reduzir custos operacionais e contornar limitações de contexto enfrentadas por empresas ao implementar agentes de voz. Com suporte a janelas de contexto de 128K tokens, a solução busca otimizar a orquestração de fluxos de dados, posicionando a OpenAI como uma competidora direta da linha Voxtral, da Mistral, no mercado corporativo.

Tópicos relacionados

Inteligência Artificial

Fontes

OpenAI brings GPT-5-class reasoning to real-time voice — and it changes what voice agents can actually orchestrate

Venturebeat • 8 mai, 18:41

OpenAI lança três novos modelos de voz que funcionam em tempo real

Times Brasil • 8 mai, 08:48

OpenAI launches three voice models in the API: GPT-Realtime-2 with GPT-5-class reasoning, GPT-Realtime-Whisper for transcription, and GPT-Realtime-Translate (Zac Hall/9to5Mac)

Techmeme • 7 mai, 15:20

Comentários

Carregando comentários...

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

Pontos principais

Tópicos relacionados

Fontes

OpenAI brings GPT-5-class reasoning to real-time voice — and it changes what voice agents can actually orchestrate

OpenAI lança três novos modelos de voz que funcionam em tempo real

OpenAI launches three voice models in the API: GPT-Realtime-2 with GPT-5-class reasoning, GPT-Realtime-Whisper for transcription, and GPT-Realtime-Translate (Zac Hall/9to5Mac)

Leia também

OpenAI desenvolve modelo GPT-Bidi-1 para conversas mais naturais

OpenAI lança GPT-5.5 Instant com redução de alucinações e nova memória

OpenAI lança GPT-5.5, codinome "Spud", e publica Card do Sistema

OpenAI lança ChatGPT Images 2.0 com melhorias em texto e complexidade

OpenAI lança GPT-5.3 Instant e divulga cartão do sistema

Comentários

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

Pontos principais

Tópicos relacionados

Fontes

OpenAI brings GPT-5-class reasoning to real-time voice — and it changes what voice agents can actually orchestrate

OpenAI lança três novos modelos de voz que funcionam em tempo real

OpenAI launches three voice models in the API: GPT-Realtime-2 with GPT-5-class reasoning, GPT-Realtime-Whisper for transcription, and GPT-Realtime-Translate (Zac Hall/9to5Mac)

Leia também

OpenAI desenvolve modelo GPT-Bidi-1 para conversas mais naturais

OpenAI lança GPT-5.5 Instant com redução de alucinações e nova memória

OpenAI lança GPT-5.5, codinome "Spud", e publica Card do Sistema

OpenAI lança ChatGPT Images 2.0 com melhorias em texto e complexidade

OpenAI lança GPT-5.3 Instant e divulga cartão do sistema

Comentários