OpenAI lança três novos modelos de voz que funcionam em tempo real

A OpenAI lançou três novos modelos de voz, da família GPT-Realtime, que operam em tempo real para agilizar tarefas, traduzir conversas e transcrever falas, representando um avanço na interação com agentes de IA.

08/05 às 08:48

Pontos principais

A OpenAI apresentou três novos modelos de voz em tempo real, da família GPT-Realtime, para agilizar tarefas e melhorar a interação com IA.
Os modelos são projetados para desenvolvedores criarem aplicações de voz que ofereçam experiências de áudio em tempo real, reagindo dinamicamente às conversas.
O GPT-Realtime-2 oferece raciocínio avançado para gerenciar solicitações complexas e acompanhar conversas naturais.
O GPT-Realtime-Translate permite tradução em tempo real de fala em mais de 70 idiomas de entrada para 13 de saída, ideal para atendimento ao cliente e educação.
O GPT-Realtime-Whisper é um novo sistema de conversão de voz em texto com baixa latência, transcrevendo a fala enquanto o usuário fala.
A empresa afirma que esses modelos transformam o áudio em tempo real, permitindo que as interfaces de voz ouçam, raciocinem, traduzam, transcrevam e ajam conforme a conversa se desenvolve.

Mencionado nesta matéria

Organizações

OpenAICNBCTimes Brasil

Faz parte de

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

8 mai, 09:07 • Daily Journal • 3 fontes

Fonte

Ver matéria original

Times Brasil • 8 mai, 08:48