OpenAI lança três novos modelos de voz que funcionam em tempo real
A OpenAI lançou três novos modelos de voz, da família GPT-Realtime, que operam em tempo real para agilizar tarefas, traduzir conversas e transcrever falas, representando um avanço na interação com agentes de IA.
|
08/05 às 08:48
Pontos principais
- A OpenAI apresentou três novos modelos de voz em tempo real, da família GPT-Realtime, para agilizar tarefas e melhorar a interação com IA.
- Os modelos são projetados para desenvolvedores criarem aplicações de voz que ofereçam experiências de áudio em tempo real, reagindo dinamicamente às conversas.
- O GPT-Realtime-2 oferece raciocínio avançado para gerenciar solicitações complexas e acompanhar conversas naturais.
- O GPT-Realtime-Translate permite tradução em tempo real de fala em mais de 70 idiomas de entrada para 13 de saída, ideal para atendimento ao cliente e educação.
- O GPT-Realtime-Whisper é um novo sistema de conversão de voz em texto com baixa latência, transcrevendo a fala enquanto o usuário fala.
- A empresa afirma que esses modelos transformam o áudio em tempo real, permitindo que as interfaces de voz ouçam, raciocinem, traduzam, transcrevam e ajam conforme a conversa se desenvolve.
Mencionado nesta matéria
Organizações
OpenAICNBCTimes Brasil

