OpenAI lança três modelos de voz na API: GPT-Realtime-2 com raciocínio de classe GPT-5, GPT-Realtime-Whisper para transcrição e GPT-Realtime-Translate (Zac Hall/9to5Mac)
A OpenAI lançou três novos modelos de voz em tempo real para sua API, incluindo o GPT-Realtime-2 com capacidade de raciocínio de nível GPT-5, o GPT-Realtime-Whisper para transcrição e o GPT-Realtime-Translate, visando impulsionar uma nova geração de aplicativos de voz para desenvolvedores.
|
07/05 às 15:20
Pontos principais
- A OpenAI introduziu três novos modelos de voz em tempo real em sua API.
- Os modelos são projetados para "desbloquear uma nova classe de aplicativos de voz para desenvolvedores".
- Um dos modelos é o GPT-Realtime-2, que oferece raciocínio de classe GPT-5.
- Outro modelo é o GPT-Realtime-Whisper, focado em transcrição.
- O terceiro modelo é o GPT-Realtime-Translate, para tradução.
- A iniciativa visa expandir as capacidades de voz em aplicações de IA.
Mencionado nesta matéria
Pessoas
Zac Hall (jornalista)
Organizações
OpenAI9to5Mac

