OpenAI lança três modelos de voz na API: GPT-Realtime-2 com raciocínio de classe GPT-5, GPT-Realtime-Whisper para transcrição e GPT-Realtime-Translate (Zac Hall/9to5Mac)

A OpenAI lançou três novos modelos de voz em tempo real para sua API, incluindo o GPT-Realtime-2 com capacidade de raciocínio de nível GPT-5, o GPT-Realtime-Whisper para transcrição e o GPT-Realtime-Translate, visando impulsionar uma nova geração de aplicativos de voz para desenvolvedores.

07/05 às 15:20

Pontos principais

A OpenAI introduziu três novos modelos de voz em tempo real em sua API.
Os modelos são projetados para "desbloquear uma nova classe de aplicativos de voz para desenvolvedores".
Um dos modelos é o GPT-Realtime-2, que oferece raciocínio de classe GPT-5.
Outro modelo é o GPT-Realtime-Whisper, focado em transcrição.
O terceiro modelo é o GPT-Realtime-Translate, para tradução.
A iniciativa visa expandir as capacidades de voz em aplicações de IA.

Mencionado nesta matéria

Pessoas

Zac Hall (jornalista)

Organizações

OpenAI9to5Mac

Faz parte de

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

8 mai, 09:07 • Daily Journal • 3 fontes

Fonte

Ver matéria original

Techmeme • 7 mai, 15:20