Daily Journal
Daily Journal

OpenAI lança três modelos de voz na API: GPT-Realtime-2 com raciocínio de classe GPT-5, GPT-Realtime-Whisper para transcrição e GPT-Realtime-Translate (Zac Hall/9to5Mac)

A OpenAI lançou três novos modelos de voz em tempo real para sua API, incluindo o GPT-Realtime-2 com capacidade de raciocínio de nível GPT-5, o GPT-Realtime-Whisper para transcrição e o GPT-Realtime-Translate, visando impulsionar uma nova geração de aplicativos de voz para desenvolvedores.

Daily Journal
|
07/05 às 15:20

Pontos principais

  • A OpenAI introduziu três novos modelos de voz em tempo real em sua API.
  • Os modelos são projetados para "desbloquear uma nova classe de aplicativos de voz para desenvolvedores".
  • Um dos modelos é o GPT-Realtime-2, que oferece raciocínio de classe GPT-5.
  • Outro modelo é o GPT-Realtime-Whisper, focado em transcrição.
  • O terceiro modelo é o GPT-Realtime-Translate, para tradução.
  • A iniciativa visa expandir as capacidades de voz em aplicações de IA.

Mencionado nesta matéria

Pessoas

Zac Hall (jornalista)

Organizações

OpenAI9to5Mac