Daily Journal

O Futuro da Informação

Daily Journal

Gemini 3.1 Flash TTS: a próxima geração de fala expressiva por IA

O novo modelo de áudio do Google, Gemini 3.1 Flash TTS, introduz tags de áudio granulares para controle preciso na geração de fala expressiva por inteligência artificial.

Daily Journal
|
15/04 às 13:03

Pontos principais

  • O Google DeepMind lançou o Gemini 3.1 Flash TTS, um novo modelo de áudio.
  • Este modelo representa a próxima geração de fala expressiva gerada por IA.
  • Ele incorpora tags de áudio granulares para um controle mais preciso.
  • As tags permitem direcionar a IA para uma geração de áudio mais expressiva.
  • A tecnologia visa melhorar a qualidade e a naturalidade da síntese de voz.

Mencionado nesta matéria

Organizações

DeepMindGoogle