Gemini 3.1 Flash TTS: a próxima geração de fala expressiva por IA

O novo modelo de áudio do Google, Gemini 3.1 Flash TTS, introduz tags de áudio granulares para controle preciso na geração de fala expressiva por inteligência artificial.

15/04 às 13:03

Pontos principais

O Google DeepMind lançou o Gemini 3.1 Flash TTS, um novo modelo de áudio.
Este modelo representa a próxima geração de fala expressiva gerada por IA.
Ele incorpora tags de áudio granulares para um controle mais preciso.
As tags permitem direcionar a IA para uma geração de áudio mais expressiva.
A tecnologia visa melhorar a qualidade e a naturalidade da síntese de voz.

Mencionado nesta matéria

Organizações

DeepMindGoogle

Fonte

Ver matéria original

DeepMind • 15 abr, 13:03