Gemini 3.1 Flash TTS: a próxima geração de fala expressiva por IA
O novo modelo de áudio do Google, Gemini 3.1 Flash TTS, introduz tags de áudio granulares para controle preciso na geração de fala expressiva por inteligência artificial.
|
15/04 às 13:03
Pontos principais
- O Google DeepMind lançou o Gemini 3.1 Flash TTS, um novo modelo de áudio.
- Este modelo representa a próxima geração de fala expressiva gerada por IA.
- Ele incorpora tags de áudio granulares para um controle mais preciso.
- As tags permitem direcionar a IA para uma geração de áudio mais expressiva.
- A tecnologia visa melhorar a qualidade e a naturalidade da síntese de voz.
Mencionado nesta matéria
Organizações
DeepMindGoogle
