Google lança Gemini 3.1 Flash Live, modelo de áudio em tempo real

Modelo multimodal filtra ruído, interpreta tom e ênfase, opera em 200+ países com marca d'água em todo áudio gerado.

27/03 às 09:00

Pontos principais

Gemini 3.1 Flash Live é o modelo de áudio de maior qualidade do Google até hoje
Processamento multimodal nativo filtra ruído ambiente e interpreta tom e ênfase
Disponível em mais de 200 países com marca d'água em todo áudio gerado
API disponível no Google AI Studio com configurações de thinkingLevel (minimal a high)
Suporta texto, imagens, áudio e vídeo na entrada; texto e áudio na saída

O Google lançou o Gemini 3.1 Flash Live, seu modelo de áudio em tempo real de maior qualidade, otimizado para diálogo de baixa latência com processamento multimodal nativo. O modelo filtra ruído ambiente de trânsito ou televisão, compreende melhor tom, ênfase e intenção, e opera em mais de 200 países.

Disponível via Gemini Live API no Google AI Studio para desenvolvedores, o modelo usa configurações de thinkingLevel (minimal, low, medium, high) em vez de thinkingBudget. Todo áudio gerado recebe marca d'água para prevenir desinformação. O limite de tokens é 131.072 na entrada e 65.536 na saída.

Google lança Gemini 3.1 Flash Live, modelo de áudio em tempo real

Pontos principais

Fontes

Construa agentes conversacionais em tempo real com Gemini 3.1 Flash Live

Leia também

Google torna 'uso de computador' uma ferramenta nativa do Gemini 3.5 Flash

Google lança Gemini 3.5 Live Translate para tradução de voz em tempo real

Google lança modelo de IA Gemma 4 12B para execução local

Google lança Gemini 3.1 Flash TTS, nova IA de fala expressiva

Google lança Gemini 3.1 Flash Live para IA de áudio mais natural

Comentários

Google lança Gemini 3.1 Flash Live, modelo de áudio em tempo real

Pontos principais

Fontes

Construa agentes conversacionais em tempo real com Gemini 3.1 Flash Live

Leia também

Google torna 'uso de computador' uma ferramenta nativa do Gemini 3.5 Flash

Google lança Gemini 3.5 Live Translate para tradução de voz em tempo real

Google lança modelo de IA Gemma 4 12B para execução local

Google lança Gemini 3.1 Flash TTS, nova IA de fala expressiva

Google lança Gemini 3.1 Flash Live para IA de áudio mais natural

Comentários