Modelo multimodal filtra ruído, interpreta tom e ênfase, opera em 200+ países com marca d'água em todo áudio gerado.
O Google lançou o Gemini 3.1 Flash Live, seu modelo de áudio em tempo real de maior qualidade, otimizado para diálogo de baixa latência com processamento multimodal nativo. O modelo filtra ruído ambiente de trânsito ou televisão, compreende melhor tom, ênfase e intenção, e opera em mais de 200 países.
Disponível via Gemini Live API no Google AI Studio para desenvolvedores, o modelo usa configurações de thinkingLevel (minimal, low, medium, high) em vez de thinkingBudget. Todo áudio gerado recebe marca d'água para prevenir desinformação. O limite de tokens é 131.072 na entrada e 65.536 na saída.
26 mar, 14:33
18 mar, 14:03
17 mar, 14:03
11 mar, 09:00
26 fev, 14:57