Modelo multimodal filtra ruído, interpreta tom e ênfase, opera em 200+ países com marca d'água em todo áudio gerado.
O Google lançou o Gemini 3.1 Flash Live, seu modelo de áudio em tempo real de maior qualidade, otimizado para diálogo de baixa latência com processamento multimodal nativo. O modelo filtra ruído ambiente de trânsito ou televisão, compreende melhor tom, ênfase e intenção, e opera em mais de 200 países.
Disponível via Gemini Live API no Google AI Studio para desenvolvedores, o modelo usa configurações de thinkingLevel (minimal, low, medium, high) em vez de thinkingBudget. Todo áudio gerado recebe marca d'água para prevenir desinformação. O limite de tokens é 131.072 na entrada e 65.536 na saída.
25 jun, 09:00
9 jun, 12:31
3 jun, 16:05
15 abr, 14:03
26 mar, 14:33
Carregando comentários...