Novo modelo experimental do Google utiliza difusão para gerar tokens simultaneamente, prometendo maior velocidade e capacidade de autocorreção.
O Google anunciou o lançamento do DiffusionGemma, um modelo experimental de linguagem que rompe com o padrão autorregressivo tradicional ao gerar 256 tokens simultaneamente. Ao aplicar princípios de difusão, a tecnologia permite que o sistema realize autocorreções durante o processo de geração, utilizando atenção bidirecional para melhorar o desempenho em tarefas estruturadas, como a escrita de código e a resolução de problemas lógicos. Segundo a empresa, a arquitetura oferece ganhos significativos de velocidade, podendo ser até seis vezes mais rápida que modelos convencionais em cenários de baixa concorrência. Embora represente um avanço na eficiência de inferência local com suporte nativo ao vLLM, o Google ressalta que a qualidade geral do DiffusionGemma é inferior à do Gemma 4 padrão, sendo este último ainda a recomendação principal para aplicações que demandam máxima precisão.
10 jun, 13:32
3 jun, 16:05
15 abr, 14:03
3 abr, 09:00
2 abr, 14:04
Carregando comentários...