O Futuro da Informação

Google lança DiffusionGemma com geração de texto em paralelo

Novo modelo experimental do Google utiliza difusão para gerar tokens simultaneamente, prometendo maior velocidade e capacidade de autocorreção.

Google lança DiffusionGemma com geração de texto em paralelo — Foto: Venturebeat

11/06 às 12:34

Pontos principais

O DiffusionGemma gera 256 tokens de forma paralela, superando a limitação sequencial dos modelos autorregressivos.
A arquitetura permite atenção bidirecional e autocorreção, sendo eficaz em tarefas como resolução de Sudoku e código.
Benchmarks indicam que o modelo pode ser de 4 a 6 vezes mais rápido que modelos padrão em baixa concorrência.
O modelo possui suporte nativo à plataforma vLLM e é baseado na estrutura Gemma 4.
O Google recomenda o uso do Gemma 4 padrão para aplicações que exigem precisão superior.

O Google anunciou o lançamento do DiffusionGemma, um modelo experimental de linguagem que rompe com o padrão autorregressivo tradicional ao gerar 256 tokens simultaneamente. Ao aplicar princípios de difusão, a tecnologia permite que o sistema realize autocorreções durante o processo de geração, utilizando atenção bidirecional para melhorar o desempenho em tarefas estruturadas, como a escrita de código e a resolução de problemas lógicos. Segundo a empresa, a arquitetura oferece ganhos significativos de velocidade, podendo ser até seis vezes mais rápida que modelos convencionais em cenários de baixa concorrência. Embora represente um avanço na eficiência de inferência local com suporte nativo ao vLLM, o Google ressalta que a qualidade geral do DiffusionGemma é inferior à do Gemma 4 padrão, sendo este último ainda a recomendação principal para aplicações que demandam máxima precisão.

Tópicos relacionados

Inteligência Artificial

Fontes

Google's DiffusionGemma generates 256 tokens in parallel and self-corrects as it goes

Venturebeat • 11 jun, 12:16

Comentários

Carregando comentários...

Home / Tecnologia

Google lança DiffusionGemma com geração de texto em paralelo

Novo modelo experimental do Google utiliza difusão para gerar tokens simultaneamente, prometendo maior velocidade e capacidade de autocorreção.

11/06 às 12:34

Pontos principais

O DiffusionGemma gera 256 tokens de forma paralela, superando a limitação sequencial dos modelos autorregressivos.
A arquitetura permite atenção bidirecional e autocorreção, sendo eficaz em tarefas como resolução de Sudoku e código.
Benchmarks indicam que o modelo pode ser de 4 a 6 vezes mais rápido que modelos padrão em baixa concorrência.
O modelo possui suporte nativo à plataforma vLLM e é baseado na estrutura Gemma 4.
O Google recomenda o uso do Gemma 4 padrão para aplicações que exigem precisão superior.

Tópicos relacionados

Inteligência Artificial

Fontes

Google's DiffusionGemma generates 256 tokens in parallel and self-corrects as it goes

Venturebeat • 11 jun, 12:16

Comentários

Carregando comentários...

Google lança DiffusionGemma com geração de texto em paralelo

Pontos principais

Tópicos relacionados

Fontes

Google's DiffusionGemma generates 256 tokens in parallel and self-corrects as it goes

Leia também

Google lança DiffusionGemma, modelo experimental de 26 bilhões de parâmetros

Google lança modelo de IA Gemma 4 12B para execução local

Google lança Gemini 3.1 Flash TTS, nova IA de fala expressiva

Google lança Gemma 4 sob licença Apache 2.0 com modelos de 2 a 31 bilhões de parâmetros

Google lança Gemma 4, seus modelos abertos mais inteligentes

Comentários

Google lança DiffusionGemma com geração de texto em paralelo

Pontos principais

Tópicos relacionados

Fontes

Google's DiffusionGemma generates 256 tokens in parallel and self-corrects as it goes

Leia também

Google lança DiffusionGemma, modelo experimental de 26 bilhões de parâmetros

Google lança modelo de IA Gemma 4 12B para execução local

Google lança Gemini 3.1 Flash TTS, nova IA de fala expressiva

Google lança Gemma 4 sob licença Apache 2.0 com modelos de 2 a 31 bilhões de parâmetros

Google lança Gemma 4, seus modelos abertos mais inteligentes

Comentários