MiniMax anuncia modelo M3 com arquitetura de atenção esparsa

A chinesa MiniMax revelou o futuro modelo M3, prometendo velocidade de decodificação 15,6 vezes superior com a nova tecnologia de atenção esparsa.

MiniMax anuncia modelo M3 com arquitetura de atenção esparsa — Foto: Venturebeat

27/05 às 17:04

Pontos principais

O modelo M3 utilizará a tecnologia MiniMax Sparse Attention (MSA) para otimizar o processamento.
A nova arquitetura permite um ganho de 15,6 vezes na velocidade de resposta em contextos de 1 milhão de tokens.
O sistema MSA mantém a precisão ao operar com chaves e valores não comprimidos.
A empresa destacou o sistema 'Forge', plataforma de aprendizado por reforço para tarefas autônomas.

A empresa chinesa MiniMax divulgou detalhes técnicos sobre a engenharia de sua série M2 e antecipou inovações para o futuro modelo M3. O grande diferencial do próximo lançamento é a implementação da MiniMax Sparse Attention (MSA), uma arquitetura projetada para superar gargalos de processamento em modelos de linguagem de grande escala. Segundo a companhia, essa tecnologia possibilita um aumento de 15,6 vezes na velocidade de decodificação ao lidar com contextos de até 1 milhão de tokens, mantendo a precisão ao processar chaves e valores reais sem compressão. Além dos avanços na arquitetura de atenção, a MiniMax reforçou o papel do sistema 'Forge', uma plataforma de aprendizado por reforço que permite aos modelos realizar tarefas de desenvolvimento de forma autônoma. Essas inovações buscam elevar o benchmark de eficiência e performance no mercado de IA generativa.

Tópicos relacionados

Inteligência Artificial

Fontes

MiniMax teases upcoming M3 model with new sparse attention mechanism and 15.6X long-context response speed boost

Venturebeat • 27 mai, 16:59

Comentários

Carregando comentários...

MiniMax anuncia modelo M3 com arquitetura de atenção esparsa

Pontos principais

Tópicos relacionados

Fontes

MiniMax teases upcoming M3 model with new sparse attention mechanism and 15.6X long-context response speed boost

Leia também

MiniMax lança modelo H3 para geração de vídeos em 2K

MiniMax desenvolve modelo de IA com 2,7 trilhões de parâmetros

MiniMax lança M3, modelo de agentes de programação com 1 milhão de tokens de contexto

MiniMax lança modelo de IA M3 com foco em codificação e baixo custo

MiniMax lança M2.7, modelo autoevolutivo com 100+ ciclos de RL

Comentários

Fontes

MiniMax teases upcoming M3 model with new sparse attention mechanism and 15.6X long-context response speed boost

Leia também

MiniMax lança modelo H3 para geração de vídeos em 2K

MiniMax desenvolve modelo de IA com 2,7 trilhões de parâmetros

MiniMax lança M3, modelo de agentes de programação com 1 milhão de tokens de contexto

MiniMax lança modelo de IA M3 com foco em codificação e baixo custo

MiniMax lança M2.7, modelo autoevolutivo com 100+ ciclos de RL