Modelo Mixture-of-Experts roda em cluster de mais de 50.000 chips domésticos e teria desempenho comparável ao Gemini 3.1 Pro.
A Meituan, gigante chinesa de entregas, abriu o código de seu maior modelo de linguagem até hoje, o LongCat-2.0, distribuído sob a permissiva licença MIT. O modelo Mixture-of-Experts soma 1,6 trilhão de parâmetros totais, ativa cerca de 48 bilhões por token e traz janela de contexto nativa de 1 milhão de tokens.
O destaque está no hardware: é o primeiro modelo de trilhão de parâmetros totalmente pré-treinado e executado em um cluster de mais de 50.000 ASICs fabricados na China, sem GPUs da Nvidia. A Meituan não revelou o fabricante dos chips e afirma que o desempenho rivaliza com o Gemini 3.1 Pro, do Google. O LongCat-2.0 era o modelo anônimo 'Owl Alpha', que liderou os rankings globais de desenvolvedores na OpenRouter nos últimos dois meses.
30 jun, 03:02
29 jun, 09:00
13 abr, 17:08
2 mar, 15:30
1 mar, 13:19
Carregando comentários...