Visão geral
LongCat-2.0 é um modelo de linguagem de grande escala (LLM) desenvolvido pela equipe LongCat da Meituan, empresa chinesa de serviços sob demanda. Trata-se de um modelo Mixture-of-Experts (MoE) com 1,6 trilhão de parâmetros totais, projetado especialmente para tarefas de codificação agentica, raciocínio em múltiplas etapas e suporte nativo a contextos longos de até 1 milhão de tokens. O modelo foi treinado e executado integralmente em um cluster de 50 mil chips ASIC domésticos chineses, sem uso de hardware Nvidia, e foi open-sourced sob licença MIT em junho de 2026. Ele se destaca por sua eficiência em ativação de parâmetros (cerca de 33 a 56 bilhões por token) e por liderar rankings de desenvolvedores em plataformas como OpenRouter sob o nome provisório "owl-alpha".
Histórico
A família LongCat foi iniciada pela Meituan com modelos anteriores como o LongCat-Flash (560 bilhões de parâmetros). LongCat-2.0 representa a evolução para escala trilionária, com foco em aplicações agenticas e independência tecnológica chinesa em computação de IA. O modelo foi liberado publicamente em 29-30 de junho de 2026, com repositórios no GitHub (meituan-longcat/LongCat-2.0) e Hugging Face (meituan-longcat/LongCat-2.0).
Características técnicas
- Arquitetura: MoE com esparsidade agressiva; ativação dinâmica de 33B–56B parâmetros por token.
- Contexto: Suporte nativo a 1 milhão de tokens.
- Treinamento: Realizado em cluster de 50 mil chips ASIC domésticos (provavelmente Huawei Ascend).
- Otimizações: LongCat Sparse Attention (LSA), Multi-Token Prediction (MTP) e fusão de experts MOPD.
- Capacidades: Chamada de ferramentas nativa, raciocínio multi-etapa, geração e compreensão de código avançada.
Desempenho
LongCat-2.0 apresenta resultados competitivos em benchmarks de codificação:
- SWE-bench Pro: 59,5
- Terminal-Bench: 70,8
O modelo foi elogiado por sua eficiência em contextos longos e tarefas agenticas, posicionando-se entre os modelos de fronteira open-source da época.
Disponibilidade e licenciamento
O modelo está disponível publicamente no Hugging Face e GitHub sob licença MIT. Também é acessível via API na plataforma longcat.chat, com suporte a ambientes de desenvolvimento como Claude Code. Pesos e código foram liberados para acelerar pesquisas e aplicações na área de agentes de IA e modelos de mundo.
