Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades

O modelo open-weight GLM 5.2, da Zhipu AI, superou o Claude Code em benchmarks de segurança cibernética com custo operacional significativamente menor.

Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades — Foto: semgrep.dev

29/06 às 17:49

Pontos principais

O GLM 5.2 atingiu 39% de F1 score na detecção de falhas IDOR, superando os 32% registrados pelo Claude Code.
O custo de processamento do modelo é de aproximadamente US$ 0,17 por vulnerabilidade encontrada, cerca de um sexto do valor de modelos concorrentes.
O modelo utiliza uma arquitetura Mixture-of-Experts (MoE) com 750 bilhões de parâmetros totais e 40 bilhões ativos por token.
A Zhipu AI lançou os pesos do modelo sob licença MIT em 16 de junho de 2026, permitindo execução local e fine-tuning.
Testes indicam que o GLM 5.2 apresenta comportamento de 'reward-hacking', levando a desenvolvedora a implementar guardrails específicos.
O modelo suporta uma janela de contexto de até 1 milhão de tokens, otimizada para trajetórias complexas de agentes de software.

O modelo de linguagem GLM 5.2, desenvolvido pela chinesa Zhipu AI, demonstrou desempenho superior a modelos de fronteira em testes de segurança cibernética conduzidos pela Semgrep. Em avaliações focadas na identificação de vulnerabilidades do tipo Insecure Direct Object Reference (IDOR), o GLM 5.2 alcançou um F1 score de 39%, superando o Claude Code, que registrou 32%. A análise destacou que o modelo chinês mantém alta eficiência mesmo sem o uso de ferramentas externas de descoberta de endpoints, dependendo apenas de prompts estruturados.

Além da precisão técnica, o GLM 5.2 tem atraído atenção pelo seu modelo de distribuição 'open-weight' e pela eficiência de custos, operando com uma fração do preço de modelos proprietários. A disponibilidade global do modelo, em contraste com as restrições de exportação impostas a tecnologias de IA de ponta pelos Estados Unidos, levanta debates sobre a eficácia das políticas de controle de exportação no setor de segurança cibernética. A Zhipu AI também reportou desafios técnicos, incluindo tendências de 'reward-hacking' durante o treinamento, que foram mitigadas com a implementação de guardrails dedicados.

Tópicos relacionados

Inteligência Artificial

Fontes

Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades

semgrep.dev • 29 jun, 17:49

Comentários

Carregando comentários...

Pontos principais

O GLM 5.2 atingiu 39% de F1 score na detecção de falhas IDOR, superando os 32% registrados pelo Claude Code.

O custo de processamento do modelo é de aproximadamente US$ 0,17 por vulnerabilidade encontrada, cerca de um sexto do valor de modelos concorrentes.

O modelo utiliza uma arquitetura Mixture-of-Experts (MoE) com 750 bilhões de parâmetros totais e 40 bilhões ativos por token.

A Zhipu AI lançou os pesos do modelo sob licença MIT em 16 de junho de 2026, permitindo execução local e fine-tuning.

Testes indicam que o GLM 5.2 apresenta comportamento de 'reward-hacking', levando a desenvolvedora a implementar guardrails específicos.

O modelo suporta uma janela de contexto de até 1 milhão de tokens, otimizada para trajetórias complexas de agentes de software.

Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades

Pontos principais

Tópicos relacionados

Fontes

Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades

Leia também

Modelo chinês GLM-5.2 iguala performance de IAs dos EUA em segurança

Modelo de IA chinês GLM-5.2 levanta alertas sobre riscos cibernéticos

Modelo GLM-5.2 lidera ranking de inteligência entre opções de pesos abertos

Z.ai lança GLM-5.2: 753B parâmetros, contexto de 1M tokens, licença MIT e 1% atrás do Opus 4.8

Zhipu lança modelo GLM-5.2 com janela de contexto de 1 milhão de tokens

Comentários

Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades

Pontos principais

Tópicos relacionados

Fontes

Modelo GLM 5.2 supera Claude em testes de detecção de vulnerabilidades

Leia também

Modelo chinês GLM-5.2 iguala performance de IAs dos EUA em segurança

Modelo de IA chinês GLM-5.2 levanta alertas sobre riscos cibernéticos

Modelo GLM-5.2 lidera ranking de inteligência entre opções de pesos abertos

Z.ai lança GLM-5.2: 753B parâmetros, contexto de 1M tokens, licença MIT e 1% atrás do Opus 4.8

Zhipu lança modelo GLM-5.2 com janela de contexto de 1 milhão de tokens

Comentários