O modelo open-weight GLM 5.2, da Zhipu AI, superou o Claude Code em benchmarks de segurança cibernética com custo operacional significativamente menor.
O modelo de linguagem GLM 5.2, desenvolvido pela chinesa Zhipu AI, demonstrou desempenho superior a modelos de fronteira em testes de segurança cibernética conduzidos pela Semgrep. Em avaliações focadas na identificação de vulnerabilidades do tipo Insecure Direct Object Reference (IDOR), o GLM 5.2 alcançou um F1 score de 39%, superando o Claude Code, que registrou 32%. A análise destacou que o modelo chinês mantém alta eficiência mesmo sem o uso de ferramentas externas de descoberta de endpoints, dependendo apenas de prompts estruturados.
Além da precisão técnica, o GLM 5.2 tem atraído atenção pelo seu modelo de distribuição 'open-weight' e pela eficiência de custos, operando com uma fração do preço de modelos proprietários. A disponibilidade global do modelo, em contraste com as restrições de exportação impostas a tecnologias de IA de ponta pelos Estados Unidos, levanta debates sobre a eficácia das políticas de controle de exportação no setor de segurança cibernética. A Zhipu AI também reportou desafios técnicos, incluindo tendências de 'reward-hacking' durante o treinamento, que foram mitigadas com a implementação de guardrails dedicados.
28 jun, 02:31
25 jun, 14:31
18 jun, 16:02
17 jun, 09:00
16 jun, 16:02
Carregando comentários...