Agente de IA da Anthropic sofre injeção de prompt em 31,5% dos testes

Relatórios indicam vulnerabilidade em agentes de IA da Anthropic, evidenciando riscos de segurança e a ausência de padrões de medição na indústria.

Agente de IA da Anthropic sofre injeção de prompt em 31,5% dos testes — Foto: Venturebeat

01/06 às 13:45

Pontos principais

O modelo da Anthropic registrou 31,5% de sucesso em ataques de injeção de prompt antes da ativação de salvaguardas.
A ausência de métricas padronizadas dificulta a comparação de segurança entre modelos da Anthropic, OpenAI, Google e Meta.
Especialistas alertam que a injeção de prompt em agentes de IA pode contornar defesas de segurança tradicionais.
A CrowdStrike aponta que cibercriminosos utilizam IA para acelerar o tempo entre o acesso inicial e o impacto de ataques.

A Anthropic divulgou dados sobre a vulnerabilidade de seus modelos de agentes de IA, revelando que 31,5% das tentativas de injeção de prompt obtiveram sucesso antes que as salvaguardas de segurança fossem acionadas. O caso destaca um desafio crítico para o setor de tecnologia: a falta de padrões industriais unificados para medir e comparar a resiliência de modelos desenvolvidos por empresas como OpenAI, Google e Meta. A injeção de prompt representa uma ameaça significativa, pois permite que agentes de IA sejam manipulados para contornar defesas convencionais. Diante desse cenário, especialistas recomendam que empresas realizem testes rigorosos de injeção e exijam métricas transparentes de fornecedores antes de integrar agentes de IA em seus fluxos de trabalho, especialmente considerando que adversários já utilizam a tecnologia para acelerar o ciclo de ataques cibernéticos.

Fontes

Anthropic’s browser agent got hijacked 31.5% of the time before safeguards engaged

Venturebeat • 1 jun, 12:50

Comentários

Carregando comentários...

Agente de IA da Anthropic sofre injeção de prompt em 31,5% dos testes

Pontos principais

Fontes

Anthropic’s browser agent got hijacked 31.5% of the time before safeguards engaged

Leia também

Injeção de prompt se torna a principal ameaça a sistemas de IA corporativos

Relatório da Anthropic analisa evolução de ataques cibernéticos com IA

Experian aponta que 40% dos vazamentos de dados em 2025 usaram IA

Falha de segurança permite envenenar agentes de IA via repositórios

Anthropic atualiza política de segurança e foca em proteção infantil e eleitoral

Comentários

Fontes

Anthropic’s browser agent got hijacked 31.5% of the time before safeguards engaged

Leia também

Injeção de prompt se torna a principal ameaça a sistemas de IA corporativos

Relatório da Anthropic analisa evolução de ataques cibernéticos com IA

Experian aponta que 40% dos vazamentos de dados em 2025 usaram IA

Falha de segurança permite envenenar agentes de IA via repositórios

Anthropic atualiza política de segurança e foca em proteção infantil e eleitoral