Ataque de Agentjacking sequestra o Claude Code por meio de um falso erro do Sentry — Datadog e PagerDuty estão igualmente expostos

A Violação Silenciosa: Como o Agentjacking Explora Fluxos de Trabalho de IA Modernos

A rápida integração de agentes de IA em pipelines de desenvolvimento de software prometeu ganhos de produtividade sem precedentes. No entanto, essa mudança também introduziu um novo e crítico vetor de ataque: Agentjacking. Descobertas recentes da Tenet Security revelam uma realidade preocupante para desenvolvedores que utilizam ferramentas como o Claude Code da Anthropic. Pesquisadores demonstraram que poderiam sequestrar com sucesso esses agentes movidos a IA em 85% de seus testes, utilizando nada mais do que uma mensagem de erro falsificada do Sentry — sem necessidade de roubo de credenciais.

Na Creati.ai, acreditamos que é nossa responsabilidade esclarecer como essas vulnerabilidades impactam o ecossistema mais amplo. Embora o Claude Code tenha sido o ponto focal dessas descobertas, o mecanismo central do ataque — manipulação de prompt do sistema via integração de ferramentas externas — não é exclusivo de nenhum fornecedor. É uma vulnerabilidade sistêmica que afeta as ferramentas mais populares na pilha de DevOps, incluindo Datadog, PagerDuty e Jira.

Anatomia do Ataque: O Papel da Falsificação do 'Sentry'

O vetor de ataque identificado pela Tenet Security depende da confiança do agente de IA em integrações de terceiros para monitorar e gerenciar a integridade das aplicações. Quando um desenvolvedor cria um aplicativo, ele frequentemente integra serviços como o Sentry para capturar exceções em tempo de execução. A vulnerabilidade ocorre porque o agente de IA confia na saída dessas ferramentas como "fonte da verdade".

Ao simular um erro malicioso do Sentry, um invasor pode manipular o contexto conversacional do agente do Claude Code. Essencialmente, o agente é enganado ao acreditar que o sistema está falhando, o que aciona uma resposta de diagnóstico. Em sua tentativa de "corrigir" o problema, o agente segue as instruções do invasor incorporadas nos logs de erro falsos, podendo conceder ao invasor capacidades de execução remota de código (RCE) na máquina local do desenvolvedor ou no ambiente de CI/CD.

Por que a autenticação falha em prevenir isso

Um dos aspectos mais alarmantes desta pesquisa é que os perímetros de segurança tradicionais — como tokens OAuth, chaves de API ou autenticação baseada em senha — tornam-se irrelevantes. O ataque opera na camada lógica do processo de tomada de decisão do agente. Como a IA foi projetada para ser prestativa e autônoma, ela ignora a necessidade de o invasor "fazer login". Ela simplesmente segue as instruções maliciosas fornecidas dentro da saída padrão de uma ferramenta externa confiável.

Avaliando a Exposição: Quem está em risco?

A vulnerabilidade é generalizada porque explora a arquitetura de integração comum a quase todas as ferramentas de IA modernas voltadas para desenvolvedores. Abaixo está uma análise de como diferentes componentes do ecossistema de software estão atualmente expostos a esta categoria de Agentjacking.

Categoria de Serviço	Ponto Principal de Exposição	Impacto Potencial
Agentes de Desenvolvimento de IA	Claude Code (e implementações similares)	RCE em máquinas de dev locais Acesso a segredos de repositórios
Ferramentas de Monitoramento	Sentry / Datadog	Injeção de prompt via mensagens de log Exfiltração de estado do sistema
Gestão de Incidentes	PagerDuty	Manipulação de fluxos de trabalho de alerta Escalações não autorizadas
Gestão de Projetos	Jira	Manipulação não autorizada de tickets Acesso a dados multiplataforma

Além da Anthropic: Implicações para toda a Indústria

Embora o foco no Claude Code tenha trazido esse problema ao centro das atenções, as equipes de segurança devem reconhecer que este é um desafio de projeto inerente às ferramentas atuais impulsionadas por LLMs. Os desenvolvedores estão cada vez mais concedendo a esses agentes "acesso total" aos seus terminais e arquivos locais. Quando um agente de IA tem o poder de executar comandos de shell, a confiança depositada em ferramentas de diagnóstico externas deve ser de zero-trust (confiança zero).

As organizações que dependem de automação por IA agora devem considerar:

Envenenamento de Contexto: Invasores injetando informações falsas na "memória" do agente.
Confiança na Cadeia de Ferramentas: A suposição de que todas as plataformas de terceiros integradas são autênticas.
Falta de Isolamento (Air-Gapping): Agentes de IA geralmente exigem conectividade com a internet para funcionar, o que simplifica a exfiltração de dados uma vez que uma base é estabelecida.

Estratégias de Mitigação e Fortalecimento de Defesa

Para combater a ameaça de Agentjacking, os líderes de engenharia devem mudar de um modelo de "execução autônoma" para um de "validação com humano no loop". Na Creati.ai, defendemos as seguintes medidas defensivas para fortalecer os fluxos de trabalho de IA contra essas vulnerabilidades:

Higienização Rigorosa de Contexto: Implementar middleware que higienize qualquer dado extraído de ferramentas externas de terceiros antes de ser apresentado ao LLM.
Sandbox de Execução: Executar assistentes de codificação de IA dentro de ambientes altamente restritos e efêmeros (como contêineres Docker ou gVisor) que não tenham acesso direto a variáveis de ambiente locais sensíveis.
Confirmação Implícita: Programar agentes para solicitar aprovação humana explícita antes de executar qualquer comando que modifique o sistema de arquivos ou entre em contato com um endpoint externo, independentemente da "urgência" sinalizada por um log de erro.
Autenticação em Nível de Ferramenta: Garantir que todas as integrações de ferramentas de diagnóstico automatizadas verifiquem a integridade dos pacotes de dados recebidos por meio de cargas úteis assinadas, em vez de confiar apenas na saída de texto bruto.

A ascensão do desenvolvimento aumentado por IA é inevitável, mas a segurança da nossa infraestrutura depende da nossa capacidade de adaptar nossa postura defensiva. A divulgação da Tenet Security serve como um alerta para toda a comunidade de IA: quando um agente recebe poder para corrigir código, ele também deve receber poder para questionar as fontes de suas próprias informações. À medida que a indústria avança, a ponte entre a produtividade da IA e a cibersegurança deve ser construída com transparência e verificação rigorosa como base.