
A rápida integração de agentes de IA em pipelines de desenvolvimento de software prometeu ganhos de produtividade sem precedentes. No entanto, essa mudança também introduziu um novo e crítico vetor de ataque: Agentjacking. Descobertas recentes da Tenet Security revelam uma realidade preocupante para desenvolvedores que utilizam ferramentas como o Claude Code da Anthropic. Pesquisadores demonstraram que poderiam sequestrar com sucesso esses agentes movidos a IA em 85% de seus testes, utilizando nada mais do que uma mensagem de erro falsificada do Sentry — sem necessidade de roubo de credenciais.
Na Creati.ai, acreditamos que é nossa responsabilidade esclarecer como essas vulnerabilidades impactam o ecossistema mais amplo. Embora o Claude Code tenha sido o ponto focal dessas descobertas, o mecanismo central do ataque — manipulação de prompt do sistema via integração de ferramentas externas — não é exclusivo de nenhum fornecedor. É uma vulnerabilidade sistêmica que afeta as ferramentas mais populares na pilha de DevOps, incluindo Datadog, PagerDuty e Jira.
O vetor de ataque identificado pela Tenet Security depende da confiança do agente de IA em integrações de terceiros para monitorar e gerenciar a integridade das aplicações. Quando um desenvolvedor cria um aplicativo, ele frequentemente integra serviços como o Sentry para capturar exceções em tempo de execução. A vulnerabilidade ocorre porque o agente de IA confia na saída dessas ferramentas como "fonte da verdade".
Ao simular um erro malicioso do Sentry, um invasor pode manipular o contexto conversacional do agente do Claude Code. Essencialmente, o agente é enganado ao acreditar que o sistema está falhando, o que aciona uma resposta de diagnóstico. Em sua tentativa de "corrigir" o problema, o agente segue as instruções do invasor incorporadas nos logs de erro falsos, podendo conceder ao invasor capacidades de execução remota de código (RCE) na máquina local do desenvolvedor ou no ambiente de CI/CD.
Um dos aspectos mais alarmantes desta pesquisa é que os perímetros de segurança tradicionais — como tokens OAuth, chaves de API ou autenticação baseada em senha — tornam-se irrelevantes. O ataque opera na camada lógica do processo de tomada de decisão do agente. Como a IA foi projetada para ser prestativa e autônoma, ela ignora a necessidade de o invasor "fazer login". Ela simplesmente segue as instruções maliciosas fornecidas dentro da saída padrão de uma ferramenta externa confiável.
A vulnerabilidade é generalizada porque explora a arquitetura de integração comum a quase todas as ferramentas de IA modernas voltadas para desenvolvedores. Abaixo está uma análise de como diferentes componentes do ecossistema de software estão atualmente expostos a esta categoria de Agentjacking.
| Categoria de Serviço | Ponto Principal de Exposição | Impacto Potencial |
|---|---|---|
| Agentes de Desenvolvimento de IA | Claude Code (e implementações similares) | RCE em máquinas de dev locais Acesso a segredos de repositórios |
| Ferramentas de Monitoramento | Sentry / Datadog | Injeção de prompt via mensagens de log Exfiltração de estado do sistema |
| Gestão de Incidentes | PagerDuty | Manipulação de fluxos de trabalho de alerta Escalações não autorizadas |
| Gestão de Projetos | Jira | Manipulação não autorizada de tickets Acesso a dados multiplataforma |
Embora o foco no Claude Code tenha trazido esse problema ao centro das atenções, as equipes de segurança devem reconhecer que este é um desafio de projeto inerente às ferramentas atuais impulsionadas por LLMs. Os desenvolvedores estão cada vez mais concedendo a esses agentes "acesso total" aos seus terminais e arquivos locais. Quando um agente de IA tem o poder de executar comandos de shell, a confiança depositada em ferramentas de diagnóstico externas deve ser de zero-trust (confiança zero).
As organizações que dependem de automação por IA agora devem considerar:
Para combater a ameaça de Agentjacking, os líderes de engenharia devem mudar de um modelo de "execução autônoma" para um de "validação com humano no loop". Na Creati.ai, defendemos as seguintes medidas defensivas para fortalecer os fluxos de trabalho de IA contra essas vulnerabilidades:
A ascensão do desenvolvimento aumentado por IA é inevitável, mas a segurança da nossa infraestrutura depende da nossa capacidade de adaptar nossa postura defensiva. A divulgação da Tenet Security serve como um alerta para toda a comunidade de IA: quando um agente recebe poder para corrigir código, ele também deve receber poder para questionar as fontes de suas próprias informações. À medida que a indústria avança, a ponte entre a produtividade da IA e a cibersegurança deve ser construída com transparência e verificação rigorosa como base.