Durante anos, Nicholas Carlini dedicou a carreira a desmentir as alegações das empresas de IA sobre os riscos de segurança dos seus modelos. Agora, foi ele próprio a soar o alarme. E o governo dos EUA respondeu com uma proibição de exportação.
A 17 de Junho de 2026, o Wall Street Journal publicou uma história que vai ficar nos anais da segurança digital. Uma história sobre Nicholas Carlini, um hacker de 35 anos, magro, cabelo comprido, que passou a carreira a ser o “cético profissional” da indústria de IA. E sobre como ele mudou de ideias — e desencadeou uma crise diplomática entre a Anthropic e a Casa Branca.
O artigo original, republicado pelo Hindustan Times, conta os bastidores do Bugmageddon: a constatação colectiva de que encontrar vulnerabilidades de segurança e escrever código para as explorar se tornou perigosamente fácil com IA.
Bugmageddon é o nome que vai definir 2026 na segurança digital. E merece uma reflexão profunda.
Quem é Nicholas Carlini?
Carlini não é um alarmista. É o oposto. Passou anos a mostrar que os claims de segurança das empresas de IA eram exagerados. Na Google, em 2019, achou que a OpenAI estava a ser “irracional” quando sugeriu que o GPT-2 podia ser perigoso demais para ser lançado.
O seu orientador de doutoramento, David Wagner, descreve-o assim: “Ele fez muito trabalho inicial sobre segurança de machine learning, mostrando que é muito difícil tornar machine learning seguro.”
A ironia? Carlini passou anos a mostrar que a IA era menos perigosa do que diziam. Até ter acesso ao Mythos, o modelo de próxima geração da Anthropic.
O que Mudou?
Em Março de 2026, Carlini apresentou-se numa sala cheia de especialistas em cibersegurança, em São Francisco. Mostrou como tinha usado o Mythos para encontrar e explorar:
- Um bug crítico no Ghost, software de publicação web usado por milhares de sites
- Uma vulnerabilidade no Linux, o kernel mais testado do planeta, que alimenta milhares de milhões de dispositivos
Carlini nunca tinha encontrado um bug no Linux antes. Nem no Ghost. Agora, o Mythos tinha encontrado 479 bugs no Linux e mais de 500 no Ghost — numa questão de dias.
A conclusão dele foi direta: “É bastante claro para mim que estes modelos atuais são melhores investigadores de vulnerabilidades do que eu.”
Duas semanas depois, escreveu um memorando interno na Anthropic: “Acho que não devemos lançar o Mythos ainda.”
O Efeito Dominó
O que se seguiu foi uma reação em cadeia. A Amazon, que tinha acesso ao Mythos, descobriu que dava para contornar as salvaguardas. O CEO Andy Jassy ligou diretamente ao governo dos EUA. A Casa Branca deu um ultimato à Anthropic: 90 minutos para remover o modelo do ar.
A Anthropic respondeu enviando Carlini e outros especialistas para Washington, para explicar as salvaguardas técnicas e convencer o governo de que, mesmo não havendo segurança garantida, era melhor para o mundo ter o modelo disponível do que mantê-lo fechado.
O governo Trump respondeu com uma proibição de uso por governos, empresas e indivíduos estrangeiros. A Anthropic cortou o acesso a todos para cumprir.
O Que Isto Significa
Esta história não é sobre um modelo perigoso. É sobre uma mudança de paradigma que estava prevista, que todos sabíamos que ia acontecer, mas que continua a ser chocante quando se materializa.
1. O equilíbrio atacante-defensor acabou.
Carlini disse-o na apresentação: “O equilíbrio que existia entre atacantes e defensores nas últimas duas décadas parece estar a chegar ao fim.” Durante anos, a vantagem estava ligeiramente do lado dos defensores — o software é complexo, encontrar bugs dá trabalho, e os atacantes precisam de sorte. A IA inverteu isto. Agora, um atacante (ou um investigador) pode gerar milhares de tentativas de exploração em dias.
2. O número de bugs vai explodir.
O Mythos já encontrou mais de 10.000 bugs. Cada um precisa de ser triado, validado, reportado, corrigido, e o patch precisa de ser instalado. O gargalo já não é encontrar bugs — é corrigi-los e fazer com que as pessoas instalem as correções.
O exemplo do Ghost é preocupante: o bug foi corrigido em Fevereiro, e em Abril já estavam a acontecer ataques generalizados a sites que não tinham atualizado. Mais de 700 sites foram hackeados.
3. A indústria não está preparada.
Empresas e consumidores estão no meio disto sem saberem bem o que fazer. Bancos preocupam-se com vulnerabilidades no software que mantém o sistema financeiro operacional. Empresas questionam-se como vão testar e instalar a quantidade massiva de patches que estão a ser lançados.
4. A regulação está a nascer a ferros.
A forma como o governo Trump lidou com a situação é reveladora: ultimatos de 90 minutos, proibições sem detalhes técnicos, o secretário do Comércio Howard Lutnick a responder “That’s the point” quando o CEO da Anthropic disse que a proibição significava que não podiam ter o modelo disponível.
Não há diálogo, há força. Não há colaboração, há imposição. Isto não é sustentável.
O Dilema
A Anthropic está numa posição difícil. Criou, provavelmente, o modelo de IA mais poderoso do mundo para segurança ofensiva e defensiva. O Mythos encontrou mais bugs em meses do que equipas humanas em anos. Isso é um feito incrível para a segurança digital.
Mas o mesmo modelo também pode ser usado para criar explorações. E a linha entre encontrar um bug e escrever um exploit é cada vez mais ténue.
O CEO Dario Amodei e o secretário da Defesa Pete Hegseth já tinham chocado antes, sobre o uso militar dos modelos da Anthropic. Agora, a tensão escalou para o patamar diplomático.
A Minha Opinião
Estou do lado do Carlini — antes de ser crente. Andei anos a desvalorizar o hype em torno dos riscos existenciais da IA, porque via que os modelos concretos estavam longe de justificar o pânico. Mas o Bugmageddon é diferente. Não é sobre AGI ou alinhamento. É sobre uma capacidade concreta, mensurável, e imediatamente perigosa: encontrar e explorar vulnerabilidades de software à escala industrial.
Isto vai piorar antes de melhorar. Outros modelos vão alcançar o Mythos — Carlini calcula que é uma questão de meses. E não estou convencido de que a indústria, os governos, ou os utilizadores finais estejam preparados para o dilúvio de bugs que aí vem.
O que me preocupa mais não é o Mythos. É o que vem a seguir, quando modelos ainda mais capazes estiverem disponíveis para qualquer pessoa com uma conexão à internet.
O Bugmageddon não é um evento. É o início de uma era.
Comentários (0)
Nenhum comentário ainda. Seja o primeiro!
Deixar comentário