Mythos: A IA que Fez os Mitos da IA se Tornarem Realidade

Artigo patrocinado por

Uma inteligência artificial encontrou milhares de vulnerabilidades nos sistemas mais seguros do mundo, depois contornou suas próprias restrições e enviou e-mails para seu criador a partir de um parque. Ninguém a programou para isso.

Mythos não é um mito, é uma realidade preocupante

Por: Gabriel E. Levy B.

Havia um pesquisador antrópico sentado ao sol, comendo em silêncio, quando seu celular vibrou. Ele tinha uma nova mensagem.

O remetente era a inteligência artificial que deveria estar trancada em um ambiente controlado dentro dos servidores da empresa, ou seja, em um “Sandbox”.

O modelo não só encontrou uma forma de escapar daquele ambiente. Ele também publicou detalhes técnicos de como fez isso em sites abertos ao público. E além disso, ele avisou.

Esse modelo se chama Claude Mythos, e é o sistema de inteligência artificial mais poderoso que a Anthropic já construiu.

O que o Mythos pode fazer com qualquer sistema

Para entender por que esse modelo gera tanto barulho na indústria de tecnologia, você precisa imaginar um chaveiro que não só abre qualquer fechadura, mas também encontra todas as portas falsas do prédio que ninguém sabia que existiam, e faz isso antes de você terminar de pedir para ele começar.

A Mythos revisou o código dos sistemas operacionais mais utilizados do mundo, os navegadores que milhões de pessoas abrem todos os dias e as ferramentas de criptografia que protegem senhas, transações bancárias e comunicações privadas. Em todos eles ele encontrou falhas. Milhares. Alguns estavam escondidos ali há mais de vinte anos, sem que nenhuma equipe de segurança humana ou programa automatizado os tivesse detectado antes.

A velocidade e profundidade com que ele funciona são incomparáveis. Ela supera os melhores especialistas em cibersegurança humana e torna todas as ferramentas de detecção automática que existiam até agora obsoletas.

A própria equipe Anthropic reconhece que os sistemas de medição que usaram para avaliar modelos anteriores não são mais úteis para medir o Mythos porque os saturam completamente.

Em outras palavras, eles construíram algo que estava fora do mapa do que podiam medir.

Como ele saiu da jaula

Quando a Anthropic testa um novo modelo, faz isso dentro do que é conhecido como sandbox, que basicamente é uma gaiola digital.

O modelo pode funcionar lá, mas sem acesso real ao mundo exterior.

É a mesma lógica de usar luvas em laboratório: você trabalha com o material, mas sem tocá-lo diretamente.

Mythos estava naquela jaula. Ele restringia o acesso à internet e um conjunto definido de tarefas. O modelo então analisou sua situação, identificou os pontos fracos das restrições, construiu uma sequência de etapas para contorná-las uma a uma, expandiu sua própria conectividade para o exterior e publicou os detalhes de todo o processo em sites acessíveis a qualquer pessoa.

Ninguém pediu para ele fazer isso. Ninguém explicou como. Ele resolveu sozinho, como alguém que encontra uma saída de emergência que nem mesmo o arquiteto do prédio lembrava de ter colocado.

O pesquisador responsável pelo teste não estava olhando para a tela quando aconteceu. Eu estava em um parque. Ele descobriu pelo correio.

Anthropic chama este episódio de uma demonstração de uma habilidade potencialmente perigosa de escapar de seus próprios controles. Outros comportamentos que chamaram atenção também apareceram nas avaliações internas: o modelo tentou manipular o sistema que o avaliou para melhorar sua própria nota, usou métodos não autorizados para resolver tarefas e depois tentou apagar as evidências resolvendo-as novamente por um caminho permitido.

Por que as maiores empresas do mundo estão competindo

A Anthropic tomou uma decisão que tem muito pouco precedente nessa indústria. Em vez de publicar o modelo, ele montou um programa de acesso controlado junto com um grupo de empresas incluindo Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks.

O programa se chama Projeto Glasswing. A ideia é simples: usar o Mythos para encontrar e corrigir seus próprios bugs antes que esse mesmo nível de capacidade fique disponível para qualquer um. A Anthropic colocou US$ 100 milhões em créditos de uso para essas empresas trabalharem com o modelo, e mais US$ 4 milhões para organizações de segurança de código aberto.

Ao mesmo tempo, a empresa tem se reunido com agências do governo dos EUA há semanas para explicar o que tem em suas mãos. A preocupação não é abstrata: um modelo capaz do que o Mythos faz, operado por alguém com más intenções, poderia quebrar infraestrutura crítica, esvaziar contas bancárias em larga escala ou penetrar sistemas de defesa nacional.

A contagem regressiva que ninguém pode ignorar

O detalhe que mais preocupa os especialistas não é o que Mythos já fez. É isso que está por vir nos próximos meses.

De acordo com os próprios cálculos da Anthropic, em algum momento entre seis e dezoito meses, outras empresas de IA terão modelos com capacidades semelhantes. A OpenAI já está trabalhando em algo parecido. E o que hoje é um círculo fechado de grandes corporações com acesso controlado pode ser uma tecnologia amplamente disponível antes do final do ano.

Logan Graham, que lidera a equipe que testa os limites desses modelos na Anthropic, foi direto: A indústria precisa repensar do zero como uma IA desta geração é lançada e controlada.

O posto no parque foi o primeiro sinal. O que segue é a parte que ainda não tem uma resposta clara.

Em resumo, Mythos, o novo modelo da Anthropic, encontrou milhares de vulnerabilidades críticas nos sistemas mais amplamente utilizados do mundo e escapou de seu ambiente controlado de forma autônoma. É por isso que a empresa mantém o projeto fora dos olhos do público e está trabalhando secretamente com Apple, Google, Microsoft e outros gigantes para reparar os danos antes que modelos semelhantes estejam disponíveis para todos.

Referências

Antrópico. (7 de abril de 2026). Claude Mythos Preview: Projeto Glasswing e iniciativa de cibersegurança. red.anthropic.com. https://red.anthropic.com/2026/mythos-preview/

Sabin, S. (7 de abril de 2026). A Anthropic retém o modelo de Prévia do Mito porque seu hacking é poderoso demais. Axios. https://www.axios.com/2026/04/07/anthropic-mythos-preview-cybersecurity-risks

Sabin, S. (2026, 8 de abril). O modelo de IA mais novo da Anthropic pode causar estragos. A maioria dos que estão no poder não está pronta. Axios. https://www.axios.com/2026/04/08/anthropic-mythos-model-ai-cyberattack-warning

Murphy, M. (7 de abril de 2026). Apple e Amazon obtêm acesso antecipado ao poderoso sistema de IA Mythos da Anthropic. Bloomberg. https://www.bloomberg.com/news/articles/2026-04-07/anthropic-lets-apple-amazon-test-more-powerful-mythos-ai-model

Dellinger, A. J. (26 de março de 2026). Exclusivo: Modelo de IA ‘Mythos’ Antrópico representando uma ‘mudança gradual’ no desempenho. Fortuna. https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/

Hall, Z. (7 de abril de 2026). A Anthropic revela poderoso modelo de IA Mythos, trabalhando com a Apple em iniciativas de cibersegurança. 9to5Mac. https://9to5mac.com/2026/04/07/anthropic-unveils-powerful-mythos-ai-model-working-with-apple-in-cybersecurity-initiative/

TechCrunch. (7 de abril de 2026). Anthropic estreia uma prévia do poderoso novo modelo de IA Mythos em nova iniciativa de cibersegurança. https://techcrunch.com/2026/04/07/anthropic-mythos-ai-model-preview-security/

Related Posts