Antrópico diz que é desabilitando dois modelos de IA lançados no início desta semana, Claude Fable 5 e Mythos 5, para cumprir uma diretriz de controle de exportação que recebeu na tarde de sexta-feira do governo dos EUA, citando preocupações de segurança nacional.
O incidente sem precedentes marca o último ponto de conflito entre a Anthropic e a administração Trump. Embora a empresa diga que a ordem pedia a suspensão do acesso a “qualquer cidadão estrangeiro, seja dentro ou fora dos Estados Unidos, incluindo funcionários estrangeiros da Antrópico”, ela removeu o acesso de todos os seus clientes para garantir o cumprimento.
No início deste ano, o Departamento de Defesa de Trump classificou o Antrópico como um “risco da cadeia de abastecimento” depois de o fabricante de Claude ter procurado traçar limites sobre como os militares dos EUA poderiam usar a sua tecnologia. A designação impediu efetivamente que agências governamentais e empreiteiros usassem a tecnologia da Antrópica. A Anthropic respondeu entrando com ações judiciais contra a administração Trump.
Na terça-feira, a Anthropic lançou publicamente Claude Fable 5, uma versão do modelo Mythos AI da empresa com salvaguardas que o impedem de responder perguntas sobre segurança cibernética, biologia e química. Antes do lançamento público, que a Anthropic disse ter conduzido em colaboração com o governo dos EUA, o modelo Mythos Preview AI teve um lançamento limitado em abril. O objetivo period dar às empresas e organizações a oportunidade de utilizarem as suas poderosas capacidades de cibersegurança para melhorar as suas defesas e acabar com as preocupações de que a tecnologia pudesse ser explorada por malfeitores para desenvolver poderosas ferramentas de hacking.
Em um postagem no blog na sexta-feira, a Anthropic afirma ter recebido uma carta do governo dos EUA às 17h21 horário do leste dos EUA. “A carta não forneceu detalhes específicos de sua preocupação com a segurança nacional”, escreveu a Anthropic.
“Nosso entendimento é que o governo acredita ter tomado conhecimento de um método para contornar ou ‘desbloquear’ o Fable 5”, acrescentou a empresa. “Revisamos uma demonstração desta técnica específica sendo usada para identificar um pequeno número de vulnerabilidades menores anteriormente conhecidas. Todas essas vulnerabilidades parecem relativamente simples, e descobrimos que outros modelos disponíveis publicamente também são capazes de descobri-las sem exigir um desvio.”
Na postagem do weblog, a empresa argumentou que implementou fortes salvaguardas para reduzir a probabilidade de uso indevido de Claude Fable 5. A Anthropic também afirmou que o jailbreak que o governo dos EUA encontrou para Claude Fable 5 foi estreito e não teria twister um invasor significativamente mais perigoso do que seria com outro modelo de IA.
“Até o momento, o governo nos deu apenas evidências verbais de um potencial jailbreak restrito e não common, que consiste essencialmente em pedir ao modelo para ler uma base de código específica e corrigir quaisquer falhas de software program”, disse a empresa em seu weblog. “Nosso entendimento é que uma possível fuga de prisão foi compartilhada com o governo.”
Porta-vozes da Casa Branca e do Departamento de Comércio dos EUA não responderam imediatamente ao pedido de comentários da WIRED.
O CEO da Antrópico, Dario Amodei, disse em um ensaio político no início desta semana que ele e a empresa apoiam um processo governamental justo, estruturado e transparente que bloquearia a liberação de modelos de IA inseguros. Na postagem do weblog da empresa na sexta-feira, a Anthropic argumentou que “esta ação não segue esses princípios”.












