A Anthropic lançou seu modelo mais recente, Fable, na terça-feira, anunciando-o como uma versão pública e limitada de seu poderoso e muito elogiado modelo de segurança cibernética Mythos.
Mas nem todos estão satisfeitos com as restrições e um número de segurança cibernética pesquisadores e profissionais foram ao ar reclamações on-line.
“[Fable] rejeita qualquer pedido que possa estar tangencialmente relacionado com o ciberespaço. Até mesmo tarefas inócuas, como ler uma postagem de weblog”, disse Valentina “Chompie” Palmiotti, uma conhecida pesquisadora de segurança que trabalha na IBM X-Pressure.
Quando um immediate aciona suas proteções, Fable pausa o bate-papo e diz que suas “medidas de segurança sinalizaram esta mensagem para tópicos de segurança cibernética ou biologia”.
As proteções foram implementadas para limitar o risco de que o Fable pudesse ser usado para desenvolver malware ou comprometer software program – uma preocupação de longa data dentro da Antrópica. As restrições à biologia vêm de uma preocupação semelhante em torno desenvolvimento de armas biológicas.
Quando a gigante da IA lançou o Mythos em abril, restringiu o modelo a um número limitado de empresas e organizações no que chamou de Projeto Glasswing, um esforço para implantar o modelo para proteger software program e infraestrutura críticos. Na semana passada, a Anthropic expandiu o acesso ao Mythos para centenas de organizações em 15 países.
Mas, apesar das boas intenções, muitos especialistas em segurança cibernética ainda se sentem desanimados pela natureza aleatória das restrições. Matt Suiche, um veterano em segurança cibernética, disse ao TechCrunch que “se você pedir para escrever um código seguro, ele assumirá que é um trabalho relacionado à segurança cibernética, em vez de práticas recomendadas de engenharia de software program, e você será rebaixado”. Fable está programado para voltar ao Claude Opus 4.8 se atingir um guardrail. “Parece ser baseado em palavras-chave, então qualquer coisa no campo lexical de ‘cibersegurança’ aciona as proteções.”
Contate-nos
Você tem mais informações sobre como os hackers estão usando IA? Ou como as empresas de cibersegurança estão usando a IA? Adoraríamos ouvir de você. A partir de um dispositivo e rede que não seja de trabalho, você pode entrar em contato com Lorenzo Franceschi-Bicchierai com segurança no Sign pelo telefone +1 917 257 1382, ou by way of Telegram e Keybase @lorenzofb, ou e-mail.
“Mas é compreensível, pois ainda estamos nos primeiros dias e eles ainda estão adaptando suas proteções. Tenho certeza de que evoluirão com o tempo, à medida que a Anthropic e outras empresas modelo de fronteira colaborarão mais com a atual nova geração de empresas de segurança cibernética”, disse Suiche, que é membro da equipe técnica da Tolmo, uma startup de segurança cibernética de IA. “É melhor capturar mais pessoas do que não o suficiente quando você faz essa liberação e relaxar as grades de proteção ao longo do tempo.”
Outro pesquisador reclamou no X, “até mesmo pedir uma revisão de código” aciona as proteções do Fable.
A Anthropic não respondeu imediatamente a um pedido de comentário.
Além das proteções dentro de seus modelos, a Anthropic exige que os profissionais de segurança cibernética se inscrevam no Programa de verificação cibernética. Se forem aprovados, os candidatos terão menos limitações ao usar Claude para trabalhos de segurança cibernética. OpenAI tem um programa semelhante chamado Acesso confiável para cibernéticos.
Quando você compra por meio de hyperlinks em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.













