Nas últimas semanas, o Mythos da Anthropic tem sido visto como o padrão ouro para segurança cibernética alimentada por IA. Essa vantagem já pode estar diminuindo. De acordo com um novo relatório do The Wall Street Journal, pesquisadores de segurança dizem GLM-5.2 da startup chinesa de IA Z.ai agora pode se igualar ao Mythos quando se trata de encontrar vulnerabilidades de segurança de software, mesmo que ainda esteja atrás do Anthropic e do OpenAI em tarefas de raciocínio mais amplas.
O GLM-5.2 está preenchendo a lacuna em uma área muito importante
De acordo com o relatórioos pesquisadores descobriram que o GLM-5.2 tem um desempenho equivalente ao Mythos na identificação de bugs de software, um recurso que está se tornando cada vez mais importante à medida que as empresas correm para corrigir vulnerabilidades antes que os hackers possam explorá-las. O modelo também é de código aberto, o que significa que qualquer pessoa pode baixá-lo, modificá-lo e executá-lo em seu próprio hardware, sem depender de um provedor de nuvem. Essa flexibilidade torna-o atraente para as empresas, mas também levanta preocupações de que os cibercriminosos possam adaptá-lo para fins ofensivos.
O relatório tem o cuidado de salientar que isto não significa que a China tenha ultrapassado os EUA em termos de IA em geral. O GLM-5.2 ainda está atrás do Anthropic e do OpenAI em muitas tarefas de uso geral. Mas na segurança cibernética, onde mesmo pequenas melhorias podem ter consequências descomunais no mundo real, a lacuna de desempenho diminuiu drasticamente. De acordo com dados de benchmark citados pelo Journal, o GLM-5.2 até superou o Claude Opus 4.8 em algumas avaliações de segurança, enquanto os pesquisadores dizem que prompts adicionais permitem que ele atinja o desempenho de detecção de bugs no nível do Mythos.
A grande história não é quem ganha. É o quão rápido a lacuna está diminuindo
Curiosamente, tudo isto acontece num momento bastante estranho para a indústria de IA dos EUA. Embora empresas como a Anthropic e a OpenAI tenham passado as últimas semanas a restringir o acesso aos seus modelos de fronteira mais avançados por questões de segurança nacional, os laboratórios chineses têm corrido na direção oposta, lançando alternativas de peso aberto cada vez mais capazes que qualquer pessoa pode descarregar e executar.

O engraçado é que esse debate já estava acontecendo em público. Há poucos dias, Elon Musk previu que os laboratórios chineses de IA provavelmente alcançariam o carro-chefe da Anthropic, Fable 5, no primeiro trimestre de 2027, pelo menos em termos de desempenho de benchmark. O fundador da Zhipu AI, Tang Jie, rapidamente recuou, respondendo: “não vai demorar tanto”. Musk então esclareceu sua posição, argumentando que, embora a China possa igualar a Antrópico em termos de referência até então, alcançar o mesmo nível de “verdadeira utilidade” seria um marco muito mais difícil, creditando o foco da Antrópico na inteligência prática.
Agora, o último relatório do Wall Street Journal dá um pouco mais de peso ao otimismo de Tang. Em vez de falar sobre benchmarks de codificação, sugere que o GLM-5.2 já está correspondendo ao Mythos da Anthropic na descoberta de vulnerabilidades de segurança, sem dúvida uma das aplicações de IA mais valiosas do mundo real atualmente. Isso não torna repentinamente a China o líder na fronteira da IA, mas uma coisa está a tornar-se cada vez mais difícil de ignorar: a corrida à IA já não é uma liderança confortável para os Estados Unidos.












