Início Tecnologia O GLM-5.2 de peso aberto da Z.ai supera o GPT-5.5 em vários...

O GLM-5.2 de peso aberto da Z.ai supera o GPT-5.5 em vários benchmarks de codificação de longo horizonte por 1/6 do custo

14
0

Hoje, a startup chinesa de IA Z.ai (anteriormente Zhipu AI) anunciou o lançamento imediato do GLM-5.2um modelo de linguagem grande (LLM) de pesos abertos de 753 bilhões de parâmetros projetado especificamente para dominar tarefas autônomas de codificação e engenharia de “horizonte longo”.

Disponível imediatamente em Abraçando o rostoo API Z.aie mais de 20 ambientes de codificação de terceiros, o modelo apresenta uma janela de contexto altamente estável de 1 milhão de tokens, juntamente com níveis de assinatura empresarial a partir de apenas US$ 12,60 por mês.

Uma excelente notícia para empresas preocupadas com custos e segurança, z.ai lançou os pesos principais do GLM-5.2 sob um contrato irrestrito Licença de código aberto do MITpermitindo que as empresas baixem o modelo gratuitamente do Hugging Face, personalizem ou ajustem-no de acordo com sua preferência e executem-no potencialmente localmente ou por meio de máquinas virtuais apenas pelo custo de sua computação e eletricidade.

Esta é uma opção cada vez mais atraente para as empresas, à medida que os modelos proprietários americanos de última geração enfrentam um futuro regulatório incerto e potencialmente interrompido, após a diretiva de controle de exportação da administração Trump na semana passada proibindo cidadãos estrangeiros de usar o novo modelo Claude Fable 5 da Anthropic (ao qual essa empresa respondeu colocando os modelos em questão totalmente offline para todos Usuários).

Para os tomadores de decisões técnicas empresariais, o GLM-5.2 da z.ai fornece um caminho altamente capaz para hospedar IA de nível de fronteira localmente, ignorando totalmente as cercas geográficas e as limitações comerciais.

IndexShare reutiliza um indexador para cada quatro camadas de atenção esparsas, reduzindo as necessidades de computação

Nos bastidores, o GLM-5.2 opera com 753 bilhões de parâmetros e introduz uma grande otimização arquitetônica chamada “IndexShare”.

Em modelos de linguagem massiva padrão, recalcular mecanismos de atenção em documentos longos é computacionalmente exorbitante. IndexShare resolve isso reutilizando o mesmo indexador em cada quatro camadas de atenção esparsas.

No comprimento máximo de contexto de 1 milhão de tokens, essa inovação única reduz os FLOPs de computação por token em 2,9 vezes.

O modelo também apresenta uma camada atualizada de Multi-Token Prediction (MTP) para decodificação especulativa, que aumenta o comprimento do token aceito em até 20% durante a inferência.

Além disso, Z.ai implementou “Modos de pensamento” flexíveis e selecionáveis. Os usuários podem alternar o esforço de raciocínio do modelo entre “Max”, projetado para ultrapassar os limites da solução lógica de problemas, ou “Excessive”, que atinge um equilíbrio cuidadoso entre desempenho de ponta e eficiência de token sensível à latência.

Benchmarks de última geração para um modelo aberto e correspondente, até mesmo superando líderes proprietários em algumas categorias

Em testes de benchmark de terceiros padrão da indústria, o GLM-5.2 tem desempenho acima da maioria dos modelos principais de código aberto, até mesmo DeepSeek v4 e pontuações próximas ou acima de seus rivais de peso fechado, GPT-5.5 da OpenAI e Claude Opus 4.8 da Anthropic.

Gráficos de barras de comparação de benchmark GLM-5.2. Crédito: z.ai

O modelo brilha particularmente no uso de ferramentas de agente e em tarefas de engenharia de software program de longo horizonte:

  • Banco SWE Professional: O GLM-5.2 obteve pontuação de 62,1, vencendo decisivamente o GPT-5.5 (58,6) e seu próprio antecessor, o GLM-5.1 (58,4).

  • FrontierSWE (Dominância): Projetado para testar a conclusão de tarefas de longo horizonte, o GLM-5.2 atingiu 74,4%, ultrapassando o GPT-5.5 (72,6%) e terminando quase empatado com Claude Opus 4,8 (75,1%).

Benchmarks de tarefas de longo horizonte GLM-5.2

Benchmarks de tarefas de longo horizonte do GLM-5.2. Crédito: z.ai

  • Atlas MCP: Nesta avaliação de uso de ferramenta, o GLM-5.2 alcançou 77,0, superando o GPT-5,5 (75,3) e tendo um desempenho apenas inferior ao de Claude Opus 4,8 (77,8).

  • Último exame da humanidade (com ferramentas): Quando equipado com ferramentas externas, o GLM-5.2 alcançou uma pontuação de 54,7, ficando à frente do GPT-5.5 (52,2) e emblem atrás do Claude Opus 4.8 (57,9).

  • PostTrainBench e SWE-Maratona: Em cargas de trabalho de engenharia estendidas de várias horas, o GLM-5.2 superou consistentemente o GPT-5.5, marcando 34,3% contra 25,0% do GPT-5.5 no PostTrainBench e 13,0% contra 12,0% do GPT-5.5 no SWE-Marathon.

Embora o GLM-5.2 fique ligeiramente atrás de Claude Opus 4.8 e GPT-5.5 nas pontuações brutas do Terminal-Bench 2.1 (81,0 versus 85,0 e 84,0, respectivamente), ele supera significativamente o Gemini 3.1 Professional do Google (74,0).

Além das métricas de codificação tradicionais, o GLM-5.2 conquistou um impressionante primeiro lugar no benchmark de tarefas de design de crowdsourcing Arena de Designsuperando até mesmo o já mencionado Claude Fable 5 de última geração com um Pontuação ELO de 1360.

Além disso, o impacto dos novos “modos de pensamento” selecionáveis ​​do Z.ai é claramente visível nos dados: no nível de esforço “Máx”, o GLM-5.2 atinge o pico de inteligência, mas utiliza quase 85 mil tokens de saída por tarefa. Mudar para a configuração de esforço “Alto” sacrifica apenas alguns pontos no desempenho, ao mesmo tempo que reduz pela metade a saída de token necessária, fornecendo uma alavanca de otimização essential para aplicativos sensíveis à latência.

Disponível por meio de planos de codificação e API

Para operacionalizar o modelo, Z.ai lançou o Plano de codificação GLMvisando diretamente os fluxos de trabalho do desenvolvedor, em vez de simples interfaces de bate-papo.

O plano oferece suporte pronto para uso para ferramentas e ferramentas de codificação de agentes globais e dos EUA, incluindo Claude Code, OpenClaw, Cline, Kilo Code, Crush e Manufacturing facility, entre outros. Os níveis de preços do Plano de Codificação (quando cobrados anualmente) são altamente competitivos:

  • Leve: US$ 12,60 por mês (US$ 151,20 por ano a partir do 2º ano), voltado para iteração leve em pequenos repositórios.

  • Pró: US$ 50,40 por mês para desenvolvimento diário em repositórios de médio porte, oferecendo 5x a permissão de uso do plano Lite.

  • Máx.: US$ 112,00 por mês para cargas de trabalho pesadas, oferecendo 20x o uso do Lite e recursos dedicados durante horários de pico.

Para desenvolvedores empresariais que integram o modelo bruto em seus próprios aplicativos, o preço da API da Z.ai reduz significativamente seus rivais ocidentais, ao mesmo tempo que corresponde às taxas exatas da geração GLM-5.1 anterior.

O acesso à API GLM-5.2 é com preço de US$ 1,40 por milhão de tokens de entrada e US$ 4,40 por milhão de tokens de saídatornando-o um modelo de preço médio globalmente, mas cerca de

Ordenado pelo custo complete (entrada + produção), do menos para o mais caro. O preço mostrado é o preço padrão de pagamento conforme o uso por 1 milhão de tokens.

Modelo

Entrada

Saída

Custo complete

Fonte

Flash MiMo-V2.5

US$ 0,10

US$ 0,30

US$ 0,40

Xiaomi MiMo

deepseek-v4-flash

US$ 0,14

US$ 0,28

US$ 0,42

DeepSeek

deepseek-v4-pro

US$ 0,435

US$ 0,87

US$ 1.305

DeepSeek

MiniMax-M3

US$ 0,30

US$ 1,20

US$ 1,50

MiniMax

Gêmeos 3.1 Flash-Lite

US$ 0,25

US$ 1,50

US$ 1,75

Google

Qwen3.7-Plus

US$ 0,40

US$ 1,60

US$ 2,00

Nuvem Alibaba

MiMo-V2.5

US$ 0,40

US$ 2,00

US$ 2,40

Xiaomi MiMo

Grok 4.3 (baixo contexto)

US$ 1,25

US$ 2,50

US$ 3,75

xAI

MiMo-V2.5 Professional (≤256K)

US$ 1,00

US$ 3,00

US$ 4,00

Xiaomi MiMo

Kimi-K2.6

US$ 0,95

US$ 4,00

US$ 4,95

Moonshot/Kimi

GLM-5.2

US$ 1,40

US$ 4,40

US$ 5,80

Z.ai

Grok 4.3 (alto contexto)

US$ 2,50

US$ 5,00

US$ 7,50

xAI

MiMo-V2.5 Professional (>256K)

US$ 2,00

US$ 6,00

US$ 8,00

Xiaomi MiMo

Qwen3.7-Máx.

US$ 2,50

US$ 7,50

US$ 10,00

Nuvem Alibaba

Gêmeos 3.5 Flash

US$ 1,50

US$ 9,00

US$ 10,50

Google

Pré-visualização do Gemini 3.1 Professional (≤200K)

US$ 2,00

US$ 12,00

US$ 14,00

Google

GPT-5.4

US$ 2,50

US$ 15,00

US$ 17,50

OpenAI

Pré-visualização do Gemini 3.1 Professional (>200K)

US$ 4,00

US$ 18,00

US$ 22,00

Google

Cláudio Opus 4.8

US$ 5,00

US$ 25,00

US$ 30,00

Antrópico

GPT-5.5

US$ 5,00

US$ 30,00

US$ 35,00

OpenAI

Claude Fábula 5 / Claude Mito 5

US$ 10,00

US$ 50,00

US$ 60,00

Antrópico

Para otimizar ainda mais os custos para cargas de trabalho de contexto longo, Z.ai oferece uma taxa de entrada em cache de apenas US$ 0,26 por milhão de tokens, juntamente com uma oferta por tempo limitado para armazenamento de entrada em cache gratuito.

O forte contraste entre inovadores de peso aberto e laboratórios ocidentais proprietários não passou despercebido pela comunidade de desenvolvedores.

No X, o prolífico observador de IA Lisan al Gaib (@ scaling01) argumentou que “os laboratórios de fronteira estão absolutamente enganando você no preço da API”.

A postagem observou que, embora modelos abertos massivos, como o GLM-5.2 de 744 bilhões de parâmetros, cobrem US$ 4,40 por milhão de tokens de saída e o DeepSeek-V4-Professional (1,6 trilhão de parâmetros) cobra apenas US$ 0,87, os modelos proprietários exigem prêmios pesados: Sonnet 4.6 e Opus 4.8 da Anthropic cobram US$ 15,00 e US$ 25,00 respectivamente, enquanto o GPT-5.5 da OpenAI custa $ 30,00 para saída.

Destacando que os desenvolvedores de modelos abertos estão operando lucrativamente sem depender dos mais novos “chips sofisticados da Blackwell”, o comentarista sugeriu que os principais laboratórios proprietários estão “provavelmente com margens de 90% ou mais neste momento”.

A beleza da licença MIT não modificada para uso empresarial

O aspecto mais perturbador da versão GLM-5.2 é o seu licenciamento. Z.ai lançou os pesos do modelo sob uma licença de código aberto do MIT, estabelecendo-o como um sistema “Pure Open”.

A documentação técnica da empresa indica explicitamente que esta licença não garante “nenhum limite regional” e permite “acesso técnico sem fronteiras”.

Para os líderes de tecnologia empresarial, uma licença do MIT significa que o software program pode ser usado, modificado e comercializado sem pagar royalties ou aderir a políticas restritivas de governança de “uso aceitável” comuns às licenças de uso duplo.

Ele permite que as equipes de engenharia hospedem IA de nível de fronteira em sua própria infraestrutura soberana, eliminando totalmente a dependência de fornecedores.

Recepção calorosa entre desenvolvedores de IA e fabricantes de ferramentas

A reação dos desenvolvedores ao lançamento foi imediata e extremamente positiva.

A equipe por trás Código do quilo integração confirmada no primeiro dia, postando no X: “GLM-5.2 é executado em Kilo Code no primeiro dia. A janela de contexto de 1M e o modo de esforço máximo estão ativos. Aponte sua configuração para ele e pronto!”.

Ambiente de codificação de código aberto Cline IDE ecoou esse sentimento no Xobservando a vantagem econômica: “GLM-5.2 é o primeiro modelo de pesos abertos a ultrapassar 80% no Terminal-Bench e supera todos os outros modelos abertos disponíveis. Ele também vence o Gemini, tornando-o um modelo de nível de fronteira por uma fração do custo. Os pesos abertos estão de volta. Este modelo é uma virada de jogo. Disponível no Cline agora!”.

Da mesma forma, o agente de desktop de codificação de código aberto rival IA inteligente também testou os novos recursos do modelo em fluxos de trabalho de agentes complexos, observando no X: “lançou uma tarefa actual de longo horizonte: pesquisar 30 empresas em 6 setores da pilha de infraestrutura de IA, estruturá-la em JSON e, em seguida, construir um relatório HTML interativo… onde 5.2 avança: -> planos…”.

fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui