GLM-5: China lança poderoso modelo open-source de IA com 744 bilhões de parâmetros

Maicon Ramos
12/02/2026
4 minutos de leitura

O GLM-5 representa um avanço significativo da Z.ai na inteligência artificial, combinando escala massiva e otimização para hardware chinês. Lançado recentemente com código aberto, o modelo já é referência em benchmarks de programação e engenharia de sistemas complexos.

744 bilhões de parâmetros totais, 40 bilhões ativos via Mixture of Experts (MoE)
Contexto de até 200 mil tokens e desempenho superior em benchmarks de codificação
Otimizado para chips Huawei Ascend, garantindo eficiência de custo e suporte ao ecossistema tecnológico chinês
Disponível sob licença MIT com API flexível e hospedagem em plataformas globais
Limitações incluem custo elevado, falta de multimodalidade e riscos geopolíticos ligados à dependência de chips chineses

Z.ai, empresa chinesa líder em inteligência artificial, lançou o GLM-5, seu mais recente modelo de linguagem de grande escala open-source com 744 bilhões de parâmetros totais e 40 bilhões ativos, focado em engenharia agentic e codificação de alta complexidade. O lançamento ocorreu no início de fevereiro de 2026, com ampla disponibilização pela web em plataformas como Fireworks AI, Ollama e Together AI, além da documentação oficial acessível no site da Z.ai.

Inovação técnica e características

O modelo adota a arquitetura Mixture of Experts (MoE), ativando apenas 40 bilhões dos 744 bilhões de parâmetros durante inferência, o que reduz custos computacionais em até 80-90% comparado a modelos densos.
Integra a tecnologia DeepSeek Sparse Attention (DSA) para otimizar atenção em contextos longos, suportando até 200 mil tokens de entrada e até 131 mil tokens de saída nas variantes mais avançadas.
Treinado com um volume elevado de dados, passando de 23 trilhões para mais de 28,5 trilhões de tokens.
Foco em aplicações de programação, engenharia de sistemas complexos e workflows de longa duração, com recursos para function calling, streaming em tempo real e saída estruturada JSON.
Otimizado para rodar em hardware nacional, especialmente os chips Huawei Ascend, fortalecendo a independência tecnológica chinesa.

Desempenho e comparação com concorrentes

O GLM-5 atinge desempenho próximo a modelos líderes globais como o Claude Opus 4.5/4.6 e o GPT-5.2 em benchmarks focados em codificação, destacando-se no SWE-bench Verified (77.8) e Terminal Bench 2.0 (56.2), superando concorrentes como Gemini 3.0 Pro.

Limitações e desafios

Custo relativamente alto de API, com preços em torno de US$ 0,90 por milhão de tokens de entrada e US$ 2,88 por milhão de tokens de saída, o que pode comprometer a viabilidade para usos em larga escala.
A ausência de suporte multimodal limita sua aplicação em cenários que exigem processamento de imagens ou dados multimídia, colocando-o atrás de concorrentes como GPT-5 e Claude em versatilidade.
Potenciais riscos geopolíticos e técnicos relacionados à forte dependência do hardware doméstico, especialmente diante de restrições comerciais internacionais.
Ceticismo da comunidade em relação à avaliação feita com judge models externos (GPT-5.2) e às possíveis falhas de roteamento típico de modelos MoE em casos extremos.

Impacto no mercado e perspectivas futuras

Expande o ecossistema de IA doméstico chinês, reduzindo a dependência tecnológica do Ocidente e incentivando a inovação local.
Disponibilização em código aberto com licença MIT estimula desenvolvedores globais a explorar capacidades avançadas de IA com flexibilidade.
Pressiona concorrentes ocidentais a ajustarem preços e estratégias, enquanto plataformas como Ollama e Together se beneficiam da hospedagem e integração locais.
Apesar de promissor, o GLM-5 ainda enfrenta desafios relacionados à escalabilidade prática e adoção internacional devido a fatores econômicos e políticos.

Treinamentos

GLM-5: China lança poderoso modelo open-source de IA com 744 bilhões de parâmetros

Navegue por tópicos

Inovação técnica e características

Desempenho e comparação com concorrentes

Limitações e desafios

Impacto no mercado e perspectivas futuras

Maicon Ramos

OpenAI Codex cria jogo completo com um único prompt estruturado

IA Mais que Dobra Produção de Código, mas Ganhos São Desiguais

Apple Renova Siri com IA do Google Gemini para Competir com ChatGPT

Anthropic Lança Claude Opus 4.8 e Desafia OpenAI

Guia ensina a treinar IA para editar no seu estilo

AWS destaca bases sólidas para escalar agentic AI corporativo

Categorias

Soluções

Inscreva-se em nossa newsletter