GLM-5: China lança poderoso modelo open-source de IA com 744 bilhões de parâmetros
-
Maicon Ramos
- 4 minutos de leitura
Navegue por tópicos
O GLM-5 representa um avanço significativo da Z.ai na inteligência artificial, combinando escala massiva e otimização para hardware chinês. Lançado recentemente com código aberto, o modelo já é referência em benchmarks de programação e engenharia de sistemas complexos.
- 744 bilhões de parâmetros totais, 40 bilhões ativos via Mixture of Experts (MoE)
- Contexto de até 200 mil tokens e desempenho superior em benchmarks de codificação
- Otimizado para chips Huawei Ascend, garantindo eficiência de custo e suporte ao ecossistema tecnológico chinês
- Disponível sob licença MIT com API flexível e hospedagem em plataformas globais
- Limitações incluem custo elevado, falta de multimodalidade e riscos geopolíticos ligados à dependência de chips chineses
Z.ai, empresa chinesa líder em inteligência artificial, lançou o GLM-5, seu mais recente modelo de linguagem de grande escala open-source com 744 bilhões de parâmetros totais e 40 bilhões ativos, focado em engenharia agentic e codificação de alta complexidade. O lançamento ocorreu no início de fevereiro de 2026, com ampla disponibilização pela web em plataformas como Fireworks AI, Ollama e Together AI, além da documentação oficial acessível no site da Z.ai.
Inovação técnica e características
- O modelo adota a arquitetura Mixture of Experts (MoE), ativando apenas 40 bilhões dos 744 bilhões de parâmetros durante inferência, o que reduz custos computacionais em até 80-90% comparado a modelos densos.
- Integra a tecnologia DeepSeek Sparse Attention (DSA) para otimizar atenção em contextos longos, suportando até 200 mil tokens de entrada e até 131 mil tokens de saída nas variantes mais avançadas.
- Treinado com um volume elevado de dados, passando de 23 trilhões para mais de 28,5 trilhões de tokens.
- Foco em aplicações de programação, engenharia de sistemas complexos e workflows de longa duração, com recursos para function calling, streaming em tempo real e saída estruturada JSON.
- Otimizado para rodar em hardware nacional, especialmente os chips Huawei Ascend, fortalecendo a independência tecnológica chinesa.
Desempenho e comparação com concorrentes
O GLM-5 atinge desempenho próximo a modelos líderes globais como o Claude Opus 4.5/4.6 e o GPT-5.2 em benchmarks focados em codificação, destacando-se no SWE-bench Verified (77.8) e Terminal Bench 2.0 (56.2), superando concorrentes como Gemini 3.0 Pro.
Limitações e desafios
- Custo relativamente alto de API, com preços em torno de US$ 0,90 por milhão de tokens de entrada e US$ 2,88 por milhão de tokens de saída, o que pode comprometer a viabilidade para usos em larga escala.
- A ausência de suporte multimodal limita sua aplicação em cenários que exigem processamento de imagens ou dados multimídia, colocando-o atrás de concorrentes como GPT-5 e Claude em versatilidade.
- Potenciais riscos geopolíticos e técnicos relacionados à forte dependência do hardware doméstico, especialmente diante de restrições comerciais internacionais.
- Ceticismo da comunidade em relação à avaliação feita com judge models externos (GPT-5.2) e às possíveis falhas de roteamento típico de modelos MoE em casos extremos.
Impacto no mercado e perspectivas futuras
- Expande o ecossistema de IA doméstico chinês, reduzindo a dependência tecnológica do Ocidente e incentivando a inovação local.
- Disponibilização em código aberto com licença MIT estimula desenvolvedores globais a explorar capacidades avançadas de IA com flexibilidade.
- Pressiona concorrentes ocidentais a ajustarem preços e estratégias, enquanto plataformas como Ollama e Together se beneficiam da hospedagem e integração locais.
- Apesar de promissor, o GLM-5 ainda enfrenta desafios relacionados à escalabilidade prática e adoção internacional devido a fatores econômicos e políticos.













