GLM-5: China lança poderoso modelo open-source de IA com 744 bilhões de parâmetros

GLM-5: China lança poderoso modelo open-source de IA com 744 bilhões de parâmetros

Navegue por tópicos

O GLM-5 representa um avanço significativo da Z.ai na inteligência artificial, combinando escala massiva e otimização para hardware chinês. Lançado recentemente com código aberto, o modelo já é referência em benchmarks de programação e engenharia de sistemas complexos.

  • 744 bilhões de parâmetros totais, 40 bilhões ativos via Mixture of Experts (MoE)
  • Contexto de até 200 mil tokens e desempenho superior em benchmarks de codificação
  • Otimizado para chips Huawei Ascend, garantindo eficiência de custo e suporte ao ecossistema tecnológico chinês
  • Disponível sob licença MIT com API flexível e hospedagem em plataformas globais
  • Limitações incluem custo elevado, falta de multimodalidade e riscos geopolíticos ligados à dependência de chips chineses

Z.ai, empresa chinesa líder em inteligência artificial, lançou o GLM-5, seu mais recente modelo de linguagem de grande escala open-source com 744 bilhões de parâmetros totais e 40 bilhões ativos, focado em engenharia agentic e codificação de alta complexidade. O lançamento ocorreu no início de fevereiro de 2026, com ampla disponibilização pela web em plataformas como Fireworks AI, Ollama e Together AI, além da documentação oficial acessível no site da Z.ai.

Inovação técnica e características

  • O modelo adota a arquitetura Mixture of Experts (MoE), ativando apenas 40 bilhões dos 744 bilhões de parâmetros durante inferência, o que reduz custos computacionais em até 80-90% comparado a modelos densos.
  • Integra a tecnologia DeepSeek Sparse Attention (DSA) para otimizar atenção em contextos longos, suportando até 200 mil tokens de entrada e até 131 mil tokens de saída nas variantes mais avançadas.
  • Treinado com um volume elevado de dados, passando de 23 trilhões para mais de 28,5 trilhões de tokens.
  • Foco em aplicações de programação, engenharia de sistemas complexos e workflows de longa duração, com recursos para function calling, streaming em tempo real e saída estruturada JSON.
  • Otimizado para rodar em hardware nacional, especialmente os chips Huawei Ascend, fortalecendo a independência tecnológica chinesa.

Desempenho e comparação com concorrentes

O GLM-5 atinge desempenho próximo a modelos líderes globais como o Claude Opus 4.5/4.6 e o GPT-5.2 em benchmarks focados em codificação, destacando-se no SWE-bench Verified (77.8) e Terminal Bench 2.0 (56.2), superando concorrentes como Gemini 3.0 Pro.

Limitações e desafios

  • Custo relativamente alto de API, com preços em torno de US$ 0,90 por milhão de tokens de entrada e US$ 2,88 por milhão de tokens de saída, o que pode comprometer a viabilidade para usos em larga escala.
  • A ausência de suporte multimodal limita sua aplicação em cenários que exigem processamento de imagens ou dados multimídia, colocando-o atrás de concorrentes como GPT-5 e Claude em versatilidade.
  • Potenciais riscos geopolíticos e técnicos relacionados à forte dependência do hardware doméstico, especialmente diante de restrições comerciais internacionais.
  • Ceticismo da comunidade em relação à avaliação feita com judge models externos (GPT-5.2) e às possíveis falhas de roteamento típico de modelos MoE em casos extremos.

Impacto no mercado e perspectivas futuras

  • Expande o ecossistema de IA doméstico chinês, reduzindo a dependência tecnológica do Ocidente e incentivando a inovação local.
  • Disponibilização em código aberto com licença MIT estimula desenvolvedores globais a explorar capacidades avançadas de IA com flexibilidade.
  • Pressiona concorrentes ocidentais a ajustarem preços e estratégias, enquanto plataformas como Ollama e Together se beneficiam da hospedagem e integração locais.
  • Apesar de promissor, o GLM-5 ainda enfrenta desafios relacionados à escalabilidade prática e adoção internacional devido a fatores econômicos e políticos.
Foto de Maicon Ramos

Maicon Ramos

Infoprodutor e especialista em automações de Marketing, fundador do Automação sem Limites, uma comunidade para ajudar empreendedores e startup.