zhipu

GLM-5

O GLM-5 é a potência open-weight de 744B parameters da Zhipu AI, destacando-se em tarefas agentic de longo horizonte, codificação e precisão factual com um...

Open WeightsAgentic EngineeringMoEZhipu AIAI para Codificação
zhipu logozhipuGLMFebruary 11, 2026
Contexto
200Ktokens
Saida Max
128Ktokens
Preco Entrada
$1.00/ 1M
Preco Saida
$3.20/ 1M
Modalidade:Text
Capacidades:FerramentasStreamingRaciocinio
Benchmarks
GPQA
68.2%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GLM-5 pontuou 68.2% neste benchmark.
HLE
32%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GLM-5 pontuou 32% neste benchmark.
MMLU
85%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GLM-5 pontuou 85% neste benchmark.
MMLU Pro
70.4%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GLM-5 pontuou 70.4% neste benchmark.
SimpleQA
48%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GLM-5 pontuou 48% neste benchmark.
IFEval
88%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GLM-5 pontuou 88% neste benchmark.
AIME 2025
84%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GLM-5 pontuou 84% neste benchmark.
MATH
88%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GLM-5 pontuou 88% neste benchmark.
GSM8k
97%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GLM-5 pontuou 97% neste benchmark.
MGSM
90%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GLM-5 pontuou 90% neste benchmark.
MathVista
0%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GLM-5 pontuou 0% neste benchmark.
SWE-Bench
77.8%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GLM-5 pontuou 77.8% neste benchmark.
HumanEval
90%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GLM-5 pontuou 90% neste benchmark.
LiveCodeBench
52%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GLM-5 pontuou 52% neste benchmark.
MMMU
0%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GLM-5 pontuou 0% neste benchmark.
MMMU Pro
0%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GLM-5 pontuou 0% neste benchmark.
ChartQA
0%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GLM-5 pontuou 0% neste benchmark.
DocVQA
0%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GLM-5 pontuou 0% neste benchmark.
Terminal-Bench
56.2%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GLM-5 pontuou 56.2% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GLM-5 pontuou 12% neste benchmark.

Sobre GLM-5

Aprenda sobre as capacidades do GLM-5, recursos e como ele pode ajuda-lo a obter melhores resultados.

O GLM-5 é o model fundamental flagship de próxima geração da Zhipu AI, especificamente projetado para redefinir o estado da Agentic Engineering para sistemas open-weight. Construído sobre uma arquitetura Mixture of Experts (MoE) massiva de 744 bilhões de parameters com 40 bilhões de active parameters, é o primeiro model open-weights a fechar a lacuna de performance com gigantes proprietários como o Claude 4.5. Este model se destaca em densidade de lógica e engenharia de software, alcançando um avanço de 77,8% no SWE-Bench Verified.

Tecnicamente, o GLM-5 integra o avançado Multi-head Latent Attention (MLA) e mecanismos de Sparse Attention para otimizar a eficiência de tokens e reduzir o overhead de memória em 33%. Treinado em uma escala de 28,5 trilhões de tokens usando um cluster puramente doméstico de 100.000 chips Huawei Ascend, o GLM-5 demonstra que o reasoning de nível de fronteira é possível sem dependência de hardware NVIDIA de ponta. Com seu context window de 200.000 tokens e 'Modo de Pensamento' especializado, ele fornece outputs robustos e com baixa alucinação para fluxos de trabalho técnicos de alta precisão.

Otimizado para confiabilidade, o GLM-5 serve como base para agentes técnicos autônomos capazes de manter estado persistente em execuções de longo horizonte. Seu licenciamento MIT permissivo e preço competitivo de US$ 1,00 por milhão de input tokens o tornam a escolha ideal para empresas que buscam implantação local ou integração de API em larga escala sem os termos restritivos das alternativas proprietárias.

GLM-5

Casos de Uso para GLM-5

Descubra as diferentes maneiras de usar GLM-5 para obter otimos resultados.

Engenharia de Sistemas Complexos

Projetar e manter arquiteturas de microsserviços com gerenciamento autônomo de dependências.

Tarefas Agentic de Longo Horizonte

Executar fluxos de trabalho técnicos de várias etapas que exigem memória persistente por mais de uma hora de execução.

Migração de Base de Código Legada

Refatorar repositórios inteiros e atualizar dependências obsoletas em um context window de 200k tokens.

Pesquisa Técnica com Baixa Alucinação

Realizar pesquisas técnicas de alta precisão onde a exatidão factual e a abstenção são fundamentais.

Operações de Terminal Autônomas

Alimentar agentes de desenvolvimento que podem executar autonomamente auditorias de segurança e comandos de administração de sistema.

Implantação Global Bilíngue

Fornecer reasoning de alto nível em inglês e chinês para aplicações corporativas localizadas em escala.

Pontos Fortes

Limitacoes

Elite Agentic Intelligence: Alcança a maior pontuação no Agentic Index (63) entre os modelos open-weight para execução de tarefas em várias etapas.
Sem Multimodality Nativa: Carece das capacidades de processamento de visão, áudio e vídeo encontradas em concorrentes multimodal como o GPT-4o.
Baixa Taxa de Alucinação: Exibe uma redução de 56% nas alucinações em comparação com as gerações anteriores, priorizando a precisão factual.
Requisitos de Hospedagem Extremos: Os 1,5 TB de pesos em BF16 tornam a implantação local impossível para quase todos os usuários sem infraestrutura de nuvem.
Eficiência MoE Massiva: A arquitetura de 744B parameters fornece densidade de lógica de flagship, enquanto o MLA reduz o overhead de memória em 33%.
Alta Latency de Inference: O tempo inicial para o primeiro token pode ser alto (mais de 7 segundos) em APIs públicas em comparação com modelos 'flash' menores.
Licença MIT Permissiva: Lançado sob uma licença verdadeiramente open-source, permitindo o uso comercial irrestrito sem cláusulas restritivas para o usuário.
Nuance de Design de Frontend: Embora excelente em lógica, ocasionalmente pode ter dificuldade com o polimento estético refinado de CSS em comparação com o Claude.

Inicio Rapido da API

zai/glm-5

Ver Documentacao
zhipu SDK
import { ZhipuAI } from "zhipuai-sdk";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-5",
    messages: [{ role: "user", content: "Analyze this repo for security vulnerabilities." }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GLM-5

Veja o que a comunidade pensa sobre GLM-5

"O GLM-5 é o novo líder em open weights! Ele marca 50 no Intelligence Index, uma redução significativa da lacuna."
Artificial Analysis
x
"Este model é inacreditável. Executei com sucesso um trabalho que levou mais de uma hora... me impressionou."
Theo - t3.gg
youtube
"O GLM-5 usou zero chips NVIDIA, 745B params e custa US$ 1 por milhão de input tokens. Este é o futuro."
Legendary
x
"A taxa de alucinação é insana; ele está muito mais disposto a dizer 'não sei' do que a mentir para você."
DevUser456
reddit
"A Zhipu AI acaba de lançar o desafio para os modelos de codificação open source."
AIExplorer
hackernews
"Finalmente, um model open weight que não perde o juízo no meio de uma tarefa complexa."
CodeMaster
reddit

Videos Sobre GLM-5

Assista tutoriais, analises e discussoes sobre GLM-5

É de longe o melhor model openweight que já vi, especialmente para coisas de código.

O fato de este ser o primeiro model openweight no qual executei com sucesso um trabalho que levou mais de uma hora... me impressionou.

Parece ser o model que menos alucina de todos até hoje.

Estamos vendo uma mudança massiva no que os modelos open weight podem realmente fazer em produção.

A estabilidade deste model durante longas sessões de uso de ferramentas é genuinamente sem precedentes.

A sensação de codificação aqui é muito, muito potente... comparável ao GLM 4.7, que já era um unicórnio.

A introdução da dynamic island em seu mockup de UI foi um recurso especial muito legal e inesperado.

Está superando quase todos os outros modelos de sua classe em lógica complexa.

A profundidade de reasoning aqui me lembra a primeira vez que usei o o1, mas é open weight.

Para um model apenas de texto, ele lida com a lógica visual no código melhor do que muitos modelos de visão.

O uso de memória despencou... tivemos melhorias de memória de 33x em relação ao que estávamos fazendo anteriormente.

Ele passou no teste de lógica do lava-jato com o pensamento ativado, superando o Claude e o GPT-4o.

A implantação disso requer um rack de servidor sério, mas a performance por watt é insana.

Ele lidou com a migração do meu repositório legado sem um único nome de biblioteca alucinado.

O modo de pensamento não é apenas um truque; ele muda fundamentalmente a qualidade do output.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GLM-5

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GLM-5 e obter melhores resultados.

Ative o Modo de Pensamento

O GLM-5 tem um desempenho significativamente melhor em enigmas lógicos complexos, como o teste do 'lava-jato', quando o reasoning está ativado.

Aproveite a Licença MIT

Tire vantagem do licenciamento permissivo para desenvolvimento comercial irrestrito e hospedagem interna.

Otimização do Uso de Ferramentas

Use o GLM-5 para tarefas de várias etapas, pois ele foi construído especificamente para alta estabilidade na execução de ferramentas agentic.

Utilização do Context Window

Insira bases de código inteiras no context window de 200k para realizar auditorias de segurança ou refatoração em todo o repositório.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Perguntas Frequentes Sobre GLM-5

Encontre respostas para perguntas comuns sobre GLM-5