zhipu

GLM-4.7

O GLM-4.7 da Zhipu AI é um flagship model MoE de 358B com uma context window de 200K, performance de elite de 73,8% no SWE-bench e Deep Thinking nativo para...

zhipu logozhipuGLM22 de dezembro de 2025
Contexto
200Ktokens
Saida Max
131Ktokens
Preco Entrada
$0.60/ 1M
Preco Saida
$2.20/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
85.7%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GLM-4.7 pontuou 85.7% neste benchmark.
HLE
42.8%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GLM-4.7 pontuou 42.8% neste benchmark.
MMLU
90.1%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GLM-4.7 pontuou 90.1% neste benchmark.
MMLU Pro
84.3%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GLM-4.7 pontuou 84.3% neste benchmark.
SimpleQA
46%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GLM-4.7 pontuou 46% neste benchmark.
IFEval
88%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GLM-4.7 pontuou 88% neste benchmark.
AIME 2025
95.7%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GLM-4.7 pontuou 95.7% neste benchmark.
MATH
92%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GLM-4.7 pontuou 92% neste benchmark.
GSM8k
98%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GLM-4.7 pontuou 98% neste benchmark.
MGSM
94%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GLM-4.7 pontuou 94% neste benchmark.
MathVista
74%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GLM-4.7 pontuou 74% neste benchmark.
SWE-Bench
73.8%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GLM-4.7 pontuou 73.8% neste benchmark.
HumanEval
94.2%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GLM-4.7 pontuou 94.2% neste benchmark.
LiveCodeBench
84.9%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GLM-4.7 pontuou 84.9% neste benchmark.
MMMU
74.2%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GLM-4.7 pontuou 74.2% neste benchmark.
MMMU Pro
58%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GLM-4.7 pontuou 58% neste benchmark.
ChartQA
86%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GLM-4.7 pontuou 86% neste benchmark.
DocVQA
93%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GLM-4.7 pontuou 93% neste benchmark.
Terminal-Bench
41%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GLM-4.7 pontuou 41% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GLM-4.7 pontuou 12% neste benchmark.

Experimente GLM-4.7 Gratis

Converse com GLM-4.7 gratuitamente. Teste suas capacidades, faca perguntas e explore o que este modelo de IA pode fazer.

Prompt
Resposta
zhipu/glm-4-7

Sua resposta de IA aparecera aqui

Sobre GLM-4.7

Aprenda sobre as capacidades do GLM-4.7, recursos e como ele pode ajuda-lo a obter melhores resultados.

O GLM-4.7 é o mais recente flagship model de IA da Zhipu AI, representando um salto significativo na inteligência de pesos abertos. Este massivo model Mixture-of-Experts (MoE) de 358 bilhões de parameters foi projetado especificamente para reasoning avançado, automação de coding e workflows agentic complexos. Ele introduz um modo dedicado de Deep Thinking que permite o planejamento em múltiplas etapas e a recuperação de erros, permitindo que o model resolva tarefas críticas de engenharia de software com uma confiabilidade sem precedentes.

O model se distingue por um desempenho técnico excepcional, alcançando um estado-da-arte de 73,8% no benchmark SWE-bench Verified e 84,9 no LiveCodeBench v6. Com seu context window de 200.000 tokens e enorme capacidade de output de 131.072 tokens, o GLM-4.7 é otimizado para gerar aplicações inteiras e realizar pesquisas profundas em vastos conjuntos de dados.

Como um lançamento de pesos abertos sob a licença MIT, ele oferece uma alternativa poderosa e flexível às APIs proprietárias, suportando tanto a integração baseada em nuvem quanto o hosting local. Suas capacidades multimodal se estendem ao design avançado de UI e análise de documentos, tornando-o uma ferramenta versátil para o desenvolvimento moderno impulsionado por IA.

GLM-4.7

Casos de Uso para GLM-4.7

Descubra as diferentes maneiras de usar GLM-4.7 para obter otimos resultados.

Engenharia de Software agentic

Resolução de problemas complexos no GitHub e implementação de funcionalidades full-stack de forma autônoma em repositórios inteiros.

Vibe Coding de Alta Fidelidade

Geração rápida de interfaces web modernas e prontas para produção usando Tailwind CSS e componentes interativos Framer Motion.

Suporte Técnico Multilíngue

Assistência avançada de coding e resolução de problemas lógicos em mais de 10 ambientes de programação internacionais.

Pesquisa Acadêmica Profunda

Análise de conjuntos massivos de documentos para extrair informações verificáveis de multi-hop usando a estrutura de busca BrowseComp.

Design de Apresentação Automatizado

Criação de slides estruturados e visualmente equilibrados com layouts e tipografia precisos a partir de prompts de uma única frase.

Automação Baseada em Terminal

Execução de tarefas complexas de administração de sistemas e DevOps diretamente em um sandbox de terminal com 41% de precisão em benchmark.

Pontos Fortes

Limitacoes

Proficiência de Elite em Coding: Lidera atualmente os models de pesos abertos com uma pontuação de 73,8% no SWE-bench, superando muitos concorrentes proprietários.
Intensidade de Hardware Extrema: A contagem de 355B parameters torna o hosting local proibitivo para desenvolvedores individuais sem setups multi-GPU.
Tokens de Output Massivos: Apresenta um limite de 131K de output, permitindo a geração de bases de código inteiras prontas para produção em um único turno.
Disparidade entre API e Web: Existe uma lacuna de performance perceptível entre as respostas instantâneas da API e o reasoning mais profundo encontrado na interface web.
Engine de Reasoning Nativo: Incorpora capacidades de 'Deep Thinking' que permitem um melhor planejamento e reduzem desvios em tarefas agentic de longa duração.
Alucinações Temporais: Usuários relataram imprecisões ocasionais em relação a datas e eventos atuais logo após o lançamento do model.
Custo-Performance Imbatível: Oferece inteligência de nível frontier model por uma fração do custo, começando em apenas $0,60 por milhão de input tokens.
Alta Latência de Reasoning: Ativar o modo completo de Deep Thinking pode aumentar significativamente o tempo de resposta para prompts complexos de múltiplas etapas.

Inicio Rapido da API

zhipu/glm-4-7

Ver Documentacao
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GLM-4.7

Veja o que a comunidade pensa sobre GLM-4.7

"GLM 4.7 ESMAGA OS RECORDES DE CÓDIGO ABERTO! ... atingiu 42,8% no Humanity's Last Exam"
MindColliers
x/twitter
"GLM-4.7... marca 73,8% no SWE-Bench a $0,6/M tokens... A corrida da IA está se tornando verdadeiramente multipolar."
MateusGalasso
x/twitter
"GLM 4.7 traz ganhos claros... em coding agentic multilíngue e tarefas baseadas em terminal"
Dear-Success-1441
reddit
"Este model está arrasando em muitos benchmarks de coding de 2025"
cloris_rust
reddit
"GLM 4.7 vence pela velocidade e estabilidade, enquanto o Minimax M2.1 domina em coding multi-agent"
JamMasterJulian
youtube
"A Zhipu está realmente mostrando o que pesos abertos podem fazer contra os grandes laboratórios dos EUA."
DevGuru
hackernews

Videos Sobre GLM-4.7

Assista tutoriais, analises e discussoes sobre GLM-4.7

O GLM 4.7 é um model que entrega grandes melhorias na qualidade do código, reasoning complexo e uso de ferramentas

Atingiu 73,8% no SWE-bench verificado, o que é absolutamente incrível para um model open-source

Ele até supera o Claude Sonnet 4.5 e o GPT 5.1 em benchmarks de uso de ferramentas

A abordagem mixture of experts aqui é muito refinada, levando a uma maior eficiência apesar do tamanho

É essencialmente o primeiro model de pesos abertos a fornecer uma alternativa viável ao Claude 3.5 para coding pesado

É o melhor model aberto até agora, de longe

Produz páginas web mais limpas e modernas e gera slides visualmente melhores

Ele faz o reasoning, mas os rastros do thinking não estão disponíveis na API de plano de coding

Os resultados de vibe coding são quase perfeitos, mesmo com animações complexas em Tailwind

O context de 200k lida com repositórios longos com pouquíssima perda de precisão em comparação com versões anteriores do GLM

O upgrade importante é o thinking antes de agir, o que ajuda o model a lidar com tarefas complexas de forma confiável

Destaque para o vibe coding, onde o GLM 4.7 melhora a qualidade da UI

Preço da API em torno de $3, tornando-a uma opção com excelente custo-benefício

A performance multimodal permite converter designs do Figma para código com alta precisão

O deployment local é possível se você tiver uma workstation massiva, mas a API é notavelmente rápida

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes
Assistir video de demonstracao

Dicas Profissionais

Dicas de especialistas para ajuda-lo a aproveitar ao maximo este modelo e obter melhores resultados.

Ative o Deep Thinking

Para tarefas lógicas complexas, acione explicitamente o modo de thinking via parameters da API para permitir o planejamento em múltiplas etapas.

Aproveite o Thinking Preservado

Mantenha históricos de conversas longos para utilizar a capacidade do model de reter rastros de reasoning em vários turnos.

Quantização Local

Use versões GGUF de 2-bit ou 4-bit otimizadas pelo Unsloth para rodar este model de alto número de parameters em hardware de nível de consumo.

Injeção de Data

Inclua manualmente a data atual no system prompt para evitar alucinações temporais e melhorar a precisão do agendamento.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Perguntas Frequentes

Encontre respostas para perguntas comuns sobre este modelo