zhipu

GLM-5.2

GLM-5.2 是智谱 AI 的旗舰 open-weights 模型,具备 100 万 token context window 和专业的 agentic 编码能力,并采用 MIT 许可证。

Open WeightsMIT License编码助手1M ContextReasoning
zhipu logozhipuGLM-52026年6月16日
上下文
1.0Mtokens
最大输出
4Ktokens
输入价格
$1.40/ 1M
输出价格
$4.40/ 1M
模态:Text
能力:工具流式传输推理
基准测试
GPQA
83%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 GLM-5.2 在此基准测试中得分 83%。
HLE
40%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 GLM-5.2 在此基准测试中得分 40%。
MMLU
94%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 GLM-5.2 在此基准测试中得分 94%。
MMLU Pro
86%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 GLM-5.2 在此基准测试中得分 86%。
IFEval
85%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 GLM-5.2 在此基准测试中得分 85%。
AIME 2025
99%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 GLM-5.2 在此基准测试中得分 99%。
MATH
97%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 GLM-5.2 在此基准测试中得分 97%。
GSM8k
98%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 GLM-5.2 在此基准测试中得分 98%。
MGSM
91%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 GLM-5.2 在此基准测试中得分 91%。
SWE-Bench
62%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 GLM-5.2 在此基准测试中得分 62%。
HumanEval
97%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 GLM-5.2 在此基准测试中得分 97%。
LiveCodeBench
65%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 GLM-5.2 在此基准测试中得分 65%。
Terminal-Bench
81%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 GLM-5.2 在此基准测试中得分 81%。
ARC-AGI
14%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 GLM-5.2 在此基准测试中得分 14%。

关于 GLM-5.2

了解 GLM-5.2 的功能、特性以及它如何帮助您获得更好的效果。

Mixture of Experts 架构

GLM-5.2 是一款专为长周期任务和自主 agentic 工作流设计的 Mixture of Experts (MoE) 旗舰模型。它采用了 7530 亿参数的庞大架构,每个 token 拥有约 400 亿激活参数。这一设计通过在保持复杂逻辑任务性能的同时降低 compute 成本,实现了 GLM 系列在效率上的重大飞跃。

IndexShare 效率

该模型引入了 IndexShare,这是一种创新的架构改进,可在稀疏 attention 层中复用索引器。这一创新在 100 万 token 的完整 context length 下,将每 token 的浮点运算量减少了 2.9 倍。这种效率使得庞大的 context window 不再仅仅是一个理论极限,而是真正可用于大规模项目的生产力工具。

专业化 Agentic 训练

GLM-5.2 与众不同之处在于它专注于长周期的编码轨迹。它专门在整个代码库的复杂调试和实现任务中进行了训练。开发者可以在 HighMax 两个 thinking effort 等级之间切换,允许模型为系统优化和高级数学问题解决消耗更多的 compute 进行内部 reasoning。

GLM-5.2

GLM-5.2 的使用案例

发现使用 GLM-5.2 获得出色效果的不同方式。

Agentic 软件工程

在自主框架中部署模型,以处理从需求收集到最终部署的全流程开发任务。

大规模代码重构

通过将整个代码库载入 100 万 token 的 context window,分析并重写多文件软件项目。

自动化文档审查

处理海量的法律或技术文档集,以极高的 reasoning 准确性识别不一致之处或提取结构化数据。

3D 场景生成

利用其在 WebGL 和 HTML5 方面的专业优势,从 text prompt 生成复杂的交互式 3D 可视化内容。

业务逻辑自动化

将模型接入 agent 操作系统,以管理共享内存并执行无需人工干预的计划内多小时工作流。

本地隐私优先开发

在私有硬件集群上运行该 open-weights 模型,确保敏感企业工程项目的数据主权。

优势

局限性

卓越的编码智能: 该模型在 FrontierSWE 上以 74.4% 的得分位列第三,证明了其在长达数小时的工程项目中的能力。
较高的 Token 冗长度: 为达到目标效果,该模型生成的 token 数量约为其前代产品的 2 倍,从而增加了 latency。
颠覆性的性价比: 以每百万 token 1.40/4.40 美元的价格,提供了顶级 frontier model 的智能表现,成本仅为竞争对手的约 1/6。
庞大的硬件需求: 由于具备 753B parameters,除非进行大幅度量化,否则大多数个人开发者无法实现本地部署。
真正可用的 1M Context: 针对长周期、杂乱的编码轨迹进行了优化,解决了以往模型难以保持连贯性的问题。
较慢的响应时间: 由于延长的内部 reasoning 周期,其响应时间可能比西方模型慢 3 倍。
完整的主权与隐私: MIT 授权的 open-weights 允许开发者在本地运行模型,规避外部 API 风险和数据泄露。
设计创造力瓶颈: 尽管在前端编码方面技术熟练,但在审美设计上的创造力可能不如 Claude Opus。

API快速入门

zhipu/glm-5.2

查看文档
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 GLM-5.2 的评价

看看社区对 GLM-5.2 的看法

我几个月来一直说开源 AI 模型比 frontier 模型落后 6 个月。它们追上来了。GLM 5.2 和 Opus 4.8 一样出色。
Alex Finn
twitter
5.1 到 5.2 的跨越非常巨大……它在这里真的很倾向于使用长 chain-of-thought,并且正在击败 proprietary 模型。
Sam Witteveen
youtube
在我们将 2-bit 模型从 1.51TB 压缩到 238GB 后,它仍保留了约 82% 的准确性。GLM-5.2 是迄今为止最强大的开源模型。
Unsloth AI
twitter
它领先于 open-weights 模型,并占据了 Design Arena 的榜首,超越了现已下线的 Claude Fable 5。
Brian Roemmele
twitter
100 万 token 的 context window 是无损的,这对于 open-weights 模型来说令人印象深刻。
DevGuru
reddit
benchmark 数值是一方面,但在实际的 agent 工作流中,它感觉非常强健。
TechInnovator
hackernews

关于 GLM-5.2 的视频

观看关于 GLM-5.2 的教程、评测和讨论

5.1 到 5.2 的跨越非常巨大……它在这里真的很倾向于使用长 chain-of-thought。

如果这个模型能以更低的价格替代 Sonnet 或 Gemini Flash,我真的看不出使用后者的意义。

100 万 token 的 context window 是无损的,这对于 open-weights 模型来说令人印象深刻。

它显然是针对那些需要对其 reasoning 引擎进行本地控制的开发者而设计的。

benchmark 数值是一方面,但在实际的 agent 工作流中,它感觉非常强健。

它是第一个在 Terminal Bench 超过 80 分的 open-weights 模型,可以与 GPT 5.5 相提并论。

你从 15,000 个 token 增加到了 30,000 个。这是 token 滥用……你得等上两倍的时间。

本地测试表明,它处理复杂文件结构的能力优于 DeepSeek v4。

Max 级别的 reasoning effort 对硬件要求很高,但逻辑非常合理。

MIT 许可证意味着你基本上可以在任何地方使用它,无需担心条款。

我看到一些疯狂的 benchmark 在设计基准上得分高于 Fable,这引起了热议。

我让 GLM 5.2 重构这个应用程序……没有一次失败的编辑。说实话,非常干净。

前端能力是该版本的核心亮点。

与其说它只是一个 chatbot,不如说它更像是一个构建其他工具的工具。

检查 thinking tokens 的能力对于调试逻辑的开发者来说简直是梦想。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

GLM-5.2专业提示

专家提示助您充分利用GLM-5.2。

为逻辑任务启用 Max Reasoning

在对准确性要求高于生成速度的复杂编码或数学任务中,激活 Max reasoning effort。

加载整个项目

利用 100 万 token 的 context window,为模型提供完整的项目文档和代码风格指南,以确保代码输出的一致性。

通过量化进行优化

在本地部署时使用 FP8 或 2-bit 量化,以将庞大的 753B parameters 占位载入高端硬件。

检查 Thinking tokens

利用对 thinking tokens 的原生支持,在得到最终答案前检查内部逻辑,从而尽早发现潜在错误。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

关于GLM-5.2的常见问题

查找关于GLM-5.2的常见问题答案