zhipu

GLM-5

GLM-5 是智谱 AI 的 744B parameters open-weight 巨作,凭借 200k 的 context window,在长程 agentic 任务、coding 和事实准确性方面表现卓越。

Open WeightsAgentic EngineeringMoE智谱 AICoding AI
zhipu logozhipuGLMFebruary 11, 2026
上下文
200Ktokens
最大输出
128Ktokens
输入价格
$1.00/ 1M
输出价格
$3.20/ 1M
模态:Text
能力:工具流式传输推理
基准测试
GPQA
68.2%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 GLM-5 在此基准测试中得分 68.2%。
HLE
32%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 GLM-5 在此基准测试中得分 32%。
MMLU
85%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 GLM-5 在此基准测试中得分 85%。
MMLU Pro
70.4%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 GLM-5 在此基准测试中得分 70.4%。
SimpleQA
48%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 GLM-5 在此基准测试中得分 48%。
IFEval
88%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 GLM-5 在此基准测试中得分 88%。
AIME 2025
84%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 GLM-5 在此基准测试中得分 84%。
MATH
88%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 GLM-5 在此基准测试中得分 88%。
GSM8k
97%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 GLM-5 在此基准测试中得分 97%。
MGSM
90%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 GLM-5 在此基准测试中得分 90%。
MathVista
0%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 GLM-5 在此基准测试中得分 0%。
SWE-Bench
77.8%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 GLM-5 在此基准测试中得分 77.8%。
HumanEval
90%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 GLM-5 在此基准测试中得分 90%。
LiveCodeBench
52%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 GLM-5 在此基准测试中得分 52%。
MMMU
0%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 GLM-5 在此基准测试中得分 0%。
MMMU Pro
0%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 GLM-5 在此基准测试中得分 0%。
ChartQA
0%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 GLM-5 在此基准测试中得分 0%。
DocVQA
0%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 GLM-5 在此基准测试中得分 0%。
Terminal-Bench
56.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 GLM-5 在此基准测试中得分 56.2%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 GLM-5 在此基准测试中得分 12%。

关于 GLM-5

了解 GLM-5 的功能、特性以及它如何帮助您获得更好的效果。

GLM-5 是智谱 AI 的下一代 flagship foundation model,专为重新定义 open-weight 系统的 Agentic Engineering 状态而设计。它基于庞大的 7440 亿 parameters 的 Mixture of Experts (MoE) 架构,拥有 400 亿 active parameters,是第一个弥合与 Claude 4.5 等 proprietary 巨头性能差距的 open-weights model。该 model 在逻辑密度和软件工程方面表现出色,在 SWE-Bench Verified 上取得了 77.8% 的突破性成绩。

技术上,GLM-5 集成了先进的 Multi-head Latent Attention (MLA) 和 Sparse Attention 机制,以优化 token 效率并减少 33% 的内存开销。GLM-5 使用 10 万片国产华为昇腾 (Ascend) 芯片集群,在 28.5 万亿 tokens 的规模上训练而成,证明了在不依赖高端 NVIDIA 硬件的情况下也能实现 frontier 级别的 reasoning。凭借其 200,000 个 token 的 context window 和专门的 'Thinking Mode',它为高精度技术工作流提供稳健、低幻觉的输出。

GLM-5 针对可靠性进行了优化,可作为自主技术 agent 的基础,能够在长程执行过程中保持持久状态。其宽松的 MIT 许可协议和每百万 input tokens 1.00 美元的极具竞争力的价格,使其成为寻求私有化部署或大规模 API 集成的企业的理想选择,且不受 proprietary 替代方案限制性条款的约束。

GLM-5

GLM-5 的使用案例

发现使用 GLM-5 获得出色效果的不同方式。

复杂系统工程

:设计和维护具有自主依赖管理的微服务架构。

长程 Agentic 任务

:执行需要一个小时以上持久化记忆的多步技术工作流。

遗留代码库迁移

:在 200k token context window 内重构整个代码仓库并更新过时的依赖项。

低幻觉技术研究

:进行高精度的技术研究,在这种场景下,事实准确性和拒绝误导信息至关重要。

自主终端操作

:为能够自主运行安全审计和系统管理命令的 dev-agents 提供动力。

双语全球部署

:为本地化企业级应用大规模提供顶级的中英文 reasoning。

优势

局限性

顶级的 Agentic 智能: :在多步任务执行方面,获得了 open-weight models 中最高的 Agentic Index 评分 (63)。
缺乏原生多模态能力: :缺乏 GPT-4o 等 multimodal 竞争对手所具备的 vision、音频和视频处理能力。
低幻觉率: :与前几代相比,幻觉减少了 56%,优先保证事实准确性。
极高的硬件托管需求: :1.5TB 的 BF16 权重使得几乎所有没有云基础设施的用户都无法进行本地部署。
高效的 MoE 架构: :744B parameters 架构提供了 flagship 级的逻辑密度,而 MLA 将内存开销降低了 33%。
较高的推理延迟: :与较小的 'flash' models 相比,公共 API 的初始 time-to-first-token 可能较高(超过 7 秒)。
宽松的 MIT 许可协议: :以真正的 open-source 许可协议发布,允许不受限制的商业使用,无歧视性限制条款。
前端设计细节处理: :虽然逻辑极佳,但与 Claude 相比,在处理细粒度的 CSS 审美润色时偶尔会感到吃力。

API快速入门

zai/glm-5

查看文档
zhipu SDK
import { ZhipuAI } from "zhipuai-sdk";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-5",
    messages: [{ role: "user", content: "Analyze this repo for security vulnerabilities." }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 GLM-5 的评价

看看社区对 GLM-5 的看法

"GLM-5 是新的 open weights 领导者!它在 Intelligence Index 上获得了 50 分,显著缩小了差距。"
Artificial Analysis
x
"这个 model 简直不可思议。我成功跑完了一个持续一小时以上的任务... 太让我震惊了。"
Theo - t3.gg
youtube
"GLM-5 没有使用任何 NVIDIA 芯片,745B parameters,成本仅为每 100 万 input tokens 1 美元。这就是未来。"
Legendary
x
"幻觉率低得惊人;比起骗你,它更愿意说‘我不知道’。"
DevUser456
reddit
"智谱 AI 为 open source coding models 树立了新的标杆。"
AIExplorer
hackernews
"终于有一个在处理复杂任务中途不会‘发疯’的 open weight model 了。"
CodeMaster
reddit

关于 GLM-5 的视频

观看关于 GLM-5 的教程、评测和讨论

这是我见过目前为止最好的 openweight model,尤其是在 code 方面。

事实上,这是第一个能让我成功跑完持续一小时以上任务的 openweight model... 简直让我大吃一惊。

它似乎是迄今为止幻觉最少的 model。

我们正在目睹 open weight models 在生产环境中所能实现的巨大飞跃。

该 model 在长时间 tool-use 过程中的稳定性确实是前所未有的。

这里的 coding 体验非常强悍... 堪比已经像独角兽一样稀缺的 GLM 4.7。

在其 UI 原型图中引入灵动岛是一个非常酷且出人意料的功能。

在复杂逻辑处理上,它的表现优于同类几乎所有其他 model。

这里的 reasoning 深度让我想起了第一次使用 o1 的感觉,但它是 open weight 的。

作为一个 text-only model,它对代码中视觉逻辑的处理比许多 vision models 还要好。

内存占用大幅下降... 与我们之前的做法相比,内存效率提升了 33 倍。

在开启 thinking 模式后,它通过了‘洗车’逻辑测试,击败了 Claude 和 GPT-4o。

部署这玩意儿需要认真的服务器机架,但它的 performance per watt 非常疯狂。

它处理了我的遗留仓库迁移,没有出现一个幻觉出来的库名。

thinking mode 不仅仅是一个噱头;它从根本上改变了输出质量。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

GLM-5专业提示

专家提示助您充分利用GLM-5。

启用思考模式 (Thinking Mode):开启 reasoning 时,GLM-5 在处理“洗车测试”等复杂逻辑难题时的表现会显著提升。

利用 MIT 许可协议:充分利用其宽松的许可协议,进行不受限制的商业开发和内部托管。

Tool Use 优化:将 GLM-5 用于多步骤任务,因为它专为 agentic tool 执行的高稳定性而设计。

利用 context window:将整个 codebase 输入到 200k 的 context window 中,以执行全仓库级别的安全审计或重构。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

关于GLM-5的常见问题

查找关于GLM-5的常见问题答案