zhipu

GLM-4.7

智谱 AI 的 GLM-4.7 是一款旗舰级 358B MoE model,具备 200K context window、卓越的 73.8% SWE-bench 性能,以及用于智能体编程(agentic coding)的原生 Deep Thinking 能力。

zhipu logozhipuGLMDecember 22, 2025
上下文
200Ktokens
最大输出
131Ktokens
输入价格
$0.60/ 1M
输出价格
$2.20/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
85.7%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 GLM-4.7 在此基准测试中得分 85.7%。
HLE
42.8%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 GLM-4.7 在此基准测试中得分 42.8%。
MMLU
90.1%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 GLM-4.7 在此基准测试中得分 90.1%。
MMLU Pro
84.3%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 GLM-4.7 在此基准测试中得分 84.3%。
SimpleQA
46%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 GLM-4.7 在此基准测试中得分 46%。
IFEval
88%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 GLM-4.7 在此基准测试中得分 88%。
AIME 2025
95.7%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 GLM-4.7 在此基准测试中得分 95.7%。
MATH
92%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 GLM-4.7 在此基准测试中得分 92%。
GSM8k
98%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 GLM-4.7 在此基准测试中得分 98%。
MGSM
94%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 GLM-4.7 在此基准测试中得分 94%。
MathVista
74%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 GLM-4.7 在此基准测试中得分 74%。
SWE-Bench
73.8%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 GLM-4.7 在此基准测试中得分 73.8%。
HumanEval
94.2%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 GLM-4.7 在此基准测试中得分 94.2%。
LiveCodeBench
84.9%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 GLM-4.7 在此基准测试中得分 84.9%。
MMMU
74.2%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 GLM-4.7 在此基准测试中得分 74.2%。
MMMU Pro
58%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 GLM-4.7 在此基准测试中得分 58%。
ChartQA
86%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 GLM-4.7 在此基准测试中得分 86%。
DocVQA
93%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 GLM-4.7 在此基准测试中得分 93%。
Terminal-Bench
41%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 GLM-4.7 在此基准测试中得分 41%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 GLM-4.7 在此基准测试中得分 12%。

免费试用 GLM-4.7

免费与 GLM-4.7 对话。测试其功能,提问并探索此AI模型能做什么。

提示词
回复
zhipu/glm-4-7

您的AI回复将显示在此处

关于 GLM-4.7

了解 GLM-4.7 的功能、特性以及它如何帮助您获得更好的效果。

GLM-4.7 是来自 Zhipu AI 的最新 flagship AI model,代表了 open-weight 智能的重大飞跃。这款拥有 3580 亿参数 的 Mixture-of-Experts (MoE) model 专为高级 reasoning、coding 自动化和复杂的 agentic 工作流而设计。它引入了专用的 Deep Thinking 模式,支持多步规划和错误恢复,使 model 能够以史无前例的可靠性解决高难度的软件工程任务。

该 model 凭借卓越的技术表现脱颖而出,在 SWE-bench Verified 上取得了 73.8% 的 SOTA 评分,在 LiveCodeBench v6 上取得了 84.9 分。凭借 200,000-token 的 context window 和惊人的 131,072-token 输出容量,GLM-4.7 针对生成完整应用程序和对庞大数据集进行深度研究进行了优化。

作为基于 MIT license 发布的 open-weight 版本,它为闭源 API 提供了一个强大且灵活的替代方案,同时支持云端集成和本地 hosting。其 multimodal 能力延伸至高级 UI 设计和文档分析,使其成为现代 AI 驱动开发的通用核心。

GLM-4.7

GLM-4.7 的使用案例

发现使用 GLM-4.7 获得出色效果的不同方式。

Agentic 软件工程

:在整个 repository 中自主解决复杂的 GitHub issues 并实现全栈功能。

高保真 Vibe Coding

:使用 Tailwind CSS 和交互式 Framer Motion 组件快速生成生产就绪的现代 Web 界面。

多语言技术支持

:在 10 多个国际化编程环境中提供高级 coding 辅助和逻辑问题解决。

深度学术研究

:使用 BrowseComp 搜索框架分析海量文档集,提取多跳、可验证的信息。

自动演示文稿设计

:根据单句 prompt 创建结构清晰、视觉均衡且具备准确布局和排版的幻灯片。

基于终端的自动化

:在终端 sandbox 中直接执行复杂的系统管理和 DevOps 任务,其 benchmark 准确率达 41%。

优势

局限性

顶尖的 Coding 精通度: :目前以 73.8% 的 SWE-bench 评分领跑 open-weight models,表现优于许多 closed-source 竞争对手。
极高的硬件需求: :355B 的 parameters 数量使得没有多 GPU 配置的个人开发者难以进行本地 hosting。
海量 Output Tokens: :具备 131K 的输出限制,支持在单次推理中生成庞大的、生产级代码库。
API 与网页端的差异: :即时 API 响应与网页界面中更深层次的 reasoning 之间存在明显的性能差距。
原生 Reasoning 引擎: :整合了 'Deep Thinking' 能力,在长期运行的 agentic 任务中能够更好地规划并减少偏离。
时间相关幻觉: :用户反馈在 model 发布初期,对于当前日期和事件偶尔会出现不准确的情况。
无可匹敌的性价比: :以极低的成本提供 frontier model 级别的智能,input tokens 价格仅为每百万 0.60 美元。
较高的 Reasoning 延迟: :开启完整的 Deep Thinking 模式会显著增加复杂多步 prompt 的响应时间。

API快速入门

zhipu/glm-4-7

查看文档
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 GLM-4.7 的评价

看看社区对 GLM-4.7 的看法

"GLM 4.7 正在粉碎 open-source 纪录!... 在 Humanity's Last Exam 中达到了 42.8%"
MindColliers
x/twitter
"GLM-4.7... 在 SWE-Bench 跑出了 73.8% 的分数,而价格仅为 $0.6/M tokens... AI 竞赛正真正进入多极化时代。"
MateusGalasso
x/twitter
"GLM 4.7 带来了显著收益... 特别是在多语言 agentic coding 和基于终端的任务中"
Dear-Success-1441
reddit
"这个 model 在许多 2025 年的 coding benchmark 中表现优异"
cloris_rust
reddit
"GLM 4.7 在速度和稳定性上取胜,而 Minimax M2.1 在 multi-agent coding 中占优"
JamMasterJulian
youtube
"Zhipu 正在向美国的大型实验室展示 open-weight 能够达到的高度。"
DevGuru
hackernews

关于 GLM-4.7 的视频

观看关于 GLM-4.7 的教程、评测和讨论

GLM 4.7 在代码质量、复杂 reasoning 和 tool 运行方面带来了重大提升

在 SWE-bench verified 获得了 73.8% 的评分,这对于一个 open-source model 来说简直不可思议

它在 tool use benchmark 中甚至超过了 Claude Sonnet 4.5 和 GPT 5.1

这里的 mixture-of-experts 方案非常精炼,尽管规模庞大却具有更高的效率

它本质上是第一个能为重度 coding 提供替代 Claude 3.5 可行方案的 open-weight model

这是目前为止最好的 open model,领先幅度巨大

它能制作出更整洁、更现代的网页,生成的幻灯片也更美观

虽然具备 reasoning 能力,但在 coding plan API 中无法查看 thinking 轨迹

Vibe coding 的效果近乎完美,即使是复杂的 Tailwind 动画也能轻松驾驭

与之前的 GLM 版本相比,200k context 在处理长 repository 时几乎没有信息丢失

重要的升级在于“谋定而后动”,这有助于 model 可靠地处理复杂任务

亮点在于 Vibe coding,GLM 4.7 显著提升了 UI 质量

API 定价保持在 3 美元左右,是一个非常有性价比的选择

其 multimodal 性能使其能够高精度地将 Figma 设计稿转换为代码

如果你有强大的工作站,本地部署是可行的,但 API 的响应速度也非常快

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流
观看演示视频

专业技巧

专家提示帮助您充分利用此模型并获得更好的效果。

开启 Deep Thinking:对于复杂的逻辑任务,请通过 API parameters 显式触发 thinking 模式,以启用多步规划。

利用保留的 Thinking:保持长对话历史,以利用 model 在多轮对话中保留 reasoning 轨迹的能力。

本地量化:使用 Unsloth 优化的 2-bit 或 4-bit GGUF 版本,在消费级硬件上运行这一高 parameters 的 model。

注入日期:在 system prompt 中手动加入当前日期,以避免时间层面的幻觉并提高调度准确性。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

常见问题

查找有关此模型的常见问题答案