zhipu

GLM-4.7

智谱 AI 的 GLM-4.7 是一款旗舰级 358B MoE 模型,具备 200K context window、73.8% 的精英级 SWE-bench 性能以及原生的 Agent 深度推理功能...

zhipu logozhipuGLM2025年12月22日
上下文
200Ktokens
最大输出
131Ktokens
输入价格
$0.60/ 1M
输出价格
$2.20/ 1M
模态:TextImage
能力:视觉工具流式传输推理
基准测试
GPQA
85.7%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 GLM-4.7 在此基准测试中得分 85.7%。
HLE
42.8%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 GLM-4.7 在此基准测试中得分 42.8%。
MMLU
90.1%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 GLM-4.7 在此基准测试中得分 90.1%。
MMLU Pro
84.3%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 GLM-4.7 在此基准测试中得分 84.3%。
SimpleQA
46%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 GLM-4.7 在此基准测试中得分 46%。
IFEval
88%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 GLM-4.7 在此基准测试中得分 88%。
AIME 2025
95.7%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 GLM-4.7 在此基准测试中得分 95.7%。
MATH
92%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 GLM-4.7 在此基准测试中得分 92%。
GSM8k
98%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 GLM-4.7 在此基准测试中得分 98%。
MGSM
94%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 GLM-4.7 在此基准测试中得分 94%。
MathVista
74%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 GLM-4.7 在此基准测试中得分 74%。
SWE-Bench
73.8%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 GLM-4.7 在此基准测试中得分 73.8%。
HumanEval
94.2%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 GLM-4.7 在此基准测试中得分 94.2%。
LiveCodeBench
84.9%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 GLM-4.7 在此基准测试中得分 84.9%。
MMMU
74.2%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 GLM-4.7 在此基准测试中得分 74.2%。
MMMU Pro
58%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 GLM-4.7 在此基准测试中得分 58%。
ChartQA
86%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 GLM-4.7 在此基准测试中得分 86%。
DocVQA
93%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 GLM-4.7 在此基准测试中得分 93%。
Terminal-Bench
41%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 GLM-4.7 在此基准测试中得分 41%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 GLM-4.7 在此基准测试中得分 12%。

关于 GLM-4.7

了解 GLM-4.7 的功能、特性以及它如何帮助您获得更好的效果。

模型概述

GLM-4.7 是由 智谱 AI 开发的旗舰级 LLM。它采用了 Mixture-of-Experts (MoE) 架构,总参数量达 3580 亿。该模型通过其独特的 Preserved ThinkingInterleaved Thinking 能力,专门用于处理复杂的 agentic 任务和长上下文推理。这些特性使模型能够在多轮会话中保持稳定的逻辑和中间推理状态,从而解决了自主工作流中常见的 context 衰减问题。

性能与架构

该模型提供了广阔的 200,000 token context window,结合 131,072 token 的海量输出容量。这使得它非常适合在单次任务中生成完整的应用程序或分析详尽的文档。作为一款以 MIT 许可发布的 open-weight 模型,它以极低的成本提供了高性能的编程和推理能力。

集成与应用

它完全兼容 OpenAI API 格式,简化了集成到现有软件生态系统的过程。开发者将其用于高要求的软件工程任务,其在 SWE-bench Verified 上达到了 73.8% 的分数。它能够在英语和中文之间处理和分析海量技术文档,并具备母语级的语言细微差别处理能力,是国际开发团队的理想选择。

GLM-4.7

GLM-4.7 的使用案例

发现使用 GLM-4.7 获得出色效果的不同方式。

自主软件工程

利用 73.8% 的 SWE-bench 能力,在复杂代码库中自主进行调试、重构和实现新功能。

大容量文档合成

利用 131k 输出限制,从海量数据集中生成综合技术手册或完整的书籍章节。

长视野 Agentic 工作流

部署使用 Preserved Thinking 的 Agent,在数百个连续任务中保持逻辑一致性,而不会丢失 context。

双语商业智能

在英语和中文之间处理和分析海量技术文档,具备母语级的语言细微差别处理能力。

自动化 UI/UX 代码生成

一次性生成包含高级动画和生产级样式的完整 React 或 Next.js 前端架构。

竞赛级数学求解

使用专用的重推理 thinking mode 解决复杂的奥赛级数学问题和符号逻辑难题。

优势

局限性

卓越的编程性能: 在 SWE-bench Verified 上得分 73.8%,超过了几乎所有 open-source 模型,并媲美顶级私有 API。
纯文本模态: 与 Gemini 或 GPT-4o 不同,GLM-4.7 缺乏原生的视觉或音频处理能力,需要外部模型来处理 multimodal 任务。
巨大的输出上限: 131,072 token 的输出限制是业内最高水平之一,支持在单次对话中生成整个应用程序。
巨大的本地运行需求: 拥有 358B parameters,在本地运行该模型需要强大的硬件支持(约 710GB VRAM),消费者级 GPU 无法运行。
Agent 优先架构: 具备 Preserved Thinking 功能,可在长视野任务中保持逻辑一致性,解决自主 Agent 中的 context 衰减问题。
偶尔的延迟波动: 个人 API 层级的用户反映,在高峰时段,相比大型服务商的基础设施,偶尔会出现响应变慢的情况。
极高的经济价值: 以比 OpenAI 或 Anthropic 等西方竞争对手低 4 到 7 倍的成本,提供 frontier-level 的智能。
指令遵循的局限性: 尽管推理能力很强,但在极度复杂的编程会话中,模型有时会忽略特定的文件结构约束。

API快速入门

zai/glm-4.7

查看文档
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_ZAI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'glm-4.7',
    messages: [{ role: 'user', content: 'Design a scalable React architecture.' }],
    thinking: { type: 'enabled' }
  });
  console.log(response.choices[0].message.content);
}
main();

安装SDK并在几分钟内开始进行API调用。

人们对 GLM-4.7 的评价

看看社区对 GLM-4.7 的看法

GLM-4.7 凭借其 128k 的 context 可靠地处理大型代码库。它在子任务处理方面非常有用,节省了主要的 API 成本。
IulianHI
reddit
智谱 AI 的 GLM-4.7 在编程方面与 GPT-5.1 High 等私有 frontier models 相当。Preserved Thinking 功能对于 autonomous agents 来说是一个巨大的胜利。
Etienne Noumen
youtube
GLM-4.7 继续成为 Intelligence Index v4.0 中最智能的 open weights 模型,领先于 DeepSeek V3.2。
Artificial Analysis
twitter
中国模型在编程效用方面的差距正在迅速缩小。对于 open weight 发布而言,73% 的 SWE-bench 分数不可小觑。
Epoch AI
hackernews
推理速度对于这种尺寸的模型来说相当不错。它处理复杂逻辑的能力比以前的版本好得多。
Bijan Bowen
youtube
GLM-4.7 在 AI Index 中排名第 6,超越了 Kimi K2。看看为什么这个 2 美元的模型正在编程工作流中取代 GPT-5.2。
TowardsAI
twitter

关于 GLM-4.7 的视频

观看关于 GLM-4.7 的教程、评测和讨论

这里的 context 长度为 200k,最大输出 token 为 128k,实际上非常强悍。

太棒了,这确实令人印象深刻。其他模型中很少有具备这种复杂程度的特殊功能。

对于这个尺寸的模型来说,推理速度其实相当不错。

它处理复杂逻辑的能力比之前的迭代版本好得多。

这个模型在逻辑一致性方面有了显著提升。

GLM 模型通过将所有 mock 数据放在一个文件中,实际上实现了一种更好的架构。

这是一个巨大的飞跃。我的测试结果证明了这些 benchmark 的准确性。

它理解了整个项目的 context,而无需我进行提醒。

编程能力可以说与目前最好的模型不相上下。

你正以极低的成本获得高端的推理能力。

它在 SWE-bench Verified 上得分 73.8%,这对于 open-source 模型来说简直不可思议。

你可以亲眼看到它的功能运作。相比之下,Gemini 3 Pro 的生成结果完全无法工作。

对于这种级别的智能来说,生成速度非常了不起。

它显然是为需要可靠代码输出的开发者设计的。

智谱 AI 在这里的 MoE 架构调优方面确实做得非常出色。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

GLM-4.7专业提示

专家提示助您充分利用GLM-4.7。

启用 Thinking Mode 以增强逻辑

在编程或数学任务中将 thinking 参数设置为 enabled,以利用模型的内部推理轨迹并提高准确性。

使用兼容 OpenAI 的 SDK

通过使用 OpenAI SDK 并将 base URL 更改为 Z.ai 端点,将 GLM-4.7 集成到现有工作流中。

最大化 131K 输出能力

在生成长篇内容时,先提供详细的大纲,以帮助模型在巨大的 token 限制内保持结构的连贯性。

优化 Agent 的系统 prompt

在系统消息中定义 Preserved Thinking 的需求,以确保模型在多轮会话中复用推理状态。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

关于GLM-4.7的常见问题

查找关于GLM-4.7的常见问题答案