zhipu

GLM-4.7

Zhipu AIのGLM-4.7は、200Kのcontext window、SWE-bench 73.8%の性能、エージェントのためのネイティブなDeep Thinkingを備えた358B MoEフラッグシップモデルです。

zhipu logozhipuGLM2025年12月22日
コンテキスト
200Kトークン
最大出力
131Kトークン
入力価格
$0.60/ 1M
出力価格
$2.20/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
85.7%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GLM-4.7はこのベンチマークで85.7%を記録しました。
HLE
42.8%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GLM-4.7はこのベンチマークで42.8%を記録しました。
MMLU
90.1%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GLM-4.7はこのベンチマークで90.1%を記録しました。
MMLU Pro
84.3%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GLM-4.7はこのベンチマークで84.3%を記録しました。
SimpleQA
46%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GLM-4.7はこのベンチマークで46%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GLM-4.7はこのベンチマークで88%を記録しました。
AIME 2025
95.7%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GLM-4.7はこのベンチマークで95.7%を記録しました。
MATH
92%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GLM-4.7はこのベンチマークで92%を記録しました。
GSM8k
98%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GLM-4.7はこのベンチマークで98%を記録しました。
MGSM
94%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GLM-4.7はこのベンチマークで94%を記録しました。
MathVista
74%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GLM-4.7はこのベンチマークで74%を記録しました。
SWE-Bench
73.8%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GLM-4.7はこのベンチマークで73.8%を記録しました。
HumanEval
94.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GLM-4.7はこのベンチマークで94.2%を記録しました。
LiveCodeBench
84.9%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GLM-4.7はこのベンチマークで84.9%を記録しました。
MMMU
74.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GLM-4.7はこのベンチマークで74.2%を記録しました。
MMMU Pro
58%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GLM-4.7はこのベンチマークで58%を記録しました。
ChartQA
86%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GLM-4.7はこのベンチマークで86%を記録しました。
DocVQA
93%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GLM-4.7はこのベンチマークで93%を記録しました。
Terminal-Bench
41%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GLM-4.7はこのベンチマークで41%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GLM-4.7はこのベンチマークで12%を記録しました。

GLM-4.7について

GLM-4.7の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

モデルの概要

GLM-4.7は、Zhipu AIが開発したフラッグシップとなる大規模言語モデルです。Mixture-of-Experts (MoE) アーキテクチャを採用し、合計3580億パラメータを誇ります。このモデルは、独自のPreserved ThinkingおよびInterleaved Thinking機能を通じて、複雑なagenticタスクや長いcontextにおける推論を処理するように特別に設計されています。これらの機能により、マルチターンセッション全体で論理と中間推論状態を安定して維持できるため、自律的なワークフローで一般的なcontextの劣化という問題に対処します。

性能とアーキテクチャ

このモデルは、拡張性に富んだ200,000 tokenのcontext windowと、巨大な131,072 tokenの出力容量を兼ね備えています。これにより、アプリケーション全体の生成や、膨大なドキュメントの分析を一度に行うのに適しています。MITライセンスの下でopen-weightsモデルとしてリリースされており、プロプライエタリな代替品と比較して、低コストで高性能なコーディングと推論を提供します。

統合と用途

OpenAI API形式との完全な互換性があり、既存のソフトウェアエコシステムへの統合を簡素化します。開発者は、SWE-bench Verifiedで73.8%のスコアを達成する、高難易度のソフトウェアエンジニアリングタスクでこのモデルを活用しています。英語と中国語の膨大な技術文書を、ネイティブレベルの言語的ニュアンスで処理・分析できるため、国際的な開発チームにとって非常に汎用性の高いツールとなっています。

GLM-4.7

GLM-4.7のユースケース

GLM-4.7を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

SWE-benchの73.8%という能力を活かし、複雑なリポジトリ全体のデバッグ、リファクタリング、新機能の実装を自律的に行います。

大容量ドキュメントの統合

131kという出力制限を活用し、大規模なデータセットから包括的な技術マニュアルや書籍の章全体を生成します。

長期間のAgenticワークフロー

Preserved Thinkingを使用して、何百もの連続するタスク間でも一貫性と論理性を維持し、contextの喪失を防ぎます。

バイリンガルなビジネスインテリジェンス

英語と中国語の膨大な技術文書を、ネイティブレベルの言語的ニュアンスで処理・分析します。

自動化されたUI/UXコード生成

高度なアニメーションと本番環境で利用可能なスタイリングを備えた、完全なReactやNext.jsのフロントエンドアーキテクチャを一度で生成します。

競技レベルの数学問題解決

専用の推論重視thinking modeを使用して、複雑な数学オリンピックレベルの問題や記号論理パズルを解きます。

強み

制限

エリート級のコーディング性能: SWE-bench Verifiedで73.8%を記録し、ほぼすべてのopen-sourceモデルを凌駕し、トップクラスのプロプライエタリなAPIに匹敵します。
テキスト専用のモダリティ: GeminiやGPT-4oと異なり、GLM-4.7はネイティブなビジョンや音声処理機能を持たないため、マルチモーダルなタスクには外部モデルが必要です。
圧倒的な出力上限: 131,072 tokenという出力制限は業界最高水準であり、一度のターンでアプリケーション全体を生成可能です。
膨大なローカル環境要件: 358B parametersのため、ローカルでの実行には非常に高度なハードウェア(約710GB VRAM)が必要であり、家庭用のGPUでは実行できません。
エージェントファーストなアーキテクチャ: Preserved Thinkingを搭載し、長期的なタスク間で論理的一貫性を維持することで、自律エージェントにおけるcontext decayを解決します。
時折発生するlatencyのスパイク: パーソナルAPI層のユーザーからは、ピーク時に大手プロバイダーのインフラと比較して、周期的な速度低下が報告されています。
高い経済価値: OpenAIやAnthropicなどの欧米競合他社と比較して、約4〜7分の1のコストでfrontierレベルの知能を提供します。
指示への従順さにおける癖: 推論能力は高いものの、非常に複雑なコーディングセッションにおいて特定のファイル構造の制約を無視することがあります。

APIクイックスタート

zai/glm-4.7

ドキュメントを見る
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_ZAI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'glm-4.7',
    messages: [{ role: 'user', content: 'Design a scalable React architecture.' }],
    thinking: { type: 'enabled' }
  });
  console.log(response.choices[0].message.content);
}
main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GLM-4.7についてのユーザーの声

GLM-4.7についてコミュニティがどう思っているか見てください

GLM-4.7は128kのcontextを活かして、大規模なコードベースを確実に処理します。主要APIのコストを節約するためのサブエージェントタスクとして非常に便利です。
IulianHI
reddit
Zhipu AIのGLM-4.7は、コーディングにおいてGPT-5.1 Highのような独自のfrontier modelに匹敵します。Preserved Thinking機能は、自律エージェントにとって大きな勝利です。
Etienne Noumen
youtube
GLM-4.7は、Intelligence Index v4.0においてDeepSeek V3.2を抜き、最も知的なopen-weightsモデルであり続けています。
Artificial Analysis
twitter
中国のモデルはコーディングの有用性において急速に差を縮めています。この73%というSWE-benchスコアは、open-weightsのリリースとしては侮れません。
Epoch AI
hackernews
このサイズのモデルにしては、推論速度はかなりまともです。以前のバージョンよりも複雑な論理をはるかにうまく処理しています。
Bijan Bowen
youtube
GLM-4.7はAI Indexで6位にランクインし、Kimi K2を追い抜きました。なぜこの2ドルのモデルが、コーディングワークフローでGPT-5.2を置き換えているのか、その理由を探ってください。
TowardsAI
twitter

GLM-4.7についての動画

GLM-4.7についてのチュートリアル、レビュー、ディスカッションを見る

context長は200kで最大出力token数は128k、これは非常に強力です。

いやはや、本当に印象的です。これほどの複雑さを持った特別な機能を実装しているモデルは他にはありません。

このサイズのモデルにしては、推論速度はかなりまともです。

以前のバージョンよりも複雑な論理をはるかにうまく処理しています。

このモデルは、論理的な一貫性の面で大きな進歩を遂げています。

GLMモデルは、モックデータを1つのファイルに配置することで、より優れたアーキテクチャを実装しました。

これは間違いなく大きな飛躍です。ベンチマークスコアは、私のテストによって正当性が証明されました。

私が思い起こさせる必要もなく、プロジェクト全体のcontextを理解していました。

そのコーディング能力は、現在存在する最高のモデルに匹敵すると言っても過言ではありません。

これほどのハイエンドな推論を、低コストで手に入れられるのです。

SWE-bench Verifiedで73.8%を記録しましたが、open-sourceモデルとしては信じられないほどの数値です。

Gemini 3 Proの生成が全く機能しない一方で、これは実際に機能し、成果物を出しています。

この知能レベルでの生成速度は驚異的です。

信頼できるコード出力を必要とする開発者のために作られたことは明らかです。

Zhipu AIは、MoEアーキテクチャのチューニングにおいて、自らの限界を超えました。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GLM-4.7のプロのヒント

GLM-4.7を最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Modeを有効にして論理性を高める

コーディングや数学のタスクではthinkingパラメータを有効に設定し、モデルの内部的な推論トレースを活用して精度を向上させてください。

OpenAI互換のSDKを利用する

OpenAI SDKを使用し、ベースURLをZ.aiのエンドポイントに変更することで、既存のワークフローにGLM-4.7を統合できます。

131Kの出力を最大限に活用する

長文コンテンツを生成する際は、まず詳細な構成案を提供することで、巨大なtoken制限の中で構造的な一貫性を保ちやすくなります。

エージェント向けにシステムプロンプトを最適化する

マルチターンセッション間で推論状態を再利用できるよう、Preserved Thinkingの要件をシステムメッセージで定義してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

GLM-4.7についてのよくある質問

GLM-4.7に関するよくある質問への回答を見つけてください