zhipu

GLM-5.2

GLM-5.2は、MITライセンスの下で提供される、100万tokenのcontext windowと特化したagenticコーディング機能を備えたZhipu AIのフラッグシップ・オープンウェイトモデルです。

Open WeightsMIT Licenseコーディングアシスタント1M Context推論
zhipu logozhipuGLM-52026年6月16日
コンテキスト
1.0Mトークン
最大出力
4Kトークン
入力価格
$1.40/ 1M
出力価格
$4.40/ 1M
モダリティ:Text
機能:ツールストリーミング推論
ベンチマーク
GPQA
83%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GLM-5.2はこのベンチマークで83%を記録しました。
HLE
40%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GLM-5.2はこのベンチマークで40%を記録しました。
MMLU
94%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GLM-5.2はこのベンチマークで94%を記録しました。
MMLU Pro
86%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GLM-5.2はこのベンチマークで86%を記録しました。
IFEval
85%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GLM-5.2はこのベンチマークで85%を記録しました。
AIME 2025
99%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GLM-5.2はこのベンチマークで99%を記録しました。
MATH
97%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GLM-5.2はこのベンチマークで97%を記録しました。
GSM8k
98%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GLM-5.2はこのベンチマークで98%を記録しました。
MGSM
91%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GLM-5.2はこのベンチマークで91%を記録しました。
SWE-Bench
62%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GLM-5.2はこのベンチマークで62%を記録しました。
HumanEval
97%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GLM-5.2はこのベンチマークで97%を記録しました。
LiveCodeBench
65%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GLM-5.2はこのベンチマークで65%を記録しました。
Terminal-Bench
81%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GLM-5.2はこのベンチマークで81%を記録しました。
ARC-AGI
14%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GLM-5.2はこのベンチマークで14%を記録しました。

GLM-5.2について

GLM-5.2の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Mixture of Expertsアーキテクチャ

GLM-5.2は、長期タスクと自律的なagenticワークフロー向けに設計されたMixture of Experts(MoE)フラッグシップモデルです。7530億パラメータという巨大なアーキテクチャを採用し、tokenあたりのアクティブなパラメータ数は約400億です。この設計は、複雑な論理タスクのパフォーマンスを維持しつつ計算コストを削減し、GLMシリーズの効率性に大きな飛躍をもたらしました。

IndexShareによる効率化

本モデルでは、スパースアテンション層全体でインデクサを再利用する革新的なアーキテクチャ「IndexShare」が導入されています。この技術により、100万tokenのフルコンテキスト時において、tokenあたりの浮動小数点演算数が2.9倍に削減されました。この効率性により、理論上の限界値ではなく、大規模プロジェクトで実際に使用可能なcontext windowを実現しています。

特化したagenticトレーニング

GLM-5.2が他と一線を画すのは、長期的なコーディングの過程に焦点を当てている点です。コードベース全体にわたる複雑なデバッグや実装タスクに特化してトレーニングされました。開発者は「High」と「Max」の推論努力レベルを切り替えることができ、システム最適化や高度な数学的問題解決のために、モデルが内部推論により多くの計算リソースを割り当てることが可能です。

GLM-5.2

GLM-5.2のユースケース

GLM-5.2を使って素晴らしい結果を得るさまざまな方法を発見してください。

Agenticなソフトウェアエンジニアリング

自律的なフレームワーク内にモデルを導入し、要件定義から最終デプロイメントまで、開発タスクを完結させます。

大規模コードリファクタリング

100万tokenのcontext windowにコードベース全体をロードし、複数ファイルにまたがるソフトウェアプロジェクトを分析・書き換えます。

自動ドキュメントレビュー

膨大な法務資料や技術文書セットを処理し、高い推論精度で不整合の特定や構造化データの抽出を行います。

3Dシーン生成

WebGLおよびHTML5における専門的な強みを活かし、テキストpromptから複雑でインタラクティブな3Dビジュアライゼーションを生成します。

ビジネスロジックの自動化

モデルをagentオペレーティングシステムに組み込み、共有メモリを管理し、監督なしで数時間にわたるスケジュールワークフローを実行します。

プライバシー第一のローカル開発

機密性の高い企業エンジニアリングプロジェクトのために、オープンなウェイトモデルをプライベートなハードウェアクラスターで実行し、完全なデータ主権を確保します。

強み

制限

卓越したコーディング知能: FrontierSWEで74.4%のスコアを記録し3位にランクイン。長時間のエンジニアリングプロジェクトに対する能力を証明しています。
高いtoken冗長性: 前モデルと比較して、同じ結果を得るために生成されるtoken数が約2倍に増加する傾向があり、レイテンシが増大します。
破壊的なコストパフォーマンス: 100万tokenあたり$1.40/$4.40という価格は、競合するプロプライエタリなモデルの約6分の1のコストで、frontier levelの知能を提供します。
膨大なハードウェア要件: 753Bのパラメータサイズのため、大幅な量子化を行わない限り、一般的な開発者がローカル環境でデプロイするのは困難です。
真に実用的な100万tokenのcontext window: 従来のモデルでは一貫性の維持が難しかった、長期にわたる複雑なコーディングの過程に最適化されています。
応答速度の遅さ: 拡張された内部推論サイクルにより、欧米モデルと比較して応答時間が最大3倍長くなる場合があります。
完全な主権とプライバシー: MITライセンスのオープンウェイトにより、開発者は外部APIのリスクやデータ漏洩を回避し、ローカルでモデルを実行できます。
デザインの創造性の限界: フロントエンドコーディングの技術力は高いものの、デザインの審美性に関してはClaude Opusよりも創造性が劣る場合があります。

APIクイックスタート

zhipu/glm-5.2

ドキュメントを見る
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GLM-5.2についてのユーザーの声

GLM-5.2についてコミュニティがどう思っているか見てください

オープンソースのAIモデルは最先端から6ヶ月遅れているとずっと言ってきましたが、追いつきましたね。GLM 5.2はOpus 4.8と同じくらい優秀です。
Alex Finn
twitter
5.1から5.2へのジャンプはかなり大きく、長いchain-of-thoughtを非常にうまく活用しており、プロプライエタリなモデルを凌駕しています。
Sam Witteveen
youtube
2ビットモデルは、1.51TBから238GBに圧縮した後でも約82%の精度を維持しています。GLM-5.2は現時点で最も強力なオープンなモデルです。
Unsloth AI
twitter
オープンなウェイトモデルをリードしており、現在利用できないClaude Fable 5を抑えてDesign Arenaのトップに君臨しました。
Brian Roemmele
twitter
100万tokenのcontext windowがロスレスなのは、オープンなウェイトモデルとしては非常に印象的です。
DevGuru
reddit
benchmarkの数字も一つですが、実際のagentワークフローでは非常に堅牢な挙動を見せます。
TechInnovator
hackernews

GLM-5.2についての動画

GLM-5.2についてのチュートリアル、レビュー、ディスカッションを見る

5.1から5.2への飛躍はかなり大きい…ここでは長いchain-of-thoughtが非常に有効です。

これよりずっと安価に置き換えられるなら、SonnetやGemini Flashを使う理由は正直分かりません。

100万tokenのcontext windowがロスレスなのは、オープンなウェイトモデルとして驚異的です。

推論エンジンをローカルで制御する必要がある開発者を明確にターゲットにしています。

benchmarkの数字も大事ですが、実際のagentワークフローでは非常に堅牢に感じます。

Terminal Benchで80を超えた初めてのオープンなウェイトモデルであり、GPT 5.5と肩を並べています。

15,000 tokenから30,000 tokenへ。これはtokenの乱用ですね…待機時間は2倍になります。

ローカルテストでは、複雑なファイル構造の処理がDeepSeek v4より優れていることが分かります。

Maxの推論努力はハードウェアに負荷をかけますが、ロジックはしっかりしています。

MITライセンスということは、規約を気にせず基本的に何にでも使えます。

Design BenchでFableより高いスコアを記録したという話もあり、話題になっています。

GLM 5.2にアプリの再設計を頼んだら…失敗なし。正直言ってかなりクリーンです。

このバージョンのフロントエンド機能は大きな特徴ですね。

単なるchatbotというより、他のツールを構築するためのツールのように感じます。

Thinking tokenを検証できるのは、ロジックのデバッグをする開発者にとって夢のようです。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GLM-5.2のプロのヒント

GLM-5.2を最大限に活用し、より良い結果を得るための専門家のヒント。

論理タスクにはMax推論を有効化

生成速度よりも精度が重要な、複雑なコーディングや数学タスクでは、Maxの推論努力レベルを有効にしてください。

プロジェクト全体をロード

100万tokenのcontext windowを活用し、プロジェクトのドキュメントやスタイルガイド全体をモデルに提供することで、一貫性のあるコード出力を確保します。

量子化による最適化

ローカル環境でデプロイする場合、FP8や2ビット量子化を使用して、753Bパラメータという巨大なサイズをハイエンドハードウェアに収めてください。

Thinking tokenを検証

Thinking tokenのネイティブサポートを活用し、回答前に内部ロジックを検証することで、潜在的なエラーを早期に発見できます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

GLM-5.2についてのよくある質問

GLM-5.2に関するよくある質問への回答を見つけてください