zhipu

GLM-5

GLM-5は、Zhipu AIの7,440億パラメータのopen-weightなパワーハウスです。長期間のagenticタスク、コーディング、正確な情報提供において優れており、20万のcontext windowを備えています。

Open WeightsAgentic EngineeringMoEZhipu AIコーディングAI
zhipu logozhipuGLM2026年2月11日
コンテキスト
200Kトークン
最大出力
128Kトークン
入力価格
$1.00/ 1M
出力価格
$3.20/ 1M
モダリティ:Text
機能:ツールストリーミング推論
ベンチマーク
GPQA
68.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GLM-5はこのベンチマークで68.2%を記録しました。
HLE
32%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GLM-5はこのベンチマークで32%を記録しました。
MMLU
85%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GLM-5はこのベンチマークで85%を記録しました。
MMLU Pro
70.4%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GLM-5はこのベンチマークで70.4%を記録しました。
SimpleQA
48%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GLM-5はこのベンチマークで48%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GLM-5はこのベンチマークで88%を記録しました。
AIME 2025
84%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GLM-5はこのベンチマークで84%を記録しました。
MATH
88%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GLM-5はこのベンチマークで88%を記録しました。
GSM8k
97%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GLM-5はこのベンチマークで97%を記録しました。
MGSM
90%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GLM-5はこのベンチマークで90%を記録しました。
MathVista
0%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GLM-5はこのベンチマークで0%を記録しました。
SWE-Bench
77.8%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GLM-5はこのベンチマークで77.8%を記録しました。
HumanEval
90%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GLM-5はこのベンチマークで90%を記録しました。
LiveCodeBench
52%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GLM-5はこのベンチマークで52%を記録しました。
MMMU
0%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GLM-5はこのベンチマークで0%を記録しました。
MMMU Pro
0%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GLM-5はこのベンチマークで0%を記録しました。
ChartQA
0%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GLM-5はこのベンチマークで0%を記録しました。
DocVQA
0%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GLM-5はこのベンチマークで0%を記録しました。
Terminal-Bench
56.2%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GLM-5はこのベンチマークで56.2%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GLM-5はこのベンチマークで12%を記録しました。

GLM-5について

GLM-5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

GLM-5は、自律的なagenticワークフローと複雑なシステムエンジニアリングのために設計された、Zhipu AIのフラッグシップ基盤モデルです。7,440億パラメータのMixture-of-Experts (MoE)アーキテクチャを活用しており、inference時には400億パラメータがアクティブになることで、パフォーマンスと速度のバランスを最適化しています。本モデルは、SWE-bench Verifiedで77.8%を記録し、ソフトウェアエンジニアリングタスクにおいてプロプライエタリなfrontier modelと同等の性能を示した最初のopen-weightシステムです。

このモデルは、10万基のHuawei Ascendチップからなる国内クラスタを用いて、28.5兆tokenで学習されました。Multi-head Latent Attention (MLA)やDeepSeek Sparse Attention (DSA)といった特殊なメカニズムを統合し、20万tokenのcontext window全体で論理的な一貫性を維持します。この技術スタックにより、GLM-5は同規模のdense modelに典型的な高い遅延を伴うことなく、長期間の計画立案やリソース管理を処理できます。

Zhipu AIはGLM-5をMITライセンスでリリースしたため、エンタープライズユーザーは機密データの処理用に重みをローカルで展開可能です。入力コストは100万tokenあたりわずか1.00ドルであり、Claude 4.5などの競合モデルと比較して6倍の価格優位性を提供します。また、先行モデルに比べてハルシネーション率を大幅に低減する専用のThinking Modeも搭載しています。

GLM-5

GLM-5のユースケース

GLM-5を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

SWE-bench Verifiedでの77.8%というスコアを活かし、複雑なGitHub issueの解決やレポジトリ全体のリファクタリングを実行します。

エンタープライズツールのオーケストレーション

社内APIをまたぐ多段階のagenticなワークフローを実行し、金融や法務分野のバックオフィス自動化を処理します。

長文contextのレポジトリ分析

20万tokenのwindowを使用して、ドキュメントセット全体や複数のコードベースを一度に読み込み分析します。

パーソナルAIの活用

OpenClawのようなopen-sourceのagentを駆動し、メール、カレンダー、バックグラウンドタスクを24時間体制で高い信頼性のもと管理します。

オンプレミスのプライベートインテリジェンス

MITライセンスに基づきモデルをローカルに展開することで、機密性の高い企業運営において完全なデータプライバシーを確保します。

コスト効率の高いagentのスケール

reasoningの深さを犠牲にすることなく、プロプライエタリなfrontier modelと比較して6〜8分の1のコストで、大規模なagenticセッションを実行します。

強み

制限

エリートレベルのコーディング性能: SWE-bench Verifiedで77.8%を記録し、自律的なソフトウェアエンジニアリングにおいてClaude Opusのようなプロプライエタリな巨人と肩を並べます。
ネイティブなvision機能の欠如: 画像を直接処理する能力がないため、現代のマルチモーダルなUI/UXワークフローにおける利用が制限されます。
6倍の価格優位性: 入力100万tokenあたりわずか1ドルでfrontierレベルのreasoningを提供し、大規模なagentic展開を経済的に実行可能にします。
ターミナルタスクの遅延: Terminal-Bench 2.0での性能は56.2%であり、トップティアのプロプライエタリな競合製品にわずかに遅れをとっています。
MITライセンスの重み: Hugging Faceで公開されているオープンな重みにより、Huawei AscendやNVIDIAのハードウェア上でプライベートなローカル展開が可能です。
ハルシネーションの頻度: 初期のbenchmarkでは、特定の複雑なreasoningタスクにおいて約30%のハルシネーション率が報告されており、上位のライバル製品より高くなっています。
巨大なcontext容量: 20万tokenのwindowと12万8,000tokenの出力容量により、レポジトリ全体の分析や長文生成に最適です。
ハードウェアの差異: Huawei Ascendハードウェアで学習されているため、標準的なNVIDIAのみのソフトウェアスタックへ展開する際に微細な性能差が生じる可能性があります。

APIクイックスタート

zai/glm-5

ドキュメントを見る
zhipu SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ZHIPU_API_KEY,
  baseURL: "https://open.bigmodel.cn/api/paas/v4/",
});

const response = await client.chat.completions.create({
  model: "glm-5",
  messages: [{ role: "user", content: "Analyze this repo structure and refactor to GraphQL." }],
  stream: true,
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

SDKをインストールして、数分でAPIコールを開始しましょう。

GLM-5についてのユーザーの声

GLM-5についてコミュニティがどう思っているか見てください

GLM-5は7,440億パラメータのopen-sourceモデルで、コーディングにおいてはClaude Opusに近い性能を発揮する…しかし価格差は大きい。
Odd-Coconut-2067
reddit
20万tokenのwindowはワークフローを変える。1回のリファクタリングのために20以上のファイルを分析したり、複雑なPR diffを一度にレビューしたりできる。
AskCodi
reddit
Claude APIに毎月約90ドル使っていたが、GLM-5に変更したら15ドル以下になった。品質の低下はほとんど感じない。
IulianHI
reddit
ハルシネーション率は30%程度だが、Gemini 3 Proは88%だった。
Sid
youtube
4.7をテストし終える前にGLM-5がリリースされたが、日常的なコーディングにおけるreasoningの進化は明らかだ。
able_wong
twitter
ZhipuがこれをMITライセンスでリリースしたことは、ローカルLLMコミュニティにとって大きな前進だ。
dev_tester
twitter

GLM-5についての動画

GLM-5についてのチュートリアル、レビュー、ディスカッションを見る

5.2のコーデックやOpus 4.5のようなモデルと僅差だ。

1時間以上かかるジョブを問題なく実行できた、最初のopen-weightモデルだ。

ハルシネーション率は30%程度だが、Gemini 3 Proは88%だった。

reasoningの密度はGLM-4よりも大幅に高い。

私の社内コーディングタスクにおいては、基本的にClaude 3.5 Sonnetと置き換わった。

彼らはパラメータ数をほぼ倍増させて…744Bにまで引き上げた。

以前のモデルよりはるかに巨大だが、動作速度はそれ以上か、同等だ。

自己修正を行う。見下すような態度をとらず、正当な質問として扱うこと。

スパースなattentionメカニズムのおかげで、これほど巨大なモデルでもメモリ使用量が抑えられている。

open-weightであるため、ローカルホスティングにおける新しいチャンピオンと言える。

彼らはSlimeという独自のRLエンジンを開発した。

20万tokenのcontext windowは、エンタープライズAIの意味を根底から変える。

SWE-bench verifiedで77.8を達成し、76.2のGemini 3 Proを凌駕した。

Zhipu AIは、国内のハードウェアでも世界クラスのモデルを学習可能であることを証明している。

単なるチャットではなく、agenticなエンジニアリングに主眼を置いている。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GLM-5のプロのヒント

GLM-5を最大限に活用し、より良い結果を得るための専門家のヒント。

Agentic Modeの有効化

GLM-5は単純なチャット応答よりも自律的なエンジニアリングに最適化されているため、promptで多段階の計画を定義してください。

ローカルハードウェアの割り当て

最適なthroughputを得るために、十分なRAM(GPUメモリ)を確保するか、MindSporeフレームワークを備えたHuawei Ascendハードウェアを使用してください。

フォールバックチェーンの実装

GLM-5をメインのreasoning modelとして設定し、単純な指示に対してはコスト効率の良いGLM-4.7-Flashをフォールバックとして使用してください。

構造化出力の活用

納品物に対して明確なスキーマ要件を与えると、GLM-5は正確な.docxや.xlsx形式の生成において優れた能力を発揮します。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M

GLM-5についてのよくある質問

GLM-5に関するよくある質問への回答を見つけてください