zhipu

GLM-5

GLM-5はZhipu AIによる744B parametersのopen-weightな強力なmodelであり、200kのcontext windowを備え、長期的なagenticタスク、コーディング、事実の正確性に優れています。

Open WeightsAgentic EngineeringMoEZhipu AIコーディング AI
zhipu logozhipuGLM2026年2月11日
コンテキスト
200Kトークン
最大出力
128Kトークン
入力価格
$1.00/ 1M
出力価格
$3.20/ 1M
モダリティ:Text
機能:ツールストリーミング推論
ベンチマーク
GPQA
68.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GLM-5はこのベンチマークで68.2%を記録しました。
HLE
32%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GLM-5はこのベンチマークで32%を記録しました。
MMLU
85%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GLM-5はこのベンチマークで85%を記録しました。
MMLU Pro
70.4%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GLM-5はこのベンチマークで70.4%を記録しました。
SimpleQA
48%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GLM-5はこのベンチマークで48%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GLM-5はこのベンチマークで88%を記録しました。
AIME 2025
84%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GLM-5はこのベンチマークで84%を記録しました。
MATH
88%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GLM-5はこのベンチマークで88%を記録しました。
GSM8k
97%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GLM-5はこのベンチマークで97%を記録しました。
MGSM
90%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GLM-5はこのベンチマークで90%を記録しました。
MathVista
0%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GLM-5はこのベンチマークで0%を記録しました。
SWE-Bench
77.8%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GLM-5はこのベンチマークで77.8%を記録しました。
HumanEval
90%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GLM-5はこのベンチマークで90%を記録しました。
LiveCodeBench
52%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GLM-5はこのベンチマークで52%を記録しました。
MMMU
0%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GLM-5はこのベンチマークで0%を記録しました。
MMMU Pro
0%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GLM-5はこのベンチマークで0%を記録しました。
ChartQA
0%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GLM-5はこのベンチマークで0%を記録しました。
DocVQA
0%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GLM-5はこのベンチマークで0%を記録しました。
Terminal-Bench
56.2%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GLM-5はこのベンチマークで56.2%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GLM-5はこのベンチマークで12%を記録しました。

GLM-5について

GLM-5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

GLM-5はZhipu AIの次世代flagship基盤modelであり、open-weightシステムにおけるAgentic Engineeringのあり方を再定義するために特別に設計されました。400億のactiveなparametersを持つ巨大な7440億parametersのMixture of Experts (MoE)アーキテクチャで構築されており、Claude 4.5のようなproprietaryな巨人とパフォーマンスの差を埋めた最初のopen-weights modelです。このmodelは論理密度とソフトウェアエンジニアリングに優れており、SWE-Bench Verifiedで画期的な77.8%を達成しています。

技術面では、GLM-5は高度なMulti-head Latent Attention (MLA)とSparse Attentionメカニズムを統合してtoken効率を最適化し、メモリオーバーヘッドを33%削減しています。10万個のHuawei Ascendチップからなる純国産のクラスターを使用して28.5兆tokensの規模でトレーニングされたGLM-5は、ハイエンドのNVIDIAハードウェアに依存することなくfrontierレベルのreasoningが可能であることを証明しました。200,000 tokensのcontext windowと専用の「Thinking Mode」により、高精度なテクニカルワークフローに対して堅牢でハルシネーションの少ない出力を提供します。

信頼性を重視して最適化されたGLM-5は、長期的な実行にわたって持続的な状態を維持できる自律的なテクニカルエージェントの基盤として機能します。寛容なMIT licenseと、100万入力tokensあたり1.00ドルという競争力のある価格設定により、proprietaryな代替手段のような制限的な条件なしに、ローカルデプロイや大規模なAPI統合を求める企業にとって理想的な選択肢となります。

GLM-5

GLM-5のユースケース

GLM-5を使って素晴らしい結果を得るさまざまな方法を発見してください。

複雑なシステムエンジニアリング

自律的な依存関係管理を備えたマイクロサービスアーキテクチャの設計と保守。

長期的なAgenticタスク

1時間を超える実行時間でも持続的なメモリを必要とする、マルチステップのテクニカルワークフローの実行。

レガシーコードベースの移行

200k tokenのcontext windowを活用した、リポジトリ全体のリファクタリングと古い依存関係の更新。

低ハルシネーションな技術調査

事実の正確性と「わからない」と答える能力が不可欠な、高精度な技術リサーチの実施。

自律的なターミナル操作

セキュリティ監査やシステム管理コマンドを自律的に実行できるdev-agentの強化。

バイリンガルなグローバル展開

現地化されたエンタープライズアプリケーション向けに、トップクラスの英語および中国語のreasoningを大規模に提供。

強み

制限

最高峰のAgentic Intelligence: マルチステップのタスク実行において、open-weight modelの中で最高のAgentic Indexスコア(63)を記録。
ネイティブなMultimodalityの欠如: GPT-4oのような競合他社に見られるvision、音声、ビデオ処理機能が搭載されていません。
低いハルシネーション率: 事実の正確性を優先し、前世代と比較してハルシネーションを56%削減。
極めて高いホスティング要件: 1.5TBのBF16 weightsを必要とするため、クラウドインフラなしでのローカルデプロイはほぼ不可能です。
大規模なMoE効率: 744B parametersのアーキテクチャによりflagship級の論理密度を提供しつつ、MLAによってメモリオーバーヘッドを33%削減。
高い推論Latency: 公開APIでは、小型の「flash」modelと比較して、最初のtoken生成までの時間(time-to-first-token)が7秒を超える場合があります。
寛容なMIT License: 真のオープンソースライセンスでリリースされており、制限的なユーザー条項なしで無制限の商用利用が可能。
フロントエンドデザインのニュアンス: 論理には優れていますが、Claudeと比較すると、細かなCSSの美的調整に苦戦することがあります。

APIクイックスタート

zai/glm-5

ドキュメントを見る
zhipu SDK
import { ZhipuAI } from "zhipuai-sdk";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-5",
    messages: [{ role: "user", content: "Analyze this repo for security vulnerabilities." }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GLM-5についてのユーザーの声

GLM-5についてコミュニティがどう思っているか見てください

"GLM-5は新しいopen-weightsのリーダーだ!Intelligence Indexで50点を獲得し、差を大幅に縮めた。"
Artificial Analysis
x
"このmodelは信じられない。1時間以上かかる仕事を成功させたんだ……ぶっ飛んだよ。"
Theo - t3.gg
youtube
"GLM-5はNVIDIAチップを一切使わず、745B paramsで100万入力tokensあたり1ドル。これが未来だ。"
Legendary
x
"ハルシネーション率がすごい。嘘をつくくらいなら『わかりません』と言う潔さがある。"
DevUser456
reddit
"Zhipu AIがオープンソースのコーディングmodelに挑戦状を叩きつけた。"
AIExplorer
hackernews
"ついに、複雑なタスクの途中で正気を失わないopen-weight modelが登場した。"
CodeMaster
reddit

GLM-5についての動画

GLM-5についてのチュートリアル、レビュー、ディスカッションを見る

これまで見てきた中で、特にコード関連において、間違いなく最高のopen-weight modelです。

1時間以上かかるジョブを完遂できた最初のopen-weight modelであるという事実に、本当に驚かされました。

現時点で、最もハルシネーションが少ないmodelだと思われます。

open-weight modelが本番環境で実際に何ができるかについて、大きなパラダイムシフトが起きています。

長時間のツール利用セッションにおけるこのmodelの安定性は、文字通り前例のないものです。

コーディングの感触は非常に強力で、すでに稀有な存在だったGLM 4.7に匹敵します。

UIモックアップにダイナミックアイランドを導入した点は、非常にクールで予想外の機能でした。

複雑な論理性において、同クラスのほぼすべてのmodelを凌駕しています。

reasoningの深さは、初めてo1を使ったときを思い出させますが、これはopen-weightです。

テキスト専用のmodelでありながら、コード内の視覚的なロジックの扱いは多くのvision modelよりも優れています。

メモリ使用量が劇的に減少し、以前の手法と比較して33倍のメモリ改善が見られました。

thinkingを有効にすると洗車論理テストに合格し、ClaudeやGPT-4oを上回りました。

デプロイには本格的なサーバーラックが必要ですが、ワットあたりのパフォーマンスは驚異的です。

レガシーリポジトリの移行を、ハルシネーションによる存在しないライブラリ名の生成なしで処理しました。

Thinking Modeは単なるギミックではなく、出力の質を根本から変えるものです。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GLM-5のプロのヒント

GLM-5を最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Modeの有効化

GLM-5は、reasoningを有効にすることで「洗車テスト」のような複雑な論理パズルにおいて大幅に高いパフォーマンスを発揮します。

MIT Licenseの活用

寛容なライセンスを活かして、制限のない商用開発や社内ホスティングに活用してください。

ツール利用の最適化

GLM-5はagenticなツール実行において高い安定性を維持するように設計されているため、マルチステップのタスクに最適です。

Context Windowの活用

200kのwindowにコードベース全体を投入し、リポジトリ全体のセキュリティ監査やリファクタリングを行うことができます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

GLM-5についてのよくある質問

GLM-5に関するよくある質問への回答を見つけてください