zhipu

GLM-4.7

Zhipu AIのGLM-4.7は、200Kの context window、73.8%という卓越した SWE-bench パフォーマンス、そして agentic なコーディングを可能にするネイティブな Deep Thinking 機能を備えた、フラッグシップの358B MoE model です。

zhipu logozhipuGLMDecember 22, 2025
コンテキスト
200Kトークン
最大出力
131Kトークン
入力価格
$0.60/ 1M
出力価格
$2.20/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
85.7%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GLM-4.7はこのベンチマークで85.7%を記録しました。
HLE
42.8%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GLM-4.7はこのベンチマークで42.8%を記録しました。
MMLU
90.1%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GLM-4.7はこのベンチマークで90.1%を記録しました。
MMLU Pro
84.3%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GLM-4.7はこのベンチマークで84.3%を記録しました。
SimpleQA
46%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GLM-4.7はこのベンチマークで46%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GLM-4.7はこのベンチマークで88%を記録しました。
AIME 2025
95.7%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GLM-4.7はこのベンチマークで95.7%を記録しました。
MATH
92%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GLM-4.7はこのベンチマークで92%を記録しました。
GSM8k
98%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GLM-4.7はこのベンチマークで98%を記録しました。
MGSM
94%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GLM-4.7はこのベンチマークで94%を記録しました。
MathVista
74%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GLM-4.7はこのベンチマークで74%を記録しました。
SWE-Bench
73.8%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GLM-4.7はこのベンチマークで73.8%を記録しました。
HumanEval
94.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GLM-4.7はこのベンチマークで94.2%を記録しました。
LiveCodeBench
84.9%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GLM-4.7はこのベンチマークで84.9%を記録しました。
MMMU
74.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GLM-4.7はこのベンチマークで74.2%を記録しました。
MMMU Pro
58%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GLM-4.7はこのベンチマークで58%を記録しました。
ChartQA
86%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GLM-4.7はこのベンチマークで86%を記録しました。
DocVQA
93%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GLM-4.7はこのベンチマークで93%を記録しました。
Terminal-Bench
41%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GLM-4.7はこのベンチマークで41%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GLM-4.7はこのベンチマークで12%を記録しました。

GLM-4.7を無料で試す

GLM-4.7と無料でチャット。機能をテストし、質問し、このAIモデルができることを探索してください。

プロンプト
レスポンス
zhipu/glm-4-7

AIの応答がここに表示されます

GLM-4.7について

GLM-4.7の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

GLM-4.7は Zhipu AI による最新の flagship AI model であり、open-weight のインテリジェンスにおける大きな飛躍を象徴しています。この巨大な 3580億 parameters の Mixture-of-Experts (MoE) model は、高度な reasoning、コーディングの自動化、および複雑な agentic ワークフロー向けに特別に設計されています。専用の Deep Thinking モードを導入することで、マルチステップの計画立案とエラー回復が可能になり、極めて高い信頼性が求められるソフトウェアエンジニアリングのタスクを解決できるようになりました。

このモデルは卓越した技術的パフォーマンスを特徴としており、SWE-bench Verified で state-of-the-art の 73.8%、LiveCodeBench v6 で 84.9 というスコアを達成しています。200,000 token の context window と 131,072 token という膨大な出力容量を備えた GLM-4.7 は、アプリケーション全体の生成や広範なデータセットにわたる深い調査に最適化されています。

MIT ライセンスの下で open-weight リリースとして提供されるため、プロプライエタリな API に代わる強力で柔軟な選択肢となり、クラウドベースの統合とローカルホスティングの両方をサポートします。その multimodal 機能は高度な UI デザインやドキュメント分析にまで及び、現代の AI 駆動型開発における多才なパワーハウスとなっています。

GLM-4.7

GLM-4.7のユースケース

GLM-4.7を使って素晴らしい結果を得るさまざまな方法を発見してください。

Agentic なソフトウェアエンジニアリング

GitHub の複雑な issue を解決し、リポジトリ全体にわたってフルスタック機能を自律的に実装します。

高精度な Vibe Coding

Tailwind CSS やインタラクティブな Framer Motion コンポーネントを使用して、モダンで本番環境レベルの Web インターフェースを迅速に生成します。

多言語テクニカルサポート

10以上の国際的なプログラミング環境において、高度なコーディング支援と論理的な問題解決を提供します。

ディープな学術研究

BrowseComp 検索フレームワークを使用して大規模なドキュメントセットを分析し、マルチホップで検証可能な情報を抽出します。

プレゼンテーションデザインの自動化

単一の文章の prompt から、正確なレイアウトとタイポグラフィを備えた、構造化され視覚的にバランスの取れたスライドを作成します。

ターミナルベースの自動化

ターミナルサンドボックス内で複雑なシステム管理や DevOps タスクを直接実行し、benchmark で 41% の精度を達成します。

強み

制限

エリートレベルのコーディング能力: 現在、SWE-bench で 73.8% のスコアを記録し、多くのプロプライエタリな競合他社を凌駕して open-weight model をリードしています。
極めて高いハードウェア負荷: 355B という parameters 数により、マルチ GPU 構成を持たない個人開発者にとってローカルホスティングは困難です。
膨大な出力トークン: 131K の出力制限を備えており、1回のターンで本番環境レベルの大規模なコードベースを生成可能です。
API と Web 版の差異: 即時レスポンスを返す API と、Web インターフェースで見られるより深い reasoning の間には、顕著なパフォーマンスの差があります。
ネイティブの Reasoning エンジン: 「Deep Thinking」機能を搭載しており、長時間の agentic なタスクにおいて、より優れた計画立案とドリフトの抑制を実現します。
時間に関するハルシネーション: モデルのリリース直後のため、現在の日付やイベントに関して時折不正確な情報が報告されています。
圧倒的なコストパフォーマンス: 100万 input token あたりわずか 0.60ドルからという、わずかなコストで frontier model 級のインテリジェンスを提供します。
高い Reasoning レイテンシ: フル機能の Deep Thinking モードを有効にすると、複雑なマルチステップの prompt に対するレスポンス時間が大幅に増加する可能性があります。

APIクイックスタート

zhipu/glm-4-7

ドキュメントを見る
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GLM-4.7についてのユーザーの声

GLM-4.7についてコミュニティがどう思っているか見てください

"GLM 4.7が open-source の記録を粉砕!... Humanity's Last Exam で 42.8% を達成。"
MindColliers
x/twitter
"GLM-4.7... SWE-Bench で 73.8% を達成しつつ 100万トークン 0.6ドル... AI レースは真に多極化しています。"
MateusGalasso
x/twitter
"GLM 4.7は、多言語の agentic なコーディングやターミナルベースのタスクにおいて明確な進化をもたらしています。"
Dear-Success-1441
reddit
"このモデルは多くの2025年コーディング benchmark で圧倒的な成績を収めています。"
cloris_rust
reddit
"GLM 4.7はスピードと安定性で勝利し、Minimax M2.1はマルチエージェント・コーディングで優位に立っています。"
JamMasterJulian
youtube
"Zhipu は、米国の巨大ラボに対して open weights が何を実現できるかを真に示しています。"
DevGuru
hackernews

GLM-4.7についての動画

GLM-4.7についてのチュートリアル、レビュー、ディスカッションを見る

GLM 4.7は、コードの品質、複雑な reasoning、およびツールの使用において大幅な改善をもたらすモデルです

SWE-bench verified で 73.8% を記録しました。これは open-source モデルとしては驚異的な数値です

ツール使用の benchmark では Claude Sonnet 4.5 や GPT 5.1 をも凌駕しています

Mixture of Experts のアプローチが非常に洗練されており、そのサイズにもかかわらず高い効率性を実現しています

これは、本格的なコーディングにおいて Claude 3.5 に代わる実用的な選択肢を提供する、事実上初の open-weight model です

これまでで断トツに最高の open モデルです

よりクリーンでモダンな Web ページを作成し、より見栄えの良いスライドを生成します

reasoning は行いますが、コーディングプラン API では思考のプロセスは公開されていません

Vibe coding の結果は、複雑な Tailwind アニメーションであってもほぼ完璧です

200k の context は、以前の GLM バージョンと比較して情報の損失がほとんどなく、大規模なリポジトリを処理できます

重要なアップグレードは「行動の前の思考」であり、モデルが複雑なタスクを確実に処理するのに役立ちます

GLM 4.7が UI の品質を向上させる Vibe coding を強調しています

API の価格は約3ドル程度になる見込みで、非常にコスト効率の高いオプションとなります

multimodal パフォーマンスにより、Figma のデザインを高い精度でコードに変換できます

大規模なワークステーションがあればローカルデプロイも可能ですが、API は驚くほど高速です

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

プロのヒント

このモデルを最大限に活用し、より良い結果を得るための専門家のヒント。

Deep Thinking の有効化:複雑な論理タスクでは、API の parameters を介して明示的に thinking mode をトリガーし、マルチステップの計画を有効にします。

保存された思考の活用:長い会話履歴を維持することで、複数のターンにわたって reasoning の軌跡を保持するモデルの能力を活用できます。

ローカルでの量子化:Unsloth で最適化された 2-bit または 4-bit の GGUF バージョンを使用することで、この高 parameters モデルをコンシューマー向けのハードウェアで実行できます。

日付の注入:system prompt に現在の日付を手動で含めることで、時間の経過に伴うハルシネーションを回避し、スケジューリングの精度を向上させます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

よくある質問

このモデルに関するよくある質問への回答を見つけてください