openai

GPT-5.2 Pro

GPT-5.2 Proは、数学、コーディング、専門業務においてSOTAの性能を発揮する「Extended Thinking」機能を搭載した、OpenAIの2025年におけるflagship reasoning modelです。

openai logoopenaiGPT-5December 11, 2025
コンテキスト
400Kトークン
最大出力
128Kトークン
入力価格
$21.00/ 1M
出力価格
$168.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
93.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-5.2 Proはこのベンチマークで93.2%を記録しました。
HLE
36.6%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-5.2 Proはこのベンチマークで36.6%を記録しました。
MMLU
89.6%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-5.2 Proはこのベンチマークで89.6%を記録しました。
MMLU Pro
82%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-5.2 Proはこのベンチマークで82%を記録しました。
SimpleQA
52%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-5.2 Proはこのベンチマークで52%を記録しました。
IFEval
93.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-5.2 Proはこのベンチマークで93.5%を記録しました。
AIME 2025
100%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-5.2 Proはこのベンチマークで100%を記録しました。
MATH
97%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-5.2 Proはこのベンチマークで97%を記録しました。
GSM8k
99.2%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-5.2 Proはこのベンチマークで99.2%を記録しました。
MGSM
96%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-5.2 Proはこのベンチマークで96%を記録しました。
MathVista
76.5%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-5.2 Proはこのベンチマークで76.5%を記録しました。
SWE-Bench
80%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-5.2 Proはこのベンチマークで80%を記録しました。
HumanEval
94.5%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-5.2 Proはこのベンチマークで94.5%を記録しました。
LiveCodeBench
78%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-5.2 Proはこのベンチマークで78%を記録しました。
MMMU
79.5%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-5.2 Proはこのベンチマークで79.5%を記録しました。
MMMU Pro
79.5%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-5.2 Proはこのベンチマークで79.5%を記録しました。
ChartQA
91.2%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-5.2 Proはこのベンチマークで91.2%を記録しました。
DocVQA
94.8%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-5.2 Proはこのベンチマークで94.8%を記録しました。
Terminal-Bench
55.6%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-5.2 Proはこのベンチマークで55.6%を記録しました。
ARC-AGI
54.2%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-5.2 Proはこのベンチマークで54.2%を記録しました。

GPT-5.2 Proについて

GPT-5.2 Proの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Reasoningにおける新たなフロンティア

GPT-5.2 Proは、極めて高い知的能力を要するタスクのために特別に設計されたOpenAIのstate-of-the-art reasoningモデルです。2025年後半にリリースされたこのモデルは、論理的な一貫性を確保するために複雑な問題を長時間処理することを可能にする「extended thinking」モードを導入しました。専門的な数学的証明や高度な競技プログラミングにおける業界リーダーとして広く認識されており、前世代のモデルでは不可能だった問題を頻繁に解決しています。

技術的な精度と出力性能

このモデルは、複雑な指示に対する厳格な準拠と、競合他社と比較して論理推論におけるhallucination率が大幅に低いことが特徴です。非常に整理されたプロフェッショナルな対話トーンを維持していますが、重いreasoning負荷によるレイテンシの増大や、やや「冷たい」印象を与える対話スタイルも指摘されています。コードベース全体にわたる機械的なチェックを必要とする開発者や、400,000 tokensという巨大なcontext window全体でPhDレベルの精度を求める研究者にとって、不可欠なツールとなっています。

エキスパートレベルのパフォーマンス

ベンチマークにとどまらず、GPT-5.2 Proは専門的な業務タスクのベンチマークにおいて、14年以上の経験を持つ人間の専門家を一貫して上回る初めてのmodelとなりました。一度のパスで数万行の実行可能なコードを生成できる能力は、以前のモデルで見られた「怠慢(laziness)」問題からの大きな転換点となり、複雑なagenticワークフローにおける主要な選択肢となっています。

GPT-5.2 Pro

GPT-5.2 Proのユースケース

GPT-5.2 Proを使って素晴らしい結果を得るさまざまな方法を発見してください。

数学オリンピック

長文の証明を伴うプロレベルやIMO(国際数学オリンピック)の数学問題を解くことに長けています。

機械的なコーディングタスク

「怠慢(laziness)」に陥ることなく、機械的なコードの更新やチェックの膨大なリストを効率的に処理します。

論理的推論

複雑なワールドビルディングや代替歴史の分析において、深いreasoningを実行します。

テクニカルリサーチ

専門的なドキュメントからニッチな技術データを正確に抽出・統合します。

指示への準拠

非常に複雑、あるいは直感に反するようなユーザーの要求を、極めて高い精度で厳密に実行します。

クリエイティブライティング

古典文学のような質感を模倣した、高密度なクリエイティブライティングが可能です。

強み

制限

数学におけるSOTA: 外部ツールを使用せずにAIME 2025 benchmarkで100%を達成した、現時点で唯一のmodelです。
高レイテンシ: 「Extended Thinking」モードでは、複雑なシナリオにおいて1つのレスポンスに30〜40分かかる場合があります。
Zero-Laziness Coding: 途中で省略することなく、一度のレスポンスで24,000行以上の機能的なコードを生成できます。
冷淡なペルソナ: 対話スタイルについて、他の会話型modelと比較して無機質で事務的、あるいは尊大であると感じるユーザーもいます。
専門知識の同等性: GDP-Valタスクにおいて、14年の経験を持つ業界の専門家を上回るパフォーマンスを初めて示したmodelです。
プレミアムな価格設定: 入力100万tokenあたり21ドルという価格は、Gemini 3 Proなどの競合modelと比較してかなり高価です。
深いReasoning Context: 400,000 tokensという巨大なcontext window全体にわたり、ほぼ完璧な検索と論理保持能力を維持します。
実装の漏れ: 高い知能を持つ一方で、複雑な3Dレンダリングスクリプトなどで、稀にマイナーなライブラリのimportを見落とすことがあります。

APIクイックスタート

openai/gpt-5.2-pro

ドキュメントを見る
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [
      { role: 'user', content: 'Prove the existence of infinite primes using the extended thinking mode.' }
    ],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-5.2 Proについてのユーザーの声

GPT-5.2 Proについてコミュニティがどう思っているか見てください

"GPT-5.2-codex xhighは、コードベース全体を走査して未解決事項を一切残さない怪物だ。"
Rafael Bittencourt
x
"GPT Proはこの分野(数学)において間違いなくSOTAだ。時には第3問や第6問さえ解いてしまう。"
ArchMeta1868
reddit
"GPT-5.2 Proには驚かされ続けている... 専門的なExcelワークブック形式で厳密な分析結果が返ってきた。"
Simon Smith
x
"このmodelは、非常に知的でクリエイティブだが、信頼性に欠ける一方で天才的な人物のようだ。"
Narrator
youtube
"5.2のhallucinationは実際にはOpusよりも少なく、私の要求を非常に厳格に実行できる。"
ArchMeta1868
reddit
"reasoningのオーバーヘッドは凄まじいが、数学的証明の結果は文字通りノーベル賞級だ。"
QuantumDev
hackernews

GPT-5.2 Proについての動画

GPT-5.2 Proについてのチュートリアル、レビュー、ディスカッションを見る

歴史上初めて、平均的な人間が... AGIによって凌駕されました。

GPT 5.2の思考は70%という新しいstate-of-the-artスコアを記録しました。人間の専門家と同等以上の性能を発揮する最初のmodelです。

これは、米国の44の現実の職業において人間を上回る単一のmodelです。

内部のreasoningトレースに、ようやく真の自己修正の兆候が見え始めています。

私たちが目にしているのは、単にテキストを予測するだけでなく、論理をシミュレートするmodelです。

1回の回答で24,000行のコードを生成するなんて、前代未聞です。

思考時間のオプションが選択可能になり... 「Extended Thinking」モードが利用できるようになりました。

このmodelはノルウェー・メンサのテストで他のすべてのmodelを上回るスコアを出し... IQ 145から147を記録しました。

context windowの検索能力は、400k tokensにおいても本質的に完璧です。

単にデータが増えただけでなく、論理的な深さを実現するための全く新しいアーキテクチャです。

GDP-Valで50%以上の確率で人間の専門家に勝つというのは、労働市場にとって恐ろしいマイルストーンです。

すべてがただ機能する... GPT 5.2のコーディング能力には本当に感銘を受けました。

canvas機能を使えば、3JSコードのデバッグも一瞬です。

OpenAIはついにGPT-4を悩ませていた「怠慢」問題を解決しました。

これは私がこれまで接した中で、最も「プロフェッショナル」な響きを持つAIです。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

GPT-5.2 Proのプロのヒント

GPT-5.2 Proを最大限に活用し、より良い結果を得るための専門家のヒント。

Extended Thinking

スピードよりも精度が重要となる数学や論理問題では、「extended thinking」モードを使用してください。

Codex Integration

機械的なコードベース管理のために、Codexのような専門的な環境でその高いパフォーマンスを活用してください。

前提条件の確認

長い回答の最初の前提が間違っている場合は、すぐに中断して修正を指示してください。

反復的な改善

最初のコードが失敗した場合は、コンソールのエラーをそのままフィードバックすることで、非常に効果的な2度目の修正案が得られます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

GPT-5.2 Proについてのよくある質問

GPT-5.2 Proに関するよくある質問への回答を見つけてください