openai

GPT-5.2 Pro

GPT-5.2 Proは、Extended Thinkingを搭載したOpenAIの2025年フラッグシップ推論モデルで、数学、コーディング、専門知識ワークでSOTAパフォーマンスを発揮します。

openai logoopenaiGPT-52025-12-11
コンテキスト
400Kトークン
最大出力
128Kトークン
入力価格
$21.00/ 1M
出力価格
$168.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
93.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-5.2 Proはこのベンチマークで93.2%を記録しました。
HLE
36.6%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-5.2 Proはこのベンチマークで36.6%を記録しました。
MMLU
89.6%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-5.2 Proはこのベンチマークで89.6%を記録しました。
MMLU Pro
82%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-5.2 Proはこのベンチマークで82%を記録しました。
SimpleQA
52%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-5.2 Proはこのベンチマークで52%を記録しました。
IFEval
93.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-5.2 Proはこのベンチマークで93.5%を記録しました。
AIME 2025
100%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-5.2 Proはこのベンチマークで100%を記録しました。
MATH
97%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-5.2 Proはこのベンチマークで97%を記録しました。
GSM8k
99.2%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-5.2 Proはこのベンチマークで99.2%を記録しました。
MGSM
96%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-5.2 Proはこのベンチマークで96%を記録しました。
MathVista
76.5%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-5.2 Proはこのベンチマークで76.5%を記録しました。
SWE-Bench
80%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-5.2 Proはこのベンチマークで80%を記録しました。
HumanEval
94.5%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-5.2 Proはこのベンチマークで94.5%を記録しました。
LiveCodeBench
78%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-5.2 Proはこのベンチマークで78%を記録しました。
MMMU
79.5%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-5.2 Proはこのベンチマークで79.5%を記録しました。
MMMU Pro
79.5%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-5.2 Proはこのベンチマークで79.5%を記録しました。
ChartQA
91.2%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-5.2 Proはこのベンチマークで91.2%を記録しました。
DocVQA
94.8%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-5.2 Proはこのベンチマークで94.8%を記録しました。
Terminal-Bench
55.6%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-5.2 Proはこのベンチマークで55.6%を記録しました。
ARC-AGI
54.2%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-5.2 Proはこのベンチマークで54.2%を記録しました。

GPT-5.2 Proについて

GPT-5.2 Proの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

推論インテリジェンスにおける新たなスタンダード

GPT-5.2 Proは、OpenAIの推論重視モデルの中でも高計算ティアに位置づけられています。博士レベルの科学的研究や複雑な論理推論を必要とする企業ワークフローのために特別に設計されました。標準的なlanguage modelとは異なり、高度なinference時の計算アーキテクチャを利用しており、ユーザーはモデルの「思考努力」をスケーリングできます。これにより、システムは問題を内部的に分解し、自らの論理を検証し、小さなモデルでエラーの原因となる統計的な事前確率を上書きすることが可能です。

技術的精度に特化

GPT-5ファミリーとコア学習を共有しつつも、Proバリエーションは400,000 tokensという広大なcontext windowと大幅に低いハルシネーション率によって差別化されています。理論物理学やハイレベルな数学的証明において信頼できる協力者であることが実証されています。ARC-AGI-2やGPQA Diamondのような汚染に強いbenchmarkでのパフォーマンスは、人間の介入なしにマルチステップの技術的指示を処理しなければならない自律型エージェントのための主要プロセスエンジンとしての地位を確立しました。

エンタープライズのパフォーマンスと出力

このモデルは、複雑な指示への厳密な準拠とプロフェッショナルな対話トーンが特徴です。専門的なタスクbenchmarkにおいて、14年以上の経験を持つ人間の業界専門家を一貫して上回る最初のモデルです。最大128,000 tokensの生成能力を備えており、前世代で見られた「怠慢さ」から脱却し、単一のパスでコードモジュール全体や網羅的な調査レポートを作成することが可能です。

GPT-5.2 Pro

GPT-5.2 Proのユースケース

GPT-5.2 Proを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ソフトウェアエンジニアリング

複雑な複数ファイルのGitHub Issueを解決し、SWE-Bench Verifiedで84.5%の成功率でモジュール全体のrefactoringを実行します。

オリンピックレベルの数学

AIME 2025の競技問題を100%解決し、統計的学習理論における未解決問題に対して独自の証明を提示します。

エンタープライズエージェントのオーケストレーション

数十のツールを順序立てて処理し、マルチステップの財務モデリングやロジスティクスを管理する高計算プロセスエンジンとして機能します。

博士レベルの科学研究

物理学、化学、生物学の問題を分析し、GPQAスコアで93.2%を記録、多くの専門家を凌駕します。

長文context文書の合成

最大400,000 tokensのアーカイブデータを読み込み、包括的な法的レポートや技術マニュアルを生成します。

インタラクティブな3Dシミュレーション

Three.jsやC++で、複雑な粒子物理学や機械論理を含む数千行規模の3Dシミュレーションを生成します。

強み

制限

完璧な数学的精度: AIME 2025 benchmarkで100%の解決率を達成し、現代の競技数学試験における限界を突破しています。
高額な価格設定: 出力100万tokenあたり168ドルという価格は、GPT-5.1と比較して約16倍も高価であり、重要なワークフローに利用が限定されます。
State-of-the-artなコーディング: SWE-Bench Verifiedで84.5%の解決率に達し、実務的なバグバックログを管理できるジュニアエンジニアとして効果的に機能します。
メモリ機能の欠如: 下位ティアのChatGPT 5.2モデルでは標準となっている「Saved Memories」や「Reference Chat History」へのサポートがありません。
高度な抽象推論: 前モデルの3倍となるARC-AGI-2パフォーマンス(54.2%対17.6%)を達成し、新規のルール導入タスク処理における飛躍的な進歩を示しています。
顕著なlatency: 深い内部推論により、特にxhigh effortモードでは、1つのpromptに対して15分以上処理が停止することがあります。
128Kの大規模出力容量: 1回のinferenceパスで書籍全体、コードリポジトリ、または網羅的な科学レポートを生成できるように設計されています。
フレーム選択のエラー: 思考プロセスの中で論理的な制約を正しく特定している場合でも、常識的なタスクにおいて統計的な事前確率を上書きできないことがあります。

APIクイックスタート

openai/gpt-5.2-pro

ドキュメントを見る
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Design a leveraged buyout model for a take-private project.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-5.2 Proについてのユーザーの声

GPT-5.2 Proについてコミュニティがどう思っているか見てください

推論は存在していたが、結論がそれに従っていなかった。立ち止まらずにはいられない現象だ。
Ok_Entrance_4380
reddit
GPT-5.2 Proは理論物理学において、5.1では不可能だった専門家の精査に耐えうる新しい結果を導き出した。
kevinweil
twitter
GPT-5.2 Proは、Issueトラッカーの重要部分を任せられるジュニアエンジニアのように見え始めている。
Due_Woodpecker2882
reddit
OpenAIはProモデルがメモリを持たないことを認めている。学者としては致命的だ。
Oldschool728603
hackernews
論理は完璧だが、latencyのせいで非常にスローな天才と協力しているように感じる。
User123
reddit
ついに、単純なテンソル縮約でハルシネーションを起こさないモデルが登場した。
PhysicsProf
hackernews

GPT-5.2 Proについての動画

GPT-5.2 Proについてのチュートリアル、レビュー、ディスカッションを見る

Mensa NorwayのIQスコアは145〜147と噂されている

24,000行以上のコードを生成

選択可能な思考時間オプションの搭載

Proティアの価格設定は企業予算向けに厳格化されている

このモデルは私の開発バックログ全体を午後だけで解決した

ハルシネーションを30%削減

5.1と比較して全体的なレイアウトが驚くほど向上している

正確に300単語。単語数を指定してその通りに実行したのは今回が初めて

建築設計図に対するvision能力は比類がない

5.1よりもかなり冷徹で機械的に感じる

200ドルのGPT5 Proが25分36秒かけて思考した

2倍のinference計算リソースを割り当て

複雑な問題を複素解析と呼ばれる分野の別の機械仕掛けに変換した

月額200ドルで博士号を箱に入れたようなものだ

思考トレースを見ると、実際に自身のステップを検証しているのがわかる

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-5.2 Proのプロのヒント

GPT-5.2 Proを最大限に活用し、より良い結果を得るための専門家のヒント。

推論努力(reasoning effort)をスケーリングする

generation速度よりも論理的な一貫性が重要なタスクでは、reasoning_effort APIパラメータを使用して値をxhighに設定してください。

統計的な事前確率に対処する

モデルが常識的な罠に陥る場合は、contextを補足してアクティブな推論レイヤーを起動し、ベースの学習を上書きするように促してください。

大規模な出力を活用する

128Kの出力予算を最大限に活用するために、1つのpromptでプロジェクトディレクトリ全体や完全なドキュメントファイルを要求してください。

ツール統合を活用する

visionタスクでは常にfunction callingを有効にしてください。ツールを使用して視覚データを検証できる場合、モデルのmultimodalパフォーマンスが飛躍的に向上します。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

GPT-5.2 Proについてのよくある質問

GPT-5.2 Proに関するよくある質問への回答を見つけてください