openai

GPT-5.5

GPT-5.5は、1Mのcontext windowと5つの推論負荷レベルを備えたOpenAIのflagshipなfrontier modelであり、自律的なagenticワークフローとコーディングに最適化されています。

Agentic AIOpenAIGPT-5Autonomous CodingFrontier Models
openai logoopenaiGPT-52026年4月23日
コンテキスト
1.0Mトークン
最大出力
128Kトークン
入力価格
$5.00/ 1M
出力価格
$30.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
93.6%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-5.5はこのベンチマークで93.6%を記録しました。
HLE
52.2%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-5.5はこのベンチマークで52.2%を記録しました。
MMLU
92.5%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-5.5はこのベンチマークで92.5%を記録しました。
MMLU Pro
88.1%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-5.5はこのベンチマークで88.1%を記録しました。
SimpleQA
57%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-5.5はこのベンチマークで57%を記録しました。
IFEval
92.1%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-5.5はこのベンチマークで92.1%を記録しました。
AIME 2025
100%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-5.5はこのベンチマークで100%を記録しました。
MATH
98%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-5.5はこのベンチマークで98%を記録しました。
GSM8k
98.5%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-5.5はこのベンチマークで98.5%を記録しました。
MGSM
96.4%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-5.5はこのベンチマークで96.4%を記録しました。
MathVista
76%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-5.5はこのベンチマークで76%を記録しました。
SWE-Bench
58.6%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-5.5はこのベンチマークで58.6%を記録しました。
HumanEval
94.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-5.5はこのベンチマークで94.2%を記録しました。
LiveCodeBench
78%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-5.5はこのベンチマークで78%を記録しました。
MMMU
88.3%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-5.5はこのベンチマークで88.3%を記録しました。
MMMU Pro
62%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-5.5はこのベンチマークで62%を記録しました。
ChartQA
94%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-5.5はこのベンチマークで94%を記録しました。
DocVQA
95%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-5.5はこのベンチマークで95%を記録しました。
Terminal-Bench
82.7%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-5.5はこのベンチマークで82.7%を記録しました。
ARC-AGI
85%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-5.5はこのベンチマークで85%を記録しました。

GPT-5.5について

GPT-5.5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Agenticな知能への移行

GPT-5.5は、LLMから大規模agenticモデルへの移行を象徴しています。単純なチャットボットではなく、自律的なチームメイトとして機能するように設計されており、デジタル環境全体で複雑なワークフローを計画、実行、自己検証する能力を備えています。このモデルの主な革新は、推論努力レベルを変数として実装した点であり、これにより開発者はモデルの思考時間とそれに関連するコンピューティングコストを細かく制御できます。

技術的な効率性と視覚能力

技術面では、GPT-5シリーズの100万tokenのcontext windowを維持しつつ、40%のtoken効率向上を実現しています。つまり、5.4シリーズと比較してtokenあたりの価格は2倍になりましたが、複雑なタスクに対する実質的なコスト増加はわずか20%に抑えられています。視覚機能も大幅にアップグレードされ、技術図面やARC-AGI v2のような空間推論タスクにおいて、人間並みの性能に達しています。

自律性への最適化

自律的なコーディングにおいて特に高い性能を発揮し、リポジトリ全体を管理しながらバグ修正を自ら検証することが可能です。新しいreasoning_effortパラメータを使用することで、ユーザーは5段階の推論深度を切り替えることができ、ハイレベルな問題解決に対して知能の段階的な調整を可能にした最初のモデルとなっています。

GPT-5.5

GPT-5.5のユースケース

GPT-5.5を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ソフトウェアエンジニアリング

人間の監視なしで、コードリポジトリ全体の管理、バグ修正、アップデートのデプロイを行います。

科学的研究分析

1Mのcontext windowを活用して数千もの研究論文を処理し、新しい仮説を合成します。

複雑な金融モデリング

博士レベルの数学的精度を用いて、複雑な企業財務構造の構築および監査を行います。

多段階のagenticワークフロー

長期的なデジタル目標を自律的に達成するため、再帰的なタスクリストの作成と実行を行います。

技術的な視覚分析

複雑なエンジニアリングの設計図や回路図を解釈し、自動化された品質保証に活用します。

高忠実度なデータ圧縮

膨大なデータセットを、深い意味的ニュアンスを保持したまま、token密度の高い要約に変換します。

強み

制限

エリートレベルのagenticパフォーマンス: コンピューター操作およびターミナルタスクにおけるTerminal-Bench 2.0で、業界トップの82.7を達成しました。
高いハルシネーション率: 高い推論能力にもかかわらず、事実知識に関するbenchmarkでは86%のハルシネーション率を示します。
大容量context window: 1M tokenの入力contextをサポートし、完全なコードリポジトリや大規模な研究コーパスの分析を可能にします。
プレミアムな価格戦略: 100万tokenあたり5ドル/30ドルという価格は、以前の世代やopen-sourceのライバルと比較して非常に高価です。
完璧な数学的推論: オリンピックレベルの数学的推論benchmarkであるAIME 2025で、満点の100%を達成しました。
動画入力の欠如: Geminiのような他のmultimodalな競合モデルと異なり、GPT-5.5にはネイティブな動画からテキストへの処理機能がありません。
柔軟な推論負荷調整: 5つの異なる推論努力レベルを備えており、開発者はlatency、コスト、知能のバランスを調整できます。
クリエイティブライティングの課題: クリエイティブライティングや詩的な表現におけるbenchmarkの性能は、Anthropicのflagshipモデルに劣ります。

APIクイックスタート

openai/gpt-5.5

ドキュメントを見る
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const response = await openai.chat.completions.create({
    model: "gpt-5.5",
    messages: [
      { role: "system", content: "あなたは自律的なコーディングエージェントです。" },
      { role: "user", content: "このPythonリポジトリをデバッグし、修正を検証してください。" }
    ],
    reasoning_effort: "xhigh"
  });

  console.log(response.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-5.5についてのユーザーの声

GPT-5.5についてコミュニティがどう思っているか見てください

ハルシネーション率が凄まじいな。事実ベースで86%か?『わかりません』と言えない天才のようなものだ。
@ArtificialAnlys
twitter
GPT-5.5 Proは出力100万tokenあたり180ドルか。いよいよAIの贅沢時代に突入したな。
@skeptrune
twitter
プロトAGI時代が到来した。もはやチャットボットではなく、チームメイトだ。
lostlifon
reddit
5段階の推論努力レベルを持つ推論の梯子は、関数呼び出し以来、最も有用な機能追加だ。
DataLearnerAI
hackernews
OpenAIはまたやってくれました。高価ですが、ハイエンドなagenticワークにおいて実際に機能します。
David Ondrej
youtube
20のbenchmarkを通して、GPT-5.5はOpus 4.7よりわずかに高いスコアだが、100万tokenあたり5ドルになった。
@rxhit05
twitter

GPT-5.5についての動画

GPT-5.5についてのチュートリアル、レビュー、ディスカッションを見る

このモデルの推論能力は、これまで見たものとは比較にならないほど劇的です。

バグを一つも直すことなく、一度の実行でSaaSアプリケーション全体を構築しました。

100万tokenあたり5ドルとなると、これほどの知能が必要かどうかを確実に見極める必要があります。

openなモデルと比較すると、agenticな自律性にはまだ大きな差があります。

開発者にとっての真の注目ポイントは推論負荷のパラメータ設定です。

OpenAIはまたやってくれました。高価ですが、ハイエンドなagenticワークにおいて実際に機能します。

UIレイアウトの視覚的理解は、今や完璧に正確です。

GPT-5.4よりも、複数ステップにわたる自身の状態管理がはるかに優れています。

基本的にターミナルを渡して、20分間作業させることができます。

価格は高いですが、デバッグにかかる時間を節約できる価値があります。

100万tokenのcontext windowは、長いドキュメント分析においてゲームチェンジャーです。

もし自律的なエージェントを構築しているなら、真に自律的だと感じられるのは現時点でこのモデルだけです。

非常に具体的な歴史的事実に関して、高いハルシネーション率に気づきました。

効率が向上しているため、同じ複雑なタスクでもより少ないtokenで処理できます。

カジュアルなチャットボットというよりは、開発者向けの専門的なツールです。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-5.5のプロのヒント

GPT-5.5を最大限に活用し、より良い結果を得るための専門家のヒント。

reasoning_effortを'xhigh'に設定する

数学やアーキテクチャ設計のような論理的思考が必要なタスクには、reasoning_effortパラメータを'xhigh'に設定してください。

大容量context windowを活用する

1Mのcontext windowを最大限に活用するために、最初のsystem promptに完全なドキュメントとコードベースのcontextを提供してください。

自己批判ループを実装する

モデルが出力した内容を自身で批判・レビューさせる再帰的なプロセスを組み込むことで、本来のハルシネーション率を軽減できます。

Agenticな検証

agenticなタスクにおいてxhighのeffortレベルを使用し、次のステップに進む前にモデル自身に各工程を確認させてください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

GPT-5.5についてのよくある質問

GPT-5.5に関するよくある質問への回答を見つけてください