openai

GPT-5.3 Codex

GPT-5.3 Codexは、400Kのcontext window、77.3%のTerminal-Benchスコア、複雑なソフトウェア構築のための優れたロジックを備えた、OpenAIの2026年最新のコーディングエージェントです。

Coding AgentGPT-5OpenAISoftware EngineeringAutonomous AI
openai logoopenaiGPT-5February 5, 2026
コンテキスト
400Kトークン
最大出力
128Kトークン
入力価格
$1.75/ 1M
出力価格
$14.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
81%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-5.3 Codexはこのベンチマークで81%を記録しました。
HLE
36%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-5.3 Codexはこのベンチマークで36%を記録しました。
MMLU
93%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-5.3 Codexはこのベンチマークで93%を記録しました。
MMLU Pro
83%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-5.3 Codexはこのベンチマークで83%を記録しました。
SimpleQA
58%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-5.3 Codexはこのベンチマークで58%を記録しました。
IFEval
94%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-5.3 Codexはこのベンチマークで94%を記録しました。
AIME 2025
94%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-5.3 Codexはこのベンチマークで94%を記録しました。
MATH
96%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-5.3 Codexはこのベンチマークで96%を記録しました。
GSM8k
99%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-5.3 Codexはこのベンチマークで99%を記録しました。
MGSM
96%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-5.3 Codexはこのベンチマークで96%を記録しました。
MathVista
78%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-5.3 Codexはこのベンチマークで78%を記録しました。
SWE-Bench
57%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-5.3 Codexはこのベンチマークで57%を記録しました。
HumanEval
93%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-5.3 Codexはこのベンチマークで93%を記録しました。
LiveCodeBench
71%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-5.3 Codexはこのベンチマークで71%を記録しました。
MMMU
84%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-5.3 Codexはこのベンチマークで84%を記録しました。
MMMU Pro
64%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-5.3 Codexはこのベンチマークで64%を記録しました。
ChartQA
91%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-5.3 Codexはこのベンチマークで91%を記録しました。
DocVQA
95%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-5.3 Codexはこのベンチマークで95%を記録しました。
Terminal-Bench
77.3%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-5.3 Codexはこのベンチマークで77.3%を記録しました。
ARC-AGI
54%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-5.3 Codexはこのベンチマークで54%を記録しました。

GPT-5.3 Codexについて

GPT-5.3 Codexの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

自律型開発の新時代

GPT-5.3 Codexは、OpenAIが開発した最も高性能なagenticなコーディングモデルであり、静的なコード生成と自律的なソフトウェアエンジニアリングの間の溝を埋めるために設計されました。次世代のGPT-5アーキテクチャを基盤とし、専門的な知識と高度なreasoningを統合することで、システム管理、デプロイ監視、アーキテクチャのリファクタリングといった長期的なタスクを処理します。このモデルの大きな特徴は「ミッドタスク・ステアリング(作業中の操縦)」機能であり、開発者は複雑なプロジェクトを進めるエージェントをリアルタイムで操作・ガイドすることができます。

再帰的なインテリジェンスとパフォーマンス

GPT-5.3 Codexは、開発のデバッグや自身のデプロイの最適化に自身の初期バージョンを使用してトレーニングされており、自己改善型AIシステムへの大きな一歩を象徴しています。Terminal-Bench 2.0環境で卓越した成績を収めており、ライブターミナルの管理、ユニットテストの実行、そして人間の介入なしにバグを反復的に修正する能力を実証しています。この再帰的なトレーニング手法により、非常に効率的なtoken使用量と、エンタープライズ全体のリポジトリを一度に読み込むことができる400,000 tokenのcontext windowが実現しました。

スムーズなプロフェッショナル統合

専用のCodexアプリ、CLI、およびIDE拡張機能を通じて提供されるこのモデルは、現代のワークフローに深く統合されるよう設計されています。特に、ゼロデイ脆弱性の特定、データパイプライン・アーキテクチャの最適化、レガシーコードベースのプロダクション級の監査において非常に効果的です。優れたロジックと競争力のある価格設定により、極めて高度なソフトウェアエンジニアリングタスクにおけるゴールドスタンダードとしての地位を瞬く間に確立しました。

GPT-5.3 Codex

GPT-5.3 Codexのユースケース

GPT-5.3 Codexを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的ソフトウェアエンジニアリング

高レベルな仕様から、モジュール化されたマルチファイルのソフトウェアプロジェクトを設計・構築します。

プロダクションコードの監査

稼働中のコードベースを分析し、並行性の問題、メモリリーク、アーキテクチャ上の技術的負債を特定します。

リアルタイムDevOps自動化

サーバー設定、コンテナデプロイ、クラスターのスケーリングを含む、ターミナルベースのワークフローを管理します。

サイバーセキュリティの脆弱性修正

高度な防御ロジックにより、ゼロデイ脆弱性やソフトウェアの弱点を特定し、修正案を提示します。

インタラクティブ・プロトタイピング

手書きのワイヤーフレームや簡素なpromptから、本番環境で使用可能なランディングページやウェブアプリを生成します。

データパイプライン・アーキテクチャ

複数の処理レイヤーや非同期環境にわたる複雑なデータフローを追跡し、最適化します。

強み

制限

最先端のコーディングロジック: 業界をリードする Terminal-Bench 2.0 スコア 77.3% を記録し、SWE-Bench Pro でも優れたパフォーマンスを発揮します。
詳細の簡略化: o3-proのようなモデルに見られる極めて深いアーキテクチャの洞察よりも、機能的な簡潔さを優先することがあります。
比類なきコストパフォーマンス: 最も近い競合である Opus 4.6 の約7分の1のコストで、最先端のagenticな機能を提供します。
デフォルトのデザイン性: 論理的には完璧ですが、生成されるアプリの初期UIデザインは、モダンな視覚的洗練さに欠ける場合があります。
再帰的な自己最適化: 自身のアーキテクチャを使用してバグの特定とトレーニングの最適化を行うことで、非常に高い効率性を実現しています。
高度なリソース管理の漏れ: 複雑なハードウェア・ソフトウェアのシミュレーションにおいて、特定のリソース解放タスクを見落とすことが稀にあります。
インタラクティブなリアルタイムステアリング: タスクの途中で人間から指示を受け取ることができる独自の機能を備え、長い反復ループの必要性を軽減します。
エコシステムの障壁: 主なアクセス方法が専用のCodexアプリとCLIに限定されているため、一般的なユーザーには学習コストがかかります。

APIクイックスタート

openai/gpt-5.3-codex

ドキュメントを見る
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-5.3 Codexについてのユーザーの声

GPT-5.3 Codexについてコミュニティがどう思っているか見てください

"Opus 4.6がリリースされた瞬間にGPT-5.3 Codexをぶつけてくるとはね(笑)"
ShreckAndDonkey123
reddit
"Codexは約1/7の価格で、より優れたコードを提供してくれます"
sergeykarayev
reddit
"GPT-5.3 Codexの価格あたりのパフォーマンスは、もはや異常です"
VraserX
x
"GPT-5.3-Codex-Sparkに自身のサービスサイトを読み込ませて新しいウェブサイトを作らせたところ、一瞬で終わりました"
Yohei Takanashi
x
"このモデルは、リリースされたその日にSwiftのactor隔離について正しくreasoningを行いました"
HeroicTardigrade
reddit
"バックエンド全体のオーケストレーションをCodexエージェントに移行しましたが、信頼性は恐ろしいほど高いです"
HackerNewsUser99
hackernews

GPT-5.3 Codexについての動画

GPT-5.3 Codexについてのチュートリアル、レビュー、ディスカッションを見る

GPT-5.3 Codexは、自分自身を作り上げるのに不可欠な役割を果たした最初のモデルです

より少ないtokenでできることが増えたという効率性の向上は、本当に素晴らしいです

このシミュレーションでは、ノズルが動くのに合わせてスプールが正しく回転しています

現実世界のハードウェア統合における処理能力の飛躍的な進歩を目の当たりにしています

ここでの再帰的なトレーニングループは、精度の面で文字通りゲームチェンジャーです

GPT 5.2に戻りたいとは思いません。あれはもう遅く感じてしまいます

大きなスピードアップを実感しています。前のモデルより25%高速だそうです

小規模なコード編集のlatencyは、今や実質的に存在しません

大規模なレガシーコードベースを扱う際、400Kのcontext windowが真価を発揮します

AIが自分のプロジェクトのアーキテクチャを真に理解していると、初めて感じることができました

これは単なるコードヘルパーではありません。あなたが見守る間にプロジェクト全体を構築するAIです

以前は何日もかかっていた作業が、今では数時間で終わります

ドキュメントセットを丸ごとpromptに投げ込める機能は驚異的です

ターミナルの中でリアルタイムに自分のミスを修正している様子が、文字通り目に見えます

SaaSを構築している人にとって、これは最も価値のある従業員になるでしょう

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-5.3 Codexのプロのヒント

GPT-5.3 Codexを最大限に活用し、より良い結果を得るための専門家のヒント。

リアルタイムステアリングの有効化

Codexの設定でフォローアップ動作を有効にすると、ビルドの途中でモデルをガイドできます。

Planモードの活用

複雑なリファクタリングの際は「Plan」コマンドを使用し、コード編集前にモデルに戦略の概要を作成させます。

プルリクエストの一括レビュー

400Kのcontext windowを活用し、機能ブランチ全体を読み込ませることで、深い結合テストが可能になります。

Context Compaction(コンテキスト圧縮)

長時間のagenticなセッションでは、プロジェクトのフォーカスを維持するためにネイティブのコンテキスト圧縮機能を活用してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

GPT-5.3 Codexについてのよくある質問

GPT-5.3 Codexに関するよくある質問への回答を見つけてください