openai

GPT-5.3 Codex

GPT-5.3 CodexはOpenAIの2026年型frontierコーディングエージェントです。400Kのcontext window、77.3%のTerminal-Benchスコア、複雑なソフトウェア開発のための優れたロジックを備えています。

コーディングエージェントGPT-5OpenAIソフトウェアエンジニアリング自律型AI
openai logoopenaiGPT2026年2月5日
コンテキスト
400Kトークン
最大出力
128Kトークン
入力価格
$1.75/ 1M
出力価格
$14.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
81%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-5.3 Codexはこのベンチマークで81%を記録しました。
HLE
36%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-5.3 Codexはこのベンチマークで36%を記録しました。
MMLU
93%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-5.3 Codexはこのベンチマークで93%を記録しました。
MMLU Pro
83%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-5.3 Codexはこのベンチマークで83%を記録しました。
SimpleQA
58%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-5.3 Codexはこのベンチマークで58%を記録しました。
IFEval
94%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-5.3 Codexはこのベンチマークで94%を記録しました。
AIME 2025
94%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-5.3 Codexはこのベンチマークで94%を記録しました。
MATH
96%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-5.3 Codexはこのベンチマークで96%を記録しました。
GSM8k
99%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-5.3 Codexはこのベンチマークで99%を記録しました。
MGSM
96%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-5.3 Codexはこのベンチマークで96%を記録しました。
MathVista
78%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-5.3 Codexはこのベンチマークで78%を記録しました。
SWE-Bench
57%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-5.3 Codexはこのベンチマークで57%を記録しました。
HumanEval
93%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-5.3 Codexはこのベンチマークで93%を記録しました。
LiveCodeBench
71%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-5.3 Codexはこのベンチマークで71%を記録しました。
MMMU
84%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-5.3 Codexはこのベンチマークで84%を記録しました。
MMMU Pro
64%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-5.3 Codexはこのベンチマークで64%を記録しました。
ChartQA
91%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-5.3 Codexはこのベンチマークで91%を記録しました。
DocVQA
95%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-5.3 Codexはこのベンチマークで95%を記録しました。
Terminal-Bench
77.3%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-5.3 Codexはこのベンチマークで77.3%を記録しました。
ARC-AGI
54%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-5.3 Codexはこのベンチマークで54%を記録しました。

GPT-5.3 Codexについて

GPT-5.3 Codexの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

自律型開発の新たな時代

GPT-5.3 Codexは、OpenAIが提供する最も有能なagenticコーディングモデルです。静的なコード生成と自律的なソフトウェアエンジニアリングの溝を埋める存在です。GPT-5のアーキテクチャに基づいて構築され、専門知識と高度な推論を統合し、システム管理、デプロイ監視、アーキテクチャのリファクタリングといった長期的なタスクを処理します。本モデルはタスク実行中の制御に対応しており、複雑なプロジェクトをナビゲートする際、開発者がリアルタイムでエージェントを誘導することができます。

再帰的な知能とパフォーマンス

OpenAIは、自らのデプロイをデバッグおよび最適化するために、このモデルの初期反復バージョンを学習させました。これは、自己改善システムへの重要な一歩です。Terminal-Bench 2.0環境に優れており、人間が介在することなく、ライブターミナルの管理、単体テストの実行、反復的なバグ修正をこなす能力を示しています。この再帰的な学習アプローチにより、効率的なtoken使用と400,000-tokenのcontext windowを実現しました。企業規模の巨大なリポジトリ全体を一度のパスで解析可能です。

プロフェッショナルなシームレス統合

専用のCodexアプリ、CLI、IDE拡張機能を通じて利用でき、現代的なワークフローに統合されます。ゼロデイエクスプロイトの特定、データパイプラインアーキテクチャの最適化、レガシーコードベースの製品レベルの監査に効果を発揮します。優れたロジックと競争力のある価格設定により、重要なソフトウェアエンジニアリングタスクのための高性能ツールとして機能します。

GPT-5.3 Codex

GPT-5.3 Codexのユースケース

GPT-5.3 Codexを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

高レベルな仕様に基づいた、モジュール式のマルチファイル構成ソフトウェアプロジェクトの設計と構築。

本番コードの監査

実行中のコードベースを解析し、並行処理の問題、メモリリーク、技術的負債を特定。

リアルタイムのDevOps自動化

サーバーセットアップ、コンテナデプロイ、クラスタスケーリングなど、ターミナルベースのワークフロー管理。

サイバーセキュリティの脆弱性修復

高度な防御ロジックを用いて、ゼロデイエクスプロイトやソフトウェアの脆弱性を特定・修正。

インタラクティブ・プロトタイピング

手描きのワイヤーフレームや大まかなpromptから、製品レベルのランディングページやWebアプリを生成。

データパイプラインのアーキテクチャ設計

複数の処理レイヤーや非同期環境にまたがる複雑なデータフローのトレースと最適化。

強み

制限

state-of-the-artのコーディングロジック: 業界をリードするTerminal-Bench 2.0での77.3%のスコアと、SWE-Bench Proでの優れたパフォーマンス。
機能的な簡潔性: o3-proのようなモデルに見られる極めて深いアーキテクチャ設計よりも、機能的な簡潔さを優先する傾向があります。
比類なきコストパフォーマンス: Opus 4.6などのライバルと比較して約7分の1のコストで、frontierなagentic能力を実現。
デフォルトのUIデザイン: 論理的には完璧ですが、アプリの初期UIデザインが現代的な洗練さに欠ける場合があります。
再帰的な自己最適化: 自身のアーキテクチャを使用してバグを特定し、学習効率を最適化するように構築。
高負荷環境でのリソース管理の隙: 複雑なハードウェア・ソフトウェアのシミュレーションにおいて、特定のリソースクリーンアップタスクを見落とすことがあります。
インタラクティブなリアルタイム制御: タスク実行中に人間から直接指示を出せる独自機能により、反復プロセスの手間を削減。
エコシステムの学習コスト: メインのアクセス手段が特化型のCodexアプリやCLIに最適化されており、標準的なAPIユーザーには学習コストがかかります。

APIクイックスタート

openai/gpt-5.3-codex

ドキュメントを見る
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-5.3 Codexについてのユーザーの声

GPT-5.3 Codexについてコミュニティがどう思っているか見てください

GPT-5.3 Codexは、一般的なチャットボットというより、純粋なエンジニアモデルのような感触だ。
Federal-Piano8695
reddit
Codexは約7分の1の価格でより優れたコードを提供している。コストパフォーマンスは異常と言える。
sergeykarayev
reddit
単に指示を実行するだけではない。インテリジェントな意思決定を行っている。まるで判断力を持っているかのようだ。
mattshumer_
twitter
バックエンドのオーケストレーションをCodexエージェントに移行したが、その信頼性は恐ろしいほど高い。
HackerNewsUser99
hackernews
GPT 5.3 CodexがTerminal-Bench 2.0で最高スコアを更新した。77.3%は前バージョンから大幅な飛躍だ。
bridgemindai
twitter
400kのcontext windowのおかげで、企業レベルのリポジトリ全体を一度に監査できるようになった。
cdcore
other

GPT-5.3 Codexについての動画

GPT-5.3 Codexについてのチュートリアル、レビュー、ディスカッションを見る

Codexは、Claudeがキー1つだけにマッピングしたのに対し、1と2の両方を適切に実装してビュー変更を反映させた。

Codexは根本原因を突き止めただけでなく、潜在的な問題点も特定して修正した。

ビル群での跳ね返りなど、物理挙動が最も自然だった。

Gemini 3.1と比較して、Codexはマルチファイルのロジック処理におけるドリフトが少ない。

ここでのagenticループの速度は、Claude Opus 4.6よりも明らかに速い。

これは単なるコードヘルパーではない。あなたが作業を見守る間にプロジェクト全体を構築するAIだ。

ドキュメントセット全体をそのままpromptに投げ込める能力は狂っている。

ターミナルで自らのミスをリアルタイムに修正している様子が見られる。

SEOツール開発を行っているなら、それが書く自動スクレイピングスクリプトは本番環境でそのまま使える。

ボタンを一つも触らずに、サイト全体をVercelにデプロイしてしまった。

GPT-5.3 Codexは、自分自身の作成に貢献した初めてのモデルだ。

より少ないtokenで多くのタスクをこなせるようになった効率性は本当に素晴らしい。

実世界のハードウェア統合における処理能力が劇的に向上している。

コーディングの判断を下す背景にある推論エンジンは、通常のGPT-5よりもはるかに堅牢だ。

Terminal-Benchのスコアもさることながら、Linuxファイルシステムを自在に操作する姿は圧巻だ。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-5.3 Codexのプロのヒント

GPT-5.3 Codexを最大限に活用し、より良い結果を得るための専門家のヒント。

リアルタイム制御の有効化

Codex設定でフォローアップ動作を有効にすると、contextを失うことなくビルド途中でモデルを誘導できます。

Planモードの活用

複雑なリファクタリングを行う際は「Plan」コマンドを使用し、編集前にモデルに戦略をアウトライン化させましょう。

プルリクエストレビューのバッチ処理

機能ブランチ全体を400Kのcontext windowに読み込ませ、詳細な統合テストを実行します。

Contextの圧縮

長時間におよぶagenticなセッションでは、ネイティブのcontext圧縮機能を利用してプロジェクトの焦点を維持してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

GPT-5.3 Codexについてのよくある質問

GPT-5.3 Codexに関するよくある質問への回答を見つけてください