openai

GPT-5.1

GPT-5.1はOpenAIが提供する高度な推論フラッグシップmodelであり、適応型思考、ネイティブmultimodality、そして数学や技術分野における最先端のパフォーマンスを備えています。

openai logoopenaiGPT-52025年11月12日
コンテキスト
400Kトークン
最大出力
128Kトークン
入力価格
$1.25/ 1M
出力価格
$10.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
88.1%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-5.1はこのベンチマークで88.1%を記録しました。
HLE
32.5%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-5.1はこのベンチマークで32.5%を記録しました。
MMLU
90.2%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-5.1はこのベンチマークで90.2%を記録しました。
MMLU Pro
81%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-5.1はこのベンチマークで81%を記録しました。
SimpleQA
52%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-5.1はこのベンチマークで52%を記録しました。
IFEval
91%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-5.1はこのベンチマークで91%を記録しました。
AIME 2025
94%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-5.1はこのベンチマークで94%を記録しました。
MATH
91%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-5.1はこのベンチマークで91%を記録しました。
GSM8k
98.5%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-5.1はこのベンチマークで98.5%を記録しました。
MGSM
95%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-5.1はこのベンチマークで95%を記録しました。
MathVista
75%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-5.1はこのベンチマークで75%を記録しました。
SWE-Bench
76.3%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-5.1はこのベンチマークで76.3%を記録しました。
HumanEval
92.5%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-5.1はこのベンチマークで92.5%を記録しました。
LiveCodeBench
74%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-5.1はこのベンチマークで74%を記録しました。
MMMU
85.4%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-5.1はこのベンチマークで85.4%を記録しました。
MMMU Pro
62%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-5.1はこのベンチマークで62%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-5.1はこのベンチマークで89%を記録しました。
DocVQA
93%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-5.1はこのベンチマークで93%を記録しました。
Terminal-Bench
58%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-5.1はこのベンチマークで58%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-5.1はこのベンチマークで12%を記録しました。

GPT-5.1について

GPT-5.1の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

推論アーキテクチャ

GPT-5.1はSystem 2思考アーキテクチャを特徴としています。これにより、クエリの複雑さに応じて処理時間を調整できます。数学的な証明に対しては深い論理的推論を適用し、単純な会話タスクではlatencyを低く抑えます。この適応型推論システムにより、価値のある箇所にのみ計算資源が割り当てられます。

Multimodalパフォーマンス

このmodelは、テキストおよびvision入力のためのオムニmultimodalフレームワークを採用しています。前世代と比較して、エンタープライズ向けドキュメント抽出タスクで84%低いlatencyを実現しました。また、メモリ保持能力が向上しており、長時間のagenticワークフロー全体でcontextが維持されるため、大規模なソフトウェア開発プロジェクトにも最適です。

パーソナライゼーションシステム

新しいエンジンにより、トーンや性格を制御できるようになりました。ユーザーはシステム指示を通じて、プロフェッショナル、カジュアル、あるいは表現力豊かといったトーンを設定できます。これらの特性により、複雑なFew-shot promptを作成せずとも、ブランドアイデンティティやユーザーの好みに適合するボットを展開可能です。

GPT-5.1

GPT-5.1のユースケース

GPT-5.1を使って素晴らしい結果を得るさまざまな方法を発見してください。

Agenticソフトウェアエンジニアリング

高精度な推論を用いて、大規模なコードベース全体にわたる複雑なリファクタリングを自動化します。

博士レベルの研究

検証済みのステップバイステップの推論が必要となる、生物学や物理学の複雑な問題を解決します。

エンタープライズ向けドキュメント分析

膨大な表形式のドキュメントセットから、高い視覚的精度で構造化データを抽出します。

パーソナライズされたカスタマーサポート

ユーザーの感情に合わせて、ユニークな性格やプロフェッショナルな対応など、ブランド独自の個性を備えたボットを展開できます。

数学的課題の解決

AIMEスコア99.6%の能力を活用し、証明の検証や高度な数学の個別指導を行います。

Visionベースのビジネスインテリジェンス

複雑なチャートや財務レポートを分析し、視覚的なコンテキストを含めたエグゼクティブサマリーを作成します。

強み

制限

エリートレベルの数学的推論: AIME 2025で99.6%のスコアを達成し、過去のほとんどの競合modelを凌駕する性能を誇ります。
高い出力latency: 複雑なクエリに対して高度な推論を行う場合、回答時間が20秒を超えることがあります。
適応型プロセッシング: 動的なコンピューティングのスケーリングにより、単純なエンタープライズドキュメント処理タスクでのlatencyを84%削減しました。
ネイティブ音声機能の欠如: Gemini 2.0などの競合に見られるような、組み込みの音声対話機能(speech-to-speech)はありません。
強化されたパーソナリティ制御: ネイティブなトーン調整機能により、従来のGPT-5よりも温かみのある人間らしい対話が可能になりました。
出力コスト: 100万tokenあたり10ドルという価格設定のため、長文の推論結果を出力する場合、軽量なmodelよりもコストが高くなります。
大規模なcontext: 400,000 tokenのwindowと24時間のcachingの組み合わせにより、大規模なagenticワークフローを実現します。
持続的な癖のある表現: メモリ指示を明示的に与えても、特定の句読点のパターンを避けきれないという指摘がユーザーから上がっています。

APIクイックスタート

openai/gpt-5.1

ドキュメントを見る
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-5.1についてのユーザーの声

GPT-5.1についてコミュニティがどう思っているか見てください

Codex環境におけるGPT-5.1は、計画立案やコードレビュータスクにおいて今でも最高のレビュアーです。
darrenjr
twitter
私たちの評価では、GPT-5は複雑な推論において他の主要modelよりも最大190%優れた性能を示しました。
CodeRabbit
twitter
GPT-5.1はpromptの難易度に応じて最適化されており、簡単な入力に対して消費するtokenを大幅に抑えています。
Tech Titans
facebook
今回のリリースは、個性を付与してChatGPTの事務的で無機質な印象を払拭することに重点が置かれています。
Theo
youtube
400kのcontext windowは、私たちの全リポジトリ分析において非常に助かっています。
RedditUser99
reddit
ネイティブ音声機能がないのは残念ですが、推論能力の向上は本物です。
HackerNewsGuy
hackernews

GPT-5.1についての動画

GPT-5.1についてのチュートリアル、レビュー、ディスカッションを見る

GPT-5.1がついに登場しました。より高速で正確、そして対話的になっています。

初めてGPT-5.1 Instantは、適応型推論を使って「いつ思考するか」を判断できるようになりました。

論理的推論能力は、標準のGPT-5 modelよりも大幅に向上しています。

以前のプレビュー版よりも温かみのあるトーンを維持しています。

開発者にとって、拡張されたprompt cachingは大幅なコスト削減につながるでしょう。

以前よりもさらに高いレベルでパーソナライズが可能です。

トーンはこれまでよりずっと自然です... 5.1の方がエネルギッシュで良いです。

複雑なワークフローのステップ中でハルシネーションが減少したと感じます。

Instantモードの速度はGPT-4o miniと同等ながら、より賢くなっています。

パーソナライズ機能により、堅苦しい言い回しを避けるように指示できます。

これはフロンティアmodelにおける最もリラックスした反復アップデートの一つと言えるでしょう。

GPT-5の思考と比較して、より的確な結果を出しました。

手書きドキュメントのvision処理は顕著に鮮明になっています。

reasoning effortの切り替えは、APIコストを管理するための最高の機能だと思います。

教科書のような受け答えではなく、対等に話せるmodelになったと感じます。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-5.1のプロのヒント

GPT-5.1を最大限に活用し、より良い結果を得るための専門家のヒント。

reasoning_effortの調整

reasoning_effortパラメータを使用して、数学タスクには「高」を、単純なチャットには「なし」を設定することで、latencyを抑えることができます。

大規模contextの活用

400kのcontext windowを活用してプロジェクトフォルダ全体を読み込ませてください。長いpromptでも情報を適切に保持します。

トーンの制御

システム指示でトーン特性を有効にすることで、事務的な印象を減らし、チームメイトのように自然な対話が可能です。

Prompt Cachingの活用

24時間のPrompt Cachingを活用して、同じコードベースで反復的なagenticループを実行する際のコストを削減しましょう。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

GPT-5.1についてのよくある質問

GPT-5.1に関するよくある質問への回答を見つけてください