openai

GPT-4o mini

GPT-4o miniはOpenAIの最もコスト効率の高い小型モデルで、GPT-4クラスの知能と優れた速度、multimodalなvision機能を高負荷なタスク向けに提供します。

小型モデルコスト効率Vision対応高速AIMultimodal
openai logoopenaiGPT-4o2024年7月18日
コンテキスト
128Kトークン
最大出力
16Kトークン
入力価格
$0.15/ 1M
出力価格
$0.60/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング
ベンチマーク
GPQA
40.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-4o miniはこのベンチマークで40.2%を記録しました。
HLE
2.3%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-4o miniはこのベンチマークで2.3%を記録しました。
MMLU
82%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-4o miniはこのベンチマークで82%を記録しました。
MMLU Pro
57%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-4o miniはこのベンチマークで57%を記録しました。
SimpleQA
8.6%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-4o miniはこのベンチマークで8.6%を記録しました。
IFEval
76.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-4o miniはこのベンチマークで76.5%を記録しました。
AIME 2025
5%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-4o miniはこのベンチマークで5%を記録しました。
MATH
50.2%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-4o miniはこのベンチマークで50.2%を記録しました。
GSM8k
91.3%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-4o miniはこのベンチマークで91.3%を記録しました。
MGSM
87%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-4o miniはこのベンチマークで87%を記録しました。
MathVista
42%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-4o miniはこのベンチマークで42%を記録しました。
SWE-Bench
8.7%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-4o miniはこのベンチマークで8.7%を記録しました。
HumanEval
87.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-4o miniはこのベンチマークで87.2%を記録しました。
LiveCodeBench
32.5%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-4o miniはこのベンチマークで32.5%を記録しました。
MMMU
59.4%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-4o miniはこのベンチマークで59.4%を記録しました。
MMMU Pro
34%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-4o miniはこのベンチマークで34%を記録しました。
ChartQA
78%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-4o miniはこのベンチマークで78%を記録しました。
DocVQA
88%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-4o miniはこのベンチマークで88%を記録しました。
Terminal-Bench
40%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-4o miniはこのベンチマークで40%を記録しました。
ARC-AGI
8%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-4o miniはこのベンチマークで8%を記録しました。

GPT-4o miniについて

GPT-4o miniの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

小型モデルの新しいスタンダード

GPT-4o miniは、AI効率における飛躍的な進化を遂げたモデルであり、開発者にとってGPT-3.5 Turboの後継となるモデルです。ネイティブなmultimodalアーキテクチャで構築されており、コストとlatencyを抑えつつGPT-4クラスのパフォーマンスを提供します。128,000 tokenという膨大なcontext windowと最大16,384 tokensの出力に対応しており、長文ドキュメント処理や大量のデータストリーム処理に最適です。

知能と手頃な価格の両立

速度のために知能を犠牲にしてきた従来の小型モデルとは異なり、GPT-4o miniはテキストおよびvisionタスク全体で高い推論能力を維持しています。GPT-3.5 Turboより60%安価でありながら性能は大幅に向上しており、MMLU benchmarkでは82%を記録しました。このモデルは、リアルタイムの顧客アシスタントや大規模なデータ分類エンジンなど、低latencyと高い信頼性が求められるアプリケーションに最適化されています。

GPT-4o mini

GPT-4o miniのユースケース

GPT-4o miniを使って素晴らしい結果を得るさまざまな方法を発見してください。

カスタマーサポートの自動化

低latencyかつ高精度な対応を低コストで実現し、大量の問い合わせを処理します。

コンテンツの要約

128kのcontext windowを活用し、大規模なドキュメントや長文コンテンツを簡潔に要約します。

データ抽出

非構造化テキストや画像をJSONなどの構造化データ形式に変換し、データベースへの取り込みを容易にします。

多言語翻訳

チャットアプリケーションやグローバルなコミュニケーション向けに、数十の言語でリアルタイム翻訳を提供します。

学習支援(チューター)

数学、科学、言語学習などにおいて、学生向けの対話型学習アシスタントとして活用できます。

基本的なVisionタスク

画像を解析して物体を特定したり、OCRでテキストを抽出したり、アクセシビリティ向上のために説明を提供したりします。

強み

制限

圧倒的なコストパフォーマンス: 入力100万tokenあたり$0.15という価格で、MMLUスコア82%というfrontierレベルの推論能力を提供します。
高度な推論の限界: GPQAスコアは40.2%であり、専門家レベルの科学的推論においてはGPT-4oやo1などの大型モデルに及びません。
高いスループットと速度: 極めて低いlatencyでレスポンスを生成するため、リアルタイムのUIに適しています。
コーディングの制約: Claude 3.5 Sonnetと比較すると、複雑なソフトウェアエンジニアリングに必要な深いアーキテクチャ理解が不足しています。
大規模なcontext window: 128kのcontext windowを維持しており、小型モデルでは珍しい複雑なドキュメント処理が可能です。
出力Windowの制限: 16kの出力制限があるため、大規模なコード移行や書籍単位の生成を行うタスクには制限がかかる場合があります。
ネイティブなVisionサポート: 小型なフォームファクタでありながらmultimodal機能を備えており、画像解析やOCRタスクに優れています。
事実性の安定性: 小型モデルであるため、特定のニッチなドメインではフラグシップモデルと比較してhallucinationが起こりやすい傾向があります。

APIクイックスタート

openai/gpt-4o-mini

ドキュメントを見る
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "量子物理学について説明してください。" }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-4o miniについてのユーザーの声

GPT-4o miniについてコミュニティがどう思っているか見てください

GPT-4o miniは、基本的なRAGのために古いモデルをfine-tuningする市場を事実上終わらせました。無視できない低コストです。
AI_Dev_Central
reddit
速度が異常です。翻訳エージェントでほぼ瞬時にtokenが返ってきます。
TechCruncher
twitter
OpenAIはこの価格設定で、AnthropicとGoogleを追い詰めました。100万tokenで$0.15というのは新しい基準です。
hn_reader_99
hackernews
3.5からminiに入れ替えましたが、最初の5分間のテストで論理的な改善がはっきりとわかりました。
PromptEngineerPro
youtube
ついに大規模なデータクレンジングにLLMをコストを気にせず利用できるようになりました。
DataVizWiz
reddit
OCRのvision性能は、10倍のコストがかかる一部の専門モデルよりも実際に優れています。
VisionDev
twitter

GPT-4o miniについての動画

GPT-4o miniについてのチュートリアル、レビュー、ディスカッションを見る

あらゆる面でGPT-3.5 Turboより高速かつ安価です。

このサイズのモデルにしてはvision機能が本当に驚くべきレベルです。

今回のリリースで、価格競争は実質的にゼロへの競争になっています。

小型でありながら、膨大なcontext windowを維持しているのが特徴です。

benchmarkではほぼすべてのカテゴリーでClaude Haikuを上回っています。

GPT-4o miniは軽量モデルなので、GPT-4oよりもはるかに高速です。

GPT-4よりも圧倒的に速いです。

日常的なタスクでは、推論能力の差を感じることはほとんどないでしょう。

基本的な物体の画像認識は非常に安定しています。

旧モデルの3.5よりも複雑な指示をはるかにうまく処理できます。

現在、LMSYS Leaderboardのチャット選好において彼らのGPT-4を上回っています。

すべてが完璧に見え、この領収書は一般的な領収書のように見事に認識されました。

短いpromptの場合、反応時間は実質的に1秒未満です。

APIを通じて長いPDFを要約するのに非常に効果的です。

わずか数ドルで数百万tokenを処理できます。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-4o miniのプロのヒント

GPT-4o miniを最大限に活用し、より良い結果を得るための専門家のヒント。

RAGへの活用

低い入力コストを活かし、高額な費用をかけずに大規模なRetrieval Augmented Generationを実行しましょう。

JSONモードによる構造化

JSONモードやfunction callingパラメータを使用して、バックエンドのワークフローに適した一貫性のあるデータ構造を確保します。

バッチ処理の利用

OpenAIのBatch APIとこのモデルを併用することで、緊急性の低いタスクのコストを50%削減できます。

Temperatureの調整

事実抽出などのタスクでは、精度を最大化するためにTemperatureを0.1から0.3の低めに設定してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

GPT-4o miniについてのよくある質問

GPT-4o miniに関するよくある質問への回答を見つけてください