openai

GPT-4o mini

GPT-4o miniは、OpenAIで最もコスト効率の高い小型modelです。大量のタスク向けに、優れたスピードとmultimodal vision、そしてGPT-4クラスの知性を提供します。

小型modelコスト効率vision対応高速AImultimodal
openai logoopenaiGPT-4July 18, 2024
コンテキスト
128Kトークン
最大出力
16Kトークン
入力価格
$0.15/ 1M
出力価格
$0.60/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング
ベンチマーク
GPQA
40.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 GPT-4o miniはこのベンチマークで40.2%を記録しました。
HLE
2.3%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 GPT-4o miniはこのベンチマークで2.3%を記録しました。
MMLU
82%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 GPT-4o miniはこのベンチマークで82%を記録しました。
MMLU Pro
57%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 GPT-4o miniはこのベンチマークで57%を記録しました。
SimpleQA
8.6%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 GPT-4o miniはこのベンチマークで8.6%を記録しました。
IFEval
76.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 GPT-4o miniはこのベンチマークで76.5%を記録しました。
AIME 2025
5%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 GPT-4o miniはこのベンチマークで5%を記録しました。
MATH
50.2%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 GPT-4o miniはこのベンチマークで50.2%を記録しました。
GSM8k
91.3%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 GPT-4o miniはこのベンチマークで91.3%を記録しました。
MGSM
87%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 GPT-4o miniはこのベンチマークで87%を記録しました。
MathVista
42%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 GPT-4o miniはこのベンチマークで42%を記録しました。
SWE-Bench
8.7%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 GPT-4o miniはこのベンチマークで8.7%を記録しました。
HumanEval
87.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 GPT-4o miniはこのベンチマークで87.2%を記録しました。
LiveCodeBench
32.5%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 GPT-4o miniはこのベンチマークで32.5%を記録しました。
MMMU
59.4%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 GPT-4o miniはこのベンチマークで59.4%を記録しました。
MMMU Pro
34%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 GPT-4o miniはこのベンチマークで34%を記録しました。
ChartQA
78%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 GPT-4o miniはこのベンチマークで78%を記録しました。
DocVQA
88%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 GPT-4o miniはこのベンチマークで88%を記録しました。
Terminal-Bench
40%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 GPT-4o miniはこのベンチマークで40%を記録しました。
ARC-AGI
8%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 GPT-4o miniはこのベンチマークで8%を記録しました。

GPT-4o miniについて

GPT-4o miniの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

小型modelの新しい基準

GPT-4o miniは、AIの効率性において大きな飛躍を遂げたmodelであり、開発者向けの主力modelとしてGPT-3.5 Turboに代わる存在として設計されました。ネイティブなmultimodalアーキテクチャで構築されており、わずかなコストとlatencyでGPT-4クラスのパフォーマンスを提供します。128,000 tokenの巨大なcontext windowを備え、1回のレスポンスで最大16,384 tokenの複雑な出力をサポートしているため、長文のドキュメント処理や大量のデータストリームの処理に最適です。

知性と手頃な価格の両立

スピードのために知性を犠牲にしていた従来の小型modelとは異なり, GPT-4o miniはテキストとvisionのタスク全般で高いreasoning能力を維持しています。GPT-3.5 Turboよりも60%安価でありながら、MMLUベンチマークで82%を記録するなど、大幅に高い性能を誇ります。このmodelは、リアルタイムのカスタマーアシスタントや大規模なデータ分類エンジンなど、低latencyと高い信頼性が極めて重要となるアプリケーション向けに特に最適化されています。

GPT-4o mini

GPT-4o miniのユースケース

GPT-4o miniを使って素晴らしい結果を得るさまざまな方法を発見してください。

カスタマーサポートの自動化

何千もの定型的な問い合わせを高い精度で処理できる、低latencyで費用対効果の高いチャットボットを導入できます。

構造化データの抽出

大量の非構造化テキストや画像データを、データベース用のクリーンでフォーマットされたJSONスキーマに変換します。

リアルタイム翻訳

最小限の運用コストで、数十の言語にわたるほぼ瞬時の翻訳機能をメッセージングアプリに提供します。

ドキュメントの要約

広大な128kのcontext windowを使用して、長編のレポートや会議の議事録を要約します。

画像分析とOCR

画像からテキストを抽出し、チャートを分析し、アクセシビリティ向上のために視覚的な内容を説明します。

迅速なプロトタイピング

大規模なmodelへスケールアップする前に、最小限のAPI費用でAIアプリケーションを迅速に構築し、反復開発を行います。

強み

制限

圧倒的な費用対効果: 100万入力tokenあたり0.15ドルという価格で、高い論理性レベルを維持しながら、GPT-4と比較して99%のコスト削減を実現します。
reasoningの深さの限界: OpenAI o1のようなmodelに見られる高度なchain-of-thought能力は備えていません。
低latencyな応答時間: スピードを重視して設計されており、リアルタイムの対話型エージェントに不可欠な、ほぼ瞬時のレスポンスを提供します。
出力tokenの制限: 16,384の出力制限は、完全な128kの出力パリティを提供する特化型modelよりも低くなっています。
ネイティブなmultimodal vision: 従来の小型modelとは異なり、画像をネイティブに処理し、ChartQA(78.0)で高いスコアを記録しています。
複雑なコーディングにおける課題: 高度なアーキテクチャ設計や、大規模な複数ファイルのリポジトリのデバッグには苦戦する場合があります。
強力な指示追従能力: IFEvalで76.5%を達成しており、複雑なフォーマット規則の遵守において優れた能力を発揮します。
ネイティブな音声入力への非対応: 標準的なテキスト/vision APIエンドポイントを介した直接的な音声対音声処理はサポートしていません。

APIクイックスタート

openai/gpt-4o-mini

ドキュメントを見る
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Analyze this data and return JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

GPT-4o miniについてのユーザーの声

GPT-4o miniについてコミュニティがどう思っているか見てください

GPT-4o miniは実質的にGPT-3.5の終焉を告げるものです。より速く、安く、そして賢い。もはや古いmodelを使う理由はありません。
rowqi
reddit
OpenAIはこの価格設定で完全にゲームチェンジャーとなりました。このレベルの論理性能で100万tokenあたり15セントというのは驚異的です。
peterm1598
hackernews
チャットボットでほぼ瞬時のレスポンスが得られています。4o-miniの価格に対するlatencyは非常に印象的です。
WesternCat5211
twitter
GPT-4o miniのリリースから4日。すでに1日あたり2,000億以上のtokenを処理しています!
Sam Altman
twitter
これほど安価なものとしてのvision性能こそが本質です。1年前のflagship modelよりもチャートの扱いが優れています。
VisionDev99
reddit
JSON抽出においてsystem instructionsに完璧に従います。3.5 Turboの信頼性と比較して大幅なアップグレードです。
LLM_Master
hackernews

GPT-4o miniについての動画

GPT-4o miniについてのチュートリアル、レビュー、ディスカッションを見る

小型modelの時代が到来しました

100万入力tokenあたり15セントという価格設定は...信じられないほど安いです

GPT-4o miniは非常に高速です...信じられないほどの速さです

このmodelは実質的にGPT-3.5 Turboを置き換えるもので、60%も安価です

テキストの生成速度を見てください、ほぼ一瞬です

GPT-4o miniは無料で高速、そして実際かなり優秀です

GPT-3.5は完全に姿を消し...GPT-4o miniへと移行しました

このスピードを見てください、圧倒的に速いですよね

これはmultimodalなmodelであり、画像を見ることができます

いくつかのベンチマークではGPT-3.5 TurboやGPT-4さえも凌駕しています

OpenAIは、多くの既存modelを圧倒するような競合製品を投入してきました

これは、彼らがコストを最小限に抑えるために最適化したmodelです

一度に16,000 tokenを出力できるというのは、非常に有用な機能です

context windowは128kで、RAGアプリケーションに最適です

このmodelの安全対策は、最初から組み込まれています

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

GPT-4o miniのプロのヒント

GPT-4o miniを最大限に活用し、より良い結果を得るための専門家のヒント。

的確なsystem instructions

JSONやMarkdownなどの特定の出力形式にmodelを誘導するために、簡潔なsystem promptを提供してください。

contextのバッチ処理

関連する小さなタスクを1つのpromptにまとめることで、128kのwindowを活用し、オーバーヘッドコストを削減できます。

visionのラベル付け

画像を処理する際、特定の視覚的属性を指定して抽出することで、メタデータ抽出の精度を向上させることができます。

UXのためのstreaming

エンドユーザーに即座にtokenのフィードバックを提供するために、常にstreamパラメータを有効にしてください。

temperatureの調整

構造化データのタスクでは、決定論的で一貫した出力を確保するために、temperatureを0に設定してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

GPT-4o miniについてのよくある質問

GPT-4o miniに関するよくある質問への回答を見つけてください