openai

GPT-4o mini

GPT-4o mini 是 OpenAI 最具成本效益的小型 model,为高任务量场景提供 GPT-4 级别的智能、卓越的速度和 multimodal vision 能力。

小型模型高性价比支持视觉能力快速 AI多模态
openai logoopenaiGPT-4July 18, 2024
上下文
128Ktokens
最大输出
16Ktokens
输入价格
$0.15/ 1M
输出价格
$0.60/ 1M
模态:TextImage
能力:视觉工具流式传输
基准测试
GPQA
40.2%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 GPT-4o mini 在此基准测试中得分 40.2%。
HLE
2.3%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 GPT-4o mini 在此基准测试中得分 2.3%。
MMLU
82%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 GPT-4o mini 在此基准测试中得分 82%。
MMLU Pro
57%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 GPT-4o mini 在此基准测试中得分 57%。
SimpleQA
8.6%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 GPT-4o mini 在此基准测试中得分 8.6%。
IFEval
76.5%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 GPT-4o mini 在此基准测试中得分 76.5%。
AIME 2025
5%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 GPT-4o mini 在此基准测试中得分 5%。
MATH
50.2%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 GPT-4o mini 在此基准测试中得分 50.2%。
GSM8k
91.3%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 GPT-4o mini 在此基准测试中得分 91.3%。
MGSM
87%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 GPT-4o mini 在此基准测试中得分 87%。
MathVista
42%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 GPT-4o mini 在此基准测试中得分 42%。
SWE-Bench
8.7%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 GPT-4o mini 在此基准测试中得分 8.7%。
HumanEval
87.2%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 GPT-4o mini 在此基准测试中得分 87.2%。
LiveCodeBench
32.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 GPT-4o mini 在此基准测试中得分 32.5%。
MMMU
59.4%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 GPT-4o mini 在此基准测试中得分 59.4%。
MMMU Pro
34%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 GPT-4o mini 在此基准测试中得分 34%。
ChartQA
78%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 GPT-4o mini 在此基准测试中得分 78%。
DocVQA
88%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 GPT-4o mini 在此基准测试中得分 88%。
Terminal-Bench
40%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 GPT-4o mini 在此基准测试中得分 40%。
ARC-AGI
8%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 GPT-4o mini 在此基准测试中得分 8%。

关于 GPT-4o mini

了解 GPT-4o mini 的功能、特性以及它如何帮助您获得更好的效果。

小型模型的新标准

GPT-4o mini 代表了 AI 效率的重大飞跃,旨在取代 GPT-3.5 Turbo 成为开发者的首选 model。它采用原生多模态架构构建,以极低的成本和 latency 提供 GPT-4 级别的性能。它拥有巨大的 128,000 token context window,并支持高达 16,384 tokens 的复杂输出,非常适合处理长篇文档和高容量数据流。

智能与高性价比的结合

与以往为了速度而牺牲智能的小型 model 不同,GPT-4o mini 在文本和 vision 任务中均保持了极高的 reasoning 能力。它比 GPT-3.5 Turbo 便宜 60%,且能力显著增强,在 MMLU benchmark 测试中得分为 82%。该 model 专门针对低 latency 和高可靠性至关重要的应用进行了优化,例如实时客户助手和大规模数据分类引擎。

GPT-4o mini

GPT-4o mini 的使用案例

发现使用 GPT-4o mini 获得出色效果的不同方式。

客户支持自动化

部署低 latency、高性价比的聊天机器人,能够高精度地处理数千个常规咨询。

结构化数据提取

将大量非结构化文本或图像数据转换为数据库所需的整洁、格式化的 JSON schema。

实时翻译

为即时通讯应用提供几乎即时的多语言翻译,且运营成本极低。

文档摘要

利用 128k 的广阔 context window,对长篇报告和会议记录进行总结。

视觉分析与 OCR

从图像中提取文本、分析图表,并出于无障碍目的描述视觉内容。

快速原型设计

在扩展到更大的 model 之前,以极低的 API 支出快速构建和迭代 AI 应用。

优势

局限性

无与伦比的性价比: 价格仅为每 100 万输入 tokens 0.15 美元,在保持高水平 reasoning 逻辑的同时,比 GPT-4 降低了 99% 的成本。
reasoning 深度有限: 不具备像 OpenAI o1 这样 model 所拥有的高级 chain-of-thought 能力。
低延迟响应时间: 专为速度而设计,提供几乎即时的响应,这对于实时对话智能体至关重要。
输出 token 限制: 16,384 的输出限制低于某些提供完整 128k 输出能力的专用 model。
原生多模态视觉能力: 与传统的轻量级 model 不同,它能够原生处理图像,在 ChartQA (78.0) 等 benchmark 测试中表现出色。
复杂编程能力的差距: 在处理高层级架构设计和大型多文件代码库调试方面表现欠佳。
强大的指令遵循能力: 在 IFEval 上达到 76.5%,证明了其在遵循复杂格式规则方面的卓越能力。
无原生音频输入: 不支持通过标准的文本/vision API 端点进行直接的音频到音频处理。

API快速入门

openai/gpt-4o-mini

查看文档
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Analyze this data and return JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 GPT-4o mini 的评价

看看社区对 GPT-4o mini 的看法

GPT-4o mini 基本上宣告了 GPT-3.5 的终结。它更快、更便宜、更聪明。已经没有理由再使用旧 model 了。
rowqi
reddit
OpenAI 真的通过这个定价改变了游戏规则。对于这种级别的 reasoning 逻辑,100 万 tokens 只要 15 美分简直疯了。
peterm1598
hackernews
我的聊天机器人几乎能实现即时响应。以这个价位来看,4o-mini 的 latency 令人印象深刻。
WesternCat5211
twitter
GPT-4o mini 发布 4 天,每天处理的 tokens 已经超过 2000 亿个!
Sam Altman
twitter
这么廉价的产品能有这样的 vision 性能才是重点。它处理图表的能力比一年前的某些 flagship 都要好。
VisionDev99
reddit
它在 JSON 提取方面完美遵循系统指令。比起 3.5 Turbo 的可靠性,这是一个巨大的升级。
LLM_Master
hackernews

关于 GPT-4o mini 的视频

观看关于 GPT-4o mini 的教程、评测和讨论

小型 model 的时代已经到来

每 100 万输入 tokens 的价格仅为 15 美分……这便宜得惊人

GPT-4o mini 非常非常快……快得令人难以置信

这个 model 基本上取代了 GPT-3.5 Turbo,而且价格便宜了 60%

看它生成文本的速度,几乎是瞬间完成的

GPT-4o mini 免费、快速且表现相当出色

GPT-3.5 已经彻底退场……取而代之的是 GPT-4o mini

看看这个速度,快得多,对吧

它是一个 multimodal model,这意味着它可以看懂图像

它在某些 benchmark 上的表现甚至超过了 GPT-3.5 Turbo 甚至 GPT-4

OpenAI 基本上发布了一个竞争对手,它似乎击败了许多同类 model

这是他们为了实现最低收费而优化过的 model

能够一次性输出 16,000 个 tokens 真的非常实用

128k 的 context window 对 RAG 应用来说非常棒

该 model 的安全措施从一开始就内置其中

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

GPT-4o mini专业提示

专家提示助您充分利用GPT-4o mini。

直接的系统指令

提供简洁的 system prompt,引导 model 输出特定的格式,如 JSON 或 Markdown。

批量处理上下文

利用 128k 的窗口,将相关的多个小型任务组合成一个 prompt,以降低开销成本。

视觉标注

在处理图像时要求特定的视觉属性,以提高元数据提取的精确度。

流式输出提升用户体验

始终开启 stream 参数,为最终用户提供即时的 token 反馈。

Temperature 调节

对于结构化数据任务,将 temperature 设置为 0,以确保输出的确定性和一致性。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

关于GPT-4o mini的常见问题

查找关于GPT-4o mini的常见问题答案