openai

GPT-4o mini

GPT-4o mini 是 OpenAI 最具成本效益的小型模型,为高容量任务提供 GPT-4 级别的智能、卓越的速度和多模态视觉能力。

小型模型高成本效益具备视觉能力快速 AI多模态
openai logoopenaiGPT-4o2024年7月18日
上下文
128Ktokens
最大输出
16Ktokens
输入价格
$0.15/ 1M
输出价格
$0.60/ 1M
模态:TextImage
能力:视觉工具流式传输
基准测试
GPQA
40.2%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 GPT-4o mini 在此基准测试中得分 40.2%。
HLE
2.3%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 GPT-4o mini 在此基准测试中得分 2.3%。
MMLU
82%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 GPT-4o mini 在此基准测试中得分 82%。
MMLU Pro
57%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 GPT-4o mini 在此基准测试中得分 57%。
SimpleQA
8.6%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 GPT-4o mini 在此基准测试中得分 8.6%。
IFEval
76.5%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 GPT-4o mini 在此基准测试中得分 76.5%。
AIME 2025
5%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 GPT-4o mini 在此基准测试中得分 5%。
MATH
50.2%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 GPT-4o mini 在此基准测试中得分 50.2%。
GSM8k
91.3%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 GPT-4o mini 在此基准测试中得分 91.3%。
MGSM
87%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 GPT-4o mini 在此基准测试中得分 87%。
MathVista
42%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 GPT-4o mini 在此基准测试中得分 42%。
SWE-Bench
8.7%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 GPT-4o mini 在此基准测试中得分 8.7%。
HumanEval
87.2%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 GPT-4o mini 在此基准测试中得分 87.2%。
LiveCodeBench
32.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 GPT-4o mini 在此基准测试中得分 32.5%。
MMMU
59.4%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 GPT-4o mini 在此基准测试中得分 59.4%。
MMMU Pro
34%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 GPT-4o mini 在此基准测试中得分 34%。
ChartQA
78%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 GPT-4o mini 在此基准测试中得分 78%。
DocVQA
88%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 GPT-4o mini 在此基准测试中得分 88%。
Terminal-Bench
40%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 GPT-4o mini 在此基准测试中得分 40%。
ARC-AGI
8%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 GPT-4o mini 在此基准测试中得分 8%。

关于 GPT-4o mini

了解 GPT-4o mini 的功能、特性以及它如何帮助您获得更好的效果。

小型模型的新标准

GPT-4o mini 代表了 AI 效率的一次重大飞跃,旨在取代 GPT-3.5 Turbo 成为开发者的首选模型。它采用原生的 multimodal 架构构建,以极低的成本和延迟提供 GPT-4 级别的性能。它拥有巨大的 128,000 token context window,并支持高达 16,384 tokens 的复杂输出,非常适合处理长文档和高容量数据流。

智能与实惠的结合

与以往牺牲智能以换取速度的小型模型不同,GPT-4o mini 在文本和视觉任务中均保持了强大的 reasoning 能力。它比 GPT-3.5 Turbo 便宜 60% 且功能更强大,在 MMLU benchmark 上得分高达 82%。该模型经过专门优化,适用于那些对低延迟和高可靠性要求极高的应用场景,例如实时客户助理和大规模数据分类引擎。

GPT-4o mini

GPT-4o mini 的使用案例

发现使用 GPT-4o mini 获得出色效果的不同方式。

自动化客户支持

以极低的延迟和高准确性处理海量客户咨询,成本仅为原有方案的一小部分。

内容摘要

在 128k context window 内将大型文档或长篇内容处理为简洁的摘要。

数据提取

将非结构化文本或图像转换为 JSON 等结构化数据格式,以便录入数据库。

多语言翻译

为聊天应用和全球通讯提供数十种语言的实时翻译。

教育辅导

作为交互式学习助手,帮助学生解决数学、科学和语言艺术方面的问题。

基础视觉任务

分析图像以识别物体、通过 OCR 提取文本,或为无障碍应用提供图像描述。

优势

局限性

极致的性价比: 每百万输入 tokens 仅需 0.15 美元,却能提供 frontier model 级别的 reasoning 能力,MMLU 得分达 82%。
复杂 reasoning 的不足: 在专家级科学问题上落后于 GPT-4o 或 o1 等大型模型,GPQA 得分为 40.2%。
高吞吐量与速度: 模型响应延迟极低,非常适合实时用户界面。
编程能力的局限: 与 Claude 3.5 Sonnet 相比,缺乏对复杂软件工程所需的深度架构理解。
大 context window: 保持完整的 128k context window,允许处理小型模型中罕见的大型复杂文档。
输出窗口限制: 16k 的输出限制对于需要大规模代码迁移或书籍级内容的生成任务可能会受到局限。
原生视觉支持: 在小巧的体积内包含 multimodal 能力,在图像分析和 OCR 任务中表现出色。
事实稳定度: 与 flagship 模型相比,小型模型在特定领域更容易产生幻觉。

API快速入门

openai/gpt-4o-mini

查看文档
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explain quantum physics." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 GPT-4o mini 的评价

看看社区对 GPT-4o mini 的看法

GPT-4o mini 基本上扼杀了针对基础 RAG 微调旧模型的市场,成本低到无法忽视。
AI_Dev_Central
reddit
速度简直疯了。我的翻译 Agent 几乎能瞬间得到 tokens 返回。
TechCruncher
twitter
OpenAI 凭借此定价确实倒逼了 Anthropic 和 Google。100 万 tokens 0.15 美元成了新的基准线。
hn_reader_99
hackernews
我把 3.5 换成了 mini,测试的前五分钟就能明显感觉到逻辑上的提升。
PromptEngineerPro
youtube
终于便宜到可以大规模使用 LLM 进行基础数据清洗,而无需面对巨额云账单了。
DataVizWiz
reddit
OCR 的视觉表现实际上比某些贵 10 倍的专用模型还要好。
VisionDev
twitter

关于 GPT-4o mini 的视频

观看关于 GPT-4o mini 的教程、评测和讨论

它在各个方面都比 GPT-3.5 Turbo 更快、更便宜。

对于这样小的模型来说,视觉能力确实令人惊讶。

随着这个版本的发布,定价已经变成了一场向零成本冲刺的竞赛。

它在保持体积小巧的同时,依然拥有巨大的 context window。

Benchmarks 显示它在几乎所有类别中都击败了 Claude Haiku。

GPT 40 mini 是一个轻量级模型,所以它比 GPT 40 快得多。

它比 GPT 4 快得多。

对于日常任务,大多数用户甚至察觉不到它在 reasoning 上的差异。

对于基础物体,图像识别非常稳定。

它处理复杂指令的能力比旧的 3.5 模型好得多。

它目前在 LMC 排行榜的聊天偏好上胜过了 gpt4。

一切看起来都很完美,而且这张特定的收据看起来就像典型的收据。

对于短提示,响应时间几乎在毫秒级。

它在通过 API 总结长篇 PDF 方面非常有效。

你只需要几美元就能运行数百万个 tokens。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

GPT-4o mini专业提示

专家提示助您充分利用GPT-4o mini。

用于 RAG

利用极低的输入成本执行大规模检索增强生成(RAG),而无需高额支出。

使用 JSON Mode 构建结构

使用 JSON mode 或 function calling 参数来确保后端工作流的数据结构一致性。

批量处理

对非紧急任务使用 OpenAI 的 Batch API,可降低 50% 的成本。

Temperature 调节

对于事实提取任务,将 temperature 设置在 0.1 到 0.3 之间,以最大化准确性。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

关于GPT-4o mini的常见问题

查找关于GPT-4o mini的常见问题答案