openai

GPT-4o mini

GPT-4o mini là model nhỏ hiệu quả nhất về chi phí của OpenAI, mang lại trí tuệ cấp GPT-4 với tốc độ vượt trội và khả năng vision multimodal cho các tác vụ khối...

Small ModelChi phí hiệu quảCó khả năng VisionAI nhanhMultimodal
openai logoopenaiGPT-4o18 tháng 7, 2024
Ngu canh
128Ktoken
Dau ra toi da
16Ktoken
Gia dau vao
$0.15/ 1M
Gia dau ra
$0.60/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiep
Diem chuan
GPQA
40.2%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-4o mini dat 40.2% trong benchmark nay.
HLE
2.3%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-4o mini dat 2.3% trong benchmark nay.
MMLU
82%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-4o mini dat 82% trong benchmark nay.
MMLU Pro
57%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-4o mini dat 57% trong benchmark nay.
SimpleQA
8.6%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-4o mini dat 8.6% trong benchmark nay.
IFEval
76.5%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-4o mini dat 76.5% trong benchmark nay.
AIME 2025
5%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-4o mini dat 5% trong benchmark nay.
MATH
50.2%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-4o mini dat 50.2% trong benchmark nay.
GSM8k
91.3%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-4o mini dat 91.3% trong benchmark nay.
MGSM
87%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-4o mini dat 87% trong benchmark nay.
MathVista
42%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-4o mini dat 42% trong benchmark nay.
SWE-Bench
8.7%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-4o mini dat 8.7% trong benchmark nay.
HumanEval
87.2%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-4o mini dat 87.2% trong benchmark nay.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-4o mini dat 32.5% trong benchmark nay.
MMMU
59.4%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-4o mini dat 59.4% trong benchmark nay.
MMMU Pro
34%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-4o mini dat 34% trong benchmark nay.
ChartQA
78%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-4o mini dat 78% trong benchmark nay.
DocVQA
88%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-4o mini dat 88% trong benchmark nay.
Terminal-Bench
40%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-4o mini dat 40% trong benchmark nay.
ARC-AGI
8%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-4o mini dat 8% trong benchmark nay.

Ve GPT-4o mini

Tim hieu ve kha nang cua GPT-4o mini, tinh nang va cach no co the giup ban dat ket qua tot hon.

Tiêu chuẩn mới cho các model nhỏ

GPT-4o mini đại diện cho một bước nhảy vọt trong hiệu quả AI, được thiết kế để thay thế GPT-3.5 Turbo trở thành model ưu tiên cho các lập trình viên. Được xây dựng với kiến trúc multimodal nguyên bản, nó mang lại hiệu suất cấp GPT-4 với chi phí và độ latency thấp hơn. Nó có context window 128.000 tokens khổng lồ và hỗ trợ các output phức tạp lên đến 16.384 tokens, giúp nó lý tưởng cho việc xử lý tài liệu dài và luồng dữ liệu khối lượng lớn.

Trí tuệ gặp gỡ sự hợp lý về chi phí

Không giống như các model nhỏ trước đây đã hy sinh trí tuệ để đổi lấy tốc độ, GPT-4o mini duy trì khả năng reasoning cao trong các tác vụ văn bản và hình ảnh. Nó rẻ hơn 60% so với GPT-3.5 Turbo và có khả năng hơn đáng kể, đạt 82% trên benchmark MMLU. Model này được tối ưu hóa đặc biệt cho các ứng dụng mà độ latency thấp và độ tin cậy cao là quan trọng hàng đầu, chẳng hạn như trợ lý khách hàng thời gian thực và các công cụ phân loại dữ liệu quy mô lớn.

GPT-4o mini

Truong hop su dung cho GPT-4o mini

Kham pha cac cach khac nhau ban co the su dung GPT-4o mini de dat ket qua tuyet voi.

Tự động hóa hỗ trợ khách hàng

Xử lý khối lượng lớn các yêu cầu của khách hàng với độ latency thấp và độ chính xác cao với chi phí tối ưu.

Tóm tắt nội dung

Xử lý các tài liệu lớn hoặc nội dung dài thành các bản tóm tắt súc tích trong phạm vi context window 128k.

Trích xuất dữ liệu

Chuyển đổi văn bản hoặc hình ảnh không cấu trúc thành các định dạng dữ liệu cấu trúc như JSON để đưa vào cơ sở dữ liệu.

Dịch thuật đa ngôn ngữ

Cung cấp bản dịch thời gian thực cho hàng chục ngôn ngữ cho các ứng dụng chat và giao tiếp toàn cầu.

Gia sư giáo dục

Đóng vai trò là trợ lý học tập tương tác cho học sinh cần hỗ trợ về toán, khoa học và ngôn ngữ.

Các tác vụ Vision cơ bản

Phân tích hình ảnh để nhận diện đối tượng, trích xuất văn bản qua OCR hoặc cung cấp mô tả cho khả năng truy cập.

Diem manh

Han che

Hiệu suất trên chi phí đáng kinh ngạc: Với mức giá 0,15 USD cho mỗi triệu input tokens, nó mang lại khả năng reasoning cấp độ frontier với điểm MMLU 82%.
Khoảng cách về reasoning phức tạp: Thấp hơn các model lớn như GPT-4o hoặc o1 trong khoa học cấp độ chuyên gia, đạt 40,2% trên GPQA.
Tốc độ throughput cao: Model cung cấp phản hồi với độ latency cực thấp, lý tưởng cho các giao diện người dùng thời gian thực.
Hạn chế về lập trình: Thiếu sự hiểu biết sâu về kiến trúc cho kỹ thuật phần mềm phức tạp so với Claude 3.5 Sonnet.
Context window lớn: Duy trì context window đầy đủ 128k, cho phép xử lý tài liệu phức tạp vốn hiếm thấy ở các model nhỏ.
Output window giảm: Giới hạn output 16k có thể gây hạn chế cho các tác vụ yêu cầu di chuyển code lớn hoặc tạo sách dài.
Hỗ trợ Vision nguyên bản: Bao gồm các khả năng multimodal trong một kích thước nhỏ, vượt trội trong các tác vụ phân tích hình ảnh và OCR.
Tính ổn định của sự thật: Các model nhỏ hơn vẫn dễ bị ảo giác (hallucination) trong các lĩnh vực chuyên biệt hơn so với các phiên bản flagship.

Bat dau nhanh API

openai/gpt-4o-mini

Xem tai lieu
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explain quantum physics." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-4o mini

Xem cong dong nghi gi ve GPT-4o mini

GPT-4o mini về cơ bản đã giết chết thị trường fine-tuning các model cũ hơn cho RAG cơ bản. Chi phí quá thấp để có thể bỏ qua.
AI_Dev_Central
reddit
Tốc độ thật điên rồ. Tôi nhận lại tokens gần như ngay lập tức cho agent dịch thuật của mình.
TechCruncher
twitter
OpenAI thực sự đã ép Anthropic và Google phải hành động với mức giá này. 0,15 USD cho 1M tokens là một mức đáy mới.
hn_reader_99
hackernews
Tôi đã thay 3.5 bằng mini và sự cải thiện về logic có thể thấy rõ ngay trong 5 phút thử nghiệm đầu tiên.
PromptEngineerPro
youtube
Cuối cùng thì nó cũng đủ rẻ để sử dụng LLMs cho việc làm sạch dữ liệu cơ bản ở quy mô lớn mà không bị hóa đơn đám mây khổng lồ.
DataVizWiz
reddit
Hiệu suất vision cho OCR thực sự tốt hơn một số model chuyên dụng có giá đắt gấp 10 lần.
VisionDev
twitter

Video ve GPT-4o mini

Xem huong dan, danh gia va thao luan ve GPT-4o mini

Nó nhanh và rẻ hơn GPT-3.5 Turbo trên mọi phương diện.

Khả năng vision cho một model nhỏ như thế này thực sự đáng kinh ngạc.

Giá cả về cơ bản là một cuộc đua xuống mức 0 với bản phát hành này.

Nó xoay sở để giữ context window khổng lồ trong khi bản thân lại rất nhỏ gọn.

Các benchmark cho thấy nó đánh bại Claude Haiku trong hầu hết mọi danh mục.

GPT 4o mini là một model nhẹ nên nó nhanh hơn nhiều so với GPT 4o.

Nó nhanh hơn rất nhiều so với GPT 4.

Đối với các tác vụ hàng ngày, hầu hết người dùng sẽ không nhận ra sự khác biệt về reasoning.

Khả năng nhận dạng hình ảnh rất nhất quán đối với các đối tượng cơ bản.

Nó xử lý các hướng dẫn phức tạp tốt hơn nhiều so với model 3.5 cũ.

Hiện tại nó vượt trội hơn gbd4 của họ về sở thích chat trên leaderboard LMC.

Mọi thứ trông hoàn hảo và bạn biết đấy, hóa đơn này trông giống như một hóa đơn thông thường.

Thời gian phản hồi gần như dưới một giây cho các prompt ngắn.

Nó rất hiệu quả trong việc tóm tắt các tệp PDF dài thông qua API.

Bạn có thể chạy hàng triệu tokens chỉ với vài đô la.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GPT-4o mini

Meo chuyen gia giup ban tan dung toi da GPT-4o mini va dat ket qua tot hon.

Sử dụng cho RAG

Tận dụng chi phí input thấp để thực hiện Retrieval Augmented Generation quy mô lớn mà không tốn kém.

Cấu trúc với JSON Mode

Sử dụng JSON mode hoặc các tham số function calling để đảm bảo cấu trúc dữ liệu nhất quán cho các luồng công việc backend.

Batch Processing

Sử dụng Batch API của OpenAI với model này để giảm 50% chi phí cho các tác vụ không khẩn cấp.

Điều chỉnh Temperature

Đặt temperature thấp từ 0,1 đến 0,3 cho các tác vụ trích xuất dữ liệu thực tế để tối đa hóa độ chính xác.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Cau hoi thuong gap ve GPT-4o mini

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-4o mini