openai

GPT-4o mini

GPT-4o mini là model nhỏ tiết kiệm chi phí nhất của OpenAI, mang lại trí tuệ đẳng cấp GPT-4 với tốc độ vượt trội và khả năng vision multimodal cho các tác vụ...

Model nhỏTiết kiệm chi phíCó khả năng VisionAI tốc độ caoMultimodal
openai logoopenaiGPT-418 tháng 7, 2024
Ngu canh
128Ktoken
Dau ra toi da
16Ktoken
Gia dau vao
$0.15/ 1M
Gia dau ra
$0.60/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiep
Diem chuan
GPQA
40.2%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-4o mini dat 40.2% trong benchmark nay.
HLE
2.3%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-4o mini dat 2.3% trong benchmark nay.
MMLU
82%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-4o mini dat 82% trong benchmark nay.
MMLU Pro
57%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-4o mini dat 57% trong benchmark nay.
SimpleQA
8.6%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-4o mini dat 8.6% trong benchmark nay.
IFEval
76.5%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-4o mini dat 76.5% trong benchmark nay.
AIME 2025
5%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-4o mini dat 5% trong benchmark nay.
MATH
50.2%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-4o mini dat 50.2% trong benchmark nay.
GSM8k
91.3%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-4o mini dat 91.3% trong benchmark nay.
MGSM
87%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-4o mini dat 87% trong benchmark nay.
MathVista
42%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-4o mini dat 42% trong benchmark nay.
SWE-Bench
8.7%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-4o mini dat 8.7% trong benchmark nay.
HumanEval
87.2%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-4o mini dat 87.2% trong benchmark nay.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-4o mini dat 32.5% trong benchmark nay.
MMMU
59.4%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-4o mini dat 59.4% trong benchmark nay.
MMMU Pro
34%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-4o mini dat 34% trong benchmark nay.
ChartQA
78%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-4o mini dat 78% trong benchmark nay.
DocVQA
88%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-4o mini dat 88% trong benchmark nay.
Terminal-Bench
40%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-4o mini dat 40% trong benchmark nay.
ARC-AGI
8%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-4o mini dat 8% trong benchmark nay.

Ve GPT-4o mini

Tim hieu ve kha nang cua GPT-4o mini, tinh nang va cach no co the giup ban dat ket qua tot hon.

Một tiêu chuẩn mới cho các model nhỏ

GPT-4o mini đại diện cho một bước nhảy vọt về hiệu quả AI, được thiết kế để thay thế GPT-3.5 Turbo trở thành model ưu tiên cho các nhà phát triển. Được xây dựng với kiến trúc multimodal gốc, nó mang lại hiệu năng đẳng cấp GPT-4 với chi phí và latency chỉ bằng một phần nhỏ. Model này sở hữu context window khổng lồ 128.000 tokens và hỗ trợ đầu ra phức tạp lên đến 16.384 tokens, lý tưởng cho việc xử lý các tài liệu dài và các luồng dữ liệu khối lượng lớn.

Khi trí tuệ đi đôi với giá thành hợp lý

Không giống như các model nhỏ trước đây thường phải hy sinh trí tuệ để đổi lấy tốc độ, GPT-4o mini duy trì khả năng reasoning cao trong cả các tác vụ văn bản và vision. Nó rẻ hơn 60% so với GPT-3.5 Turbo và có khả năng vượt trội đáng kể, đạt 82% trên benchmark MMLU. Model này được tối ưu hóa đặc biệt cho các ứng dụng đòi hỏi latency thấp và độ tin cậy cao, chẳng hạn như trợ lý khách hàng thời gian thực và các hệ thống phân loại dữ liệu quy mô lớn.

GPT-4o mini

Truong hop su dung cho GPT-4o mini

Kham pha cac cach khac nhau ban co the su dung GPT-4o mini de dat ket qua tuyet voi.

Tự động hóa hỗ trợ khách hàng

Triển khai các chatbot có latency thấp, chi phí hiệu quả, có thể xử lý hàng nghìn câu hỏi thường gặp với độ chính xác cao.

Trích xuất dữ liệu có cấu trúc

Chuyển đổi khối lượng lớn văn bản không cấu trúc hoặc dữ liệu hình ảnh thành các schema JSON sạch, được định dạng cho cơ sở dữ liệu.

Dịch thuật thời gian thực

Cung cấp sức mạnh cho các ứng dụng nhắn tin với khả năng dịch thuật gần như tức thời qua hàng chục ngôn ngữ với chi phí vận hành tối thiểu.

Tóm tắt tài liệu

Tóm tắt các báo cáo dài và biên bản cuộc họp bằng cách sử dụng context window rộng 128k.

Phân tích hình ảnh & OCR

Trích xuất văn bản từ hình ảnh, phân tích biểu đồ và mô tả nội dung hình ảnh cho các mục đích hỗ trợ tiếp cận.

Xây dựng nguyên mẫu nhanh chóng

Nhanh chóng xây dựng và lặp lại các ứng dụng AI với mức chi phí API tối thiểu trước khi mở rộng sang các model lớn hơn.

Diem manh

Han che

Hiệu năng trên giá thành vô đối: Với mức giá $0,15/1M input tokens, nó giúp giảm 99% chi phí so với GPT-4 trong khi vẫn duy trì khả năng logic cao.
Độ sâu reasoning hạn chế: Không sở hữu khả năng chain-of-thought nâng cao như các model chuyên dụng như OpenAI o1.
Thời gian phản hồi latency thấp: Được thiết kế để tối ưu tốc độ, cung cấp các phản hồi gần như tức thời, cực kỳ quan trọng cho các tác nhân hội thoại thời gian thực.
Giới hạn output token: Giới hạn 16.384 output tokens thấp hơn so với một số model chuyên dụng có khả năng cung cấp đầy đủ 128k output.
Khả năng Vision multimodal gốc: Khác với các model nhỏ đời cũ, nó xử lý hình ảnh một cách tự nhiên với điểm số cao trên ChartQA (78.0).
Hạn chế trong lập trình phức tạp: Gặp khó khăn với thiết kế kiến trúc cấp cao và gỡ lỗi trong các kho mã nguồn lớn gồm nhiều tệp tin.
Tuân thủ chỉ dẫn mạnh mẽ: Đạt 76,5% trên IFEval, chứng minh khả năng vượt trội trong việc tuân thủ các quy tắc định dạng phức tạp.
Không có đầu vào âm thanh gốc: Không hỗ trợ xử lý âm thanh-sang-âm thanh trực tiếp thông qua endpoint API văn bản/vision tiêu chuẩn.

Bat dau nhanh API

openai/gpt-4o-mini

Xem tai lieu
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Analyze this data and return JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-4o mini

Xem cong dong nghi gi ve GPT-4o mini

GPT-4o mini về cơ bản là hồi chuông báo tử cho GPT-3.5. Nó nhanh hơn, rẻ hơn và thông minh hơn. Không còn lý do gì để sử dụng model cũ nữa.
rowqi
reddit
OpenAI thực sự đã thay đổi cuộc chơi với mức giá này. 15 cent cho một triệu tokens là điều điên rồ đối với mức độ logic này.
peterm1598
hackernews
Tôi đang thấy các phản hồi gần như tức thời cho chatbot của mình. Latency trên 4o-mini thực sự ấn tượng so với mức giá.
WesternCat5211
twitter
GPT-4o mini vừa ra mắt 4 ngày. Hiện đã xử lý hơn 200 tỷ tokens mỗi ngày!
Sam Altman
twitter
Hiệu suất vision cho một thứ rẻ như thế này mới là câu chuyện thực sự. Nó xử lý biểu đồ tốt hơn cả một số frontier model từ một năm trước.
VisionDev99
reddit
Nó tuân thủ chỉ dẫn hệ thống một cách hoàn hảo cho việc trích xuất JSON. Một sự nâng cấp lớn so với độ tin cậy của 3.5 Turbo.
LLM_Master
hackernews

Video ve GPT-4o mini

Xem huong dan, danh gia va thao luan ve GPT-4o mini

Kỷ nguyên của các model nhỏ đã đến

Nó có giá 15 cent cho mỗi triệu input tokens... mức giá rẻ đến kinh ngạc

GPT-4o mini rất, rất nhanh... tốc độ không thể tin nổi

Model này cơ bản là để thay thế GPT-3.5 Turbo và nó rẻ hơn 60%

Hãy nhìn cách nó tạo văn bản nhanh như thế nào, gần như là tức thời

GPT-4o mini miễn phí, nhanh và thực sự rất tốt

GPT-3.5 đã hoàn toàn biến mất... nó đưa bạn thẳng tới GPT-4o mini

Nhìn tốc độ đó kìa, nhanh hơn hẳn đúng không

Đây là một multimodal model, nghĩa là nó có thể nhìn thấy hình ảnh

Nó vượt qua GPT-3.5 Turbo và thậm chí cả GPT-4 trên một số benchmark

OpenAI về cơ bản đã tung ra một đối thủ có vẻ như đang đánh bại rất nhiều model hiện nay

Đây là model mà họ đã tối ưu hóa để có chi phí thấp nhất

Việc có thể output 16.000 tokens cùng một lúc thực sự là một điều rất hữu ích

Context window là 128k, điều này thật tuyệt vời cho các ứng dụng RAG

Các biện pháp an toàn trên model này đã được xây dựng ngay từ đầu

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GPT-4o mini

Meo chuyen gia giup ban tan dung toi da GPT-4o mini va dat ket qua tot hon.

Chỉ dẫn hệ thống trực tiếp

Cung cấp các prompt hệ thống ngắn gọn để điều hướng model hướng tới các định dạng đầu ra cụ thể như JSON hoặc Markdown.

Gom nhóm bối cảnh (Batching)

Tận dụng context window 128k bằng cách nhóm các tác vụ nhỏ liên quan vào một prompt duy nhất để giảm chi phí vận hành.

Gán nhãn Vision

Yêu cầu các thuộc tính hình ảnh cụ thể khi xử lý hình ảnh để cải thiện độ chính xác của việc trích xuất metadata.

Streaming cho trải nghiệm người dùng

Luôn bật tham số stream để cung cấp phản hồi token ngay lập tức cho người dùng cuối.

Điều chỉnh Temperature

Đặt temperature bằng 0 cho các tác vụ dữ liệu có cấu trúc để đảm bảo đầu ra có tính xác định và nhất quán.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

Cau hoi thuong gap ve GPT-4o mini

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-4o mini