Chi phí của GPT-4o mini là bao nhiêu?

GPT-4o mini có giá 0,15 USD cho mỗi triệu input tokens và 0,60 USD cho mỗi triệu output tokens. Mức giá này giúp nó rẻ hơn 60% so với model GPT-3.5 Turbo cũ.

Context window của GPT-4o mini là bao nhiêu?

Nó có context window lên tới 128.000 tokens. Dung lượng này cho phép model xử lý khoảng 300 trang văn bản trong một prompt duy nhất.

GPT-4o mini có thể xử lý hình ảnh không?

Có, GPT-4o mini có khả năng vision nguyên bản. Nó có thể phân tích hình ảnh, thực hiện OCR và hiểu ngữ cảnh hình ảnh cùng với các input văn bản.

Nó so sánh thế nào với GPT-3.5 Turbo?

Nó nhanh hơn, rẻ hơn và thông minh hơn so với GPT-3.5 Turbo. Model đạt 82,0% trên các benchmark MMLU so với mức xấp xỉ 70% của phiên bản tiền nhiệm.

GPT-4o mini có hỗ trợ function calling không?

Có, nó hỗ trợ tool use và function calling một cách tự nhiên. Điều này cho phép model tương tác với các API bên ngoài và các hệ thống dữ liệu có cấu trúc.

Giới hạn output tối đa là bao nhiêu?

Model có thể tạo ra tối đa 16.384 tokens trong một phản hồi duy nhất. Điều này là đủ cho hầu hết các yêu cầu tạo nội dung dạng dài.

GPT-4o mini có sẵn qua API không?

Có, nó khả dụng trong OpenAI API với model ID gpt-4o-mini. Nó hỗ trợ các chế độ chat completions, assistants và batch processing.

GPT-4o mini

GPT-4o mini là model nhỏ hiệu quả nhất về chi phí của OpenAI, mang lại trí tuệ cấp GPT-4 với tốc độ vượt trội và khả năng vision multimodal cho các tác vụ khối...

Small ModelChi phí hiệu quảCó khả năng VisionAI nhanhMultimodal

openaiGPT-4o18 tháng 7, 2024

Ngu canh

128Ktoken

Dau ra toi da

16Ktoken

Gia dau vao

$0.15/ 1M

Gia dau ra

$0.60/ 1M

Phuong thuc:TextImage

Kha nang:Thi giacCong cuTruyen truc tiep

Diem chuan

GPQA

40.2%

HLE

2.3%

MMLU

82%

MMLU Pro

57%

SimpleQA

8.6%

IFEval

76.5%

AIME 2025

MATH

50.2%

GSM8k

91.3%

MGSM

87%

MathVista

42%

SWE-Bench

8.7%

HumanEval

87.2%

LiveCodeBench

32.5%

MMMU

59.4%

MMMU Pro

34%

ChartQA

78%

DocVQA

88%

Terminal-Bench

40%

ARC-AGI

Xem tai lieu API

Ve GPT-4o mini

Tim hieu ve kha nang cua GPT-4o mini, tinh nang va cach no co the giup ban dat ket qua tot hon.

Tiêu chuẩn mới cho các model nhỏ

GPT-4o mini đại diện cho một bước nhảy vọt trong hiệu quả AI, được thiết kế để thay thế GPT-3.5 Turbo trở thành model ưu tiên cho các lập trình viên. Được xây dựng với kiến trúc multimodal nguyên bản, nó mang lại hiệu suất cấp GPT-4 với chi phí và độ latency thấp hơn. Nó có context window 128.000 tokens khổng lồ và hỗ trợ các output phức tạp lên đến 16.384 tokens, giúp nó lý tưởng cho việc xử lý tài liệu dài và luồng dữ liệu khối lượng lớn.

Trí tuệ gặp gỡ sự hợp lý về chi phí

Không giống như các model nhỏ trước đây đã hy sinh trí tuệ để đổi lấy tốc độ, GPT-4o mini duy trì khả năng reasoning cao trong các tác vụ văn bản và hình ảnh. Nó rẻ hơn 60% so với GPT-3.5 Turbo và có khả năng hơn đáng kể, đạt 82% trên benchmark MMLU. Model này được tối ưu hóa đặc biệt cho các ứng dụng mà độ latency thấp và độ tin cậy cao là quan trọng hàng đầu, chẳng hạn như trợ lý khách hàng thời gian thực và các công cụ phân loại dữ liệu quy mô lớn.

Truong hop su dung cho GPT-4o mini

Kham pha cac cach khac nhau ban co the su dung GPT-4o mini de dat ket qua tuyet voi.

Tự động hóa hỗ trợ khách hàng

Xử lý khối lượng lớn các yêu cầu của khách hàng với độ latency thấp và độ chính xác cao với chi phí tối ưu.

Tóm tắt nội dung

Xử lý các tài liệu lớn hoặc nội dung dài thành các bản tóm tắt súc tích trong phạm vi context window 128k.

Trích xuất dữ liệu

Chuyển đổi văn bản hoặc hình ảnh không cấu trúc thành các định dạng dữ liệu cấu trúc như JSON để đưa vào cơ sở dữ liệu.

Dịch thuật đa ngôn ngữ

Cung cấp bản dịch thời gian thực cho hàng chục ngôn ngữ cho các ứng dụng chat và giao tiếp toàn cầu.

Gia sư giáo dục

Đóng vai trò là trợ lý học tập tương tác cho học sinh cần hỗ trợ về toán, khoa học và ngôn ngữ.

Các tác vụ Vision cơ bản

Phân tích hình ảnh để nhận diện đối tượng, trích xuất văn bản qua OCR hoặc cung cấp mô tả cho khả năng truy cập.

Diem manh

Han che

Hiệu suất trên chi phí đáng kinh ngạc: Với mức giá 0,15 USD cho mỗi triệu input tokens, nó mang lại khả năng reasoning cấp độ frontier với điểm MMLU 82%.

Khoảng cách về reasoning phức tạp: Thấp hơn các model lớn như GPT-4o hoặc o1 trong khoa học cấp độ chuyên gia, đạt 40,2% trên GPQA.

Tốc độ throughput cao: Model cung cấp phản hồi với độ latency cực thấp, lý tưởng cho các giao diện người dùng thời gian thực.

Hạn chế về lập trình: Thiếu sự hiểu biết sâu về kiến trúc cho kỹ thuật phần mềm phức tạp so với Claude 3.5 Sonnet.

Context window lớn: Duy trì context window đầy đủ 128k, cho phép xử lý tài liệu phức tạp vốn hiếm thấy ở các model nhỏ.

Output window giảm: Giới hạn output 16k có thể gây hạn chế cho các tác vụ yêu cầu di chuyển code lớn hoặc tạo sách dài.

Hỗ trợ Vision nguyên bản: Bao gồm các khả năng multimodal trong một kích thước nhỏ, vượt trội trong các tác vụ phân tích hình ảnh và OCR.

Tính ổn định của sự thật: Các model nhỏ hơn vẫn dễ bị ảo giác (hallucination) trong các lĩnh vực chuyên biệt hơn so với các phiên bản flagship.

Bat dau nhanh API

openai/gpt-4o-mini

Xem tai lieu

openai SDK

import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explain quantum physics." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-4o mini

Xem cong dong nghi gi ve GPT-4o mini

“GPT-4o mini về cơ bản đã giết chết thị trường fine-tuning các model cũ hơn cho RAG cơ bản. Chi phí quá thấp để có thể bỏ qua.”

— AI_Dev_Central

“Tốc độ thật điên rồ. Tôi nhận lại tokens gần như ngay lập tức cho agent dịch thuật của mình.”

— TechCruncher

twitter

“OpenAI thực sự đã ép Anthropic và Google phải hành động với mức giá này. 0,15 USD cho 1M tokens là một mức đáy mới.”

— hn_reader_99

hackernews

“Tôi đã thay 3.5 bằng mini và sự cải thiện về logic có thể thấy rõ ngay trong 5 phút thử nghiệm đầu tiên.”

— PromptEngineerPro

youtube

“Cuối cùng thì nó cũng đủ rẻ để sử dụng LLMs cho việc làm sạch dữ liệu cơ bản ở quy mô lớn mà không bị hóa đơn đám mây khổng lồ.”

— DataVizWiz

“Hiệu suất vision cho OCR thực sự tốt hơn một số model chuyên dụng có giá đắt gấp 10 lần.”

— VisionDev

twitter

Video ve GPT-4o mini

Xem huong dan, danh gia va thao luan ve GPT-4o mini

“Nó nhanh và rẻ hơn GPT-3.5 Turbo trên mọi phương diện.”

“Khả năng vision cho một model nhỏ như thế này thực sự đáng kinh ngạc.”

“Giá cả về cơ bản là một cuộc đua xuống mức 0 với bản phát hành này.”

“Nó xoay sở để giữ context window khổng lồ trong khi bản thân lại rất nhỏ gọn.”

“Các benchmark cho thấy nó đánh bại Claude Haiku trong hầu hết mọi danh mục.”

“GPT 4o mini là một model nhẹ nên nó nhanh hơn nhiều so với GPT 4o.”

“Nó nhanh hơn rất nhiều so với GPT 4.”

“Đối với các tác vụ hàng ngày, hầu hết người dùng sẽ không nhận ra sự khác biệt về reasoning.”

“Khả năng nhận dạng hình ảnh rất nhất quán đối với các đối tượng cơ bản.”

“Nó xử lý các hướng dẫn phức tạp tốt hơn nhiều so với model 3.5 cũ.”

“Hiện tại nó vượt trội hơn gbd4 của họ về sở thích chat trên leaderboard LMC.”

“Mọi thứ trông hoàn hảo và bạn biết đấy, hóa đơn này trông giống như một hóa đơn thông thường.”

“Thời gian phản hồi gần như dưới một giây cho các prompt ngắn.”

“Nó rất hiệu quả trong việc tóm tắt các tệp PDF dài thông qua API.”

“Bạn có thể chạy hàng triệu tokens chỉ với vài đô la.”

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent

Tu dong hoa web

Quy trinh thong minh

Bat dau mien phi

Meo chuyen nghiep cho GPT-4o mini

Meo chuyen gia giup ban tan dung toi da GPT-4o mini va dat ket qua tot hon.

Sử dụng cho RAG

Tận dụng chi phí input thấp để thực hiện Retrieval Augmented Generation quy mô lớn mà không tốn kém.

Cấu trúc với JSON Mode

Sử dụng JSON mode hoặc các tham số function calling để đảm bảo cấu trúc dữ liệu nhất quán cho các luồng công việc backend.

Batch Processing

Sử dụng Batch API của OpenAI với model này để giảm 50% chi phí cho các tác vụ không khẩn cấp.

Điều chỉnh Temperature

Đặt temperature thấp từ 0,1 đến 0,3 cho các tác vụ trích xuất dữ liệu thực tế để tối đa hóa độ chính xác.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context

$0.12/$0.75/1M

Gemini 3.6 Flash Lite

Google

Gemini 3.6 Flash Lite is a high-efficiency model from Google featuring a 1M token context window and 350 tokens/sec throughput for agentic workflows.

1M context

$0.30/$2.50/1M

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context

$0.60/$2.20/1M

Gemini 3.6 Flash

Google

Gemini 3.6 Flash is Google's high-speed model featuring a 17% reduction in token consumption, $1.50/M input pricing, and advanced 3D visualization.

1M context

$1.50/$7.50/1M

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context

$0.15/$1.20/1M

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context

$1.00/$3.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GLM-5.2

Zhipu (GLM)

GLM-5.2 is Zhipu AI's flagship open-weight model featuring a 1M context window and specialized agentic coding capabilities under an MIT license.

1M context

$1.40/$4.40/1M

Cau hoi thuong gap ve GPT-4o mini

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-4o mini