openai

GPT-4o mini

GPT-4o mini کارآمدترین مدل کوچک OpenAI است که هوشمندی در سطح GPT-4 را با سرعتی برتر و قابلیت‌های دیداری multimodal برای وظایف با حجم بالا ارائه می‌دهد.

مدل کوچکمقرون‌به‌صرفهدارای قابلیت بیناییهوش مصنوعی سریعMultimodal
openai logoopenaiGPT-4o۱۸ ژوئیه ۲۰۲۴
پنجره زمینه
128Kتوکن
حداکثر خروجی
16Kتوکن
قیمت ورودی
$0.15/ 1M
قیمت خروجی
$0.60/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگ
معیارها
GPQA
40.2%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. GPT-4o mini امتیاز 40.2% در این معیار کسب کرد.
HLE
2.3%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. GPT-4o mini امتیاز 2.3% در این معیار کسب کرد.
MMLU
82%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. GPT-4o mini امتیاز 82% در این معیار کسب کرد.
MMLU Pro
57%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. GPT-4o mini امتیاز 57% در این معیار کسب کرد.
SimpleQA
8.6%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. GPT-4o mini امتیاز 8.6% در این معیار کسب کرد.
IFEval
76.5%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. GPT-4o mini امتیاز 76.5% در این معیار کسب کرد.
AIME 2025
5%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. GPT-4o mini امتیاز 5% در این معیار کسب کرد.
MATH
50.2%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. GPT-4o mini امتیاز 50.2% در این معیار کسب کرد.
GSM8k
91.3%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. GPT-4o mini امتیاز 91.3% در این معیار کسب کرد.
MGSM
87%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. GPT-4o mini امتیاز 87% در این معیار کسب کرد.
MathVista
42%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. GPT-4o mini امتیاز 42% در این معیار کسب کرد.
SWE-Bench
8.7%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. GPT-4o mini امتیاز 8.7% در این معیار کسب کرد.
HumanEval
87.2%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. GPT-4o mini امتیاز 87.2% در این معیار کسب کرد.
LiveCodeBench
32.5%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. GPT-4o mini امتیاز 32.5% در این معیار کسب کرد.
MMMU
59.4%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. GPT-4o mini امتیاز 59.4% در این معیار کسب کرد.
MMMU Pro
34%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. GPT-4o mini امتیاز 34% در این معیار کسب کرد.
ChartQA
78%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. GPT-4o mini امتیاز 78% در این معیار کسب کرد.
DocVQA
88%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. GPT-4o mini امتیاز 88% در این معیار کسب کرد.
Terminal-Bench
40%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. GPT-4o mini امتیاز 40% در این معیار کسب کرد.
ARC-AGI
8%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. GPT-4o mini امتیاز 8% در این معیار کسب کرد.

درباره GPT-4o mini

درباره قابلیت‌های GPT-4o mini، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

استاندارد جدید برای مدل‌های کوچک

GPT-4o mini نشان‌دهنده یک جهش بزرگ در کارایی هوش مصنوعی است که طراحی شده تا جایگزین GPT-3.5 Turbo به عنوان مدل اصلی برای توسعه‌دهندگان شود. این مدل با معماری native multimodal ساخته شده و عملکردی در سطح GPT-4 را با کسری از هزینه و latency ارائه می‌دهد. این مدل دارای ۱۲۸,۰۰۰ token context window عظیم است و از خروجی‌های پیچیده تا ۱۶,۳۸۴ token پشتیبانی می‌کند که آن را برای پردازش اسناد طولانی و جریان‌های داده با حجم بالا ایده‌آل می‌سازد.

هوشمندی همراه با مقرون‌به‌صرفه بودن

برخلاف مدل‌های کوچک قبلی که هوشمندی را فدای سرعت می‌کردند، GPT-4o mini قابلیت‌های استدلالی بالایی را در وظایف متنی و دیداری حفظ می‌کند. این مدل ۶۰٪ ارزان‌تر از GPT-3.5 Turbo است و عملکرد به مراتب قوی‌تری دارد، به‌طوری که امتیاز ۸۲٪ را در benchmark MMLU کسب کرده است. این مدل به‌طور خاص برای اپلیکیشن‌هایی که latency پایین و قابلیت اطمینان بالا در آن‌ها حیاتی است، مانند دستیارهای مشتری آنی و موتورهای طبقه‌بندی داده‌های در مقیاس بزرگ، بهینه‌سازی شده است.

GPT-4o mini

موارد استفاده برای GPT-4o mini

روش‌های مختلف استفاده از GPT-4o mini برای دستیابی به نتایج عالی را کشف کنید.

اتوماسیون پشتیبانی مشتری

مدیریت حجم بالای سوالات مشتریان با latency پایین و دقت بالا، با کسری از هزینه معمول.

خلاصه‌سازی محتوا

پردازش اسناد بزرگ یا محتوای طولانی و تبدیل آن‌ها به خلاصه‌های مختصر در محدوده ۱۲۸k context window.

استخراج داده‌ها

تبدیل متن‌ها یا تصاویر بدون ساختار به فرمت‌های داده‌ای ساختاریافته مانند JSON برای ذخیره‌سازی در دیتابیس.

ترجمه چندزبانه

ارائه ترجمه آنی برای ده‌ها زبان در اپلیکیشن‌های چت و ارتباطات جهانی.

آموزش و تدریس خصوصی

به عنوان یک دستیار مطالعاتی تعاملی برای دانش‌آموزانی که در دروس ریاضی، علوم و ادبیات نیاز به کمک دارند.

وظایف اولیه بینایی ماشین

تحلیل تصاویر برای شناسایی اشیاء، استخراج متن از طریق OCR یا ارائه توضیحات برای دسترس‌پذیری.

نقاط قوت

محدودیت‌ها

نسبت عملکرد به قیمت فوق‌العاده: با هزینه ۰.۱۵ دلار برای هر میلیون token ورودی، این مدل استدلال در سطح frontier model را با امتیاز ۸۲٪ در MMLU ارائه می‌دهد.
شکاف در استدلال‌های پیچیده: در سطح علمی تخصصی نسبت به مدل‌های بزرگتر مانند GPT-4o یا o1 عقب‌تر است و امتیاز ۴۰.۲٪ را در GPQA کسب کرده است.
سرعت پردازش (Throughput) بالا: این مدل پاسخ‌ها را با latency بسیار پایین ارائه می‌دهد که آن را برای رابط‌های کاربری آنی ایده‌آل می‌کند.
محدودیت‌های برنامه‌نویسی: فاقد درک عمیق معماری برای مهندسی نرم‌افزار پیچیده در مقایسه با Claude 3.5 Sonnet است.
Context Window بزرگ: حفظ یک context window کامل ۱۲۸k که امکان پردازش اسناد پیچیده را فراهم می‌کند؛ قابلیتی که به ندرت در مدل‌های کوچک دیده می‌شود.
محدودیت پنجره خروجی: محدودیت ۱۶k در خروجی می‌تواند برای وظایفی که نیاز به انتقال عظیم کد یا تولید محتوا در حد کتاب دارند، محدودکننده باشد.
پشتیبانی بومی از Vision: شامل قابلیت‌های multimodal در قالبی کوچک، که در تحلیل تصویر و وظایف OCR بسیار عالی عمل می‌کند.
ثبات در دقت حقایق: مدل‌های کوچکتر در دامنه‌های خاص، همچنان نسبت به مدل‌های flagship بیشتر مستعد توهم (hallucinations) هستند.

شروع سریع API

openai/gpt-4o-mini

مشاهده مستندات
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explain quantum physics." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره GPT-4o mini چه می‌گویند

ببینید جامعه درباره GPT-4o mini چه فکر می‌کند

مدل GPT-4o mini عملاً بازار fine-tuning مدل‌های قدیمی برای RAG ساده را از بین برده است. هزینه‌ها آنقدر پایین است که نمی‌توان نادیده‌اش گرفت.
AI_Dev_Central
reddit
سرعت آن دیوانه‌وار است. برای ایجنت ترجمه‌ام، tokenها را تقریباً آنی دریافت می‌کنم.
TechCruncher
twitter
OpenAI با این قیمت‌گذاری واقعاً دست Anthropic و Google را بسته است. ۰.۱۵ دلار برای ۱ میلیون token یک کف جدید برای بازار است.
hn_reader_99
hackernews
من 3.5 را با mini جایگزین کردم و بهبود منطق در همان پنج دقیقه اول تست کاملاً قابل مشاهده بود.
PromptEngineerPro
youtube
بالاخره آنقدر ارزان شده که می‌توان بدون قبض سنگین ابری، از LLMها برای پاکسازی داده‌های حجیم در مقیاس بالا استفاده کرد.
DataVizWiz
reddit
عملکرد بینایی برای OCR در واقع از برخی مدل‌های تخصصی که ۱۰ برابر گران‌تر هستند، بهتر است.
VisionDev
twitter

ویدیوهای درباره GPT-4o mini

آموزش‌ها، بررسی‌ها و بحث‌های درباره GPT-4o mini را تماشا کنید

این مدل در تمام موارد سریع‌تر و ارزان‌تر از GPT-3.5 Turbo است.

قابلیت‌های دیداری برای مدلی با این اندازه حقیقتاً شگفت‌انگیز است.

قیمت‌گذاری با این انتشار، عملاً به یک رقابت برای رسیدن به صفر تبدیل شده است.

این مدل موفق شده در عین کوچک بودن، context window عظیم خود را حفظ کند.

نتایج benchmark نشان می‌دهد که در تقریباً تمام دسته‌ها از Claude Haiku پیشی گرفته است.

مدل GPT 4o mini یک مدل سبک‌وزن است، بنابراین بسیار سریع‌تر از GPT 4o عمل می‌کند.

این مدل خیلی خیلی سریع‌تر از GPT 4 است.

برای کارهای روزمره، اکثر کاربران حتی متوجه تفاوت در قدرت استدلال نخواهند شد.

تشخیص تصویر برای اشیاء پایه بسیار دقیق است.

این مدل دستورالعمل‌های پیچیده را بسیار بهتر از مدل قدیمی 3.5 مدیریت می‌کند.

این مدل در حال حاضر در ترجیحات چت در leaderboard مدل‌های زبانی، از GPT-4 پیشی گرفته است.

همه چیز عالی به نظر می‌رسد و این رسید خاص، شبیه به یک رسید معمولی است.

زمان پاسخ‌دهی برای promptهای کوتاه عملاً زیر یک ثانیه است.

این مدل در خلاصه‌سازی فایل‌های PDF طولانی از طریق API بسیار موثر است.

شما می‌توانید میلیون‌ها token را تنها با چند دلار پردازش کنید.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای GPT-4o mini

نکات تخصصی برای کمک به شما در استفاده حداکثری از GPT-4o mini و دستیابی به نتایج بهتر.

استفاده برای RAG

از هزینه ورودی پایین برای اجرای گسترده Retrieval Augmented Generation بدون تحمیل هزینه‌های بالا استفاده کنید.

ساختاردهی با حالت JSON

از پارامترهای حالت JSON یا function calling استفاده کنید تا از ساختارهای داده‌ای ثابت برای گردش‌کارهای backend اطمینان حاصل کنید.

پردازش دسته‌ای (Batch Processing)

برای وظایف غیرفوری، از Batch API شرکت OpenAI همراه با این مدل استفاده کنید تا هزینه‌ها را تا ۵۰٪ کاهش دهید.

تنظیم Temperature

برای وظایف استخراج حقایق، درجه Temperature را بین ۰.۱ و ۰.۳ تنظیم کنید تا دقت به حداکثر برسد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

سوالات متداول درباره GPT-4o mini

پاسخ سوالات رایج درباره GPT-4o mini را بیابید