openai

GPT-4o mini

GPT-4o mini — це найбільш економічна мала модель від OpenAI, що пропонує інтелект рівня GPT-4 з чудовою швидкістю та multimodal vision для масштабних завдань.

Мала модельЕкономічністьПідтримка visionШвидкий AIMultimodal
openai logoopenaiGPT-4o18 липня 2024 р.
Контекст
128Kтокенів
Макс. вивід
16Kтокенів
Ціна вводу
$0.15/ 1M
Ціна виводу
$0.60/ 1M
Модальність:TextImage
Можливості:ЗірІнструментиПотокова передача
Бенчмарки
GPQA
40.2%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. GPT-4o mini набрав 40.2% у цьому бенчмарку.
HLE
2.3%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. GPT-4o mini набрав 2.3% у цьому бенчмарку.
MMLU
82%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. GPT-4o mini набрав 82% у цьому бенчмарку.
MMLU Pro
57%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. GPT-4o mini набрав 57% у цьому бенчмарку.
SimpleQA
8.6%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. GPT-4o mini набрав 8.6% у цьому бенчмарку.
IFEval
76.5%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. GPT-4o mini набрав 76.5% у цьому бенчмарку.
AIME 2025
5%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. GPT-4o mini набрав 5% у цьому бенчмарку.
MATH
50.2%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. GPT-4o mini набрав 50.2% у цьому бенчмарку.
GSM8k
91.3%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. GPT-4o mini набрав 91.3% у цьому бенчмарку.
MGSM
87%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. GPT-4o mini набрав 87% у цьому бенчмарку.
MathVista
42%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. GPT-4o mini набрав 42% у цьому бенчмарку.
SWE-Bench
8.7%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. GPT-4o mini набрав 8.7% у цьому бенчмарку.
HumanEval
87.2%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. GPT-4o mini набрав 87.2% у цьому бенчмарку.
LiveCodeBench
32.5%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. GPT-4o mini набрав 32.5% у цьому бенчмарку.
MMMU
59.4%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. GPT-4o mini набрав 59.4% у цьому бенчмарку.
MMMU Pro
34%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. GPT-4o mini набрав 34% у цьому бенчмарку.
ChartQA
78%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. GPT-4o mini набрав 78% у цьому бенчмарку.
DocVQA
88%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. GPT-4o mini набрав 88% у цьому бенчмарку.
Terminal-Bench
40%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. GPT-4o mini набрав 40% у цьому бенчмарку.
ARC-AGI
8%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. GPT-4o mini набрав 8% у цьому бенчмарку.

Про GPT-4o mini

Дізнайтеся про можливості GPT-4o mini, функції та як це може допомогти вам досягти кращих результатів.

Новий стандарт для малих моделей

GPT-4o mini, це значний стрибок у продуктивності AI, розроблений як заміна GPT-3.5 Turbo для розробників. Завдяки нативній multimodal архітектурі модель забезпечує продуктивність рівня GPT-4 за частку вартості та latency. Вона має величезний 128 000 token context window і підтримує складні виводи до 16 384 tokens, що робить її ідеальною для обробки великих документів та потоків даних з високим обсягом.

Інтелект у поєднанні з доступністю

На відміну від попередніх малих моделей, які жертвували інтелектом заради швидкості, GPT-4o mini зберігає високі можливості reasoning у завданнях з текстом та vision. Вона на 60% дешевша за GPT-3.5 Turbo і значно спроможніша, отримуючи 82% на benchmark MMLU. Ця модель спеціально оптимізована для додатків, де низька latency та висока надійність є ключовими, як-от клієнтські асистенти в реальному часі та механізми класифікації даних у великих масштабах.

GPT-4o mini

Випадки використання для GPT-4o mini

Відкрийте різні способи використання GPT-4o mini для досягнення чудових результатів.

Автоматизація клієнтської підтримки

Обробка великих обсягів запитів від клієнтів з низькою latency та високою точністю за частку вартості.

Підсумовування контенту

Перетворення великих документів або довгого тексту на стислі резюме в межах 128k context window.

Вилучення даних

Перетворення неструктурованого тексту або зображень у структуровані формати даних, як-от JSON, для завантаження в бази даних.

Багатомовний переклад

Надання перекладу в реальному часі десятками мов для чат-додатків та глобальної комунікації.

Освітній тьюторинг

Виконання ролі інтерактивного помічника у навчанні для студентів, яким потрібна допомога з математикою, наукою та мовами.

Базові завдання vision

Аналіз зображень для ідентифікації об'єктів, вилучення тексту за допомогою OCR або надання описів для доступності.

Сильні сторони

Обмеження

Неймовірне співвідношення ціни та продуктивності: За $0.15 за мільйон input tokens модель пропонує frontier model рівень reasoning з результатом MMLU 82%.
Прогалини у складному reasoning: Поступається більшим моделям, таким як GPT-4o або o1, у наукових завданнях експертного рівня, набираючи 40.2% на GPQA.
Висока пропускна здатність: Модель надає відповіді з надзвичайно низькою latency, що робить її ідеальною для інтерфейсів користувача в реальному часі.
Обмеження у програмуванні: Бракує глибинного архітектурного розуміння для складної розробки програмного забезпечення порівняно з Claude 3.5 Sonnet.
Великий context window: Підтримує повний 128k context window, що дозволяє виконувати складну обробку документів, рідкісну для маленьких моделей.
Зменшений output window: Ліміт виводу 16k може бути обмежувальним для завдань, що потребують масштабної міграції коду або генерації великих текстів.
Нативна підтримка vision: Включає multimodal можливості у компактному розмірі, демонструючи високу ефективність у завданнях аналізу зображень та OCR.
Стабільність фактів: Маленькі моделі залишаються більш схильними до галюцинацій у нішевих доменах, ніж їхні flagship аналоги.

Швидкий старт API

openai/gpt-4o-mini

Переглянути документацію
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explain quantum physics." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про GPT-4o mini

Подивіться, що думає спільнота про GPT-4o mini

GPT-4o mini фактично вбив ринок fine-tuning для старих моделей для базового RAG. Витрати занадто низькі, щоб їх ігнорувати.
AI_Dev_Central
reddit
Швидкість просто шалена. Я отримую tokens назад майже миттєво для свого агента перекладу.
TechCruncher
twitter
OpenAI справді змусили Anthropic та Google змінити підхід ціноутворенням. $0.15 за 1M tokens, це новий мінімум.
hn_reader_99
hackernews
Я замінив 3.5 на mini, і покращення логіки було помітне вже в перші п'ять хвилин тестування.
PromptEngineerPro
youtube
Він нарешті достатньо дешевий, щоб використовувати LLM для базового очищення даних у масштабі без величезних рахунків за хмару.
DataVizWiz
reddit
Ефективність vision для OCR насправді краща, ніж у деяких спеціалізованих моделей, які коштують в 10 разів дорожче.
VisionDev
twitter

Відео про GPT-4o mini

Дивіться навчальні матеріали, огляди та обговорення про GPT-4o mini

Він швидший і дешевший за GPT-3.5 Turbo за всіма показниками.

Можливості vision для такої маленької моделі справді дивують.

Ціноутворення, це фактично перегони до нуля після цього релізу.

Їй вдається зберігати величезний context window при малому розмірі.

Benchmark показують, що він перевершує Claude Haiku майже в кожній категорії.

GPT-4o mini, це полегшена модель, тому вона набагато швидша за GPT-4o.

Він значно, значно швидший за GPT-4.

Для щоденних завдань більшість користувачів навіть не помітять різниці в reasoning.

Розпізнавання зображень дуже послідовне для базових об'єктів.

Він обробляє складні інструкції набагато краще за стару модель 3.5.

Наразі він випереджає gbd4 за чат-вподобаннями у таблиці лідерів LMC.

Все виглядає ідеально, і цей чек виглядає як звичайний чек.

Час відповіді практично менше секунди для коротких prompt.

Він дуже ефективний у підсумовуванні довгих PDF-файлів через API.

Можна обробити мільйони tokens лише за кілька доларів.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для GPT-4o mini

Експертні поради, які допоможуть вам отримати максимум від GPT-4o mini та досягти кращих результатів.

Використання для RAG

Використовуйте низьку вартість input для виконання масштабного Retrieval Augmented Generation без великих витрат.

Структурування через JSON Mode

Використовуйте JSON mode або параметри function calling для забезпечення узгоджених структур даних у бекенд-процесах.

Batch Processing

Використовуйте OpenAI Batch API з цією моделлю, щоб зменшити витрати на 50% для нетермінових завдань.

Налаштування Temperature

Встановлюйте нижчу температуру від 0.1 до 0.3 для завдань з вилучення фактичних даних, щоб максимізувати точність.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Часті запитання про GPT-4o mini

Знайдіть відповіді на поширені запитання про GPT-4o mini