openai

GPT-4o mini

GPT-4o mini — самая экономичная малая model от OpenAI, предлагающая интеллект класса GPT-4 с превосходной скоростью и multimodal vision для ресурсоемких задач.

Малая modelЭкономичныйС поддержкой visionБыстрый AIMultimodal
openai logoopenaiGPT-4July 18, 2024
Контекст
128Kтокенов
Макс. вывод
16Kтокенов
Цена ввода
$0.15/ 1M
Цена вывода
$0.60/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передача
Бенчмарки
GPQA
40.2%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-4o mini набрал 40.2% в этом бенчмарке.
HLE
2.3%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-4o mini набрал 2.3% в этом бенчмарке.
MMLU
82%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-4o mini набрал 82% в этом бенчмарке.
MMLU Pro
57%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-4o mini набрал 57% в этом бенчмарке.
SimpleQA
8.6%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-4o mini набрал 8.6% в этом бенчмарке.
IFEval
76.5%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-4o mini набрал 76.5% в этом бенчмарке.
AIME 2025
5%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-4o mini набрал 5% в этом бенчмарке.
MATH
50.2%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-4o mini набрал 50.2% в этом бенчмарке.
GSM8k
91.3%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-4o mini набрал 91.3% в этом бенчмарке.
MGSM
87%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-4o mini набрал 87% в этом бенчмарке.
MathVista
42%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-4o mini набрал 42% в этом бенчмарке.
SWE-Bench
8.7%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-4o mini набрал 8.7% в этом бенчмарке.
HumanEval
87.2%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-4o mini набрал 87.2% в этом бенчмарке.
LiveCodeBench
32.5%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-4o mini набрал 32.5% в этом бенчмарке.
MMMU
59.4%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-4o mini набрал 59.4% в этом бенчмарке.
MMMU Pro
34%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-4o mini набрал 34% в этом бенчмарке.
ChartQA
78%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-4o mini набрал 78% в этом бенчмарке.
DocVQA
88%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-4o mini набрал 88% в этом бенчмарке.
Terminal-Bench
40%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-4o mini набрал 40% в этом бенчмарке.
ARC-AGI
8%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-4o mini набрал 8% в этом бенчмарке.

О модели GPT-4o mini

Узнайте о возможностях, функциях и способах использования GPT-4o mini.

Новый стандарт для малых models

GPT-4o mini представляет собой значительный скачок в эффективности AI, разработанный для замены GPT-3.5 Turbo в качестве основного инструмента для разработчиков. Построенная на нативной multimodal архитектуре, она обеспечивает производительность класса GPT-4 при значительно меньших затратах и latency. Она обладает огромным context window в 128,000 tokens и поддерживает сложные ответы объемом до 16,384 tokens, что делает её идеальной для обработки длинных документов и больших потоков данных.

Интеллект в сочетании с доступностью

В отличие от предыдущих малых models, которые жертвовали интеллектом ради скорости, GPT-4o mini сохраняет высокие возможности reasoning в задачах с текстом и vision. Она на 60% дешевле, чем GPT-3.5 Turbo, и значительно функциональнее, набирая 82% в benchmark MMLU. Эта model специально оптимизирована для приложений, где критически важны низкая latency и высокая надежность, таких как клиентские ассистенты в реальном времени и системы крупномасштабной классификации данных.

GPT-4o mini

Варианты использования GPT-4o mini

Откройте для себя различные способы использования GPT-4o mini для достижения отличных результатов.

Автоматизация клиентской поддержки

Развертывание чат-ботов с низкой latency и высокой эффективностью затрат, способных обрабатывать тысячи рутинных запросов с высокой точностью.

Извлечение структурированных данных

Преобразование больших объемов неструктурированного текста или изображений в чистые, форматированные JSON-схемы для баз данных.

Перевод в реальном времени

Обеспечение почти мгновенного перевода в мессенджерах на десятки языков при минимальных операционных затратах.

Саммаризация документов

Создание кратких резюме длинных отчетов и транскриптов встреч, используя обширное context window в 128k.

Визуальный анализ и OCR

Извлечение текста из изображений, анализ графиков и описание визуального контента для целей доступности.

Быстрое прототипирование

Быстрое создание и итерация AI-приложений с минимальными затратами на API перед переходом на более крупные models.

Преимущества

Ограничения

Непревзойденное соотношение цены и производительности: При цене $0.15 за 1M input tokens, он предлагает снижение стоимости на 99% по сравнению с GPT-4, сохраняя высокий уровень логики.
Ограниченная глубина reasoning: Не обладает продвинутыми возможностями chain-of-thought, которые есть в таких models, как OpenAI o1.
Низкая latency ответов: Разработан для скорости, обеспечивая почти мгновенные ответы, что критично для диалоговых agents в реальном времени.
Ограничение output tokens: Лимит в 16,384 output tokens ниже, чем у специализированных models, предлагающих полный паритет с 128k на выходе.
Нативная multimodal vision: В отличие от прежних малых models, он обрабатывает изображения нативно, показывая высокие результаты в ChartQA (78.0).
Пробелы в сложном кодинге: Испытывает трудности с высокоуровневым архитектурным проектированием и отладкой крупных многофайловых репозиториев.
Четкое следование инструкциям: Показывает результат 76.5% в IFEval, демонстрируя превосходную способность соблюдать сложные правила форматирования.
Отсутствие нативного аудио-input: Не поддерживает прямую обработку аудио в аудио через стандартный endpoint API для текста/vision.

Быстрый старт API

openai/gpt-4o-mini

Посмотреть документацию
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Analyze this data and return JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-4o mini

Посмотрите, что думает сообщество о GPT-4o mini

GPT-4o mini — это, по сути, смертный приговор для GPT-3.5. Она быстрее, дешевле и умнее. Больше нет причин использовать старую model.
rowqi
reddit
OpenAI реально изменила правила игры своим ценообразованием. 15 центов за миллион tokens — это безумие для такого уровня логики.
peterm1598
hackernews
Я вижу почти мгновенные ответы в моем чат-боте. Latency у 4o-mini впечатляет для такой цены.
WesternCat5211
twitter
GPT-4o mini запущена 4 дня назад и уже обрабатывает более 200 миллиардов tokens в день!
Sam Altman
twitter
Производительность vision за такие деньги — вот настоящая сенсация. Она справляется с графиками лучше, чем флагманские models год назад.
VisionDev99
reddit
Она идеально следует системным инструкциям для извлечения JSON. Огромный скачок в надежности по сравнению с 3.5 Turbo.
LLM_Master
hackernews

Видео о GPT-4o mini

Смотрите обучающие материалы, обзоры и обсуждения о GPT-4o mini

Эра малых models настала

Цена составляет 15 центов за миллион input tokens... это безумно дешево

GPT-4o mini очень, очень быстрая... невероятно быстрая

Эта model практически заменяет GPT-3.5 Turbo, при этом она на 60% дешевле

Посмотрите, как быстро генерируется текст, это почти мгновенно

GPT-4o mini — бесплатная, быстрая и действительно качественная

GPT-3.5 полностью ушла в прошлое... теперь всё сводится к GPT-4o mini

Посмотрите на скорость, это намного быстрее

Это multimodal model, что означает, что она может видеть изображения

Она превосходит GPT-3.5 Turbo и даже GPT-4 в некоторых benchmarks

OpenAI выпустила конкурента, который, похоже, побеждает многие из этих models

Это model, которую они оптимизировали для минимальной стоимости использования

Возможность выдавать 16,000 output tokens за раз — это действительно полезная вещь

Context window составляет 128k, что отлично подходит для RAG приложений

Меры безопасности в этой model встроены с самого начала

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-4o mini

Экспертные советы для максимальной эффективности GPT-4o mini.

Прямые системные инструкции

Используйте краткие системные prompt, чтобы направить model к конкретным форматам вывода, таким как JSON или Markdown.

Группировка контекста

Используйте context window в 128k, объединяя связанные небольшие задачи в один prompt, чтобы снизить накладные расходы.

Маркировка vision

Запрашивайте конкретные визуальные атрибуты при обработке изображений для повышения точности извлечения метаданных.

Streaming для UX

Всегда включайте параметр stream, чтобы обеспечить мгновенное отображение tokens для конечных пользователей.

Настройка temperature

Установите temperature на 0 для задач со структурированными данными, чтобы обеспечить детерминированные и стабильные результаты.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

Часто задаваемые вопросы о GPT-4o mini

Найдите ответы на частые вопросы о GPT-4o mini