openai

GPT-4o mini

GPT-4o mini je OpenAI-jev cenovno najefikasniji mali model, koji nudi inteligenciju GPT-4 klase uz vrhunsku brzinu i multimodalni vision za zadatke velikog...

Mali modelCenovno efikasanVision-kapabilanBrzi AIMultimodal
openai logoopenaiGPT-4o18. jul 2024.
Контекст
128Kтокена
Макс. излаз
16Kтокена
Улазна цена
$0.15/ 1M
Излазна цена
$0.60/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтриминг
Бенчмаркови
GPQA
40.2%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GPT-4o mini је постигао 40.2% на овом бенчмарку.
HLE
2.3%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GPT-4o mini је постигао 2.3% на овом бенчмарку.
MMLU
82%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GPT-4o mini је постигао 82% на овом бенчмарку.
MMLU Pro
57%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GPT-4o mini је постигао 57% на овом бенчмарку.
SimpleQA
8.6%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GPT-4o mini је постигао 8.6% на овом бенчмарку.
IFEval
76.5%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GPT-4o mini је постигао 76.5% на овом бенчмарку.
AIME 2025
5%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GPT-4o mini је постигао 5% на овом бенчмарку.
MATH
50.2%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GPT-4o mini је постигао 50.2% на овом бенчмарку.
GSM8k
91.3%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GPT-4o mini је постигао 91.3% на овом бенчмарку.
MGSM
87%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GPT-4o mini је постигао 87% на овом бенчмарку.
MathVista
42%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GPT-4o mini је постигао 42% на овом бенчмарку.
SWE-Bench
8.7%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GPT-4o mini је постигао 8.7% на овом бенчмарку.
HumanEval
87.2%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GPT-4o mini је постигао 87.2% на овом бенчмарку.
LiveCodeBench
32.5%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GPT-4o mini је постигао 32.5% на овом бенчмарку.
MMMU
59.4%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GPT-4o mini је постигао 59.4% на овом бенчмарку.
MMMU Pro
34%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GPT-4o mini је постигао 34% на овом бенчмарку.
ChartQA
78%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GPT-4o mini је постигао 78% на овом бенчмарку.
DocVQA
88%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GPT-4o mini је постигао 88% на овом бенчмарку.
Terminal-Bench
40%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GPT-4o mini је постигао 40% на овом бенчмарку.
ARC-AGI
8%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GPT-4o mini је постигао 8% на овом бенчмарку.

О моделу GPT-4o mini

Сазнајте о могућностима, функцијама и начинима коришћења модела GPT-4o mini.

Novi standard za male modele

GPT-4o mini predstavlja značajan iskorak u AI efikasnosti, dizajniran da zameni GPT-3.5 Turbo kao primarni model za developere. Izgrađen na nativnoj multimodalnoj arhitekturi, pruža performanse GPT-4 klase uz delić troškova i latency-ja. Poseduje masivan 128.000 token context window i podržava kompleksne izlaze do 16.384 tokens, što ga čini idealnim za obradu dugačkih dokumenata i tokove podataka velikog obima.

Inteligencija koja je pristupačna

Za razliku od prethodnih malih modela koji su žrtvovali inteligenciju zarad brzine, GPT-4o mini održava visoke reasoning sposobnosti kroz tekstualne i vizuelne zadatke. 60% je jeftiniji od GPT-3.5 Turbo i značajno sposobniji, sa 82% rezultatom na MMLU benchmark-u. Ovaj model je posebno optimizovan za aplikacije gde su niska latency i visoka pouzdanost od suštinskog značaja, kao što su asistenti za korisničku podršku u realnom vremenu i mašine za klasifikaciju podataka velikog obima.

GPT-4o mini

Случајеви употребе за GPT-4o mini

Откријте различите начине коришћења модела GPT-4o mini за постизање одличних резултата.

Automatizacija korisničke podrške

Upravljanje velikim brojem upita korisnika uz nisku latency i visoku tačnost po deliću cene.

Sumiranje sadržaja

Obrada obimnih dokumenata ili dugačkih formata u sažete rezimee unutar 128k context window-a.

Ekstrakcija podataka

Pretvaranje nestrukturiranog teksta ili slika u strukturirane formate podataka poput JSON-a za učitavanje u baze.

Višejezički prevod

Pružanje prevoda u realnom vremenu na desetine jezika za chat aplikacije i globalnu komunikaciju.

Obrazovno mentorstvo

Služi kao interaktivni asistent za učenje za studente kojima je potrebna pomoć iz matematike, nauke i jezika.

Osnovni vizuelni zadaci

Analiza slika radi identifikacije objekata, ekstrakcije teksta putem OCR-a ili pružanja opisa radi pristupačnosti.

Предности

Ограничења

Neverovatan odnos cene i performansi: Po ceni od 0,15 USD po milion ulaznih tokens, nudi frontier model nivo reasoning-a sa 82% MMLU rezultatom.
Praznine u kompleksnom reasoning-u: Zaostaje za većim modelima poput GPT-4o ili o1 u naučnim oblastima na ekspertskom nivou, sa 40,2% rezultatom na GPQA.
Visoka propusna moć (throughput): Model isporučuje odgovore sa izuzetno niskom latency, što ga čini idealnim za korisničke interfejse u realnom vremenu.
Ograničenja u kodiranju: Nedostaje mu duboko arhitektonsko razumevanje potrebno za kompleksno softversko inženjerstvo u poređenju sa Claude 3.5 Sonnet.
Veliki context window: Održava pun 128k context window, omogućavajući obradu kompleksnih dokumenata koja se retko viđa kod malih modela.
Smanjen izlazni prozor: Ograničenje izlaza od 16k može biti restriktivno za zadatke koji zahtevaju masivne migracije koda ili generisanje sadržaja obima knjige.
Nativna podrška za vision: Uključuje multimodalne mogućnosti u malom formatu, sa izuzetnim performansama u analizi slika i OCR zadacima.
Stabilnost faktografije: Manji modeli ostaju skloniji halucinacijama u nišnim domenima u poređenju sa njihovim flagship pandanima.

АПИ брзи старт

openai/gpt-4o-mini

Погледај документацију
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Objasni kvantnu fiziku." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GPT-4o mini

Погледајте шта заједница мисли о моделу GPT-4o mini

GPT-4o mini je praktično ubio tržište za fine-tuning starijih modela za osnovni RAG. Troškovi su suviše niski da bi se ignorisali.
AI_Dev_Central
reddit
Brzina je jednostavno ludilo. Dobijam tokens nazad skoro trenutno za mog prevodilačkog agenta.
TechCruncher
twitter
OpenAI je zaista primorao Anthropic i Google na reakciju ovim cenama. 0,15 USD za 1M tokens je novi minimum.
hn_reader_99
hackernews
Zamenio sam 3.5 sa mini verzijom i poboljšanje logike je bilo vidljivo u prvih pet minuta testiranja.
PromptEngineerPro
youtube
Konačno je dovoljno jeftino da se koriste LLM za osnovno čišćenje podataka u velikom obimu bez ogromnih računa za cloud.
DataVizWiz
reddit
Vision performanse za OCR su zapravo bolje od nekih specijalizovanih modela koji koštaju 10x više.
VisionDev
twitter

Видео снимци о моделу GPT-4o mini

Гледајте туторијале, рецензије и дискусије о моделу GPT-4o mini

Brži je i jeftiniji od GPT-3.5 Turbo u svakom pogledu.

Vision mogućnosti za ovako mali model su zaista iznenađujuće.

Cene su sada praktično trka ka nuli sa ovim izdanjem.

Uspeva da održi masivan context window dok ostaje malen.

Benchmark-ovi pokazuju da pobeđuje Claude Haiku u skoro svakoj kategoriji.

GPT 40 mini je lagan model, pa je mnogo brži od GPT 40.

Daleko je brži od GPT 4.

Za svakodnevne zadatke, većina korisnika neće ni primetiti razliku u reasoning-u.

Prepoznavanje slika je veoma konzistentno za osnovne objekte.

Daleko bolje barata kompleksnim instrukcijama nego stari 3.5 model.

Trenutno nadmašuje njihov gbd4 po preferencijama u chat-u na LMC leaderboard-u.

Sve izgleda savršeno, a ovaj konkretan račun izgleda kao tipičan račun.

Vreme odziva je praktično kraće od sekunde za kratke prompt-ove.

Veoma je efikasan za sumiranje dugih PDF-ova putem API-ja.

Možete pokrenuti milione tokens za samo nekoliko dolara.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za GPT-4o mini

Stručni saveti za maksimalno iskorišćenje GPT-4o mini.

Koristite za RAG

Iskoristite nisku cenu ulaznih podataka za obavljanje ekstenzivnog Retrieval Augmented Generation bez visokih troškova.

Strukturirajte pomoću JSON Mode

Koristite JSON mode ili parametre za function calling kako biste osigurali konzistentne strukture podataka za backend radne tokove.

Batch Processing

Koristite OpenAI Batch API sa ovim modelom da smanjite troškove za 50% kod zadataka koji nisu hitni.

Podešavanje temperature

Postavite nižu temperature između 0,1 i 0,3 za zadatke faktografske ekstrakcije kako biste maksimizovali tačnost.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Често Постављана Питања о GPT-4o mini

Пронађите одговоре на честа питања о GPT-4o mini