openai

GPT-4o mini

GPT-4o mini je OpenAI-jev cjenovno najučinkovitiji mali model, koji nudi GPT-4 class inteligenciju uz vrhunsku brzinu i multimodalni vision za zadatke velikog...

Mali modelCjenovno učinkovitVision-sposobanBrzi AIMultimodal
openai logoopenaiGPT-4o18. srpnja 2024.
Kontekst
128Ktokena
Maks. izlaz
16Ktokena
Ulazna cijena
$0.15/ 1M
Izlazna cijena
$0.60/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreaming
Benchmarks
GPQA
40.2%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-4o mini je postigao 40.2% na ovom benchmarku.
HLE
2.3%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-4o mini je postigao 2.3% na ovom benchmarku.
MMLU
82%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-4o mini je postigao 82% na ovom benchmarku.
MMLU Pro
57%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-4o mini je postigao 57% na ovom benchmarku.
SimpleQA
8.6%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-4o mini je postigao 8.6% na ovom benchmarku.
IFEval
76.5%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-4o mini je postigao 76.5% na ovom benchmarku.
AIME 2025
5%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-4o mini je postigao 5% na ovom benchmarku.
MATH
50.2%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-4o mini je postigao 50.2% na ovom benchmarku.
GSM8k
91.3%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-4o mini je postigao 91.3% na ovom benchmarku.
MGSM
87%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-4o mini je postigao 87% na ovom benchmarku.
MathVista
42%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-4o mini je postigao 42% na ovom benchmarku.
SWE-Bench
8.7%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-4o mini je postigao 8.7% na ovom benchmarku.
HumanEval
87.2%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-4o mini je postigao 87.2% na ovom benchmarku.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-4o mini je postigao 32.5% na ovom benchmarku.
MMMU
59.4%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-4o mini je postigao 59.4% na ovom benchmarku.
MMMU Pro
34%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-4o mini je postigao 34% na ovom benchmarku.
ChartQA
78%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-4o mini je postigao 78% na ovom benchmarku.
DocVQA
88%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-4o mini je postigao 88% na ovom benchmarku.
Terminal-Bench
40%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-4o mini je postigao 40% na ovom benchmarku.
ARC-AGI
8%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-4o mini je postigao 8% na ovom benchmarku.

O modelu GPT-4o mini

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-4o mini.

Novi standard za male modele

GPT-4o mini predstavlja značajan iskorak u AI efikasnosti, dizajniran da zamijeni GPT-3.5 Turbo kao primarni model za developere. Izgrađen s nativnom multimodalnom arhitekturom, pruža GPT-4 class performanse uz djelić troškova i latency-ja. Sadrži masivan 128 000 token context window i podržava složene output-e do 16 384 tokens, što ga čini idealnim za obradu dugačkih dokumenata i podatkovnih streamova velikog volumena.

Inteligencija susreće pristupačnost

Za razliku od prethodnih malih modela koji su žrtvovali inteligenciju radi brzine, GPT-4o mini zadržava visoke sposobnosti reasoning-a u tekstualnim i vizualnim zadacima. 60 % je jeftiniji od GPT-3.5 Turbo i znatno sposobniji, s ostvarenih 82 % na MMLU benchmarku. Ovaj model je posebno optimiziran za aplikacije gdje su niska latency i visoka pouzdanost ključni, kao što su korisnički asistenti u stvarnom vremenu i mehanizmi za klasifikaciju podataka velikih razmjera.

GPT-4o mini

Slučajevi korištenja za GPT-4o mini

Otkrijte različite načine korištenja modela GPT-4o mini za postizanje izvrsnih rezultata.

Automatizacija korisničke podrške

Rukovanje velikim brojem korisničkih upita uz nisku latency i visoku točnost uz djelić troškova.

Sažimanje sadržaja

Obrada velikih dokumenata ili dugih formata sadržaja u koncizne sažetke unutar 128k context window-a.

Ekstrakcija podataka

Pretvaranje nestrukturiranog teksta ili slika u strukturirane formate podataka poput JSON-a za unos u bazu.

Višejezično prevođenje

Pružanje prijevoda u stvarnom vremenu na desetke jezika za chat aplikacije i globalnu komunikaciju.

Edukativno podučavanje

Služi kao interaktivni asistent za učenje studentima kojima je potrebna pomoć u matematici, znanosti i jezicima.

Osnovni vizualni zadaci

Analiza slika radi prepoznavanja objekata, ekstrakcija teksta putem OCR-a ili pružanje opisa radi pristupačnosti.

Prednosti

Ograničenja

Nevjerojatan omjer cijene i performansi: Uz 0,15 $ po milijun input tokens, nudi reasoning na razini frontier modela s 82 % MMLU rezultatom.
Praznine u složenom reasoning-u: Zaostaje za većim modelima poput GPT-4o ili o1 u znanosti na stručnoj razini, s rezultatom od 40,2 % na GPQA benchmarku.
Velika brzina propusnosti: Model isporučuje odgovore uz izuzetno nisku latency, što ga čini idealnim za korisnička sučelja u stvarnom vremenu.
Ograničenja u kodiranju: Nedostaje mu duboko arhitektonsko razumijevanje potrebno za složeno softversko inženjerstvo u usporedbi s modelom Claude 3.5 Sonnet.
Veliki context window: Zadržava puni 128k context window, omogućujući obradu složenih dokumenata što je rijetkost kod manjih modela.
Smanjen output prozor: Ograničenje od 16k za output može biti restriktivno za zadatke koji zahtijevaju masivne migracije koda ili generiranje sadržaja dužine knjige.
Nativna podrška za vizualne zadatke: Uključuje multimodalne mogućnosti u malom formatu, uz izvrsne rezultate u analizi slika i OCR zadacima.
Stabilnost faktografije: Manji modeli ostaju skloniji halucinacijama u specifičnim domenama nego njihovi flagship pandani.

API brzi početak

openai/gpt-4o-mini

Pogledaj dokumentaciju
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Objasni kvantnu fiziku." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-4o mini

Pogledajte što zajednica misli o modelu GPT-4o mini

GPT-4o mini je praktički uništio tržište za fine-tuning starijih modela za osnovni RAG. Troškovi su preniski da bi se ignorirali.
AI_Dev_Central
reddit
Brzina je jednostavno suluda. Dobivam natrag tokens gotovo trenutno za mog agenta za prevođenje.
TechCruncher
twitter
OpenAI je ovim cijenama stvarno prisilio Anthropic i Google na reakciju. 0,15 $ za 1M tokens je novi donji prag.
hn_reader_99
hackernews
Zamijenio sam 3.5 s mini verzijom i poboljšanje logike bilo je vidljivo unutar prvih pet minuta testiranja.
PromptEngineerPro
youtube
Napokon je dovoljno jeftino za korištenje LLM-ova za osnovno čišćenje podataka u velikom obujmu bez ogromnih računa za cloud.
DataVizWiz
reddit
Vizualne performanse za OCR su zapravo bolje od nekih specijaliziranih modela koji koštaju 10x više.
VisionDev
twitter

Videozapisi o modelu GPT-4o mini

Gledajte tutorijale, recenzije i diskusije o modelu GPT-4o mini

Brži je i jeftiniji od GPT-3.5 Turbo u svim aspektima.

Vision sposobnosti za ovako mali model su uistinu iznenađujuće.

Cijene su s ovim izdanjem praktički postale utrka prema nuli.

Uspijeva zadržati masivan context window dok ostaje malen.

Benchmarkovi pokazuju da pobjeđuje Claude Haiku u gotovo svakoj kategoriji.

GPT 40 mini je lagani model pa je puno brži od GPT 40.

Puno je brži od GPT 4.

Za svakodnevne zadatke, većina korisnika neće ni primijetiti razliku u reasoning-u.

Prepoznavanje slika je vrlo konzistentno za osnovne objekte.

Nosi se sa složenim uputama puno bolje od starog 3.5 modela.

Trenutno nadmašuje njihov gbd4 u preferencijama chata na LMC leaderboardu.

Sve izgleda savršeno, a ovaj konkretan račun izgleda kao tipičan račun.

Vrijeme odziva je praktički ispod jedne sekunde za kratke prompt-ove.

Vrlo je učinkovit u sažimanju dugih PDF-ova putem API-ja.

Možete pokrenuti milijune tokens za samo nekoliko dolara.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-4o mini

Stručni savjeti za maksimalno iskorištavanje GPT-4o mini.

Koristite za RAG

Iskoristite nisku cijenu inputa za provođenje opsežne Retrieval Augmented Generation bez visokih troškova.

Strukturirajte uz JSON Mode

Koristite JSON mode ili parametre za function calling kako biste osigurali konzistentne strukture podataka za backend tijekove rada.

Batch Processing

Koristite OpenAI Batch API s ovim modelom kako biste smanjili troškove za 50 % za zadatke koji nisu hitni.

Podešavanje temperature

Postavite nižu temperature između 0,1 i 0,3 za zadatke faktografske ekstrakcije kako biste maksimizirali točnost.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Često Postavljana Pitanja o GPT-4o mini

Pronađite odgovore na česta pitanja o GPT-4o mini