Koliko košta GPT-4o mini?

GPT-4o mini košta 0,15 $ po milijun input tokens i 0,60 $ po milijun output tokens. Ovakva cijena ga čini 60 % jeftinijim od starijeg modela GPT-3.5 Turbo.

Koliki je context window za GPT-4o mini?

Sadrži context window od 128 000 tokens. Taj kapacitet modelu omogućuje obradu približno 300 stranica teksta u jednom prompt.

Može li GPT-4o mini obrađivati slike?

Da, GPT-4o mini ima nativne vision sposobnosti. Može analizirati slike, provoditi OCR i razumjeti vizualni kontekst uz tekstualne inpute.

Kako se uspoređuje s GPT-3.5 Turbo?

Brži je, jeftiniji i inteligentniji od GPT-3.5 Turbo. Na MMLU benchmark ostvaruje 82,0 % u usporedbi s otprilike 70 % koliko ima njegov prethodnik.

Podržava li GPT-4o mini function calling?

Da, nativno podržava tool use i function calling. To modelu omogućuje interakciju s vanjskim API-jima i strukturiranim podatkovnim sustavima.

Koliko iznosi maksimalno ograničenje output-a?

Model može generirati do 16 384 tokens u jednom odgovoru. To je dovoljno za većinu zahtjeva za generiranjem dugačkog sadržaja.

Je li GPT-4o mini dostupan putem API-ja?

Da, dostupan je unutar OpenAI API pod model ID-jem gpt-4o-mini. Podržava chat completions, assistants i načine batch processinga.

GPT-4o mini

GPT-4o mini je OpenAI-jev cjenovno najučinkovitiji mali model, koji nudi GPT-4 class inteligenciju uz vrhunsku brzinu i multimodalni vision za zadatke velikog...

Mali modelCjenovno učinkovitVision-sposobanBrzi AIMultimodal

openaiGPT-4o18. srpnja 2024.

Kontekst

128Ktokena

Maks. izlaz

16Ktokena

Ulazna cijena

$0.15/ 1M

Izlazna cijena

$0.60/ 1M

Modalitet:TextImage

Mogućnosti:VidAlatiStreaming

Benchmarks

GPQA

40.2%

HLE

2.3%

MMLU

82%

MMLU Pro

57%

SimpleQA

8.6%

IFEval

76.5%

AIME 2025

MATH

50.2%

GSM8k

91.3%

MGSM

87%

MathVista

42%

SWE-Bench

8.7%

HumanEval

87.2%

LiveCodeBench

32.5%

MMMU

59.4%

MMMU Pro

34%

ChartQA

78%

DocVQA

88%

Terminal-Bench

40%

ARC-AGI

Pogledaj API dokumentaciju

O modelu GPT-4o mini

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-4o mini.

Novi standard za male modele

GPT-4o mini predstavlja značajan iskorak u AI efikasnosti, dizajniran da zamijeni GPT-3.5 Turbo kao primarni model za developere. Izgrađen s nativnom multimodalnom arhitekturom, pruža GPT-4 class performanse uz djelić troškova i latency-ja. Sadrži masivan 128 000 token context window i podržava složene output-e do 16 384 tokens, što ga čini idealnim za obradu dugačkih dokumenata i podatkovnih streamova velikog volumena.

Inteligencija susreće pristupačnost

Za razliku od prethodnih malih modela koji su žrtvovali inteligenciju radi brzine, GPT-4o mini zadržava visoke sposobnosti reasoning-a u tekstualnim i vizualnim zadacima. 60 % je jeftiniji od GPT-3.5 Turbo i znatno sposobniji, s ostvarenih 82 % na MMLU benchmarku. Ovaj model je posebno optimiziran za aplikacije gdje su niska latency i visoka pouzdanost ključni, kao što su korisnički asistenti u stvarnom vremenu i mehanizmi za klasifikaciju podataka velikih razmjera.

Slučajevi korištenja za GPT-4o mini

Otkrijte različite načine korištenja modela GPT-4o mini za postizanje izvrsnih rezultata.

Automatizacija korisničke podrške

Rukovanje velikim brojem korisničkih upita uz nisku latency i visoku točnost uz djelić troškova.

Sažimanje sadržaja

Obrada velikih dokumenata ili dugih formata sadržaja u koncizne sažetke unutar 128k context window-a.

Ekstrakcija podataka

Pretvaranje nestrukturiranog teksta ili slika u strukturirane formate podataka poput JSON-a za unos u bazu.

Višejezično prevođenje

Pružanje prijevoda u stvarnom vremenu na desetke jezika za chat aplikacije i globalnu komunikaciju.

Edukativno podučavanje

Služi kao interaktivni asistent za učenje studentima kojima je potrebna pomoć u matematici, znanosti i jezicima.

Osnovni vizualni zadaci

Analiza slika radi prepoznavanja objekata, ekstrakcija teksta putem OCR-a ili pružanje opisa radi pristupačnosti.

Prednosti

Ograničenja

Nevjerojatan omjer cijene i performansi: Uz 0,15 $ po milijun input tokens, nudi reasoning na razini frontier modela s 82 % MMLU rezultatom.

Praznine u složenom reasoning-u: Zaostaje za većim modelima poput GPT-4o ili o1 u znanosti na stručnoj razini, s rezultatom od 40,2 % na GPQA benchmarku.

Velika brzina propusnosti: Model isporučuje odgovore uz izuzetno nisku latency, što ga čini idealnim za korisnička sučelja u stvarnom vremenu.

Ograničenja u kodiranju: Nedostaje mu duboko arhitektonsko razumijevanje potrebno za složeno softversko inženjerstvo u usporedbi s modelom Claude 3.5 Sonnet.

Veliki context window: Zadržava puni 128k context window, omogućujući obradu složenih dokumenata što je rijetkost kod manjih modela.

Smanjen output prozor: Ograničenje od 16k za output može biti restriktivno za zadatke koji zahtijevaju masivne migracije koda ili generiranje sadržaja dužine knjige.

Nativna podrška za vizualne zadatke: Uključuje multimodalne mogućnosti u malom formatu, uz izvrsne rezultate u analizi slika i OCR zadacima.

Stabilnost faktografije: Manji modeli ostaju skloniji halucinacijama u specifičnim domenama nego njihovi flagship pandani.

API brzi početak

openai/gpt-4o-mini

Pogledaj dokumentaciju

openai SDK

import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Objasni kvantnu fiziku." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-4o mini

Pogledajte što zajednica misli o modelu GPT-4o mini

“GPT-4o mini je praktički uništio tržište za fine-tuning starijih modela za osnovni RAG. Troškovi su preniski da bi se ignorirali.”

— AI_Dev_Central

“Brzina je jednostavno suluda. Dobivam natrag tokens gotovo trenutno za mog agenta za prevođenje.”

— TechCruncher

twitter

“OpenAI je ovim cijenama stvarno prisilio Anthropic i Google na reakciju. 0,15 $ za 1M tokens je novi donji prag.”

— hn_reader_99

hackernews

“Zamijenio sam 3.5 s mini verzijom i poboljšanje logike bilo je vidljivo unutar prvih pet minuta testiranja.”

— PromptEngineerPro

youtube

“Napokon je dovoljno jeftino za korištenje LLM-ova za osnovno čišćenje podataka u velikom obujmu bez ogromnih računa za cloud.”

— DataVizWiz

“Vizualne performanse za OCR su zapravo bolje od nekih specijaliziranih modela koji koštaju 10x više.”

— VisionDev

twitter

Videozapisi o modelu GPT-4o mini

Gledajte tutorijale, recenzije i diskusije o modelu GPT-4o mini

“Brži je i jeftiniji od GPT-3.5 Turbo u svim aspektima.”

“Vision sposobnosti za ovako mali model su uistinu iznenađujuće.”

“Cijene su s ovim izdanjem praktički postale utrka prema nuli.”

“Uspijeva zadržati masivan context window dok ostaje malen.”

“Benchmarkovi pokazuju da pobjeđuje Claude Haiku u gotovo svakoj kategoriji.”

“GPT 40 mini je lagani model pa je puno brži od GPT 40.”

“Puno je brži od GPT 4.”

“Za svakodnevne zadatke, većina korisnika neće ni primijetiti razliku u reasoning-u.”

“Prepoznavanje slika je vrlo konzistentno za osnovne objekte.”

“Nosi se sa složenim uputama puno bolje od starog 3.5 modela.”

“Trenutno nadmašuje njihov gbd4 u preferencijama chata na LMC leaderboardu.”

“Sve izgleda savršeno, a ovaj konkretan račun izgleda kao tipičan račun.”

“Vrijeme odziva je praktički ispod jedne sekunde za kratke prompt-ove.”

“Vrlo je učinkovit u sažimanju dugih PDF-ova putem API-ja.”

“Možete pokrenuti milijune tokens za samo nekoliko dolara.”

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti

Web Automatizacija

Pametni Tokovi

Zapocnite Besplatno

Pro Savjeti za GPT-4o mini

Stručni savjeti za maksimalno iskorištavanje GPT-4o mini.

Koristite za RAG

Iskoristite nisku cijenu inputa za provođenje opsežne Retrieval Augmented Generation bez visokih troškova.

Strukturirajte uz JSON Mode

Koristite JSON mode ili parametre za function calling kako biste osigurali konzistentne strukture podataka za backend tijekove rada.

Batch Processing

Koristite OpenAI Batch API s ovim modelom kako biste smanjili troškove za 50 % za zadatke koji nisu hitni.

Podešavanje temperature

Postavite nižu temperature između 0,1 i 0,3 za zadatke faktografske ekstrakcije kako biste maksimizirali točnost.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context

$0.12/$0.75/1M

Gemini 3.6 Flash Lite

Google

Gemini 3.6 Flash Lite is a high-efficiency model from Google featuring a 1M token context window and 350 tokens/sec throughput for agentic workflows.

1M context

$0.30/$2.50/1M

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context

$0.60/$2.20/1M

Gemini 3.6 Flash

Google

Gemini 3.6 Flash is Google's high-speed model featuring a 17% reduction in token consumption, $1.50/M input pricing, and advanced 3D visualization.

1M context

$1.50/$7.50/1M

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context

$0.15/$1.20/1M

MiMo V2.5 Pro

Other

MiMo V2.5 Pro is Xiaomi's open-source 1.02T parameter MoE model featuring a 1M context window, native multimodality, and elite agentic coding performance.

1M context

$1.00/$3.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GLM-5.2

Zhipu (GLM)

GLM-5.2 is Zhipu AI's flagship open-weight model featuring a 1M context window and specialized agentic coding capabilities under an MIT license.

1M context

$1.40/$4.40/1M

Često Postavljana Pitanja o GPT-4o mini

Pronađite odgovore na česta pitanja o GPT-4o mini