openai

GPT-4o mini

GPT-4o mini je nejefektivnější malý model od OpenAI, který nabízí inteligenci třídy GPT-4 s vynikající rychlostí a multimodal vision pro velkoobjemové úkoly.

Malý modelNákladově efektivníS podporou visionRychlá AIMultimodal
openai logoopenaiGPT-418. července 2024
Kontext
128Ktokenu
Max vystup
16Ktokenu
Cena vstupu
$0.15/ 1M
Cena vystupu
$0.60/ 1M
Modalita:TextImage
Schopnosti:VideniNastrojeStreaming
Benchmarky
GPQA
40.2%
GPQA: Vedecke otazky postgradualni urovne. Prisnybenchmark s 448 otazkami z biologie, fyziky a chemie. PhD experti dosahuji pouze 65-74% presnosti. GPT-4o mini ziskal 40.2% v tomto benchmarku.
HLE
2.3%
HLE: Uvazovani na expertni urovni. Testuje schopnost modelu demonstrovat uvazovani na expertni urovni ve specializovanych oblastech. GPT-4o mini ziskal 2.3% v tomto benchmarku.
MMLU
82%
MMLU: Masivni viceulohove porozumeni jazyku. Komplexni benchmark s 16 000 otazkami z 57 akademickych predmetu. GPT-4o mini ziskal 82% v tomto benchmarku.
MMLU Pro
57%
MMLU Pro: MMLU Profesionalni edice. Vylepsena verze MMLU s 12 032 otazkami a tezsim 10-moznostnim formatem. GPT-4o mini ziskal 57% v tomto benchmarku.
SimpleQA
8.6%
SimpleQA: Benchmark fakticke presnosti. Testuje schopnost modelu poskytnout presne, fakticke odpovedi. GPT-4o mini ziskal 8.6% v tomto benchmarku.
IFEval
76.5%
IFEval: Hodnoceni dodrzovani instrukci. Meri, jak dobre model dodrzuje specificke instrukce a omezeni. GPT-4o mini ziskal 76.5% v tomto benchmarku.
AIME 2025
5%
AIME 2025: Americka pozvanecka matematicka zkouska. Matematicke ulohy na soutezni urovni z prestizni zkousky AIME. GPT-4o mini ziskal 5% v tomto benchmarku.
MATH
50.2%
MATH: Reseni matematickych problemu. Komplexni matematicky benchmark testujici reseni problemu v algebre, geometrii, kalkulu. GPT-4o mini ziskal 50.2% v tomto benchmarku.
GSM8k
91.3%
GSM8k: Matematika zakladni skoly 8K. 8 500 matematickych slovnich uloh urovne zakladni skoly. GPT-4o mini ziskal 91.3% v tomto benchmarku.
MGSM
87%
MGSM: Vicejazycna matematika zakladni skoly. Benchmark GSM8k prelozeny do 10 jazyku. GPT-4o mini ziskal 87% v tomto benchmarku.
MathVista
42%
MathVista: Matematicke vizualni uvazovani. Testuje schopnost resit matematicke problemy s vizualnimi prvky. GPT-4o mini ziskal 42% v tomto benchmarku.
SWE-Bench
8.7%
SWE-Bench: Benchmark softwaroveho inzenyrstvi. AI modely se pokousi resit skutecne problemy GitHub v Python projektech. GPT-4o mini ziskal 8.7% v tomto benchmarku.
HumanEval
87.2%
HumanEval: Programovaci ulohy v Pythonu. 164 programovacich uloh, kde modely musi generovat spravne implementace Python funkci. GPT-4o mini ziskal 87.2% v tomto benchmarku.
LiveCodeBench
32.5%
LiveCodeBench: Zive programovaci benchmark. Testuje programovaci schopnosti na neustale aktualizovanych, skutecnych programovacich vyzvan. GPT-4o mini ziskal 32.5% v tomto benchmarku.
MMMU
59.4%
MMMU: Multimodalni porozumeni. Multimodalni benchmark porozumeni z 30 univerzitnich predmetu. GPT-4o mini ziskal 59.4% v tomto benchmarku.
MMMU Pro
34%
MMMU Pro: MMMU Profesionalni edice. Vylepsena verze MMMU s narocnejsimi otazkami. GPT-4o mini ziskal 34% v tomto benchmarku.
ChartQA
78%
ChartQA: Otazky a odpovedi o grafech. Testuje schopnost porozumet a analyzovat informace z grafu a diagramu. GPT-4o mini ziskal 78% v tomto benchmarku.
DocVQA
88%
DocVQA: Vizualni otazky o dokumentech. Testuje schopnost extrahovat informace z obrazku dokumentu. GPT-4o mini ziskal 88% v tomto benchmarku.
Terminal-Bench
40%
Terminal-Bench: Ulohy terminal/CLI. Testuje schopnost provadet operace prikazoveho radku. GPT-4o mini ziskal 40% v tomto benchmarku.
ARC-AGI
8%
ARC-AGI: Abstrakce a uvazovani. Testuje fluidni inteligenci prostrednictvim novych hadanek rozpoznavani vzoru. GPT-4o mini ziskal 8% v tomto benchmarku.

O GPT-4o mini

Zjistete o schopnostech GPT-4o mini, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Nový standard pro malé modely

GPT-4o mini představuje významný skok v efektivitě AI a je navržen tak, aby nahradil GPT-3.5 Turbo jako hlavní volbu pro vývojáře. Díky nativní multimodal architektuře poskytuje výkon třídy GPT-4 za zlomek ceny a s minimální latency. Nabízí masivní 128 000 token context window a podporuje komplexní výstupy až do 16 384 tokens, což jej činí ideálním pro zpracování dlouhých dokumentů a velkoobjemových datových toků.

Inteligence se potkává s cenovou dostupností

Na rozdíl od předchozích malých modelů, které obětovaly inteligenci ve prospěch rychlosti, si GPT-4o mini udržuje vysoké schopnosti reasoning v textových i vision úlohách. Je o 60 % levnější než GPT-3.5 Turbo a přitom výrazně schopnější, s výsledkem 82 % v benchmarku MMLU. Tento model je specificky optimalizován pro aplikace, kde jsou prioritou nízká latency a vysoká spolehlivost, jako jsou zákazničtí asistenti v reálném čase a systémy pro rozsáhlou klasifikaci dat.

GPT-4o mini

Pripady pouziti pro GPT-4o mini

Objevte ruzne zpusoby, jak muzete pouzit GPT-4o mini pro dosazeni skvelych vysledku.

Automatizace zákaznické podpory

Nasaďte nízkonákladové chatboty s nízkou latency, kteří zvládnou tisíce běžných dotazů s vysokou přesností.

Extrakce strukturovaných dat

Převádějte velké objemy nestrukturovaného textu nebo obrazových dat do čistých, formátovaných JSON schémat pro databáze.

Překlad v reálném čase

Pohánějte chatovací aplikace s téměř okamžitým překladem do desítek jazyků při minimálních provozních nákladech.

Sumarizace dokumentů

Sumarizujte rozsáhlé zprávy a zápisy z jednání s využitím širokého 128k context window.

Vizuální analýza a OCR

Extrahujte text z obrázků, analyzujte grafy a popisujte vizuální obsah pro účely přístupnosti.

Rychlé prototypování

Rychle vytvářejte a vylepšujte AI aplikace s minimálními náklady na API před přechodem na větší modely.

Silne stranky

Omezeni

Bezkonkurenční poměr cena/výkon: S cenou 0,15 $/1M input tokens nabízí 99% snížení nákladů ve srovnání s GPT-4 při zachování vysoké úrovně logiky.
Omezená hloubka reasoning: Nedisponuje pokročilými schopnostmi chain-of-thought, které najdeme u modelů jako OpenAI o1.
Nízká latency odpovědí: Navrženo pro rychlost, poskytuje téměř okamžité odpovědi klíčové pro konverzační agenty v reálném čase.
Omezení výstupních tokens: Limit 16 384 výstupních tokens je nižší než u specializovaných modelů, které nabízejí plnou paritu s 128k výstupem.
Nativní multimodal vision: Na rozdíl od starších malých modelů zpracovává obrázky nativně s vysokým skóre v benchmarku ChartQA (78,0).
Mezery v komplexním kódování: Má potíže s návrhem architektury na vysoké úrovni a laděním velkých repozitářů s více soubory.
Silné dodržování instrukcí: Dosahuje 76,5 % v IFEval, což prokazuje vynikající schopnost dodržovat složitá pravidla formátování.
Chybějící nativní audio vstup: Nepodporuje přímé zpracování audio-to-audio prostřednictvím standardního API endpointu pro text/vision.

Rychly start API

openai/gpt-4o-mini

Zobrazit dokumentaci
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Analyze this data and return JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o GPT-4o mini

Podivejte se, co si komunita mysli o GPT-4o mini

GPT-4o mini je v podstatě umíráček pro GPT-3.5. Je rychlejší, levnější a chytřejší. Už není důvod používat starý model.
rowqi
reddit
OpenAI s touto cenou opravdu změnilo pravidla hry. 15 centů za milion tokens je při této úrovni logiky šílené.
peterm1598
hackernews
U svého chatbota vidím téměř okamžité odpovědi. Latency u 4o-mini je vzhledem k ceně působivá.
WesternCat5211
twitter
GPT-4o mini byl spuštěn před 4 dny. Už teď zpracovává více než 200 miliard tokens denně!
Sam Altman
twitter
Výkon vision u něčeho tak levného je ten hlavní příběh. Grafy zvládá lépe než některé flagship modely před rokem.
VisionDev99
reddit
Perfektně dodržuje systémové instrukce pro extrakci JSON. Obrovský upgrade oproti spolehlivosti 3.5 Turbo.
LLM_Master
hackernews

Videa o GPT-4o mini

Sledujte navody, recenze a diskuse o GPT-4o mini

Éra malých modelů je tady

Cena je 15 centů za milion input tokens... to je šíleně levné

GPT-4o mini je velmi, velmi rychlý... neuvěřitelně rychlý

Tento model v podstatě nahrazuje GPT-3.5 Turbo a je o 60 % levnější

Podívejte se, jak rychle generuje text, je to téměř okamžité

GPT-4o mini je zdarma, je rychlý a je opravdu docela dobrý

GPT-3.5 je úplně pryč... nahrazuje ho GPT-4o mini

Podívejte se na tu rychlost, je to mnohem svižnější

Je to multimodal model, což znamená, že vidí obrázky

V některých benchmarcích překonává GPT-3.5 Turbo a dokonce i GPT-4

OpenAI v podstatě vydalo konkurenta, který zřejmě poráží mnoho těchto modelů

Je to model, který optimalizovali tak, aby stál co nejméně

Možnost vygenerovat 16 000 output tokens najednou je opravdu užitečná věc

Context window je 128k, což je skvělé pro RAG aplikace

Bezpečnostní opatření jsou v tomto modelu zabudována od samého začátku

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow

Profesionalni tipy pro GPT-4o mini

Expertni tipy, ktere vam pomohou ziskat maximum z GPT-4o mini a dosahnout lepsich vysledku.

Přímé systémové instrukce

Poskytujte stručné systémové prompts, abyste model nasměrovali ke konkrétním výstupním formátům, jako je JSON nebo Markdown.

Dávkování kontextu

Využijte 128k window seskupením souvisejících malých úkolů do jednoho promptu, abyste snížili režijní náklady.

Označování ve vision

Při zpracování obrázků žádejte o konkrétní vizuální atributy, abyste zlepšili přesnost extrakce metadat.

Streamování pro UX

Vždy povolte parametr stream, abyste koncovým uživatelům poskytli okamžitou odezvu v podobě tokens.

Ladění parametru temperature

U úloh se strukturovanými daty nastavte temperature na 0, aby byly výstupy deterministické a konzistentní.

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

Casto kladene dotazy o GPT-4o mini

Najdete odpovedi na bezne otazky o GPT-4o mini