openai

GPT-5.4

GPT-5.4 je frontier model od OpenAI disponující 1,05M context window a Extreme Reasoning. Vyniká v autonomní interakci s UI a analýze dlouhých datových forem.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54. března 2026
Kontext
1.1Mtokenu
Max vystup
128Ktokenu
Cena vstupu
$2.50/ 1M
Cena vystupu
$15.00/ 1M
Modalita:TextImage
Schopnosti:VideniNastrojeStreamingUvazovani
Benchmarky
GPQA
84.2%
GPQA: Vedecke otazky postgradualni urovne. Prisnybenchmark s 448 otazkami z biologie, fyziky a chemie. PhD experti dosahuji pouze 65-74% presnosti. GPT-5.4 ziskal 84.2% v tomto benchmarku.
HLE
42%
HLE: Uvazovani na expertni urovni. Testuje schopnost modelu demonstrovat uvazovani na expertni urovni ve specializovanych oblastech. GPT-5.4 ziskal 42% v tomto benchmarku.
MMLU
91%
MMLU: Masivni viceulohove porozumeni jazyku. Komplexni benchmark s 16 000 otazkami z 57 akademickych predmetu. GPT-5.4 ziskal 91% v tomto benchmarku.
MMLU Pro
76%
MMLU Pro: MMLU Profesionalni edice. Vylepsena verze MMLU s 12 032 otazkami a tezsim 10-moznostnim formatem. GPT-5.4 ziskal 76% v tomto benchmarku.
SimpleQA
56.7%
SimpleQA: Benchmark fakticke presnosti. Testuje schopnost modelu poskytnout presne, fakticke odpovedi. GPT-5.4 ziskal 56.7% v tomto benchmarku.
IFEval
92%
IFEval: Hodnoceni dodrzovani instrukci. Meri, jak dobre model dodrzuje specificke instrukce a omezeni. GPT-5.4 ziskal 92% v tomto benchmarku.
AIME 2025
100%
AIME 2025: Americka pozvanecka matematicka zkouska. Matematicke ulohy na soutezni urovni z prestizni zkousky AIME. GPT-5.4 ziskal 100% v tomto benchmarku.
MATH
88.6%
MATH: Reseni matematickych problemu. Komplexni matematicky benchmark testujici reseni problemu v algebre, geometrii, kalkulu. GPT-5.4 ziskal 88.6% v tomto benchmarku.
GSM8k
99%
GSM8k: Matematika zakladni skoly 8K. 8 500 matematickych slovnich uloh urovne zakladni skoly. GPT-5.4 ziskal 99% v tomto benchmarku.
MGSM
96%
MGSM: Vicejazycna matematika zakladni skoly. Benchmark GSM8k prelozeny do 10 jazyku. GPT-5.4 ziskal 96% v tomto benchmarku.
MathVista
74%
MathVista: Matematicke vizualni uvazovani. Testuje schopnost resit matematicke problemy s vizualnimi prvky. GPT-5.4 ziskal 74% v tomto benchmarku.
SWE-Bench
52.8%
SWE-Bench: Benchmark softwaroveho inzenyrstvi. AI modely se pokousi resit skutecne problemy GitHub v Python projektech. GPT-5.4 ziskal 52.8% v tomto benchmarku.
HumanEval
85.1%
HumanEval: Programovaci ulohy v Pythonu. 164 programovacich uloh, kde modely musi generovat spravne implementace Python funkci. GPT-5.4 ziskal 85.1% v tomto benchmarku.
LiveCodeBench
72.5%
LiveCodeBench: Zive programovaci benchmark. Testuje programovaci schopnosti na neustale aktualizovanych, skutecnych programovacich vyzvan. GPT-5.4 ziskal 72.5% v tomto benchmarku.
MMMU
84.2%
MMMU: Multimodalni porozumeni. Multimodalni benchmark porozumeni z 30 univerzitnich predmetu. GPT-5.4 ziskal 84.2% v tomto benchmarku.
MMMU Pro
61%
MMMU Pro: MMMU Profesionalni edice. Vylepsena verze MMMU s narocnejsimi otazkami. GPT-5.4 ziskal 61% v tomto benchmarku.
ChartQA
89%
ChartQA: Otazky a odpovedi o grafech. Testuje schopnost porozumet a analyzovat informace z grafu a diagramu. GPT-5.4 ziskal 89% v tomto benchmarku.
DocVQA
94%
DocVQA: Vizualni otazky o dokumentech. Testuje schopnost extrahovat informace z obrazku dokumentu. GPT-5.4 ziskal 94% v tomto benchmarku.
Terminal-Bench
55%
Terminal-Bench: Ulohy terminal/CLI. Testuje schopnost provadet operace prikazoveho radku. GPT-5.4 ziskal 55% v tomto benchmarku.
ARC-AGI
52.9%
ARC-AGI: Abstrakce a uvazovani. Testuje fluidni inteligenci prostrednictvim novych hadanek rozpoznavani vzoru. GPT-5.4 ziskal 52.9% v tomto benchmarku.

O GPT-5.4

Zjistete o schopnostech GPT-5.4, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Hranice uvažování v dlouhém kontextu

GPT-5.4 představuje vysoce výkonnou evoluci série GPT-5, charakterizovanou svým v odvětví vedoucím 1,05milionovým context window. Tento model je speciálně navržen tak, aby zvládal rozsáhlé datové sady, jako jsou masivní repozitáře kódu nebo víceleté historické logy, aniž by ztratil schopnost provádět high-fidelity reasoning. Výjimečnou funkcí je interaktivní „Mid-Response Steering“, které uživatelům umožňuje vizuálně sledovat a upravovat plán uvažování modelu v reálném čase, což zajišťuje, že výstup dokonale odpovídá složitým, vícekrokovým záměrům.

Sjednocená inteligence a autonomní akce

Technicky GPT-5.4 sjednocuje špičkové schopnosti kódování předchozích větví specifických pro Codex s kreativními nuancemi standardní řady GPT-5. Obsahuje specializovaný režim „Thinking“ s nastavitelnými úrovněmi úsilí (Standard, Extended a Heavy), který využívá zesílené chain-of-thought zpracování k řešení vědeckých a logických problémů na úrovni PhD. Kromě textu zavádí GPT-5.4 nativní schopnosti ovládání počítače a dosahuje skóre 75 % v úlohách OSWorld-Verified tím, že interpretuje high-fidelity vizuální screenshoty a provádí kliknutí na základě souřadnic.

Efektivita a spolehlivost

OpenAI uvádí významný 33% pokles chyb na úrovni tvrzení ve srovnání se svými předchůdci, což z GPT-5.4 činí prvotřídní volbu pro autonomní agenty a podporu rozhodování v kritických situacích. Navzdory svému výkonu je navržen pro efektivitu tokens a energie, což umožňuje levnější zpracování dlouhého kontextu než předchozí iterace. Ať už spravuje celou podnikovou codebase nebo funguje jako autonomní agent pro plánování, GPT-5.4 nastavuje nový standard spolehlivosti a agentic výkonu v prostředí generativní AI.

GPT-5.4

Pripady pouziti pro GPT-5.4

Objevte ruzne zpusoby, jak muzete pouzit GPT-5.4 pro dosazeni skvelych vysledku.

Refaktorování rozsáhlých codebase

Načítání a analýza stovek zdrojových souborů současně pro zajištění konzistence napříč moduly a identifikaci hlubokých sémantických chyb v celých repozitářích.

Autonomní agentic plánování

Interakce s e-maily a kalendáři prostřednictvím vizuálního ukotvení pro autonomní koordinaci složitých harmonogramů událostí a odesílání následné komunikace.

High-Fidelity architektonický návrh

Generování složitých 3D scén a strukturálních plánů, jako jsou funkční stanice metra, s využitím více než 1 000 řádků přesného kódu připraveného pro simulaci.

Dlouhodobé vědecké plánování

Využití Extreme Reasoning k řešení vědeckých problémů na úrovni PhD a provádění vícekrokových analýz vyžadujících hodiny konzistentní správy stavu.

Vyšetřování kyberbezpečnostních incidentů

Zpracování obrovského množství nezpracovaných dat z logů v rámci jedné relace s 1,05M context window pro autonomní identifikaci, vyšetřování a hlášení narušení bezpečnosti.

Interaktivní Mid-Response Steering

Korekce směru modelu během interní fáze přemýšlení pro úpravu architektonických rozhodnutí nebo logických cest bez nutnosti restartovat prompt.

Silne stranky

Omezeni

Špičkový 1,05M context window: Poskytuje v odvětví vedoucí kapacitu pro reasoning nad masivními datovými sadami a codebase v jediném promptu bez okamžité ztráty koherence.
Degradace při dlouhém kontextu: Výkon v úlohách s vysoce komplexním reasoning výrazně klesá, jakmile context window překročí hranici 256K tokens.
Přesnost Extreme Reasoning: Dosahuje úrovně vědeckých znalostí PhD (84,2 % v GPQA) a perfektních výsledků v matematice (100 % v AIME 2025) s využitím režimu reasoning s vysokým úsilím.
Matoucí schéma verzování: Složitá řada variant 5.1, 5.2 Thinking, 5.3 Codex a 5.4 vytváří značnou kognitivní zátěž pro vývojáře využívající API i uživatele Chatu.
Autonomní interakce s UI: State-of-the-art vizuální ukotvení umožňuje modelu interagovat se softwarem a prohlížeči s přesností 75 % v benchmarku OSWorld.
Vysoká latency v režimu Heavy: Režimy s nejvyšším úsilím reasoning mohou trvat déle než 8 minut při zpracování interního chain-of-thought, což je činí nevhodnými pro interaktivní úlohy v reálném čase.
Efektivita tokens a energie: Navrženo jako dosud nejefektivnější frontier model od OpenAI, snižující energetické náklady potřebné pro komplexní reasoning ve srovnání s verzí GPT-5.2.
Neurotický alignment: Agresivní bezpečnostní fine-tuning může vést k odmítavému chování, kdy model zbytečně odporuje uživateli v neškodných věcných tématech.

Rychly start API

openai/gpt-5.4

Zobrazit dokumentaci
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyzuj tento log soubor s 1,05M tokens z hlediska bezpečnostních hrozeb." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o GPT-5.4

Podivejte se, co si komunita mysli o GPT-5.4

GPT-5 zažívá drtivý návrat... každý řádek kódu, který vygeneroval, byl plně funkční.
immortalsol
reddit
Hlavním lákadlem je očividně 1M context window ve srovnání s přibližně 200k, které podporují ostatní modely.
Developer
hackernews
Wow, GPT 5.4 je neskutečně dobrý. Měl by to být skokový posun na 6.0. Je těžké uvěřit, že se Codex dostal tak daleko.
Rahul Sood
twitter
GPT-5.4 dosahuje extra vysokého skóre 94,0 v NYT Connections. Prostě to trefí hned napoprvé.
senko
hackernews
GPT-5.4 je nyní v indexu Artificial Analysis Intelligence... nastejno s Gemini 3.1 Pro.
AiBattle
twitter
Hloubka reasoning je konečně na úrovni, kdy zvládne architektonické problémy v podnikovém měřítku.
CloudArchitect99
reddit

Videa o GPT-5.4

Sledujte navody, recenze a diskuse o GPT-5.4

Context window o velikosti 1 milion 50 tisíc tokens... to je velmi dlouhý context window.

Po 5 minutách a 22 sekundách přemýšlení jsme obdrželi výsledek... model to testoval více agentic způsobem.

Aktualizace schopnosti modelu prohlížet high-fidelity obrázky... až 10,24 milionu pixelů celkem.

Model skutečně provádí výzkum napříč webem, aby si ověřil vlastní logiku.

To je obrovský skok pro agentic pracovní postupy, kde je potřeba zachovat stav.

GPT 5.4 má všechno... v podstatě vzali 5.2 a GPT 5.3 Codex a nechali je mít dítě.

Schopnosti kódování jsou neuvěřitelné. Je to v podstatě bezchybné.

Vkus pro front-end je daleko za Opus 4.6 a Gemini 3.1 Pro.

Mám pocit, že mnohem lépe rozumí nuancovaným záměrům vývojáře.

Cenová hladina je konkurenceschopná vzhledem k velikosti 1M context window.

Je jasné, že to vytváří tlak na OpenAI, aby odpověděla modelem, který se vyrovná té schopnosti 1 milionového kontextu.

Skutečnost, že tento model dokáže vytvořit tento klon Minecraftu na jeden pokus, je prostě pozoruhodná.

Vidíme 33procentní snížení míry faktických halucinací.

Režimy reasoning jsou rozděleny do úrovní Standard, Extended a Heavy.

Vizuální ukotvení v benchmarku OSWorld je momentálně špičkou v odvětví.

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow

Profesionalni tipy pro GPT-5.4

Expertni tipy, ktere vam pomohou ziskat maximum z GPT-5.4 a dosahnout lepsich vysledku.

Přepínejte úsilí reasoning

Používejte úrovně Standard, Extended nebo Heavy v závislosti na složitosti úkolu pro vyvážení nákladů na výpočet a kvality výstupu.

Sledujte plán předem

Při použití varianty Thinking sledujte plán uvažování; do generování můžete zasáhnout v jeho průběhu, pokud se navržená logická cesta modelu zdá chybná.

Strategický prompt caching

Umístěte velké statické bloky kontextu na začátek svého promptu, abyste využili automatický prompt caching od OpenAI a ušetřili náklady.

Spravujte stabilitu kontextu

Přestože je 1,05M window robustní, výkon je údajně nejstabilnější v rámci prvních 256K tokens; kritická shrnutí udržujte blízko konce promptu.

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Casto kladene dotazy o GPT-5.4

Najdete odpovedi na bezne otazky o GPT-5.4