openai

GPT-5.4

GPT-5.4 je OpenAI frontier model s 1,05M context windowom i Extreme Reasoningom. Izvrsno obavlja autonomnu UI interakciju i analizu opsežnih podataka.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-5March 4, 2026
Kontekst
1.1Mtokena
Maks. izlaz
128Ktokena
Ulazna cijena
$2.50/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
84.2%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.4 je postigao 84.2% na ovom benchmarku.
HLE
42%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.4 je postigao 42% na ovom benchmarku.
MMLU
91%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.4 je postigao 91% na ovom benchmarku.
MMLU Pro
76%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.4 je postigao 76% na ovom benchmarku.
SimpleQA
56.7%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.4 je postigao 56.7% na ovom benchmarku.
IFEval
92%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.4 je postigao 92% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.4 je postigao 100% na ovom benchmarku.
MATH
88.6%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.4 je postigao 88.6% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.4 je postigao 99% na ovom benchmarku.
MGSM
96%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.4 je postigao 96% na ovom benchmarku.
MathVista
74%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.4 je postigao 74% na ovom benchmarku.
SWE-Bench
52.8%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.4 je postigao 52.8% na ovom benchmarku.
HumanEval
85.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.4 je postigao 85.1% na ovom benchmarku.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.4 je postigao 72.5% na ovom benchmarku.
MMMU
84.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.4 je postigao 84.2% na ovom benchmarku.
MMMU Pro
61%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.4 je postigao 61% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.4 je postigao 89% na ovom benchmarku.
DocVQA
94%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.4 je postigao 94% na ovom benchmarku.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.4 je postigao 55% na ovom benchmarku.
ARC-AGI
52.9%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.4 je postigao 52.9% na ovom benchmarku.

O modelu GPT-5.4

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.4.

Granica Reasoninga s dugim Contextom

GPT-5.4 predstavlja evoluciju visokih performansi GPT-5 serije, koju karakterizira vodeći u industriji context window od 1,05 milijuna tokens. Ovaj model je specifično dizajniran za rukovanje opsežnim skupovima podataka, kao što su masivni repozitoriji koda ili višegodišnji povijesni logovi, bez gubitka sposobnosti izvođenja preciznog reasoninga. Istaknuta značajka je interaktivni „Mid-Response Steering”, koji korisnicima omogućuje vizualno praćenje i prilagodbu plana razmišljanja modela u stvarnom vremenu, osiguravajući da output savršeno odgovara složenim namjerama u više koraka.

Ujedinjena inteligencija i autonomno djelovanje

Tehnički, GPT-5.4 ujedinjuje vrhunske snage kodiranja prethodnih Codex ogranaka s kreativnim nijansama standardne GPT-5 serije. Sadrži specijalizirani „Thinking” način rada s podesivim razinama napora (Standard, Extended i Heavy) koji koristi pojačanu chain-of-thought obradu za rješavanje znanstvenih i logičkih problema na razini doktorata. Osim teksta, GPT-5.4 uvodi izvorne mogućnosti korištenja računala, postižući rezultat od 75% na OSWorld-Verified zadacima interpretacijom vizualnih screenshotova i izvršavanjem klikova na temelju koordinata.

Učinkovitost i pouzdanost

OpenAI izvještava o značajnom smanjenju pogrešaka na razini tvrdnji od 33% u usporedbi s prethodnicima, što GPT-5.4 čini primarnim izborom za autonomne agente i podršku pri donošenju odluka s visokim ulozima. Unatoč svojoj snazi, projektiran je za učinkovitost tokens i energije, omogućujući jeftiniju obradu dugog contexta od prethodnih verzija. Bilo da upravlja cijelim codebaseom poduzeća ili djeluje kao autonomni agent za zakazivanje, GPT-5.4 postavlja novi standard za pouzdanost i agentic performanse u svijetu generativne AI.

GPT-5.4

Slučajevi korištenja za GPT-5.4

Otkrijte različite načine korištenja modela GPT-5.4 za postizanje izvrsnih rezultata.

Refaktoriranje velikih codebaseova

Učitavanje i analiza stotina izvornih datoteka istovremeno kako bi se osigurala konzistentnost među modulima i identificirali duboki semantički bugovi u cijelim repozitorijima.

Autonomno agentic zakazivanje

Interakcija s e-poštom i kalendarima putem vizualnog prepoznavanja za autonomnu koordinaciju složenih rasporeda događaja i slanje popratnih komunikacija.

Arhitektonski dizajn visoke vjernosti

Generiranje zamršenih 3D scena i strukturnih planova, poput funkcionalnih stanica podzemne željeznice, koristeći preko 1.000 linija preciznog koda spremnog za simulaciju.

Dugoročno znanstveno planiranje

Korištenje Extreme Reasoning za rješavanje znanstvenih problema na razini doktorata i izvođenje analize u više koraka koja zahtijeva sate dosljednog upravljanja stanjima.

Istraga cybersecurity incidenata

Obrada ogromnih količina sirovih log podataka unutar jedne 1,05M context sesije za autonomnu identifikaciju, istragu i izvještavanje o povredama sigurnosti.

Interaktivni Mid-Response Steering

Ispravljanje putanje modela tijekom interne 'thinking' faze radi prilagodbe arhitektonskih izbora ili logičkih putanja bez potrebe za ponovnim pokretanjem prompta.

Prednosti

Ograničenja

Frontier 1,05M Context Window: Pruža vodeći kapacitet u industriji za reasoning nad masivnim skupovima podataka i codebaseovima u jednom promptu bez trenutnog gubitka koherentnosti.
Degradacija dugog contexta: Primijećeno je da performanse na zadacima reasoninga visoke složenosti značajno padaju kada context window prijeđe granicu od 256K tokens.
Točnost Extreme Reasoninga: Postiže znanstveno znanje na razini doktorata (84,2% na GPQA) i savršene rezultate iz matematike (100% na AIME 2025) koristeći svoj način rada s visokim naporom reasoninga.
Zbunjujuća shema verzija: Složena postava varijanti 5.1, 5.2 Thinking, 5.3 Codex i 5.4 stvara značajno kognitivno opterećenje za API developere i korisnike Chata.
Autonomna UI interakcija: State-of-the-art vizualno pozicioniranje omogućuje modelu interakciju sa softverom i preglednicima s točnošću od 75% na OSWorld benchmarku.
Visoki latency u Heavy načinu: Načini rada s najvećim naporom reasoninga mogu trajati preko 8 minuta za obradu internog CoT-a, što ih čini neprikladnima za interaktivne zadatke u stvarnom vremenu.
Učinkovitost tokens i energije: Dizajniran kao dosad najučinkovitiji OpenAI frontier model, smanjujući energetski trošak potreban za složeni reasoning u usporedbi s GPT-5.2 izdanjem.
Neurotični alignment: Agresivno sigurnosno fine-tuning podešavanje može dovesti do kontrirajućeg ponašanja gdje model nepotrebno proturječi korisniku o bezopasnim činjeničnim temama.

API brzi početak

openai/gpt-5.4

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.4

Pogledajte što zajednica misli o modelu GPT-5.4

GPT-5 se vraća na scenu na brutalan način... svaka linija koda koju je generirao radila je savršeno.
immortalsol
reddit
Glavna značajka je očito context window od 1M, u usporedbi s ~200k koliko podržavaju drugi modeli.
Developer
hackernews
Wow, GPT 5.4 je ludo dobar. Trebao bi se zvati 6.0. Teško je povjerovati da je Codex ovoliko napredovao.
Rahul Sood
twitter
GPT-5.4 postiže iznimno visoke rezultate od 94.0 na NYT Connections. Jednostavno pogađa stvari iz prve.
senko
hackernews
GPT-5.4 je sada na Artificial Analysis Intelligence Indexu... Izjednačen s Gemini 3.1 Pro.
AiBattle
twitter
Dubina reasoninga je napokon na razini na kojoj može podnijeti arhitektonske probleme na razini poduzeća.
CloudArchitect99
reddit

Videozapisi o modelu GPT-5.4

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.4

Context window od 1 milijun i 50.000 tokens... ovo je jako dugačak context window.

Nakon 5 minuta i 22 sekunde thinkinga, dobili smo rezultat... testirao je ovo na više agentic način.

Ažurirana sposobnost modela da analizira slike visoke vjernosti... do ukupno 10,24 milijuna piksela.

Model zapravo provodi istraživanje diljem weba kako bi verificirao vlastitu logiku.

Ovo je ogroman skok za agentic workflowe gdje stanje mora biti postojano.

GPT 5.4 ima sve... zapravo su rekli, u redu, 5.2 i GPT 5.3 Codex, spojite se u jedno.

Mogućnosti kodiranja su nevjerojatne. U osnovi je besprijekoran.

Osjećaj za front-end je daleko iza modela Opus 4.6 i Gemini 3.1 Pro.

Čini se da puno bolje razumije nijansiranu namjeru developera.

Cijena je konkurentna s obzirom na veličinu context windowa od 1M tokens.

Jasno je da ovo stvara pritisak na OpenAI da odgovori modelom koji odgovara toj mogućnosti od 1 milijun contexta.

Činjenica da je ovaj model u jednom pokušaju uspio stvoriti ovaj Minecraft klon je jednostavno izvanredna.

Vidimo smanjenje stope činjeničnih halucinacija za 33 posto.

Načini reasoninga kategorizirani su u Standard, Extended i Heavy razine.

Vizualno pozicioniranje na OSWorld benchmarku je trenutno vodeće u industriji.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.4

Stručni savjeti za maksimalno iskorištavanje GPT-5.4.

Promjena Reasoning napora

Koristite Standard, Extended ili Heavy nivoe reasoning napora ovisno o složenosti zadatka kako biste uravnotežili trošak računanja i kvalitetu outputa.

Pratite plan unaprijed

Kada koristite Thinking varijantu, pratite plan; možete intervenirati usred generiranja ako se predložena logička putanja modela čini pogrešnom.

Strateški prompt caching

Postavite velike, statične blokove contexta na početak vašeg prompta kako biste iskoristili OpenAI automatski prompt caching za uštedu troškova.

Upravljanje stabilnošću contexta

Iako je 1,05M window robustan, izvještaji pokazuju da su performanse najstabilnije unutar prvih 256K tokens; držite ključne sažetke blizu kraja prompta.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Često Postavljana Pitanja o GPT-5.4

Pronađite odgovore na česta pitanja o GPT-5.4