openai

GPT-5.4

GPT-5.4 je OpenAI-ev frontier model s 1,05M context windowom i ekstremnim reasoningom. Izvrsan je u autonomnoj UI interakciji i analizi dugih dokumenata.

OpenAIGPT-51M contextReasoningMultimodal
openai logoopenaiGPT-55. ožujka 2026.
Kontekst
1.1Mtokena
Maks. izlaz
128Ktokena
Ulazna cijena
$2.50/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
84.2%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.4 je postigao 84.2% na ovom benchmarku.
HLE
42%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.4 je postigao 42% na ovom benchmarku.
MMLU
91%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.4 je postigao 91% na ovom benchmarku.
MMLU Pro
76%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.4 je postigao 76% na ovom benchmarku.
SimpleQA
56.7%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.4 je postigao 56.7% na ovom benchmarku.
IFEval
92%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.4 je postigao 92% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.4 je postigao 100% na ovom benchmarku.
MATH
88.6%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.4 je postigao 88.6% na ovom benchmarku.
GSM8k
99%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.4 je postigao 99% na ovom benchmarku.
MGSM
96%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.4 je postigao 96% na ovom benchmarku.
MathVista
74%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.4 je postigao 74% na ovom benchmarku.
SWE-Bench
52.8%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.4 je postigao 52.8% na ovom benchmarku.
HumanEval
85.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.4 je postigao 85.1% na ovom benchmarku.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.4 je postigao 72.5% na ovom benchmarku.
MMMU
84.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.4 je postigao 84.2% na ovom benchmarku.
MMMU Pro
61%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.4 je postigao 61% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.4 je postigao 89% na ovom benchmarku.
DocVQA
94%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.4 je postigao 94% na ovom benchmarku.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.4 je postigao 55% na ovom benchmarku.
ARC-AGI
52.9%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.4 je postigao 52.9% na ovom benchmarku.

O modelu GPT-5.4

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.4.

Granica reasoninga s dugim kontekstom

GPT-5.4 predstavlja evoluciju visokih performansi GPT-5 serije. Sadrži vodeći 1,05-milijunski context window. Ovaj model upravlja golemim skupovima podataka, poput masivnih repozitorija koda ili višegodišnjih povijesnih zapisa, bez gubitka vjernosti u logičkom zaključivanju. Interaktivni Mid-Response Steering omogućuje korisnicima praćenje i prilagodbu plana razmišljanja modela u stvarnom vremenu. Time se osigurava da izlaz bude u skladu sa složenim, višestupanjskim namjerama.

Objedinjena inteligencija i autonomno djelovanje

Tehnički, GPT-5.4 objedinjuje vrhunske vještine programiranja prethodnih Codex grana s kreativnim nijansama standardne GPT-5 serije. Sadrži specijalizirani Thinking mod s podesivim razinama napora, uključujući Standard, Extended i Heavy modove. Koristi ojačano chain-of-thought procesiranje za rješavanje znanstvenih i logičkih problema na doktorskoj razini. Uz tekst, GPT-5.4 uvodi nativne sposobnosti computer usea. Ostvaruje rezultat od 75 % na OSWorld-Verified zadacima interpretacijom vizualnih snimaka zaslona i izvršavanjem klikova temeljenih na koordinatama.

Učinkovitost i pouzdanost

OpenAI izvještava o smanjenju pogrešaka na razini tvrdnji za 33 % u usporedbi s prethodnicima. To čini GPT-5.4 primarnim izborom za autonomne agente i podršku pri donošenju odluka s visokim ulozima. Dizajniran je za učinkovitost u pogledu tokens i energije. To omogućuje jeftiniju obradu dugog konteksta nego u prethodnim iteracijama. Bez obzira upravljate li cijelom bazom koda poduzeća ili djeluje kao autonomni agent za planiranje, GPT-5.4 postavlja novi standard za pouzdanost i agentic performanse.

GPT-5.4

Slučajevi korištenja za GPT-5.4

Otkrijte različite načine korištenja modela GPT-5.4 za postizanje izvrsnih rezultata.

Refaktoriranje koda velikih razmjera

Sustavno prepisivanje naslijeđenih (legacy) baza koda koje premašuju 300 000 linija uz strogo pridržavanje arhitektonskih standarda.

Autonomno financijsko modeliranje

Izrada složenih modela s tri izvještaja gdje AI usklađuje račune dobiti i gubitka, bilance i novčane tokove.

Interaktivni dizajn sustava

Razvoj 3D simulacija ili igara temeljenih na fizici usmjeravanjem logičke putanje modela tijekom procesa generiranja.

Agentic computer use

Izvršavanje višestupanjskih zadataka na stolnom računalu, poput masovnog unosa podataka, upravljanja e-poštom i testiranja softvera putem nativne UI interakcije.

Pravna analiza s dugim kontekstom

Unakrsno referenciranje stotina pravnih dokumenata radi prepoznavanja nedosljednosti ili izdvajanja specifičnih klauzula uz visoku preciznost.

Znanstvena podrška na doktorskoj razini

Rješavanje složenih matematičkih dokaza i znanstvenih problema pomoću Heavy Reasoning moda za provjerene logičke lance.

Prednosti

Ograničenja

Golemi 1,05M context window: Pruža vodeći kapacitet u industriji za dubinsku analizu ogromnih baza koda i skupova dokumenata bez degradacije konteksta.
Latency razmišljanja: Aktiviranje Heavy Thinking moda može rezultirati čekanjem od nekoliko minuta kod složene logike ili generiranja velikih količina koda.
Interaktivno razmišljanje: Jedinstvena navigacija tijekom generiranja odgovora omogućuje korisnicima usmjeravanje reasoning putanja, čime se značajno smanjuje broj uzaludnih generiranja i nepotrebnih tokens.
Ograničenja brzine (Rate Limiting): Tijekom početnog uvođenja korisnici mogu naići na agresivna ograničenja poruka ili privremene pogreške na računu kako se kapaciteti skaliraju.
Nativni computer use: Visoka preciznost UI interakcije (75 % na OSWorldu) omogućuje modelu izravan rad unutar desktop i pregledničkih okruženja.
Nelinearno skaliranje: Kod nekih kreativnih zadataka uočeno je da lakši modovi razmišljanja nadmašuju teške modove po pitanju estetskih detalja.
Ekstremna učinkovitost tokena: Optimizirana arhitektura donosi performanse na razini 2026. uz nižu latency i manju potrošnju energije od prethodnih verzija GPT-5.
Degradacija konteksta na 1M: Iako je context window velik, točnost pronalaženja informacija značajno opada pri prijelazu s 256K na 1M tokens.

API brzi početak

openai/gpt-5.4

Pogledaj dokumentaciju
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.4

Pogledajte što zajednica misli o modelu GPT-5.4

GPT 5.4 u Codexu je ogromno poboljšanje... vidio sam kako radi 150 minuta bez prekida, a da nije izgubio kontekst.
ArchMeta1868
reddit
GPT 5.4 je nenadmašan u 3D dizajnu. Način na koji je upravljao prozirnošću i fizikom u mom simulatoru brodova bio je jezivo precizan.
AI_Creative_Daily
twitter
Ispravljanje smjera usred odgovora je nevjerojatno. Mogu vidjeti kamo model ide i popraviti ga prije nego što potroši tokene.
dev_guru_99
reddit
Pobijedio je ljude u 83 % slučajeva u 44 različita posla. Odvjetnik. Računovođa. Financijski analitičar. Administrator.
Josh Kale
twitter
OpenAI je napokon popravio usko grlo izlaza. 128k izlaznih tokens je san za programere koji grade full-stack aplikacije.
TheCodeChannel
youtube
Latency kod computer usea je još uvijek prisutan, ali preciznost je dovoljno visoka za rad sa složenim SAP tijekovima rada, što je suludo.
enterprise_sysadmin
hackernews

Videozapisi o modelu GPT-5.4

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.4

GPT 5.4 je stigao i možda zaista imamo novi najbolji model na planetu.

GPT 5.4 Thinking sada može pružiti plan razmišljanja unaprijed... omogućuje vam da vodite model.

Ovaj interaktivni element rješava problem 'crne kutije' kod reasoning modela.

Brzina u usporedbi s o1-preview je nebo i zemlja za standardne zadatke.

Vidite reasoning koji doista djeluje dosljedno kroz duge razgovore.

GPT 5.4... nije napravljen za čavrljanje. Napravljen je za rad.

Deferred loading... smanjio ukupnu upotrebu tokens za 47 % bez gubitka točnosti.

Funkcionalnost computer use prati UI elemente pomoću koordinatnog sustava.

Testirao sam ga s naslijeđenom Java bazom koda i doista je razumio zavisnosti između datoteka.

Ulazimo u svijet u kojem je AI operativni sustav koji kontrolira računalo.

1 milijun i 50 000 tokens context window. Ovo je jako dug context window.

Navigirajte njime dok razmišlja, što je definitivno učinkovitije za rad.

Cijena je visoka, ali za velike skupove dokumenata, to je jedini model koji radi.

Thinking mod se može prilagoditi ovisno o složenosti vašeg prompta.

Djeluje pouzdanije po pitanju činjeničnog prisjećanja od bilo koje prethodne GPT verzije.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.4

Stručni savjeti za maksimalno iskorištavanje GPT-5.4.

Prilagodba intenziteta razmišljanja

Koristite parametre Standard, Extended ili Heavy kako biste uravnotežili potrebu za preciznošću s brzinom generiranja i troškom.

Pregled plana razmišljanja

Pratite početni plan koji model pruža i koristite Mid-Response Steering kako biste ga ispravili ako logika krene u krivom smjeru.

Iskoristite odgođeno učitavanje alata (Deferred Tool Loading)

Za agentic tijekove rada koristite registar odgođenog učitavanja kako biste smanjili troškove inicijalnih tokens za do 47 %.

Ugovori o potpunosti (Completeness Contracts)

U svom promptu jasno definirajte što znači da je zadatak dovršen kako bi model bio ustrajniji tijekom dugotrajnih zadataka.

Vision maksimalne rezolucije

Učitajte slike visoke vjernosti do 10,24 MP za precizne vizualne preglede UI elemenata ili tehničkih dijagrama.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Često Postavljana Pitanja o GPT-5.4

Pronađite odgovore na česta pitanja o GPT-5.4