openai

GPT-5.4

GPT-5.4 je OpenAI-ev frontier model sa context window-om od 1,05 miliona tokena i Extreme Reasoning-om. Ističe se u autonomnoj UI interakciji i analizi dugih...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54. mart 2026.
Контекст
1.1Mтокена
Макс. излаз
128Kтокена
Улазна цена
$2.50/ 1M
Излазна цена
$15.00/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
84.2%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GPT-5.4 је постигао 84.2% на овом бенчмарку.
HLE
42%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GPT-5.4 је постигао 42% на овом бенчмарку.
MMLU
91%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GPT-5.4 је постигао 91% на овом бенчмарку.
MMLU Pro
76%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GPT-5.4 је постигао 76% на овом бенчмарку.
SimpleQA
56.7%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GPT-5.4 је постигао 56.7% на овом бенчмарку.
IFEval
92%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GPT-5.4 је постигао 92% на овом бенчмарку.
AIME 2025
100%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GPT-5.4 је постигао 100% на овом бенчмарку.
MATH
88.6%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GPT-5.4 је постигао 88.6% на овом бенчмарку.
GSM8k
99%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GPT-5.4 је постигао 99% на овом бенчмарку.
MGSM
96%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GPT-5.4 је постигао 96% на овом бенчмарку.
MathVista
74%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GPT-5.4 је постигао 74% на овом бенчмарку.
SWE-Bench
52.8%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GPT-5.4 је постигао 52.8% на овом бенчмарку.
HumanEval
85.1%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GPT-5.4 је постигао 85.1% на овом бенчмарку.
LiveCodeBench
72.5%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GPT-5.4 је постигао 72.5% на овом бенчмарку.
MMMU
84.2%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GPT-5.4 је постигао 84.2% на овом бенчмарку.
MMMU Pro
61%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GPT-5.4 је постигао 61% на овом бенчмарку.
ChartQA
89%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GPT-5.4 је постигао 89% на овом бенчмарку.
DocVQA
94%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GPT-5.4 је постигао 94% на овом бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GPT-5.4 је постигао 55% на овом бенчмарку.
ARC-AGI
52.9%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GPT-5.4 је постигао 52.9% на овом бенчмарку.

О моделу GPT-5.4

Сазнајте о могућностима, функцијама и начинима коришћења модела GPT-5.4.

Granica reasoning-a sa dugim kontekstom

GPT-5.4 predstavlja evoluciju GPT-5 serije visokih performansi, koju karakteriše context window od 1,05 miliona tokena, vodeći u industriji. Ovaj model je specifično dizajniran za rad sa ogromnim skupovima podataka, kao što su masivni repozitorijumi koda ili višegodišnji istorijski logovi, bez gubitka sposobnosti za precizan reasoning. Istaknuta karakteristika je interaktivni „Mid-Response Steering“, koji omogućava korisnicima da vizuelno prate i prilagođavaju plan razmišljanja modela u realnom vremenu, osiguravajući da output bude savršeno usklađen sa složenim, višestepenim namerama.

Objedinjena inteligencija i autonomno delovanje

Tehnički, GPT-5.4 objedinjuje svetske snage u programiranju prethodnih Codex ogranaka sa kreativnim nijansama standardne GPT-5 serije. Poseduje specijalizovani „Thinking“ režim sa podesivim nivoima napora (Standard, Extended i Heavy) koji koristi ojačani chain-of-thought proces za rešavanje naučnih i logičkih problema na nivou doktorata. Pored teksta, GPT-5.4 uvodi izvorne mogućnosti korišćenja računara, postižući rezultat od 75% na OSWorld-Verified zadacima interpretacijom vizuelnih snimaka ekrana visoke vernosti i izvršavanjem klikova zasnovanih na koordinatama.

Efikasnost i pouzdanost

OpenAI izveštava o značajnom smanjenju grešaka na nivou tvrdnji od 33% u poređenju sa svojim prethodnicima, čineći GPT-5.4 primarnim izborom za autonomne agente i podršku pri donošenju odluka visokog rizika. Uprkos svojoj snazi, dizajniran je za efikasnost tokena i energije, omogućavajući jeftiniju obradu dugog konteksta od prethodnih iteracija. Bilo da upravlja celokupnom bazom koda preduzeća ili deluje kao autonomni agent za zakazivanje, GPT-5.4 postavlja novi standard za pouzdanost i agentic performanse u svetu generativne AI.

GPT-5.4

Случајеви употребе за GPT-5.4

Откријте различите начине коришћења модела GPT-5.4 за постизање одличних резултата.

Refaktorisanje velikih baza koda

Učitavanje i analiza stotina izvornih fajlova istovremeno kako bi se osigurala konzistentnost između modula i identifikovali duboki semantički bagovi u čitavim repozitorijumima.

Autonomno agentic zakazivanje

Interakcija sa e-poštom i kalendarima putem vizuelnog prepoznavanja radi autonomne koordinacije složenih rasporeda događaja i slanja naknadnih komunikacija.

Arhitektonski dizajn visoke vernosti

Generisanje složenih 3D scena i strukturnih planova, kao što su funkcionalne stanice metroa, koristeći preko 1.000 linija preciznog koda spremnog za simulaciju.

Dugoročno naučno planiranje

Korišćenje Extreme Reasoning-a za rešavanje naučnih problema na nivou doktorata i obavljanje višestepene analize koja zahteva sate doslednog upravljanja stanjem.

Istraživanje cybersecurity incidenata

Obrada ogromnih količina sirovih log podataka unutar jedne sesije od 1,05 miliona tokena radi autonomne identifikacije, istraživanja i izveštavanja o kršenjima bezbednosti.

Interaktivni Mid-Response Steering

Ispravljanje kursa modela tokom interne faze 'razmišljanja' radi prilagođavanja arhitektonskih izbora ili logičkih putanja bez potrebe za ponovnim pokretanjem prompt-a.

Предности

Ограничења

Frontier context window od 1,05 miliona tokena: Pruža vodeći kapacitet u industriji za reasoning nad masivnim skupovima podataka i bazama koda u jednom prompt-u bez trenutnog gubitka koherentnosti.
Degradacija pri dugom kontekstu: Primećeno je da performanse na zadacima složenog reasoning-a značajno opadaju kada context window pređe granicu od 256k tokena.
Ekstremna preciznost reasoning-a: Postiže nivo naučnog znanja ranga doktorata (84,2% na GPQA) i savršene rezultate iz matematike (100% na AIME 2025) koristeći svoj Heavy režim reasoning-a.
Zbunjujuća šema verzija: Kompleksna linija varijanti 5.1, 5.2 Thinking, 5.3 Codex i 5.4 stvara značajno kognitivno opterećenje za API developere i korisnike chat-a.
Autonomna UI interakcija: State-of-the-art vizuelno prepoznavanje omogućava modelu da komunicira sa softverom i pretraživačima sa 75% preciznosti na OSWorld benchmark-u.
Visok latency u Heavy režimu: Režimi sa najvećim naporom reasoning-a mogu trajati preko 8 minuta za obradu internog chain-of-thought, što ih čini neprikladnim za interaktivne zadatke u realnom vremenu.
Efikasnost tokena i energije: Dizajniran kao najefikasniji OpenAI frontier model do sada, smanjujući energetski trošak potreban za složeni reasoning u poređenju sa GPT-5.2 verzijom.
Neurotični alignment: Agresivno sigurnosno fino podešavanje može dovesti do kontradiktornog ponašanja gde model nepotrebno protivreči korisniku o bezopasnim činjeničnim temama.

АПИ брзи старт

openai/gpt-5.4

Погледај документацију
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analiziraj ovaj log fajl od 1,05 miliona tokena radi bezbednosnih pretnji." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GPT-5.4

Погледајте шта заједница мисли о моделу GPT-5.4

GPT-5 se vraća na brutalno moćan način... svaka linija koda koju je generisao je savršeno radila.
immortalsol
reddit
Glavna karakteristika je očigledno context window od 1M, u poređenju sa ~200k koliko podržavaju drugi modeli.
Developer
hackernews
Vau, GPT 5.4 je neverovatno dobar. Trebalo je da bude skok na 6.0. Teško je poverovati da je Codex ovoliko napredovao.
Rahul Sood
twitter
GPT-5.4 postiže ekstra visoke rezultate 94.0 na NYT Connections. Jednostavno pogađa stvari iz prve.
senko
hackernews
GPT-5.4 je sada na Artificial Analysis Intelligence indeksu... Izjednačen sa Gemini 3.1 Pro.
AiBattle
twitter
Dubina reasoning-a je konačno na nivou gde može da rešava arhitektonske probleme na nivou preduzeća.
CloudArchitect99
reddit

Видео снимци о моделу GPT-5.4

Гледајте туторијале, рецензије и дискусије о моделу GPT-5.4

Context window od milion i 50 hiljada tokena... ovo je veoma dug context window.

Nakon 5 minuta i 22 sekunde razmišljanja, dobili smo rezultat... model je ovo testirao na više agentic način.

Unapređena sposobnost modela da analizira slike visoke vernosti... do 10,24 miliona ukupno piksela.

Model zapravo sprovodi istraživanje širom interneta kako bi verifikovao sopstvenu logiku.

Ovo je ogroman skok za agentic radne procese gde stanje mora da perzistira.

GPT 5.4 ima sve... u suštini su rekli, okej, 5.2 i GPT 5.3 Codex, hajde, napravite dete.

Sposobnosti programiranja su neverovatne. Praktično su besprekorne.

Osećaj za front-end zaostaje za modelima Opus 4.6 i Gemini 3.1 Pro.

Čini se da mnogo bolje razume nijansirane namere developera.

Cena je konkurentna s obzirom na veličinu context window-a od 1M tokena.

Ovo jasno vrši pritisak na OpenAI da odgovori modelom koji parira tom kapacitetu od milion konteksta.

Činjenica da je ovaj model sposoban da iz jednog pokušaja napravi klon Minecraft-a je prosto izvanredna.

Vidimo smanjenje stope činjeničnih halucinacija za 33 procenta.

Režimi za reasoning su kategorisani u Standard, Extended i Heavy nivoe.

Vizuelno prepoznavanje na OSWorld benchmark-u je trenutno vodeće u industriji.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za GPT-5.4

Stručni saveti za maksimalno iskorišćenje GPT-5.4.

Promena nivoa napora za reasoning

Koristite Standard, Extended ili Heavy nivoe napora za reasoning u zavisnosti od složenosti zadatka kako biste balansirali troškove računanja i kvalitet outputa.

Pratite plan unapred

Kada koristite Thinking varijantu, pratite plan koji model napravi unapred; možete intervenisati usred generisanja ako vam se predložena logička putanja modela učini pogrešnom.

Strateški prompt caching

Postavite velike, statične blokove konteksta na početak vašeg prompt-a kako biste iskoristili OpenAI automatski prompt caching za uštedu troškova.

Upravljajte stabilnošću konteksta

Iako je context window od 1,05 miliona tokena robustan, performanse su najstabilnije unutar prvih 256k tokena; držite kritične sažetke blizu kraja prompt-a.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Често Постављана Питања о GPT-5.4

Пронађите одговоре на честа питања о GPT-5.4