openai

GPT-5.4

GPT-5.4 je OpenAI-ev frontier model koji sadrži 1.05M context window i Extreme Reasoning. Ističe se u autonomnoj UI interakciji i analizi podataka dugog...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55. mart 2026.
Контекст
1.1Mтокена
Макс. излаз
128Kтокена
Улазна цена
$2.50/ 1M
Излазна цена
$15.00/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
84.2%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GPT-5.4 је постигао 84.2% на овом бенчмарку.
HLE
42%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GPT-5.4 је постигао 42% на овом бенчмарку.
MMLU
91%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GPT-5.4 је постигао 91% на овом бенчмарку.
MMLU Pro
76%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GPT-5.4 је постигао 76% на овом бенчмарку.
SimpleQA
56.7%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GPT-5.4 је постигао 56.7% на овом бенчмарку.
IFEval
92%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GPT-5.4 је постигао 92% на овом бенчмарку.
AIME 2025
100%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GPT-5.4 је постигао 100% на овом бенчмарку.
MATH
88.6%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GPT-5.4 је постигао 88.6% на овом бенчмарку.
GSM8k
99%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GPT-5.4 је постигао 99% на овом бенчмарку.
MGSM
96%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GPT-5.4 је постигао 96% на овом бенчмарку.
MathVista
74%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GPT-5.4 је постигао 74% на овом бенчмарку.
SWE-Bench
52.8%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GPT-5.4 је постигао 52.8% на овом бенчмарку.
HumanEval
85.1%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GPT-5.4 је постигао 85.1% на овом бенчмарку.
LiveCodeBench
72.5%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GPT-5.4 је постигао 72.5% на овом бенчмарку.
MMMU
84.2%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GPT-5.4 је постигао 84.2% на овом бенчмарку.
MMMU Pro
61%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GPT-5.4 је постигао 61% на овом бенчмарку.
ChartQA
89%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GPT-5.4 је постигао 89% на овом бенчмарку.
DocVQA
94%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GPT-5.4 је постигао 94% на овом бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GPT-5.4 је постигао 55% на овом бенчмарку.
ARC-AGI
52.9%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GPT-5.4 је постигао 52.9% на овом бенчмарку.

О моделу GPT-5.4

Сазнајте о могућностима, функцијама и начинима коришћења модела GPT-5.4.

Granice reasoning-a sa velikim kontekstom

GPT-5.4 predstavlja evoluciju visokih performansi GPT-5 serije. Poseduje vodeći u industriji 1.05 miliona tokena context window. Ovaj model upravlja obimnim skupovima podataka, poput masivnih repozitorijuma koda ili višegodišnjih istorijskih zapisa, bez gubitka vernosti zaključivanja. Interaktivni Mid-Response Steering omogućava korisnicima da prate i prilagođavaju plan razmišljanja modela u realnom vremenu. To osigurava da je output usklađen sa kompleksnim namerama u više koraka.

Objedinjena inteligencija i autonomna akcija

Tehnički, GPT-5.4 objedinjuje vrhunske programske snage prethodnih Codex grana sa kreativnim nijansama standardne GPT-5 serije. Poseduje specijalizovani Thinking režim sa podesivim nivoima napora. Oni uključuju Standard, Extended i Heavy režime. Koristi ojačanu obradu lanca misli (chain-of-thought) za rešavanje naučnih i logičkih problema na doktorskom nivou. Pored teksta, GPT-5.4 uvodi izvorne mogućnosti korišćenja računara. Postiže rezultat od 75% na OSWorld-verifikovanim zadacima tumačenjem vizuelnih snimaka ekrana i izvršavanjem klikova zasnovanih na koordinatama.

Efikasnost i pouzdanost

OpenAI izveštava o smanjenju grešaka na nivou tvrdnji od 33% u odnosu na prethodnike. To čini GPT-5.4 primarnim izborom za autonomne agente i podršku u odlučivanju visokog rizika. Dizajniran je za efikasnost tokena i energije. To omogućava jeftiniju obradu sa velikim kontekstom u odnosu na prethodne iteracije. Bilo da upravlja celokupnom bazom koda preduzeća ili deluje kao autonomni agent za zakazivanje, GPT-5.4 postavlja novi standard za pouzdanost i agentic performanse.

GPT-5.4

Случајеви употребе за GPT-5.4

Откријте различите начине коришћења модела GPT-5.4 за постизање одличних резултата.

Refaktorisanje koda velikih razmera

Sistematsko prepisivanje nasleđenih baza koda koje premašuju 300.000 linija uz strogo pridržavanje arhitektonskih standarda.

Autonomno finansijsko modeliranje

Izrada kompleksnih modela sa tri izveštaja gde AI usklađuje bilanse uspeha, bilanse stanja i tokove gotovine.

Interaktivni dizajn sistema

Razvoj 3D simulacija ili igara zasnovanih na fizici usmeravanjem logičke putanje modela tokom procesa generisanja.

Agentic computer use

Izvršavanje desktop zadataka u više koraka, kao što su masovni unos podataka, upravljanje e-poštom i testiranje softvera putem izvorne UI interakcije.

Pravna analiza sa velikim kontekstom

Unakrsna provera stotina pravnih dokumenata radi identifikacije nedoslednosti ili izdvajanja specifičnih klauzula uz visoku tačnost preuzimanja.

Istraživačka podrška na doktorskom nivou

Rešavanje kompleksnih matematičkih dokaza i naučnih problema korišćenjem Heavy Reasoning režima za verifikovane lance logike.

Предности

Ограничења

Ogroman kontekst od 1.05M: Pruža kapacitet vodeći u industriji za dubinsku analizu ogromnih baza koda i dokumenata bez degradacije konteksta.
Latencija reasoning-a: Omogućavanje Heavy Thinking režima može rezultirati vremenom čekanja od nekoliko minuta za kompleksnu logiku ili generisanje obimnog koda.
Interaktivno razmišljanje: Jedinstvena navigacija usred odgovora omogućava korisnicima da usmeravaju reasoning putanje, značajno smanjujući nepotrebno generisanje i potrošnju tokena.
Ograničenja stope (Rate Limiting): Tokom početnog uvođenja, korisnici mogu naići na agresivna ograničenja poruka ili privremene greške na nalogu dok se kapacitet povećava.
Izvorno korišćenje računara: Visokoprecizna UI interakcija (75% na OSWorld-u) omogućava modelu da radi direktno unutar desktop i browser okruženja.
Nelinearno skaliranje: Kod nekih kreativnih zadataka, ustanovljeno je da lakši reasoning režimi nadmašuju teške režime po estetskim detaljima.
Ekstremna efikasnost tokena: Optimizovana arhitektura pruža performanse na nivou frontier modela iz 2026. uz manju latenciju i potrošnju energije u odnosu na prethodne verzije GPT-5.
Gubitak konteksta na 1M: Iako je prozor veliki, tačnost preuzimanja informacija značajno opada prilikom prelaska sa 256K na 1M tokena.

АПИ брзи старт

openai/gpt-5.4

Погледај документацију
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GPT-5.4

Погледајте шта заједница мисли о моделу GPT-5.4

GPT 5.4 u Codex-u je ogromno poboljšanje... Zaista sam video da radi 150 minuta bez prekida bez gubitka konteksta.
ArchMeta1868
reddit
Mogućnosti GPT 5.4 za 3D dizajn su bez premca. Način na koji je upravljao providnošću i fizikom u mom simulatoru brodova bio je jezivo precizan.
AI_Creative_Daily
twitter
Korekcija kursa tokom odgovora je neverovatna. Zapravo mogu da vidim kuda model ide i da to popravim pre nego što potroši tokene.
dev_guru_99
reddit
Pobedio je ljude u 83% slučajeva na 44 različita posla. Pravnik. Računovođa. Finansijski analitičar. Administrator.
Josh Kale
twitter
OpenAI je konačno popravio usko grlo output-a. 128k output tokena je san za programere koji grade full-stack aplikacije.
TheCodeChannel
youtube
Latencija kod korišćenja računara je i dalje prisutna, ali je preciznost dovoljno visoka da se nose sa kompleksnim SAP radnim tokovima, što je neverovatno.
enterprise_sysadmin
hackernews

Видео снимци о моделу GPT-5.4

Гледајте туторијале, рецензије и дискусије о моделу GPT-5.4

GPT 5.4 je tu i možda zaista imamo novi najbolji model na planeti.

GPT 5.4 Thinking sada može da pruži početni plan svog razmišljanja... omogućava vam da vodite model.

Ovaj interaktivni element rešava problem „crne kutije“ kod reasoning modela.

Brzina u poređenju sa o1-preview je nebo i zemlja za standardne zadatke.

Vidite reasoning koji deluje zaista konzistentno tokom dugih razgovora.

GPT 5.4... nije napravljen za ćaskanje. Napravljen je da radi.

Deferred loading... smanjio je ukupnu upotrebu tokena za 47% bez gubitka tačnosti.

Funkcionalnost korišćenja računara prati UI elemente pomoću sistema baziranog na koordinatama.

Testirao sam ga sa nasleđenom Java bazom koda i zaista je razumeo zavisnosti između fajlova.

Ulazimo u svet u kojem je AI kontroler operativnog sistema.

1 milion i 50.000 tokena context window-a. Ovo je veoma dugačak kontekst.

Navigirajte kroz njega dok razmišlja, što je definitivno efikasnije za upotrebu.

Cena je visoka, ali za velike skupove dokumenata, to je jedini model koji radi.

Thinking režim se može prilagoditi na osnovu kompleksnosti vašeg prompt-a.

Deluje pouzdanije u pogledu činjeničnog prisećanja nego bilo koja prethodna verzija GPT-a.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za GPT-5.4

Stručni saveti za maksimalno iskorišćenje GPT-5.4.

Promena Thinking Effort-a

Koristite parametre Standard, Extended ili Heavy kako biste balansirali potrebu za preciznošću naspram brzine generisanja i troškova.

Pregled plana razmišljanja

Pratite početni plan koji model pruža i koristite Mid-Response Steering da ga ispravite ako logika skrene sa putanje.

Iskoristite odloženo učitavanje alata (Deferred Tool Loading)

Za agentic radne tokove, koristite registar odloženog učitavanja kako biste smanjili početne troškove tokena za čak 47%.

Koristite ugovore o potpunosti (Completeness Contracts)

Eksplicitno definišite šta znači „završeno“ u vašem prompt-u kako biste model učinili istrajnijim tokom dugotrajnih zadataka.

Vision maksimalne rezolucije

Otpremite slike visoke vernosti do 10,24 miliona piksela za preciznu vizuelnu inspekciju UI elemenata ili tehničkih dijagrama.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Често Постављана Питања о GPT-5.4

Пронађите одговоре на честа питања о GPT-5.4

GPT-5.4: Frontier Reasoning sa 1.05M Context Window-om