openai

GPT-5.4

GPT-5.4 to model frontier od OpenAI z context window 1,05 mln tokenów i Extreme Reasoning. Doskonale radzi sobie z autonomiczną interakcją z UI i analizą...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 marca 2026
Kontekst
1.1Mtokenow
Maks. wyjscie
128Ktokenow
Cena wejscia
$2.50/ 1M
Cena wyjscia
$15.00/ 1M
Modalnosc:TextImage
Mozliwosci:WizjaNarzedziaStreamingRozumowanie
Benchmarki
GPQA
84.2%
GPQA: Pytania naukowe poziomu doktoranckiego. Rygorystyczny benchmark z 448 pytaniami z biologii, fizyki i chemii. Eksperci PhD osiagaja tylko 65-74% dokładnosci. GPT-5.4 uzyskal 84.2% w tym benchmarku.
HLE
42%
HLE: Rozumowanie eksperckie wysokiego poziomu. Testuje zdolnosc modelu do demonstrowania rozumowania na poziomie eksperta w specjalistycznych dziedzinach. GPT-5.4 uzyskal 42% w tym benchmarku.
MMLU
91%
MMLU: Masowe wielozadaniowe rozumienie jezyka. Kompleksowy benchmark z 16 000 pytan z 57 przedmiotow akademickich. GPT-5.4 uzyskal 91% w tym benchmarku.
MMLU Pro
76%
MMLU Pro: MMLU Edycja Profesjonalna. Ulepszona wersja MMLU z 12 032 pytaniami i trudniejszym formatem 10 opcji. GPT-5.4 uzyskal 76% w tym benchmarku.
SimpleQA
56.7%
SimpleQA: Benchmark dokładnosci faktycznej. Testuje zdolnosc modelu do udzielania dokladnych, faktycznych odpowiedzi. GPT-5.4 uzyskal 56.7% w tym benchmarku.
IFEval
92%
IFEval: Ocena przestrzegania instrukcji. Mierzy jak dobrze model przestrzega konkretnych instrukcji i ograniczen. GPT-5.4 uzyskal 92% w tym benchmarku.
AIME 2025
100%
AIME 2025: Amerykanski Zaproszeniowy Egzamin Matematyczny. Zadania matematyczne poziomu konkursowego z prestizowego egzaminu AIME. GPT-5.4 uzyskal 100% w tym benchmarku.
MATH
88.6%
MATH: Rozwiazywanie problemow matematycznych. Kompleksowy benchmark matematyczny testujacy rozwiazywanie problemow z algebry, geometrii, analizy. GPT-5.4 uzyskal 88.6% w tym benchmarku.
GSM8k
99%
GSM8k: Matematyka szkoly podstawowej 8K. 8 500 zadan matematycznych poziomu szkoly podstawowej. GPT-5.4 uzyskal 99% w tym benchmarku.
MGSM
96%
MGSM: Wielojezyczna matematyka szkolna. Benchmark GSM8k przetlumaczony na 10 jezykow. GPT-5.4 uzyskal 96% w tym benchmarku.
MathVista
74%
MathVista: Matematyczne rozumowanie wizualne. Testuje zdolnosc rozwiazywania problemow matematycznych z elementami wizualnymi. GPT-5.4 uzyskal 74% w tym benchmarku.
SWE-Bench
52.8%
SWE-Bench: Benchmark inzynierii oprogramowania. Modele AI probuja rozwiazac prawdziwe problemy GitHub w projektach Python. GPT-5.4 uzyskal 52.8% w tym benchmarku.
HumanEval
85.1%
HumanEval: Zadania programistyczne Python. 164 zadania programistyczne, gdzie modele musza generowac poprawne implementacje funkcji Python. GPT-5.4 uzyskal 85.1% w tym benchmarku.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark programowania na zywo. Testuje umiejetnosci programowania na ciagle aktualizowanych, rzeczywistych wyzwaniach. GPT-5.4 uzyskal 72.5% w tym benchmarku.
MMMU
84.2%
MMMU: Rozumienie multimodalne. Benchmark rozumienia multimodalnego z 30 przedmiotow uniwersyteckich. GPT-5.4 uzyskal 84.2% w tym benchmarku.
MMMU Pro
61%
MMMU Pro: MMMU Edycja Profesjonalna. Ulepszona wersja MMMU z trudniejszymi pytaniami. GPT-5.4 uzyskal 61% w tym benchmarku.
ChartQA
89%
ChartQA: Pytania i odpowiedzi o wykresach. Testuje zdolnosc rozumienia i analizowania informacji z wykresow i diagramow. GPT-5.4 uzyskal 89% w tym benchmarku.
DocVQA
94%
DocVQA: Wizualne pytania o dokumentach. Testuje zdolnosc wydobywania informacji z obrazow dokumentow. GPT-5.4 uzyskal 94% w tym benchmarku.
Terminal-Bench
55%
Terminal-Bench: Zadania terminal/CLI. Testuje zdolnosc wykonywania operacji wiersza polecen. GPT-5.4 uzyskal 55% w tym benchmarku.
ARC-AGI
52.9%
ARC-AGI: Abstrakcja i rozumowanie. Testuje plynna inteligencje poprzez nowe lamiglowki rozpoznawania wzorow. GPT-5.4 uzyskal 52.9% w tym benchmarku.

O GPT-5.4

Dowiedz sie o mozliwosciach GPT-5.4, funkcjach i jak moze pomoc Ci osiagnac lepsze wyniki.

Frontier modelu długokontekstowego reasoning

GPT-5.4 stanowi ewolucję serii GPT-5 o wysokiej wydajności. Posiada wiodący w branży context window o wielkości 1,05 miliona tokenów. Model ten obsługuje obszerne zbiory danych, takie jak ogromne repozytoria kodu czy wieloletnie logi historyczne, bez utraty wierności logicznej. Interaktywny Mid-Response Steering pozwala użytkownikom monitorować i dostosowywać plan myślenia modelu w czasie rzeczywistym, co gwarantuje, że wynik końcowy jest zgodny ze złożonymi, wieloetapowymi intencjami.

Zunifikowana inteligencja i autonomiczne działanie

Technicznie GPT-5.4 łączy światowej klasy zdolności programistyczne poprzednich gałęzi Codex z kreatywnymi niuansami standardowej serii GPT-5. Posiada specjalistyczny tryb Thinking z regulowanymi poziomami wysiłku, w tym trybami Standard, Extended i Heavy. Wykorzystuje wzmocnione przetwarzanie chain-of-thought do rozwiązywania problemów naukowych i logicznych na poziomie doktoratu. Poza tekstem, GPT-5.4 wprowadza natywne możliwości computer use – osiąga wynik 75% w zadaniach weryfikowanych przez OSWorld poprzez interpretację zrzutów ekranu i wykonywanie kliknięć opartych na współrzędnych.

Wydajność i niezawodność

OpenAI raportuje 33-procentowy spadek błędów na poziomie twierdzeń w porównaniu do poprzedników, co czyni GPT-5.4 głównym wyborem dla autonomicznych agentów i wsparcia decyzji o wysokiej stawce. Model został zaprojektowany pod kątem efektywności tokenów i energii, co pozwala na tańsze przetwarzanie długiego kontekstu niż w poprzednich iteracjach. Niezależnie od tego, czy zarządza całą bazą kodu przedsiębiorstwa, czy działa jako autonomiczny agent planujący, GPT-5.4 wyznacza nowy standard niezawodności i wydajności agentowej.

GPT-5.4

Przypadki uzycia dla GPT-5.4

Odkryj rozne sposoby wykorzystania GPT-5.4 do osiagniecia swietnych wynikow.

Refaktoryzacja kodu na dużą skalę

Systematyczne przepisywanie starych baz kodu przekraczających 300 000 linii z rygorystycznym przestrzeganiem standardów architektonicznych.

Autonomiczne modelowanie finansowe

Tworzenie złożonych modeli trójstronnych (rachunek zysków i strat, bilans, przepływy pieniężne), gdzie AI dokonuje ich uzgodnienia.

Interaktywne projektowanie systemów

Tworzenie symulacji 3D lub gier opartych na fizyce poprzez sterowanie logiką modelu w trakcie procesu generowania.

Agentic Computer Use

Wykonywanie wieloetapowych zadań biurowych, takich jak masowe wprowadzanie danych, zarządzanie pocztą e-mail i testowanie oprogramowania poprzez natywną interakcję z UI.

Analiza prawna długiego kontekstu

Porównywanie setek dokumentów prawnych w celu identyfikacji niespójności lub ekstrakcji konkretnych klauzul z wysoką dokładnością odzyskiwania informacji.

Wsparcie badań naukowych na poziomie doktoratu

Rozwiązywanie złożonych dowodów matematycznych i problemów naukowych przy użyciu trybu Heavy Reasoning dla zweryfikowanych ciągów logicznych.

Mocne strony

Ograniczenia

Ogromny context window 1,05 mln: Zapewnia wiodącą w branży pojemność do głębokiej analizy potężnych baz kodu i zestawów dokumentów bez utraty spójności kontekstu.
Opóźnienia reasoning: Włączenie trybu Heavy Thinking może skutkować czasem oczekiwania rzędu kilku minut w przypadku złożonej logiki lub dużych generacji kodu.
Interaktywne myślenie: Unikalna nawigacja w trakcie odpowiedzi pozwala użytkownikom sterować ścieżkami reasoning, znacznie redukując marnowanie generacji i tokenów.
Limity szybkości (Rate Limiting): Podczas początkowego wprowadzania na rynek użytkownicy mogą napotkać agresywne limity wiadomości lub tymczasowe błędy konta w miarę skalowania pojemności.
Natywny computer use: Wysoka precyzja interakcji z UI (75% w OSWorld) umożliwia modelowi pracę bezpośrednio w środowiskach pulpitu i przeglądarki.
Nieliniowe skalowanie: W niektórych zadaniach kreatywnych zauważono, że lżejsze tryby reasoning przewyższają tryby ciężkie pod względem estetycznych szczegółów.
Ekstremalna wydajność tokenów: Zoptymalizowana architektura zapewnia wydajność na poziomie frontier modelu z 2026 roku, przy niższych opóźnieniach i zużyciu energii niż w poprzednich wersjach GPT-5.
Context Rot przy 1M: Mimo że okno kontekstowe jest duże, dokładność wyszukiwania informacji znacząco spada przy przejściu z 256 tys. do 1 mln tokenów.

Szybki start API

openai/gpt-5.4

Zobacz dokumentacje
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Zainstaluj SDK i zacznij wykonywac wywolania API w kilka minut.

Co mowia ludzie o GPT-5.4

Zobacz, co spolecznosc mysli o GPT-5.4

GPT 5.4 w Codex to ogromna poprawa... widziałem, jak pracował przez 150 minut bez przerwy bez utraty kontekstu.
ArchMeta1868
reddit
Możliwości GPT 5.4 w projektowaniu 3D są nie do pobicia. Sposób, w jaki poradził sobie z przezroczystością i fizyką w moim symulatorze statków, był przerażająco dokładny.
AI_Creative_Daily
twitter
Korekta kursu w trakcie odpowiedzi jest niesamowita. Widzę, dokąd zmierza model i mogę to naprawić, zanim zmarnuje tokeny.
dev_guru_99
reddit
Pokonał ludzi w 83% przypadków w 44 różnych zawodach. Prawnik. Księgowy. Analityk finansowy. Administrator.
Josh Kale
twitter
OpenAI w końcu naprawiło wąskie gardło wyjścia. 128 tys. wyjściowych tokenów to marzenie dla programistów budujących aplikacje full-stack.
TheCodeChannel
youtube
Opóźnienia przy computer use nadal występują, ale precyzja jest wystarczająco wysoka, by radzić sobie ze złożonymi procesami SAP, co jest szalone.
enterprise_sysadmin
hackernews

Filmy o GPT-5.4

Ogladaj samouczki, recenzje i dyskusje o GPT-5.4

GPT 5.4 już jest i być może mamy właśnie nowy najlepszy model na świecie.

Thinking w GPT 5.4 może teraz dostarczyć wstępny plan swojego myślenia... co pozwala kierować modelem.

Ten interaktywny element rozwiązuje problem czarnej skrzynki w modelach reasoning.

Szybkość w porównaniu do o1-preview jest ogromna w zadaniach standardowych.

Widzisz reasoning, który faktycznie wydaje się spójny podczas długich konwersacji.

GPT 5.4... nie został zbudowany do czatowania. Został zbudowany do pracy.

Odroczone ładowanie... zredukowało całkowite zużycie tokenów o 47% bez utraty dokładności.

Funkcjonalność computer use śledzi elementy UI za pomocą systemu opartego na współrzędnych.

Przetestowałem go na starszej bazie kodu Java i faktycznie zrozumiał zależności między plikami.

Wkraczamy w świat, w którym AI jest kontrolerem systemu operacyjnego.

1 milion 50 tysięcy tokenów context window. To bardzo długi context window.

Możesz nawigować po nim, gdy model myśli, co jest zdecydowanie bardziej efektywne w użyciu.

Cena jest wysoka, ale w przypadku dużych zestawów dokumentów to jedyny model, który działa.

Tryb Thinking można dostosować w zależności od złożoności Twojego promptu.

Wydaje się bardziej niezawodny w przywoływaniu faktów niż jakakolwiek poprzednia wersja GPT.

Wiecej niz tylko prompty

Przyspiesz swoj workflow z automatyzacja AI

Automatio laczy moc agentow AI, automatyzacji web i inteligentnych integracji, aby pomoc Ci osiagnac wiecej w krotszym czasie.

Agenci AI
Automatyzacja web
Inteligentne workflow

Porady Pro dla GPT-5.4

Wskazówki ekspertów, aby w pełni wykorzystać GPT-5.4.

Dostosowanie poziomu myślenia (Thinking Effort)

Użyj parametrów Standard, Extended lub Heavy, aby zrównoważyć potrzebę dokładności z szybkością generowania i kosztem.

Weryfikacja planu myślenia

Monitoruj wstępny plan dostarczany przez model i używaj Mid-Response Steering, aby go skorygować, jeśli logika zbacza z kursu.

Wykorzystanie odroczonego ładowania narzędzi

W przypadku agentic workflows używaj rejestru odroczonego ładowania (deferred loading), aby zredukować początkowe koszty tokenów nawet o 47%.

Stosowanie kontraktów kompletności

Wyraźnie zdefiniuj w swoim prompt, co oznacza „zakończenie zadania”, aby model był bardziej wytrwały podczas długotrwałych procesów.

Vision w maksymalnej rozdzielczości

Przesyłaj wysokiej jakości obrazy o rozdzielczości do 10,24 mln pikseli w celu precyzyjnej inspekcji wizualnej elementów UI lub schematów technicznych.

Opinie

Co mowia nasi uzytkownicy

Dolacz do tysiecy zadowolonych uzytkownikow, ktorzy przeksztalcili swoj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Powiazane AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Często Zadawane Pytania o GPT-5.4

Znajdź odpowiedzi na częste pytania o GPT-5.4