openai

GPT-5.4

GPT-5.4 är OpenAIs frontier model med ett 1,05M context window och Extreme Reasoning. Den briljerar på autonom UI-interaktion och dataanalys i långa format.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 mars 2026
Kontext
1.1Mtokens
Max utdata
128Ktokens
Inmatningspris
$2.50/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
84.2%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. GPT-5.4 fick 84.2% pa detta benchmark.
HLE
42%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. GPT-5.4 fick 42% pa detta benchmark.
MMLU
91%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. GPT-5.4 fick 91% pa detta benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. GPT-5.4 fick 76% pa detta benchmark.
SimpleQA
56.7%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. GPT-5.4 fick 56.7% pa detta benchmark.
IFEval
92%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. GPT-5.4 fick 92% pa detta benchmark.
AIME 2025
100%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. GPT-5.4 fick 100% pa detta benchmark.
MATH
88.6%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. GPT-5.4 fick 88.6% pa detta benchmark.
GSM8k
99%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. GPT-5.4 fick 99% pa detta benchmark.
MGSM
96%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. GPT-5.4 fick 96% pa detta benchmark.
MathVista
74%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. GPT-5.4 fick 74% pa detta benchmark.
SWE-Bench
52.8%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. GPT-5.4 fick 52.8% pa detta benchmark.
HumanEval
85.1%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. GPT-5.4 fick 85.1% pa detta benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. GPT-5.4 fick 72.5% pa detta benchmark.
MMMU
84.2%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. GPT-5.4 fick 84.2% pa detta benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. GPT-5.4 fick 61% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. GPT-5.4 fick 89% pa detta benchmark.
DocVQA
94%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. GPT-5.4 fick 94% pa detta benchmark.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. GPT-5.4 fick 55% pa detta benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. GPT-5.4 fick 52.9% pa detta benchmark.

Om GPT-5.4

Lar dig om GPT-5.4s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Frontlinjen för Long-Context Reasoning

GPT-5.4 representerar den högpresterande utvecklingen av GPT-5-serien. Den har ett branschledande 1,05 miljoners token context window. Denna modell hanterar omfattande dataset, som enorma kodarkiv eller fleråriga historiska loggar, utan att tappa sin resonemangsförmåga. Den interaktiva funktionen för Mid-Response Steering gör att användare kan övervaka och justera modellens tänkande i realtid. Detta säkerställer att resultatet stämmer överens med komplexa intentioner i flera steg.

Förenad intelligens och autonom handling

Tekniskt sett förenar GPT-5.4 den världsledande kodningsstyrkan från tidigare Codex-grenar med de kreativa nyanserna i standard-GPT-5-serien. Den har ett specialiserat Thinking-läge med justerbara ansträngningsnivåer, inklusive lägena Standard, Extended och Heavy. Den använder förstärkt chain-of-thought för att lösa vetenskapliga problem och logikproblem på doktorsnivå. Utöver text introducerar GPT-5.4 inbyggda funktioner för datoranvändning. Den uppnår ett resultat på 75 % i OSWorld-verifierade uppgifter genom att tolka visuella skärmdumpar och utföra koordinatbaserade klick.

Effektivitet och pålitlighet

OpenAI rapporterar en minskning på 33 % av felaktigheter jämfört med föregångare. Detta gör GPT-5.4 till ett förstahandsval för autonoma agenter och beslutsstöd i affärskritiska situationer. Den är konstruerad för token- och energieffektivitet, vilket möjliggör billigare långkontext-bearbetning än tidigare iterationer. Oavsett om den hanterar en hel företagsbaserad kodbas eller agerar som en autonom schemaläggningsagent, sätter GPT-5.4 en ny standard för tillförlitlighet och agentic prestanda.

GPT-5.4

Anvandningsfall for GPT-5.4

Upptack de olika satten du kan anvanda GPT-5.4 for att uppna fantastiska resultat.

Storskalig kodrefaktorering

Systematisk omskrivning av äldre kodbaser på över 300 000 rader med strikt efterlevnad av arkitektoniska standarder.

Autonom finansiell modellering

Byggande av komplexa finansiella modeller där AI:n stämmer av resultaträkningar, balansräkningar och kassaflöden.

Interaktiv systemdesign

Utveckling av 3D-simuleringar eller fysikbaserade spel genom att styra modellens logikväg under genereringsprocessen.

Agentic datoranvändning

Utförande av skrivbordsuppgifter i flera steg såsom massinmatning av data, e-posthantering och mjukvarutestning via direkt UI-interaktion.

Juridisk analys med lång kontext

Korsreferering av hundratals juridiska dokument för att identifiera inkonsekvenser eller extrahera specifika klausuler med hög träffsäkerhet.

Forskningsstöd på doktorsnivå

Lösning av komplexa matematiska bevis och vetenskapliga problem med hjälp av Heavy Reasoning-läget för verifierade logiska kedjor.

Styrkor

Begransningar

Massivt 1,05M context window: Ger branschledande kapacitet för djupanalys av enorma kodbaser och dokument utan att kontexten försämras.
Resonemangs-latency: Att aktivera Heavy Thinking-läget kan resultera i väntetider på flera minuter för komplex logik eller stora kodgenereringar.
Interaktivt tänkande: Unik navigering mitt i svaret gör att användare kan styra resonemangsvägar, vilket avsevärt minskar slöseri med genereringar och tokens.
Rate limiting: Under den initiala utrullningen kan användare stöta på aggressiva meddelandegränser eller tillfälliga kontofel i takt med att kapaciteten skalas upp.
Inbyggd datoranvändning: Högprecisionsinteraktion med UI (75 % på OSWorld) gör att modellen kan arbeta direkt i skrivbords- och webbläsarmiljöer.
Icke-linjär skalning: I vissa kreativa uppgifter har lättare reasoning-lägen visat sig prestera bättre än tunga lägen när det gäller estetiska detaljer.
Extrem token-effektivitet: Optimerad arkitektur levererar 2026-frontier prestanda med lägre latency och energiförbrukning än tidigare GPT-5-versioner.
Kontextförlust vid 1M: Även om fönstret är stort, sjunker söknoggrannheten avsevärt när man rör sig från 256K till 1M tokens.

API snabbstart

openai/gpt-5.4

Visa dokumentation
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om GPT-5.4

Se vad communityt tycker om GPT-5.4

GPT 5.4 i Codex är en enorm förbättring... jag har faktiskt sett den arbeta i 150 minuter i sträck utan att förlora kontexten.
ArchMeta1868
reddit
GPT 5.4:s 3D-designförmåga är oöverträffad. Hur den hanterade transparens och fysik i min skeppssimulator var kusligt exakt.
AI_Creative_Daily
twitter
Kurskorrigeringen mitt i svaret är otrolig. Jag kan faktiskt se vart modellen är på väg och fixa det innan den slösar tokens.
dev_guru_99
reddit
Den slog människor 83 % av gångerna över 44 olika jobb. Advokat. Revisor. Finansanalytiker. Administratör.
Josh Kale
twitter
OpenAI löste äntligen output-flaskhalsen. 128k output tokens är en dröm för utvecklare som bygger full-stack applikationer.
TheCodeChannel
youtube
Latency för datoranvändning finns fortfarande där, men precisionen är tillräckligt hög för att hantera komplexa SAP-arbetsflöden, vilket är galet.
enterprise_sysadmin
hackernews

Videor om GPT-5.4

Se handledningar, recensioner och diskussioner om GPT-5.4

GPT 5.4 är här och vi har kanske äntligen en ny bästa modell på planeten.

GPT 5.4 Thinking kan nu ge en förhandsplan för sitt tänkande... låter dig guida modellen.

Detta interaktiva element löser "black box"-problemet med reasoning-modeller.

Hastigheten jämfört med o1-preview är natt och dag för standarduppgifter.

Du ser ett resonemang som faktiskt känns konsekvent över långa konversationer.

GPT 5.4... byggdes inte för att chatta. Den byggdes för att arbeta.

Uppskjuten laddning... minskade den totala token-användningen med 47 % utan förlust i noggrannhet.

Datoranvändningsfunktionaliteten spårar UI-element med ett koordinatbaserat system.

Jag testade den med en äldre Java-kodbas och den förstod faktiskt beroenden mellan filerna.

Vi är på väg in i en värld där AI:n är operativsystemets kontrollenhet.

1 miljon 50 000 token context window. Detta är ett väldigt långt context window.

Navigera i den medan den tänker, vilket definitivt är mer effektivt att använda.

Prissättningen är hög, men för stora dokumentuppsättningar är det den enda modellen som fungerar.

Thinking-läget kan justeras baserat på komplexiteten i din prompt.

Den känns mer pålitlig när det gäller faktabaserad återkallning än någon tidigare GPT-version.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for GPT-5.4

Experttips for att hjalpa dig fa ut det mesta av GPT-5.4 och uppna battre resultat.

Justera Thinking-ansträngning

Använd parametrarna Standard, Extended eller Heavy för att balansera behovet av noggrannhet mot genereringshastighet och kostnad.

Granska Thinking-planen

Övervaka den inledande planen som modellen tillhandahåller och använd Mid-Response Steering för att korrigera om logiken avviker.

Utnyttja uppskjuten laddning av verktyg

För agentic arbetsflöden, använd registret för uppskjuten laddning för att minska den initiala kostnaden för tokens med upp till 47 %.

Använd kontrakt för fullständighet

Definiera uttryckligen vad "färdigt" innebär i din prompt för att göra modellen mer ihärdig under långvariga uppgifter.

Vision med maximal upplösning

Ladda upp högupplösta bilder på upp till 10,24 miljoner pixlar för exakt visuell granskning av UI-element eller tekniska diagram.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Vanliga fragor om GPT-5.4

Hitta svar pa vanliga fragor om GPT-5.4