openai

GPT-5.4

GPT-5.4 është modeli frontier i OpenAI me një context window prej 1.05M dhe Extreme Reasoning. Ai shkëlqen në ndërveprimin autonom me UI dhe analizën e të...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 Mars, 2026
Konteksti
1.1Mtokena
Output maksimal
128Ktokena
Cmimi i inputit
$2.50/ 1M
Cmimi i outputit
$15.00/ 1M
Modaliteti:TextImage
Aftesite:VizioniMjetetStreamingArsyetimi
Benchmarket
GPQA
84.2%
GPQA: Pyetje shkence niveli pasuniversitar. Benchmark rigoroz me 448 pyetje nga biologjia, fizika dhe kimia. Ekspertet PhD arrijne vetem 65-74% saktesi. GPT-5.4 mori 84.2% ne kete benchmark.
HLE
42%
HLE: Arsyetim niveli ekspert. Teston aftesine e modelit per te demonstruar arsyetim niveli ekspert ne fusha te specializuara. GPT-5.4 mori 42% ne kete benchmark.
MMLU
91%
MMLU: Kuptim masiv gjuhor multitask. Benchmark gjitheperfshires me 16,000 pyetje ne 57 lende akademike. GPT-5.4 mori 91% ne kete benchmark.
MMLU Pro
76%
MMLU Pro: MMLU Edicioni Profesional. Version i permiresuar i MMLU me 12,032 pyetje dhe format me te veshtire me 10 opsione. GPT-5.4 mori 76% ne kete benchmark.
SimpleQA
56.7%
SimpleQA: Benchmark saktesie faktike. Teston aftesine e modelit per te dhene pergjigje te sakta, faktike. GPT-5.4 mori 56.7% ne kete benchmark.
IFEval
92%
IFEval: Vleresim i ndjekjes se udhezimeve. Mat sa mire modeli ndjek udhezime dhe kufizime specifike. GPT-5.4 mori 92% ne kete benchmark.
AIME 2025
100%
AIME 2025: Provimi Amerikan i Matematikes me Ftese. Probleme matematike niveli konkursi nga provimi prestigjioz AIME. GPT-5.4 mori 100% ne kete benchmark.
MATH
88.6%
MATH: Zgjidhje problemesh matematike. Benchmark gjitheperfshires matematike qe teston zgjidhjen e problemeve ne algebre, gjeometri, kalkulus. GPT-5.4 mori 88.6% ne kete benchmark.
GSM8k
99%
GSM8k: Matematike shkolle fillore 8K. 8,500 probleme matematike me fjale niveli shkolle fillore. GPT-5.4 mori 99% ne kete benchmark.
MGSM
96%
MGSM: Matematike shkolle fillore shumegjuheshe. Benchmarku GSM8k i perkthyer ne 10 gjuhe. GPT-5.4 mori 96% ne kete benchmark.
MathVista
74%
MathVista: Arsyetim vizual matematik. Teston aftesine per te zgjidhur probleme matematike me elemente vizuale. GPT-5.4 mori 74% ne kete benchmark.
SWE-Bench
52.8%
SWE-Bench: Benchmark inxhinieri software. Modelet AI perpiqen te zgjidhin probleme reale GitHub ne projekte Python. GPT-5.4 mori 52.8% ne kete benchmark.
HumanEval
85.1%
HumanEval: Probleme programimi Python. 164 probleme programimi ku modelet duhet te gjenerojne implementime te sakta funksionesh Python. GPT-5.4 mori 85.1% ne kete benchmark.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark kodimi live. Teston aftesite e kodimit ne sfida programimi te botes reale qe perditsohen vazhdimisht. GPT-5.4 mori 72.5% ne kete benchmark.
MMMU
84.2%
MMMU: Kuptim multimodal. Benchmark kuptimi multimodal nga 30 lende universitare. GPT-5.4 mori 84.2% ne kete benchmark.
MMMU Pro
61%
MMMU Pro: MMMU Edicioni Profesional. Version i permiresuar i MMMU me pyetje me sfiduese. GPT-5.4 mori 61% ne kete benchmark.
ChartQA
89%
ChartQA: Pyetje dhe pergjigje grafiku. Teston aftesine per te kuptuar dhe analizuar informacion nga grafiqet dhe diagramet. GPT-5.4 mori 89% ne kete benchmark.
DocVQA
94%
DocVQA: Pyetje vizuale dokumentesh. Teston aftesine per te nxjerre informacion nga imazhet e dokumenteve. GPT-5.4 mori 94% ne kete benchmark.
Terminal-Bench
55%
Terminal-Bench: Detyra terminal/CLI. Teston aftesine per te kryer operacione te linjes se komandes. GPT-5.4 mori 55% ne kete benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstraksion dhe arsyetim. Teston inteligjencen e lengeshem permes puzzleve te reja te njohjes se modeleve. GPT-5.4 mori 52.9% ne kete benchmark.

Rreth GPT-5.4

Meso per aftesite e GPT-5.4, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Kufiri i Reasoning me Kontekst të Gjatë

GPT-5.4 përfaqëson evolucionin me performancë të lartë të serisë GPT-5. Ai përmban një context window prej 1.05 milionë token, lider në industri. Ky model trajton datasete të gjera, si baza të mëdha kodi ose regjistra historikë shumëvjeçarë, pa humbur besnikërinë e logjikës. Interaktivi Mid-Response Steering u lejon përdoruesve të monitorojnë dhe rregullojnë planin e mendimit të modelit në kohë reale. Kjo siguron që output-i të përputhet me qëllimet komplekse, me shumë hapa.

Inteligjencë e Unifikuar dhe Veprim Autonom

Teknikisht, GPT-5.4 unifikon pikat e forta të kodimit të klasit botëror të degëve të mëparshme Codex me nuancat krijuese të serisë standarde GPT-5. Ai përmban një Thinking mode të specializuar me nivele të rregullueshme të përpjekjes. Këto përfshijnë modalitetet Standard, Extended dhe Heavy. Ai përdor përpunim të përforcuar chain-of-thought për të zgjidhur probleme shkencore dhe logjike në nivel doktorature. Përtej tekstit, GPT-5.4 prezanton aftësi native të përdorimit të kompjuterit. Ai arrin një rezultat prej 75% në detyrat e verifikuara nga OSWorld duke interpretuar screenshots vizuale dhe duke ekzekutuar klikime të bazuara në koordinata.

Efikasitet dhe Besueshmëri

OpenAI raporton një ulje prej 33% të gabimeve në nivel deklarate krahasuar me paraardhësit. Kjo e bën GPT-5.4 një zgjedhje primare për agjentë autonomë dhe mbështetje vendimmarrëse me rëndësi të lartë. Ai është projektuar për efikasitet të token-ve dhe energjisë. Kjo lejon përpunim më të lirë me kontekst të gjatë se iteracionet e mëparshme. Pavarësisht nëse menaxhoni një bazë kodi të tërë ndërmarrjeje ose veproni si një agjent autonom planifikimi, GPT-5.4 vendos një standard të ri për besueshmërinë dhe performancën agentic.

GPT-5.4

Rastet e perdorimit per GPT-5.4

Zbulo menyrat e ndryshme per te perdorur GPT-5.4 per te arritur rezultate te shkelvqyera.

Refaktorim i Kodit në Shkallë të Gjerë

Rishkrimi sistematik i bazave të trashëguara të kodit që tejkalojnë 300,000 rreshta me aderim strikt ndaj standardeve arkitekturore.

Modelim Financiar Autonom

Ndërtimi i modeleve komplekse me tre pasqyra financiare, ku AI pajton pasqyrat e të ardhurave, bilancet dhe flukset e parave.

Dizajn Interaktiv i Sistemit

Zhvillimi i simulimeve 3D ose lojërave të bazuara në fizikë duke drejtuar shtegun e logjikës së modelit gjatë procesit të gjenerimit.

Përdorim Agentic i Kompjuterit

Ekzekutimi i detyrave desktop me shumë hapa, si futja masive e të dhënave, menaxhimi i email-eve dhe testimin e software-it përmes ndërveprimit nativ me UI.

Analizë Ligjore me Kontekst të Gjatë

Kryqëzimi i qindra dokumenteve ligjore për të identifikuar mospërputhjet ose për të nxjerrë klauzola specifike me saktësi të lartë.

Mbështetje Kërkimore në Nivel Doktorature

Zgjidhja e provave komplekse matematikore dhe problemeve shkencore duke përdorur modalitetin Heavy Reasoning për zinxhirë logjikë të verifikuar.

Pikat e forta

Kufizimet

Context Masiv prej 1.05M: Ofron kapacitet lider në industri për analizë të thellë të bazave kolosale të kodit dhe grupeve të dokumenteve pa rënie të kontekstit.
Latency e Reasoning: Aktivizimi i modalitetit Heavy Thinking mund të rezultojë në kohë pritjeje prej disa minutash për logjikë komplekse ose gjenerime të mëdha kodi.
Mendim Interaktiv: Navigimi unik në mes të përgjigjes u lejon përdoruesve të drejtojnë shtigjet e logjikës, duke reduktuar ndjeshëm gjenerimet dhe token-t e humbura.
Rate Limiting: Gjatë lançimit fillestar, përdoruesit mund të hasin limite agresive të mesazheve ose gabime të përkohshme të llogarisë ndërsa kapaciteti shkallëzohet.
Përdorim Nativ i Kompjuterit: Ndërveprimi me saktësi të lartë me UI (75% në OSWorld) i mundëson modelit të punojë drejtpërdrejt brenda ambienteve desktop dhe shfletuesit.
Shkallëzim Jo-Linear: Në disa detyra krijuese, modalitetet e lehta të reasoning janë treguar se tejkalojnë modalitetet e rënda në detaje estetike.
Efikasitet Ekstrem i Token-ve: Arkitektura e optimizuar ofron performancë të nivelit 2026-frontier me latency dhe konsum energjie më të ulët se versionet e mëparshme të GPT-5.
Context Rot në 1M: Edhe pse context window është i madh, saktësia e retrieval bie ndjeshëm kur lëvizim nga 256K në 1M token.

Fillim i shpejte API

openai/gpt-5.4

Shiko dokumentacionin
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per GPT-5.4

Shiko se cfare mendon komuniteti per GPT-5.4

GPT 5.4 në Codex është një përmirësim vërtet i madh... e kam parë të punojë për 150 minuta rresht pa humbur kontekstin.
ArchMeta1868
reddit
Aftësitë e dizajnit 3D të GPT 5.4 janë të pakrahasueshme. Mënyra se si trajtoi transparencën dhe fizikën në simulatorin tim të anijeve ishte tmerrësisht e saktë.
AI_Creative_Daily
twitter
Korigjimi i kursit në mes të përgjigjes është i pabesueshëm. Mund ta shoh vërtet se ku po shkon modeli dhe ta rregulloj përpara se të shpërdorojë token-t.
dev_guru_99
reddit
Ai mundi njerëzit në 83% të rasteve në 44 punë të ndryshme. Avokat. Kontabilist. Analist financiar. Administrator.
Josh Kale
twitter
OpenAI më në fund rregulloi pengesën e output-it. 128k output tokens janë një ëndërr për zhvilluesit që ndërtojnë aplikacione full-stack.
TheCodeChannel
youtube
Latency i përdorimit të kompjuterit është ende aty, por saktësia është mjaft e lartë për të përballuar workflow-t komplekse SAP, gjë që është çmenduri.
enterprise_sysadmin
hackernews

Video rreth GPT-5.4

Shiko tutoriale, rishikime dhe diskutime rreth GPT-5.4

GPT 5.4 është këtu dhe ne mund të kemi vërtet modelin më të mirë në planet.

GPT 5.4 Thinking tani mund të ofrojë një plan paraprak të të menduarit të tij... ju lejon të udhëzoni modelin.

Ky element interaktiv zgjidh problemin e kutisë së zezë të modeleve të reasoning.

Shpejtësia krahasuar me o1-preview është si nata me ditën për detyrat standarde.

Po shihni një logjikë që ndihet vërtet konsistente përgjatë bisedave të gjata.

GPT 5.4... nuk u ndërtua për të biseduar. U ndërtua për të punuar.

Deferred loading... uli përdorimin total të token-ve me 47% pa humbje të saktësisë.

Funksionaliteti i përdorimit të kompjuterit gjurmon elementet e UI me një sistem të bazuar në koordinata.

E testova me një bazë kodi të vjetër Java dhe vërtet i kuptoi varësitë ndërmjet skedarëve.

Po hyjmë në një botë ku AI është kontrolluesi i sistemit operativ.

1 milion e 50,000 token context window. Ky është një context window shumë i gjatë.

Navigoni ndërsa ai është duke menduar, gjë që është padyshim më efikase për t'u përdorur.

Çmimi është i lartë, por për grupe të mëdha dokumentesh, është i vetmi model që funksionon.

Modaliteti Thinking mund të rregullohet bazuar në kompleksitetin e prompt-it tuaj.

Ndihet më i besueshëm në riprodhimin faktik se çdo version i mëparshëm i GPT.

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI
Automatizimi i web-it
Workflow-e inteligjente

Keshilla Pro per GPT-5.4

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga GPT-5.4 dhe te arrish rezultate me te mira.

Ndërroni Thinking Effort

Përdorni parametrat Standard, Extended ose Heavy për të balancuar nevojën për saktësi kundrejt shpejtësisë së gjenerimit dhe kostos.

Rishikoni Planin e Mendimit

Monitoroni planin paraprak të ofruar nga modeli dhe përdorni Mid-Response Steering për ta korrigjuar nëse logjika devijon.

Shfrytëzoni Deferred Tool Loading

Për workflow-t agentic, përdorni regjistrin e deferred loading për të ulur kostot fillestare të token-ve me deri në 47%.

Përdorni Kontratat e Plotësisë

Definoni në mënyrë eksplicite se çfarë do të thotë 'i përfunduar' në prompt-in tuaj për ta bërë modelin më këmbëngulës gjatë detyrave afatgjata.

Vision me Rezolucion Maksimal

Ngarkoni imazhe me besnikëri të lartë deri në 10.24M pikselë për inspektime vizuale precize të elementeve të UI ose diagrameve teknike.

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Pyetjet e bera shpesh rreth GPT-5.4

Gjej pergjigje per pyetjet e zakonshme rreth GPT-5.4