openai

GPT-5.5

GPT-5.5 je OpenAI-ov flagship frontier model s 1M context windowom i pet razina reasoning napora, optimiziran za autonomne agentic radne procese i kodiranje.

Agentic AIOpenAIGPT-5Autonomno kodiranjeFrontier Models
openai logoopenaiGPT-523. travnja 2026.
Kontekst
1.0Mtokena
Maks. izlaz
128Ktokena
Ulazna cijena
$5.00/ 1M
Izlazna cijena
$30.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
93.6%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.5 je postigao 93.6% na ovom benchmarku.
HLE
52.2%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.5 je postigao 52.2% na ovom benchmarku.
MMLU
92.5%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.5 je postigao 92.5% na ovom benchmarku.
MMLU Pro
88.1%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.5 je postigao 88.1% na ovom benchmarku.
SimpleQA
57%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.5 je postigao 57% na ovom benchmarku.
IFEval
92.1%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.5 je postigao 92.1% na ovom benchmarku.
AIME 2025
100%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.5 je postigao 100% na ovom benchmarku.
MATH
98%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.5 je postigao 98% na ovom benchmarku.
GSM8k
98.5%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.5 je postigao 98.5% na ovom benchmarku.
MGSM
96.4%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.5 je postigao 96.4% na ovom benchmarku.
MathVista
76%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.5 je postigao 76% na ovom benchmarku.
SWE-Bench
58.6%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.5 je postigao 58.6% na ovom benchmarku.
HumanEval
94.2%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.5 je postigao 94.2% na ovom benchmarku.
LiveCodeBench
78%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.5 je postigao 78% na ovom benchmarku.
MMMU
88.3%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.5 je postigao 88.3% na ovom benchmarku.
MMMU Pro
62%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.5 je postigao 62% na ovom benchmarku.
ChartQA
94%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.5 je postigao 94% na ovom benchmarku.
DocVQA
95%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.5 je postigao 95% na ovom benchmarku.
Terminal-Bench
82.7%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.5 je postigao 82.7% na ovom benchmarku.
ARC-AGI
85%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.5 je postigao 85% na ovom benchmarku.

O modelu GPT-5.5

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.5.

Prijelaz na agentic inteligenciju

GPT-5.5 predstavlja prijelaz s velikih jezičnih modela na velike agentic modele. Dizajniran je da funkcionira kao autonomni suigrač, a ne kao jednostavan chatbot, sposoban za planiranje, izvršavanje i samoprovjeru kompleksnih radnih procesa unutar digitalnih okruženja. Glavna inovacija modela je implementacija varijabilnih razina napora zaključivanja (reasoning effort), što developerima daje detaljnu kontrolu nad vremenom razmišljanja modela i povezanim troškovima računalnih resursa.

Tehnička učinkovitost i vid

Tehnički, GPT-5.5 zadržava context window od milijun tokena GPT-5 obitelji, ali uvodi 40% povećanje učinkovitosti tokena. To znači da, iako se cijena po tokenu udvostručila u odnosu na seriju 5.4, stvarni trošak za kompleksne zadatke je samo 20% viši. Mogućnosti vida modela također su znatno nadograđene, dosežući performanse bliske ljudskim na tehničkim dijagramima i zadacima prostornog zaključivanja poput ARC-AGI v2.

Optimizacija za autonomiju

Posebno je učinkovit za autonomno kodiranje, gdje može upravljati cijelim repozitorijima i sam provjeravati svoje ispravke grešaka. Korištenjem novog parametra reasoning_effort, korisnici mogu prebacivati između pet različitih dubina logike, što ga čini prvim modelom koji nudi kliznu skalu inteligencije za rješavanje problema visokog značaja.

GPT-5.5

Slučajevi korištenja za GPT-5.5

Otkrijte različite načine korištenja modela GPT-5.5 za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Upravljanje cijelim repozitorijima koda, ispravljanje grešaka i implementacija ažuriranja bez ljudskog nadzora.

Analiza znanstvenih istraživanja

Obrada tisuća istraživačkih radova unutar 1M windowa za sintetiziranje novih hipoteza.

Kompleksno financijsko modeliranje

Izgradnja i revizija zamršenih korporativnih financijskih struktura s matematičkom preciznošću na razini doktorskog studija.

Višestupanjski agentic radni procesi

Stvaranje i izvršavanje rekurzivnih popisa zadataka za autonomno postizanje dugoročnih digitalnih ciljeva.

Tehnička vizualna analiza

Interpretacija kompleksnih inženjerskih nacrta i dijagrama strujnih krugova za automatiziranu kontrolu kvalitete.

Kompresija podataka visoke vjernosti

Pretvaranje masivnih skupova podataka u sažetke bogate tokenima koji zadržavaju duboke semantičke nijanse.

Prednosti

Ograničenja

Vrhunske agentic performanse: Postiže vodeći rezultat u industriji od 82,7 na Terminal-Bench 2.0 za računalnu upotrebu i terminalske zadatke.
Visoka stopa halucinacija: Pokazuje stopu halucinacija od 86% na benchmarkovima činjeničnog znanja unatoč visokim sposobnostima zaključivanja.
Masivan Context Window: Podržava 1M token input context, omogućujući analizu punih repozitorija koda i velikih istraživačkih korpusa.
Premium strategija cijena: S cijenom od 5/30 USD po 1M tokens, znatno je skuplji od prethodnih generacija i open-source konkurenata.
Savršeno matematičko zaključivanje: Postigao savršen rezultat od 100% na olimpijskom matematičkom benchmarku AIME 2025.
Nedostatak video unosa: Za razliku od nekih multimodalnih konkurenata kao što je Gemini, GPT-5.5 nema izvornu sposobnost obrade videa u tekst.
Fleksibilan Reasoning Effort: Sadrži 5 različitih razina napora zaključivanja koje developerima omogućuju balansiranje latencije, troškova i inteligencije.
Praznine u kreativnom pisanju: Rezultati na benchmarkovima za kreativno pisanje i poetski izričaj zaostaju za flagship modelima tvrtke Anthropic.

API brzi početak

openai/gpt-5.5

Pogledaj dokumentaciju
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const response = await openai.chat.completions.create({
    model: "gpt-5.5",
    messages: [
      { role: "system", content: "You are an autonomous coding agent." },
      { role: "user", content: "Debug this Python repository and verify the fixes." }
    ],
    reasoning_effort: "xhigh"
  });

  console.log(response.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.5

Pogledajte što zajednica misli o modelu GPT-5.5

Stopa halucinacija je ludost, 86% na činjenicama? To je kao genijalac koji odbija reći 'ne znam'.
@ArtificialAnlys
twitter
GPT-5.5 Pro je 180 USD/mil output. Službeno smo ušli u luksuznu eru AI-ja.
@skeptrune
twitter
Došla je era proto-AGI-ja. Više to nije chatbot; to je suigrač.
lostlifon
reddit
Ljestvica zaključivanja s 5 razina napora je najkorisnije izdanje značajki od uvođenja poziva funkcija (function calling).
DataLearnerAI
hackernews
OpenAI je napravio odličan posao. Skup je, ali stvarno radi za vrhunski agentic rad.
David Ondrej
youtube
Na 20 benchmarkova GPT-5.5 postiže nešto više rezultate od Opus 4.7, ali sada košta 5 USD po milijun tokena.
@rxhit05
twitter

Videozapisi o modelu GPT-5.5

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.5

Sposobnost zaključivanja kod ovog modela je nebo i zemlja u odnosu na sve što smo do sada vidjeli.

Doslovno je izgradio cijelu SaaS aplikaciju u jednom pokušaju bez da sam morao popraviti ijedan bug.

Uz 5 USD po milijun tokena, stvarno morate biti sigurni da vam treba ova razina inteligencije.

Uspoređujući ovo s open modelima, još uvijek postoji značajna razlika u agentic autonomiji.

Parametri reasoning efforta su ovdje glavna priča za developere.

OpenAI je napravio odličan posao. Skup je, ali stvarno radi za vrhunski agentic rad.

Vizualno razumijevanje UI izgleda sada je savršeno točno.

Upravlja vlastitim stanjem kroz višestruke korake puno bolje nego GPT-5.4.

Možete mu praktički dati terminal i pustiti ga da radi dvadeset minuta.

Cijena je visoka, ali vrijeme ušteđeno na debagiranju vrijedi toga.

Context window od punih milijun tokena mijenja pravila igre za analizu dugih dokumenata.

Ako gradite autonomne agente, ovo je trenutno jedini model koji djeluje istinski autonomno.

Primijetio sam visoku stopu halucinacija kod vrlo specifičnih povijesnih činjenica.

Uštede u učinkovitosti znače da koristite manje tokena za isti složeni zadatak.

Ovo je specijalizirani alat za developere više nego povremeni chatbot.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.5

Stručni savjeti za maksimalno iskorištavanje GPT-5.5.

Koristite Reasoning Effort xhigh

Postavite parametar reasoning_effort na 'xhigh' za zadatke koji zahtijevaju intenzivnu logiku, poput matematike i arhitektonskog dizajna.

Iskoristite veliki Context Window

Osigurajte potpunu dokumentaciju i context baze koda u početnom system promptu kako biste u potpunosti iskoristili 1M window.

Implementirajte petlje za samokritiku

Zatražite rekurzivnu provjeru gdje model kritizira svoj prvi output kako bi se smanjila izvorna stopa halucinacija.

Agentic provjera

Koristite xhigh razinu napora za agentic zadatke kako biste osigurali da model sam provjerava svaki korak prije prelaska na sljedeći.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Često Postavljana Pitanja o GPT-5.5

Pronađite odgovore na česta pitanja o GPT-5.5