openai

GPT-5.5

GPT-5.5 är OpenAI:s ledande frontier model med 1M context window och fem nivåer för reasoning-ansträngning, optimerad för autonoma agentic-arbetsflöden och...

Agentic AIOpenAIGPT-5Autonom programmeringFrontier Models
openai logoopenaiGPT-523 april 2026
Kontext
1.0Mtokens
Max utdata
128Ktokens
Inmatningspris
$5.00/ 1M
Utdatapris
$30.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
93.6%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. GPT-5.5 fick 93.6% pa detta benchmark.
HLE
52.2%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. GPT-5.5 fick 52.2% pa detta benchmark.
MMLU
92.5%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. GPT-5.5 fick 92.5% pa detta benchmark.
MMLU Pro
88.1%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. GPT-5.5 fick 88.1% pa detta benchmark.
SimpleQA
57%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. GPT-5.5 fick 57% pa detta benchmark.
IFEval
92.1%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. GPT-5.5 fick 92.1% pa detta benchmark.
AIME 2025
100%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. GPT-5.5 fick 100% pa detta benchmark.
MATH
98%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. GPT-5.5 fick 98% pa detta benchmark.
GSM8k
98.5%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. GPT-5.5 fick 98.5% pa detta benchmark.
MGSM
96.4%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. GPT-5.5 fick 96.4% pa detta benchmark.
MathVista
76%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. GPT-5.5 fick 76% pa detta benchmark.
SWE-Bench
58.6%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. GPT-5.5 fick 58.6% pa detta benchmark.
HumanEval
94.2%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. GPT-5.5 fick 94.2% pa detta benchmark.
LiveCodeBench
78%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. GPT-5.5 fick 78% pa detta benchmark.
MMMU
88.3%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. GPT-5.5 fick 88.3% pa detta benchmark.
MMMU Pro
62%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. GPT-5.5 fick 62% pa detta benchmark.
ChartQA
94%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. GPT-5.5 fick 94% pa detta benchmark.
DocVQA
95%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. GPT-5.5 fick 95% pa detta benchmark.
Terminal-Bench
82.7%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. GPT-5.5 fick 82.7% pa detta benchmark.
ARC-AGI
85%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. GPT-5.5 fick 85% pa detta benchmark.

Om GPT-5.5

Lar dig om GPT-5.5s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Övergång till agentic intelligens

GPT-5.5 representerar övergången från stora språkmodeller till stora agentic-modeller. Den är utformad för att fungera som en autonom lagkamrat snarare än en enkel chattbot, kapabel att planera, utföra och själv verifiera komplexa arbetsflöden i digitala miljöer. Modellens främsta innovation är implementeringen av variabla nivåer för reasoning-ansträngning, vilket ger utvecklare granulär kontroll över modellens tänkande och tillhörande beräkningskostnader.

Teknisk effektivitet och vision

Tekniskt sett behåller GPT-5.5 1-miljon-token context window från GPT-5-familjen men introducerar en 40 % vinst i token-effektivitet. Det innebär att även om prissättningen per token har fördubblats jämfört med 5.4-serien, är den faktiska kostnaden för komplexa uppgifter bara 20 % högre. Modellens vision-kapacitet har också uppgraderats avsevärt och når nu nästan mänsklig prestanda på tekniska diagram och uppgifter för spatialt resonemang som ARC-AGI v2.

Optimering för autonomi

Den är särskilt effektiv för autonom programmering, där den kan hantera hela kodförråd och verifiera sina egna buggfixar. Genom att använda den nya parametern reasoning_effort kan användare växla mellan fem distinkta logikdjup, vilket gör det till den första modellen som erbjuder en glidande skala av intelligens för problemlösning med hög insats.

GPT-5.5

Anvandningsfall for GPT-5.5

Upptack de olika satten du kan anvanda GPT-5.5 for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Hantering av hela kodförråd, felrättning och driftsättning av uppdateringar utan mänsklig övervakning.

Analys av vetenskaplig forskning

Bearbetning av tusentals forskningsrapporter genom ett 1M-fönster för att syntetisera nya hypoteser.

Komplex finansiell modellering

Bygga och granska intrikata företagsfinansiella strukturer med matematisk precision på PhD-nivå.

Agentic arbetsflöden i flera steg

Skapa och utföra rekursiva uppgiftslistor för att autonomt uppnå långsiktiga digitala mål.

Teknisk visuell analys

Tolkning av komplexa tekniska ritningar och kopplingsscheman för automatiserad kvalitetssäkring.

Datakomprimering med hög trohet

Konvertering av enorma datamängder till token-täta sammanfattningar som bevarar djupa semantiska nyanser.

Styrkor

Begransningar

Exceptionell agentic-prestanda: Uppnår branschledande 82,7 på Terminal-Bench 2.0 för datoranvändning och terminaluppgifter.
Hög frekvens av hallucinationer: Uppvisar en hallucinationsfrekvens på 86 % i benchmarks för faktakunskap trots hög förmåga till reasoning.
Massiv context window: Stöder ett context window på 1M tokens, vilket möjliggör analys av hela kodbaser och omfattande forskningsmaterial.
Premium prissättningsstrategi: Med 5 $/30 $ per 1 miljon tokens är den betydligt dyrare än tidigare generationer och open-source-alternativ.
Perfekt matematisk reasoning: Uppnådde full pott (100 %) på AIME 2025, ett benchmark-test för matematisk reasoning på olympiadnivå.
Saknar video-input: Till skillnad från multimodala konkurrenter som Gemini saknar GPT-5.5 inbyggd förmåga att bearbeta video till text.
Flexibel ansträngning för reasoning: Innehåller 5 distinkta nivåer för reasoning-ansträngning, vilket gör att utvecklare kan balansera latency, kostnad och intelligens.
Bristande kreativt skrivande: Prestandan i benchmark-tester för kreativt skrivande och poetiskt uttryck hamnar efter Anthropic's flagship-modeller.

API snabbstart

openai/gpt-5.5

Visa dokumentation
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const response = await openai.chat.completions.create({
    model: "gpt-5.5",
    messages: [
      { role: "system", content: "Du är en autonom programmeringsagent." },
      { role: "user", content: "Debugga detta Python-förråd och verifiera fixarna." }
    ],
    reasoning_effort: "xhigh"
  });

  console.log(response.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om GPT-5.5

Se vad communityt tycker om GPT-5.5

Hallucinationsfrekvensen är galen dock, 86 % på fakta? Det är som ett geni som vägrar säga 'jag vet inte'.
@ArtificialAnlys
twitter
GPT-5.5 Pro kostar 180 $/miljon output. Vi har officiellt gått in i AI:s lyxeran.
@skeptrune
twitter
Proto-AGI-eran har anlänt. Det är inte längre en chattbot; det är en lagkamrat.
lostlifon
reddit
Resonemangsstegen med 5 ansträngningsnivåer är den mest användbara funktionslanseringen sedan function calling.
DataLearnerAI
hackernews
OpenAI har verkligen lyckats med den här. Den är dyr, men den fungerar faktiskt för avancerat agentic-arbete.
David Ondrej
youtube
Över 20 benchmark-tester får GPT-5.5 något högre poäng än Opus 4.7, men den kostar nu också 5 $/miljon tokens.
@rxhit05
twitter

Videor om GPT-5.5

Se handledningar, recensioner och diskussioner om GPT-5.5

Resonemangsförmågan i den här modellen är natt och dag jämfört med allt vi sett tidigare.

Den byggde bokstavligen en hel SaaS-applikation på ett svep utan att jag behövde fixa ett enda fel.

Vid 5 dollar per miljon tokens måste man verkligen vara säker på att man behöver den här nivån av intelligens.

När man jämför med open-source-modeller finns det fortfarande ett märkbart gap i agentic autonomi.

Parametrarna för reasoning-ansträngning är den verkliga nyheten här för utvecklare.

OpenAI har verkligen lyckats med den här. Den är dyr, men den fungerar faktiskt för avancerat agentic-arbete.

Den visuella förståelsen av UI-layouter är helt korrekt nu.

Den hanterar sitt eget tillstånd genom flera steg mycket bättre än GPT-5.4.

Man kan i princip ge den en terminal och låta den jobba i tjugo minuter.

Priset är högt, men tiden man sparar på debugging gör det värt det.

Att fönstret för kontext är på en hel miljon tokens är en game changer för analys av långa dokument.

Om du bygger autonoma agenter är detta den enda modellen just nu som känns genuint autonom.

Jag märkte en hög frekvens av hallucinationer gällande mycket specifika historiska fakta.

Effektivitetsvinsterna innebär att du använder färre tokens för samma komplexa uppgift.

Det är mer ett specialverktyg för utvecklare än en avslappnad chattbot.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for GPT-5.5

Experttips for att hjalpa dig fa ut det mesta av GPT-5.5 och uppna battre resultat.

Använd 'xhigh' för reasoning_effort

Ställ in parametern reasoning_effort till 'xhigh' för logiktunga uppgifter som matematik och arkitektonisk design.

Utnyttja den stora context window

Tillhandahåll fullständig dokumentation och kontext om kodbasen i den initiala system prompten för att dra full nytta av 1M-fönstret.

Implementera självkritiska loopar

Begär en rekursiv granskning där modellen kritiserar sitt första utdata för att mildra den inbyggda frekvensen av hallucinationer.

Agentic verifiering

Använd 'xhigh' som ansträngningsnivå för agentic-uppgifter för att säkerställa att modellen verifierar varje steg innan den går vidare till nästa.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Vanliga fragor om GPT-5.5

Hitta svar pa vanliga fragor om GPT-5.5