openai

GPT-5.1

GPT-5.1 är OpenAI:s avancerade reasoning-flaggskepp med adaptivt tänkande, nativ multimodalitet och state-of-the-art prestanda inom matematik och teknik...

openai logoopenaiGPT-512 november 2025
Kontext
400Ktokens
Max utdata
128Ktokens
Inmatningspris
$1.25/ 1M
Utdatapris
$10.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
88.1%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. GPT-5.1 fick 88.1% pa detta benchmark.
HLE
32.5%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. GPT-5.1 fick 32.5% pa detta benchmark.
MMLU
90.2%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. GPT-5.1 fick 90.2% pa detta benchmark.
MMLU Pro
81%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. GPT-5.1 fick 81% pa detta benchmark.
SimpleQA
52%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. GPT-5.1 fick 52% pa detta benchmark.
IFEval
91%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. GPT-5.1 fick 91% pa detta benchmark.
AIME 2025
94%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. GPT-5.1 fick 94% pa detta benchmark.
MATH
91%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. GPT-5.1 fick 91% pa detta benchmark.
GSM8k
98.5%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. GPT-5.1 fick 98.5% pa detta benchmark.
MGSM
95%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. GPT-5.1 fick 95% pa detta benchmark.
MathVista
75%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. GPT-5.1 fick 75% pa detta benchmark.
SWE-Bench
76.3%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. GPT-5.1 fick 76.3% pa detta benchmark.
HumanEval
92.5%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. GPT-5.1 fick 92.5% pa detta benchmark.
LiveCodeBench
74%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. GPT-5.1 fick 74% pa detta benchmark.
MMMU
85.4%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. GPT-5.1 fick 85.4% pa detta benchmark.
MMMU Pro
62%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. GPT-5.1 fick 62% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. GPT-5.1 fick 89% pa detta benchmark.
DocVQA
93%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. GPT-5.1 fick 93% pa detta benchmark.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. GPT-5.1 fick 58% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. GPT-5.1 fick 12% pa detta benchmark.

Om GPT-5.1

Lar dig om GPT-5.1s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Reasoning-arkitektur

GPT-5.1 har en arkitektur för System 2-tänkande. Detta gör att modellen kan justera sin bearbetningstid baserat på frågans komplexitet. För matematiska bevis tillämpar den djupa logiska deduktioner, medan enkla konversationella uppgifter bibehåller låg latency. Det adaptiva reasoning-systemet säkerställer att beräkningskraft används där den ger mest värde.

Multimodal prestanda

Modellen använder ett omni-multimodalt ramverk för text- och vision-input. Den ger 84 % lägre latency vid extrahering av dokument för företag jämfört med sin föregångare. Förbättrad minneshantering säkerställer att kontexten bibehålls genom långvariga agentic arbetsflöden, vilket gör den lämplig för storskaliga mjukvaruprojekt.

Personaliseringssystem

En ny motor möjliggör styrning av ton och egenskaper. Användare kan konfigurera modellen till att vara professionell, avslappnad eller uttrycksfull genom explicita systeminstruktioner. Dessa egenskaper gör det möjligt för utvecklare att distribuera bottar som bättre matchar specifika varumärkesidentiteter och användarpreferenser utan omfattande few-shot prompting.

GPT-5.1

Anvandningsfall for GPT-5.1

Upptack de olika satten du kan anvanda GPT-5.1 for att uppna fantastiska resultat.

Agentic Software Engineering

Modellen automatiserar komplex refaktorering över stora kodbaser med högprecisions-reasoning.

Forskning på doktorandnivå

Den löser komplicerade problem inom biologi och fysik som kräver verifierade avdrag i flera steg.

Dokumentanalys för företag

Systemet extraherar strukturerad data från massiva mängder tabulära dokument med hög visuell precision.

Personlig kundsupport

Utvecklare distribuerar bottar med specifika varumärkesdrag, som lekfull eller professionell, för att matcha användarens sinnesstämning.

Matematisk problemlösning

Modellen använder sina 99,6 % AIME-poäng för att verifiera bevis och handleda studenter i avancerad matematik.

Visionsbaserad affärsintelligens

Den analyserar komplexa diagram och finansiella rapporter för att generera sammanfattningar för ledningen med visuell kontext.

Styrkor

Begransningar

Enastående matematisk reasoning: Modellen uppnådde 99,6 % på AIME 2025 och överträffar nästan alla tidigare konkurrerande modeller.
Hög output-latency: Reasoning med hög ansträngning kan förlänga svarstiderna till över 20 sekunder för komplexa frågor.
Adaptiv bearbetning: Dynamisk skalning av beräkningskraft minskar latency med 84 % för enkla dokumentuppgifter inom företag.
Inget nativt ljudstöd: Den saknar de inbyggda speech-to-speech-funktioner som finns hos konkurrenter som Gemini 2.0.
Förbättrad personlighetskontroll: Nativ styrning av tonläget gör interaktioner varmare och mer mänskliga än i den ursprungliga GPT-5.
Prissättning för output: Med $10 per miljon tokens är kostnaden för reasoning-output i långa format betydligt högre än för snabba modeller.
Storskalig kontext: Ett context window på 400 000 tokens i kombination med 24-timmars caching möjliggör massiva agentic arbetsflöden.
Kvarstående stilistiska egenheter: Användare rapporterar att modellen fortfarande har svårt att undvika specifika interpunktionsmönster trots explicita minnesinstruktioner.

API snabbstart

openai/gpt-5.1

Visa dokumentation
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om GPT-5.1

Se vad communityt tycker om GPT-5.1

GPT-5.1 etc i Codex är fortfarande bäst på granskning av planering och kod.
darrenjr
twitter
Våra utvärderingar visade att GPT-5 presterade upp till 190 % bättre än andra ledande modeller inom komplex reasoning.
CodeRabbit
twitter
GPT-5.1 är bättre kalibrerad efter prompt-svårighet och förbrukar betydligt färre tokens vid enkla input.
Tech Titans
facebook
Den här releasen handlar helt om personligheten och att få ChatGPT att kännas mindre klinisk och steril.
Theo
youtube
400k context window är en livräddare för vår analys av hela repot.
RedditUser99
reddit
Fortfarande inget nativt ljud är tråkigt, men vinsterna i reasoning är verkliga.
HackerNewsGuy
hackernews

Videor om GPT-5.1

Se handledningar, recensioner och diskussioner om GPT-5.1

GPT 5.1 är här. Den är snabbare. Den är mer exakt. Den är mer konversationell.

För första gången kan GPT 5.1 Instant använda adaptiv reasoning för att avgöra när den ska tänka.

Logiken här är betydligt bättre än standardmodellen GPT 5.

Den lyckas hålla en varmare ton än vad vi såg i tidigare förhandsversioner.

Om du är utvecklare kommer den utökade prompt cachingen att spara dig massor av pengar.

Den är ännu mer personaliserbar än någonsin tidigare.

Tonen låter mycket mer naturlig... 5.1 är mycket bättre när det gäller energi.

Jag märkte att den inte hallucinerar lika mycket under komplexa arbetsflödessteg.

Hastigheten i instant mode är nästan likvärdig med GPT 4o mini men med mer intelligens.

Personaliseringsfunktionerna innebär att du faktiskt kan be den att sluta vara så formell.

Detta är förmodligen en av de mest avslappnade iterativa uppdateringarna av en frontier model.

Den gav ett lyckat resultat för stötfångarbilsspelet jämfört med GPT-5-tänkande.

Vision-bearbetningen av handskrivna dokument är märkbart skarpare.

Jag tycker att växlingsknappen för reasoning effort är den bästa funktionen för att hantera API-kostnader.

Det känns äntligen som en modell du kan prata med utan att den låter som en lärobok.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for GPT-5.1

Experttips for att hjalpa dig fa ut det mesta av GPT-5.1 och uppna battre resultat.

Justera Reasoning Effort

Använd parametern reasoning_effort för att ställa in tänkandenivån till high för matematik, men none för enkel chatt för att spara på latency.

Utnyttja stort context window

Utnyttja 400k context window för hela projektmappar eftersom modellen behåller information väl i långa prompts.

Styr tonläget

Aktivera tone traits i dina systeminstruktioner för att få modellen att låta mindre klinisk och mer som en kollega.

Prompt Caching

Dra nytta av 24-timmars prompt caching för att minska kostnader när du kör repetitiva agentic loopar på samma kodbas.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Vanliga fragor om GPT-5.1

Hitta svar pa vanliga fragor om GPT-5.1