openai

GPT-5.1

GPT-5.1 är OpenAI:s avancerade flaggskepps-model för reasoning med adaptive thinking, inbyggd multimodalitet och state-of-the-art-prestanda inom matematik och...

openai logoopenaiGPT-52025-11-13
Kontext
400Ktokens
Max utdata
128Ktokens
Inmatningspris
$1.25/ 1M
Utdatapris
$10.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
88.1%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. GPT-5.1 fick 88.1% pa detta benchmark.
HLE
32.5%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. GPT-5.1 fick 32.5% pa detta benchmark.
MMLU
90.2%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. GPT-5.1 fick 90.2% pa detta benchmark.
MMLU Pro
81%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. GPT-5.1 fick 81% pa detta benchmark.
SimpleQA
52%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. GPT-5.1 fick 52% pa detta benchmark.
IFEval
91%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. GPT-5.1 fick 91% pa detta benchmark.
AIME 2025
94%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. GPT-5.1 fick 94% pa detta benchmark.
MATH
91%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. GPT-5.1 fick 91% pa detta benchmark.
GSM8k
98.5%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. GPT-5.1 fick 98.5% pa detta benchmark.
MGSM
95%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. GPT-5.1 fick 95% pa detta benchmark.
MathVista
75%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. GPT-5.1 fick 75% pa detta benchmark.
SWE-Bench
76.3%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. GPT-5.1 fick 76.3% pa detta benchmark.
HumanEval
92.5%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. GPT-5.1 fick 92.5% pa detta benchmark.
LiveCodeBench
74%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. GPT-5.1 fick 74% pa detta benchmark.
MMMU
85.4%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. GPT-5.1 fick 85.4% pa detta benchmark.
MMMU Pro
62%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. GPT-5.1 fick 62% pa detta benchmark.
ChartQA
89%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. GPT-5.1 fick 89% pa detta benchmark.
DocVQA
93%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. GPT-5.1 fick 93% pa detta benchmark.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. GPT-5.1 fick 58% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. GPT-5.1 fick 12% pa detta benchmark.

Om GPT-5.1

Lar dig om GPT-5.1s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

En ny gräns för reasoning

GPT-5.1 representerar en betydande evolution av OpenAI:s frontier models och markerar den första utgåvan där varje modell i ekosystemet har inbyggda reasoning-förmågor. Denna uppdatering fokuserar på att gå bortom den kliniska känslan i tidigare versioner för att erbjuda en varmare och mer intuitiv användarupplevelse genom System 2-tänkande. Genom att integrera adaptive reasoning kan GPT-5.1 dynamiskt avgöra hur mycket bearbetningstid som krävs för en specifik prompt, vilket gör att den kan lösa komplexa vetenskapliga och matematiska problem på PhD-nivå som kräver logiska slutsatser i flera steg via chain-of-thought.

Multimodalitet och personlig anpassning

Modellen är byggd på en omni multimodal-arkitektur som stöder text och vision med avsevärt förbättrade minnessystem och stärkt förmåga att följa instruktioner. Den introducerar sofistikerade funktioner för stil och karaktärsdrag som låter användare styra modellens personlighet från professionell och akademisk till mer informella och uttrycksfulla toner. Dessa uppdateringar säkerställer att modellen behåller personligt sammanhang och strikt följer komplexa användarkrav i långsiktiga uppgifter, särskilt inom agentic programvaruteknik.

GPT-5.1

Anvandningsfall for GPT-5.1

Upptack de olika satten du kan anvanda GPT-5.1 for att uppna fantastiska resultat.

Software Refactoring

Planera top-down-omdesign av legacy-applikationer med över 100 000 rader kod via GPT-5.1 Codex.

Lösning av matematikolympiader

Ta fram bevis för obskyra olympiadproblem med heltal och symbolisk reasoning med en framgångsgrad på 94 %.

Kartläggning av tekniska specifikationer

Identifiera och förklara komplexa kolumnstrukturer för nischade databastabeller från visuella eller textbaserade inputs.

Avancerad logisk slutledning

Utveckla internt konsekventa narrativ för komplex världsbyggnad och kontrafaktisk historieskrivning.

Förslag på AI-integrering

Generera professionella, datadrivna presentationer för att integrera agentic-system i produktionsmiljöer.

Strategisk arkitekturgranskning

Analysera projektstrukturer i flera steg för att skapa fasbaserade implementeringsplaner och riskbedömningar.

Styrkor

Begransningar

Integrering av Adaptive Reasoning: Skalar beräkningsinsatsen dynamiskt och lägger dubbelt så mycket tid på de svåraste 10 % av frågorna.
Reasoning Latency: Uppgifter som kräver deep thinking resulterar i betydligt långsammare svarstider jämfört med vanliga interaktiva modeller.
SOTA-prestanda i matematik: Uppnår ett resultat på 94 % på AIME 2025, vilket sätter en ny branschstandard för matematik på olympiadnivå.
Säkerhetsmässig överkorrigering: Modellen kan uppvisa ett neurotiskt beteende eller ge kliniska friskrivningar när känsliga sociala ämnen diskuteras.
Förbättrad emotionell intelligens: Adresserar tidigare klinisk feedback med avsevärt förbättrad värme och en intuitiv konversationston.
Identitets-gaslighting: Återkommande interna friskrivningar om att den inte är en riktig person kan störa den genuina kontakten med användaren.
Hög output-kapacitet: Stöder en massiv gräns på 128 000 output tokens, vilket möjliggör generering av långa format och omfattande refactor-arbeten av kod.
Inkonsekvent växling: Övergången mellan lägena Instant och Thinking via den automatiska växlingen kan ibland kännas ryckig.

API snabbstart

openai/gpt-5.1

Visa dokumentation
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.1",
    messages: [
      { role: "system", content: "You are a reasoning assistant." },
      { role: "user", content: "Analyze this complex physics problem." }
    ],
    reasoning_effort: "high"
  });

  console.log(completion.choices[0].message);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om GPT-5.1

Se vad communityt tycker om GPT-5.1

"GPT-5.1 Thinking justerar nu sin reasoning-tid mer effektivt baserat på frågan"
OpenAI
x
"GPT-5 Pro är absolut SOTA inom det här området [math]"
ArchMeta1868
reddit
"Jag förstår dig, Ron — det är helt normalt, särskilt med allt du har haft för dig på sistone"
Tamay Besiroglu
x
"GPT-5.1 Codex Max fixade det direkt. OpenAI dominerar fortfarande kodningsspelet"
BradAI
x
"Djupet i reasoning är skrämmande bra för systemarkitektur"
CodeKing
hackernews
"Det känns faktiskt som att den känner mig nu med minnesuppdateringen"
User445
twitter

Videor om GPT-5.1

Se handledningar, recensioner och diskussioner om GPT-5.1

Jämfört med GPT-5 kommer den att använda reasoning nästan dubbelt så länge för vad den anser vara de 10 % svåraste frågorna

GPT-5.1 auto... miniatyrmodellen som avgör om din förfrågan är värd att lägga tid på

Denna dynamiska skalning av beräkningskraft är exakt vad vi behövde för seriös forskning

Output-längden är galen, du kan faktiskt bygga hela appar i ett svep

OpenAI satsar definitivt på en reasoning-först-strategi här

För första gången någonsin är alla modeller i chatten reasoning-modeller

Den här modellens uttrycksomfång är mycket bredare

Vi ville ge modellen en personlighetskänsla som inte bara är klinisk

Användare kan nu påverka drag som optimism eller skepticism via systeminställningar

Reasoning effort är något som användaren nu kan kontrollera direkt

GPT-5.1 Codex för kodarna bland er kommer att vara en ganska strikt förbättring

Claude överdrev ofta sina resultat och fabricerade ibland data... GPT-5.1 är ärligare

AIME 2025-resultaten är ett massivt hopp jämfört med vanliga GPT-5

Den är långsammare, ja, men kvaliteten på dess Thinking-spår är överlägsen

Hanteringen av context window verkar mycket stramare än hos konkurrenterna

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden
Se demo

Proffs-tips for GPT-5.1

Experttips for att hjalpa dig fa ut det mesta av GPT-5.1 och uppna battre resultat.

Ställ in Reasoning Effort

Ställ in parametern reasoning_effort manuellt till high för komplex logik eller none för omedelbara konversationsuppgifter.

Utnyttja Persona-stilar

Använd de nya inställningarna för stil och drag för att växla mellan tonerna Professional, Candid och Quirky.

Hantera aktivt minne

Granska och hantera sparade minnen regelbundet för att förankra modellens varma svar i rätt personligt sammanhang.

Verifiera källhänvisningar

Eftersom modellen citerar källor bör du korsreferera dess tekniska output med citerad dokumentation för kritiska uppgifter.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M

Vanliga fragor om GPT-5.1

Hitta svar pa vanliga fragor om GPT-5.1