openai

GPT-5.1

GPT-5.1 je OpenAI flagship model za napredni reasoning koji nudi adaptivno razmišljanje, nativnu multimodalnost i state-of-the-art performanse u matematici i...

openai logoopenaiGPT-52025-11-13
Kontekst
400Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$1.25/ 1M
Izlazna cijena
$10.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
88.1%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.1 je postigao 88.1% na ovom benchmarku.
HLE
32.5%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.1 je postigao 32.5% na ovom benchmarku.
MMLU
90.2%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.1 je postigao 90.2% na ovom benchmarku.
MMLU Pro
81%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.1 je postigao 81% na ovom benchmarku.
SimpleQA
52%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.1 je postigao 52% na ovom benchmarku.
IFEval
91%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.1 je postigao 91% na ovom benchmarku.
AIME 2025
94%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.1 je postigao 94% na ovom benchmarku.
MATH
91%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.1 je postigao 91% na ovom benchmarku.
GSM8k
98.5%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.1 je postigao 98.5% na ovom benchmarku.
MGSM
95%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.1 je postigao 95% na ovom benchmarku.
MathVista
75%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.1 je postigao 75% na ovom benchmarku.
SWE-Bench
76.3%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.1 je postigao 76.3% na ovom benchmarku.
HumanEval
92.5%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.1 je postigao 92.5% na ovom benchmarku.
LiveCodeBench
74%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.1 je postigao 74% na ovom benchmarku.
MMMU
85.4%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.1 je postigao 85.4% na ovom benchmarku.
MMMU Pro
62%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.1 je postigao 62% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.1 je postigao 89% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.1 je postigao 93% na ovom benchmarku.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.1 je postigao 58% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.1 je postigao 12% na ovom benchmarku.

O modelu GPT-5.1

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.1.

Nova granica u reasoning-u

GPT-5.1 predstavlja značajnu evoluciju OpenAI frontier modela, označavajući prvo izdanje u kojem svaki model u ekosustavu ima nativne reasoning sposobnosti. Ovo ažuriranje fokusira se na odmak od kliničkog osjećaja prethodnih iteracija kako bi pružilo toplije, intuitivnije korisničko iskustvo kroz System 2 razmišljanje. Integracijom adaptive reasoning-a, GPT-5.1 može dinamički odlučiti koliko je procesorskog vremena potrebno za određeni prompt, omogućujući mu rješavanje složenih znanstvenih i matematičkih problema na razini doktorata koji zahtijevaju logičke dedukcije u više koraka.

Multimodalnost i personalizacija

Model je izgrađen na omni multimodal arhitekturi, podržavajući tekst i viziju sa značajno poboljšanim sustavima memorije i unaprijeđenim praćenjem uputa. Uvodi sofisticirane značajke stila i osobina koje korisnicima omogućuju usmjeravanje osobnosti modela, od profesionalnog i akademskog do ležernijih i ekspresivnijih tonova. Ova ažuriranja osiguravaju da model zadrži osobni kontekst i strogo se pridržava složenih korisničkih zahtjeva u dugotrajnim zadacima, posebno u agentic softverskom inženjerstvu.

GPT-5.1

Slučajevi korištenja za GPT-5.1

Otkrijte različite načine korištenja modela GPT-5.1 za postizanje izvrsnih rezultata.

Software Refactoring

Planiranje top-down redizajna naslijeđenih aplikacija s više od 100,000 linija koda putem GPT-5.1 Codexa.

Rješavanje matematičkih olimpijada

Pružanje dokaza za opskurne olimpijske probleme s cjelobrojnim i simboličkim reasoning-om uz 94% uspješnosti.

Mapiranje tehničkih specifikacija

Identificiranje i objašnjavanje složenih struktura stupaca za specifične baze podataka iz vizualnih ili tekstualnih inputa.

Napredna logička inferencija

Razvijanje interno dosljednih narativa za kompleksnu izgradnju svjetova i fikciju alternativne povijesti.

Prijedlozi AI integracije

Generiranje profesionalnih prezentacija temeljenih na podacima za integraciju agentic sustava u produkcijska okruženja.

Strateški arhitektonski pregled

Analiza višestupanjskih projektnih struktura radi kreiranja planova implementacije po fazama i procjena rizika.

Prednosti

Ograničenja

Integracija Adaptive Reasoning: Dinamički skalira compute napore, trošeći dvostruko više vremena na najtežih 10% pitanja.
Reasoning latency: Zadaci dubokog razmišljanja rezultiraju značajno sporijim vremenima odgovora u usporedbi sa standardnim interaktivnim modelima.
SOTA matematičke performanse: Postiže rezultat od 94% na AIME 2025, postavljajući novi industrijski standard za matematiku na razini olimpijade.
Safety Over-Correction: Model može pokazivati neurotično ponašanje ili klinička odricanja od odgovornosti kada raspravlja o osjetljivim društvenim temama.
Poboljšana emocionalna inteligencija: Rješava prethodne povratne informacije o kliničkom pristupu značajno poboljšanom toplinom i intuitivnim konverzacijskim tonom.
Gaslighting identiteta: Česta interna odricanja o tome da nije stvarna osoba mogu prekinuti iskrenu vezu s korisnicima.
Visoki kapacitet outputa: Podržava masivni limit od 128,000 output tokens, omogućujući generiranje dugih formi i velike refaktore koda.
Nedosljednost prijelaza: Prijelaz između Instant i Thinking načina rada putem auto-switchera ponekad može djelovati naglo.

API brzi početak

openai/gpt-5.1

Pogledaj dokumentaciju
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.1",
    messages: [
      { role: "system", content: "You are a reasoning assistant." },
      { role: "user", content: "Analyze this complex physics problem." }
    ],
    reasoning_effort: "high"
  });

  console.log(completion.choices[0].message);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.1

Pogledajte što zajednica misli o modelu GPT-5.1

"GPT-5.1 Thinking sada učinkovitije prilagođava svoje vrijeme razmišljanja na temelju pitanja"
OpenAI
x
"GPT-5 Pro je apsolutni state-of-the-art na ovom području [matematika]"
ArchMeta1868
reddit
"Tu sam za tebe, Ron — to je sasvim normalno, posebno uz sve što ti se događa u zadnje vrijeme"
Tamay Besiroglu
x
"GPT-5.1 Codex Max je to odmah popravio. OpenAI i dalje vlada u programiranju"
BradAI
x
"Dubina reasoning-a je zastrašujuće dobra za arhitekturu sustava"
CodeKing
hackernews
"Zapravo se čini kao da me poznaje sada uz ažuriranje memorije"
User445
twitter

Videozapisi o modelu GPT-5.1

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.1

U usporedbi s GPT-5, razmišljat će gotovo dvostruko duže za ono što smatra da spada u top 10% najtežih pitanja

GPT 5.1 auto... minijaturni model koji odlučuje vrijedi li na vaš upit trošiti vrijeme

Ovo dinamičko skaliranje compute-a je upravo ono što nam je trebalo za ozbiljno istraživanje

Duljina outputa je nevjerojatna, zapravo možete izgraditi cijele aplikacije odjednom

OpenAI se ovdje definitivno priklanja strategiji koja stavlja reasoning na prvo mjesto

Po prvi put ikada, svi modeli u chatu su reasoning modeli

Raspon izražajnosti ovog modela je puno širi

Htjeli smo modelu dati osjećaj osobnosti koji nije samo klinički

Korisnici sada mogu utjecati na osobine poput optimizma ili skepticizma kroz postavke sustava

Korisnik sada može izravno kontrolirati reasoning effort

GPT 5.1 Codex za programere među vama bit će prilično ozbiljno poboljšanje

Claude je često preuveličavao svoje nalaze i povremeno izmišljao podatke... GPT-5.1 je iskreniji

AIME 2025 rezultati su ogroman skok u odnosu na standardni GPT-5

Sporiji je, da, ali kvaliteta 'Thinking' traga je superiorna

Upravljanje context window-om se čini puno čvršćim nego kod konkurencije

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi
Pogledaj demo video

Pro Savjeti za GPT-5.1

Stručni savjeti za maksimalno iskorištavanje GPT-5.1.

Postavite Reasoning Effort

Ručno postavite reasoning_effort parametar na 'high' za kompleksnu logiku ili 'none' za trenutne konverzacijske zadatke.

Iskoristite Persona Styles

Koristite nove postavke stila i osobina za prebacivanje između Professional, Candid i Quirky tonova.

Upravljajte aktivnom memorijom

Redovito pregledavajte i upravljajte spremljenim sjećanjima kako biste toplinu odgovora modela utemeljili u ispravnom osobnom kontekstu.

Provjerite citate

S obzirom na to da model citira izvore, usporedite njegove tehničke rezultate s citiranom dokumentacijom za zadatke visokog rizika.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M

Često Postavljana Pitanja o GPT-5.1

Pronađite odgovore na česta pitanja o GPT-5.1