openai

GPT-5.1

GPT-5.1 je napredni reasoning flagship tvrtke OpenAI koji nudi adaptive thinking, nativnu multimodalnost i vrhunske performanse u matematičkim i tehničkim...

openai logoopenaiGPT-512. studenoga 2025.
Kontekst
400Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$1.25/ 1M
Izlazna cijena
$10.00/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
88.1%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GPT-5.1 je postigao 88.1% na ovom benchmarku.
HLE
32.5%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GPT-5.1 je postigao 32.5% na ovom benchmarku.
MMLU
90.2%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GPT-5.1 je postigao 90.2% na ovom benchmarku.
MMLU Pro
81%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GPT-5.1 je postigao 81% na ovom benchmarku.
SimpleQA
52%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GPT-5.1 je postigao 52% na ovom benchmarku.
IFEval
91%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GPT-5.1 je postigao 91% na ovom benchmarku.
AIME 2025
94%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GPT-5.1 je postigao 94% na ovom benchmarku.
MATH
91%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GPT-5.1 je postigao 91% na ovom benchmarku.
GSM8k
98.5%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GPT-5.1 je postigao 98.5% na ovom benchmarku.
MGSM
95%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GPT-5.1 je postigao 95% na ovom benchmarku.
MathVista
75%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GPT-5.1 je postigao 75% na ovom benchmarku.
SWE-Bench
76.3%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GPT-5.1 je postigao 76.3% na ovom benchmarku.
HumanEval
92.5%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GPT-5.1 je postigao 92.5% na ovom benchmarku.
LiveCodeBench
74%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GPT-5.1 je postigao 74% na ovom benchmarku.
MMMU
85.4%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GPT-5.1 je postigao 85.4% na ovom benchmarku.
MMMU Pro
62%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GPT-5.1 je postigao 62% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GPT-5.1 je postigao 89% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GPT-5.1 je postigao 93% na ovom benchmarku.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GPT-5.1 je postigao 58% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GPT-5.1 je postigao 12% na ovom benchmarku.

O modelu GPT-5.1

Saznajte o mogućnostima, značajkama i načinima korištenja modela GPT-5.1.

Arhitektura reasoning-a

GPT-5.1 sadrži arhitekturu razmišljanja "Sustav 2". To modelu omogućuje prilagodbu vremena obrade na temelju složenosti upita. Za matematičke dokaze primjenjuje duboke logičke dedukcije, dok jednostavni razgovorni zadaci održavaju nizak latency. Sustav adaptive reasoning-a osigurava da se računalni resursi alociraju tamo gdje pružaju najveću vrijednost.

Multimodalne performanse

Model koristi omni multimodalni okvir za tekstualne i vizualne inpute. Pruža 84% manji latency kod zadataka ekstrakcije poslovnih dokumenata u usporedbi sa svojim prethodnikom. Poboljšano zadržavanje memorije osigurava održavanje konteksta kroz duge agentic tijekove rada, što ga čini prikladnim za softverske projekte velikih razmjera.

Sustavi personalizacije

Novi motor omogućuje upravljanje tonom i osobinama. Korisnici mogu konfigurirati model da bude profesionalan, ležeran ili ekspresivan putem izričitih system instructions. Ove osobine omogućuju developerima implementaciju botova koji se bolje uklapaju u specifične identitete brenda i preferencije korisnika bez opsežnog few-shot promptanja.

GPT-5.1

Slučajevi korištenja za GPT-5.1

Otkrijte različite načine korištenja modela GPT-5.1 za postizanje izvrsnih rezultata.

Agentic Software Engineering

Model automatizira složene refaktore unutar velikih codebase-ova koristeći high-accuracy reasoning.

PhD istraživanja

Rješava zamršene probleme iz biologije i fizike koji zahtijevaju provjerene zaključke u više koraka.

Analiza poslovnih dokumenata

Sustav ekstrahira strukturirane podatke iz golemih setova tabličnih dokumenata s visokom vizualnom preciznošću.

Personalizirana korisnička podrška

Developeri implementiraju botove sa specifičnim crtama brenda, poput opuštenog ili profesionalnog stila, kako bi odgovarali raspoloženju korisnika.

Matematičko rješavanje problema

Model koristi svoje rezultate od 99,6% na AIME benchmarku za provjeru dokaza i podučavanje studenata naprednoj matematici.

Vision-based poslovna inteligencija

Analizira složene grafikone i financijska izvješća kako bi generirao sažetke za rukovoditelje uz vizualni kontekst.

Prednosti

Ograničenja

Vrhunski matematički reasoning: Model je ostvario rezultat od 99,6% na AIME 2025, nadmašivši gotovo sve prethodne konkurentske modele.
Visoki output latency: Reasoning visokog napora može produžiti vrijeme odgovora na više od 20 sekundi kod složenih upita.
Adaptive Processing: Dinamičko skaliranje računalnih resursa smanjuje latency za 84% kod jednostavnih zadataka obrade dokumenata.
Nedostatak nativnog audija: Nedostaju mu ugrađene speech-to-speech mogućnosti kakve nalazimo kod konkurenata poput Gemini 2.0.
Napredna kontrola osobnosti: Nativno upravljanje tonom čini interakcije toplijima i ljudskijima u odnosu na originalni GPT-5.
Cijena outputa: Uz cijenu od 10 USD po milijunu tokena, trošak dugotrajnih reasoning outputa znatno je viši od instant modela.
Large Scale context: Context window od 400.000 tokena u kombinaciji s 24-satnim cachingom omogućuje masivne agentic tijekove rada.
Ustrajne stilske osobitosti: Korisnici javljaju da se model i dalje bori s izbjegavanjem specifičnih uzoraka interpunkcije, unatoč izričitim uputama za memoriju.

API brzi početak

openai/gpt-5.1

Pogledaj dokumentaciju
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GPT-5.1

Pogledajte što zajednica misli o modelu GPT-5.1

GPT-5.1 itd. u Codexu je i dalje najbolji recenzent za zadatke planiranja i pregleda koda.
darrenjr
twitter
Naše su procjene otkrile da GPT-5 radi do 190% bolje od ostalih vodećih modela u složenom reasoning-u.
CodeRabbit
twitter
GPT-5.1 je bolje kalibriran prema težini prompt-a, trošeći znatno manje tokena na jednostavnim inputima.
Tech Titans
facebook
Ovo izdanje fokusira se na osobnost i na to da ChatGPT bude manje kliničan i sterilan.
Theo
youtube
Context window od 400k spašava stvar za analizu cijelog našeg repozitorija.
RedditUser99
reddit
I dalje nema nativnog audija što je razočaravajuće, ali dobici u reasoning-u su stvarni.
HackerNewsGuy
hackernews

Videozapisi o modelu GPT-5.1

Gledajte tutorijale, recenzije i diskusije o modelu GPT-5.1

GPT 5.1 je ovdje. Brži je. Precizniji je. Više je konverzacijski.

Prvi put, GPT 5.1 Instant može koristiti adaptive reasoning kako bi odlučio kada treba razmišljati.

Logika je ovdje znatno bolja od standardnog GPT 5 modela.

Uspijeva održati topliji ton nego što smo vidjeli u prethodnim preview verzijama.

Ako ste developer, produljeni prompt caching će vam uštedjeti puno novca.

Personaliziraniji je nego ikad prije.

Ton zvuči puno prirodnije... 5.1 je puno bolji za energiju.

Primijetio sam da ne halucinira toliko tijekom složenih koraka u tijeku rada.

Brzina instant moda je gotovo jednaka GPT 4o mini modelu, ali s više pameti.

Značajke personalizacije znače da mu zapravo možete reći da prestane biti toliko formalan.

Ovo je vjerojatno jedno od najopuštenijih iterativnih ažuriranja nekog frontier modela.

Proizveo je uspješan rezultat igre sudarajućih automobila u usporedbi s razmišljanjem GPT5.

Vision obrada na rukom pisanim dokumentima primjetno je oštrija.

Mislim da je preklopnik za reasoning effort najbolja značajka za upravljanje troškovima API-ja.

Napokon se čini kao model s kojim možete razgovarati, a da ne zvuči kao udžbenik.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GPT-5.1

Stručni savjeti za maksimalno iskorištavanje GPT-5.1.

Prilagodba reasoning effort-a

Koristite reasoning_effort parametar kako biste postavili razinu razmišljanja na high za matematiku, a na none za jednostavne razgovore kako biste smanjili latency.

Iskorištavanje velikog context-a

Koristite 400k context window za čitave mape projekata jer model zadržava informacije vrlo učinkovito u dugim promptovima.

Upravljanje tonom

Uključite osobine tona u svojim system instructions kako bi model zvučao manje klinički, a više kao član tima.

Prompt Caching

Iskoristite 24-satni prompt caching kako biste smanjili troškove pri pokretanju ponavljajućih agentic petlji na istom codebase-u.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Često Postavljana Pitanja o GPT-5.1

Pronađite odgovore na česta pitanja o GPT-5.1

GPT-5.1: 400K context i vrhunski asistent za adaptive reasoning