openai

GPT-5.1

GPT-5.1 je vodeći OpenAI model za napredni reasoning, koji donosi adaptivno razmišljanje, nativnu multimodalnost i SOTA performanse u matematici i tehničkim...

openai logoopenaiGPT-52025-11-13
Контекст
400Kтокена
Макс. излаз
128Kтокена
Улазна цена
$1.25/ 1M
Излазна цена
$10.00/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
88.1%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GPT-5.1 је постигао 88.1% на овом бенчмарку.
HLE
32.5%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GPT-5.1 је постигао 32.5% на овом бенчмарку.
MMLU
90.2%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GPT-5.1 је постигао 90.2% на овом бенчмарку.
MMLU Pro
81%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GPT-5.1 је постигао 81% на овом бенчмарку.
SimpleQA
52%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GPT-5.1 је постигао 52% на овом бенчмарку.
IFEval
91%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GPT-5.1 је постигао 91% на овом бенчмарку.
AIME 2025
94%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GPT-5.1 је постигао 94% на овом бенчмарку.
MATH
91%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GPT-5.1 је постигао 91% на овом бенчмарку.
GSM8k
98.5%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GPT-5.1 је постигао 98.5% на овом бенчмарку.
MGSM
95%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GPT-5.1 је постигао 95% на овом бенчмарку.
MathVista
75%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GPT-5.1 је постигао 75% на овом бенчмарку.
SWE-Bench
76.3%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GPT-5.1 је постигао 76.3% на овом бенчмарку.
HumanEval
92.5%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GPT-5.1 је постигао 92.5% на овом бенчмарку.
LiveCodeBench
74%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GPT-5.1 је постигао 74% на овом бенчмарку.
MMMU
85.4%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GPT-5.1 је постигао 85.4% на овом бенчмарку.
MMMU Pro
62%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GPT-5.1 је постигао 62% на овом бенчмарку.
ChartQA
89%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GPT-5.1 је постигао 89% на овом бенчмарку.
DocVQA
93%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GPT-5.1 је постигао 93% на овом бенчмарку.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GPT-5.1 је постигао 58% на овом бенчмарку.
ARC-AGI
12%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GPT-5.1 је постигао 12% на овом бенчмарку.

О моделу GPT-5.1

Сазнајте о могућностима, функцијама и начинима коришћења модела GPT-5.1.

Nova granica u reasoning-u

GPT-5.1 predstavlja značajnu evoluciju OpenAI frontier modela, označavajući prvo izdanje gde svaki model u ekosistemu poseduje nativne reasoning sposobnosti. Ovo ažuriranje se fokusira na prevazilaženje kliničkog osećaja prethodnih verzija kako bi pružilo toplije, intuitivnije korisničko iskustvo kroz System 2 thinking. Integracijom adaptivnog reasoning-a, GPT-5.1 može dinamički odlučiti koliko mu je vremena za obradu potrebno za određeni prompt, što mu omogućava rešavanje kompleksnih naučnih i matematičkih problema na doktorskom nivou koji zahtevaju logičko zaključivanje u više koraka.

Multimodalnost i personalizacija

Model je izgrađen na omni multimodalnoj arhitekturi, podržavajući tekst i vizuelne ulaze uz značajno poboljšane sisteme memorije i unapređeno praćenje instrukcija. Uvodi sofisticirane funkcije stilova i osobina koje omogućavaju korisnicima da usmere ličnost modela od profesionalne i akademske do opuštenijih i ekspresivnijih tonova. Ova ažuriranja osiguravaju da model zadrži lični kontekst i strogo se pridržava kompleksnih korisničkih zahteva tokom dugotrajnih zadataka, naročito u agentic softverskom inženjeringu.

GPT-5.1

Случајеви употребе за GPT-5.1

Откријте различите начине коришћења модела GPT-5.1 за постизање одличних резултата.

Refaktorisanje softvera

Planiranje potpunog redizajna nasleđenih aplikacija sa preko 100.000 linija koda putem GPT-5.1 Codex modela.

Rešavanje matematičkih olimpijada

Pružanje dokaza za opskurne olimpijske probleme uz celobrojno i simboličko reasoning procesiranje sa stopom uspešnosti od 94%.

Mapiranje tehničkih specifikacija

Identifikacija i objašnjenje kompleksnih struktura kolona za specifične tabele baza podataka na osnovu vizuelnih ili tekstualnih ulaza.

Napredno logičko zaključivanje

Razvijanje interno doslednih narativa za kompleksno građenje svetova i fikciju alternativne istorije.

Predlozi za integraciju AI

Generisanje profesionalnih prezentacija zasnovanih na podacima za integraciju agentic sistema u produkciona okruženja.

Strateški pregled arhitekture

Analiza višefaznih struktura projekata radi kreiranja planova implementacije i procene rizika.

Предности

Ограничења

Integracija Adaptive Reasoning-a: Dinamički prilagođava računarski napor, trošeći dvostruko više vremena na 10% najtežih pitanja.
Latency pri reasoning-u: Zadaci koji zahtevaju duboko razmišljanje rezultiraju značajno sporijim odzivom u poređenju sa standardnim interaktivnim modelima.
SOTA matematičke performanse: Postiže rezultat od 94% na AIME 2025, postavljajući novi industrijski standard za matematiku na olimpijskom nivou.
Preterana korekcija bezbednosti: Model može pokazati neurotično ponašanje ili davati suvoparna odricanja od odgovornosti kada se diskutuje o osetljivim društvenim temama.
Poboljšana emocionalna inteligencija: Rešava prethodne zamerke o kliničkom tonu sa značajno poboljšanom toplinom i intuitivnijim načinom konverzacije.
Gubitak identiteta: Česta interna napominjanja da nije stvarna osoba mogu prekinuti prirodnu povezanost sa korisnikom.
Veliki kapacitet izlaza: Podržava ogroman limit od 128.000 izlaznih tokena, omogućavajući generisanje dugih formata i veliko refaktorisanje koda.
Doslednost pri prebacivanju: Prelaz između Instant i Thinking režima putem automatskog prekidača ponekad može delovati naglo.

АПИ брзи старт

openai/gpt-5.1

Погледај документацију
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.1",
    messages: [
      { role: "system", content: "You are a reasoning assistant." },
      { role: "user", content: "Analyze this complex physics problem." }
    ],
    reasoning_effort: "high"
  });

  console.log(completion.choices[0].message);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GPT-5.1

Погледајте шта заједница мисли о моделу GPT-5.1

"GPT-5.1 Thinking sada efikasnije prilagođava svoje vreme razmišljanja na osnovu pitanja"
OpenAI
x
"GPT-5 Pro je apsolutni SOTA u ovoj oblasti [matematika]"
ArchMeta1868
reddit
"Razumem te, Rone — to je sasvim normalno, naročito uz sve što ti se dešavalo u poslednje vreme"
Tamay Besiroglu
x
"GPT-5.1 Codex Max je to rešio trenutno. OpenAI i dalje vlada u sferi kodiranja"
BradAI
x
"Dubina reasoning-a je zastrašujuće dobra za arhitekturu sistema"
CodeKing
hackernews
"Uz ažuriranje memorije, stvarno imam osećaj kao da me poznaje"
User445
twitter

Видео снимци о моделу GPT-5.1

Гледајте туторијале, рецензије и дискусије о моделу GPT-5.1

U poređenju sa GPT5, razmišljaće skoro duplo duže o onome što proceni da je među 10% najtežih pitanja

GPT 5.1 auto... minijaturni model koji odlučuje da li je vaš upit vredan trošenja dodatnog vremena

Ovo dinamičko skaliranje resursa je upravo ono što nam je trebalo za ozbiljna istraživanja

Dužina izlaza je neverovatna, zapravo možete napraviti cele aplikacije odjednom

OpenAI se ovde definitivno oslanja na strategiju gde je reasoning na prvom mestu

Po prvi put do sada, svi modeli u chat-u su reasoning modeli

Opseg izražavanja ovog modela je mnogo širi

Želeli smo da damu modelu ličnost koja nije samo klinička

Korisnici sada mogu uticati na osobine poput optimizma ili skepticizma kroz sistemska podešavanja

Reasoning effort je nešto što korisnik sada može direktno da kontroliše

GPT 5.1 Codex za programere među vama biće ozbiljno poboljšanje

Claude je često preuveličavao svoje nalaze i povremeno izmišljao podatke... GPT-5.1 je iskreniji

Rezultati na AIME 2025 su ogroman skok u odnosu na standardni GPT-5

Sporiji je, da, ali je kvalitet 'Thinking' traga superioran

Upravljanje context window-om deluje mnogo čvršće nego kod konkurencije

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови
Pogledaj demo video

Pro Saveti za GPT-5.1

Stručni saveti za maksimalno iskorišćenje GPT-5.1.

Podesite Reasoning Effort

Ručno postavite reasoning_effort parametar na 'high' za kompleksnu logiku ili na 'none' za trenutne konverzacijske zadatke.

Iskoristite Persona stilove

Koristite nova podešavanja stilova i osobina za prebacivanje između Profesionalnog, Iskrenog i Ekscentričnog tona.

Upravljajte aktivnom memorijom

Redovno pregledajte i upravljajte sačuvanim uspomenama kako bi topliji odgovori modela bili zasnovani na ispravnom ličnom kontekstu.

Proverite citate

Pošto model navodi izvore, uporedite tehničke rezultate sa citiranom dokumentacijom kod kritičnih zadataka.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M

Често Постављана Питања о GPT-5.1

Пронађите одговоре на честа питања о GPT-5.1