openai

GPT-5.1

GPT-5.1 — це просунутий флагманський reasoning від OpenAI з адаптивним мисленням, нативною мультимодальністю та state-of-the-art продуктивністю в математичних...

openai logoopenaiGPT-512 листопада 2025 р.
Контекст
400Kтокенів
Макс. вивід
128Kтокенів
Ціна вводу
$1.25/ 1M
Ціна виводу
$10.00/ 1M
Модальність:TextImage
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
88.1%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. GPT-5.1 набрав 88.1% у цьому бенчмарку.
HLE
32.5%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. GPT-5.1 набрав 32.5% у цьому бенчмарку.
MMLU
90.2%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. GPT-5.1 набрав 90.2% у цьому бенчмарку.
MMLU Pro
81%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. GPT-5.1 набрав 81% у цьому бенчмарку.
SimpleQA
52%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. GPT-5.1 набрав 52% у цьому бенчмарку.
IFEval
91%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. GPT-5.1 набрав 91% у цьому бенчмарку.
AIME 2025
94%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. GPT-5.1 набрав 94% у цьому бенчмарку.
MATH
91%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. GPT-5.1 набрав 91% у цьому бенчмарку.
GSM8k
98.5%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. GPT-5.1 набрав 98.5% у цьому бенчмарку.
MGSM
95%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. GPT-5.1 набрав 95% у цьому бенчмарку.
MathVista
75%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. GPT-5.1 набрав 75% у цьому бенчмарку.
SWE-Bench
76.3%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. GPT-5.1 набрав 76.3% у цьому бенчмарку.
HumanEval
92.5%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. GPT-5.1 набрав 92.5% у цьому бенчмарку.
LiveCodeBench
74%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. GPT-5.1 набрав 74% у цьому бенчмарку.
MMMU
85.4%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. GPT-5.1 набрав 85.4% у цьому бенчмарку.
MMMU Pro
62%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. GPT-5.1 набрав 62% у цьому бенчмарку.
ChartQA
89%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. GPT-5.1 набрав 89% у цьому бенчмарку.
DocVQA
93%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. GPT-5.1 набрав 93% у цьому бенчмарку.
Terminal-Bench
58%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. GPT-5.1 набрав 58% у цьому бенчмарку.
ARC-AGI
12%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. GPT-5.1 набрав 12% у цьому бенчмарку.

Про GPT-5.1

Дізнайтеся про можливості GPT-5.1, функції та як це може допомогти вам досягти кращих результатів.

Архітектура Reasoning

GPT-5.1 має архітектуру мислення System 2. Це дозволяє моделі регулювати час обробки залежно від складності запиту. Для математичних доведень вона застосовує глибокі логічні дедукції, тоді як прості розмовні завдання зберігають низьку latency. Адаптивна система reasoning гарантує, що обчислювальні ресурси спрямовуються туди, де вони приносять найбільшу користь.

Multimodal продуктивність

Модель використовує omni multimodal фреймворк для текстових та візуальних вхідних даних. Вона забезпечує на 84% меншу latency при вилученні даних із корпоративних документів порівняно зі своїм попередником. Покращене утримання пам'яті гарантує, що контекст зберігається протягом тривалих agentic робочих процесів, що робить її придатною для масштабних інженерних проектів у галузі програмного забезпечення.

Системи персоналізації

Новий рушій забезпечує керування тоном та рисами. Користувачі можуть налаштувати модель бути професійною, невимушеною або емоційною за допомогою явних системних інструкцій. Ці риси дозволяють розробникам розгортати ботів, які краще відповідають певним брендам та перевагам користувачів без необхідності обширного few-shot prompt-інгу.

GPT-5.1

Випадки використання для GPT-5.1

Відкрийте різні способи використання GPT-5.1 для досягнення чудових результатів.

Agentic розробка програмного забезпечення

Модель автоматизує складний рефакторинг у великих кодових базах за допомогою високоточного reasoning.

Дослідження PhD-рівня

Вирішує складні проблеми в біології та фізиці, які потребують перевірених багатоетапних дедукцій.

Аналіз корпоративної документації

Система вилучає структуровані дані з величезних масивів табличних документів із високою візуальною точністю.

Персоналізована підтримка клієнтів

Розробники розгортають ботів зі специфічними рисами бренду, як-от дотепність або професіоналізм, відповідно до настрою користувача.

Розв'язання математичних задач

Модель використовує свої результати 99.6% у AIME для перевірки доведень та навчання студентів просунутій математиці.

Бізнес-аналітика на основі візуальних даних

Аналізує складні графіки та фінансові звіти для створення резюме для керівництва з урахуванням візуального контексту.

Сильні сторони

Обмеження

Елітний математичний reasoning: Модель отримала 99.6% балів у AIME 2025, перевершивши майже всі попередні competitive моделі.
Висока вихідна latency: Reasoning високої інтенсивності може збільшити час відповіді до понад 20 секунд для складних запитів.
Адаптивна обробка: Динамічне масштабування обчислень зменшує latency на 84% у простих корпоративних завданнях з документами.
Відсутність нативного аудіо: Бракує вбудованих можливостей speech-to-speech, які є у конкурентів на кшталт Gemini 2.0.
Покращений контроль особистості: Нативне керування тоном робить взаємодію теплішою та людянішою, ніж у оригінальному GPT-5.
Вартість виведення: При ціні $10 за мільйон tokens, вартість довготривалого reasoning значно вища, ніж у миттєвих моделей.
Великий масштаб контексту: Context window на 400 000 tokens у поєднанні з 24-годинним кешуванням дозволяє виконувати масивні agentic робочі процеси.
Постійні стилістичні особливості: Користувачі повідомляють, що модель все ще має труднощі з уникненням певних патернів пунктуації, попри явні інструкції в пам'яті.

Швидкий старт API

openai/gpt-5.1

Переглянути документацію
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про GPT-5.1

Подивіться, що думає спільнота про GPT-5.1

GPT-5.1 та інші в Codex, все ще найкращий рецензент для планування та завдань із перегляду коду.
darrenjr
twitter
Наші оцінки показали, що GPT-5 працює на 190% краще, ніж інші провідні моделі, у складному reasoning.
CodeRabbit
twitter
GPT-5.1 краще калібрується під складність запиту, споживаючи набагато менше tokens на легких входах.
Tech Titans
facebook
Цей реліз повністю про особистість та про те, щоб зробити ChatGPT менш клінічним та стерильним.
Theo
youtube
Context window на 400k, це порятунок для аналізу всього нашого репозиторію.
RedditUser99
reddit
Відсутність нативного аудіо, це розчарування, але досягнення в reasoning реальні.
HackerNewsGuy
hackernews

Відео про GPT-5.1

Дивіться навчальні матеріали, огляди та обговорення про GPT-5.1

GPT 5.1 уже тут. Вона швидша. Вона точніша. Вона краще спілкується.

Вперше GPT 5.1 Instant може використовувати адаптивний reasoning, щоб вирішувати, коли думати.

Логіка тут значно краща, ніж у стандартній моделі GPT 5.

Їй вдається підтримувати тепліший тон, ніж ми бачили у попередніх версіях.

Якщо ви розробник, розширений prompt caching заощадить вам купу грошей.

Вона ще більш персоналізована, ніж будь-коли раніше.

Тон звучить набагато природніше... 5.1 набагато краща за енергією.

Я помітив, що вона менше галюцинує під час складних кроків робочого процесу.

Швидкість instant mode майже еквівалентна GPT 4o mini, але з більшим інтелектом.

Функції персоналізації означають, що ви можете реально попросити її не бути такою офіційною.

Це, мабуть, одне з найбільш невимушених ітеративних оновлень для frontier model.

Вона видала успішний результат у грі з машинками порівняно з мисленням GPT5.

Обробка рукописних документів візуально помітно чіткіша.

Я думаю, перемикач reasoning effort, це найкраща функція для управління витратами API.

Вона нарешті відчувається як модель, з якою можна говорити, і вона не звучить як підручник.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для GPT-5.1

Експертні поради, які допоможуть вам отримати максимум від GPT-5.1 та досягти кращих результатів.

Налаштування Reasoning Effort

Використовуйте параметр reasoning_effort, щоб встановити рівень мислення на 'high' для математики, або 'none' для простого чату, щоб зменшити latency.

Використання великого контексту

Задіюйте context window на 400 тис. токенів для цілих папок проекту, оскільки модель добре утримує інформацію у довгих prompt-ах.

Налаштування тону

Активуйте риси тону в системних інструкціях, щоб модель звучала менш сухо і більше як колега по команді.

Prompt Caching

Скористайтеся перевагами 24-годинного prompt caching, щоб зменшити витрати при запуску повторюваних agentic циклів у тій самій кодовій базі.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Часті запитання про GPT-5.1

Знайдіть відповіді на поширені запитання про GPT-5.1