openai

GPT-5.1

GPT-5.1 — продвинутый флагман OpenAI с адаптивным мышлением, нативной мультимодальностью и передовой производительностью в математике и технических задачах.

openai logoopenaiGPT-512 ноября 2025 г.
Контекст
400Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$1.25/ 1M
Цена вывода
$10.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
88.1%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.1 набрал 88.1% в этом бенчмарке.
HLE
32.5%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.1 набрал 32.5% в этом бенчмарке.
MMLU
90.2%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.1 набрал 90.2% в этом бенчмарке.
MMLU Pro
81%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.1 набрал 81% в этом бенчмарке.
SimpleQA
52%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.1 набрал 52% в этом бенчмарке.
IFEval
91%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.1 набрал 91% в этом бенчмарке.
AIME 2025
94%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.1 набрал 94% в этом бенчмарке.
MATH
91%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.1 набрал 91% в этом бенчмарке.
GSM8k
98.5%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.1 набрал 98.5% в этом бенчмарке.
MGSM
95%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.1 набрал 95% в этом бенчмарке.
MathVista
75%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.1 набрал 75% в этом бенчмарке.
SWE-Bench
76.3%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.1 набрал 76.3% в этом бенчмарке.
HumanEval
92.5%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.1 набрал 92.5% в этом бенчмарке.
LiveCodeBench
74%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.1 набрал 74% в этом бенчмарке.
MMMU
85.4%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.1 набрал 85.4% в этом бенчмарке.
MMMU Pro
62%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.1 набрал 62% в этом бенчмарке.
ChartQA
89%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.1 набрал 89% в этом бенчмарке.
DocVQA
93%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.1 набрал 93% в этом бенчмарке.
Terminal-Bench
58%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.1 набрал 58% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.1 набрал 12% в этом бенчмарке.

О модели GPT-5.1

Узнайте о возможностях, функциях и способах использования GPT-5.1.

Архитектура reasoning

GPT-5.1 использует архитектуру мышления «System 2». Это позволяет модели регулировать время обработки в зависимости от сложности запроса. Для математических доказательств она применяет глубокую логическую дедукцию, в то время как простые разговорные задачи выполняются с низкой задержкой. Система адаптивного reasoning гарантирует, что вычислительные ресурсы распределяются там, где они приносят наибольшую пользу.

Multimodal производительность

Модель использует мультимодальный фреймворк omni для обработки текста и изображений. Она обеспечивает на 84% меньшую задержку при извлечении данных из корпоративных документов по сравнению с предшественником. Улучшенное сохранение памяти гарантирует, что контекст поддерживается на протяжении длинных agentic процессов, что делает её подходящей для крупномасштабных инженерных проектов.

Системы персонализации

Новый движок позволяет управлять тоном и чертами характера. Пользователи могут настроить модель на профессиональный, повседневный или экспрессивный стиль через явные системные инструкции. Эти особенности позволяют разработчикам внедрять ботов, которые лучше соответствуют идентичности бренда и предпочтениям пользователей без необходимости обширного few-shot prompting.

GPT-5.1

Варианты использования GPT-5.1

Откройте для себя различные способы использования GPT-5.1 для достижения отличных результатов.

Agentic разработка ПО

Модель автоматизирует сложный рефакторинг в крупных кодовых базах с использованием высокоточного reasoning.

Исследования уровня PhD

Решает сложные задачи в биологии и физике, требующие проверенных многошаговых дедуктивных выводов.

Корпоративный анализ документов

Система извлекает структурированные данные из огромных массивов табличных документов с высокой визуальной точностью.

Персонализированная поддержка клиентов

Разработчики создают ботов с определенными чертами бренда (например, неформальные или профессиональные) в соответствии с настроением пользователя.

Решение математических задач

Модель использует свои 99.6% баллов AIME для проверки доказательств и обучения студентов высшей математике.

Бизнес-аналитика на основе vision

Анализирует сложные графики и финансовые отчеты для создания резюме для руководства с учетом визуального контекста.

Преимущества

Ограничения

Элитный математический reasoning: Модель достигла 99.6% результата в AIME 2025, превзойдя почти все предыдущие конкурентные модели.
Высокая задержка вывода (latency): Рассуждения с высоким усилием могут увеличивать время ответа до 20+ секунд для сложных запросов.
Адаптивная обработка: Динамическое масштабирование вычислительных мощностей снижает latency на 84% при выполнении простых корпоративных задач с документами.
Нет нативного аудио: Отсутствуют встроенные функции speech-to-speech, как у конкурентов вроде Gemini 2.0.
Улучшенный контроль индивидуальности: Нативное управление тоном делает взаимодействие более теплым и «человечным», чем в оригинальной GPT-5.
Стоимость вывода: При цене $10 за миллион tokens стоимость длинных рассуждений значительно выше, чем у быстрых моделей.
Масштабный контекст: 400 000 tokens context window в сочетании с 24-часовым кэшированием позволяют создавать массивные agentic рабочие процессы.
Устойчивые стилистические особенности: Пользователи сообщают, что модель все еще пытается избегать определенных стилей пунктуации, несмотря на прямые инструкции в памяти.

Быстрый старт API

openai/gpt-5.1

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.1

Посмотрите, что думает сообщество о GPT-5.1

GPT-5.1 и аналогичные модели в Codex по-прежнему лучшие для планирования и ревью кода.
darrenjr
twitter
Наши оценки показали, что GPT-5 работает до 190% лучше других ведущих моделей в задачах сложного reasoning.
CodeRabbit
twitter
GPT-5.1 лучше откалибрована под сложность запроса, потребляя гораздо меньше tokens на простых входных данных.
Tech Titans
facebook
Этот релиз, про личность и попытку сделать ChatGPT менее клиническим и стерильным.
Theo
youtube
400к context window, это спасение для анализа всего нашего репозитория.
RedditUser99
reddit
Отсутствие нативного аудио расстраивает, но прирост в reasoning, реальный.
HackerNewsGuy
hackernews

Видео о GPT-5.1

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.1

GPT 5.1 здесь. Она быстрее. Она точнее. Она лучше ведет беседу.

Впервые GPT 5.1 Instant может использовать адаптивный reasoning, чтобы решать, когда нужно «подумать».

Логика здесь значительно лучше, чем в стандартной модели GPT 5.

Модели удается поддерживать более теплый тон, чем мы видели в предыдущих версиях.

Если вы разработчик, расширенный prompt caching сэкономит вам кучу денег.

Она стала еще более персонализируемой, чем когда-либо.

Тон звучит гораздо естественнее... 5.1 гораздо лучше в плане энергии общения.

Я заметил, что она совершает меньше «галлюцинаций» при выполнении сложных рабочих процессов.

Скорость режима instant почти эквивалентна GPT 4o mini, но с большим интеллектом.

Функции персонализации означают, что вы реально можете попросить её не быть такой формальной.

Это, пожалуй, одно из самых спокойных итеративных обновлений frontier model.

Она выдала успешный результат при моделировании игры, в отличие от размышлений GPT-5.

Обработка рукописных документов через vision заметно четче.

Думаю, переключатель reasoning effort, лучшая функция для контроля затрат на API.

Наконец-то кажется, что с моделью можно разговаривать, и она не звучит как учебник.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-5.1

Экспертные советы для максимальной эффективности GPT-5.1.

Настройка reasoning effort

Используйте параметр reasoning_effort, чтобы установить уровень «мышления» на high для математики или на none для простых чатов, чтобы снизить latency.

Использование большого контекста

Используйте context window в 400к для анализа целых папок проекта, так как модель отлично сохраняет информацию в длинных prompts.

Управление тоном

Включите характеристики тона в свои системные инструкции, чтобы сделать ответы модели менее клиническими и более похожими на стиль коллеги.

Prompt Caching

Используйте 24-часовой prompt caching, чтобы сократить расходы при запуске повторяющихся agentic циклов на одной кодовой базе.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Часто задаваемые вопросы о GPT-5.1

Найдите ответы на частые вопросы о GPT-5.1