openai

GPT-5.1

GPT-5.1 — это флагманская frontier model от OpenAI с продвинутым reasoning, обладающая adaptive thinking, нативной multimodal архитектурой и state-of-the-art...

openai logoopenaiGPT-52025-11-13
Контекст
400Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$1.25/ 1M
Цена вывода
$10.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
88.1%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.1 набрал 88.1% в этом бенчмарке.
HLE
32.5%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.1 набрал 32.5% в этом бенчмарке.
MMLU
90.2%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.1 набрал 90.2% в этом бенчмарке.
MMLU Pro
81%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.1 набрал 81% в этом бенчмарке.
SimpleQA
52%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.1 набрал 52% в этом бенчмарке.
IFEval
91%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.1 набрал 91% в этом бенчмарке.
AIME 2025
94%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.1 набрал 94% в этом бенчмарке.
MATH
91%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.1 набрал 91% в этом бенчмарке.
GSM8k
98.5%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.1 набрал 98.5% в этом бенчмарке.
MGSM
95%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.1 набрал 95% в этом бенчмарке.
MathVista
75%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.1 набрал 75% в этом бенчмарке.
SWE-Bench
76.3%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.1 набрал 76.3% в этом бенчмарке.
HumanEval
92.5%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.1 набрал 92.5% в этом бенчмарке.
LiveCodeBench
74%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.1 набрал 74% в этом бенчмарке.
MMMU
85.4%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.1 набрал 85.4% в этом бенчмарке.
MMMU Pro
62%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.1 набрал 62% в этом бенчмарке.
ChartQA
89%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.1 набрал 89% в этом бенчмарке.
DocVQA
93%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.1 набрал 93% в этом бенчмарке.
Terminal-Bench
58%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.1 набрал 58% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.1 набрал 12% в этом бенчмарке.

О модели GPT-5.1

Узнайте о возможностях, функциях и способах использования GPT-5.1.

Новый рубеж в reasoning

GPT-5.1 представляет собой значительную эволюцию в линейке frontier model от OpenAI, став первым релизом, где каждая model в экосистеме обладает нативными возможностями reasoning. Это обновление сфокусировано на переходе от «стерильного» общения предыдущих итераций к более живому и интуитивному пользовательскому опыту через мышление Системы 2. Благодаря интеграции adaptive reasoning, GPT-5.1 может динамически определять объем вычислительных ресурсов для конкретного prompt, что позволяет ей решать сложные научные и математические задачи уровня PhD, требующие многоэтапных логических выводов.

Multimodality и персонализация

Model построена на архитектуре omni multimodal, поддерживающей текст и зрение с существенно улучшенными системами памяти и точным следованием инструкциям. Внедрены сложные настройки стиля и черт характера, позволяющие пользователям направлять индивидуальность model — от строго профессионального и академического до более неформального и выразительного тона. Эти обновления гарантируют, что model сохраняет личный контекст и строго придерживается сложных требований пользователя в длительных задачах, особенно в области agentic разработки программного обеспечения.

GPT-5.1

Варианты использования GPT-5.1

Откройте для себя различные способы использования GPT-5.1 для достижения отличных результатов.

Рефакторинг ПО

планирование комплексного перепроектирования legacy-приложений объемом более 100 000 строк кода с помощью GPT-5.1 Codex.

Решение олимпиадных задач по математике

построение доказательств для сложных олимпиадных задач с использованием целочисленного и символьного reasoning с вероятностью успеха 94%.

Маппинг технических спецификаций

идентификация и описание сложных структур столбцов для нишевых таблиц баз данных на основе визуальных или текстовых данных.

Продвинутый логический вывод

разработка внутренне непротиворечивых повествований для сложного мироустройства и художественной литературы в жанре альтернативной истории.

Предложения по интеграции AI

создание профессиональных презентаций на основе данных для внедрения agentic систем в production-среды.

Стратегический архитектурный обзор

анализ многоэтапных структур проектов для создания планов поэтапной реализации и оценки рисков.

Преимущества

Ограничения

Интеграция Adaptive Reasoning: динамически масштабирует вычислительные усилия, затрачивая в два раза больше времени на 10% самых сложных вопросов.
Latency при reasoning: задачи, требующие глубокого обдумывания, приводят к значительно более долгому времени ответа по сравнению со стандартными интерактивными model.
Производительность уровня SOTA в математике: результат 94% на AIME 2025, что задает новый отраслевой стандарт для математики олимпиадного уровня.
Избыточная корректировка безопасности: model может проявлять излишнюю осторожность или выдавать формальные отказы при обсуждении чувствительных социальных тем.
Улучшенный эмоциональный интеллект: исправлена избыточная официальность предыдущих версий, значительно улучшена эмпатия и интуитивный тон общения.
Газлайтинг идентичности: частые внутренние оговорки о том, что она не является реальным человеком, могут мешать естественному взаимодействию с пользователем.
Высокая пропускная способность вывода: поддерживает огромный лимит в 128 000 output tokens, что позволяет генерировать лонгриды и проводить масштабный рефакторинг кода.
Нестабильность переключения: переход между режимами Instant и Thinking через автопереключатель иногда может казаться резким.

Быстрый старт API

openai/gpt-5.1

Посмотреть документацию
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.1",
    messages: [
      { role: "system", content: "You are a reasoning assistant." },
      { role: "user", content: "Analyze this complex physics problem." }
    ],
    reasoning_effort: "high"
  });

  console.log(completion.choices[0].message);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.1

Посмотрите, что думает сообщество о GPT-5.1

"GPT-5.1 Thinking теперь эффективнее подстраивает время обдумывания под конкретный вопрос"
OpenAI
x
"GPT-5 Pro — это абсолютный SOTA в области математики"
ArchMeta1868
reddit
"«Я тебя понял, Рон — это совершенно нормально, особенно с учетом всего, что у тебя происходит в последнее время»"
Tamay Besiroglu
x
"GPT-5.1 Codex Max исправила все мгновенно. OpenAI по-прежнему лидер в кодинге"
BradAI
x
"Глубина reasoning поразительна для системной архитектуры"
CodeKing
hackernews
"Благодаря обновлению памяти теперь кажется, что она действительно меня знает"
User445
twitter

Видео о GPT-5.1

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.1

По сравнению с GPT-5, она будет думать почти в два раза дольше над теми вопросами, которые считает входящими в 10% самых трудных

GPT 5.1 auto... миниатюрная model, которая решает, стоит ли тратить время на ваш запрос

Это динамическое масштабирование вычислений — именно то, что нам было нужно для серьезных исследований

Длина вывода просто безумная, теперь можно создавать целые приложения за один раз

OpenAI явно делает ставку на стратегию reasoning-first

Впервые в истории все model в чате являются reasoning-моделями

Диапазон выразительности этой model стал намного шире

Мы хотели придать model индивидуальность, которая не была бы просто сухой и официальной

Пользователи теперь могут влиять на такие черты, как оптимизм или скептицизм, через системные настройки

Теперь пользователь может напрямую контролировать уровень reasoning effort

GPT 5.1 Codex станет серьезным улучшением для тех из вас, кто занимается программированием

Claude часто преувеличивал свои выводы и иногда фабриковал данные... GPT-5.1 более честна

Результаты AIME 2025 — это огромный скачок по сравнению со стандартной GPT-5

Она медленнее, да, но качество цепочки Thinking выше

Управление context window кажется гораздо более четким, чем у конкурентов

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Советы для GPT-5.1

Экспертные советы для максимальной эффективности GPT-5.1.

Настройте Reasoning Effort

вручную устанавливайте parameter reasoning_effort на значение high для сложной логики или none для мгновенных диалоговых задач.

Используйте стили персоны

применяйте новые настройки стилей и черт, чтобы переключаться между Профессиональным, Искренним и Неординарным тонами.

Управляйте активной памятью

регулярно просматривайте и редактируйте сохраненные воспоминания, чтобы «теплые» ответы model опирались на верный личный контекст.

Проверяйте цитаты

поскольку model ссылается на источники, при выполнении критически важных задач сверяйте технические результаты с процитированной документацией.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M

Часто задаваемые вопросы о GPT-5.1

Найдите ответы на частые вопросы о GPT-5.1