openai

GPT-5.2

GPT-5.2 — это флагманская модель OpenAI для профессиональных задач, оснащенная 400K context window, элитными навыками программирования и глубокими...

openai logoopenaiGPT-511 декабря 2025 г.
Контекст
400Kтокенов
Макс. вывод
100Kтокенов
Цена ввода
$1.75/ 1M
Цена вывода
$14.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
93%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.2 набрал 93% в этом бенчмарке.
HLE
45%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.2 набрал 45% в этом бенчмарке.
MMLU
88%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.2 набрал 88% в этом бенчмарке.
MMLU Pro
83%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.2 набрал 83% в этом бенчмарке.
SimpleQA
58%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.2 набрал 58% в этом бенчмарке.
IFEval
95%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.2 набрал 95% в этом бенчмарке.
AIME 2025
100%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.2 набрал 100% в этом бенчмарке.
MATH
98%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.2 набрал 98% в этом бенчмарке.
GSM8k
99%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.2 набрал 99% в этом бенчмарке.
MGSM
98%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.2 набрал 98% в этом бенчмарке.
MathVista
78%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.2 набрал 78% в этом бенчмарке.
SWE-Bench
80%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.2 набрал 80% в этом бенчмарке.
HumanEval
95%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.2 набрал 95% в этом бенчмарке.
LiveCodeBench
80%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.2 набрал 80% в этом бенчмарке.
MMMU
75%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.2 набрал 75% в этом бенчмарке.
MMMU Pro
65%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.2 набрал 65% в этом бенчмарке.
ChartQA
93%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.2 набрал 93% в этом бенчмарке.
DocVQA
95%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.2 набрал 95% в этом бенчмарке.
Terminal-Bench
60%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.2 набрал 60% в этом бенчмарке.
ARC-AGI
52.9%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.2 набрал 52.9% в этом бенчмарке.

О модели GPT-5.2

Узнайте о возможностях, функциях и способах использования GPT-5.2.

GPT-5.2, это флагманская модель OpenAI, разработанная для ответственной профессиональной интеллектуальной работы и автономного проектирования. Выпущенная 11 декабря 2025 года, она знаменует собой значительную эволюцию по сравнению с сериями GPT-4 и GPT-o1 за счет интеграции специального Thinking mode с контролем усилий (Medium, High, Extra High). Это позволяет модели делать паузу и верифицировать многошаговую логику перед генерацией ответа.

Обладая огромным 400K context window и почти 100% точностью извлечения данных, модель разработана для ревью кода уровня senior, сложного рефакторинга и научных исследований. Архитектура модели создана для поддержки agentic воркфлоу, включая нативные возможности вызова инструментов и multimodal зрение, позволяющее обрабатывать сложные технические схемы и базы кода одновременно.

Хотя модель превосходна в логической точности и инженерных benchmarks, достигая 100% результата в AIME 2025, она отличается более формальным, машинным тоном по сравнению с конкурентами, такими как Claude. В настоящее время цена составляет $1.75 за миллион входных tokens и $14.00 за миллион выходных tokens, что делает её экономически эффективной альтернативой для глубоких задач, требующих высокой вычислительной мощности и ранее нуждавшихся в человеческом контроле.

GPT-5.2

Варианты использования GPT-5.2

Откройте для себя различные способы использования GPT-5.2 для достижения отличных результатов.

Комплексный инженерный рефакторинг

Выполнение глубокого рефакторинга критически важного кода с сохранением строгих типов и архитектурной целостности.

Автономные задачи в терминале

Выполнение многошаговых CLI-процессов и управление сложными облачными развертываниями благодаря высокой производительности в окружении Terminal-Bench.

Синтез знаний PhD-уровня

Одновременный анализ сотен технических источников и научных статей для составления всесторонних отчетов по узкоспециализированным темам.

Устранение багов параллелизма

Выявление и исправление сложных race conditions или утечек памяти, требующих высокого уровня логического inference на длинных участках кода.

Механическая обработка кода

Масштабные повторяющиеся миграции кода по всем репозиториям без «лени», часто наблюдаемой у универсальных LLM.

Старший технический обзор

Выполнение роли виртуального старшего инженера для проверки проектных планов и выявления пограничных случаев в логике производственных систем.

Преимущества

Ограничения

Превосходная инженерная точность: Достигнут результат 77.3% в Terminal-Bench 2.0, что превосходит конкурентов в сложных задачах с интерфейсом командной строки.
Высокая latency ответа: Значительные затраты ресурсов на рассуждения означают, что модель работает заметно медленнее, чем предыдущие версии, что приводит к долгому ожиданию.
Элитные математические рассуждения: Получен 100% результат в benchmark AIME 2025, что демонстрирует способность решать математические задачи соревновательного уровня без сторонних инструментов.
Искусственный тон UX: Пользователи критикуют модель за претенциозную и излишне структурированную манеру общения, которая кажется менее естественной, чем у серии Claude.
Низкий уровень галлюцинаций: Тестирование сообщества и внутренние benchmarks показывают снижение фактологических выдумок на 30% по сравнению с предыдущими flagship моделями.
Непрозрачный мыслительный процесс: В отличие от некоторых моделей с прозрачными рассуждениями, GPT-5.2 часто скрывает внутренний chain-of-thought, выдавая только финальный верифицированный ответ.
Длительная автономная работа: Способность поддерживать активные автономные рабочие сессии более двух часов, что идеально подходит для масштабной разработки.
Высокая стоимость: Цена $14.00 за выходные данные может быстро расти при выполнении длинных задач, где расходуется большой объем thinking tokens.

Быстрый старт API

openai/gpt-5.2

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function solveCodeProblem() {
  const response = await openai.chat.completions.create({
    model: 'gpt-5.2',
    messages: [{ role: 'user', content: 'Debug this race condition in my Rust service.' }],
    reasoning_effort: 'high',
    temperature: 0,
  });
  console.log(response.choices[0].message.content);
}

solveCodeProblem();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.2

Посмотрите, что думает сообщество о GPT-5.2

GPT 5.2 в Codex, это огромный шаг вперед, он более охотно берется за те механические задачи, на которых обычно модели начинают лениться.
ArchMeta1868
reddit
Повышенное внимание к обдумыванию и время, затрачиваемое на проверку фактов в ответах, заслуживают похвалы... надежность значительно возросла.
Thomas Randall
techopedia
Модель, лежащая в основе глубоких исследований, продемонстрировала человеческий подход, эффективно осуществляя поиск специализированной информации при необходимости.
OpenAI Official
twitter
Акцент OpenAI на структурированной «заботе о пользователе» кажется корпоративной маской для холодного ядра по сравнению с естественными дискуссиями в Claude.
Anonymous Developer
hackernews
Наконец-то модель, которая не ленится на середине 500-строчного рефакторинга.
CodeWizard
reddit
Параметр reasoning effort, это настоящий MVP для сложных логических задач.
AIBuilder
twitter

Видео о GPT-5.2

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.2

Это просто безумие. Посмотрите на этот результат с первой попытки.

Дизайн в GPT 5.2 меня не особо впечатлил... он справился гораздо хуже, чем Gemini 3.

Точность извлечения из контекста почти идеальна во всем диапазоне 400k.

Это больше похоже на движок для рассуждений, чем на чат-бота.

Latency, единственный реальный минус для некоторых приложений реального времени.

GPT 5.2 теперь может создавать полностью отформатированные таблицы и презентации прямо в чате.

Такое ощущение, что модель наконец повзрослела и начала относиться к работе серьезно.

Используйте настройку высокого уровня рассуждений только для логически сложных задач.

Галлюцинации значительно сократились по сравнению с серией 4o.

Agentic воркфлоу наконец стали жизнеспособными без постоянного контроля.

GPT 5.2 на самом деле на 40% дороже, чем 5.1, но все еще значительно дешевле, чем Opus.

GPT 5.2 потратил 11 минут и 20 секунд [на создание приложения]. То есть в два раза больше времени [по сравнению с Opus].

Качество выходных данных намного выше, если позволить работать режиму обдумывания.

Он справился с рефакторингом нескольких файлов, не потеряв определения типов.

Если вам нужна максимальная скорость, это не та модель, которая вам нужна.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-5.2

Экспертные советы для максимальной эффективности GPT-5.2.

Используйте возможности обдумывания

Применяйте параметр reasoning_effort (medium, high, xhigh), чтобы сопоставить время на размышления модели со сложностью задачи.

Используйте Codex для сохранения сессии

При работе с большими репозиториями используйте специализированную среду Codex, чтобы поддерживать активные сессии обработки до 150 минут.

Предоставляйте контекст порционно

Предоставляйте подробную документацию в system prompts, так как модель лучше всего работает, когда ей задают вопросы о необходимом контексте.

Итерируйте требования

Явно давайте модели инструкции проводить верификацию текущей кодовой базы для подтверждения соблюдения требований.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Часто задаваемые вопросы о GPT-5.2

Найдите ответы на частые вопросы о GPT-5.2