openai

GPT-5.2 Pro

GPT-5.2 Pro — флагманская reasoning model от OpenAI 2025 года, оснащенная функцией Extended Thinking для достижения SOTA-производительности в математике...

openai logoopenaiGPT-5December 11, 2025
Контекст
400Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$21.00/ 1M
Цена вывода
$168.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
93.2%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.2 Pro набрал 93.2% в этом бенчмарке.
HLE
36.6%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.2 Pro набрал 36.6% в этом бенчмарке.
MMLU
89.6%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.2 Pro набрал 89.6% в этом бенчмарке.
MMLU Pro
82%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.2 Pro набрал 82% в этом бенчмарке.
SimpleQA
52%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.2 Pro набрал 52% в этом бенчмарке.
IFEval
93.5%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.2 Pro набрал 93.5% в этом бенчмарке.
AIME 2025
100%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.2 Pro набрал 100% в этом бенчмарке.
MATH
97%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.2 Pro набрал 97% в этом бенчмарке.
GSM8k
99.2%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.2 Pro набрал 99.2% в этом бенчмарке.
MGSM
96%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.2 Pro набрал 96% в этом бенчмарке.
MathVista
76.5%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.2 Pro набрал 76.5% в этом бенчмарке.
SWE-Bench
80%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.2 Pro набрал 80% в этом бенчмарке.
HumanEval
94.5%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.2 Pro набрал 94.5% в этом бенчмарке.
LiveCodeBench
78%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.2 Pro набрал 78% в этом бенчмарке.
MMMU
79.5%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.2 Pro набрал 79.5% в этом бенчмарке.
MMMU Pro
79.5%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.2 Pro набрал 79.5% в этом бенчмарке.
ChartQA
91.2%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.2 Pro набрал 91.2% в этом бенчмарке.
DocVQA
94.8%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.2 Pro набрал 94.8% в этом бенчмарке.
Terminal-Bench
55.6%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.2 Pro набрал 55.6% в этом бенчмарке.
ARC-AGI
54.2%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.2 Pro набрал 54.2% в этом бенчмарке.

О модели GPT-5.2 Pro

Узнайте о возможностях, функциях и способах использования GPT-5.2 Pro.

Новый рубеж в области Reasoning

GPT-5.2 Pro — это state-of-the-art reasoning model от OpenAI, разработанная специально для решения критически важных интеллектуальных задач. Выпущенная в конце 2025 года, она представляет режим 'extended thinking', который позволяет model обрабатывать сложные проблемы в течение длительного времени для обеспечения логической последовательности. Она по праву считается отраслевым лидером в области профессиональных математических доказательств и продвинутого спортивного программирования, часто решая задачи, которые были не под силу предыдущим поколениям.

Техническая точность и результаты

Model отличается строгим соблюдением сложных инструкций и значительно более низким уровнем галлюцинаций при логическом выводе по сравнению с конкурентами. Она поддерживает высокоорганизованный и профессиональный тон общения, хотя пользователи отмечают более «холодный» стиль взаимодействия и повышенную latency из-за серьезных вычислительных затрат на reasoning. Она стала основным инструментом для разработчиков, которым требуются механические проверки всей кодовой базы, и исследователей, нуждающихся в точности уровня PhD в рамках огромного context window объемом 400,000 tokens.

Производительность экспертного уровня

Помимо стандартных benchmarks, GPT-5.2 Pro является первой model, которая стабильно превосходит отраслевых экспертов-людей с более чем 14-летним стажем в тестах на выполнение специализированных рабочих задач. Ее способность генерировать десятки тысяч строк функционального кода за один проход знаменует собой окончательный уход от проблем с «ленью», наблюдавшихся в ранних versions, что делает ее приоритетным выбором для сложных agentic рабочих процессов.

GPT-5.2 Pro

Варианты использования GPT-5.2 Pro

Откройте для себя различные способы использования GPT-5.2 Pro для достижения отличных результатов.

Олимпиадная математика

блестяще решает математические задачи профессионального уровня и задачи IMO с подробными доказательствами.

Механические задачи по программированию

эффективно обрабатывает огромные списки обновлений кода и правок без проявлений «лени».

Логический вывод

выполняет глубокий reasoning для сложного построения миров и анализа альтернативной истории.

Технические исследования

точно извлекает и синтезирует узкоспециализированные технические данные из документации.

Следование инструкциям

строго выполняет крайне сложные или контринтуитивные требования пользователя с экстремальной точностью.

Креативное письмо

способна создавать насыщенные творческие тексты, имитирующие стиль классической литературы.

Преимущества

Ограничения

Математический SOTA: на данный момент это единственная model, достигшая 100% в benchmark AIME 2025 без использования внешних инструментов.
Высокая latency: в некоторых сценариях режим 'extended thinking' может занимать 30–40 минут для генерации одного сложного ответа.
Zero-laziness программирование: способна генерировать более 24,000 строк функционального кода в одном ответе без сокращений.
«Холодная» личность: пользователи описывают стиль взаимодействия как стерильный, сухой и претенциозный по сравнению с более разговорными models.
Паритет с экспертными знаниями: первая model, превзошедшая отраслевых экспертов с 14-летним опытом в задачах GDP-Val.
Премиальная цена: при стоимости $21 за 1 млн input tokens она значительно дороже многих конкурентов, таких как Gemini 3 Pro.
Глубокий reasoning в контексте: сохраняет почти идеальную точность извлечения данных и логику на протяжении всего context window в 400,000 tokens.
Пропуски в реализации: несмотря на интеллект, она может иногда пропускать редкие импорты библиотек в сложных скриптах 3D-рендеринга.

Быстрый старт API

openai/gpt-5.2-pro

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [
      { role: 'user', content: 'Prove the existence of infinite primes using the extended thinking mode.' }
    ],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.2 Pro

Посмотрите, что думает сообщество о GPT-5.2 Pro

"GPT-5.2-codex xhigh — это зверь, который прочесывает всю вашу кодовую базу и не оставляет незавершенных задач."
Rafael Bittencourt
x
"GPT Pro — это абсолютный SOTA в области математики. Иногда она может решить даже третью и шестую задачи олимпиады."
ArchMeta1868
reddit
"GPT-5.2 Pro продолжает меня поражать... Я получил строгий анализ, оформленный в профессиональную рабочую книгу Excel."
Simon Smith
x
"Эта model похожа на очень умного, творческого человека — местами ненадежного, но гениального."
Narrator
youtube
"Галлюцинаций у 5.2 на самом деле меньше, чем у Opus, и она очень строго выполняет мои требования."
ArchMeta1868
reddit
"Затраты на reasoning огромны, но результаты математических доказательств — это буквально уровень Нобелевской премии."
QuantumDev
hackernews

Видео о GPT-5.2 Pro

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.2 Pro

Это первый случай в истории, когда человек в среднем уступает... AGI.

Reasoning в GPT 5.2 устанавливает новый SOTA-результат в 70%... это наша первая model, которая работает на уровне эксперта-человека или выше.

Это уникальная model, которая превосходит человека в 44 реальных профессиях в США.

Внутренняя цепочка рассуждений наконец-то показывает признаки подлинной самокоррекции.

Перед нами model, которая не просто предсказывает текст, она симулирует логику.

Генерация 24,000 строк кода в одном ответе — это просто неслыханно.

Теперь здесь есть опция выбора времени на раздумья... позволяющая включить режим 'Extended Thinking'.

Эта model набрала больше баллов, чем все остальные, в тесте Mensa Norway... IQ от 145 до 147.

Точность извлечения данных из контекста практически идеальна даже при 400k tokens.

Это не просто больше данных, это совершенно другая архитектура для обеспечения глубины логики.

Тот факт, что ИИ побеждает экспертов в GDP-Val более чем в 50% случаев — это пугающая веха для рынка труда.

Все просто работает... Я действительно впечатлен способностями GPT 5.2 к программированию.

Функция canvas делает отладку кода 3JS мгновенной.

OpenAI наконец-то решила проблему «лени», которая преследовала GPT-4.

Это самый «профессионально» звучащий ИИ, с которым я когда-либо взаимодействовал.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Советы для GPT-5.2 Pro

Экспертные советы для максимальной эффективности GPT-5.2 Pro.

Extended Thinking

используйте режим 'extended thinking' для математических или логических задач, где точность важнее скорости.

Интеграция с Codex

используйте ее высокую производительность в специализированных средах, таких как Codex, для управления сложными кодовыми базами.

Проверка предпосылок

если первая посылка в длинном ответе неверна, прервите генерацию и сразу исправьте ее.

Итеративное улучшение

если исходный код не работает, отправьте текст ошибки из консоли обратно — это крайне эффективно для исправления со второй попытки.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Часто задаваемые вопросы о GPT-5.2 Pro

Найдите ответы на частые вопросы о GPT-5.2 Pro