openai

GPT-5.2 Pro

GPT-5.2 Pro — это флагманская модель рассуждения OpenAI 2025 года с функцией Extended Thinking для достижения SOTA-производительности в математике,...

openai logoopenaiGPT-52025-12-11
Контекст
400Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$21.00/ 1M
Цена вывода
$168.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
93.2%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.2 Pro набрал 93.2% в этом бенчмарке.
HLE
36.6%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.2 Pro набрал 36.6% в этом бенчмарке.
MMLU
89.6%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.2 Pro набрал 89.6% в этом бенчмарке.
MMLU Pro
82%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.2 Pro набрал 82% в этом бенчмарке.
SimpleQA
52%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.2 Pro набрал 52% в этом бенчмарке.
IFEval
93.5%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.2 Pro набрал 93.5% в этом бенчмарке.
AIME 2025
100%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.2 Pro набрал 100% в этом бенчмарке.
MATH
97%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.2 Pro набрал 97% в этом бенчмарке.
GSM8k
99.2%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.2 Pro набрал 99.2% в этом бенчмарке.
MGSM
96%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.2 Pro набрал 96% в этом бенчмарке.
MathVista
76.5%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.2 Pro набрал 76.5% в этом бенчмарке.
SWE-Bench
80%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.2 Pro набрал 80% в этом бенчмарке.
HumanEval
94.5%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.2 Pro набрал 94.5% в этом бенчмарке.
LiveCodeBench
78%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.2 Pro набрал 78% в этом бенчмарке.
MMMU
79.5%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.2 Pro набрал 79.5% в этом бенчмарке.
MMMU Pro
79.5%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.2 Pro набрал 79.5% в этом бенчмарке.
ChartQA
91.2%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.2 Pro набрал 91.2% в этом бенчмарке.
DocVQA
94.8%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.2 Pro набрал 94.8% в этом бенчмарке.
Terminal-Bench
55.6%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.2 Pro набрал 55.6% в этом бенчмарке.
ARC-AGI
54.2%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.2 Pro набрал 54.2% в этом бенчмарке.

О модели GPT-5.2 Pro

Узнайте о возможностях, функциях и способах использования GPT-5.2 Pro.

Новый стандарт в интеллектуальных рассуждениях

GPT-5.2 Pro представляет собой высокопроизводительный уровень моделей OpenAI, ориентированных на reasoning. Она специально разработана для корпоративных рабочих процессов, требующих научных исследований уровня PhD и сложных логических выводов. В отличие от стандартных языковых моделей, она использует сложную архитектуру вычислений в процессе inference, которая позволяет пользователям масштабировать усилия модели на размышление. Это позволяет системе внутренне декомпозировать задачи, проверять собственную логику и переопределять статистические предубеждения, которые часто приводят к ошибкам в более простых моделях.

Специализация на технической точности

Хотя Pro-вариант разделяет общее обучение с семейством GPT-5, он отличается огромным context window в 400 000 tokens и значительно более низким уровнем галлюцинаций. Модель зарекомендовала себя как надежный соавтор в области теоретической физики и высокоуровневых математических доказательств. Ее производительность в бенчмарках, устойчивых к «загрязнению» данных (таких как ARC-AGI-2 и GPQA Diamond), делает ее основным вычислительным двигателем для автономных агентов, которые должны выполнять многошаговые технические инструкции без вмешательства человека.

Корпоративная производительность и возможности вывода

Модель характеризуется строгим следованием сложным инструкциям и профессиональным тоном общения. Это первая модель, которая стабильно превосходит экспертов с более чем 14-летним стажем в специализированных рабочих задачах. Благодаря способности генерировать до 128 000 tokens, она знаменует собой значительный отход от «лени», наблюдаемой в предыдущих поколениях, позволяя создавать целые программные модули или исчерпывающие исследовательские отчеты за один проход.

GPT-5.2 Pro

Варианты использования GPT-5.2 Pro

Откройте для себя различные способы использования GPT-5.2 Pro для достижения отличных результатов.

Автономная разработка ПО

Решение сложных проблем в нескольких файлах GitHub и проведение рефакторинга полных модулей с показателем успешности 84,5% на SWE-Bench Verified.

Олимпиадная математика

Решение 100% задач конкурса AIME 2025 и создание оригинальных доказательств для открытых вопросов в теории статистического обучения.

Оркестрация корпоративных агентов

Работа в качестве высокопроизводительного вычислительного ядра, способного последовательно использовать десятки инструментов для многошагового финансового моделирования и логистики.

Научные исследования уровня PhD

Анализ задач по физике, химии и биологии с результатом 93,2% в тесте GPQA, превосходя многих экспертов-людей в этих предметных областях.

Синтез документов с длинным контекстом

Обработка до 400 000 tokens архивных данных для создания комплексных юридических отчетов или технических руководств.

Интерактивное 3D-моделирование

Генерация многотысячных 3D-симуляций на Three.js или C++, включая сложную физику частиц и логику механики.

Преимущества

Ограничения

Идеальная математическая точность: Достигает безупречного результата в 100% при решении задач бенчмарка AIME 2025, исчерпывая потенциал современных математических экзаменов высокого уровня.
Запретительно высокая цена: При стоимости $168 за миллион выходных tokens модель примерно в 16 раз дороже, чем GPT-5.1, что ограничивает её использование критически важными рабочими процессами.
Передовые навыки программирования: Достигает показателя решения 84,5% на SWE-Bench Verified, эффективно работая как младший инженер, способный самостоятельно справляться с серьезным бэклогом ошибок.
Отсутствие функций памяти: Отсутствует поддержка Saved Memories и Reference Chat History, функций, которые являются стандартными для моделей младшего уровня ChatGPT 5.2.
Продвинутое абстрактное рассуждение: Втрое превышает показатели предшественника в ARC-AGI-2 (54,2% против 17,6%), что свидетельствует о прорыве в решении задач на индукцию правил.
Значительная задержка (latency): Глубокие внутренние рассуждения могут привести к тому, что модель будет думать более 15 минут над одним prompt, особенно в режиме xhigh effort.
Массивная емкость вывода в 128K: Разработана для генерации целых книг, репозиториев кода или исчерпывающих научных отчетов за один проход inference.
Ошибки выбора кадров (Frame Selection): Периодические сбои в переопределении статистических предубеждений в задачах на здравый смысл, даже при правильном выявлении логических ограничений в цепочках рассуждений.

Быстрый старт API

openai/gpt-5.2-pro

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Design a leveraged buyout model for a take-private project.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.2 Pro

Посмотрите, что думает сообщество о GPT-5.2 Pro

Рассуждение присутствовало, но вывод просто не следовал из него. Если это не заставляет вас задуматься, то должно.
Ok_Entrance_4380
reddit
GPT-5.2 Pro вывела новый результат в теоретической физике, который прошел проверку экспертами, то, чего 5.1 не могла сделать.
kevinweil
twitter
GPT-5.2 Pro начинает выглядеть как младший инженер, который может взять на себя серьезную часть работы по отслеживанию багов.
Due_Woodpecker2882
reddit
OpenAI признает, что модели Pro не хватает памяти. Для меня как для академика это катастрофа.
Oldschool728603
hackernews
Логика безупречна, но из-за latency кажется, что я работаю с очень медленным гением.
User123
reddit
Наконец-то модель, которая не галлюцинирует при выполнении простого тензорного сокращения.
PhysicsProf
hackernews

Видео о GPT-5.2 Pro

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.2 Pro

ходят слухи об IQ по тесту Mensa Norway от 145 до 147

сгенерировала более 24 000 строк кода

включение опции выбора времени на размышление

цена уровня Pro предназначена строго для корпоративных бюджетов

эта модель разобрала весь мой бэклог разработки за один вечер

сокращение галлюцинаций на 30%

общая верстка поразительно хороша по сравнению с тем, что было в 5.1

Ровно 300 слов. Это первый раз, когда я задал ограничение по словам, и она попала в точное число

Возможности vision в работе с архитектурными чертежами не имеют себе равных

Она кажется значительно более холодной и роботизированной, чем 5.1

GPT5 Pro за $200 думал 25 минут и 36 секунд

назначение двойного объема вычислительных ресурсов inference

превратила сложную задачу... в другой вид инструментов из области комплексного анализа

по сути, это PhD в коробке за $200 в месяц

цепочка рассуждений показывает, что она действительно проверяет свои собственные шаги

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-5.2 Pro

Экспертные советы для максимальной эффективности GPT-5.2 Pro.

Масштабирование усилий на рассуждение

Используйте параметр API reasoning_effort и установите значение xhigh для задач, где логическая последовательность важнее скорости генерации.

Работа со статистическими предубеждениями

Если модель попадает в ловушки здравого смысла, добавьте подсказку в context, чтобы активировать слой активного рассуждения и переопределить базовое обучение.

Использование огромного объема вывода

Запрашивайте целые директории проекта или полные файлы документации в одном prompt, чтобы задействовать бюджет вывода в 128K tokens.

Использование интеграции инструментов

Всегда включайте вызов функций (function calling) для задач, связанных с vision; эффективность multimodal работы модели возрастает, когда она может использовать инструменты для проверки визуальных данных.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Часто задаваемые вопросы о GPT-5.2 Pro

Найдите ответы на частые вопросы о GPT-5.2 Pro