openai

GPT-5.2

GPT-5.2 — это флагманская model от OpenAI для профессиональных задач, обладающая context window в 400K, элитным уровнем написания кода и способностью к...

openai logoopenaiGPT-5December 11, 2025
Контекст
400Kтокенов
Макс. вывод
100Kтокенов
Цена ввода
$1.75/ 1M
Цена вывода
$14.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
93%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.2 набрал 93% в этом бенчмарке.
HLE
45%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.2 набрал 45% в этом бенчмарке.
MMLU
88%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.2 набрал 88% в этом бенчмарке.
MMLU Pro
83%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.2 набрал 83% в этом бенчмарке.
SimpleQA
58%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.2 набрал 58% в этом бенчмарке.
IFEval
95%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.2 набрал 95% в этом бенчмарке.
AIME 2025
100%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.2 набрал 100% в этом бенчмарке.
MATH
98%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.2 набрал 98% в этом бенчмарке.
GSM8k
99%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.2 набрал 99% в этом бенчмарке.
MGSM
98%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.2 набрал 98% в этом бенчмарке.
MathVista
78%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.2 набрал 78% в этом бенчмарке.
SWE-Bench
80%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.2 набрал 80% в этом бенчмарке.
HumanEval
95%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.2 набрал 95% в этом бенчмарке.
LiveCodeBench
80%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.2 набрал 80% в этом бенчмарке.
MMMU
75%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.2 набрал 75% в этом бенчмарке.
MMMU Pro
65%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.2 набрал 65% в этом бенчмарке.
ChartQA
93%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.2 набрал 93% в этом бенчмарке.
DocVQA
95%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.2 набрал 95% в этом бенчмарке.
Terminal-Bench
60%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.2 набрал 60% в этом бенчмарке.
ARC-AGI
52.9%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.2 набрал 52.9% в этом бенчмарке.

Попробуйте GPT-5.2 Бесплатно

Общайтесь с GPT-5.2 бесплатно. Протестируйте возможности, задавайте вопросы и изучайте, на что способна эта ИИ-модель.

Промпт
Ответ
openai/gpt-5.2

Ваш ответ ИИ появится здесь

О модели GPT-5.2

Узнайте о возможностях, функциях и способах использования GPT-5.2.

Элитное профессиональное reasoning

GPT-5.2 представляет собой frontier model от OpenAI в области искусственного интеллекта профессионального уровня, специально разработанную для сложной интеллектуальной работы и автономного выполнения задач. Выпущенная в конце 2025 года, она представляет выделенный режим Thinking mode, который позволяет model планировать многоэтапную логику, что делает ее исключительно эффективной в сложной программной инженерии, продвинутых математических доказательствах и научном анализе. Архитектура этой model интегрирует multimodal vision и вызов инструментов в единый механизм reasoning, позволяя ей выступать в роли agentic партнера в профессиональных рабочих процессах.

Масштабируемая архитектура интеллекта

С технической точки зрения GPT-5.2 обладает лучшим в индустрии context window в 400K tokens с точностью recall почти 100%, что позволяет ей обрабатывать массивные кодовые базы или плотные технические руководства без потери информации. Хотя она превосходит другие модели в точности и надежности (сократив галлюцинации на 30% по сравнению с предыдущими итерациями), model переходит на более формальный, структурированный тон общения. Она оптимизирована для корпоративных сред, где последовательность и точность приоритетнее творческих изысков, что знаменует переход к AI как к надежному интеллектуальному сотруднику.

GPT-5.2

Варианты использования GPT-5.2

Откройте для себя различные способы использования GPT-5.2 для достижения отличных результатов.

Автономная программная инженерия

решение сложных проблем на GitHub и отладка масштабных кодовых баз с точностью 80%.

Глубокие финансовые исследования

проведение фундаментального анализа акций и синтез рыночных трендов с использованием интегрированных agentic инструментов.

Многоэтапная бизнес-автоматизация

оркестрация сложных рабочих процессов в подключенных приложениях, таких как Notion, Slack и Google Drive.

Синтез технической документации

обработка и обобщение объемных технических документов с использованием context window в 400K tokens.

Научное и математическое reasoning

решение научных задач уровня PhD и олимпиадной математики через специализированный режим Thinking.

Генерация профессионального контента

создание высококачественной прозы и детальных профессиональных отчетов в промышленных масштабах.

Преимущества

Ограничения

Элитное владение кодом: результат 80% в SWE-bench Verified делает ее одной из самых способных models для профессиональной программной инженерии.
Проблемы с latency в vision: задачи по анализу и созданию изображений выполняются значительно медленнее, чем текстовое reasoning, из-за высоких вычислительных затрат.
State-of-the-art reasoning: специализированный вариант Thinking обеспечивает глубокую логику для олимпиадной математики и науки уровня PhD.
Холодный тон общения: стиль взаимодействия model часто описывают как формальный и роботизированный, лишенный естественной теплоты предыдущих итераций.
Agentic использование инструментов: высокая эффективность в работе с внешними инструментами, такими как браузеры и среды Python, для управления многоэтапными рабочими процессами.
Премиальная стоимость output: при цене $14 за миллион tokens в режиме Thinking стоимость генерации остается значительно выше, чем у более старых и быстрых models.
Точное воспроизведение при большом контексте: поддержка до 400K tokens с почти идеальной точностью, что идеально для анализа и синтеза массивных данных.
Прерывистость диалога: акцент на структурированности иногда может нарушать плавность естественных синхронных обсуждений с пользователями.

Быстрый старт API

openai/gpt-5.2

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-thinking',
    messages: [{ role: 'user', content: 'Analyze this recursive reflection problem in WebGL 2.' }],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.2

Посмотрите, что думает сообщество о GPT-5.2

"Режим Thinking в GPT-5.2 в корне меняет правила игры для сложных задач по кодингу; она реально создает рабочие приложения за один раз."
AI_Dev
reddit
"Она нашла Уолдо за 13 минут, используя чистый анализ пикселей. Ужасающе умная, но такая медленная в простых задачах."
VisualLearner
youtube
"Recall при context window в 400k почти идеален, наконец-то появился настоящий конкурент доминированию Gemini в области длинного контекста."
LogicGate
hackernews
"Создание изображений в GPT-5.2 до сих пор ощущается медленнее, чем патока, текущая в гору в январе. Скорость — ее главный враг."
adventurepaul
reddit
"Models от OpenAI теперь настолько зациклены на организованности, что общение с ними перестает быть похожим на разговор."
ArchMeta1868
reddit
"Премия ARC только что подтвердила 390-кратное улучшение эффективности за год при переходе от model o3 к 5.2."
Fireship
x

Видео о GPT-5.2

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.2

«GPT 5.2 — это не просто улучшенная версия GPT-4. Это совершенно другой зверь».

«В некоторых режимах вы можете скармливать ей целые книги, несколько научных статей и огромные кодовые базы одновременно».

«В задачах на reasoning на основе изображений режим Thinking достигает точности около 89% в действительно сложных benchmarks».

«Параметр reasoning effort — это ключ к раскрытию истинного логического потенциала этой model».

«Подождите, пока не увидите, как она справляется с prompt caching для повторяющихся задач разработчика».

«Model правильно определила, что пчелы залетают через один вход, а не разлетаются хаотично».

«Model потратила 19 секунд на 'thinking', чтобы создать функциональный клон Photoshop со слоями и режимами наложения».

«GPT 5.2 успешно реализовала рекурсивный ray tracing для отражающих сфер в WebGL 2».

«Я впервые вижу, чтобы AI сохранял состояние в такой массивной логической цепочке».

«Даже со сложными макетами UI модуль vision ни разу не потерял из виду основной CTA».

«OpenAI только что представила свой ответ Gemini: GPT 5.2, model, которая снова развернула колесо хайпа в пользу OpenAI».

«Но настоящий триумф — это ее выход на первое место в benchmark ARC AGI».

«Премия ARC только что подтвердила 390-кратное улучшение эффективности за год при переходе от model o3 к 5.2».

«Если вы думали, что предыдущие coding agents были хороши, то эта штука находится на другом уровне автономии».

«Релизьте ее, просто релизьте эту model, потому что она решает проблемы на GitHub, пока мы спим».

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Профессиональные Советы

Экспертные советы, которые помогут вам максимально использовать эту модель.

Включайте режим Thinking для логики

явно переключайтесь на вариант gpt-5.2-thinking при решении сверхсложных математических или программных задач для достижения максимальной точности.

Используйте prompt caching

воспользуйтесь 24-часовым кэшированием prompt, чтобы снизить latency и затраты при работе с большими повторяющимися наборами данных.

Используйте Model Context Protocol

подключите model к инструментам вашего рабочего пространства для выполнения реальных задач, таких как планирование встреч и отправка писем.

Пошаговый prompting

просите model показывать процесс reasoning, чтобы упростить аудит принятия решений во время задач с экстремально длинным контекстом.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Часто Задаваемые Вопросы

Найдите ответы на частые вопросы об этой модели