openai

GPT-5.5

GPT-5.5 — это flagship frontier model от OpenAI с context window 1M и пятью уровнями интенсивности рассуждений, оптимизированная для автономных агентных...

Agentic AIOpenAIGPT-5Автономный кодFrontier Models
openai logoopenaiGPT-523 апреля 2026
Контекст
1.0Mтокенов
Макс. вывод
128Kтокенов
Цена ввода
$5.00/ 1M
Цена вывода
$30.00/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
93.6%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.5 набрал 93.6% в этом бенчмарке.
HLE
52.2%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.5 набрал 52.2% в этом бенчмарке.
MMLU
92.5%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.5 набрал 92.5% в этом бенчмарке.
MMLU Pro
88.1%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.5 набрал 88.1% в этом бенчмарке.
SimpleQA
57%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.5 набрал 57% в этом бенчмарке.
IFEval
92.1%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.5 набрал 92.1% в этом бенчмарке.
AIME 2025
100%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.5 набрал 100% в этом бенчмарке.
MATH
98%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.5 набрал 98% в этом бенчмарке.
GSM8k
98.5%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.5 набрал 98.5% в этом бенчмарке.
MGSM
96.4%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.5 набрал 96.4% в этом бенчмарке.
MathVista
76%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.5 набрал 76% в этом бенчмарке.
SWE-Bench
58.6%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.5 набрал 58.6% в этом бенчмарке.
HumanEval
94.2%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.5 набрал 94.2% в этом бенчмарке.
LiveCodeBench
78%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.5 набрал 78% в этом бенчмарке.
MMMU
88.3%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.5 набрал 88.3% в этом бенчмарке.
MMMU Pro
62%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.5 набрал 62% в этом бенчмарке.
ChartQA
94%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.5 набрал 94% в этом бенчмарке.
DocVQA
95%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.5 набрал 95% в этом бенчмарке.
Terminal-Bench
82.7%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.5 набрал 82.7% в этом бенчмарке.
ARC-AGI
85%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.5 набрал 85% в этом бенчмарке.

О модели GPT-5.5

Узнайте о возможностях, функциях и способах использования GPT-5.5.

Переход к агентному интеллекту

GPT-5.5 представляет собой переход от просто больших языковых моделей к большим агентным моделям. Она разработана для работы в качестве автономного напарника, а не простого чат-бота, способного планировать, выполнять и проверять сложные рабочие процессы в цифровой среде. Главным инновационным решением модели является внедрение переменных уровней усилий на рассуждение (reasoning effort), что дает разработчикам детальный контроль над временем «размышления» модели и соответствующими затратами на вычисления.

Техническая эффективность и зрение

Технически GPT-5.5 сохраняет context window в 1 миллион tokens, присущий семейству GPT-5, но при этом демонстрирует 40%-ный прирост в эффективности использования tokens. Это означает, что, несмотря на удвоение цены за токен по сравнению с серией 5.4, фактическая стоимость выполнения сложных задач выросла всего на 20%. Визуальные возможности модели также были значительно расширены: теперь она достигает производительности, близкой к человеческой, при работе с техническими схемами и пространственными задачами вроде ARC-AGI v2.

Оптимизация для автономности

Модель особенно эффективна для автономного программирования, где она может управлять целыми репозиториями и самостоятельно проверять исправления ошибок. Благодаря использованию нового параметра reasoning_effort, пользователи могут переключаться между пятью уровнями глубины логики, что делает её первой моделью, предлагающей гибкую шкалу «интеллекта» для решения критически важных задач.

GPT-5.5

Варианты использования GPT-5.5

Откройте для себя различные способы использования GPT-5.5 для достижения отличных результатов.

Автономная разработка ПО

Управление целыми репозиториями кода, исправление багов и развертывание обновлений без участия человека.

Анализ научных исследований

Обработка тысяч исследовательских работ в рамках context window в 1M для синтеза новых гипотез.

Сложное финансовое моделирование

Создание и аудит сложных корпоративных финансовых структур с математической точностью уровня PhD.

Многошаговые агентные рабочие процессы

Создание и выполнение рекурсивных списков задач для достижения долгосрочных цифровых целей в автономном режиме.

Технический визуальный анализ

Интерпретация сложных инженерных чертежей и электрических схем для автоматизированного контроля качества.

Высокоточное сжатие данных

Преобразование массивных наборов данных в плотные, насыщенные информацией резюме, сохраняющие глубокие семантические нюансы.

Преимущества

Ограничения

Элитная агентная производительность: Достигает лидирующего в отрасли показателя 82.7 в Terminal-Bench 2.0 для задач использования компьютера и терминала.
Высокий уровень галлюцинаций: Демонстрирует уровень галлюцинаций 86% на benchmark фактических знаний, несмотря на высокие способности к рассуждению.
Масштабный context window: Поддержка контекста в 1M tokens, что позволяет анализировать полные кодовые репозитории и огромные массивы исследовательских данных.
Премиальная ценовая стратегия: При цене $5/$30 за 1 млн tokens она значительно дороже предыдущих поколений и open-source конкурентов.
Идеальное математическое обоснование: Получен идеальный результат 100% в benchmark по математическим рассуждениям олимпиадного уровня AIME 2025.
Отсутствие обработки видео: В отличие от некоторых multimodal конкурентов, таких как Gemini, GPT-5.5 лишена нативной возможности преобразования видео в текст.
Гибкие усилия на рассуждение: Предусмотрено 5 различных уровней интенсивности рассуждений, позволяющих разработчикам балансировать между latency, стоимостью и интеллектом модели.
Пробелы в творческом письме: Производительность в творческом письме и поэтическом выражении уступает flagship моделям от Anthropic.

Быстрый старт API

openai/gpt-5.5

Посмотреть документацию
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const response = await openai.chat.completions.create({
    model: "gpt-5.5",
    messages: [
      { role: "system", content: "You are an autonomous coding agent." },
      { role: "user", content: "Debug this Python repository and verify the fixes." }
    ],
    reasoning_effort: "xhigh"
  });

  console.log(response.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.5

Посмотрите, что думает сообщество о GPT-5.5

Уровень галлюцинаций просто дикий, 86% на фактах? Она как гений, который отказывается сказать 'я не знаю'.
@ArtificialAnlys
twitter
GPT-5.5 Pro стоит $180 за миллион выходных tokens. Мы официально вступили в эпоху люксового ИИ.
@skeptrune
twitter
Эра прото-AGI наступила. Это больше не чат-бот, это полноценный напарник.
lostlifon
reddit
Лестница рассуждений с 5 уровнями интенсивности, это самый полезный функционал со времен вызова функций (function calling).
DataLearnerAI
hackernews
OpenAI проделали отличную работу. Это дорого, но реально работает для высокоуровневых агентных задач.
David Ondrej
youtube
По 20 benchmark GPT-5.5 набирает чуть больше, чем Opus 4.7, но теперь она стоит $5 за миллион tokens.
@rxhit05
twitter

Видео о GPT-5.5

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.5

Способности к рассуждению у этой модели, это небо и земля по сравнению со всем, что мы видели раньше.

Она буквально создала целое SaaS-приложение за один проход, и мне не пришлось исправлять ни одного бага.

При цене $5 за миллион tokens нужно быть уверенным, что вам действительно нужен такой уровень интеллекта.

Если сравнивать с open-source моделями, все еще есть значительный разрыв в агентной автономности.

Параметры интенсивности рассуждений, это главная фишка для разработчиков.

OpenAI превзошли себя. Это дорого, но модель реально работает для сложных агентных задач.

Визуальное понимание макетов интерфейса теперь абсолютно точное.

Она управляет своим состоянием на протяжении нескольких шагов гораздо лучше, чем GPT-5.4.

Можно буквально дать ей терминал и позволить работать 20 минут.

Цена кусается, но сэкономленное на отладке время того стоит.

Context window в целый миллион tokens, это переломный момент для анализа длинных документов.

Если вы создаете автономных агентов, это сейчас единственная модель, которая кажется по-настоящему автономной.

Я заметил высокий уровень галлюцинаций по очень специфическим историческим фактам.

Выигрыш в эффективности означает, что вы используете меньше tokens для той же сложной задачи.

Это специализированный инструмент для разработчиков, а не просто чат-бот для развлечений.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-5.5

Экспертные советы для максимальной эффективности GPT-5.5.

Используйте reasoning_effort уровня 'xhigh'

Установите параметр reasoning_effort на 'xhigh' для задач, требующих высокой логической нагрузки, таких как математика или архитектурное проектирование.

Используйте преимущества большого context window

Предоставляйте полную документацию и контекст кодовой базы в начальном system prompt, чтобы максимально эффективно использовать окно в 1 млн tokens.

Внедряйте циклы самокритики

Запрашивайте рекурсивную проверку, при которой модель критикует свой первый результат, чтобы снизить уровень галлюцинаций.

Агентная верификация

Используйте уровень усилий 'xhigh' для agentic задач, чтобы модель самостоятельно проверяла каждый шаг перед переходом к следующему.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Часто задаваемые вопросы о GPT-5.5

Найдите ответы на частые вопросы о GPT-5.5