openai

GPT-5.3 Codex

GPT-5.3 Codex — это передовой кодинг-агент 2026 года от OpenAI, обладающий контекстным окном 400K, результатом 77,3% в Terminal-Bench и превосходной логикой...

Кодинг-агентGPT-5OpenAIПрограммная инженерияАвтономный AI
openai logoopenaiGPT5 февраля 2026 г.
Контекст
400Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$1.75/ 1M
Цена вывода
$14.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
81%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.3 Codex набрал 81% в этом бенчмарке.
HLE
36%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.3 Codex набрал 36% в этом бенчмарке.
MMLU
93%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.3 Codex набрал 93% в этом бенчмарке.
MMLU Pro
83%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.3 Codex набрал 83% в этом бенчмарке.
SimpleQA
58%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.3 Codex набрал 58% в этом бенчмарке.
IFEval
94%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.3 Codex набрал 94% в этом бенчмарке.
AIME 2025
94%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.3 Codex набрал 94% в этом бенчмарке.
MATH
96%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.3 Codex набрал 96% в этом бенчмарке.
GSM8k
99%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.3 Codex набрал 99% в этом бенчмарке.
MGSM
96%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.3 Codex набрал 96% в этом бенчмарке.
MathVista
78%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.3 Codex набрал 78% в этом бенчмарке.
SWE-Bench
57%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.3 Codex набрал 57% в этом бенчмарке.
HumanEval
93%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.3 Codex набрал 93% в этом бенчмарке.
LiveCodeBench
71%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.3 Codex набрал 71% в этом бенчмарке.
MMMU
84%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.3 Codex набрал 84% в этом бенчмарке.
MMMU Pro
64%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.3 Codex набрал 64% в этом бенчмарке.
ChartQA
91%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.3 Codex набрал 91% в этом бенчмарке.
DocVQA
95%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.3 Codex набрал 95% в этом бенчмарке.
Terminal-Bench
77.3%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.3 Codex набрал 77.3% в этом бенчмарке.
ARC-AGI
54%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.3 Codex набрал 54% в этом бенчмарке.

О модели GPT-5.3 Codex

Узнайте о возможностях, функциях и способах использования GPT-5.3 Codex.

Новая эра автономной разработки

GPT-5.3 Codex, самая способная agentic модель OpenAI для написания кода. Она преодолевает разрыв между статической генерацией кода и автономной инженерией ПО. Построенная на архитектуре GPT-5, она объединяет специализированные профессиональные знания с продвинутым reasoning, что позволяет выполнять долгосрочные задачи, такие как системное администрирование, мониторинг развертывания и архитектурный рефакторинг. Модель включает функцию управления в процессе выполнения (mid-task steering). Это позволяет разработчикам взаимодействовать с агентом и направлять его в реальном времени, пока он работает над сложными проектами.

Рекурсивный интеллект и производительность

OpenAI обучала эту модель, используя её собственные ранние итерации для отладки и оптимизации процессов развертывания. Это значительный шаг к самосовершенствующимся системам. Модель превосходно работает в средах Terminal-Bench 2.0, демонстрируя способность управлять реальными терминалами, запускать юнит-тесты и итеративно исправлять ошибки без вмешательства человека. Такой подход к рекурсивному обучению привел к эффективному использованию tokens и контекстному окну в 400 000 tokens. Она способна анализировать целые корпоративные репозитории за один проход.

Бесшовная профессиональная интеграция

Доступная через специальное приложение Codex, CLI и расширения для IDE, модель легко встраивается в современные рабочие процессы. Она эффективно выявляет эксплойты нулевого дня, оптимизирует архитектуру конвейеров данных и проводит аудит legacy-кода на профессиональном уровне. Обладая превосходной логикой и конкурентной ценой, модель служит высокопроизводительным инструментом для сложных инженерных задач.

GPT-5.3 Codex

Варианты использования GPT-5.3 Codex

Откройте для себя различные способы использования GPT-5.3 Codex для достижения отличных результатов.

Автономная разработка ПО

Проектирование и создание модульных, многофайловых программных проектов на основе высокоуровневых спецификаций.

Аудит промышленного кода

Анализ действующих кодовых баз на предмет проблем с параллелизмом, утечек памяти и архитектурного технического долга.

DevOps-автоматизация в реальном времени

Управление процессами в терминале, включая настройку серверов, развертывание контейнеров и масштабирование кластеров.

Устранение уязвимостей в кибербезопасности

Выявление и исправление эксплойтов нулевого дня и уязвимостей ПО с использованием высокоэффективной защитной логики.

Интерактивное прототипирование

Создание готовых к использованию лендингов и веб-приложений на основе набросков или недостаточно детальных prompt.

Архитектура конвейеров данных

Отслеживание и оптимизация сложных потоков данных через несколько уровней обработки и асинхронные среды.

Преимущества

Ограничения

State-of-the-art логика кодирования: Лидирующий в отрасли показатель 77,3% в Terminal-Bench 2.0 и превосходная производительность в SWE-Bench Pro.
Функциональная лаконичность: Иногда отдает приоритет функциональной краткости в ущерб глубокой архитектурной проработке, характерной для моделей вроде o3-pro.
Непревзойденное соотношение цены и качества: Обеспечивает agentic возможности уровня frontier model примерно за 1/7 стоимости таких конкурентов, как Opus 4.6.
Эстетическое оформление по умолчанию: Хотя логически дизайн безупречен, первоначальные варианты UI для приложений иногда требуют доработки визуального стиля.
Рекурсивная самооптимизация: Создана с использованием собственной архитектуры для выявления багов и оптимизации обучения ради высокой эффективности.
Пробелы в ресурсоемких задачах: Иногда пропускает задачи по очистке ресурсов в сложных аппаратно-программных симуляциях.
Интерактивное управление в реальном времени: Уникальная способность принимать указания от людей прямо во время выполнения задачи, снижая потребность в длинных итерационных циклах.
Сложность экосистемы: Основной доступ оптимизирован для специализированного приложения Codex и CLI, что создает порог вхождения для стандартных пользователей API.

Быстрый старт API

openai/gpt-5.3-codex

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.3 Codex

Посмотрите, что думает сообщество о GPT-5.3 Codex

GPT-5.3 Codex ощущается не как обычный чат-бот, а как чисто инженерная модель.
Federal-Piano8695
reddit
Codex выдает лучший код примерно за 1/7 цены. Производительность на доллар просто абсурдная.
sergeykarayev
reddit
Он не просто выполнял мои инструкции. Он принимал интеллектуальные решения. В этом чувствовалось что-то вроде здравого суждения.
mattshumer_
twitter
Только что мигрировали всю нашу оркестровку бэкенда на агентов Codex, и надежность пугающе высока.
HackerNewsUser99
hackernews
GPT 5.3 Codex установил новый рекорд в Terminal-Bench 2.0. 77,3%, это огромный скачок по сравнению с предыдущей версией.
bridgemindai
twitter
Способность работать с контекстным окном 400K позволяет аудировать целые корпоративные репозитории за один раз.
cdcore
other

Видео о GPT-5.3 Codex

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.3 Codex

Codeex действительно правильно реализовал оба варианта, внеся изменения в представление, в то время как Claude просто привязал его к первой клавише.

Codeex на самом деле нашел основную причину, но также определил её как потенциальную проблему и сразу исправил.

Мне понравилось, как объекты отскакивали от зданий, физика ощущалась наиболее естественно.

В сравнении с Gemini 3.1, Codex справляется с многофайловой логикой с гораздо меньшим отклонением.

Скорость agentic циклов здесь заметно выше, чем у Claude Opus 4.6.

Это не очередной помощник для написания кода. Это AI, который создает весь ваш проект, пока вы наблюдаете.

Возможность просто скормить весь набор документации в prompt, это нечто невероятное.

Вы буквально можете видеть, как он исправляет собственные ошибки в терминале в реальном времени.

Если вы занимаетесь разработкой инструментов для SEO, скрипты для парсинга, которые он пишет, готовы к продакшену.

Ему удалось развернуть весь сайт на Vercel, пока я не нажал ни одной кнопки.

GPT-5.3 Codex, наша первая модель, которая сыграла ключевую роль в создании самой себя.

Эффективность роста его возможностей при меньшем потреблении tokens просто фантастическая.

Мы наблюдаем колоссальный скачок в том, как он справляется с интеграцией реального оборудования.

Движок рассуждений (reasoning), стоящий за решениями в коде, гораздо более надежен, чем у стандартного GPT-5.

Оценки Terminal-Bench, это одно, но видеть, как он перемещается по файловой системе Linux, совсем другое.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-5.3 Codex

Экспертные советы для максимальной эффективности GPT-5.3 Codex.

Включите управление в реальном времени

Активируйте поведение для последующих действий в настройках Codex, чтобы направлять модель прямо во время сборки, не теряя контекст.

Используйте режим планирования (Plan Mode)

Используйте команду Plan для сложных рефакторингов, чтобы модель сначала наметила стратегию перед внесением правок.

Пакетные обзоры Pull Request

Загружайте целые ветки функций в контекстное окно 400K для глубокого интеграционного тестирования.

Сжатие контекста

Полагайтесь на встроенное сжатие контекста для длительных agentic сессий, чтобы сохранять фокус на проекте.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Часто задаваемые вопросы о GPT-5.3 Codex

Найдите ответы на частые вопросы о GPT-5.3 Codex