openai

GPT-5.3 Codex

GPT-5.3 Codex — это frontier-агент 2026 года от OpenAI для написания кода с context window 400K, результатом 77.3% в Terminal-Bench и превосходной логикой для...

Coding AgentGPT-5OpenAIРазработка ПОАвтономный ИИ
openai logoopenaiGPT-55 февраля 2026 г.
Контекст
400Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$1.75/ 1M
Цена вывода
$14.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
81%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GPT-5.3 Codex набрал 81% в этом бенчмарке.
HLE
36%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GPT-5.3 Codex набрал 36% в этом бенчмарке.
MMLU
93%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GPT-5.3 Codex набрал 93% в этом бенчмарке.
MMLU Pro
83%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GPT-5.3 Codex набрал 83% в этом бенчмарке.
SimpleQA
58%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GPT-5.3 Codex набрал 58% в этом бенчмарке.
IFEval
94%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GPT-5.3 Codex набрал 94% в этом бенчмарке.
AIME 2025
94%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GPT-5.3 Codex набрал 94% в этом бенчмарке.
MATH
96%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GPT-5.3 Codex набрал 96% в этом бенчмарке.
GSM8k
99%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GPT-5.3 Codex набрал 99% в этом бенчмарке.
MGSM
96%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GPT-5.3 Codex набрал 96% в этом бенчмарке.
MathVista
78%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GPT-5.3 Codex набрал 78% в этом бенчмарке.
SWE-Bench
57%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GPT-5.3 Codex набрал 57% в этом бенчмарке.
HumanEval
93%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GPT-5.3 Codex набрал 93% в этом бенчмарке.
LiveCodeBench
71%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GPT-5.3 Codex набрал 71% в этом бенчмарке.
MMMU
84%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GPT-5.3 Codex набрал 84% в этом бенчмарке.
MMMU Pro
64%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GPT-5.3 Codex набрал 64% в этом бенчмарке.
ChartQA
91%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GPT-5.3 Codex набрал 91% в этом бенчмарке.
DocVQA
95%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GPT-5.3 Codex набрал 95% в этом бенчмарке.
Terminal-Bench
77.3%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GPT-5.3 Codex набрал 77.3% в этом бенчмарке.
ARC-AGI
54%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GPT-5.3 Codex набрал 54% в этом бенчмарке.

О модели GPT-5.3 Codex

Узнайте о возможностях, функциях и способах использования GPT-5.3 Codex.

Новая эра автономной разработки

GPT-5.3 Codex — самая мощная agentic-модель OpenAI для кодинга, созданная для того, чтобы стереть грань между статической генерацией кода и автономной программной инженерией. Построенная на архитектуре GPT-5 следующего поколения, она сочетает в себе специализированные профессиональные знания с продвинутым reasoning для решения долгосрочных задач, таких как системное администрирование, мониторинг развертывания и архитектурный рефакторинг. Модель отличается возможностью «управления в процессе задачи» (mid-task steering), позволяя разработчикам взаимодействовать с агентом и направлять его в реальном времени при работе над сложными проектами.

Рекурсивный интеллект и производительность

Обученная с использованием своих собственных ранних итераций для отладки и оптимизации развертывания, GPT-5.3 Codex представляет собой значительный шаг к самосовершенствующимся системам ИИ. Она демонстрирует выдающиеся результаты в средах Terminal-Bench 2.0, проявляя способность управлять живыми терминалами, запускать unit-тесты и итеративно исправлять ошибки без вмешательства человека. Этот рекурсивный подход к обучению позволил добиться высокоэффективного использования tokens и огромного context window в 400 000 tokens, способного поглощать целые корпоративные репозитории за один проход.

Бесшовная профессиональная интеграция

Доступная через специальное приложение Codex, CLI и расширения для IDE, модель разработана для глубокой интеграции в современные рабочие процессы. Она особенно эффективна при выявлении уязвимостей нулевого дня, оптимизации архитектур data pipeline и проведении аудита устаревших кодовых баз на промышленном уровне. Благодаря превосходной логике и конкурентоспособной цене, она быстро стала золотым стандартом для критически важных задач программной инженерии.

GPT-5.3 Codex

Варианты использования GPT-5.3 Codex

Откройте для себя различные способы использования GPT-5.3 Codex для достижения отличных результатов.

Автономная разработка ПО

проектирование архитектуры и создание модульных многофайловых проектов на основе высокоуровневых спецификаций.

Аудит производственного кода

анализ кодовых баз на предмет проблем с параллелизмом, утечек памяти и архитектурного технического долга.

DevOps-автоматизация в реальном времени

управление рабочими процессами в терминале, включая настройку серверов, развертывание контейнеров и масштабирование кластеров.

Устранение уязвимостей кибербезопасности

идентификация и исправление эксплойтов нулевого дня с помощью высокоуровневой защитной логики.

Интерактивное прототипирование

генерация готовых к продакшену лендингов и веб-приложений из нарисованных от руки макетов или неполных prompt.

Архитектура Data Pipeline

отслеживание и оптимизация сложных потоков данных через несколько уровней обработки в асинхронных средах.

Преимущества

Ограничения

State-of-the-Art логика кодинга: лидирующий в индустрии результат 77.3% в Terminal-Bench 2.0 и превосходные показатели в SWE-Bench Pro.
Сжатая детализация: иногда отдает приоритет функциональной краткости в ущерб экстремальной архитектурной глубине, присущей таким моделям, как o3-pro.
Непревзойденное соотношение цены и качества: предоставляет frontier agentic возможности примерно в 7 раз дешевле, чем ближайший конкурент Opus 4.6.
Стандартный дизайн: несмотря на логическую безупречность, первоначальные UI-дизайны приложений иногда могут казаться недостаточно современными визуально.
Рекурсивная самооптимизация: построена с использованием собственной архитектуры для поиска багов и оптимизации обучения, что обеспечивает высочайшую эффективность.
Пропуски ресурсов в критических узлах: в редких случаях может упустить специфические задачи по очистке ресурсов в сложных симуляциях взаимодействия «железа» и софта.
Интерактивный Real-Time Steering: уникальная способность принимать корректировки от человека в процессе выполнения задачи, сокращая циклы итераций.
Сложность экосистемы: основной доступ ограничен специализированным приложением Codex и CLI, что создает порог вхождения для обычных пользователей.

Быстрый старт API

openai/gpt-5.3-codex

Посмотреть документацию
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GPT-5.3 Codex

Посмотрите, что думает сообщество о GPT-5.3 Codex

"Они реально выпустили GPT-5.3 Codex в ту же минуту, когда вышла Opus 4.6, ЛОЛ"
ShreckAndDonkey123
reddit
"Codex выдает лучший код примерно в 7 раз дешевле"
sergeykarayev
reddit
"Производительность на единицу стоимости у GPT-5.3 Codex просто абсурдная"
VraserX
x
"Я заставил GPT-5.3-Codex-Spark прочитать сайт собственного сервиса и создать новый веб-сайт. Она закончила в мгновение ока"
Yohei Takanashi
x
"Эта модель правильно рассуждала об изоляции акторов в Swift... в день выхода"
HeroicTardigrade
reddit
"Только что мигрировали всю оркестровку нашего бэкенда на Codex agents, и надежность пугающе высока"
HackerNewsUser99
hackernews

Видео о GPT-5.3 Codex

Смотрите обучающие материалы, обзоры и обсуждения о GPT-5.3 Codex

GPT-5.3 Codex — это наша первая модель, которая сыграла ключевую роль в создании самой себя

Эффективность того, сколько она может сделать с меньшим количеством tokens, просто фантастическая

Эта катушка вращается правильно, пока сопло движется прямо здесь, в симуляции

Мы видим огромный скачок в том, как модель справляется с интеграцией реального оборудования

Рекурсивный цикл обучения здесь — это настоящий game changer для точности

Мне не хочется возвращаться к GPT 5.2, потому что она кажется просто медленной

Это действительно ощущается как большой прирост скорости... мне сказали, что она на 25% быстрее предыдущей модели

Latency при небольших правках кода теперь практически отсутствует

Работа с огромными легаси-проектами — это то, где context window в 400K раскрывается по-настоящему

Впервые я чувствую, что ИИ действительно понимает архитектуру моего проекта

Это не просто очередной помощник для кода. Это ИИ, который строит весь ваш проект, пока вы наблюдаете

То, что раньше занимало у меня дни, теперь с этой штукой занимает часы

Возможность просто закинуть целый набор документации в prompt — это нечто невообразимое

Вы буквально видите, как она исправляет свои собственные ошибки в терминале в реальном времени

Для любого, кто строит SaaS, это будет ваш самый ценный сотрудник

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GPT-5.3 Codex

Экспертные советы для максимальной эффективности GPT-5.3 Codex.

Включите Real-Time Steering

активируйте функцию обратной связи в настройках Codex, чтобы направлять модель прямо в процессе написания кода.

Используйте Plan Mode

применяйте команду «Plan» для сложных рефакторингов, чтобы модель составила план стратегии перед началом редактирования.

Пакетный аудит Pull Request

используйте context window в 400K для передачи целых веток с фичами для глубокого интеграционного тестирования.

Context Compaction

полагайтесь на нативную функцию сжатия контекста (context compaction) во время длительных agentic-сессий для сохранения фокуса на проекте.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

Часто задаваемые вопросы о GPT-5.3 Codex

Найдите ответы на частые вопросы о GPT-5.3 Codex