openai

GPT-5.4

GPT-5.4 — це frontier model від OpenAI з context window 1,05 млн та Extreme Reasoning. Вона чудово справляється з автономною взаємодією з UI та аналізом...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 березня 2026 р.
Контекст
1.1Mтокенів
Макс. вивід
128Kтокенів
Ціна вводу
$2.50/ 1M
Ціна виводу
$15.00/ 1M
Модальність:TextImage
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
84.2%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. GPT-5.4 набрав 84.2% у цьому бенчмарку.
HLE
42%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. GPT-5.4 набрав 42% у цьому бенчмарку.
MMLU
91%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. GPT-5.4 набрав 91% у цьому бенчмарку.
MMLU Pro
76%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. GPT-5.4 набрав 76% у цьому бенчмарку.
SimpleQA
56.7%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. GPT-5.4 набрав 56.7% у цьому бенчмарку.
IFEval
92%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. GPT-5.4 набрав 92% у цьому бенчмарку.
AIME 2025
100%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. GPT-5.4 набрав 100% у цьому бенчмарку.
MATH
88.6%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. GPT-5.4 набрав 88.6% у цьому бенчмарку.
GSM8k
99%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. GPT-5.4 набрав 99% у цьому бенчмарку.
MGSM
96%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. GPT-5.4 набрав 96% у цьому бенчмарку.
MathVista
74%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. GPT-5.4 набрав 74% у цьому бенчмарку.
SWE-Bench
52.8%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. GPT-5.4 набрав 52.8% у цьому бенчмарку.
HumanEval
85.1%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. GPT-5.4 набрав 85.1% у цьому бенчмарку.
LiveCodeBench
72.5%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. GPT-5.4 набрав 72.5% у цьому бенчмарку.
MMMU
84.2%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. GPT-5.4 набрав 84.2% у цьому бенчмарку.
MMMU Pro
61%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. GPT-5.4 набрав 61% у цьому бенчмарку.
ChartQA
89%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. GPT-5.4 набрав 89% у цьому бенчмарку.
DocVQA
94%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. GPT-5.4 набрав 94% у цьому бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. GPT-5.4 набрав 55% у цьому бенчмарку.
ARC-AGI
52.9%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. GPT-5.4 набрав 52.9% у цьому бенчмарку.

Про GPT-5.4

Дізнайтеся про можливості GPT-5.4, функції та як це може допомогти вам досягти кращих результатів.

Вершина reasoning з довгим контекстом

GPT-5.4 являє собою високопродуктивну еволюцію серії GPT-5. Вона має провідний у галузі context window розміром 1,05 мільйона tokens. Ця модель обробляє розлогі набори даних, такі як величезні репозиторії коду або багаторічні архіви журналів, без втрати точності reasoning. Інтерактивний Mid-Response Steering дозволяє користувачам контролювати та коригувати план мислення моделі в режимі реального часу. Це гарантує, що результат відповідає складним, багатоетапним намірам.

Уніфікований інтелект та автономні дії

Технічно GPT-5.4 об'єднує першокласні можливості кодування попередніх гілок Codex із творчими нюансами стандартної серії GPT-5. Вона має спеціалізований режим Thinking з регульованими рівнями зусиль. Вони включають режими Standard, Extended та Heavy. Модель використовує посилену обробку chain-of-thought для вирішення наукових і логічних проблем рівня PhD. Окрім тексту, GPT-5.4 представляє нативні можливості computer use. Вона досягає показника 75% у завданнях OSWorld-Verified завдяки інтерпретації візуальних знімків екрана та виконанню натискань на основі координат.

Ефективність та надійність

OpenAI повідомляє про зниження кількості помилок на рівні тверджень на 33% порівняно з попередниками. Це робить GPT-5.4 основним вибором для автономних агентів і підтримки прийняття рішень у критично важливих ситуаціях. Вона розроблена з акцентом на ефективність використання tokens та енергії. Це дозволяє здійснювати дешевшу обробку довгого контексту, ніж у попередніх ітераціях. Незалежно від того, чи керуєте ви всією корпоративною кодовою базою, чи використовуєте модель як автономного агента планування, GPT-5.4 встановлює новий стандарт надійності та agentic продуктивності.

GPT-5.4

Випадки використання для GPT-5.4

Відкрийте різні способи використання GPT-5.4 для досягнення чудових результатів.

Масштабний рефакторинг коду

Систематичне переписування застарілих кодових баз обсягом понад 300 000 рядків із суворим дотриманням архітектурних стандартів.

Автономне фінансове моделювання

Побудова складних моделей трьох звітів, де AI узгоджує звіт про прибутки та збитки, баланс і рух грошових коштів.

Інтерактивне проектування систем

Розробка 3D-симуляцій або ігор на основі фізики шляхом коригування логічного шляху моделі під час процесу генерації.

Agentic Computer Use

Виконання багатоетапних завдань на робочому столі, таких як масове введення даних, керування електронною поштою та тестування програмного забезпечення через нативну взаємодію з UI.

Юридичний аналіз довгого контексту

Перехресна перевірка сотень юридичних документів для виявлення невідповідностей або вилучення конкретних пунктів із високою точністю запам'ятовування.

Дослідницька підтримка рівня PhD

Вирішення складних математичних доведень і наукових проблем за допомогою режиму Heavy Reasoning для перевірених логічних ланцюжків.

Сильні сторони

Обмеження

Величезний context window 1,05 млн: Забезпечує провідну в галузі ємність для глибокого аналізу величезних кодових баз і наборів документів без деградації контексту.
Reasoning latency: Увімкнення режиму Heavy Thinking може призвести до часу очікування у кілька хвилин для складної логіки або генерації великих обсягів коду.
Інтерактивне мислення: Унікальна навігація під час генерації дозволяє користувачам керувати шляхами reasoning, значно зменшуючи марну генерацію та витрати tokens.
Обмеження швидкості (Rate Limiting): Під час початкового розгортання користувачі можуть зіткнутися з агресивними лімітами повідомлень або тимчасовими помилками облікового запису в міру масштабування потужностей.
Нативний Computer Use: Високоточна взаємодія з UI (75% у OSWorld) дозволяє моделі працювати безпосередньо в середовищі робочого столу та браузера.
Нелінійне масштабування: У деяких творчих завданнях легші режими reasoning показали кращі результати в естетичних деталях, ніж важкі режими.
Надзвичайна ефективність tokens: Оптимізована архітектура забезпечує продуктивність на рівні 2026 року з меншою latency та енергоспоживанням, ніж у попередніх версіях GPT-5.
Деградація контексту на 1 млн: Хоча вікно велике, точність пошуку значно знижується при переході з 256K на 1M tokens.

Швидкий старт API

openai/gpt-5.4

Переглянути документацію
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про GPT-5.4

Подивіться, що думає спільнота про GPT-5.4

GPT 5.4 в Codex, це величезне покращення... Я справді бачив, як він працював 150 хвилин поспіль, не втрачаючи контексту.
ArchMeta1868
reddit
Можливості 3D-дизайну GPT 5.4 не мають рівних. Те, як він впорався з прозорістю та фізикою в моєму симуляторі кораблів, було лякаюче точним.
AI_Creative_Daily
twitter
Коригування курсу під час генерації, це неймовірно. Я бачу, куди рухається модель, і можу виправити її, перш ніж вона витратить tokens.
dev_guru_99
reddit
Він перевершив людей у 83% випадків у 44 різних професіях. Юрист. Бухгалтер. Фінансовий аналітик. Адміністратор.
Josh Kale
twitter
OpenAI нарешті усунула вузьке місце виводу. 128 тисяч вихідних tokens, це мрія для розробників, які будують full-stack додатки.
TheCodeChannel
youtube
Latency computer use все ще присутня, але точність достатньо висока, щоб справлятися зі складними робочими процесами SAP, що вражає.
enterprise_sysadmin
hackernews

Відео про GPT-5.4

Дивіться навчальні матеріали, огляди та обговорення про GPT-5.4

GPT 5.4 вже тут, і ми, можливо, отримали найкращу модель на планеті.

Мислительний процес GPT 5.4 тепер може надавати попередній план своїх думок... це дозволяє вам керувати моделлю.

Цей інтерактивний елемент вирішує проблему «чорної скриньки» в моделях reasoning.

Швидкість у порівнянні з o1-preview для стандартних завдань, це небо і земля.

Ви бачите reasoning, який справді здається послідовним протягом довгих розмов.

GPT 5.4... був створений не для чату. Він був створений для роботи.

Відкладене завантаження... зменшило загальне використання tokens на 47% без втрати точності.

Функціонал computer use відстежує елементи UI за допомогою системи координат.

Я протестував його на застарілій кодовій базі Java, і він справді зрозумів міжфайлові залежності.

Ми рухаємося у світ, де AI, це контролер операційної системи.

Context window 1 050 000 tokens. Це дуже великий context window.

Ви можете навігувати в процесі його мислення, що, безумовно, ефективніше.

Ціна висока, але для великих наборів документів це єдина модель, яка працює.

Режим мислення можна налаштувати залежно від складності вашого prompt.

Він здається надійнішим у відтворенні фактів, ніж будь-яка попередня версія GPT.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для GPT-5.4

Експертні поради, які допоможуть вам отримати максимум від GPT-5.4 та досягти кращих результатів.

Керування зусиллями мислення

Використовуйте параметри Standard, Extended або Heavy, щоб збалансувати необхідність точності зі швидкістю генерації та вартістю.

Перевірка плану мислення

Слідкуйте за попереднім планом, наданим моделлю, і використовуйте Mid-Response Steering, щоб виправити його, якщо логіка відхиляється.

Використання відкладеного завантаження інструментів

Для agentic робочих процесів використовуйте реєстр відкладеного завантаження, щоб зменшити витрати на вхідні tokens до 47%.

Використання контрактів на завершеність

Чітко визначте, що означає «завершено» у вашому prompt, щоб зробити модель більш наполегливою під час виконання довготривалих завдань.

Vision з максимальною роздільною здатністю

Завантажуйте високоякісні зображення до 10,24 млн пікселів для точних візуальних перевірок елементів UI або технічних схем.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Часті запитання про GPT-5.4

Знайдіть відповіді на поширені запитання про GPT-5.4