openai

GPT-5.4

مدل GPT-5.4 پیشروترین model شرکت OpenAI با context window ۱.۰۵ میلیونی و Extreme Reasoning است. این مدل در تعامل خودکار با UI و تحلیل داده‌های طولانی تخصص دارد.

OpenAIGPT-5context window یک میلیونیreasoningmultimodal
openai logoopenaiGPT-5March 4, 2026
پنجره زمینه
1.1Mتوکن
حداکثر خروجی
128Kتوکن
قیمت ورودی
$2.50/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
84.2%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. GPT-5.4 امتیاز 84.2% در این معیار کسب کرد.
HLE
42%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. GPT-5.4 امتیاز 42% در این معیار کسب کرد.
MMLU
91%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. GPT-5.4 امتیاز 91% در این معیار کسب کرد.
MMLU Pro
76%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. GPT-5.4 امتیاز 76% در این معیار کسب کرد.
SimpleQA
56.7%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. GPT-5.4 امتیاز 56.7% در این معیار کسب کرد.
IFEval
92%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. GPT-5.4 امتیاز 92% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. GPT-5.4 امتیاز 100% در این معیار کسب کرد.
MATH
88.6%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. GPT-5.4 امتیاز 88.6% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. GPT-5.4 امتیاز 99% در این معیار کسب کرد.
MGSM
96%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. GPT-5.4 امتیاز 96% در این معیار کسب کرد.
MathVista
74%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. GPT-5.4 امتیاز 74% در این معیار کسب کرد.
SWE-Bench
52.8%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. GPT-5.4 امتیاز 52.8% در این معیار کسب کرد.
HumanEval
85.1%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. GPT-5.4 امتیاز 85.1% در این معیار کسب کرد.
LiveCodeBench
72.5%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. GPT-5.4 امتیاز 72.5% در این معیار کسب کرد.
MMMU
84.2%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. GPT-5.4 امتیاز 84.2% در این معیار کسب کرد.
MMMU Pro
61%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. GPT-5.4 امتیاز 61% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. GPT-5.4 امتیاز 89% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. GPT-5.4 امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
55%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. GPT-5.4 امتیاز 55% در این معیار کسب کرد.
ARC-AGI
52.9%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. GPT-5.4 امتیاز 52.9% در این معیار کسب کرد.

درباره GPT-5.4

درباره قابلیت‌های GPT-5.4، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

پیشرو در استدلال با Context طولانی

GPT-5.4 تکامل پرقدرت سری GPT-5 است که با context window ۱.۰۵ میلیون token خود شناخته می‌شود. این model به طور اختصاصی برای مدیریت مجموعه‌داده‌های عظیم، مانند مخازن کد حجیم یا لاگ‌های تاریخی چندساله، بدون از دست دادن توانایی انجام reasoning با دقت بالا مهندسی شده است. ویژگی برجسته آن، «Mid-Response Steering» تعاملی است که به کاربران اجازه می‌دهد به صورت بصری بر برنامه تفکر model نظارت کرده و آن را در لحظه تنظیم کنند تا خروجی دقیقاً با قصدهای پیچیده و چندمرحله‌ای مطابقت داشته باشد.

هوش یکپارچه و اقدام خودکار

از نظر فنی، GPT-5.4 نقاط قوت کلاس جهانی در coding از شاخه‌های قبلی Codex را با ظرافت‌های خلاقانه سری استاندارد GPT-5 متحد می‌کند. این مدل دارای یک حالت «Thinking» اختصاصی با سطوح تلاش قابل تنظیم (Standard، Extended و Heavy) است که از پردازش chain-of-thought تقویت‌شده برای حل مسائل علمی و منطقی در سطح دکتری استفاده می‌کند. فراتر از متن، GPT-5.4 قابلیت‌های native برای استفاده از کامپیوتر را معرفی می‌کند و با تفسیر اسکرین‌شات‌های بصری high-fidelity و اجرای کلیک‌های مبتنی بر مختصات، به امتیاز ۷۵٪ در تسک‌های OSWorld-Verified دست یافته است.

کارایی و قابلیت اطمینان

OpenAI گزارش داده است که خطاهای ادعایی نسبت به نسخه‌های قبلی ۳۳٪ کاهش یافته است که GPT-5.4 را به انتخابی برتر برای autonomous agents و پشتیبانی از تصمیم‌گیری‌های حساس تبدیل می‌کند. علیرغم قدرت بالا، این مدل برای کارایی در مصرف token و انرژی مهندسی شده است که امکان پردازش ارزان‌تر context طولانی را نسبت به نسخه‌های قبلی فراهم می‌کند. چه مدیریت کل پایگاه کد یک سازمان باشد و چه ایفای نقش به عنوان یک agent زمان‌بندی خودکار، GPT-5.4 استانداردی جدید برای قابلیت اطمینان و عملکرد agentic در چشم‌انداز هوش مصنوعی مولد تعیین می‌کند.

GPT-5.4

موارد استفاده برای GPT-5.4

روش‌های مختلف استفاده از GPT-5.4 برای دستیابی به نتایج عالی را کشف کنید.

بازنویسی (Refactoring) مخازن کد بزرگ

دریافت و تحلیل صدها فایل سورس به صورت همزمان برای اطمینان از یکپارچگی میان ماژول‌ها و شناسایی باگ‌های معنایی عمیق در کل مخازن.

زمان‌بندی خودکار مبتنی بر Agentic

تعامل با ایمیل و تقویم از طریق درک بصری برای هماهنگی خودکار رویدادهای پیچیده و ارسال مکاتبات پیگیری.

طراحی معماری High-Fidelity

تولید صحنه‌های پیچیده سه بعدی و نقشه‌های ساختاری، مانند ایستگاه‌های متروی کاربردی، با استفاده از بیش از ۱۰۰۰ خط کد دقیق و آماده شبیه‌سازی.

برنامه‌ریزی علمی بلندمدت

استفاده از Extreme Reasoning برای حل مسائل علمی در سطح دکتری و انجام تحلیل‌های چند مرحله‌ای که نیازمند ساعت‌ها مدیریت وضعیت (state) مداوم است.

بررسی حوادث امنیت سایبری

پردازش حجم وسیعی از داده‌های خام log در یک session واحد ۱.۰۵M context برای شناسایی، بررسی و گزارش خودکار رخنه‌های امنیتی.

هدایت تعاملی Mid-Response Steering

اصلاح مسیر model در طول فاز داخلی «تفکر» برای تغییر انتخاب‌های معماری یا مسیرهای منطقی بدون نیاز به شروع مجدد prompt.

نقاط قوت

محدودیت‌ها

پیشرو با 1.05M Context Window: ارائه ظرفیت پیشرو در صنعت برای استدلال روی مجموعه‌داده‌های حجیم و مخازن کد در یک prompt واحد بدون از دست دادن انسجام.
تضعیف کیفیت در Context طولانی: گزارش شده است که عملکرد در تسک‌های reasoning با پیچیدگی بالا، پس از فراتر رفتن از مرز ۲۵۶ هزار token، به طرز چشمگیری کاهش می‌یابد.
دقت Extreme Reasoning: دستیابی به دانش علمی در سطح دکتری (۸۴.۲٪ در GPQA) و نمرات کامل ریاضی (۱۰۰٪ در AIME 2025) با استفاده از حالت reasoning سطح بالا.
طرح نسخه‌بندی گیج‌کننده: تنوع پیچیده نسخه‌های 5.1، 5.2 Thinking، 5.3 Codex و 5.4 باعث ایجاد بار ذهنی زیاد برای توسعه‌دهندگان API و کاربران Chat می‌شود.
تعامل خودکار با UI: قابلیت درک بصری state-of-the-art که به model اجازه می‌دهد با نرم‌افزارها و مرورگرها با دقت ۷۵٪ در benchmark OSWorld تعامل داشته باشد.
Latency بالا در حالت Heavy: بالاترین سطوح reasoning effort ممکن است بیش از ۸ دقیقه برای پردازش داخلی CoT زمان ببرند که آن‌ها را برای تسک‌های تعاملی Real-time نامناسب می‌کند.
کارایی در مصرف Token و انرژی: این model به عنوان کارآمدترین frontier model شرکت OpenAI تا به امروز طراحی شده که هزینه انرژی مورد نیاز برای reasoning پیچیده را نسبت به نسخه GPT-5.2 کاهش می‌دهد.
Neurotic Alignment: اعمال سخت‌گیرانه safety fine-tuning می‌تواند منجر به رفتارهای متضاد شود که در آن model بی‌دلیل در مورد موضوعات واقعی بی‌خطر با کاربر مخالفت می‌کند.

شروع سریع API

openai/gpt-5.4

مشاهده مستندات
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره GPT-5.4 چه می‌گویند

ببینید جامعه درباره GPT-5.4 چه فکر می‌کند

GPT-5 بازگشتی کوبنده داشته است... تک‌تک خطوط کدی که تولید کرد کاملاً کار می‌کردند.
immortalsol
reddit
ویژگی اصلی قطعاً context window یک میلیونی است، در حالی که مدل‌های دیگر حدود ۲۰۰ هزار را پشتیبانی می‌کنند.
Developer
hackernews
واو، GPT 5.4 فوق‌العاده خوب است. باید به نسخه ۶.۰ ارتقا می‌یافت. باورکردنی نیست که Codex تا این حد پیشرفت کرده است.
Rahul Sood
twitter
GPT-5.4 امتیاز فوق‌العاده ۹۴.۰ را در NYT Connections کسب کرد. فقط مسائل را در اولین تلاش درست حل می‌کند.
senko
hackernews
GPT-5.4 اکنون در شاخص هوش مصنوعی Artificial Analysis قرار دارد... هم‌تراز با Gemini 3.1 Pro.
AiBattle
twitter
عمق reasoning بالاخره به سطحی رسیده است که می‌تواند مشکلات معماری در مقیاس سازمانی را مدیریت کند.
CloudArchitect99
reddit

ویدیوهای درباره GPT-5.4

آموزش‌ها، بررسی‌ها و بحث‌های درباره GPT-5.4 را تماشا کنید

یک context window با ظرفیت ۱ میلیون و ۵۰ هزار token... این یک پنجره بسیار طولانی است. [۰۳:۴۸]

پس از ۵ دقیقه و ۲۲ ثانیه تفکر، نتیجه را دریافت کردیم... این مورد را بیشتر به صورت agentic آزمایش کرد.

به‌روزرسانی توانایی مدل برای مشاهده تصاویر high-fidelity... تا سقف ۱۰.۲۴ میلیون پیکسل کل. [۲۷:۵۷]

model در واقع برای تایید منطق خود در وب تحقیق انجام می‌دهد. [۳۱:۱۲]

این یک جهش بزرگ برای workflowهای agentic است که در آن وضعیت (state) باید حفظ شود. [۴۲:۱۵]

GPT 5.4 همه چیز دارد... آن‌ها اساساً گفتند بسیار خب، 5.2 و GPT 5.3 Codex با هم ترکیب شوند. [۰۲:۲۲]

قابلیت‌های coding خیره‌کننده هستند. عملاً بی‌نقص است. [۱۴:۳۱]

سلیقه فرانت‌اند بسیار عقب‌تر از Opus 4.6 و Gemini 3.1 Pro است. [۱۴:۴۷]

به نظر می‌رسد درک بسیار بهتری از قصد ظریف توسعه‌دهنده دارد. [۱۸:۰۲]

قیمت با توجه به اندازه ۱ میلیون token در context window رقابتی است. [۲۲:۱۹]

به وضوح OpenAI را تحت فشار می‌گذارد تا با مدلی پاسخ دهد که با آن قابلیت ۱ میلیون context برابری کند. [۰۱:۳۱]

این واقعیت که این model می‌تواند در یک تلاش (single shot) این کلون Minecraft را بسازد، شگفت‌انگیز است. [۰۴:۱۵]

ما شاهد کاهش ۳۳ درصدی در نرخ توهمات واقعی (factual hallucination) هستیم. [۰۶:۵۵]

حالت‌های reasoning به سطوح Standard، Extended و Heavy دسته‌بندی شده‌اند. [۰۸:۲۰]

درک بصری در benchmark OSWorld در حال حاضر پیشرو در صنعت است. [۱۱:۱۰]

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای GPT-5.4

نکات تخصصی برای کمک به شما در استفاده حداکثری از GPT-5.4 و دستیابی به نتایج بهتر.

تغییر سطح Reasoning Effort

بسته به پیچیدگی تسک، از سطوح Standard، Extended یا Heavy برای reasoning استفاده کنید تا تعادلی میان هزینه محاسباتی و کیفیت خروجی ایجاد شود.

نظارت بر برنامه اولیه

هنگام استفاده از نسخه Thinking، به برنامه اولیه مدل دقت کنید؛ اگر مسیر منطقی پیشنهادی model اشتباه به نظر رسید، می‌توانید در میانه تولید پاسخ دخالت کنید.

استفاده استراتژیک از Prompt Caching

بلاک‌های بزرگ و ثابت context را در ابتدای prompt خود قرار دهید تا از قابلیت prompt caching خودکار OpenAI برای صرفه‌جویی در هزینه‌ها بهره‌مند شوید.

مدیریت ثبات Context

اگرچه context window ۱.۰۵ میلیونی بسیار قدرتمند است، اما گزارش شده که عملکرد در ۲۵۶ هزار token اول پایدارتر است؛ خلاصه‌های حیاتی را نزدیک به انتهای prompt نگه دارید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

سوالات متداول درباره GPT-5.4

پاسخ سوالات رایج درباره GPT-5.4 را بیابید