openai

GPT-5.4

GPT-5.4 مدل frontier شرکت OpenAI با context window ۱.۰۵ میلیونی و Extreme Reasoning است. این مدل در تعامل خودکار با UI و تحلیل داده‌های طولانی‌مدت برتری دارد.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-5۵ مارس ۲۰۲۶
پنجره زمینه
1.1Mتوکن
حداکثر خروجی
128Kتوکن
قیمت ورودی
$2.50/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
84.2%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. GPT-5.4 امتیاز 84.2% در این معیار کسب کرد.
HLE
42%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. GPT-5.4 امتیاز 42% در این معیار کسب کرد.
MMLU
91%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. GPT-5.4 امتیاز 91% در این معیار کسب کرد.
MMLU Pro
76%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. GPT-5.4 امتیاز 76% در این معیار کسب کرد.
SimpleQA
56.7%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. GPT-5.4 امتیاز 56.7% در این معیار کسب کرد.
IFEval
92%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. GPT-5.4 امتیاز 92% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. GPT-5.4 امتیاز 100% در این معیار کسب کرد.
MATH
88.6%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. GPT-5.4 امتیاز 88.6% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. GPT-5.4 امتیاز 99% در این معیار کسب کرد.
MGSM
96%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. GPT-5.4 امتیاز 96% در این معیار کسب کرد.
MathVista
74%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. GPT-5.4 امتیاز 74% در این معیار کسب کرد.
SWE-Bench
52.8%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. GPT-5.4 امتیاز 52.8% در این معیار کسب کرد.
HumanEval
85.1%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. GPT-5.4 امتیاز 85.1% در این معیار کسب کرد.
LiveCodeBench
72.5%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. GPT-5.4 امتیاز 72.5% در این معیار کسب کرد.
MMMU
84.2%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. GPT-5.4 امتیاز 84.2% در این معیار کسب کرد.
MMMU Pro
61%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. GPT-5.4 امتیاز 61% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. GPT-5.4 امتیاز 89% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. GPT-5.4 امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
55%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. GPT-5.4 امتیاز 55% در این معیار کسب کرد.
ARC-AGI
52.9%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. GPT-5.4 امتیاز 52.9% در این معیار کسب کرد.

درباره GPT-5.4

درباره قابلیت‌های GPT-5.4، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

مرز reasoning با context طولانی

GPT-5.4 نشان‌دهنده تکامل با کارایی بالا در سری GPT-5 است. این مدل دارای یک context window پیشرو در صنعت با ظرفیت ۱.۰۵ میلیون token است. این مدل مجموعه‌های داده گسترده، مانند مخازن کد عظیم یا گزارش‌های تاریخی چند ساله را بدون از دست دادن دقت منطقی پردازش می‌کند. قابلیت تعاملی Mid-Response Steering به کاربران امکان می‌دهد برنامه فکری مدل را به صورت real-time نظارت و تنظیم کنند. این امر تضمین می‌کند که خروجی با اهداف پیچیده و چندمرحله‌ای مطابقت دارد.

هوش یکپارچه و عمل خودکار

از نظر فنی، GPT-5.4 نقاط قوت برنامه‌نویسی در سطح جهانی شاخه‌های قبلی Codex را با ظرافت‌های خلاقانه سری استاندارد GPT-5 یکپارچه می‌کند. این مدل دارای یک حالت Thinking تخصصی با سطوح تلاش قابل تنظیم است. این سطوح شامل حالت‌های Standard، Extended و Heavy هستند. این مدل از پردازش chain-of-thought تقویت‌شده برای حل مسائل علمی و منطقی در سطح دکتری استفاده می‌کند. فراتر از متن، GPT-5.4 قابلیت‌های بومی استفاده از کامپیوتر را معرفی می‌کند. این مدل با تفسیر اسکرین‌شات‌های بصری و اجرای کلیک‌های مبتنی بر مختصات، به امتیاز ۷۵٪ در وظایف تأیید شده OSWorld دست می‌یابد.

بهره‌وری و قابلیت اطمینان

OpenAI گزارش می‌دهد که خطاهای سطح ادعا در مقایسه با پیشینیان ۳۳٪ کاهش یافته است. این امر GPT-5.4 را به انتخابی اصلی برای عوامل خودکار (autonomous agents) و پشتیبانی از تصمیم‌گیری‌های حساس تبدیل می‌کند. این مدل برای بهره‌وری token و انرژی مهندسی شده است. این موضوع امکان پردازش ارزان‌تر contextهای طولانی را نسبت به تکرارهای قبلی فراهم می‌کند. چه در حال مدیریت یک پایگاه کد سازمانی کامل باشد و چه به عنوان یک عامل برنامه‌ریز خودکار عمل کند، GPT-5.4 استاندارد جدیدی برای قابلیت اطمینان و عملکرد agentic تعیین می‌کند.

GPT-5.4

موارد استفاده برای GPT-5.4

روش‌های مختلف استفاده از GPT-5.4 برای دستیابی به نتایج عالی را کشف کنید.

بازنویسی (Refactoring) کدهای مقیاس بزرگ

بازنویسی سیستماتیک کدهای قدیمی بیش از ۳۰۰,۰۰۰ خطی با پایبندی دقیق به استانداردهای معماری.

مدل‌سازی مالی خودکار

ایجاد مدل‌های پیچیده سه صورت مالی که در آن AI صورت سود و زیان، ترازنامه و جریان وجوه نقد را با هم مطابقت می‌دهد.

طراحی سیستم تعاملی

توسعه شبیه‌سازی‌های سه‌بعدی یا بازی‌های مبتنی بر فیزیک با هدایت مسیر منطقی مدل در طول فرآیند تولید.

استفاده agentic از کامپیوتر

اجرای وظایف چندمرحله‌ای دسکتاپ مانند ورود انبوه داده‌ها، مدیریت ایمیل و تست نرم‌افزار از طریق تعامل بومی با UI.

تحلیل حقوقی با context طولانی

ارجاع متقاطع صدها سند حقوقی برای شناسایی تناقضات یا استخراج بندهای خاص با دقت بازخوانی بالا.

پشتیبانی پژوهشی در سطح دکتری

حل اثبات‌های پیچیده ریاضی و مسائل علمی با استفاده از حالت Heavy Reasoning برای زنجیره‌های منطقی تأیید شده.

نقاط قوت

محدودیت‌ها

context عظیم ۱.۰۵ میلیون token: ظرفیتی پیشرو در صنعت برای تحلیل عمیق پایگاه‌های کد و مجموعه‌های اسناد عظیم بدون افت context.
latency در Reasoning: فعال‌سازی حالت Heavy Thinking می‌تواند منجر به زمان‌های انتظار چند دقیقه‌ای برای منطق‌های پیچیده یا تولید کدهای حجیم شود.
تفکر تعاملی: ناوبری منحصر به فرد در میانه پاسخ که به کاربران اجازه می‌دهد مسیرهای reasoning را هدایت کنند و هدررفت تولید و token را به شدت کاهش دهند.
محدودیت نرخ (Rate Limiting): در طول عرضه اولیه، ممکن است کاربران با محدودیت‌های شدید پیام یا باگ‌های موقت حساب کاربری به دلیل افزایش ظرفیت مواجه شوند.
استفاده بومی از کامپیوتر: تعامل با دقت بالای UI (۷۵٪ در OSWorld) که به مدل اجازه می‌دهد مستقیماً در محیط‌های دسکتاپ و مرورگر کار کند.
مقیاس‌پذیری غیرخطی: در برخی وظایف خلاقانه، مشاهده شده که حالت‌های reasoning سبک‌تر در جزئیات زیبایی‌شناختی بهتر از حالت‌های سنگین عمل می‌کنند.
بهره‌وری فوق‌العاده در مصرف token: معماری بهینه شده عملکردی در سطح frontier سال ۲۰۲۶ را با latency و مصرف انرژی کمتر از نسخه‌های قبلی GPT-5 ارائه می‌دهد.
افت کیفیت در حافظه ۱ میلیون token: اگرچه window بزرگ است، اما دقت بازیابی هنگام حرکت از ۲۵۶ هزار به ۱ میلیون token به میزان قابل‌توجهی کاهش می‌یابد.

شروع سریع API

openai/gpt-5.4

مشاهده مستندات
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "این کنترلر را برای مدیریت بهتر خطا بازنویسی کن." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره GPT-5.4 چه می‌گویند

ببینید جامعه درباره GPT-5.4 چه فکر می‌کند

GPT 5.4 در Codex پیشرفت بسیار بزرگی است... من واقعاً شاهد کارکرد آن برای ۱۵۰ دقیقه به صورت یک‌سره بدون از دست دادن context بودم.
ArchMeta1868
reddit
مهارت‌های طراحی سه‌بعدی GPT 5.4 بی‌نظیر است. نحوه‌ای که شفافیت و فیزیک را در شبیه‌ساز کشتی من مدیریت کرد، به شکل ترسناکی دقیق بود.
AI_Creative_Daily
twitter
اصلاح مسیر در میانه پاسخ باورنکردنی است. من واقعاً می‌توانم ببینم مدل به کجا می‌رود و قبل از هدر دادن tokenها آن را اصلاح کنم.
dev_guru_99
reddit
در ۴۴ شغل مختلف، ۸۳٪ مواقع از انسان‌ها پیشی گرفت. وکیل، حسابدار، تحلیلگر مالی، مدیر.
Josh Kale
twitter
OpenAI بالاخره گلوگاه خروجی را رفع کرد. ۱۲۸ هزار token خروجی برای توسعه‌دهندگانی که برنامه‌های full-stack می‌سازند، یک رویاست.
TheCodeChannel
youtube
latency استفاده از کامپیوتر هنوز وجود دارد، اما دقت آن به اندازه‌ای بالا هست که جریان‌های کاری پیچیده SAP را مدیریت کند که دیوانه‌کننده است.
enterprise_sysadmin
hackernews

ویدیوهای درباره GPT-5.4

آموزش‌ها، بررسی‌ها و بحث‌های درباره GPT-5.4 را تماشا کنید

GPT 5.4 اینجاست و احتمالاً ما اکنون بهترین مدل جهان را داریم.

تفکر در GPT 5.4 اکنون می‌تواند یک برنامه اولیه از تفکر خود ارائه دهد... که به شما اجازه می‌دهد مدل را هدایت کنید.

این عنصر تعاملی، مشکل «جعبه سیاه» در مدل‌های reasoning را حل می‌کند.

سرعت آن نسبت به o1-preview برای وظایف استاندارد، تفاوت شب و روز است.

شما شاهد reasoning هستید که در طول مکالمات طولانی واقعاً منسجم به نظر می‌رسد.

GPT 5.4... برای چت کردن ساخته نشده است. برای کار کردن ساخته شده است.

بارگذاری با تأخیر... استفاده کلی از token را تا ۴۷٪ بدون افت دقت کاهش داد.

قابلیت استفاده از کامپیوتر، عناصر UI را با سیستم مبتنی بر مختصات ردیابی می‌کند.

من آن را با یک پایگاه کد قدیمی Java تست کردم و واقعاً وابستگی‌های بین‌فایلی را درک کرد.

ما در حال حرکت به دنیایی هستیم که در آن AI کنترل‌کننده سیستم‌عامل است.

ظرفیت ۱ میلیون و ۵۰ هزار token برای context window. این یک context window بسیار طولانی است.

در حین تفکر مدل در آن پیمایش کنید، که قطعاً استفاده از آن را کارآمدتر می‌کند.

قیمت‌گذاری سنگین است اما برای مجموعه‌های بزرگ اسناد، تنها مدلی است که کار می‌کند.

حالت Thinking می‌تواند بر اساس پیچیدگی prompt شما تنظیم شود.

از نظر بازیابی حقایق، نسبت به هر نسخه قبلی GPT قابل‌اعتمادتر است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای GPT-5.4

نکات تخصصی برای کمک به شما در استفاده حداکثری از GPT-5.4 و دستیابی به نتایج بهتر.

تنظیم میزان دقت (Thinking Effort)

از پارامترهای Standard، Extended یا Heavy استفاده کنید تا نیاز به دقت را در برابر سرعت تولید و هزینه متعادل کنید.

بازبینی برنامه تفکر (Thinking Plan)

برنامه اولیه‌ای که توسط مدل ارائه می‌شود را نظارت کنید و اگر منطق آن از مسیر منحرف شد، از Mid-Response Steering برای اصلاح آن استفاده کنید.

بهره‌گیری از بارگذاری ابزار با تأخیر (Deferred Tool Loading)

برای گردش‌کارهای agentic، از رجیستری بارگذاری با تأخیر استفاده کنید تا هزینه‌های اولیه token را تا ۴۷٪ کاهش دهید.

استفاده از قراردادهای تکمیل (Completeness Contracts)

در prompt خود به صراحت تعریف کنید که «تمام شدن» به چه معناست تا مدل در طول وظایف طولانی‌مدت، پیوستگی خود را حفظ کند.

Vision با حداکثر رزولوشن

تصاویر با کیفیت بالا تا ۱۰.۲۴ میلیون پیکسل را برای بررسی‌های بصری دقیق عناصر UI یا نمودارهای فنی آپلود کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

سوالات متداول درباره GPT-5.4

پاسخ سوالات رایج درباره GPT-5.4 را بیابید