openai

GPT-5.4

GPT-5.4 هو frontier model من OpenAI يتميز بـ context window سعة 1.05M و Extreme Reasoning. يتفوق في تفاعل UI ذاتي التشغيل وتحليل البيانات طويلة المدى.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54 مارس 2026
نافذة السياق
1.1Mرموز
أقصى مخرج
128Kرموز
سعر الإدخال
$2.50/ 1M
سعر الإخراج
$15.00/ 1M
الوضع:TextImage
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
84.2%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق GPT-5.4 درجة 84.2% في هذا المعيار.
HLE
42%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق GPT-5.4 درجة 42% في هذا المعيار.
MMLU
91%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق GPT-5.4 درجة 91% في هذا المعيار.
MMLU Pro
76%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق GPT-5.4 درجة 76% في هذا المعيار.
SimpleQA
56.7%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق GPT-5.4 درجة 56.7% في هذا المعيار.
IFEval
92%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق GPT-5.4 درجة 92% في هذا المعيار.
AIME 2025
100%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق GPT-5.4 درجة 100% في هذا المعيار.
MATH
88.6%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق GPT-5.4 درجة 88.6% في هذا المعيار.
GSM8k
99%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق GPT-5.4 درجة 99% في هذا المعيار.
MGSM
96%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق GPT-5.4 درجة 96% في هذا المعيار.
MathVista
74%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق GPT-5.4 درجة 74% في هذا المعيار.
SWE-Bench
52.8%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق GPT-5.4 درجة 52.8% في هذا المعيار.
HumanEval
85.1%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق GPT-5.4 درجة 85.1% في هذا المعيار.
LiveCodeBench
72.5%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق GPT-5.4 درجة 72.5% في هذا المعيار.
MMMU
84.2%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق GPT-5.4 درجة 84.2% في هذا المعيار.
MMMU Pro
61%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق GPT-5.4 درجة 61% في هذا المعيار.
ChartQA
89%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق GPT-5.4 درجة 89% في هذا المعيار.
DocVQA
94%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق GPT-5.4 درجة 94% في هذا المعيار.
Terminal-Bench
55%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق GPT-5.4 درجة 55% في هذا المعيار.
ARC-AGI
52.9%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق GPT-5.4 درجة 52.9% في هذا المعيار.

حول GPT-5.4

تعرف على قدرات GPT-5.4 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

حدود الـ Long-Context Reasoning

يمثل GPT-5.4 التطور عالي الأداء لسلسلة GPT-5، ويتميز بـ context window رائدة في الصناعة تبلغ 1.05 مليون token. تم تصميم هذا الـ model خصيصًا للتعامل مع مجموعات البيانات الواسعة، مثل repositories البرمجية الضخمة أو السجلات التاريخية لعدة سنوات، دون فقدان القدرة على أداء high-fidelity reasoning. إحدى الميزات البارزة هي ميزة 'Mid-Response Steering' التفاعلية، والتي تتيح للمستخدمين مراقبة وتعديل خطة تفكير الـ model بصريًا في الوقت الفعلي، مما يضمن توافق الـ output تمامًا مع الأهداف المعقدة متعددة الخطوات.

ذكاء موحد وعمل ذاتي التشغيل

من الناحية التقنية، يدمج GPT-5.4 نقاط القوة العالمية في البرمجة من فروع Codex السابقة مع اللمسات الإبداعية لسلسلة GPT-5 القياسية. يتميز بوضع 'Thinking' متخصص مع مستويات جهد قابلة للتعديل (Standard و Extended و Heavy) يستخدم معالجة chain-of-thought معززة لحل مشكلات العلوم والمنطق بمستوى PhD. بعيدًا عن النصوص، يقدم GPT-5.4 قدرات native computer use، محققًا درجة 75% في مهام OSWorld-Verified من خلال تفسير لقطات الشاشة المرئية عالية الدقة وتنفيذ نقرات قائمة على الإحداثيات.

الكفاءة والموثوقية

تفيد OpenAI بوجود انخفاض ملحوظ بنسبة 33% في الأخطاء على مستوى الادعاءات مقارنة بالإصدارات السابقة، مما يجعل GPT-5.4 خيارًا ممتازًا للـ autonomous agents ودعم القرارات عالية المخاطر. ورغم قوته، فقد تم تصميمه لتحقيق كفاءة الـ tokens والطاقة، مما يسمح بمعالجة long-context بتكلفة أقل من الإصدارات السابقة. سواء كان يدير codebase كاملة لمؤسسة أو يعمل كـ agent جدولة ذاتي التشغيل، يضع GPT-5.4 معيارًا جديدًا للموثوقية والأداء الـ agentic في مشهد الـ generative AI.

GPT-5.4

حالات استخدام GPT-5.4

اكتشف الطرق المختلفة لاستخدام GPT-5.4 لتحقيق نتائج رائعة.

إعادة هيكلة Codebase الضخمة

استيعاب وتحليل مئات الملفات المصدرية في وقت واحد لضمان الاتساق بين الوحدات (cross-module consistency) وتحديد الأخطاء الدلالية العميقة عبر الـ repositories بالكامل.

جدولة Agentic ذاتية التشغيل

التفاعل مع البريد الإلكتروني والتقويمات عبر visual grounding لتنسيق جداول الفعاليات المعقدة ذاتيًا وإرسال المتابعات.

التصميم المعماري عالي الدقة

توليد مشاهد 3D معقدة وخطط إنشائية، مثل محطات مترو أنفاق وظيفية، باستخدام أكثر من 1000 سطر من الكود الدقيق والجاهز للمحاكاة.

التخطيط العلمي طويل الأمد

استخدام Extreme Reasoning لحل مشكلات علمية بمستوى PhD وإجراء تحليلات متعددة الخطوات تتطلب ساعات من إدارة الحالة المتسقة.

التحقيق في حوادث Cybersecurity

معالجة كميات هائلة من بيانات السجلات (log data) الخام في جلسة context واحدة سعة 1.05M لتحديد حوادث الاختراق الأمني والتحقيق فيها والإبلاغ عنها ذاتيًا.

التوجيه التفاعلي أثناء الرد

تصحيح مسار الـ model خلال مرحلة 'التفكير' الداخلية لتعديل الخيارات المعمارية أو المسارات المنطقية دون الحاجة لإعادة تشغيل الـ prompt.

نقاط القوة

القيود

Frontier 1.05M Context Window: يوفر سعة رائدة في الصناعة للـ reasoning عبر مجموعات البيانات الضخمة والـ codebases في prompt واحد دون فقدان فوري للترابط.
تدهور الـ Long Context: يلاحظ انخفاض الأداء في مهام الـ reasoning عالية التعقيد بشكل كبير بمجرد تجاوز الـ context window حاجز 256K token.
دقة Extreme Reasoning: يحقق مستوى معرفة علمية يضاهي PhD (بنسبة 84.2% على GPQA) ونتائج رياضيات مثالية (100% على AIME 2025) باستخدام وضع high-effort reasoning.
نظام إصدارات محير: تخلق التشكيلة المعقدة من إصدارات 5.1 و 5.2 Thinking و 5.3 Codex و 5.4 عبئًا ذهنيًا كبيرًا لمطوري الـ API ومستخدمي Chat.
تفاعل UI ذاتي التشغيل: يتيح الـ visual grounding المتطور للـ model التفاعل مع البرامج والمتصفحات بدقة 75% على benchmark OSWorld.
Latency عالٍ في وضع Heavy: يمكن أن تستغرق أوضاع جهد الـ reasoning الأعلى أكثر من 8 دقائق لمعالجة CoT الداخلية، مما يجعلها غير مناسبة للمهام التفاعلية في الوقت الفعلي.
كفاءة الـ tokens والطاقة: تم تصميمه ليكون أكثر frontier model كفاءة من OpenAI حتى الآن، مما يقلل تكلفة الطاقة المطلوبة للـ reasoning المعقد مقارنة بإصدار GPT-5.2.
الضبط المتحفظ (Neurotic Alignment): يمكن أن يؤدي الـ safety fine-tuning العنيف إلى سلوكيات معارضة حيث يناقض الـ model المستخدم دون داعٍ في موضوعات واقعية غير ضارة.

البدء السريع API

openai/gpt-5.4

عرض التوثيق
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن GPT-5.4

شاهد رأي المجتمع في GPT-5.4

GPT-5 يحقق عودة ساحقة... كل سطر كود أنتجه كان يعمل بالكامل.
immortalsol
reddit
الميزة الأبرز هي بوضوح الـ context window سعة 1M، مقارنة بحوالي 200k في الـ models الأخرى.
Developer
hackernews
واو، GPT 5.4 جيد بشكل جنوني. يجب أن يكون قفزة للإصدار 6.0. من الصعب تصديق أن Codex قد وصل إلى هذا الحد.
Rahul Sood
twitter
سجل GPT-5.4 درجات عالية استثنائية بلغت 94.0 في NYT Connections. إنه يصيب الهدف من المحاولة الأولى.
senko
hackernews
GPT-5.4 الآن على مؤشر ذكاء التحليل الاصطناعي... متعادل مع Gemini 3.1 Pro.
AiBattle
twitter
عمق الـ reasoning وصل أخيرًا إلى المستوى الذي يمكنه التعامل فيه مع المشكلات المعمارية على مستوى المؤسسات.
CloudArchitect99
reddit

فيديوهات عن GPT-5.4

شاهد الدروس والمراجعات والنقاشات عن GPT-5.4

context window بمليون و50 ألف token... هذه نافذة سياق طويلة جدًا.

بعد 5 دقائق و22 ثانية من التفكير، تلقينا نتيجتنا... لقد اختبر هذا الأمر بأسلوب agentic أكثر.

تحديث قدرة هذا الـ model على النظر في الصور عالية الدقة... حتى 10.24 مليون بكسل إجمالاً.

يقوم الـ model فعليًا بإجراء بحث عبر الويب للتحقق من منطقه الخاص.

هذه قفزة هائلة لسير العمل الـ agentic حيث يجب أن تستمر الحالة (state).

GPT 5.4 لديه كل شيء... لقد قالوا ببساطة، حسنًا، GPT 5.2 و GPT 5.3 Codex، تفضلا بإنجاب طفل.

قدرات البرمجة لا تصدق. إنها مثالية تمامًا.

الذوق في تصميم الـ Front-end متأخر كثيرًا عن Opus 4.6 و Gemini 3.1 Pro.

يبدو أن لديه فهمًا أفضل بكثير لنوايا المطورين الدقيقة.

نقطة السعر تنافسية بالنظر إلى حجم الـ context window البالغ 1 مليون token.

من الواضح أنه يضغط على OpenAI للرد بـ model يطابق قدرة الـ context البالغة مليون واحد.

في محاولة واحدة (single shot)، حقيقة أن هذا الـ model قادر على إنشاء نسخة Minecraft هذه هي مجرد أمر لافت للنظر.

نشهد انخفاضًا بنسبة 33 بالمائة في معدلات الهلوسة الواقعية.

يتم تصنيف أوضاع الـ reasoning إلى مستويات Standard و Extended و Heavy.

الـ visual grounding على benchmark OSWorld هو الرائد في الصناعة حاليًا.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لـ GPT-5.4

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من GPT-5.4 وتحقيق نتائج أفضل.

تبديل جهد الـ Reasoning

استخدم مستويات Standard أو Extended أو Heavy لجهد الـ reasoning اعتمادًا على تعقيد المهمة للموازنة بين التكلفة الحسابية وجودة الـ output.

مراقبة الخطة المسبقة

عند استخدام نسخة Thinking، راقب الخطة المسبقة؛ يمكنك التدخل في منتصف عملية التوليد إذا بدا مسار المنطق المقترح من الـ model معيبًا.

استراتيجية الـ prompt caching

ضع كتل الـ context الكبيرة والثابتة في بداية الـ prompt للاستفادة من ميزة prompt caching التلقائية من OpenAI لتوفير التكاليف.

إدارة استقرار الـ context

بينما تعد نافذة 1.05M قوية، تشير التقارير إلى أن الأداء يكون أكثر استقرارًا ضمن أول 256K tokens؛ احتفظ بالملخصات المهمة بالقرب من نهاية الـ prompt.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

الأسئلة الشائعة حول GPT-5.4

ابحث عن إجابات للأسئلة الشائعة حول GPT-5.4