openai

GPT-5.4

GPT-5.4 هو الموديل الرائد من OpenAI، ويتميز بـ context window بحجم 1.05 مليون token وExtreme Reasoning. يتفوق في التفاعل المستقل مع واجهات المستخدم وتحليل...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 مارس 2026
نافذة السياق
1.1Mرموز
أقصى مخرج
128Kرموز
سعر الإدخال
$2.50/ 1M
سعر الإخراج
$15.00/ 1M
الوضع:TextImage
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
84.2%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق GPT-5.4 درجة 84.2% في هذا المعيار.
HLE
42%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق GPT-5.4 درجة 42% في هذا المعيار.
MMLU
91%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق GPT-5.4 درجة 91% في هذا المعيار.
MMLU Pro
76%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق GPT-5.4 درجة 76% في هذا المعيار.
SimpleQA
56.7%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق GPT-5.4 درجة 56.7% في هذا المعيار.
IFEval
92%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق GPT-5.4 درجة 92% في هذا المعيار.
AIME 2025
100%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق GPT-5.4 درجة 100% في هذا المعيار.
MATH
88.6%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق GPT-5.4 درجة 88.6% في هذا المعيار.
GSM8k
99%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق GPT-5.4 درجة 99% في هذا المعيار.
MGSM
96%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق GPT-5.4 درجة 96% في هذا المعيار.
MathVista
74%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق GPT-5.4 درجة 74% في هذا المعيار.
SWE-Bench
52.8%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق GPT-5.4 درجة 52.8% في هذا المعيار.
HumanEval
85.1%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق GPT-5.4 درجة 85.1% في هذا المعيار.
LiveCodeBench
72.5%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق GPT-5.4 درجة 72.5% في هذا المعيار.
MMMU
84.2%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق GPT-5.4 درجة 84.2% في هذا المعيار.
MMMU Pro
61%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق GPT-5.4 درجة 61% في هذا المعيار.
ChartQA
89%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق GPT-5.4 درجة 89% في هذا المعيار.
DocVQA
94%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق GPT-5.4 درجة 94% في هذا المعيار.
Terminal-Bench
55%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق GPT-5.4 درجة 55% في هذا المعيار.
ARC-AGI
52.9%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق GPT-5.4 درجة 52.9% في هذا المعيار.

حول GPT-5.4

تعرف على قدرات GPT-5.4 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

حدود الـ reasoning طويل السياق

يمثل GPT-5.4 التطور عالي الأداء لسلسلة GPT-5. يتميز بـ context window رائد في الصناعة بحجم 1.05 مليون token. يتعامل هذا الموديل مع مجموعات البيانات الموسعة، مثل مستودعات الأكواد الضخمة أو سجلات تاريخية لسنوات عديدة، دون فقدان دقة الـ reasoning. يسمح الـ Mid-Response Steering التفاعلي للمستخدمين بمراقبة وتعديل خطة تفكير الموديل في الوقت الفعلي، مما يضمن توافق المخرجات مع النوايا المعقدة ومتعددة الخطوات.

ذكاء موحد وإجراءات مستقلة

تقنياً، يوحّد GPT-5.4 نقاط القوة البرمجية العالمية لفروع Codex السابقة مع الفروق الدقيقة الإبداعية لسلسلة GPT-5 القياسية. يتميز بوضع Thinking mode متخصص مع مستويات جهد قابلة للتعديل، تشمل أوضاع Standard وExtended وHeavy. يستخدم معالجة chain-of-thought معززة لحل المشكلات العلمية والمنطقية بمستوى الدكتوراه. بالإضافة إلى النص، يقدم GPT-5.4 قدرات أصلية لاستخدام الكمبيوتر، حيث يحقق 75% في مهام OSWorld عبر تفسير لقطات الشاشة وتنفيذ نقرات تعتمد على الإحداثيات.

الكفاءة والموثوقية

تشير تقارير OpenAI إلى انخفاض بنسبة 33% في أخطاء مستوى الادعاء مقارنة بالإصدارات السابقة، مما يجعل GPT-5.4 خياراً أساسياً للـ autonomous agents ودعم القرارات ذات المخاطر العالية. لقد تم تصميمه من أجل كفاءة الـ tokens والطاقة، مما يسمح بمعالجة سياق طويل بتكلفة أقل من التكرارات السابقة. سواء كان يدير قاعدة أكواد مؤسسية كاملة أو يعمل كـ autonomous scheduling agent، يضع GPT-5.4 معياراً جديداً للموثوقية وأداء الـ agentic.

GPT-5.4

حالات استخدام GPT-5.4

اكتشف الطرق المختلفة لاستخدام GPT-5.4 لتحقيق نتائج رائعة.

إعادة هيكلة الأكواد واسعة النطاق

إعادة كتابة الأكواد البرمجية القديمة التي تتجاوز 300,000 سطر بشكل منهجي مع الالتزام الصارم بالمعايير المعمارية.

النمذجة المالية المستقلة

بناء نماذج مالية معقدة حيث تقوم الـ AI بمطابقة قوائم الدخل، والميزانيات العمومية، والتدفقات النقدية.

تصميم الأنظمة التفاعلية

تطوير محاكاة ثلاثية الأبعاد أو ألعاب تعتمد على الفيزياء من خلال توجيه مسار منطق الموديل أثناء عملية التوليد.

استخدام الكمبيوتر بطريقة agentic

تنفيذ مهام مكتبية متعددة الخطوات مثل إدخال البيانات الضخمة، وإدارة البريد الإلكتروني، واختبار البرمجيات عبر التفاعل المباشر مع واجهة المستخدم.

التحليل القانوني طويل السياق

مقارنة مئات الوثائق القانونية لتحديد التناقضات أو استخراج بنود محددة بدقة عالية في الـ recall.

دعم الأبحاث بمستوى دكتوراه

حل البراهين الرياضية المعقدة والمشكلات العلمية باستخدام وضع Heavy Reasoning لسلاسل منطقية موثقة.

نقاط القوة

القيود

سياق ضخم بحجم 1.05 مليون token: يوفر قدرة رائدة في الصناعة للتحليل العميق لقواعد الأكواد ومجموعات الوثائق الهائلة دون تدهور في الـ context.
latency الـ reasoning: تفعيل وضع Heavy Thinking قد يؤدي إلى أوقات انتظار تصل إلى عدة دقائق للمنطق المعقد أو توليد أكواد برمجية كبيرة.
التفكير التفاعلي: يسمح التنقل الفريد أثناء التوليد للمستخدمين بتوجيه مسارات الـ reasoning، مما يقلل بشكل كبير من الهدر في التوليد والـ tokens.
تحديد معدل الطلبات: خلال الإطلاق الأولي، قد يواجه المستخدمون حدوداً صارمة للرسائل أو أخطاء مؤقتة في الحسابات مع توسع القدرة.
دعم أصلي لاستخدام الكمبيوتر: التفاعل عالي الدقة مع واجهة المستخدم (75% في OSWorld) يُمكّن الموديل من العمل مباشرة داخل بيئات سطح المكتب والمتصفح.
تدرج غير خطي: في بعض المهام الإبداعية، وُجد أن أوضاع الـ reasoning الأخف تتفوق على الأوضاع الثقيلة في التفاصيل الجمالية.
كفاءة فائقة في الـ tokens: بنية محسّنة تقدم أداءً رائداً لعام 2026 مع latency أقل واستهلاك طاقة أقل من إصدارات GPT-5 السابقة.
تدهور الـ context عند 1 مليون token: على الرغم من كبر حجم الـ window، إلا أن دقة الاسترجاع تنخفض بشكل ملحوظ عند الانتقال من 256 ألف إلى 1 مليون token.

البدء السريع API

openai/gpt-5.4

عرض التوثيق
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن GPT-5.4

شاهد رأي المجتمع في GPT-5.4

GPT 5.4 في Codex يمثل تحسناً هائلاً... لقد رأيته يعمل لمدة 150 دقيقة متواصلة دون فقدان الـ context.
ArchMeta1868
reddit
مهارات التصميم ثلاثي الأبعاد لـ GPT 5.4 لا تضاهى. الطريقة التي تعامل بها مع الشفافية والفيزياء في محاكي السفن الخاص بي كانت دقيقة بشكل مخيف.
AI_Creative_Daily
twitter
تصحيح المسار أثناء الرد أمر مذهل. يمكنني رؤية إلى أين يتجه الموديل وإصلاحه قبل أن يهدر الـ tokens.
dev_guru_99
reddit
لقد تفوق على البشر في 83% من الحالات عبر 44 وظيفة مختلفة. محامٍ. محاسب. محلل مالي. إداري.
Josh Kale
twitter
قامت OpenAI أخيراً بإصلاح عنق زجاجة الـ output. 128 ألف token للمخرجات هو حلم للمطورين الذين يبنون تطبيقات full-stack.
TheCodeChannel
youtube
latency استخدام الكمبيوتر لا يزال موجوداً، لكن الدقة عالية بما يكفي للتعامل مع سير عمل SAP المعقد، وهو أمر جنوني.
enterprise_sysadmin
hackernews

فيديوهات عن GPT-5.4

شاهد الدروس والمراجعات والنقاشات عن GPT-5.4

GPT 5.4 وصل وربما لدينا بالفعل أفضل موديل جديد على الكوكب.

تفكير GPT 5.4 يمكنه الآن تقديم خطة أولية لتفكيره... مما يسمح لك بتوجيه الموديل.

هذا العنصر التفاعلي يحل مشكلة الصندوق الأسود في موديلات الـ reasoning.

السرعة مقارنة بـ o1-preview تختلف كلياً في المهام القياسية.

أنت ترى reasoning يبدو متسقاً بالفعل عبر المحادثات الطويلة.

GPT 5.4... لم يُبنى للدردشة. لقد بُني للعمل.

التحميل المؤجل... قلل استخدام الـ tokens الكلي بنسبة 47% دون أي فقدان في الدقة.

وظيفة استخدام الكمبيوتر تتعقب عناصر واجهة المستخدم بنظام يعتمد على الإحداثيات.

اختبرته مع كود Java قديم وقد فهم بالفعل الاعتماديات المتقاطعة بين الملفات.

نحن نتجه إلى عالم حيث الـ AI هو المتحكم في نظام التشغيل.

context window بحجم 1 مليون و 50 ألف token. هذا سياق طويل جداً.

يمكنك التنقل فيه بينما يفكر، وهو بالتأكيد أكثر كفاءة في الاستخدام.

التسعير مرتفع ولكن بالنسبة لمجموعات الوثائق الكبيرة، فهو الموديل الوحيد الذي يعمل.

يمكن تعديل وضع التفكير بناءً على تعقيد الـ prompt الخاص بك.

يبدو أكثر موثوقية في الاسترجاع الواقعي من أي إصدار GPT سابق.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لـ GPT-5.4

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من GPT-5.4 وتحقيق نتائج أفضل.

التحكم في قوة التفكير (Thinking Effort)

استخدم الـ parameters المخصصة للوضع Standard أو Extended أو Heavy للموازنة بين الحاجة إلى الدقة وسرعة التوليد والتكلفة.

مراجعة خطة التفكير

راقب الخطة الأولية التي يقدمها الموديل واستخدم خاصية Mid-Response Steering لتصحيحها إذا انحرف المنطق.

الاستفادة من التحميل المؤجل للأدوات

بالنسبة لسير عمل الـ agentic، استخدم سجل التحميل المؤجل لتقليل تكاليف الـ tokens الأولية بنسبة تصل إلى 47%.

استخدام عقود الاكتمال (Completeness Contracts)

حدد بوضوح في الـ prompt الخاص بك ماذا يعني "الانتهاء" لجعل الموديل أكثر ثباتاً خلال المهام الطويلة.

الرؤية بأقصى دقة

قم بتحميل صور عالية الجودة تصل إلى 10.24 مليون بكسل لإجراء عمليات فحص بصري دقيقة لعناصر واجهة المستخدم أو المخططات التقنية.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

الأسئلة الشائعة حول GPT-5.4

ابحث عن إجابات للأسئلة الشائعة حول GPT-5.4