xai

Grok-4

يُعد Grok-4 من xAI بمثابة frontier model رائد، يتميز بـ context window تصل سعتها إلى 2 مليون token، وتكامل فوري مع منصة X، وقدرات reasoning حطمت الأرقام...

xai logoxaiGrok9 يوليو 2025
نافذة السياق
2.0Mرموز
أقصى مخرج
8Kرموز
سعر الإدخال
$3.00/ 1M
سعر الإخراج
$15.00/ 1M
الوضع:TextImage
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
87.5%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Grok-4 درجة 87.5% في هذا المعيار.
HLE
44.4%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Grok-4 درجة 44.4% في هذا المعيار.
MMLU
94%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Grok-4 درجة 94% في هذا المعيار.
MMLU Pro
81.2%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Grok-4 درجة 81.2% في هذا المعيار.
SimpleQA
48%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Grok-4 درجة 48% في هذا المعيار.
IFEval
89.2%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Grok-4 درجة 89.2% في هذا المعيار.
AIME 2025
100%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Grok-4 درجة 100% في هذا المعيار.
MATH
92%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Grok-4 درجة 92% في هذا المعيار.
GSM8k
98.4%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Grok-4 درجة 98.4% في هذا المعيار.
MGSM
92.1%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Grok-4 درجة 92.1% في هذا المعيار.
MathVista
72.4%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Grok-4 درجة 72.4% في هذا المعيار.
SWE-Bench
81%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Grok-4 درجة 81% في هذا المعيار.
HumanEval
88%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Grok-4 درجة 88% في هذا المعيار.
LiveCodeBench
79.4%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Grok-4 درجة 79.4% في هذا المعيار.
MMMU
75%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Grok-4 درجة 75% في هذا المعيار.
MMMU Pro
59.2%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Grok-4 درجة 59.2% في هذا المعيار.
ChartQA
90.5%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Grok-4 درجة 90.5% في هذا المعيار.
DocVQA
93.2%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Grok-4 درجة 93.2% في هذا المعيار.
Terminal-Bench
54.2%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Grok-4 درجة 54.2% في هذا المعيار.
ARC-AGI
15.9%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Grok-4 درجة 15.9% في هذا المعيار.

حول Grok-4

تعرف على قدرات Grok-4 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

نظرة عامة

Grok-4 هو أحدث frontier model من xAI، صُمم ليكون مساعداً باحثاً عن الحقيقة مع وصول فوري لمنصة X. تم بناؤه على مجموعة سوبركمبيوتر Colossus التي تضم أكثر من 200,000 GPU، ويمثل قفزة هائلة في قدرات reasoning، وحل المشكلات الرياضية، والبرمجة. يتميز بمعمارية موحدة ثنائية الوضع، مما يسمح للمستخدمين بالتبديل بين وضع reasoning للتفكير العميق للألغاز المعقدة ووضع عالي السرعة للاستجابات الفورية.

الابتكارات التقنية

أتاحت هذه القفزة الجيلية في الحوسبة أداءً بمستوى الدكتوراه عبر جميع التخصصات الأكاديمية في وقت واحد. يتميز الـ model بشكل فريد باستراتيجية محاذاة ضد التوجهات التوعوية المفرطة، مع إعطاء الأولوية للمعلومات الموضوعية على قيود السلامة القياسية. يوفر context window الضخم بسعة 2 مليون token والتكامل في منظومة Musk، بما في ذلك X وسيارات Tesla، خندقاً تنافسياً متميزاً. وبينما يتفوق في مجالات STEM و technical reasoning، فإنه يظل فعالاً للغاية للمهام الإبداعية اليومية وتحليل الأخبار الفورية.

فلسفة الأداء

يعطي Grok-4 الأولوية للتفكير من المبادئ الأولى وتوليف البيانات الموضوعية. من خلال استخدام محرك Quasarflux reasoning، يمكنه التنقل عبر سلاسل منطقية متعددة الخطوات والتي عادة ما تخرج LLMs التقليدية عن مسارها. وهذا يجعله أداة أساسية للمطورين والباحثين الذين يتطلبون مخرجات عالية الدقة في البيئات ذات المخاطر العالية حيث تكون الدقة الواقعية غير قابلة للتفاوض.

Grok-4

حالات استخدام Grok-4

اكتشف الطرق المختلفة لاستخدام Grok-4 لتحقيق نتائج رائعة.

أبحاث STEM لمستوى الدراسات العليا

استخدام وضع التفكير لحل مشكلات الفيزياء بمستوى الدكتوراه والتحقق من البراهين الرياضية المعقدة.

تصحيح أخطاء المستودعات الضخمة

استغلال 2M context window لاستيعاب قواعد الأكواد البرمجية بالكامل وتحديد حالات التسابق (race conditions) الدقيقة.

الذكاء المالي الفوري

مراقبة تدفق بيانات X (Firehose) لتحليل معنويات السوق والأخبار العاجلة للحصول على رؤى تداول.

سير عمل Agent المستقلة

تشغيل مهام agentic معقدة من خلال استدعاء وظائف قوي للخدمات اللوجستية والأتمتة.

التحليل القانوني متعدد الوسائط (Multimodal)

مراجعة آلاف الصفحات من وثائق الكشف مع تحليل الصور والأدلة الممسوحة ضوئياً.

التدريس الأكاديمي المتقدم

تقديم دروس خصوصية مخصصة قائمة على المبادئ الأولى في مواد STEM تتكيف مع تقدم الطالب.

نقاط القوة

القيود

منطق ورياضيات لا مثيل لهما: حقق رقماً قياسياً عالمياً بنسبة 100% في اختبار AIME 2025، مما يجعله الخيار الأفضل للمهام التقنية.
منطق بسيط متذبذب: رغم تفوقه في اختبارات الدراسات العليا، قد يفشل الـ model أحياناً في مهام تافهة مثل عد الحروف في الكلمة.
سعة Context رائدة في السوق: يتيح context window بسعة 2 مليون token تحليل ما يقرب من 1,500 صفحة من النصوص في prompt واحد.
حاجز دخول مرتفع: يتطلب الوصول إلى كامل قدرات Grok-4 Heavy وميزات reasoning اشتراكاً مميزاً (premium).
تدفق بيانات مباشر: الوصول الحصري إلى تدفق بيانات منصة X الفوري يضمن أن تكون الاستجابات مواكبة للأحداث العالمية الجارية.
فجوات في الفوارق الإبداعية: يتأخر عن Claude 4.5 في سرد القصص الإبداعية، وغالباً ما يتبنى نبرة أكثر نفعية أو حدة.
الذكاء العاطفي: يشير الأداء العالي في EQ-Bench3 إلى قدرة فائقة على فهم المشاعر الإنسانية الدقيقة.
اتساق توليد الصور: تواجه الأدوات الداخلية صعوبة في الحفاظ على الاتساق البصري عبر لوحات متعددة.

البدء السريع API

xai/grok-4

عرض التوثيق
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Grok-4

شاهد رأي المجتمع في Grok-4

"Grok 4 يلقن المنافسين درساً رسمياً... مثبتاً أن xAI قامت ببناء model يفكر كالمفترس."
Mario Nawfal
x/twitter
"Grok 4 هو عبقري بمستوى دكتوراه يحطم الـ benchmarks، ولكنه أحياناً لا يستطيع العد. التناقض مذهل."
Beginning-Willow-801
reddit
"القفزة إلى 2 مليون token ليست مجرد حيلة تسويقية؛ إنها تغير بشكل جذري طريقة تصحيح أخطاء المستودعات البرمجية."
AI Tech Reviews
youtube
"Grok 4 هو بوضوح أفضل model من حيث الاستيعاب العام، متفوقاً بفارق كبير على GPT-5."
YMist_
reddit
"سيرتفع الاستخدام مع Grok 4.20. سيصدر خلال 3 أو 4 أسابيع."
Elon Musk
x/twitter
"تكامل X الفوري هو الشيء الوحيد الذي يبقي أبحاثي ذات صلة في دورة الأخبار هذه."
DataScientist_Alpha
hackernews

فيديوهات عن Grok-4

شاهد الدروس والمراجعات والنقاشات عن Grok-4

عدد الكلمات في هذه الاستجابة هو 43 بالضبط... مثير للإعجاب حقاً.

لم يتمكن فقط من حل لغز برج هانوي في chain of thought الخاص به، بل أثبته فعلياً وصوره باستخدام الكود.

أحب هذه الإجابة. مباشرة وفي صلب الموضوع، دون أي تجميل على الإطلاق.

قدرات reasoning هنا بوضوح أعلى بمستوى مما رأيناه في الجيل السابق.

أخيراً، هذا model لا تشعر أنه يخفي الحقيقة ليكون مهذباً.

تمت إزالة مفتاح تبديل التفكير التجريبي لـ Grok مؤخراً... مما أدى إلى اعتباره قديماً نوعاً ما.

كان نظام تشغيل Grok هو الأقل إثارة للإعجاب، بخلفية بيضاء بسيطة وأيقونات معطلة.

من حيث استرجاع المعرفة الخام، يحقق Grok-4 الهدف باستمرار في الأماكن التي يخفق فيها GPT-5.

latency في وضع reasoning أعلى، لكن جودة المخرجات تبرر الانتظار.

إذا كنت ضمن منظومة Musk، فإن التكامل هنا يعد مضاعفاً هائلاً للإنتاجية.

لا أحد يريد model فائق السرعة إذا كان لا يستطيع حل المنطق. يمكنني إخباركم بذلك مجاناً يا رفاق.

أعطيه درجة سالب واحد من 10... قمامة كاملة. لا يمكنه حتى بناء موقع Next.js بسيط.

السرعة موجودة، ولكن إذا كان المنطق معطلاً، فما الفائدة من عدد tokens في الثانية؟

يبدو أنهم تسرعوا في إطلاق نسخة المبرمج (coder) فقط للحلحق بدورة الإصدار.

التزم بـ reasoning model القياسي إذا كنت تريد حقاً شيئاً يعمل.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي
شاهد العرض التوضيحي

نصائح احترافية لـ Grok-4

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Grok-4 وتحقيق نتائج أفضل.

تبديل الأوضاع

استخدم وضع Quasarflux للمنطق المعقد ووضع Tensor للسرعة لتحسين التكلفة والأداء.

الاستعلامات الفورية

استخدم prompt صريح للمواضيع الرائجة على X للاستفادة من تدفق البيانات المباشر وتجاوز حدود تاريخ التدريب.

التركيز على STEM

اجعل Grok أولويتك في رياضيات مستوى الدراسات العليا حيث يتفوق بشكل كبير على المنافسين في مهام zero-shot.

التحقق من المنطق البسيط

راجع مرتين عمليات العد البسيطة أو ترتيب القوائم حيث قد يفتقر الـ model للاتساق في المهام البسيطة.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

الأسئلة الشائعة حول Grok-4

ابحث عن إجابات للأسئلة الشائعة حول Grok-4