xai

Grok-3

يُعد Grok-3 هو الـ flagship reasoning model من xAI، ويتميز بقدرات استنتاج عميقة، و context window بسعة 128k، وتكامل فوري مع X للبحث والبرمجة الحية.

xai logoxaiGrokFebruary 17, 2025
نافذة السياق
128Kرموز
أقصى مخرج
8Kرموز
سعر الإدخال
$3.00/ 1M
سعر الإخراج
$15.00/ 1M
الوضع:TextImage
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
84.6%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Grok-3 درجة 84.6% في هذا المعيار.
HLE
36%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Grok-3 درجة 36% في هذا المعيار.
MMLU
87.5%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Grok-3 درجة 87.5% في هذا المعيار.
MMLU Pro
76.5%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Grok-3 درجة 76.5% في هذا المعيار.
SimpleQA
42%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Grok-3 درجة 42% في هذا المعيار.
IFEval
91.2%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Grok-3 درجة 91.2% في هذا المعيار.
AIME 2025
93.3%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Grok-3 درجة 93.3% في هذا المعيار.
MATH
94.4%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Grok-3 درجة 94.4% في هذا المعيار.
GSM8k
98.7%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Grok-3 درجة 98.7% في هذا المعيار.
MGSM
92.4%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Grok-3 درجة 92.4% في هذا المعيار.
MathVista
71.3%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Grok-3 درجة 71.3% في هذا المعيار.
SWE-Bench
49%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Grok-3 درجة 49% في هذا المعيار.
HumanEval
94.5%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Grok-3 درجة 94.5% في هذا المعيار.
LiveCodeBench
79.4%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Grok-3 درجة 79.4% في هذا المعيار.
MMMU
78%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Grok-3 درجة 78% في هذا المعيار.
MMMU Pro
58.5%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Grok-3 درجة 58.5% في هذا المعيار.
ChartQA
89.2%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Grok-3 درجة 89.2% في هذا المعيار.
DocVQA
92.4%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Grok-3 درجة 92.4% في هذا المعيار.
Terminal-Bench
52%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Grok-3 درجة 52% في هذا المعيار.
ARC-AGI
12.5%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Grok-3 درجة 12.5% في هذا المعيار.

حول Grok-3

تعرف على قدرات Grok-3 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

Reasoning وذكاء بمستوى Frontier

يمثل Grok-3 قفزة هائلة في الذكاء الاصطناعي، حيث تم تدريبه على مجمع Colossus للحوسبة الفائقة التابع لـ xAI باستخدام أكثر من 100,000 GPU من نوع NVIDIA H100. تم تصميمه خصيصاً للتفوق في المنطق المعقد، والاستنتاج الرياضي، وهندسة البرمجيات عالية المخاطر. بخلاف الـ models التقليدية التي تعطي الأولوية لسرعة إنشاء الاستجابة، يتميز Grok-3 بوضع Deep Thinking متخصص يستخدم عمليات compute هائلة وقت الاختبار للتحقق من خطوات الـ reasoning الداخلية الخاصة به قبل تقديم النتيجة النهائية.

تكامل المعرفة في الوقت الفعلي

الميزة الجوهرية لـ Grok-3 هي وصوله غير المسبوق إلى تدفق البيانات المباشر لمنصة X. يتيح ذلك للـ model تلخيص الأخبار العاجلة، والتحولات المالية، والتوجهات العالمية بـ latency لا يتعدى الثواني، بينما تعتمد الـ models الأخرى على تواريخ انقطاع المعرفة أو أدوات بحث ويب أبطأ. هذا الوعي اللحظي، مقترناً بـ context window سعة 128,000 token، يجعله أداة أساسية لباحثي السوق وعلماء البيانات الذين يحتاجون إلى أحدث الرؤى.

قدرات Multimodal و Agentic

بعيداً عن النصوص والمنطق، يعد Grok-3 multimodal vision model قوي قادر على تفسير المخططات التقنية المعقدة، والرسوم الهندسية، والبيانات المرئية بدقة متناهية بمستوى frontier model. كما يدعم ميزات function calling المتقدمة واستخدام الأدوات، مما يمكنه من العمل كمحرك معرفي للـ agents المستقلة. مع تحقيق نتيجة 94.5% في HumanEval، فإنه يقف حالياً كواحد من أكثر مساعدي البرمجة قدرة، حيث ينافس أو يتفوق على المنافسين في تصحيح الأخطاء المستقل وإعادة الهيكلة المعمارية.

Grok-3

حالات استخدام Grok-3

اكتشف الطرق المختلفة لاستخدام Grok-3 لتحقيق نتائج رائعة.

هندسة البرمجيات المتقدمة

حل المشكلات المعمارية المعقدة وإعادة هيكلة قواعد الكود بالكامل باستخدام reasoning عميق ودقة 94.5% في HumanEval.

ذكاء السوق الفوري

الاستفادة من بيانات X المباشرة لتلخيص الأخبار المالية العاجلة وآراء المستهلكين بشكل أسرع من محركات البحث التقليدية.

توليف البيانات العلمية

معالجة آلاف الصفحات من المجلات الأكاديمية في وضع البحث العميق لتحديد روابط فرضيات بحثية جديدة.

تحليل المستندات الـ Multimodal

تفسير المخططات التقنية المعقدة، والرسوم الهندسية، والجداول المالية باستخدام قدرات رؤية من فئة frontier model.

التدريس بمستوى المنافسات

تبسيط مسائل الرياضيات والفيزياء المعقدة بمستوى الأولمبياد إلى خطوات مفهومة ومحققة باستخدام وضع Think.

أتمتة سير العمل الـ Agentic

العمل كمحرك أساسي للـ agents المستقلة التي تتطلب دقة عالية في function calling واستخدام الأدوات في بيئات الإنتاج.

نقاط القوة

القيود

Reasoning فائق: يتفوق على المنافسين الرائدين في benchmarks الرياضيات المعقدة مثل AIME 2025 (93.3%) و MATH (94.4%).
Latency مرتفع في وضع التفكير: قد تستغرق مطالبات الـ reasoning المعقدة أكثر من 60 ثانية لإنشاء استجابة محققة في وضع Think.
بحث عميق متكامل: يتميز بقدرة فريدة على البحث في الويب وتوليف بيانات X المباشرة بشكل أسرع بكثير من المنافسين.
لا يدعم الفيديو أو الصوت بشكل أصلي: يفتقر إلى معالجة الصوت والفيديو الـ multimodal في الوقت الفعلي المتوفرة في منافسين مثل Gemini 2.0.
أداء برمجي نخبو: حقق 94.5% في HumanEval، مما يجعله خياراً من الطراز الأول لتطوير البرمجيات وتصحيح الأخطاء بشكل مستقل.
حصص استخدام صارمة: حدود الرسائل للمشتركين في Premium+ حالياً أقل من بعض المنافسين الراسخين خلال ساعات الذروة.
مسارات تفكير شفافة: يتيح للمستخدمين رؤية منطق الـ model خطوة بخطوة، مما يزيد الثقة ويجعل تصحيح الأخطاء المعقدة أسهل.
مشكلات استقرار النسخة التجريبية: قد يواجه المستخدمون أحياناً أخطاء في الخادم أو مسارات تفكير مبتورة خلال فترات الازدحام العالي.

البدء السريع API

xai/grok-3

عرض التوثيق
xai SDK
import OpenAI from "openai";

const xai = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1"
});

const response = await xai.chat.completions.create({
  model: "grok-3",
  messages: [{ role: "user", content: "Analyze current X trends for AGI." }],
  stream: true
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Grok-3

شاهد رأي المجتمع في Grok-3

"البحث العميق في Grok-3 أسرع وأكثر دقة بشكل ملحوظ من إصدار OpenAI"
TechEnthusiast
x
"أداء البرمجة مذهل تماماً؛ لقد أصلح ثغرة كنت عالقاً فيها لساعات في ثوانٍ معدودة"
DevLife
reddit
"يعتبر Grok-3 بلا شك أكثر reasoning model تطوراً متاح اليوم"
DataCamp
youtube
"تبدو مسارات التفكير مشابهة لـ DeepSeek ولكن السرعة في مستوى آخر تماماً"
AIResearcher
hackernews
"قدرات الرؤية في المخططات التقنية أصبحت أخيراً قابلة للاستخدام في العمل الهندسي الحقيقي"
EngDesign
reddit
"التكامل مع X يمنحه ميزة هائلة لأي شخص يتتبع مشاعر العملات المشفرة أو الأسهم في الوقت الفعلي"
FinancePro
x

فيديوهات عن Grok-3

شاهد الدروس والمراجعات والنقاشات عن Grok-3

يعتبر Grok 3 بلا شك أكثر reasoning model تطوراً متاح اليوم

كانت جودة النتائج أفضل بكثير من وظيفة البحث العميق في OpenAI

سرعة وضع البحث العميق مبهرة حقاً مقارنة بـ O1

يمكنك رؤية الـ model وهو يعالج نتائج بحث متعددة في وقت واحد

هذه قفزة كبيرة عن Grok-2 من حيث الاتساق المنطقي

يتفوق Grok 3 و Grok 3 mini على جميع reasoning models المنشورة

المنطق يميل نحو الدقة... هذا أكثر reasoning يشبه البشر رأيته على الإطلاق

يوفر مسار التفكير الداخلي رؤية أوضح بكثير للمنطق المتبع

إنه لا يكتفي بالتخمين؛ بل يراجع عمله، وهي السمة المميزة لتفكير System 2

أداء الرياضيات في benchmarks AIME هو حقاً state-of-the-art

في تلك الـ benchmarks، يمكنك رؤية أن Grok 3 يؤدي بالفعل بشكل جيد للغاية في جميع المجالات

مقارنة بالمنافسين الآخرين، فإنه واعد جداً

أداء البرمجة هو القصة الحقيقية هنا، فهو ينافس الأفضل في الصناعة

يتعامل مع مهام إعادة الهيكلة المعمارية التي فشلت فيها الإصدارات السابقة

التكامل مع X API يجعله قوياً بشكل فريد للأحداث الجارية

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي
شاهد العرض التوضيحي

نصائح احترافية لـ Grok-3

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Grok-3 وتحقيق نتائج أفضل.

تفعيل Deep Thinking

قم دائماً بتمكين وضع التفكير للمهام الرياضية أو المنطقية لضمان التحقق خطوة بخطوة من خلال test-time compute.

استغلال التكامل مع X

استخدم استفسارات محددة حول الأخبار العاجلة أو الأحداث الجارية للحصول على بيانات لا تستطيع الـ LLMs الأخرى الوصول إليها بسبب تواريخ انقطاع المعرفة.

فحص المسارات (Traces)

راجع مسارات التفكير الداخلية لتحديد أين يستهلك الـ model عمليات الـ compute الخاصة به والتحقق من مساره المنطقي.

الرؤية لواجهات المستخدم

ارفع لقطات شاشة لتصميمات UI واطلب من Grok إنشاء كود React أو Tailwind المقابل للبرمجة السريعة للنماذج الأولية.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

الأسئلة الشائعة حول Grok-3

ابحث عن إجابات للأسئلة الشائعة حول Grok-3