xai

Grok-4

Grok-4 محصول xAI یک frontier model است که از context window ۲ میلیونی، قابلیت ادغام real-time با پلتفرم X و توانمندی‌های reasoning در سطح رکورد جهانی بهره...

xai logoxaiGrokJuly 9, 2025
پنجره زمینه
2.0Mتوکن
حداکثر خروجی
8Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
87.5%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Grok-4 امتیاز 87.5% در این معیار کسب کرد.
HLE
44.4%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Grok-4 امتیاز 44.4% در این معیار کسب کرد.
MMLU
94%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Grok-4 امتیاز 94% در این معیار کسب کرد.
MMLU Pro
81.2%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Grok-4 امتیاز 81.2% در این معیار کسب کرد.
SimpleQA
48%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Grok-4 امتیاز 48% در این معیار کسب کرد.
IFEval
89.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Grok-4 امتیاز 89.2% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Grok-4 امتیاز 100% در این معیار کسب کرد.
MATH
92%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Grok-4 امتیاز 92% در این معیار کسب کرد.
GSM8k
98.4%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Grok-4 امتیاز 98.4% در این معیار کسب کرد.
MGSM
92.1%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Grok-4 امتیاز 92.1% در این معیار کسب کرد.
MathVista
72.4%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Grok-4 امتیاز 72.4% در این معیار کسب کرد.
SWE-Bench
81%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Grok-4 امتیاز 81% در این معیار کسب کرد.
HumanEval
88%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Grok-4 امتیاز 88% در این معیار کسب کرد.
LiveCodeBench
79.4%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Grok-4 امتیاز 79.4% در این معیار کسب کرد.
MMMU
75%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Grok-4 امتیاز 75% در این معیار کسب کرد.
MMMU Pro
59.2%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Grok-4 امتیاز 59.2% در این معیار کسب کرد.
ChartQA
90.5%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Grok-4 امتیاز 90.5% در این معیار کسب کرد.
DocVQA
93.2%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Grok-4 امتیاز 93.2% در این معیار کسب کرد.
Terminal-Bench
54.2%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Grok-4 امتیاز 54.2% در این معیار کسب کرد.
ARC-AGI
15.9%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Grok-4 امتیاز 15.9% در این معیار کسب کرد.

درباره Grok-4

درباره قابلیت‌های Grok-4، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

نمای کلی

Grok-4 جدیدترین frontier model از xAI است که به عنوان یک دستیار حقیقت‌جو با دسترسی real-time به پلتفرم X طراحی شده است. این مدل که بر روی کلاستر ابررایانه Colossus با بیش از ۲۰۰,۰۰۰ GPU ساخته شده، جهشی عظیم در reasoning، حل مسائل ریاضی و توانمندی‌های کدنویسی محسوب می‌شود. این مدل دارای یک معماری دوگانه یکپارچه است که به کاربران اجازه می‌دهد بین حالت reasoning برای معماهای پیچیده و حالت پرسرعت برای پاسخ‌های آنی، سوئیچ کنند.

نوآوری‌های فنی

این جهش نسلی در قدرت محاسباتی، عملکردی در سطح دکترا را در تمام رشته‌های آکادمیک به طور همزمان فراهم کرده است. ویژگی منحصر به فرد این model، استراتژی هم‌سویی ضد-woke آن است که اطلاعات عینی را بر محدودیت‌های ایمنی (guardrails) استاندارد ترجیح می‌دهد. context window عظیم ۲ میلیون tokens و ادغام در اکوسیستم Musk، از جمله پلتفرم X و خودروهای Tesla، یک مزیت رقابتی (moat) متمایز ایجاد کرده است. در حالی که این مدل در STEM و reasoning فنی می‌درخشد، برای کارهای خلاقانه روزمره و تحلیل اخبار real-time نیز بسیار کارآمد باقی مانده است.

فلسفه عملکرد

Grok-4 تفکر مبتنی بر اصول اولیه (first-principles) و ترکیب داده‌های عینی را در اولویت قرار می‌دهد. با استفاده از موتور reasoning Quasarflux، این مدل می‌تواند زنجیره‌های منطقی چندمرحله‌ای را که معمولاً LLMهای سنتی در آن شکست می‌خورند، هدایت کند. این امر Grok-4 را به ابزاری ضروری برای توسعه‌دهندگان و محققانی تبدیل می‌کند که در محیط‌های حساس، جایی که دقت واقعیت‌ها غیرقابل مذاکره است، به خروجی‌های با دقت بالا نیاز دارند.

Grok-4

موارد استفاده برای Grok-4

روش‌های مختلف استفاده از Grok-4 برای دستیابی به نتایج عالی را کشف کنید.

تحقیقات STEM در سطح تحصیلات تکمیلی

استفاده از حالت reasoning برای حل مسائل فیزیک در سطح دکترا و تایید اثبات‌های ریاضی پیچیده.

دیباگ کردن مخازن عظیم کد

بهره‌گیری از context window ۲ میلیونی برای بررسی کامل codebaseها و شناسایی شرایط رقابتی (race conditions) ظریف.

هوش مالی Real-Time

نظارت بر X Firehose برای تحلیل جو بازار و اخبار فوری جهت دریافت بینش‌های معاملاتی.

گردش‌کارهای Agentic خودگردان

قدرت بخشیدن به وظایف agentic پیچیده از طریق function calling قدرتمند برای لجستیک و اتوماسیون.

تحلیل حقوقی Multi-modal

بررسی هزاران صفحه از اسناد پرونده در کنار تحلیل عکس‌های مستندات اسکن شده.

تدریس خصوصی آکادمیک پیشرفته

ارائه آموزش شخصی‌سازی شده و مبتنی بر اصول اولیه (first-principles) در موضوعات STEM متناسب با پیشرفت دانشجو.

نقاط قوت

محدودیت‌ها

ریاضیات و منطق بی‌رقیب: دستیابی به رکورد جهانی ۱۰۰٪ در آزمون AIME 2025، که آن را به انتخاب اول برای وظایف فنی تبدیل می‌کند.
نوسان در منطق پایه: علیرغم درخشش در آزمون‌های تحصیلات تکمیلی، model ممکن است گاهی در وظایف ساده مانند شمردن حروف یک کلمه اشتباه کند.
Context پیشرو در بازار: context window ۲ میلیون tokens اجازه تحلیل تقریباً ۱,۵۰۰ صفحه متن را در یک prompt واحد می‌دهد.
مانع ورود بالا: دسترسی به قدرت کامل model Grok-4 Heavy و قابلیت‌های reasoning نیاز به اشتراک ویژه (premium) دارد.
خط لوله داده‌های زنده: دسترسی انحصاری به جریان داده‌های real-time پلتفرم X باعث می‌شود پاسخ‌ها درباره رویدادهای جهانی کاملاً به‌روز باشند.
شکاف در ظرافت‌های خلاقانه: در داستان‌سرایی خلاقانه از Claude 4.5 عقب می‌ماند و اغلب لحنی کاربردی‌تر یا تندتر دارد.
هوش هیجانی: عملکرد بالا در EQ-Bench3 نشان‌دهنده توانایی برتر در درک احساسات ظریف انسانی است.
ثبات در تولید تصویر: ابزارهای داخلی در حفظ ثبات بصری در چندین پنل مختلف با دشواری مواجه هستند.

شروع سریع API

xai/grok-4

مشاهده مستندات
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Grok-4 چه می‌گویند

ببینید جامعه درباره Grok-4 چه فکر می‌کند

"Grok 4 رسماً در حال درس دادن به رقبا است... ثابت می‌کند که xAI مدلی ساخته که مانند یک شکارچی فکر می‌کند."
Mario Nawfal
x/twitter
"Grok 4 یک نابغه در سطح دکترا و درهم‌کوبنده benchmarkها است که گاهی نمی‌تواند بشمارد. این دوگانگی عجیب است."
Beginning-Willow-801
reddit
"جهش به ۲ میلیون tokens فقط یک ترفند تبلیغاتی نیست؛ این قابلیت دیباگ کردن مخازن کد را به طور بنیادی تغییر می‌دهد."
AI Tech Reviews
youtube
"Grok 4 از نظر درک عمومی به وضوح بهترین model است، بسیار جلوتر از GPT-5."
YMist_
reddit
"استفاده از آن با نسخه Grok 4.20 اوج خواهد گرفت. ۳ یا ۴ هفته دیگر عرضه می‌شود."
Elon Musk
x/twitter
"ادغام real-time با پلتفرم X تنها چیزی است که تحقیقات من را در این چرخه خبری به‌روز نگه می‌دارد."
DataScientist_Alpha
hackernews

ویدیوهای درباره Grok-4

آموزش‌ها، بررسی‌ها و بحث‌های درباره Grok-4 را تماشا کنید

تعداد کلمات در این پاسخ دقیقاً ۴۳ عدد است... فوق‌العاده چشم‌گیر.

نه تنها توانست برج هانوی را در chain-of-thought خود حل کند، بلکه در واقع آن را اثبات کرد و با کد تصویرسازی کرد.

من این پاسخ را دوست دارم. مستقیم و بدون حاشیه. اصلاً اهل چاپلوسی نیست.

قابلیت‌های reasoning در اینجا به وضوح یک پله بالاتر از چیزی است که در نسل قبل دیدیم.

بالاخره با مدلی روبرو هستیم که حس نمی‌شود برای رعایت ادب، حقیقت را پنهان می‌کند.

دکمه تفکر آزمایشی برای Grok اخیراً حذف شده... که باعث شده کمی قدیمی به نظر برسد.

Grok OS کمترین میزان جذابیت را داشت، با یک پس‌زمینه سفید ساده و آیکون‌های خراب.

از نظر بازیابی اطلاعات خام، Grok-4 دقیقاً همان جایی را هدف قرار می‌دهد که GPT-5 در آن ناتوان است.

latency در حالت reasoning بالاتر است، اما کیفیت خروجی، انتظار را توجیه می‌کند.

اگر در اکوسیستم Musk هستید، ادغام در اینجا یک شتاب‌دهنده عظیم برای بهره‌وری است.

هیچ‌کس یک model فوق‌العاده سریع نمی‌خواهد اگر نتواند منطق را حل کند. این را رایگان به شما می‌گویم دوستان.

من به این نمره منفی یک از ۱۰ می‌دهم... کاملاً بی‌استفاده. حتی نمی‌تواند یک وب‌سایت ساده Next.js بسازد.

سرعت وجود دارد، اما اگر منطق خراب باشد، tokens بر ثانیه چه فایده‌ای دارد؟

به نظر می‌رسد آن‌ها نسخه مخصوص کدنویسی را فقط برای رسیدن به چرخه انتشار، با عجله عرضه کردند.

اگر واقعاً چیزی می‌خواهید که کار کند، به همان reasoning model استاندارد پایبند بمانید.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای برای Grok-4

نکات تخصصی برای کمک به شما در استفاده حداکثری از Grok-4 و دستیابی به نتایج بهتر.

تغییر حالت

برای منطق پیچیده از حالت Quasarflux و برای سرعت از حالت Tensor استفاده کنید تا هزینه و عملکرد را بهینه کنید.

پرس‌وجوهای Real-Time

صراحتاً در مورد موضوعات ترند در پلتفرم X prompt بنویسید تا از خط لوله داده‌های زنده بهره‌مند شوید و از محدودیت‌های زمان آموزش عبور کنید.

تمرکز بر STEM

برای ریاضیات سطح تحصیلات تکمیلی، Grok را در اولویت قرار دهید، زیرا در وظایف zero-shot به طرز قابل توجهی از رقبا بهتر عمل می‌کند.

تایید منطق پایه

منطق‌های ساده مانند شمردن یا ترتیب لیست‌ها را دوباره چک کنید، زیرا model ممکن است در وظایف پیش‌پاافتاده ناهماهنگ عمل کند.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

سوالات متداول درباره Grok-4

پاسخ سوالات رایج درباره Grok-4 را بیابید