xai

Grok-4

Grok-4 از xAI یک frontier model با کانتکست ویندو 2 میلیونی، ادغام real-time با پلتفرم X و قابلیت‌های رکوردشکن در زمینه reasoning است.

xai logoxaiGrok9 ژوئیه 2025
پنجره زمینه
2.0Mتوکن
حداکثر خروجی
8Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
87.5%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Grok-4 امتیاز 87.5% در این معیار کسب کرد.
HLE
44.4%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Grok-4 امتیاز 44.4% در این معیار کسب کرد.
MMLU
94%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Grok-4 امتیاز 94% در این معیار کسب کرد.
MMLU Pro
81.2%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Grok-4 امتیاز 81.2% در این معیار کسب کرد.
SimpleQA
48%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Grok-4 امتیاز 48% در این معیار کسب کرد.
IFEval
89.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Grok-4 امتیاز 89.2% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Grok-4 امتیاز 100% در این معیار کسب کرد.
MATH
92%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Grok-4 امتیاز 92% در این معیار کسب کرد.
GSM8k
98.4%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Grok-4 امتیاز 98.4% در این معیار کسب کرد.
MGSM
92.1%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Grok-4 امتیاز 92.1% در این معیار کسب کرد.
MathVista
72.4%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Grok-4 امتیاز 72.4% در این معیار کسب کرد.
SWE-Bench
81%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Grok-4 امتیاز 81% در این معیار کسب کرد.
HumanEval
88%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Grok-4 امتیاز 88% در این معیار کسب کرد.
LiveCodeBench
79.4%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Grok-4 امتیاز 79.4% در این معیار کسب کرد.
MMMU
75%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Grok-4 امتیاز 75% در این معیار کسب کرد.
MMMU Pro
59.2%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Grok-4 امتیاز 59.2% در این معیار کسب کرد.
ChartQA
90.5%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Grok-4 امتیاز 90.5% در این معیار کسب کرد.
DocVQA
93.2%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Grok-4 امتیاز 93.2% در این معیار کسب کرد.
Terminal-Bench
54.2%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Grok-4 امتیاز 54.2% در این معیار کسب کرد.
ARC-AGI
15.9%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Grok-4 امتیاز 15.9% در این معیار کسب کرد.

درباره Grok-4

درباره قابلیت‌های Grok-4، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

نمای کلی مدل

Grok-4 مدل multimodal پیشرو از xAI است. این مدل با اولویت قرار دادن reasoning بر اساس اصول اولیه و بازیابی اطلاعات real-time ساخته شده است. این مدل از طریق ادغام بومی با پلتفرم اجتماعی X مزیت رقابتی قابل توجهی به دست می‌آورد. این قابلیت به آن اجازه می‌دهد تا گفتگوهای جهانی و اخبار را به محض وقوع تحلیل کند. Grok-4 از ابرکامپیوتر Colossus برای آموزش استفاده می‌کند که منجر به عملکرد سطح بالا در دامنه‌های ریاضی و فنی شده است.

قابلیت‌های فنی

معماری مدل از یک کانتکست ویندو 2 میلیون token در نسخه‌های reasoning پشتیبانی می‌کند. این ظرفیت امکان پردازش پایگاه‌های کد عظیم و مستندات فنی متراکم را بدون از دست دادن داده فراهم می‌سازد. Grok-4 دارای یک سیستم دو حالته است که در آن کاربران می‌توانند بین حالت سرعت بالا برای تعاملات سریع و حالت تفکر عمیق برای وظایف منطقی چند مرحله‌ای انتخاب کنند. این مدل با به‌کارگیری مکانیزم اجماع چند-عاملی در پیکربندی Heavy، نرخ توهم (hallucination) را حدود 4 درصد مدیریت می‌کند.

ادغام اکوسیستم

فراتر از تولید متن ساده، Grok-4 برای استفاده از ابزارهای بومی و function calling پیچیده طراحی شده است. این مدل از پردازش تصویر و صوت پشتیبانی می‌کند که آن را به گزینه‌ای همه کاره برای توسعه‌دهندگانی که برنامه‌های multimodal می‌سازند تبدیل کرده است. استراتژی همسویی مدل به جای خط‌مشی‌های ایمنی استاندارد صنعت، بر حقیقت‌جویی عینی متمرکز است. این امر منجر به امتناع کمتر از پاسخ‌دهی به موضوعات بحث‌برانگیز یا صریح در مقایسه با سایر frontier modelها می‌شود.

Grok-4

موارد استفاده برای Grok-4

روش‌های مختلف استفاده از Grok-4 برای دستیابی به نتایج عالی را کشف کنید.

تحلیل sentiment به صورت real-time

تحلیل پست‌های زنده در X برای تعیین واکنش عمومی نسبت به اخبار فوری یا عرضه محصولات جدید.

حسابرسی مخازن کد در مقیاس بزرگ

ارزیابی کل مخازن نرم‌افزاری با استفاده از کانتکست ویندو 2 میلیونی برای یافتن نقص‌های معماری.

حل مسائل ریاضی در سطح المپیاد

ارائه راه‌حل‌های گام‌به‌گام برای اثبات‌های ریاضی پیچیده و مسائل در سطح AIME.

تولید محتوای خلاقانه بدون فیلتر

تولید سناریوهای شخصیت‌محور و شوخ‌طبعانه بدون محدودیت‌های سختگیرانه سایر ارائه‌دهندگان AI.

ترکیب تحقیقات علمی

خلاصه‌سازی چندین مقاله آکادمیک در سطح دکترا به صورت همزمان با حفظ دقت فنی.

دیباگ فنی

شناسایی باگ‌های مبهم در کدهای production و پیشنهاد اصلاحات بر اساس بهترین روش‌های روز.

نقاط قوت

محدودیت‌ها

Reasoning ریاضی نخبه: کسب امتیاز کامل 100% در benchmark AIME 2025، که اکثر frontier modelها را در منطق پشت سر گذاشته است.
Latency در Heavy Mode: حالت reasoning چند-عاملی (multi-agent) ممکن است چندین دقیقه زمان ببرد تا یک پاسخ با دقت بالا تولید کند.
کانتکست ویندو پیشرو در صنعت: کانتکست ویندو 2 میلیونی امکان عمق بی‌سابقه‌ای در تحلیل اسناد و پروژه‌های کدنویسی بزرگ‌مقیاس را فراهم می‌کند.
پشتیبانی ناقص از ویدیو: اگرچه قابلیت‌های متن و تصویر در سطح برتر هستند، پردازش ویدیو به صورت فریم‌به‌فریم هنوز در دسترس نیست.
هوش اجتماعی زنده: دسترسی مستقیم به پلتفرم X اطلاعاتی real-time را فراهم می‌کند که داده‌های آموزشی ایستا نمی‌توانند جایگزین آن شوند.
دسترسی محدود منطقه‌ای: ویژگی‌های حافظه پایدار (persistent memory) در حال حاضر در اتحادیه اروپا به دلیل الزامات نظارتی غیرفعال هستند.
نرخ امتناع پایین: معماری ایمنی منعطف‌تر، گفتگوی صادقانه و عینی در مورد موضوعات بحث‌برانگیز را ممکن می‌سازد.
محدودیت‌های دقت بینایی: سازندگان اذعان دارند که مدل هنگام تفسیر جزئیات بصری با وفاداری بسیار بالا، همچنان تا حدی دچار ضعف است.

شروع سریع API

xai/grok-4

مشاهده مستندات
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Grok-4 چه می‌گویند

ببینید جامعه درباره Grok-4 چه فکر می‌کند

Grok 4 fast کانتکست 2 میلیونی دارد!!! واقعاً نمی‌دانم چرا این همه مدت با ChatGPT کلنجار می‌رفتیم.
myfuturewifee
reddit
امتیاز 15.88% در زیرمجموعه خصوصی ARC-AGI v2 دیوانه‌کننده است. Grok 4 اولین مدلی است که پس از ماه‌ها این سد 10 درصدی را شکست.
Greg (ARC-AGI Lead)
twitter
رویکرد گروه مطالعه چند-عاملی در Grok 4 Heavy روش درستی برای استفاده از test-time compute است. واقعاً قلق مسائل را پیدا می‌کند.
Tony_xAI
twitter
Grok 4: امتیاز 79 در LiveCodeBench... benchmarkها به شما نمی‌گویند کدنویسی با یک مدل چه حسی دارد، اما این مدل قابل اعتماد به نظر می‌رسد.
thankzr3ddit
reddit
این مدل در همه چیز در سطح تحصیلات تکمیلی و دکترا است. به طرز ترسناکی باهوش است و سریع‌تر از آنچه هر انسانی بتواند یاد بگیرد، می‌آموزد.
Elon Musk
youtube
جستجوی real-time فقط در حال جمع‌آوری تیترها نیست؛ بلکه محتوا را از چندین منبع تحلیل می‌کند.
BitBiasedAI
youtube

ویدیوهای درباره Grok-4

آموزش‌ها، بررسی‌ها و بحث‌های درباره Grok-4 را تماشا کنید

Grok 4 heavy برای کارهای متمرکز بر منطق و reasoning است، در حالی که نسخه معمولی سایر موارد را مدیریت می‌کند.

مدل به طور کاملاً دقیق دست و انگشتان من را برای طراحی روی صفحه ردیابی کرد.

Grok 4 رمز عبوری که در اعماق کانتکست ویندو پنهان کرده بودم را تنها پس از 15 ثانیه تفکر پیدا کرد.

دقت در تست 'سوزن در انبار کاه' با 2 میلیون token برابر 100% بود.

این مدل بالاخره یک جایگزین واقعی برای کسانی است که کانتکست ویندو Gemini را غیرقابل اعتماد می‌دانستند.

Grok 4 در همه چیز در سطح تحصیلات تکمیلی و دکترا است، حتی بهتر از اکثر دارندگان مدرک دکترا.

Grok 4 Heavy چندین agent را به صورت موازی ایجاد می‌کند... مثل یک گروه مطالعه است.

این مدل در API موجود است و کانتکست 256 هزار تایی دارد، با برنامه‌هایی برای افزایش بیشتر.

آموزش روی کلاستر Colossus به آن قابلیت reasoning داده که قبلاً ندیده بودیم.

این مدل طوری طراحی شده که حقیقت‌جوترین AI موجود باشد.

Grok 4 Heavy تا 32 مدل AI موازی را برای prompt واحد شما اجرا می‌کند.

جستجوی real-time فقط در حال جمع‌آوری تیترها نیست؛ بلکه محتوا را از چندین منبع تحلیل می‌کند.

حالت Think زمان محاسباتی بیشتری را صرف برنامه‌ریزی و شناسایی خطاهای احتمالی قبل از پاسخ دادن می‌کند.

اگر دسترسی API داشته باشید، می‌توانید در لاگ‌ها ببینید که agentها چگونه با یکدیگر بحث می‌کنند.

عملکرد multimodal با صدا به طور محسوسی سریع‌تر از نسل قبلی است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Grok-4

نکات تخصصی برای کمک به شما در استفاده حداکثری از Grok-4 و دستیابی به نتایج بهتر.

استفاده از کلمات کلیدی برای جستجو

هشتگ‌ها یا اکانت‌های خاص را در prompt خود بگنجانید تا جستجوی real-time مدل در پلتفرم X را هدایت کنید.

سوییچ به Heavy Mode

برای وظایفی که دقت در آن‌ها حیاتی‌تر از سرعت پاسخ‌دهی است، Grok-4 Heavy را فعال کنید.

ارائه پرسوناهای دقیق

با تعریف پرسوناهای خاص و صریح برای نویسندگی خلاقانه، از همسویی ایمنی منعطف مدل بهره ببرید.

تحلیل لینک‌های خارجی

URL‌های زنده را مستقیماً در چت قرار دهید تا مدل بتواند محتوای تازه وب را بازیابی و خلاصه کند.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

سوالات متداول درباره Grok-4

پاسخ سوالات رایج درباره Grok-4 را بیابید