xai

Grok-3

Grok-3 مدل reasoning پرچمدار xAI است که دارای استنتاج منطقی عمیق، context window ۱۲۸ هزار token و یکپارچگی بلادرنگ با X برای پژوهش و کدنویسی زنده است.

xai logoxaiGrok۱۷ فوریه ۲۰۲۵
پنجره زمینه
128Kتوکن
حداکثر خروجی
8Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
84.6%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Grok-3 امتیاز 84.6% در این معیار کسب کرد.
HLE
36%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Grok-3 امتیاز 36% در این معیار کسب کرد.
MMLU
87.5%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Grok-3 امتیاز 87.5% در این معیار کسب کرد.
MMLU Pro
76.5%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Grok-3 امتیاز 76.5% در این معیار کسب کرد.
SimpleQA
42%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Grok-3 امتیاز 42% در این معیار کسب کرد.
IFEval
91.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Grok-3 امتیاز 91.2% در این معیار کسب کرد.
AIME 2025
93.3%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Grok-3 امتیاز 93.3% در این معیار کسب کرد.
MATH
94.4%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Grok-3 امتیاز 94.4% در این معیار کسب کرد.
GSM8k
98.7%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Grok-3 امتیاز 98.7% در این معیار کسب کرد.
MGSM
92.4%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Grok-3 امتیاز 92.4% در این معیار کسب کرد.
MathVista
71.3%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Grok-3 امتیاز 71.3% در این معیار کسب کرد.
SWE-Bench
49%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Grok-3 امتیاز 49% در این معیار کسب کرد.
HumanEval
94.5%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Grok-3 امتیاز 94.5% در این معیار کسب کرد.
LiveCodeBench
79.4%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Grok-3 امتیاز 79.4% در این معیار کسب کرد.
MMMU
78%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Grok-3 امتیاز 78% در این معیار کسب کرد.
MMMU Pro
58.5%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Grok-3 امتیاز 58.5% در این معیار کسب کرد.
ChartQA
89.2%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Grok-3 امتیاز 89.2% در این معیار کسب کرد.
DocVQA
92.4%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Grok-3 امتیاز 92.4% در این معیار کسب کرد.
Terminal-Bench
52%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Grok-3 امتیاز 52% در این معیار کسب کرد.
ARC-AGI
12.5%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Grok-3 امتیاز 12.5% در این معیار کسب کرد.

درباره Grok-3

درباره قابلیت‌های Grok-3، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Reasoning و هوش در سطح Frontier

Grok-3 مدل frontier پرچمدار xAI است که نشان‌دهنده جهشی بزرگ در مقیاس محاسباتی و منطق است. این مدل که بر روی کلاستر ابرکامپیوتر Colossus با بیش از ۱۰۰,۰۰۰ کارت گرافیک NVIDIA H100 آموزش دیده، مسائل پیچیده ریاضی و علمی را حل می‌کند. این مدل دارای یک حالت تخصصی reasoning است که از توان محاسباتی اضافی برای تأیید منطق خود قبل از ارائه پاسخ نهایی استفاده می‌کند.

یکپارچگی دانش بلادرنگ

یکی از تفاوت‌های اصلی این مدل، یکپارچگی بومی آن با پلتفرم X است. این ویژگی به Grok-3 اجازه می‌دهد تا به اخبار فوری، تغییرات مالی و ترندهای جهانی با latency کمتر نسبت به مدل‌هایی که بر خزیدن استاندارد وب متکی هستند، دسترسی پیدا کند. این قابلیت در کنار context window یک میلیون token، به پژوهشگران اجازه می‌دهد حجم عظیمی از داده‌های دقیق و لحظه‌ای را سنتز کنند.

قابلیت‌های Multimodal و Agentic

فراتر از متن، Grok-3 یک مدل بصری قدرتمند است که قادر به تفسیر نمودارهای فنی، نقشه‌ها و داده‌های بصری است. این مدل از فراخوانی توابع پیشرفته برای استفاده در عامل‌های خودگردان پشتیبانی می‌کند. با کسب امتیاز ۸۳.۹٪ در SWE-Bench Verified، این مدل یکی از توانمندترین مدل‌ها برای حل مسائل واقعی مهندسی نرم‌افزار است.

Grok-3

موارد استفاده برای Grok-3

روش‌های مختلف استفاده از Grok-3 برای دستیابی به نتایج عالی را کشف کنید.

تحلیل بازار در لحظه

استفاده از داده‌های زنده X برای تحلیل احساسات بازار مالی و اخبار فوری برای سرمایه‌گذاران.

پژوهش علمی در سطح دکتری

حل مسائل STEM در سطح تحصیلات تکمیلی و تحلیل ادبیات فشرده با استفاده از حالت‌های reasoning.

مهندسی نرم‌افزار رقابتی

تولید کد در سطح عملیاتی و حل مشکلات GitHub با دقت بالا.

اثبات‌های ریاضی پیچیده

بهره‌گیری از توان محاسباتی در زمان تست برای حل مسائل ریاضی سطح المپیاد که نیازمند استنتاج‌های چندمرحله‌ای هستند.

تفسیر اسناد فنی

تحلیل نقشه‌ها و دستورالعمل‌های فنی از طریق سیستم multimodal vision.

منطق عامل‌های خودگردان (Agentic)

عملکرد به عنوان هسته شناختی برای عامل‌هایی که نیاز به برنامه‌ریزی دقیق و استفاده از ابزار دارند.

نقاط قوت

محدودیت‌ها

Reasoning در سطح المپیاد: کسب امتیاز کامل ۱۰۰٪ در benchmark ریاضی AIME 2025 با استفاده از حالت Deep Thinking.
اثرات زیست‌محیطی بالا: آموزش این مدل نیازمند ۲۰۰,۰۰۰ GPU بود و حدود ۱۵۰ مگاوات برق مصرف کرد که نگرانی‌های پایداری ایجاد کرده است.
ظرفیت بسیار بالای context: ارائه context window با ظرفیت ۱ میلیون token که امکان پردازش کتابخانه‌های کامل یا پروژه‌های نرم‌افزاری بزرگ را فراهم می‌کند.
هزینه API رده‌بالا: با قیمت ۱۵ دلار به ازای هر ۱ میلیون token خروجی، هزینه آن به مراتب بیشتر از گزینه‌های کوچک‌تر frontier است.
داده‌های بلادرنگ بی‌رقیب: یکپارچگی مستقیم با X، تازه‌ترین جریان داده را نسبت به هر مدل AI موجود فراهم می‌کند.
محدودیت‌های token خروجی: پاسخ‌ها معمولاً به ۴,۰۹۶ token محدود می‌شوند که ممکن است باعث قطع شدن گزارش‌ها یا فایل‌های کد بسیار طولانی شود.
دقت بالای کدنویسی: کسب امتیاز ۸۳.۹٪ در SWE-Bench Verified، که از رقبای اصلی در حل مسائل پیچیده GitHub پیشی گرفته است.
محدودیت‌های دسترسی: قابلیت‌های کامل مدل و API keyها اغلب برای مشترکین X Premium Plus یا مناطق خاص محدود شده‌اند.

شروع سریع API

xai/grok-3

مشاهده مستندات
xai SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-3",
    messages: [{ role: "user", content: "Analyze the current market sentiment for Nvidia on X." }],
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Grok-3 چه می‌گویند

ببینید جامعه درباره Grok-3 چه فکر می‌کند

Grok-3 [به دلیل] تحلیل احساسات بازار در لحظه، بهترین مدل AI برای معامله‌گران و سرمایه‌گذاران است.
Austin Starks
reddit
توانست برخی از prompt‌های سخت کدنویسی HVM را که Gemini و Sonnet در آن شکست خوردند، حل کند. کیفیتی را حس می‌کنم که از Sonnet-3.5 بالاتر است.
Victor Taelin
twitter
سرعت آن بسیار بالاست. Reasoning، اطلاعات بلادرنگ؛ به نظر می‌رسد در حال حاضر سریع‌ترین مدل flagship موجود باشد.
Matthew Berman
youtube
Grok دسترسی به داده‌های بلادرنگ دارد و مایل است به جاهایی برود که مدل‌های دیگر نمی‌روند، که آن را به انتخابی جسورانه برای کاربران حرفه‌ای تبدیل می‌کند.
Beginning-Willow-801
reddit
عملکرد Grok-3 در GPQA قابل توجه است. قطعاً برای کسب رتبه اول در reasoning رقابت می‌کند.
EpochAIResearch
twitter
ظرفیت ۱ میلیون token واقعاً کار می‌کند. کل codebase قدیمی من را بدون از دست دادن context در prompt‌های اولیه مدیریت کرد.
DevGuru42
hackernews

ویدیوهای درباره Grok-3

آموزش‌ها، بررسی‌ها و بحث‌های درباره Grok-3 را تماشا کنید

مقدمه‌ای بر Grok-3 و مقیاس آموزش آن.

این مدل برای هوش و جستجوی حقیقت ساخته شده است.

به نظر می‌رسد reasoning مدل Grok 3 در benchmark‌های علمی از مدل‌های OpenAI o1 و DeepSeek R1 پیشی گرفته است.

عملکرد benchmark در MMLU نشان می‌دهد که این یک مدل رده‌بالا است.

Grok 3 در واقع سعی می‌کند مسائل حل‌نشده را حل کند... در حالی که مدل‌های دیگر صرفاً اعلام می‌کنند که مسئله حل‌نشده است.

ایلان ماسک ادعا می‌کند که این قدرتمندترین AI تا به امروز است.

Grok 3 اکنون در این تست کور رتبه اول را کسب کرده و قهرمان فعلی Chatbot Arena است.

یکپارچگی با X مزیتی متمایز در تازگی داده‌ها فراهم می‌کند.

قابلیت‌های multimodal نسبت به Grok-2 به‌طور قابل‌توجهی بهبود یافته‌اند.

قدرتمندترین نسخه Grok و آخرین نسخه آن، همان نسخه وب در grok.com خواهد بود.

کاوش در معماری فنی کلاستر Colossus.

بحث در مورد آموزش عظیم با ۱۰۰ هزار GPU مدل H100.

ویژگی Big brain که مختص Grok 3 است... به کاربران اجازه می‌دهد از چندین عامل reasoning برای حل مسائل پیچیده استفاده کنند.

توسعه Grok 3 توسط ابرکامپیوتر Colossus شرکت X تسریع شد که در فاز اول از ۱۰۰,۰۰۰ کارت گرافیک NVIDIA H100 استفاده کرد.

نکات نهایی در مورد اینکه چرا Grok-3 گام بزرگی به جلو برای شفافیت در سبک open-weights است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Grok-3

نکات تخصصی برای کمک به شما در استفاده حداکثری از Grok-3 و دستیابی به نتایج بهتر.

استفاده از Deep Search

برای پرس‌وجوهای مربوط به اخبار یک ساعت اخیر، از deep search استفاده کنید تا دقیق‌ترین نتایج را دریافت کنید.

فعال‌سازی High Reasoning

برای معماهای ریاضی، دقت reasoning را بر روی high تنظیم کنید تا مراحل خود-ارزیابی (self-verification) فعال شوند.

استفاده از Collections API

اسناد حساس خود را در Collections API آپلود کنید تا داده‌هایتان از چرخه‌های آموزش مدل خارج بمانند.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

سوالات متداول درباره Grok-3

پاسخ سوالات رایج درباره Grok-3 را بیابید