xai

Grok-3

model Grok-3 محصول پرچم‌دار شرکت xAI در حوزه reasoning است که از استنتاج منطقی عمیق، context window ۱۲۸ هزار تایی و یکپارچگی real-time با پلتفرم X برای تحقیق...

xai logoxaiGrokFebruary 17, 2025
پنجره زمینه
128Kتوکن
حداکثر خروجی
8Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
84.6%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Grok-3 امتیاز 84.6% در این معیار کسب کرد.
HLE
36%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Grok-3 امتیاز 36% در این معیار کسب کرد.
MMLU
87.5%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Grok-3 امتیاز 87.5% در این معیار کسب کرد.
MMLU Pro
76.5%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Grok-3 امتیاز 76.5% در این معیار کسب کرد.
SimpleQA
42%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Grok-3 امتیاز 42% در این معیار کسب کرد.
IFEval
91.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Grok-3 امتیاز 91.2% در این معیار کسب کرد.
AIME 2025
93.3%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Grok-3 امتیاز 93.3% در این معیار کسب کرد.
MATH
94.4%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Grok-3 امتیاز 94.4% در این معیار کسب کرد.
GSM8k
98.7%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Grok-3 امتیاز 98.7% در این معیار کسب کرد.
MGSM
92.4%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Grok-3 امتیاز 92.4% در این معیار کسب کرد.
MathVista
71.3%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Grok-3 امتیاز 71.3% در این معیار کسب کرد.
SWE-Bench
49%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Grok-3 امتیاز 49% در این معیار کسب کرد.
HumanEval
94.5%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Grok-3 امتیاز 94.5% در این معیار کسب کرد.
LiveCodeBench
79.4%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Grok-3 امتیاز 79.4% در این معیار کسب کرد.
MMMU
78%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Grok-3 امتیاز 78% در این معیار کسب کرد.
MMMU Pro
58.5%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Grok-3 امتیاز 58.5% در این معیار کسب کرد.
ChartQA
89.2%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Grok-3 امتیاز 89.2% در این معیار کسب کرد.
DocVQA
92.4%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Grok-3 امتیاز 92.4% در این معیار کسب کرد.
Terminal-Bench
52%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Grok-3 امتیاز 52% در این معیار کسب کرد.
ARC-AGI
12.5%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Grok-3 امتیاز 12.5% در این معیار کسب کرد.

درباره Grok-3

درباره قابلیت‌های Grok-3، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Reasoning و هوشمندی در سطح Frontier

Grok-3 نشان‌دهنده جهشی عظیم در هوش مصنوعی است که در کلاستر ابررایانه‌ای Colossus متعلق به xAI با استفاده از بیش از ۱۰۰,۰۰۰ GPU مدل NVIDIA H100 آموزش دیده است. این model به‌طور خاص برای برتری در منطق پیچیده، استنتاج ریاضی و مهندسی نرم‌افزار سطح بالا معماری شده است. برخلاف مدل‌های سنتی که تولید پاسخ سریع را در اولویت قرار می‌دهند، Grok-3 دارای یک حالت Deep Thinking اختصاصی است که از compute عظیم در زمان تست برای تأیید مراحل reasoning داخلی خود پیش از ارائه خروجی نهایی استفاده می‌کند.

یکپارچگی با دانش Real-Time

تمایز اصلی Grok-3 دسترسی بی‌نظیر آن به جریان داده‌های لحظه‌ای پلتفرم X است. این ویژگی به model اجازه می‌دهد اخبار فوری، تحولات مالی و ترندهای جهانی را با تأخیر تنها چند ثانیه‌ای تحلیل و ترکیب کند، در حالی که سایر مدل‌ها به knowledge cutoffs یا ابزارهای جستجوی وب کندتر متکی هستند. این آگاهی real-time در کنار یک context window ۱۲۸,۰۰۰ تایی، آن را به ابزاری ضروری برای پژوهشگران بازار و دانشمندان داده تبدیل می‌کند که به بینش‌های لحظه‌ای نیاز دارند.

قابلیت‌های Multimodal و Agentic

فراتر از متن و منطق، Grok-3 یک vision model قدرتمند و multimodal است که توانایی تفسیر نمودارهای فنی پیچیده، نقشه‌ها و داده‌های بصری را با دقت سطح frontier دارد. این مدل از function calling پیشرفته و استفاده از ابزارها پشتیبانی می‌کند و به آن اجازه می‌دهد به عنوان موتور شناختی برای عامل‌های خودگردان (autonomous agents) عمل کند. با کسب امتیاز ۹۴.۵٪ در HumanEval، این مدل در حال حاضر به عنوان یکی از توانمندترین دستیارهای coding موجود شناخته می‌شود که با برترین رقبای خود در عیب‌یابی خودگردان و بازنویسی معماری رقابت کرده یا از آن‌ها پیشی می‌گیرد.

Grok-3

موارد استفاده برای Grok-3

روش‌های مختلف استفاده از Grok-3 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار پیشرفته

حل مسائل پیچیده معماری و بازنویسی کل پایگاه‌های کد با reasoning عمیق و دقت ۹۴.۵٪ در benchmark مدل HumanEval.

هوش بازار Real-Time

بهره‌گیری از داده‌های زنده X برای ترکیب و تحلیل اخبار فوری مالی و احساسات مصرف‌کنندگان، سریع‌تر از موتورهای جستجوی سنتی.

ترکیب داده‌های علمی

پردازش هزاران صفحه از مجلات آکادمیک در حالت Deep Research برای شناسایی ارتباطات پژوهشی جدید و فرضیه‌ها.

تحلیل اسناد Multimodal

تفسیر نمودارهای فنی پیچیده، نقشه‌ها و چارت‌های مالی با استفاده از قابلیت‌های vision در سطح frontier model.

تدریس خصوصی در سطح مسابقات

تجزیه مسائل پیچیده ریاضی و فیزیک در سطح المپیاد به مراحل قابل فهم و تأیید شده با استفاده از حالت Think.

اتوماسیون جریان کار Agentic

عمل به عنوان موتور اصلی برای عامل‌های خودگردان که در محیط‌های عملیاتی به function calling و استفاده دقیق از ابزارها نیاز دارند.

نقاط قوت

محدودیت‌ها

Reasoning برتر: عملکرد بهتر از رقبای پیشرو در benchmarkهای پیچیده ریاضی مانند AIME 2025 (۹۳.۳٪) و MATH (۹۴.۴٪).
Latency بالا در حالت تفکر: تولید پاسخ تأیید شده برای promptهای استدلالی پیچیده در حالت Think می‌تواند بیش از ۶۰ ثانیه زمان ببرد.
قابلیت Deep Research یکپارچه: دارای ویژگی منحصر‌به‌فرد جستجوی وب که داده‌های زنده X را به‌طور قابل‌توجهی سریع‌تر از رقبا تحلیل و ترکیب می‌کند.
عدم پشتیبانی بومی از ویدیو یا صدا: فاقد پردازش real-time ویدیو و صدای multimodal است که در رقبایی مانند Gemini 2.0 یافت می‌شود.
عملکرد ممتاز در Coding: کسب امتیاز ۹۴.۵٪ در HumanEval، که آن را به انتخابی سطح بالا برای توسعه نرم‌افزار خودگردان و عیب‌یابی تبدیل می‌کند.
سهمیه‌های مصرف سخت‌گیرانه: محدودیت تعداد پیام برای مشترکین Premium+ در ساعات اوج مصرف در حال حاضر کمتر از برخی رقبای تثبیت‌شده است.
ردپاهای تفکر شفاف: به کاربران اجازه می‌دهد منطق مدل را گام‌به‌گام مشاهده کنند که باعث افزایش اعتماد و تسهیل عیب‌یابی خطاهای پیچیده می‌شود.
مشکلات پایداری نسخه بتا: کاربران ممکن است گهگاه در دوره‌های ترافیک بالا با خطاهای سرور یا قطع شدن thinking traces مواجه شوند.

شروع سریع API

xai/grok-3

مشاهده مستندات
xai SDK
import OpenAI from "openai";

const xai = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1"
});

const response = await xai.chat.completions.create({
  model: "grok-3",
  messages: [{ role: "user", content: "Analyze current X trends for AGI." }],
  stream: true
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Grok-3 چه می‌گویند

ببینید جامعه درباره Grok-3 چه فکر می‌کند

"قابلیت deep research در Grok-3 به‌طور قابل توجهی سریع‌تر و دقیق‌تر از نسخه OpenAI است"
TechEnthusiast
x
"عملکرد coding فوق‌العاده است؛ باگی را که ساعت‌ها درگیرش بودم در عرض چند ثانیه رفع کرد"
DevLife
reddit
"Grok-3 بدون شک پیشرفته‌ترین reasoning model موجود در حال حاضر است"
DataCamp
youtube
"Thinking traces شباهت زیادی به DeepSeek دارد اما سرعت آن در سطح دیگری است"
AIResearcher
hackernews
"قابلیت‌های vision روی نقشه‌های فنی بالاخره برای کارهای مهندسی واقعی قابل استفاده شده است"
EngDesign
reddit
"ادغام با X به هر کسی که به دنبال رهگیری real-time احساسات بازار کریپتو یا سهام است، برتری بزرگی می‌دهد"
FinancePro
x

ویدیوهای درباره Grok-3

آموزش‌ها، بررسی‌ها و بحث‌های درباره Grok-3 را تماشا کنید

Grok 3 بدون شک پیشرفته‌ترین reasoning model موجود در حال حاضر است

کیفیت خروجی آن به مراتب بهتر از قابلیت جستجوی عمیق OpenAI بود

سرعت حالت deep research در مقایسه با O1 واقعاً چشمگیر است

می‌توانید ببینید که مدل واقعاً در حال پردازش همزمان چندین نتیجه جستجو است

این یک جهش بزرگ نسبت به Grok-2 از نظر سازگاری منطقی است

مدل‌های Grok 3 و Grok 3 mini از تمام reasoning models منتشر شده بهتر هستند

منطق آن به سمت واقعیت میل می‌کند... این انسانی‌ترین شیوه reasoning است که تا به حال دیده‌ام

Thinking trace داخلی دید بسیار واضح‌تری از منطق ارائه می‌دهد

فقط حدس نمی‌زند؛ کار خود را چک می‌کند که نشانه تفکر System 2 است

عملکرد ریاضی در benchmarkهای AIME واقعاً state-of-the-art است

در این benchmarkها می‌بینید که Grok 3 در تمام زمینه‌ها واقعاً خوب عمل می‌کند

در مقایسه با سایر رقبا، بسیار نویدبخش است

عملکرد coding داستان اصلی اینجاست که با بهترین‌های صنعت رقابت می‌کند

وظایف بازنویسی معماری را که نسخه‌های قبلی در آن‌ها شکست می‌خوردند، به خوبی انجام می‌دهد

ادغام با X API آن را برای رویدادهای جاری به‌طور منحصربه‌فردی قدرتمند می‌کند

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای برای Grok-3

نکات تخصصی برای کمک به شما در استفاده حداکثری از Grok-3 و دستیابی به نتایج بهتر.

فعال‌سازی Deep Thinking

برای وظایف ریاضی یا منطقی همیشه حالت Think را فعال کنید تا از تأیید گام‌به‌گام از طریق test-time compute اطمینان حاصل شود.

بهره‌گیری از ادغام با X

از پرس‌وجوهای خاص درباره اخبار فوری یا رویدادهای جاری استفاده کنید تا به داده‌هایی دسترسی پیدا کنید که سایر LLM‌ها به دلیل knowledge cutoffs به آن‌ها دسترسی ندارند.

بررسی Traces

ردپاهای تفکر داخلی مدل را مرور کنید تا دقیقاً متوجه شوید مدل compute خود را در کجا صرف کرده و مسیر منطقی آن را تأیید کنید.

Vision برای UI

اسکرین‌شات‌های طراحی رابط کاربری را آپلود کنید و از Grok بخواهید برای پروتوتایپ‌سازی سریع فرانت‌‌اند، کد React یا Tailwind معادل آن را تولید کند.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

سوالات متداول درباره Grok-3

پاسخ سوالات رایج درباره Grok-3 را بیابید