xai

Grok-3

Grok-3 është modeli flagship reasoning i xAI, që përmban zbritje të thellë logjike, 128k context window dhe integrim në kohë reale me X për kërkime dhe kodim...

xai logoxaiGrok17 Shkurt, 2025
Konteksti
128Ktokena
Output maksimal
8Ktokena
Cmimi i inputit
$3.00/ 1M
Cmimi i outputit
$15.00/ 1M
Modaliteti:TextImage
Aftesite:VizioniMjetetStreamingArsyetimi
Benchmarket
GPQA
84.6%
GPQA: Pyetje shkence niveli pasuniversitar. Benchmark rigoroz me 448 pyetje nga biologjia, fizika dhe kimia. Ekspertet PhD arrijne vetem 65-74% saktesi. Grok-3 mori 84.6% ne kete benchmark.
HLE
36%
HLE: Arsyetim niveli ekspert. Teston aftesine e modelit per te demonstruar arsyetim niveli ekspert ne fusha te specializuara. Grok-3 mori 36% ne kete benchmark.
MMLU
87.5%
MMLU: Kuptim masiv gjuhor multitask. Benchmark gjitheperfshires me 16,000 pyetje ne 57 lende akademike. Grok-3 mori 87.5% ne kete benchmark.
MMLU Pro
76.5%
MMLU Pro: MMLU Edicioni Profesional. Version i permiresuar i MMLU me 12,032 pyetje dhe format me te veshtire me 10 opsione. Grok-3 mori 76.5% ne kete benchmark.
SimpleQA
42%
SimpleQA: Benchmark saktesie faktike. Teston aftesine e modelit per te dhene pergjigje te sakta, faktike. Grok-3 mori 42% ne kete benchmark.
IFEval
91.2%
IFEval: Vleresim i ndjekjes se udhezimeve. Mat sa mire modeli ndjek udhezime dhe kufizime specifike. Grok-3 mori 91.2% ne kete benchmark.
AIME 2025
93.3%
AIME 2025: Provimi Amerikan i Matematikes me Ftese. Probleme matematike niveli konkursi nga provimi prestigjioz AIME. Grok-3 mori 93.3% ne kete benchmark.
MATH
94.4%
MATH: Zgjidhje problemesh matematike. Benchmark gjitheperfshires matematike qe teston zgjidhjen e problemeve ne algebre, gjeometri, kalkulus. Grok-3 mori 94.4% ne kete benchmark.
GSM8k
98.7%
GSM8k: Matematike shkolle fillore 8K. 8,500 probleme matematike me fjale niveli shkolle fillore. Grok-3 mori 98.7% ne kete benchmark.
MGSM
92.4%
MGSM: Matematike shkolle fillore shumegjuheshe. Benchmarku GSM8k i perkthyer ne 10 gjuhe. Grok-3 mori 92.4% ne kete benchmark.
MathVista
71.3%
MathVista: Arsyetim vizual matematik. Teston aftesine per te zgjidhur probleme matematike me elemente vizuale. Grok-3 mori 71.3% ne kete benchmark.
SWE-Bench
49%
SWE-Bench: Benchmark inxhinieri software. Modelet AI perpiqen te zgjidhin probleme reale GitHub ne projekte Python. Grok-3 mori 49% ne kete benchmark.
HumanEval
94.5%
HumanEval: Probleme programimi Python. 164 probleme programimi ku modelet duhet te gjenerojne implementime te sakta funksionesh Python. Grok-3 mori 94.5% ne kete benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark kodimi live. Teston aftesite e kodimit ne sfida programimi te botes reale qe perditsohen vazhdimisht. Grok-3 mori 79.4% ne kete benchmark.
MMMU
78%
MMMU: Kuptim multimodal. Benchmark kuptimi multimodal nga 30 lende universitare. Grok-3 mori 78% ne kete benchmark.
MMMU Pro
58.5%
MMMU Pro: MMMU Edicioni Profesional. Version i permiresuar i MMMU me pyetje me sfiduese. Grok-3 mori 58.5% ne kete benchmark.
ChartQA
89.2%
ChartQA: Pyetje dhe pergjigje grafiku. Teston aftesine per te kuptuar dhe analizuar informacion nga grafiqet dhe diagramet. Grok-3 mori 89.2% ne kete benchmark.
DocVQA
92.4%
DocVQA: Pyetje vizuale dokumentesh. Teston aftesine per te nxjerre informacion nga imazhet e dokumenteve. Grok-3 mori 92.4% ne kete benchmark.
Terminal-Bench
52%
Terminal-Bench: Detyra terminal/CLI. Teston aftesine per te kryer operacione te linjes se komandes. Grok-3 mori 52% ne kete benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstraksion dhe arsyetim. Teston inteligjencen e lengeshem permes puzzleve te reja te njohjes se modeleve. Grok-3 mori 12.5% ne kete benchmark.

Rreth Grok-3

Meso per aftesite e Grok-3, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Reasoning dhe Inteligjencë Frontier

Grok-3 është modeli flagship frontier i xAI, duke përfaqësuar një kapërcim të rëndësishëm në shkallën llogaritëse dhe logjikë. I trajnuar në cluster-in e superkompjuterit Colossus me mbi 100,000 NVIDIA H100 GPU, ai përballon sfida komplekse matematikore dhe shkencore. Modeli përmban një modalitet të specializuar reasoning që përdor llogaritje shtesë për të verifikuar logjikën e tij përpara se të japë një përgjigje përfundimtare.

Integrimi i njohurive në kohë reale

Një diferencues kryesor është integrimi i tij native me platformën X. Kjo i lejon Grok-3 të aksesojë lajmet e fundit, ndryshimet financiare dhe trendet globale me më pak latency se modelet që mbështeten në web crawling standard. I çiftuar me një context window prej 1 milion tokens, ai u mundëson studiuesve të sintetizojnë sasi masive të të dhënave të përditësuara.

Kapacitete Multimodale dhe Agentic

Përtej tekstit, Grok-3 është një model vision i fuqishëm i aftë për të interpretuar diagrame teknike, plane dhe të dhëna vizuale. Ai mbështet funksionet e avancuara të thirrjes (function calling) për t'u përdorur në agjentë autonomë. Me një rezultat prej 83.9% në SWE-Bench Verified, ai është një nga modelet më të afta për zgjidhjen e çështjeve të inxhinierisë softuerike në botën reale.

Grok-3

Rastet e perdorimit per Grok-3

Zbulo menyrat e ndryshme per te perdorur Grok-3 per te arritur rezultate te shkelvqyera.

Analiza e tregut në kohë reale

Përdor të dhënat live nga X për të analizuar sentimentin financiar dhe lajmet e fundit për investitorët.

Kërkime shkencore në nivel PhD

Zgjidh probleme STEM të nivelit pasuniversitar dhe analizon literaturë komplekse me modalitete reasoning.

Inxhinieri softuerike konkurruese

Gjeneron kod të shkallës së prodhimit dhe zgjidh çështje të GitHub me saktësi të lartë.

Prova matematikore komplekse

Përdor fuqi llogaritëse gjatë testimit (test-time compute) për të zgjidhur matematikë të nivelit të olimpiadave që kërkon zbritje me shumë hapa.

Interpretimi i dokumenteve teknike

Analizon plane dhe manuale teknike përmes sistemit të tij multimodal vision.

Logjika e agjentëve autonomë

Shërben si bërthama kognitive për agjentë që kërkojnë planifikim me besnikëri të lartë dhe përdorim të mjeteve.

Pikat e forta

Kufizimet

Reasoning i nivelit të Olimpiadës: Arriti një rezultat perfekt 100% në benchmark-in e matematikës AIME 2025 duke përdorur modalitetin Deep Thinking.
Gjurmë e lartë mjedisore: Training kërkoi 200,000 GPU dhe konsumon afërsisht 150MW energji, duke ngritur shqetësime për qëndrueshmërinë.
Kapacitet masiv të context-it: Ofron një context window prej 1 milion tokens, duke mundësuar përpunimin e bibliotekave të tëra ose projekteve softuerike.
Çmimi Premium i API: Me 15 dollarë për milion output tokens, është dukshëm më i shtrenjtë se alternativat e tjera më të vogla frontier.
Të dhëna në kohë reale të pakrahasueshme: Integrimi direkt me X ofron stream-in më të freskët të të dhënave nga çdo model tjetër AI aktualisht i disponueshëm.
Kufizimet e output tokens: Përgjigjet janë përgjithësisht të kufizuara në 4,096 tokens, gjë që mund të shkurtojë raporte ose skedarë kodi jashtëzakonisht të gjatë.
Saktësi e lartë në kodim: Shënoi 83.9% në SWE-Bench Verified, duke performuar më mirë se konkurrentët kryesorë në zgjidhjen e çështjeve komplekse në GitHub.
Kufizimet e qasjes: Kapacitetet e plota të modelit dhe çelësat e API shpesh janë të kufizuara për abonentët X Premium Plus ose rajone specifike.

Fillim i shpejte API

xai/grok-3

Shiko dokumentacionin
xai SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-3",
    messages: [{ role: "user", content: "Analyze the current market sentiment for Nvidia on X." }],
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per Grok-3

Shiko se cfare mendon komuniteti per Grok-3

Grok-3 [është] modeli më i mirë i AI për tregtarët dhe investitorët për shkak të analizës së sentimentit në kohë reale.
Austin Starks
reddit
Arriti të zgjidhë disa prompt-e të vështira të HVM code completion që Gemini dhe Sonnet dështuan. Ndiej një nivel 'cilësie' që është më i lartë se Sonnet-3.5.
Victor Taelin
twitter
Shpejtësia është shumë e lartë. Reasoning, informacioni në kohë reale, thjesht duket si modeli flagship më i shpejtë atje tani.
Matthew Berman
youtube
Grok ka qasje në të dhëna në kohë reale dhe dëshirë për të shkuar atje ku modele të tjera nuk do të shkonin, duke e bërë atë zgjedhjen 'edgy' për power users.
Beginning-Willow-801
reddit
Performanca e Grok-3 në GPQA është e jashtëzakonshme. Ai me siguri po konkurron për vendin e parë në reasoning.
EpochAIResearch
twitter
Context window prej 1M vërtet funksionon. Ai përpunoi të gjithë bazën time të vjetër të kodit pa humbur context-in në prompt-et fillestare.
DevGuru42
hackernews

Video rreth Grok-3

Shiko tutoriale, rishikime dhe diskutime rreth Grok-3

Hyrje në Grok-3 dhe shkallën e tij të training.

Modeli është ndërtuar për inteligjencë dhe kërkimin e së vërtetës.

Reasoning-u i Grok 3... duket se po mposht si OpenAI o1 ashtu edhe modelin DeepSeek R1 në benchmark-et shkencore.

Performanca në benchmark-in MMLU tregon se është një model i nivelit më të lartë.

Grok 3 gjithashtu do të përpiqet të zgjidhë probleme të pazgjidhura... ndërsa modele të tjera thjesht do të deklarojnë se janë të pazgjidhura.

Elon Musk pretendon se ky është AI më i fuqishëm deri më sot.

Grok 3 tani ka marrë vendin e parë në këtë test të verbër, duke e bërë atë kampionin aktual në Chatbot Arena.

Integrimi me X ofron një avantazh të veçantë në përditësimin e të dhënave.

Kapacitetet multimodale janë përmirësuar ndjeshëm krahasuar me Grok-2.

Versioni më i fuqishëm i Grok dhe versioni më i fundit do të jetë versioni web në grok.com.

Eksplorimi i arkitekturës teknike të cluster-it Colossus.

Diskutim për training run-in masiv me 100k GPU H100.

Big brain është një veçori që është vërtet unike për Grok 3... u lejon përdoruesve të përdorin agjentë të shumtë reasoning për të zgjidhur probleme komplekse.

Zhvillimi i Grok 3 u përshpejtua nga superkompjuteri Colossus i X, i cili përdori 100,000 GPU Nvidia H100 në Fazën 1.

Mendimet përfundimtare përse Grok-3 është një hap i madh përpara për transparencën e stilit open-weights.

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI
Automatizimi i web-it
Workflow-e inteligjente

Keshilla Pro per Grok-3

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga Grok-3 dhe te arrish rezultate me te mira.

Përdorni Deep Search

Përdorni deep search për kërkime që lidhen me lajmet e orës së fundit për rezultatet më të sakta.

Aktivizoni High Reasoning

Specifikoni angazhimin e reasoning si të lartë për enigmat matematikore për të aktivizuar hapat e vetë-verifikimit.

Përdorni Collections API

Ngarkoni dokumente sensitive në Collections API për t'i mbajtur të dhënat tuaja jashtë cikleve të training.

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Pyetjet e bera shpesh rreth Grok-3

Gjej pergjigje per pyetjet e zakonshme rreth Grok-3