xai

Grok-4

Grok-4 nga xAI është një frontier model me një context window prej 2M tokens, integrim në kohë reale me platformën X dhe aftësi të shkëlqyera të reasoning-ut.

xai logoxaiGrok9 Korrik 2025
Konteksti
2.0Mtokena
Output maksimal
8Ktokena
Cmimi i inputit
$3.00/ 1M
Cmimi i outputit
$15.00/ 1M
Modaliteti:TextImage
Aftesite:VizioniMjetetStreamingArsyetimi
Benchmarket
GPQA
87.5%
GPQA: Pyetje shkence niveli pasuniversitar. Benchmark rigoroz me 448 pyetje nga biologjia, fizika dhe kimia. Ekspertet PhD arrijne vetem 65-74% saktesi. Grok-4 mori 87.5% ne kete benchmark.
HLE
44.4%
HLE: Arsyetim niveli ekspert. Teston aftesine e modelit per te demonstruar arsyetim niveli ekspert ne fusha te specializuara. Grok-4 mori 44.4% ne kete benchmark.
MMLU
94%
MMLU: Kuptim masiv gjuhor multitask. Benchmark gjitheperfshires me 16,000 pyetje ne 57 lende akademike. Grok-4 mori 94% ne kete benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Edicioni Profesional. Version i permiresuar i MMLU me 12,032 pyetje dhe format me te veshtire me 10 opsione. Grok-4 mori 81.2% ne kete benchmark.
SimpleQA
48%
SimpleQA: Benchmark saktesie faktike. Teston aftesine e modelit per te dhene pergjigje te sakta, faktike. Grok-4 mori 48% ne kete benchmark.
IFEval
89.2%
IFEval: Vleresim i ndjekjes se udhezimeve. Mat sa mire modeli ndjek udhezime dhe kufizime specifike. Grok-4 mori 89.2% ne kete benchmark.
AIME 2025
100%
AIME 2025: Provimi Amerikan i Matematikes me Ftese. Probleme matematike niveli konkursi nga provimi prestigjioz AIME. Grok-4 mori 100% ne kete benchmark.
MATH
92%
MATH: Zgjidhje problemesh matematike. Benchmark gjitheperfshires matematike qe teston zgjidhjen e problemeve ne algebre, gjeometri, kalkulus. Grok-4 mori 92% ne kete benchmark.
GSM8k
98.4%
GSM8k: Matematike shkolle fillore 8K. 8,500 probleme matematike me fjale niveli shkolle fillore. Grok-4 mori 98.4% ne kete benchmark.
MGSM
92.1%
MGSM: Matematike shkolle fillore shumegjuheshe. Benchmarku GSM8k i perkthyer ne 10 gjuhe. Grok-4 mori 92.1% ne kete benchmark.
MathVista
72.4%
MathVista: Arsyetim vizual matematik. Teston aftesine per te zgjidhur probleme matematike me elemente vizuale. Grok-4 mori 72.4% ne kete benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark inxhinieri software. Modelet AI perpiqen te zgjidhin probleme reale GitHub ne projekte Python. Grok-4 mori 81% ne kete benchmark.
HumanEval
88%
HumanEval: Probleme programimi Python. 164 probleme programimi ku modelet duhet te gjenerojne implementime te sakta funksionesh Python. Grok-4 mori 88% ne kete benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark kodimi live. Teston aftesite e kodimit ne sfida programimi te botes reale qe perditsohen vazhdimisht. Grok-4 mori 79.4% ne kete benchmark.
MMMU
75%
MMMU: Kuptim multimodal. Benchmark kuptimi multimodal nga 30 lende universitare. Grok-4 mori 75% ne kete benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Edicioni Profesional. Version i permiresuar i MMMU me pyetje me sfiduese. Grok-4 mori 59.2% ne kete benchmark.
ChartQA
90.5%
ChartQA: Pyetje dhe pergjigje grafiku. Teston aftesine per te kuptuar dhe analizuar informacion nga grafiqet dhe diagramet. Grok-4 mori 90.5% ne kete benchmark.
DocVQA
93.2%
DocVQA: Pyetje vizuale dokumentesh. Teston aftesine per te nxjerre informacion nga imazhet e dokumenteve. Grok-4 mori 93.2% ne kete benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Detyra terminal/CLI. Teston aftesine per te kryer operacione te linjes se komandes. Grok-4 mori 54.2% ne kete benchmark.
ARC-AGI
15.9%
ARC-AGI: Abstraksion dhe arsyetim. Teston inteligjencen e lengeshem permes puzzleve te reja te njohjes se modeleve. Grok-4 mori 15.9% ne kete benchmark.

Rreth Grok-4

Meso per aftesite e Grok-4, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Përmbledhje e modelit

Grok-4 është frontier model multimodal nga xAI. Ai është ndërtuar për t'i dhënë përparësi reasoning-ut nga parimet e para dhe marrjes së informacionit në kohë reale. Modeli fiton një avantazh të rëndësishëm konkurrues përmes integrimit të tij vendas me platformën sociale X. Kjo i mundëson atij të analizojë bisedat dhe lajmet globale të gjalla sapo ato ndodhin. Ai përdor superkompjuterin Colossus për trajnim, duke rezultuar në performancë të lartë në domenet matematikore dhe teknike.

Aftësitë teknike

Arkitektura mbështet një context window prej 2 milionë tokens në variantet e tij të reasoning-ut. Ky kapacitet mundëson përpunimin e bazave të mëdha të kodit dhe dokumentacionit teknik të dendur pa humbje të të dhënave. Ai përmban një sistem me dy mënyra ku përdoruesit zgjedhin midis një mënyre me shpejtësi të lartë për ndërveprime të shpejta dhe një mënyre të thelluar për detyra logjike me shumë hapa. Modeli menaxhon një shkallë halucinacioni prej rreth 4% duke përdorur një mekanizëm konsensusi me shumë agjentë në konfigurimin e tij Heavy.

Integrimi në ekosistem

Përtej gjenerimit të thjeshtë të tekstit, Grok-4 është projektuar për përdorim të mjeteve në mënyrë native dhe thirrje komplekse të funksioneve. Ai mbështet përpunimin e imazhit dhe audios, duke e bërë atë një zgjedhje të shkathët për zhvilluesit që ndërtojnë aplikacione multimodale. Strategjia e tij e alinjamentit fokusohet në kërkimin e së vërtetës objektive dhe jo te barrierat standarde të sigurisë së industrisë. Kjo rezulton në më pak refuzime për tema të diskutueshme ose provokuese krahasuar me frontier models të tjera.

Grok-4

Rastet e perdorimit per Grok-4

Zbulo menyrat e ndryshme per te perdorur Grok-4 per te arritur rezultate te shkelvqyera.

Analiza e sentimentit në kohë reale

Analizon postimet e gjalla në X për të përcaktuar reagimin e publikut ndaj lajmeve të fundit ose lançimeve të produkteve.

Auditimi i depozitave të mëdha të kodit

Vlerëson depozita të tëra softuerike duke përdorur dritaren prej 2M tokens për të gjetur defekte arkitekturore.

Zgjidhja e problemeve matematikore të nivelit olimpiadë

Ofron zgjidhje hap pas hapi për prova komplekse matematikore dhe probleme të nivelit AIME.

Përmbajtje kreative e pafiltruar

Gjeneron skenarë të bazuar në personazhe dhe humor pa filtrat kufizues të ofruesve të tjerë të AI.

Sinteza e kërkimeve shkencore

Përmbledh disa punime akademike të nivelit PhD njëkohësisht duke ruajtur saktësinë teknike.

Debugging teknik

Identifikon gabime të pakuptimta në kodin e prodhimit dhe sugjeron rregullime bazuar në praktikat më të mira aktuale.

Pikat e forta

Kufizimet

Reasoning matematikor elitar: Arriti një rezultat të përsosur 100% në benchmark-un AIME 2025, duke lënë pas shumicën e frontier models në logjikë.
Latency në Heavy Mode: Mënyra e reasoning-ut me shumë agjentë mund të marrë disa minuta për të prodhuar një përgjigje të vetme me saktësi të lartë.
Context window lider në industri: Dritarja prej 2M tokens lejon thellësi të paparë në analizën e dokumenteve dhe projektet e mëdha të kodimit.
Mbështetje jo e plotë për video: Ndërsa aftësitë për tekst dhe imazh janë të nivelit të lartë, përpunimi vendas i videos kuadër-pas-kuadri ende nuk është i disponueshëm.
Inteligjencë sociale e gjallë: Aksesi i drejtpërdrejtë në platformën X siguron informacion në kohë reale që të dhënat statike të trajnimit nuk mund ta replikojnë.
Akses rajonal i kufizuar: Veçoritë e memories persistente janë aktualisht të çaktivizuara në Bashkimin Evropian për shkak të kërkesave rregullatore.
Shkallë e ulët refuzimi: Një arkitekturë sigurie më lejuese lejon një dialog të ndershëm dhe objektiv mbi tema të diskutueshme.
Kufizimet në saktësinë vizuale: Krijuesit pranojnë se modeli mbetet pjesërisht i verbër kur interpreton detaje vizuale me besnikëri jashtëzakonisht të lartë.

Fillim i shpejte API

xai/grok-4

Shiko dokumentacionin
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per Grok-4

Shiko se cfare mendon komuniteti per Grok-4

Grok 4 fast ka një dritare 2M tokens!!! Pse kemi vuajtur dhe jemi mjaftuar me ChatGPT, vërtet nuk e di më.
myfuturewifee
reddit
15.88% në subset-in privat ARC-AGI v2 është i çmendur. Grok 4 është modeli i parë që thyen atë barrierë prej 10% në muaj.
Greg (ARC-AGI Lead)
twitter
Qasja e grupit të studimit me shumë agjentë në Grok 4 Heavy është mënyra e duhur për të përdorur test-time compute. Ai vërtet gjen trukun e problemit.
Tony_xAI
twitter
Grok 4: 79 në LiveCodeBench... benchmark-et nuk të tregojnë se si ndihet të kodosh me një model, por ky ndihet i besueshëm.
thankzr3ddit
reddit
Modeli është në nivel pasuniversitar si PhD në gjithçka. Është tmerrësisht i zgjuar dhe më i shpejtë se çdo gjë që një njeri mund të mësojë.
Elon Musk
youtube
Kërkimi në kohë reale nuk është thjesht skrapim titujsh; është analizimi i përmbajtjes nëpër burime të shumta.
BitBiasedAI
youtube

Video rreth Grok-4

Shiko tutoriale, rishikime dhe diskutime rreth Grok-4

Grok 4 heavy është për detyra më intensive të logjikës dhe reasoning-ut, ndërsa Grok 4 i rregullt trajton të tjerat.

Ai ndoqi plotësisht saktë dorën dhe gishtat e mi për të vizatuar në ekran.

Grok 4 gjeti fjalëkalimin që fsheha thellë në context window pas vetëm 15 sekondash mendimi.

Saktësia në testin e gjilpërës në kashtë me 2 milionë tokens ishte 100%.

Ky model është më në fund një alternativë reale për ata që e gjetën context window të Gemini-t të pabesueshëm.

Grok 4 është në nivel pasuniversitar si PhD në gjithçka, më mirë se shumica e PhD-ve.

Grok 4 Heavy krijon disa agjentë në paralel... është si një grup studimi.

Është në API dhe ka një gjatësi kontakti prej 256k, me plane për shumë më tepër.

Trajnimi në grupin Colossus i ka dhënë një aftësi reasoning-u që nuk e kemi parë.

Është projektuar të jetë AI më kërkues i së vërtetës që ekziston aktualisht.

Grok 4 Heavy ekzekuton deri në 32 modele AI paralele në një prompt të vetëm tuajin.

Kërkimi në kohë reale nuk është thjesht skrapim titujsh; është analizimi i përmbajtjes nëpër burime të shumta.

Think Mode shpenzon kohë shtesë llogaritëse duke planifikuar dhe kapur gabime të mundshme përpara se të përgjigjet.

Ju mund të shihni agjentët duke debatuar me njëri-tjetrin në log-e nëse keni akses në API.

Performanca multimodale me audio është dukshëm më e shpejtë se gjenerata e mëparshme.

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI
Automatizimi i web-it
Workflow-e inteligjente

Keshilla Pro per Grok-4

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga Grok-4 dhe te arrish rezultate me te mira.

Përdorni fjalë kyçe për kërkim

Përfshini hashtag-e ose llogari specifike në prompt-in tuaj për të drejtuar kërkimin në kohë reale në X të modelit.

Kaloni në Heavy Mode

Aktivizoni Grok-4 Heavy për detyrat ku saktësia është më kritike se shpejtësia e përgjigjes.

Ofroni persona të detajuar

Përfitoni nga alinjamenti i sigurisë më lejues duke përcaktuar persona specifikë dhe provokues për shkrim kreativ.

Analizoni lidhjet e jashtme

Ngjisni URL-të e gjalla direkt në chat që modeli të marrë dhe të përmbledhë përmbajtje të freskët nga uebi.

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Pyetjet e bera shpesh rreth Grok-4

Gjej pergjigje per pyetjet e zakonshme rreth Grok-4