xai

Grok-4

Grok-4 från xAI är en frontier model med ett context window på 2M tokens, realtidsintegration med X-plattformen och reasoning-kapacitet i världsklass.

xai logoxaiGrokJuly 9, 2025
Kontext
2.0Mtokens
Max utdata
8Ktokens
Inmatningspris
$3.00/ 1M
Utdatapris
$15.00/ 1M
Modalitet:TextImage
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
87.5%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Grok-4 fick 87.5% pa detta benchmark.
HLE
44.4%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Grok-4 fick 44.4% pa detta benchmark.
MMLU
94%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Grok-4 fick 94% pa detta benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Grok-4 fick 81.2% pa detta benchmark.
SimpleQA
48%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Grok-4 fick 48% pa detta benchmark.
IFEval
89.2%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Grok-4 fick 89.2% pa detta benchmark.
AIME 2025
100%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Grok-4 fick 100% pa detta benchmark.
MATH
92%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Grok-4 fick 92% pa detta benchmark.
GSM8k
98.4%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Grok-4 fick 98.4% pa detta benchmark.
MGSM
92.1%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Grok-4 fick 92.1% pa detta benchmark.
MathVista
72.4%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Grok-4 fick 72.4% pa detta benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Grok-4 fick 81% pa detta benchmark.
HumanEval
88%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Grok-4 fick 88% pa detta benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Grok-4 fick 79.4% pa detta benchmark.
MMMU
75%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Grok-4 fick 75% pa detta benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Grok-4 fick 59.2% pa detta benchmark.
ChartQA
90.5%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Grok-4 fick 90.5% pa detta benchmark.
DocVQA
93.2%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Grok-4 fick 93.2% pa detta benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Grok-4 fick 54.2% pa detta benchmark.
ARC-AGI
15.9%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Grok-4 fick 15.9% pa detta benchmark.

Om Grok-4

Lar dig om Grok-4s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Översikt

Grok-4 är den senaste frontier-AI-modellen från xAI, designad för att vara en sanningssökande assistent med realtidsåtkomst till X-plattformen. Byggd på Colossus-superdatorn med över 200 000 GPUs, representerar den ett massivt språng inom reasoning, matematisk problemlösning och kodning. Den har en enhetlig dual-mode-arkitektur som låter användare växla mellan ett djuptänkande reasoning-läge för komplexa problem och ett högfrekvent läge för omedelbara svar.

Tekniska innovationer

Detta generationssprång i beräkningskraft har möjliggjort prestanda på doktorandnivå inom alla akademiska discipliner samtidigt. Modellen karaktäriseras unikt av sin anti-woke-strategi, som prioriterar objektiv information framför standardiserade säkerhetsfilter. Dess massiva context window på 2 miljoner tokens och integration i Musk-ekosystemet, inklusive X och Tesla-fordon, ger en distinkt konkurrensfördel. Medan den briljerar inom STEM och teknisk reasoning, förblir den högeffektiv för vardagliga kreativa uppgifter och nyhetsanalys i realtid.

Prestandafilosofi

Grok-4 prioriterar first-principles thinking och objektiv datasyntes. Genom att använda reasoning-motorn Quasarflux kan den navigera genom logiska kedjor i flera steg som vanligtvis får traditionella LLM-modeller att spåra ur. Detta gör den till ett oumbärligt verktyg för utvecklare och forskare som kräver högkvalitativ output i miljöer där faktamässig noggrannhet är avgörande.

Grok-4

Anvandningsfall for Grok-4

Upptack de olika satten du kan anvanda Grok-4 for att uppna fantastiska resultat.

STEM-forskning på forskarnivå

Använder Thinking-läget för att lösa fysikproblem på doktorandnivå och verifiera komplexa matematiska bevis.

Debugging av massiva kodbaser

Utnyttjar ett context window på 2 miljoner tokens för att läsa in hela kodbaser och identifiera subtila race conditions.

Finansiell intelligens i realtid

Övervakar X Firehose för att analysera marknadssentiment och senaste nytt för trading-insikter.

Agentic-arbetsflöden

Driver komplexa agentic-uppgifter genom robust function calling för logistik och automatisering.

Multimodal juridisk analys

Granskar tusentals sidor av bevismaterial samtidigt som skannade bevisfoton analyseras.

Avancerad akademisk handledning

Erbjuder personlig handledning baserad på first-principles inom STEM-ämnen, anpassad efter studentens framsteg.

Styrkor

Begransningar

Oöverträffad matematik och logik: Uppnådde ett världsrekord på 100 % på AIME 2025, vilket gör den till det främsta valet för tekniska uppgifter.
Ojämn grundläggande logik: Trots toppresultat på avancerade prov kan modellen ibland misslyckas med triviala uppgifter som att räkna bokstäver i ett ord.
Marknadsledande context: Det 2 miljoner tokens stora fönstret tillåter analys av ungefär 1 500 sidor text i en enda prompt.
Hög instegströskel: Tillgång till den fullständiga Grok-4 Heavy-modellen och reasoning-funktioner kräver en premiumprenumeration.
Live-datapipeline: Exklusiv åtkomst till X-plattformens realtidsström säkerställer att svaren är uppdaterade kring globala händelser.
Bristande kreativ fingertoppskänsla: Den ligger efter Claude 4.5 inom kreativt berättande och antar ofta en mer utilitaristisk eller kaxig ton.
Emotionell intelligens: Hög prestanda i EQ-Bench3 tyder på en överlägsen förmåga att förstå nyanserade mänskliga känslor.
Inkonsekvent bildgenerering: Interna verktyg kämpar med att bibehålla visuell konsistens över flera paneler.

API snabbstart

xai/grok-4

Visa dokumentation
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Grok-4

Se vad communityt tycker om Grok-4

"Grok 4 läxar officiellt upp konkurrenterna... bevisar att xAI har byggt en model som tänker som ett rovdjur."
Mario Nawfal
x/twitter
"Grok 4 är ett benchmark-slaktande geni på PhD-nivå som emellanåt inte kan räkna. Dualiteten är vild."
Beginning-Willow-801
reddit
"Hoppet till 2 miljoner tokens är inte bara ett jippo; det förändrar i grunden debugging av kodbaser."
AI Tech Reviews
youtube
"Grok 4 är tydligt den bästa modellen när det gäller allmän förståelse, långt före GPT-5."
YMist_
reddit
"Användningen kommer att peaka med Grok 4.20. Den släpps om 3 eller 4 veckor."
Elon Musk
x/twitter
"Den realtidsintegrerade X-kopplingen är det enda som håller min forskning relevant i det här nyhetsflödet."
DataScientist_Alpha
hackernews

Videor om Grok-4

Se handledningar, recensioner och diskussioner om Grok-4

Antalet ord i det här svaret är exakt 43... Superimponerande.

Den lyckades inte bara lösa Tower of Hanoi i sin chain-of-thought, utan den faktiskt bevisade det och visualiserade det med kod.

Jag älskar det här svaret. Rakt på sak, direkt. Ingen försköning alls.

Reasoning-kapaciteten här är tydligt ett steg över vad vi såg i förra generationen.

Det är äntligen en model som inte känns som att den håller tillbaka sanningen för att vara artig.

Den experimentella thinking-switchen för Grok togs nyligen bort... vilket leder till att den karakteriseras som potentiellt föråldrad.

Grok OS var det minst imponerande, med en enkel vit bakgrund och trasiga ikoner.

När det gäller ren kunskapsinhämtning träffar Grok-4 konsekvent rätt där GPT-5 missar.

Latency i reasoning-läget är högre, men kvaliteten på outputen rättfärdigar väntan.

Om du befinner dig i Musk-ekosystemet är integrationen här en massiv produktivitetsmultiplikator.

Ingen vill ha en supersnabb model om den inte kan lösa logiken. Det kan jag säga er helt gratis, grabbar.

Jag skulle ge detta minus ett av 10... Totalt skräp. Kan inte ens bygga en enkel Next.js-webbplats.

Snabbheten finns där, men om logiken är trasig, vad är då poängen med tokens per sekund?

Det känns som att de stressade fram coder-varianten bara för att hinna med lanseringscykeln.

Håll dig till standard-reasoning-modellen om du faktiskt vill ha något som fungerar.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden
Se demo

Proffs-tips for Grok-4

Experttips for att hjalpa dig fa ut det mesta av Grok-4 och uppna battre resultat.

Växla mellan lägen

Använd Quasarflux-läge för komplex logik och Tensor-läge för hastighet för att optimera kostnad och prestanda.

Realtidsfrågor

Ge explicita prompts om trendande ämnen på X för att dra nytta av live-datapipelinen och kringgå träningsdata-gränser.

STEM-fokus

Prioritera Grok för matematik på avancerad nivå där den presterar avsevärt bättre än konkurrenter på zero-shot-uppgifter.

Verifiera grundläggande logik

Dubbelkolla enkel räkning eller listordning då modellen kan vara inkonsekvent vid triviala uppgifter.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Vanliga fragor om Grok-4

Hitta svar pa vanliga fragor om Grok-4