xai

Grok-4

Grok-4 van xAI is een frontier model met een 2M token context window, real-time X-platformintegratie en wereldrecordbrekende reasoning-capaciteiten.

xai logoxaiGrok9 juli 2025
Context
2.0Mtokens
Max output
8Ktokens
Invoerprijs
$3.00/ 1M
Uitvoerprijs
$15.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
87.5%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Grok-4 scoorde 87.5% op deze benchmark.
HLE
44.4%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Grok-4 scoorde 44.4% op deze benchmark.
MMLU
94%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Grok-4 scoorde 94% op deze benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Grok-4 scoorde 81.2% op deze benchmark.
SimpleQA
48%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Grok-4 scoorde 48% op deze benchmark.
IFEval
89.2%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Grok-4 scoorde 89.2% op deze benchmark.
AIME 2025
100%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Grok-4 scoorde 100% op deze benchmark.
MATH
92%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Grok-4 scoorde 92% op deze benchmark.
GSM8k
98.4%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Grok-4 scoorde 98.4% op deze benchmark.
MGSM
92.1%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Grok-4 scoorde 92.1% op deze benchmark.
MathVista
72.4%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Grok-4 scoorde 72.4% op deze benchmark.
SWE-Bench
81%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Grok-4 scoorde 81% op deze benchmark.
HumanEval
88%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Grok-4 scoorde 88% op deze benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Grok-4 scoorde 79.4% op deze benchmark.
MMMU
75%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Grok-4 scoorde 75% op deze benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Grok-4 scoorde 59.2% op deze benchmark.
ChartQA
90.5%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Grok-4 scoorde 90.5% op deze benchmark.
DocVQA
93.2%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Grok-4 scoorde 93.2% op deze benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Grok-4 scoorde 54.2% op deze benchmark.
ARC-AGI
15.9%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Grok-4 scoorde 15.9% op deze benchmark.

Over Grok-4

Leer over de mogelijkheden van Grok-4, functies en hoe het je kan helpen betere resultaten te behalen.

Overzicht

Grok-4 is het nieuwste frontier model van xAI, ontworpen als een waarheidszoekende assistent met real-time toegang tot het X-platform. Gebouwd op het Colossus-supercomputercluster met meer dan 200.000 GPUs, vertegenwoordigt het een enorme sprong in reasoning, wiskundige probleemoplossing en programmeervaardigheden. Het beschikt over een geünificeerde dual-mode architectuur, waardoor gebruikers kunnen schakelen tussen een deep-thinking reasoning-modus voor complexe puzzels en een high-velocity modus voor onmiddellijke antwoorden.

Technische Innovaties

Deze generationele sprong in rekenkracht heeft PhD-niveau performance mogelijk gemaakt in alle academische disciplines tegelijkertijd. De model kenmerkt zich uniek door zijn anti-woke alignment-strategie, waarbij objectieve informatie prioriteit krijgt boven standaard veiligheidsbeperkingen. De enorme context window van 2 miljoen tokens en de integratie in het Musk-ecosysteem, inclusief X en Tesla-voertuigen, bieden een duidelijk concurrentievoordeel. Hoewel het uitblinkt in STEM en technische reasoning, blijft het zeer efficiënt voor dagelijkse creatieve taken en real-time nieuwsanalyse.

Performance-filosofie

Grok-4 geeft prioriteit aan first-principles denken en objectieve datasynthese. Door gebruik te maken van de Quasarflux reasoning engine kan het navigeren door logische ketens van meerdere stappen die traditionele LLMs meestal laten ontsporen. Dit maakt het een essentieel instrument voor developers en onderzoekers die high-fidelity outputs nodig hebben in omgevingen waar feitelijke nauwkeurigheid ononderhandelbaar is.

Grok-4

Gebruikscases voor Grok-4

Ontdek de verschillende manieren waarop je Grok-4 kunt gebruiken voor geweldige resultaten.

STEM-onderzoek op academisch niveau

De reasoning-modus gebruiken om natuurkundeproblemen op PhD-niveau op te lossen en complexe wiskundige bewijzen te verifiëren.

Debugging van enorme repositories

De 2M context window benutten om volledige codebases in te voeren en subtiele race conditions te identificeren.

Real-time financiële intelligentie

De X Firehose monitoren om marktsentiment en het laatste nieuws te analyseren voor inzichten in de handel.

Autonomous agent workflows

Complexe agentic taken aansturen via robuuste function calling voor logistiek en automatisering.

Multimodale juridische analyse

Duizenden pagina's aan bewijsstukken doornemen terwijl gescande bewijsfoto's worden geanalyseerd.

Geavanceerde academische begeleiding

Gepersonaliseerde tutoring op basis van first-principles in STEM-vakken, aangepast aan de voortgang van de student.

Sterke punten

Beperkingen

Ongeëvenaarde wiskunde en logica: Behaalde een wereldrecordscore van 100% op de AIME 2025, wat het de eerste keuze maakt voor technische taken.
Wisselvallige basislogica: Ondanks het behalen van academische examens kan de model af en toe falen bij triviale taken zoals het tellen van letters in een woord.
Marktleidende context: De context window van 2 miljoen tokens maakt de analyse van ongeveer 1.500 pagina's tekst in één prompt mogelijk.
Hoge instapdrempel: Toegang tot de volledige kracht van het Grok-4 Heavy-model en de reasoning-mogelijkheden vereist een premium abonnement.
Live datapijplijn: Exclusieve toegang tot de real-time datastream van het X-platform zorgt ervoor dat antwoorden actueel zijn over wereldwijde gebeurtenissen.
Tekortkomingen in creatieve nuance: Loopt achter op Claude 4.5 in creatieve storytelling en hanteert vaak een meer utilitaire of scherpe toon.
Emotionele intelligentie: Hoge performance op EQ-Bench3 duidt op een superieur vermogen om genuanceerde menselijke emoties te begrijpen.
Inconsistentie in beeldgeneratie: Interne tools hebben moeite met het handhaven van visuele consistentie over meerdere panels.

API snelstart

xai/grok-4

Bekijk documentatie
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Grok-4

Bekijk wat de community denkt over Grok-4

"Grok 4 geeft de concurrentie officieel les... het bewijst dat xAI een model heeft gebouwd dat denkt als een roofdier."
Mario Nawfal
x/twitter
"Grok 4 is een benchmark-verslindend genie op PhD-niveau dat af en toe niet kan tellen. De dualiteit is bizar."
Beginning-Willow-801
reddit
"De sprong naar 2 miljoen tokens is niet zomaar een gimmick; het verandert fundamenteel de manier waarop we repositories debuggen."
AI Tech Reviews
youtube
"Grok 4 is duidelijk het beste model qua algemeen begrip, ver voor op GPT-5."
YMist_
reddit
"Het gebruik zal pieken met Grok 4.20. Het komt over 3 of 4 weken uit."
Elon Musk
x/twitter
"De real-time X-integratie is het enige dat mijn onderzoek relevant houdt in deze nieuwscyclus."
DataScientist_Alpha
hackernews

Video's over Grok-4

Bekijk tutorials, reviews en discussies over Grok-4

Het aantal woorden in dit antwoord is precies 43... Super indrukwekkend.

Het was niet alleen in staat om de Toren van Hanoi op te lossen in de chain-of-thought, maar het bewees het ook echt en visualiseerde het met code.

Ik hou van dit antwoord. To the point, direct. Totaal geen doekjes eromheen winden.

De reasoning-capaciteiten zijn hier duidelijk een stap hoger dan wat we in de vorige generatie zagen.

Het is eindelijk een model dat niet het gevoel geeft dat het de waarheid achterhoudt om beleefd te zijn.

De experimentele thinking toggle voor Grok is onlangs verwijderd... wat leidde tot de typering als potentieel verouderd.

Grok OS was het minst indrukwekkend, met een basis witte achtergrond en kapotte iconen.

In termen van ruwe kennisreproductie raakt Grok-4 consequent de kern waar GPT-5 mist.

De latency in de reasoning-modus is hoger, maar de kwaliteit van de output rechtvaardigt het wachten.

Als je je in het Musk-ecosysteem bevindt, is de integratie hier een enorme productiviteitsversterker.

Niemand wil een supersnel model als het de logica niet kan oplossen. Dat kan ik je gratis vertellen, jongens.

Ik zou dit een min één van de 10 geven... Complete troep. Kan niet eens een simpele Next.js website bouwen.

De snelheid is er, maar als de logica kapot is, wat is dan het nut van de tokens per seconde?

Het voelt alsof ze de coder-variant hebben gehaast om de release-cyclus te halen.

Blijf bij het standaard reasoning model als je echt iets wilt dat werkt.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows
Bekijk demo

Pro-tips voor Grok-4

Experttips om je te helpen het maximale uit Grok-4 te halen en betere resultaten te behalen.

Schakelen tussen modi

Gebruik de Quasarflux-modus voor complexe logica en de Tensor-modus voor snelheid om kosten en performance te optimaliseren.

Real-time queries

Gebruik een expliciete prompt voor trending topics op X om de live datapijplijn te benutten en trainings-cutoffs te omzeilen.

STEM-focus

Geef de voorkeur aan Grok voor wiskunde op academisch niveau, waar het aanzienlijk beter presteert dan concurrenten op zero-shot taken.

Basislogica verifiëren

Controleer eenvoudige tellingen of lijstvolgordes dubbel, aangezien de model inconsistent kan zijn bij triviale taken.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Veelgestelde vragen over Grok-4

Vind antwoorden op veelvoorkomende vragen over Grok-4