xai

Grok-4

Grok-4 van xAI is een frontier model met een 2M token context window, real-time integratie met het X-platform en wereldrecord-reasoning-capaciteiten.

xai logoxaiGrok9 juli 2025
Context
2.0Mtokens
Max output
8Ktokens
Invoerprijs
$3.00/ 1M
Uitvoerprijs
$15.00/ 1M
Modaliteit:TextImage
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
87.5%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Grok-4 scoorde 87.5% op deze benchmark.
HLE
44.4%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Grok-4 scoorde 44.4% op deze benchmark.
MMLU
94%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Grok-4 scoorde 94% op deze benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Grok-4 scoorde 81.2% op deze benchmark.
SimpleQA
48%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Grok-4 scoorde 48% op deze benchmark.
IFEval
89.2%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Grok-4 scoorde 89.2% op deze benchmark.
AIME 2025
100%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Grok-4 scoorde 100% op deze benchmark.
MATH
92%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Grok-4 scoorde 92% op deze benchmark.
GSM8k
98.4%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Grok-4 scoorde 98.4% op deze benchmark.
MGSM
92.1%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Grok-4 scoorde 92.1% op deze benchmark.
MathVista
72.4%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Grok-4 scoorde 72.4% op deze benchmark.
SWE-Bench
81%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Grok-4 scoorde 81% op deze benchmark.
HumanEval
88%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Grok-4 scoorde 88% op deze benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Grok-4 scoorde 79.4% op deze benchmark.
MMMU
75%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Grok-4 scoorde 75% op deze benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Grok-4 scoorde 59.2% op deze benchmark.
ChartQA
90.5%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Grok-4 scoorde 90.5% op deze benchmark.
DocVQA
93.2%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Grok-4 scoorde 93.2% op deze benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Grok-4 scoorde 54.2% op deze benchmark.
ARC-AGI
15.9%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Grok-4 scoorde 15.9% op deze benchmark.

Over Grok-4

Leer over de mogelijkheden van Grok-4, functies en hoe het je kan helpen betere resultaten te behalen.

Modeloverzicht

Grok-4 is het frontier multimodal model van xAI. Het is gebouwd om reasoning vanuit eerste principes en real-time informatie-opvraging prioriteit te geven. Het model wint een aanzienlijk concurrentievoordeel door zijn native integratie met het X social mediaplatform. Dit stelt het in staat om live wereldwijde gesprekken en nieuws te analyseren zodra ze gebeuren. Het maakt gebruik van de Colossus supercomputer voor training, wat resulteert in topprestaties in wiskundige en technische domeinen.

Technische capaciteiten

De architectuur ondersteunt een 2-miljoen-token context window in zijn reasoning-varianten. Deze capaciteit maakt de verwerking van enorme codebases en uitgebreide technische documentatie mogelijk zonder dataverlies. Het beschikt over een duaal modesysteem waarbij gebruikers kiezen tussen een high-velocity modus voor snelle interacties en een deep-thinking modus voor logische taken in meerdere stappen. Het model beheert een hallucinatiepercentage van ongeveer 4% door een consensusmechanisme met meerdere agents in te zetten in de Heavy-configuratie.

Ecosysteem-integratie

Naast eenvoudige tekstgeneratie is Grok-4 ontworpen voor native tool use en complexe function calling. Het ondersteunt beeld- en audioverwerking, waardoor het een veelzijdige keuze is voor ontwikkelaars die multimodale applicaties bouwen. De alignment-strategie richt zich op objectieve waarheidsvinding in plaats van standaard industriële veiligheidskaders. Dit resulteert in minder weigeringen voor controversiële of scherpe onderwerpen in vergelijking met andere frontier modellen.

Grok-4

Gebruikscases voor Grok-4

Ontdek de verschillende manieren waarop je Grok-4 kunt gebruiken voor geweldige resultaten.

Real-time sentimentanalyse

Analyseert live berichten op X om de publieke reactie op het laatste nieuws of productlanceringen te bepalen.

Auditing van grote repositories

Evalueert volledige software repositories met behulp van de 2M token context window om architecturale gebreken te vinden.

Wiskundig oplossend vermogen op Olympiade-niveau

Biedt stapsgewijze oplossingen voor complexe wiskundige bewijzen en AIME-niveau problemen.

Ongefilterde creatieve content

Genereert scripts en humor met sterke karakters, zonder de beperkende filters van andere AI-aanbieders.

Synthese van wetenschappelijk onderzoek

Vat meerdere academische papers op PhD-niveau gelijktijdig samen met behoud van technische nauwkeurigheid.

Technische debugging

Identificeert obscure bugs in productiecode en stelt oplossingen voor op basis van de huidige best practices.

Sterke punten

Beperkingen

Superieure wiskundige reasoning: Behaalde een perfecte 100% op de AIME 2025 benchmark, waarmee het de meeste frontier modellen in logica overtreft.
Latency bij Heavy Mode: De multi-agent reasoning-modus kan enkele minuten duren om één uiterst nauwkeurig antwoord te genereren.
Toonaangevende context: De 2M token window zorgt voor ongekende diepgang bij documentanalyse en grootschalige softwareprojecten.
Onvolledige video-ondersteuning: Hoewel tekst- en afbeeldingsmogelijkheden van topniveau zijn, is native frame-voor-frame videoverwerking nog niet beschikbaar.
Live sociale intelligentie: Directe toegang tot het X-platform biedt real-time informatie die statische trainingsdata niet kan evenaren.
Beperkte regionale toegang: Functies voor persistent memory zijn momenteel uitgeschakeld in de Europese Unie vanwege wettelijke vereisten.
Laag weigeringspercentage: Een soepelere safety-architectuur staat eerlijke, objectieve dialogen over controversiële onderwerpen toe.
Beperkingen in precisie bij vision: De makers erkennen dat het model deels 'blind' blijft bij het interpreteren van uiterst gedetailleerde visuele details.

API snelstart

xai/grok-4

Bekijk documentatie
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Grok-4

Bekijk wat de community denkt over Grok-4

Grok 4 fast heeft een 2M token window!!! Ik weet echt niet meer waarom we zo worstelden en genoegen namen met ChatGPT.
myfuturewifee
reddit
15,88% op de ARC-AGI v2 private subset is waanzinnig. Grok 4 is het eerste model dat die 10%-barrière in maanden doorbreekt.
Greg (ARC-AGI Lead)
twitter
De multi-agent studiegroep-aanpak in Grok 4 Heavy is de juiste manier om test-time compute te gebruiken. Het vindt daadwerkelijk de truc van het probleem.
Tony_xAI
twitter
Grok 4: 79 op LiveCodeBench... benchmarks vertellen je niet hoe het voelt om te coderen met een model, maar dit voelt betrouwbaar.
thankzr3ddit
reddit
Het model is post-graduaat, dus PhD-niveau in alles. Het is eng slim en leert sneller dan een mens ooit kan.
Elon Musk
youtube
Het real-time zoeken is niet zomaar headlines scrapen; het analyseert content over meerdere bronnen heen.
BitBiasedAI
youtube

Video's over Grok-4

Bekijk tutorials, reviews en discussies over Grok-4

Grok 4 heavy is voor intensievere logica- en reasoning-taken, terwijl de normale Grok 4 de rest afhandelt.

Het volgde mijn hand en vingers volledig nauwkeurig om op het scherm te tekenen.

Grok 4 vond het wachtwoord dat ik diep in de context window had verstopt na slechts 15 seconden denktijd.

De nauwkeurigheid op de 2 miljoen token 'naald in de hooiberg'-test was 100%.

Dit model is eindelijk een echt alternatief voor wie de context window van Gemini onbetrouwbaar vond.

Grok 4 is post-graduaat, dus PhD-niveau in alles, beter dan de meeste PhD's.

Grok 4 Heavy spawnt meerdere agents parallel... het is als een studiegroep.

Het zit op de API en heeft een 256k contact length, met plannen voor veel meer.

De training op het Colossus-cluster heeft het een reasoning-vermogen gegeven dat we nog niet eerder hebben gezien.

Het is ontworpen om de meest naar waarheid zoekende AI te zijn die er momenteel bestaat.

Grok 4 Heavy draait tot 32 parallelle AI-modellen op je enkele prompt.

Het real-time zoeken is niet zomaar headlines scrapen; het analyseert content over meerdere bronnen heen.

Think Mode besteedt extra computationele tijd aan het plannen en opvangen van potentiële fouten voordat het antwoordt.

Je kunt de agents daadwerkelijk met elkaar zien debatteren in de logs als je API-toegang hebt.

De multimodale prestaties met audio zijn merkbaar sneller dan de vorige generatie.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Grok-4

Experttips om je te helpen het maximale uit Grok-4 te halen en betere resultaten te behalen.

Gebruik zoekwoorden

Voeg specifieke hashtags of accounts toe aan je prompt om de real-time X-zoekopdracht van het model aan te sturen.

Schakel over naar Heavy Mode

Activeer Grok-4 Heavy voor taken waarbij nauwkeurigheid belangrijker is dan de reactiesnelheid.

Geef gedetailleerde persona's op

Maak gebruik van de toegankelijkere safety alignment door specifieke, gedurfde persona's te definiëren voor creatief schrijven.

Analyseer externe links

Plak live URL's direct in de chat zodat het model verse webcontent kan ophalen en samenvatten.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Veelgestelde vragen over Grok-4

Vind antwoorden op veelvoorkomende vragen over Grok-4