xai

Grok-4

Grok-4 od xAI je frontier model disponující 2M token context window, integrací platformy X v reálném čase a světově rekordními schopnostmi v oblasti reasoning.

xai logoxaiGrok9. července 2025
Kontext
2.0Mtokenu
Max vystup
8Ktokenu
Cena vstupu
$3.00/ 1M
Cena vystupu
$15.00/ 1M
Modalita:TextImage
Schopnosti:VideniNastrojeStreamingUvazovani
Benchmarky
GPQA
87.5%
GPQA: Vedecke otazky postgradualni urovne. Prisnybenchmark s 448 otazkami z biologie, fyziky a chemie. PhD experti dosahuji pouze 65-74% presnosti. Grok-4 ziskal 87.5% v tomto benchmarku.
HLE
44.4%
HLE: Uvazovani na expertni urovni. Testuje schopnost modelu demonstrovat uvazovani na expertni urovni ve specializovanych oblastech. Grok-4 ziskal 44.4% v tomto benchmarku.
MMLU
94%
MMLU: Masivni viceulohove porozumeni jazyku. Komplexni benchmark s 16 000 otazkami z 57 akademickych predmetu. Grok-4 ziskal 94% v tomto benchmarku.
MMLU Pro
81.2%
MMLU Pro: MMLU Profesionalni edice. Vylepsena verze MMLU s 12 032 otazkami a tezsim 10-moznostnim formatem. Grok-4 ziskal 81.2% v tomto benchmarku.
SimpleQA
48%
SimpleQA: Benchmark fakticke presnosti. Testuje schopnost modelu poskytnout presne, fakticke odpovedi. Grok-4 ziskal 48% v tomto benchmarku.
IFEval
89.2%
IFEval: Hodnoceni dodrzovani instrukci. Meri, jak dobre model dodrzuje specificke instrukce a omezeni. Grok-4 ziskal 89.2% v tomto benchmarku.
AIME 2025
100%
AIME 2025: Americka pozvanecka matematicka zkouska. Matematicke ulohy na soutezni urovni z prestizni zkousky AIME. Grok-4 ziskal 100% v tomto benchmarku.
MATH
92%
MATH: Reseni matematickych problemu. Komplexni matematicky benchmark testujici reseni problemu v algebre, geometrii, kalkulu. Grok-4 ziskal 92% v tomto benchmarku.
GSM8k
98.4%
GSM8k: Matematika zakladni skoly 8K. 8 500 matematickych slovnich uloh urovne zakladni skoly. Grok-4 ziskal 98.4% v tomto benchmarku.
MGSM
92.1%
MGSM: Vicejazycna matematika zakladni skoly. Benchmark GSM8k prelozeny do 10 jazyku. Grok-4 ziskal 92.1% v tomto benchmarku.
MathVista
72.4%
MathVista: Matematicke vizualni uvazovani. Testuje schopnost resit matematicke problemy s vizualnimi prvky. Grok-4 ziskal 72.4% v tomto benchmarku.
SWE-Bench
81%
SWE-Bench: Benchmark softwaroveho inzenyrstvi. AI modely se pokousi resit skutecne problemy GitHub v Python projektech. Grok-4 ziskal 81% v tomto benchmarku.
HumanEval
88%
HumanEval: Programovaci ulohy v Pythonu. 164 programovacich uloh, kde modely musi generovat spravne implementace Python funkci. Grok-4 ziskal 88% v tomto benchmarku.
LiveCodeBench
79.4%
LiveCodeBench: Zive programovaci benchmark. Testuje programovaci schopnosti na neustale aktualizovanych, skutecnych programovacich vyzvan. Grok-4 ziskal 79.4% v tomto benchmarku.
MMMU
75%
MMMU: Multimodalni porozumeni. Multimodalni benchmark porozumeni z 30 univerzitnich predmetu. Grok-4 ziskal 75% v tomto benchmarku.
MMMU Pro
59.2%
MMMU Pro: MMMU Profesionalni edice. Vylepsena verze MMMU s narocnejsimi otazkami. Grok-4 ziskal 59.2% v tomto benchmarku.
ChartQA
90.5%
ChartQA: Otazky a odpovedi o grafech. Testuje schopnost porozumet a analyzovat informace z grafu a diagramu. Grok-4 ziskal 90.5% v tomto benchmarku.
DocVQA
93.2%
DocVQA: Vizualni otazky o dokumentech. Testuje schopnost extrahovat informace z obrazku dokumentu. Grok-4 ziskal 93.2% v tomto benchmarku.
Terminal-Bench
54.2%
Terminal-Bench: Ulohy terminal/CLI. Testuje schopnost provadet operace prikazoveho radku. Grok-4 ziskal 54.2% v tomto benchmarku.
ARC-AGI
15.9%
ARC-AGI: Abstrakce a uvazovani. Testuje fluidni inteligenci prostrednictvim novych hadanek rozpoznavani vzoru. Grok-4 ziskal 15.9% v tomto benchmarku.

O Grok-4

Zjistete o schopnostech Grok-4, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Přehled

Grok-4 je nejnovější frontier AI model od xAI, navržený jako asistent hledající pravdu s přístupem k platformě X v reálném čase. Postaven na superpočítačovém clusteru Colossus s více než 200 000 GPU, představuje masivní skok v reasoning, řešení matematických problémů a kódování. Disponuje sjednocenou duální architekturou, která uživatelům umožňuje přepínat mezi režimem hlubokého reasoning pro složité hádanky a vysokorychlostním režimem pro okamžité odpovědi.

Technické inovace

Tento generační skok ve výpočetním výkonu umožnil dosáhnout výkonu na úrovni PhD napříč všemi akademickými disciplínami současně. Model je unikátní svou strategií ladění, která upřednostňuje objektivní informace před standardními bezpečnostními omezeními. Jeho masivní 2milionový context window a integrace do ekosystému Muska, včetně X a vozů Tesla, vytváří výraznou konkurenční výhodu. Zatímco exceluje v STEM a technickém reasoning, zůstává vysoce efektivní i pro každodenní kreativní úkoly a analýzu zpráv v reálném čase.

Filozofie výkonu

Grok-4 upřednostňuje uvažování z prvotních principů a syntézu objektivních dat. Díky využití reasoning engine Quasarflux dokáže procházet vícekrokové logické řetězce, které obvykle tradiční LLM nezvládnou. To z něj činí nezbytný nástroj pro vývojáře a výzkumníky, kteří vyžadují vysoce věrné výstupy v kritických prostředích, kde je věcná přesnost nesmlouvavým požadavkem.

Grok-4

Pripady pouziti pro Grok-4

Objevte ruzne zpusoby, jak muzete pouzit Grok-4 pro dosazeni skvelych vysledku.

STEM výzkum na postgraduální úrovni

Využití Thinking mode k řešení fyzikálních problémů na úrovni PhD a ověřování komplexních matematických důkazů.

Debugging masivních repozitářů

Využití 2M context window pro načtení celých codebase a identifikaci subtilních race conditions.

Finanční analýza v reálném čase

Monitorování X Firehose k analýze tržního sentimentu a aktuálních zpráv pro obchodní rozhodování.

Agentic pracovní postupy

Pohánění komplexních agentic úloh prostřednictvím robustního function calling pro logistiku a automatizaci.

Multimodální právní analýza

Revize tisíců stran dokumentů při současné analýze naskenovaných důkazních fotografií.

Pokročilé akademické doučování

Poskytování personalizovaného doučování v STEM předmětech založeného na prvotních principech, přizpůsobeného pokroku studenta.

Silne stranky

Omezeni

Bezkonkurenční matematika a logika: Dosáhl světového rekordu se 100% skóre v AIME 2025, což z něj činí špičkovou volbu pro technické úkoly.
Kolísavá základní logika: Přestože exceluje v postgraduálních zkouškách, model může občas selhat v triviálních úlohách, jako je počítání písmen ve slově.
Špičkový context na trhu: 2milionový context window umožňuje analýzu zhruba 1 500 stran textu v jediném promptu.
Vysoká bariéra vstupu: Přístup k plnému výkonu modelu Grok-4 Heavy a schopnostem reasoning vyžaduje prémiové předplatné.
Live datový kanál: Exkluzivní přístup k datovému streamu platformy X v reálném čase zajišťuje, že odpovědi jsou aktuální vzhledem ke světovému dění.
Mezery v kreativních nuancích: Zaostává za Claude 4.5 v kreativním vyprávění, často používá spíše utilitární nebo provokativní tón.
Emoční inteligence: Vysoký výkon v EQ-Bench3 naznačuje vynikající schopnost porozumět nuancím lidských emocí.
Konzistence generování obrázků: Interní nástroje mají potíže s udržením vizuální konzistence napříč více panely.

Rychly start API

xai/grok-4

Zobrazit dokumentaci
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o Grok-4

Podivejte se, co si komunita mysli o Grok-4

"Grok 4 oficiálně školí konkurenci... dokazuje, že xAI postavila model, který myslí jako predátor."
Mario Nawfal
x/twitter
"Grok 4 je genius na úrovni PhD ničící benchmarky, který občas neumí počítat. Ta dualita je divoká."
Beginning-Willow-801
reddit
"Skok na 2 miliony tokens není jen trik; zásadně mění debugging repozitářů."
AI Tech Reviews
youtube
"Grok 4 je jasně nejlepší model z hlediska obecného pochopení, daleko před GPT-5."
YMist_
reddit
"Využití prudce vzroste s Grok 4.20. Vyjde za 3 nebo 4 týdny."
Elon Musk
x/twitter
"Integrace X v reálném čase je jediná věc, díky které zůstává můj výzkum v tomto zpravodajském cyklu relevantní."
DataScientist_Alpha
hackernews

Videa o Grok-4

Sledujte navody, recenze a diskuse o Grok-4

Počet slov v této odpovědi je přesně 43... Velmi působivé.

Nejenže dokázal vyřešit Hanojskou věž ve svém chain-of-thought, ale skutečně to dokázal a vizualizoval pomocí kódu.

Tahle odpověď se mi líbí. K věci, přímá. Žádné zbytečné příkrasy.

Schopnosti reasoning jsou zde jasně o úroveň výš, než co jsme viděli u předchozí generace.

Konečně je to model, u kterého nemám pocit, že by zatajoval pravdu, aby byl zdvořilý.

Experimentální přepínač pro thinking u Grok byl nedávno odstraněn... což vede k označení za potenciálně zastaralý.

Grok OS byl nejméně působivý, s jednoduchým bílým pozadím a rozbitými ikonami.

Pokud jde o surové vyhledávání informací, Grok-4 konzistentně trefuje cíl tam, kde GPT-5 chybuje.

Latency v režimu reasoning je vyšší, ale kvalita výstupu to čekání ospravedlňuje.

Pokud se pohybujete v ekosystému Muska, je zdejší integrace masivním multiplikátorem produktivity.

Nikdo nechce super rychlý model, pokud neumí vyřešit logiku. To vám můžu říct na rovinu, hoši.

Dal bych tomu mínus jedna z deseti... Totální odpad. Nedokáže postavit ani jednoduchý Next.js web.

Rychlost tu je, ale pokud je logika rozbitá, jaký má smysl počet tokens za sekundu?

Působí to, jako by vývojářskou variantu uspěchali jen proto, aby stihli termín vydání.

Zůstaňte u standardního reasoning modelu, pokud skutečně chcete něco, co funguje.

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow
Sledovat demo

Profesionalni tipy pro Grok-4

Expertni tipy, ktere vam pomohou ziskat maximum z Grok-4 a dosahnout lepsich vysledku.

Přepínání režimů

Používejte režim Quasarflux pro komplexní logiku a režim Tensor pro rychlost, abyste optimalizovali náklady a výkon.

Dotazy v reálném čase

Výslovně promptujte trendy témata na X, abyste využili live datový kanál a obešli tréninkové limity.

Zaměření na STEM

Upřednostněte Grok pro matematiku na úrovni postgraduálního studia, kde výrazně překonává konkurenty v zero-shot úlohách.

Ověřte základní logiku

Překontrolujte jednoduché počítání nebo řazení seznamů, protože model může být v triviálních úlohách nekonzistentní.

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Casto kladene dotazy o Grok-4

Najdete odpovedi na bezne otazky o Grok-4