xai

Grok-4

Grok-4 od xAI je frontier model s 2M token context window, integrací platformy X v reálném čase a světovými rekordy v reasoningu.

xai logoxaiGrok9. července 2025
Kontext
2.0Mtokenu
Max vystup
8Ktokenu
Cena vstupu
$3.00/ 1M
Cena vystupu
$15.00/ 1M
Modalita:TextImage
Schopnosti:VideniNastrojeStreamingUvazovani
Benchmarky
GPQA
87.5%
GPQA: Vedecke otazky postgradualni urovne. Prisnybenchmark s 448 otazkami z biologie, fyziky a chemie. PhD experti dosahuji pouze 65-74% presnosti. Grok-4 ziskal 87.5% v tomto benchmarku.
HLE
44.4%
HLE: Uvazovani na expertni urovni. Testuje schopnost modelu demonstrovat uvazovani na expertni urovni ve specializovanych oblastech. Grok-4 ziskal 44.4% v tomto benchmarku.
MMLU
94%
MMLU: Masivni viceulohove porozumeni jazyku. Komplexni benchmark s 16 000 otazkami z 57 akademickych predmetu. Grok-4 ziskal 94% v tomto benchmarku.
MMLU Pro
81.2%
MMLU Pro: MMLU Profesionalni edice. Vylepsena verze MMLU s 12 032 otazkami a tezsim 10-moznostnim formatem. Grok-4 ziskal 81.2% v tomto benchmarku.
SimpleQA
48%
SimpleQA: Benchmark fakticke presnosti. Testuje schopnost modelu poskytnout presne, fakticke odpovedi. Grok-4 ziskal 48% v tomto benchmarku.
IFEval
89.2%
IFEval: Hodnoceni dodrzovani instrukci. Meri, jak dobre model dodrzuje specificke instrukce a omezeni. Grok-4 ziskal 89.2% v tomto benchmarku.
AIME 2025
100%
AIME 2025: Americka pozvanecka matematicka zkouska. Matematicke ulohy na soutezni urovni z prestizni zkousky AIME. Grok-4 ziskal 100% v tomto benchmarku.
MATH
92%
MATH: Reseni matematickych problemu. Komplexni matematicky benchmark testujici reseni problemu v algebre, geometrii, kalkulu. Grok-4 ziskal 92% v tomto benchmarku.
GSM8k
98.4%
GSM8k: Matematika zakladni skoly 8K. 8 500 matematickych slovnich uloh urovne zakladni skoly. Grok-4 ziskal 98.4% v tomto benchmarku.
MGSM
92.1%
MGSM: Vicejazycna matematika zakladni skoly. Benchmark GSM8k prelozeny do 10 jazyku. Grok-4 ziskal 92.1% v tomto benchmarku.
MathVista
72.4%
MathVista: Matematicke vizualni uvazovani. Testuje schopnost resit matematicke problemy s vizualnimi prvky. Grok-4 ziskal 72.4% v tomto benchmarku.
SWE-Bench
81%
SWE-Bench: Benchmark softwaroveho inzenyrstvi. AI modely se pokousi resit skutecne problemy GitHub v Python projektech. Grok-4 ziskal 81% v tomto benchmarku.
HumanEval
88%
HumanEval: Programovaci ulohy v Pythonu. 164 programovacich uloh, kde modely musi generovat spravne implementace Python funkci. Grok-4 ziskal 88% v tomto benchmarku.
LiveCodeBench
79.4%
LiveCodeBench: Zive programovaci benchmark. Testuje programovaci schopnosti na neustale aktualizovanych, skutecnych programovacich vyzvan. Grok-4 ziskal 79.4% v tomto benchmarku.
MMMU
75%
MMMU: Multimodalni porozumeni. Multimodalni benchmark porozumeni z 30 univerzitnich predmetu. Grok-4 ziskal 75% v tomto benchmarku.
MMMU Pro
59.2%
MMMU Pro: MMMU Profesionalni edice. Vylepsena verze MMMU s narocnejsimi otazkami. Grok-4 ziskal 59.2% v tomto benchmarku.
ChartQA
90.5%
ChartQA: Otazky a odpovedi o grafech. Testuje schopnost porozumet a analyzovat informace z grafu a diagramu. Grok-4 ziskal 90.5% v tomto benchmarku.
DocVQA
93.2%
DocVQA: Vizualni otazky o dokumentech. Testuje schopnost extrahovat informace z obrazku dokumentu. Grok-4 ziskal 93.2% v tomto benchmarku.
Terminal-Bench
54.2%
Terminal-Bench: Ulohy terminal/CLI. Testuje schopnost provadet operace prikazoveho radku. Grok-4 ziskal 54.2% v tomto benchmarku.
ARC-AGI
15.9%
ARC-AGI: Abstrakce a uvazovani. Testuje fluidni inteligenci prostrednictvim novych hadanek rozpoznavani vzoru. Grok-4 ziskal 15.9% v tomto benchmarku.

O Grok-4

Zjistete o schopnostech Grok-4, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Přehled modelu

Grok-4 je frontier multimodal model od společnosti xAI. Je navržen tak, aby upřednostňoval reasoning založený na prvních principech a získávání informací v reálném čase. Model získává významnou konkurenční výhodu díky své nativní integraci s platformou X, což mu umožňuje analyzovat živé globální konverzace a zprávy v momentě, kdy se dějí. Pro trénink využívá superpočítač Colossus, což vede k vysokému výkonu v matematických a technických doménách.

Technické možnosti

Architektura podporuje 2milionový token context window u variant určených pro reasoning. Tato kapacita umožňuje zpracování obrovských kódových bází a husté technické dokumentace bez ztráty dat. Disponuje duálním systémem, kde si uživatelé vybírají mezi vysokorychlostním módem pro rychlé interakce a módem hlubokého přemýšlení pro vícekrokové logické úlohy. Model udržuje míru halucinací zhruba na 4 % díky využití mechanismu konsensu více agentů v konfiguraci Heavy.

Integrace do ekosystému

Kromě jednoduchého generování textu je Grok-4 navržen pro nativní tool use a komplexní function calling. Podporuje zpracování obrazu i zvuku, což z něj činí všestrannou volbu pro vývojáře vytvářející multimodal aplikace. Jeho strategie zarovnání se zaměřuje na objektivní hledání pravdy spíše než na standardní průmyslové bezpečnostní mantinely. To má za následek méně odmítnutí u kontroverzních nebo odvážných témat ve srovnání s ostatními frontier modely.

Grok-4

Pripady pouziti pro Grok-4

Objevte ruzne zpusoby, jak muzete pouzit Grok-4 pro dosazeni skvelych vysledku.

Analýza sentimentu v reálném čase

Analyzuje živé příspěvky na X za účelem zjištění veřejné reakce na aktuální zprávy nebo uvedení produktu na trh.

Audit rozsáhlých repozitářů

Vyhodnocuje celé softwarové repozitáře s využitím 2M context window pro odhalení architektonických nedostatků.

Řešení matematických úloh na úrovni olympiád

Poskytuje řešení krok za krokem pro komplexní matematické důkazy a úlohy na úrovni AIME.

Nefiltrovaný kreativní obsah

Generuje scénáře zaměřené na postavy a humor bez omezujících filtrů jiných poskytovatelů AI.

Syntéza vědeckého výzkumu

Shrnuje více akademických prací na doktorské úrovni současně při zachování technické přesnosti.

Technické ladění kódu

Identifikuje nejasné chyby v produkčním kódu a navrhuje opravy na základě aktuálních osvědčených postupů.

Silne stranky

Omezeni

Elitní matematické reasoning schopnosti: Dosáhl perfektního skóre 100 % v benchmarku AIME 2025, čímž v logice překonal většinu frontier modelů.
Latence Heavy módu: Mód multi-agentního reasoningu může trvat několik minut, než vytvoří jednu vysoce přesnou odpověď.
Špičkový context window v oboru: 2M context window umožňuje bezprecedentní hloubku při analýze dokumentů a rozsáhlých programovacích projektech.
Neúplná podpora videa: Zatímco schopnosti práce s textem a obrázky jsou na špičkové úrovni, nativní zpracování videa snímek po snímku zatím není dostupné.
Živá sociální inteligence: Přímý přístup k platformě X poskytuje informace v reálném čase, které statická trénovací data nemohou nahradit.
Omezený regionální přístup: Funkce trvalé paměti jsou v současnosti v Evropské unii zakázány z důvodu regulatorních požadavků.
Nízká míra odmítnutí: Benevolentnější bezpečnostní architektura umožňuje upřímný a objektivní dialog o kontroverzních tématech.
Limity přesnosti vizuálního vnímání: Autoři přiznávají, že model zůstává částečně slepý při interpretaci vizuálních detailů v extrémně vysokém rozlišení.

Rychly start API

xai/grok-4

Zobrazit dokumentaci
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o Grok-4

Podivejte se, co si komunita mysli o Grok-4

Grok 4 fast má 2M token window!!! Proč jsme se trápili a spokojili s ChatGPT, to už opravdu nevím.
myfuturewifee
reddit
15,88 % na soukromé podmnožině ARC-AGI v2 je šílené. Grok 4 je první model za poslední měsíce, který překonal tu 10% hranici.
Greg (vedoucí ARC-AGI)
twitter
Přístup studijní skupiny multi-agentů u Grok 4 Heavy je správný způsob, jak využít test-time compute. Skutečně to najde ten háček v problému.
Tony_xAI
twitter
Grok 4: 79 v LiveCodeBench... benchmarky vám neřeknou, jaké to je programovat s modelem, ale tohle působí důvěryhodně.
thankzr3ddit
reddit
Ten model je na postgraduální, tedy doktorské úrovni ve všem. Je děsivě chytrý a rychlejší, než se může jakýkoli člověk naučit.
Elon Musk
youtube
Vyhledávání v reálném čase není jen scrapování titulků; analyzuje obsah napříč mnoha zdroji.
BitBiasedAI
youtube

Videa o Grok-4

Sledujte navody, recenze a diskuse o Grok-4

Grok 4 Heavy je určen pro náročnější úlohy na logiku a reasoning, zatímco běžný Grok 4 zvládá ostatní.

Naprosto přesně sledoval moji ruku a prsty při kreslení na obrazovku.

Grok 4 našel heslo, které jsem schoval hluboko v context window, po pouhých 15 sekundách přemýšlení.

Přesnost v testu 2 milionů tokenů 'jehla v kupce sena' byla 100 %.

Tento model je konečně skutečnou alternativou pro ty, kterým přišel context window u Gemini nespolehlivý.

Grok 4 je na postgraduální, tedy doktorské úrovni ve všem, lepší než většina doktorandů.

Grok 4 Heavy spouští více agentů paralelně... je to jako studijní skupina.

Je v API a má 256k délku kontextu, s plány na mnohem více.

Trénink na clusteru Colossus mu dal reasoning schopnosti, které jsme zatím neviděli.

Je navržen tak, aby byl tou nejvíce pravdomluvnou AI, která aktuálně existuje.

Grok 4 Heavy spustí až 32 paralelních AI modelů na váš jeden prompt.

Vyhledávání v reálném čase není jen scrapování titulků; analyzuje obsah napříč mnoha zdroji.

Think mód využívá dodatečný výpočetní čas na plánování a zachycení potenciálních chyb před odesláním odpovědi.

Pokud máte přístup k API, můžete v logách skutečně vidět, jak spolu agenti debatují.

Multimodal výkon se zvukem je citelně rychlejší než u předchozí generace.

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow

Profesionalni tipy pro Grok-4

Expertni tipy, ktere vam pomohou ziskat maximum z Grok-4 a dosahnout lepsich vysledku.

Používejte vyhledávací klíčová slova

Do svého promptu zahrňte konkrétní hashtagy nebo účty, abyste nasměrovali vyhledávání modelu na platformě X v reálném čase.

Přepněte na Heavy mód

Aktivujte Grok-4 Heavy pro úkoly, kde je přesnost důležitější než rychlost odezvy.

Poskytněte detailní persony

Využijte benevolentnější bezpečnostní nastavení definováním konkrétních, odvážných person pro kreativní psaní.

Analyzujte externí odkazy

Vložte živé URL přímo do chatu a nechte model, aby vyhledal a shrnul čerstvý obsah z webu.

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Casto kladene dotazy o Grok-4

Najdete odpovedi na bezne otazky o Grok-4