xai

Grok-4

Az xAI Grok-4 egy frontier modell 2M tokenes context window-val, valós idejű X platform integrációval és világrekordot döntő reasoning-képességekkel.

xai logoxaiGrok2025. július 9.
Kontextus
2.0Mtoken
Max kimenet
8Ktoken
Bemenet ara
$3.00/ 1M
Kimenet ara
$15.00/ 1M
Modalitas:TextImage
Kepessegek:LatasEszkozokStreamingErvelés
Benchmarkok
GPQA
87.5%
GPQA: Posztgradualis szintu tudomanyos kerdesek. Szigoru benchmark 448 kerdessel biologiabol, fizikabol es kemiabol. PhD szakertok csak 65-74% pontossagot ernek el. Grok-4 87.5% pontot ert el ezen a benchmarkon.
HLE
44.4%
HLE: Szakertoi szintu erveles. Teszteli a modell kepesseget szakertoi szintu erveles bemutatására specializalt teruletteken. Grok-4 44.4% pontot ert el ezen a benchmarkon.
MMLU
94%
MMLU: Massziv multitask nyelvmegertes. Atfogo benchmark 16 000 kerdessel 57 akademiai tantargybol. Grok-4 94% pontot ert el ezen a benchmarkon.
MMLU Pro
81.2%
MMLU Pro: MMLU Professzionalis kiadas. MMLU javitott valtozata 12 032 kerdessel es nehezebb 10 opcis formatummal. Grok-4 81.2% pontot ert el ezen a benchmarkon.
SimpleQA
48%
SimpleQA: Tenybeli pontossag benchmark. Teszteli a modell kepesseget pontos, tenyszeru valaszok adasara. Grok-4 48% pontot ert el ezen a benchmarkon.
IFEval
89.2%
IFEval: Utasitaskovetes ertekeles. Meri, mennyire jol koveti a modell az adott utasitasokat es korlatozasokat. Grok-4 89.2% pontot ert el ezen a benchmarkon.
AIME 2025
100%
AIME 2025: Amerikai Meghivasos Matematika Vizsga. Verseny szintu matematikai problemak a rangos AIME vizsgabol. Grok-4 100% pontot ert el ezen a benchmarkon.
MATH
92%
MATH: Matematikai problemamegoldas. Atfogo matematikai benchmark problemamegoldasra algebraban, geometriaban, analizisben. Grok-4 92% pontot ert el ezen a benchmarkon.
GSM8k
98.4%
GSM8k: Altalanos iskolai matematika 8K. 8 500 altalanos iskolai szintu matematikai szoveges feladat. Grok-4 98.4% pontot ert el ezen a benchmarkon.
MGSM
92.1%
MGSM: Tobbnyelvű altalanos iskolai matematika. GSM8k benchmark 10 nyelvre forditva. Grok-4 92.1% pontot ert el ezen a benchmarkon.
MathVista
72.4%
MathVista: Matematikai vizualis erveles. Teszteli a kepesseget vizualis elemeket tartalmazo matematikai problémak megoldasara. Grok-4 72.4% pontot ert el ezen a benchmarkon.
SWE-Bench
81%
SWE-Bench: Szoftverfejlesztesi benchmark. AI modellek valos GitHub problemakat probalnak megoldani Python projektekben. Grok-4 81% pontot ert el ezen a benchmarkon.
HumanEval
88%
HumanEval: Python programozasi problemak. 164 programozasi problema, ahol modelleknek helyes Python fuggveny implementaciokat kell generalniuk. Grok-4 88% pontot ert el ezen a benchmarkon.
LiveCodeBench
79.4%
LiveCodeBench: Elo kodolasi benchmark. Teszteli a kodolasi kepessegeket folyamatosan frissulo, valos vilag programozasi kihivasokon. Grok-4 79.4% pontot ert el ezen a benchmarkon.
MMMU
75%
MMMU: Multimodalis megertes. Multimodalis megertesi benchmark 30 egyetemi tantargybol. Grok-4 75% pontot ert el ezen a benchmarkon.
MMMU Pro
59.2%
MMMU Pro: MMMU Professzionalis kiadas. MMMU javitott valtozata nehezebb kerdesekkel. Grok-4 59.2% pontot ert el ezen a benchmarkon.
ChartQA
90.5%
ChartQA: Diagram kerdes-valasz. Teszteli a kepesseget informaciok megertesere es elemzesere diagramokbol es grafikonokbol. Grok-4 90.5% pontot ert el ezen a benchmarkon.
DocVQA
93.2%
DocVQA: Dokumentum vizualis kerdes. Teszteli a kepesseget informaciok kinyeresere dokumentum kepekbol. Grok-4 93.2% pontot ert el ezen a benchmarkon.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI feladatok. Teszteli a kepesseget parancssori muveletek vegrehajtasara. Grok-4 54.2% pontot ert el ezen a benchmarkon.
ARC-AGI
15.9%
ARC-AGI: Absztrakció es erveles. Teszteli a fluid intelligenciat uj minta-felismero rejtvenyekkel. Grok-4 15.9% pontot ert el ezen a benchmarkon.

A Grok-4 reszletei

Ismerd meg a Grok-4 kepessegeit, funkcioit es hogy hogyan segithet jobb eredmenyeket elerni.

Modelláttekintés

A Grok-4 az xAI frontier multimodal modellje. Úgy építették, hogy az első elveken alapuló reasoning-et és a valós idejű információkeresést helyezze előtérbe. A modell jelentős versenyelőnyre tesz szert az X közösségi platformmal való natív integrációja révén. Ez lehetővé teszi, hogy elemezze a globális beszélgetéseket és híreket, ahogy azok megtörténnek. A tréninghez a Colossus szuperszámítógépet használja, ami kiváló teljesítményt eredményez matematikai és technikai területeken.

Technikai képességek

Az architektúra a reasoning-variánsaiban 2 millió tokenes context window-t támogat. Ez a kapacitás lehetővé teszi hatalmas kódbázisok és sűrű technikai dokumentációk adatvesztés nélküli feldolgozását. Dual-mode rendszerrel rendelkezik, ahol a felhasználók választhatnak a gyors interakciókat biztosító nagy sebességű mód és a több-lépéses logikai feladatokat támogató mélyelemző (deep-thinking) mód között. A modell a hallucinációs rátát körülbelül 4%-on tartja egy több-agentes konszenzusmechanizmus alkalmazásával a Heavy konfigurációban.

Ökoszisztéma-integráció

Az egyszerű szöveggeneráláson túl a Grok-4-et natív eszközhasználatra és komplex function calling-ra tervezték. Támogatja a kép- és hangfeldolgozást, ami sokoldalú választássá teszi a multimodális alkalmazásokat fejlesztő szakemberek számára. Az igazodási (alignment) stratégiája az objektív igazságkeresésre fókuszál, nem a szokásos iparági biztonsági korlátokra. Ez kevesebb elutasítást eredményez a vitatott vagy merész témáknál, mint más frontier modellek esetében.

Grok-4

Hasznalati esetek a Grok-4 szamara

Fedezd fel a kulonbozo modokat, ahogyan a Grok-4-t hasznalhatod remek eredmenyek eleresehez.

Valós idejű hangulatelemzés

Elemzi az X-en megjelenő élő bejegyzéseket, hogy meghatározza a közvélemény reakcióját friss hírekre vagy termékbevezetésekre.

Nagyszabású adattár-auditálás

A 2M tokenes context window használatával teljes szoftver-adattárakat értékel ki, hogy feltárja az építészeti hibákat.

Olimpiai szintű matematikai feladatmegoldás

Lépésről lépésre megoldásokat kínál összetett matematikai bizonyításokhoz és AIME-szintű problémákhoz.

Szűretlen kreatív tartalom

Karakterközpontú forgatókönyveket és humort generál, más AI-szolgáltatók korlátozó szűrői nélkül.

Tudományos kutatások szintézise

Egyszerre foglal össze több PhD-szintű tudományos publikációt, miközben megőrzi a szakmai pontosságot.

Technikai hibakeresés

Azonosítja az elrejtett hibákat az éles kódban, és a jelenlegi legjobb gyakorlatok alapján javasol javításokat.

Erossegek

Korlatozasok

Kiváló matematikai reasoning: Tökéletes, 100%-os eredményt ért el az AIME 2025 benchmarkon, ezzel a legtöbb frontier modelt túlszárnyalva logikában.
Heavy mód késleltetése: A több-agentes reasoning mód néhány percig is eltarthat, mire egyetlen nagy pontosságú választ ad.
Iparágvezető context window: A 2M tokenes context window példátlan mélységű dokumentumelemzést és nagyszabású kódolási projekteket tesz lehetővé.
Hiányos videotámogatás: Bár a szöveg és kép kezelése csúcsszintű, a natív képkockáról-képkockára történő videofeldolgozás még nem érhető el.
Élő közösségi intelligencia: Az X platformhoz való közvetlen hozzáférés olyan valós idejű információkat biztosít, amelyeket a statikus tanítóadatok nem tudnak reprodukálni.
Korlátozott regionális hozzáférés: A perzisztens memória funkciói jelenleg az Európai Unióban szabályozási okok miatt le vannak tiltva.
Alacsony elutasítási arány: A megengedőbb biztonsági architektúra őszinte, objektív párbeszédet tesz lehetővé vitatott témákról is.
Látásbeli precíziós korlátok: Az alkotók elismerik, hogy a modell részben még vak, amikor rendkívül nagy felbontású vizuális részleteket kell értelmeznie.

API gyorsinditas

xai/grok-4

Dokumentacio megtekintese
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Telepitsd az SDK-t es kezdj API hivasokat vegezni perceken belul.

Mit mondanak az emberek a Grok-4-rol

Nezd meg, mit gondol a kozosseg a Grok-4-rol

A Grok 4 fast-nek 2M-s context window-ja van!!! Nem tudom, miért szenvedtünk és értük be a ChatGPT-vel eddig.
myfuturewifee
reddit
A 15,88%-os eredmény az ARC-AGI v2 privát részhalmazán őrület. A Grok 4 az első modell, ami hónapok óta átlépte a 10%-os korlátot.
Greg (ARC-AGI Lead)
twitter
A több-agentes tanulócsoport megközelítés a Grok 4 Heavy-ben a helyes út a test-time compute használatához. Tényleg megtalálja a probléma trükkjét.
Tony_xAI
twitter
Grok 4: 79 a LiveCodeBench-en... a benchmarkok nem mondják el, milyen érzés egy modellel kódolni, de ez megbízhatónak tűnik.
thankzr3ddit
reddit
A modell posztgraduális, PhD-szintű mindenben. Ijesztően okos és gyorsabb, mint ahogy bármely ember tanulni tudna.
Elon Musk
youtube
A valós idejű keresés nem csak címsorok gyűjtése; több forrásból származó tartalmat elemez.
BitBiasedAI
youtube

Videok a Grok-4-rol

Nezz oktatoanyagokat, ertekeléseket es beszelgetéseket a Grok-4-rol

A Grok 4 Heavy a logikai és reasoning-igényesebb feladatokhoz való, míg a normál Grok 4 kezeli a többit.

Teljesen pontosan követte a kezem és az ujjaimat, miközben a képernyőre rajzoltam.

A Grok 4 megtalálta a context window mélyére rejtett jelszót, mindössze 15 másodperc gondolkodás után.

A 2 millió tokenes 'needle in a haystack' teszt pontossága 100% volt.

Ez a modell végre egy valódi alternatíva azoknak, akik a Gemini context window-ját megbízhatatlannak találták.

A Grok 4 posztgraduális, azaz PhD-szintű mindenben, jobb, mint a legtöbb PhD-hallgató.

A Grok 4 Heavy több agentet indít párhuzamosan... olyan, mint egy tanulócsoport.

Az API-n keresztül érhető el és 256k-s context window-val rendelkezik, de tervezik a bővítést.

A Colossus klaszteren végzett tréning olyan reasoning-képességet adott neki, amit eddig nem láttunk.

Úgy tervezték, hogy a létező leginkább igazságkereső AI legyen.

A Grok 4 Heavy akár 32 párhuzamos AI modellt futtat egyetlen prompton.

A valós idejű keresés nem csak címsorok gyűjtése, hanem több forrásból származó tartalom elemzése.

A Think Mode további számítási időt fordít a tervezésre és a potenciális hibák kiszűrésére a válaszadás előtt.

Ha van API hozzáférésed, láthatod a naplókban, ahogy az agentek vitáznak egymással.

A multimodális teljesítmény hanggal észrevehetően gyorsabb, mint az előző generációnál.

Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok

Profi tippek a Grok-4 szamara

Szakertoi tippek, hogy a legtobbet hozd ki a Grok-4-bol es jobb eredmenyeket erj el.

Használj keresési kulcsszavakat

Használj specifikus hashtageket vagy fiókokat a promptban, hogy irányítsd a modell valós idejű X keresését.

Válts Heavy módra

Aktiváld a Grok-4 Heavy módot azokon a feladatokon, ahol a pontosság fontosabb, mint a válaszadási sebesség.

Adj meg részletes perszónákat

Használd ki a megengedőbb biztonsági irányelveket és definiálj specifikus, merész perszónákat a kreatív íráshoz.

Elemezz külső linkeket

Illessz be élő URL-eket közvetlenül a chatbe, hogy a modell lekérje és összefoglalja a friss webes tartalmakat.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Gyakran ismetelt kerdesek a Grok-4-rol

Talalj valaszokat a Grok-4-val kapcsolatos gyakori kerdesekre

Grok-4: 2M context window és 100%-os AIME pontszám 3 dolláros token-áron