xai

Grok-3

A Grok-3 az xAI zászlóshajója: mély logikai következtetés, 128k context window és valós idejű X integráció az élő kutatáshoz és kódoláshoz.

xai logoxaiGrok2025. február 17.
Kontextus
128Ktoken
Max kimenet
8Ktoken
Bemenet ara
$3.00/ 1M
Kimenet ara
$15.00/ 1M
Modalitas:TextImage
Kepessegek:LatasEszkozokStreamingErvelés
Benchmarkok
GPQA
84.6%
GPQA: Posztgradualis szintu tudomanyos kerdesek. Szigoru benchmark 448 kerdessel biologiabol, fizikabol es kemiabol. PhD szakertok csak 65-74% pontossagot ernek el. Grok-3 84.6% pontot ert el ezen a benchmarkon.
HLE
36%
HLE: Szakertoi szintu erveles. Teszteli a modell kepesseget szakertoi szintu erveles bemutatására specializalt teruletteken. Grok-3 36% pontot ert el ezen a benchmarkon.
MMLU
87.5%
MMLU: Massziv multitask nyelvmegertes. Atfogo benchmark 16 000 kerdessel 57 akademiai tantargybol. Grok-3 87.5% pontot ert el ezen a benchmarkon.
MMLU Pro
76.5%
MMLU Pro: MMLU Professzionalis kiadas. MMLU javitott valtozata 12 032 kerdessel es nehezebb 10 opcis formatummal. Grok-3 76.5% pontot ert el ezen a benchmarkon.
SimpleQA
42%
SimpleQA: Tenybeli pontossag benchmark. Teszteli a modell kepesseget pontos, tenyszeru valaszok adasara. Grok-3 42% pontot ert el ezen a benchmarkon.
IFEval
91.2%
IFEval: Utasitaskovetes ertekeles. Meri, mennyire jol koveti a modell az adott utasitasokat es korlatozasokat. Grok-3 91.2% pontot ert el ezen a benchmarkon.
AIME 2025
93.3%
AIME 2025: Amerikai Meghivasos Matematika Vizsga. Verseny szintu matematikai problemak a rangos AIME vizsgabol. Grok-3 93.3% pontot ert el ezen a benchmarkon.
MATH
94.4%
MATH: Matematikai problemamegoldas. Atfogo matematikai benchmark problemamegoldasra algebraban, geometriaban, analizisben. Grok-3 94.4% pontot ert el ezen a benchmarkon.
GSM8k
98.7%
GSM8k: Altalanos iskolai matematika 8K. 8 500 altalanos iskolai szintu matematikai szoveges feladat. Grok-3 98.7% pontot ert el ezen a benchmarkon.
MGSM
92.4%
MGSM: Tobbnyelvű altalanos iskolai matematika. GSM8k benchmark 10 nyelvre forditva. Grok-3 92.4% pontot ert el ezen a benchmarkon.
MathVista
71.3%
MathVista: Matematikai vizualis erveles. Teszteli a kepesseget vizualis elemeket tartalmazo matematikai problémak megoldasara. Grok-3 71.3% pontot ert el ezen a benchmarkon.
SWE-Bench
49%
SWE-Bench: Szoftverfejlesztesi benchmark. AI modellek valos GitHub problemakat probalnak megoldani Python projektekben. Grok-3 49% pontot ert el ezen a benchmarkon.
HumanEval
94.5%
HumanEval: Python programozasi problemak. 164 programozasi problema, ahol modelleknek helyes Python fuggveny implementaciokat kell generalniuk. Grok-3 94.5% pontot ert el ezen a benchmarkon.
LiveCodeBench
79.4%
LiveCodeBench: Elo kodolasi benchmark. Teszteli a kodolasi kepessegeket folyamatosan frissulo, valos vilag programozasi kihivasokon. Grok-3 79.4% pontot ert el ezen a benchmarkon.
MMMU
78%
MMMU: Multimodalis megertes. Multimodalis megertesi benchmark 30 egyetemi tantargybol. Grok-3 78% pontot ert el ezen a benchmarkon.
MMMU Pro
58.5%
MMMU Pro: MMMU Professzionalis kiadas. MMMU javitott valtozata nehezebb kerdesekkel. Grok-3 58.5% pontot ert el ezen a benchmarkon.
ChartQA
89.2%
ChartQA: Diagram kerdes-valasz. Teszteli a kepesseget informaciok megertesere es elemzesere diagramokbol es grafikonokbol. Grok-3 89.2% pontot ert el ezen a benchmarkon.
DocVQA
92.4%
DocVQA: Dokumentum vizualis kerdes. Teszteli a kepesseget informaciok kinyeresere dokumentum kepekbol. Grok-3 92.4% pontot ert el ezen a benchmarkon.
Terminal-Bench
52%
Terminal-Bench: Terminal/CLI feladatok. Teszteli a kepesseget parancssori muveletek vegrehajtasara. Grok-3 52% pontot ert el ezen a benchmarkon.
ARC-AGI
12.5%
ARC-AGI: Absztrakció es erveles. Teszteli a fluid intelligenciat uj minta-felismero rejtvenyekkel. Grok-3 12.5% pontot ert el ezen a benchmarkon.

A Grok-3 reszletei

Ismerd meg a Grok-3 kepessegeit, funkcioit es hogy hogyan segithet jobb eredmenyeket elerni.

Frontier reasoning és intelligencia

A Grok-3 az xAI zászlóshajója, a frontier modellek új generációja, amely jelentős ugrást képvisel a számítási skála és a logika terén. A több mint 100 000 NVIDIA H100 GPU-t tartalmazó Colossus szuperszámítógép-klaszteren kiképzett modell komplex matematikai és tudományos kihívásokkal is megbirkózik. A modell speciális reasoning móddal rendelkezik, amely további számítást használ saját logikájának ellenőrzésére a válasz megadása előtt.

Valós idejű tudásintegráció

A modell legfőbb megkülönböztető jegye az X platformmal való natív integráció. Ez lehetővé teszi a Grok-3 számára, hogy friss hírekhez, pénzügyi változásokhoz és globális trendekhez férjen hozzá, kisebb latency mellett, mint a hagyományos webes keresőkre épülő modellek. Az 1 millió tokenes context window-val párosítva a kutatók hatalmas mennyiségű, naprakész adatot képesek szintetizálni.

Multimodal és agentic képességek

A szövegen túl a Grok-3 egy erőteljes vision modell, amely képes technikai diagramok, tervrajzok és vizuális adatok értelmezésére. Támogatja a fejlett függvényhívást autonóm agentekben való felhasználáshoz. A SWE-Bench Verified benchmarkon elért 83,9%-os eredményével az egyik legalkalmasabb modell a valós szoftverfejlesztési problémák megoldására.

Grok-3

Hasznalati esetek a Grok-3 szamara

Fedezd fel a kulonbozo modokat, ahogyan a Grok-3-t hasznalhatod remek eredmenyek eleresehez.

Valós idejű piacelemzés

Élő X adatokat használ a pénzügyi hangulat és a friss hírek elemzésére befektetők számára.

PhD-szintű tudományos kutatás

Megoldja a felsőfokú STEM problémákat és elemzi a sűrű szakirodalmat a különböző reasoning módokkal.

Versenyképes szoftverfejlesztés

Produkciós minőségű kódot generál és nagy pontossággal oldja meg a GitHub issue-kat.

Komplex matematikai bizonyítások

Test-time compute-ot használ az olimpia szintű matematikai feladatok megoldásához, amelyek többlépéses levezetést igényelnek.

Technikai dokumentumok értelmezése

Tervrajzokat és technikai kézikönyveket elemez a multimodal vision rendszerén keresztül.

Autonóm agent logika

Kognitív magként szolgál olyan agentek számára, amelyek nagy pontosságú tervezést és eszközhasználatot igényelnek.

Erossegek

Korlatozasok

Olimpiai szintű reasoning: Tökéletes, 100%-os pontszámot ért el az AIME 2025 benchmarkon a Deep Thinking mód használatával.
Magas környezeti lábnyom: A képzés 200 000 GPU-t igényelt és körülbelül 150 MW energiát fogyasztott, ami fenntarthatósági aggályokat vet fel.
Hatalmas context kapacitás: 1 millió tokenes context window-t kínál, amely lehetővé teszi teljes könyvtárak vagy szoftverprojektek betöltését.
Prémium API árazás: A 15 dolláros 1 millió output tokenenkénti árral jelentősen drágább, mint a kisebb frontier alternatívák.
Páratlan valós idejű adatok: Az X-szel való közvetlen integráció a legfrissebb adatfolyamot biztosítja a jelenleg elérhető AI modellek közül.
Output token korlátok: A válaszok általában 4 096 tokenre vannak korlátozva, ami a rendkívül hosszú jelentések vagy kódfájlok csonkolását okozhatja.
Magas kódolási precizitás: 83,9%-ot ért el a SWE-Bench Verified benchmarkon, túlszárnyalva a jelentősebb versenytársakat a komplex GitHub issue-k megoldásában.
Hozzáférési korlátozások: A modell teljes képességei és az API kulcsok gyakran az X Premium Plus előfizetőkre vagy meghatározott régiókra korlátozódnak.

API gyorsinditas

xai/grok-3

Dokumentacio megtekintese
xai SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-3",
    messages: [{ role: "user", content: "Analyze the current market sentiment for Nvidia on X." }],
  });

  console.log(completion.choices[0].message.content);
}

main();

Telepitsd az SDK-t es kezdj API hivasokat vegezni perceken belul.

Mit mondanak az emberek a Grok-3-rol

Nezd meg, mit gondol a kozosseg a Grok-3-rol

A Grok-3 a legjobb AI modell kereskedőknek és befektetőknek a valós idejű hangulatelemzés miatt.
Austin Starks
reddit
Sikerült megoldania néhány nehéz HVM kódkiegészítési promptot, amivel a Gemini és a Sonnet kudarcot vallott. Olyan 'minőséget' érzek, ami magasabb, mint a Sonnet-3.5 esetében.
Victor Taelin
twitter
A sebessége elképesztő. Reasoning, valós idejű információk, egyszerűen ez tűnik a leggyorsabb flagship modellnek a jelenlegi piacon.
Matthew Berman
youtube
A Grok rendelkezik valós idejű adathozzáféréssel és hajlandó olyan helyekre is betekinteni, ahová más modellek nem, ami a 'bevállalós' választássá teszi a profi felhasználók számára.
Beginning-Willow-801
reddit
A Grok-3 GPQA-n nyújtott teljesítménye figyelemreméltó. Határozottan versenyben van az első helyért a reasoning területén.
EpochAIResearch
twitter
Az 1M context window tényleg működik. Kezelte a teljes legacy kódbázisomat anélkül, hogy elveszítette volna a kontextust a kezdeti promptokon.
DevGuru42
hackernews

Videok a Grok-3-rol

Nezz oktatoanyagokat, ertekeléseket es beszelgetéseket a Grok-3-rol

Bevezetés a Grok-3-ba és annak képzési skálájába.

A modell intelligenciára és az igazság keresésére épült.

A Grok 3 reasoning képessége... úgy tűnik, veri az OpenAI 01-et és a DeepSeek R1 modellt is a tudományos benchmarkokon.

Az MMLU benchmark teljesítménye azt mutatja, hogy ez egy csúcskategóriás modell.

A Grok 3 megpróbál megoldani megoldatlan problémákat is... míg más modellek egyszerűen csak kijelentik, hogy megoldatlanok.

Elon Musk szerint ez az eddigi legerősebb AI.

A Grok 3 megszerezte az első helyet ebben a vaktesztben, így ő a chatbot aréna uralkodó bajnoka.

Az X-szel való integráció határozott előnyt jelent a frissesség terén.

A multimodal képességek jelentősen javultak a Grok-2-höz képest.

A Grok legerősebb és legfrissebb verziója a webes változat lesz a grok.com oldalon.

A Colossus klaszter technikai architektúrájának felfedezése.

Beszélgetés a masszív 100 000 H100 GPU-s képzési futtatásról.

A 'big brain' egy igazán egyedi funkciója a Grok 3-nak... lehetővé teszi a felhasználóknak, hogy több reasoning agentet használjanak komplex problémák megoldására.

A Grok 3 fejlesztését az X Colossus szuperszámítógépe gyorsította fel, amely az első fázisban 100 000 Nvidia H100 GPU-t használt.

Záró gondolatok arról, hogy miért jelent nagy előrelépést a Grok-3 az open-weights stílusú átláthatóság terén.

Tobb, mint promptok

Turbozd fel a munkafolyamatodat AI automatizalasal

Az Automatio egyesiti az AI ugynokk, a web automatizalas es az okos integraciok erejet, hogy segitsen tobbet elerni kevesebb ido alatt.

AI ugynokk
Web automatizalas
Okos munkafolyamatok

Profi tippek a Grok-3 szamara

Szakertoi tippek, hogy a legtobbet hozd ki a Grok-3-bol es jobb eredmenyeket erj el.

Használd a Deep Search-et

Használd a deep search funkciót az elmúlt óra híreivel kapcsolatos lekérdezésekhez a legpontosabb eredmények érdekében.

Engedélyezd a High Reasoning módot

Matematikai feladványoknál állítsd a reasoning erőfeszítést magasra az önellenőrzési folyamatok aktiválásához.

Használd a Collections API-t

Töltsd fel a bizalmas dokumentumokat a Collections API-ba, hogy adataid kikerüljenek a képzési körökből.

Velemenyek

Mit mondanak a felhasznaloink

Csatlakozz tobb ezer elegedett felhasznalohoz, akik atalakitottak a munkafolyamatukat

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Kapcsolodo AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Gyakran ismetelt kerdesek a Grok-3-rol

Talalj valaszokat a Grok-3-val kapcsolatos gyakori kerdesekre