xai

Grok-4

Grok-4 kompanije xAI je frontier model koji sadrži 2M token context window, integraciju sa X platformom u realnom vremenu i svetske rekorde u performansama...

xai logoxaiGrok9. jul 2025.
Контекст
2.0Mтокена
Макс. излаз
8Kтокена
Улазна цена
$3.00/ 1M
Излазна цена
$15.00/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
87.5%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Grok-4 је постигао 87.5% на овом бенчмарку.
HLE
44.4%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Grok-4 је постигао 44.4% на овом бенчмарку.
MMLU
94%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Grok-4 је постигао 94% на овом бенчмарку.
MMLU Pro
81.2%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Grok-4 је постигао 81.2% на овом бенчмарку.
SimpleQA
48%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Grok-4 је постигао 48% на овом бенчмарку.
IFEval
89.2%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Grok-4 је постигао 89.2% на овом бенчмарку.
AIME 2025
100%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Grok-4 је постигао 100% на овом бенчмарку.
MATH
92%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Grok-4 је постигао 92% на овом бенчмарку.
GSM8k
98.4%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Grok-4 је постигао 98.4% на овом бенчмарку.
MGSM
92.1%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Grok-4 је постигао 92.1% на овом бенчмарку.
MathVista
72.4%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Grok-4 је постигао 72.4% на овом бенчмарку.
SWE-Bench
81%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Grok-4 је постигао 81% на овом бенчмарку.
HumanEval
88%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Grok-4 је постигао 88% на овом бенчмарку.
LiveCodeBench
79.4%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Grok-4 је постигао 79.4% на овом бенчмарку.
MMMU
75%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Grok-4 је постигао 75% на овом бенчмарку.
MMMU Pro
59.2%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Grok-4 је постигао 59.2% на овом бенчмарку.
ChartQA
90.5%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Grok-4 је постигао 90.5% на овом бенчмарку.
DocVQA
93.2%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Grok-4 је постигао 93.2% на овом бенчмарку.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Grok-4 је постигао 54.2% на овом бенчмарку.
ARC-AGI
15.9%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Grok-4 је постигао 15.9% на овом бенчмарку.

О моделу Grok-4

Сазнајте о могућностима, функцијама и начинима коришћења модела Grok-4.

Pregled modela

Grok-4 je frontier multimodal model kompanije xAI. Napravljen je da prioritet daje rezonovanju zasnovanom na prvim principima i pronalaženju informacija u realnom vremenu. Model dobija značajnu konkurentsku prednost kroz izvornu integraciju sa društvenom mrežom X. To mu omogućava da analizira globalne razgovore i vesti uživo dok se događaju. Koristi Colossus superkompjuter za treniranje, što rezultira vrhunskim performansama u matematičkim i tehničkim domenima.

Tehničke mogućnosti

Arhitektura podržava 2-miliona-tokena context window u svojim varijantama za rezonovanje. Ovaj kapacitet omogućava obradu ogromnih baza koda i guste tehničke dokumentacije bez gubitka podataka. Sadrži sistem sa dva režima gde korisnici biraju između režima velike brzine za brze interakcije i režima dubokog razmišljanja za logičke zadatke u više koraka. Model održava stopu halucinacija od oko 4% korišćenjem mehanizma konsenzusa više agenata u svojoj Heavy konfiguraciji.

Integracija ekosistema

Pored jednostavnog generisanja teksta, Grok-4 je dizajniran za nativnu upotrebu alata i kompleksan function calling. Podržava obradu slika i zvuka, što ga čini raznovrsnim izborom za developere koji grade multimodalne aplikacije. Njegova strategija usklađivanja fokusira se na objektivno traženje istine, umesto na standardne industrijske sigurnosne barijere. Ovo rezultira manjim brojem odbijanja odgovora na kontroverzne teme u poređenju sa drugim frontier modelima.

Grok-4

Случајеви употребе за Grok-4

Откријте различите начине коришћења модела Grok-4 за постизање одличних резултата.

Analiza sentimenta u realnom vremenu

Analizira objave na X platformi kako bi utvrdio reakciju javnosti na aktuelne vesti ili lansiranje proizvoda.

Revizija obimnih repozitorijuma

Evaluira čitave softverske repozitorijume koristeći 2M token context window za pronalaženje arhitektonskih propusta.

Matematičko rešavanje na nivou olimpijade

Pruža rešenja korak po korak za složene matematičke dokaze i probleme AIME nivoa.

Filtriranje kreativnog sadržaja bez ograničenja

Generiše skripte vođene karakterima i humor bez restriktivnih filtera drugih AI provajdera.

Sinteza naučnih istraživanja

Sumira više akademskih radova doktorskog nivoa istovremeno, uz zadržavanje tehničke preciznosti.

Tehnički debugging

Identifikuje nejasne bagove u produkcionom kodu i sugeriše ispravke na osnovu aktuelnih best practices.

Предности

Ограничења

Vrhunsko matematičko rezonovanje: Postigao savršenih 100% na AIME 2025 benchmarku, nadmašivši većinu frontier modela u logici.
Latencija u Heavy režimu: Multi-agent reasoning režim može zahtevati nekoliko minuta da proizvede jedan odgovor visoke preciznosti.
Context window vodeći u industriji: 2M token context window omogućava neviđenu dubinu u analizi dokumenata i velikim projektima kodiranja.
Nepotpuna podrška za video: Iako su sposobnosti za tekst i slike vrhunske, izvorna obrada videa kadar-po-kadar još uvek nije dostupna.
Socijalna inteligencija uživo: Direktan pristup X platformi pruža informacije u realnom vremenu koje statični podaci za treniranje ne mogu da repliciraju.
Ograničen pristup po regionima: Funkcije permanentne memorije su trenutno onemogućene u Evropskoj uniji zbog regulatornih zahteva.
Niska stopa odbijanja odgovora: Permisivnija sigurnosna arhitektura omogućava iskren i objektivan dijalog o kontroverznim temama.
Ograničenja preciznosti vizije: Kreatori priznaju da model ostaje delimično „slep” pri interpretaciji izuzetno detaljnih vizuelnih podataka.

АПИ брзи старт

xai/grok-4

Погледај документацију
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Grok-4

Погледајте шта заједница мисли о моделу Grok-4

Grok 4 fast ima 2M token context window!!! Zašto smo se mučili i zadovoljavali ChatGPT-om, zaista više ne znam.
myfuturewifee
reddit
15.88% na ARC-AGI v2 privatnom podskupu je ludo. Grok 4 je prvi model koji je probio barijeru od 10% u poslednjih nekoliko meseci.
Greg (ARC-AGI Lead)
twitter
Pristup studijske grupe sa više agenata u Grok 4 Heavy je pravi način za korišćenje test-time compute-a. Zaista pronalazi 'kvaku' u problemu.
Tony_xAI
twitter
Grok 4: 79 na LiveCodeBench... benchmarkovi vam ne govore kakav je osećaj kodirati uz model, ali ovo deluje pouzdano.
thankzr3ddit
reddit
Model je na postdiplomskom nivou u svemu. Zastrašujuće je pametan i brži nego što bilo koji čovek može da uči.
Elon Musk
youtube
Pretraga u realnom vremenu ne samo da skrapuje naslove; ona analizira sadržaj iz više izvora.
BitBiasedAI
youtube

Видео снимци о моделу Grok-4

Гледајте туторијале, рецензије и дискусије о моделу Grok-4

Grok 4 Heavy je za logički intenzivnije zadatke, dok običan Grok 4 radi ostalo.

Potpuno precizno je pratio moju ruku i prste dok sam crtao po ekranu.

Grok 4 je pronašao lozinku koju sam sakrio duboko u context window nakon samo 15 sekundi razmišljanja.

Preciznost na testu 'igla u plastu sena' sa 2 miliona tokens bila je 100%.

Ovaj model je konačno prava alternativa za one kojima je Gemini context window bio nepouzdan.

Grok 4 je na postdiplomskom nivou u svemu, bolji od većine doktora nauka.

Grok 4 Heavy pokreće više agenata paralelno... to je kao studijska grupa.

Dostupan je na API-ju i ima 256k context length, sa planovima za mnogo više.

Treniranje na Colossus klasteru mu je dalo sposobnost rezonovanja koju do sada nismo videli.

Dizajniran je da bude AI koji najviše teži istini od svih koji trenutno postoje.

Grok 4 Heavy pokreće do 32 paralelna AI modela na vaš jedan prompt.

Pretraga u realnom vremenu ne samo da skrapuje naslove; ona analizira sadržaj iz više izvora.

Think Mode troši dodatno vreme na planiranje i hvatanje potencijalnih grešaka pre odgovora.

Možete zapravo videti kako agenti debatuju međusobno u logovima ako imate pristup API-ju.

Multimodalne performanse sa audio zapisom su primetno brže od prethodne generacije.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Grok-4

Stručni saveti za maksimalno iskorišćenje Grok-4.

Koristite ključne reči za pretragu

Uključite specifične hashtagove ili naloge u svoj prompt kako biste usmerili model na pretragu X platforme u realnom vremenu.

Prebacite se na Heavy režim

Aktivirajte Grok-4 Heavy za zadatke gde je preciznost važnija od brzine odgovora.

Definišite detaljne persone

Iskoristite permisivna sigurnosna podešavanja tako što ćete definisati specifične, odvažne persone za kreativno pisanje.

Analizirajte eksterne linkove

Nalepite URL adrese direktno u chat kako bi model preuzeo i sumirao svež sadržaj sa veba.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Често Постављана Питања о Grok-4

Пронађите одговоре на честа питања о Grok-4