xai

Grok-3

Grok-3 je xAI flagship reasoning model, sa dubokom logičkom dedukcijom, 128k context window-om i real-time integracijom sa X platformom za istraživanje i...

xai logoxaiGrok17. februar 2025.
Контекст
128Kтокена
Макс. излаз
8Kтокена
Улазна цена
$3.00/ 1M
Излазна цена
$15.00/ 1M
Модалитет:TextImage
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
84.6%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Grok-3 је постигао 84.6% на овом бенчмарку.
HLE
36%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Grok-3 је постигао 36% на овом бенчмарку.
MMLU
87.5%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Grok-3 је постигао 87.5% на овом бенчмарку.
MMLU Pro
76.5%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Grok-3 је постигао 76.5% на овом бенчмарку.
SimpleQA
42%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Grok-3 је постигао 42% на овом бенчмарку.
IFEval
91.2%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Grok-3 је постигао 91.2% на овом бенчмарку.
AIME 2025
93.3%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Grok-3 је постигао 93.3% на овом бенчмарку.
MATH
94.4%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Grok-3 је постигао 94.4% на овом бенчмарку.
GSM8k
98.7%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Grok-3 је постигао 98.7% на овом бенчмарку.
MGSM
92.4%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Grok-3 је постигао 92.4% на овом бенчмарку.
MathVista
71.3%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Grok-3 је постигао 71.3% на овом бенчмарку.
SWE-Bench
49%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Grok-3 је постигао 49% на овом бенчмарку.
HumanEval
94.5%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Grok-3 је постигао 94.5% на овом бенчмарку.
LiveCodeBench
79.4%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Grok-3 је постигао 79.4% на овом бенчмарку.
MMMU
78%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Grok-3 је постигао 78% на овом бенчмарку.
MMMU Pro
58.5%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Grok-3 је постигао 58.5% на овом бенчмарку.
ChartQA
89.2%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Grok-3 је постигао 89.2% на овом бенчмарку.
DocVQA
92.4%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Grok-3 је постигао 92.4% на овом бенчмарку.
Terminal-Bench
52%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Grok-3 је постигао 52% на овом бенчмарку.
ARC-AGI
12.5%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Grok-3 је постигао 12.5% на овом бенчмарку.

О моделу Grok-3

Сазнајте о могућностима, функцијама и начинима коришћења модела Grok-3.

Frontier reasoning i inteligencija

Grok-3 je xAI flagship frontier model, koji predstavlja značajan iskorak u računarskoj skali i logici. Treniran na Colossus superkompjuterskom klasteru sa preko 100.000 NVIDIA H100 GPU jedinica, on rešava kompleksne matematičke i naučne izazove. Model poseduje specijalizovan reasoning mod koji koristi dodatne proračune kako bi proverio sopstvenu logiku pre nego što pruži konačan odgovor.

Integracija znanja u realnom vremenu

Ključna razlika je njegova izvorna integracija sa X platformom. Ovo omogućava Grok-3 modelu da pristupi najnovijim vestima, finansijskim promenama i globalnim trendovima sa manjom latencijom od modela koji se oslanjaju na standardno pretraživanje weba. Uparen sa 1 milion token context window-om, omogućava istraživačima da sintetizuju ogromnu količinu podataka u deliću sekunde.

Multimodal i agentic sposobnosti

Pored teksta, Grok-3 je moćan vision model sposoban da interpretira tehničke dijagrame, nacrte i vizuelne podatke. Podržava napredne funkcije (function calling) za upotrebu u autonomnim agentima. Sa rezultatom od 83,9% na SWE-Bench Verified, jedan je od najsposobnijih modela za rešavanje realnih softverskih inženjerskih problema.

Grok-3

Случајеви употребе за Grok-3

Откријте различите начине коришћења модела Grok-3 за постизање одличних резултата.

Analiza tržišta u realnom vremenu

Koristi live X podatke za analizu finansijskog sentimenta i najnovijih vesti za investitore.

Naučna istraživanja na PhD nivou

Rešava STEM probleme na nivou postdiplomskih studija i analizira gustu literaturu pomoću reasoning modova.

Konkurentni softverski inženjering

Generiše kod produkcionog kvaliteta i rešava GitHub issues sa visokom preciznošću.

Složeni matematički dokazi

Koristi test-time compute za rešavanje matematike na olimpijskom nivou koja zahteva dedukciju u više koraka.

Interpretacija tehničke dokumentacije

Analizira nacrte i tehnička uputstva kroz svoj multimodal vision sistem.

Logika za agentic sisteme

Služi kao kognitivno jezgro za agente koji zahtevaju planiranje visoke vernosti i upotrebu alata.

Предности

Ограничења

Reasoning olimpijskog nivoa: Postigao savršen rezultat od 100% na AIME 2025 math benchmark koristeći svoj Deep Thinking mod.
Veliki ekološki otisak: Treniranje je zahtevalo 200.000 GPU jedinica i troši približno 150MW energije, što izaziva zabrinutost za održivost.
Masivni kapacitet context window-a: Nudi 1 milion token context window, omogućavajući učitavanje čitavih biblioteka ili softverskih projekata.
Premium API cene: Sa 15 $ po milionu output tokens, značajno je skuplji od manjih frontier alternativa.
Neprevaziđeni podaci u realnom vremenu: Direktna integracija sa X platformom pruža najsvežiji stream podataka od svih trenutno dostupnih AI modela.
Ograničenja output tokens: Odgovori su generalno ograničeni na 4.096 tokens, što može skratiti ekstremno dugačke izveštaje ili fajlove sa kodom.
Visoka preciznost u programiranju: Ostvario 83,9% na SWE-Bench Verified, nadmašujući glavne konkurente u rešavanju kompleksnih GitHub issues.
Ograničenja pristupa: Puna funkcionalnost modela i API ključevi su često ograničeni na X Premium Plus pretplatnike ili specifične regione.

АПИ брзи старт

xai/grok-3

Погледај документацију
xai SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-3",
    messages: [{ role: "user", content: "Analiziraj trenutni tržišni sentiment za Nvidia na platformi X." }],
  });

  console.log(completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Grok-3

Погледајте шта заједница мисли о моделу Grok-3

Grok-3 je najbolji AI model za trgovce i investitore zbog svoje analize sentimenta u realnom vremenu.
Austin Starks
reddit
Uspeo je da reši neke teške HVM code completion promptove koje Gemini i Sonnet nisu uspeli. Osećam nivo 'kvaliteta' koji je viši od Sonnet-3.5.
Victor Taelin
twitter
Brzina je neverovatna. Reasoning, informacije u realnom vremenu, deluje kao najbrži flagship model koji trenutno postoji.
Matthew Berman
youtube
Grok ima pristup podacima u realnom vremenu i spremnost da ode tamo gde drugi modeli neće, što ga čini 'edgy' izborom za napredne korisnike.
Beginning-Willow-801
reddit
Performanse Grok-3 na GPQA su izvanredne. Definitivno se takmiči za prvo mesto u oblasti reasoning-a.
EpochAIResearch
twitter
Context window od 1M zaista radi. Obradio je ceo moj legacy codebase bez gubitka konteksta na inicijalnim promptovima.
DevGuru42
hackernews

Видео снимци о моделу Grok-3

Гледајте туторијале, рецензије и дискусије о моделу Grok-3

Uvod u Grok-3 i skalu njegovog treninga.

Model je napravljen za inteligenciju i traganje za istinom.

Grok 3 reasoning... izgleda da pobeđuje i OpenAI o1 i DeepSeek R1 model na naučnim benchmark testovima.

Benchmark performanse na MMLU pokazuju da je model vrhunske klase.

Grok 3 će zapravo pokušati da reši i nerešene probleme... dok će drugi modeli jednostavno navesti da su nerešivi.

Elon Musk tvrdi da je ovo najmoćniji AI do sada.

Grok 3 je sada zauzeo prvo mesto u ovom slepom testu, postavši vladajući šampion u Chatbot Arena.

Integracija sa X platformom pruža jasnu prednost u aktuelnosti podataka.

Multimodal sposobnosti su značajno poboljšane u odnosu na Grok-2.

Najmoćnija i najnovija verzija Grok-a biće web verzija na grok.com.

Istraživanje tehničke arhitekture Colossus klastera.

Diskusija o masivnom treningu na 100k H100 GPU jedinica.

Big brain je funkcija koja je zaista jedinstvena za Grok 3... omogućava korisnicima da koriste više reasoning agenata za rešavanje kompleksnih problema.

Razvoj Grok-3 je ubrzan X-ovim Colossus superkompjuterom koji je koristio 100.000 Nvidia H100 GPU jedinica u prvoj fazi.

Završna razmišljanja o tome zašto je Grok-3 veliki korak napred za transparentnost u stilu otvorenih modela.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Grok-3

Stručni saveti za maksimalno iskorišćenje Grok-3.

Iskoristite Deep Search

Koristite deep search za upite koji se tiču vesti iz poslednjih sat vremena radi najpreciznijih rezultata.

Aktivirajte High Reasoning

Postavite nivo reasoning napora na visok za matematičke zadatke kako biste pokrenuli korake za samoproveru.

Koristite Collections API

Otpremite osetljiva dokumenta na Collections API kako biste zadržali svoje podatke van ciklusa treniranja.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Често Постављана Питања о Grok-3

Пронађите одговоре на честа питања о Grok-3

Grok-3: 1M context window i 100% AIME 2025 math benchmark