xai

Grok-4

Grok-4 від xAI — це frontier model з 2M tokens context window, інтеграцією з платформою X у реальному часі та світовим рекордом у reasoning.

xai logoxaiGrok9 липня 2025 року
Контекст
2.0Mтокенів
Макс. вивід
8Kтокенів
Ціна вводу
$3.00/ 1M
Ціна виводу
$15.00/ 1M
Модальність:TextImage
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
87.5%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Grok-4 набрав 87.5% у цьому бенчмарку.
HLE
44.4%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Grok-4 набрав 44.4% у цьому бенчмарку.
MMLU
94%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Grok-4 набрав 94% у цьому бенчмарку.
MMLU Pro
81.2%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Grok-4 набрав 81.2% у цьому бенчмарку.
SimpleQA
48%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Grok-4 набрав 48% у цьому бенчмарку.
IFEval
89.2%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Grok-4 набрав 89.2% у цьому бенчмарку.
AIME 2025
100%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Grok-4 набрав 100% у цьому бенчмарку.
MATH
92%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Grok-4 набрав 92% у цьому бенчмарку.
GSM8k
98.4%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Grok-4 набрав 98.4% у цьому бенчмарку.
MGSM
92.1%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Grok-4 набрав 92.1% у цьому бенчмарку.
MathVista
72.4%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Grok-4 набрав 72.4% у цьому бенчмарку.
SWE-Bench
81%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Grok-4 набрав 81% у цьому бенчмарку.
HumanEval
88%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Grok-4 набрав 88% у цьому бенчмарку.
LiveCodeBench
79.4%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Grok-4 набрав 79.4% у цьому бенчмарку.
MMMU
75%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Grok-4 набрав 75% у цьому бенчмарку.
MMMU Pro
59.2%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Grok-4 набрав 59.2% у цьому бенчмарку.
ChartQA
90.5%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Grok-4 набрав 90.5% у цьому бенчмарку.
DocVQA
93.2%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Grok-4 набрав 93.2% у цьому бенчмарку.
Terminal-Bench
54.2%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Grok-4 набрав 54.2% у цьому бенчмарку.
ARC-AGI
15.9%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Grok-4 набрав 15.9% у цьому бенчмарку.

Про Grok-4

Дізнайтеся про можливості Grok-4, функції та як це може допомогти вам досягти кращих результатів.

Огляд моделі

Grok-4, це frontier model від xAI. Вона створена з пріоритетом на reasoning за першими принципами та пошук інформації в реальному часі. Модель отримує суттєву конкурентну перевагу завдяки нативній інтеграції з платформою X. Це дозволяє аналізувати глобальні розмови та новини в момент їх появи. Для навчання використовується суперкомп'ютер Colossus, що забезпечує високу продуктивність у математичних та технічних доменах.

Технічні можливості

Архітектура підтримує 2-мільйонне вікно context window у своїх версіях для reasoning. Ця місткість дозволяє обробляти величезні кодові бази та щільну технічну документацію без втрати даних. Вона має систему подвійного режиму, де користувачі обирають між режимом високої швидкості для швидкої взаємодії та режимом глибокого мислення для логічних задач із багатьма кроками. Модель підтримує рівень галюцинацій приблизно 4%, використовуючи механізм консенсусу агентів у конфігурації Heavy.

Інтеграція в екосистему

Крім простої генерації тексту, Grok-4 розроблений для нативного використання інструментів та складного function calling. Він підтримує обробку зображень та аудіо, що робить його універсальним вибором для розробників, які створюють multimodal програми. Його стратегія безпеки зосереджена на пошуку об'єктивної істини, а не на стандартних індустріальних обмеженнях. Це призводить до меншої кількості відмов при обговоренні суперечливих тем порівняно з іншими frontier models.

Grok-4

Випадки використання для Grok-4

Відкрийте різні способи використання Grok-4 для досягнення чудових результатів.

Аналіз настроїв у реальному часі

Аналізує активні дописи на X, щоб визначити суспільну реакцію на актуальні новини або запуски продуктів.

Аудит великих репозиторіїв

Оцінює цілі репозиторії коду, використовуючи вікно 2M tokens для пошуку архітектурних недоліків.

Вирішення математичних задач олімпіадного рівня

Надає покрокові рішення для складних математичних доведень та задач рівня AIME.

Нефільтрований креативний контент

Генерує сценарії та гумор, керовані персонажами, без обмежувальних фільтрів інших постачальників AI.

Синтез наукових досліджень

Підсумовує кілька академічних статей рівня PhD одночасно, зберігаючи технічну точність.

Технічне налагодження (debugging)

Виявляє приховані помилки у production-коді та пропонує виправлення на основі сучасних найкращих практик.

Сильні сторони

Обмеження

Елітарний математичний reasoning: Досягнуто ідеальних 100% у benchmark AIME 2025, що перевершує більшість frontier models у логіці.
Latency в Heavy Mode: Режим reasoning з кількома агентами може потребувати кількох хвилин для створення однієї високоточної відповіді.
Найкращий у галузі context window: Вікно 2M tokens забезпечує безпрецедентну глибину аналізу документів та масштабування проєктів програмування.
Неповна підтримка відео: Хоча можливості тексту та зображень на найвищому рівні, нативна обробка відео по кадрах ще не доступна.
Соціальний інтелект у реальному часі: Прямий доступ до платформи X надає актуальну інформацію, яку не можуть відтворити статичні дані навчання.
Обмежений доступ у регіонах: Функції постійної пам'яті наразі вимкнені в Європейському Союзі через регуляторні вимоги.
Низький рівень відмов: Більш ліберальна архітектура безпеки дозволяє вести чесний та об'єктивний діалог на суперечливі теми.
Обмеження точності зору: Розробники визнають, що модель залишається частково сліпою при інтерпретації надзвичайно дрібних візуальних деталей.

Швидкий старт API

xai/grok-4

Переглянути документацію
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Grok-4

Подивіться, що думає спільнота про Grok-4

У Grok 4 fast вікно 2M tokens!!! Чому ми так довго страждали і погоджувалися на ChatGPT, я справді не знаю.
myfuturewifee
reddit
15.88% на приватному підмножині ARC-AGI v2, це шалено. Grok 4, перша модель за багато місяців, яка подолала бар'єр у 10%.
Greg (ARC-AGI Lead)
twitter
Підхід з «дослідницькою групою агентів» у Grok 4 Heavy, це правильний спосіб використання test-time compute. Він дійсно знаходить хитрощі у задачах.
Tony_xAI
twitter
Grok 4: 79 на LiveCodeBench... benchmark не передають відчуття програмування з моделлю, але ця здається надійною.
thankzr3ddit
reddit
Модель, це рівень PhD у всьому. Вона лякаюче розумна і вчиться швидше, ніж будь-яка людина.
Elon Musk
youtube
Пошук у реальному часі, це не просто парсинг заголовків, він аналізує контент із багатьох джерел.
BitBiasedAI
youtube

Відео про Grok-4

Дивіться навчальні матеріали, огляди та обговорення про Grok-4

Grok 4 heavy призначений для більш інтенсивних задач на логіку та reasoning, тоді як звичайний Grok 4 обробляє інші.

Він повністю точно відстежив мою руку та пальці для малювання на екрані.

Grok 4 знайшов пароль, який я сховав глибоко в context window, всього після 15 секунд роздумів.

Точність у тесті «голка в стозі сіна» на 2 мільйони tokens склала 100%.

Ця модель нарешті є реальною альтернативою для тих, хто вважав context window Gemini ненадійним.

Grok 4, це рівень аспірантури або PhD у всьому, краще за більшість PhD.

Grok 4 Heavy запускає кілька agents паралельно... це як дослідницька група.

Він доступний в API і має довжину контексту 256k, з планами на значне збільшення.

Навчання на кластері Colossus надало йому здібностей до reasoning, яких ми ще не бачили.

Він створений, щоб бути найбільш орієнтованим на пошук істини AI з існуючих.

Grok 4 Heavy запускає до 32 паралельних AI models на ваш один prompt.

Пошук у реальному часі, це не просто парсинг заголовків, він аналізує контент із багатьох джерел.

Think Mode витрачає додатковий час на планування та виявлення потенційних помилок перед відповіддю.

Ви можете бачити, як агенти дебатують один з одним у логах, якщо маєте доступ до API.

Multimodal продуктивність зі звуком помітно швидша, ніж у попередньому поколінні.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Grok-4

Експертні поради, які допоможуть вам отримати максимум від Grok-4 та досягти кращих результатів.

Використовуйте ключові слова для пошуку

Додавайте конкретні хештеги або акаунти у свій prompt, щоб спрямувати пошук моделі в реальному часі на X.

Перемикайтеся на Heavy Mode

Активуйте Grok-4 Heavy для завдань, де точність важливіша за швидкість відповіді.

Створюйте детальні персонажі

Використовуйте переваги ліберальної політики безпеки, визначаючи специфічні, «гострі» персонажі для креативного письма.

Аналізуйте зовнішні посилання

Вставляйте активні URL прямо в чат, щоб модель могла отримати та підсумувати свіжий контент із вебсторінки.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Часті запитання про Grok-4

Знайдіть відповіді на поширені запитання про Grok-4