Grok-4 的 context window 是多大？

Grok-4 支持高达 200 万 tokens。这使用户能够在单个 prompt 中输入几本大型书籍或整个软件仓库。

Grok-4 API 的价格是多少？

输入 tokens 的价格为每百万 3.00 美元，输出 tokens 为每百万 15.00 美元。这些费率适用于 flagship 模型变体。

Grok-4 可以实时访问互联网吗？

是的，它与 X 平台有直接集成。它可以搜索实时帖子和新闻事件，提供仅有几分钟之差的最新信息。

Grok-4 是否可用于图像生成？

是的，它是一个 multimodal 模型，既能理解也能生成图像。它使用原生视觉系统来分析上传的文件。

什么是 Grok-4 Heavy？

Grok-4 Heavy 是一个经过推理优化的版本，使用了 test-time compute。它并行运行多个 agent 来验证答案并解决复杂的逻辑问题。

Grok-4 与 GPT-4o 相比如何？

在数学和编程 benchmark 中，Grok-4 经常优于 GPT-4o。它还提供了更大的 context window 和对实时社交数据的访问能力。

Grok-4 支持 function calling 吗？

是的，它支持原生工具调用。开发者可以定义自定义函数，供模型在对话期间执行。

Grok-4 是否比其他模型审查更少？

是的，该模型旨在追求最大程度的真实。它拥有更宽松的安全政策，允许出现前卫的幽默和争议性话题。

Grok-4

由 xAI 推出的 Grok-4 是一款 frontier model，具有 2M token 的 context window、实时 X 平台集成和世界级的推理能力。

xaiGrok2025年7月9日

上下文

2.0Mtokens

最大输出

8Ktokens

输入价格

$3.00/ 1M

输出价格

$15.00/ 1M

模态:TextImage

能力:视觉工具流式传输推理

基准测试

GPQA

87.5%

HLE

44.4%

MMLU

94%

MMLU Pro

81.2%

SimpleQA

48%

IFEval

89.2%

AIME 2025

100%

MATH

92%

GSM8k

98.4%

MGSM

92.1%

MathVista

72.4%

SWE-Bench

81%

HumanEval

88%

LiveCodeBench

79.4%

MMMU

75%

MMMU Pro

59.2%

ChartQA

90.5%

DocVQA

93.2%

Terminal-Bench

54.2%

ARC-AGI

15.9%

查看API文档

关于 Grok-4

了解 Grok-4 的功能、特性以及它如何帮助您获得更好的效果。

模型概述

Grok-4 是来自 xAI 的 frontier multimodal model。它旨在优先考虑第一性原理推理和实时信息检索。该模型通过与 X 社交媒体平台的原生集成获得了巨大的竞争优势。这使它能够实时分析全球对话和正在发生的实时新闻。它利用 Colossus 超级计算机 进行训练，从而在数学和技术领域实现了顶级性能。

技术能力

其架构在推理变体中支持 200 万 token 的 context window。这一容量使得处理海量代码库和密集的技术文档而不会丢失数据成为可能。它采用双模式系统，用户可以在用于快速交互的高速模式和用于多步逻辑任务的深度思考模式之间进行选择。该模型通过在其 Heavy 配置中采用多 agent 共识机制，将幻觉率控制在 4% 左右。

生态集成

除了简单的文本生成外，Grok-4 还专为原生工具使用和复杂的 function calling 而设计。它支持图像和音频处理，使其成为开发者构建 multimodal 应用的通用选择。其对齐策略专注于客观的真实追求，而非标准的行业安全护栏。与其他 frontier model 相比，这导致它对争议性或前卫话题的拒绝情况更少。

Grok-4 的使用案例

发现使用 Grok-4 获得出色效果的不同方式。

实时情绪分析

分析 X 上的实时帖子，以判断公众对突发新闻或产品发布的反应。

大规模代码库审计

利用 2M token 的 context window 评估整个软件仓库，从而发现架构缺陷。

奥林匹克级数学解题

为复杂的数学证明和 AIME 级别的难题提供分步解决方案。

无过滤的创意内容

在没有其他 AI 提供商限制性过滤器的情况下，生成以角色为导向的剧本和幽默内容。

科学研究综合

同时总结多篇博士级学术论文，并保持技术准确性。

技术调试

识别生产代码中的隐藏 Bug，并根据当前的最佳实践提出修复建议。

优势

局限性

精英级的数学推理: 在 AIME 2025 benchmark 中取得了 100% 的完美成绩，在逻辑方面超越了大多数 frontier model。

Heavy 模式延迟: 多 agent 推理模式可能需要几分钟才能生成一个高精度的响应。

业界领先的 context 能力: 2M token 的 context window 为文档分析和大规模编程项目提供了前所未有的深度。

视频支持不完整: 尽管文本和图像能力处于顶级水平，但原生的逐帧视频处理功能尚不可用。

实时社交智能: 直接访问 X 平台，提供了静态训练数据无法复制的实时信息。

区域访问受限: 由于监管要求，目前在欧盟境内禁用了持久记忆功能。

极低的拒绝率: 更宽松的安全架构允许就争议性话题进行诚实、客观的对话。

视觉精度限制: 开发者承认，在解释极高保真度的视觉细节时，模型仍存在一定的盲区。

API快速入门

xai/grok-4

查看文档

xai SDK

import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 Grok-4 的评价

看看社区对 Grok-4 的看法

“Grok 4 fast 有 2M token 的 context window！！！我真不知道我们为什么还在苦苦挣扎并凑合使用 ChatGPT。”

— myfuturewifee

“在 ARC-AGI v2 私有子集上达到 15.88% 真是太疯狂了。Grok 4 是几个月来第一个打破 10% 门槛的模型。”

— Greg (ARC-AGI Lead)

twitter

“Grok 4 Heavy 中的多 agent 研究小组方法是使用 test-time compute 的正确方式。它确实能找到问题的诀窍。”

— Tony_xAI

twitter

“Grok 4: 在 LiveCodeBench 上得分为 79……benchmark 无法告诉你用该模型编码的实际感觉，但这感觉非常值得信赖。”

— thankzr3ddit

“该模型在各方面都达到了研究生甚至是博士级别。它聪明得可怕，而且学习速度比任何人类都要快。”

— Elon Musk

youtube

“实时搜索不仅是抓取头条新闻；它还能分析跨多个来源的内容。”

— BitBiasedAI

youtube

关于 Grok-4 的视频

观看关于 Grok-4 的教程、评测和讨论

“Grok 4 heavy 适用于更复杂的逻辑和推理任务，而常规版 Grok 4 处理其他任务。”

“它非常准确地追踪了我的手和手指在屏幕上的绘画轨迹。”

“Grok 4 只用了 15 秒的思考时间，就找到了我藏在 context window 深处的密码。”

“在 200 万 token 的“大海捞针”测试中，准确率达到了 100%。”

“对于那些觉得 Gemini 的 context window 不可靠的人来说，这款模型终于是一个真正的替代品。”

“Grok 4 在各方面都达到了研究生甚至是博士级别，比大多数博士都要强。”

“Grok 4 Heavy 并行生成多个 agent……这就像一个研究小组。”

“它已经在 API 上线，拥有 256k 的 context length，未来还有更多计划。”

“在 Colossus 集群上的训练赋予了它我们从未见过的推理能力。”

“它的设计初衷是成为目前世界上最追求真实性的 AI。”

“Grok 4 Heavy 针对你的单个 prompt 最多运行 32 个并行 AI 模型。”

“实时搜索不仅是抓取头条新闻，它还能跨多个来源分析内容。”

“思考模式会花费额外的计算时间在响应前进行规划并捕捉潜在错误。”

“如果你有 API 权限，你甚至可以在日志中看到 agent 之间互相辩论的过程。”

“其音频的多模态性能比上一代明显更快。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量，帮助您在更短的时间内完成更多工作。

AI代理

网页自动化

智能工作流

免费开始

Grok-4专业提示

专家提示助您充分利用Grok-4。

使用搜索关键词

在 prompt 中包含特定的标签或账户，以引导模型进行实时的 X 搜索。

切换至 Heavy 模式

对于准确性重于响应速度的任务，请激活 Grok-4 Heavy。

提供详细的人格设定

利用其宽松的安全对齐机制，通过定义特定、前卫的人格设定来进行创意写作。

分析外部链接

将实时 URL 直接粘贴到聊天框中，模型即可提取并总结最新的网页内容。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.