xai

Grok-4

O Grok-4 da xAI é um frontier model com context window de 2M tokens, integração em tempo real com o X e capacidades de reasoning que batem recordes mundiais.

xai logoxaiGrok9 de julho de 2025
Contexto
2.0Mtokens
Saida Max
8Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
87.5%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Grok-4 pontuou 87.5% neste benchmark.
HLE
44.4%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Grok-4 pontuou 44.4% neste benchmark.
MMLU
94%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Grok-4 pontuou 94% neste benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Grok-4 pontuou 81.2% neste benchmark.
SimpleQA
48%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Grok-4 pontuou 48% neste benchmark.
IFEval
89.2%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Grok-4 pontuou 89.2% neste benchmark.
AIME 2025
100%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Grok-4 pontuou 100% neste benchmark.
MATH
92%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Grok-4 pontuou 92% neste benchmark.
GSM8k
98.4%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Grok-4 pontuou 98.4% neste benchmark.
MGSM
92.1%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Grok-4 pontuou 92.1% neste benchmark.
MathVista
72.4%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Grok-4 pontuou 72.4% neste benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Grok-4 pontuou 81% neste benchmark.
HumanEval
88%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Grok-4 pontuou 88% neste benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Grok-4 pontuou 79.4% neste benchmark.
MMMU
75%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Grok-4 pontuou 75% neste benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Grok-4 pontuou 59.2% neste benchmark.
ChartQA
90.5%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Grok-4 pontuou 90.5% neste benchmark.
DocVQA
93.2%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Grok-4 pontuou 93.2% neste benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Grok-4 pontuou 54.2% neste benchmark.
ARC-AGI
15.9%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Grok-4 pontuou 15.9% neste benchmark.

Sobre Grok-4

Aprenda sobre as capacidades do Grok-4, recursos e como ele pode ajuda-lo a obter melhores resultados.

Visão geral do modelo

O Grok-4 é o frontier model multimodal da xAI. Ele foi construído para priorizar o reasoning a partir de princípios fundamentais e a recuperação de informações em tempo real. O modelo ganha uma vantagem competitiva significativa através de sua integração nativa com a plataforma de mídia social X. Isso permite analisar conversas globais e notícias ao vivo conforme acontecem. Ele utiliza o supercomputador Colossus para treinamento, resultando em desempenho de alto nível em domínios matemáticos e técnicos.

Capacidades técnicas

A arquitetura suporta uma context window de 2 milhões de tokens em suas variantes de reasoning. Essa capacidade permite o processamento de bases de código massivas e documentação técnica densa sem perda de dados. O modelo possui um sistema de modo duplo onde os usuários escolhem entre um modo de alta velocidade para interações rápidas e um modo de pensamento profundo para tarefas lógicas de várias etapas. O modelo gerencia uma taxa de alucinação de cerca de 4% ao empregar um mecanismo de consenso multi-agente em sua configuração Heavy.

Integração no ecossistema

Além da simples geração de texto, o Grok-4 foi projetado para uso nativo de ferramentas e complexo function calling. Ele suporta processamento de imagem e áudio, tornando-o uma escolha versátil para desenvolvedores que criam aplicações multimodais. Sua estratégia de alinhamento foca na busca objetiva pela verdade, em vez de guardrails de segurança padrão da indústria. Isso resulta em menos recusas para tópicos controversos em comparação com outros frontier models.

Grok-4

Casos de Uso para Grok-4

Descubra as diferentes maneiras de usar Grok-4 para obter otimos resultados.

Análise de sentimento em tempo real

Analisa posts ao vivo no X para determinar a reação pública a notícias de última hora ou lançamentos de produtos.

Auditoria de repositórios em larga escala

Avalia repositórios de software inteiros usando a janela de 2M tokens para encontrar falhas arquiteturais.

Resolução de matemática nível olimpíada

Fornece soluções passo a passo para provas matemáticas complexas e problemas de nível AIME.

Conteúdo criativo sem filtros

Gera scripts e humor baseados em personagens sem os filtros restritivos de outros provedores de AI.

Síntese de pesquisa científica

Resume múltiplos artigos acadêmicos de nível PhD simultaneamente, mantendo a precisão técnica.

Depuração técnica

Identifica bugs obscuros em código de produção e sugere correções baseadas nas melhores práticas atuais.

Pontos Fortes

Limitacoes

Reasoning matemático de elite: Atingiu 100% de precisão no benchmark AIME 2025, superando a maioria dos frontier models em lógica.
Latência do modo Heavy: O modo de reasoning multi-agente pode levar vários minutos para produzir uma única resposta de alta precisão.
Context window líder da indústria: A janela de 2M tokens permite uma profundidade sem precedentes em análise de documentos e projetos de código extensos.
Suporte a vídeo incompleto: Embora os recursos de texto e imagem sejam de primeira linha, o processamento de vídeo nativo quadro a quadro ainda não está disponível.
Inteligência social ao vivo: O acesso direto à plataforma X fornece informações em tempo real que dados de treinamento estáticos não conseguem replicar.
Acesso regional restrito: Recursos de memória persistente estão atualmente desativados na União Europeia devido a requisitos regulatórios.
Baixa taxa de recusa: Uma arquitetura de segurança mais permissiva permite um diálogo honesto e objetivo sobre assuntos controversos.
Limites de precisão visual: Os criadores reconhecem que o modelo permanece parcialmente cego ao interpretar detalhes visuais de altíssima fidelidade.

Inicio Rapido da API

xai/grok-4

Ver Documentacao
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Grok-4

Veja o que a comunidade pensa sobre Grok-4

O Grok 4 fast tem uma janela de 2M de tokens!!! Por que estávamos sofrendo e nos contentando com o ChatGPT, eu realmente não sei mais.
myfuturewifee
reddit
15,88% no subconjunto privado ARC-AGI v2 é insano. O Grok 4 é o primeiro modelo a quebrar a barreira dos 10% em meses.
Greg (Líder da ARC-AGI)
twitter
A abordagem de grupo de estudo multi-agente no Grok 4 Heavy é a maneira correta de usar test-time compute. Ele realmente encontra o truque do problema.
Tony_xAI
twitter
Grok 4: 79 no LiveCodeBench... benchmarks não te dizem como é a sensação de programar com um modelo, mas este parece confiável.
thankzr3ddit
reddit
O modelo é nível pós-graduação, PhD em tudo. É assustadoramente inteligente e mais rápido do que qualquer humano pode aprender.
Elon Musk
youtube
A busca em tempo real não está apenas raspando manchetes; ela analisa conteúdo em múltiplas fontes.
BitBiasedAI
youtube

Videos Sobre Grok-4

Assista tutoriais, analises e discussoes sobre Grok-4

O Grok 4 heavy serve para tarefas mais intensivas em lógica e reasoning, enquanto o Grok 4 regular lida com outras.

Ele rastreou com precisão total minha mão e dedos para desenhar na tela.

O Grok 4 encontrou a senha que escondi nas profundezas da context window após apenas 15 segundos de processamento.

A precisão no teste de 2 milhões de tokens 'needle in a haystack' foi de 100%.

Este modelo é finalmente uma alternativa real para quem achava a context window do Gemini pouco confiável.

O Grok 4 é nível pós-graduação, nível PhD em tudo, melhor que a maioria dos PhDs.

O Grok 4 Heavy gera múltiplos agentes em paralelo... é como um grupo de estudo.

Está na API e tem um tamanho de contexto de 256k, com planos para muito mais.

O treinamento no cluster Colossus deu a ele uma capacidade de reasoning que ainda não tínhamos visto.

Ele foi projetado para ser a AI mais focada na verdade que existe atualmente.

O Grok 4 Heavy executa até 32 modelos de AI paralelos no seu único prompt.

A busca em tempo real não está apenas raspando manchetes; ela analisa conteúdo em múltiplas fontes.

O Think Mode gasta tempo computacional adicional planejando e detectando possíveis erros antes de responder.

Você pode realmente ver os agentes debatendo entre si nos logs se tiver acesso à API.

O desempenho multimodal com áudio é visivelmente mais rápido do que na geração anterior.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Grok-4

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Grok-4 e obter melhores resultados.

Use palavras-chave de busca

Inclua hashtags ou contas específicas em seu prompt para direcionar a busca em tempo real do X pelo modelo.

Mude para o modo Heavy

Ative o Grok-4 Heavy para tarefas onde a precisão é mais crítica do que a velocidade de resposta.

Forneça personas detalhadas

Aproveite o alinhamento de segurança permissivo definindo personas específicas e autênticas para escrita criativa.

Analise links externos

Cole URLs ao vivo diretamente no chat para que o modelo recupere e resuma conteúdo fresco da web.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Perguntas Frequentes Sobre Grok-4

Encontre respostas para perguntas comuns sobre Grok-4