xai

Grok-4

O Grok-4 da xAI é um frontier model que apresenta um context window de 2M de tokens, integração em tempo real com a plataforma X e capacidades de reasoning que...

xai logoxaiGrokJuly 9, 2025
Contexto
2.0Mtokens
Saida Max
8Ktokens
Preco Entrada
$3.00/ 1M
Preco Saida
$15.00/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
87.5%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Grok-4 pontuou 87.5% neste benchmark.
HLE
44.4%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Grok-4 pontuou 44.4% neste benchmark.
MMLU
94%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Grok-4 pontuou 94% neste benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Grok-4 pontuou 81.2% neste benchmark.
SimpleQA
48%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Grok-4 pontuou 48% neste benchmark.
IFEval
89.2%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Grok-4 pontuou 89.2% neste benchmark.
AIME 2025
100%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Grok-4 pontuou 100% neste benchmark.
MATH
92%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Grok-4 pontuou 92% neste benchmark.
GSM8k
98.4%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Grok-4 pontuou 98.4% neste benchmark.
MGSM
92.1%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Grok-4 pontuou 92.1% neste benchmark.
MathVista
72.4%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Grok-4 pontuou 72.4% neste benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Grok-4 pontuou 81% neste benchmark.
HumanEval
88%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Grok-4 pontuou 88% neste benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Grok-4 pontuou 79.4% neste benchmark.
MMMU
75%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Grok-4 pontuou 75% neste benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Grok-4 pontuou 59.2% neste benchmark.
ChartQA
90.5%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Grok-4 pontuou 90.5% neste benchmark.
DocVQA
93.2%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Grok-4 pontuou 93.2% neste benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Grok-4 pontuou 54.2% neste benchmark.
ARC-AGI
15.9%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Grok-4 pontuou 15.9% neste benchmark.

Sobre Grok-4

Aprenda sobre as capacidades do Grok-4, recursos e como ele pode ajuda-lo a obter melhores resultados.

Visão Geral

Grok-4 é o mais recente frontier model de AI da xAI, projetado para ser um assistente em busca da verdade com acesso em tempo real à plataforma X. Construído no cluster de supercomputadores Colossus com mais de 200.000 GPUs, ele representa um salto massivo em reasoning, resolução de problemas matemáticos e capacidades de codificação. Ele apresenta uma arquitetura unificada de modo duplo, permitindo que os usuários alternem entre um modo de reasoning de deep-thinking para enigmas complexos e um modo de alta velocidade para respostas imediatas.

Inovações Técnicas

Este salto geracional em computação permitiu um desempenho de nível de doutorado em todas as disciplinas acadêmicas simultaneamente. O modelo é caracterizado de forma única por sua estratégia de alinhamento anti-woke, priorizando informações objetivas sobre as proteções de segurança padrão. Seu massivo context window de 2 milhões de tokens e a integração no ecossistema Musk, incluindo o X e veículos Tesla, proporcionam uma vantagem competitiva distinta. Embora se destaque em STEM e reasoning técnico, ele permanece altamente eficiente para tarefas criativas cotidianas e análise de notícias em tempo real.

Filosofia de Desempenho

O Grok-4 prioriza o pensamento a partir de princípios fundamentais e a síntese de dados objetivos. Ao utilizar o mecanismo de reasoning Quasarflux, ele pode navegar por cadeias lógicas de múltiplas etapas que normalmente confundem LLMs tradicionais. Isso o torna uma ferramenta essencial para desenvolvedores e pesquisadores que exigem outputs de alta fidelidade em ambientes de alto risco, onde a precisão factual é inegociável.

Grok-4

Casos de Uso para Grok-4

Descubra as diferentes maneiras de usar Grok-4 para obter otimos resultados.

Pesquisa STEM de Nível de Pós-Graduação

Utilizando o modo Thinking para resolver problemas de física de nível de doutorado e verificar provas matemáticas complexas.

Debugging de Repositórios Massivos

Aproveitando o context window de 2M para ingerir bases de código inteiras e identificar race conditions sutis.

Inteligência Financeira em Tempo Real

Monitorando o X Firehose para analisar o sentimento do mercado e notícias de última hora para insights de trading.

Workflows de Agentes Autônomos

Impulsionando tarefas agentic complexas através de function calling robusto para logística e automação.

Análise Jurídica Multimodal

Revisando milhares de páginas de documentos de descoberta enquanto analisa fotos de evidências digitalizadas.

Tutoria Acadêmica Avançada

Oferecendo tutoria personalizada baseada em princípios fundamentais em disciplinas STEM, adaptada ao progresso do aluno.

Pontos Fortes

Limitacoes

Matemática e Lógica Inigualáveis: Alcançou a pontuação recorde mundial de 100% no AIME 2025, tornando-se a principal escolha para tarefas técnicas.
Lógica Básica Oscilante: Apesar de gabar os exames de pós-graduação, o modelo ocasionalmente falha em tarefas triviais, como contar letras em uma palavra.
Contexto Líder de Mercado: O window de 2 milhões de tokens permite a análise de aproximadamente 1.500 páginas de texto em um único prompt.
Alta Barreira de Entrada: O acesso ao modelo Grok-4 Heavy de potência total e aos recursos de reasoning exige uma assinatura premium.
Pipeline de Dados ao Vivo: O acesso exclusivo ao fluxo de dados em tempo real da plataforma X garante que as respostas estejam atualizadas sobre eventos globais.
Lacunas em Nuances Criativas: Fica atrás do Claude 4.5 em storytelling criativo, adotando frequentemente um tom mais utilitário ou provocativo.
Inteligência Emocional: O alto desempenho no EQ-Bench3 indica uma capacidade superior de compreender emoções humanas sutis.
Consistência na Geração de Imagens: As ferramentas internas têm dificuldade em manter a consistência visual em múltiplos painéis.

Inicio Rapido da API

xai/grok-4

Ver Documentacao
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Grok-4

Veja o que a comunidade pensa sobre Grok-4

"O Grok 4 está oficialmente dando uma aula na concorrência... provando que a xAI construiu um modelo que pensa como um predador."
Mario Nawfal
x/twitter
"O Grok 4 é um gênio de nível de doutorado que destrói benchmarks, mas que ocasionalmente não consegue contar. A dualidade é bizarra."
Beginning-Willow-801
reddit
"O salto para 2 milhões de tokens não é apenas um truque; ele muda fundamentalmente o debugging de repositórios."
AI Tech Reviews
youtube
"O Grok 4 é claramente o melhor modelo em termos de compreensão geral, muito à frente do GPT-5."
YMist_
reddit
"O uso vai disparar com o Grok 4.20. Ele será lançado em 3 ou 4 semanas."
Elon Musk
x/twitter
"A integração em tempo real com o X é a única coisa que mantém minha pesquisa relevante neste ciclo de notícias."
DataScientist_Alpha
hackernews

Videos Sobre Grok-4

Assista tutoriais, analises e discussoes sobre Grok-4

O número de palavras nesta resposta é exatamente 43... Super impressionante.

Não só foi capaz de resolver a Torre de Hanói em seu chain-of-thought, mas ele realmente provou e visualizou isso com código.

Adorei esta resposta. Direta ao ponto. Sem rodeios.

As capacidades de reasoning aqui estão claramente um nível acima do que vimos na geração anterior.

Finalmente é um modelo que não parece estar escondendo a verdade para ser educado.

A chave experimental de thinking para o Grok foi removida recentemente... levando à caracterização como potencialmente antiquado.

O Grok OS foi o menos impressionante, apresentando um fundo branco básico e ícones quebrados.

Em termos de recuperação de conhecimento bruto, o Grok-4 está atingindo o alvo consistentemente onde o GPT-5 falha.

A latency no modo de reasoning é maior, mas a qualidade do output justifica a espera.

Se você está no ecossistema Musk, a integração aqui é um multiplicador de produtividade massivo.

Ninguém quer um modelo super rápido se ele não consegue resolver a lógica. Posso dizer isso de graça, pessoal.

Eu daria nota menos um de 10... Lixo completo. Não consegue nem construir um site Next.js simples.

A velocidade está lá, mas se a lógica está quebrada, qual é o sentido dos tokens por segundo?

Parece que eles apressaram a variante coder apenas para bater o ciclo de lançamento.

Fique com o modelo de reasoning padrão se você realmente quer algo que funcione.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes
Assistir video de demonstracao

Dicas Profissionais para Grok-4

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Grok-4 e obter melhores resultados.

Alternância de Modos

Use o modo Quasarflux para lógica complexa e o modo Tensor para velocidade, otimizando custo e desempenho.

Consultas em Tempo Real

Use prompts explícitos para tópicos em alta no X para aproveitar o pipeline de dados ao vivo e contornar os training cutoffs.

Foco em STEM

Priorize o Grok para matemática de nível de pós-graduação, onde ele supera significativamente os concorrentes em tarefas zero-shot.

Verifique a Lógica Básica

Revise contagens simples ou ordenação de listas, pois o modelo pode ser inconsistente em tarefas triviais.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Perguntas Frequentes Sobre Grok-4

Encontre respostas para perguntas comuns sobre Grok-4