xai

Grok-4

Grok-4 di xAI è un frontier model con una context window di 2M di token, integrazione in tempo reale con la piattaforma X e capacità di reasoning da record...

xai logoxaiGrok9 Luglio 2025
Contesto
2.0Mtoken
Output max
8Ktoken
Prezzo input
$3.00/ 1M
Prezzo output
$15.00/ 1M
Modalita:TextImage
Capacita:VisioneStrumentiStreamingRagionamento
Benchmark
GPQA
87.5%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Grok-4 ha ottenuto 87.5% in questo benchmark.
HLE
44.4%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Grok-4 ha ottenuto 44.4% in questo benchmark.
MMLU
94%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Grok-4 ha ottenuto 94% in questo benchmark.
MMLU Pro
81.2%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Grok-4 ha ottenuto 81.2% in questo benchmark.
SimpleQA
48%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Grok-4 ha ottenuto 48% in questo benchmark.
IFEval
89.2%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Grok-4 ha ottenuto 89.2% in questo benchmark.
AIME 2025
100%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Grok-4 ha ottenuto 100% in questo benchmark.
MATH
92%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Grok-4 ha ottenuto 92% in questo benchmark.
GSM8k
98.4%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Grok-4 ha ottenuto 98.4% in questo benchmark.
MGSM
92.1%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Grok-4 ha ottenuto 92.1% in questo benchmark.
MathVista
72.4%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Grok-4 ha ottenuto 72.4% in questo benchmark.
SWE-Bench
81%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Grok-4 ha ottenuto 81% in questo benchmark.
HumanEval
88%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Grok-4 ha ottenuto 88% in questo benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Grok-4 ha ottenuto 79.4% in questo benchmark.
MMMU
75%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Grok-4 ha ottenuto 75% in questo benchmark.
MMMU Pro
59.2%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Grok-4 ha ottenuto 59.2% in questo benchmark.
ChartQA
90.5%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Grok-4 ha ottenuto 90.5% in questo benchmark.
DocVQA
93.2%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Grok-4 ha ottenuto 93.2% in questo benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Grok-4 ha ottenuto 54.2% in questo benchmark.
ARC-AGI
15.9%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Grok-4 ha ottenuto 15.9% in questo benchmark.

Informazioni su Grok-4

Scopri le capacita di Grok-4, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Panoramica

Grok-4 è l'ultimo frontier model di xAI, progettato per essere un assistente alla ricerca della verità con accesso in tempo reale alla piattaforma X. Sviluppato sul supercomputer Colossus con oltre 200.000 GPU, rappresenta un salto enorme nel reasoning, nella risoluzione di problemi matematici e nelle capacità di coding. Presenta un'architettura dual-mode unificata, che consente agli utenti di passare da una modalità reasoning di deep-thinking per enigmi complessi a una modalità ad alta velocità per risposte immediate.

Innovazioni Tecniche

Questo salto generazionale nella potenza di calcolo ha permesso prestazioni di livello dottorato in tutte le discipline accademiche simultaneamente. Il model si caratterizza in modo unico per la sua strategia di allineamento anti-woke, che dà priorità alle informazioni oggettive rispetto ai protocolli di sicurezza standard. Il suo enorme context window da 2 milioni di tokens e l'integrazione nell'ecosistema Musk, inclusi X e i veicoli Tesla, forniscono un vantaggio competitivo distintivo. Sebbene eccella nelle materie STEM e nel reasoning tecnico, rimane altamente efficiente per le attività creative quotidiane e l'analisi delle news in tempo reale.

Filosofia delle Prestazioni

Grok-4 dà priorità al pensiero basato su principi primi e alla sintesi oggettiva dei dati. Utilizzando il motore di reasoning Quasarflux, può navigare in catene logiche multi-step che tipicamente mettono in crisi i tradizionali LLM. Questo lo rende uno strumento essenziale per sviluppatori e ricercatori che richiedono output ad alta fedeltà in ambienti critici dove l'accuratezza dei fatti non è negoziabile.

Grok-4

Casi d'uso per Grok-4

Scopri i diversi modi in cui puoi usare Grok-4 per ottenere ottimi risultati.

Ricerca STEM di livello universitario

Utilizzo della modalità Thinking per risolvere problemi di fisica di livello dottorato e verificare prove matematiche complesse.

Debugging di repository massivi

Sfruttare il context window di 2M per elaborare interi codebase e identificare sottili race condition.

Intelligence finanziaria in tempo reale

Monitoraggio del Firehose di X per analizzare il sentiment del mercato e le breaking news per insight di trading.

Workflow di agenti autonomi

Gestione di task agentic complessi attraverso un robusto function calling per la logistica e l'automazione.

Analisi legale multimodale

Revisione di migliaia di pagine di documenti legali analizzando contemporaneamente foto di prove scannerizzate.

Tutoring accademico avanzato

Fornitura di tutoring personalizzato basato su principi primi nelle materie STEM, adattato ai progressi dello studente.

Punti di forza

Limitazioni

Logica e Matematica senza pari: Ha ottenuto il punteggio record mondiale del 100% nell'AIME 2025, rendendolo la scelta principale per i task tecnici.
Logica di base altalenante: Nonostante eccella negli esami universitari, il model può occasionalmente fallire in task banali come contare le lettere in una parola.
Context window leader del mercato: La finestra da 2 milioni di tokens permette l'analisi di circa 1.500 pagine di testo in un singolo prompt.
Alta barriera all'ingresso: L'accesso alla piena potenza del model Grok-4 Heavy e alle capacità di reasoning richiede un abbonamento premium.
Pipeline di dati live: L'accesso esclusivo allo streaming di dati in tempo reale della piattaforma X garantisce risposte sempre aggiornate sugli eventi globali.
Lacune nelle sfumature creative: Resta indietro rispetto a Claude 4.5 nello storytelling creativo, adottando spesso un tono più utilitaristico o provocatorio.
Intelligenza emotiva: Le alte prestazioni su EQ-Bench3 indicano una capacità superiore nel comprendere le sfumature delle emozioni umane.
Coerenza nella generazione di immagini: Gli strumenti interni faticano a mantenere la coerenza visiva su più pannelli.

Avvio rapido API

xai/grok-4

Visualizza documentazione
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Grok-4

Guarda cosa pensa la community di Grok-4

"Grok 4 sta ufficialmente dando lezioni alla concorrenza... dimostrando che xAI ha costruito un model che pensa come un predatore."
Mario Nawfal
x/twitter
"Grok 4 è un genio da livello dottorato che distrugge i benchmark, ma che occasionalmente non sa contare. Questa dualità è pazzesca."
Beginning-Willow-801
reddit
"Il salto a 2 milioni di tokens non è solo una trovata pubblicitaria; cambia radicalmente il debugging dei repository."
AI Tech Reviews
youtube
"Grok 4 è chiaramente il miglior model in termini di comprensione generale, molto avanti rispetto a GPT-5."
YMist_
reddit
"L'utilizzo esploderà con Grok 4.20. Uscirà tra 3 o 4 settimane."
Elon Musk
x/twitter
"L'integrazione in tempo reale con X è l'unica cosa che mantiene la mia ricerca rilevante in questo ciclo di notizie."
DataScientist_Alpha
hackernews

Video su Grok-4

Guarda tutorial, recensioni e discussioni su Grok-4

Il numero di parole in questa risposta è esattamente 43... Davvero impressionante.

Non solo è stato in grado di risolvere la Torre di Hanoi nel suo chain-of-thought, ma l'ha effettivamente dimostrato e visualizzato con il codice.

Amo questa risposta. Dritta al punto, diretta. Senza alcun giro di parole.

Le capacità di reasoning qui sono chiaramente un passo avanti rispetto a quelle della generazione precedente.

È finalmente un model che non sembra trattenersi dal dire la verità per essere educato.

Il selettore sperimentale per il thinking di Grok è stato rimosso di recente... portando a considerarlo potenzialmente antiquato.

Grok OS è stato il meno impressionante, con uno sfondo bianco essenziale e icone non funzionanti.

In termini di recupero puro della conoscenza, Grok-4 colpisce costantemente nel segno dove GPT-5 fallisce.

La latency nella modalità reasoning è più alta, ma la qualità dell'output giustifica l'attesa.

Se fai parte dell'ecosistema Musk, l'integrazione qui è un enorme moltiplicatore di produttività.

Nessuno vuole un model super veloce se non riesce a risolvere la logica. Ve lo dico io, ragazzi.

Darei a questo un meno uno su 10... Spazzatura totale. Non riesce nemmeno a costruire un semplice sito Next.js.

La velocità c'è, ma se la logica è fallata, a cosa servono i tokens per second?

Sembra che abbiano affrettato la variante coder solo per rispettare i tempi di rilascio.

Rimanete sul model di reasoning standard se volete davvero qualcosa che funzioni.

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti
Guarda la demo

Consigli Pro per Grok-4

Consigli esperti per aiutarti a ottenere il massimo da Grok-4 e raggiungere risultati migliori.

Passaggio tra modalità

Usa la modalità Quasarflux per la logica complessa e la modalità Tensor per la velocità, così da ottimizzare costi e performance.

Query in tempo reale

Chiedi esplicitamente i trending topics su X per sfruttare la pipeline di dati live e superare i limiti di aggiornamento del training.

Focus STEM

Dai priorità a Grok per la matematica di livello universitario, dove supera significativamente i concorrenti nei task zero-shot.

Verifica la logica di base

Controlla due volte il conteggio semplice o l'ordinamento di liste, poiché il model può essere incoerente su task banali.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Domande frequenti su Grok-4

Trova risposte alle domande comuni su Grok-4