xai

Grok-4

xAI'den Grok-4; 2M token context window, gerçek zamanlı X platformu entegrasyonu ve dünya rekoru kıran reasoning yeteneklerine sahip bir frontier modeldir.

xai logoxaiGrok9 Temmuz 2025
Bağlam
2.0Mtoken
Maks. çıktı
8Ktoken
Giriş fiyatı
$3.00/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
87.5%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Grok-4 bu benchmark'ta 87.5% puan aldı.
HLE
44.4%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Grok-4 bu benchmark'ta 44.4% puan aldı.
MMLU
94%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Grok-4 bu benchmark'ta 94% puan aldı.
MMLU Pro
81.2%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Grok-4 bu benchmark'ta 81.2% puan aldı.
SimpleQA
48%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Grok-4 bu benchmark'ta 48% puan aldı.
IFEval
89.2%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Grok-4 bu benchmark'ta 89.2% puan aldı.
AIME 2025
100%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Grok-4 bu benchmark'ta 100% puan aldı.
MATH
92%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Grok-4 bu benchmark'ta 92% puan aldı.
GSM8k
98.4%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Grok-4 bu benchmark'ta 98.4% puan aldı.
MGSM
92.1%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Grok-4 bu benchmark'ta 92.1% puan aldı.
MathVista
72.4%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Grok-4 bu benchmark'ta 72.4% puan aldı.
SWE-Bench
81%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Grok-4 bu benchmark'ta 81% puan aldı.
HumanEval
88%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Grok-4 bu benchmark'ta 88% puan aldı.
LiveCodeBench
79.4%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Grok-4 bu benchmark'ta 79.4% puan aldı.
MMMU
75%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Grok-4 bu benchmark'ta 75% puan aldı.
MMMU Pro
59.2%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Grok-4 bu benchmark'ta 59.2% puan aldı.
ChartQA
90.5%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Grok-4 bu benchmark'ta 90.5% puan aldı.
DocVQA
93.2%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Grok-4 bu benchmark'ta 93.2% puan aldı.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Grok-4 bu benchmark'ta 54.2% puan aldı.
ARC-AGI
15.9%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Grok-4 bu benchmark'ta 15.9% puan aldı.

Grok-4 Hakkında

Grok-4'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Model Genel Bakış

Grok-4, xAI'nin frontier multimodal modelidir. İlk ilkeler (first-principles) mantığına ve gerçek zamanlı bilgi erişimine öncelik verecek şekilde oluşturulmuştur. Model, X sosyal medya platformuyla yerel entegrasyonu sayesinde önemli bir rekabet avantajı kazanır. Bu, küresel konuşmaları ve haberleri gerçekleştiği anda analiz etmesine olanak tanır. Eğitim için Colossus süper bilgisayarını kullanır, bu da matematiksel ve teknik alanlarda üst düzey performans sağlar.

Teknik Yetenekler

Mimari, reasoning varyantlarında 2 milyon token'lık context window destekler. Bu kapasite, veri kaybı olmaksızın devasa kod tabanlarının ve yoğun teknik dokümantasyonların işlenmesini sağlar. Kullanıcıların hızlı etkileşimler için yüksek hızlı bir mod ile çok adımlı mantıksal görevler için derin düşünme modu arasında seçim yaptığı ikili bir sisteme sahiptir. Heavy konfigürasyonunda çoklu agent fikir birliği mekanizması kullanarak yaklaşık %4'lük bir halüsinasyon oranını yönetir.

Ekosistem Entegrasyonu

Basit metin üretiminin ötesinde Grok-4, yerel araç kullanımı ve karmaşık function calling için tasarlanmıştır. Görüntü ve ses işlemeyi destekleyerek, multimodal uygulamalar geliştiren geliştiriciler için çok yönlü bir seçenek haline gelir. Hizalama stratejisi, standart endüstri güvenlik korumaları yerine objektif gerçeği aramaya odaklanır. Bu, diğer frontier modellerine kıyasla tartışmalı veya sivri konular için daha az reddetme ile sonuçlanır.

Grok-4

Grok-4 için Kullanım Alanları

Harika sonuçlar elde etmek için Grok-4'i kullanmanın farklı yollarını keşfedin.

Gerçek Zamanlı Duygu Analizi

Son dakika haberlerine veya ürün lansmanlarına yönelik kamuoyu tepkisini belirlemek için X'teki canlı gönderileri analiz eder.

Büyük Ölçekli Yazılım Deposu Denetimi

Mimari kusurları bulmak için 2M token penceresini kullanarak tüm yazılım depolarını değerlendirir.

Olimpiyat Seviyesinde Matematik Çözümü

Karmaşık matematiksel ispatlar ve AIME seviyesindeki problemler için adım adım çözümler sunar.

Filtresiz Yaratıcı İçerik

Diğer AI sağlayıcılarının kısıtlayıcı filtreleri olmadan karakter odaklı senaryolar ve mizah üretir.

Bilimsel Araştırma Sentezi

Teknik doğruluğu korurken aynı anda birden fazla doktora seviyesindeki akademik makaleyi özetler.

Teknik Hata Ayıklama

Üretim kodundaki belirsiz hataları tanımlar ve güncel en iyi uygulamalara dayalı düzeltmeler önerir.

Güçlü Yönler

Sınırlamalar

Üstün Matematiksel Reasoning: AIME 2025 benchmark'ında kusursuz %100 skoruna ulaşarak, mantık konusunda çoğu frontier model'i geride bıraktı.
Heavy Modu Latency'si: Çoklu agent reasoning modu, yüksek doğrulukta tek bir yanıt üretmek için birkaç dakika sürebilir.
Sektör Lideri Context Window: 2M token'lık pencere, doküman analizi ve büyük ölçekli kodlama projelerinde benzeri görülmemiş bir derinliğe olanak tanır.
Eksik Video Desteği: Metin ve görüntü yetenekleri üst düzey olsa da, kare kare yerel video işleme henüz mevcut değildir.
Canlı Sosyal Zeka: X platformuna doğrudan erişim, statik eğitim verilerinin kopyalayamayacağı gerçek zamanlı bilgiler sağlar.
Kısıtlı Bölgesel Erişim: Kalıcı bellek özellikleri, düzenleyici gereklilikler nedeniyle Avrupa Birliği'nde şu anda devre dışıdır.
Düşük Reddetme Oranı: Daha esnek bir güvenlik mimarisi, tartışmalı konularda dürüst ve objektif bir diyaloğa olanak tanır.
Görsel Hassasiyet Sınırları: Geliştiriciler, çok yüksek sadakatli görsel detayları yorumlarken modelin kısmen kör kaldığını kabul ediyor.

API Hızlı Başlangıç

xai/grok-4

Belgeleri Görüntüle
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Grok-4 Hakkında Ne Diyor

Topluluğun Grok-4 hakkında ne düşündüğünü görün

Grok 4 fast'in 2M token penceresi var!!! Neden hala ChatGPT ile boğuşup yetiniyoruz, gerçekten bilmiyorum.
myfuturewifee
reddit
ARC-AGI v2 özel alt kümesinde %15,88 puan almak çılgınca. Grok 4, aylardır %10 bariyerini aşan ilk model.
Greg (ARC-AGI Lead)
twitter
Grok 4 Heavy'deki çoklu agent çalışma grubu yaklaşımı, test-time compute'u kullanmanın doğru yoludur. Problemin püf noktasını gerçekten buluyor.
Tony_xAI
twitter
Grok 4: LiveCodeBench üzerinde 79... benchmark'lar bir modelle kod yazmanın nasıl bir his olduğunu söylemez ama bu güven verici hissettiriyor.
thankzr3ddit
reddit
Model her şeyde lisansüstü, doktora seviyesinde. Ürkütecek kadar akıllı ve herhangi bir insanın öğrenebileceğinden daha hızlı.
Elon Musk
youtube
Gerçek zamanlı arama sadece manşetleri kazımıyor; birden fazla kaynaktaki içeriği analiz ediyor.
BitBiasedAI
youtube

Grok-4 Hakkında Videolar

Grok-4 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Grok 4 Heavy daha çok mantık ve reasoning yoğun görevler içindir, normal Grok 4 ise diğerlerini halleder.

Ekrana çizim yapmam için elimi ve parmaklarımı tamamen doğru bir şekilde takip etti.

Grok 4, sadece 15 saniyelik bir düşünme sürecinden sonra context window'un derinliklerine sakladığım şifreyi buldu.

2 milyon token'lık samanlıkta iğne arama testindeki doğruluk oranı %100'dü.

Bu model, Gemini'nin context window'unu güvenilmez bulanlar için nihayet gerçek bir alternatif.

Grok 4 her şeyde lisansüstü, doktora seviyesinde; çoğu doktora sahibinden daha iyi.

Grok 4 Heavy, paralel olarak birden fazla agent oluşturur... bu bir çalışma grubu gibi.

API üzerinde ve 256k context uzunluğuna sahip, daha fazlası için planlar var.

Colossus kümesindeki eğitim, ona daha önce görmediğimiz bir reasoning yeteneği kazandırdı.

Mevcut olan en gerçeği arayan AI olacak şekilde tasarlandı.

Grok 4 Heavy, tek bir prompt'unuz üzerinde 32'ye kadar paralel AI modeli çalıştırır.

Gerçek zamanlı arama sadece manşetleri kazımıyor; birden fazla kaynaktaki içeriği analiz ediyor.

Think Mode, yanıt vermeden önce planlama yapmak ve potansiyel hataları yakalamak için ekstra hesaplama süresi harcar.

API erişiminiz varsa, loglarda agent'ların birbirleriyle tartıştığını gerçekten görebilirsiniz.

Ses ile multimodal performans, önceki nesile göre gözle görülür şekilde daha hızlı.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Grok-4 için Pro İpuçları

Grok-4'den en iyi şekilde yararlanmak için uzman ipuçları.

Arama Anahtar Kelimelerini Kullanın

Modelin gerçek zamanlı X aramasını yönlendirmek için prompt'unuza belirli hashtag'leri veya hesapları ekleyin.

Heavy Moduna Geçin

Doğruluğun yanıt hızından daha kritik olduğu görevler için Grok-4 Heavy'yi etkinleştirin.

Detaylı Personalar Sağlayın

Yaratıcı yazarlık için belirli, sivri personalar tanımlayarak esnek güvenlik uyumundan yararlanın.

Harici Bağlantıları Analiz Edin

Modelin güncel web içeriğini alıp özetlemesi için canlı URL'leri doğrudan sohbet kutusuna yapıştırın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Grok-4 Hakkında Sık Sorulan Sorular

Grok-4 hakkında sık sorulan soruların cevaplarını bulun