xai

Grok-4

xAI tarafından geliştirilen Grok-4; 2M token context window, gerçek zamanlı X platformu entegrasyonu ve dünya rekoru kıran akıl yürütme yeteneklerine sahip bir...

xai logoxaiGrokJuly 9, 2025
Bağlam
2.0Mtoken
Maks. çıktı
8Ktoken
Giriş fiyatı
$3.00/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
87.5%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Grok-4 bu benchmark'ta 87.5% puan aldı.
HLE
44.4%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Grok-4 bu benchmark'ta 44.4% puan aldı.
MMLU
94%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Grok-4 bu benchmark'ta 94% puan aldı.
MMLU Pro
81.2%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Grok-4 bu benchmark'ta 81.2% puan aldı.
SimpleQA
48%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Grok-4 bu benchmark'ta 48% puan aldı.
IFEval
89.2%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Grok-4 bu benchmark'ta 89.2% puan aldı.
AIME 2025
100%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Grok-4 bu benchmark'ta 100% puan aldı.
MATH
92%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Grok-4 bu benchmark'ta 92% puan aldı.
GSM8k
98.4%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Grok-4 bu benchmark'ta 98.4% puan aldı.
MGSM
92.1%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Grok-4 bu benchmark'ta 92.1% puan aldı.
MathVista
72.4%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Grok-4 bu benchmark'ta 72.4% puan aldı.
SWE-Bench
81%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Grok-4 bu benchmark'ta 81% puan aldı.
HumanEval
88%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Grok-4 bu benchmark'ta 88% puan aldı.
LiveCodeBench
79.4%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Grok-4 bu benchmark'ta 79.4% puan aldı.
MMMU
75%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Grok-4 bu benchmark'ta 75% puan aldı.
MMMU Pro
59.2%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Grok-4 bu benchmark'ta 59.2% puan aldı.
ChartQA
90.5%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Grok-4 bu benchmark'ta 90.5% puan aldı.
DocVQA
93.2%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Grok-4 bu benchmark'ta 93.2% puan aldı.
Terminal-Bench
54.2%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Grok-4 bu benchmark'ta 54.2% puan aldı.
ARC-AGI
15.9%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Grok-4 bu benchmark'ta 15.9% puan aldı.

Grok-4 Hakkında

Grok-4'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Genel Bakış

Grok-4, xAI'ın X platformuna gerçek zamanlı erişimi olan, gerçeği arayan bir asistan olarak tasarlanmış en yeni frontier AI modelidir. 200.000'den fazla GPU'ya sahip Colossus süper bilgisayar kümesi üzerinde inşa edilen model; reasoning, matematiksel problem çözme ve kodlama yeteneklerinde devasa bir sıçramayı temsil eder. Kullanıcıların karmaşık bulmacalar için derin düşünme sağlayan bir reasoning modu ile anında yanıtlar için yüksek hızlı bir mod arasında geçiş yapmasına olanak tanıyan birleşik bir çift modlu mimariye sahiptir.

Teknik Yenilikler

Hesaplama gücündeki bu nesilsel sıçrama, tüm akademik disiplinlerde aynı anda doktora düzeyinde performans sergilenmesini sağlamıştır. model, standart güvenlik önlemleri yerine nesnel bilgiyi önceliklendiren anti-woke hizalama stratejisiyle benzersiz bir şekilde karakterize edilir. Devasa 2 milyon tokens context window kapasitesi ve X ile Tesla araçları dahil olmak üzere Musk ekosistemine entegrasyonu, belirgin bir rekabet avantajı sağlar. STEM ve teknik reasoning alanlarında mükemmel olsa da günlük yaratıcı görevler ve gerçek zamanlı haber analizi için son derece verimli olmaya devam etmektedir.

Performans Felsefesi

Grok-4, temel ilkelere dayalı düşünmeyi ve nesnel veri sentezini önceliklendirir. Quasarflux reasoning motorunu kullanarak, geleneksel LLM modellerini genellikle raydan çıkaran çok aşamalı mantık zincirlerini yönetebilir. Bu, olgusal doğruluğun tartışılmaz olduğu yüksek riskli ortamlarda yüksek sadakatli çıktılara ihtiyaç duyan geliştiriciler ve araştırmacılar için onu temel bir araç haline getirir.

Grok-4

Grok-4 için Kullanım Alanları

Harika sonuçlar elde etmek için Grok-4'i kullanmanın farklı yollarını keşfedin.

Lisansüstü STEM Araştırması

Doktora düzeyindeki fizik problemlerini çözmek ve karmaşık matematiksel kanıtları doğrulamak için Thinking modunu kullanmak.

Devasa Depo Hata Ayıklama

Tüm kod tabanlarını içe aktarmak ve sinsi yarış durumlarını (race conditions) belirlemek için 2M context window kapasitesinden yararlanmak.

Gerçek Zamanlı Finansal İstihbarat

Alım-satım öngörüleri için piyasa duyarlılığını ve son dakika haberlerini analiz etmek üzere X Firehose'u izlemek.

Otonom Agent İş Akışları

Lojistik ve otomasyon için güçlü function calling aracılığıyla karmaşık agentic görevlere güç sağlamak.

Çok Modlu Hukuk Analizi

Binlerce sayfalık inceleme belgesini okurken taranmış kanıt fotoğraflarını analiz etmek.

Gelişmiş Akademik Özel Ders

Öğrencinin ilerlemesine uyarlanan, STEM konularında temel ilkelere dayalı kişiselleştirilmiş özel dersler sunmak.

Güçlü Yönler

Sınırlamalar

Eşsiz Matematik ve Mantık: AIME 2025'te %100 puan alarak dünya rekoru kırdı ve teknik görevler için birincil tercih haline geldi.
Kesintili Temel Mantık: Lisansüstü sınavlarda çok başarılı olmasına rağmen, model bir kelimedeki harfleri saymak gibi basit görevlerde bazen başarısız olabilir.
Pazar Lideri Context: 2 milyon tokens context window, tek bir prompt içinde yaklaşık 1.500 sayfalık metnin analiz edilmesine olanak tanır.
Yüksek Giriş Bariyeri: Tam güçlü Grok-4 Heavy modeline ve reasoning yeteneklerine erişim premium abonelik gerektirir.
Canlı Veri Hattı: X platformunun gerçek zamanlı veri akışına özel erişim, yanıtların küresel olaylar konusunda güncel olmasını sağlar.
Yaratıcı Nüans Eksiklikleri: Yaratıcı hikaye anlatımında Claude 4.5'in gerisinde kalır; genellikle daha faydacı veya sert bir ton benimser.
Duygusal Zeka: EQ-Bench3 üzerindeki yüksek performans, karmaşık insan duygularını anlama konusunda üstün bir yeteneğe işaret eder.
Görsel Üretim Tutarlılığı: Dahili araçlar, birden fazla panelde görsel tutarlılığı korumakta zorlanmaktadır.

API Hızlı Başlangıç

xai/grok-4

Belgeleri Görüntüle
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Grok-4 Hakkında Ne Diyor

Topluluğun Grok-4 hakkında ne düşündüğünü görün

"Grok 4 resmen rakiplerine ders veriyor... xAI'ın avcı gibi düşünen bir model inşa ettiğini kanıtlıyor."
Mario Nawfal
x/twitter
"Grok 4, benchmark canavarı, doktora düzeyinde bir dahi ama bazen sayı sayamıyor. Bu ikilem çılgınca."
Beginning-Willow-801
reddit
"2 milyon tokens kapasitesine geçiş sadece bir gösteriş değil; depo hata ayıklama sürecini temelden değiştiriyor."
AI Tech Reviews
youtube
"Grok 4, genel anlama açısından açık ara en iyi model, GPT-5'in çok önünde."
YMist_
reddit
"Grok 4.20 ile kullanım tavan yapacak. 3 veya 4 hafta içinde çıkıyor."
Elon Musk
x/twitter
"Gerçek zamanlı X entegrasyonu, bu haber döngüsünde araştırmalarımı güncel tutan tek şey."
DataScientist_Alpha
hackernews

Grok-4 Hakkında Videolar

Grok-4 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Bu yanıttaki kelime sayısı tam olarak 43... Süper etkileyici.

Sadece chain-of-thought sürecinde Hanoi Kuleleri'ni çözmekle kalmadı, aynı zamanda bunu kanıtladı ve kodla görselleştirdi.

Bu cevabı seviyorum. Net ve doğrudan. Hiç lafı dolandırmıyor.

Buradaki reasoning yetenekleri önceki nesilde gördüklerimizin açıkça bir adım ötesinde.

Sonunda nazik olmak adına gerçekleri saklıyormuş gibi hissettirmeyen bir model.

Grok için deneysel düşünme butonu yakın zamanda kaldırıldı... bu da potansiyel olarak miadını doldurmuş olarak nitelendirilmesine yol açtı.

Grok OS en az etkileyici olanıydı; temel beyaz bir arka plana ve bozuk simgelere sahipti.

Ham bilgi geri çağırma açısından Grok-4, GPT-5'in kaçırdığı noktalarda sürekli olarak hedefi vuruyor.

reasoning modundaki latency daha yüksek ancak çıktının kalitesi beklemeye değer.

Eğer Musk ekosistemindeyseniz, buradaki entegrasyon devasa bir verimlilik çarpanıdır.

Mantığı çözemiyorsa kimse süper hızlı bir model istemez. Bunu size bedavaya söyleyebilirim çocuklar.

Buna 10 üzerinden eksi bir veririm... Tamamen çöp. Basit bir Next.js web sitesi bile kuramıyor.

Hız orada ama mantık bozuksa saniyedeki tokens hızının ne anlamı var?

Sırf lansman döngüsüne yetişmek için coder varyantını aceleye getirmişler gibi hissettiriyor.

Eğer gerçekten çalışan bir şey istiyorsanız standart reasoning modelini kullanmaya devam edin.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları
Demo videoyu izle

Grok-4 için Pro İpuçları

Grok-4'den en iyi şekilde yararlanmak için uzman ipuçları.

Mod Değiştirme

Maliyet ve performansı optimize etmek için karmaşık mantık yürütme süreçlerinde Quasarflux modunu, hız için Tensor modunu kullanın.

Gerçek Zamanlı Sorgular

Canlı veri hattından yararlanmak ve eğitim kesinti tarihlerini aşmak için X üzerindeki trend konuları açıkça prompt edin.

STEM Odaklılık

Sıfır-atışlı (zero-shot) görevlerde rakiplerinden önemli ölçüde daha iyi performans gösterdiği lisansüstü matematik soruları için Grok'a öncelik verin.

Temel Mantığı Doğrulayın

model önemsiz görevlerde tutarsız olabildiğinden, basit sayma veya liste sıralama işlemlerini iki kez kontrol edin.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Grok-4 Hakkında Sık Sorulan Sorular

Grok-4 hakkında sık sorulan soruların cevaplarını bulun