xai

Grok-3

Grok-3, xAI'ın amiral gemisi reasoning modelidir; derin mantık yürütme yetenekleri, 128k context window ve canlı araştırma ile kodlama süreçleri için X ile...

xai logoxaiGrokFebruary 17, 2025
Bağlam
128Ktoken
Maks. çıktı
8Ktoken
Giriş fiyatı
$3.00/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
84.6%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Grok-3 bu benchmark'ta 84.6% puan aldı.
HLE
36%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Grok-3 bu benchmark'ta 36% puan aldı.
MMLU
87.5%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Grok-3 bu benchmark'ta 87.5% puan aldı.
MMLU Pro
76.5%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Grok-3 bu benchmark'ta 76.5% puan aldı.
SimpleQA
42%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Grok-3 bu benchmark'ta 42% puan aldı.
IFEval
91.2%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Grok-3 bu benchmark'ta 91.2% puan aldı.
AIME 2025
93.3%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Grok-3 bu benchmark'ta 93.3% puan aldı.
MATH
94.4%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Grok-3 bu benchmark'ta 94.4% puan aldı.
GSM8k
98.7%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Grok-3 bu benchmark'ta 98.7% puan aldı.
MGSM
92.4%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Grok-3 bu benchmark'ta 92.4% puan aldı.
MathVista
71.3%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Grok-3 bu benchmark'ta 71.3% puan aldı.
SWE-Bench
49%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Grok-3 bu benchmark'ta 49% puan aldı.
HumanEval
94.5%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Grok-3 bu benchmark'ta 94.5% puan aldı.
LiveCodeBench
79.4%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Grok-3 bu benchmark'ta 79.4% puan aldı.
MMMU
78%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Grok-3 bu benchmark'ta 78% puan aldı.
MMMU Pro
58.5%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Grok-3 bu benchmark'ta 58.5% puan aldı.
ChartQA
89.2%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Grok-3 bu benchmark'ta 89.2% puan aldı.
DocVQA
92.4%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Grok-3 bu benchmark'ta 92.4% puan aldı.
Terminal-Bench
52%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Grok-3 bu benchmark'ta 52% puan aldı.
ARC-AGI
12.5%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Grok-3 bu benchmark'ta 12.5% puan aldı.

Grok-3 Hakkında

Grok-3'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Sınırları Zorlayan Reasoning ve Zeka

Grok-3, xAI'ın 100.000'den fazla NVIDIA H100 GPU içeren Colossus süper bilgisayar kümesinde eğitilmiş, yapay zekada devasa bir sıçramayı temsil eder. Özellikle karmaşık mantık, matematiksel çıkarım ve kritik yazılım mühendisliği görevlerinde başarılı olmak için tasarlanmıştır. Hızlı yanıt üretimine öncelik veren geleneksel modellerin aksine Grok-3, nihai bir çıktı sunmadan önce kendi dahili reasoning adımlarını doğrulamak için devasa test-time compute kullanan özel bir Deep Thinking moduna sahiptir.

Gerçek Zamanlı Bilgi Entegrasyonu

Grok-3'ün temel farkı, X platformunun gerçek zamanlı veri akışına benzersiz erişimidir. Bu, modelin son dakika haberlerini, finansal değişimleri ve küresel trendleri saniyeler içinde sentezlemesine olanak tanır; oysa diğer modeller bilgi kesintilerine veya daha yavaş web arama araçlarına dayanır. 128.000 token'lık context window ile birleşen bu gerçek zamanlı farkındalık, onu güncel içgörülere ihtiyaç duyan pazar araştırmacıları ve veri bilimcileri için vazgeçilmez bir araç haline getirir.

Multimodal ve Agentic Yetenekler

Metin ve mantığın ötesinde Grok-3, karmaşık teknik diyagramları, planları ve görsel verileri frontier-level hassasiyetle yorumlayabilen güçlü bir multimodal model olup görüntü işleme yeteneğine sahiptir. Gelişmiş function calling ve araç kullanımını destekleyerek otonom agent'lar için bilişsel bir motor görevi görmesini sağlar. HumanEval'de %94,5 puan alarak, otonom hata ayıklama ve mimari refactoring konularında rakiplerine rakip olan veya onları geride bırakan, şu anki en yetenekli kodlama asistanlarından biri olarak öne çıkmaktadır.

Grok-3

Grok-3 için Kullanım Alanları

Harika sonuçlar elde etmek için Grok-3'i kullanmanın farklı yollarını keşfedin.

İleri Düzey Yazılım Mühendisliği

Derin reasoning ve %94,5 HumanEval doğruluğu ile karmaşık mimari sorunları çözme ve tüm kod tabanlarını refactor etme.

Gerçek Zamanlı Pazar İstihbaratı

Canlı X verilerinden yararlanarak son dakika finans haberlerini ve tüketici duyarlılığını geleneksel arama motorlarından daha hızlı sentezleme.

Bilimsel Veri Sentezi

Yeni araştırma bağlantılarını ve hipotezleri belirlemek için Deep Research modunda binlerce sayfalık akademik dergiyi işleme.

Multimodal Belge Analizi

Frontier-level görüntüleme yeteneklerini kullanarak karmaşık teknik diyagramları, planları ve finansal grafikleri yorumlama.

Yarışma Düzeyinde Özel Ders

Think modunu kullanarak karmaşık Olimpiyat düzeyi matematik ve fizik problemlerini anlaşılır, doğrulanmış adımlara ayırma.

Agentic İş Akışı Otomasyonu

Üretim ortamlarında hassas function calling ve araç kullanımı gerektiren otonom agent'lar için temel motor görevi görme.

Güçlü Yönler

Sınırlamalar

Üstün Reasoning: AIME 2025 (%93,3) ve MATH (%94,4) gibi karmaşık matematik benchmark testlerinde önde gelen rakiplerini geride bırakır.
Think Modunda Yüksek Latency: Karmaşık reasoning prompt'ları, Think modunda doğrulanmış bir yanıt oluşturmak için 60 saniyeden fazla sürebilir.
Entegre Deep Research: Canlı X verilerini rakiplerinden önemli ölçüde daha hızlı sentezleyen benzersiz bir web arama yeteneğine sahiptir.
Yerleşik Video veya Ses Desteği Yok: Gemini 2.0 gibi rakiplerde bulunan gerçek zamanlı multimodal ses ve video işleme özelliklerinden yoksundur.
Üst Düzey Kodlama Performansı: HumanEval'de %94,5 puan alarak otonom yazılım geliştirme ve hata ayıklama için birinci sınıf bir seçenek haline gelir.
Sıkı Kullanım Kotaları: Premium+ aboneleri için mesaj limitleri, yoğun saatlerde bazı köklü rakiplerden daha düşüktür.
Şeffaf Düşünme Trace'leri: Kullanıcıların modelin mantığını adım adım görmesine olanak tanıyarak güveni artırır ve karmaşık hataların ayıklanmasını kolaylaştırır.
Beta Kararlılık Sorunları: Kullanıcılar, yüksek trafikli dönemlerde zaman zaman sunucu hatalarıyla veya kesintiye uğramış düşünme trace'leriyle karşılaşabilir.

API Hızlı Başlangıç

xai/grok-3

Belgeleri Görüntüle
xai SDK
import OpenAI from "openai";

const xai = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1"
});

const response = await xai.chat.completions.create({
  model: "grok-3",
  messages: [{ role: "user", content: "Analyze current X trends for AGI." }],
  stream: true
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Grok-3 Hakkında Ne Diyor

Topluluğun Grok-3 hakkında ne düşündüğünü görün

"Grok-3'ün deep research özelliği, OpenAI sürümünden önemli ölçüde daha hızlı ve doğru."
TechEnthusiast
x
"Kodlama performansı kesinlikle çılgınca; saatlerce uğraştığım bir hatayı saniyeler içinde çözdü."
DevLife
reddit
"Grok-3, tartışmasız bugün mevcut olan en ileri reasoning model seçeneğidir."
DataCamp
youtube
"Düşünme trace'leri DeepSeek'e çok benziyor ancak hızı bambaşka bir seviyede."
AIResearcher
hackernews
"Teknik planlar üzerindeki görüntüleme yetenekleri nihayet gerçek mühendislik işleri için kullanılabilir hale gelmiş."
EngDesign
reddit
"X entegrasyonu, gerçek zamanlı kripto veya hisse senedi duyarlılığını takip eden herkes için büyük bir avantaj sağlıyor."
FinancePro
x

Grok-3 Hakkında Videolar

Grok-3 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Grok 3, tartışmasız bugün mevcut olan en ileri reasoning model seçeneğidir

OpenAI deep search işlevinden çok daha kaliteli bir çıktı sağladı

Deep research modunun hızı O1 ile kıyaslandığında oldukça etkileyici

Modelin birden fazla arama sonucunu aynı anda taradığını gerçekten görebiliyorsunuz

Mantıksal tutarlılık açısından Grok-2'den bu yana önemli bir sıçrama yapılmış

Grok 3 ve Grok 3 mini, yayınlanmış tüm reasoning modellerinden daha iyi

Mantık daha doğal... Bu, şimdiye kadar gördüğüm en insan benzeri reasoning yeteneği

Dahili düşünme trace'i, mantığa çok daha net bir bakış sağlıyor

Sadece tahmin etmiyor; System 2 thinking'in bir göstergesi olarak işini kontrol ediyor

AIME benchmark testlerindeki matematik performansı gerçekten state-of-the-art düzeyinde

Bu benchmark testlerinde Grok 3'ün genel olarak oldukça iyi performans gösterdiğini görebilirsiniz

Diğer rakiplerle karşılaştırıldığında oldukça gelecek vaat ediyor

Buradaki asıl olay, sektörün en iyileriyle yarışan kodlama performansı

Önceki sürümlerin başarısız olduğu mimari refactoring görevlerini başarıyla yerine getiriyor

X API entegrasyonu, onu güncel olaylar için benzersiz şekilde güçlü kılıyor

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları
Demo videoyu izle

Grok-3 için Pro İpuçları

Grok-3'den en iyi şekilde yararlanmak için uzman ipuçları.

Deep Thinking'i Açın

Matematik veya mantık görevlerinde, test-time compute aracılığıyla adım adım doğrulama sağlamak için her zaman Think modunu etkinleştirin.

X Entegrasyonundan Yararlanın

Bilgi kesintileri nedeniyle diğer LLM modellerinin erişemediği verilere ulaşmak için son dakika haberleri veya güncel olaylar hakkında spesifik sorgular kullanın.

Trace'leri İnceleyin

Modelin tam olarak nerede işlem gücü harcadığını belirlemek ve mantıksal yolunu doğrulamak için dahili düşünme trace'lerini gözden geçirin.

UI için Görüntü İşleme

Kullanıcı arayüzü tasarımlarının ekran görüntülerini yükleyin ve hızlı ön uç prototipleme için Grok'tan ilgili React veya Tailwind kodlarını oluşturmasını isteyin.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Grok-3 Hakkında Sık Sorulan Sorular

Grok-3 hakkında sık sorulan soruların cevaplarını bulun