openai

GPT-5.2 Pro

GPT-5.2 Pro, matematik, kodlama ve uzmanlık gerektiren çalışmalarda SOTA performans için Extended Thinking özelliğine sahip OpenAI'ın 2025 yılı amiral gemisi...

openai logoopenaiGPT-52025-12-11
Bağlam
400Ktoken
Maks. çıktı
128Ktoken
Giriş fiyatı
$21.00/ 1M
Çıkış fiyatı
$168.00/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
93.2%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). GPT-5.2 Pro bu benchmark'ta 93.2% puan aldı.
HLE
36.6%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. GPT-5.2 Pro bu benchmark'ta 36.6% puan aldı.
MMLU
89.6%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. GPT-5.2 Pro bu benchmark'ta 89.6% puan aldı.
MMLU Pro
82%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. GPT-5.2 Pro bu benchmark'ta 82% puan aldı.
SimpleQA
52%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. GPT-5.2 Pro bu benchmark'ta 52% puan aldı.
IFEval
93.5%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. GPT-5.2 Pro bu benchmark'ta 93.5% puan aldı.
AIME 2025
100%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. GPT-5.2 Pro bu benchmark'ta 100% puan aldı.
MATH
97%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. GPT-5.2 Pro bu benchmark'ta 97% puan aldı.
GSM8k
99.2%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. GPT-5.2 Pro bu benchmark'ta 99.2% puan aldı.
MGSM
96%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. GPT-5.2 Pro bu benchmark'ta 96% puan aldı.
MathVista
76.5%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. GPT-5.2 Pro bu benchmark'ta 76.5% puan aldı.
SWE-Bench
80%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. GPT-5.2 Pro bu benchmark'ta 80% puan aldı.
HumanEval
94.5%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. GPT-5.2 Pro bu benchmark'ta 94.5% puan aldı.
LiveCodeBench
78%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. GPT-5.2 Pro bu benchmark'ta 78% puan aldı.
MMMU
79.5%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. GPT-5.2 Pro bu benchmark'ta 79.5% puan aldı.
MMMU Pro
79.5%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. GPT-5.2 Pro bu benchmark'ta 79.5% puan aldı.
ChartQA
91.2%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. GPT-5.2 Pro bu benchmark'ta 91.2% puan aldı.
DocVQA
94.8%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. GPT-5.2 Pro bu benchmark'ta 94.8% puan aldı.
Terminal-Bench
55.6%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. GPT-5.2 Pro bu benchmark'ta 55.6% puan aldı.
ARC-AGI
54.2%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. GPT-5.2 Pro bu benchmark'ta 54.2% puan aldı.

GPT-5.2 Pro Hakkında

GPT-5.2 Pro'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Reasoning Zekasında Yeni Bir Standart

GPT-5.2 Pro, OpenAI'ın reasoning odaklı modellerinin yüksek hesaplama gücü gerektiren katmanını temsil eder. Doktora seviyesinde bilimsel araştırma ve karmaşık mantıksal inference gerektiren kurumsal iş akışları için özel olarak tasarlanmıştır. Standart dil modellerinden farklı olarak, kullanıcıların modelin düşünme çabasını ölçeklendirmesine olanak tanıyan gelişmiş bir inference süresi hesaplama mimarisi kullanır. Bu, sistemin sorunları dahili olarak ayrıştırmasını, kendi mantığını doğrulamasını ve küçük modellerde hatalara yol açan istatistiksel ön kabulleri geçersiz kılmasını sağlar.

Teknik Hassasiyet İçin Özelleştirilmiş

GPT-5 ailesiyle temel eğitimi paylaşsa da Pro varyantı, 400.000 token'lık devasa context window'u ve önemli ölçüde düşük halüsinasyon oranlarıyla ayrışır. Teorik fizik ve yüksek riskli matematiksel ispatlarda güvenilir bir işbirlikçi olduğu kanıtlanmıştır. ARC-AGI-2 ve GPQA Diamond gibi kontaminasyona dayanıklı benchmark'lardaki performansı, onu insan müdahalesi olmadan çok adımlı, teknik talimatları işlemek zorunda olan otonom ajanlar için birincil işlem motoru haline getirir.

Kurumsal Performans ve Çıktı

Model, karmaşık talimatlara sıkı sıkıya bağlı kalması ve profesyonel sohbet tonuyla karakterize edilir. Uzmanlaşmış iş görevi benchmark'larında 14 yıldan fazla deneyime sahip insan endüstri uzmanlarını tutarlı bir şekilde geride bırakan ilk modeldir. 128.000 token'a kadar üretim kapasitesi ile önceki nesillerde görülen tembellikten önemli ölçüde uzaklaşarak, tek bir geçişte tüm kod modüllerini veya kapsamlı araştırma raporlarını üretme yeteneğine sahiptir.

GPT-5.2 Pro

GPT-5.2 Pro için Kullanım Alanları

Harika sonuçlar elde etmek için GPT-5.2 Pro'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

SWE-Bench Verified üzerinde %84,5 başarı oranıyla karmaşık, çok dosyalı GitHub sorunlarını çözme ve tam modül refactoring işlemleri gerçekleştirme.

Olimpiyat Matematiği

AIME 2025 yarışma problemlerinin %100'ünü çözme ve istatistiksel öğrenme teorisindeki açık sorulara özgün kanıtlar sunma.

Kurumsal Ajan Orkestrasyonu

Çok adımlı finansal modelleme ve lojistik süreçlerini yönetmek için düzinelerce aracı sıralayabilen yüksek hesaplama gücüne sahip bir işlem motoru olarak işlev görme.

Doktora Seviyesinde Bilimsel Araştırma

Fizik, kimya ve biyoloji problemlerini %93,2 GPQA skoruyla analiz ederek birçok insan uzmanı geride bırakma.

Uzun İçerikli Belge Sentezi

Kapsamlı yasal raporlar veya teknik kılavuzlar oluşturmak için 400.000 token'a kadar arşiv verisini işleme.

Etkileşimli 3D Simülasyon

Karmaşık parçacık fiziği ve mekanik mantık dahil olmak üzere Three.js veya C++ dilinde binlerce satırlık 3D simülasyonlar oluşturma.

Güçlü Yönler

Sınırlamalar

Kusursuz Matematik Doğruluğu: AIME 2025 benchmark'ında kusursuz %100 başarı oranına ulaşarak modern yarışma seviyesindeki matematik sınavlarının sınırlarını zorlar.
Yüksek Fiyatlandırma: Milyon output token başına 168$ ile model, GPT-5.1'den yaklaşık 16 kat daha pahalıdır ve bu da kullanımını yüksek riskli iş akışlarıyla sınırlar.
State-of-the-Art Kodlama: SWE-Bench Verified üzerinde %84,5 çözüm oranına ulaşarak, önemli hata kayıtlarını sahiplenebilecek bir junior mühendis gibi etkili bir şekilde çalışır.
Eksik Hafıza Özellikleri: Daha alt katman ChatGPT 5.2 modellerinde standart olan Kaydedilmiş Anılar ve Referans Sohbet Geçmişi desteğinden yoksundur.
Gelişmiş Soyut Reasoning: ARC-AGI-2 performansını selefinin üç katına (%17,6'ya karşı %54,2) çıkararak, yeni kural türetme görevlerini ele almada bir atılım yaptığını kanıtlar.
Belirgin Latency: Derin dahili reasoning, özellikle xhigh çaba modunda, modelin tek bir prompt üzerinde 15 dakikadan fazla beklemesine neden olabilir.
Muazzam 128K Output Kapasitesi: Tek bir inference geçişinde bütün kitapları, kod depolarını veya kapsamlı bilimsel raporları oluşturmak için tasarlanmıştır.
Çerçeve Seçim Hataları: Düşünce izlerinde mantıksal kısıtlamaları doğru tespit ettiğinde bile, sağduyu görevlerinde istatistiksel ön kabulleri geçersiz kılmakta zaman zaman başarısız olur.

API Hızlı Başlangıç

openai/gpt-5.2-pro

Belgeleri Görüntüle
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Bir şirketi özelden halka açık hale getirme (take-private) projesi için borçlu satın alma modeli tasarla.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar GPT-5.2 Pro Hakkında Ne Diyor

Topluluğun GPT-5.2 Pro hakkında ne düşündüğünü görün

Reasoning mevcuttu; ancak sonuç mantıklı bir şekilde takip etmiyordu. Bu sizi durdurup düşündürmüyorsa, düşündürmeli.
Ok_Entrance_4380
reddit
GPT-5.2 Pro, teorik fizikte uzman incelemesinden geçen yeni bir sonuç türetti, 5.1 bunu yapamıyordu.
kevinweil
twitter
GPT-5.2 Pro, sorun takip sistemindeki karmaşık olmayan bir dilimi sahiplenebilecek bir junior mühendis gibi görünmeye başladı.
Due_Woodpecker2882
reddit
OpenAI, Pro modelinin hafızadan yoksun olduğunu kabul ediyor. Bir akademisyen olarak bu benim için çok yıkıcı.
Oldschool728603
hackernews
Mantık kusursuz ancak latency yüzünden çok yavaş bir dahiyle işbirliği yapıyormuşum gibi hissettiriyor.
User123
reddit
Sonunda basit bir tensör daraltma işlemi sırasında halüsinasyon görmeyen bir model.
PhysicsProf
hackernews

GPT-5.2 Pro Hakkında Videolar

GPT-5.2 Pro hakkında eğitimler, incelemeler ve tartışmalar izleyin

145 ile 147 arasında olduğu söylenen Mensa Norveç IQ skorları

24.000 satırdan fazla kod üretti

seçilebilir düşünme süresi seçeneğinin eklenmesi

Pro katmanı fiyatlandırması tamamen kurumsal bütçeler içindir

bu model tüm geliştirme birikimimi bir öğleden sonrada çözdü

halüsinasyonda %30 azalma

genel düzen, 5.1 ile bulunduğumuz yere kıyasla şaşırtıcı derecede iyi

Tam 300 kelime. İlk kez kelime sayısı verdim ve tam olarak o sayıya ulaştı

Mimari planlar üzerindeki vizyon yetenekleri benzersiz

5.1'den önemli ölçüde daha soğuk ve robotik hissettiriyor

200$'lık GPT5 Pro 25 dakika 36 saniye boyunca düşündü

iki katı inference hesaplama gücü atama

karmaşık bir problemi... kompleks analiz denilen bir alandan farklı bir tür makineye dönüştürdü

aylık 200 dolara kutu içinde bir doktora seviyesine sahip

düşünce izi, aslında kendi adımlarını doğruladığını gösteriyor

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

GPT-5.2 Pro için Pro İpuçları

GPT-5.2 Pro'den en iyi şekilde yararlanmak için uzman ipuçları.

Reasoning Çabasını Ölçeklendirin

reasoning_effort API parametresini kullanın ve mantıksal tutarlılığın üretim hızından daha önemli olduğu görevler için değeri xhigh olarak ayarlayın.

İstatistiksel Ön Kabullere Müdahale Edin

Model sağduyu tuzaklarına düşerse, aktif reasoning katmanını tetiklemek ve temel eğitimini geçersiz kılmak için bir bağlam ipucu sağlayın.

Büyük Çıktı Kapasitesinden Yararlanın

128K output bütçesinden faydalanmak için tüm proje dizinlerini veya eksiksiz dokümantasyon dosyalarını tek bir prompt ile isteyin.

Araç Entegrasyonundan Faydalanın

Vizyon görevleri için her zaman fonksiyon çağırmayı (function calling) etkinleştirin; model, görsel verileri doğrulamak için araçları kullanabildiğinde multimodal performansı artar.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

GPT-5.2 Pro Hakkında Sık Sorulan Sorular

GPT-5.2 Pro hakkında sık sorulan soruların cevaplarını bulun