openai

GPT-5.4

GPT-5.4, 1,05 milyon context window ve Extreme Reasoning özelliklerine sahip OpenAI'ın frontier model ürünüdür. Otonom UI etkileşimi ve uzun soluklu veri...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54 Mart 2026
Bağlam
1.1Mtoken
Maks. çıktı
128Ktoken
Giriş fiyatı
$2.50/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
84.2%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). GPT-5.4 bu benchmark'ta 84.2% puan aldı.
HLE
42%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. GPT-5.4 bu benchmark'ta 42% puan aldı.
MMLU
91%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. GPT-5.4 bu benchmark'ta 91% puan aldı.
MMLU Pro
76%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. GPT-5.4 bu benchmark'ta 76% puan aldı.
SimpleQA
56.7%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. GPT-5.4 bu benchmark'ta 56.7% puan aldı.
IFEval
92%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. GPT-5.4 bu benchmark'ta 92% puan aldı.
AIME 2025
100%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. GPT-5.4 bu benchmark'ta 100% puan aldı.
MATH
88.6%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. GPT-5.4 bu benchmark'ta 88.6% puan aldı.
GSM8k
99%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. GPT-5.4 bu benchmark'ta 99% puan aldı.
MGSM
96%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. GPT-5.4 bu benchmark'ta 96% puan aldı.
MathVista
74%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. GPT-5.4 bu benchmark'ta 74% puan aldı.
SWE-Bench
52.8%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. GPT-5.4 bu benchmark'ta 52.8% puan aldı.
HumanEval
85.1%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. GPT-5.4 bu benchmark'ta 85.1% puan aldı.
LiveCodeBench
72.5%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. GPT-5.4 bu benchmark'ta 72.5% puan aldı.
MMMU
84.2%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. GPT-5.4 bu benchmark'ta 84.2% puan aldı.
MMMU Pro
61%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. GPT-5.4 bu benchmark'ta 61% puan aldı.
ChartQA
89%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. GPT-5.4 bu benchmark'ta 89% puan aldı.
DocVQA
94%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. GPT-5.4 bu benchmark'ta 94% puan aldı.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. GPT-5.4 bu benchmark'ta 55% puan aldı.
ARC-AGI
52.9%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. GPT-5.4 bu benchmark'ta 52.9% puan aldı.

GPT-5.4 Hakkında

GPT-5.4'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Uzun Bağlamlı Reasoning Dünyasının Öncüsü

GPT-5.4, endüstri lideri 1,05 milyon token context window kapasitesiyle karakterize edilen GPT-5 serisinin yüksek performanslı evrimini temsil eder. Bu model, yüksek sadakatli reasoning yeteneğini kaybetmeden devasa kod depoları veya çok yıllık geçmiş loglar gibi kapsamlı veri kümelerini işlemek için özel olarak tasarlanmıştır. Öne çıkan bir özellik olan interaktif "Mid-Response Steering", kullanıcıların modelin düşünme planını gerçek zamanlı olarak görsel olarak izlemesine ve ayarlamasına olanak tanıyarak çıktının karmaşık ve çok adımlı niyetlerle mükemmel şekilde hizalanmasını sağlar.

Birleşik Zeka ve Otonom Eylem

Teknik olarak GPT-5.4, önceki Codex odaklı dalların dünya standartlarındaki kodlama güçlerini standart GPT-5 serisinin yaratıcı nüanslarıyla birleştirir. Doktora düzeyindeki bilim ve mantık problemlerini çözmek için güçlendirilmiş chain-of-thought işlemeyi kullanan, ayarlanabilir efor seviyelerine (Standard, Extended ve Heavy) sahip özel bir "Thinking" modu sunar. Metnin ötesinde, GPT-5.4 yerel bilgisayar kullanım yeteneklerini tanıtarak, yüksek sadakatli görsel ekran görüntülerini yorumlayıp koordinat tabanlı tıklamalar gerçekleştirerek OSWorld-Verified görevlerinde %75 puan elde etmiştir.

Verimlilik ve Güvenilirlik

OpenAI, öncekilere kıyasla iddia düzeyindeki hatalarda %33'lük önemli bir düşüş bildirerek GPT-5.4'ü otonom agentlar ve yüksek riskli karar destek süreçleri için birincil seçenek haline getirmiştir. Gücüne rağmen, token ve enerji verimliliği için tasarlanmış olup önceki sürümlere göre daha düşük maliyetli uzun bağlamlı işleme imkanı sağlar. İster tüm bir kurumsal kod tabanını yönetiyor ister otonom bir planlama ajanı olarak görev yapıyor olsun, GPT-5.4 üretken yapay zeka ortamında güvenilirlik ve agentic performans için yeni bir standart belirlemektedir.

GPT-5.4

GPT-5.4 için Kullanım Alanları

Harika sonuçlar elde etmek için GPT-5.4'i kullanmanın farklı yollarını keşfedin.

Geniş Kod Tabanı Refaktörü

Modüller arası tutarlılığı sağlamak ve tüm depolar genelindeki derin anlamsal hataları belirlemek için yüzlerce kaynak dosyasını aynı anda işleme ve analiz etme.

Otonom Agentic Planlama

Karmaşık etkinlik programlarını otonom olarak koordine etmek ve takip iletişimlerini göndermek için görsel temellendirme yoluyla e-posta ve takvimlerle etkileşim kurma.

Yüksek Sadakatli Mimari Tasarım

1.000 satırdan fazla hassas ve simülasyona hazır kod kullanarak işlevsel metro istasyonları gibi karmaşık 3D sahneler ve yapısal planlar oluşturma.

Uzun Vadeli Bilimsel Planlama

Doktora düzeyindeki bilimsel problemleri çözmek ve saatlerce süren tutarlı durum yönetimi gerektiren çok adımlı analizleri gerçekleştirmek için Extreme Reasoning kullanma.

Siber Güvenlik Olay İncelemesi

Güvenlik ihlallerini otonom olarak tanımlamak, incelemek ve raporlamak için tek bir 1,05 milyonluk context oturumunda büyük miktarlarda ham log verisini işleme.

İnteraktif Mid-Response Steering

Promptu yeniden başlatmaya gerek kalmadan mimari seçimleri veya mantık yollarını ayarlamak için modelin dahili 'düşünme' aşamasında rotasını düzeltme.

Güçlü Yönler

Sınırlamalar

Öncü 1.05M Context Window: Büyük veri kümeleri ve kod tabanları üzerinde tutarlılığı kaybetmeden tek bir prompt ile reasoning yapabilmek için sektör lideri kapasite sağlar.
Uzun Context Performans Düşüşü: Context window 256 bin token sınırını aştığında, yüksek karmaşıklıktaki reasoning görevlerinde performansın önemli ölçüde düştüğü kaydedilmiştir.
Extreme Reasoning Doğruluğu: Yüksek eforlu reasoning modunu kullanarak doktora düzeyinde bilim bilgisine (GPQA'da %84,2) ve mükemmel matematik puanlarına (AIME 2025'te %100) ulaşır.
Karmaşık Versiyon Şeması: 5.1, 5.2 Thinking, 5.3 Codex ve 5.4 varyantlarından oluşan karmaşık ürün yelpazesi, API geliştiricileri ve Chat kullanıcıları için önemli bir bilişsel yük oluşturur.
Otonom UI Etkileşimi: State-of-the-art görsel temellendirme, modelin OSWorld benchmark testinde %75 doğrulukla yazılımlar ve tarayıcılarla etkileşime girmesini sağlar.
Heavy Modda Yüksek Latency: En yüksek reasoning efor modlarının dahili CoT sürecini işlemesi 8 dakikadan fazla sürebilir, bu da onları gerçek zamanlı interaktif görevler için uygunsuz kılar.
Token ve Enerji Verimliliği: OpenAI'ın şimdiye kadarki en verimli frontier model ürünü olarak tasarlanmıştır ve GPT-5.2 sürümüne kıyasla karmaşık reasoning için gereken enerji maliyetini azaltır.
Nevrotik Hizalama: Agresif güvenlik ince ayarları (fine-tuning), modelin zararsız olgusal konularda bile kullanıcıyla gereksiz yere çeliştiği muhalif davranışlara yol açabilir.

API Hızlı Başlangıç

openai/gpt-5.4

Belgeleri Görüntüle
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar GPT-5.4 Hakkında Ne Diyor

Topluluğun GPT-5.4 hakkında ne düşündüğünü görün

GPT-5 muazzam bir geri dönüş yapıyor... ürettiği her bir kod satırı eksiksiz çalışıyordu.
immortalsol
reddit
En göze çarpan özellik, diğer modellerin desteklediği yaklaşık 200 bin seviyesine kıyasla bariz bir şekilde 1 milyonluk context window kapasitesi.
Developer
hackernews
Vay canına, GPT 5.4 inanılmaz iyi. Bu 6.0 sürümüne bir adım olmalıydı. Codex'in bu kadar ilerlediğine inanmak zor.
Rahul Sood
twitter
GPT-5.4, NYT Connections testinde 94,0 gibi çok yüksek bir puan alıyor. İlk denemede her şeyi doğru anlıyor.
senko
hackernews
GPT-5.4 artık Artificial Analysis Intelligence Index'te yer alıyor... Gemini 3.1 Pro ile kafa kafaya.
AiBattle
twitter
Reasoning derinliği nihayet kurumsal ölçekteki mimari problemleri çözebilecek seviyeye ulaştı.
CloudArchitect99
reddit

GPT-5.4 Hakkında Videolar

GPT-5.4 hakkında eğitimler, incelemeler ve tartışmalar izleyin

1 milyon 50 bin tokenlık bir context window... bu gerçekten çok uzun bir bağlam penceresi.

5 dakika 22 saniyelik bir düşünme sürecinin ardından sonucu aldık... bunu daha agentic bir yaklaşımla test etti.

Yüksek sadakatli görüntüleri inceleme yeteneği güncellendi... toplam 10,24 milyon piksele kadar.

Model, kendi mantığını doğrulamak için web genelinde fiilen araştırma yapıyor.

Bu, durumun kalıcı olması gereken agentic iş akışları için devasa bir sıçrama.

GPT 5.4 her şeye sahip... temelde 5.2 ve GPT 5.3 Codex'e 'hadi bir bebek yapın' demişler gibi.

Kodlama yetenekleri inanılmaz. Esasen kusursuz.

Front-end zevki Opus 4.6 ve Gemini 3.1 Pro'nun oldukça gerisinde.

Nüanslı geliştirici niyetini çok daha iyi anladığını hissettiriyor.

1 milyon token pencere boyutu düşünüldüğünde fiyat noktası rekabetçi.

Bu durum OpenAI üzerinde 1 milyon context kapasitesine sahip bir modelle yanıt verme baskısı oluşturuyor.

Modelin tek seferde bu Minecraft klonunu oluşturabilmesi tek kelimeyle olağanüstü.

Olgusal halüsinasyon oranlarında yüzde 33'lük bir azalma görüyoruz.

Reasoning modları Standard, Extended ve Heavy seviyeleri olarak kategorize edilmiş.

OSWorld benchmark testindeki görsel temellendirme şu an sektör lideri konumunda.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

GPT-5.4 için Pro İpuçları

GPT-5.4'den en iyi şekilde yararlanmak için uzman ipuçları.

Reasoning Eforunu Ayarlayın

Hesaplama maliyeti ve çıktı kalitesini dengelemek için görevin karmaşıklığına göre Standard, Extended veya Heavy reasoning efor seviyelerini kullanın.

Ön Planı İzleyin

Thinking varyantını kullanırken önceden sunulan planı takip edin; modelin önerdiği mantık yolu hatalı görünüyorsa üretim sırasında müdahale edebilirsiniz.

Stratejik Prompt Caching

Maliyet tasarrufu sağlamak amacıyla OpenAI'ın otomatik prompt caching özelliğinden yararlanmak için büyük, statik bağlam bloklarını promptun başına yerleştirin.

Context Kararlılığını Yönetin

1,05 milyonluk pencere güçlü olsa da, performansın ilk 256 bin token içinde en kararlı olduğu bildirilmektedir; kritik özetleri promptun sonuna yakın tutun.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

GPT-5.4 Hakkında Sık Sorulan Sorular

GPT-5.4 hakkında sık sorulan soruların cevaplarını bulun