anthropic

Claude Sonnet 4.5

Anthropic'in Claude Sonnet 4.5 modeli, yeni nesil otonom agent'lar için optimize edilmiş dünya lideri kodlama yeteneği (%77,2 SWE-bench) ve 200K context window...

Yapay Zeka KodlamaAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 429 Eylül 2025
Bağlam
200Ktoken
Maks. çıktı
64Ktoken
Giriş fiyatı
$3.00/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImageAudioVideo
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
83%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Claude Sonnet 4.5 bu benchmark'ta 83% puan aldı.
HLE
34%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Claude Sonnet 4.5 bu benchmark'ta 34% puan aldı.
MMLU
89%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Claude Sonnet 4.5 bu benchmark'ta 89% puan aldı.
MMLU Pro
78%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Claude Sonnet 4.5 bu benchmark'ta 78% puan aldı.
SimpleQA
52%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Claude Sonnet 4.5 bu benchmark'ta 52% puan aldı.
IFEval
88%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Claude Sonnet 4.5 bu benchmark'ta 88% puan aldı.
AIME 2025
87%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Claude Sonnet 4.5 bu benchmark'ta 87% puan aldı.
MATH
87%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Claude Sonnet 4.5 bu benchmark'ta 87% puan aldı.
GSM8k
98%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Claude Sonnet 4.5 bu benchmark'ta 98% puan aldı.
MGSM
92%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Claude Sonnet 4.5 bu benchmark'ta 92% puan aldı.
MathVista
72%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Claude Sonnet 4.5 bu benchmark'ta 72% puan aldı.
SWE-Bench
77%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Claude Sonnet 4.5 bu benchmark'ta 77% puan aldı.
HumanEval
94%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Claude Sonnet 4.5 bu benchmark'ta 94% puan aldı.
LiveCodeBench
68%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Claude Sonnet 4.5 bu benchmark'ta 68% puan aldı.
MMMU
78%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Claude Sonnet 4.5 bu benchmark'ta 78% puan aldı.
MMMU Pro
55%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Claude Sonnet 4.5 bu benchmark'ta 55% puan aldı.
ChartQA
89%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Claude Sonnet 4.5 bu benchmark'ta 89% puan aldı.
DocVQA
92%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Claude Sonnet 4.5 bu benchmark'ta 92% puan aldı.
Terminal-Bench
50%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Claude Sonnet 4.5 bu benchmark'ta 50% puan aldı.
ARC-AGI
14%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Claude Sonnet 4.5 bu benchmark'ta 14% puan aldı.

Claude Sonnet 4.5'i Ücretsiz Dene

Claude Sonnet 4.5 ile ücretsiz sohbet edin. Yeteneklerini test edin, sorular sorun ve bu AI modelinin neler yapabileceğini keşfedin.

Prompt
Yanıt
Claude Sonnet 4.5

Yapay zeka yanıtınız burada görünecek

Claude Sonnet 4.5 Hakkında

Claude Sonnet 4.5'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

**Agentic Zekanın Sınırları**

Claude Sonnet 4.5, Anthropic'in özellikle otonom yapay zeka agent'ları dönemi için optimize edilmiş "frontier intelligence" konusundaki en önemli sıçramasını temsil ediyor. 2025'in sonlarında piyasaya sürülen bu model, geliştiricilerin rutin görevler için yüksek hızlı yürütme ile karmaşık mantıksal zorluklar için extended thinking (genişletilmiş düşünme) arasında geçiş yapmasına olanak tanıyan sektörün ilk gerçek "hybrid reasoning" modelidir. Bilgisayar kullanımı ve araç yönetimi (tool orchestration) konularında önceki benchmarkları geride bırakarak, terminal tabanlı agent'lar ve çok dosyalı yazılım mühendisliği için tercih edilen motor haline gelmiştir.

**Hassasiyet ve Azaltılmış Hallucination Seviyeleri**

model, 3.5 serisinde görülen sycophancy ve hallucination durumlarını önemli ölçüde azaltan, "iki ölç, bir biç" mantığını önceliklendiren bir mimari üzerine inşa edilmiştir. Devasa 64.000 token output limit ve 200.000 token input window ile tüm depoları (repository) sindirebilirken, tek bir geçişte tam uzunlukta uygulama dosyaları oluşturabilir. Ayrıca agentic iş akışları için yerleşik "checkpoints" özelliği sunarak, agent'ların kendi hatalarını otonom olarak geri almalarına ve düzeltmelerine olanak tanır.

**Multimodal ve Reasoning Gücü**

Kodlamanın ötesinde Sonnet 4.5, multimodal belge analizi ve karmaşık finansal modelleme konularında hakimiyet kuruyor. Dahili mantığı, mimari bağlamı önceliklendirecek şekilde eğitilmiştir ve bu da büyük ölçekli kod tabanlarını önceki tüm modellerden daha iyi haritalamasını sağlar. İster el yazısı notları işliyor ister tam bir Stripe entegrasyonu uyguluyor olsun, Sonnet 4.5 yüksek düzeyde doğruluk ve talimat takibi sağlar.

Claude Sonnet 4.5

Claude Sonnet 4.5 için Kullanım Alanları

Harika sonuçlar elde etmek için Claude Sonnet 4.5'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

Karmaşık kod tabanlarında gezinmek, birden fazla dosya genelinde özellikler uygulamak ve testleri bağımsız olarak çalıştırmak için Claude Sonnet 4.5 kullanın.

Bilgisayar Kullanan Agent'lar

Veri çıkarma, eski sistemlerde gezinme veya tekrarlayan idari görevler için masaüstü ve web tarayıcılarını kontrol etmek üzere model'i dağıtın.

Kurumsal Agentic Arama

Çok adımlı arama sorgularını yönetin ve dahili dökümantasyon ile canlı web'den gelen farklı bilgileri sentezleyin.

Karmaşık Finansal Modelleme

Finansal raporlar ve piyasa verileri üzerinde derin mantıksal çıkarımlar yapmak için %87'lik AIME skorundan yararlanın.

Teknik İçerik İyileştirme

Üst düzey gereksinimleri profesyonel PRD'lere, teknik spesifikasyonlara ve kopyala-yapıştır yapmaya hazır kod tabanlarına dönüştürün.

Multimodal Belge Analizi

state-of-the-art görüntü işleme yetenekleriyle binlerce sayfalık grafiği, el yazısı notu ve teknik diyagramı işleyin.

Güçlü Yönler

Sınırlamalar

Agentic Kodlama Gücü: Gerçek GitHub sorunları üzerindeki %77,2'lik başarı oranıyla şu anda SWE-bench Verified'da dünya rekorunun sahibidir.
Kullanım Sınırları: Profesyonel kullanıcılar, aylık 20 dolarlık Pro planında haftalık kullanım limitlerine hızla ulaştıklarını belirtiyor.
İnanılmaz Hız: Saniyede 40-60 token hızında çalışarak etkileşimli kullanımda önceki frontier model serilerinden önemli ölçüde daha hızlıdır.
Arama Gecikmesi: Agentic web gezintisi (BrowseComp), özel arama modellerine kıyasla hala zayıf bir nokta olmaya devam ediyor.
Hybrid Reasoning Esnekliği: Karmaşık mantıksal zincirler için "hızlı sohbet" modu ile "extended thinking" arasında etkili bir denge kuran ilk model.
Niş Bilgi Boşlukları: Belirli kaykay numaralarını tanımlamak gibi oldukça özelleşmiş görsel görevlerde zorlanıyor (SkateBench'te %29 doğruluk).
Massive Output Penceresi: 64K output token limiti, tek bir API çağrısında çok dosyalı özelliklerin tamamının oluşturulmasına olanak tanır.
Agentic Maliyetler: model'i terminal modunda otonom olarak çalıştırmak, tek bir karmaşık uygulama oluşturma oturumu için 50-100 dolar tutarında token tüketebilir.

API Hızlı Başlangıç

anthropic/claude-sonnet-4.5

Belgeleri Görüntüle
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Claude Sonnet 4.5 Hakkında Ne Diyor

Topluluğun Claude Sonnet 4.5 hakkında ne düşündüğünü görün

"Claude Sonnet 4.5, yapay zeka kodlamasının yeni kralı... gerçekten çok iyi görünüyor"
James Montemagno
youtube
"Sonnet 4.5 gerçekten harika bir iş çıkarıyor... çok daha hızlıydı ve hatırı sayılır derecede daha iyiydi"
Cole Medin
youtube
"Sonnet 4.5 beni şaşkına çevirdi... bu model kesinlikle çarpıcı sayfalar tasarlıyor"
Savage Reviews
youtube
"Terminal tabanlı agent, 'terminalinizde yaşayan bir geliştirici' gibi... kod tabanlarını okuyabiliyor ve testleri otonom olarak çalıştırabiliyor"
DevUser_99
reddit
"Fiyatlandırma 3.5 ile aynı kalıyor, ancak 'Checkpoints' özelliği onu profesyonel iş akışları için 10 kat daha değerli kılıyor"
AgentArchitect
x
"SWE-bench'teki %77,2'lik skorla, bu gerçekten bir Kıdemli Mühendis gibi hissettiren ilk model"
HackerNewsReader
hackernews

Claude Sonnet 4.5 Hakkında Videolar

Claude Sonnet 4.5 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Anthropic, bunun reasoning, matematik ve bilgisayar kullanımı konusunda önemli kazanımlar sunan 'dünyanın en iyi kod modeli' olduğunu iddia ediyor.

GPT-5 üst düzey planlama için daha iyi olsa da, Claude 4.5 Sonnet şu anda uygulama için kullanımı en 'keyifli' model.

Hız gerçekten inanılmaz, etkileşimli kodlamayı çok daha akıcı hissettiriyor.

Çok dosyalı düzenlemeleri daha önce görmediğimiz bir hassasiyetle ele alıyor.

Hallucination oranındaki azalma, onu üretim kodu için güvenilir bir ortak haline getiriyor.

Claude Sonnet 4.5, GPT-5 Codex'ten çok daha hızlı ve hatırı sayılır derecede daha iyiydi.

Stripe entegrasyonunun tamamını 15 dakikada yaptı... Opus 4.1'den iki kat daha hızlı.

Karmaşık tool-calling talimatlarını takip etme yeteneği onun gizli gücü.

modelin sadece benim kötü fikirlerime katıldığı 'sycophancy' sorunlarını daha az görüyorum.

Terminal tabanlı bir agent'ı gözetimsiz çalıştırmak için gerçekten güvenebileceğim ilk model bu.

Bu, şimdiye kadar bir prompt ile oluşturulmuş en iyi açılış sayfalarından biri, hatta BELKİ DE EN İYİSİ.

Kesinlikle muazzam... gerçekten çok şık kodlarla kesinlikle çarpıcı sayfalar tasarlıyor.

UI tasarımını yorumlamaya yönelik görüntü işleme yetenekleri önemli ölçüde yükseltilmiş.

Sadece teknik gereksinimleri değil, estetik gereksinimleri de anlıyor gibi hissettiriyor.

Sonnet 4.5 resmi olarak yaratıcı ön uç mühendisliği için yeni benchmark haline geldi.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları
Demo videoyu izle

Profesyonel İpuçları

Bu modelden en iyi şekilde yararlanmanız için uzman ipuçları.

CLAUDE.md'den Yararlanın

model'e kısa özetler ve ipuçları vermek için depo (repository) kök dizininde bir CLAUDE.md dosyası kullanın; bu, token israfını %30 oranında azaltır.

Hybrid Reasoning Geçişi

Rutin işlemler sırasında latency ve maliyet tasarrufu sağlamak için API çağrılarınızdaki 'thinking' parametresini yalnızca mantık ağırlıklı görevler için kullanın.

The .claude/context Klasörü

Mimari kararları saklamak için bir .claude/context.md dosyası oluşturun; model, kod tabanı haritalama için özellikle bu yolu önceliklendirecek şekilde eğitilmiştir.

Prompt Caching

Tekrarlanan sorgularda input maliyetlerinden %90'a varan tasarruf sağlamak için statik dökümantasyon veya büyük kod tabanları için prompt caching özelliğini etkinleştirin.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Sık Sorulan Sorular

Bu model hakkında sık sorulan soruların cevaplarını bulun