anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6, 1M token context window ile kodlama ve bilgisayar kullanımı için 3$/1M token maliyetle frontier performans sunar.

Agentic AIMultimodalKodlamaBilgisayar KullanımıUzun Context
anthropic logoanthropicClaude 417 Şubat 2026
Bağlam
1.0Mtoken
Maks. çıktı
64Ktoken
Giriş fiyatı
$3.00/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImageAudioVideo
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
89.9%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Claude Sonnet 4.6 bu benchmark'ta 89.9% puan aldı.
HLE
49%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Claude Sonnet 4.6 bu benchmark'ta 49% puan aldı.
MMLU
89.3%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Claude Sonnet 4.6 bu benchmark'ta 89.3% puan aldı.
MMLU Pro
79.2%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Claude Sonnet 4.6 bu benchmark'ta 79.2% puan aldı.
SimpleQA
48.5%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Claude Sonnet 4.6 bu benchmark'ta 48.5% puan aldı.
IFEval
89.5%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Claude Sonnet 4.6 bu benchmark'ta 89.5% puan aldı.
AIME 2025
83%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Claude Sonnet 4.6 bu benchmark'ta 83% puan aldı.
MATH
85.3%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Claude Sonnet 4.6 bu benchmark'ta 85.3% puan aldı.
GSM8k
96.4%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Claude Sonnet 4.6 bu benchmark'ta 96.4% puan aldı.
MGSM
92.8%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Claude Sonnet 4.6 bu benchmark'ta 92.8% puan aldı.
MathVista
68.7%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Claude Sonnet 4.6 bu benchmark'ta 68.7% puan aldı.
SWE-Bench
79.6%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Claude Sonnet 4.6 bu benchmark'ta 79.6% puan aldı.
HumanEval
92.1%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Claude Sonnet 4.6 bu benchmark'ta 92.1% puan aldı.
LiveCodeBench
72.4%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Claude Sonnet 4.6 bu benchmark'ta 72.4% puan aldı.
MMMU
74.2%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Claude Sonnet 4.6 bu benchmark'ta 74.2% puan aldı.
MMMU Pro
75.6%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Claude Sonnet 4.6 bu benchmark'ta 75.6% puan aldı.
ChartQA
88.1%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Claude Sonnet 4.6 bu benchmark'ta 88.1% puan aldı.
DocVQA
93.4%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Claude Sonnet 4.6 bu benchmark'ta 93.4% puan aldı.
Terminal-Bench
59.1%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Claude Sonnet 4.6 bu benchmark'ta 59.1% puan aldı.
ARC-AGI
58.3%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Claude Sonnet 4.6 bu benchmark'ta 58.3% puan aldı.

Claude Sonnet 4.6 Hakkında

Claude Sonnet 4.6'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Yüksek Performanslı Agentic Zeka

Claude Sonnet 4.6, Anthropic'in en çok yönlü modelidir; karmaşık kurumsal iş akışları ve otonom agent'lar için birincil motor olarak tasarlanmıştır. 17 Şubat 2026'da yayınlanan model, insan seviyesinde bilgisayar kullanım yetenekleri ve 1 milyon token'lık bir context window getiriyor. Model mimarisi, orta segment sistemlerin hızını, genellikle Opus sınıfına ayrılan reasoning derinliğiyle dengeler ve bu da onu yüksek hacimli production ortamları için sürdürülebilir bir seçim haline getirir.

Adaptive Thinking ve Multimodallik

Teknik çekirdeğinde Sonnet 4.6, bir Adaptive Thinking mekanizması kullanır. Bu, geliştiricilerin bir görevin özel gereksinimlerine göre dahili reasoning çabasını ölçeklendirmesine, ister milisaniyelik latency'e ister derin mantıksal doğrulamaya optimize etmesine olanak tanır. Model, yerel olarak multimodal olup metin, yüksek çözünürlüklü görseller ve ses dosyalarını işlemede state-of-the-art performans sunar. Yoğun teknik belgeleri ve mimari planlar veya finansal grafikler gibi karmaşık görsel verileri yorumlamada mükemmeldir.

Kodlamada Sektör Standardı

SWE-bench Verified üzerinde rekor kıran %79,6 ile Sonnet 4.6, yazılım mühendisliği otomasyonu için varsayılan seçenek haline geldi. 1M context window içinde devasa kod tabanları üzerinde akıl yürütme yeteneği, çok dosyalı hataları çözmesine ve mimari refactor'leri minimum insan müdahalesiyle planlamasına olanak tanır. Milyon girdi token'ı başına 3$ fiyatla Opus seviyesinde zeka sunarak, daha önce otonom AI sistemlerini dağıtmakla ilişkilendirilen finansal engelleri ortadan kaldırır.

Claude Sonnet 4.6

Claude Sonnet 4.6 için Kullanım Alanları

Harika sonuçlar elde etmek için Claude Sonnet 4.6'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

%79,6'lık SWE-bench doğruluğunu kullanarak karmaşık çoklu dosya GitHub sorunlarını çözme ve tüm depo çapında refactor işlemleri yürütme.

İnsan Seviyesinde Bilgisayar Kullanımı

Özel API entegrasyonlarına ihtiyaç duymadan çok adımlı idari görevleri tamamlamak için doğrudan masaüstü yazılımlarında ve web arayüzlerinde gezinme.

Büyük Ölçekli Belge Analizi

1 milyon token'lık context window içerisinde binlerce sayfalık yasal sözleşmeleri veya araştırma makalelerini eş zamanlı olarak inceleme.

Finansal İstihbarat ve Tahminleme

Yüksek çabalı adaptive reasoning kullanarak kazanç çağrılarını ve üç aylık raporları işleyip ince pazar anomalilerini tespit etme.

Multimodal Teknik Destek

Hassas sorun giderme adımları sağlamak için karmaşık teknik şemaları, devre kartı fotoğraflarını ve ses kayıtlarını yorumlama.

Agentic İş Stratejisi

Strateji ve mantık tabanlı benchmark'lardaki üst düzey skorlardan yararlanarak uzun vadeli operasyonları planlama ve yürütme.

Güçlü Yönler

Sınırlamalar

Üstün Kodlama Doğruluğu: SWE-bench Verified üzerinde %79,6 ile sektör standardını belirleyerek, tüm orta segment ve çoğu flagship modelden daha iyi performans gösterir.
Yerel Video Girdi Eksikliği: Video dosyalarının görsel olarak işlenmesi için manuel kare çıkarma işlemi gerektirir, bu da medya iş akışlarını karmaşıklaştırır.
Rakipsiz Context Kapasitesi: 1 milyon token'lık pencere, tüm teknik kütüphanelerin veya devasa kod tabanlarının performans kaybı olmadan modele yüklenmesine olanak tanır.
Artan Reasoning Latency: Yüksek çabalı adaptive reasoning kullanmak, standart inference'a kıyasla ilk token'a ulaşma süresini (TTFT) önemli ölçüde artırır.
Otonom Bilgisayar Kullanımı: OSWorld üzerinde %72,5 skor elde ederek modelin sanal bir operatör gibi karmaşık GUI'lerde ve yazılım araçlarında gezinmesini sağlar.
Yüksek Çıktı Reasoning Maliyetleri: Girdi fiyatlandırması rekabetçi olsa da, maksimum çaba gerektiren reasoning görevleri çok fazla çıktı token'ı tüketebilir ve maliyetleri artırabilir.
Optimize Edilmiş Fiyat-Performans: Opus'un 1/5'i maliyetine Opus seviyesine yakın bir zeka sunarak, büyük ölçekli agent dağıtımları için en ekonomik seçenek haline gelir.
Context Getirme Gürültüsü: 1M token sınırında, eğer context alakasız verilerle doluysa model zaman zaman odak kaybı yaşayabilir.

API Hızlı Başlangıç

anthropic/claude-sonnet-4-6

Belgeleri Görüntüle
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analyze this repository for architectural bottlenecks." }
  ],
});

console.log(response.content[0].text);

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Claude Sonnet 4.6 Hakkında Ne Diyor

Topluluğun Claude Sonnet 4.6 hakkında ne düşündüğünü görün

Context gürültüdür. Daha büyük token pencereleri bir tuzaktır. Agent'lara sadece ihtiyaç duydukları dar ve küratörlü sinyali verin.
Logical-Storm-1180
reddit
Bu Claude Sonnet 4.6: şimdiye kadarki en yetenekli Sonnet modelimiz. Kodlama, bilgisayar kullanımı ve agent planlaması genelinde tam bir yükseltmedir.
Claude
twitter
Claude Sonnet 4.6'nın performans-maliyet oranı olağanüstü; bu modellerin ne kadar hızlı geliştiğini anlatmak zor.
Replit
youtube
Sonnet 4.6 artık Claude Code'da yayında. Opus 4.6'dan daha ucuz ve Opus seviyesindeki zekaya yaklaşıyor.
Boris Cherny
twitter
Claude 4.6, gerçek dünya bilgi iş görevlerinde Opus 4.6'nın biraz önünde, agentic performansında yeni liderdir.
Artificial Analysis
twitter
Bu modelin bilgisayar arayüzünde %72 doğrulukla gezinebilmesi, çoğu özel API ihtiyacını temelden bitiriyor.
DevOpsGuru
hackernews

Claude Sonnet 4.6 Hakkında Videolar

Claude Sonnet 4.6 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Sonnet 4.6 burada ve günlük işlerinizin %90'ında Opus'un yerini alabilir.

En iyi yanı ise, Opus 4.6 kullanmaktan %40 daha ucuz olması.

SWE-bench sonuçları orta segment bir model için gerçekten inanılmaz.

Etkili bir şekilde ona tüm bir kod tabanını verebilirsiniz ve konudan kopmaz.

Adaptive thinking, hız ile daha derin mantık arasında seçim yapmanızı sağlar.

Erken kullanıcılar, karmaşık hesap tablosu işlemlerinde insan benzeri performansa yakın sonuçlar aldığını bildiriyor.

Bu model Opus'a kıyasla yaklaşık iki kat daha hızlı.

1 milyon token'lık context window şu anda beta aşamasında ancak çok iyi çalışıyor.

Özel API entegrasyonlarına ihtiyaç duymadan yazılım arayüzlerinde geziniyor.

Python ve JavaScript üzerindeki kodlama yeteneği temel olarak tavan noktasında.

Anthropic yeni context window'un tüm kod tabanlarını tutacak ve tüm bu context üzerinde etkili bir şekilde akıl yürütecek kadar büyük olduğunu söylüyor.

Opus 4.6 nükleer bomba seçeneğiydi... ama artık elimizde bir neşter var ve bu harika bir haber.

Bilgisayar kullanımı buradaki öne çıkan özellik; gerçekten fareyi hareket ettiriyor ve yazı yazıyor.

Finansal analistler, belge incelemesi için reasoning derinliğine bayılacaklar.

Bir 'Sonnet' modelinin sınıfının mutlak en iyisi gibi hissettirdiği ilk sefer.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Claude Sonnet 4.6 için Pro İpuçları

Claude Sonnet 4.6'den en iyi şekilde yararlanmak için uzman ipuçları.

Düşünme Çabasını Optimize Edin

Basit sorgularda maliyetten tasarruf etmek için 'adaptive' düşünme modunu kullanın, matematik ve mantık görevleri için ise 'max' çabayı saklı tutun.

Context Sıkıştırmayı Uygulayın

1M token'lık pencereyi gereksiz maliyetler olmadan verimli bir şekilde yönetmek için prompt caching ve sıkıştırma özelliklerini etkinleştirin.

Yapılandırılmış Davranışsal Çıpalama

Modelin mimari kararları için kalıcı bir doğruluk kaynağı sağlamak amacıyla merkezi bir proje markdown dosyası kullanın.

Video Kare Çıkarma

Yerel video desteği bulunmadığından, video içeriğinin en doğru görsel analizi için 1fps hızında önemli kareleri dışa aktarın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Claude Sonnet 4.6 Hakkında Sık Sorulan Sorular

Claude Sonnet 4.6 hakkında sık sorulan soruların cevaplarını bulun