anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet, Anthropic’in state-of-the-art kodlama yetenekleri, 200k context window ve görünür thinking sunan ilk hybrid reasoning modelidir.

anthropic logoanthropicClaude 3February 24, 2025
Bağlam
200Ktoken
Maks. çıktı
128Ktoken
Giriş fiyatı
$3.00/ 1M
Çıkış fiyatı
$15.00/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
84.8%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Claude 3.7 Sonnet bu benchmark'ta 84.8% puan aldı.
HLE
34%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Claude 3.7 Sonnet bu benchmark'ta 34% puan aldı.
MMLU
89%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Claude 3.7 Sonnet bu benchmark'ta 89% puan aldı.
MMLU Pro
74%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Claude 3.7 Sonnet bu benchmark'ta 74% puan aldı.
SimpleQA
42%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Claude 3.7 Sonnet bu benchmark'ta 42% puan aldı.
IFEval
93.2%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Claude 3.7 Sonnet bu benchmark'ta 93.2% puan aldı.
AIME 2025
54.8%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Claude 3.7 Sonnet bu benchmark'ta 54.8% puan aldı.
MATH
96.2%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Claude 3.7 Sonnet bu benchmark'ta 96.2% puan aldı.
GSM8k
97%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Claude 3.7 Sonnet bu benchmark'ta 97% puan aldı.
MGSM
92%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Claude 3.7 Sonnet bu benchmark'ta 92% puan aldı.
MathVista
70%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Claude 3.7 Sonnet bu benchmark'ta 70% puan aldı.
SWE-Bench
70.3%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Claude 3.7 Sonnet bu benchmark'ta 70.3% puan aldı.
HumanEval
94%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Claude 3.7 Sonnet bu benchmark'ta 94% puan aldı.
LiveCodeBench
65%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Claude 3.7 Sonnet bu benchmark'ta 65% puan aldı.
MMMU
75%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Claude 3.7 Sonnet bu benchmark'ta 75% puan aldı.
MMMU Pro
55%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Claude 3.7 Sonnet bu benchmark'ta 55% puan aldı.
ChartQA
89%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Claude 3.7 Sonnet bu benchmark'ta 89% puan aldı.
DocVQA
94%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Claude 3.7 Sonnet bu benchmark'ta 94% puan aldı.
Terminal-Bench
35.2%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Claude 3.7 Sonnet bu benchmark'ta 35.2% puan aldı.
ARC-AGI
12%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Claude 3.7 Sonnet bu benchmark'ta 12% puan aldı.

Claude 3.7 Sonnet'i Ücretsiz Dene

Claude 3.7 Sonnet ile ücretsiz sohbet edin. Yeteneklerini test edin, sorular sorun ve bu AI modelinin neler yapabileceğini keşfedin.

Prompt
Yanıt
anthropic/claude-3-7-sonnet-20250219

Yapay zeka yanıtınız burada görünecek

Claude 3.7 Sonnet Hakkında

Claude 3.7 Sonnet'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Hybrid Reasoning ve Şeffaflık

Claude 3.7 Sonnet, Anthropic'in ilk 'hybrid reasoning' modeli olarak LLM mimarisinde dönüm noktası niteliğinde bir değişimi temsil ediyor. Kullanıcıların standart, düşük latency yanıtlar ile içsel chain-of-thought sürecini görüntüleyen 'extended thinking' modu arasında geçiş yapmasına benzersiz bir şekilde olanak tanır. Bu şeffaflık, kullanıcılara modelin mantığına dair net bir pencere açarak, onu özellikle karmaşık sorun giderme ve kritik reasoning görevleri için etkili kılar.

Yazılım Mühendisliği Uzmanlığı

Yazılım mühendisliğine ve production ortamına hazır çıktılara güçlü bir odaklanma ile tasarlanan model, SWE-bench Verified gibi benchmark testlerinde yeni sektör standartlarını belirledi. Geliştiricilerin üst düzey niyetlerini tanımladığı ve modelin birden fazla dosya genelinde uygulamayı üstlendiği 'vibe coding' konusunda mükemmeldir. Karmaşık refactor işlemlerini ve mimari kararları, önceki frontier model sürümlerini aşan bir hassasiyetle yönetir.

Dev Context ve Agentic Araçlar

Muazzam 200.000 token'lık context window ve Claude Code adı verilen agentic araç seti ile basit bir chatbot'tan iş birlikçi bir teknik ortağa dönüşür. İlk dokümantasyon incelemesinden otomatik git iş akışlarına ve test yürütmeye kadar tüm proje yaşam döngülerini yönetebilir; geliştirme sürecinin hızlı ve hatasız kalmasını sağlar.

Claude 3.7 Sonnet

Claude 3.7 Sonnet için Kullanım Alanları

Harika sonuçlar elde etmek için Claude 3.7 Sonnet'i kullanmanın farklı yollarını keşfedin.

Vibe Coding

Doğal dilde niyet belirterek sıfırdan işlevsel yazılımlar oluşturmak.

Gelişmiş Debugging

Karmaşık logları analiz etmek ve kesin, tek seferlik düzeltmeler sağlamak için extended thinking özelliğinden yararlanmak.

Geniş Context Analizi

Tek bir prompt içinde tüm kod tabanlarını veya uzun teknik dokümantasyonları incelemek ve refactor etmek.

Agentic Geliştirme

Git iş akışlarını ve test yürütmeyi otomatikleştirmek için Claude Code gibi terminal tabanlı araçlara güç vermek.

Frontend UI Oluşturma

Dahili tasarım duyarlılığı ile şık ve bakımı kolay React ve Svelte bileşenleri oluşturmak.

Olgusal Araştırma

Büyük PDF belgelerini ve veri setlerini yüksek doğruluk ve düşük hallucination oranları ile analiz etmek.

Güçlü Yönler

Sınırlamalar

Sektör Lideri Kodlama: SWE-bench Verified üzerinde %70,3'lük state-of-the-art bir başarı yakalayarak gerçek GitHub sorunlarını benzersiz bir doğrulukla çözdü.
Yanıt Latency: 'extended thinking' modunun etkinleştirilmesi, standart model yanıtlarına kıyasla ilk token'a kadar geçen süreyi önemli ölçüde artırır.
Görünür Reasoning: Karmaşık ve kritik problem çözme süreçleri için görünür ve kullanıcı tarafından kontrol edilebilir 'extended thinking' sunan ilk model.
Premium Fiyatlandırma: 1 milyon token başına 15 dolarlık output maliyeti, çoğu 'mini' veya open-weights alternatifinden hala çok daha yüksektir.
Agentic Entegrasyon: Uçtan uca görev otomasyonu için Claude Code agent çerçevesi aracılığıyla tool-use ve CLI etkileşimi için özel olarak optimize edilmiştir.
Native Ses/Video Yok: GPT-4o veya Gemini 2.0'ın aksine, yerleşik ses ve video girişi işleme yeteneklerinden yoksundur.
Üstün Tasarım Zevki: Diğer frontier model seçeneklerine kıyasla tutarlı bir şekilde daha zarif, erişilebilir ve bakımı kolay UI kodları üretir.
Hesaplama Maliyeti: Derin reasoning seansları, büyük ölçekli kod tabanı refactor işlemleri sırasında token bütçelerini ve context limitlerini hızla tüketebilir.

API Hızlı Başlangıç

anthropic/claude-3-7-sonnet-20250219

Belgeleri Görüntüle
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Claude 3.7 Sonnet Hakkında Ne Diyor

Topluluğun Claude 3.7 Sonnet hakkında ne düşündüğünü görün

"Claude 3.7 Sonnet dünyadaki en iyi kodlama AI modelidir; zorlu görevlerde aklımı başımdan aldı."
rawcell4772
reddit
"Tek bir prompt ile karmaşık bir TypeScript projesindeki her şeyi mükemmel bir şekilde halletti."
rawcell4772
reddit
"Sonnet 3.7 ile Claude Code, Cline'dan çok daha iyi ve şu anki en iyi araç."
peterkrueck
reddit
"3.7 gibi üst düzey modellerdeki kalite sıçraması bakış açımı tamamen değiştirdi."
lurking_horrors
reddit
"Claude 3.7 resmen uçuyor, çok farklı bir seviye... kesinlikle zirveye oynuyor"
Fireship
youtube
"Claude 3.7'nin reasoning modu, mantık hatalarını giderme konusunda tam bir paradigma değişimi."
DevLead99
x

Claude 3.7 Sonnet Hakkında Videolar

Claude 3.7 Sonnet hakkında eğitimler, incelemeler ve tartışmalar izleyin

Yeni 3.7 model kesinlikle diğer tüm modelleri geride bıraktı... artık GitHub sorunlarının %70,3'ünü çözebiliyor

TDD ile birlikte güçlü tipli bir dil kullanmak, AI'ın yazdığı kodun gerçekten geçerli olduğunu doğrulaması için harika yollardır

model, talimatları takip etme konusunda inanılmaz derecede akıllı

SWE-bench performansı gerçekten çılgınca

Görünür reasoning, şeffaflık açısından kuralları değiştiriyor

Claude 3.7 Sonnet... muhtemelen kod üretimi için en iyi LLM

Eğer API kullanıyorsanız, tek seferde 128.000 token output alabilirsiniz

128k output limiti muazzam bir yükseltme

Frontend bileşenleri için tasarım zevki eşsiz

Tool use ve agentic yetenekler bu modelin kalbinde yer alıyor

reasoning, tamamen ayrı bir model olmaktan ziyade frontier model sistemlerinin entegre bir yeteneği olmalıdır

Claude 3.7, bu modelleri [DeepSeek, o3] oldukça önemli bir farkla geride bırakmayı başarıyor

reasoning modunda latency biraz daha yüksek

Birçok talimat takip etme görevinde DeepSeek R1'i geride bırakıyor

Anthropic gerçekten production ortamına hazır çıktılara odaklanmış

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları
Demo videoyu izle

Profesyonel İpuçları

Bu modelden en iyi şekilde yararlanmanız için uzman ipuçları.

Thinking Bütçesi

Daha yüksek kaliteli sonuçlar almak için karmaşık mantık veya mimari planlama süreçlerinde özellikle 'extended thinking' modunu kullanın.

Context Kontrolü

Context maliyetlerinden tasarruf etmek ve modelin yavaşlamasını önlemek için sohbetleri düzenli olarak /clear komutuyla temizleyin veya yeniden başlatın.

Doğrulama

Production stabilitesini sağlamak için Claude Code aracını kullanarak Claude'dan kendi yazdığı kod için testler yazmasını ve çalıştırmasını isteyin.

Markdown Spesifikasyonları

Büyük projelerde talimatlara daha iyi uyulması için özellik gereksinimlerini yapılandırılmış Markdown dosyalarıyla sunun.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Sık Sorulan Sorular

Bu model hakkında sık sorulan soruların cevaplarını bulun