deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale, altın madalya matematik performansı, DeepSeek Sparse Attention ve 131K context window sunan reasoning odaklı bir LLM'dir. GPT-5'e...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V32025-12-01
Bağlam
131Ktoken
Maks. çıktı
131Ktoken
Giriş fiyatı
$0.28/ 1M
Çıkış fiyatı
$0.42/ 1M
Modalite:Text
Yetenekler:AraçlarAkışAkıl Yürütme
Benchmarks
GPQA
91.5%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). DeepSeek-V3.2-Speciale bu benchmark'ta 91.5% puan aldı.
HLE
30.6%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. DeepSeek-V3.2-Speciale bu benchmark'ta 30.6% puan aldı.
MMLU
88.5%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. DeepSeek-V3.2-Speciale bu benchmark'ta 88.5% puan aldı.
MMLU Pro
78.4%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. DeepSeek-V3.2-Speciale bu benchmark'ta 78.4% puan aldı.
SimpleQA
45.8%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. DeepSeek-V3.2-Speciale bu benchmark'ta 45.8% puan aldı.
IFEval
91.2%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. DeepSeek-V3.2-Speciale bu benchmark'ta 91.2% puan aldı.
AIME 2025
96%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. DeepSeek-V3.2-Speciale bu benchmark'ta 96% puan aldı.
MATH
90.1%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. DeepSeek-V3.2-Speciale bu benchmark'ta 90.1% puan aldı.
GSM8k
98.9%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. DeepSeek-V3.2-Speciale bu benchmark'ta 98.9% puan aldı.
MGSM
92.5%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. DeepSeek-V3.2-Speciale bu benchmark'ta 92.5% puan aldı.
MathVista
68.5%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. DeepSeek-V3.2-Speciale bu benchmark'ta 68.5% puan aldı.
SWE-Bench
73.1%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. DeepSeek-V3.2-Speciale bu benchmark'ta 73.1% puan aldı.
HumanEval
94.1%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. DeepSeek-V3.2-Speciale bu benchmark'ta 94.1% puan aldı.
LiveCodeBench
71.4%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. DeepSeek-V3.2-Speciale bu benchmark'ta 71.4% puan aldı.
MMMU
70.2%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. DeepSeek-V3.2-Speciale bu benchmark'ta 70.2% puan aldı.
MMMU Pro
58%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. DeepSeek-V3.2-Speciale bu benchmark'ta 58% puan aldı.
ChartQA
85%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. DeepSeek-V3.2-Speciale bu benchmark'ta 85% puan aldı.
DocVQA
93%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. DeepSeek-V3.2-Speciale bu benchmark'ta 93% puan aldı.
Terminal-Bench
46.4%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. DeepSeek-V3.2-Speciale bu benchmark'ta 46.4% puan aldı.
ARC-AGI
12%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. DeepSeek-V3.2-Speciale bu benchmark'ta 12% puan aldı.

DeepSeek-V3.2-Speciale Hakkında

DeepSeek-V3.2-Speciale'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Reasoning Alanında Yeni Bir Sınır

DeepSeek-V3.2-Speciale, V3.2 ailesinin yüksek hesaplama kapasiteli varyantı olarak hizmet veren, state-of-the-art seviyesinde reasoning odaklı bir large language model (LLM) sistemidir. GPT-5 ve Gemini 3 Pro gibi frontier sistemlerle rekabet etmek üzere açıkça tasarlanan bu model, reinforcement learning sırasında uzunluk cezalarını esneterek ve eğitim sonrası hesaplamayı pre-training bütçesinin %10'unun üzerine çıkararak olağanüstü bir performans sergiler. Bu, modelin karmaşık çok adımlı problemleri çözmek için yanıt başına 47.000 tokenı aşan son derece uzun chain-of-thought yörüngeleri oluşturmasına olanak tanır.

Mimari İnovasyon

Teknik olarak model, 131K context window içerisindeki en alakalı tokenları belirlemek için yıldırım hızında bir dizinleyici kullanan devrim niteliğindeki DeepSeek Sparse Attention (DSA) mekanizmasını tanıtır. Model, belirli bir token alt kümesine odaklanarak, yoğun mimarilerin doğruluğunu korurken uzun bağlamlı inference için hesaplama yükünü önemli ölçüde azaltır. 2025 Uluslararası Matematik Olimpiyatı (IMO) ve Uluslararası Bilişim Olimpiyatı'nda (IOI) altın madalya sonuçları elde eden ilk open-source model olmasıyla dikkat çekmektedir.

Verimlilik ve Entegrasyon

Model, salt mantığın ötesinde maliyet verimliliğine ve geliştirici faydasına öncelik verir. Kapalı kaynaklı emsallerinin çok küçük bir kısmına fiyatlandırılan model, reasoning yeteneğinin doğrudan tool-calling döngüsüne entegre edildiği bir mod olan Thinking in Tool-Use özelliğini destekler. Bu özellik, karmaşık simüle edilmiş ortamlarda eylemleri gerçek zamanlı olarak planlayabilen, doğrulayabilen ve düzeltebilen daha sağlam otonom agents oluşturulmasına imkan tanır.

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale için Kullanım Alanları

Harika sonuçlar elde etmek için DeepSeek-V3.2-Speciale'i kullanmanın farklı yollarını keşfedin.

Olimpiyat Seviyesinde Matematiksel Kanıtlar

Onlarca mantıksal adım gerektiren IMO ve CMO seviyesindeki problemlerin çözümü.

Agentic Yazılım Mühendisliği

Karmaşık kod tabanlarında otonom olarak gezinerek ve yamalar uygulayarak gerçek dünyadaki GitHub sorunlarını giderme.

Karmaşık Sistem Simülasyonu

Radyo frekansı yayılımı veya dalga fiziği gibi fiziksel veya matematiksel sistemlerin yüksek hassasiyetle emülasyonu.

Deep Reasoning İş Akışları

Stratejik planlama veya bilimsel keşif için kapsamlı araştırma ve chain-of-thought analizi gerçekleştirme.

Otonom Agent Planlaması

1.800'den fazla simüle edilmiş ortamda çok adımlı eylemleri planlamak, yürütmek ve doğrulamak için "Thinking in Tool-Use" özelliğini kullanma.

Zero-Shot Rekabetçi Programlama

Otomatik öz-düzeltme ile CodeForces veya IOI seviyesindeki programlama zorlukları için verimli algoritmalar üretme.

Güçlü Yönler

Sınırlamalar

Altın Madalya Seviyesinde Reasoning: 2025 Uluslararası Matematik Olimpiyatı'nda (IMO) altın madalya seviyesinde sonuçlar elde ederek mantık konusunda hemen hemen her closed-source modeli geride bırakır.
Token Verimsizliği: Yüksek doğruluk oranına ulaşmak için model genellikle rakiplerinden 3 ila 4 kat daha fazla tokens üretir, bu da daha uzun bekleme sürelerine neden olur.
Rakipsiz Uygun Maliyet: 1M tokens başına 0,28 $/0,42 $ fiyatıyla, büyük ölçekli agent dağıtımlarını uygulanabilir kılan bir fiyat noktasında frontier reasoning sunar.
Donanım Yoğunluğu: 671B parametreli bir model olarak, yerel çalıştırma çoğu tüketici masaüstü bilgisayarını aşan devasa VRAM kurulumları gerektirir.
Verimli Uzun Bağlam: DeepSeek Sparse Attention (DSA) mekanizması, 131K tokens boyutundaki veriyi standart yoğun transformer modellerinden çok daha düşük hesaplama maliyetiyle işlemesini sağlar.
Inference Gecikmesi: Genişletilmiş reasoning zincirleri, modelin son derece karmaşık matematik problemleri için nihai bir cevap üretmesinin birkaç dakika sürebileceği anlamına gelir.
Gelişmiş Araç Entegrasyonu: Reasoning yeteneğinin doğrudan tool-calling döngüsüne entegre edildiği, türünün ilk örneği olan "Thinking in Tool-Use" moduna sahiptir.
Sadece API Optimize Edilmiş Beta: Ağırlıklar mevcut olsa da, en optimize edilmiş "Speciale" deneyimine şu anda DeepSeek'in API uç noktaları üzerinden öncelik verilmektedir.

API Hızlı Başlangıç

deepseek/deepseek-v3.2-speciale

Belgeleri Görüntüle
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: "YOUR_DEEPSEEK_API_KEY",
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve the 2025 IMO Problem 1 with step-by-step reasoning." }],
    model: "deepseek-v3.2-speciale",
    max_tokens: 16384, 
  });

  console.log("Reasoning Chain:", completion.choices[0].message.reasoning_content);
  console.log("Final Answer:", completion.choices[0].message.content);
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar DeepSeek-V3.2-Speciale Hakkında Ne Diyor

Topluluğun DeepSeek-V3.2-Speciale hakkında ne düşündüğünü görün

"DeepSeek V3.2 Speciale, GPT-5.1 High'dan ~15 kat daha ucuz olmasına rağmen matematik benchmark'larımda baskın durumda"
gum1h0x
x
"Herkesin gerçekten erişebileceği Altın IMO 2025 ve ICPC Dünya Finalleri seviyesinde bir modeli ilk kez yayınladılar"
Chubby
reddit
"Gerçekten çılgınca bir süre boyunca reasoning yapıyor... ama ürettiği script matematiksel olarak kusursuzdu"
Bijan Bowen
youtube
"Speciale zor problemler içindir; 2025 IMO'daki altın madalya sonuçlarıyla Gemini-3.0-Pro'ya rakip oluyor"
nick-baumann
reddit
"Geçerlilik oranı çok yüksek, yani tek bir yanlış kelime geçişi ürettiğinde bir kısır döngüye düşmüyor"
Lisan al Gaib
x
"Bu temel olarak GPT-4o-mini fiyatına o1-pro performansı demek. DeepSeek'ten inanılmaz bir iş"
tech-enthusiast
hackernews

DeepSeek-V3.2-Speciale Hakkında Videolar

DeepSeek-V3.2-Speciale hakkında eğitimler, incelemeler ve tartışmalar izleyin

Temelde reasoning yeteneklerinin en üst seviyeye çıkarıldığını ve Gemini 3 Pro ile rekabet etmek üzere tasarlandığını söylüyorlar.

Beni etkileyen sebep, Gemini 2.5 deepthink sadece bronz seviye sonuçlar alırken, bu DeepSeek modelinin altın madalya almasıydı.

Open-source olarak bu potansiyel seviyesinde bir modele sahip olmak gerçekten harika.

Çok uzun süre düşünecek... basit '2+2 kaç eder' soruları için tasarlanmamış.

2025 matematik olimpiyatı problemlerindeki doğruluk oranı, bu fiyattaki bir model için duyulmamış bir seviyede.

V3.2 speciality en üst seviye reasoning yeteneklerine sahip ve daha çok Gemini 3 Pro'nun rakibi.

DeepSeek, düşünmeyi doğrudan araç kullanımına (tool use) entegre eden ilk şirket.

Bu kapalı kaynaklı ve pahalı modellerle kıyaslanabilir bir open-source model.

Ulaştıkları benchmark rakamları, çoğu açık ağırlıklı modelin çok ötesinde.

Bu varyant için reinforcement learning üzerine gerçekten çok yoğunlaşmışlar.

Speciale özellikle reasoning için tasarlandı... bırakın model ne kadar gerekiyorsa o kadar düşünsün.

Artık attention darboğazını çözmek için DSA veya Deepseek sparse architecture kullanıyor.

Bu sadece teorik bir optimizasyon değil. Bu modelin uzun bağlamlarda bile çalıştırılmasının inanılmaz ucuz olduğu anlamına geliyor.

HumanEval sonuçlarına baktığınızda, indirebileceğiniz bir model için %94,1 oranı tek kelimeyle sarsıcı.

Standart V3'e kıyasla kod refactoring işlemlerini ele alma biçimi daha 'zeki' hissettiriyor.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları
Demo videoyu izle

DeepSeek-V3.2-Speciale için Pro İpuçları

DeepSeek-V3.2-Speciale'den en iyi şekilde yararlanmak için uzman ipuçları.

Uzunluk Kısıtlamalarını Devre Dışı Bırakın

API çağrınızın kısıtlayıcı max_tokens sınırlarına sahip olmadığından emin olun; modelin "düşünmek" için alana ihtiyacı vardır.

Token Tüketimini İzleyin

Bu model doğruluğu kısalığa tercih eder ve aynı görev için standart modellerden 3-4 kat daha fazla tokens harcayabilir.

Tool-Use Sırasında Reasoning'den Yararlanın

Modeli, sadece araç yürütmeden önce değil, yürütme sırasında da reasoning yapabildiği karmaşık agent görevleri için kullanın.

Yerel Quantization

Yerel olarak çalıştırıyorsanız, 671B mimarisinin karmaşık reasoning ağırlıklarını korumak için Q5_K_M veya daha yüksek quantization kullanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

DeepSeek-V3.2-Speciale Hakkında Sık Sorulan Sorular

DeepSeek-V3.2-Speciale hakkında sık sorulan soruların cevaplarını bulun