deepseek

DeepSeek-V3.2-Speciale

مدل DeepSeek-V3.2-Speciale یک LLM با اولویت reasoning است که دارای عملکرد ریاضی در سطح مدال طلا، DeepSeek Sparse Attention و context window ۱۳۱ هزارتایی...

DeepSeekReasoningAIOpenSourceالمپیاد ریاضیSparseAttention
deepseek logodeepseekDeepSeek-V3۱ دسامبر ۲۰۲۵
پنجره زمینه
131Kتوکن
حداکثر خروجی
131Kتوکن
قیمت ورودی
$0.28/ 1M
قیمت خروجی
$0.42/ 1M
حالت:Text
قابلیت‌ها:ابزارهااستریمینگاستدلال
معیارها
GPQA
91.5%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. DeepSeek-V3.2-Speciale امتیاز 91.5% در این معیار کسب کرد.
HLE
30.6%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 30.6% در این معیار کسب کرد.
MMLU
88.5%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. DeepSeek-V3.2-Speciale امتیاز 88.5% در این معیار کسب کرد.
MMLU Pro
78.4%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. DeepSeek-V3.2-Speciale امتیاز 78.4% در این معیار کسب کرد.
SimpleQA
45.8%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 45.8% در این معیار کسب کرد.
IFEval
91.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. DeepSeek-V3.2-Speciale امتیاز 91.2% در این معیار کسب کرد.
AIME 2025
96%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. DeepSeek-V3.2-Speciale امتیاز 96% در این معیار کسب کرد.
MATH
90.1%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 90.1% در این معیار کسب کرد.
GSM8k
98.9%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. DeepSeek-V3.2-Speciale امتیاز 98.9% در این معیار کسب کرد.
MGSM
92.5%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. DeepSeek-V3.2-Speciale امتیاز 92.5% در این معیار کسب کرد.
MathVista
68.5%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 68.5% در این معیار کسب کرد.
SWE-Bench
73.1%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. DeepSeek-V3.2-Speciale امتیاز 73.1% در این معیار کسب کرد.
HumanEval
94.1%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. DeepSeek-V3.2-Speciale امتیاز 94.1% در این معیار کسب کرد.
LiveCodeBench
71.4%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 71.4% در این معیار کسب کرد.
MMMU
70.2%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. DeepSeek-V3.2-Speciale امتیاز 70.2% در این معیار کسب کرد.
MMMU Pro
58%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. DeepSeek-V3.2-Speciale امتیاز 58% در این معیار کسب کرد.
ChartQA
85%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 85% در این معیار کسب کرد.
DocVQA
93%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 93% در این معیار کسب کرد.
Terminal-Bench
46.4%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 46.4% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. DeepSeek-V3.2-Speciale امتیاز 12% در این معیار کسب کرد.

درباره DeepSeek-V3.2-Speciale

درباره قابلیت‌های DeepSeek-V3.2-Speciale، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

تمرکز بر Reasoning با توان محاسباتی بالا

DeepSeek-V3.2-Speciale یک مدل زبانی Mixture-of-Experts با ۶۸۵ میلیارد parameters است. این مدل ۳۷ میلیارد parameters را به ازای هر token فعال می‌کند تا تعادلی بین عملکرد و کارایی ایجاد کند. این نسخه برای حل مسائل چندمرحله‌ای طراحی شده است که نیازمند reasoning داخلی قابل‌توجهی هستند. با مقیاس‌بندی توان محاسباتی پس از آموزش به بیش از ۱۰٪ از بودجه پیش‌آموزش، این مدل زنجیره‌های فکری (chain-of-thought) طولانی‌ای تولید می‌کند که می‌تواند از ۴۷,۰۰۰ token در هر پاسخ فراتر رود. این ویژگی آن را برای پیمایش اثبات‌های منطقی پیچیده و تحقیقات فنی مناسب می‌سازد.

معماری Sparse Attention

این مدل از DeepSeek Sparse Attention (DSA) برای مدیریت context window ۱۳۱,۰۷۲ tokenی خود استفاده می‌کند. این مکانیزم از یک ایندکسر سریع برای جداسازی مرتبط‌ترین tokenها استفاده می‌کند که بار محاسباتی معمول در سیستم‌های dense با context طولانی را کاهش می‌دهد. این مدل در حالی که با سربار کمتری کار می‌کند، منطق خود را حفظ می‌نماید. این معماری به‌طور خاص محیط‌های با توان محاسباتی بالا را هدف قرار می‌دهد که در آن عمق reasoning بر انعطاف‌پذیری multimodal وسیع اولویت دارد.

عملکرد فنی و آکادمیک

نسخه Speciale اولین مدل open-weights است که به نتایج سطح مدال طلا در المپیاد بین‌المللی ریاضی (IMO) ۲۰۲۵ دست یافته است. این مدل در benchmarkهای فنی مانند AIME 2025 و HumanEval عالی عمل می‌کند و اغلب در وظایف منطقی خالص با سیستم‌های proprietary برابری می‌کند. توسعه‌دهندگان می‌توانند از آن برای تولید codebaseهای پیچیده یا سنتز اسناد فنی متراکم استفاده کنند. این مدل تحت لایسنس MIT منتشر شده که تسهیل‌کننده کاربرد گسترده در جامعه open-source است.

DeepSeek-V3.2-Speciale

موارد استفاده برای DeepSeek-V3.2-Speciale

روش‌های مختلف استفاده از DeepSeek-V3.2-Speciale برای دستیابی به نتایج عالی را کشف کنید.

تولید اثبات‌های ریاضی

حل اثبات‌های ریاضی در سطح المپیاد و مسائل منطق نمادین که نیازمند عمق شناختی بالا هستند.

طراحی معماری نرم‌افزار

تولید معماری‌های نرم‌افزاری پیچیده و چند فایلی از طریق reasoning در مورد وابستگی‌های ساختاری بدون نیاز به tool-use.

سنتز اسناد فنی

تحلیل و ارجاع متقاطع اطلاعات در مقالات فنی حجیم با استفاده از context window ۱۳۱ هزار tokenی.

تولید داده‌های مصنوعی (Synthetic Data)

ایجاد مجموعه‌داده‌های آموزشی با کیفیت و غنی از لحاظ reasoning برای انتقال منطق به مدل‌های کوچک‌تر و تخصصی.

تحقیقات علمی عمیق

بررسی و سنتز ادبیات آکادمیک متراکم برای استخراج پیشرفت منطقی دقیق در رشته‌های STEM.

برنامه‌ریزی Agentیک

پیمایش برنامه‌ریزی‌های چندمرحله‌ای پیچیده و توسعه استراتژی برای agentهای AI در محیط‌های شبیه‌سازی‌شده.

نقاط قوت

محدودیت‌ها

عملکرد عالی در ریاضی: کسب امتیاز ۹۶٪ در AIME 2025 و کسب مدال طلا در مسابقات بین‌المللی IMO.
عدم پشتیبانی از Multimodality بومی: فاقد قابلیت پردازش تصویر یا صدا است و استفاده از آن را به داده‌های متنی محدود می‌کند.
بودجه تفکر عظیم: تولید مسیرهای فکری فراتر از ۴۷,۰۰۰ token برای کاوش عمیق منطقی.
غیرفعال بودن Tool Calling: از function calling پشتیبانی نمی‌کند که کاربرد آن را برای تعامل خودکار با API محدود می‌سازد.
بهره‌وری DSA: مکانیزم DeepSeek Sparse Attention، context ۱۲۸ هزارتایی را با هزینه محاسباتی کمتر نسبت به مدل‌های dense مدیریت می‌کند.
Inference Latency: حالت‌های تفکر عمیق می‌توانند باعث ایجاد زمان انتظار چند دقیقه‌ای برای اثبات‌های منطقی پیچیده شوند.
مزیت هزینه: ارائه reasoning در سطح frontier با قیمت ۰.۲۸ دلار به ازای هر میلیون token، که به‌طور قابل‌توجهی ارزان‌تر از مدل‌های proprietary است.
نیازهای میزبانی: به دلیل معماری MoE با ۶۸۵ میلیارد parameters، نیازمند کلاسترهای GPU در سطح سازمانی است.

شروع سریع API

deepseek/deepseek-v3.2-speciale

مشاهده مستندات
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve for x in the complex plane: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره DeepSeek-V3.2-Speciale چه می‌گویند

ببینید جامعه درباره DeepSeek-V3.2-Speciale چه فکر می‌کند

DeepSeek-V3.2-Speciale یک هیولاست. reasoning به حداکثر رسیده که با Gemini 3 Pro رقابت می‌کند.
OpenRouter
twitter
امتیازات HumanEval واقعی هستند. کد بسیار تمیزتری نسبت به بسیاری از مدل‌های proprietary که این ماه تست کردم، می‌نویسد.
dev_guru_99
reddit
قیمت‌گذاری آن دیوانه‌وار است. reasoning در سطح frontier با کسری از هزینه OpenAI یا Anthropic.
AI_Builder_X
twitter
دیدن یک مدل open-weights که واقعاً ۳ آزمایشگاه برتر را به چالش می‌کشد، طراوت‌بخش است. انتخاب‌های معماری در اینجا نبوغ‌آمیز است.
binary_explorer
hackernews

ویدیوهای درباره DeepSeek-V3.2-Speciale

آموزش‌ها، بررسی‌ها و بحث‌های درباره DeepSeek-V3.2-Speciale را تماشا کنید

مدت زمان تفکر آن دیوانه‌وار طولانی است... این یک مدل عمیقاً reasoning است.

مدل DeepSeek در [IMO] مدال طلا گرفت در حالی که Deepthink فقط برنز گرفت.

تماشای عملکرد آن می‌تواند از نظر آموزشی بسیار ارزشمند باشد.

منطق در اینجا نسبت به مدل‌های استاندارد در سطح دیگری قرار دارد.

شما می‌توانید واقعاً ببینید که مدل در حال تکرار و عبور از شکست‌ها است.

Special در واقع به معنای تفکر عمیق است. این مدل یک حالت deep think دارد.

۶۳ ثانیه فکر می‌کند... این واقعاً شگفت‌انگیز است.

در آنجا بسیار هوشمند عمل می‌کند... کدهای واقعاً پیشرفته‌ای ارائه می‌دهد.

مقیاس‌بندی محلی این مدل، بزرگترین مانع برای کاربران خواهد بود.

tokenهای مربوط به reasoning در اکثر پلتفرم‌ها به شکل متفاوتی محاسبه می‌شوند.

نسخه Special یک هیولا است. reasoning به حداکثر رسیده، chain of thought عمیق.

Special برای deep reasoning، اثبات‌های چندمرحله‌ای و تحقیقات پیچیده طراحی شده است.

شفافیت DeepSeek یک مزیت عظیم است... مشاهده نحوه کارکرد آن.

این مدل در پاسخ‌های بسیار طولانی‌تر از Gemini منسجم‌تر باقی می‌ماند.

فناوری Sparse Attention دلیلی است که آن‌ها قیمت را اینقدر پایین نگه می‌دارند.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای DeepSeek-V3.2-Speciale

نکات تخصصی برای کمک به شما در استفاده حداکثری از DeepSeek-V3.2-Speciale و دستیابی به نتایج بهتر.

بهینه‌سازی پارامترهای Sampling

برای وظایف با منطق بالا، temperature را روی ۱.۰ و top_p را روی ۰.۹۵ تنظیم کنید تا اطمینان حاصل شود که مسیرهای deep reasoning متنوع باقی می‌مانند.

ارائه جزئیات فنی

دستورالعمل‌ها را با markdown ساختاردهی کنید تا به مدل کمک کنید پردازش chain-of-thought داخلی خود را بهتر سازماندهی کند.

در نظر گرفتن زمان تفکر

در اثبات‌های پیچیده منتظر latency بیشتر باشید، زیرا مدل زنجیره‌های فکری داخلی عظیمی تولید می‌کند.

استفاده از Endpointهای اختصاصی

مسیر API 'speciale' را در تنظیمات خود مشخص کنید تا مستقیماً به نسخه reasoning با توان محاسباتی بالا دسترسی پیدا کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

سوالات متداول درباره DeepSeek-V3.2-Speciale

پاسخ سوالات رایج درباره DeepSeek-V3.2-Speciale را بیابید