قیمتگذاری برای DeepSeek-V3.2-Speciale چگونه است؟

هزینه آن ۰.۲۸ دلار به ازای هر ۱ میلیون token ورودی و ۰.۴۲ دلار به ازای هر ۱ میلیون token خروجی است. این موضوع نشاندهنده هدف DeepSeek برای فراهم کردن دسترسی ارزان به هوش در سطح frontier model است.

آیا این مدل از ورودی تصویر یا vision پشتیبانی میکند؟

خیر، نسخه Speciale یک model صرفاً متنی است که بر منطق و reasoning ریاضی متمرکز است. این مدل تصاویر یا ویدئوها را پردازش نمیکند.

اندازه context window چقدر است؟

این مدل از یک context window به اندازه ۱۳۱,۰۷۲ token پشتیبانی میکند. این یعنی میتواند حدود ۱۹۲ صفحه A4 متن را در یک prompt واحد پردازش کند.

آیا میتوانم از tool-calling با مدل Speciale استفاده کنم؟

خیر، قابلیت tool-calling در نسخه Speciale غیرفعال شده است تا ظرفیت خالص reasoning به حداکثر برسد. کاربرانی که به ابزار نیاز دارند باید از مدل استاندارد V3.2 استفاده کنند.

این مدل در مقایسه با GPT-5 چگونه است؟

این مدل در benchmarkهای خاص reasoning و ریاضی مانند AIME 2025 با GPT-5 برابری میکند یا از آن پیشی میگیرد. مزیت اصلی آن ارائه منطق مشابه با هزینه کمتر است.

آیا این مدل open-weights است؟

بله، DeepSeek-V3.2-Speciale یک مدل open-weights است که تحت لایسنس MIT منتشر شده است. این امکان دانلود و استقرار عمومی آن را فراهم میکند.

حداکثر محدودیت خروجی چقدر است؟

این مدل میتواند بیش از ۴۷,۰۰۰ token در یک پاسخ واحد تولید کند. این قابلیت بهطور خاص برای جلسات طولانی تفکر و deep reasoning استفاده میشود.

DeepSeek-V3.2-Speciale

مدل DeepSeek-V3.2-Speciale یک LLM با اولویت reasoning است که دارای عملکرد ریاضی در سطح مدال طلا، DeepSeek Sparse Attention و context window ۱۳۱ هزارتایی...

DeepSeekReasoningAIOpenSourceالمپیاد ریاضیSparseAttention

deepseekDeepSeek-V3۱ دسامبر ۲۰۲۵

پنجره زمینه

131Kتوکن

حداکثر خروجی

131Kتوکن

قیمت ورودی

$0.28/ 1M

قیمت خروجی

$0.42/ 1M

حالت:Text

قابلیت‌ها:ابزارهااستریمینگاستدلال

معیارها

GPQA

91.5%

HLE

30.6%

MMLU

88.5%

MMLU Pro

78.4%

SimpleQA

45.8%

IFEval

91.2%

AIME 2025

96%

MATH

90.1%

GSM8k

98.9%

MGSM

92.5%

MathVista

68.5%

SWE-Bench

73.1%

HumanEval

94.1%

LiveCodeBench

71.4%

MMMU

70.2%

MMMU Pro

58%

ChartQA

85%

DocVQA

93%

Terminal-Bench

46.4%

ARC-AGI

12%

مشاهده مستندات API

درباره DeepSeek-V3.2-Speciale

درباره قابلیت‌های DeepSeek-V3.2-Speciale، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

تمرکز بر Reasoning با توان محاسباتی بالا

DeepSeek-V3.2-Speciale یک مدل زبانی Mixture-of-Experts با ۶۸۵ میلیارد parameters است. این مدل ۳۷ میلیارد parameters را به ازای هر token فعال می‌کند تا تعادلی بین عملکرد و کارایی ایجاد کند. این نسخه برای حل مسائل چندمرحله‌ای طراحی شده است که نیازمند reasoning داخلی قابل‌توجهی هستند. با مقیاس‌بندی توان محاسباتی پس از آموزش به بیش از ۱۰٪ از بودجه پیش‌آموزش، این مدل زنجیره‌های فکری (chain-of-thought) طولانی‌ای تولید می‌کند که می‌تواند از ۴۷,۰۰۰ token در هر پاسخ فراتر رود. این ویژگی آن را برای پیمایش اثبات‌های منطقی پیچیده و تحقیقات فنی مناسب می‌سازد.

معماری Sparse Attention

این مدل از DeepSeek Sparse Attention (DSA) برای مدیریت context window ۱۳۱,۰۷۲ tokenی خود استفاده می‌کند. این مکانیزم از یک ایندکسر سریع برای جداسازی مرتبط‌ترین tokenها استفاده می‌کند که بار محاسباتی معمول در سیستم‌های dense با context طولانی را کاهش می‌دهد. این مدل در حالی که با سربار کمتری کار می‌کند، منطق خود را حفظ می‌نماید. این معماری به‌طور خاص محیط‌های با توان محاسباتی بالا را هدف قرار می‌دهد که در آن عمق reasoning بر انعطاف‌پذیری multimodal وسیع اولویت دارد.

عملکرد فنی و آکادمیک

نسخه Speciale اولین مدل open-weights است که به نتایج سطح مدال طلا در المپیاد بین‌المللی ریاضی (IMO) ۲۰۲۵ دست یافته است. این مدل در benchmarkهای فنی مانند AIME 2025 و HumanEval عالی عمل می‌کند و اغلب در وظایف منطقی خالص با سیستم‌های proprietary برابری می‌کند. توسعه‌دهندگان می‌توانند از آن برای تولید codebaseهای پیچیده یا سنتز اسناد فنی متراکم استفاده کنند. این مدل تحت لایسنس MIT منتشر شده که تسهیل‌کننده کاربرد گسترده در جامعه open-source است.

موارد استفاده برای DeepSeek-V3.2-Speciale

روش‌های مختلف استفاده از DeepSeek-V3.2-Speciale برای دستیابی به نتایج عالی را کشف کنید.

تولید اثبات‌های ریاضی

حل اثبات‌های ریاضی در سطح المپیاد و مسائل منطق نمادین که نیازمند عمق شناختی بالا هستند.

طراحی معماری نرم‌افزار

تولید معماری‌های نرم‌افزاری پیچیده و چند فایلی از طریق reasoning در مورد وابستگی‌های ساختاری بدون نیاز به tool-use.

سنتز اسناد فنی

تحلیل و ارجاع متقاطع اطلاعات در مقالات فنی حجیم با استفاده از context window ۱۳۱ هزار tokenی.

تولید داده‌های مصنوعی (Synthetic Data)

ایجاد مجموعه‌داده‌های آموزشی با کیفیت و غنی از لحاظ reasoning برای انتقال منطق به مدل‌های کوچک‌تر و تخصصی.

تحقیقات علمی عمیق

بررسی و سنتز ادبیات آکادمیک متراکم برای استخراج پیشرفت منطقی دقیق در رشته‌های STEM.

برنامه‌ریزی Agentیک

پیمایش برنامه‌ریزی‌های چندمرحله‌ای پیچیده و توسعه استراتژی برای agentهای AI در محیط‌های شبیه‌سازی‌شده.

نقاط قوت

محدودیت‌ها

عملکرد عالی در ریاضی: کسب امتیاز ۹۶٪ در AIME 2025 و کسب مدال طلا در مسابقات بین‌المللی IMO.

عدم پشتیبانی از Multimodality بومی: فاقد قابلیت پردازش تصویر یا صدا است و استفاده از آن را به داده‌های متنی محدود می‌کند.

بودجه تفکر عظیم: تولید مسیرهای فکری فراتر از ۴۷,۰۰۰ token برای کاوش عمیق منطقی.

غیرفعال بودن Tool Calling: از function calling پشتیبانی نمی‌کند که کاربرد آن را برای تعامل خودکار با API محدود می‌سازد.

بهره‌وری DSA: مکانیزم DeepSeek Sparse Attention، context ۱۲۸ هزارتایی را با هزینه محاسباتی کمتر نسبت به مدل‌های dense مدیریت می‌کند.

Inference Latency: حالت‌های تفکر عمیق می‌توانند باعث ایجاد زمان انتظار چند دقیقه‌ای برای اثبات‌های منطقی پیچیده شوند.

مزیت هزینه: ارائه reasoning در سطح frontier با قیمت ۰.۲۸ دلار به ازای هر میلیون token، که به‌طور قابل‌توجهی ارزان‌تر از مدل‌های proprietary است.

نیازهای میزبانی: به دلیل معماری MoE با ۶۸۵ میلیارد parameters، نیازمند کلاسترهای GPU در سطح سازمانی است.

شروع سریع API

deepseek/deepseek-v3.2-speciale

مشاهده مستندات

deepseek SDK

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve for x in the complex plane: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره DeepSeek-V3.2-Speciale چه می‌گویند

ببینید جامعه درباره DeepSeek-V3.2-Speciale چه فکر می‌کند

“DeepSeek-V3.2-Speciale یک هیولاست. reasoning به حداکثر رسیده که با Gemini 3 Pro رقابت می‌کند.”

— OpenRouter

twitter

“امتیازات HumanEval واقعی هستند. کد بسیار تمیزتری نسبت به بسیاری از مدل‌های proprietary که این ماه تست کردم، می‌نویسد.”

— dev_guru_99

“قیمت‌گذاری آن دیوانه‌وار است. reasoning در سطح frontier با کسری از هزینه OpenAI یا Anthropic.”

— AI_Builder_X

twitter

“دیدن یک مدل open-weights که واقعاً ۳ آزمایشگاه برتر را به چالش می‌کشد، طراوت‌بخش است. انتخاب‌های معماری در اینجا نبوغ‌آمیز است.”

— binary_explorer

hackernews

ویدیوهای درباره DeepSeek-V3.2-Speciale

آموزش‌ها، بررسی‌ها و بحث‌های درباره DeepSeek-V3.2-Speciale را تماشا کنید

“مدت زمان تفکر آن دیوانه‌وار طولانی است... این یک مدل عمیقاً reasoning است.”

“مدل DeepSeek در [IMO] مدال طلا گرفت در حالی که Deepthink فقط برنز گرفت.”

“تماشای عملکرد آن می‌تواند از نظر آموزشی بسیار ارزشمند باشد.”

“منطق در اینجا نسبت به مدل‌های استاندارد در سطح دیگری قرار دارد.”

“شما می‌توانید واقعاً ببینید که مدل در حال تکرار و عبور از شکست‌ها است.”

“Special در واقع به معنای تفکر عمیق است. این مدل یک حالت deep think دارد.”

“۶۳ ثانیه فکر می‌کند... این واقعاً شگفت‌انگیز است.”

“در آنجا بسیار هوشمند عمل می‌کند... کدهای واقعاً پیشرفته‌ای ارائه می‌دهد.”

“مقیاس‌بندی محلی این مدل، بزرگترین مانع برای کاربران خواهد بود.”

“tokenهای مربوط به reasoning در اکثر پلتفرم‌ها به شکل متفاوتی محاسبه می‌شوند.”

“نسخه Special یک هیولا است. reasoning به حداکثر رسیده، chain of thought عمیق.”

“Special برای deep reasoning، اثبات‌های چندمرحله‌ای و تحقیقات پیچیده طراحی شده است.”

“شفافیت DeepSeek یک مزیت عظیم است... مشاهده نحوه کارکرد آن.”

“این مدل در پاسخ‌های بسیار طولانی‌تر از Gemini منسجم‌تر باقی می‌ماند.”

“فناوری Sparse Attention دلیلی است که آن‌ها قیمت را اینقدر پایین نگه می‌دارند.”

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI

اتوماسیون وب

گردش‌کارهای هوشمند

شروع رایگان

نکات حرفه‌ای برای DeepSeek-V3.2-Speciale

نکات تخصصی برای کمک به شما در استفاده حداکثری از DeepSeek-V3.2-Speciale و دستیابی به نتایج بهتر.

بهینه‌سازی پارامترهای Sampling

برای وظایف با منطق بالا، temperature را روی ۱.۰ و top_p را روی ۰.۹۵ تنظیم کنید تا اطمینان حاصل شود که مسیرهای deep reasoning متنوع باقی می‌مانند.

ارائه جزئیات فنی

دستورالعمل‌ها را با markdown ساختاردهی کنید تا به مدل کمک کنید پردازش chain-of-thought داخلی خود را بهتر سازماندهی کند.

در نظر گرفتن زمان تفکر

در اثبات‌های پیچیده منتظر latency بیشتر باشید، زیرا مدل زنجیره‌های فکری داخلی عظیمی تولید می‌کند.

استفاده از Endpointهای اختصاصی

مسیر API 'speciale' را در تنظیمات خود مشخص کنید تا مستقیماً به نسخه reasoning با توان محاسباتی بالا دسترسی پیدا کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context

$0.95/$4.00/1M

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

سوالات متداول درباره DeepSeek-V3.2-Speciale

پاسخ سوالات رایج درباره DeepSeek-V3.2-Speciale را بیابید

DeepSeek-V3.2-Speciale

درباره DeepSeek-V3.2-Speciale

تمرکز بر Reasoning با توان محاسباتی بالا

معماری Sparse Attention

عملکرد فنی و آکادمیک

موارد استفاده برای DeepSeek-V3.2-Speciale

تولید اثبات‌های ریاضی

طراحی معماری نرم‌افزار

سنتز اسناد فنی

تولید داده‌های مصنوعی (Synthetic Data)

تحقیقات علمی عمیق

برنامه‌ریزی Agentیک

نقاط قوت

محدودیت‌ها

شروع سریع API

مردم درباره DeepSeek-V3.2-Speciale چه می‌گویند

ویدیوهای درباره DeepSeek-V3.2-Speciale

گردش کار خود را با اتوماسیون AI

نکات حرفه‌ای برای DeepSeek-V3.2-Speciale

بهینه‌سازی پارامترهای Sampling

ارائه جزئیات فنی

در نظر گرفتن زمان تفکر

استفاده از Endpointهای اختصاصی

کاربران ما چه می‌گویند

مرتبط AI Models

Claude Opus 4.6

Gemini 3 Pro

Qwen 3.7 Max

Kimi k2.6

Gemini 3 Flash

DeepSeek v4

Claude Sonnet 4.6

GPT-5.2 Pro

سوالات متداول درباره DeepSeek-V3.2-Speciale

قیمت‌گذاری برای DeepSeek-V3.2-Speciale چگونه است؟

آیا این مدل از ورودی تصویر یا vision پشتیبانی می‌کند؟

اندازه context window چقدر است؟

آیا می‌توانم از tool-calling با مدل Speciale استفاده کنم؟

این مدل در مقایسه با GPT-5 چگونه است؟

آیا این مدل open-weights است؟

حداکثر محدودیت خروجی چقدر است؟