deepseek

DeepSeek v4

DeepSeek v4 یک مدل MoE با ۱.۶ تریلیون پارامتر است که دارای context window یک میلیونی و پشتیبانی multimodal بومی برای متن، تصویر و ویدیو با قیمت‌های بی‌سابقه...

Open SourceMultimodalMixture of ExpertsReasoningLong Context
deepseek logodeepseekDeepSeek-V2026-04-23
پنجره زمینه
1.0Mتوکن
حداکثر خروجی
384Kتوکن
قیمت ورودی
$1.74/ 1M
قیمت خروجی
$3.48/ 1M
حالت:TextImageAudioVideo
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
90.1%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. DeepSeek v4 امتیاز 90.1% در این معیار کسب کرد.
HLE
48.2%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. DeepSeek v4 امتیاز 48.2% در این معیار کسب کرد.
MMLU
90.1%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. DeepSeek v4 امتیاز 90.1% در این معیار کسب کرد.
MMLU Pro
87.5%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. DeepSeek v4 امتیاز 87.5% در این معیار کسب کرد.
SimpleQA
57.9%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. DeepSeek v4 امتیاز 57.9% در این معیار کسب کرد.
IFEval
89%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. DeepSeek v4 امتیاز 89% در این معیار کسب کرد.
AIME 2025
92%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. DeepSeek v4 امتیاز 92% در این معیار کسب کرد.
MATH
90.2%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. DeepSeek v4 امتیاز 90.2% در این معیار کسب کرد.
GSM8k
92.6%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. DeepSeek v4 امتیاز 92.6% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. DeepSeek v4 امتیاز 92% در این معیار کسب کرد.
MathVista
72%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. DeepSeek v4 امتیاز 72% در این معیار کسب کرد.
SWE-Bench
80.6%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. DeepSeek v4 امتیاز 80.6% در این معیار کسب کرد.
HumanEval
90%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. DeepSeek v4 امتیاز 90% در این معیار کسب کرد.
LiveCodeBench
93.5%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. DeepSeek v4 امتیاز 93.5% در این معیار کسب کرد.
MMMU
70%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. DeepSeek v4 امتیاز 70% در این معیار کسب کرد.
MMMU Pro
55%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. DeepSeek v4 امتیاز 55% در این معیار کسب کرد.
ChartQA
87%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. DeepSeek v4 امتیاز 87% در این معیار کسب کرد.
DocVQA
92%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. DeepSeek v4 امتیاز 92% در این معیار کسب کرد.
Terminal-Bench
67.9%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. DeepSeek v4 امتیاز 67.9% در این معیار کسب کرد.
ARC-AGI
77%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. DeepSeek v4 امتیاز 77% در این معیار کسب کرد.

درباره DeepSeek v4

درباره قابلیت‌های DeepSeek v4، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

معماری فوق‌کارآمد در مقیاس تریلیون پارامتری

DeepSeek v4 نشان‌دهنده تکاملی در طراحی Mixture-of-Experts (MoE) است که تا ۱.۶ تریلیون پارامتر کل با ۴۹ میلیارد پارامتر فعال مقیاس می‌یابد. این مدل با ادغام Compressed Sparse Attention (CSA) و Heavily Compressed Attention (HCA) برای مدیریت context window یک میلیونی خود عمل می‌کند. این فناوری‌ها ردپای حافظه KV cache را نسبت به معماری‌های استاندارد تا ۹۰٪ کاهش می‌دهند که امکان inference سریع‌تر و نیازهای سخت‌افزاری کمتر برای وظایف long-context را فراهم می‌کند.

یکپارچه‌سازی Multimodal بومی

برخلاف مدل‌هایی که از انکودرهای جداگانه تصویر یا صدا استفاده می‌کنند، DeepSeek v4 از مرحله آموزش اولیه به صورت natively multimodal بوده است. این مدل متن، تصاویر، صدا و ویدیو را در یک چارچوب واحد پردازش می‌کند. این رویکرد استدلال بین‌مدل را بهبود می‌بخشد و به مدل اجازه می‌دهد بدون از دست دادن جزئیات دقیق، تحلیل‌های پیچیده‌ای روی فایل‌های ویدیویی خام و آرشیوهای اسناد بزرگ انجام دهد.

اختلال استراتژیک در قیمت‌گذاری

این مدل به عنوان یک جایگزین open-source قدرتمند برای مدل‌های proprietary سطح بالا معرفی شده است. با قیمت ۱.۷۴ دلار به ازای هر میلیون input tokens، این مدل ضمن کاهش قابل توجه هزینه‌های عملیاتی برای توسعه‌دهندگان، عملکردی در سطح frontier در کدنویسی و ریاضیات حفظ می‌کند. گنجاندن یک Thinking Mode اختیاری امکان استدلال عمیق برای اثبات‌های منطقی و برنامه‌نویسی رقابتی را فراهم می‌آورد.

DeepSeek v4

موارد استفاده برای DeepSeek v4

روش‌های مختلف استفاده از DeepSeek v4 برای دستیابی به نتایج عالی را کشف کنید.

رفکتورینگ کدهای حجیم

استفاده از context window یک میلیونی برای وارد کردن کل مخازن (repositories) جهت شناسایی باگ‌های سراسری و بهبودهای معماری.

تجزیه و تحلیل ویدیویی بومی

پردازش مستقیم فایل‌های ویدیویی خام برای انجام تشخیص صحنه، تولید متن (transcript) و استدلال بصری پیچیده.

Agentهای نرم‌افزاری خودمختار

استقرار مدل در گردش‌کارهای agentic برای حل مشکلات واقعی GitHub با نرخ موفقیت ۸۰.۶٪ در SWE-bench.

تولید محتوای Multi-Modal

تولید داده‌های ساختاریافته و محتوای خلاقانه در قالب‌های متن، تصویر و صدا با استفاده از یک مدل واحد.

اثبات‌های ریاضی سطح بالا

حل مسائل ریاضی در سطح المپیاد و اثبات‌های رسمی با استفاده از Thinking Mode تخصصی برای استدلال عمیق.

بازیابی دانش سازمانی

تجزیه و تحلیل آرشیوهای عظیم اسناد در یک prompt واحد برای استخراج حقایق بدون نیاز به پایپ‌لاین‌های پیچیده RAG.

نقاط قوت

محدودیت‌ها

Context طولانی فوق‌کارآمد: کاهش ۹۰ درصدی حافظه KV cache که امکان استفاده از context window یک میلیونی را روی سخت‌افزارهای استاندارد فراهم می‌کند.
تاخیر بیشتر در Thinking Mode: حالت استدلال عمیق، زمان رسیدن به اولین token را افزایش می‌دهد و آن را برای نیازهای گفتگو بسیار سریع کمتر مناسب می‌کند.
ارزش بی‌نظیر در بازار: ارائه هوش در سطح frontier با قیمت ۱.۷۴ دلار به ازای هر میلیون token، که قیمت بسیار کمتری نسبت به رقبای غربی closed-source دارد.
سوگیری در بهینه‌سازی سخت‌افزاری: گزارش‌های فنی نشان می‌دهد که بهینه‌سازی‌ها عمدتاً برای شتاب‌دهنده‌های خاص چینی نسبت به خوشه‌های Nvidia تنظیم شده‌اند.
کدنویسی Agentic پیشرفته: دستیابی به امتیاز ۸۰.۶٪ در SWE-bench Verified که آن را به یکی از تواناترین مدل‌ها برای مهندسی نرم‌افزار خودمختار تبدیل می‌کند.
شکاف در دقت واقعی (Factuality): کسب امتیاز ۵۷.۹٪ در SimpleQA که نشان می‌دهد علی‌رغم استدلال عالی، توهم حقایق (factual hallucination) همچنان یک چالش است.
Multimodality بومی یکپارچه: پشتیبانی از متن، تصویر، صدا و ویدیو در یک معماری واحد بدون نیاز به آداپتورهای خارجی یا مدل‌های فرعی.
نیازهای پیچیده KV Cache: مکانیزم توجه ترکیبی HCA/CSA برای عملکرد محلی بهینه به پشتیبانی خاص کرنل نیاز دارد.

شروع سریع API

deepseek/deepseek-v4-pro

مشاهده مستندات
deepseek SDK
import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Optimize this Rust kernel for memory efficiency.' }], }); console.log(msg.choices[0].message.content);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره DeepSeek v4 چه می‌گویند

ببینید جامعه درباره DeepSeek v4 چه فکر می‌کند

حالت استدلال DeepSeek v4 یک باگ همزمانی (concurrency) در کد Rust من پیدا کرد که حتی Claude Opus هم متوجه آن نشده بود. واقعاً دیوانه‌کننده است.
rust_dev_2025
reddit
عصر context یک میلیونی مقرون‌به‌صرفه بالاخره فرا رسید. اکنون می‌توانیم رفکتورینگ کل پروژه را با قیمت ناچیز انجام دهیم.
tech_lead_alex
twitter
دیدن اینکه مدل یک codebase یک میلیونی را بدون از دست دادن 'سوزن در انبار کاه' پردازش می‌کند، نقطه عطف واقعی سال ۲۰۲۶ است.
logic_fanatic
hackernews
Anthropic و OpenAI اکنون مشکل قیمت‌گذاری جدی دارند. DeepSeek هوش مصنوعی frontier را به یک کالا تبدیل کرد.
CodeMaster
youtube
این مدل در benchmarkهای کدنویسی، GPT-5.4 را شکست می‌دهد در حالی که open-source است. این بزرگترین عرضه سال است.
AI_Researcher_99
twitter
فشرده‌سازی حافظه، جادوی واقعی است. یک تریلیون پارامتر روی سخت‌افزارهای مصرفی بالاخره در حال واقعی شدن است.
GPU_Rich
reddit

ویدیوهای درباره DeepSeek v4

آموزش‌ها، بررسی‌ها و بحث‌های درباره DeepSeek v4 را تماشا کنید

بهره‌وری حافظه داستان اصلی اینجاست؛ کاهش ۹۰ درصدی KV cache همه چیز را تغییر می‌دهد

اجرای یک مدل ۱ تریلیون پارامتری با این سرعت، یک پیروزی بزرگ در معماری است

هزینه به ازای هر میلیون token باعث می‌شود استارتاپ‌های کوچک نتوانند آن را نادیده بگیرند

تا به حال ندیده بودم یک مدل open-source بتواند ۱ میلیون token را اینقدر تمیز پردازش کند

به نظر می‌رسد شکاف بین مدل‌های باز و بسته رسماً از بین رفته است

DeepSeek دیگر فقط در قیمت رقابت نمی‌کند؛ آن‌ها در استدلال long-context پیشرو هستند

پشتیبانی بومی ویدیو در مقایسه با Gemini 2.0 به طرز شگفت‌آوری قوی است

اگر از SGLang استفاده کنید، نصب محلی آن بسیار آسان است

benchmarkهای HumanEval نشان می‌دهند که اساساً با GPT-5 برابری می‌کند

این context window باعث شده پایپ‌لاین‌های RAG برای پروژه‌های متوسط تقریباً اضافی باشند

عملکرد در benchmarkهای کدنویسی در حال حاضر توسط هیچ مدل open-weight دیگری قابل رقابت نیست

در رفکتورینگ کدهای حجیم، با مدل‌های سطح بالای closed برابری کرده یا از آن‌ها پیشی می‌گیرد

پیاده‌سازی حافظه engram یک شاهکار فنی در این حوزه است

ما در Thinking Mode برای ریاضیات المپیادی دقت منطقی ۹۰ درصدی می‌بینیم

این عرضه عملاً هوش تریلیون پارامتری را دموکراتیزه می‌کند

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای DeepSeek v4

نکات تخصصی برای کمک به شما در استفاده حداکثری از DeepSeek v4 و دستیابی به نتایج بهتر.

تغییر بین حالت‌های تفکر (Thinking Modes)

از حالت استاندارد برای چت‌های سریع استفاده کنید و Thinking Mode را منحصراً برای کدنویسی و اثبات‌های منطقی رزرو کنید.

بهره‌گیری از Context Caching

از ویژگی‌های داخلی context caching استفاده کنید تا هنگام استفاده از promptهای طولانی و تکراری، هزینه‌ها را تا ۹۰٪ کاهش دهید.

ورودی Multimodal مستقیم

فایل‌های خام صوتی و ویدیویی را مستقیماً به API بدهید تا به جای پیش‌نویسی (transcribing) از معماری بومی مدل بهره‌مند شوید.

بهینه‌سازی System Prompt

برای دستیابی به رفتار agentic بسیار قابل اعتماد، دستورالعمل‌های واضح JSON schema یا استفاده از ابزارها (tool-use) را در system prompt ارائه دهید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

سوالات متداول درباره DeepSeek v4

پاسخ سوالات رایج درباره DeepSeek v4 را بیابید