deepseek

DeepSeek v4

DeepSeek v4 是一款 1.6T 参数的 MoE 模型,具有 1M token context window,并以极具破坏性的价格提供针对文本、视觉和视频的原生 multimodal 支持。

Open SourceMultimodalMixture of ExpertsReasoningLong Context
deepseek logodeepseekDeepSeek-V2026-04-23
上下文
1.0Mtokens
最大输出
384Ktokens
输入价格
$1.74/ 1M
输出价格
$3.48/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
90.1%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 DeepSeek v4 在此基准测试中得分 90.1%。
HLE
48.2%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 DeepSeek v4 在此基准测试中得分 48.2%。
MMLU
90.1%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 DeepSeek v4 在此基准测试中得分 90.1%。
MMLU Pro
87.5%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 DeepSeek v4 在此基准测试中得分 87.5%。
SimpleQA
57.9%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 DeepSeek v4 在此基准测试中得分 57.9%。
IFEval
89%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 DeepSeek v4 在此基准测试中得分 89%。
AIME 2025
92%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 DeepSeek v4 在此基准测试中得分 92%。
MATH
90.2%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 DeepSeek v4 在此基准测试中得分 90.2%。
GSM8k
92.6%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 DeepSeek v4 在此基准测试中得分 92.6%。
MGSM
92%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 DeepSeek v4 在此基准测试中得分 92%。
MathVista
72%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 DeepSeek v4 在此基准测试中得分 72%。
SWE-Bench
80.6%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 DeepSeek v4 在此基准测试中得分 80.6%。
HumanEval
90%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 DeepSeek v4 在此基准测试中得分 90%。
LiveCodeBench
93.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 DeepSeek v4 在此基准测试中得分 93.5%。
MMMU
70%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 DeepSeek v4 在此基准测试中得分 70%。
MMMU Pro
55%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 DeepSeek v4 在此基准测试中得分 55%。
ChartQA
87%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 DeepSeek v4 在此基准测试中得分 87%。
DocVQA
92%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 DeepSeek v4 在此基准测试中得分 92%。
Terminal-Bench
67.9%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 DeepSeek v4 在此基准测试中得分 67.9%。
ARC-AGI
77%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 DeepSeek v4 在此基准测试中得分 77%。

关于 DeepSeek v4

了解 DeepSeek v4 的功能、特性以及它如何帮助您获得更好的效果。

高效的万亿级架构

DeepSeek v4 代表了 Mixture-of-Experts (MoE) 设计的演进,总参数扩展至 1.6 万亿,激活参数为 490 亿。该模型集成了 Compressed Sparse Attention (CSA) 和 Heavily Compressed Attention (HCA) 以管理其 100 万 token 的 context window。与标准架构相比,这些技术将 KV cache 内存占用减少了 90%,从而实现了更快的 inference,并降低了长 context 任务的硬件要求。

原生 Multimodal 集成

与那些使用独立视觉或音频编码器的模型不同,DeepSeek v4 从最初的训练阶段就是原生 multimodal 的。它在统一框架内处理文本、图像、音频和视频。这种方法改进了跨模态的 reasoning,使模型能够对原始视频文件和大型文档档案进行复杂分析,而不会丢失精细细节。

战略性成本颠覆

该模型定位为高性能的 open-source 替代品,用以取代顶级的私有模型。其定价为每百万输入 tokens 1.74 美元,在 coding 和数学领域保持了 frontier 级别的性能,同时显著降低了开发者的运营成本。包含可选的 Thinking Mode,允许对逻辑证明和竞赛编程进行深度 reasoning。

DeepSeek v4

DeepSeek v4 的使用案例

发现使用 DeepSeek v4 获得出色效果的不同方式。

大规模代码库重构

利用 1M context window 摄取整个仓库,进行全局错误检测和架构优化。

原生视频分析

直接处理原始视频文件,执行场景检测、生成字幕以及进行复杂的视觉 reasoning。

自动软件 Agent

将 model 部署在 agentic 工作流中,在 SWE-bench 上以 80.6% 的成功率解决实际的 GitHub 问题。

多模态内容创作

使用统一模型生成跨文本、图像和音频格式的结构化数据与创意内容。

高阶数学证明

使用专门的 Thinking Mode 解决奥林匹克级别的数学问题和形式化证明,进行深度 reasoning。

企业知识检索

在单次 prompt 中分析海量文档档案以提取事实,无需复杂的 RAG 管道。

优势

局限性

超高效的长 context: 将 KV cache 足迹减少了 90%,实现了在标准硬件上仍能保持高性能的 1M context window。
Thinking Mode 延迟较高: 深度 reasoning 模式增加了首字延迟 (time-to-first-token),使其不太适合超高速的对话需求。
市场领先的性价比: 以每百万 tokens 1.74 美元的价格提供 frontier 级别的智能,大幅低于西方 closed-source 竞品。
硬件优化偏差: 技术报告显示,其优化主要针对特定的国产加速器,而非 Nvidia 集群。
顶尖的 agentic coding: 在 SWE-bench Verified 上达到 80.6%,使其成为自动软件工程领域最强的模型之一。
事实准确性偏差: 在 SimpleQA 上得分 57.9%,表明虽然 reasoning 能力顶尖,但事实幻觉仍是一项挑战。
统一的原生 Multimodal: 在单一架构中支持文本、视觉、音频和视频,无需外部适配器或子模型。
复杂的 KV Cache 要求: 混合 HCA/CSA attention 机制需要特定的 kernel 支持才能实现最佳的本地性能。

API快速入门

deepseek/deepseek-v4-pro

查看文档
deepseek SDK
import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Optimize this Rust kernel for memory efficiency.' }], }); console.log(msg.choices[0].message.content);

安装SDK并在几分钟内开始进行API调用。

人们对 DeepSeek v4 的评价

看看社区对 DeepSeek v4 的看法

DeepSeek v4 的 reasoning 模式在我 Rust 代码中发现了一个连 Claude Opus 都错过的并发错误。简直疯狂。
rust_dev_2025
reddit
具有成本效益的 1M context 时代终于到来了。我们现在可以以极低的成本运行全项目重构。
tech_lead_alex
twitter
看到模型在处理 1M tokens 的代码库时没有丢失任何细节,这确实是 2026 年的转折点。
logic_fanatic
hackernews
Anthropic 和 OpenAI 现在面临严重的定价问题。DeepSeek 刚刚让 frontier AI 变成了大宗商品。
CodeMaster
youtube
它在 coding benchmark 上击败了 GPT-5.4,而且是 open-source。这是今年最重磅的发布。
AI_Researcher_99
twitter
内存压缩才是真正的魔法。在消费级硬件上运行 1T 参数模型终于成为现实。
GPU_Rich
reddit

关于 DeepSeek v4 的视频

观看关于 DeepSeek v4 的教程、评测和讨论

内存效率才是真正的亮点,将 KV cache 削减 90% 彻底改变了一切

以这种速度运行 1T 参数模型是一项巨大的架构胜利

每百万 tokens 的成本让小型初创公司无法忽视

我从未见过 open-source 模型能如此流畅地处理 100 万 tokens

感觉 open 和 closed 模型之间的差距已正式缩小

DeepSeek 不再仅仅是在价格上竞争;他们在 long-context reasoning 方面处于领先地位

与 Gemini 2.0 相比,其原生视频支持非常强大

如果使用 SGLang,本地安装非常简单

HumanEval 上的 benchmark 显示它基本与 GPT-5 持平

context window 使 RAG 管道对于中型项目而言几乎变得多余

coding benchmark 上的表现目前是任何其他开源模型无法比拟的

在大规模代码库重构方面,它媲美甚至超越了顶级 closed 模型

Engram 内存实现是该领域的一项技术奇迹

我们看到 Thinking Mode 在奥数比赛中的逻辑准确率达到了 90%

这次发布有效地让万亿参数智能实现了民主化

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

DeepSeek v4专业提示

专家提示助您充分利用DeepSeek v4。

切换 Thinking Mode

使用标准模式进行快速对话,将 Thinking Mode 专门用于 coding 和逻辑证明。

利用 context caching

利用内置的 context caching 功能,在使用重复的长 context prompts 时可降低高达 90% 的成本。

直接 Multimodal 输入

将原始音频和视频文件直接输入 API,以利用原生架构而非预先转录。

System Prompt 优化

在 system prompt 中提供清晰的 JSON schema 或工具使用说明,以实现高度可靠的 agentic 行为。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

关于DeepSeek v4的常见问题

查找关于DeepSeek v4的常见问题答案