deepseek

DeepSeek v4

DeepSeek v4は、100万トークンのcontext windowを備え、テキスト、ビジョン、動画のネイティブなmultimodal対応を圧倒的な低価格で実現する1.6TパラメータのMoE modelです。

Open SourceMultimodalMixture of ExpertsReasoningLong Context
deepseek logodeepseekDeepSeek-V2026-04-23
コンテキスト
1.0Mトークン
最大出力
384Kトークン
入力価格
$1.74/ 1M
出力価格
$3.48/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
90.1%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 DeepSeek v4はこのベンチマークで90.1%を記録しました。
HLE
48.2%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 DeepSeek v4はこのベンチマークで48.2%を記録しました。
MMLU
90.1%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 DeepSeek v4はこのベンチマークで90.1%を記録しました。
MMLU Pro
87.5%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 DeepSeek v4はこのベンチマークで87.5%を記録しました。
SimpleQA
57.9%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 DeepSeek v4はこのベンチマークで57.9%を記録しました。
IFEval
89%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 DeepSeek v4はこのベンチマークで89%を記録しました。
AIME 2025
92%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 DeepSeek v4はこのベンチマークで92%を記録しました。
MATH
90.2%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 DeepSeek v4はこのベンチマークで90.2%を記録しました。
GSM8k
92.6%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 DeepSeek v4はこのベンチマークで92.6%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 DeepSeek v4はこのベンチマークで92%を記録しました。
MathVista
72%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 DeepSeek v4はこのベンチマークで72%を記録しました。
SWE-Bench
80.6%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 DeepSeek v4はこのベンチマークで80.6%を記録しました。
HumanEval
90%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 DeepSeek v4はこのベンチマークで90%を記録しました。
LiveCodeBench
93.5%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 DeepSeek v4はこのベンチマークで93.5%を記録しました。
MMMU
70%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 DeepSeek v4はこのベンチマークで70%を記録しました。
MMMU Pro
55%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 DeepSeek v4はこのベンチマークで55%を記録しました。
ChartQA
87%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 DeepSeek v4はこのベンチマークで87%を記録しました。
DocVQA
92%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 DeepSeek v4はこのベンチマークで92%を記録しました。
Terminal-Bench
67.9%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 DeepSeek v4はこのベンチマークで67.9%を記録しました。
ARC-AGI
77%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 DeepSeek v4はこのベンチマークで77%を記録しました。

DeepSeek v4について

DeepSeek v4の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

高効率の兆(trillion)スケール・アーキテクチャ

DeepSeek v4は、1.6兆の総パラメータ数と490億の有効パラメータ数を備えたMixture-of-Experts (MoE)設計の進化形です。Compressed Sparse Attention (CSA) とHeavily Compressed Attention (HCA) を統合し、100万トークンのcontext windowを管理します。これらの技術により、標準的なアーキテクチャと比較してKVキャッシュのメモリフットプリントを90%削減し、Long Contextタスクにおいて高速なinferenceと低いハードウェア要件を実現しています。 ### ネイティブなMultimodal統合 個別の視覚や音声エンコーダーを使用する他のmodelとは異なり、DeepSeek v4は最初の学習段階からネイティブにmultimodalです。テキスト、画像、音声、動画を単一の統合フレームワーク内で処理します。このアプローチにより、modal間のreasoningが向上し、詳細な情報を失うことなく、生の動画ファイルや大規模なドキュメントアーカイブに対する複雑な分析を実行できます。 ### 戦略的なコスト破壊 本modelは、高性能なプロプライエタリmodelに対する、実力あるopen-sourceの代替手段として位置づけられています。入力100万トークンあたり1.74ドルという価格設定により、コーディングや数学においてfrontierレベルのパフォーマンスを維持しながら、開発者の運用コストを大幅に削減します。オプションのThinking Modeが搭載されており、論理的証明や競技プログラミングにおいて深いreasoningが可能です。

DeepSeek v4

DeepSeek v4のユースケース

DeepSeek v4を使って素晴らしい結果を得るさまざまな方法を発見してください。

大規模コードベースのリファクタリング

100万トークンのcontext windowを活用し、リポジトリ全体を読み込ませてグローバルなバグ検出やアーキテクチャの改善を行います。

ネイティブな動画分析

生の動画ファイルを直接処理し、シーン検出、トランスクリプト生成、複雑な視覚的reasoningを実行します。

自律型ソフトウェアAgent

agenticなワークフローに本modelを導入し、SWE-benchで80.6%の成功率を誇る能力でGitHubの課題を解決します。

Multimodalなコンテンツ制作

単一のmodelを使用して、テキスト、画像、音声の各フォーマットにまたがる構造化データやクリエイティブなコンテンツを生成します。

高度な数学的証明

特殊なThinking Modeを用いて、オリンピックレベルの数学問題や正式な証明を解決します。

企業内知識検索

大規模なドキュメントアーカイブを一度のpromptで分析し、複雑なRAGパイプラインなしで事実を抽出します。

強み

制限

超効率的なLong Context: KVキャッシュのフットプリントを90%削減し、標準的なハードウェアでも高性能を維持する100万トークンのcontext windowを実現しています。
Thinking Modeのレイテンシ: 深層reasoningモードでは最初のtoken生成までの時間が長くなるため、超高速な会話応答にはあまり適していません。
市場をリードするコストパフォーマンス: 100万トークンあたり1.74ドルでfrontier-classの知能を提供し、欧米のclosed-sourceな競合製品よりも圧倒的に安価です。
ハードウェア最適化の偏り: 技術レポートによると、Nvidiaクラスターよりも特定の中国製アクセラレータ向けに最適化が強く調整されている可能性があります。
卓越したAgenticコーディング能力: SWE-bench Verifiedで80.6%を達成し、自律的なソフトウェアエンジニアリングにおいて最も有能なmodelの一つです。
正確性の欠如: SimpleQAでのスコアは57.9%であり、reasoningは卓越しているものの、事実誤認(hallucination)が課題として残っています。
統合されたネイティブなMultimodality: 外部アダプターやサブmodelを必要とせず、単一のアーキテクチャでテキスト、ビジョン、音声、動画をサポートします。
複雑なKVキャッシュ要件: ハイブリッドなHCA/CSA attentionメカニズムにおいて、最適なローカルパフォーマンスを得るには特定のカーネルサポートが必要です。

APIクイックスタート

deepseek/deepseek-v4-pro

ドキュメントを見る
deepseek SDK
import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Optimize this Rust kernel for memory efficiency.' }], }); console.log(msg.choices[0].message.content);

SDKをインストールして、数分でAPIコールを開始しましょう。

DeepSeek v4についてのユーザーの声

DeepSeek v4についてコミュニティがどう思っているか見てください

DeepSeek v4のreasoningモードは、Claude Opusですら見逃したRustコードの並行処理バグを見つけた。本当に正気じゃない。
rust_dev_2025
reddit
コスト効率の高い100万トークンの時代がついに来た。これでプロジェクト全体のリファクタリングを少額で実行できる。
tech_lead_alex
twitter
100万トークンのコードベースを「needle(針)」を見失わずに動作させる様子を見て、2026年の転換点だと確信した。
logic_fanatic
hackernews
AnthropicとOpenAIは今、深刻な価格競争の問題を抱えている。DeepSeekはfrontier AIをただのコモディティにしてしまった。
CodeMaster
youtube
open-sourceでありながらGPT-5.4をコーディングbenchmarkで打ち負かしている。今年最大のリリースだ。
AI_Researcher_99
twitter
メモリ圧縮こそが真の魔法。コンシューマーに近いハードウェアでの1Tパラメータ動作が、ついに現実のものとなった。
GPU_Rich
reddit

DeepSeek v4についての動画

DeepSeek v4についてのチュートリアル、レビュー、ディスカッションを見る

メモリ効率こそが本質です。KVキャッシュを90%削減したことは全てを変えます

この速度で1Tパラメータのmodelを動かすことは、アーキテクチャ面での大きな勝利です

100万トークンあたりのコストは、小規模なスタートアップにとって無視できない存在です

これほどクリーンに100万トークンを処理するopen-source modelは見たことがありません

openなmodelとclosedなmodelの差が正式に埋まったと感じます

DeepSeekは単に価格で競うのではなく、Long Contextのreasoningでリードしています

ネイティブな動画サポートはGemini 2.0と比較しても驚くほど堅牢です

SGLangを使えば、ローカル環境へのインストールは驚くほど簡単です

HumanEvalのbenchmarkでは、本質的にGPT-5と同等です

このcontext windowがあれば、中規模プロジェクトにおいてRAGパイプラインはほぼ不要です

コーディングのbenchmarkにおけるパフォーマンスは、他のいかなるopen-weight modelも匹敵しません

大規模なコードベースのリファクタリングにおいて、最高級のclosed modelに匹敵するか上回ります

Engramメモリの実装はこの分野における技術的な驚異です

Thinking Modeでのオリンピックレベルの数学において90%の論理正解率を確認しました

このリリースは実質的に1兆パラメータ規模の知能を民主化しました

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

DeepSeek v4のプロのヒント

DeepSeek v4を最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Modeの切り替え

迅速なチャットには標準モードを使用し、コーディングや論理的証明にはThinking Modeを使い分けるのが効果的です。

Context Cachingの活用

内蔵のcontext caching機能を活用することで、繰り返し長いcontext promptを使用する際のコストを最大90%削減できます。

直接的なMultimodal入力

音声を事前に文字起こしするのではなく、生の音声や動画ファイルを直接APIに送信し、ネイティブなアーキテクチャの利点を享受してください。

System Promptの最適化

信頼性の高いagenticな動作を実現するために、system prompt内で明確なJSONスキーマやツール使用の手順を提供してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

DeepSeek v4についてのよくある質問

DeepSeek v4に関するよくある質問への回答を見つけてください