deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Specialeは、金メダル級の数学性能、DeepSeek Sparse Attention、131K context windowを備えたreasoning特化型LLMです。GPT-5に匹敵する性能を20分の1のコストで提供します。

DeepSeek推論AIオープンソース数学オリンピックSparseAttention
deepseek logodeepseekDeepSeek-V32025-12-01
コンテキスト
131Kトークン
最大出力
131Kトークン
入力価格
$0.28/ 1M
出力価格
$0.42/ 1M
モダリティ:Text
機能:ツールストリーミング推論
ベンチマーク
GPQA
91.5%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 DeepSeek-V3.2-Specialeはこのベンチマークで91.5%を記録しました。
HLE
30.6%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで30.6%を記録しました。
MMLU
88.5%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで88.5%を記録しました。
MMLU Pro
78.4%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 DeepSeek-V3.2-Specialeはこのベンチマークで78.4%を記録しました。
SimpleQA
45.8%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで45.8%を記録しました。
IFEval
91.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 DeepSeek-V3.2-Specialeはこのベンチマークで91.2%を記録しました。
AIME 2025
96%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 DeepSeek-V3.2-Specialeはこのベンチマークで96%を記録しました。
MATH
90.1%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで90.1%を記録しました。
GSM8k
98.9%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 DeepSeek-V3.2-Specialeはこのベンチマークで98.9%を記録しました。
MGSM
92.5%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 DeepSeek-V3.2-Specialeはこのベンチマークで92.5%を記録しました。
MathVista
68.5%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで68.5%を記録しました。
SWE-Bench
73.1%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 DeepSeek-V3.2-Specialeはこのベンチマークで73.1%を記録しました。
HumanEval
94.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 DeepSeek-V3.2-Specialeはこのベンチマークで94.1%を記録しました。
LiveCodeBench
71.4%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで71.4%を記録しました。
MMMU
70.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで70.2%を記録しました。
MMMU Pro
58%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 DeepSeek-V3.2-Specialeはこのベンチマークで58%を記録しました。
ChartQA
85%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで85%を記録しました。
DocVQA
93%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで93%を記録しました。
Terminal-Bench
46.4%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで46.4%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで12%を記録しました。

DeepSeek-V3.2-Specialeについて

DeepSeek-V3.2-Specialeの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

推論の新たなフロンティア

DeepSeek-V3.2-Specialeは、V3.2ファミリーの高計算量バリアントとして機能する、state-of-the-artなreasoning特化型LLMです。GPT-5やGemini 3 Proなどのfrontier modelに対抗するために明示的に設計されており、強化学習中の長さペナルティを緩和し、事後学習の計算量を事前学習予算の10%以上にスケーリングすることで、並外れた性能を実現しています。これにより、modelは複雑な多段階の問題を解決するために、1回の回答につき47,000 tokenを超える非常に長いchain-of-thoughtを生成することが可能です。

アーキテクチャの革新

技術的には、このmodelはDeepSeek Sparse Attention (DSA)を導入しています。これは、ライトニングインデクサーを使用して、131Kのcontext window内で最も関連性の高いtokenを特定する革新的なメカニズムです。特定のtokenサブセットに焦点を当てることで、denseアーキテクチャの精度を維持しながら、長文コンテキストのinferenceにおける計算オーバーヘッドを大幅に削減します。特筆すべきは、2025年の国際数学オリンピック(IMO)および国際情報オリンピック(IOI)で金メダル級の成績を収めた初のopen-source modelである点です。

効率性と統合

単なるロジックの強さだけでなく、このmodelはコスト効率と開発者の利便性も重視しています。closed-sourceの競合モデルの数分の一の価格で提供され、reasoningをツール呼び出しのループに直接統合するThinking in Tool-Useモードをサポートしています。これにより、複雑なシミュレーション環境内でリアルタイムに行動を計画、検証、修正できる、より堅牢な自律型agentの構築が可能になります。

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Specialeのユースケース

DeepSeek-V3.2-Specialeを使って素晴らしい結果を得るさまざまな方法を発見してください。

オリンピックレベルの数学的証明

数十の論理ステップを必要とするIMOやCMOレベルの競技数学の問題を解決します。

エージェントによるソフトウェアエンジニアリング

複雑なコードベースを自律的に探索し、パッチを適用することで、現実世界のGitHubのissueを解決します。

複雑なシステムシミュレーション

無線周波数の伝搬や波動物理学などの物理的・数学的システムを高精度にシミュレートします。

深い推論ワークフロー

戦略立案や科学的発見のための包括的な調査と、詳細なchain-of-thought分析を実行します。

自律エージェントの計画

「Thinking in Tool-Use」を活用し、1,800以上のシミュレーション環境で多段階のアクションを計画、実行、検証します。

ゼロショット競技プログラミング

自動自己修正機能を備え、CodeForcesやIOIレベルのプログラミング課題に対して効率的なアルゴリズムを生成します。

強み

制限

金メダル級のreasoning: 2025年国際数学オリンピック (IMO) で金メダルレベルの成績を収め、論理性能においてほぼすべてのclosed-source modelを凌駕しています。
トークン効率の低さ: 高い精度を実現するために、競合他社よりも3〜4倍多くのtokenを生成することが多く、待ち時間が長くなる傾向があります。
圧倒的な低価格: 100万tokenあたり0.28ドル/0.42ドルという価格設定により、大規模なagent導入を現実的なコストで可能にするfrontier model級のreasoningを提供します。
ハードウェア負荷: 671B parametersのmodelであるため、ローカルで実行するには、一般的なデスクトップPCの性能を大幅に超える膨大なVRAMが必要です。
効率的なロングコンテキスト: DeepSeek Sparse Attention (DSA) メカニズムにより、標準的なdense transformerよりもはるかに低い計算コストで131K tokenを処理できます。
推論レイテンシ: 思考チェーンが長いため、非常に複雑な数学の問題に対して最終的な回答を出すまでに数分かかる場合があります。
高度なツール統合: reasoningをツール呼び出しのループに直接統合する、世界初の「Thinking in Tool-Use」モードを搭載しています。
API最適化ベータ版: ウェイトは公開されていますが、最も最適化された「Speciale」の体験は、現在DeepSeekのAPIエンドポイント経由で優先的に提供されています。

APIクイックスタート

deepseek/deepseek-v3.2-speciale

ドキュメントを見る
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: "YOUR_DEEPSEEK_API_KEY",
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve the 2025 IMO Problem 1 with step-by-step reasoning." }],
    model: "deepseek-v3.2-speciale",
    max_tokens: 16384, 
  });

  console.log("Reasoning Chain:", completion.choices[0].message.reasoning_content);
  console.log("Final Answer:", completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

DeepSeek-V3.2-Specialeについてのユーザーの声

DeepSeek-V3.2-Specialeについてコミュニティがどう思っているか見てください

"DeepSeek V3.2 Specialeは、GPT-5.1 Highより約15倍安価でありながら、私の数学ベンチマークを圧倒しています"
gum1h0x
x
"誰もが実際にアクセスできる、2025年IMO金メダルおよびICPCワールドファイルレベルのモデルを最初にリリースしたのは彼らです"
Chubby
reddit
"異常なほど長い時間推論を続けますが…生成されたスクリプトは数学的に非常に正確でした"
Bijan Bowen
youtube
"Specialeは難問向けです。2025年IMOで金メダル級の結果を出し、Gemini-3.0-Proに匹敵します"
nick-baumann
reddit
"妥当性率が非常に高く、一つの単語の遷移を間違えても、破滅的なループに陥ることがありません"
Lisan al Gaib
x
"これは基本的に、GPT-4o-miniの価格でo1-proのパフォーマンスを手に入れるようなものです。DeepSeekの素晴らしい成果です"
tech-enthusiast
hackernews

DeepSeek-V3.2-Specialeについての動画

DeepSeek-V3.2-Specialeについてのチュートリアル、レビュー、ディスカッションを見る

reasoning能力が最大限に引き出されており、Gemini 3 Proに対抗するように設計されていると言えます。

Gemini 2.5 deepthinkが銅メダルレベルだったのに対し、このDeepSeekモデルが金メダルを獲得したという事実は非常に大きな意味を持ちます。

これほど強力なレベルのモデルが、いわゆるオープンソースとして提供されるのは本当に素晴らしいことです。

非常に長い時間考え続けます…これは「2+2は?」といった単純な質問のためのものではありません。

2025年の数学オリンピックの問題における正解率は、この価格のモデルとしては前代未聞です。

V3.2 Specialeはreasoning能力が最大化されており、Gemini 3 Proのライバルと言える存在です。

DeepSeekは、ツールの利用に思考を直接統合した最初の企業です。

高価なクローズドソースモデルに匹敵するオープンソースモデルです。

彼らが達成しているベンチマークの数値は、ほとんどのオープンウェイトモデルを圧倒しています。

このバリアントでは、強化学習に徹底的に力を入れています。

Specialeはreasoningのために特別に設計されています…モデルが必要なだけ長く思考できるようにしてください。

アテンションのボトルネックを解消するために、DSA(Deepseek Sparse Architecture)を採用しています。

これは単なる理論上の最適化ではありません。長いコンテキストでも、このモデルが驚異的に安価に動作することを意味します。

HumanEvalで94.1%という数値は、ダウンロード可能なモデルとしては驚異的です。

標準のV3と比較して、コードのリファクタリングの扱いがより「知的」に感じられます。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

DeepSeek-V3.2-Specialeのプロのヒント

DeepSeek-V3.2-Specialeを最大限に活用し、より良い結果を得るための専門家のヒント。

長さ制限の無効化

API呼び出しにおいて、max_tokensの制限を厳しくしすぎないようにしてください。modelには「思考」するための余裕が必要です。

token消費の監視

このmodelは簡潔さよりも正確さを優先するため、同じタスクでも標準的なmodelより3〜4倍多くのtokenを消費することがあります。

ツール利用時の思考の活用

単なる実行前だけでなく、ツール実行中にもreasoningを行うことができる複雑なagentタスクに活用してください。

ローカル量子化

ローカルで実行する場合は、671Bアーキテクチャの複雑なreasoningウェイトを維持するために、Q5_K_M以上の量子化を使用してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

DeepSeek-V3.2-Specialeについてのよくある質問

DeepSeek-V3.2-Specialeに関するよくある質問への回答を見つけてください