deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Specialeは、金メダル級の数学的性能、DeepSeek Sparse Attention、131Kのcontext windowを備えた、推論特化型LLMです。GPT-5に匹敵する性能を誇ります...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V32025年12月1日
コンテキスト
131Kトークン
最大出力
131Kトークン
入力価格
$0.28/ 1M
出力価格
$0.42/ 1M
モダリティ:Text
機能:ツールストリーミング推論
ベンチマーク
GPQA
91.5%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 DeepSeek-V3.2-Specialeはこのベンチマークで91.5%を記録しました。
HLE
30.6%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで30.6%を記録しました。
MMLU
88.5%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで88.5%を記録しました。
MMLU Pro
78.4%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 DeepSeek-V3.2-Specialeはこのベンチマークで78.4%を記録しました。
SimpleQA
45.8%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで45.8%を記録しました。
IFEval
91.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 DeepSeek-V3.2-Specialeはこのベンチマークで91.2%を記録しました。
AIME 2025
96%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 DeepSeek-V3.2-Specialeはこのベンチマークで96%を記録しました。
MATH
90.1%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで90.1%を記録しました。
GSM8k
98.9%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 DeepSeek-V3.2-Specialeはこのベンチマークで98.9%を記録しました。
MGSM
92.5%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 DeepSeek-V3.2-Specialeはこのベンチマークで92.5%を記録しました。
MathVista
68.5%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで68.5%を記録しました。
SWE-Bench
73.1%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 DeepSeek-V3.2-Specialeはこのベンチマークで73.1%を記録しました。
HumanEval
94.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 DeepSeek-V3.2-Specialeはこのベンチマークで94.1%を記録しました。
LiveCodeBench
71.4%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで71.4%を記録しました。
MMMU
70.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで70.2%を記録しました。
MMMU Pro
58%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 DeepSeek-V3.2-Specialeはこのベンチマークで58%を記録しました。
ChartQA
85%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで85%を記録しました。
DocVQA
93%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 DeepSeek-V3.2-Specialeはこのベンチマークで93%を記録しました。
Terminal-Bench
46.4%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで46.4%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 DeepSeek-V3.2-Specialeはこのベンチマークで12%を記録しました。

DeepSeek-V3.2-Specialeについて

DeepSeek-V3.2-Specialeの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

計算負荷の高い推論への注力

DeepSeek-V3.2-Specialeは、6850億parametersを誇るMixture-of-Experts(MoE)モデルです。tokenあたり370億parametersをアクティブ化することで、性能と効率のバランスをとっています。このバリアントは、高度な内部推論を必要とする多段階の問題を解決するように設計されました。事前学習予算の10%以上をポストトレーニング計算に割り当てることで、モデルは1応答あたり47,000 tokenを超える長いchain-of-thought(思考の連鎖)を生成します。これにより、複雑な論理証明や技術研究に適しています。

Sparse Attentionアーキテクチャ

このモデルは、DeepSeek Sparse Attention (DSA) を使用して131,072 tokenのcontext windowを管理します。このメカニズムはライトニングインデクサを採用して最も関連性の高いtokenを分離することで、高密度な長文脈システムで一般的に見られる計算負荷を軽減しています。低いオーバーヘッドで動作しつつ、論理の一貫性を保ちます。このアーキテクチャは、広範なマルチモーダル対応よりも推論の深さを優先する、計算リソースが豊富な環境を特に想定しています。

技術的および学術的性能

Specialeは、2025年の国際数学オリンピック(IMO)で金メダルレベルの結果を達成した最初のopen-weightsモデルです。AIME 2025やHumanEvalといった技術benchmarkで秀でており、純粋な論理タスクにおいてプロプライエタリなシステムとしばしば同等の性能を発揮します。開発者は複雑なコードベースの生成や、濃密な技術文書の統合に活用できます。本モデルはMITライセンスでリリースされており、open-sourceコミュニティにおける広範な利用を促進しています。

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Specialeのユースケース

DeepSeek-V3.2-Specialeを使って素晴らしい結果を得るさまざまな方法を発見してください。

数学的証明の生成

高い認知的深さを必要とする、数学オリンピックレベルの証明問題や記号論理学の問題の解決。

ソフトウェアアーキテクチャの設計

tool-useに頼らず、構造的な依存関係を推論することで、複雑な複数ファイルにまたがるソフトウェアアーキテクチャを生成。

技術文書の統合

131Kのcontext windowを活用し、膨大な技術論文から情報を分析し、関連付けを行う。

合成データ生成

論理性の高い高品質な学習用データセットを作成し、その論理をより小規模な専門特化型AI modelに蒸留する。

科学的な深掘り研究

密度の高い学術文献をレビュー・統合し、STEM分野における論理的な進展を抽出する。

エージェントの計画策定

シミュレーション環境において、AI agentのための複雑な多段階計画や戦略策定を行う。

強み

制限

卓越した数学性能: AIME 2025で96%を記録し、国際数学オリンピック(IMO)で金メダルレベルの成果を達成。
マルチモーダル非対応: 画像や音声を処理する機能がなく、テキストベースのデータのみに制限される。
膨大な思考リソース: 深い論理的探索のために、47,000 tokenを超える思考の軌跡を生成可能。
tool-callingの無効化: 関数呼び出しに対応しておらず、自律的なAPI連携における有用性が制限される。
DSAの効率性: DeepSeek Sparse Attentionメカニズムにより、denseモデルよりも低い計算コストで128Kのcontextを処理。
推論latency: 思考モードでは、複雑な論理証明において数分間の待ち時間が発生する場合がある。
コストの優位性: 100万tokenあたり0.28ドルというfrontierレベルのreasoningを提供。他社の閉鎖的モデルと比較して大幅に安価。
ホスティング要件: 6850億parametersのMoEアーキテクチャのため、エンタープライズグレードのGPUクラスターが必要。

APIクイックスタート

deepseek/deepseek-v3.2-speciale

ドキュメントを見る
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve for x in the complex plane: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

DeepSeek-V3.2-Specialeについてのユーザーの声

DeepSeek-V3.2-Specialeについてコミュニティがどう思っているか見てください

DeepSeek-V3.2-Specialeは怪物だ。Gemini 3 Proに匹敵する最高レベルのreasoning能力。
OpenRouter
twitter
HumanEvalのスコアは本物。今月テストした多くのプロプライエタリなモデルよりもクリーンなコードを書く。
dev_guru_99
reddit
価格設定が正気の沙汰ではない。OpenAIやAnthropicの何分の一かのコストでfrontierレベルの推論能力。
AI_Builder_X
twitter
トップ3の研究所に挑むようなopen-weightsモデルは新鮮だ。アーキテクチャの選択が非常に優れている。
binary_explorer
hackernews

DeepSeek-V3.2-Specialeについての動画

DeepSeek-V3.2-Specialeについてのチュートリアル、レビュー、ディスカッションを見る

とてつもなく長い時間をかけて推論する...まさにディープなreasonerだ。

DeepSeek modelが(IMOで)金メダルを獲得し、Deepthinkは銅メダルだった。

その挙動を観察することは、教育的価値が非常に高い。

ここでの論理構築は、標準的なモデルとは次元が違う。

モデルが試行錯誤を繰り返している様子を実際に見て取れる。

Specialとはつまり、ディープシンキングのことだ。思考モードを搭載している。

63秒間も思考し続ける...これは驚異的だ。

非常に賢い...本当に高度なコードを生成している。

これをローカルでスケーリングするのがユーザーにとって最大のハードルになるだろう。

多くのプラットフォームでは、reasoning tokenは別料金として請求される。

Specialは怪物だ。最大化されたreasoning、深いchain-of-thought。

Specialは深い推論、多段階の証明、複雑な研究のために設計されている。

DeepSeekの透明性は大きな利点だ...プロセスが見える。

Geminiよりもはるかに長い応答で一貫性を保てている。

Sparse Attention技術こそが、この低価格を維持している理由だ。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

DeepSeek-V3.2-Specialeのプロのヒント

DeepSeek-V3.2-Specialeを最大限に活用し、より良い結果を得るための専門家のヒント。

サンプリングparametersの最適化

論理性の高いタスクではtemperatureを1.0、top_pを0.95に設定し、深いreasoningの経路が多様性を維持できるようにしてください。

技術的な詳細の提示

指示をmarkdownで構成することで、モデルが内部のchain-of-thought処理をより適切に整理できるよう支援してください。

思考時間の確保

複雑な証明を行う場合、モデルが膨大な内部思考チェーンを生成するため、より長いlatencyが発生することを想定しておいてください。

専用エンドポイントの使用

計算負荷の高いreasoningバリアントにアクセスするには、設定で 'speciale' APIパスを指定してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

DeepSeek-V3.2-Specialeについてのよくある質問

DeepSeek-V3.2-Specialeに関するよくある質問への回答を見つけてください