deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale är en reasoning-först LLM med guldmedalj-prestanda i matte, DeepSeek Sparse Attention och ett 131K context window. Utmanar GPT-5...

DeepSeekReasoningAIOpenSourceMatematikOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V31 december 2025
Kontext
131Ktokens
Max utdata
131Ktokens
Inmatningspris
$0.28/ 1M
Utdatapris
$0.42/ 1M
Modalitet:Text
Kapaciteter:VerktygStreamingResonemang
Benchmarks
GPQA
91.5%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. DeepSeek-V3.2-Speciale fick 91.5% pa detta benchmark.
HLE
30.6%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. DeepSeek-V3.2-Speciale fick 30.6% pa detta benchmark.
MMLU
88.5%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. DeepSeek-V3.2-Speciale fick 88.5% pa detta benchmark.
MMLU Pro
78.4%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. DeepSeek-V3.2-Speciale fick 78.4% pa detta benchmark.
SimpleQA
45.8%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. DeepSeek-V3.2-Speciale fick 45.8% pa detta benchmark.
IFEval
91.2%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. DeepSeek-V3.2-Speciale fick 91.2% pa detta benchmark.
AIME 2025
96%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. DeepSeek-V3.2-Speciale fick 96% pa detta benchmark.
MATH
90.1%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. DeepSeek-V3.2-Speciale fick 90.1% pa detta benchmark.
GSM8k
98.9%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. DeepSeek-V3.2-Speciale fick 98.9% pa detta benchmark.
MGSM
92.5%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. DeepSeek-V3.2-Speciale fick 92.5% pa detta benchmark.
MathVista
68.5%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. DeepSeek-V3.2-Speciale fick 68.5% pa detta benchmark.
SWE-Bench
73.1%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. DeepSeek-V3.2-Speciale fick 73.1% pa detta benchmark.
HumanEval
94.1%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. DeepSeek-V3.2-Speciale fick 94.1% pa detta benchmark.
LiveCodeBench
71.4%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. DeepSeek-V3.2-Speciale fick 71.4% pa detta benchmark.
MMMU
70.2%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. DeepSeek-V3.2-Speciale fick 70.2% pa detta benchmark.
MMMU Pro
58%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. DeepSeek-V3.2-Speciale fick 58% pa detta benchmark.
ChartQA
85%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. DeepSeek-V3.2-Speciale fick 85% pa detta benchmark.
DocVQA
93%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. DeepSeek-V3.2-Speciale fick 93% pa detta benchmark.
Terminal-Bench
46.4%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. DeepSeek-V3.2-Speciale fick 46.4% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. DeepSeek-V3.2-Speciale fick 12% pa detta benchmark.

Om DeepSeek-V3.2-Speciale

Lar dig om DeepSeek-V3.2-Speciales kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Fokus på beräkningsintensiv reasoning

DeepSeek-V3.2-Speciale är en Mixture-of-Experts språkmodell med 685 miljarder parametrar. Den aktiverar 37 miljarder parametrar per token för att balansera prestanda och effektivitet. Denna variant är konstruerad för att lösa problem i flera steg som kräver betydande intern reasoning. Genom att skala efterträningsberäkningar till över 10 % av förträningsbudgeten producerar modellen långa chain-of-thought-sekvenser som kan överstiga 47 000 tokens per svar. Detta gör den lämplig för komplexa logiska bevis och teknisk forskning.

Sparse Attention-arkitektur

Modellen använder DeepSeek Sparse Attention (DSA) för att hantera sitt 131 072-token context window. Denna mekanism använder ett blixtsnabbt index för att isolera de mest relevanta tokens, vilket minskar beräkningsbördan som vanligtvis finns i täta long-context system. Den upprätthåller logik samtidigt som den körs med lägre omkostnader. Arkitekturen riktar sig specifikt till beräkningsintensiva miljöer där reasoning-djup prioriteras framför bred multimodal flexibilitet.

Teknisk och akademisk prestanda

Speciale är den första open-weights modellen som uppnått guldmedalj-nivå i 2025 års International Mathematical Olympiad (IMO). Den utmärker sig i tekniska benchmark som AIME 2025 och HumanEval, och matchar ofta proprietära system i rena logikuppgifter. Utvecklare kan använda den för att generera komplexa kodbaser eller syntetisera tät teknisk dokumentation. Modellen är släppt under MIT-licens, vilket underlättar bred användning inom open-source-communityt.

DeepSeek-V3.2-Speciale

Anvandningsfall for DeepSeek-V3.2-Speciale

Upptack de olika satten du kan anvanda DeepSeek-V3.2-Speciale for att uppna fantastiska resultat.

Generering av matematiska bevis

Lösa matematiska bevis på olympiadnivå och symboliska logikproblem som kräver stort kognitivt djup.

Arkitektonisk mjukvarudesign

Generera komplexa mjukvaruarkitekturer med flera filer genom att resonera kring strukturella beroenden utan tool-use.

Syntes av tekniska dokument

Analysera och korsreferera insikter från massiva tekniska rapporter inom dess 131K context window.

Produktion av syntetisk data

Skapa högkvalitativa, reasoning-rika träningsdataset för att destillera logik till mindre, specialiserade AI-modeller.

Vetenskaplig forskning (deep-dive)

Granska och sammanställa tät akademisk litteratur för att extrahera nyanserad logisk progression inom STEM-områden.

Planering för autonoma agenter

Navigera komplex, flerstegsplanering och strategiutveckling för AI-agenter i simulerade miljöer.

Styrkor

Begransningar

Elitprestanda inom matematik: Uppnår 96 % på AIME 2025 och guldmedaljresultat i den internationella IMO-tävlingen.
Ingen inbyggd multimodalitet: Saknar förmågan att bearbeta bilder eller ljud, vilket begränsar användningen till textbaserad data.
Massiv tänkandebudget: Genererar tänkande-trajektorier som överstiger 47 000 tokens för djup logisk utforskning.
Inaktiverad tool-calling: Stöder inte function calling, vilket begränsar nyttan för autonom API-interaktion.
DSA-effektivitet: DeepSeek Sparse Attention-mekanismen hanterar 128K context med lägre beräkningskostnader än täta modeller.
Inference-latency: Tänkande-lägen kan orsaka väntetider på flera minuter för komplexa logiska bevis.
Kostnadsfördel: Ger frontier-level reasoning till $0,28 per miljon tokens, vilket är betydligt billigare än proprietära motsvarigheter.
Krav på hosting: Kräver GPU-kluster i företagsklass på grund av dess 685 miljarder parameters MoE-arkitektur.

API snabbstart

deepseek/deepseek-v3.2-speciale

Visa dokumentation
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Lös x i det komplexa planet: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om DeepSeek-V3.2-Speciale

Se vad communityt tycker om DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale är ett monster. Maxad reasoning som utmanar Gemini 3 Pro.
OpenRouter
twitter
HumanEval-poängen är på riktigt. Den skriver renare kod än många proprietära modeller jag testat den här månaden.
dev_guru_99
reddit
Prissättningen är helt galen. Frontier-level reasoning till en bråkdel av kostnaden hos OpenAI eller Anthropic.
AI_Builder_X
twitter
Det är uppfriskande att se en open-weights modell faktiskt utmana de tre största labben. Arkitekturvalen här är briljanta.
binary_explorer
hackernews

Videor om DeepSeek-V3.2-Speciale

Se handledningar, recensioner och diskussioner om DeepSeek-V3.2-Speciale

Den resonerar under en galet lång tid... det är en djup-resonör.

DeepSeek-modellen fick guld [i IMO] medan Deepthink bara fick brons.

Att se vad den gör kan vara extremt lärorikt.

Logiken här är på en helt annan nivå jämfört med standardmodeller.

Du kan faktiskt se modellen iterera genom misslyckanden.

Allt 'Speciale' egentligen betyder är deep think. Den har ett deep think-läge.

Den tänker i 63 sekunder... det är ganska fantastiskt.

Den är väldigt smart där... kommer fram till riktigt avancerad kod.

Att skala detta lokalt kommer att vara det största hindret för användare.

Reasoning-tokens faktureras annorlunda på de flesta plattformar.

Speciale är ett monster. Maxad reasoning, djup chain of thought.

Speciale är designad för djup reasoning, flerstegsbevis, komplex forskning.

DeepSeeks transparens är en enorm fördel... att se arbetet.

Den lyckas hålla sig sammanhängande över mycket längre svar än Gemini.

Sparse Attention-tekniken är hur de håller nere priset så lågt.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for DeepSeek-V3.2-Speciale

Experttips for att hjalpa dig fa ut det mesta av DeepSeek-V3.2-Speciale och uppna battre resultat.

Optimera sampling-parametrar

Ställ in temperature till 1.0 och top_p till 0.95 för uppgifter med hög logik för att säkerställa att djupa reasoning-stigar förblir varierade.

Ge tekniska detaljer

Strukturera instruktioner i markdown för att hjälpa modellen att bättre organisera sin interna chain-of-thought bearbetning.

Tillåt tänkandetid

Förvänta dig högre latency under komplexa bevis eftersom modellen genererar massiva interna tänkande-kedjor.

Använd dedikerade endpoints

Ange 'speciale' API-sökvägen i din konfiguration för att specifikt få tillgång till den högpresterande reasoning-varianten.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Vanliga fragor om DeepSeek-V3.2-Speciale

Hitta svar pa vanliga fragor om DeepSeek-V3.2-Speciale