deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale er en reasoning-først LLM med guldmedalje-præstationer i matematik, DeepSeek Sparse Attention og et 131K context window. Rivaliserer...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V31. december 2025
Kontekst
131Ktokens
Maks output
131Ktokens
Input-pris
$0.28/ 1M
Output-pris
$0.42/ 1M
Modalitet:Text
Funktioner:VærktøjerStreamingRæsonnering
Benchmarks
GPQA
91.5%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). DeepSeek-V3.2-Speciale scorede 91.5% på denne benchmark.
HLE
30.6%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. DeepSeek-V3.2-Speciale scorede 30.6% på denne benchmark.
MMLU
88.5%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. DeepSeek-V3.2-Speciale scorede 88.5% på denne benchmark.
MMLU Pro
78.4%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. DeepSeek-V3.2-Speciale scorede 78.4% på denne benchmark.
SimpleQA
45.8%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. DeepSeek-V3.2-Speciale scorede 45.8% på denne benchmark.
IFEval
91.2%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. DeepSeek-V3.2-Speciale scorede 91.2% på denne benchmark.
AIME 2025
96%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. DeepSeek-V3.2-Speciale scorede 96% på denne benchmark.
MATH
90.1%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. DeepSeek-V3.2-Speciale scorede 90.1% på denne benchmark.
GSM8k
98.9%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. DeepSeek-V3.2-Speciale scorede 98.9% på denne benchmark.
MGSM
92.5%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. DeepSeek-V3.2-Speciale scorede 92.5% på denne benchmark.
MathVista
68.5%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. DeepSeek-V3.2-Speciale scorede 68.5% på denne benchmark.
SWE-Bench
73.1%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. DeepSeek-V3.2-Speciale scorede 73.1% på denne benchmark.
HumanEval
94.1%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. DeepSeek-V3.2-Speciale scorede 94.1% på denne benchmark.
LiveCodeBench
71.4%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. DeepSeek-V3.2-Speciale scorede 71.4% på denne benchmark.
MMMU
70.2%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. DeepSeek-V3.2-Speciale scorede 70.2% på denne benchmark.
MMMU Pro
58%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. DeepSeek-V3.2-Speciale scorede 58% på denne benchmark.
ChartQA
85%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. DeepSeek-V3.2-Speciale scorede 85% på denne benchmark.
DocVQA
93%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. DeepSeek-V3.2-Speciale scorede 93% på denne benchmark.
Terminal-Bench
46.4%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. DeepSeek-V3.2-Speciale scorede 46.4% på denne benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. DeepSeek-V3.2-Speciale scorede 12% på denne benchmark.

Om DeepSeek-V3.2-Speciale

Lær om DeepSeek-V3.2-Speciales muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Fokus på reasoning med høj compute

DeepSeek-V3.2-Speciale er en Mixture-of-Experts sprogmodel med 685 milliarder parameters. Den aktiverer 37 milliarder parameters pr. token for at balancere performance og effektivitet. Denne variant er designet til at løse problemer i flere trin, der kræver betydelig intern reasoning. Ved at skalere compute efter træning til over 10% af pre-training-budgettet, producerer modellen lange chain-of-thought-trajektorier, der kan overstige 47.000 tokens pr. svar. Dette gør den velegnet til at navigere i komplekse logiske beviser og teknisk forskning.

Sparse Attention-arkitektur

Modellen bruger DeepSeek Sparse Attention (DSA) til at administrere sit 131.072-token context window. Denne mekanisme anvender en lightning-indeksering til at isolere de mest relevante tokens, hvilket reducerer den beregningsmæssige belastning, man typisk finder i tætte systemer med lang kontekst. Den opretholder logik, mens den kører med lavere overhead. Arkitekturen målretter sig specifikt mod miljøer med høj compute, hvor reasoning-dybde prioriteres over bred multimodal fleksibilitet.

Teknisk og akademisk performance

Speciale er den første open-weights model, der opnår resultater på guldmedalje-niveau i 2025 International Mathematical Olympiad (IMO). Den udmærker sig i tekniske benchmarks som AIME 2025 og HumanEval og matcher ofte proprietære systemer i rene logikopgaver. Udviklere kan bruge den til at generere komplekse kodebaser eller syntetisere tæt teknisk dokumentation. Modellen er udgivet under MIT-licensen, hvilket fremmer bred nytte i open-source-fællesskabet.

DeepSeek-V3.2-Speciale

Anvendelser for DeepSeek-V3.2-Speciale

Opdag de forskellige måder, du kan bruge DeepSeek-V3.2-Speciale til at opnå gode resultater.

Generering af matematiske beviser

Løsning af matematiske beviser på olympiade-niveau og symbolske logikproblemer, der kræver høj kognitiv dybde.

Arkitektonisk softwaredesign

Generering af komplekse softwarearkitekturer på tværs af flere filer ved at ræsonnere gennem strukturelle afhængigheder uden tool-use.

Syntese af tekniske dokumenter

Analyse og krydsreferering af indsigter på tværs af massive tekniske papers inden for dens 131K context window.

Produktion af syntetiske data

Oprettelse af høj-kvalitets, reasoning-rige træningsdatasæt for at destillere logik ind i mindre, specialiserede AI-modeller.

Videnskabelig deep-dive forskning

Gennemgang og syntese af tæt akademisk litteratur for at udtrække nuancerede logiske progressioner inden for STEM-felter.

Planlægning for autonome agenter

Navigation i kompleks planlægning i flere trin og strategiudvikling for AI-agenter i simulerede miljøer.

Styrker

Begrænsninger

Elite matematik-performance: Opnår 96% på AIME 2025 og guldmedalje-resultater i den internationale IMO-konkurrence.
Ingen indfødt multimodalitet: Mangler evnen til at behandle billeder eller lyd, hvilket begrænser brugen til tekstbaserede data.
Massivt tænkningsbudget: Genererer tænknings-trajektorier, der overstiger 47.000 tokens for dyb logisk udforskning.
Deaktiveret tool-calling: Understøtter ikke funktion-kald, hvilket begrænser nytten til autonom API-interaktion.
DSA-effektivitet: DeepSeek Sparse Attention-mekanismen håndterer 128K context med lavere compute-omkostninger end tætte modeller.
Inference-latency: Tænkningstilstande kan medføre ventetider på flere minutter ved komplekse logiske beviser.
Prisfordel: Leverer frontier reasoning til $0,28 pr. million tokens, hvilket er væsentligt billigere end proprietære alternativer.
Hosting-krav: Kræver enterprise-grade GPU-klynger på grund af dens MoE-arkitektur med 685 milliarder parameters.

API hurtig start

deepseek/deepseek-v3.2-speciale

Se dokumentation
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve for x in the complex plane: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om DeepSeek-V3.2-Speciale

Se hvad fællesskabet mener om DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale er et bæst. Maksimal reasoning, der rivaliserer Gemini 3 Pro.
OpenRouter
twitter
HumanEval-scorerne er ægte. Den skriver renere kode end mange proprietære modeller, jeg har testet i denne måned.
dev_guru_99
reddit
Prissætningen er bare sindssyg. Reasoning på frontier-niveau til en brøkdel af prisen hos OpenAI eller Anthropic.
AI_Builder_X
twitter
Det er forfriskende at se en open-weights model, der faktisk udfordrer de top 3 laboratorier. Arkitekturvalgene her er geniale.
binary_explorer
hackernews

Videoer om DeepSeek-V3.2-Speciale

Se vejledninger, anmeldelser og diskussioner om DeepSeek-V3.2-Speciale

Den ræsonnerer i utrolig lang tid... det er en dyb, dyb reasoner.

DeepSeek-modellen får guld [i IMO], mens Deepthink kun fik bronze.

At se hvad den gør, kan være ekstremt lærerigt.

Logikken her er på et andet niveau sammenlignet med standardmodeller.

Man kan faktisk se modellen iterere gennem fejl.

Alt hvad Speciale egentlig betyder, er deep think. Den har en deep think-tilstand.

Den tænker i 63 sekunder... det er ret fantastisk.

Den er meget klog der... kommer med noget virkelig avanceret kode.

At skalere dette lokalt bliver den største hindring for brugerne.

Reasoning-tokens faktureres anderledes på de fleste platforme.

Speciale er bæstet. Maksimal reasoning, dyb chain of thought.

Speciale er designet til dyb reasoning, beviser i flere trin, kompleks forskning.

DeepSeeks transparens er en massiv fordel... at kunne se arbejdet.

Den formår at forblive sammenhængende over meget længere svar end Gemini.

Sparse Attention-teknologien er hvordan de holder prisen så lav.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til DeepSeek-V3.2-Speciale

Eksperttips til at hjælpe dig med at få mest muligt ud af DeepSeek-V3.2-Speciale og opnå bedre resultater.

Optimer sampling-parametre

Indstil temperature til 1.0 og top_p til 0.95 ved opgaver med høj logik for at sikre, at dybe reasoning-stier forbliver diverse.

Giv tekniske detaljer

Strukturer instruktioner i markdown for at hjælpe modellen med bedre at organisere sin interne chain-of-thought-behandling.

Giv tid til tænkning

Forvent højere latency ved komplekse beviser, da modellen genererer massive interne tænkningskæder.

Brug dedikerede endpoints

Angiv 'speciale' API-stien i din konfiguration for specifikt at få adgang til reasoning-varianten med høj compute.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Ofte stillede spørgsmål om DeepSeek-V3.2-Speciale

Find svar på almindelige spørgsmål om DeepSeek-V3.2-Speciale