Vad är prissättningen för DeepSeek-V3.2-Speciale?

Det kostar $0,28 per 1 miljon input tokens och $0,42 per 1 miljon output tokens. Detta återspeglar DeepSeeks mål att erbjuda prisvärd tillgång till frontier-level intelligens.

Stöder modellen vision eller bild-input?

Nej, Speciale-varianten är en text-only modell fokuserad på logik och matematisk reasoning. Den kan inte bearbeta bilder eller videor.

Hur stort är context window?

Modellen stöder ett 131 072-token context window. Detta gör att den kan bearbeta cirka 192 A4-sidor text i en enda prompt.

Kan jag använda tool-calling med Speciale-modellen?

Nej, tool-calling är inaktiverat i Speciale-varianten för att maximera den råa reasoning-kapaciteten. Användare som behöver verktyg bör använda standardversionen av V3.2-modellen.

Hur står den sig mot GPT-5?

Den matchar eller överträffar GPT-5 i specifika reasoning- och matte-benchmark, såsom AIME 2025. Dess främsta fördel är att erbjuda liknande logik till en lägre kostnad.

Är detta en open-weights modell?

Ja, DeepSeek-V3.2-Speciale är en open-weights modell som släppts under MIT-licens. Detta tillåter publik nedladdning och driftsättning.

Vad är den maximala output-gränsen?

Modellen kan generera över 47 000 tokens i ett enda svar. Detta används specifikt för utökat tänkande och djupa reasoning-sessioner.

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale är en reasoning-först LLM med guldmedalj-prestanda i matte, DeepSeek Sparse Attention och ett 131K context window. Utmanar GPT-5...

DeepSeekReasoningAIOpenSourceMatematikOlympiadSparseAttention

deepseekDeepSeek-V31 december 2025

Kontext

131Ktokens

Max utdata

131Ktokens

Inmatningspris

$0.28/ 1M

Utdatapris

$0.42/ 1M

Modalitet:Text

Kapaciteter:VerktygStreamingResonemang

Benchmarks

GPQA

91.5%

HLE

30.6%

MMLU

88.5%

MMLU Pro

78.4%

SimpleQA

45.8%

IFEval

91.2%

AIME 2025

96%

MATH

90.1%

GSM8k

98.9%

MGSM

92.5%

MathVista

68.5%

SWE-Bench

73.1%

HumanEval

94.1%

LiveCodeBench

71.4%

MMMU

70.2%

MMMU Pro

58%

ChartQA

85%

DocVQA

93%

Terminal-Bench

46.4%

ARC-AGI

12%

Visa API-dokumentation

Om DeepSeek-V3.2-Speciale

Lar dig om DeepSeek-V3.2-Speciales kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Fokus på beräkningsintensiv reasoning

DeepSeek-V3.2-Speciale är en Mixture-of-Experts språkmodell med 685 miljarder parametrar. Den aktiverar 37 miljarder parametrar per token för att balansera prestanda och effektivitet. Denna variant är konstruerad för att lösa problem i flera steg som kräver betydande intern reasoning. Genom att skala efterträningsberäkningar till över 10 % av förträningsbudgeten producerar modellen långa chain-of-thought-sekvenser som kan överstiga 47 000 tokens per svar. Detta gör den lämplig för komplexa logiska bevis och teknisk forskning.

Sparse Attention-arkitektur

Modellen använder DeepSeek Sparse Attention (DSA) för att hantera sitt 131 072-token context window. Denna mekanism använder ett blixtsnabbt index för att isolera de mest relevanta tokens, vilket minskar beräkningsbördan som vanligtvis finns i täta long-context system. Den upprätthåller logik samtidigt som den körs med lägre omkostnader. Arkitekturen riktar sig specifikt till beräkningsintensiva miljöer där reasoning-djup prioriteras framför bred multimodal flexibilitet.

Teknisk och akademisk prestanda

Speciale är den första open-weights modellen som uppnått guldmedalj-nivå i 2025 års International Mathematical Olympiad (IMO). Den utmärker sig i tekniska benchmark som AIME 2025 och HumanEval, och matchar ofta proprietära system i rena logikuppgifter. Utvecklare kan använda den för att generera komplexa kodbaser eller syntetisera tät teknisk dokumentation. Modellen är släppt under MIT-licens, vilket underlättar bred användning inom open-source-communityt.

Anvandningsfall for DeepSeek-V3.2-Speciale

Upptack de olika satten du kan anvanda DeepSeek-V3.2-Speciale for att uppna fantastiska resultat.

Generering av matematiska bevis

Lösa matematiska bevis på olympiadnivå och symboliska logikproblem som kräver stort kognitivt djup.

Arkitektonisk mjukvarudesign

Generera komplexa mjukvaruarkitekturer med flera filer genom att resonera kring strukturella beroenden utan tool-use.

Syntes av tekniska dokument

Analysera och korsreferera insikter från massiva tekniska rapporter inom dess 131K context window.

Produktion av syntetisk data

Skapa högkvalitativa, reasoning-rika träningsdataset för att destillera logik till mindre, specialiserade AI-modeller.

Vetenskaplig forskning (deep-dive)

Granska och sammanställa tät akademisk litteratur för att extrahera nyanserad logisk progression inom STEM-områden.

Planering för autonoma agenter

Navigera komplex, flerstegsplanering och strategiutveckling för AI-agenter i simulerade miljöer.

Styrkor

Begransningar

Elitprestanda inom matematik: Uppnår 96 % på AIME 2025 och guldmedaljresultat i den internationella IMO-tävlingen.

Ingen inbyggd multimodalitet: Saknar förmågan att bearbeta bilder eller ljud, vilket begränsar användningen till textbaserad data.

Massiv tänkandebudget: Genererar tänkande-trajektorier som överstiger 47 000 tokens för djup logisk utforskning.

Inaktiverad tool-calling: Stöder inte function calling, vilket begränsar nyttan för autonom API-interaktion.

DSA-effektivitet: DeepSeek Sparse Attention-mekanismen hanterar 128K context med lägre beräkningskostnader än täta modeller.

Inference-latency: Tänkande-lägen kan orsaka väntetider på flera minuter för komplexa logiska bevis.

Kostnadsfördel: Ger frontier-level reasoning till $0,28 per miljon tokens, vilket är betydligt billigare än proprietära motsvarigheter.

Krav på hosting: Kräver GPU-kluster i företagsklass på grund av dess 685 miljarder parameters MoE-arkitektur.

API snabbstart

deepseek/deepseek-v3.2-speciale

Visa dokumentation

deepseek SDK

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Lös x i det komplexa planet: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om DeepSeek-V3.2-Speciale

Se vad communityt tycker om DeepSeek-V3.2-Speciale

“DeepSeek-V3.2-Speciale är ett monster. Maxad reasoning som utmanar Gemini 3 Pro.”

— OpenRouter

twitter

“HumanEval-poängen är på riktigt. Den skriver renare kod än många proprietära modeller jag testat den här månaden.”

— dev_guru_99

“Prissättningen är helt galen. Frontier-level reasoning till en bråkdel av kostnaden hos OpenAI eller Anthropic.”

— AI_Builder_X

twitter

“Det är uppfriskande att se en open-weights modell faktiskt utmana de tre största labben. Arkitekturvalen här är briljanta.”

— binary_explorer

hackernews

Videor om DeepSeek-V3.2-Speciale

Se handledningar, recensioner och diskussioner om DeepSeek-V3.2-Speciale

“Den resonerar under en galet lång tid... det är en djup-resonör.”

“DeepSeek-modellen fick guld [i IMO] medan Deepthink bara fick brons.”

“Att se vad den gör kan vara extremt lärorikt.”

“Logiken här är på en helt annan nivå jämfört med standardmodeller.”

“Du kan faktiskt se modellen iterera genom misslyckanden.”

“Allt 'Speciale' egentligen betyder är deep think. Den har ett deep think-läge.”

“Den tänker i 63 sekunder... det är ganska fantastiskt.”

“Den är väldigt smart där... kommer fram till riktigt avancerad kod.”

“Att skala detta lokalt kommer att vara det största hindret för användare.”

“Reasoning-tokens faktureras annorlunda på de flesta plattformar.”

“Speciale är ett monster. Maxad reasoning, djup chain of thought.”

“Speciale är designad för djup reasoning, flerstegsbevis, komplex forskning.”

“DeepSeeks transparens är en enorm fördel... att se arbetet.”

“Den lyckas hålla sig sammanhängande över mycket längre svar än Gemini.”

“Sparse Attention-tekniken är hur de håller nere priset så lågt.”

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter

Webbautomatisering

Smarta arbetsfloden

Kom igang gratis

Proffs-tips for DeepSeek-V3.2-Speciale

Experttips for att hjalpa dig fa ut det mesta av DeepSeek-V3.2-Speciale och uppna battre resultat.

Optimera sampling-parametrar

Ställ in temperature till 1.0 och top_p till 0.95 för uppgifter med hög logik för att säkerställa att djupa reasoning-stigar förblir varierade.

Ge tekniska detaljer

Strukturera instruktioner i markdown för att hjälpa modellen att bättre organisera sin interna chain-of-thought bearbetning.

Tillåt tänkandetid

Förvänta dig högre latency under komplexa bevis eftersom modellen genererar massiva interna tänkande-kedjor.

Använd dedikerade endpoints

Ange 'speciale' API-sökvägen i din konfiguration för att specifikt få tillgång till den högpresterande reasoning-varianten.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context

$0.95/$4.00/1M

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Vanliga fragor om DeepSeek-V3.2-Speciale

Hitta svar pa vanliga fragor om DeepSeek-V3.2-Speciale