deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale je reasoning-first LLM s matematičkim performansama na razini zlatne medalje, DeepSeek Sparse Attention-om i context windowom od 131K....

DeepSeekReasoningAIOpenSourceMatematičkaOlimpijadaSparseAttention
deepseek logodeepseekDeepSeek-V32025-12-01
Kontekst
131Ktokena
Maks. izlaz
131Ktokena
Ulazna cijena
$0.28/ 1M
Izlazna cijena
$0.42/ 1M
Modalitet:Text
Mogućnosti:AlatiStreamingZaključivanje
Benchmarks
GPQA
91.5%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). DeepSeek-V3.2-Speciale je postigao 91.5% na ovom benchmarku.
HLE
30.6%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. DeepSeek-V3.2-Speciale je postigao 30.6% na ovom benchmarku.
MMLU
88.5%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. DeepSeek-V3.2-Speciale je postigao 88.5% na ovom benchmarku.
MMLU Pro
78.4%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. DeepSeek-V3.2-Speciale je postigao 78.4% na ovom benchmarku.
SimpleQA
45.8%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. DeepSeek-V3.2-Speciale je postigao 45.8% na ovom benchmarku.
IFEval
91.2%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. DeepSeek-V3.2-Speciale je postigao 91.2% na ovom benchmarku.
AIME 2025
96%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. DeepSeek-V3.2-Speciale je postigao 96% na ovom benchmarku.
MATH
90.1%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. DeepSeek-V3.2-Speciale je postigao 90.1% na ovom benchmarku.
GSM8k
98.9%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. DeepSeek-V3.2-Speciale je postigao 98.9% na ovom benchmarku.
MGSM
92.5%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. DeepSeek-V3.2-Speciale je postigao 92.5% na ovom benchmarku.
MathVista
68.5%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. DeepSeek-V3.2-Speciale je postigao 68.5% na ovom benchmarku.
SWE-Bench
73.1%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. DeepSeek-V3.2-Speciale je postigao 73.1% na ovom benchmarku.
HumanEval
94.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. DeepSeek-V3.2-Speciale je postigao 94.1% na ovom benchmarku.
LiveCodeBench
71.4%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. DeepSeek-V3.2-Speciale je postigao 71.4% na ovom benchmarku.
MMMU
70.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. DeepSeek-V3.2-Speciale je postigao 70.2% na ovom benchmarku.
MMMU Pro
58%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. DeepSeek-V3.2-Speciale je postigao 58% na ovom benchmarku.
ChartQA
85%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. DeepSeek-V3.2-Speciale je postigao 85% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. DeepSeek-V3.2-Speciale je postigao 93% na ovom benchmarku.
Terminal-Bench
46.4%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. DeepSeek-V3.2-Speciale je postigao 46.4% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. DeepSeek-V3.2-Speciale je postigao 12% na ovom benchmarku.

O modelu DeepSeek-V3.2-Speciale

Saznajte o mogućnostima, značajkama i načinima korištenja modela DeepSeek-V3.2-Speciale.

Nova granica u reasoningu

DeepSeek-V3.2-Speciale je state-of-the-art, reasoning-first large language model (LLM) koji služi kao high-compute varijanta V3.2 obitelji. Eksplicitno dizajniran da konkurira frontier model sustavima poput GPT-5 i Gemini 3 Pro, postiže iznimne performanse ublažavanjem length penalties tijekom reinforcement learninga i skaliranjem post-training compute-a na više od 10% budžeta pre-traininga. To omogućuje modelu generiranje iznimno dugih chain-of-thought putanja — preko 47.000 tokens po odgovoru — za rješavanje složenih problema u više koraka.

Arhitektonska inovacija

Tehnički, model uvodi DeepSeek Sparse Attention (DSA), revolucionarni mehanizam koji koristi munjeviti indexer za identifikaciju najrelevantnijih tokens unutar svog 131K context windowa. Fokusiranjem na specifičan podskup tokens, model značajno smanjuje računalni overhead za long-context inference uz zadržavanje točnosti dense arhitektura. To je ujedno i prvi open-source model koji je postigao rezultate na razini zlatne medalje na Međunarodnoj matematičkoj olimpijadi (IMO) 2025. i Međunarodnoj informatičkoj olimpijadi (IOI).

Učinkovitost i integracija

Osim čiste logike, model daje prioritet troškovnoj učinkovitosti i korisnosti za developere. Uz cijenu koja je tek djelić cijene closed-source konkurenata, podržava Thinking in Tool-Use, način rada u kojem je reasoning integriran izravno u petlju pozivanja alata. To omogućuje robusnije autonomne agente koji mogu planirati, verificirati i ispravljati akcije u stvarnom vremenu unutar složenih simuliranih okruženja.

DeepSeek-V3.2-Speciale

Slučajevi korištenja za DeepSeek-V3.2-Speciale

Otkrijte različite načine korištenja modela DeepSeek-V3.2-Speciale za postizanje izvrsnih rezultata.

Matematički dokazi na razini olimpijade

Rješavanje problema s natjecanja poput IMO i CMO koji zahtijevaju desetke logičkih koraka.

Agentic softversko inženjerstvo

Rješavanje stvarnih GitHub problema autonomnom navigacijom kroz složene codebaseove i primjenom zakrpa.

Simulacija složenih sustava

Emulacija fizičkih ili matematičkih sustava, poput širenja radio frekvencija ili fizike valova, uz visoku preciznost.

Deep reasoning tijekovi rada

Provođenje sveobuhvatnog istraživanja i chain-of-thought analize za strateško planiranje ili znanstvena otkrića.

Planiranje autonomnih agenata

Korištenje "Thinking in Tool-Use" za planiranje, izvršavanje i provjeru koraka u više od 1.800 simuliranih okruženja.

Zero-shot natjecateljsko programiranje

Generiranje učinkovitih algoritama za CodeForces ili IOI izazove uz automatiziranu samokorekciju.

Prednosti

Ograničenja

Gold-Medal Reasoning: Postizanje rezultata na razini zlatne medalje na Međunarodnoj matematičkoj olimpijadi (IMO) 2025., nadmašujući gotovo svaki closed-source model u logici.
Inefikasnost tokens: Da bi postigao visoku točnost, model često generira 3x do 4x više tokens od konkurenata, što dovodi do dužeg vremena čekanja.
Nenadmašna pristupačnost: S cijenom od 0,28 $/0,42 $ po 1M tokens, pruža frontier model reasoning po cijeni koja omogućuje masovnu implementaciju agenata.
Hardverska zahtjevnost: Kao model sa 671B parameters, lokalno pokretanje zahtijeva masivne VRAM konfiguracije koje nadmašuju većinu kućnih računala.
Učinkovit dugi kontekst: DeepSeek Sparse Attention (DSA) mehanizam omogućuje obradu 131K tokens uz znatno niže troškove compute-a od standardnih dense transformersa.
Inference Latency: Prošireni reasoning lanci znače da modelu može trebati nekoliko minuta da generira konačni odgovor za visoko složene matematičke probleme.
Napredna integracija alata: Sadrži prvi takve vrste "Thinking in Tool-Use" način rada gdje je reasoning integriran izravno u petlju pozivanja alata.
Beta optimizirana samo za API: Iako su weights dostupni, najoptimiziranije "Speciale" iskustvo trenutno je prioritet putem DeepSeek API endpointova.

API brzi početak

deepseek/deepseek-v3.2-speciale

Pogledaj dokumentaciju
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: "YOUR_DEEPSEEK_API_KEY",
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve the 2025 IMO Problem 1 with step-by-step reasoning." }],
    model: "deepseek-v3.2-speciale",
    max_tokens: 16384, 
  });

  console.log("Reasoning Chain:", completion.choices[0].message.reasoning_content);
  console.log("Final Answer:", completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu DeepSeek-V3.2-Speciale

Pogledajte što zajednica misli o modelu DeepSeek-V3.2-Speciale

"DeepSeek V3.2 Speciale dominira mojim testovima matematike, a istovremeno je ~15× jeftiniji od GPT-5.1 High"
gum1h0x
x
"Prvi su koji su objavili model sa zlatnom medaljom na IMO 2025 i ICPC World Finals kojem svatko zapravo može pristupiti"
Chubby
reddit
"Provodi reasoning nevjerojatno dugo... ali skripta koju je generirao bila je matematički ispravna"
Bijan Bowen
youtube
"Speciale je za teške probleme — parira modelu Gemini-3.0-Pro s rezultatima na razini zlatne medalje na IMO 2025"
nick-baumann
reddit
"Omjer valjanosti je izuzetno visok, što znači da kada proizvede jedan pogrešan prijelaz riječi, ne upada u beskonačnu petlju pogrešaka"
Lisan al Gaib
x
"Ovo su u osnovi o1-pro performanse po cijenama GPT-4o-mini. Nevjerojatan rad DeepSeek tima"
tech-enthusiast
hackernews

Videozapisi o modelu DeepSeek-V3.2-Speciale

Gledajte tutorijale, recenzije i diskusije o modelu DeepSeek-V3.2-Speciale

U osnovi kažu da ima maksimalne reasoning mogućnosti i dizajniran je da parira modelu Gemini 3 Pro.

Razlog koji me oduševio je taj što je Gemini 2.5 deepthink postigao samo brončane rezultate, dok ovaj DeepSeek model osvaja zlato.

Imati model ove razine snage koji je k tome još i open-source je stvarno izvrsno.

Razmišljat će jako dugo... nije namijenjen za jednostavna pitanja poput 'koliko je 2+2'.

Točnost na zadacima matematičke olimpijade 2025. je jednostavno nečuvena za model ove cijene.

V3.2 Speciale ima maksimalne reasoning mogućnosti i više je rival modelu Gemini 3 Pro.

DeepSeek je prvi koji je integrirao razmišljanje izravno u korištenje alata.

Open-source model usporediv s ovim closed-source i skupim modelima.

Benchmark brojke koje postižu su u suštini pomele većinu open weights modela.

Stvarno su se fokusirali na reinforcement learning za ovu varijantu.

Speciale je dizajniran specifično za reasoning... pustite model da razmišlja onoliko dugo koliko mu je potrebno.

Sada koristi njihovu DSA ili Deepseek sparse arhitekturu kako bi riješio usko grlo pažnje.

Ovo nije samo teorijska optimizacija. To znači da je ovaj model nevjerojatno jeftin za pokretanje, čak i s dugim kontekstima.

Kada pogledate HumanEval, 94,1% je jednostavno zapanjujuće za model koji možete preuzeti.

Djeluje 'inteligentnije' u načinu na koji obrađuje refaktoriranje koda u usporedbi sa standardnim V3.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi
Pogledaj demo video

Pro Savjeti za DeepSeek-V3.2-Speciale

Stručni savjeti za maksimalno iskorištavanje DeepSeek-V3.2-Speciale.

Onemogućite ograničenja duljine

Osigurajte da vaš API poziv nema restriktivne max_tokens limite; model treba prostora za "razmišljanje".

Pratite potrošnju tokens

Ovaj model daje prednost točnosti nad sažetošću i može potrošiti 3-4x više tokens od standardnih modela za isti zadatak.

Iskoristite Thinking in Tool-Use

Koristite model za složene agentic zadatke gdje može provoditi reasoning tijekom izvršavanja alata, a ne samo prije.

Lokalna kvantizacija

Ako pokrećete model lokalno, koristite Q5_K_M ili višu kvantizaciju kako biste očuvali zamršene reasoning weights 671B arhitekture.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Često Postavljana Pitanja o DeepSeek-V3.2-Speciale

Pronađite odgovore na česta pitanja o DeepSeek-V3.2-Speciale