deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale je LLM usmjeren na reasoning sa zlatnim rezultatima u matematici, DeepSeek Sparse Attention i 131K context windowom. Parira GPT-5...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V31. prosinca 2025.
Kontekst
131Ktokena
Maks. izlaz
131Ktokena
Ulazna cijena
$0.28/ 1M
Izlazna cijena
$0.42/ 1M
Modalitet:Text
Mogućnosti:AlatiStreamingZaključivanje
Benchmarks
GPQA
91.5%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). DeepSeek-V3.2-Speciale je postigao 91.5% na ovom benchmarku.
HLE
30.6%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. DeepSeek-V3.2-Speciale je postigao 30.6% na ovom benchmarku.
MMLU
88.5%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. DeepSeek-V3.2-Speciale je postigao 88.5% na ovom benchmarku.
MMLU Pro
78.4%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. DeepSeek-V3.2-Speciale je postigao 78.4% na ovom benchmarku.
SimpleQA
45.8%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. DeepSeek-V3.2-Speciale je postigao 45.8% na ovom benchmarku.
IFEval
91.2%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. DeepSeek-V3.2-Speciale je postigao 91.2% na ovom benchmarku.
AIME 2025
96%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. DeepSeek-V3.2-Speciale je postigao 96% na ovom benchmarku.
MATH
90.1%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. DeepSeek-V3.2-Speciale je postigao 90.1% na ovom benchmarku.
GSM8k
98.9%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. DeepSeek-V3.2-Speciale je postigao 98.9% na ovom benchmarku.
MGSM
92.5%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. DeepSeek-V3.2-Speciale je postigao 92.5% na ovom benchmarku.
MathVista
68.5%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. DeepSeek-V3.2-Speciale je postigao 68.5% na ovom benchmarku.
SWE-Bench
73.1%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. DeepSeek-V3.2-Speciale je postigao 73.1% na ovom benchmarku.
HumanEval
94.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. DeepSeek-V3.2-Speciale je postigao 94.1% na ovom benchmarku.
LiveCodeBench
71.4%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. DeepSeek-V3.2-Speciale je postigao 71.4% na ovom benchmarku.
MMMU
70.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. DeepSeek-V3.2-Speciale je postigao 70.2% na ovom benchmarku.
MMMU Pro
58%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. DeepSeek-V3.2-Speciale je postigao 58% na ovom benchmarku.
ChartQA
85%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. DeepSeek-V3.2-Speciale je postigao 85% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. DeepSeek-V3.2-Speciale je postigao 93% na ovom benchmarku.
Terminal-Bench
46.4%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. DeepSeek-V3.2-Speciale je postigao 46.4% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. DeepSeek-V3.2-Speciale je postigao 12% na ovom benchmarku.

O modelu DeepSeek-V3.2-Speciale

Saznajte o mogućnostima, značajkama i načinima korištenja modela DeepSeek-V3.2-Speciale.

Fokus na reasoning visokih performansi

DeepSeek-V3.2-Speciale je Mixture-of-Experts jezični model s 685 milijardi parametara. Aktivira 37 milijardi parametara po tokenu kako bi uravnotežio performanse i učinkovitost. Ova je varijanta dizajnirana za rješavanje problema u više koraka koji zahtijevaju značajan interni reasoning. Skaliranjem računalne snage nakon treniranja na više od 10% budžeta za pre-training, model stvara dugačke chain-of-thought putanje koje mogu premašiti 47 000 tokena po odgovoru. To ga čini prikladnim za navigaciju složenim logičkim dokazima i tehničkim istraživanjima.

Arhitektura Sparse Attention

Model koristi DeepSeek Sparse Attention (DSA) za upravljanje svojim context windowom od 131 072 tokena. Ovaj mehanizam koristi lightning indexer za izolaciju najrelevantnijih tokena, smanjujući računalno opterećenje koje se obično nalazi u dense sistemima s dugim kontekstom. Održava logiku dok radi s manjim overheadom. Arhitektura je posebno usmjerena na okruženja visoke računalne snage gdje se dubina reasoninga daje prednost pred širokom multimodalnom fleksibilnošću.

Tehnička i akademska izvedba

Speciale je prvi open-weights model koji je postigao rezultate razine zlatne medalje na Međunarodnoj matematičkoj olimpijadi (IMO) 2025. godine. Ističe se u tehničkim benchmark testovima kao što su AIME 2025 i HumanEval, često parirajući vlasničkim sustavima u čistim logičkim zadacima. Programeri ga mogu koristiti za generiranje složenih baza koda ili sintezu guste tehničke dokumentacije. Model je objavljen pod licencom MIT, čime se olakšava široka korisnost u open-source zajednici.

DeepSeek-V3.2-Speciale

Slučajevi korištenja za DeepSeek-V3.2-Speciale

Otkrijte različite načine korištenja modela DeepSeek-V3.2-Speciale za postizanje izvrsnih rezultata.

Generiranje matematičkih dokaza

Rješavanje matematičkih dokaza na razini olimpijade i problema simboličke logike koji zahtijevaju visoku kognitivnu dubinu.

Arhitektonski softverski dizajn

Generiranje složenih softverskih arhitektura s više datoteka razmišljanjem o strukturnim ovisnostima bez korištenja alata.

Sinteza tehničke dokumentacije

Analiza i unakrsno referenciranje uvida iz ogromnih tehničkih radova unutar njegovog context windowa od 131K.

Proizvodnja sintetičkih podataka

Stvaranje visokokvalitetnih skupova podataka bogatih reasoningom za destiliranje logike u manje, specijalizirane AI modele.

Znanstveno dubinsko istraživanje

Pregled i sinteza guste akademske literature za izvlačenje nijansirane logičke progresije u STEM područjima.

Planiranje autonomnih agenata

Navigacija složenim planiranjem u više koraka i razvoj strategije za AI agente u simuliranim okruženjima.

Prednosti

Ograničenja

Vrhunska matematička izvedba: Postiže 96% na AIME 2025 i rezultate zlatne medalje na međunarodnom natjecanju IMO.
Nema nativnu multimodalnost: Nedostaje mu mogućnost obrade slika ili zvuka, što ograničava njegovu upotrebu na podatke temeljene na tekstu.
Masivan budžet za razmišljanje: Generira putanje razmišljanja koje prelaze 47 000 tokena za duboko logičko istraživanje.
Onemogućen tool calling: Ne podržava pozivanje funkcija, što ograničava njegovu korist za autonomnu API interakciju.
DSA učinkovitost: Mehanizam DeepSeek Sparse Attention rukuje s 128K kontekstom uz niže računalne troškove od dense modela.
Inference latency: Načini razmišljanja mogu uzrokovati vrijeme čekanja od nekoliko minuta za složene logičke dokaze.
Cjenovna prednost: Pruža frontier reasoning po cijeni od $0.28 po milijun tokena, što je znatno jeftinije od vlasničkih konkurenata.
Zahtjevi za hosting: Zahtijeva GPU klastere na razini poduzeća zbog svoje MoE arhitekture od 685 milijardi parameters.

API brzi početak

deepseek/deepseek-v3.2-speciale

Pogledaj dokumentaciju
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Riješi x u kompleksnoj ravnini: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu DeepSeek-V3.2-Speciale

Pogledajte što zajednica misli o modelu DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale je zvijer. Maksimalni reasoning koji parira Gemini 3 Pro.
OpenRouter
twitter
HumanEval rezultati su stvarni. Piše čišći kod od mnogih vlasničkih modela koje sam testirao ovog mjeseca.
dev_guru_99
reddit
Cijena je jednostavno suluda. Frontier-level reasoning za djelić cijene OpenAI-a ili Anthropic-a.
AI_Builder_X
twitter
Osvježavajuće je vidjeti open-weights model koji zapravo izaziva top 3 laboratorija. Arhitektonski odabiri ovdje su briljantni.
binary_explorer
hackernews

Videozapisi o modelu DeepSeek-V3.2-Speciale

Gledajte tutorijale, recenzije i diskusije o modelu DeepSeek-V3.2-Speciale

Razmišlja nevjerojatno dugo... to je duboki duboki reasoner.

DeepSeek model osvaja zlato [na IMO] dok je Deepthink osvojio samo broncu.

Gledanje onoga što radi može biti izuzetno edukativno vrijedno.

Logika ovdje je na drugoj razini u usporedbi sa standardnim modelima.

Zapravo možete vidjeti kako model iterira kroz pogreške.

Sve što Speciale zapravo znači je deep think. Ima način dubokog razmišljanja.

Razmišlja 63 sekunde... to je prilično nevjerojatno.

Vrlo je pametan... dolazi do nekih stvarno naprednih kodova.

Skaliranje ovoga lokalno bit će najveća prepreka za korisnike.

Reasoning tokeni se na većini platformi naplaćuju drugačije.

Speciale je zvijer. Maksimalni reasoning, duboki chain-of-thought.

Speciale je dizajniran za duboki reasoning, dokaze u više koraka, složena istraživanja.

Transparentnost DeepSeek-a je ogromna prednost... vidjeti proces rada.

Uspijeva ostati koherentan kroz puno dulje odgovore nego Gemini.

Sparse Attention tehnologija je način na koji održavaju cijene tako niskima.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za DeepSeek-V3.2-Speciale

Stručni savjeti za maksimalno iskorištavanje DeepSeek-V3.2-Speciale.

Optimizirajte parametre uzorkovanja (sampling)

Postavite temperature na 1.0 i top_p na 0.95 za zadatke visoke logike kako biste osigurali raznolikost puteva dubokog reasoninga.

Pružite tehničke detalje

Strukturirajte upute u markdown formatu kako biste pomogli modelu da bolje organizira vlastitu internu chain-of-thought obradu.

Omogućite vrijeme za razmišljanje

Očekujte veću latency tijekom složenih dokaza jer model generira masivne interne lance razmišljanja.

Koristite namjenske krajnje točke (endpoints)

Navedite 'speciale' API putanju u svojoj konfiguraciji za pristup specifičnoj varijanti visokih performansi za reasoning.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Često Postavljana Pitanja o DeepSeek-V3.2-Speciale

Pronađite odgovore na česta pitanja o DeepSeek-V3.2-Speciale