deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale je reasoning-first LLM sa performansama na nivou zlatne medalje iz matematike, DeepSeek Sparse Attention mehanizmom i context window-om...

DeepSeekReasoningAIOpenSourceMatematičkaOlimpijadaSparseAttention
deepseek logodeepseekDeepSeek-V32025-12-01
Контекст
131Kтокена
Макс. излаз
131Kтокена
Улазна цена
$0.28/ 1M
Излазна цена
$0.42/ 1M
Модалитет:Text
Могућности:АлатиСтримингЗакључивање
Бенчмаркови
GPQA
91.5%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). DeepSeek-V3.2-Speciale је постигао 91.5% на овом бенчмарку.
HLE
30.6%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. DeepSeek-V3.2-Speciale је постигао 30.6% на овом бенчмарку.
MMLU
88.5%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. DeepSeek-V3.2-Speciale је постигао 88.5% на овом бенчмарку.
MMLU Pro
78.4%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. DeepSeek-V3.2-Speciale је постигао 78.4% на овом бенчмарку.
SimpleQA
45.8%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. DeepSeek-V3.2-Speciale је постигао 45.8% на овом бенчмарку.
IFEval
91.2%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. DeepSeek-V3.2-Speciale је постигао 91.2% на овом бенчмарку.
AIME 2025
96%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. DeepSeek-V3.2-Speciale је постигао 96% на овом бенчмарку.
MATH
90.1%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. DeepSeek-V3.2-Speciale је постигао 90.1% на овом бенчмарку.
GSM8k
98.9%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. DeepSeek-V3.2-Speciale је постигао 98.9% на овом бенчмарку.
MGSM
92.5%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. DeepSeek-V3.2-Speciale је постигао 92.5% на овом бенчмарку.
MathVista
68.5%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. DeepSeek-V3.2-Speciale је постигао 68.5% на овом бенчмарку.
SWE-Bench
73.1%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. DeepSeek-V3.2-Speciale је постигао 73.1% на овом бенчмарку.
HumanEval
94.1%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. DeepSeek-V3.2-Speciale је постигао 94.1% на овом бенчмарку.
LiveCodeBench
71.4%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. DeepSeek-V3.2-Speciale је постигао 71.4% на овом бенчмарку.
MMMU
70.2%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. DeepSeek-V3.2-Speciale је постигао 70.2% на овом бенчмарку.
MMMU Pro
58%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. DeepSeek-V3.2-Speciale је постигао 58% на овом бенчмарку.
ChartQA
85%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. DeepSeek-V3.2-Speciale је постигао 85% на овом бенчмарку.
DocVQA
93%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. DeepSeek-V3.2-Speciale је постигао 93% на овом бенчмарку.
Terminal-Bench
46.4%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. DeepSeek-V3.2-Speciale је постигао 46.4% на овом бенчмарку.
ARC-AGI
12%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. DeepSeek-V3.2-Speciale је постигао 12% на овом бенчмарку.

О моделу DeepSeek-V3.2-Speciale

Сазнајте о могућностима, функцијама и начинима коришћења модела DeepSeek-V3.2-Speciale.

Nova granica u reasoning-u

DeepSeek-V3.2-Speciale je vrhunski (state-of-the-art), reasoning-first veliki jezički model (LLM) koji služi kao high-compute varijanta V3.2 porodice. Eksplicitno dizajniran da parira frontier sistemima kao što su GPT-5 i Gemini 3 Pro, postiže izuzetne performanse uklanjanjem kazni za dužinu tokom reinforcement learning-a i skaliranjem post-training compute-a na preko 10% budžeta za pre-training. Ovo omogućava modelu da generiše ekstremno duge putanje chain-of-thought procesa — koje premašuju 47.000 tokens po odgovoru — kako bi rešio složene probleme u više koraka.

Arhitektonska inovacija

Tehnički, model uvodi DeepSeek Sparse Attention (DSA), revolucionarni mehanizam koji koristi munjeviti indekser za identifikaciju najrelevantnijih tokena unutar svog context window-a od 131K. Fokusiranjem na specifičan podskup tokena, model značajno smanjuje računarsko opterećenje za inference dugog konteksta, zadržavajući preciznost dense arhitektura. Prvi je open-source model koji je postigao rezultate na nivou zlatne medalje na Međunarodnoj matematičkoj olimpijadi (IMO) 2025. i Međunarodnoj olimpijadi iz informatike (IOI).

Efikasnost i integracija

Pored sirove logike, model daje prioritet isplativosti i korisnosti za developere. Sa cenom koja je delić cene njegovih closed-source konkurenata, podržava Thinking in Tool-Use, režim u kojem je reasoning direktno integrisan u petlju pozivanja alata. Ovo omogućava kreiranje robusnijih autonomnih agenata koji mogu da planiraju, verifikuju i ispravljaju akcije u realnom vremenu unutar složenih simuliranih okruženja.

DeepSeek-V3.2-Speciale

Случајеви употребе за DeepSeek-V3.2-Speciale

Откријте различите начине коришћења модела DeepSeek-V3.2-Speciale за постизање одличних резултата.

Matematički dokazi olimpijskog nivoa

Rešavanje problema takmičarskog nivoa sa IMO i CMO koji zahtevaju desetine logičkih koraka.

Agentic softversko inženjerstvo

Rešavanje stvarnih GitHub problema autonomnom navigacijom kroz složene baze koda i primenom zakrpa.

Simulacija složenih sistema

Emulacija fizičkih ili matematičkih sistema, kao što su prostiranje radio-frekvencija ili fizika talasa, sa visokom preciznošću.

Radni tokovi dubokog reasoning-a

Sprovođenje sveobuhvatnog istraživanja i chain-of-thought analize za strateško planiranje ili naučna otkrića.

Planiranje autonomnih agenata

Korišćenje „Thinking in Tool-Use“ pristupa za planiranje, izvršavanje i verifikaciju koraka u više od 1.800 simuliranih okruženja.

Zero-Shot takmičarsko programiranje

Generisanje efikasnih algoritama za CodeForces ili IOI nivoe programerskih izazova uz automatizovanu samoispravku.

Предности

Ограничења

Reasoning zlatne medalje: Postizanje rezultata na nivou zlatne medalje na Međunarodnoj matematičkoj olimpijadi (IMO) 2025, nadmašujući skoro svaki closed-source model u logici.
Inefikasnost tokena: Da bi postigao visoku tačnost, model često generiše 3x do 4x više tokens od konkurencije, što dovodi do dužeg vremena čekanja.
Nepobediva pristupačnost: Sa cenom od 0,28 $/0,42 $ na 1M tokens, omogućava frontier reasoning po ceni koja čini masovnu primenu agenata održivom.
Hardverska zahtevnost: Kao model sa 671B parameters, lokalno pokretanje zahteva ogromne VRAM konfiguracije koje premašuju većinu kućnih računara.
Efikasan dugi kontekst: DeepSeek Sparse Attention (DSA) mehanizam mu omogućava da obradi 131K tokens uz mnogo niže troškove compute-a nego standardni dense transformer modeli.
Inference latencija: Prošireni lanci razmišljanja znače da modelu može biti potrebno nekoliko minuta da proizvede konačan odgovor za veoma složene matematičke probleme.
Napredna integracija alata: Poseduje prvi te vrste „Thinking in Tool-Use“ režim gde je reasoning direktno integrisan u petlju pozivanja alata.
Beta optimizovana samo za API: Iako su težine dostupne, najoptimisovanije „Speciale“ iskustvo je trenutno prioritetno dostupno putem DeepSeek API endpoint-a.

АПИ брзи старт

deepseek/deepseek-v3.2-speciale

Погледај документацију
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: "YOUR_DEEPSEEK_API_KEY",
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Reši problem 1 sa IMO 2025 uz reasoning korak po korak." }],
    model: "deepseek-v3.2-speciale",
    max_tokens: 16384, 
  });

  console.log("Reasoning Chain:", completion.choices[0].message.reasoning_content);
  console.log("Final Answer:", completion.choices[0].message.content);
}

main();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу DeepSeek-V3.2-Speciale

Погледајте шта заједница мисли о моделу DeepSeek-V3.2-Speciale

"DeepSeek V3.2 Speciale dominira mojim matematičkim testovima dok je ~15x jeftiniji od GPT-5.1 High"
gum1h0x
x
"Oni su prvi koji su objavili model za Gold IMO 2025 i ICPC World Finals kojem svako može zapravo pristupiti"
Chubby
reddit
"Zaista razmišlja ludački dugo... ali skripta koju je generisao bila je matematički besprekorna"
Bijan Bowen
youtube
"Speciale je za teške probleme — parira Gemini-3.0-Pro sa rezultatima na nivou zlatne medalje na IMO 2025"
nick-baumann
reddit
"Stopa validnosti je izuzetno visoka, što znači da kada napravi jednu pogrešnu tranziciju reči, ne upada u doom loop"
Lisan al Gaib
x
"Ovo su u suštini o1-pro performanse po cenama GPT-4o-mini modela. Neverovatan rad DeepSeek tima"
tech-enthusiast
hackernews

Видео снимци о моделу DeepSeek-V3.2-Speciale

Гледајте туторијале, рецензије и дискусије о моделу DeepSeek-V3.2-Speciale

Kažu da ima maksimalne reasoning sposobnosti i dizajniran je da parira Gemini 3 Pro modelu.

Razlog koji mi je privukao pažnju je taj što je Gemini 2.5 deepthink postigao samo bronzani nivo, dok ovaj DeepSeek model osvaja zlato.

Imati model ovog nivoa snage koji je uslovno rečeno open-source je zaista sjajna stvar.

Razmišljaće veoma dugo... nije namenjen za jednostavna pitanja poput 'koliko je 2+2'.

Preciznost na matematičkim problemima sa olimpijade 2025. je prosto nečuvena za model ove cene.

V3.2 Speciale ima maksimalne reasoning mogućnosti i više je rival za Gemini 3 Pro.

DeepSeek je prvi koji je integrisao razmišljanje direktno u upotrebu alata (tool use).

Open-source model koji je uporediv sa ovim closed-source i skupim modelima.

Benchmark brojke koje dostižu suštinski brišu pod sa većinom open weights modela.

Zaista su uložili mnogo truda u reinforcement learning za ovu varijantu.

Speciale je dizajniran specifično za reasoning... pustite model da razmišlja onoliko dugo koliko mu je potrebno.

Sada koristi njihovu DSA ili Deepseek sparse arhitekturu kako bi rešio usko grlo pažnje (attention bottleneck).

Ovo nije samo teorijska optimizacija. To znači da je ovaj model neverovatno jeftin za pokretanje, čak i pri dugim kontekstima.

Kada pogledate HumanEval, 94,1% je prosto zapanjujuće za model koji možete preuzeti.

Deluje „inteligentnije“ u tome kako obrađuje refaktoring koda u poređenju sa standardnim V3 modelom.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови
Pogledaj demo video

Pro Saveti za DeepSeek-V3.2-Speciale

Stručni saveti za maksimalno iskorišćenje DeepSeek-V3.2-Speciale.

Onemogućite ograničenja dužine

Osigurajte da vaš API poziv nema restriktivne max_tokens limite; modelu je potreban prostor da „razmišlja“.

Pratite potrošnju tokena

Ovaj model daje prioritet tačnosti u odnosu na sažetost i može potrošiti 3-4x više tokens nego standardni modeli za isti zadatak.

Iskoristite razmišljanje pri tool-use

Koristite model za složene agentic zadatke gde može da primeni reasoning tokom izvršavanja alata, a ne samo pre toga.

Lokalna kvantizacija

Ako pokrećete model lokalno, koristite Q5_K_M ili višu kvantizaciju kako biste sačuvali složene reasoning težine 671B arhitekture.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Често Постављана Питања о DeepSeek-V3.2-Speciale

Пронађите одговоре на честа питања о DeepSeek-V3.2-Speciale