deepseek

DeepSeek v4

DeepSeek v4 je MoE model s 1.6T parametara koji nudi 1M token context window i nativnu multimodalnu podršku za tekst, vizualne elemente i video po...

Open SourceMultimodalMixture of ExpertsReasoningLong Context
deepseek logodeepseekDeepSeek-V2026-04-23
Kontekst
1.0Mtokena
Maks. izlaz
384Ktokena
Ulazna cijena
$1.74/ 1M
Izlazna cijena
$3.48/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
90.1%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). DeepSeek v4 je postigao 90.1% na ovom benchmarku.
HLE
48.2%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. DeepSeek v4 je postigao 48.2% na ovom benchmarku.
MMLU
90.1%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. DeepSeek v4 je postigao 90.1% na ovom benchmarku.
MMLU Pro
87.5%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. DeepSeek v4 je postigao 87.5% na ovom benchmarku.
SimpleQA
57.9%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. DeepSeek v4 je postigao 57.9% na ovom benchmarku.
IFEval
89%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. DeepSeek v4 je postigao 89% na ovom benchmarku.
AIME 2025
92%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. DeepSeek v4 je postigao 92% na ovom benchmarku.
MATH
90.2%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. DeepSeek v4 je postigao 90.2% na ovom benchmarku.
GSM8k
92.6%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. DeepSeek v4 je postigao 92.6% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. DeepSeek v4 je postigao 92% na ovom benchmarku.
MathVista
72%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. DeepSeek v4 je postigao 72% na ovom benchmarku.
SWE-Bench
80.6%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. DeepSeek v4 je postigao 80.6% na ovom benchmarku.
HumanEval
90%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. DeepSeek v4 je postigao 90% na ovom benchmarku.
LiveCodeBench
93.5%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. DeepSeek v4 je postigao 93.5% na ovom benchmarku.
MMMU
70%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. DeepSeek v4 je postigao 70% na ovom benchmarku.
MMMU Pro
55%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. DeepSeek v4 je postigao 55% na ovom benchmarku.
ChartQA
87%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. DeepSeek v4 je postigao 87% na ovom benchmarku.
DocVQA
92%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. DeepSeek v4 je postigao 92% na ovom benchmarku.
Terminal-Bench
67.9%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. DeepSeek v4 je postigao 67.9% na ovom benchmarku.
ARC-AGI
77%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. DeepSeek v4 je postigao 77% na ovom benchmarku.

O modelu DeepSeek v4

Saznajte o mogućnostima, značajkama i načinima korištenja modela DeepSeek v4.

Visokoučinkovita arhitektura bilijunskog razmjera

DeepSeek v4 predstavlja evoluciju u dizajnu Mixture-of-Experts (MoE), skalirajući se na ukupno 1,6 bilijuna parametara s 49 milijardi aktivnih parametara. Model integrira Compressed Sparse Attention (CSA) i Heavily Compressed Attention (HCA) za upravljanje svojim context windowom od 1 milijun tokena. Ove tehnologije smanjuju otisak KV cache memorije za 90% u usporedbi sa standardnim arhitekturama, omogućujući bržu inferenciju i manje hardverske zahtjeve za zadatke s dugim kontekstom.

Nativna multimodalna integracija

Za razliku od modela koji koriste odvojene vizualne ili audio enkodere, DeepSeek v4 je nativno multimodalan od početne faze treniranja. Obrađuje tekst, slike, zvuk i video unutar jednog jedinstvenog okvira. Ovakav pristup poboljšava kros-modalni reasoning, omogućujući modelu izvođenje složene analize sirovih video datoteka i opsežnih arhiva dokumenata bez gubitka detalja.

Strateško rušenje cijena

Model je pozicioniran kao performantna open-source alternativa vrhunskim zatvorenim modelima. Uz cijenu od 1,74 USD po milijun ulaznih tokena, održava performanse razine frontier modela u kodiranju i matematici, značajno smanjujući operativne troškove za programere. Uključenje opcionalnog Thinking Modea omogućuje duboki reasoning za logičke dokaze i natjecateljsko programiranje.

DeepSeek v4

Slučajevi korištenja za DeepSeek v4

Otkrijte različite načine korištenja modela DeepSeek v4 za postizanje izvrsnih rezultata.

Refaktoriranje kodnih baza velikih razmjera

Korištenje 1M context windowa za učitavanje čitavih repozitorija radi globalnog otkrivanja bugova i arhitektonskih poboljšanja.

Nativna video analiza

Izravna obrada sirovih video datoteka za prepoznavanje scena, generiranje transkripata i složeno vizualno zaključivanje.

Autonomni softverski agenti

Implementacija modela u agentic tijekovima rada za rješavanje stvarnih GitHub problema s uspješnošću od 80,6% na SWE-benchu.

Multimodalno stvaranje sadržaja

Generiranje strukturiranih podataka i kreativnog sadržaja kroz tekstualne, slikovne i audio formate pomoću jedinstvenog modela.

Napredni matematički dokazi

Rješavanje matematičkih problema na razini olimpijade i formalnih dokaza korištenjem specijaliziranog Thinking Modea za duboki reasoning.

Dohvaćanje znanja u poduzećima

Analiza masivnih arhiva dokumenata u jednom promptu za izvlačenje činjenica bez potrebe za složenim RAG cjevovodima.

Prednosti

Ograničenja

Hiper-učinkovit Long Context: Smanjuje otisak KV cachea za 90%, omogućujući 1M context window koji ostaje performantan na standardnom hardveru.
Veća latencija Thinking Modea: Mod za duboki reasoning povećava vrijeme do prvog tokena, što ga čini manje pogodnim za iznimno brze konverzacijske potrebe.
Vodeća vrijednost na tržištu: Pruža inteligenciju razine frontier modela po cijeni od 1,74 USD/M tokena, znatno povoljnije od zapadnih closed-source konkurenata.
Pristranost prema hardverskoj optimizaciji: Tehnička izvješća sugeriraju da je optimizacija snažno prilagođena specifičnim kineskim domaćim akceleratorima u odnosu na Nvidia klastere.
Vrhunsko agentic kodiranje: Postiže 80,6% na SWE-bench Verified, što ga čini jednim od najsposobnijih modela za autonomno softversko inženjerstvo.
Nedostaci u činjeničnoj točnosti: Postiže 57,9% na SimpleQA, što ukazuje na to da, iako je reasoning vrhunski, činjenične halucinacije ostaju izazov.
Objedinjena nativna multimodalnost: Podržava tekst, vizualne elemente, audio i video u jednoj arhitekturi bez potrebe za vanjskim adapterima ili sub-modelima.
Složeni zahtjevi za KV cache: Hibridni HCA/CSA mehanizam pažnje zahtijeva specifičnu podršku kernela za optimalne lokalne performanse.

API brzi početak

deepseek/deepseek-v4-pro

Pogledaj dokumentaciju
deepseek SDK
import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Optimiziraj ovaj Rust kernel za memorijsku učinkovitost.' }], }); console.log(msg.choices[0].message.content);

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu DeepSeek v4

Pogledajte što zajednica misli o modelu DeepSeek v4

Reasoning mode u DeepSeek v4 pronašao je bug u sinkronizaciji u mom Rust kodu koji je čak i Claude Opus propustio. Stvarno nevjerojatno.
rust_dev_2025
reddit
Era isplativog 1M context windowa je konačno stigla. Sada možemo izvoditi refaktoriranja punih projekata za sitniš.
tech_lead_alex
twitter
Gledati model kako prolazi kroz kodnu bazu od 1M tokena bez gubitka 'igle' stvarna je prekretnica za 2026.
logic_fanatic
hackernews
Anthropic i OpenAI sada imaju ozbiljan problem s cijenama. DeepSeek je upravo pretvorio frontier AI u robu široke potrošnje.
CodeMaster
youtube
Pobjeđuje GPT-5.4 u benchmarkovima kodiranja, a pritom je open-source. Ovo je najveće izdanje godine.
AI_Researcher_99
twitter
Kompresija memorije je prava magija. 1T parametara na hardveru za široku potrošnju konačno postaje stvarnost.
GPU_Rich
reddit

Videozapisi o modelu DeepSeek v4

Gledajte tutorijale, recenzije i diskusije o modelu DeepSeek v4

Memorijska učinkovitost je ovdje prava priča, smanjenje KV cachea za 90% mijenja sve

Pokretanje 1T modela s ovom razinom brzine je masovna arhitektonska pobjeda

Cijena po milijunu tokena čini ga nezaobilaznim za male startupe

Nikad nisam vidio da open-source model ovako čisto barata s 1 milijun tokena

Čini se da se jaz između open i closed modela službeno zatvorio

DeepSeek se više ne natječe samo cijenom; predvode u long-context reasoningu

Nativna video podrška je iznenađujuće robusna u usporedbi s Gemini 2.0

Lokalna instalacija je iznenađujuće jednostavna ako koristite SGLang

Benchmarkovi na HumanEval pokazuju da je u osnovi u paritetu s GPT-5

Context window čini RAG cjevovode gotovo suvišnima za projekte srednje veličine

Performanse na benchmarkovima kodiranja trenutno su nenadmašne od strane bilo kojeg drugog modela otvorenih težina

Usporediv je ili nadmašuje vrhunske zatvorene modele u masovnom refaktoriranju kodnih baza

Implementacija engram memorije je tehničko čudo u ovom prostoru

Vidimo 90% točnosti logike u Thinking Modeu za olimpijsku matematiku

Ovo izdanje učinkovito demokratizira inteligenciju od bilijun parametara

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za DeepSeek v4

Stručni savjeti za maksimalno iskorištavanje DeepSeek v4.

Prebacivanje između Thinking modova

Koristite standardni način za brzi chat, a Thinking Mode rezervirajte posebno za kodiranje i logičke dokaze.

Iskorištavanje context cachinga

Koristite ugrađene značajke context cachinga za smanjenje troškova do 90% pri korištenju ponavljajućih promptova s velikim context windowom.

Izravan multimodalni unos

Učitajte sirove audio i video datoteke izravno u API kako biste iskoristili prednosti nativne arhitekture umjesto prethodne transkripcije.

Optimizacija system prompta

Pružite jasnu JSON shemu ili upute za korištenje alata u system promptu za visoko pouzdano agentic ponašanje.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Često Postavljana Pitanja o DeepSeek v4

Pronađite odgovore na česta pitanja o DeepSeek v4