deepseek

DeepSeek v4

DeepSeek v4 är en MoE-modell på 1,6T parametrar med ett context window på 1 miljon tokens och nativt multimodalt stöd för text, bild och video till disruptiva...

Open-sourceMultimodalMixture of ExpertsReasoningLong Context
deepseek logodeepseekDeepSeek-V2026-04-23
Kontext
1.0Mtokens
Max utdata
384Ktokens
Inmatningspris
$1.74/ 1M
Utdatapris
$3.48/ 1M
Modalitet:TextImageAudioVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
90.1%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. DeepSeek v4 fick 90.1% pa detta benchmark.
HLE
48.2%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. DeepSeek v4 fick 48.2% pa detta benchmark.
MMLU
90.1%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. DeepSeek v4 fick 90.1% pa detta benchmark.
MMLU Pro
87.5%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. DeepSeek v4 fick 87.5% pa detta benchmark.
SimpleQA
57.9%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. DeepSeek v4 fick 57.9% pa detta benchmark.
IFEval
89%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. DeepSeek v4 fick 89% pa detta benchmark.
AIME 2025
92%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. DeepSeek v4 fick 92% pa detta benchmark.
MATH
90.2%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. DeepSeek v4 fick 90.2% pa detta benchmark.
GSM8k
92.6%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. DeepSeek v4 fick 92.6% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. DeepSeek v4 fick 92% pa detta benchmark.
MathVista
72%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. DeepSeek v4 fick 72% pa detta benchmark.
SWE-Bench
80.6%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. DeepSeek v4 fick 80.6% pa detta benchmark.
HumanEval
90%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. DeepSeek v4 fick 90% pa detta benchmark.
LiveCodeBench
93.5%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. DeepSeek v4 fick 93.5% pa detta benchmark.
MMMU
70%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. DeepSeek v4 fick 70% pa detta benchmark.
MMMU Pro
55%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. DeepSeek v4 fick 55% pa detta benchmark.
ChartQA
87%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. DeepSeek v4 fick 87% pa detta benchmark.
DocVQA
92%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. DeepSeek v4 fick 92% pa detta benchmark.
Terminal-Bench
67.9%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. DeepSeek v4 fick 67.9% pa detta benchmark.
ARC-AGI
77%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. DeepSeek v4 fick 77% pa detta benchmark.

Om DeepSeek v4

Lar dig om DeepSeek v4s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Högeffektiv arkitektur i biljonskala

DeepSeek v4 representerar en evolution inom Mixture-of-Experts (MoE)-design, som skalar upp till 1,6 biljoner totala parametrar med 49 miljarder aktiva parametrar. Modellen integrerar Compressed Sparse Attention (CSA) och Heavily Compressed Attention (HCA) för att hantera sitt context window på 1 miljon tokens. Dessa tekniker minskar KV cache-minnesavtrycket med 90 % jämfört med standardarkitekturer, vilket möjliggör snabbare inference och lägre hårdvarukrav för uppgifter med lång kontext.

Nativ multimodal integration

Till skillnad från modeller som använder separata vision- eller ljud-encoders är DeepSeek v4 nativt multimodal från den inledande träningsfasen. Den bearbetar text, bilder, ljud och video inom ett enhetligt ramverk. Detta tillvägagångssätt förbättrar cross-modal reasoning, vilket gör att modellen kan utföra komplexa analyser på råa videofiler och storskaliga dokumentarkiv utan att förlora detaljer.

Strategisk kostnadsdisruption

Modellen är positionerad som ett högpresterande open-source-alternativ till proprietära toppmodeller. Med prissättning på 1,74 $ per miljon input tokens bibehåller den frontier-nivå i kodning och matematik samtidigt som den avsevärt sänker de operativa kostnaderna för utvecklare. Inkluderingen av ett valfritt Thinking Mode möjliggör djup reasoning för logiska bevis och tävlingsprogrammering.

DeepSeek v4

Anvandningsfall for DeepSeek v4

Upptack de olika satten du kan anvanda DeepSeek v4 for att uppna fantastiska resultat.

Storskalig refaktorisering av kodbaser

Utnyttja context window på 1 miljon tokens för att läsa in hela repositories för global feldetektering och arkitektoniska förbättringar.

Nativ videoanalys

Bearbeta råa videofiler direkt för att utföra scendetektering, transkribering och komplex visuell reasoning.

Autonoma programvaruagenter

Distribuera modellen i agentic arbetsflöden för att lösa verkliga GitHub-ärenden med en framgångsfrekvens på 80,6 % på SWE-bench.

Multimodal innehållsskapande

Generera strukturerad data och kreativt innehåll i text-, bild- och ljudformat med en enhetlig modell.

Matematiska bevis på hög nivå

Lösa matematiska problem på olympiadnivå och formella bevis med hjälp av det specialiserade Thinking Mode för djup reasoning.

Hämtning av företagskunskap

Analysera massiva dokumentarkiv i en enda prompt för att extrahera fakta utan behov av komplexa RAG-pipelines.

Styrkor

Begransningar

Hyper-effektiv long context: Minskar KV cache-avtrycket med 90 %, vilket möjliggör ett context window på 1 miljon tokens som förblir högpresterande på standardhårdvara.
Högre latency i Thinking Mode: Läget för djup reasoning ökar tiden till första token (time-to-first-token), vilket gör det mindre lämpligt för blixtsnabba konversationer.
Marknadsledande värde: Levererar intelligens i frontier-klass för 1,74 $/M tokens, vilket avsevärt understiger västerländska closed-source-konkurrenter.
Bias för hårdvaruoptimering: Tekniska rapporter tyder på att optimeringen är kraftigt anpassad för specifika kinesiska acceleratorer framför Nvidia-kluster.
Överlägsen agentic kodning: Uppnår 80,6 % på SWE-bench Verified, vilket gör den till en av de mest kapabla modellerna för autonom mjukvaruutveckling.
Faktamässiga brister: Får 57,9 % på SimpleQA, vilket tyder på att även om reasoning-förmågan är i toppklass, förblir faktamässiga hallucinationer en utmaning.
Enhetlig nativ multimodalitet: Stödjer text, vision, ljud och video i en arkitektur utan behov av externa adaptrar eller under-modeller.
Komplexa krav för KV cache: Hybrid-mekanismen HCA/CSA-attention kräver specifikt kernel-stöd för optimal lokal prestanda.

API snabbstart

deepseek/deepseek-v4-pro

Visa dokumentation
deepseek SDK
import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Optimize this Rust kernel for memory efficiency.' }], }); console.log(msg.choices[0].message.content);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om DeepSeek v4

Se vad communityt tycker om DeepSeek v4

DeepSeek v4:s reasoning mode hittade en concurrency-bugg i min Rust-kod som till och med Claude Opus missade. Helt sjukt.
rust_dev_2025
reddit
Tiden för kostnadseffektivt context window på 1 miljon är äntligen här. Vi kan nu köra refaktoriseringar av hela projekt för småpengar.
tech_lead_alex
twitter
Att se modellen arbeta igenom en kodbas på 1 miljon tokens utan att tappa 'tråden' är den verkliga vändpunkten för 2026.
logic_fanatic
hackernews
Anthropic och OpenAI har ett allvarligt prisproblem nu. DeepSeek gjorde precis frontier AI till en råvara.
CodeMaster
youtube
Den slår GPT-5.4 i kodnings-benchmark samtidigt som den är open-source. Årets största lansering.
AI_Researcher_99
twitter
Minneskomprimeringen är den verkliga magin. 1T parametrar på konsumentnära hårdvara blir äntligen verklighet.
GPU_Rich
reddit

Videor om DeepSeek v4

Se handledningar, recensioner och diskussioner om DeepSeek v4

Minneseffektiviteten är den verkliga nyheten här; att minska KV cache med 90 % ändrar allt

Att köra en 1T-modell med denna hastighet är en enorm arkitektonisk vinst

Kostnaden per miljon tokens gör att små startups inte kan ignorera den

Jag har aldrig sett en open-source-modell hantera 1 miljon tokens så snyggt

Det känns som att klyftan mellan öppna och stängda modeller officiellt har stängts

DeepSeek konkurrerar inte längre bara på pris; de leder inom long-context reasoning

Det nativa videostödet är förvånansvärt robust jämfört med Gemini 2.0

Att installera den lokalt är förvånansvärt enkelt om du använder SGLang

Benchmark-tester på HumanEval visar att den i princip är i nivå med GPT-5

Deras context window gör RAG-pipelines nästan överflödiga för medelstora projekt

Prestandan i kodnings-benchmark saknar för närvarande motstycke hos andra modeller med öppen vikt

Den matchar eller överträffar topprankade closed-source-modeller vid refaktorisering av enorma kodbaser

Engram-minnesimplementeringen är ett tekniskt underverk inom detta område

Vi ser 90 % logik-precision i Thinking Mode för olympiad-matte

Den här lanseringen demokratiserar i praktiken intelligens på biljon-parameter-nivå

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for DeepSeek v4

Experttips for att hjalpa dig fa ut det mesta av DeepSeek v4 och uppna battre resultat.

Växla Thinking Mode

Använd standardläget för snabb chatt och reservera Thinking Mode specifikt för kodning och logiska bevis.

Utnyttja context caching

Använd inbyggda funktioner för context caching för att minska kostnaderna med upp till 90 % vid repetitiva prompts med lång kontext.

Direkt multimodal input

Mata in råa ljud- och videofiler direkt i API:et för att dra nytta av den nativa arkitekturen istället för att transkribera i förväg.

Optimering av system prompt

Tillhandahåll tydliga JSON-scheman eller instruktioner för verktygsanvändning i system prompten för ett mycket tillförlitligt agentic beteende.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Vanliga fragor om DeepSeek v4

Hitta svar pa vanliga fragor om DeepSeek v4