Vad kostar DeepSeek v4?

DeepSeek v4 Pro kostar 1,74 $ per miljon input tokens och 3,48 $ per miljon output tokens. Detta gör modellen betydligt mer prisvärd än proprietära frontier models.

Hur använder jag DeepSeek v4 API?

Du kan nå den via DeepSeek-plattformen genom att använda en OpenAI-kompatibel SDK eller via leverantörer som OpenRouter. Den använder samma bas-URL-struktur som tidigare versioner.

Vad är det maximala context window?

Modellen har ett inbyggt context window på 1 miljon tokens. Detta gör att användare kan bearbeta flera böcker eller stora kodbaser i en enda prompt.

Stödjer modellen bild- och video-input?

Ja, DeepSeek v4 är en nativ multimodal modell som hanterar input i form av text, bild, video och ljud. Den kräver inga externa encoders för dessa uppgifter.

Är DeepSeek v4 open-source?

Ja, modellvikterna finns tillgängliga på Hugging Face under MIT-licensen. Detta möjliggör både lokal driftsättning och kommersiell integration.

Vad är funktionen 'Thinking Mode'?

Thinking Mode är en valfri inställning för reasoning som använder chain-of-thought för att lösa komplexa matematiska och logiska problem. Den är modellerad efter andra system för djupt tänkande.

Hur står den sig mot GPT-5 eller Claude 4?

Den konkurrerar med de bästa closed-source-modellerna när det gäller reasoning och kodnings-benchmark, samtidigt som den är upp till 30 gånger mer kostnadseffektiv. Den utmärker sig särskilt i LiveCodeBench-resultat.

Vad är den maximala output-längden?

DeepSeek v4 kan generera upp till 384 000 output tokens i ett enskilt svar. Detta är för närvarande en av de högsta output-gränserna i branschen.

DeepSeek v4

DeepSeek v4 är en MoE-modell på 1,6T parametrar med ett context window på 1 miljon tokens och nativt multimodalt stöd för text, bild och video till disruptiva...

Open-sourceMultimodalMixture of ExpertsReasoningLong Context

deepseekDeepSeek-V2026-04-23

Kontext

1.0Mtokens

Max utdata

384Ktokens

Inmatningspris

$1.74/ 1M

Utdatapris

$3.48/ 1M

Modalitet:TextImageAudioVideo

Kapaciteter:VisionVerktygStreamingResonemang

Benchmarks

GPQA

90.1%

HLE

48.2%

MMLU

90.1%

MMLU Pro

87.5%

SimpleQA

57.9%

IFEval

89%

AIME 2025

92%

MATH

90.2%

GSM8k

92.6%

MGSM

92%

MathVista

72%

SWE-Bench

80.6%

HumanEval

90%

LiveCodeBench

93.5%

MMMU

70%

MMMU Pro

55%

ChartQA

87%

DocVQA

92%

Terminal-Bench

67.9%

ARC-AGI

77%

Visa API-dokumentation

Om DeepSeek v4

Lar dig om DeepSeek v4s kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Högeffektiv arkitektur i biljonskala

DeepSeek v4 representerar en evolution inom Mixture-of-Experts (MoE)-design, som skalar upp till 1,6 biljoner totala parametrar med 49 miljarder aktiva parametrar. Modellen integrerar Compressed Sparse Attention (CSA) och Heavily Compressed Attention (HCA) för att hantera sitt context window på 1 miljon tokens. Dessa tekniker minskar KV cache-minnesavtrycket med 90 % jämfört med standardarkitekturer, vilket möjliggör snabbare inference och lägre hårdvarukrav för uppgifter med lång kontext.

Nativ multimodal integration

Till skillnad från modeller som använder separata vision- eller ljud-encoders är DeepSeek v4 nativt multimodal från den inledande träningsfasen. Den bearbetar text, bilder, ljud och video inom ett enhetligt ramverk. Detta tillvägagångssätt förbättrar cross-modal reasoning, vilket gör att modellen kan utföra komplexa analyser på råa videofiler och storskaliga dokumentarkiv utan att förlora detaljer.

Strategisk kostnadsdisruption

Modellen är positionerad som ett högpresterande open-source-alternativ till proprietära toppmodeller. Med prissättning på 1,74 $ per miljon input tokens bibehåller den frontier-nivå i kodning och matematik samtidigt som den avsevärt sänker de operativa kostnaderna för utvecklare. Inkluderingen av ett valfritt Thinking Mode möjliggör djup reasoning för logiska bevis och tävlingsprogrammering.

Anvandningsfall for DeepSeek v4

Upptack de olika satten du kan anvanda DeepSeek v4 for att uppna fantastiska resultat.

Storskalig refaktorisering av kodbaser

Utnyttja context window på 1 miljon tokens för att läsa in hela repositories för global feldetektering och arkitektoniska förbättringar.

Nativ videoanalys

Bearbeta råa videofiler direkt för att utföra scendetektering, transkribering och komplex visuell reasoning.

Autonoma programvaruagenter

Distribuera modellen i agentic arbetsflöden för att lösa verkliga GitHub-ärenden med en framgångsfrekvens på 80,6 % på SWE-bench.

Multimodal innehållsskapande

Generera strukturerad data och kreativt innehåll i text-, bild- och ljudformat med en enhetlig modell.

Matematiska bevis på hög nivå

Lösa matematiska problem på olympiadnivå och formella bevis med hjälp av det specialiserade Thinking Mode för djup reasoning.

Hämtning av företagskunskap

Analysera massiva dokumentarkiv i en enda prompt för att extrahera fakta utan behov av komplexa RAG-pipelines.

Styrkor

Begransningar

Hyper-effektiv long context: Minskar KV cache-avtrycket med 90 %, vilket möjliggör ett context window på 1 miljon tokens som förblir högpresterande på standardhårdvara.

Högre latency i Thinking Mode: Läget för djup reasoning ökar tiden till första token (time-to-first-token), vilket gör det mindre lämpligt för blixtsnabba konversationer.

Marknadsledande värde: Levererar intelligens i frontier-klass för 1,74 $/M tokens, vilket avsevärt understiger västerländska closed-source-konkurrenter.

Bias för hårdvaruoptimering: Tekniska rapporter tyder på att optimeringen är kraftigt anpassad för specifika kinesiska acceleratorer framför Nvidia-kluster.

Överlägsen agentic kodning: Uppnår 80,6 % på SWE-bench Verified, vilket gör den till en av de mest kapabla modellerna för autonom mjukvaruutveckling.

Faktamässiga brister: Får 57,9 % på SimpleQA, vilket tyder på att även om reasoning-förmågan är i toppklass, förblir faktamässiga hallucinationer en utmaning.

Enhetlig nativ multimodalitet: Stödjer text, vision, ljud och video i en arkitektur utan behov av externa adaptrar eller under-modeller.

Komplexa krav för KV cache: Hybrid-mekanismen HCA/CSA-attention kräver specifikt kernel-stöd för optimal lokal prestanda.

API snabbstart

deepseek/deepseek-v4-pro

Visa dokumentation

deepseek SDK

import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: 'Optimize this Rust kernel for memory efficiency.' }], }); console.log(msg.choices[0].message.content);

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om DeepSeek v4

Se vad communityt tycker om DeepSeek v4

“DeepSeek v4:s reasoning mode hittade en concurrency-bugg i min Rust-kod som till och med Claude Opus missade. Helt sjukt.”

— rust_dev_2025

“Tiden för kostnadseffektivt context window på 1 miljon är äntligen här. Vi kan nu köra refaktoriseringar av hela projekt för småpengar.”

— tech_lead_alex

twitter

“Att se modellen arbeta igenom en kodbas på 1 miljon tokens utan att tappa 'tråden' är den verkliga vändpunkten för 2026.”

— logic_fanatic

hackernews

“Anthropic och OpenAI har ett allvarligt prisproblem nu. DeepSeek gjorde precis frontier AI till en råvara.”

— CodeMaster

youtube

“Den slår GPT-5.4 i kodnings-benchmark samtidigt som den är open-source. Årets största lansering.”

— AI_Researcher_99

twitter

“Minneskomprimeringen är den verkliga magin. 1T parametrar på konsumentnära hårdvara blir äntligen verklighet.”

— GPU_Rich

Videor om DeepSeek v4

Se handledningar, recensioner och diskussioner om DeepSeek v4

“Minneseffektiviteten är den verkliga nyheten här; att minska KV cache med 90 % ändrar allt”

“Att köra en 1T-modell med denna hastighet är en enorm arkitektonisk vinst”

“Kostnaden per miljon tokens gör att små startups inte kan ignorera den”

“Jag har aldrig sett en open-source-modell hantera 1 miljon tokens så snyggt”

“Det känns som att klyftan mellan öppna och stängda modeller officiellt har stängts”

“DeepSeek konkurrerar inte längre bara på pris; de leder inom long-context reasoning”

“Det nativa videostödet är förvånansvärt robust jämfört med Gemini 2.0”

“Att installera den lokalt är förvånansvärt enkelt om du använder SGLang”

“Benchmark-tester på HumanEval visar att den i princip är i nivå med GPT-5”

“Deras context window gör RAG-pipelines nästan överflödiga för medelstora projekt”

“Prestandan i kodnings-benchmark saknar för närvarande motstycke hos andra modeller med öppen vikt”

“Den matchar eller överträffar topprankade closed-source-modeller vid refaktorisering av enorma kodbaser”

“Engram-minnesimplementeringen är ett tekniskt underverk inom detta område”

“Vi ser 90 % logik-precision i Thinking Mode för olympiad-matte”

“Den här lanseringen demokratiserar i praktiken intelligens på biljon-parameter-nivå”

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter

Webbautomatisering

Smarta arbetsfloden

Kom igang gratis

Proffs-tips for DeepSeek v4

Experttips for att hjalpa dig fa ut det mesta av DeepSeek v4 och uppna battre resultat.

Växla Thinking Mode

Använd standardläget för snabb chatt och reservera Thinking Mode specifikt för kodning och logiska bevis.

Utnyttja context caching

Använd inbyggda funktioner för context caching för att minska kostnaderna med upp till 90 % vid repetitiva prompts med lång kontext.

Direkt multimodal input

Mata in råa ljud- och videofiler direkt i API:et för att dra nytta av den nativa arkitekturen istället för att transkribera i förväg.

Optimering av system prompt

Tillhandahåll tydliga JSON-scheman eller instruktioner för verktygsanvändning i system prompten för ett mycket tillförlitligt agentic beteende.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context

$0.95/$4.00/1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Vanliga fragor om DeepSeek v4

Hitta svar pa vanliga fragor om DeepSeek v4