deepseek

DeepSeek v4

DeepSeek v4는 1.6T parameter MoE model로, 100만 token context window와 텍스트, 비전, 비디오를 위한 native multimodal 지원을 혁신적인 가격에 제공합니다.

Open SourceMultimodalMixture of ExpertsReasoningLong Context
deepseek logodeepseekDeepSeek-V2026-04-23
컨텍스트
1.0M토큰
최대 출력
384K토큰
입력 가격
$1.74/ 1M
출력 가격
$3.48/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
90.1%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. DeepSeek v4이 이 벤치마크에서 90.1%점을 기록했습니다.
HLE
48.2%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. DeepSeek v4이 이 벤치마크에서 48.2%점을 기록했습니다.
MMLU
90.1%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. DeepSeek v4이 이 벤치마크에서 90.1%점을 기록했습니다.
MMLU Pro
87.5%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. DeepSeek v4이 이 벤치마크에서 87.5%점을 기록했습니다.
SimpleQA
57.9%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. DeepSeek v4이 이 벤치마크에서 57.9%점을 기록했습니다.
IFEval
89%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. DeepSeek v4이 이 벤치마크에서 89%점을 기록했습니다.
AIME 2025
92%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. DeepSeek v4이 이 벤치마크에서 92%점을 기록했습니다.
MATH
90.2%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. DeepSeek v4이 이 벤치마크에서 90.2%점을 기록했습니다.
GSM8k
92.6%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. DeepSeek v4이 이 벤치마크에서 92.6%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. DeepSeek v4이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
72%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. DeepSeek v4이 이 벤치마크에서 72%점을 기록했습니다.
SWE-Bench
80.6%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. DeepSeek v4이 이 벤치마크에서 80.6%점을 기록했습니다.
HumanEval
90%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. DeepSeek v4이 이 벤치마크에서 90%점을 기록했습니다.
LiveCodeBench
93.5%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. DeepSeek v4이 이 벤치마크에서 93.5%점을 기록했습니다.
MMMU
70%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. DeepSeek v4이 이 벤치마크에서 70%점을 기록했습니다.
MMMU Pro
55%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. DeepSeek v4이 이 벤치마크에서 55%점을 기록했습니다.
ChartQA
87%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. DeepSeek v4이 이 벤치마크에서 87%점을 기록했습니다.
DocVQA
92%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. DeepSeek v4이 이 벤치마크에서 92%점을 기록했습니다.
Terminal-Bench
67.9%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. DeepSeek v4이 이 벤치마크에서 67.9%점을 기록했습니다.
ARC-AGI
77%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. DeepSeek v4이 이 벤치마크에서 77%점을 기록했습니다.

DeepSeek v4 소개

DeepSeek v4의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

고효율 조 단위 architecture

DeepSeek v4는 Mixture-of-Experts (MoE) 설계의 진화를 보여주며, 490억 개의 활성 parameter와 함께 총 1.6조 개의 parameter로 확장되었습니다. 이 model은 Compressed Sparse Attention (CSA)과 Heavily Compressed Attention (HCA)을 통합하여 100만 token context window를 관리합니다. 이러한 기술들은 표준 아키텍처 대비 KV cache 메모리 점유율을 90% 절감하여, 긴 context 작업에서 더 빠른 inference와 낮은 하드웨어 요구사항을 가능하게 합니다.

Native Multimodal 통합

별도의 비전이나 오디오 encoder를 사용하는 모델들과 달리, DeepSeek v4는 학습 초기부터 natively multimodal로 설계되었습니다. 단일 통합 프레임워크 내에서 텍스트, 이미지, 오디오, 비디오를 처리합니다. 이러한 접근 방식은 cross-modal reasoning을 향상시켜, 세부 정보를 잃지 않고 원본 비디오 파일 및 대규모 문서 아카이브에 대한 복잡한 분석을 수행할 수 있게 합니다.

전략적 비용 파괴

이 model은 고성능의 open-source 대안으로 자리매김했습니다. 100만 입력 token당 $1.74라는 가격으로, 개발자의 운영 비용을 크게 낮추면서도 코딩 및 수학 분야에서 frontier급 성능을 유지합니다. 선택 가능한 Thinking Mode를 통해 논리 증명 및 프로그래밍 경진대회를 위한 깊이 있는 reasoning을 지원합니다.

DeepSeek v4

DeepSeek v4 사용 사례

DeepSeek v4을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

대규모 codebase 리팩토링

100만 context window를 활용하여 전체 저장소를 ingest하고 전역적인 버그 탐지 및 구조적 개선을 수행합니다.

Native 비디오 분석

원본 비디오 파일을 직접 처리하여 장면 탐지, 스크립트 생성, 복잡한 시각적 reasoning을 수행합니다.

자율형 소프트웨어 agent

agentic 워크플로우에 model을 배포하여 SWE-bench에서 80.6%의 성공률로 실제 GitHub 문제를 해결합니다.

Multi-Modal 콘텐츠 제작

통합된 model을 사용하여 텍스트, 이미지, 오디오 형식 전반에 걸쳐 구조화된 데이터와 창의적인 콘텐츠를 생성합니다.

고난도 수학 증명

심층 reasoning을 위한 특화된 Thinking Mode를 사용하여 올림피아드 수준의 수학 문제와 공식 증명을 해결합니다.

엔터프라이즈 지식 검색

복잡한 RAG 파이프라인 없이도 단일 prompt 내에서 방대한 문서 아카이브를 분석하여 사실을 추출합니다.

강점

제한

초효율적 Long Context: KV cache 점유율을 90% 줄여 표준 하드웨어에서도 100만 context window가 고성능으로 작동하게 합니다.
더 높은 Thinking Mode Latency: 심층 reasoning 모드는 time-to-first-token을 증가시켜 매우 빠른 응답이 필요한 대화에는 덜 적합할 수 있습니다.
업계 최고 수준의 가성비: 100만 token당 $1.74의 가격으로 frontier급 지능을 제공하며, 서구권의 closed-source 경쟁사들보다 현저히 저렴합니다.
하드웨어 최적화 편향: 기술 보고서에 따르면 최적화가 Nvidia 클러스터보다는 특정 중국산 가속기에 맞춰져 있을 가능성이 있습니다.
최정상급 Agentic 코딩: SWE-bench Verified에서 80.6%를 달성하여 자율 소프트웨어 엔지니어링을 위한 가장 뛰어난 model 중 하나입니다.
사실관계 오류(Factuality Gaps): SimpleQA에서 57.9%의 점수를 기록했는데, 이는 reasoning 능력은 뛰어나지만 사실관계 환각(hallucination)이 여전히 과제임을 나타냅니다.
통합 Native Multimodality: 외부 어댑터나 sub-model 없이 단일 아키텍처에서 텍스트, 시각, 오디오, 비디오를 모두 지원합니다.
복잡한 KV Cache 요구사항: 하이브리드 HCA/CSA attention 메커니즘을 최적으로 로컬에서 실행하려면 특정 커널 지원이 필요합니다.

API 빠른 시작

deepseek/deepseek-v4-pro

문서 보기
deepseek SDK
import OpenAI from 'openai';  const deepseek = new OpenAI({   baseURL: 'https://api.deepseek.com',   apiKey: process.env.DEEPSEEK_API_KEY, });  const msg = await deepseek.chat.completions.create({   model: 'deepseek-v4-pro',   messages: [{ role: 'user', content: '이 Rust 커널을 메모리 효율성을 위해 최적화해 줘.' }], }); console.log(msg.choices[0].message.content);

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

DeepSeek v4에 대한 사람들의 의견

커뮤니티가 DeepSeek v4에 대해 어떻게 생각하는지 확인하세요

DeepSeek v4의 reasoning 모드가 제 Rust 코드에서 Claude Opus조차 놓친 동시성 버그를 찾아냈습니다. 정말 미쳤네요.
rust_dev_2025
reddit
비용 효율적인 100만 context 시대가 마침내 왔습니다. 이제 프로젝트 전체 리팩토링을 저렴하게 실행할 수 있습니다.
tech_lead_alex
twitter
100만 token codebase에서 'needle(바늘)'을 잃어버리지 않고 작업하는 것을 보는 것은 2026년의 진정한 전환점입니다.
logic_fanatic
hackernews
Anthropic과 OpenAI는 이제 심각한 가격 경쟁 문제를 겪게 될 것입니다. DeepSeek가 frontier AI를 상품화했습니다.
CodeMaster
youtube
open source이면서 코딩 벤치마크에서 GPT-5.4를 이기다니, 올해 가장 큰 발표입니다.
AI_Researcher_99
twitter
메모리 압축이 진짜 마법입니다. 일반 소비자용 하드웨어에서 1T parameter를 돌리는 것이 드디어 현실이 되고 있습니다.
GPU_Rich
reddit

DeepSeek v4에 대한 동영상

DeepSeek v4에 대한 튜토리얼, 리뷰 및 토론 시청

메모리 효율성이 핵심입니다. KV cache를 90% 줄인 것은 모든 것을 바꿉니다

이 속도로 1T model을 구동하는 것은 거대한 아키텍처적 승리입니다

100만 token당 가격은 소규모 스타트업이 무시하기 어렵게 만듭니다

100만 token을 이렇게 깔끔하게 처리하는 open-source model은 처음 봅니다

open model과 closed model 사이의 격차가 공식적으로 사라진 느낌입니다

DeepSeek는 더 이상 가격 경쟁만 하는 것이 아닙니다. long-context reasoning을 주도하고 있습니다

native 비디오 지원은 Gemini 2.0과 비교해도 놀랍도록 견고합니다

SGLang을 사용하면 로컬 설치가 놀라울 정도로 쉽습니다

HumanEval 벤치마크를 보면 기본적으로 GPT-5와 동등한 수준입니다

이 context window 덕분에 중간 규모 프로젝트에서 RAG 파이프라인이 거의 불필요해졌습니다

코딩 벤치마크 성능은 현재 그 어떤 open-weight model도 따라올 수 없습니다

대규모 codebase 리팩토링에서 최고급 closed model과 대등하거나 능가합니다

engram 메모리 구현은 이 분야의 기술적 경이로움입니다

Thinking Mode를 사용한 올림피아드 수학에서 90%의 논리 정확도를 보여줍니다

이번 출시는 조 단위 parameter 지능을 효과적으로 대중화했습니다

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

DeepSeek v4 프로 팁

DeepSeek v4을 최대한 활용하기 위한 전문가 팁.

Thinking Mode 전환

빠른 대화에는 표준 모드를 사용하고, 코딩 및 논리 증명에는 Thinking Mode를 전용으로 사용하세요.

Context Caching 활용

내장된 context caching 기능을 활용하여 반복적인 long-context prompt 사용 시 비용을 최대 90%까지 절감하세요.

직접적인 Multimodal 입력

사전 전사(transcription) 과정 없이 원본 오디오 및 비디오 파일을 API에 직접 입력하여 native architecture의 이점을 누리세요.

System Prompt 최적화

안정적인 agentic 동작을 위해 system prompt에 명확한 JSON 스키마나 tool-use 지침을 제공하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

DeepSeek v4에 대한 자주 묻는 질문

DeepSeek v4에 대한 일반적인 질문에 대한 답변 찾기