deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale은 금메달 수준의 수학 성능, DeepSeek Sparse Attention, 131K context window를 갖춘 reasoning 특화 LLM입니다. GPT-5와 경쟁하며...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V32025년 12월 1일
컨텍스트
131K토큰
최대 출력
131K토큰
입력 가격
$0.28/ 1M
출력 가격
$0.42/ 1M
모달리티:Text
기능:도구스트리밍추론
벤치마크
GPQA
91.5%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 91.5%점을 기록했습니다.
HLE
30.6%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 30.6%점을 기록했습니다.
MMLU
88.5%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. DeepSeek-V3.2-Speciale이 이 벤치마크에서 88.5%점을 기록했습니다.
MMLU Pro
78.4%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. DeepSeek-V3.2-Speciale이 이 벤치마크에서 78.4%점을 기록했습니다.
SimpleQA
45.8%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 45.8%점을 기록했습니다.
IFEval
91.2%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 91.2%점을 기록했습니다.
AIME 2025
96%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. DeepSeek-V3.2-Speciale이 이 벤치마크에서 96%점을 기록했습니다.
MATH
90.1%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. DeepSeek-V3.2-Speciale이 이 벤치마크에서 90.1%점을 기록했습니다.
GSM8k
98.9%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. DeepSeek-V3.2-Speciale이 이 벤치마크에서 98.9%점을 기록했습니다.
MGSM
92.5%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. DeepSeek-V3.2-Speciale이 이 벤치마크에서 92.5%점을 기록했습니다.
MathVista
68.5%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 68.5%점을 기록했습니다.
SWE-Bench
73.1%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 73.1%점을 기록했습니다.
HumanEval
94.1%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. DeepSeek-V3.2-Speciale이 이 벤치마크에서 94.1%점을 기록했습니다.
LiveCodeBench
71.4%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 71.4%점을 기록했습니다.
MMMU
70.2%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. DeepSeek-V3.2-Speciale이 이 벤치마크에서 70.2%점을 기록했습니다.
MMMU Pro
58%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. DeepSeek-V3.2-Speciale이 이 벤치마크에서 58%점을 기록했습니다.
ChartQA
85%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 85%점을 기록했습니다.
DocVQA
93%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. DeepSeek-V3.2-Speciale이 이 벤치마크에서 93%점을 기록했습니다.
Terminal-Bench
46.4%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 46.4%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. DeepSeek-V3.2-Speciale이 이 벤치마크에서 12%점을 기록했습니다.

DeepSeek-V3.2-Speciale 소개

DeepSeek-V3.2-Speciale의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

고연산 reasoning에 집중

DeepSeek-V3.2-Speciale은 6,850억 개의 parameter를 가진 Mixture-of-Experts 언어 모델입니다. 토큰당 370억 개의 parameter를 활성화하여 성능과 효율성 사이의 균형을 맞췄습니다. 이 모델은 상당한 내부 reasoning을 요구하는 다단계 문제를 해결하도록 설계되었습니다. 사전 학습 예산의 10% 이상을 사후 학습 연산에 할애함으로써, 응답당 47,000 토큰을 초과하는 긴 chain-of-thought 궤적을 생성합니다. 이는 복잡한 논리 증명 및 기술 연구를 탐색하는 데 적합합니다.

Sparse Attention 아키텍처

이 모델은 DeepSeek Sparse Attention(DSA)을 사용하여 131,072-token context window를 관리합니다. 이 메커니즘은 라이트닝 인덱서를 통해 가장 관련성 높은 토큰을 선별하여, 기존 dense long-context 시스템에서 발생하는 계산 부담을 줄여줍니다. 낮은 오버헤드로 논리적 일관성을 유지하며, 넓은 멀티모달 유연성보다 reasoning 깊이를 우선시하는 고연산 환경을 목표로 합니다.

기술 및 학술 성능

Speciale은 2025년 국제 수학 올림피아드(IMO)에서 금메달 수준의 결과를 달성한 최초의 open-weights 모델입니다. AIME 2025 및 HumanEval과 같은 기술적 benchmark에서 탁월하며, 순수 논리 작업에서는 상용 시스템과 종종 어깨를 나란히 합니다. 개발자들은 복잡한 코드베이스 생성이나 방대한 기술 문서 합성 작업에 이 모델을 활용할 수 있습니다. MIT 라이선스로 배포되어 오픈소스 커뮤니티 전반에서 폭넓게 사용될 수 있습니다.

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale 사용 사례

DeepSeek-V3.2-Speciale을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

수학적 증명 생성

높은 인지적 깊이를 요구하는 올림피아드 수준의 수학적 증명 및 기호 논리 문제 해결.

소프트웨어 아키텍처 설계

tool-use 없이 구조적 의존성을 추론하여 복잡한 다중 파일 소프트웨어 아키텍처 생성.

기술 문서 합성

131K context window 내에서 방대한 기술 논문들의 통찰을 분석하고 교차 참조.

합성 데이터 제작

논리가 풍부한 고품질 학습 데이터셋을 생성하여 소형화된 특수 AI 모델에 논리력을 증류(distill).

과학 분야 심층 연구

방대한 학술 문헌을 검토 및 합성하여 STEM 분야의 미묘한 논리적 전개 과정을 추출.

자율 에이전트 계획

시뮬레이션 환경에서 AI 에이전트를 위한 복잡한 다단계 계획 및 전략 수립.

강점

제한

최상위 수학 성능: AIME 2025에서 96% 달성 및 IMO 국제 대회에서 금메달 수준의 성과 기록.
네이티브 멀티모달 기능 부재: 이미지나 오디오 처리 능력이 없어 텍스트 기반 데이터로 사용이 제한됨.
방대한 사고(Thinking) 예산: 심층적인 논리 탐구를 위해 47,000 토큰을 초과하는 사고 궤적 생성.
비활성화된 tool-calling: 함수 호출을 지원하지 않아 자율적인 API 상호작용 측면에서는 유용성이 낮음.
DSA 효율성: DeepSeek Sparse Attention 메커니즘을 통해 dense 모델보다 낮은 연산 비용으로 128K context 처리.
inference latency: 사고 모드 작동 시 복잡한 논리 증명에 수 분의 대기 시간이 발생할 수 있음.
비용 효율성: 100만 토큰당 $0.28의 비용으로 frontier 수준의 reasoning을 제공하여 상용 모델 대비 대폭 저렴.
호스팅 요구 사항: 6,850억 개의 parameter MoE 아키텍처로 인해 기업급 GPU 클러스터가 필요함.

API 빠른 시작

deepseek/deepseek-v3.2-speciale

문서 보기
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "복소 평면에서 e^z = -1을 만족하는 x를 구하세요." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

DeepSeek-V3.2-Speciale에 대한 사람들의 의견

커뮤니티가 DeepSeek-V3.2-Speciale에 대해 어떻게 생각하는지 확인하세요

DeepSeek-V3.2-Speciale은 괴물입니다. Gemini 3 Pro와 경쟁하는 극대화된 reasoning을 보여줍니다.
OpenRouter
twitter
HumanEval 점수는 진짜입니다. 이번 달에 테스트한 많은 상용 모델보다 훨씬 깔끔한 코드를 작성합니다.
dev_guru_99
reddit
가격은 정말 미쳤네요. OpenAI나 Anthropic 비용의 일부만으로 frontier 수준의 reasoning을 사용할 수 있다니.
AI_Builder_X
twitter
open-weight 모델이 탑 3 연구소 모델에 도전하는 모습을 보니 반갑습니다. 아키텍처 선택이 아주 훌륭하네요.
binary_explorer
hackernews

DeepSeek-V3.2-Speciale에 대한 동영상

DeepSeek-V3.2-Speciale에 대한 튜토리얼, 리뷰 및 토론 시청

엄청난 시간 동안 사고합니다... 진정한 deep reasoner입니다.

DeepSeek 모델은 [IMO에서] 금메달을 땄지만 Deepthink는 동메달에 그쳤습니다.

이 모델이 어떻게 작동하는지 보는 것만으로도 교육적으로 매우 가치 있습니다.

여기서 보여주는 논리는 표준 모델들과 비교할 때 차원이 다릅니다.

모델이 실패를 반복하며 해결책을 찾아가는 과정을 실제로 볼 수 있습니다.

Special은 사실 deep think를 의미합니다. 심층 사고 모드가 포함되어 있죠.

63초 동안 생각하는데... 정말 놀랍습니다.

매우 똑똑하네요... 정말 고급 코드를 작성해 냅니다.

이걸 로컬에서 스케일링하는 것이 사용자에게는 가장 큰 걸림돌이 될 것입니다.

대부분의 플랫폼에서 reasoning 토큰은 별도로 청구됩니다.

Special은 괴물입니다. 극대화된 reasoning, 깊은 chain-of-thought가 특징이죠.

Special은 deep reasoning, 다단계 증명, 복잡한 연구를 위해 설계되었습니다.

DeepSeek의 투명성은 엄청난 장점입니다... 작업 과정을 볼 수 있으니까요.

Gemini보다 훨씬 긴 응답에서도 일관성을 유지합니다.

Sparse Attention 기술이 바로 가격을 이 정도로 낮게 유지할 수 있는 비결입니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

DeepSeek-V3.2-Speciale 프로 팁

DeepSeek-V3.2-Speciale을 최대한 활용하기 위한 전문가 팁.

샘플링 parameters 최적화

고도의 논리가 필요한 작업에서는 temperature를 1.0으로, top_p를 0.95로 설정하여 deep reasoning 경로가 다양하게 유지되도록 하세요.

기술적 세부 정보 제공

지침을 markdown 형식으로 구성하면 모델이 내부 chain-of-thought 프로세스를 더 잘 체계화하는 데 도움이 됩니다.

생각할 시간 확보

모델이 방대한 내부 사고 체인을 생성하므로 복잡한 증명 작업 시 더 높은 latency가 발생할 수 있습니다.

전용 엔드포인트 사용

고성능 reasoning 변형 모델에 액세스하려면 구성에서 'speciale' API 경로를 명시하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

DeepSeek-V3.2-Speciale에 대한 자주 묻는 질문

DeepSeek-V3.2-Speciale에 대한 일반적인 질문에 대한 답변 찾기