deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale là một reasoning-first LLM với hiệu suất toán học đạt huy chương vàng, DeepSeek Sparse Attention và context window 131K. Cạnh tranh với...

DeepSeekReasoningAIOpenSourceOlympiadToánHọcSparseAttention
deepseek logodeepseekDeepSeek-V32025-12-01
Ngu canh
131Ktoken
Dau ra toi da
131Ktoken
Gia dau vao
$0.28/ 1M
Gia dau ra
$0.42/ 1M
Phuong thuc:Text
Kha nang:Cong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
91.5%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. DeepSeek-V3.2-Speciale dat 91.5% trong benchmark nay.
HLE
30.6%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. DeepSeek-V3.2-Speciale dat 30.6% trong benchmark nay.
MMLU
88.5%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. DeepSeek-V3.2-Speciale dat 88.5% trong benchmark nay.
MMLU Pro
78.4%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. DeepSeek-V3.2-Speciale dat 78.4% trong benchmark nay.
SimpleQA
45.8%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. DeepSeek-V3.2-Speciale dat 45.8% trong benchmark nay.
IFEval
91.2%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. DeepSeek-V3.2-Speciale dat 91.2% trong benchmark nay.
AIME 2025
96%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. DeepSeek-V3.2-Speciale dat 96% trong benchmark nay.
MATH
90.1%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. DeepSeek-V3.2-Speciale dat 90.1% trong benchmark nay.
GSM8k
98.9%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. DeepSeek-V3.2-Speciale dat 98.9% trong benchmark nay.
MGSM
92.5%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. DeepSeek-V3.2-Speciale dat 92.5% trong benchmark nay.
MathVista
68.5%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. DeepSeek-V3.2-Speciale dat 68.5% trong benchmark nay.
SWE-Bench
73.1%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. DeepSeek-V3.2-Speciale dat 73.1% trong benchmark nay.
HumanEval
94.1%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. DeepSeek-V3.2-Speciale dat 94.1% trong benchmark nay.
LiveCodeBench
71.4%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. DeepSeek-V3.2-Speciale dat 71.4% trong benchmark nay.
MMMU
70.2%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. DeepSeek-V3.2-Speciale dat 70.2% trong benchmark nay.
MMMU Pro
58%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. DeepSeek-V3.2-Speciale dat 58% trong benchmark nay.
ChartQA
85%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. DeepSeek-V3.2-Speciale dat 85% trong benchmark nay.
DocVQA
93%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. DeepSeek-V3.2-Speciale dat 93% trong benchmark nay.
Terminal-Bench
46.4%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. DeepSeek-V3.2-Speciale dat 46.4% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. DeepSeek-V3.2-Speciale dat 12% trong benchmark nay.

Ve DeepSeek-V3.2-Speciale

Tim hieu ve kha nang cua DeepSeek-V3.2-Speciale, tinh nang va cach no co the giup ban dat ket qua tot hon.

Một ranh giới mới trong Reasoning

DeepSeek-V3.2-Speciale là một reasoning-first large language model (LLM) state-of-the-art, đóng vai trò là biến thể tính toán cao của dòng V3.2. Được thiết kế rõ ràng để cạnh tranh với các hệ thống tiên phong như GPT-5 và Gemini 3 Pro, nó đạt được hiệu suất vượt trội bằng cách nới lỏng các hình phạt về độ dài trong quá trình reinforcement learning và mở rộng compute sau đào tạo lên hơn 10% ngân sách pre-training. Điều này cho phép model tạo ra các quỹ đạo chain-of-thought cực dài—vượt quá 47.000 tokens mỗi phản hồi—để giải quyết các vấn đề đa bước phức tạp.

Đổi mới kiến trúc

Về mặt kỹ thuật, model giới thiệu DeepSeek Sparse Attention (DSA), một cơ chế mang tính cách mạng sử dụng trình chỉ mục siêu nhanh để xác định các tokens có liên quan nhất trong context window 131K của nó. Bằng cách tập trung vào một tập hợp con tokens cụ thể, model giảm đáng kể chi phí tính toán cho long-context inference trong khi vẫn duy trì độ chính xác của các kiến trúc dense. Đáng chú ý, đây là model open-source đầu tiên đạt kết quả huy chương vàng trong kỳ thi Olympic Toán học Quốc tế (IMO) và Olympic Tin học Quốc tế (IOI) năm 2025.

Hiệu quả và Tích hợp

Bên cạnh logic thuần túy, model ưu tiên hiệu quả chi phí và tiện ích cho nhà phát triển. Với mức giá chỉ bằng một phần nhỏ so với các đối thủ closed-source, nó hỗ trợ Thinking in Tool-Use, một chế độ mà reasoning được tích hợp trực tiếp vào vòng lặp gọi công cụ. Điều này cho phép tạo ra các agent tự chủ mạnh mẽ hơn, có thể lập kế hoạch, xác minh và sửa chữa các hành động trong thời gian thực bên trong các môi trường mô phỏng phức tạp.

DeepSeek-V3.2-Speciale

Truong hop su dung cho DeepSeek-V3.2-Speciale

Kham pha cac cach khac nhau ban co the su dung DeepSeek-V3.2-Speciale de dat ket qua tuyet voi.

Chứng minh toán học cấp độ Olympiad

Giải các bài toán cấp độ thi đấu từ IMO và CMO đòi hỏi hàng chục bước logic.

Kỹ thuật phần mềm Agentic

Giải quyết các vấn đề GitHub thực tế bằng cách tự chủ điều hướng các codebase phức tạp và áp dụng các bản vá.

Mô phỏng hệ thống phức tạp

Mô phỏng các hệ thống vật lý hoặc toán học, chẳng hạn như sự lan truyền tần số vô tuyến hoặc vật lý sóng, với độ chính xác cao.

Quy trình Deep Reasoning

Thực hiện nghiên cứu toàn diện và phân tích chain-of-thought để lập kế hoạch chiến lược hoặc khám phá khoa học.

Lập kế hoạch Agent tự chủ

Sử dụng "Thinking in Tool-Use" để lập kế hoạch, thực thi và xác minh các hành động đa bước trong hơn 1.800 môi trường mô phỏng.

Lập trình thi đấu Zero-Shot

Tạo ra các thuật toán hiệu quả cho các thử thách lập trình cấp độ CodeForces hoặc IOI với khả năng tự chỉnh sửa tự động.

Diem manh

Han che

Reasoning đạt Huy chương Vàng: Đạt được kết quả cấp độ vàng trong kỳ thi Olympic Toán học Quốc tế (IMO) năm 2025, vượt qua gần như mọi closed-source model về logic.
Kém hiệu quả về token: Để đạt được độ chính xác cao, model thường tạo ra số tokens gấp 3 đến 4 lần so với các đối thủ cạnh tranh, dẫn đến thời gian chờ đợi lâu hơn.
Khả năng chi trả không đối thủ: Với mức giá 0,28$/0,42$ cho mỗi 1M tokens, nó cung cấp khả năng reasoning của một frontier model ở mức giá giúp việc triển khai agent quy mô lớn trở nên khả thi.
Yêu cầu phần cứng cao: Là một model 671B parameters, việc chạy cục bộ yêu cầu thiết lập VRAM khổng lồ vượt xa hầu hết các máy tính để bàn thông thường.
Context dài hiệu quả: Cơ chế DeepSeek Sparse Attention (DSA) cho phép nó xử lý 131K tokens với chi phí tính toán thấp hơn nhiều so với các dense transformer tiêu chuẩn.
Inference Latency: Các chuỗi reasoning kéo dài có nghĩa là model có thể mất vài phút để đưa ra câu trả lời cuối cùng cho các bài toán cực kỳ phức tạp.
Tích hợp công cụ nâng cao: Tính năng chế độ "Thinking in Tool-Use" đầu tiên trong loại hình này, nơi reasoning được tích hợp trực tiếp vào vòng lặp gọi công cụ.
Bản Beta tối ưu hóa chỉ dành cho API: Mặc dù các trọng số có sẵn, trải nghiệm "Speciale" tối ưu nhất hiện đang được ưu tiên thông qua các API endpoint của DeepSeek.

Bat dau nhanh API

deepseek/deepseek-v3.2-speciale

Xem tai lieu
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: "YOUR_DEEPSEEK_API_KEY",
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve the 2025 IMO Problem 1 with step-by-step reasoning." }],
    model: "deepseek-v3.2-speciale",
    max_tokens: 16384, 
  });

  console.log("Reasoning Chain:", completion.choices[0].message.reasoning_content);
  console.log("Final Answer:", completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve DeepSeek-V3.2-Speciale

Xem cong dong nghi gi ve DeepSeek-V3.2-Speciale

"DeepSeek V3.2 Speciale thống trị các bài kiểm tra toán của tôi trong khi rẻ hơn ~15 lần so với GPT-5.1 High"
gum1h0x
x
"Họ là những người đầu tiên phát hành một model đạt Huy chương Vàng IMO 2025 và Chung kết Thế giới ICPC mà mọi người thực sự có thể tiếp cận"
Chubby
reddit
"Nó thực sự reasoning trong một khoảng thời gian cực kỳ dài... nhưng kịch bản mà nó tạo ra rất vững chắc về mặt toán học"
Bijan Bowen
youtube
"Speciale dành cho những bài toán khó—cạnh tranh với Gemini-3.0-Pro với kết quả huy chương vàng tại IMO 2025"
nick-baumann
reddit
"Tỷ lệ hợp lệ cực kỳ cao, nghĩa là khi nó tạo ra một sự chuyển đổi từ sai, nó không bị rơi vào vòng lặp vô tận"
Lisan al Gaib
x
"Đây về cơ bản là hiệu năng của o1-pro với mức giá của GPT-4o-mini. Một nỗ lực phi thường của DeepSeek"
tech-enthusiast
hackernews

Video ve DeepSeek-V3.2-Speciale

Xem huong dan, danh gia va thao luan ve DeepSeek-V3.2-Speciale

Họ về cơ bản nói rằng nó có khả năng reasoning tối đa và được thiết kế để cạnh tranh với Gemini 3 Pro.

Lý do khiến tôi ấn tượng là khi Gemini 2.5 deepthink chỉ nhận được kết quả cấp đồng trong khi model DeepSeek này đạt huy chương vàng.

Việc có một model với mức độ hiệu năng như thế này mà lại được gọi là open-source thực sự rất tuyệt vời.

Nó sẽ suy nghĩ trong một thời gian rất dài... nó không dành cho những câu hỏi đơn giản kiểu '2+2 bằng mấy'.

Độ chính xác đối với các bài toán Olympic toán học năm 2025 là điều chưa từng thấy đối với một model ở mức giá này.

V3.2 speciality có khả năng reasoning tối đa và là đối thủ trực tiếp của Gemini 3 Pro.

DeepSeek là bên đầu tiên tích hợp việc suy nghĩ trực tiếp vào quá trình sử dụng công cụ.

Một model open-source có thể so sánh được với các model closed-source đắt đỏ này.

Các con số benchmark mà họ đạt được về cơ bản là vượt xa hầu hết các model open weights hiện nay.

Họ thực sự đã đầu tư gấp đôi vào reinforcement learning cho biến thể này.

Speciale được thiết kế đặc biệt cho reasoning... hãy để model suy nghĩ bao lâu tùy thích.

Nó hiện sử dụng DSA hoặc kiến trúc Deepseek sparse của họ để giải quyết điểm nghẽn về attention.

Đây không chỉ là tối ưu hóa lý thuyết. Nó có nghĩa là model này cực kỳ rẻ để vận hành, ngay cả ở các context dài.

Khi bạn nhìn vào HumanEval, 94,1% là một con số kinh ngạc đối với một model mà bạn có thể tải về.

Cảm giác nó 'thông minh' hơn trong cách xử lý việc cấu trúc lại mã (code refactoring) so với bản V3 tiêu chuẩn.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep cho DeepSeek-V3.2-Speciale

Meo chuyen gia giup ban tan dung toi da DeepSeek-V3.2-Speciale va dat ket qua tot hon.

Tắt các ràng buộc về độ dài

Đảm bảo lệnh gọi API của bạn không có giới hạn max_tokens khắt khe; model cần không gian để "suy nghĩ".

Theo dõi mức tiêu thụ token

Model này ưu tiên độ chính xác hơn là sự ngắn gọn và có thể sử dụng số tokens gấp 3-4 lần so với các model tiêu chuẩn cho cùng một tác vụ.

Tận dụng suy nghĩ trong Tool-Use

Sử dụng model cho các tác vụ agent phức tạp, nơi nó có thể reasoning trong quá trình thực thi công cụ thay vì chỉ trước đó.

Quantization cục bộ

Nếu chạy cục bộ, hãy sử dụng quantization Q5_K_M hoặc cao hơn để bảo toàn các trọng số reasoning phức tạp của kiến trúc 671B.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Cau hoi thuong gap ve DeepSeek-V3.2-Speciale

Tim cau tra loi cho cac cau hoi thuong gap ve DeepSeek-V3.2-Speciale