deepseek

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale là một LLM ưu tiên suy luận với hiệu suất toán học đạt huy chương vàng, DeepSeek Sparse Attention và 131K context window. Đối thủ cạnh...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention
deepseek logodeepseekDeepSeek-V31 tháng 12, 2025
Ngu canh
131Ktoken
Dau ra toi da
131Ktoken
Gia dau vao
$0.28/ 1M
Gia dau ra
$0.42/ 1M
Phuong thuc:Text
Kha nang:Cong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
91.5%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. DeepSeek-V3.2-Speciale dat 91.5% trong benchmark nay.
HLE
30.6%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. DeepSeek-V3.2-Speciale dat 30.6% trong benchmark nay.
MMLU
88.5%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. DeepSeek-V3.2-Speciale dat 88.5% trong benchmark nay.
MMLU Pro
78.4%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. DeepSeek-V3.2-Speciale dat 78.4% trong benchmark nay.
SimpleQA
45.8%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. DeepSeek-V3.2-Speciale dat 45.8% trong benchmark nay.
IFEval
91.2%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. DeepSeek-V3.2-Speciale dat 91.2% trong benchmark nay.
AIME 2025
96%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. DeepSeek-V3.2-Speciale dat 96% trong benchmark nay.
MATH
90.1%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. DeepSeek-V3.2-Speciale dat 90.1% trong benchmark nay.
GSM8k
98.9%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. DeepSeek-V3.2-Speciale dat 98.9% trong benchmark nay.
MGSM
92.5%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. DeepSeek-V3.2-Speciale dat 92.5% trong benchmark nay.
MathVista
68.5%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. DeepSeek-V3.2-Speciale dat 68.5% trong benchmark nay.
SWE-Bench
73.1%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. DeepSeek-V3.2-Speciale dat 73.1% trong benchmark nay.
HumanEval
94.1%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. DeepSeek-V3.2-Speciale dat 94.1% trong benchmark nay.
LiveCodeBench
71.4%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. DeepSeek-V3.2-Speciale dat 71.4% trong benchmark nay.
MMMU
70.2%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. DeepSeek-V3.2-Speciale dat 70.2% trong benchmark nay.
MMMU Pro
58%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. DeepSeek-V3.2-Speciale dat 58% trong benchmark nay.
ChartQA
85%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. DeepSeek-V3.2-Speciale dat 85% trong benchmark nay.
DocVQA
93%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. DeepSeek-V3.2-Speciale dat 93% trong benchmark nay.
Terminal-Bench
46.4%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. DeepSeek-V3.2-Speciale dat 46.4% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. DeepSeek-V3.2-Speciale dat 12% trong benchmark nay.

Ve DeepSeek-V3.2-Speciale

Tim hieu ve kha nang cua DeepSeek-V3.2-Speciale, tinh nang va cach no co the giup ban dat ket qua tot hon.

Tập trung vào suy luận tính toán cao

DeepSeek-V3.2-Speciale là một ngôn ngữ model Mixture-of-Experts với 685 tỷ parameters. Nó kích hoạt 37 tỷ parameters cho mỗi token để cân bằng giữa hiệu suất và hiệu quả. Biến thể này được thiết kế để giải quyết các vấn đề nhiều bước đòi hỏi sự suy luận nội bộ đáng kể. Bằng cách mở rộng tính toán sau huấn luyện lên hơn 10% ngân sách pre-training, model tạo ra các chuỗi chain-of-thought dài vượt quá 47.000 tokens mỗi phản hồi. Điều này làm cho nó phù hợp để điều hướng các bài chứng minh logic phức tạp và nghiên cứu kỹ thuật.

Kiến trúc Sparse Attention

Model sử dụng DeepSeek Sparse Attention (DSA) để quản lý 131.072-token context window. Cơ chế này sử dụng một bộ lập chỉ mục nhanh để cô lập các tokens phù hợp nhất, giảm gánh nặng tính toán thường thấy trong các hệ thống context dài dày đặc. Nó duy trì logic trong khi hoạt động với chi phí thấp hơn. Kiến trúc này đặc biệt nhắm vào các môi trường tính toán cao, nơi chiều sâu suy luận được ưu tiên hơn tính linh hoạt đa phương thức rộng rãi.

Hiệu suất kỹ thuật và học thuật

Speciale là model open-weights đầu tiên đạt kết quả cấp huy chương vàng trong kỳ thi Olympic Toán học Quốc tế (IMO) 2025. Nó vượt trội trong các benchmark kỹ thuật như AIME 2025 và HumanEval, thường ngang bằng với các hệ thống thương mại trong các tác vụ logic thuần túy. Các lập trình viên có thể sử dụng nó để tạo ra các codebase phức tạp hoặc tổng hợp tài liệu kỹ thuật chuyên sâu. Model được phát hành theo giấy phép MIT, tạo điều kiện thuận lợi cho việc sử dụng rộng rãi trong cộng đồng open-source.

DeepSeek-V3.2-Speciale

Truong hop su dung cho DeepSeek-V3.2-Speciale

Kham pha cac cach khac nhau ban co the su dung DeepSeek-V3.2-Speciale de dat ket qua tuyet voi.

Tạo chứng minh toán học

Giải các bài chứng minh toán học cấp độ olympiad và các vấn đề logic biểu tượng đòi hỏi chiều sâu nhận thức cao.

Thiết kế kiến trúc phần mềm

Tạo ra các kiến trúc phần mềm phức tạp, đa tệp tin bằng cách suy luận qua các phụ thuộc cấu trúc mà không cần sử dụng tool.

Tổng hợp tài liệu kỹ thuật

Phân tích và đối chiếu thông tin chuyên sâu trên các bài báo kỹ thuật đồ sộ trong phạm vi 131K context window.

Sản xuất dữ liệu tổng hợp (Synthetic Data)

Tạo các bộ dữ liệu huấn luyện giàu khả năng suy luận chất lượng cao để tinh chỉnh (distill) logic vào các model AI nhỏ hơn, chuyên biệt hơn.

Nghiên cứu khoa học chuyên sâu

Xem xét và tổng hợp các tài liệu học thuật dày đặc để trích xuất sự tiến triển logic tinh tế trong các lĩnh vực STEM.

Lập kế hoạch cho agent tự chủ

Điều hướng việc lập kế hoạch nhiều bước phức tạp và phát triển chiến lược cho các agentic AI trong môi trường mô phỏng.

Diem manh

Han che

Hiệu suất toán học ưu tú: Đạt 96% trong AIME 2025 và các kết quả huy chương vàng trong cuộc thi IMO quốc tế.
Không có tính đa phương thức (Multimodality) bản địa: Thiếu khả năng xử lý hình ảnh hoặc âm thanh, hạn chế việc sử dụng chỉ với dữ liệu dựa trên văn bản.
Ngân sách suy nghĩ khổng lồ: Tạo ra các quỹ đạo tư duy vượt quá 47.000 tokens cho việc khám phá logic chuyên sâu.
Vô hiệu hóa Tool Calling: Không hỗ trợ gọi hàm, hạn chế tiện ích cho việc tương tác API tự chủ.
Hiệu quả DSA: Cơ chế DeepSeek Sparse Attention xử lý 131K context với chi phí tính toán thấp hơn so với các model dày đặc (dense model).
Inference Latency: Các chế độ tư duy có thể gây ra thời gian chờ đợi lên đến vài phút đối với các chứng minh logic phức tạp.
Lợi thế chi phí: Cung cấp khả năng suy luận cấp độ frontier với giá $0.28 mỗi triệu tokens, rẻ hơn đáng kể so với các đối thủ thương mại.
Yêu cầu hosting: Yêu cầu các cụm GPU cấp doanh nghiệp do kiến trúc MoE 685 tỷ parameters của nó.

Bat dau nhanh API

deepseek/deepseek-v3.2-speciale

Xem tai lieu
deepseek SDK
import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve for x in the complex plane: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve DeepSeek-V3.2-Speciale

Xem cong dong nghi gi ve DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale là một con quái vật. Khả năng suy luận tối đa sánh ngang với Gemini 3 Pro.
OpenRouter
twitter
Điểm HumanEval là thật. Nó viết code sạch hơn nhiều model thương mại mà tôi đã thử nghiệm trong tháng này.
dev_guru_99
reddit
Giá cả thực sự điên rồ. Suy luận cấp độ frontier với chi phí chỉ bằng một phần nhỏ so với OpenAI hoặc Anthropic.
AI_Builder_X
twitter
Thật mới mẻ khi thấy một model open-weights thực sự thách thức 3 phòng thí nghiệm hàng đầu. Các lựa chọn kiến trúc ở đây rất xuất sắc.
binary_explorer
hackernews

Video ve DeepSeek-V3.2-Speciale

Xem huong dan, danh gia va thao luan ve DeepSeek-V3.2-Speciale

Nó suy luận trong một khoảng thời gian điên rồ... nó là một bộ suy luận cực kỳ sâu sắc.

Model DeepSeek đạt huy chương vàng [trong IMO] trong khi Deepthink chỉ đạt huy chương đồng.

Theo dõi những gì nó làm có thể cực kỳ có giá trị về mặt giáo dục.

Logic ở đây ở một cấp độ khác so với các model tiêu chuẩn.

Bạn thực sự có thể thấy model lặp lại qua các thất bại.

Tất cả những gì 'speciale' thực sự có nghĩa là suy nghĩ sâu. Nó có chế độ suy nghĩ sâu.

Nó suy nghĩ trong 63 giây... điều đó thật tuyệt vời.

Nó rất thông minh ở đó... đưa ra một số code thực sự tiên tiến.

Scaling cái này cục bộ sẽ là rào cản lớn nhất đối với người dùng.

Các reasoning tokens được tính phí khác biệt trên hầu hết các nền tảng.

Speciale là một con quái vật. Suy luận tối đa, chain of thought sâu sắc.

Speciale được thiết kế để suy luận sâu, các bài chứng minh nhiều bước, nghiên cứu phức tạp.

Tính minh bạch của DeepSeek là một lợi thế to lớn... nhìn thấy cách nó làm việc.

Nó duy trì sự mạch lạc trên các phản hồi dài hơn nhiều so với Gemini.

Công nghệ Sparse Attention là cách họ giữ mức giá thấp như vậy.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho DeepSeek-V3.2-Speciale

Meo chuyen gia giup ban tan dung toi da DeepSeek-V3.2-Speciale va dat ket qua tot hon.

Tối ưu hóa các tham số lấy mẫu (Sampling Parameters)

Đặt temperature là 1.0 và top_p là 0.95 cho các tác vụ đòi hỏi logic cao để đảm bảo các lộ trình suy luận sâu luôn đa dạng.

Cung cấp thông tin kỹ thuật chi tiết

Cấu trúc các chỉ dẫn bằng markdown để giúp model sắp xếp tốt hơn quá trình chain-of-thought nội bộ của nó.

Dành thời gian cho suy nghĩ

Hãy dự kiến latency cao hơn trong các bài chứng minh phức tạp vì model tạo ra các chuỗi tư duy nội bộ khổng lồ.

Sử dụng Endpoint chuyên dụng

Chỉ định đường dẫn API 'speciale' trong cấu hình của bạn để truy cập biến thể suy luận tính toán cao này.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Cau hoi thuong gap ve DeepSeek-V3.2-Speciale

Tim cau tra loi cho cac cau hoi thuong gap ve DeepSeek-V3.2-Speciale