Mức giá của DeepSeek-V3.2-Speciale là bao nhiêu?

Mức giá là $0.28 cho mỗi 1 triệu input tokens và $0.42 cho mỗi 1 triệu output tokens. Điều này phản ánh mục tiêu của DeepSeek trong việc cung cấp quyền truy cập chi phí thấp vào trí tuệ cấp độ frontier.

Model này có hỗ trợ đầu vào dạng hình ảnh hay thị giác không?

Không, phiên bản Speciale là một model chỉ xử lý văn bản, tập trung vào logic và suy luận toán học. Nó không xử lý hình ảnh hoặc video.

Context window lớn đến mức nào?

Model hỗ trợ context window lên tới 131.072 tokens. Điều này cho phép nó xử lý khoảng 192 trang văn bản A4 trong một prompt duy nhất.

Tôi có thể sử dụng tool calling với model Speciale không?

Không, tính năng tool-calling đã bị vô hiệu hóa trên phiên bản Speciale để tối đa hóa khả năng suy luận thô. Người dùng cần sử dụng tool nên dùng model V3.2 tiêu chuẩn.

Nó so sánh thế nào với GPT-5?

Nó ngang bằng hoặc vượt trội hơn GPT-5 trong các benchmark cụ thể về suy luận và toán học, chẳng hạn như AIME 2025. Ưu điểm chính của nó là cung cấp logic tương đương với chi phí thấp hơn.

Đây có phải là model open-weights không?

Có, DeepSeek-V3.2-Speciale là một model open-weights được phát hành theo giấy phép MIT. Điều này cho phép tải xuống và triển khai công khai.

Giới hạn đầu ra tối đa là bao nhiêu?

Model có thể tạo ra hơn 47.000 tokens trong một phản hồi duy nhất. Điều này được sử dụng đặc biệt cho các phiên tư duy mở rộng và suy luận chuyên sâu.

DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale là một LLM ưu tiên suy luận với hiệu suất toán học đạt huy chương vàng, DeepSeek Sparse Attention và 131K context window. Đối thủ cạnh...

DeepSeekReasoningAIOpenSourceMathOlympiadSparseAttention

deepseekDeepSeek-V31 tháng 12, 2025

Ngu canh

131Ktoken

Dau ra toi da

131Ktoken

Gia dau vao

$0.28/ 1M

Gia dau ra

$0.42/ 1M

Phuong thuc:Text

Kha nang:Cong cuTruyen truc tiepSuy luan

Diem chuan

GPQA

91.5%

HLE

30.6%

MMLU

88.5%

MMLU Pro

78.4%

SimpleQA

45.8%

IFEval

91.2%

AIME 2025

96%

MATH

90.1%

GSM8k

98.9%

MGSM

92.5%

MathVista

68.5%

SWE-Bench

73.1%

HumanEval

94.1%

LiveCodeBench

71.4%

MMMU

70.2%

MMMU Pro

58%

ChartQA

85%

DocVQA

93%

Terminal-Bench

46.4%

ARC-AGI

12%

Xem tai lieu API

Ve DeepSeek-V3.2-Speciale

Tim hieu ve kha nang cua DeepSeek-V3.2-Speciale, tinh nang va cach no co the giup ban dat ket qua tot hon.

Tập trung vào suy luận tính toán cao

DeepSeek-V3.2-Speciale là một ngôn ngữ model Mixture-of-Experts với 685 tỷ parameters. Nó kích hoạt 37 tỷ parameters cho mỗi token để cân bằng giữa hiệu suất và hiệu quả. Biến thể này được thiết kế để giải quyết các vấn đề nhiều bước đòi hỏi sự suy luận nội bộ đáng kể. Bằng cách mở rộng tính toán sau huấn luyện lên hơn 10% ngân sách pre-training, model tạo ra các chuỗi chain-of-thought dài vượt quá 47.000 tokens mỗi phản hồi. Điều này làm cho nó phù hợp để điều hướng các bài chứng minh logic phức tạp và nghiên cứu kỹ thuật.

Kiến trúc Sparse Attention

Model sử dụng DeepSeek Sparse Attention (DSA) để quản lý 131.072-token context window. Cơ chế này sử dụng một bộ lập chỉ mục nhanh để cô lập các tokens phù hợp nhất, giảm gánh nặng tính toán thường thấy trong các hệ thống context dài dày đặc. Nó duy trì logic trong khi hoạt động với chi phí thấp hơn. Kiến trúc này đặc biệt nhắm vào các môi trường tính toán cao, nơi chiều sâu suy luận được ưu tiên hơn tính linh hoạt đa phương thức rộng rãi.

Hiệu suất kỹ thuật và học thuật

Speciale là model open-weights đầu tiên đạt kết quả cấp huy chương vàng trong kỳ thi Olympic Toán học Quốc tế (IMO) 2025. Nó vượt trội trong các benchmark kỹ thuật như AIME 2025 và HumanEval, thường ngang bằng với các hệ thống thương mại trong các tác vụ logic thuần túy. Các lập trình viên có thể sử dụng nó để tạo ra các codebase phức tạp hoặc tổng hợp tài liệu kỹ thuật chuyên sâu. Model được phát hành theo giấy phép MIT, tạo điều kiện thuận lợi cho việc sử dụng rộng rãi trong cộng đồng open-source.

Truong hop su dung cho DeepSeek-V3.2-Speciale

Kham pha cac cach khac nhau ban co the su dung DeepSeek-V3.2-Speciale de dat ket qua tuyet voi.

Tạo chứng minh toán học

Giải các bài chứng minh toán học cấp độ olympiad và các vấn đề logic biểu tượng đòi hỏi chiều sâu nhận thức cao.

Thiết kế kiến trúc phần mềm

Tạo ra các kiến trúc phần mềm phức tạp, đa tệp tin bằng cách suy luận qua các phụ thuộc cấu trúc mà không cần sử dụng tool.

Tổng hợp tài liệu kỹ thuật

Phân tích và đối chiếu thông tin chuyên sâu trên các bài báo kỹ thuật đồ sộ trong phạm vi 131K context window.

Sản xuất dữ liệu tổng hợp (Synthetic Data)

Tạo các bộ dữ liệu huấn luyện giàu khả năng suy luận chất lượng cao để tinh chỉnh (distill) logic vào các model AI nhỏ hơn, chuyên biệt hơn.

Nghiên cứu khoa học chuyên sâu

Xem xét và tổng hợp các tài liệu học thuật dày đặc để trích xuất sự tiến triển logic tinh tế trong các lĩnh vực STEM.

Lập kế hoạch cho agent tự chủ

Điều hướng việc lập kế hoạch nhiều bước phức tạp và phát triển chiến lược cho các agentic AI trong môi trường mô phỏng.

Diem manh

Han che

Hiệu suất toán học ưu tú: Đạt 96% trong AIME 2025 và các kết quả huy chương vàng trong cuộc thi IMO quốc tế.

Không có tính đa phương thức (Multimodality) bản địa: Thiếu khả năng xử lý hình ảnh hoặc âm thanh, hạn chế việc sử dụng chỉ với dữ liệu dựa trên văn bản.

Ngân sách suy nghĩ khổng lồ: Tạo ra các quỹ đạo tư duy vượt quá 47.000 tokens cho việc khám phá logic chuyên sâu.

Vô hiệu hóa Tool Calling: Không hỗ trợ gọi hàm, hạn chế tiện ích cho việc tương tác API tự chủ.

Hiệu quả DSA: Cơ chế DeepSeek Sparse Attention xử lý 131K context với chi phí tính toán thấp hơn so với các model dày đặc (dense model).

Inference Latency: Các chế độ tư duy có thể gây ra thời gian chờ đợi lên đến vài phút đối với các chứng minh logic phức tạp.

Lợi thế chi phí: Cung cấp khả năng suy luận cấp độ frontier với giá $0.28 mỗi triệu tokens, rẻ hơn đáng kể so với các đối thủ thương mại.

Yêu cầu hosting: Yêu cầu các cụm GPU cấp doanh nghiệp do kiến trúc MoE 685 tỷ parameters của nó.

Bat dau nhanh API

deepseek/deepseek-v3.2-speciale

Xem tai lieu

deepseek SDK

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.deepseek.com",
  apiKey: process.env.DEEPSEEK_API_KEY,
});

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Solve for x in the complex plane: e^z = -1." }],
    model: "deepseek-v3.2-speciale",
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve DeepSeek-V3.2-Speciale

Xem cong dong nghi gi ve DeepSeek-V3.2-Speciale

“DeepSeek-V3.2-Speciale là một con quái vật. Khả năng suy luận tối đa sánh ngang với Gemini 3 Pro.”

— OpenRouter

twitter

“Điểm HumanEval là thật. Nó viết code sạch hơn nhiều model thương mại mà tôi đã thử nghiệm trong tháng này.”

— dev_guru_99

“Giá cả thực sự điên rồ. Suy luận cấp độ frontier với chi phí chỉ bằng một phần nhỏ so với OpenAI hoặc Anthropic.”

— AI_Builder_X

twitter

“Thật mới mẻ khi thấy một model open-weights thực sự thách thức 3 phòng thí nghiệm hàng đầu. Các lựa chọn kiến trúc ở đây rất xuất sắc.”

— binary_explorer

hackernews

Video ve DeepSeek-V3.2-Speciale

Xem huong dan, danh gia va thao luan ve DeepSeek-V3.2-Speciale

“Nó suy luận trong một khoảng thời gian điên rồ... nó là một bộ suy luận cực kỳ sâu sắc.”

“Model DeepSeek đạt huy chương vàng [trong IMO] trong khi Deepthink chỉ đạt huy chương đồng.”

“Theo dõi những gì nó làm có thể cực kỳ có giá trị về mặt giáo dục.”

“Logic ở đây ở một cấp độ khác so với các model tiêu chuẩn.”

“Bạn thực sự có thể thấy model lặp lại qua các thất bại.”

“Tất cả những gì 'speciale' thực sự có nghĩa là suy nghĩ sâu. Nó có chế độ suy nghĩ sâu.”

“Nó suy nghĩ trong 63 giây... điều đó thật tuyệt vời.”

“Nó rất thông minh ở đó... đưa ra một số code thực sự tiên tiến.”

“Scaling cái này cục bộ sẽ là rào cản lớn nhất đối với người dùng.”

“Các reasoning tokens được tính phí khác biệt trên hầu hết các nền tảng.”

“Speciale là một con quái vật. Suy luận tối đa, chain of thought sâu sắc.”

“Speciale được thiết kế để suy luận sâu, các bài chứng minh nhiều bước, nghiên cứu phức tạp.”

“Tính minh bạch của DeepSeek là một lợi thế to lớn... nhìn thấy cách nó làm việc.”

“Nó duy trì sự mạch lạc trên các phản hồi dài hơn nhiều so với Gemini.”

“Công nghệ Sparse Attention là cách họ giữ mức giá thấp như vậy.”

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent

Tu dong hoa web

Quy trinh thong minh

Bat dau mien phi

Meo chuyen nghiep cho DeepSeek-V3.2-Speciale

Meo chuyen gia giup ban tan dung toi da DeepSeek-V3.2-Speciale va dat ket qua tot hon.

Tối ưu hóa các tham số lấy mẫu (Sampling Parameters)

Đặt temperature là 1.0 và top_p là 0.95 cho các tác vụ đòi hỏi logic cao để đảm bảo các lộ trình suy luận sâu luôn đa dạng.

Cung cấp thông tin kỹ thuật chi tiết

Cấu trúc các chỉ dẫn bằng markdown để giúp model sắp xếp tốt hơn quá trình chain-of-thought nội bộ của nó.

Dành thời gian cho suy nghĩ

Hãy dự kiến latency cao hơn trong các bài chứng minh phức tạp vì model tạo ra các chuỗi tư duy nội bộ khổng lồ.

Sử dụng Endpoint chuyên dụng

Chỉ định đường dẫn API 'speciale' trong cấu hình của bạn để truy cập biến thể suy luận tính toán cao này.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context

$0.95/$4.00/1M

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Cau hoi thuong gap ve DeepSeek-V3.2-Speciale

Tim cau tra loi cho cac cau hoi thuong gap ve DeepSeek-V3.2-Speciale