alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next là mô hình lập trình Apache 2.0 ưu việt của Alibaba Cloud, có kiến trúc MoE 80B và 256k context window cho sự phát triển cục bộ nâng cao.

AI lập trìnhOpen WeightsMixture of ExpertsQuy trình làm việc AgenticLocal LLM
alibaba logoalibabaQwen33 tháng 2, 2026
Ngu canh
256Ktoken
Dau ra toi da
8Ktoken
Gia dau vao
$0.14/ 1M
Gia dau ra
$0.42/ 1M
Phuong thuc:Text
Kha nang:Cong cuTruyen truc tiep
Diem chuan
GPQA
53.4%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Qwen3-Coder-Next dat 53.4% trong benchmark nay.
HLE
28.5%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Qwen3-Coder-Next dat 28.5% trong benchmark nay.
MMLU
86.2%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Qwen3-Coder-Next dat 86.2% trong benchmark nay.
MMLU Pro
78.4%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Qwen3-Coder-Next dat 78.4% trong benchmark nay.
SimpleQA
48.2%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Qwen3-Coder-Next dat 48.2% trong benchmark nay.
IFEval
89.1%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Qwen3-Coder-Next dat 89.1% trong benchmark nay.
AIME 2025
89.2%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Qwen3-Coder-Next dat 89.2% trong benchmark nay.
MATH
83.5%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Qwen3-Coder-Next dat 83.5% trong benchmark nay.
GSM8k
95.8%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Qwen3-Coder-Next dat 95.8% trong benchmark nay.
MGSM
92.5%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Qwen3-Coder-Next dat 92.5% trong benchmark nay.
MathVista
71.2%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Qwen3-Coder-Next dat 71.2% trong benchmark nay.
SWE-Bench
74.2%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Qwen3-Coder-Next dat 74.2% trong benchmark nay.
HumanEval
94.1%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Qwen3-Coder-Next dat 94.1% trong benchmark nay.
LiveCodeBench
74.5%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Qwen3-Coder-Next dat 74.5% trong benchmark nay.
MMMU
72.4%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Qwen3-Coder-Next dat 72.4% trong benchmark nay.
MMMU Pro
58.6%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Qwen3-Coder-Next dat 58.6% trong benchmark nay.
ChartQA
86.4%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Qwen3-Coder-Next dat 86.4% trong benchmark nay.
DocVQA
93.5%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Qwen3-Coder-Next dat 93.5% trong benchmark nay.
Terminal-Bench
58.2%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Qwen3-Coder-Next dat 58.2% trong benchmark nay.
ARC-AGI
12.5%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Qwen3-Coder-Next dat 12.5% trong benchmark nay.

Ve Qwen3-Coder-Next

Tim hieu ve kha nang cua Qwen3-Coder-Next, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kiến trúc mô hình

Qwen3-Coder-Next là một mô hình open-weight chuyên dụng được thiết kế bởi Alibaba Cloud dành cho các tác nhân kỹ thuật phần mềm. Nó sử dụng kiến trúc Mixture-of-Experts (MoE) với tổng cộng 80 tỷ parameters, nhưng chỉ kích hoạt 3 tỷ parameters cho mỗi token. Thiết kế này kết hợp trí tuệ của một mô hình khổng lồ với tốc độ inference của một mô hình nhỏ. Kiến trúc bao gồm cơ chế hybrid attention, tích hợp Gated DeltaNet với tiêu chuẩn Gated Attention để xử lý các ngữ cảnh lên tới 262.144 tokens.

Chuyên môn hóa cho Agent

Mô hình được đào tạo trên hơn 800.000 tác vụ lập trình có thể xác minh và các môi trường thực thi. Quá trình đào tạo này nhấn mạnh vào khả năng suy luận dài hạn và khả năng phục hồi sau các lỗi thực thi. Nó đạt 70,8% trên SWE-Bench Verified, chứng minh khả năng xử lý các tác vụ phát triển nhiều bước từ lập kế hoạch ban đầu đến thực thi code cuối cùng. Nó vượt trội trong các framework agentic tự trị như OpenClaw và Qwen Code.

Triển khai và Quyền riêng tư

Được cấp phép theo Apache 2.0, mô hình này cung cấp một giải pháp thay thế an toàn cho các nhà phát triển cần môi trường phát triển cục bộ, riêng tư. Nó có thể chạy trên phần cứng cấp người dùng với đủ RAM thông qua lượng tử hóa. Cửa sổ ngữ cảnh lớn cho phép phân tích quy mô kho lưu trữ mà không bị suy giảm hiệu suất như thường thấy ở các mô hình có cửa sổ ngữ cảnh nhỏ hơn.

Qwen3-Coder-Next

Truong hop su dung cho Qwen3-Coder-Next

Kham pha cac cach khac nhau ban co the su dung Qwen3-Coder-Next de dat ket qua tuyet voi.

Autonomous Coding Agents

Cung cấp năng lượng cho các framework để xử lý các tác vụ phát triển nhiều bước từ lập kế hoạch đến thực thi cuối cùng.

Phát triển phần mềm riêng tư cục bộ

Chạy hỗ trợ lập trình cao cấp trên GPU phổ thông có 16GB VRAM bằng cách sử dụng các MoE layers đã lượng tử hóa.

Phân tích kho lưu trữ quy mô lớn

Xử lý toàn bộ codebase trong cửa sổ context 256k để xác định các khoản nợ kỹ thuật.

Sửa lỗi và Refactoring mã nguồn

Cập nhật mã cũ lên các tiêu chuẩn hiện đại bằng cách cung cấp phản hồi từ môi trường thực thi.

Viết script đa ngôn ngữ

Tạo mã nguồn chất lượng cao bằng hơn 40 ngôn ngữ lập trình bao gồm Rust và Go.

Mô phỏng 3D tương tác

Xây dựng các công cụ trực quan hóa và mô phỏng dựa trên web phức tạp bằng phương pháp tạo mã nhanh one-shot.

Diem manh

Han che

Hiệu suất MoE: Hoạt động với 3 tỷ active parameters cho phần cứng phổ thông trong khi vẫn duy trì trí tuệ của mô hình 80 tỷ.
Yêu cầu về RAM hệ thống: Tổng số 80 tỷ parameters yêu cầu khoảng 45GB RAM tổng cộng để lượng tử hóa 4-bit hiệu quả.
Chuyên môn hóa cho Agent: Đạt 70,8% trên SWE-Bench Verified, chứng minh khả năng giải quyết vấn đề nhiều lượt vượt trội.
Hạn chế về Recurrent State: Kiến trúc hybrid attention khiến self-speculative decoding không được hỗ trợ trong các engine inference thông thường.
Context Window gốc khổng lồ: Cửa sổ 262.144 tokens hỗ trợ phân tích ở cấp độ kho lưu trữ mà không bị suy giảm hiệu suất.
Giới hạn chỉ văn bản: Thiếu khả năng thị giác multimodal, ngăn cản việc gỡ lỗi layout từ ảnh chụp màn hình.
Giấy phép thông thoáng: Được phát hành theo giấy phép Apache 2.0, cho phép sử dụng thương mại không giới hạn và tự lưu trữ nội bộ.
Vật lý độ phức tạp cao: Có thể gặp khó khăn với việc tạo one-shot các logic vật lý 3D cực đoan so với các flagship model dày đặc (dense models).

Bat dau nhanh API

alibaba/qwen-3-coder-next

Xem tai lieu
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Qwen3-Coder-Next

Xem cong dong nghi gi ve Qwen3-Coder-Next

Gần như ngang bằng với Claude về khả năng lập trình tổng thể. Vượt qua Claude 3.5 Sonnet trên HumanEval với 92,7%.
Philipp Schmid
twitter
Hiệu suất của phiên bản MoE thực sự điên rồ đối với phần cứng cục bộ. Tôi đạt được 26 TPS trên một hệ thống tầm trung.
LocalAI_Dev
reddit
Self-speculative decoding là không thể về mặt toán học đối với Qwen Coder Next do các recurrent states.
GodComplecs
reddit
Qwen3-Coder-Next dựa trên MoE, mạnh mẽ và thông minh hơn nhiều so với trước đây!
JustinLin610
twitter
Chứng minh khả năng chuyển đổi nhà cung cấp giữa chừng dự án với các biến thể mô hình 480B mới.
saveralter
reddit
Công thức đào tạo agentic trên 800k tác vụ thể hiện rõ qua cách nó phục hồi sau các lỗi build.
TechGurus
hackernews

Video ve Qwen3-Coder-Next

Xem huong dan, danh gia va thao luan ve Qwen3-Coder-Next

Cho phép những người muốn thử nghiệm các AI coding agent cục bộ có thể tiếp cận dễ dàng

Đối với tôi, nó đang gào thét 'hãy thử nghiệm mô hình này đi', và tôi sẽ làm điều đó

Hiệu quả bộ nhớ của mô hình này thực sự là một chiến thắng lớn

Nó xử lý logic phức tạp tốt hơn mô hình dense 72B trước đó

Đây là mô hình open đầu tiên thực sự thực hiện đúng các lệnh terminal của tôi

Qwen 3 Coder Next cũng chỉ có 3 tỷ active parameters để chạy trên card đồ họa phổ thông

Nó hoạt động tuyệt vời. Tôi thực sự ngạc nhiên khi có thể nhận được kết quả này trong một lần tạo từ AI cục bộ

80 tỷ parameters thường yêu cầu cả một cluster, nhưng cách tiếp cận MoE đã thay đổi tất cả

Nó xử lý 40+ ngôn ngữ lập trình mà không có bất kỳ sự suy giảm hiệu suất đáng chú ý nào

Sử dụng nó với OpenClaw mang lại cảm giác như có một lập trình viên cấp dưới trong nhóm

Mô hình 3 tỷ parameters đối đầu với các mô hình lớn gấp 10 đến 20 lần kích thước của nó

Qwen 3 đi kèm với rất nhiều lợi thế nhưng chi phí lại thấp hơn

Context 256k là thực, nó không hề bị ảo tưởng (hallucinate) ở giữa dự án của tôi

Độ trễ (latency) thấp đến bất ngờ với tổng trọng số 80B parameters

Nó đã sửa một lỗi trong kho Go cũ của tôi mà GPT-4o đã bỏ lỡ ba lần

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Qwen3-Coder-Next

Meo chuyen gia giup ban tan dung toi da Qwen3-Coder-Next va dat ket qua tot hon.

Sử dụng System Prompts dài

Cung cấp cho mô hình các ví dụ chi tiết và tài liệu để định hướng hành vi agentic của nó.

Phản hồi lỗi lặp lại

Đưa các nhật ký lỗi từ console trình duyệt trở lại mô hình để đạt tỷ lệ tự sửa lỗi thành công cao.

Tối ưu hóa Layer Offloading

Offload các MoE expert layers cụ thể vào RAM hệ thống để cân bằng giữa tốc độ inference và khả năng suy luận.

Căn chỉnh các Sampling Parameters

Sử dụng temperature 1.0 với top_p 0.95 và top_k 40 để có kết quả lập trình chính xác nhất.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Cau hoi thuong gap ve Qwen3-Coder-Next

Tim cau tra loi cho cac cau hoi thuong gap ve Qwen3-Coder-Next