alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next 是阿里云推出的精英级 Apache 2.0 编码 model,具有 80B MoE 架构和 256k 上下文 window,适用于高级本地开发。

编码 AI开放权重混合专家模型Agentic 工作流本地 LLM
alibaba logoalibabaQwen32026年2月3日
上下文
256Ktokens
最大输出
8Ktokens
输入价格
$0.14/ 1M
输出价格
$0.42/ 1M
模态:Text
能力:工具流式传输
基准测试
GPQA
53.4%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Qwen3-Coder-Next 在此基准测试中得分 53.4%。
HLE
28.5%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Qwen3-Coder-Next 在此基准测试中得分 28.5%。
MMLU
86.2%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Qwen3-Coder-Next 在此基准测试中得分 86.2%。
MMLU Pro
78.4%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Qwen3-Coder-Next 在此基准测试中得分 78.4%。
SimpleQA
48.2%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Qwen3-Coder-Next 在此基准测试中得分 48.2%。
IFEval
89.1%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Qwen3-Coder-Next 在此基准测试中得分 89.1%。
AIME 2025
89.2%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Qwen3-Coder-Next 在此基准测试中得分 89.2%。
MATH
83.5%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Qwen3-Coder-Next 在此基准测试中得分 83.5%。
GSM8k
95.8%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Qwen3-Coder-Next 在此基准测试中得分 95.8%。
MGSM
92.5%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Qwen3-Coder-Next 在此基准测试中得分 92.5%。
MathVista
71.2%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Qwen3-Coder-Next 在此基准测试中得分 71.2%。
SWE-Bench
74.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Qwen3-Coder-Next 在此基准测试中得分 74.2%。
HumanEval
94.1%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Qwen3-Coder-Next 在此基准测试中得分 94.1%。
LiveCodeBench
74.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Qwen3-Coder-Next 在此基准测试中得分 74.5%。
MMMU
72.4%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Qwen3-Coder-Next 在此基准测试中得分 72.4%。
MMMU Pro
58.6%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Qwen3-Coder-Next 在此基准测试中得分 58.6%。
ChartQA
86.4%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Qwen3-Coder-Next 在此基准测试中得分 86.4%。
DocVQA
93.5%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Qwen3-Coder-Next 在此基准测试中得分 93.5%。
Terminal-Bench
58.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Qwen3-Coder-Next 在此基准测试中得分 58.2%。
ARC-AGI
12.5%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Qwen3-Coder-Next 在此基准测试中得分 12.5%。

关于 Qwen3-Coder-Next

了解 Qwen3-Coder-Next 的功能、特性以及它如何帮助您获得更好的效果。

Model 架构

Qwen3-Coder-Next 是阿里云为软件工程 agent 设计的专用 open-weight model。它采用 Mixture-of-Experts (MoE) 架构,总计 800 亿 parameters,但每个 token 仅激活 30 亿。这种设计结合了海量 model 的智能与小型 model 的 inference 速度。该架构包含一种混合注意力机制,集成了 Gated DeltaNet 和标准 Gated Attention,以处理高达 262,144 tokens 的上下文。

Agentic 专业化

该 model 在超过 80 万个可验证的编码任务和可执行环境中进行了训练。这种训练强调长跨度的 reasoning 以及从执行失败中恢复的能力。它在 SWE-Bench Verified 上得分 70.8%,展示了其处理从初始规划到最终代码执行的多步骤开发任务的能力。它在 OpenClaw 和 Qwen Code 等自主 agentic 框架中表现优异。

部署与隐私

该 model 在 Apache 2.0 协议下发布,为需要本地私有开发环境的开发者提供了安全选择。通过量化,它可以在配备足够 RAM 的消费级硬件上运行。高 context window 支持存储库规模的分析,且不会出现通常在较小上下文 model 中看到的性能下降。

Qwen3-Coder-Next

Qwen3-Coder-Next 的使用案例

发现使用 Qwen3-Coder-Next 获得出色效果的不同方式。

自主编码 Agent

赋能各类框架处理从规划到最终执行的多步骤开发任务。

本地私有开发

通过量化 MoE layers,在 16GB VRAM 的消费级 GPU 上运行精英级编码辅助。

大规模代码库分析

在其 256k 的 window 内处理完整代码库,识别技术债。

代码修复与重构

通过提供可执行的环境反馈,将旧代码更新为现代标准。

多语言脚本编写

生成包括 Rust 和 Go 在内的 40 多种编程语言的高质量代码。

交互式 3D 模拟

利用快速单次生成功能构建复杂的基于 Web 的可视化工具和模拟程序。

优势

局限性

MoE 高效性: 在消费级硬件上以 3B 活跃 parameters 运行,同时保持 80B 级别的智能水平。
系统 RAM 要求: 80B 的总 parameter 量在进行 4-bit 量化时,大约需要 45GB 的总 RAM。
Agentic 专业化: 在 SWE-Bench Verified 上得分 70.8%,展示了卓越的多轮问题解决能力。
循环状态限制: 混合注意力架构导致常见的 inference 引擎不支持自我投机解码(self-speculative decoding)。
海量原生上下文: 262,144 token 的 window 支持存储库规模的分析,且不会出现性能下降。
仅支持文本: 缺乏 multimodal 视觉能力,无法通过截图进行布局调试。
宽松的许可协议: 以 Apache 2.0 协议发布,支持无限制的商业用途和私有本地部署。
高复杂度物理模拟: 相比稠密型 flagship model,在一次性生成极端 3D 物理逻辑时可能会遇到困难。

API快速入门

alibaba/qwen-3-coder-next

查看文档
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

安装SDK并在几分钟内开始进行API调用。

人们对 Qwen3-Coder-Next 的评价

看看社区对 Qwen3-Coder-Next 的看法

整体编码能力几乎与 Claude 持平。在 HumanEval 上以 92.7% 的成绩击败了 Claude 3.5 Sonnet。
Philipp Schmid
twitter
MoE 版本的效率对于本地硬件来说简直疯狂。我在中端系统上获得了 26 TPS 的速度。
LocalAI_Dev
reddit
由于循环状态的存在,自我投机解码在数学上对 Qwen Coder Next 是不可能的。
GodComplecs
reddit
Qwen3-Coder-Next 基于 MoE,比以前更强大、更聪明了!
JustinLin610
twitter
展示了使用新的 480B model 变体在项目过程中切换提供商的能力。
saveralter
reddit
它在 80 万个任务上的 agentic 训练配方在它从构建错误中恢复的方式中得到了体现。
TechGurus
hackernews

关于 Qwen3-Coder-Next 的视频

观看关于 Qwen3-Coder-Next 的教程、评测和讨论

让想要使用本地 AI 编码 agent 的用户更易于上手

这简直在呼唤我进行开源代码测试,我待会就去尝试

它的内存效率是巨大的优势

它处理复杂逻辑的能力比之前的 72B 稠密 model 更好

这是第一个能准确遵循我终端命令的开源 model

Qwen 3 Coder Next 只有 30 亿活跃 parameters,可以在消费级显卡上运行

它运行得非常完美。我真的很惊讶能从本地 AI 一次性得到这个结果

800 亿 parameters 通常需要集群支持,但 MoE 方法改变了一切

它处理 40 多种编程语言时性能没有明显下降

结合 OpenClaw 使用,感觉就像团队里多了个初级开发人员

一个 30 亿参数的 model 与比它大 10 到 20 倍的 model 正面交锋

Qwen 3 带来了很多优势,且成本更低

256k 上下文是真实的,它没有在项目中间产生幻觉

考虑到 80B 的总 parameter 量,其 latency 低得惊人

它修复了我陈旧 Go 代码库中一个 GPT-4o 错过三次的 bug

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Qwen3-Coder-Next专业提示

专家提示助您充分利用Qwen3-Coder-Next。

使用长 System Prompts

向 model 提供详细的示例和文档,以引导其 agentic 行为。

迭代式错误反馈

将浏览器控制台的错误日志回传给 model,以实现高成功率的自我修正。

优化层卸载

将特定的 MoE expert layers 卸载到系统 RAM,以平衡 inference 速度和 reasoning 能力。

校准采样参数

使用 temperature 1.0、top_p 0.95 和 top_k 40,以获得最精确的编码结果。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

关于Qwen3-Coder-Next的常见问题

查找关于Qwen3-Coder-Next的常见问题答案