Qwen3.5-397B-A17B 是 open-source 的吗？

是的，它以 Apache 2.0 协议发布为 open-weight 模型，允许商用及私有化部署。

“17B active parameters”是什么意思？

它采用了 Mixture-of-Experts 架构，在处理每个 token 时仅使用其 3970 亿参数中的 170 亿参数，从而大幅降低了计算需求。

Qwen3.5-Plus API 的价格是多少？

其 API 定价为每 100 万输入 tokens 0.40 美元，每 100 万输出 tokens 2.40 美元，是目前最具性价比的 frontier model 之一。

它能处理视频文件吗？

是的，该 model 原生支持高达 100 万 tokens 的 context window，相当于约 120 分钟的视频内容。

它支持 function calling 吗？

是的，该 model 对工具使用有出色的支持，包括网络搜索、代码解释以及自定义 function calling。

硬件需求是什么？

由于拥有 397B 的总参数量，在 16-bit 精度下运行该 model 需要超过 800GB 的 VRAM，通常需要多 GPU 服务器集群。

它如何处理 reasoning 任务？

Qwen3.5 使用异步 RL 框架来支持 chain-of-thought reasoning，可以通过 API 参数（如 'enable_thinking'）进行切换。

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 是阿里旗下的 flagship open-weight MoE 模型。具备原生 multimodal reasoning、1M context window 及 19 倍解码吞吐量提升...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen3.5February 16, 2026

上下文

1.0Mtokens

最大输出

8Ktokens

输入价格

$0.60/ 1M

输出价格

$3.60/ 1M

模态:TextImageVideo

能力:视觉工具流式传输推理

基准测试

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

查看API文档

关于 Qwen3.5-397B-A17B

了解 Qwen3.5-397B-A17B 的功能、特性以及它如何帮助您获得更好的效果。

高效 Mixture-of-Experts

Qwen3.5-397B-A17B 是一款 flagship 原生 multimodal 模型，采用了一种创新的混合架构，将 Gated Delta Networks 的线性 attention 与稀疏 Mixture-of-Experts (MoE) 相融合。尽管总参数达到 3970 亿，但其稀疏设计在每次前向传播时仅激活 170 亿参数，在不牺牲庞大 reasoning 能力的前提下实现了极高的推理效率和速度。它针对语言和视觉任务进行了优化，支持 25 万 tokens 的词汇量，并支持超过 201 种语言和方言。

原生 Multimodal Agentic 工作流

该模型作为原生 multimodal agent 表现优异，能够处理高达 100 万 tokens 的 context，相当于约两小时的视频内容。它引入了专门的 Thinking Mode 以用于复杂的逻辑 reasoning，并原生适配 agentic 工作流，包括 Web 开发、GUI 导航和现实世界的空间智能。其架构支持 FP8 端到端训练和训练-推理分离框架，使其成为企业级 AI 应用中最具扩展性和效率的模型之一。

助力全球可访问性的 Open Weights

该模型在 Apache 2.0 协议下发布，为开源社区提供了此前仅限于专有系统的 frontier-level 能力。它弥合了庞大参数量与实际部署之间的差距，允许企业在私有基础设施上运行最先进的 reasoning 任务，且计算开销远低于传统的 400B 密集型模型。

Qwen3.5-397B-A17B 的使用案例

发现使用 Qwen3.5-397B-A17B 获得出色效果的不同方式。

长跨度视频分析

分析长达两小时的视频内容，提取逻辑、根据画面进行代码反向工程或生成结构化摘要。

博士级 STEM 研究

利用其自适应深度思考模式，解决研究生级别的科学问题和奥赛级别的数学难题。

自主 GUI Agent

自动化与手机和电脑的交互，处理办公流程及跨应用的移动导航。

视觉软件工程

通过自然语言指令和 UI 草图生成功能性前端代码，实现“vibe coding”。

文档智能

处理复杂的文档、图表和手写草图，提取结构化数据并进行版式反向工程。

空间 AI 应用

理解像素级的关系，用于具身 AI 任务，如自动驾驶场景分析和机器人导航。

优势

局限性

卓越的视频支持: 支持 100 万 tokens，允许原生处理长达 120 分钟的视频，适用于 agentic 和编程任务。

极高的硬件门槛: 完整部署需要企业级 GPU 服务器集群，且未压缩的 16-bit 精度需 800GB 以上 VRAM。

MoE 推理效率: 397B 总参数/17B 激活参数的架构，相比以往的密集型 flagship model 提升了 19 倍的解码吞吐量。

HLE 知识差距: 尽管在科学和数学 benchmark 上表现优异，但在 Humanity's Last Exam (HLE) 上仅得 28.7%，显示出在绝对专家事实性方面仍有差距。

State-of-the-art reasoning: 在 AIME 上达到 91.3%，GPQA 上达到 88.4%，在博士级科学和数学能力上媲美顶尖的 closed-source model。

工具使用过度自信: 在自主 Agent 场景中，该 model 有时会产生 hallucinated 的工具输出，或忽略结果而倾向于其内部预测。

Apache 2.0 Open Weights: 提供 frontier-level 的智能，同时具备 Open Weights 的自由度，支持私有化部署。

终端任务表现: 在 Terminal-Bench 2.0 上得分为 52.5%，在复杂的命令行交互任务中落后于竞争对手。

API快速入门

alibaba/qwen3.5-plus

查看文档

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 Qwen3.5-397B-A17B 的评价

看看社区对 Qwen3.5-397B-A17B 的看法

“Qwen3.5-397B 本质上是一个 GPT-5 级别的模型但属于 open-weight。DeltaNet 架构完美解决了 MoE 的 latency 问题。”

— u/DeepLearningLover

“Qwen3.5 原生 multimodal reasoning 看起来太不可思议了。1M context + 视频分析将改变 Agent 工作流。”

— @AiDevDaily

twitter

“在敏感层保持 BF16 的同时使用 FP8 端到端训练，这是稳定性优化方面的大师级作品。”

— cold_fusion

hackernews

“这是我第一次看到 open 模型在复杂的 multimodal agent 任务上真正击败了 Gemini 1.5 Pro。”

— AI Revolution

youtube

“相比 Qwen3-Max，19 倍的解码吞吐量提升使其成为生产级 Agent 的可行替代方案。”

— u/ModelTester2026

“我很惊讶它在 4-bit 量化下的表现如此出色。在双 A100 设置上几乎保留了所有 reasoning 能力。”

— @GlobalTechReview

twitter

关于 Qwen3.5-397B-A17B 的视频

观看关于 Qwen3.5-397B-A17B 的教程、评测和讨论

“一个拥有 3970 亿参数的模型，但激活参数仅 170 亿。”

“在 256K 解码时，该模型比 Qwen 3 Max 快 19 倍。”

“原生的视觉语言 reasoning 是其在 agentic 工作流中脱颖而出的关键。”

“它在标准数学 benchmark 上击败了大多数 closed 模型。”

“本地运行非常困难，但在高端 Mac 上可以使用量化版本。”

“3970 亿参数模型，激活参数 170 亿。它是原生的 multimodal。”

“它很可能是目前最好的 open-source multimodal 模型。”

“能够原生处理两小时视频是一个巨大的优势。”

“看看这些逻辑分数，它持续达到 GPT-4o 的水平。”

“Apache 协议使它在企业数据隐私方面非常有吸引力。”

“OCR 结构化提取。如果你有一个凌乱的 PDF……需要将其转为整洁的 JSON，该模型非常出色。”

“你获得了 4000 亿参数巨人的智能……但只需支付 170 亿参数模型的计算成本。”

“它处理长 context 检索的能力比前一版本更好。”

“工具使用集成直接内置于基础训练中，并非后期添加。”

“Thinking 模式允许它在输出前修正自身的逻辑。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量，帮助您在更短的时间内完成更多工作。

AI代理

网页自动化

智能工作流

免费开始

Qwen3.5-397B-A17B专业提示

专家提示助您充分利用Qwen3.5-397B-A17B。

开启 Thinking 模式

在 API 调用中传入 'enable_thinking: true' 参数，可激活深度 reasoning，适用于数学、编程及复杂逻辑谜题。

使用 Fast 模式

对于简单查询，使用 'Fast' 模式可获得即时回复，且无需消耗额外内部思考过程的 tokens。

优化视频 prompt

在分析视频时，prompt model 关注最终的动态结果而非逐帧分析，以获得更好的时间连贯性。

利用量化技术

如果您拥有充足的 VRAM（200GB+），可使用 4-bit 或 8-bit 量化（GGUF/EXL2）在消费级硬件上运行该 model。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.