alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 是阿里巴巴的旗舰级 open-weight MoE 模型。它具备原生的多模态推理能力、1M context window 以及 19 倍的解码 throughput 提升。

多模态MoE开源权重Agentic AIReasoning
alibaba logoalibabaQwen2026-02-16
上下文
1.0Mtokens
最大输出
8Ktokens
输入价格
$0.60/ 1M
输出价格
$3.60/ 1M
模态:TextImageVideo
能力:视觉工具流式传输推理
基准测试
GPQA
88.4%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Qwen3.5-397B-A17B 在此基准测试中得分 88.4%。
HLE
28.7%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 28.7%。
MMLU
88.6%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Qwen3.5-397B-A17B 在此基准测试中得分 88.6%。
MMLU Pro
87.8%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Qwen3.5-397B-A17B 在此基准测试中得分 87.8%。
SimpleQA
48%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 48%。
IFEval
92.6%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 92.6%。
AIME 2025
91.3%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Qwen3.5-397B-A17B 在此基准测试中得分 91.3%。
MATH
74.1%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Qwen3.5-397B-A17B 在此基准测试中得分 74.1%。
GSM8k
93.7%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Qwen3.5-397B-A17B 在此基准测试中得分 93.7%。
MGSM
92.1%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Qwen3.5-397B-A17B 在此基准测试中得分 92.1%。
MathVista
90.3%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 90.3%。
SWE-Bench
76.4%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Qwen3.5-397B-A17B 在此基准测试中得分 76.4%。
HumanEval
79.3%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Qwen3.5-397B-A17B 在此基准测试中得分 79.3%。
LiveCodeBench
83.6%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Qwen3.5-397B-A17B 在此基准测试中得分 83.6%。
MMMU
85%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Qwen3.5-397B-A17B 在此基准测试中得分 85%。
MMMU Pro
79%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Qwen3.5-397B-A17B 在此基准测试中得分 79%。
ChartQA
86.5%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 86.5%。
DocVQA
93.2%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 93.2%。
Terminal-Bench
52.5%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Qwen3.5-397B-A17B 在此基准测试中得分 52.5%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Qwen3.5-397B-A17B 在此基准测试中得分 12%。

关于 Qwen3.5-397B-A17B

了解 Qwen3.5-397B-A17B 的功能、特性以及它如何帮助您获得更好的效果。

开放 AI 领域的里程碑式飞跃

Qwen3.5-397B-A17B 代表了阿里云 AI 战略的重大跨越,使其从一个强有力的 open-source 竞争者转型为专为 agentic AI 时代设计的顶级 frontier model 系统。该模型于 2026 年 2 月 16 日发布,是 Qwen3.5 系列的 flagship,采用了庞大的 397 亿参数 Mixture-of-Experts (MoE) 架构。通过每个 token 仅激活 17 亿个参数,它实现了与其前代 Qwen3-Max 相比前所未有的 19 倍解码 throughput 提升,同时缩小了与世界顶尖 closed-source 模型之间的性能差距。

统一的多模态强力工具

该模型是一个统一的原生 multimodal 强力工具。与之前需要独立 vision-language 适配器的版本不同,Qwen3.5 采用了在数万亿 multimodal tokens 上训练的 early-fusion multimodality 技术。这使其能够观看并分析超过两小时的视频内容,在桌面和移动界面上充当 GUI agent,并在其专门的 Thinking 模式下处理复杂的编程任务。凭借支持 201 种语言的 250,000 个 tokens 的扩展词汇表,它成为了全球范围内多语言和多模态自动化的首选。

为智能体时代而设计

除了简单的对话,Qwen3.5-397B 还针对工具使用和自主工作流进行了深度优化。它在 function-calling benchmark 和指令遵循方面的高分,使其成为视觉软件工程和博士级研究的理想骨干。通过在 Apache 2.0 协议下提供 state-of-the-art 的性能,阿里巴巴为社区提供了一个可靠、高效的替代方案,足以挑战那些受到严格限制的 closed-source 模型。

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 的使用案例

发现使用 Qwen3.5-397B-A17B 获得出色效果的不同方式。

自主 GUI Agents

导航复杂的 PC 和智能手机界面,以完成多步办公自动化工作流。

长视频智能分析

从长达 120 分钟的连续视频文件中提取深层因果 reasoning 和摘要。

Vibe Coding 与原型设计

仅需一次尝试,即可将 UI 草图直接转换为生产级别的 React 和前端逻辑。

博士级研究

使用专门的内部 chain-of-thought Thinking 模式解决研究生水平的 STEM 问题。

多语言全球支持

支持 201 种语言,并针对非英语脚本提供卓越的 tokenization 效率。

视觉软件工程

将线框图和截图转换为清晰且具备布局感知能力的 HTML、CSS 和 JavaScript 代码。

优势

局限性

推理效率: 通过其混合 MoE 架构仅激活 17B parameters,实现了 19 倍的解码 throughput 提升。
巨大的硬件需求: 拥有 397B 总 parameters,在本地运行未量化的版本需要高端服务器级基础设施。
原生视频推理: 原生支持处理长达 120 分钟的连续视频,无需帧提取适配器。
音频模态缺失: 缺乏像 GPT-4o 或 Gemini 等 'omni' model 那样的原生音频输入和输出能力。
顶尖 STEM 能力: 在 GPQA (88.4%) 和 AIME 2025 数学考试 (91.3%) 中表现优异,足以媲美闭源 reasoning model。
HLE 性能差距: 在 Humanity's Last Exam (28.7%) 上的表现落后于闭源领先 model,表明在特定领域的专家知识方面存在差距。
开源权重的易获得性: 在 Apache 2.0 协议下提供 frontier model 级别的 multimodal 智能,方便企业私有化部署。
显存占用: 即使有稀疏性,其庞大的规模仍需要巨大的 VRAM,限制了在消费级设备上的广泛部署。

API快速入门

alibaba/qwen-3.5-plus

查看文档
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 Qwen3.5-397B-A17B 的评价

看看社区对 Qwen3.5-397B-A17B 的看法

Qwen3.5-397B 基本上是开源社区对 GPT-4o 的回应。它在 SVG 方面的能力对于网页设计来说简直太疯狂了。
u/LLM_Reviewer
reddit
19 倍的 throughput 提升让 Qwen3.5 的响应速度明显快于我测试过的任何其他同规模 model。
tech_enthusiast_99
reddit
对于如此庞大的 model 采用 Apache 2.0 协议,对于本地 AI 开发和注重隐私的企业来说,完全改变了行业规则。
TechInnovator88
twitter
3.5-397B model 中的 MoE 路由明显比之前的 2.5 代更聪明;它确实能遵循逻辑。
DistanceSolar1449
reddit
在这种级别的 open-weight 模型上拥有 1M context,在目前的生态系统中是前所未有的。
dev_logic
hackernews
它的视频 reasoning 不仅仅是逐帧处理;它具备真正的时间理解力,感觉领先目前的 vision LLM 好几个身位。
Matthew Berman (Context)
youtube

关于 Qwen3.5-397B-A17B 的视频

观看关于 Qwen3.5-397B-A17B 的教程、评测和讨论

它在浏览器端任务上击败了 Claude Opus 4.5,在多项 multimodal 任务中也超过了 Gemini 3 Pro。

据报道,它的速度比支持 201 种语言和方言的 Qwen 3 Max 快 19 倍。

它在生成写实的蝴蝶图像方面表现得非常出色……优于大多数 open-source 模型。

这台 397B model 基本上是第一款真正能与 AGI 领域最前沿竞争的 open-weights 模型。

通过 MoE 进行扩展显然对阿里巴巴奏效了,他们最新的 benchmark 结果证明了这一点。

该 model 达到了 Qwen Max 的水平……但速度提升了 19 倍。

其 tokenizer 的词汇表已扩展至 250K……达到了 Gemini 和 Google tokenizer 的水平。

你必须将 Qwen 团队视为一家 Frontier Lab……他们正在攻克闭源实验室专注的任务。

与早期的 Llama 版本相比,非拉丁脚本的 tokenization 效率要高得多。

Thinking 模式虽然增加了 latency,但对于代码和 reasoning 任务来说,准确率的提升是值得的。

这是一个统一的 vision language model……以前的模型需要特定的 VL 变体,而它将所有功能集成在单个 model 中。

它的视频理解能力使其能够捕捉到传统帧提取方法会遗漏的时间维度细节。

在编程方面,它的响应速度像 GPT-4o 一样快,但指令遵循能力更强。

桌面 GUI agent 能力是其在真实场景自动化中的最大亮点。

它能处理 120 分钟的视频而不会丢失 context,这对于分析工作来说太震撼了。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Qwen3.5-397B-A17B专业提示

专家提示助您充分利用Qwen3.5-397B-A17B。

切换思考模式

在处理重逻辑任务时,使用 enable_thinking parameters 来激活深度内部 reasoning 路径。

利用原生搜索

启用 search body parameters 以根据实时网页数据验证事实并执行 python 代码。

优化视频 Prompt

提供特定的时间戳锚点,使 1M token context window 聚焦于最相关的片段。

区域端点选择

中国大陆以外的用户请使用 dashscope-intl 端点,以降低网络 latency。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

关于Qwen3.5-397B-A17B的常见问题

查找关于Qwen3.5-397B-A17B的常见问题答案