alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B là model MoE trọng số mở flagship của Alibaba. Nó sở hữu khả năng reasoning multimodal gốc, context window 1M và decoding throughput gấp 19...

MultimodalMoETrọng số mởAgentic AIReasoning
alibaba logoalibabaQwen2026-02-16
Ngu canh
1.0Mtoken
Dau ra toi da
8Ktoken
Gia dau vao
$0.60/ 1M
Gia dau ra
$3.60/ 1M
Phuong thuc:TextImageVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
88.4%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Qwen3.5-397B-A17B dat 88.4% trong benchmark nay.
HLE
28.7%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Qwen3.5-397B-A17B dat 28.7% trong benchmark nay.
MMLU
88.6%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Qwen3.5-397B-A17B dat 88.6% trong benchmark nay.
MMLU Pro
87.8%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Qwen3.5-397B-A17B dat 87.8% trong benchmark nay.
SimpleQA
48%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Qwen3.5-397B-A17B dat 48% trong benchmark nay.
IFEval
92.6%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Qwen3.5-397B-A17B dat 92.6% trong benchmark nay.
AIME 2025
91.3%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Qwen3.5-397B-A17B dat 91.3% trong benchmark nay.
MATH
74.1%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Qwen3.5-397B-A17B dat 74.1% trong benchmark nay.
GSM8k
93.7%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Qwen3.5-397B-A17B dat 93.7% trong benchmark nay.
MGSM
92.1%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Qwen3.5-397B-A17B dat 92.1% trong benchmark nay.
MathVista
90.3%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Qwen3.5-397B-A17B dat 90.3% trong benchmark nay.
SWE-Bench
76.4%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Qwen3.5-397B-A17B dat 76.4% trong benchmark nay.
HumanEval
79.3%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Qwen3.5-397B-A17B dat 79.3% trong benchmark nay.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Qwen3.5-397B-A17B dat 83.6% trong benchmark nay.
MMMU
85%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Qwen3.5-397B-A17B dat 85% trong benchmark nay.
MMMU Pro
79%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Qwen3.5-397B-A17B dat 79% trong benchmark nay.
ChartQA
86.5%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Qwen3.5-397B-A17B dat 86.5% trong benchmark nay.
DocVQA
93.2%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Qwen3.5-397B-A17B dat 93.2% trong benchmark nay.
Terminal-Bench
52.5%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Qwen3.5-397B-A17B dat 52.5% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Qwen3.5-397B-A17B dat 12% trong benchmark nay.

Ve Qwen3.5-397B-A17B

Tim hieu ve kha nang cua Qwen3.5-397B-A17B, tinh nang va cach no co the giup ban dat ket qua tot hon.

Một bước tiến khổng lồ trong AI Mở

Qwen3.5-397B-A17B đại diện cho một bước tiến khổng lồ trong chiến lược AI của Alibaba Cloud, chuyển mình từ một đối thủ nặng ký trong giới open-source thành một hệ thống cấp độ frontier thống trị, được thiết kế cho kỷ nguyên agentic AI. Được phát hành vào ngày 16 tháng 2 năm 2026, đây là flagship của dòng Qwen3.5, sử dụng kiến trúc Mixture-of-Experts (MoE) khổng lồ với 397 tỷ parameters. Bằng cách chỉ kích hoạt 17 tỷ parameters cho mỗi token, nó đạt được mức tăng decoding throughput gấp 19 lần so với phiên bản tiền nhiệm Qwen3-Max, đồng thời thu hẹp khoảng cách hiệu suất với các model độc quyền tiên tiến nhất thế giới.

Cỗ máy Multimodal Thống nhất

Model này là một cỗ máy multimodal gốc thống nhất. Không giống như các phiên bản trước yêu cầu các bộ điều hợp thị giác-ngôn ngữ riêng biệt, Qwen3.5 sở hữu multimodality kết hợp sớm (early-fusion) được huấn luyện trên hàng nghìn tỷ token multimodal. Điều này cho phép nó xem và reasoning trên nội dung video dài hơn hai giờ, hoạt động như một agent GUI trên các giao diện máy tính để bàn và di động, và xử lý các tác vụ lập trình phức tạp trong chế độ Thinking chuyên dụng. Với vốn từ vựng được mở rộng lên 250.000 token hỗ trợ 201 ngôn ngữ, nó khẳng định vị thế là lựa chọn hàng đầu toàn cầu cho tự động hóa đa ngôn ngữ và multimodal.

Được thiết kế cho Kỷ nguyên Agentic

Không chỉ dừng lại ở chat đơn thuần, Qwen3.5-397B được tối ưu hóa cho việc sử dụng công cụ và quy trình làm việc tự hành. Điểm số cao trong các benchmark function-calling và khả năng tuân thủ hướng dẫn khiến nó trở thành xương sống lý tưởng cho kỹ thuật phần mềm thị giác và nghiên cứu cấp độ Tiến sĩ. Bằng cách cung cấp hiệu suất state-of-the-art dưới giấy phép Apache 2.0, Alibaba đã mang đến cho cộng đồng một giải pháp thay thế hiệu quả cao, đáng tin cậy cho các model closed-source bị hạn chế nhất.

Qwen3.5-397B-A17B

Truong hop su dung cho Qwen3.5-397B-A17B

Kham pha cac cach khac nhau ban co the su dung Qwen3.5-397B-A17B de dat ket qua tuyet voi.

Agent GUI Tự hành

Điều hướng các giao diện phức tạp trên PC và điện thoại thông minh để hoàn thành các quy trình tự động hóa văn phòng nhiều bước.

Trí tuệ Video Dạng dài

Trích xuất tóm tắt và reasoning nhân quả chuyên sâu từ các tệp video liên tục dài tới 120 phút.

Lập trình Cảm hứng (Vibe Coding) & Tạo mẫu

Chuyển đổi trực tiếp các bản phác thảo UI thành logic frontend và React sẵn sàng cho sản xuất chỉ trong một lần thử.

Nghiên cứu Cấp độ Tiến sĩ

Giải quyết các vấn đề STEM cấp độ sau đại học bằng chế độ Thinking với chain-of-thought nội bộ chuyên dụng.

Hỗ trợ Toàn cầu Đa ngôn ngữ

Tương tác với người dùng qua 201 ngôn ngữ với hiệu suất tokenization vượt trội cho các chữ viết không phải tiếng Anh.

Kỹ thuật Phần mềm Thị giác

Biến đổi wireframe và ảnh chụp màn hình thành mã nguồn HTML, CSS và JavaScript sạch, hiểu rõ về bố cục.

Diem manh

Han che

Hiệu suất Inference: Đạt được mức tăng decoding throughput gấp 19 lần bằng cách chỉ kích hoạt 17B parameters thông qua kiến trúc MoE lai.
Yêu cầu Phần cứng Khổng lồ: Với tổng cộng 397B parameters, việc chạy các phiên bản chưa định lượng cục bộ đòi hỏi hạ tầng cấp máy chủ cao cấp.
Reasoning Video Gốc: Xử lý tối đa 120 phút video liên tục một cách tự nhiên mà không cần các bộ điều hợp trích xuất khung hình.
Thiếu hụt Phương thức Âm thanh: Thiếu khả năng nhập và xuất âm thanh gốc như thường thấy trong các model 'omni' như GPT-4o hoặc Gemini.
Khả năng STEM Hàng đầu: Cạnh tranh với các model reasoning độc quyền với điểm số 88,4% trên GPQA và 91,3% trong các kỳ thi toán AIME 2025.
Khoảng cách Hiệu suất HLE: Thấp hơn các model dẫn đầu độc quyền trong Humanity's Last Exam (28,7%), cho thấy khoảng cách trong kiến thức chuyên gia ngách.
Khả năng Tiếp cận Trọng số Mở: Cung cấp trí tuệ multimodal cấp độ frontier theo giấy phép Apache 2.0 cho việc triển khai doanh nghiệp riêng tư.
Dấu chân Bộ nhớ: Quy mô khổng lồ đòi hỏi lượng VRAM đáng kể ngay cả khi có tính thưa thớt (sparsity), hạn chế việc triển khai rộng rãi ở cấp độ người tiêu dùng.

Bat dau nhanh API

alibaba/qwen-3.5-plus

Xem tai lieu
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Qwen3.5-397B-A17B

Xem cong dong nghi gi ve Qwen3.5-397B-A17B

Qwen3.5-397B về cơ bản là câu trả lời của cộng đồng open-source dành cho GPT-4o. Riêng khả năng SVG đã là quá kinh khủng cho thiết kế web.
u/LLM_Reviewer
reddit
Mức tăng throughput gấp 19 lần khiến Qwen3.5 mang lại cảm giác phản hồi nhanh hơn đáng kể so với bất kỳ model nào cùng kích thước mà tôi từng thử nghiệm.
tech_enthusiast_99
reddit
Apache 2.0 cho một model lớn thế này là một bước ngoặt thực sự cho phát triển AI cục bộ và các doanh nghiệp chú trọng quyền riêng tư.
TechInnovator88
twitter
Việc điều hướng MoE trong model 3.5-397B thông minh hơn rõ rệt so với thế hệ 2.5 trước đó; nó thực sự tuân theo logic.
DistanceSolar1449
reddit
Context window 1M trên một model trọng số mở tầm cỡ này là điều chưa từng có trong hệ sinh thái hiện tại.
dev_logic
hackernews
Reasoning video không chỉ là từng khung hình; đó là sự hiểu biết thực sự về trình tự thời gian, cảm giác vượt xa các LLM thị giác hiện nay.
Matthew Berman (Bối cảnh)
youtube

Video ve Qwen3.5-397B-A17B

Xem huong dan, danh gia va thao luan ve Qwen3.5-397B-A17B

Nó đánh bại Claude Opus 4.5 về khả năng duyệt web cũng như Gemini 3 Pro trong một số tác vụ multimodal.

Theo báo cáo, nó nhanh hơn 19 lần so với Qwen 3 Max, vốn hỗ trợ 201 ngôn ngữ và phương ngữ.

Nó đã làm rất tốt với hình ảnh con bướm chân thực... tốt hơn hầu hết các model open-source khác.

Model 397B về cơ bản là model trọng số mở đầu tiên thực sự cạnh tranh ở ranh giới của AGI.

Việc mở rộng quy mô với MoE rõ ràng đang hiệu quả với Alibaba và các kết quả benchmark mới nhất đã chứng minh điều đó.

Model này tương đương với những gì Qwen Max có thể làm... nhưng nó thực hiện được với tốc độ tăng gấp 19 lần.

Bộ tokenizer thực tế đã nâng vốn từ vựng lên 250K... khớp với Gemini và tokenizer của Google.

Bạn phải coi đội ngũ Qwen như một Frontier Lab... họ đang dấn thân vào những tác vụ mà các lab độc quyền tập trung vào.

Việc tokenization hiệu quả hơn nhiều cho các chữ viết không phải Latinh so với các phiên bản Llama trước đó.

Chế độ Thinking làm tăng latency đáng kể nhưng mức tăng độ chính xác là rất xứng đáng cho việc lập trình và reasoning.

Đây là một vision language model thống nhất... nơi các model trước đó có biến thể VL riêng biệt, model này chứa đựng mọi thứ trong một model duy nhất.

Khả năng hiểu video cho phép nó nắm bắt các chi tiết thời gian mà các phương pháp trích xuất khung hình bỏ lỡ.

Về mặt lập trình, nó mang lại cảm giác phản hồi nhanh như model GPT-4o nhưng với khả năng tuân thủ hướng dẫn tốt hơn.

Khả năng agent GUI máy tính để bàn là tính năng nổi bật ở đây cho tự động hóa thế giới thực.

Nó xử lý 120 phút video mà không mất context, điều này thực sự khổng lồ cho việc phân tích.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Qwen3.5-397B-A17B

Meo chuyen gia giup ban tan dung toi da Qwen3.5-397B-A17B va dat ket qua tot hon.

Bật Chế độ Suy nghĩ

Sử dụng tham số enable_thinking cho các tác vụ nặng về logic để kích hoạt các lộ trình reasoning nội bộ chuyên sâu.

Tận dụng Tìm kiếm Gốc

Kích hoạt tham số search body để xác thực các sự thật dựa trên dữ liệu web thời gian thực và thực thi mã python.

Tối ưu hóa Prompt Video

Cung cấp các mốc thời gian (timestamp) cụ thể để tập trung context window 1M token vào các phân đoạn liên quan nhất.

Lựa chọn Endpoint theo Khu vực

Sử dụng endpoint dashscope-intl cho người dùng bên ngoài Trung Quốc đại lục để giảm latency mạng.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Cau hoi thuong gap ve Qwen3.5-397B-A17B

Tim cau tra loi cho cac cau hoi thuong gap ve Qwen3.5-397B-A17B