alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B là mô hình MoE open-weight flagship của Alibaba. Nó có tính năng lập luận đa phương thức nguyên bản, cửa sổ 1M context và tốc độ giải mã gấp...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516 Tháng 2, 2026
Ngu canh
1.0Mtoken
Dau ra toi da
8Ktoken
Gia dau vao
$0.60/ 1M
Gia dau ra
$3.60/ 1M
Phuong thuc:TextImageVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
88.4%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Qwen3.5-397B-A17B dat 88.4% trong benchmark nay.
HLE
28.7%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Qwen3.5-397B-A17B dat 28.7% trong benchmark nay.
MMLU
88.6%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Qwen3.5-397B-A17B dat 88.6% trong benchmark nay.
MMLU Pro
87.8%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Qwen3.5-397B-A17B dat 87.8% trong benchmark nay.
SimpleQA
48%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Qwen3.5-397B-A17B dat 48% trong benchmark nay.
IFEval
92.6%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Qwen3.5-397B-A17B dat 92.6% trong benchmark nay.
AIME 2025
91.3%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Qwen3.5-397B-A17B dat 91.3% trong benchmark nay.
MATH
74.1%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Qwen3.5-397B-A17B dat 74.1% trong benchmark nay.
GSM8k
93.7%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Qwen3.5-397B-A17B dat 93.7% trong benchmark nay.
MGSM
92.1%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Qwen3.5-397B-A17B dat 92.1% trong benchmark nay.
MathVista
90.3%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Qwen3.5-397B-A17B dat 90.3% trong benchmark nay.
SWE-Bench
76.4%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Qwen3.5-397B-A17B dat 76.4% trong benchmark nay.
HumanEval
79.3%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Qwen3.5-397B-A17B dat 79.3% trong benchmark nay.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Qwen3.5-397B-A17B dat 83.6% trong benchmark nay.
MMMU
85%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Qwen3.5-397B-A17B dat 85% trong benchmark nay.
MMMU Pro
79%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Qwen3.5-397B-A17B dat 79% trong benchmark nay.
ChartQA
86.5%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Qwen3.5-397B-A17B dat 86.5% trong benchmark nay.
DocVQA
93.2%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Qwen3.5-397B-A17B dat 93.2% trong benchmark nay.
Terminal-Bench
52.5%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Qwen3.5-397B-A17B dat 52.5% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Qwen3.5-397B-A17B dat 12% trong benchmark nay.

Ve Qwen3.5-397B-A17B

Tim hieu ve kha nang cua Qwen3.5-397B-A17B, tinh nang va cach no co the giup ban dat ket qua tot hon.

Mixture of Experts hiệu suất cao

Qwen3.5-397B-A17B là một flagship multimodal model nguyên bản sử dụng kiến trúc hybrid sáng tạo, kết hợp attention tuyến tính thông qua Gated Delta Networks với Mixture-of-Experts (MoE) thưa. Mặc dù chứa tổng cộng 397 tỷ parameters, thiết kế thưa của nó chỉ kích hoạt 17 tỷ parameters mỗi forward pass, đạt được hiệu suất suy luận và tốc độ vượt trội mà không làm giảm khả năng lập luận mạnh mẽ của nó. Nó được tối ưu hóa cho cả ngôn ngữ và thị giác, hỗ trợ từ vựng khổng lồ lên tới 250k tokens và hỗ trợ hơn 201 ngôn ngữ và phương ngữ.

Quy trình làm việc Agentic đa phương thức nguyên bản

Mô hình này xuất sắc trong vai trò một multimodal agent nguyên bản, có khả năng xử lý tới 1 triệu tokens context, tương đương với khoảng hai giờ video. Nó giới thiệu Thinking Mode chuyên dụng cho các lập luận logic phức tạp và được trang bị sẵn cho các quy trình làm việc agentic, bao gồm phát triển web, điều hướng GUI và trí tuệ không gian thực tế. Kiến trúc của nó hỗ trợ huấn luyện FP8 end-to-end và khung huấn luyện-suy luận phân tách, biến nó thành một trong những mô hình có khả năng mở rộng và hiệu quả nhất cho các ứng dụng AI doanh nghiệp.

Open Weights cho khả năng truy cập toàn cầu

Được phát hành theo giấy phép Apache 2.0, mô hình này cung cấp cho cộng đồng open-source các khả năng cấp frontier trước đây chỉ giới hạn ở các hệ thống đóng. Nó thu hẹp khoảng cách giữa số lượng parameters khổng lồ và việc triển khai thực tế, cho phép các tổ chức thực hiện các tác vụ lập luận state-of-the-art trên cơ sở hạ tầng riêng tư với chi phí tính toán thấp hơn đáng kể so với các lựa chọn 400B dày đặc khác.

Qwen3.5-397B-A17B

Truong hop su dung cho Qwen3.5-397B-A17B

Kham pha cac cach khac nhau ban co the su dung Qwen3.5-397B-A17B de dat ket qua tuyet voi.

Phân tích video dài

Phân tích nội dung video lên đến hai giờ để trích xuất logic, reverse-engineer code từ cảnh quay hoặc tạo tóm tắt có cấu trúc.

Nghiên cứu STEM trình độ Tiến sĩ

Giải các bài toán khoa học cấp Tiến sĩ và các bài toán Olympic bằng chế độ lập luận chuyên sâu thích ứng.

Tác nhân GUI tự hành

Tự động hóa các tương tác với điện thoại thông minh và máy tính để xử lý quy trình làm việc văn phòng và điều hướng ứng dụng di động.

Kỹ thuật phần mềm thị giác

Thực hiện 'vibe coding' bằng cách chuyển đổi các hướng dẫn ngôn ngữ tự nhiên và bản phác thảo UI thành code frontend chức năng.

Trí tuệ tài liệu

Xử lý các tài liệu, biểu đồ và bản phác thảo viết tay phức tạp để trích xuất dữ liệu có cấu trúc và reverse-engineer bố cục.

Ứng dụng AI không gian

Hiểu các mối quan hệ ở cấp độ pixel cho các tác vụ AI hiện thân (embodied AI) như phân tích cảnh lái xe tự động và điều hướng robot.

Diem manh

Han che

Hỗ trợ video vượt trội: Hỗ trợ 1 triệu tokens, cho phép xử lý nguyên bản tới 120 phút video cho các tác vụ agentic và lập trình.
Rào cản phần cứng khổng lồ: Việc triển khai đầy đủ yêu cầu các cụm GPU cấp máy chủ với hơn 800GB VRAM cho độ chính xác 16-bit không nén.
Hiệu suất suy luận MoE: Kiến trúc 397B tổng/17B active mang lại tốc độ giải mã (decoding throughput) tăng gấp 19 lần so với các flagship model dày đặc trước đây.
Khoảng cách kiến thức HLE: Mặc dù đạt điểm cao trong khoa học và toán học, mô hình chỉ đạt 28.7% trong Humanity's Last Exam (HLE), cho thấy khoảng cách về tính chính xác tuyệt đối.
Lập luận đỉnh cao (State-of-the-art): Đạt 91.3% trên AIME và 88.4% trên GPQA, cạnh tranh với các mô hình closed-source hàng đầu trong khoa học và toán học trình độ Tiến sĩ.
Quá tự tin vào công cụ: Trong các kịch bản agent tự hành, mô hình đôi khi tạo ra kết quả công cụ ảo (hallucinated) hoặc bỏ qua kết quả để ưu tiên dự đoán nội bộ.
Open Weights theo giấy phép Apache 2.0: Cung cấp trí tuệ cấp frontier với sự tự do của open weights, cho phép triển khai riêng tư, on-premise.
Hiệu suất tác vụ terminal: Đạt 52.5% trên Terminal-Bench 2.0, xếp sau các đối thủ trong các tác vụ tương tác dòng lệnh phức tạp.

Bat dau nhanh API

alibaba/qwen3.5-plus

Xem tai lieu
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Qwen3.5-397B-A17B

Xem cong dong nghi gi ve Qwen3.5-397B-A17B

Qwen3.5-397B về cơ bản là mô hình đẳng cấp GPT-5 nhưng là open-weight. Kiến trúc DeltaNet đang giải quyết triệt để các vấn đề latency của MoE.
u/DeepLearningLover
reddit
Lập luận đa phương thức nguyên bản trên Qwen3.5 trông thật đáng kinh ngạc. 1M context + phân tích video sẽ thay đổi quy trình làm việc của các agent.
@AiDevDaily
twitter
Quyết định sử dụng huấn luyện FP8 end-to-end trong khi vẫn duy trì BF16 ở các lớp nhạy cảm là một đỉnh cao của việc tối ưu hóa sự ổn định.
cold_fusion
hackernews
Đây là lần đầu tiên tôi thấy một mô hình open thực sự đánh bại Gemini 1.5 Pro trong các tác vụ agent multimodal phức tạp.
AI Revolution
youtube
Tốc độ giải mã tăng gấp 19 lần so với Qwen3-Max khiến đây trở thành sự thay thế khả thi cho các agent cấp độ sản xuất.
u/ModelTester2026
reddit
Tôi ngạc nhiên về khả năng xử lý quantization 4-bit của nó. Nó giữ lại gần như toàn bộ khả năng lập luận trên cụm A100 kép.
@GlobalTechReview
twitter

Video ve Qwen3.5-397B-A17B

Xem huong dan, danh gia va thao luan ve Qwen3.5-397B-A17B

Một mô hình 397 tỷ parameters, nhưng chỉ 17 tỷ parameters được active.

Khi giải mã ở 256K, mô hình này nhanh gấp 19 lần so với Qwen 3 Max.

Khả năng lập luận đa phương thức nguyên bản là điểm khác biệt cho các quy trình làm việc của agent.

Nó đánh bại hầu hết các mô hình closed trên các bài kiểm tra toán tiêu chuẩn.

Chạy cục bộ rất khó, nhưng các phiên bản quantized có thể hoạt động trên các máy Mac cấu hình cao.

Mô hình 397 tỷ parameters với 17 tỷ active parameters. Nó là multimodal nguyên bản.

Đây có lẽ là mô hình multimodal open-source tốt nhất hiện nay.

Khả năng xử lý hai giờ video nguyên bản là một lợi thế khổng lồ.

Nhìn vào điểm logic này, nó liên tục đạt mức GPT-4o.

Giấy phép Apache làm cho nó rất hấp dẫn đối với bảo mật dữ liệu doanh nghiệp.

Trích xuất cấu trúc OCR. Bạn có một tệp PDF lộn xộn... và bạn cần biến nó thành JSON sạch. Mô hình này rất giỏi việc đó.

Bạn nhận được trí tuệ của một gã khổng lồ 400 tỷ parameters... nhưng trả chi phí tính toán của mô hình 17 tỷ parameters.

Nó xử lý việc truy xuất context dài tốt hơn phiên bản trước.

Việc tích hợp sử dụng công cụ được xây dựng ngay trong training cơ bản, không phải là tính năng thêm vào.

Chế độ Thinking cho phép nó tự sửa lỗi logic trước khi xuất câu trả lời.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Qwen3.5-397B-A17B

Meo chuyen gia giup ban tan dung toi da Qwen3.5-397B-A17B va dat ket qua tot hon.

Bật chế độ Thinking Mode

Thêm tham số 'enable_thinking: true' vào lệnh gọi API của bạn để kích hoạt khả năng lập luận chuyên sâu cho toán học, lập trình và các câu đố logic phức tạp.

Sử dụng Fast Mode

Sử dụng chế độ 'Fast' cho các truy vấn đơn giản để nhận câu trả lời tức thì mà không tiêu tốn tokens vào các giai đoạn suy nghĩ nội bộ không cần thiết.

Tối ưu hóa video prompt

Khi phân tích video, hãy prompt mô hình tập trung vào kết quả động cuối cùng thay vì phân tích từng khung hình để đạt được sự nhất quán về mặt thời gian tốt hơn.

Tận dụng định lượng (Quantization)

Sử dụng quantization 4-bit hoặc 8-bit (GGUF/EXL2) để chạy mô hình trên phần cứng phổ thông nếu bạn có đủ VRAM (200GB+).

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Cau hoi thuong gap ve Qwen3.5-397B-A17B

Tim cau tra loi cho cac cau hoi thuong gap ve Qwen3.5-397B-A17B