Qwen 3.7 Max có giá bao nhiêu?

Input tokens có giá 1,20 đô la cho mỗi 1 triệu token, và output tokens là 6,00 đô la cho mỗi 1 triệu token. Mức giá này giúp tiết kiệm 70-80% chi phí so với các frontier model như GPT-5.5 hoặc Claude 4.7.

Sự khác biệt giữa Qwen 3.7 Max và Plus là gì?

Max là một model tập trung vào suy luận văn bản với context window 256k, trong khi Plus là một model multimodal với context window lên tới 1 triệu token.

Qwen 3.7 có hỗ trợ đầu vào là hình ảnh hoặc video không?

Phiên bản Max hiện được tối ưu hóa cho suy luận văn bản và code; người dùng có nhu cầu hỗ trợ về hình ảnh hoặc video nên sử dụng phiên bản Qwen 3.7 Plus.

Chế độ 'Always-On Thinking' là gì?

Đây là tính năng tích hợp sẵn, trong đó model thực hiện xác thực chain-of-thought nội bộ trước khi phản hồi để đảm bảo tính nhất quán về logic và giảm thiểu tình trạng ảo giác (hallucinations).

Tôi có thể chạy Qwen 3.7 Max cục bộ (locally) không?

Qwen 3.7 Max là một model độc quyền có thể truy cập thông qua API, mặc dù các phiên bản open-weight nhỏ hơn của dòng Qwen 3 vẫn có sẵn để lưu trữ cục bộ.

Context window của Qwen 3.7 Max lớn đến mức nào?

Model hỗ trợ context window lên tới 256.000 token, tương đương với khoảng 500 trang tài liệu kỹ thuật.

Model này có phù hợp để lập trình không?

Có, đây là một trong những model lập trình được đánh giá cao nhất trên toàn cầu, đạt 60,6% trên SWE-Bench Verified và 94,5% trên HumanEval.

Tôi có thể truy cập API ở đâu?

API có sẵn thông qua nền tảng DashScope của Alibaba Cloud và tương thích với định dạng OpenAI SDK tiêu chuẩn.

Qwen 3.7 Max

Qwen 3.7 Max là model AI flagship của Alibaba dành cho các tác vụ suy luận sâu và autonomous agent, với context window 256k và hiệu suất lập trình hàng đầu.

Thinking ModelHỗ trợ lập trìnhAgentic AIAlibaba CloudKiến trúc MoE

alibabaQwen320 tháng 5, 2026

Ngu canh

256Ktoken

Dau ra toi da

66Ktoken

Gia dau vao

$1.20/ 1M

Gia dau ra

$6.00/ 1M

Phuong thuc:Text

Kha nang:Cong cuTruyen truc tiepSuy luan

Diem chuan

GPQA

92.4%

HLE

38.2%

MMLU

92.8%

MMLU Pro

82%

SimpleQA

45%

IFEval

95%

AIME 2025

99.7%

MATH

94.8%

GSM8k

99.2%

MGSM

98%

SWE-Bench

60.6%

HumanEval

94.5%

LiveCodeBench

78.2%

Terminal-Bench

69.7%

ARC-AGI

12.4%

Xem tai lieu API

Ve Qwen 3.7 Max

Tim hieu ve kha nang cua Qwen 3.7 Max, tinh nang va cach no co the giup ban dat ket qua tot hon.

Công cụ suy luận cấp độ cao

Qwen 3.7 Max là một hệ thống Mixture-of-Experts khổng lồ chứa khoảng 1,6 nghìn tỷ parameters. Nó được thiết kế để vận hành như một công cụ ưu tiên logic cho các tác vụ kỹ thuật và nghiên cứu phức tạp. Model tích hợp chế độ Always-On Thinking, buộc model phải xác minh logic và lập kế hoạch các bước trước khi đưa ra phản hồi. Lựa chọn kiến trúc này giảm thiểu đáng kể sự chệch hướng logic trong các câu trả lời dài và cung cấp nền tảng đáng tin cậy cho kiến trúc phần mềm và chứng minh toán học.

Kiến trúc cho Autonomous Agency

Model này đóng vai trò là cơ sở chuyên biệt cho thế hệ các autonomous agents tiếp theo. Nó tập trung vào quản lý tác vụ dài hạn và sử dụng các công cụ phức tạp. Trong các đánh giá nội bộ, model duy trì sự mạch lạc logic xuyên suốt các phiên làm việc kéo dài hơn 30 giờ, quản lý hàng nghìn lượt tool call tuần tự để giải quyết các vấn đề kỹ thuật ở mức độ phần cứng. Mặc dù được tối ưu hóa cho văn bản và code để duy trì mật độ suy luận cao, nó vẫn dễ dàng tích hợp với các module vision hoặc audio bên ngoài thông qua việc điều phối đa tác nhân (multi-agent orchestration).

Hiệu quả trong ngữ cảnh lớn

Với context window 256.000 token, model hỗ trợ phân tích kho lưu trữ quy mô lớn và truy xuất tài liệu phức tạp. Nó duy trì độ chính xác truy xuất cao ngay cả khi cửa sổ ngữ cảnh đầy, giúp nó trở nên lý tưởng cho các quy trình RAG doanh nghiệp và tìm kiếm pháp lý. Cấu trúc giá cạnh tranh cho phép các nhà phát triển triển khai logic cấp frontier với chi phí chỉ bằng một phần nhỏ so với các model tương đương từ các phòng thí nghiệm phương Tây.

Truong hop su dung cho Qwen 3.7 Max

Kham pha cac cach khac nhau ban co the su dung Qwen 3.7 Max de dat ket qua tuyet voi.

Kỹ thuật Kernel tự động

Model tạo và tối ưu hóa các code kernel đặc thù cho phần cứng mới mà không cần tài liệu sẵn có, thông qua việc sử dụng các công cụ đệ quy.

Tái cấu trúc Repo doanh nghiệp

Qwen 3.7 Max phân tích toàn bộ các kho lưu trữ phần mềm cũ để cập nhật framework và giải quyết nợ kỹ thuật trong khi vẫn đảm bảo sự tương đương về logic.

Lập kế hoạch Agent dài hạn

Quản lý các quy trình làm việc đa bước đòi hỏi khả năng ra quyết định tự động và lập kế hoạch xuyên suốt trong các phiên làm việc kéo dài hơn 30 giờ.

Xác thực nghiên cứu khoa học

Các nhà nghiên cứu sử dụng model để xác minh các chứng minh toán học phức tạp và giải quyết các truy vấn khoa học đa giai đoạn với độ chính xác logic cao.

Mô hình hóa rủi ro tài chính nâng cao

Model xử lý hàng nghìn trang dữ liệu tài chính để xác định các điểm bất thường và dự báo ROI với khả năng suy luận có cấu trúc.

Kỹ thuật UI đa framework

Xây dựng các bản mẫu frontend chức năng với hệ thống quản lý trạng thái tích hợp và logic phức tạp trực tiếp từ các hướng dẫn ngôn ngữ tự nhiên cấp cao.

Diem manh

Han che

Hiệu suất suy luận vượt trội: Model đạt 92,4% trên GPQA, ngang bằng hoặc vượt qua các model suy luận hàng đầu với chi phí chỉ bằng một phần nhỏ.

Model flagship chỉ hỗ trợ văn bản: Phiên bản Max thiếu hỗ trợ native cho vision và audio, yêu cầu chuyển đổi model cho các tác vụ multimodal.

Khả năng làm Autonomous Agent chuyên nghiệp: Với số điểm 69,7 trên Terminal-Bench, model thể hiện sự xuất sắc trong việc điều hướng môi trường terminal thực tế và quản lý các tool call tự động.

Hạn chế về thiết kế thẩm mỹ: Mặc dù logic chặt chẽ, các giao diện UI và tài sản sáng tạo được tạo ra thường thiếu sự bóng bẩy về hình ảnh như các đối thủ như Claude.

Kiến trúc MoE quy mô lớn: Kiến trúc Mixture-of-Experts với 1,6 nghìn tỷ parameters đảm bảo mức độ chuyên biệt hóa cao cho các tác vụ đa dạng mà vẫn giữ được logic tổng quát.

Vấn đề ổn định của bản Preview: Các bản preview sớm đôi khi gặp vòng lặp logic trong việc trích xuất tài liệu cực dài so với các bản stable 3.6.

Độ chính xác khi tuân thủ hướng dẫn: Số điểm 95,0% trên IFEval chứng minh khả năng vượt trội trong việc tuân thủ các hướng dẫn về định dạng và logic phức tạp với nhiều ràng buộc.

Thiên kiến ngữ cảnh khu vực: Tài liệu và các tham chiếu văn hóa mặc định đôi khi ưu tiên thị trường phương Đông, ảnh hưởng đến một số tác vụ sáng tạo ở thị trường phương Tây.

Bat dau nhanh API

alibaba/qwen-3.7-max

Xem tai lieu

alibaba SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QWEN_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

async function runReasoningTask() {
  const completion = await client.chat.completions.create({
    model: "qwen-3.7-max",
    messages: [
      { role: "system", content: "Bạn là một kiến trúc sư phần mềm cấp cao." },
      { role: "user", content: "Phân tích kernel cũ này để tìm các race condition tiềm ẩn." }
    ],
    temperature: 0.1,
  });
  console.log(completion.choices[0].message.content);
}

runReasoningTask();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Qwen 3.7 Max

Xem cong dong nghi gi ve Qwen 3.7 Max

“Qwen 3.7 mới của Trung Quốc thật điên rồ. Nó đã xây dựng một bộ tính toán ROI SEO với 4 đầu vào phức tạp trong chưa đầy 5 phút. Thung lũng Silicon đang bắt đầu lo lắng.”

— Julian Goldie

youtube

“Qwen3.7-Max là một model với 1,6 nghìn tỷ parameters. Sự cải thiện chất lượng chỉ trong một tháng kể từ bản 3.6 là bước tiến nhanh nhất mà tôi từng thấy.”

— AJ

twitter

“Tiến bộ trong NL2Repo mới là câu chuyện chính. Họ khẳng định đã đạt được trình độ lập trình ở cấp độ repository ngang bằng với Claude Opus.”

— TeortaxesTex

twitter

“Qwen cuối cùng cũng thoát khỏi các vòng lặp overthinking của bản 3.5. Bản preview 3.7 Max quyết đoán hơn nhiều trong khi vẫn giữ được độ sâu logic.”

— LocalLLaMA

“Qwen 3.7 Max vừa trở thành model đầu tiên thực sự cạnh tranh và trong một số trường hợp đánh bại Claude Opus 4.6 trong các tác vụ kỹ thuật.”

— TechInsights

twitter

“Đã chạy được QWEN 3.6 27B cục bộ, nhưng hiệu suất cloud của 3.7 Max thực sự ở một đẳng cấp khác về suy luận phức tạp.”

— DevArchitect

hackernews

Video ve Qwen 3.7 Max

Xem huong dan, danh gia va thao luan ve Qwen 3.7 Max

“Quy trình Chain of Thought nhanh hơn đáng kể so với các phiên bản trước.”

“Đây là lần thứ hai tôi thấy một model thể hiện chính xác các vết va chạm của đạn trên phong cảnh.”

“Sự nhất quán về logic trong việc gỡ lỗi code nhiều lượt ổn định hơn rõ rệt so với bản preview 3.6.”

“Nó xử lý context window 256k với gần như không mất mát dữ liệu (needle-in-a-haystack).”

“Model này là cầu nối giữa việc hoàn thành tĩnh và lập kế hoạch tự động thực sự.”

“Context window là 256K token cho bản Max và quan trọng là nó chỉ xử lý văn bản.”

“Chúng ta thấy lượng suy nghĩ hoặc suy nghĩ thừa (overthinking) ít hơn hẳn so với bản 3.5.”

“Hiệu suất trong các môi trường terminal cho thấy nó thực sự có thể quản lý một máy chủ.”

“Qwen 3.7 Max rẻ hơn đáng kể cho các khối lượng công việc doanh nghiệp cần logic cao cấp.”

“Nó không gặp phải các vấn đề về định hướng văn hóa giống như một số model trước đó.”

“Qwen 3.7 Max Preview đứng thứ 13 tổng thể trên Text Arena.”

“Chế độ Thinking nghĩa là model chia nhỏ các vấn đề thành các bước nhỏ trước khi trả lời.”

“Nó xây dựng các máy tính phức tạp trong chưa đầy 5 phút với khả năng quản lý trạng thái hoàn hảo.”

“Model này được tối ưu hóa riêng cho Agentic AI, nghĩa là nó hành động thay vì chỉ nói chuyện.”

“Mức giá này là một đòn đánh trực diện vào sự thống trị của OpenAI trong thị trường lập trình viên.”

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent

Tu dong hoa web

Quy trinh thong minh

Bat dau mien phi

Meo chuyen nghiep cho Qwen 3.7 Max

Meo chuyen gia giup ban tan dung toi da Qwen 3.7 Max va dat ket qua tot hon.

Thực thi xác thực logic

Hãy thêm yêu cầu 'Xác minh các bước suy nghĩ của bạn trước khi cung cấp code cuối cùng' để kích hoạt chế độ suy luận chuyên sâu của model.

Sử dụng context caching

Đối với các tác vụ liên quan đến cùng một codebase khổng lồ, hãy sử dụng context caching để giảm latency và chi phí cho input tokens.

Định nghĩa danh sách kiểm tra (checklists) theo giai đoạn

Cung cấp danh sách kiểm tra được đánh số cho các tác vụ dài để đảm bảo model không bỏ sót các bước trung gian trong quá trình tạo nội dung dài.

Thiết kế tham số ràng buộc

Khi tạo UI, hãy cung cấp các biến CSS cụ thể để tạo kiểu, nhằm bù đắp cho việc model tập trung vào logic hơn là thẩm mỹ.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context

$5.00/$25.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context

$0.75/$4.50/1M

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Cau hoi thuong gap ve Qwen 3.7 Max

Tim cau tra loi cho cac cau hoi thuong gap ve Qwen 3.7 Max