alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B adalah model MoE open-weight flagship dari Alibaba. Menghadirkan reasoning multimodal native, context window 1M, dan peningkatan throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen2026-02-16
Konteks
1.0Mtoken
Output maks.
8Ktoken
Harga input
$0.60/ 1M
Harga output
$3.60/ 1M
Modalitas:TextImageVideo
Kemampuan:VisiAlatStreamingPenalaran
Benchmarks
GPQA
88.4%
GPQA: Tanya Jawab Sains Tingkat Doktoral. Benchmark ketat dengan 448 pertanyaan pilihan ganda dalam biologi, fisika, dan kimia yang dibuat oleh pakar domain. Para ahli PhD hanya mencapai akurasi 65-74%, sementara non-ahli hanya mendapat 34% bahkan dengan akses web tak terbatas (sehingga disebut 'tahan Google'). Qwen3.5-397B-A17B meraih skor 88.4% pada benchmark ini.
HLE
28.7%
HLE: Penalaran Keahlian Tingkat Tinggi. Menguji kemampuan model untuk mendemonstrasikan penalaran tingkat ahli di domain khusus. Mengevaluasi pemahaman mendalam tentang topik kompleks yang membutuhkan pengetahuan tingkat profesional. Qwen3.5-397B-A17B meraih skor 28.7% pada benchmark ini.
MMLU
88.6%
MMLU: Pemahaman Bahasa Multitugas Masif. Benchmark komprehensif dengan 16.000 pertanyaan pilihan ganda meliputi 57 mata pelajaran akademik termasuk matematika, filsafat, hukum, dan kedokteran. Menguji pengetahuan luas dan kemampuan penalaran. Qwen3.5-397B-A17B meraih skor 88.6% pada benchmark ini.
MMLU Pro
87.8%
MMLU Pro: MMLU Edisi Profesional. Versi MMLU yang ditingkatkan dengan 12.032 pertanyaan menggunakan format 10 pilihan yang lebih sulit. Mencakup Matematika, Fisika, Kimia, Hukum, Teknik, Ekonomi, Kesehatan, Psikologi, Bisnis, Biologi, Filsafat, dan Ilmu Komputer. Qwen3.5-397B-A17B meraih skor 87.8% pada benchmark ini.
SimpleQA
48%
SimpleQA: Benchmark Akurasi Faktual. Menguji kemampuan model untuk memberikan respons yang akurat dan faktual terhadap pertanyaan langsung. Mengukur keandalan dan mengurangi halusinasi dalam tugas pengambilan pengetahuan. Qwen3.5-397B-A17B meraih skor 48% pada benchmark ini.
IFEval
92.6%
IFEval: Evaluasi Kepatuhan Instruksi. Mengukur seberapa baik model mengikuti instruksi dan batasan tertentu. Menguji kemampuan untuk mematuhi aturan format, batas panjang, dan persyaratan eksplisit lainnya. Qwen3.5-397B-A17B meraih skor 92.6% pada benchmark ini.
AIME 2025
91.3%
AIME 2025: Ujian Matematika Undangan Amerika. Soal matematika tingkat kompetisi dari ujian AIME bergengsi yang dirancang untuk siswa SMA berbakat. Menguji pemecahan masalah matematika tingkat lanjut yang membutuhkan penalaran abstrak, bukan sekadar pencocokan pola. Qwen3.5-397B-A17B meraih skor 91.3% pada benchmark ini.
MATH
74.1%
MATH: Pemecahan Masalah Matematika. Benchmark matematika komprehensif yang menguji pemecahan masalah dalam aljabar, geometri, kalkulus, dan domain matematika lainnya. Membutuhkan penalaran multi-langkah dan pengetahuan matematika formal. Qwen3.5-397B-A17B meraih skor 74.1% pada benchmark ini.
GSM8k
93.7%
GSM8k: Matematika SD 8K. 8.500 soal cerita matematika tingkat SD yang membutuhkan penalaran multi-langkah. Menguji aritmatika dasar dan pemikiran logis melalui skenario dunia nyata seperti belanja atau perhitungan waktu. Qwen3.5-397B-A17B meraih skor 93.7% pada benchmark ini.
MGSM
92.1%
MGSM: Matematika SD Multibahasa. Benchmark GSM8k yang diterjemahkan ke 10 bahasa termasuk Spanyol, Prancis, Jerman, Rusia, Cina, dan Jepang. Menguji penalaran matematika dalam berbagai bahasa. Qwen3.5-397B-A17B meraih skor 92.1% pada benchmark ini.
MathVista
90.3%
MathVista: Penalaran Matematika Visual. Menguji kemampuan untuk menyelesaikan masalah matematika yang melibatkan elemen visual seperti grafik, diagram geometri, dan figur ilmiah. Menggabungkan pemahaman visual dengan penalaran matematika. Qwen3.5-397B-A17B meraih skor 90.3% pada benchmark ini.
SWE-Bench
76.4%
SWE-Bench: Benchmark Rekayasa Perangkat Lunak. Model AI mencoba menyelesaikan masalah GitHub nyata dalam proyek Python open-source dengan verifikasi manusia. Menguji keterampilan rekayasa perangkat lunak praktis pada codebase produksi. Model terbaik meningkat dari 4,4% di 2023 menjadi lebih dari 70% di 2024. Qwen3.5-397B-A17B meraih skor 76.4% pada benchmark ini.
HumanEval
79.3%
HumanEval: Masalah Pemrograman Python. 164 masalah pemrograman yang ditulis tangan di mana model harus menghasilkan implementasi fungsi Python yang benar. Setiap solusi diverifikasi dengan unit test. Model terbaik sekarang mencapai akurasi lebih dari 90%. Qwen3.5-397B-A17B meraih skor 79.3% pada benchmark ini.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark Koding Langsung. Menguji kemampuan koding pada tantangan pemrograman dunia nyata yang terus diperbarui. Berbeda dengan benchmark statis, menggunakan masalah baru untuk mencegah kontaminasi data dan mengukur keterampilan koding yang sebenarnya. Qwen3.5-397B-A17B meraih skor 83.6% pada benchmark ini.
MMMU
85%
MMMU: Pemahaman Multimodal. Benchmark Pemahaman Multimodal Multi-disiplin Masif yang menguji model penglihatan-bahasa pada masalah tingkat universitas di 30 mata pelajaran yang membutuhkan pemahaman gambar dan pengetahuan ahli. Qwen3.5-397B-A17B meraih skor 85% pada benchmark ini.
MMMU Pro
79%
MMMU Pro: MMMU Edisi Profesional. Versi MMMU yang ditingkatkan dengan pertanyaan lebih sulit dan evaluasi lebih ketat. Menguji penalaran multimodal tingkat lanjut di tingkat profesional dan ahli. Qwen3.5-397B-A17B meraih skor 79% pada benchmark ini.
ChartQA
86.5%
ChartQA: Tanya Jawab Grafik. Menguji kemampuan untuk memahami dan bernalar tentang informasi yang disajikan dalam grafik dan diagram. Membutuhkan ekstraksi data, perbandingan nilai, dan melakukan perhitungan dari representasi visual data. Qwen3.5-397B-A17B meraih skor 86.5% pada benchmark ini.
DocVQA
93.2%
DocVQA: Tanya Jawab Visual Dokumen. Benchmark Tanya Jawab Visual Dokumen yang menguji kemampuan untuk mengekstrak dan bernalar tentang informasi dari gambar dokumen termasuk formulir, laporan, dan teks yang dipindai. Qwen3.5-397B-A17B meraih skor 93.2% pada benchmark ini.
Terminal-Bench
52.5%
Terminal-Bench: Tugas Terminal/CLI. Menguji kemampuan untuk melakukan operasi baris perintah, menulis skrip shell, dan menavigasi lingkungan terminal. Mengukur keterampilan administrasi sistem praktis dan alur kerja pengembangan. Qwen3.5-397B-A17B meraih skor 52.5% pada benchmark ini.
ARC-AGI
12%
ARC-AGI: Abstraksi dan Penalaran. Abstraction and Reasoning Corpus untuk AGI - menguji kecerdasan fluida melalui teka-teki pengenalan pola baru. Setiap tugas membutuhkan penemuan aturan yang mendasari dari contoh, mengukur kemampuan penalaran umum daripada menghafal. Qwen3.5-397B-A17B meraih skor 12% pada benchmark ini.

Tentang Qwen3.5-397B-A17B

Pelajari tentang kemampuan, fitur, dan cara menggunakan Qwen3.5-397B-A17B.

Lompatan Monumental dalam Open AI

Qwen3.5-397B-A17B mewakili lompatan monumental dalam strategi AI Alibaba Cloud, bertransformasi dari penantang open-source yang kuat menjadi sistem frontier model yang dominan yang dirancang untuk era agentic AI. Dirilis pada 16 Februari 2026, ini adalah flagship dari seri Qwen3.5, yang menggunakan arsitektur Mixture-of-Experts (MoE) masif dengan 397 miliar parameters. Dengan hanya mengaktifkan 17 miliar parameters per token, model ini mencapai peningkatan throughput decoding 19x yang belum pernah terjadi sebelumnya dibandingkan pendahulunya, Qwen3-Max, sekaligus memperkecil celah performa dengan model tertutup tercanggih di dunia.

Kekuatan Multimodal Terpadu

Model ini adalah pusat kekuatan multimodal native yang terpadu. Berbeda dengan versi sebelumnya yang memerlukan adapter vision-language terpisah, Qwen3.5 menghadirkan multimodality early-fusion yang dilatih pada triliunan token multimodal. Hal ini memungkinkannya untuk menonton dan melakukan reasoning atas konten video berdurasi lebih dari dua jam, beroperasi sebagai agen GUI di berbagai antarmuka desktop dan seluler, serta menangani tugas coding yang kompleks dalam mode Thinking khusus. Dengan kosakata yang diperluas menjadi 250.000 token yang mendukung 201 bahasa, model ini berdiri sebagai pilihan global utama untuk otomatisasi multibahasa dan multimodal.

Dirancang untuk Era Agentic

Lebih dari sekadar chat sederhana, Qwen3.5-397B dioptimalkan untuk penggunaan alat dan alur kerja otonom. Skor tingginya dalam benchmark function-calling dan kepatuhan instruksi menjadikannya tulang punggung ideal untuk rekayasa perangkat lunak visual dan riset tingkat PhD. Dengan menawarkan performa state-of-the-art di bawah lisensi Apache 2.0, Alibaba telah memberikan alternatif berefisiensi tinggi yang kredibel bagi komunitas dibandingkan model closed-source yang paling dibatasi.

Qwen3.5-397B-A17B

Kasus Penggunaan untuk Qwen3.5-397B-A17B

Temukan berbagai cara menggunakan Qwen3.5-397B-A17B untuk hasil yang luar biasa.

Agen GUI Otonom

Menavigasi antarmuka PC dan smartphone yang kompleks untuk menyelesaikan alur kerja otomatisasi kantor multi-langkah.

Inteligensi Video Durasi Panjang

Mengekstraksi reasoning kausal yang mendalam dan ringkasan dari file video kontinu berdurasi hingga 120 menit.

Vibe Coding & Prototyping

Menerjemahkan sketsa UI secara langsung menjadi logika frontend dan React yang siap produksi dalam satu kali percobaan.

Riset Tingkat PhD

Menyelesaikan masalah STEM tingkat pascasarjana menggunakan mode Thinking dengan chain-of-thought internal yang terspesialisasi.

Dukungan Global Multibahasa

Melayani pengguna dalam 201 bahasa dengan efisiensi tokenization yang unggul untuk skrip non-Inggris.

Rekayasa Perangkat Lunak Visual

Mengubah wireframe dan screenshot menjadi kode HTML, CSS, dan JavaScript yang bersih dan responsif terhadap tata letak.

Kelebihan

Keterbatasan

Efisiensi Inference: Mencapai peningkatan throughput decoding sebesar 19x dengan hanya mengaktifkan 17B parameters melalui arsitektur MoE hibridanya.
Kebutuhan Hardware yang Masif: Dengan total 397B parameters, menjalankan versi tanpa kuantisasi secara lokal memerlukan infrastruktur kelas server tingkat tinggi.
Reasoning Video Native: Memproses video kontinu hingga 120 menit secara native tanpa memerlukan adapter ekstraksi frame.
Kesenjangan Modalitas Audio: Kurang memiliki kemampuan input dan output audio native seperti yang ditemukan pada model 'omni' seperti GPT-4o atau Gemini.
Kemampuan STEM Kelas Atas: Menyaingi model reasoning berpemilik dengan skor 88,4% pada GPQA dan 91,3% pada ujian matematika AIME 2025.
Kesenjangan Performa HLE: Masih tertinggal dari pemimpin model tertutup pada Humanity's Last Exam (28,7%), menunjukkan adanya celah dalam pengetahuan ahli yang spesifik.
Aksesibilitas Open-Weight: Menyediakan inteligensi multimodal tingkat frontier di bawah lisensi Apache 2.0 untuk penerapan perusahaan swasta.
Penggunaan Memori: Skala yang masif membutuhkan VRAM yang substansial bahkan dengan sparsitas, membatasi penyebaran luas di tingkat konsumen.

Mulai Cepat API

alibaba/qwen-3.5-plus

Lihat Dokumentasi
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instal SDK dan mulai melakukan panggilan API dalam hitungan menit.

Apa Kata Orang Tentang Qwen3.5-397B-A17B

Lihat apa yang dipikirkan komunitas tentang Qwen3.5-397B-A17B

Qwen3.5-397B pada dasarnya adalah jawaban komunitas open-source untuk GPT-4o. Kemampuan SVG-nya saja sudah luar biasa untuk desain web.
u/LLM_Reviewer
reddit
Peningkatan throughput 19x membuat Qwen3.5 terasa jauh lebih responsif dibandingkan model lain seukurannya yang pernah saya uji.
tech_enthusiast_99
reddit
Apache 2.0 untuk model sebesar ini adalah pengubah permainan total bagi pengembangan AI lokal dan perusahaan yang fokus pada privasi.
TechInnovator88
twitter
Routing MoE pada model 3.5-397B ini terasa jauh lebih cerdas daripada generasi 2.5 sebelumnya; model ini benar-benar mengikuti logika.
DistanceSolar1449
reddit
Konteks 1M pada model open-weight sekaliber ini belum pernah terjadi sebelumnya dalam ekosistem saat ini.
dev_logic
hackernews
Reasoning videonya bukan sekadar frame-demi-frame; ini adalah pemahaman temporal aktual yang terasa jauh di depan vision LLM saat ini.
Matthew Berman (Context)
youtube

Video Tentang Qwen3.5-397B-A17B

Tonton tutorial, ulasan, dan diskusi tentang Qwen3.5-397B-A17B

Model ini mengalahkan Claude Opus 4.5 pada komputasi browser serta Gemini 3 Pro dalam beberapa tugas multimodal.

Kabarnya 19 kali lebih cepat daripada Qwen 3 Max yang mendukung 201 bahasa dan dialek.

Model ini melakukan pekerjaan yang sangat luar biasa dengan kupu-kupu fotorealistik... lebih baik daripada kebanyakan model open-source lainnya.

Model 397B pada dasarnya adalah model open-weights pertama yang benar-benar bersaing di frontier AGI.

Penskalaan dengan MoE jelas berhasil bagi Alibaba dan hasil benchmark terbaru mereka membuktikannya.

Model ini menyamai apa yang mampu dilakukan oleh Qwen Max... tetapi mampu melakukannya dengan peningkatan kecepatan hingga 19x.

Tokenizernya kini telah mencapai vocab sebesar 250K... setara dengan Gemini dan tokenizer Google.

Anda harus menganggap tim Qwen sebagai Frontier Lab... mereka merambah ke tugas-tugas yang menjadi fokus lab berpemilik.

Tokenization jauh lebih efisien untuk skrip non-Latin dibandingkan dengan iterasi Llama sebelumnya.

Mode Thinking menambah latency yang signifikan tetapi peningkatan akurasinya sangat sepadan untuk coding dan reasoning.

Ini adalah vision language model yang terpadu... di mana model sebelumnya memiliki varian VL yang spesifik, model ini memiliki segalanya dalam satu model tunggal.

Pemahaman video memungkinkannya menangkap detail temporal yang terlewatkan oleh metode ekstraksi frame.

Dalam hal coding, model ini terasa secepat model GPT-4o tetapi dengan kepatuhan instruksi yang lebih baik.

Kemampuan agen GUI desktop adalah fitur unggulan di sini untuk otomatisasi dunia nyata.

Model ini menangani 120 menit video tanpa kehilangan konteks, yang sangat masif untuk analisis.

Lebih dari sekadar prompt

Tingkatkan alur kerja Anda dengan Otomatisasi AI

Automatio menggabungkan kekuatan agen AI, otomatisasi web, dan integrasi cerdas untuk membantu Anda mencapai lebih banyak dalam waktu lebih singkat.

Agen AI
Otomasi Web
Alur Kerja Cerdas

Tips Pro untuk Qwen3.5-397B-A17B

Tips ahli untuk memaksimalkan Qwen3.5-397B-A17B.

Aktifkan Mode Berpikir

Gunakan parameter enable_thinking untuk tugas yang berat secara logika guna mengaktifkan jalur reasoning internal yang mendalam.

Manfaatkan Pencarian Native

Aktifkan parameter search body untuk memverifikasi fakta terhadap data web real-time dan mengeksekusi kode python.

Optimalkan Video Prompts

Berikan anchor timestamp yang spesifik untuk memfokuskan context window 1M token pada segmen yang paling relevan.

Pemilihan Endpoint Regional

Gunakan endpoint dashscope-intl bagi pengguna di luar Tiongkok daratan untuk mengurangi latency jaringan.

Testimoni

Apa Kata Pengguna Kami

Bergabunglah dengan ribuan pengguna puas yang telah mengubah alur kerja mereka

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Terkait AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Pertanyaan yang Sering Diajukan tentang Qwen3.5-397B-A17B

Temukan jawaban untuk pertanyaan umum tentang Qwen3.5-397B-A17B