alibaba

Qwen3.5-Omni

Qwen3.5-Omni คือ AI แบบ omnimodal จาก Alibaba Cloud มอบการใช้เหตุผลผ่านภาพและเสียง แชทเสียงแบบ real-time และ context 256k สำหรับแอปที่เน้นความหน่วงต่ำ

OmnimodalReal-time VoiceVideo VisionAlibaba CloudMoE
alibaba logoalibabaQwen3.529 มีนาคม 2026
บริบท
256Kโทเคน
เอาต์พุตสูงสุด
8Kโทเคน
ราคาอินพุต
$0.40/ 1M
ราคาเอาต์พุต
$4.80/ 1M
โหมด:TextImageAudioVideo
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่ง
เกณฑ์มาตรฐาน
GPQA
83.9%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Qwen3.5-Omni ได้คะแนน 83.9% ในเกณฑ์มาตรฐานนี้
HLE
34.2%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง Qwen3.5-Omni ได้คะแนน 34.2% ในเกณฑ์มาตรฐานนี้
MMLU
94.2%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Qwen3.5-Omni ได้คะแนน 94.2% ในเกณฑ์มาตรฐานนี้
MMLU Pro
85.9%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Qwen3.5-Omni ได้คะแนน 85.9% ในเกณฑ์มาตรฐานนี้
SimpleQA
48.2%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง Qwen3.5-Omni ได้คะแนน 48.2% ในเกณฑ์มาตรฐานนี้
IFEval
89.7%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Qwen3.5-Omni ได้คะแนน 89.7% ในเกณฑ์มาตรฐานนี้
AIME 2025
81.6%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Qwen3.5-Omni ได้คะแนน 81.6% ในเกณฑ์มาตรฐานนี้
MATH
90.4%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Qwen3.5-Omni ได้คะแนน 90.4% ในเกณฑ์มาตรฐานนี้
GSM8k
94.5%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Qwen3.5-Omni ได้คะแนน 94.5% ในเกณฑ์มาตรฐานนี้
MGSM
94.1%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Qwen3.5-Omni ได้คะแนน 94.1% ในเกณฑ์มาตรฐานนี้
MathVista
86.1%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Qwen3.5-Omni ได้คะแนน 86.1% ในเกณฑ์มาตรฐานนี้
SWE-Bench
75%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Qwen3.5-Omni ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
HumanEval
91.2%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Qwen3.5-Omni ได้คะแนน 91.2% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
65.6%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Qwen3.5-Omni ได้คะแนน 65.6% ในเกณฑ์มาตรฐานนี้
MMMU
80.1%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Qwen3.5-Omni ได้คะแนน 80.1% ในเกณฑ์มาตรฐานนี้
MMMU Pro
73.9%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Qwen3.5-Omni ได้คะแนน 73.9% ในเกณฑ์มาตรฐานนี้
ChartQA
85.3%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Qwen3.5-Omni ได้คะแนน 85.3% ในเกณฑ์มาตรฐานนี้
DocVQA
95.2%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Qwen3.5-Omni ได้คะแนน 95.2% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
52.5%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Qwen3.5-Omni ได้คะแนน 52.5% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12.5%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Qwen3.5-Omni ได้คะแนน 12.5% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ Qwen3.5-Omni

เรียนรู้เกี่ยวกับความสามารถของ Qwen3.5-Omni คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

สถาปัตยกรรม Omnimodal แบบรวมศูนย์

Qwen3.5-Omni คือโมเดลแบบ omnimodal โดยกำเนิดที่พัฒนาโดย Alibaba Cloud สร้างขึ้นบนสถาปัตยกรรมรวมที่ออกแบบมาเพื่อประมวลผลอินพุตข้อความ รูปภาพ เสียง และวิดีโอพร้อมกัน ไม่เหมือนกับโมเดลก่อนหน้าที่อาศัยตัวเข้ารหัสแยกส่วน Qwen3.5-Omni ใช้สถาปัตยกรรม Thinker-Talker องค์ประกอบ Thinker จะทำหน้าที่ใช้เหตุผลแบบ multimodal ที่ซับซ้อนผ่านสัญญาณที่สลับซับซ้อน ในขณะที่องค์ประกอบ Talker จะสร้างเสียงพูดแบบสตรีมคุณภาพสูงที่มีความหน่วงต่ำ สิ่งนี้ช่วยให้โมเดลจัดการ context จำนวนมหาศาล รวมถึงเสียงได้นานสูงสุด 10 ชั่วโมง หรือวิดีโอ 720p นานเกือบ 7 นาทีใน prompt เดียว

การประสานและการทำงานขั้นสูง

ฟีเจอร์ทางเทคนิคของโมเดลนี้คือระบบ Adaptive Rate Interleave Alignment (ARIA) ซึ่งจะประสาน token ข้อความและเสียงเพื่อให้แน่ใจว่าได้การตอบสนองด้วยเสียงที่ฟังดูเป็นธรรมชาติ โมเดลรองรับการขัดจังหวะเชิงความหมายแบบ real-time ทำให้ผู้ใช้สามารถขัดจังหวะ AI ระหว่างบทสนทนาได้ มันได้รับการปรับให้เหมาะสมสำหรับการวิเคราะห์ multimodal ระดับองค์กรและผู้ช่วยเสียง real-time สำหรับผู้ใช้ทั่วไป โดยมอบคุณภาพการทำงานด้านภาพและเสียงที่เทียบเท่าหรือเหนือกว่าโมเดลเรือธงที่เป็นกรรมสิทธิ์

ปรับแต่งเพื่อการโต้ตอบที่หน่วงต่ำ

สถาปัตยกรรมของโมเดลได้รับการปรับแต่งเป็นพิเศษสำหรับแอปพลิเคชัน real-time ที่ความหน่วงมีความสำคัญมาก โดยการใช้แนวทาง Mixture-of-Experts (MoE) กับสถาปัตยกรรมแบบ gated delta networks โมเดลจึงรักษาประสิทธิภาพการประมวลผลสูงไว้ได้ ประสิทธิภาพนี้ช่วยให้สามารถโต้ตอบด้วยเสียงแบบ real-time ในขณะที่จัดการกับ context window ขนาด 256k token ทำให้เหมาะสำหรับการวิเคราะห์เนื้อหาขนาดยาว เช่น บันทึกการประชุมและการทำดัชนีวิดีโอเชิงภาพยนตร์

Qwen3.5-Omni

กรณีการใช้งานสำหรับ Qwen3.5-Omni

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Qwen3.5-Omni เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

ผู้ช่วยเสียงแบบ Real-time

โมเดลช่วยสร้าง AI อวตารที่โต้ตอบด้วยเสียงอย่างเป็นธรรมชาติ พร้อมรองรับการขัดจังหวะเชิงความหมาย

การบรรยายวิดีโอเชิงภาพยนตร์

สร้างคำอธิบายระดับบทภาพยนตร์และใส่คำบรรยายระบุเวลาสำหรับเนื้อหาวิดีโอความละเอียดสูงที่มีความยาว

การเขียนโค้ดแบบ Audio-Visual Live

นักพัฒนาสามารถแก้ไขโค้ดโดยแสดงหน้าจอและอธิบายตรรกะด้วยเสียงแบบ real-time ให้โมเดลฟัง

การจัดเก็บไฟล์เสียงสำหรับองค์กร

ระบบประมวลผลบันทึกการประชุมหรือพอดแคสต์ได้สูงสุด 10 ชั่วโมง เพื่อสรุปข้อมูลสำคัญในการรันเพียงครั้งเดียว

บริการแปลภาษาหลายภาษา

ให้บริการแปลเสียงเป็นเสียงแบบ end-to-end ครอบคลุม 113 ภาษาและสำเนียงท้องถิ่นต่างๆ ของจีน

การกลั่นกรองเนื้อหา

โมเดลตรวจสอบวิดีโอและเสียงเพื่อความปลอดภัย โดยระบุเนื้อหาที่ไม่เหมาะสมทั้งในรูปแบบภาพและเสียงไปพร้อมกัน

จุดแข็ง

ข้อจำกัด

การผสานรวม Omnimodal แบบเนทีฟ: รวมข้อความ รูปภาพ และเสียงไว้ในโมเดลเดียว ทำผลงานระดับ state-of-the-art ใน 215 งานย่อยแบบ multimodal
ความต้องการ GPU สูง: การติดตั้งสถาปัตยกรรม MoE แบบ omnimodal ในเครื่องต้องใช้ VRAM จำนวนมากเมื่อเทียบกับโมเดลข้อความทั่วไป
ขอบเขตการรองรับข้อมูลเสียงที่กว้างขวาง: context window ขนาด 256k ช่วยให้ประมวลผลข้อมูลเสียงต่อเนื่องได้นานกว่า 10 ชั่วโมงในคำสั่งเดียว
ความหน่วงของ API ในบางภูมิภาค: ประสิทธิภาพแบบ real-time ในปัจจุบันได้รับการปรับให้เหมาะสมที่สุดสำหรับผู้ใช้ที่อยู่ใกล้กับคลัสเตอร์หลักของ Alibaba Cloud ในเอเชีย
เสียง Real-time ที่มีความหน่วงต่ำ: สถาปัตยกรรม Thinker-Talker ช่วยให้เวลาตอบสนองรวดเร็วระดับเสี้ยววินาที สำหรับบทสนทนาที่โต้ตอบและขัดจังหวะได้
ช่องว่างในการใช้เหตุผลเชิงข้อความ: แม้จะทำได้ดีเยี่ยมในงาน multimodal แต่ประสิทธิภาพด้านตรรกะบริสุทธิ์ (GPQA 83.9) ยังตามหลังโมเดลที่เน้นด้าน reasoning โดยเฉพาะ
กลยุทธ์ราคาที่คุ้มค่า: ด้วยราคา $0.40 ต่อ 1 ล้าน input tokens ให้ประสิทธิภาพระดับ flagship ในราคาย่อมเยาเมื่อเทียบกับคู่แข่ง
การเขียนโค้ดเชิงภาพที่ยังอยู่ในช่วงทดลอง: ฟีเจอร์ vibe coding เป็นความสามารถที่เพิ่งเกิดขึ้นใหม่และอาจมีปัญหากับพิกัด UI ที่มีความซับซ้อนในวิดีโอ

เริ่มต้นด่วน API

alibaba/qwen3.5-omni-plus

ดูเอกสาร
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

const completion = await client.chat.completions.create({
  model: 'qwen3.5-omni-plus',
  messages: [{ role: 'user', content: 'Analyze this video content.' }],
  modalities: ['text'],
  stream: true,
});

for await (const chunk of completion) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Qwen3.5-Omni

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Qwen3.5-Omni

การเขียนโค้ดแบบ Audio-Visual Vibe เปลี่ยนเกมจริงๆ; ในที่สุดมันก็เข้าใจสิ่งที่ฉันโชว์บนหน้าจอขณะที่ฉันอธิบายบั๊ก
dev_mindset
reddit
ความสามารถของ Qwen3.5-Omni ในการประมวลผลเสียง 10 ชั่วโมงใน context เดียว เป็นอะไรที่ยอดเยี่ยมมากสำหรับนักวิจัยและพอดแคสเตอร์
AI_Explorer_01
twitter
การโคลนเสียงดูเป็นธรรมชาติอย่างน่าประหลาดใจเมื่อเทียบกับรุ่นก่อนหน้า แทบแยกไม่ออกเลยในภาษาอังกฤษ
TechGuru_Reviews
youtube
ในที่สุด ก็มีโมเดลที่ไม่ใช่แค่ตัดบทฉันกลางคัน; การขัดจังหวะเชิงความหมายทำงานได้จริงตามที่โฆษณาไว้
hacker_news_user
hackernews
ตัวเลขที่น่าประทับใจของ Qwen3.6 27B ใหม่ แต่เวอร์ชัน Omni คือตัวที่จะถูกใช้งานจริงในผลิตภัณฑ์ต่างๆ
David Hendrickson
twitter
ฉันลองขัดจังหวะมันห้าครั้ง และมันจับใจความสิ่งที่ฉันต้องการได้ทุกครั้ง
Matt Shumer
youtube

วิดีโอเกี่ยวกับ Qwen3.5-Omni

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Qwen3.5-Omni

สถาปัตยกรรม Thinker-Talker เป็นก้าวกระโดดที่สำคัญสำหรับ latency แบบ real-time

รองรับวิดีโอได้นาน 400 วินาที ซึ่งเป็นสองเท่าของที่เราเห็นกันทั่วไป

โมเดลนี้เป็นแบบ multilingual และ multimodal แบบ end-to-end ตั้งแต่ต้น

ระบบ ARIA ช่วยป้องกันข้อผิดพลาดในการออกเสียงที่พบใน TTS มาตรฐาน

คุณสามารถโชว์หน้าจอและสนทนาเรื่องโค้ดได้อย่างลื่นไหล

ฉันลองขัดจังหวะมัน 5 ครั้ง และมันเข้าใจความตั้งใจของฉันได้ทุกครั้ง

วิธีที่มันเขียนโค้ดตามสิ่งที่เห็นในวิดีโอเป็นอะไรที่น่าทึ่งมาก

นี่คือคู่แข่งที่แท้จริงรายแรกของ GPT-4o ในโหมดเสียงที่เราเคยเห็นมา

รองรับการจดจำเสียง 113 ภาษา ซึ่งถือเป็นข้อได้เปรียบมหาศาล

การสกัดข้อมูลภาพทำได้แข็งแกร่งกว่ามากสำหรับไฟล์ PDF และวิดีโอที่มีความซับซ้อน

context ของเสียง 10 ชั่วโมงเป็นจุดเด่นสำหรับองค์กร

ประสิทธิภาพในภาษาที่ไม่ใช่ภาษาอังกฤษคือจุดที่ Qwen ทำได้ดีกว่าใคร

มันสามารถแยกแยะเสียงรบกวนรอบข้างและการขัดจังหวะจากผู้ใช้ได้จริง

ราคาแข่งขันได้ดีมาก โดยเฉพาะเมื่อเทียบกับจำนวน parameters ที่เปิดใช้งาน

นี่คือโมเดลที่มีความสามารถมากที่สุดในปัจจุบันสำหรับระบบอัตโนมัติด้วย Python ที่เกี่ยวข้องกับ visual UI

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ Qwen3.5-Omni

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Qwen3.5-Omni และได้ผลลัพธ์ที่ดีขึ้น

เพิ่มประสิทธิภาพการรับข้อมูลเสียง

ควรแบ่งส่วนไฟล์เสียงที่มีความยาวมากกว่า 10 ชั่วโมง เพื่อรักษาความแม่นยำในการดึงข้อมูลภายใน context window ขนาด 256k

ใช้ประโยชน์จากการขัดจังหวะเชิงความหมาย (Semantic Interruption)

เปิดใช้งานฟีเจอร์การสลับบทสนทนาในแอปพลิเคชันเสียง เพื่อแยกแยะความตั้งใจของผู้ใช้จากเสียงรบกวนรอบข้าง

ใช้ ARIA สำหรับศัพท์เทคนิค

ใช้โหมดสตรีมเสียงเพื่อรับประโยชน์จาก ARIA alignment ซึ่งช่วยให้มั่นใจว่าการออกเสียงตัวเลขเชิงเทคนิคจะถูกต้องแม่นยำ

การควบคุมอัตราเฟรมวิดีโอ

อัปโหลดวิดีโอมาตรฐานที่ 1 FPS แต่ให้เพิ่มอัตราเฟรมสำหรับฉากที่มีการเคลื่อนไหวสูงเพื่อให้มั่นใจในความแม่นยำด้านภาพ

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M

คำถามที่พบบ่อยเกี่ยวกับ Qwen3.5-Omni

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Qwen3.5-Omni