alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B는 Alibaba의 flagship open-weight MoE 모델입니다. 네이티브 multimodal reasoning, 1M context window, 19배의 디코딩 처리량을 특징으로 합니다...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.52026년 2월 16일
컨텍스트
1.0M토큰
최대 출력
8K토큰
입력 가격
$0.60/ 1M
출력 가격
$3.60/ 1M
모달리티:TextImageVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
88.4%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 88.4%점을 기록했습니다.
HLE
28.7%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 28.7%점을 기록했습니다.
MMLU
88.6%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 88.6%점을 기록했습니다.
MMLU Pro
87.8%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Qwen3.5-397B-A17B이 이 벤치마크에서 87.8%점을 기록했습니다.
SimpleQA
48%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 48%점을 기록했습니다.
IFEval
92.6%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 92.6%점을 기록했습니다.
AIME 2025
91.3%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Qwen3.5-397B-A17B이 이 벤치마크에서 91.3%점을 기록했습니다.
MATH
74.1%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 74.1%점을 기록했습니다.
GSM8k
93.7%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Qwen3.5-397B-A17B이 이 벤치마크에서 93.7%점을 기록했습니다.
MGSM
92.1%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Qwen3.5-397B-A17B이 이 벤치마크에서 92.1%점을 기록했습니다.
MathVista
90.3%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 90.3%점을 기록했습니다.
SWE-Bench
76.4%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 76.4%점을 기록했습니다.
HumanEval
79.3%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Qwen3.5-397B-A17B이 이 벤치마크에서 79.3%점을 기록했습니다.
LiveCodeBench
83.6%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 83.6%점을 기록했습니다.
MMMU
85%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 85%점을 기록했습니다.
MMMU Pro
79%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Qwen3.5-397B-A17B이 이 벤치마크에서 79%점을 기록했습니다.
ChartQA
86.5%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 86.5%점을 기록했습니다.
DocVQA
93.2%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 93.2%점을 기록했습니다.
Terminal-Bench
52.5%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 52.5%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 12%점을 기록했습니다.

Qwen3.5-397B-A17B 소개

Qwen3.5-397B-A17B의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

고효율 Mixture-of-Experts

Qwen3.5-397B-A17B는 Gated Delta Networks를 통한 선형 attention과 sparse Mixture-of-Experts(MoE)를 결합한 혁신적인 하이브리드 아키텍처를 사용하는 flagship 네이티브 multimodal 모델입니다. 전체 3970억 개의 parameters를 포함하고 있지만, sparse 설계 덕분에 forward pass마다 170억 개의 parameters만 활성화하여, 방대한 추론 능력은 그대로 유지하면서도 뛰어난 inference 효율성과 속도를 달성했습니다. 이 모델은 언어 및 시각 작업 모두에 최적화되어 있으며, 25만 개의 tokens 어휘를 지원하고 201개 이상의 언어 및 방언을 처리합니다.

네이티브 Multimodal Agentic 워크플로우

이 모델은 약 2시간 분량의 영상에 해당하는 100만 tokens의 context를 처리할 수 있는 네이티브 multimodal agent로서 탁월한 능력을 발휘합니다. 복잡한 논리적 추론을 위한 특수 Thinking Mode를 도입했으며, 웹 개발, GUI 내이게이션, 현실 세계의 공간 지능을 포함한 agentic 워크플로우를 지원합니다. FP8 end-to-end 학습과 disaggregated 학습-inference 프레임워크를 지원하여 엔터프라이즈급 AI 애플리케이션을 위한 가장 확장 가능하고 효율적인 모델 중 하나입니다.

글로벌 접근성을 위한 Open Weights

Apache 2.0 라이선스로 출시된 이 모델은 이전에 독점 시스템에만 국한되었던 frontier-level의 기능을 open-source 커뮤니티에 제공합니다. 거대한 parameter 규모와 실제 배포 사이의 격차를 해소하여, 조직이 dense한 400B 대체 모델보다 훨씬 낮은 컴퓨팅 비용으로 사설 인프라에서 최신 reasoning 작업을 수행할 수 있도록 합니다.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 사용 사례

Qwen3.5-397B-A17B을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

장시간 영상 분석

최대 2시간 분량의 영상 콘텐츠를 분석하여 논리를 추출하거나, 영상에서 코드를 역설계하거나, 구조화된 요약을 생성합니다.

박사급 STEM 연구

적응형 deep-thinking 모드를 사용하여 대학원 수준의 과학 문제 및 올림피아드 수준의 수학 문제를 해결합니다.

자율형 GUI Agent

스마트폰 및 컴퓨터와의 상호작용을 자동화하여 사무 워크플로우를 처리하고 앱 간 모바일 탐색을 수행합니다.

시각적 소프트웨어 엔지니어링

자연어 지시사항과 UI 스케치를 기능적인 프론트엔드 코드로 변환하는 'vibe coding'을 실행합니다.

문서 인텔리전스

복잡한 문서, 차트, 손으로 그린 스케치를 처리하여 구조화된 데이터를 추출하고 레이아웃을 역설계합니다.

공간 AI 애플리케이션

자율 주행 장면 분석 및 로봇 내비게이션과 같은 embodied AI 작업을 위해 픽셀 단위의 관계를 이해합니다.

강점

제한

탁월한 영상 지원: 100만 tokens를 지원하여 agentic 및 코딩 작업을 위해 최대 120분 분량의 영상을 네이티브로 처리합니다.
높은 하드웨어 장벽: 전체 배포를 위해서는 압축되지 않은 16-bit 정밀도를 위해 800GB 이상의 VRAM을 갖춘 서버급 GPU 랙이 필요합니다.
MoE inference 효율성: 전체 397B/활성 17B 아키텍처는 이전의 dense flagship 모델 대비 19배 빠른 디코딩 처리량(throughput)을 제공합니다.
HLE 지식 격차: 과학 및 수학 분야의 높은 점수에도 불구하고 Humanity's Last Exam(HLE)에서 28.7%를 기록하여 절대적인 전문 사실 관계 파악에는 격차가 있습니다.
state-of-the-art reasoning: AIME 91.3%, GPQA 88.4%를 달성하여 박사급 과학 및 수학 분야에서 최상위 closed-source 모델들과 경쟁합니다.
Tool 오용 가능성: 자율 agent 시나리오에서 모델이 가끔 tool 출력을 환각하거나 내부 예측을 우선시하여 결과를 무시하는 경우가 있습니다.
Apache 2.0 Open Weights: frontier-level의 지능을 open-weights의 자유와 함께 제공하여 사설 온프레미스 배포가 가능합니다.
터미널 작업 성능: Terminal-Bench 2.0에서 52.5%를 기록하여 복잡한 명령줄 상호작용 작업에서 경쟁 모델보다 뒤처집니다.

API 빠른 시작

alibaba/qwen3.5-plus

문서 보기
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Qwen3.5-397B-A17B에 대한 사람들의 의견

커뮤니티가 Qwen3.5-397B-A17B에 대해 어떻게 생각하는지 확인하세요

Qwen3.5-397B는 본질적으로 GPT-5급 모델이지만 open-weights입니다. DeltaNet 아키텍처는 MoE latency 문제를 완벽하게 해결하고 있습니다.
u/DeepLearningLover
reddit
Qwen3.5의 네이티브 multimodal reasoning은 놀랍습니다. 1M context와 영상 분석은 agent 워크플로우를 바꿀 것입니다.
@AiDevDaily
twitter
민감한 레이어에서 BF16을 유지하면서 FP8 end-to-end 학습을 사용하기로 한 결정은 안정성 최적화의 정수입니다.
cold_fusion
hackernews
복잡한 multimodal agent 작업에서 open 모델이 Gemini 1.5 Pro를 실제로 이기는 것을 처음 봅니다.
AI Revolution
youtube
Qwen3-Max보다 19배 향상된 디코딩 처리량은 이 모델을 프로덕션 수준의 agent를 위한 실행 가능한 대안으로 만듭니다.
u/ModelTester2026
reddit
4-bit 양자화를 얼마나 잘 처리하는지 놀랐습니다. 듀얼 A100 설정에서 거의 모든 reasoning 능력을 유지합니다.
@GlobalTechReview
twitter

Qwen3.5-397B-A17B에 대한 동영상

Qwen3.5-397B-A17B에 대한 튜토리얼, 리뷰 및 토론 시청

3970억 개의 parameters 모델이지만, 170억 개만 활성화됩니다.

256K로 디코딩할 때, 이 모델은 Qwen 3 Max보다 19배 빠릅니다.

네이티브 vision-language reasoning 기능이 agentic 워크플로우에서의 차별점입니다.

표준 수학 benchmark에서 대부분의 closed 모델을 이깁니다.

로컬에서 돌리는 것은 어렵지만, 양자화 버전은 고성능 맥에서 작동 가능합니다.

3970억 개의 parameters 모델로, 170억 개의 active parameters를 가집니다. 네이티브 multimodal입니다.

현재 최고의 open-source multimodal 모델일 것입니다.

두 시간 분량의 영상을 네이티브로 처리하는 기능은 엄청난 장점입니다.

논리 점수를 보면, GPT-4o 수준을 꾸준히 유지하고 있습니다.

Apache 라이선스는 기업 데이터 보안에 매우 매력적입니다.

OCR 구조화 추출 기능입니다. 복잡한 PDF를 깔끔한 JSON으로 변환해야 할 때 이 모델이 뛰어납니다.

4000억 개의 parameters 거대 모델의 지능을 얻으면서, 170억 개의 compute 비용만 지불합니다.

이전 버전보다 long-context 검색을 더 잘 처리합니다.

tool use 통합은 나중에 추가된 것이 아니라 기본 학습에 내장되어 있습니다.

Thinking 모드를 통해 출력 전에 스스로 논리를 수정할 수 있습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Qwen3.5-397B-A17B 프로 팁

Qwen3.5-397B-A17B을 최대한 활용하기 위한 전문가 팁.

Thinking Mode 활성화

API 호출 시 'enable_thinking: true' 파라미터를 전달하여 수학, 코딩, 복잡한 논리 문제를 해결하기 위한 deep reasoning을 활성화하세요.

Fast Mode 활용

단순한 질의에는 'Fast' 모드를 사용하여 불필요한 내부 추론 단계에 토큰을 소비하지 않고 즉각적인 답변을 받으세요.

영상 프롬프트 최적화

영상 분석 시, 프레임 단위 분석보다는 최종적인 동적 결과에 집중하도록 프롬프트를 작성하면 더 나은 시간적 일관성을 확보할 수 있습니다.

양자화 활용

VRAM이 충분(200GB 이상)하다면 4-bit 또는 8-bit 양자화(GGUF/EXL2)를 사용하여 일반 하드웨어에서도 모델을 실행해 보세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Qwen3.5-397B-A17B에 대한 자주 묻는 질문

Qwen3.5-397B-A17B에 대한 일반적인 질문에 대한 답변 찾기