alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B는 Alibaba의 flagship open-weight MoE model입니다. 네이티브 multimodal 추론, 1M context window, 19배 향상된 decoding throughput을 경험해 보세요.

멀티모달MoEOpen-Weights에이전틱 AI추론
alibaba logoalibabaQwen2026-02-16
컨텍스트
1.0M토큰
최대 출력
8K토큰
입력 가격
$0.60/ 1M
출력 가격
$3.60/ 1M
모달리티:TextImageVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
88.4%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 88.4%점을 기록했습니다.
HLE
28.7%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 28.7%점을 기록했습니다.
MMLU
88.6%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 88.6%점을 기록했습니다.
MMLU Pro
87.8%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Qwen3.5-397B-A17B이 이 벤치마크에서 87.8%점을 기록했습니다.
SimpleQA
48%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 48%점을 기록했습니다.
IFEval
92.6%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 92.6%점을 기록했습니다.
AIME 2025
91.3%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Qwen3.5-397B-A17B이 이 벤치마크에서 91.3%점을 기록했습니다.
MATH
74.1%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 74.1%점을 기록했습니다.
GSM8k
93.7%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Qwen3.5-397B-A17B이 이 벤치마크에서 93.7%점을 기록했습니다.
MGSM
92.1%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Qwen3.5-397B-A17B이 이 벤치마크에서 92.1%점을 기록했습니다.
MathVista
90.3%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 90.3%점을 기록했습니다.
SWE-Bench
76.4%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 76.4%점을 기록했습니다.
HumanEval
79.3%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Qwen3.5-397B-A17B이 이 벤치마크에서 79.3%점을 기록했습니다.
LiveCodeBench
83.6%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 83.6%점을 기록했습니다.
MMMU
85%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 85%점을 기록했습니다.
MMMU Pro
79%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Qwen3.5-397B-A17B이 이 벤치마크에서 79%점을 기록했습니다.
ChartQA
86.5%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 86.5%점을 기록했습니다.
DocVQA
93.2%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Qwen3.5-397B-A17B이 이 벤치마크에서 93.2%점을 기록했습니다.
Terminal-Bench
52.5%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 52.5%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Qwen3.5-397B-A17B이 이 벤치마크에서 12%점을 기록했습니다.

Qwen3.5-397B-A17B 소개

Qwen3.5-397B-A17B의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

오픈 AI의 기념비적인 도약

Qwen3.5-397B-A17B는 Alibaba Cloud의 AI 전략에서 핵심적인 도약을 상징합니다. 단순한 오픈소스 경쟁자를 넘어 에이전틱 AI 시대를 위해 설계된 지배적인 frontier-level 시스템으로 거듭났습니다. 2026년 2월 16일 출시된 Qwen3.5 시리즈의 flagship인 이 모델은 방대한 3970억 개의 parameters를 가진 Mixture-of-Experts (MoE) 아키텍처를 활용합니다. 토큰당 170억 개의 parameters만 활성화함으로써, 이전 모델인 Qwen3-Max 대비 전례 없는 19배의 decoding throughput 향상을 달성하는 동시에 세계 최고 수준의 폐쇄형 모델들과의 성능 격차를 좁혔습니다.

통합 멀티모달 파워하우스

이 모델은 통합된 네이티브 멀티모달 시스템입니다. 별도의 vision-language 어댑터가 필요했던 이전 버전과 달리, Qwen3.5는 수조 개의 멀티모달 tokens로 학습된 early-fusion multimodality를 특징으로 합니다. 이를 통해 최대 2시간 분량의 비디오 콘텐츠를 시청하고 추론하며, 데스크톱 및 모바일 인터페이스 전반에서 GUI 에이전트로 작동하고, 특화된 Thinking mode를 통해 복잡한 코딩 작업을 수행할 수 있습니다. 201개 언어를 지원하는 25만 개의 확장된 어휘 사전을 갖추어, 다국어 및 멀티모달 자동화를 위한 전 세계 최고의 선택지로 자리 잡았습니다.

에이전틱 시대를 위한 설계

단순한 채팅을 넘어, Qwen3.5-397B는 도구 사용 및 자율 워크플로우에 최적화되어 있습니다. function calling benchmark와 지시 이행 능력에서 거둔 높은 점수는 이 모델이 시각적 소프트웨어 엔지니어링 및 박사급 연구를 위한 이상적인 중추임을 증명합니다. Apache 2.0 라이선스 하에 state-of-the-art 성능을 제공함으로써, Alibaba는 커뮤니티에 가장 제한적인 closed-source 모델들을 대체할 수 있는 신뢰할 수 있고 효율적인 대안을 제시했습니다.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B 사용 사례

Qwen3.5-397B-A17B을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율형 GUI 에이전트

복잡한 PC 및 스마트폰 인터페이스를 탐색하여 다단계 사무 자동화 워크플로우를 완료합니다.

장편 비디오 인텔리전스

최대 120분 길이의 연속된 비디오 파일에서 심층적인 인과 관계 추론 및 요약을 추출합니다.

바이브 코딩 및 프로토타이핑

UI 스케치를 단 한 번의 prompt로 실제 서비스 가능한 수준의 React 및 프런트엔드 로직으로 변환합니다.

박사급 연구 지원

전문화된 내부 chain-of-thought 기반의 Thinking mode를 사용하여 대학원 수준의 STEM 문제를 해결합니다.

다국어 글로벌 지원

비영어권 문자에 대한 뛰어난 tokenization 효율성을 바탕으로 201개 언어의 사용자와 소통합니다.

시각 기반 소프트웨어 엔지니어링

와이어프레임과 스크린샷을 레이아웃이 반영된 깨끗한 HTML, CSS 및 JavaScript 코드로 변환합니다.

강점

제한

Inference 효율성: 하이브리드 MoE 아키텍처를 통해 토큰당 17B parameters만 활성화함으로써 19배 향상된 decoding throughput을 달성했습니다.
방대한 하드웨어 요구량: 총 397B parameters 규모로 인해 양자화되지 않은 버전을 로컬에서 실행하려면 하이엔드 서버급 인프라가 필요합니다.
네이티브 비디오 추론: 별도의 프레임 추출 어댑터 없이 최대 120분의 연속 비디오를 네이티브 방식으로 처리합니다.
오디오 모달리티 부재: GPT-4o나 Gemini와 같은 'omni' model들이 제공하는 네이티브 오디오 input/output 기능이 부족합니다.
최상위 STEM 역량: GPQA에서 88.4%, AIME 2025 수학 시험에서 91.3%를 기록하며 폐쇄형 reasoning model들과 대등하게 경쟁합니다.
HLE 성능 격차: Humanity's Last Exam(28.7%)에서 유료 선도 모델들에 뒤처지며, 특정 전문 분야 지식에서 한계를 보입니다.
Open-Weight 접근성: 프라이빗 기업 배포를 위해 Apache 2.0 라이선스 하에 최첨단 멀티모달 지능을 제공합니다.
메모리 점유율: 희소성(sparsity)을 고려하더라도 엄청난 규모로 인해 상당한 VRAM이 요구되어 일반 소비자급 배포에는 제약이 있습니다.

API 빠른 시작

alibaba/qwen-3.5-plus

문서 보기
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Qwen3.5-397B-A17B에 대한 사람들의 의견

커뮤니티가 Qwen3.5-397B-A17B에 대해 어떻게 생각하는지 확인하세요

Qwen3.5-397B는 기본적으로 오픈소스 커뮤니티가 GPT-4o에 보내는 해답입니다. SVG 생성 능력만 봐도 웹 디자인 분야에서 정말 놀랍습니다.
u/LLM_Reviewer
reddit
19배의 throughput 향상 덕분에 Qwen3.5는 제가 테스트한 동급 크기의 어떤 모델보다 훨씬 더 기민하게 반응합니다.
tech_enthusiast_99
reddit
이 정도 규모의 모델에 Apache 2.0 라이선스를 적용한 것은 로컬 AI 개발과 개인정보 보호를 중시하는 기업들에게 완전히 게임 체인저가 될 것입니다.
TechInnovator88
twitter
3.5-397B 모델의 MoE 라우팅은 이전 2.5 세대보다 눈에 띄게 지능적입니다. 실제로 논리를 따릅니다.
DistanceSolar1449
reddit
현재 생태계에서 이 정도 급의 open-weight 모델이 1M context를 지원하는 것은 유례가 없는 일입니다.
dev_logic
hackernews
비디오 추론은 단순히 프레임 단위가 아니라 실제 시간적 흐름을 이해하는 방식입니다. 현재의 vision LLM들보다 수 세대는 앞서 있는 느낌입니다.
Matthew Berman (Context)
youtube

Qwen3.5-397B-A17B에 대한 동영상

Qwen3.5-397B-A17B에 대한 튜토리얼, 리뷰 및 토론 시청

브라우저 성능에서 Claude Opus 4.5를 이겼을 뿐만 아니라 여러 멀티모달 작업에서 Gemini 3 Pro를 앞섭니다.

201개 언어와 방언을 지원하며 Qwen 3 Max보다 19배 더 빠르다고 보고되었습니다.

실사 같은 나비 이미지를 생성하는 데 훌륭한 성능을 보였습니다. 대부분의 open-source 모델보다 낫습니다.

397B 모델은 본질적으로 AGI의 최전선에서 진정으로 경쟁하는 최초의 open-weights 모델입니다.

MoE를 통한 확장이 Alibaba에게 효과적이라는 점이 이번 benchmark 결과로 증명되었습니다.

이 모델은 Qwen Max의 성능을 유지하면서도 최대 19배의 속도 향상을 이뤄냈습니다.

tokenizer의 어휘 사전이 25만 개로 늘어나 Gemini 및 Google의 tokenizer 수준에 도달했습니다.

Qwen 팀을 Frontier Lab으로 보아야 합니다. 이들은 이제 폐쇄형 연구소들이 집중하는 작업들에 뛰어들고 있습니다.

초기 Llama 모델들에 비해 비라틴계 문자에 대한 tokenization이 훨씬 효율적입니다.

Thinking mode는 상당한 latency를 유발하지만 코딩과 추론 작업에서의 정확도 향상은 그 가치가 충분합니다.

이것은 통합 vision language model입니다. 이전 모델들이 별도의 VL 변형 모델을 가졌던 것과 달리, 이 모델은 모든 것을 하나에 담고 있습니다.

비디오 이해 기능을 통해 프레임 추출 방식이 놓치기 쉬운 시간적 디테일을 포착할 수 있습니다.

코딩 면에서 GPT-4o만큼 반응이 빠르면서도 지시 이행 능력은 더 뛰어납니다.

데스크톱 GUI 에이전트 기능은 실제 업무 자동화를 위한 핵심적인 특징입니다.

컨텍스트 손실 없이 120분 분량의 비디오를 처리하는데, 이는 분석 작업에서 정말 엄청난 이점입니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Qwen3.5-397B-A17B 프로 팁

Qwen3.5-397B-A17B을 최대한 활용하기 위한 전문가 팁.

Thinking Mode 활성화

논리적 사고가 중요한 작업에서는 enable_thinking parameters를 사용하여 심층적인 내부 reasoning 경로를 활성화하세요.

네이티브 검색 활용

search body parameter를 활성화하여 실시간 웹 데이터로 사실 관계를 검증하고 python 코드를 실행하세요.

비디오 prompt 최적화

특정 타임스탬프 앵커를 제공하여 1M token context window가 가장 관련성 높은 구간에 집중하도록 하세요.

지역별 엔드포인트 선택

중국 본토 이외의 지역에서 접속하는 사용자는 네트워크 latency를 줄이기 위해 dashscope-intl 엔드포인트를 사용하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Qwen3.5-397B-A17B에 대한 자주 묻는 질문

Qwen3.5-397B-A17B에 대한 일반적인 질문에 대한 답변 찾기