moonshot

Kimi K2.5

native multimodal 기능, 262K context window, SOTA reasoning을 갖춘 Moonshot AI의 1T-parameter open-source agentic model, Kimi K2.5를 확인하세요.

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi2026년 1월 27일
컨텍스트
256K토큰
최대 출력
66K토큰
입력 가격
$0.60/ 1M
출력 가격
$3.00/ 1M
모달리티:TextImageVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
87.6%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Kimi K2.5이 이 벤치마크에서 87.6%점을 기록했습니다.
HLE
50.2%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 50.2%점을 기록했습니다.
MMLU
91.5%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Kimi K2.5이 이 벤치마크에서 91.5%점을 기록했습니다.
MMLU Pro
87.1%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Kimi K2.5이 이 벤치마크에서 87.1%점을 기록했습니다.
SimpleQA
48%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 48%점을 기록했습니다.
IFEval
85%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Kimi K2.5이 이 벤치마크에서 85%점을 기록했습니다.
AIME 2025
96.1%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Kimi K2.5이 이 벤치마크에서 96.1%점을 기록했습니다.
MATH
90.1%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Kimi K2.5이 이 벤치마크에서 90.1%점을 기록했습니다.
GSM8k
97.1%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Kimi K2.5이 이 벤치마크에서 97.1%점을 기록했습니다.
MGSM
95%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Kimi K2.5이 이 벤치마크에서 95%점을 기록했습니다.
MathVista
90.1%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 90.1%점을 기록했습니다.
SWE-Bench
76.8%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Kimi K2.5이 이 벤치마크에서 76.8%점을 기록했습니다.
HumanEval
88%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Kimi K2.5이 이 벤치마크에서 88%점을 기록했습니다.
LiveCodeBench
85%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 85%점을 기록했습니다.
MMMU
78.5%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Kimi K2.5이 이 벤치마크에서 78.5%점을 기록했습니다.
MMMU Pro
78.5%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Kimi K2.5이 이 벤치마크에서 78.5%점을 기록했습니다.
ChartQA
77.5%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 77.5%점을 기록했습니다.
DocVQA
88.8%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Kimi K2.5이 이 벤치마크에서 88.8%점을 기록했습니다.
Terminal-Bench
50.8%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 50.8%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Kimi K2.5이 이 벤치마크에서 12%점을 기록했습니다.

Kimi K2.5 소개

Kimi K2.5의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

Kimi K2.5는 Moonshot AI의 open-source multimodal model입니다. 이 model은 1 trillion parameter의 Mixture-of-Experts 아키텍처를 채택하고 있으며, token당 32 billion parameter가 활성화됩니다. 시스템은 모달리티별로 별도의 외부 encoder를 사용하는 대신 단일 reasoning 프레임워크를 통해 텍스트, 이미지, 동영상 처리를 통합합니다. 이 아키텍처는 매우 긴 시퀀스에서도 높은 검색 정확도와 논리적 일관성을 유지하면서 256,000 tokens의 context를 처리할 수 있게 합니다.

이 model의 핵심 차별점은 Agent Swarm 기능입니다. 이 기능을 통해 시스템은 최대 100개의 병렬 sub-agent를 조정하여 복잡한 리서치나 엔지니어링 작업을 동시에 수행할 수 있습니다. 400M parameter의 MoonViT-3D encoder를 통합하여 수 시간 분량의 동영상 콘텐츠를 시간적 정밀도를 가지고 분석할 수 있습니다. 자율적인 실행을 위해 특별히 설계되었으며, SWE-Bench 및 BrowseComp와 같은 agentic 벤치마크에서 다수의 독점적 model을 능가합니다.

Kimi K2.5는 깊은 논리가 필요한 작업을 위해 전용 Thinking 모드를 제공합니다. 활성화 시 model은 내부적으로 reasoning chain을 생성하여 최종 답변을 도출하기 전에 단계를 스스로 수정하고 검증합니다. 이는 대회 수준의 수학 문제 해결과 대규모 소프트웨어 개발에 매우 효과적입니다. 토큰 경제성 또한 엔터프라이즈 배포에 최적화되어, 경쟁 관계의 closed-source 시스템보다 훨씬 낮은 비용으로 frontier급 지능을 제공합니다.

Kimi K2.5

Kimi K2.5 사용 사례

Kimi K2.5을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

SWE-Bench에 최적화된 논리를 사용하여 복잡한 GitHub 이슈를 해결하고 다중 파일 프로젝트 아키텍처를 설계합니다.

비주얼 웹 개발

기존 웹사이트 상호작용 화면 녹화본으로부터 직접 기능적인 프론트엔드 코드와 UI 디자인을 생성합니다.

멀티 스레드 리서치

Agent Swarm을 사용하여 단일 병렬 워크플로우 내에서 100개 이상의 소스 정보를 크롤링하고 종합합니다.

긴 동영상 분석

별도의 프레임 추출 도구 없이도 수 시간 분량의 보안 영상이나 강의 자료에서 특정 이벤트와 시계열 데이터를 추출합니다.

수학적 증명 생성

Deep Thinking 모드를 적용하여 올림피아드 수준의 수학 문제를 96%의 정확도로 해결합니다.

엔터프라이즈 문서 자동화

비정형 비즈니스 데이터 소스로부터 다중 페이지 PDF 보고서와 복잡한 재무 스프레드시트를 생성합니다.

강점

제한

최고 수준의 Agentic 성능: SWE-Bench Verified에서 76.8점을 기록하며 소프트웨어 엔지니어링 작업에서 다수의 독점적 frontier model을 능가합니다.
극도로 높은 로컬 VRAM 요구량: 전체 양자화되지 않은 model 실행에 632GB의 VRAM이 필요하여 대부분의 소비자 환경에서는 로컬 배포가 불가능합니다.
독보적인 토큰 경제성: 1T parameter MoE 지능을 백만 input tokens당 $0.60에 제공하며, 이는 Claude Opus 비용의 약 10% 수준입니다.
높은 reasoning latency: Thinking 모드는 답변 생성 전 내부 논리 체인을 생성하는 과정에서 상당한 지연이 발생할 수 있습니다.
Native 동영상 이해력: 외부 프레임 추출 없이 복잡한 동영상 파일을 처리하여 긴 영상에 대한 정밀한 시계열 분석을 가능하게 합니다.
형식 반복 문제: 특정 문단 구조를 사용하도록 엄격하게 prompt하지 않으면 지나치게 긴 텍스트를 출력하는 경향이 있습니다.
병렬 Swarm 오케스트레이션: 거대한 멀티 스레드 리서치 워크플로우를 위해 최대 100개의 sub-agent를 조정하도록 학습된 유일한 open model입니다.
데이터 주권 우려: 주요 인프라가 중국에 위치해 있어 일부 서구권 기업에는 컴플라이언스 문제가 발생할 수 있습니다.

API 빠른 시작

fireworks/kimi-k2p5

문서 보기
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Kimi K2.5에 대한 사람들의 의견

커뮤니티가 Kimi K2.5에 대해 어떻게 생각하는지 확인하세요

Kimi K2.5는 비슷한 성능의 Opus와 비교했을 때 비용이 약 10% 수준입니다.
Odd_Tumbleweed574
reddit
중국 연구소가 frontier급 지능을 갖춘 중대한 무언가를 open-source로 공개했을 때 Nvidia가 6천억 달러의 가치를 잃었다는 사실을 사람들은 잊고 있습니다. Kimi가 다시 한번 해내고 있죠.
chetaslua
twitter
K2.5의 Attention Residuals 개념은 LLM의 망각 문제를 실제로 해결하는 몇 년 만의 첫 아키텍처적 변화입니다.
logic_king
hackernews
이제 Workers AI에서 대형 model을 실행할 수 있습니다. Kimi K2.5가 그 첫 주자죠. 최고의 open-source model 중 하나이며 코딩에도 매우 뛰어납니다.
dok2001
twitter
Kimi K2.5는 완전히 다른 차원의 괴물입니다. 아주 똑똑한 RP model이지만 커뮤니티 프리셋을 사용하지 않으면 다소 신경질적으로 변할 수 있습니다.
dptgreg
reddit
GPT 4 워크플로우를 Kimi K2.5로 대체했습니다. thinking 모드가 더 투명하고 context window가 전체 레포지토리를 감당할 수 있기 때문입니다.
Dev_Max
reddit

Kimi K2.5에 대한 동영상

Kimi K2.5에 대한 튜토리얼, 리뷰 및 토론 시청

Kimi K2.5는 뛰어난 thinking 성능으로 GPT 5.2를 능가하며 다른 frontier model들을 압도하고 있습니다.

SWE Verified에서 76.8점을 기록하며 현재까지 가장 강력한 open-source 코딩 model입니다.

Agent Swarm은 단일 agent에서 다중 agent로 전환하여 최대 1500단계의 조율된 작업을 병렬 워크플로우로 실행합니다.

256k tokens의 거대한 context window는 대부분의 프로젝트에 충분합니다.

Moonshot은 2026년 초, open weights가 도달할 수 있는 한계를 넓히고 있습니다.

단순히 영상만 보고도 Apple의 디자인 미학을 살려 애니메이션이 포함된 멋진 웹사이트를 만들어냈습니다.

Swarm 기능은 매우 흥미롭고, 각 sub-agent에게 ID 배지를 부여하는 방식이 사용하기 재미있습니다.

K2.5는 백만 input tokens당 60센트, 백만 output tokens당 3달러로 훨씬 저렴합니다.

Native 동영상 처리 기능 덕분에 비싼 외부 도구를 사용하여 프레임을 처리할 필요가 없습니다.

이 model은 저예산으로 자율 agent가 필요한 개발자들에게 판도를 뒤흔들 변화를 가져왔습니다.

Moonshot은 각 sub-agent에게 단계별로 보상을 제공하여 순차적 붕괴를 방지하는 방식으로 이를 구현했습니다.

이 model은 병렬 처리가 임계 경로를 단축할 때만 이를 선택하도록 학습되었으며, 이는 매우 영리한 혁신입니다.

Kimi K2.5는 GGUF를 사용해 소비자용 하드웨어에서 구동할 수 있는 경계선에 있습니다.

Thinking 모드는 Python의 복잡한 논리 오류를 해결하는 데 매우 강력합니다.

1 trillion parameter model이 이렇게 공개되는 것은 open-source 커뮤니티에 엄청난 의미가 있습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Kimi K2.5 프로 팁

Kimi K2.5을 최대한 활용하기 위한 전문가 팁.

Thinking 모드 활성화

수학 및 코딩 작업에서 정확도를 극대화하려면 API 요청 시 thinking parameter를 전달하세요.

Agent Swarm 트리거

리서치 작업 시 model에게 swarm을 배포하도록 지시하여 sub-agent 간의 병렬 오케스트레이션을 강제하세요.

Temperature 최적화

Thinking 모드에서는 다양한 reasoning을 위해 temperature를 1.0으로 설정하고, 일반 채팅에서는 0.6으로 낮추는 것이 좋습니다.

통합 Vision Prompt 활용

model의 통합 text-vision 학습을 활용하기 위해 코드 스니펫과 함께 에러 스크린샷을 업로드하세요.

Context Caching 사용

반복되는 긴 문서에 대해 context caching을 사용하여 input 비용을 최대 90%까지 절감하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Kimi K2.5에 대한 자주 묻는 질문

Kimi K2.5에 대한 일반적인 질문에 대한 답변 찾기