Kimi K2.5

Moonshot AI의 Kimi K2.5를 만나보세요. 네이티브 multimodal 기능, 262K context window, 그리고 state-of-the-art reasoning 성능을 갖춘 1T parameters 규모의 open-source agentic model입니다.

Agentic AIMultimodalOpen-sourceReasoningMoE
moonshot logomoonshotKimi K-seriesJanuary 27, 2026
컨텍스트
262K토큰
최대 출력
33K토큰
입력 가격
$0.60/ 1M
출력 가격
$2.50/ 1M
모달리티:TextImageVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
87.6%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Kimi K2.5이 이 벤치마크에서 87.6%점을 기록했습니다.
HLE
50.2%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 50.2%점을 기록했습니다.
MMLU
92%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Kimi K2.5이 이 벤치마크에서 92%점을 기록했습니다.
MMLU Pro
87.1%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Kimi K2.5이 이 벤치마크에서 87.1%점을 기록했습니다.
SimpleQA
54%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 54%점을 기록했습니다.
IFEval
94%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Kimi K2.5이 이 벤치마크에서 94%점을 기록했습니다.
AIME 2025
96.1%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Kimi K2.5이 이 벤치마크에서 96.1%점을 기록했습니다.
MATH
98%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Kimi K2.5이 이 벤치마크에서 98%점을 기록했습니다.
GSM8k
99%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Kimi K2.5이 이 벤치마크에서 99%점을 기록했습니다.
MGSM
96%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Kimi K2.5이 이 벤치마크에서 96%점을 기록했습니다.
MathVista
84.2%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 84.2%점을 기록했습니다.
SWE-Bench
76.8%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Kimi K2.5이 이 벤치마크에서 76.8%점을 기록했습니다.
HumanEval
99%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Kimi K2.5이 이 벤치마크에서 99%점을 기록했습니다.
LiveCodeBench
85%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 85%점을 기록했습니다.
MMMU
84%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Kimi K2.5이 이 벤치마크에서 84%점을 기록했습니다.
MMMU Pro
78.5%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Kimi K2.5이 이 벤치마크에서 78.5%점을 기록했습니다.
ChartQA
77.5%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 77.5%점을 기록했습니다.
DocVQA
88.8%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Kimi K2.5이 이 벤치마크에서 88.8%점을 기록했습니다.
Terminal-Bench
50.8%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Kimi K2.5이 이 벤치마크에서 50.8%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Kimi K2.5이 이 벤치마크에서 12%점을 기록했습니다.

Kimi K2.5 소개

Kimi K2.5의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

에이전트 인공지능의 새로운 지평

Kimi K2.5는 Moonshot AI의 flagship open-source agentic model로, 통합 multimodal 지능의 비약적인 도약을 상징합니다. 320억 개의 활성 parameters를 가진 거대한 1조 parameters 규모의 Mixture-of-Experts (MoE) 아키텍처를 기반으로 구축되었으며, 텍스트, 이미지, 비디오 처리를 단일 reasoning 프레임워크로 네이티브하게 통합합니다. 기존 LLM과 달리, K2.5는 자율 실행을 위해 특별히 설계되었으며, 인간의 개입 없이 복잡한 다단계 문제를 스스로 수정하고 추론할 수 있는 고유한 'Thinking' 모드를 갖추고 있습니다.

아키텍처의 혁신

이 model은 'Agent Swarm'이라는 혁신적인 기능을 도입하여, 시스템이 최대 100개의 병렬 서브 에이전트를 동적으로 조율하여 대규모 리서치나 엔지니어링 작업을 해결할 수 있도록 합니다. SWE-Bench 및 AIME 2025와 같은 benchmark에서 최상위권 성능을 달성함으로써, Kimi K2.5는 open-source model과 폐쇄형 frontier AI 사이의 간극을 효과적으로 메우며 훨씬 적은 운영 비용으로 엘리트 수준의 역량을 제공합니다. MoonViT-3D 인코더의 통합을 통해 높은 시간적 정확도로 수 시간 분량의 콘텐츠를 아우르는 전례 없는 비디오 이해 능력을 선보입니다.

타의 추종을 불허하는 효율성

단순한 성능을 넘어, K2.5는 지속 가능한 token 경제성에 집중합니다. 공격적인 context 캐싱과 고도로 최적화된 MoE 구조를 활용하여, 입력 100만 token당 $0.60라는 매우 경쟁력 있는 가격을 유지하면서도 가장 비싼 폐쇄형 model들과 대등한 성능을 제공합니다. 이는 대규모로 복잡한 long-context 자율 에이전트를 구축하려는 기업들에게 이상적인 기반이 됩니다.

Kimi K2.5

Kimi K2.5 사용 사례

Kimi K2.5을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

복잡한 GitHub 이슈 해결 및 시각적 UI 스케치로부터 풀스택 웹사이트 클로닝 수행.

올림피아드 수준의 수학 문제 풀이

AIME 2025에서 96% 이상의 정확도로 고급 수학 증명 및 경시대회 수준의 문제 해결.

긴 형식의 비디오 reasoning

context 손실이나 시간적 품질 저하 없이 최대 2시간 길이의 비디오 콘텐츠 분석 및 요약.

동적 리서치 에이전트

'Agent Swarm'을 사용하여 수백 개의 소스에서 데이터를 병렬로 수집하고 종합하는 멀티스레드 웹 리서치 수행.

심미적 프런트엔드 생성

손으로 그린 UI 와이어프레임이나 스크린샷을 표현력 있는 모션이 포함된 세련되고 기능적인 React 코드로 변환.

자율 터미널 제어

복잡한 bash 명령 및 시스템 수준 작업을 실행하여 서버 클러스터 및 개발 환경 관리.

강점

제한

엘리트 수학적 reasoning: AIME 2025에서 96.1%를 기록하며 순수 논리적 연역 능력에서 거의 모든 폐쇄형 model을 능가함.
높은 하드웨어 요구 사양: 전체 1T model을 로컬에서 실행하려면 여러 대의 H100 또는 B200 GPU를 갖춘 엔터프라이즈급 AI 클러스터가 필요함.
대규모 병렬 처리: 'Agent Swarm' 기능을 통해 100개 이상의 서브 에이전트를 가동하여 리서치 작업 완료 시간을 획기적으로 단축.
Thinking 지연 시간: 심층 reasoning 모드를 활성화하면 표준 처리 방식에 비해 첫 번째 token 생성까지 걸리는 시간이 크게 증가함.
통합 multimodal 아키텍처: 별도의 vision 인코더 없이도 2시간 분량의 비디오와 고해상도 이미지를 네이티브로 처리.
박사 수준 지식의 한계: 'Humanity's Last Exam'에서 기록한 50.2%의 점수는 고수준 과학 전문 지식 분야에서 개선의 여지가 있음을 보여줌.
공격적인 token 경제성: 입력 100만 token당 $0.60의 가격으로, Claude 4.5와 같은 유사한 frontier model보다 약 8~10배 저렴함.
규제 관련 우려: 중국 model이므로 서구권 기업의 경우 API 사용 및 데이터 주권이 다른 규제 프레임워크의 영향을 받을 수 있음.

API 빠른 시작

fireworks/kimi-k2p5

문서 보기
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Kimi K2.5에 대한 사람들의 의견

커뮤니티가 Kimi K2.5에 대해 어떻게 생각하는지 확인하세요

"AIME 2025에서의 reasoning 능력은 open model로서는 정말 말도 안 되는 수준입니다."
LogicLover
reddit
"Kimi K2.5가 긴 비디오 이해의 새로운 기준을 세웠습니다. 마침내 영상 시작 부분을 잊어버리지 않는 model이 나왔네요."
AI_Pioneer
x
"K2.5를 코딩 에이전트로 사용하는 것은 게임 체인저입니다. SWE-Bench 점수는 단순한 숫자가 아니라 실질적인 능력이 체감됩니다."
DevGuru
hackernews
"중국이 Kimi K2.5를 출시했고, 성능은 마치 시계태엽처럼 미국 frontier AI model들과 대등한 수준입니다."
BasedTorba
x
"중국의 Kimi가 OpenAI의 조 단위 비즈니스 꿈을 무너뜨렸습니다... 8배나 더 저렴하네요."
nrqa__
x
"Kimi K2.5는 단순한 채팅창이 아니라 실제 co-pilot처럼 느껴지는 첫 번째 model입니다."
CodeWizard
reddit

Kimi K2.5에 대한 동영상

Kimi K2.5에 대한 튜토리얼, 리뷰 및 토론 시청

AIME 문제를 테스트해본 결과, Kimi K2.5는 GPT-4o가 어려워했던 문제들까지 거의 모두 맞혔습니다.

코딩 작업의 경우, 표준 LLM들과 비교했을 때 에이전트 기능이 이 model이 가장 빛나는 부분입니다.

이런 규모의 1조 parameter model이 open-source로 공개된 것은 현재 시장에서 유례없는 일입니다.

초기 수학 테스트에서 o1에 필적하는 논리 처리 능력을 확인했습니다.

token 가격이 매우 낮아서 기본적인 작업을 위해 폐쇄형 model을 사용할 이유가 사실상 사라졌습니다.

context 손실 없이 2시간 분량의 비디오를 한 번에 처리하는 능력은 엄청난 돌파구입니다.

단순한 채팅 model이 아니라, 처음부터 도구와 터미널을 사용하도록 설계되었습니다.

Swarm 모드를 트리거하면 웹 리서치를 위한 병렬 처리 능력이 타의 추종을 불허합니다.

이것은 Moonshot AI가 자신들이 충분한 연산 자원과 인재를 보유하고 있음을 전 세계에 알리는 신호입니다.

버그 수정을 위해 라이브 터미널을 탐색하는 모습은 자율 엔지니어링의 미래를 보여줍니다.

BrowseComp benchmark에서 Kimi K2.5의 점수 도약은 이전에 보지 못한 수준의 끈기로 웹을 탐색할 수 있음을 시사합니다.

vision과 thinking 모드를 하나의 아키텍처로 통합했다는 사실이 이번 아키텍처 발표의 핵심입니다.

MMLU 및 GSM8k에서의 성능은 학습에 사용된 데이터의 품질이 최상급이었음을 증명합니다.

이전 버전들과 달리, 비디오 이해 능력에서 시간적 품질 저하가 발생하지 않습니다.

개발자라면 OpenAI 호환성 덕분에 테스트를 위해 이 model로 전환하는 데 노력이 거의 들지 않을 것입니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로
데모 영상 보기

Kimi K2.5 프로 팁

Kimi K2.5을 최대한 활용하기 위한 전문가 팁.

Thinking 모드 활용

논리적 사고가 필요한 수학이나 코딩 작업 시 'Think step-by-step'이라고 명시적으로 prompt를 입력하여 reasoning 모드를 활성화하세요.

비디오 context 장점

model의 MoonViT-3D 인코더를 사용하여 매우 긴 비디오를 처리하세요. 2시간 분량의 영상에서도 특정 세부 정보를 찾아내는 데 탁월합니다.

에이전트 오케스트레이션

대규모 프로젝트의 경우, swarm 기능을 활용하여 K2.5가 작업을 하위 작업으로 세분화해 더 빠르게 실행하도록 하세요.

캐시 히트 절감

Moonshot의 강력한 context 캐싱 기능을 활용하도록 API 호출을 구성하여 입력 비용을 최대 75%까지 절감하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Kimi K2.5에 대한 자주 묻는 질문

Kimi K2.5에 대한 일반적인 질문에 대한 답변 찾기