moonshot

Kimi k2.6

Kimi k2.6은 256K context window, 네이티브 비디오 입력 및 자율 에이전트 코딩에서 탁월한 성능을 발휘하는 Moonshot AI의 1T-parameter MoE 모델입니다.

ReasoningMultimodalCoding AgentOpen WeightsMoE
moonshot logomoonshotKimi2026년 4월 20일
컨텍스트
256K토큰
최대 출력
33K토큰
입력 가격
$0.95/ 1M
출력 가격
$4.00/ 1M
모달리티:TextImageVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
90.5%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Kimi k2.6이 이 벤치마크에서 90.5%점을 기록했습니다.
HLE
54%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Kimi k2.6이 이 벤치마크에서 54%점을 기록했습니다.
MMLU
86.4%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Kimi k2.6이 이 벤치마크에서 86.4%점을 기록했습니다.
MMLU Pro
84.6%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Kimi k2.6이 이 벤치마크에서 84.6%점을 기록했습니다.
SimpleQA
43%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Kimi k2.6이 이 벤치마크에서 43%점을 기록했습니다.
IFEval
89.8%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Kimi k2.6이 이 벤치마크에서 89.8%점을 기록했습니다.
AIME 2025
97.3%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Kimi k2.6이 이 벤치마크에서 97.3%점을 기록했습니다.
MATH
98.2%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Kimi k2.6이 이 벤치마크에서 98.2%점을 기록했습니다.
GSM8k
97.3%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Kimi k2.6이 이 벤치마크에서 97.3%점을 기록했습니다.
MGSM
91.5%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Kimi k2.6이 이 벤치마크에서 91.5%점을 기록했습니다.
MathVista
67.1%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Kimi k2.6이 이 벤치마크에서 67.1%점을 기록했습니다.
SWE-Bench
80.2%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Kimi k2.6이 이 벤치마크에서 80.2%점을 기록했습니다.
HumanEval
92%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Kimi k2.6이 이 벤치마크에서 92%점을 기록했습니다.
LiveCodeBench
83.1%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Kimi k2.6이 이 벤치마크에서 83.1%점을 기록했습니다.
MMMU
77.3%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Kimi k2.6이 이 벤치마크에서 77.3%점을 기록했습니다.
MMMU Pro
75.6%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Kimi k2.6이 이 벤치마크에서 75.6%점을 기록했습니다.
ChartQA
87.4%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Kimi k2.6이 이 벤치마크에서 87.4%점을 기록했습니다.
DocVQA
94.9%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Kimi k2.6이 이 벤치마크에서 94.9%점을 기록했습니다.
Terminal-Bench
60.2%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Kimi k2.6이 이 벤치마크에서 60.2%점을 기록했습니다.
ARC-AGI
68.8%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Kimi k2.6이 이 벤치마크에서 68.8%점을 기록했습니다.

Kimi k2.6 소개

Kimi k2.6의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

아키텍처 설계 및 규모

Kimi k2.6은 1조 parameter 규모를 갖춘 최첨단 multimodal Mixture-of-Experts (MoE) 모델입니다. token당 320억 개의 활성 parameter를 사용하여 계산 효율성과 고차원 인지 성능 간의 균형을 맞춥니다. 이 아키텍처는 내부적인 chain-of-thought reasoning을 지원하여 모델이 최종 응답을 출력하기 전에 숨겨진 reasoning 단계를 생성합니다. 이러한 설계 덕분에 표준적인 대규모 언어 모델들이 종종 막히는 복잡한 다단계 문제를 해결할 수 있습니다.

에이전트 지능 및 조정

이 모델은 자율 소프트웨어 엔지니어링 및 장기 작업을 위해 특별히 최적화되었습니다. 최대 300개의 병렬 하위 에이전트로 구성된 Agent Swarms를 관리할 수 있으며, 이들은 대규모 코드베이스를 리팩토링하거나 복잡한 DevOps 파이프라인을 조정하기 위해 협력합니다. 네이티브 도구 호출과 시각적 이해를 활용하는 Kimi k2.6은 다중 파일 GitHub 이슈를 해결하고 시각적 참조로부터 모션이 풍부한 웹 인터페이스를 생성할 수 있는 자율 에이전트로 작동합니다.

Multimodal 기능

비디오 및 이미지 입력에 대한 네이티브 지원은 Kimi k2.6을 다른 open-weights 모델들과 차별화하는 요소입니다. 비디오 파일을 직접 처리하여 장면 분석, 버그 재현 및 구조화된 데이터 추출을 수행합니다. 이 모델은 시각적 설계자로서, 시각적 설명이나 업로드된 목업(mockup)을 기반으로 Three.js 및 GSAP와 같은 라이브러리를 사용하여 3D 셰이더와 복잡한 애니메이션을 생성합니다.

Kimi k2.6

Kimi k2.6 사용 사례

Kimi k2.6을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

최대 300개의 병렬 하위 에이전트를 12시간 동안 조정하여 복잡한 GitHub 이슈 해결.

모션 중심 프론트엔드 생성

단일 텍스트나 이미지 prompt로부터 WebGL 및 GSAP 셰이더를 사용하여 현대적인 웹 인터페이스 제작.

심층 비디오 분석

녹화 영상을 분석하여 시각적 버그 재현, 장면 설명 또는 구조화된 데이터 추출 수행.

Agentic 시장 조사

수백 개의 소스에서 경쟁 분석 보고서를 종합하기 위해 다단계 웹 검색 및 도구 호출 실행.

레거시 코드 최적화

CPU flame graph와 할당 데이터를 분석하여 구형 코드베이스의 성능 병목 현상 식별.

과학적 문제 해결

Python 기반 reasoning과 도구 검증을 사용하여 대학원 수준의 과학 및 수학 질문 해결.

강점

제한

탁월한 Agentic 코딩: SWE-Bench Verified에서 80.2% 점수를 획득하여 자율 엔지니어링을 위한 가장 유능한 모델 중 하나로 자리매김.
높은 로컬 VRAM 요구 사항: 전체 모델을 로컬에서 실행하려면 600GB의 VRAM이 필요하여, 고사양 워크스테이션으로 셀프 호스팅이 제한됨.
대규모 조정 능력: 300개의 병렬 하위 에이전트를 관리하여 엔터프라이즈급 리팩토링 작업을 한 번에 처리 가능.
지역별 API Latency: 인프라가 아시아에 최적화되어 있어 서구권 사용자에게는 응답 시간이 더 길어질 수 있음.
네이티브 Multimodal 범용성: 네이티브 비디오 및 이미지 입력을 지원하여 UI/UX 작업을 위한 고급 시각-언어 에이전트 워크플로우 구현.
긴 context에서의 회상(recall) 격차: 256,000-token 버퍼의 극한 경계에서는 완벽한 회상에 어려움을 겪을 수 있음.
공격적인 가격 경쟁력: 입력 100만 token당 $0.95로, Claude 3.7이나 GPT-4o와 같은 독점 모델보다 훨씬 저렴.
제한적인 상업용 라이선스: open-weights 릴리스는 대규모 엔터프라이즈 배포 시 특정 규정 준수를 요구하는 수정된 라이선스를 사용함.

API 빠른 시작

moonshotai/kimi-k2.6

문서 보기
moonshot SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "kimi-k2.6",
    messages: [
      { role: "system", content: "You are a coding expert." },
      { role: "user", content: "Optimize this Rust function for throughput." }
    ],
    extra_body: { thinking: { type: "enabled" } }
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Kimi k2.6에 대한 사람들의 의견

커뮤니티가 Kimi k2.6에 대해 어떻게 생각하는지 확인하세요

Kimi K2.6을 만나보세요: 오픈 소스 코딩의 진보. 한 번의 prompt, 100개 이상의 파일. 12시간의 연속 실행 동안 4,000회 이상의 도구 호출.
@Kimi_Moonshot
twitter
Kimi 2.6이 Opus 4.7을 이기고 세계 최고의 open-source 모델이 되었다. 10분의 1 비용으로 이 정도 성능이라니 매우 훌륭하다.
@bindureddy
twitter
가격 차이는 아무도 예상하지 못한 부분이다. Kimi K2.6은 Sonnet 4.6보다 5배 저렴하다. benchmark 격차가 공식적으로 뒤집혔다.
@aakashgupta
twitter
내가 가진 버그에 대해 테스트해 보았다. 1달러 조금 넘는 비용으로 성공적으로 해결했다. Sonnet도 고전했던 어려운 버그였다.
@uworldhits1391
youtube
Kimi K2.6은 혁신적이다. 다만 초장기 작업에서는 회상(recall) 개선의 여지가 있다. 그래도 300개의 병렬 에이전트는 엄청나다.
@Radiant-Act4707
reddit
Kimi K2 시리즈는 open-source frontier 연구소들이 마침내 closed-source 거대 기업들을 경쟁하고 추월하는 순간을 보여준다.
@zxytim
twitter

Kimi k2.6에 대한 동영상

Kimi k2.6에 대한 튜토리얼, 리뷰 및 토론 시청

Kimi K2.6이 Claude를 파괴하지는 않겠지만, 폐쇄형 연구소의 프리미엄 가격 정책은 무너뜨릴 것이다.

300개의 병렬 에이전트를 가동하는 swarm 기능은 오픈 소스에서 아직 본 적 없는 수준이다.

HLE 점수 54.0은 open-weights 모델로서 우리가 본 것 중 가장 높다.

한 번의 prompt로 12시간 연속 실행이 가능하며, 이는 에이전트의 새로운 개척지이다.

최고의 독점 모델과 견줄 만한 안정성으로 다단계 도구 호출을 처리한다.

vision 모델은 네이티브 비디오 입력을 지원하는데, 이는 2026년에도 보기 드문 기능이다.

OpenAI의 o-시리즈와 경쟁할 만한 안정적인 thinking 모드로 다단계 도구 호출을 처리한다.

프론트엔드 개발에 있어, 모션이 풍부한 생성 결과는 K2.5보다 훨씬 우수하다.

256K context window 덕분에 전체 문서 세트를 한 번에 파싱할 수 있다.

터미널 환경에서 진정한 자율성을 보여주는 최초의 모델 중 하나이다.

K2.6과 Kimi Code CLI를 결합하면 12시간 이상의 자율 코딩 세션이 가능하다.

8년 된 금융 엔진을 리팩토링하여 185%의 throughput 향상을 자율적으로 이끌어냈다.

1조 parameter 모델이지만 활성 parameter는 32B에 불과하여 빠른 속도를 유지한다.

Claude에서 Kimi로 넘어가는 개발자들의 비용 절감 효과는 엄청나다.

3개월 동안 해결되지 않았던 복잡한 Rust 라이브러리의 버그를 해결했다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Kimi k2.6 프로 팁

Kimi k2.6을 최대한 활용하기 위한 전문가 팁.

Reasoning을 위한 도구 사용 활성화

benchmark에 따르면 모델이 외부 검색 및 계산 도구를 사용할 수 있을 때 HLE 점수가 23.9에서 54.0으로 급격히 상승합니다.

context 버퍼 경계 모니터링

회상(recall) 기능은 256,000-token 버퍼의 첫 200,000 token에서 가장 정확합니다.

Thinking 모드 절제된 사용

단순한 채팅 작업에서는 latency와 총 token 소비를 줄이기 위해 thinking parameter를 비활성화하세요.

XML 태그를 통한 표준화

context와 작업을 XML 태그로 감싸면 모델이 지침을 더 정확하게 따릅니다.

네이티브 비디오 업로드 활용

요청 크기 제한을 피하려면 100MB가 넘는 비디오에는 base64 인코딩 대신 파일 업로드 방식을 사용하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Kimi k2.6에 대한 자주 묻는 질문

Kimi k2.6에 대한 일반적인 질문에 대한 답변 찾기