moonshot

Kimi K2 Thinking

يُعد Kimi K2 Thinking هو model الـ reasoning من Moonshot AI بـ 1 trillion-parameter. يتفوق الـ model على GPT-5 في benchmark الـ HLE، ويدعم 300 tool calls...

moonshot logomoonshotKimi2025-11-06
نافذة السياق
256Kرموز
أقصى مخرج
16Kرموز
سعر الإدخال
$0.15/ 1M
سعر الإخراج
$0.15/ 1M
الوضع:Text
القدرات:الأدواتالبثالاستدلال
المعايير
GPQA
93%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Kimi K2 Thinking درجة 93% في هذا المعيار.
HLE
44.9%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Kimi K2 Thinking درجة 44.9% في هذا المعيار.
MMLU
90%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Kimi K2 Thinking درجة 90% في هذا المعيار.
MMLU Pro
78%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Kimi K2 Thinking درجة 78% في هذا المعيار.
SimpleQA
55%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Kimi K2 Thinking درجة 55% في هذا المعيار.
IFEval
92%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Kimi K2 Thinking درجة 92% في هذا المعيار.
AIME 2025
99.1%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Kimi K2 Thinking درجة 99.1% في هذا المعيار.
MATH
99.1%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Kimi K2 Thinking درجة 99.1% في هذا المعيار.
GSM8k
99%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Kimi K2 Thinking درجة 99% في هذا المعيار.
MGSM
95%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Kimi K2 Thinking درجة 95% في هذا المعيار.
MathVista
75%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Kimi K2 Thinking درجة 75% في هذا المعيار.
SWE-Bench
71.3%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Kimi K2 Thinking درجة 71.3% في هذا المعيار.
HumanEval
83%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Kimi K2 Thinking درجة 83% في هذا المعيار.
LiveCodeBench
83.1%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Kimi K2 Thinking درجة 83.1% في هذا المعيار.
MMMU
80%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Kimi K2 Thinking درجة 80% في هذا المعيار.
MMMU Pro
60%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Kimi K2 Thinking درجة 60% في هذا المعيار.
ChartQA
88%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Kimi K2 Thinking درجة 88% في هذا المعيار.
DocVQA
94%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Kimi K2 Thinking درجة 94% في هذا المعيار.
Terminal-Bench
55%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Kimi K2 Thinking درجة 55% في هذا المعيار.
ARC-AGI
12%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Kimi K2 Thinking درجة 12% في هذا المعيار.

حول Kimi K2 Thinking

تعرف على قدرات Kimi K2 Thinking والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

ذكاء مفتوح بـ Trillion-Parameter

Kimi K2 Thinking هو model reasoning ثوري بـ trillion-parameter من Moonshot AI، أعاد تعريف حدود الذكاء في الـ open-source. تم إصداره في نوفمبر 2025، ويعتمد على MoE architecture متطورة بإجمالي 1T parameters — يتم تفعيل 32B منها فقط أثناء الـ inference — مما يجعله قوياً بشكل ملحوظ وفعالاً حسابياً. بخلاف الـ language models القياسية، تم تصميم K2 Thinking كـ "thinking agent"، حيث يقوم بتوسيع الـ test-time computation لأداء reasoning منطقي عميق، وتخطيط، واستخدام مستقل للأدوات.

براعة الـ Agentic وقابلية التوسع

يشتهر الـ model بشكل خاص بقدراته الـ agentic، حيث نجح في تنفيذ ما يصل إلى 300 tool calls متتالية دون تدخل بشري. وهذا يجعله خياراً هائلاً للأبحاث المعقدة، والبرمجة التنافسية، وسير العمل الفني متعدد الخطوات. من خلال استخدام دقة INT4 الأصلية عبر Quantization-Aware Training، مكنت Moonshot AI هذا الـ model الضخم من العمل على clusters الأجهزة المتاحة مع التفوق على عمالقة الـ closed-source مثل GPT-5 و Claude 4.5 في الـ reasoning الحرج و benchmarks التصفح.

Architecture تركز على المطورين

تم تصميم Kimi K2-Thinking لمجتمع المطورين العالمي، ويقدم مقاييس أداء مقابل تكلفة لا تضاهى. مع context window هائل بسعة 256K ودعم لمعالجة chain-of-thought مكثفة، فإنه يسد الفجوة بين الـ models المتخصصة المحلية والـ cloud APIs من فئة المؤسسات. تركز منهجية تدريبه على التخطيط طويل المدى، مما يسمح للـ model بالمراجعة والتصحيح وتحسين مخرجاته بشكل تكراري.

Kimi K2 Thinking

حالات استخدام Kimi K2 Thinking

اكتشف الطرق المختلفة لاستخدام Kimi K2 Thinking لتحقيق نتائج رائعة.

البحث المستقل (Autonomous Research)

تنفيذ استقصاءات عميقة عبر الويب تتطلب مئات الـ tool calls المتتالية والتحقق التكراري من المعلومات.

حل المشكلات العلمية

معالجة استفسارات الرياضيات والفيزياء على مستوى الدكتوراه باستخدام تنفيذ أدوات Python ومعالجة chain-of-thought.

البرمجة التنافسية

حل التحديات الخوارزمية عالية الصعوبة من منصات مثل Codeforces و LeetCode بدقة تضاهي مستوى الدكتوراه.

تصحيح الأكواد المعقدة

تحديد وإصلاح الأخطاء المنطقية في قواعد الأكواد الضخمة متعددة الملفات من خلال خطوات reasoning شاملة وطويلة المدى.

التحليل القانوني والامتثال

مراجعة الوثائق الفنية أو القانونية الطويلة عبر context window بسعة 256K لتحديد المخاطر الدقيقة أو التناقضات.

أتمتة الـ Agentic AI

تشغيل الـ agents المستقلة التي يمكنها التخطيط والتنفيذ والمراجعة وتحسين مخرجاتها لساعات دون تدخل بشري.

نقاط القوة

القيود

عمق Agentic: الـ model الوحيد بنظام open-weights القادر على إدارة 200-300 من الـ tool calls المتتالية دون تدهور في الأداء.
مدخلات نصية فقط: يفتقر حالياً إلى دعم الـ multimodal vision الأصلي لمعالجة ملفات الصور أو الفيديو أو الصوت بشكل مباشر.
Reasoning رائد (State-of-the-Art): يتفوق على GPT-5 و Claude 4.5 في اختبارات Humanity's Last Exam (HLE) و BrowseComp من خلال تكثيف الـ test-time scaling.
متطلبات RAM ضخمة: يتطلب التشغيل المحلي لـ architecture الـ 1T الكاملة أكثر من 500 جيجابايت من الـ RAM أو clusters موزعة من أجهزة Mac.
كفاءة تكلفة لا تضاهى: بسعر ثابت قدره 0.15 دولار لكل 1M tokens، يقدم ذكاءً من فئة الـ frontier model بكسر بسيط من تكاليف الـ API المملوكة.
Latency الـ token الأول: تؤدي مرحلة الـ reasoning الداخلي المكثفة إلى بطء في الـ time-to-first-token مقارنة بـ LLMs التي لا تعتمد نظام الـ thinking.
تحسين INT4 أصلي: يوفر الـ quantization الأصلي عبر Quantization-Aware Training زيادة في السرعة بمقدار ضعفين للـ inference المحلي على الأجهزة المتاحة.
إسهاب الـ Reasoning: قد يولد الـ model سلاسل chain-of-thought طويلة بشكل مفرط حتى بالنسبة للاستفسارات المباشرة نسبياً.

البدء السريع API

moonshot/kimi-k2-thinking

عرض التوثيق
moonshot SDK
import OpenAI from 'openai';

const openai = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.ai/v1',
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning AI by Moonshot AI.' },
      { role: 'user', content: 'Solve the Riemann Hypothesis proof verification task.' }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Kimi K2 Thinking

شاهد رأي المجتمع في Kimi K2 Thinking

"Kimi K2 Thinking هو أفضل model ذكاء اصطناعي استخدمته على الإطلاق... لا توجد hallucinations ومئات الـ tool calls."
Alex Finn
youtube
"الفجوة بين الـ closed والـ open تستمر في التقلص حتى مع انهيار تكلفة الـ tokens."
Emad Mostaque
x
"Moonshot K2-Thinking يعيد تعريف الـ agents الذكية المحلية مع 300 tool calls."
Brian Roemmele
x
"أخيراً model يفكر فعلياً في منطق الـ prompt قبل الإجابة!"
ai_user_2025
reddit
"الصين تدفع حقاً حدود الـ open-source والـ open weights مع سلسلة Kimi."
Nathan Lambert
x
"أداء مذهل تماماً في مسائل الرياضيات التنافسية."
MathWizard
hackernews

فيديوهات عن Kimi K2 Thinking

شاهد الدروس والمراجعات والنقاشات عن Kimi K2 Thinking

هذا هو الـ model الأكثر استقلالية و agentic تم صنعه على الإطلاق.

إنه قادر على الـ think والمراجعة في كل خطوة، لذا لا يضل طريقه أبداً.

إنه موفر للتكلفة للغاية... نصف سعر GPT-5 وحوالي عُشر سعر Sonnet 4.5.

ينجح في تجنب فخاخ المنطق الشائعة في الـ LLMs القياسية.

تغير Moonshot قواعد اللعبة حقاً في إمكانية الوصول للـ open-weight.

يمكنه تنفيذ ما يصل إلى 200 إلى 300 tool calls متتالية دون تدخل بشري.

حقق K2 Thinking نتيجة 60.2% متفوقاً بشكل كبير على المتوسط البشري البالغ 29.2% في BrowseComp.

الصين تدفع حقاً حدود الـ open-source والـ open weights.

تطبيق Mixture-of-Experts هنا فعال بشكل لا يصدق بالنسبة لـ 1 trillion parameters.

تحصل على reasoning بمستوى الـ frontier model مقابل قروش معدودة.

لقد قمت بتشغيله هنا على Mac Studio باستخدام wired limit.

نحن نستهلك 500 جيجابايت من الـ RAM. استقرت سرعة المعالجة لدينا عند حوالي 6.9 tokens في الثانية.

لقد كتب الكود، لكنه لم يتوقف فعلياً، بل بدأ في الـ thinking مرة أخرى.

حتى مع الـ quantization، يظل التماسك المنطقي لهذا الـ model من النخبة.

يُظهر الحوار الداخلي (internal monologue) بالضبط أين يصحح أخطاءه البرمجية الخاصة.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي
شاهد العرض التوضيحي

نصائح احترافية لـ Kimi K2 Thinking

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Kimi K2 Thinking وتحقيق نتائج أفضل.

تفعيل Thinking Tags

عند التشغيل محلياً عبر أدوات مثل llama.cpp، تأكد من استخدام علم --special لمعالجة الـ tokens الداخلية لـ <think> بشكل صحيح.

تحسين الـ Temperature

اضبط الـ temperature على 1.0 والـ min_p على 0.01 للحصول على نتائج reasoning أكثر استقراراً ودقة.

تجميع الأجهزة (Hardware Clustering)

قم بنشر نسخة INT4 quantized على cluster مكون من جهازي Mac Studio M3 Ultra مع RDMA للحصول على تجربة 1T محلية بدون فقدان في الجودة.

تخطيط المهام طويلة المدى

صمم الـ prompt ليطلب صراحةً 'خطة خطوة بخطوة' أولاً لتفعيل قدرات الـ model في الـ adaptive learning والبحث.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

الأسئلة الشائعة حول Kimi K2 Thinking

ابحث عن إجابات للأسئلة الشائعة حول Kimi K2 Thinking