moonshot

Kimi K2 Thinking

Kimi K2 Thinking هو نموذج الـ reasoning ذو التريليون parameter من Moonshot AI. يتفوق على GPT-5 في HLE ويدعم 300 استدعاء متسلسل للأدوات بشكل مستقل لـ...

moonshot logomoonshotKimi K26 نوفمبر 2025
نافذة السياق
256Kرموز
أقصى مخرج
16Kرموز
سعر الإدخال
$0.15/ 1M
سعر الإخراج
$0.15/ 1M
الوضع:Text
القدرات:الأدواتالبثالاستدلال
المعايير
GPQA
93%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Kimi K2 Thinking درجة 93% في هذا المعيار.
HLE
44.9%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Kimi K2 Thinking درجة 44.9% في هذا المعيار.
MMLU
90%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Kimi K2 Thinking درجة 90% في هذا المعيار.
MMLU Pro
78%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Kimi K2 Thinking درجة 78% في هذا المعيار.
SimpleQA
55%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Kimi K2 Thinking درجة 55% في هذا المعيار.
IFEval
92%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Kimi K2 Thinking درجة 92% في هذا المعيار.
AIME 2025
99.1%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Kimi K2 Thinking درجة 99.1% في هذا المعيار.
MATH
99.1%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Kimi K2 Thinking درجة 99.1% في هذا المعيار.
GSM8k
99%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Kimi K2 Thinking درجة 99% في هذا المعيار.
MGSM
95%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Kimi K2 Thinking درجة 95% في هذا المعيار.
MathVista
75%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Kimi K2 Thinking درجة 75% في هذا المعيار.
SWE-Bench
71.3%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Kimi K2 Thinking درجة 71.3% في هذا المعيار.
HumanEval
83%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Kimi K2 Thinking درجة 83% في هذا المعيار.
LiveCodeBench
83.1%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Kimi K2 Thinking درجة 83.1% في هذا المعيار.
MMMU
80%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Kimi K2 Thinking درجة 80% في هذا المعيار.
MMMU Pro
60%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Kimi K2 Thinking درجة 60% في هذا المعيار.
ChartQA
88%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Kimi K2 Thinking درجة 88% في هذا المعيار.
DocVQA
94%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Kimi K2 Thinking درجة 94% في هذا المعيار.
Terminal-Bench
55%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Kimi K2 Thinking درجة 55% في هذا المعيار.
ARC-AGI
12%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Kimi K2 Thinking درجة 12% في هذا المعيار.

حول Kimi K2 Thinking

تعرف على قدرات Kimi K2 Thinking والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

Mixture of Experts بتريليون parameter

Kimi K2 Thinking هو نموذج reasoning بحجم تريليون parameter يستخدم معمارية Mixture-of-Experts (MoE). تم تطويره بواسطة Moonshot AI وإصداره في أواخر 2025، وهو يفعل 32 مليار parameter فقط للـ inference، مما يوازن بين القدرة المعرفية الهائلة والكفاءة الحسابية. تم تصميمه خصيصاً كـ agent مفكر يقوم بتوسيع نطاق حساباته أثناء مرحلة الـ inference لحل المشكلات المنطقية المعقدة. يسمح هذا النهج للنموذج بالتأمل في الـ reasoning الخاص به وتصحيح الأخطاء قبل تقديم إجابة نهائية.

استخدام الأدوات والتخطيط الـ Agentic

يتميز النموذج بقدرته على التعامل مع ما يصل إلى 300 استدعاء للأدوات بشكل مستقل. بينما تعاني معظم نماذج اللغة القياسية مع التخطيط طويل الأمد، تم تصميم K2 Thinking لسير عمل الـ agentic مثل تصفح الويب المستقل وهندسة البرمجيات متعددة الخطوات. وهو يدعم أصلاً دقة INT4 عبر الـ Quantization-Aware Training، مما يسمح للنموذج بالحفاظ على أداء بمستوى الـ frontier أثناء تشغيله على مجمعات أجهزة المؤسسات القياسية.

التركيز على المطورين والبحث

مع context window بحجم 256K token، تم بناء النموذج للبحث العميق والمهام التقنية المعقدة. وهو يسد فجوة الأداء بين الأنظمة المغلقة والنماذج مفتوحة الأوزان. إن قدرته على حل أسئلة العلوم بمستوى الدكتوراه والمشكلات الرياضية التنافسية تجعله خياراً مناسباً للبحث الأكاديمي، ومساعدي البرمجة المؤتمتة، وتطبيقات الـ reasoning عالية الدقة حيث يكون الاتساق المنطقي هو المتطلب الأساسي.

Kimi K2 Thinking

حالات استخدام Kimi K2 Thinking

اكتشف الطرق المختلفة لاستخدام Kimi K2 Thinking لتحقيق نتائج رائعة.

هندسة البرمجيات المعقدة

حل مشكلات GitHub الواقعية وهيكلة قواعد بيانات برمجية متعددة الملفات باستخدام التصحيح الذاتي التكراري.

وكلاء البحث المستقل (Autonomous Research Agents)

تنفيذ مئات من استدعاءات الأدوات المتسلسلة لجمع وتوليف البيانات التقنية النادرة.

الرياضيات بمستوى الأولمبياد

حل مشكلات الهندسة والجبر المتقدمة مع التحقق العميق من خلال chain-of-thought.

البحث العلمي بمستوى الدكتوراه

الإجابة على أسئلة الخبراء في الفيزياء والأحياء التي تتطلب استنتاجاً منطقياً متعدد الخطوات.

التحكم التفاعلي في الكمبيوتر

التنقل في بيئات الـ terminal والبنية التحتية السحابية لأتمتة سير عمل الـ devops.

الكتابة الإبداعية المعقدة منطقياً

إنشاء محتوى طويل يتطلب التزاماً صارماً بقواعد بناء العالم المعقدة.

نقاط القوة

القيود

Reasoning من الطراز الأول: يسجل 44.9% على HLE مع استخدام الأدوات، متجاوزاً النماذج الرئيسية المغلقة في المنطق على مستوى الخبراء.
متطلبات موارد ضخمة: يتطلب الـ inference المحلي ما لا يقل عن 245GB من الـ VRAM حتى مع الـ quantization، مما يقصر استخدامه على مجمعات الخوادم المتطورة.
عمق استثنائي في الـ Agentic: قادر على إجراء 300 استدعاء متسلسل للأدوات، مما يتيح بحثاً مستقلاً تماماً على الويب ومهام المتصفح.
latency الاستجابة المتأصلة: تؤدي عملية الـ thinking العميقة إلى فترات انتظار كبيرة حيث يقوم النموذج بتوسيع نطاق حسابات الـ test-time.
دقة رياضية فائقة: يحقق 94.5% على AIME 2025، مما يثبت موثوقيته في حل المشكلات الرياضية عالية المستوى.
غياب الـ Multimodality الأصلي: لا يمكن لهذا الإصدار معالجة مدخلات الصور أو الفيديو مباشرة، مما يتطلب نموذج رؤية منفصلاً للمهام الـ multimodal.
إتاحة الأوزان (Open-Weights): يوفر ذكاءً بمستوى النماذج الرائدة (frontier model) لمجتمع المطورين للنشر المحلي والـ fine-tuning.
تجاوز كبير في الـ tokens: تستهلك خطوات الـ reasoning الداخلية عدداً كبيراً من الـ tokens للمخرجات، مما يزيد من تكاليف الـ API للاستعلامات البسيطة.

البدء السريع API

moonshot/kimi-k2-thinking

عرض التوثيق
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2-thinking',
    messages: [{ role: 'user', content: 'صمم نظاماً لمراجعة الكود المستقل باستخدام 300 استدعاء للأدوات.' }],
  });
  console.log(response.choices[0].message.content);
}

main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Kimi K2 Thinking

شاهد رأي المجتمع في Kimi K2 Thinking

Kimi K2.5 هو أفضل نموذج مفتوح للبرمجة، لقد أبدعوا حقاً.
npc_gooner
reddit
أطلقت Moonshot AI نموذج Kimi K2 Thinking. 300 استدعاء متسلسل للأدوات؟ هذا هو مستقبل الـ agentic AI.
@tech_trends
twitter
أصدرت Kimi نموذج Kimi K2 Thinking، وهو نموذج reasoning مفتوح بـ تريليون parameter. هذا هو الشيء الحقيقي.
nekofneko
reddit
حقيقة أنه يستطيع التعامل مع 300 استدعاء للأدوات بالتسلسل تفتح آفاقاً جديدة لسير عمل الـ agents.
AI Explained
youtube
من المثير للإعجاب رؤية نموذج open-source يحقق هذه الأرقام. نهج توسيع نطاق الـ test-time يؤتي ثماره بوضوح.
jsmith23
hackernews
تشغيل هذا النموذج محلياً يمثل تحدياً، لكن عمق الـ reasoning لا يشبه أي شيء آخر في مساحة الـ open weights.
LocalLlamaEnthusiast
reddit

فيديوهات عن Kimi K2 Thinking

شاهد الدروس والمراجعات والنقاشات عن Kimi K2 Thinking

Kimi K2 thinking هو أفضل نموذج AI استخدمته على الإطلاق.

إنه أكثر نموذج مستقل (agentic) تم صنعه على الإطلاق، مما يعني أنه يمكن أن يعمل لساعات بمفرده.

إنه قادر على التفكير والتأمل في كل خطوة، لذا لا يضيع أبداً.

سرعة الـ reasoning سريعة بشكل مدهش على الرغم من وجود تريليون parameter.

إذا كنت تبني agents، فهذه هي المعمارية التي يجب أن تنظر إليها.

Kimi K2 Thinking... هو ترقية تفكير لنموذج Kimi K2، الذي يبدو أنه يحظى بتقدير واسع.

هذا بالطبع نموذج open-source... بحجم إجمالي يبلغ حوالي 1 تريليون parameter.

جميع نتائج الـ benchmark تم الإبلاغ عنها بدقة int4.

يتعامل مع المشكلات الرياضية المعقدة بمستوى من المنطق ينافس أفضل المختبرات المملوكة للشركات.

عملية تثبيت الأوزان محلياً مباشرة تماماً إذا كان لديك الـ VRAM الكافي.

Kimi K2.5 هو أحدث نموذج open-source طورته شركة صينية تدعى Moonshot AI.

إنه قادر على تشغيل ما يصل إلى 100 وكيل فرعي و1,500 استدعاء للأدوات وتشغيلها بالتوازي.

أوصي به بالتأكيد إذا كنت ترغب في بناء موقع ويب جميل حقاً.

تسمح سلسلة الـ chain-of-thought الداخلية له بتصحيح أخطاء الكود ذاتياً قبل تقديم الإجابة النهائية.

ركزت Moonshot حقاً على التخطيط طويل الأمد لهذا الإصدار.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لـ Kimi K2 Thinking

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Kimi K2 Thinking وتحقيق نتائج أفضل.

تفعيل مخرجات التفكير (Thinking Output)

استخدم خاصية الـ special tokens في محرك الـ inference الخاص بك لرؤية خطوات الـ reasoning الداخلية للنموذج.

تحسين الـ Temperature

اضبط الـ sampling temperature على 1.0 و min_p على 0.01 للحصول على أكثر تدفق منطقي متسق.

استخدام الـ System Prompts

ابدأ المحادثات بـ prompt الهوية الرسمي لـ Moonshot AI لضمان استقرار سلوك النموذج.

توسيع نطاق الـ Test-Time Compute

اسمح للنموذج بتوليد المزيد من الـ tokens الداخلية للمشكلات الأصعب لزيادة الدقة.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

الأسئلة الشائعة حول Kimi K2 Thinking

ابحث عن إجابات للأسئلة الشائعة حول Kimi K2 Thinking