moonshot

Kimi K2.5

اكتشف Kimi K2.5 من Moonshot AI، نموذج agentic مفتوح المصدر بـ 1 تريليون بارامتر يتميز بقدرات multimodal أصلية، وcontext window بـ 262 ألف، وSOTA reasoning.

Agentic AIMultimodalمفتوح المصدرReasoningMoE
moonshot logomoonshotKimi27 يناير 2026
نافذة السياق
256Kرموز
أقصى مخرج
66Kرموز
سعر الإدخال
$0.60/ 1M
سعر الإخراج
$3.00/ 1M
الوضع:TextImageVideo
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
87.6%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Kimi K2.5 درجة 87.6% في هذا المعيار.
HLE
50.2%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Kimi K2.5 درجة 50.2% في هذا المعيار.
MMLU
91.5%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Kimi K2.5 درجة 91.5% في هذا المعيار.
MMLU Pro
87.1%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Kimi K2.5 درجة 87.1% في هذا المعيار.
SimpleQA
48%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Kimi K2.5 درجة 48% في هذا المعيار.
IFEval
85%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Kimi K2.5 درجة 85% في هذا المعيار.
AIME 2025
96.1%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Kimi K2.5 درجة 96.1% في هذا المعيار.
MATH
90.1%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Kimi K2.5 درجة 90.1% في هذا المعيار.
GSM8k
97.1%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Kimi K2.5 درجة 97.1% في هذا المعيار.
MGSM
95%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Kimi K2.5 درجة 95% في هذا المعيار.
MathVista
90.1%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Kimi K2.5 درجة 90.1% في هذا المعيار.
SWE-Bench
76.8%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Kimi K2.5 درجة 76.8% في هذا المعيار.
HumanEval
88%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Kimi K2.5 درجة 88% في هذا المعيار.
LiveCodeBench
85%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Kimi K2.5 درجة 85% في هذا المعيار.
MMMU
78.5%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Kimi K2.5 درجة 78.5% في هذا المعيار.
MMMU Pro
78.5%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Kimi K2.5 درجة 78.5% في هذا المعيار.
ChartQA
77.5%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Kimi K2.5 درجة 77.5% في هذا المعيار.
DocVQA
88.8%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Kimi K2.5 درجة 88.8% في هذا المعيار.
Terminal-Bench
50.8%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Kimi K2.5 درجة 50.8% في هذا المعيار.
ARC-AGI
12%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Kimi K2.5 درجة 12% في هذا المعيار.

حول Kimi K2.5

تعرف على قدرات Kimi K2.5 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

Kimi K2.5 هو نموذج multimodal مفتوح المصدر من Moonshot AI. يستخدم معمارية Mixture-of-Experts بـ 1 تريليون بارامتر حيث يتم تفعيل 32 مليار بارامتر لكل token. يوحد النظام معالجة النص والصورة والفيديو من خلال إطار عمل reasoning واحد بدلاً من استخدام encoders خارجية منفصلة لكل modality. تسمح هذه المعمارية للنموذج بالتعامل مع 256,000 token من الـ context مع الحفاظ على دقة استرجاع عالية واتساق منطقي عبر سلاسل طويلة جداً.

يتميز النموذج بقدرة Agent Swarm. تسمح هذه الميزة للنظام بتنسيق ما يصل إلى 100 sub-agent متوازٍ لتنفيذ مهام بحثية أو هندسية معقدة في وقت واحد. من خلال دمج encoder MoonViT-3D بـ 400 مليون بارامتر، يمكن لـ K2.5 تحليل ساعات من محتوى الفيديو بدقة زمنية. إنه مصمم خصيصاً للتنفيذ المستقل، متفوقاً على العديد من النماذج المملوكة في معايير الـ agentic مثل SWE-Bench وBrowseComp.

يوفر Kimi K2.5 نمط Thinking مخصصاً للمهام التي تتطلب منطقاً عميقاً. عند تفعيله، يقوم النموذج بتوليد سلسلة من الـ reasoning الداخلية لتصحيح نفسه والتحقق من الخطوات قبل إنتاج إجابة نهائية. هذا يجعله فعالاً للغاية للرياضيات بمستوى المنافسات وتطوير البرمجيات على نطاق واسع. تم تحسين اقتصاديات الـ token الخاصة به لنشر المؤسسات، حيث يوفر ذكاءً بمستوى الـ frontier بجزء بسيط من تكلفة الأنظمة المنافسة مغلقة المصدر.

Kimi K2.5

حالات استخدام Kimi K2.5

اكتشف الطرق المختلفة لاستخدام Kimi K2.5 لتحقيق نتائج رائعة.

هندسة البرمجيات المستقلة

حل مشكلات GitHub المعقدة وبناء بنى مشاريع متعددة الملفات باستخدام منطق محسن لـ SWE-Bench.

تطوير الويب المرئي

إنشاء كود واجهة أمامية وتصاميم واجهة مستخدم وظيفية مباشرة من تسجيلات شاشة لتفاعلات مواقع الويب الحالية.

البحث متعدد المسارات

استخدام Agent Swarm للزحف وتوليف المعلومات من أكثر من 100 مصدر في سير عمل متوازٍ واحد.

تحليل الفيديو الطويل

استخراج أحداث وبيانات زمنية محددة من ساعات من لقطات الأمن أو المحاضرات دون أدوات استخراج الإطارات.

توليد البراهين الرياضية

تطبيق نمط الـ deep thinking لحل المسائل الرياضية بمستوى الأولمبياد بدقة تصل إلى 96 بالمئة.

أتمتة مستندات المؤسسات

توليد تقارير PDF متعددة الصفحات وجداول بيانات مالية معقدة من مصادر بيانات الأعمال غير المهيكلة.

نقاط القوة

القيود

أداء Agentic متميز: حقق 76.8 على اختبار SWE-Bench Verified، متفوقاً على العديد من نماذج الـ frontier المملوكة في مهام هندسة البرمجيات.
احتياجات VRAM محلية متطرفة: يتطلب 632 جيجابايت من الـ VRAM للنموذج الكامل غير المكمم، مما يجعل النشر المحلي مستحيلاً لمعظم المستخدمين العاديين.
اقتصاديات الـ token التي لا تضاهى: يوفر ذكاءً بمعمارية MoE بـ 1 تريليون بارامتر بسعر 0.60 دولار لكل مليون input token، أي حوالي 10 بالمئة من تكلفة Claude Opus.
latency أعلى في الـ reasoning: قد يؤدي نمط الـ thinking إلى تأخيرات كبيرة حيث يقوم النموذج بتوليد سلاسل منطقية داخلية قبل الرد.
فهم الفيديو الأصلي: يعالج ملفات الفيديو المعقدة دون استخراج إطارات خارجي، مما يتيح تحليلاً زمنياً دقيقاً للتسجيلات الطويلة.
تكرار التنسيق: قد ينتج جدران نصية طويلة بشكل مفرط ما لم يتم توجيهه بدقة لاستخدام هياكل فقرات محددة.
تنسيق الـ Swarm المتوازي: النموذج المفتوح الوحيد المدرب لتنسيق ما يصل إلى 100 sub-agent لسير عمل بحثي ضخم ومتعدد المسارات.
مخاوف مكان إقامة البيانات: البنية التحتية الرئيسية مقرها الصين، مما قد يمثل مشكلات امتثال لبعض المؤسسات الغربية.

البدء السريع API

fireworks/kimi-k2p5

عرض التوثيق
moonshot SDK
import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Kimi K2.5

شاهد رأي المجتمع في Kimi K2.5

يكلف Kimi K2.5 ما يقرب من 10 بالمئة مما يكلفه Opus بنفس مستوى الأداء.
Odd_Tumbleweed574
reddit
ينسى الناس أن Nvidia خسرت 600 مليار دولار عندما جعل مختبر صيني شيئاً كبيراً مفتوح المصدر. كيمي يفعل ذلك مرة أخرى بذكاء الـ frontier.
chetaslua
twitter
مفهوم Attention Residuals في K2.5 هو أول تغيير هيكلي منذ سنوات يعالج فعلياً مشكلة نسيان الـ LLM.
logic_king
hackernews
Workers AI تشغل نماذج كبيرة الآن. Kimi K2.5 أولاً. إنه أحد أفضل النماذج مفتوحة المصدر الموجودة، جيد جداً للبرمجة أيضاً.
dok2001
twitter
Kimi K2.5 وحش مختلف. إنه نموذج RP ذكي ومذهل، لكنه قد يصبح عصبياً إذا لم تستخدم إعدادات المجتمع المسبقة.
dptgreg
reddit
استبدلت سير عمل GPT 4 بـ Kimi K2.5 لأن نمط الـ thinking أكثر شفافية والـ context window يتعامل مع مستودع الكود الخاص بي بالكامل.
Dev_Max
reddit

فيديوهات عن Kimi K2.5

شاهد الدروس والمراجعات والنقاشات عن Kimi K2.5

كيمي K2.5 يتفوق على GPT 5.2 بفضل الـ thinking العالي، ويدمر تماماً نماذج الـ Frontier الأخرى.

إنه أقوى نموذج برمجي مفتوح المصدر حتى الآن مع 76.8 على SWE verified.

خاصية Agent swarm هي تحول من الـ agent الفردي إلى الـ agents المتعددين الذين ينفذون سير عمل متوازٍ عبر ما يصل إلى 1500 خطوة منسقة.

الـ context window ضخم بـ 256 ألف token وهو أكثر من كافٍ لمعظم المشاريع.

شركة Moonshot تدفع حقاً حدود ما يمكن أن تفعله الـ open weights في أوائل عام 2026.

لقد نجح حقاً في محاكاة جمالية تصميم Apple وأنتج موقعاً جميلاً مع حركات انيميشن فقط من فيديو.

خاصية Swarm تبدو رائعة جداً وهي بالتأكيد ممتعة في الاستخدام حيث تخصص شارات هوية لكل sub agent.

K2.5 أرخص بكثير بـ 60 سنتاً لكل مليون input token و3 دولارات لكل مليون output token.

المعالجة الأصلية للفيديو تعني أنك لا تحتاج إلى استخدام أدوات خارجية باهظة الثمن لمعالجة الإطارات.

هذا النموذج يغير قواعد اللعبة للمطورين الذين يحتاجون إلى agents مستقلة بميزانية محدودة.

حققت Moonshot ذلك من خلال منح كل sub agent مكافآت في مراحل خطوات حرجة منفصلة لمنع الانهيار التسلسلي.

يتعلم النموذج اختيار التوازي فقط عندما يختصر هذا المسار الحرج، وهو ابتكار ذكي جداً.

Kimi K2.5 يكاد يكون قادراً على العمل على الأجهزة الاستهلاكية باستخدام GGUF.

نمط الـ thinking قوي بشكل لا يصدق لحل الأخطاء المنطقية المعقدة في Python.

رؤية نموذج بـ 1 تريليون بارامتر يتم إصداره هكذا هو أمر ضخم لمجتمع الـ open source.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لـ Kimi K2.5

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Kimi K2.5 وتحقيق نتائج أفضل.

تفعيل نمط Thinking

مرر بارامتر الـ thinking في طلب الـ API الخاص بك للوصول إلى أقصى دقة في مهام الرياضيات والبرمجة.

تشغيل Agent Swarm

وجه النموذج لنشر swarm لمهام البحث لفرض تنسيق متوازٍ عبر الـ sub-agents.

تحسين الـ Temperature

استخدم temperature بمقدار 1.0 لنمط الـ thinking للسماح بـ reasoning متنوع، ولكن اخفضه إلى 0.6 للدردشة القياسية.

مطالبات الـ Vision المشتركة

ارفع لقطات الشاشة للأخطاء بجانب مقتطفات الكود للاستفادة من التدريب الموحد للـ text-vision الخاص بالنموذج.

تخزين الـ context مؤقتاً

استخدم الـ context caching للمستندات الطويلة المتكررة لتقليل تكاليف الـ input بنسبة تصل إلى 90 بالمئة.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

الأسئلة الشائعة حول Kimi K2.5

ابحث عن إجابات للأسئلة الشائعة حول Kimi K2.5