Kimi K2.5

اكتشف Kimi K2.5 من Moonshot AI، وهو model ذكاء اصطناعي agentic مفتوح المصدر بـ 1T parameter، يتميز بقدرات multimodal أصلية، وcontext window تصل إلى 262K،...

Agentic AIMultimodalOpen SourceReasoningMoE
moonshot logomoonshotKimi K-seriesJanuary 27, 2026
نافذة السياق
262Kرموز
أقصى مخرج
33Kرموز
سعر الإدخال
$0.60/ 1M
سعر الإخراج
$2.50/ 1M
الوضع:TextImageVideo
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
87.6%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Kimi K2.5 درجة 87.6% في هذا المعيار.
HLE
50.2%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Kimi K2.5 درجة 50.2% في هذا المعيار.
MMLU
92%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Kimi K2.5 درجة 92% في هذا المعيار.
MMLU Pro
87.1%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Kimi K2.5 درجة 87.1% في هذا المعيار.
SimpleQA
54%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Kimi K2.5 درجة 54% في هذا المعيار.
IFEval
94%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Kimi K2.5 درجة 94% في هذا المعيار.
AIME 2025
96.1%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Kimi K2.5 درجة 96.1% في هذا المعيار.
MATH
98%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Kimi K2.5 درجة 98% في هذا المعيار.
GSM8k
99%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Kimi K2.5 درجة 99% في هذا المعيار.
MGSM
96%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Kimi K2.5 درجة 96% في هذا المعيار.
MathVista
84.2%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Kimi K2.5 درجة 84.2% في هذا المعيار.
SWE-Bench
76.8%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Kimi K2.5 درجة 76.8% في هذا المعيار.
HumanEval
99%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Kimi K2.5 درجة 99% في هذا المعيار.
LiveCodeBench
85%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Kimi K2.5 درجة 85% في هذا المعيار.
MMMU
84%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Kimi K2.5 درجة 84% في هذا المعيار.
MMMU Pro
78.5%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Kimi K2.5 درجة 78.5% في هذا المعيار.
ChartQA
77.5%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Kimi K2.5 درجة 77.5% في هذا المعيار.
DocVQA
88.8%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Kimi K2.5 درجة 88.8% في هذا المعيار.
Terminal-Bench
50.8%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Kimi K2.5 درجة 50.8% في هذا المعيار.
ARC-AGI
12%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Kimi K2.5 درجة 12% في هذا المعيار.

حول Kimi K2.5

تعرف على قدرات Kimi K2.5 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

أفق جديد في الذكاء الـ Agentic

Kimi K2.5 هو model ذكاء اصطناعي agentic رائد و open-source من Moonshot AI، ويمثل قفزة كبيرة في الذكاء الـ multimodal الموحد. بُني الـ model على architecture ضخمة من نوع Mixture-of-Experts (MoE) بـ 1 تريليون parameter مع 32 مليار parameter نشط، وهو يدمج بشكل أصلي معالجة النصوص والصور والفيديو في إطار reasoning واحد. على عكس الـ LLMs التقليدية، تم تصميم K2.5 خصيصاً للتنفيذ الذاتي، ويتميز بوضع 'Thinking' فريد يسمح له بالتصحيح الذاتي والتفكير في المشكلات المعقدة متعددة الخطوات دون تدخل بشري.

اختراقات معمارية

يقدم الـ model ميزة ثورية تُعرف باسم 'Agent Swarm'، والتي تمكن النظام من تنسيق ما يصل إلى 100 sub-agent متوازٍ ديناميكياً لحل مهام البحث أو الهندسة الضخمة. من خلال تحقيق أداء من الطراز الأول في benchmarks مثل SWE-Bench وAIME 2025، يسد Kimi K2.5 الفجوة بفعالية بين الـ models الـ open-source والذكاء الاصطناعي الـ frontier المملوك، مقدماً قدرات نخبوية بجزء بسيط من التكلفة التشغيلية. كما يتيح دمجه لـ MoonViT-3D encoder فهماً غير مسبوق للفيديو، يغطي عدة ساعات من المحتوى بدقة زمنية عالية.

كفاءة لا تضاهى

بعيداً عن القوة الخام، يركز K2.5 على اقتصاديات الـ tokens المستدامة. من خلال استخدام context caching قوي و structure MoE محسن للغاية، فإنه يقدم أداءً يضاهي أغلى الـ models الـ closed-source مع الحفاظ على سعر تنافسي للغاية يبلغ 0.60 دولار لكل مليون input tokens. وهذا يجعله عموداً فقرياً مثالياً للمؤسسات التي تتطلع إلى نشر complex, long-context autonomous agents على نطاق واسع.

Kimi K2.5

حالات استخدام Kimi K2.5

اكتشف الطرق المختلفة لاستخدام Kimi K2.5 لتحقيق نتائج رائعة.

هندسة البرمجيات الذاتية

حل مشكلات GitHub المعقدة واستنساخ المواقع بالكامل (full-stack) من رسومات واجهة المستخدم البصرية.

حل الرياضيات بمستوى الأولمبياد

معالجة البراهين الرياضية المتقدمة ومسائل المسابقات بدقة تتجاوز 96% في اختبار AIME 2025.

الـ reasoning للفيديوهات الطويلة

تحليل وتلخيص المحتوى من فيديوهات تصل مدتها إلى ساعتين دون فقدان السياق أو تدهور الجودة الزمنية.

agents بحث ديناميكية

استخدام 'Agent Swarm' لإجراء أبحاث ويب متعددة المسارات وتوليف البيانات من مئات المصادر بالتوازي.

توليد واجهات أمامية جمالية

تحويل مخططات واجهة المستخدم المرسومة يدوياً أو لقطات الشاشة إلى كود React وظيفي ومصقول مع حركات تعبيرية.

التحكم الذاتي في الـ terminal

تنفيذ أوامر bash المعقدة وعمليات مستوى النظام لإدارة مجموعات الخوادم وبيئات التطوير.

نقاط القوة

القيود

Reasoning رياضي نخبوي: بتسجيل 96.1% في AIME 2025، فإنه يتفوق على جميع الـ models الـ closed-source تقريبًا في الاستنتاج المنطقي البحت.
متطلب للأجهزة: يتطلب تشغيل الـ model الكامل (1T) محلياً cluster ذكاء اصطناعي من فئة المؤسسات مع عدة GPUs من نوع H100 أو B200.
توازي هائل: تتيح ميزة 'Agent Swarm' استخدام أكثر من 100 sub-agent، مما يقلل بشكل كبير من الوقت اللازم لإكمال مهام البحث.
Latency في التفكير: يؤدي تفعيل وضع الـ deep reasoning إلى زيادة كبيرة في الـ time-to-first-token مقارنة بالمعالجة القياسية.
Unified Multimodal Architecture: يعالج بشكل أصلي فيديوهات مدتها ساعتان وصوراً عالية الدقة دون الحاجة إلى vision encoders منفصلة.
فجوة معرفية بمستوى الدكتوراه: تشير نتيجته (50.2%) في اختبار 'Humanity's Last Exam' إلى وجود مساحة للتحسين في الخبرات العلمية رفيعة المستوى.
اقتصاديات tokens قوية: بسعر 0.60 دولار لكل مليون input tokens، فهو أرخص بنحو 8-10 مرات من الـ frontier models المنافسة مثل Claude 4.5.
مخاوف تنظيمية: كـ model صيني، قد يخضع استخدام الـ API وسيادة البيانات لأطر تنظيمية مختلفة بالنسبة للمؤسسات الغربية.

البدء السريع API

fireworks/kimi-k2p5

عرض التوثيق
moonshot SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: 'https://api.moonshot.cn/v1'
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [{ role: 'user', content: 'Create a full-stack Next.js dashboard with a dark mode glassmorphism UI.' }],
    max_tokens: 2048,
  });
  console.log(response.choices[0].message.content);
}

main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Kimi K2.5

شاهد رأي المجتمع في Kimi K2.5

"قدرات الـ reasoning في AIME 2025 جنونية تماماً بالنسبة لـ model مفتوح."
LogicLover
reddit
"لقد وضع Kimi K2.5 معياراً جديداً لفهم الفيديوهات الطويلة. أخيراً model لا ينسى بداية المقطع."
AI_Pioneer
x
"استخدام K2.5 كـ coding agent يغير قواعد اللعبة. نتيجته في SWE-Bench ليست مجرد رقم، يمكنك الشعور بالكفاءة."
DevGuru
hackernews
"أصدرت الصين Kimi K2.5 ومثل الساعة، الأداء يتساوى مع frontier AI models الأمريكية."
BasedTorba
x
"Kimi من الصين دمر حلم OpenAI في تجارة التريليون دولار... أرخص بـ 8 مرات."
nrqa__
x
"Kimi K2.5 هو أول model يشعرك حقاً بأنه co-pilot وليس مجرد صندوق دردشة."
CodeWizard
reddit

فيديوهات عن Kimi K2.5

شاهد الدروس والمراجعات والنقاشات عن Kimi K2.5

عند اختبار مسائل AIME، نجح Kimi K2.5 في حل كل شيء تقريباً، حتى تلك التي واجه GPT-4o صعوبة فيها.

بالنسبة لمهام البرمجة، فإن القدرات الـ agentic هي بوضوح المكان الذي يتألق فيه هذا الـ model مقارنة بالـ LLMs القياسية.

الطبيعة الـ open-source لـ model بهذا الحجم (trillion-parameter) هي أمر غير مسبوق في السوق الحالي.

إنك ترى هنا معالجة منطقية تنافس o1 في اختبارات الرياضيات الأولية التي أجريتها.

تسعير الـ tokens منخفض جداً لدرجة أنه ينهي فعلياً حجة استخدام الـ models الـ closed-source للمهام الأساسية.

القدرة على معالجة فيديوهات مدتها ساعتان دفعة واحدة دون فقدان السياق هي اختراق هائل.

إنه ليس مجرد model للدردشة؛ لقد صُمم من الصفر لاستخدام الأدوات والـ terminals.

عند تفعيل وضع Swarm، فإن التوازي في أبحاث الويب لا يُعلى عليه ببساطة.

هذه رسالة من Moonshot AI للعالم بأن لديهم القدرة الحوسبية والموهبة.

رؤيته يتنقل في terminal حي لإصلاح ثغرة برمجية هو مستقبل الهندسة الذاتية (autonomous engineering).

قفزة Kimi K2.5 في benchmark BrowseComp تشير إلى قدرته على تصفح الويب بمستوى من الإصرار لم نره من قبل.

حقيقة أنه يوحد أوضاع الرؤية والتفكير في architecture واحدة هي القصة المعمارية الحقيقية هنا.

الأداء في MMLU وGSM8k يثبت أن جودة البيانات المستخدمة في التدريب كانت من الطراز الأول.

على عكس الإصدارات السابقة، فإن فهم الفيديو هنا لا يعاني من التدهور الزمني.

إذا كنت مطوراً، فإن التوافق مع OpenAI يجعل الانتقال إلى هذا الـ model للاختبار لا يتطلب أي مجهود تقريباً.

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي
شاهد العرض التوضيحي

نصائح احترافية لـ Kimi K2.5

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Kimi K2.5 وتحقيق نتائج أفضل.

الاستفادة من وضع الـ Thinking

اطلب من الـ model صراحة عبر الـ prompt أن 'يفكر خطوة بخطوة' (Think step-by-step) لتنشيط وضع الـ reasoning الخاص به لمهام الرياضيات أو البرمجة المعقدة.

ميزة سياق الفيديو

استخدم MoonViT-3D encoder الخاص بالـ model لمعالجة الفيديوهات الطويلة جداً؛ فهو يتفوق في العثور على تفاصيل محددة في مقاطع مدتها ساعتان.

تنسيق الـ agents

للمشاريع الكبيرة، استخدم قدرة الـ swarm للسماح لـ K2.5 بتفكيك المهام إلى مهام فرعية لتنفيذ أسرع.

توفير الـ Cache

صمم استدعاءات الـ API الخاصة بك للاستفادة من ميزة الـ context caching القوية في Moonshot لتقليل تكاليف الـ input بنسبة تصل إلى 75%.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

الأسئلة الشائعة حول Kimi K2.5

ابحث عن إجابات للأسئلة الشائعة حول Kimi K2.5