كم تبلغ تكلفة استخدام Kimi K2.5؟

تبلغ تكلفة الـ input tokens 0.60 دولار لكل مليون، وتكلفة الـ output tokens 3.00 دولار لكل مليون. تجعل هذه التسعيرة النموذج واحداً من أكثر النماذج من فئة frontier-class تكلفةً ومعقوليةً.

ما هو الحد الأقصى لطول الـ context في Kimi K2.5؟

يدعم Kimi K2.5 سعة context window تصل إلى 256,000 token. وهذا يسمح للمستخدمين بمعالجة كتب كاملة أو قواعد برمجية ضخمة في prompt واحد.

هل يمكن لـ Kimi K2.5 معالجة ملفات الفيديو؟

نعم، يتميز النموذج بـ encoder أصلي من نوع MoonViT-3D لمعالجة محتوى الفيديو الطويل. يمكنه تحليل ساعات من اللقطات لاستخراج الأحداث والملخصات والتفاصيل المرئية.

هل Kimi K2.5 مفتوح المصدر (open-source)؟

أصدرت Moonshot AI أوزان النموذج بموجب ترخيص MIT معدل. وهذا يسمح للمطورين باستضافة النموذج على بنيتهم التحتية الخاصة.

ما هي خاصية Agent Swarm؟

هو نمط تنسيق (orchestration mode) حيث يدير النموذج ما يصل إلى 100 sub-agent يعملون بالتوازي. يُستخدم هذا للمهام التي تتطلب بحثاً عالي التزامن أو تعديلاً على ملفات متعددة.

كيف يقارن Kimi K2.5 بـ Claude 3.7 Sonnet؟

يوفر Kimi K2.5 قدرات reasoning مشابهة ولكنه يتضمن دعماً أصلياً للفيديو وتسعيراً أقل بكثير. كما يتميز بهيكلية الـ swarm المتوازية الفريدة.

ما هي الأجهزة المطلوبة لتشغيل Kimi K2.5 محلياً؟

يتطلب النموذج الكامل غير المكمم حوالي 632 جيجابايت من الـ VRAM. سيحتاج معظم المستخدمين المحليين إلى استخدام نسخ مكممة (quantized) على أجهزة استهلاكية عالية الأداء.

كيف يمكنني الوصول إلى نمط Thinking عبر الـ API؟

يمكنك تفعيله عن طريق إضافة كائن thinking مع تعيين النوع إلى enabled في الـ extra_body الخاص بطلب الـ API الخاص بك. هذا يحسن الأداء في المهام التي تتطلب منطقاً مكثفاً.

Kimi K2.5

اكتشف Kimi K2.5 من Moonshot AI، نموذج agentic مفتوح المصدر بـ 1 تريليون بارامتر يتميز بقدرات multimodal أصلية، وcontext window بـ 262 ألف، وSOTA reasoning.

Agentic AIMultimodalمفتوح المصدرReasoningMoE

moonshotKimi27 يناير 2026

نافذة السياق

256Kرموز

أقصى مخرج

66Kرموز

سعر الإدخال

$0.60/ 1M

سعر الإخراج

$3.00/ 1M

الوضع:TextImageVideo

القدرات:الرؤيةالأدواتالبثالاستدلال

المعايير

GPQA

87.6%

HLE

50.2%

MMLU

91.5%

MMLU Pro

87.1%

SimpleQA

48%

IFEval

85%

AIME 2025

96.1%

MATH

90.1%

GSM8k

97.1%

MGSM

95%

MathVista

90.1%

SWE-Bench

76.8%

HumanEval

88%

LiveCodeBench

85%

MMMU

78.5%

MMMU Pro

78.5%

ChartQA

77.5%

DocVQA

88.8%

Terminal-Bench

50.8%

ARC-AGI

12%

عرض توثيق API

حول Kimi K2.5

تعرف على قدرات Kimi K2.5 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

Kimi K2.5 هو نموذج multimodal مفتوح المصدر من Moonshot AI. يستخدم معمارية Mixture-of-Experts بـ 1 تريليون بارامتر حيث يتم تفعيل 32 مليار بارامتر لكل token. يوحد النظام معالجة النص والصورة والفيديو من خلال إطار عمل reasoning واحد بدلاً من استخدام encoders خارجية منفصلة لكل modality. تسمح هذه المعمارية للنموذج بالتعامل مع 256,000 token من الـ context مع الحفاظ على دقة استرجاع عالية واتساق منطقي عبر سلاسل طويلة جداً.

يتميز النموذج بقدرة Agent Swarm. تسمح هذه الميزة للنظام بتنسيق ما يصل إلى 100 sub-agent متوازٍ لتنفيذ مهام بحثية أو هندسية معقدة في وقت واحد. من خلال دمج encoder MoonViT-3D بـ 400 مليون بارامتر، يمكن لـ K2.5 تحليل ساعات من محتوى الفيديو بدقة زمنية. إنه مصمم خصيصاً للتنفيذ المستقل، متفوقاً على العديد من النماذج المملوكة في معايير الـ agentic مثل SWE-Bench وBrowseComp.

يوفر Kimi K2.5 نمط Thinking مخصصاً للمهام التي تتطلب منطقاً عميقاً. عند تفعيله، يقوم النموذج بتوليد سلسلة من الـ reasoning الداخلية لتصحيح نفسه والتحقق من الخطوات قبل إنتاج إجابة نهائية. هذا يجعله فعالاً للغاية للرياضيات بمستوى المنافسات وتطوير البرمجيات على نطاق واسع. تم تحسين اقتصاديات الـ token الخاصة به لنشر المؤسسات، حيث يوفر ذكاءً بمستوى الـ frontier بجزء بسيط من تكلفة الأنظمة المنافسة مغلقة المصدر.

حالات استخدام Kimi K2.5

اكتشف الطرق المختلفة لاستخدام Kimi K2.5 لتحقيق نتائج رائعة.

هندسة البرمجيات المستقلة

حل مشكلات GitHub المعقدة وبناء بنى مشاريع متعددة الملفات باستخدام منطق محسن لـ SWE-Bench.

تطوير الويب المرئي

إنشاء كود واجهة أمامية وتصاميم واجهة مستخدم وظيفية مباشرة من تسجيلات شاشة لتفاعلات مواقع الويب الحالية.

البحث متعدد المسارات

استخدام Agent Swarm للزحف وتوليف المعلومات من أكثر من 100 مصدر في سير عمل متوازٍ واحد.

تحليل الفيديو الطويل

استخراج أحداث وبيانات زمنية محددة من ساعات من لقطات الأمن أو المحاضرات دون أدوات استخراج الإطارات.

توليد البراهين الرياضية

تطبيق نمط الـ deep thinking لحل المسائل الرياضية بمستوى الأولمبياد بدقة تصل إلى 96 بالمئة.

أتمتة مستندات المؤسسات

توليد تقارير PDF متعددة الصفحات وجداول بيانات مالية معقدة من مصادر بيانات الأعمال غير المهيكلة.

نقاط القوة

القيود

أداء Agentic متميز: حقق 76.8 على اختبار SWE-Bench Verified، متفوقاً على العديد من نماذج الـ frontier المملوكة في مهام هندسة البرمجيات.

احتياجات VRAM محلية متطرفة: يتطلب 632 جيجابايت من الـ VRAM للنموذج الكامل غير المكمم، مما يجعل النشر المحلي مستحيلاً لمعظم المستخدمين العاديين.

اقتصاديات الـ token التي لا تضاهى: يوفر ذكاءً بمعمارية MoE بـ 1 تريليون بارامتر بسعر 0.60 دولار لكل مليون input token، أي حوالي 10 بالمئة من تكلفة Claude Opus.

latency أعلى في الـ reasoning: قد يؤدي نمط الـ thinking إلى تأخيرات كبيرة حيث يقوم النموذج بتوليد سلاسل منطقية داخلية قبل الرد.

فهم الفيديو الأصلي: يعالج ملفات الفيديو المعقدة دون استخراج إطارات خارجي، مما يتيح تحليلاً زمنياً دقيقاً للتسجيلات الطويلة.

تكرار التنسيق: قد ينتج جدران نصية طويلة بشكل مفرط ما لم يتم توجيهه بدقة لاستخدام هياكل فقرات محددة.

تنسيق الـ Swarm المتوازي: النموذج المفتوح الوحيد المدرب لتنسيق ما يصل إلى 100 sub-agent لسير عمل بحثي ضخم ومتعدد المسارات.

مخاوف مكان إقامة البيانات: البنية التحتية الرئيسية مقرها الصين، مما قد يمثل مشكلات امتثال لبعض المؤسسات الغربية.

البدء السريع API

fireworks/kimi-k2p5

عرض التوثيق

moonshot SDK

import OpenAI from 'openai';
const client = new OpenAI({ apiKey: process.env.KIMI_API_KEY, baseURL: 'https://api.moonshot.cn/v1' });
async function main() {
  const res = await client.chat.completions.create({
    model: 'kimi-k2.5',
    messages: [
      { role: 'system', content: 'You are Kimi, a reasoning agent.' },
      { role: 'user', content: 'Design a parallel research plan for quantum computing trends.' }
    ],
    extra_body: { thinking: { type: 'enabled' } }
  });
  console.log(res.choices[0].message.content);
}
main();

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Kimi K2.5

شاهد رأي المجتمع في Kimi K2.5

“يكلف Kimi K2.5 ما يقرب من 10 بالمئة مما يكلفه Opus بنفس مستوى الأداء.”

— Odd_Tumbleweed574

“ينسى الناس أن Nvidia خسرت 600 مليار دولار عندما جعل مختبر صيني شيئاً كبيراً مفتوح المصدر. كيمي يفعل ذلك مرة أخرى بذكاء الـ frontier.”

— chetaslua

twitter

“مفهوم Attention Residuals في K2.5 هو أول تغيير هيكلي منذ سنوات يعالج فعلياً مشكلة نسيان الـ LLM.”

— logic_king

hackernews

“Workers AI تشغل نماذج كبيرة الآن. Kimi K2.5 أولاً. إنه أحد أفضل النماذج مفتوحة المصدر الموجودة، جيد جداً للبرمجة أيضاً.”

— dok2001

twitter

“Kimi K2.5 وحش مختلف. إنه نموذج RP ذكي ومذهل، لكنه قد يصبح عصبياً إذا لم تستخدم إعدادات المجتمع المسبقة.”

— dptgreg

“استبدلت سير عمل GPT 4 بـ Kimi K2.5 لأن نمط الـ thinking أكثر شفافية والـ context window يتعامل مع مستودع الكود الخاص بي بالكامل.”

— Dev_Max

فيديوهات عن Kimi K2.5

شاهد الدروس والمراجعات والنقاشات عن Kimi K2.5

“كيمي K2.5 يتفوق على GPT 5.2 بفضل الـ thinking العالي، ويدمر تماماً نماذج الـ Frontier الأخرى.”

“إنه أقوى نموذج برمجي مفتوح المصدر حتى الآن مع 76.8 على SWE verified.”

“خاصية Agent swarm هي تحول من الـ agent الفردي إلى الـ agents المتعددين الذين ينفذون سير عمل متوازٍ عبر ما يصل إلى 1500 خطوة منسقة.”

“الـ context window ضخم بـ 256 ألف token وهو أكثر من كافٍ لمعظم المشاريع.”

“شركة Moonshot تدفع حقاً حدود ما يمكن أن تفعله الـ open weights في أوائل عام 2026.”

“لقد نجح حقاً في محاكاة جمالية تصميم Apple وأنتج موقعاً جميلاً مع حركات انيميشن فقط من فيديو.”

“خاصية Swarm تبدو رائعة جداً وهي بالتأكيد ممتعة في الاستخدام حيث تخصص شارات هوية لكل sub agent.”

“K2.5 أرخص بكثير بـ 60 سنتاً لكل مليون input token و3 دولارات لكل مليون output token.”

“المعالجة الأصلية للفيديو تعني أنك لا تحتاج إلى استخدام أدوات خارجية باهظة الثمن لمعالجة الإطارات.”

“هذا النموذج يغير قواعد اللعبة للمطورين الذين يحتاجون إلى agents مستقلة بميزانية محدودة.”

“حققت Moonshot ذلك من خلال منح كل sub agent مكافآت في مراحل خطوات حرجة منفصلة لمنع الانهيار التسلسلي.”

“يتعلم النموذج اختيار التوازي فقط عندما يختصر هذا المسار الحرج، وهو ابتكار ذكي جداً.”

“Kimi K2.5 يكاد يكون قادراً على العمل على الأجهزة الاستهلاكية باستخدام GGUF.”

“نمط الـ thinking قوي بشكل لا يصدق لحل الأخطاء المنطقية المعقدة في Python.”

“رؤية نموذج بـ 1 تريليون بارامتر يتم إصداره هكذا هو أمر ضخم لمجتمع الـ open source.”

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي

أتمتة الويب

سير عمل ذكي

ابدأ مجاناً

نصائح احترافية لـ Kimi K2.5

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Kimi K2.5 وتحقيق نتائج أفضل.

تفعيل نمط Thinking

مرر بارامتر الـ thinking في طلب الـ API الخاص بك للوصول إلى أقصى دقة في مهام الرياضيات والبرمجة.

تشغيل Agent Swarm

وجه النموذج لنشر swarm لمهام البحث لفرض تنسيق متوازٍ عبر الـ sub-agents.

تحسين الـ Temperature

استخدم temperature بمقدار 1.0 لنمط الـ thinking للسماح بـ reasoning متنوع، ولكن اخفضه إلى 0.6 للدردشة القياسية.

مطالبات الـ Vision المشتركة

ارفع لقطات الشاشة للأخطاء بجانب مقتطفات الكود للاستفادة من التدريب الموحد للـ text-vision الخاص بالنموذج.

تخزين الـ context مؤقتاً

استخدم الـ context caching للمستندات الطويلة المتكررة لتقليل تكاليف الـ input بنسبة تصل إلى 90 بالمئة.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

الأسئلة الشائعة حول Kimi K2.5

ابحث عن إجابات للأسئلة الشائعة حول Kimi K2.5