anthropic

Claude Sonnet 4.5

يقدم Claude Sonnet 4.5 من Anthropic قدرات برمجة رائدة عالمياً (77.2% SWE-bench) و 200K context window، مُحسّنة للجيل القادم من الـ autonomous agents.

البرمجة بالذكاء الاصطناعيAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude29 سبتمبر 2025
نافذة السياق
200Kرموز
أقصى مخرج
64Kرموز
سعر الإدخال
$3.00/ 1M
سعر الإخراج
$15.00/ 1M
الوضع:TextImageAudioVideo
القدرات:الرؤيةالأدواتالبثالاستدلال
المعايير
GPQA
83%
GPQA: أسئلة علمية مستوى الدراسات العليا. معيار صارم مع 448 سؤالاً من الأحياء والفيزياء والكيمياء. خبراء الدكتوراه يحققون فقط 65-74% دقة. حقق Claude Sonnet 4.5 درجة 83% في هذا المعيار.
HLE
34%
HLE: استدلال مستوى الخبير. يختبر قدرة النموذج على إظهار استدلال مستوى الخبير في المجالات المتخصصة. حقق Claude Sonnet 4.5 درجة 34% في هذا المعيار.
MMLU
89%
MMLU: فهم اللغة متعدد المهام الضخم. معيار شامل مع 16,000 سؤال في 57 مادة أكاديمية. حقق Claude Sonnet 4.5 درجة 89% في هذا المعيار.
MMLU Pro
78%
MMLU Pro: MMLU النسخة المهنية. نسخة محسنة من MMLU مع 12,032 سؤالاً وتنسيق 10 خيارات أصعب. حقق Claude Sonnet 4.5 درجة 78% في هذا المعيار.
SimpleQA
52%
SimpleQA: معيار الدقة الواقعية. يختبر قدرة النموذج على تقديم إجابات دقيقة وواقعية. حقق Claude Sonnet 4.5 درجة 52% في هذا المعيار.
IFEval
88%
IFEval: تقييم اتباع التعليمات. يقيس مدى جودة اتباع النموذج للتعليمات والقيود المحددة. حقق Claude Sonnet 4.5 درجة 88% في هذا المعيار.
AIME 2025
87%
AIME 2025: امتحان الرياضيات الأمريكي بالدعوة. مسائل رياضيات مستوى المنافسة من امتحان AIME المرموق. حقق Claude Sonnet 4.5 درجة 87% في هذا المعيار.
MATH
87%
MATH: حل المسائل الرياضية. معيار رياضيات شامل يختبر حل المسائل في الجبر والهندسة والتفاضل والتكامل. حقق Claude Sonnet 4.5 درجة 87% في هذا المعيار.
GSM8k
98%
GSM8k: رياضيات المدرسة الابتدائية 8K. 8,500 مسألة رياضية كلامية مستوى المدرسة الابتدائية. حقق Claude Sonnet 4.5 درجة 98% في هذا المعيار.
MGSM
92%
MGSM: رياضيات ابتدائية متعددة اللغات. معيار GSM8k مترجم إلى 10 لغات. حقق Claude Sonnet 4.5 درجة 92% في هذا المعيار.
MathVista
72%
MathVista: الاستدلال البصري الرياضي. يختبر القدرة على حل المسائل الرياضية مع عناصر بصرية. حقق Claude Sonnet 4.5 درجة 72% في هذا المعيار.
SWE-Bench
77%
SWE-Bench: معيار هندسة البرمجيات. نماذج الذكاء الاصطناعي تحاول حل مشكلات GitHub حقيقية في مشاريع Python. حقق Claude Sonnet 4.5 درجة 77% في هذا المعيار.
HumanEval
94%
HumanEval: مسائل برمجة Python. 164 مسألة برمجة حيث يجب على النماذج إنشاء تنفيذات صحيحة لدوال Python. حقق Claude Sonnet 4.5 درجة 94% في هذا المعيار.
LiveCodeBench
68%
LiveCodeBench: معيار البرمجة المباشرة. يختبر قدرات البرمجة على تحديات برمجة واقعية محدثة باستمرار. حقق Claude Sonnet 4.5 درجة 68% في هذا المعيار.
MMMU
78%
MMMU: الفهم متعدد الوسائط. معيار الفهم متعدد الوسائط من 30 مادة جامعية. حقق Claude Sonnet 4.5 درجة 78% في هذا المعيار.
MMMU Pro
55%
MMMU Pro: MMMU النسخة المهنية. نسخة محسنة من MMMU مع أسئلة أكثر تحدياً. حقق Claude Sonnet 4.5 درجة 55% في هذا المعيار.
ChartQA
89%
ChartQA: أسئلة وأجوبة الرسوم البيانية. يختبر القدرة على فهم وتحليل المعلومات من الرسوم البيانية والمخططات. حقق Claude Sonnet 4.5 درجة 89% في هذا المعيار.
DocVQA
92%
DocVQA: أسئلة بصرية للمستندات. يختبر القدرة على استخراج المعلومات من صور المستندات. حقق Claude Sonnet 4.5 درجة 92% في هذا المعيار.
Terminal-Bench
50%
Terminal-Bench: مهام Terminal/CLI. يختبر القدرة على تنفيذ عمليات سطر الأوامر. حقق Claude Sonnet 4.5 درجة 50% في هذا المعيار.
ARC-AGI
14%
ARC-AGI: التجريد والاستدلال. يختبر الذكاء المرن من خلال ألغاز جديدة للتعرف على الأنماط. حقق Claude Sonnet 4.5 درجة 14% في هذا المعيار.

حول Claude Sonnet 4.5

تعرف على قدرات Claude Sonnet 4.5 والميزات وكيف يمكن أن يساعدك في تحقيق نتائج أفضل.

**حدود الذكاء الـ Agentic**

يمثل Claude 4.5 Sonnet تقدماً كبيراً في ذكاء الـ frontier، وقد تم تحسينه لعصر الـ autonomous AI agents. صدر النموذج في أواخر عام 2025، وهو نموذج hybrid reasoning يسمح للمطورين بالتبديل بين التنفيذ عالي السرعة للمهام الروتينية والتفكير الممتد (extended thinking) للتحديات المنطقية المعقدة. يتصدر النموذج الـ benchmarks في استخدام الكمبيوتر وتنسيق الأدوات، مما يجعله المحرك المفضل للـ agents المعتمدة على الـ terminal وهندسة البرمجيات متعددة الملفات.

**الدقة وتقليل الهلوسة**

تعطي بنية النموذج الأولوية للمنطق والدقة، مما يقلل من الانصياع والهلوسة التي لوحظت في السلاسل السابقة. مع حد 64,000 token للـ output و 200,000 token للـ input، يمكنه معالجة مستودعات كاملة مع إنشاء ملفات تطبيقات كاملة في تمريرة واحدة. يقدم النموذج نقاط تحقق (checkpoints) أصلية لسير عمل الـ agentic، مما يسمح للأنظمة بالتراجع وتصحيح الأخطاء بشكل مستقل دون تدخل بشري.

**براعة الـ Multimodal والـ Reasoning**

بعيداً عن تطوير البرمجيات، يتفوق Sonnet 4.5 في تحليل المستندات الـ multimodal والنمذجة المالية. يعطي منطقه الداخلي الأولوية للـ context المعماري، مما يمكنه من رسم خرائط للأنظمة واسعة النطاق بشكل أكثر فعالية من سابقيه. سواء كان الأمر يتعلق بمعالجة الملاحظات المكتوبة بخط اليد أو تنفيذ تكاملات الـ API، يحافظ النموذج على دقة واقعية عالية واتباع صارم للتعليمات عبر المهام طويلة المدى.

Claude Sonnet 4.5

حالات استخدام Claude Sonnet 4.5

اكتشف الطرق المختلفة لاستخدام Claude Sonnet 4.5 لتحقيق نتائج رائعة.

هندسة البرمجيات المستقلة

إدارة التطوير من البداية إلى النهاية بدءاً من المتطلبات الأولية وصولاً إلى الـ commits الآلية باستخدام واجهات الـ terminal.

الأتمتة المعتمدة على واجهة المستخدم الرسومية (GUI)

أتمتة تصفح الويب وإدخال البيانات في التطبيقات القديمة باستخدام قدرات الـ computer use الأصلية.

تنسيق الـ Multi-Agent

تفويض المهام المتخصصة إلى الـ sub-agents مثل المراجعين والمطورين ضمن حلقة تخطيط مركزية.

إعادة هيكلة الأكواد المعقدة

إعادة تصميم بنية قواعد الأكواد متعددة الملفات مع الحفاظ على الاتساق عبر 200,000 token من الـ context النشط.

تحليل مالي دقيق

تحليل التقارير الفصلية وجداول البيانات باستخدام الـ vision لتحديد التناقضات واستخلاص رؤى استثمارية.

تصور البيانات التفاعلي

إنشاء رسوم بيانية ديناميكية من مجموعات بيانات معقدة باستخدام تنفيذ الكود المدمج والبناء في الوقت الفعلي.

نقاط القوة

القيود

الاستخدام الأصلي للكمبيوتر (Native Computer Use): يتفاعل النموذج مع أنظمة التشغيل عبر حركة المؤشر والتلاعب بواجهة المستخدم الرسومية بدقة 61.4 بالمئة.
لا يوجد مدخل صوتي أصلي: لا يمكن للنموذج معالجة الملفات الصوتية مباشرة كنمط أصلي ويتطلب أدوات تحويل صوتي خارجية.
أداء برمجي فائق: يحقق 77.2 بالمئة في SWE-bench Verified، متصدراً جميع النماذج الأخرى في حل مشكلات GitHub.
تكلفة الـ reasoning tokens: يتم محاسبة الـ tokens المستخدمة أثناء الـ extended thinking الداخلي كـ output tokens، مما يزيد التكلفة للاستعلامات المعقدة.
أفق مهام يمتد لـ 30 ساعة: تسمح البنية بـ 30 ساعة من العمل المستقل المتواصل مع الحفاظ على الحالة والتركيز.
الـ latency في وضع التفكير: عند تفعيل الـ extended thinking، قد يستغرق النموذج عدة دقائق لمعالجة الخطط المعمارية المعقدة.
حد 64K للـ output: تتيح سعة الـ output الضخمة إنشاء بنى تطبيقات كاملة في استدعاء API واحد.
تباين في الرياضيات التنافسية: على الرغم من ريادته في البرمجة، إلا أنه يتأخر أحياناً عن نماذج الـ reasoning المتخصصة في بعض الـ benchmarks الخاصة ببرمجة المسابقات.

البدء السريع API

anthropic/claude-4-5-sonnet

عرض التوثيق
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

ثبت SDK وابدأ في إجراء استدعاءات API في دقائق.

ماذا يقول الناس عن Claude Sonnet 4.5

شاهد رأي المجتمع في Claude Sonnet 4.5

Claude 4.5 Sonnet متاح في كل مكان اليوم، وهو أفضل نموذج برمجي في العالم.
ClaudeOfficial
reddit
هذا يحل واحدة من أكثر مشاكل التوسع إيلاماً مع إعدادات MCP. كنت أشاهد الـ context يتبخر قبل بدء أي عمل فعلي.
Simon Willison
twitter
Claude Code-Sonnet 4.5 يتفوق بكثير على Gemini 3.0 Pro لمهام إعادة هيكلة الـ Dockerized المعقدة.
Comfortable-Friend96
reddit
النمط: الأخطاء تصبح توثيقاً. يمكنك إضافة قاعدة إلى CLAUDE.md ولن تحدث مرة أخرى أبداً.
Boris Cherny
twitter
وضع الـ hybrid reasoning هو منقذ لحل مشكلات منطق الـ async المعقد حيث تدخل النماذج العادية في حلقة مفرغة.
AsyncDev
hackernews
تساوي الأسعار مع 3.5 Sonnet يجعل هذا ترقية سهلة لجميع خطوط أنابيب الـ agent الإنتاجية لدينا.
StartupFounder2025
reddit

فيديوهات عن Claude Sonnet 4.5

شاهد الدروس والمراجعات والنقاشات عن Claude Sonnet 4.5

نموذج 4.5 Sonnet الجديد يتفوق حتى على Opus 4.1 في اختبار Swaybench verified

كان قادراً على الحفاظ على التركيز لأكثر من 30 ساعة في المهام المعقدة متعددة الخطوات

يتصدر الـ benchmark الخاص بـ OS world للـ computer use بنسبة 61.4 بالمئة

محرك الـ reasoning الداخلي يتعامل مع بيئات Python باستقرار أكبر بكثير من 3.5

تكامل الـ terminal يبدو أكثر تماسكاً مع شبه انعدام لأوامر الـ shell الوهمية

Sonnet 4.5 يتصدر الآن استخدام أدوات الـ agentic... قفزة بنسبة 20 بالمئة، وهو أمر مثير حقاً

أنهى Claude code مع Sonnet 4.5 تنفيذ Stripe بالكامل في 15 دقيقة

كان Claude Sonnet 4.5 أسرع بكثير وأفضل بمقدار معقول

خيار الـ thinking يتيح لك تخصيص المزيد من الـ compute لكتل محددة من الكود

يحتفظ بالـ context بشكل مثالي حتى عندما تكون بعمق 150,000 token داخل مشروع ضخم

إنه أفضل نموذج أداءً على الإطلاق عندما يتحكم في جهاز الكمبيوتر الخاص بك

انخفاض في معدلات الخطأ في البرمجة من 9 بالمئة إلى الصفر تقريباً

قد تكون ميزة Claude imagine هي الأكثر روعة... تجربة بناء تطبيق في الوقت الفعلي

تكامل MCP يسمح له بالبحث عن الأدوات دون استنزاف الـ prompt context الخاص بك

انخفضت الـ latency للـ vision بشكل كبير عند تحليل تخطيطات UI المعقدة

أكثر من مجرد برومبتات

عزز سير عملك مع أتمتة الذكاء الاصطناعي

يجمع Automatio بين قوة وكلاء الذكاء الاصطناعي وأتمتة الويب والتكاملات الذكية لمساعدتك على إنجاز المزيد في وقت أقل.

وكلاء الذكاء الاصطناعي
أتمتة الويب
سير عمل ذكي

نصائح احترافية لـ Claude Sonnet 4.5

نصائح الخبراء لمساعدتك على تحقيق أقصى استفادة من Claude Sonnet 4.5 وتحقيق نتائج أفضل.

تفعيل بحث أدوات MCP

استخدم Model Context Protocol Tool Search لتقليل استخدام الـ context بنسبة 85 بالمئة وتوفير مساحة للملفات النشطة.

الاستفادة من نقاط التحقق (Checkpoints) للـ agents

استخدم أمر /checkpoint في واجهات الـ terminal لحفظ التقدم قبل عمليات إعادة الهيكلة الرئيسية للتمكن من الاستعادة الفورية.

إدارة ميزانية الـ context

قم بمسح السجل بين المهام غير المرتبطة لمنع تراكم الـ context والحفاظ على دقة المنطق العالية.

هيكلية الـ System Prompt

حدد شخصية النموذج وقيود الـ output الصارمة في ملف إعدادات مخصص لضمان الاتساق بين الـ agents.

الشهادات

ماذا يقول مستخدمونا

انضم إلى الآلاف من المستخدمين الراضين الذين حولوا سير عملهم

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ذو صلة AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

الأسئلة الشائعة حول Claude Sonnet 4.5

ابحث عن إجابات للأسئلة الشائعة حول Claude Sonnet 4.5