anthropic

Claude Opus 4.5

Claude Opus 4.5 قدرتمندترین frontier model شرکت Anthropic است که با عملکرد بی‌سابقه ۸۰.۹٪ در SWE-bench و قابلیت‌های پیشرفته autonomous agency برای...

anthropic logoanthropicClaude۲۴ نوامبر ۲۰۲۵
پنجره زمینه
200Kتوکن
حداکثر خروجی
64Kتوکن
قیمت ورودی
$5.00/ 1M
قیمت خروجی
$25.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
87%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude Opus 4.5 امتیاز 87% در این معیار کسب کرد.
MMLU
90.8%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude Opus 4.5 امتیاز 90.8% در این معیار کسب کرد.
MMLU Pro
80%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude Opus 4.5 امتیاز 80% در این معیار کسب کرد.
IFEval
90%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude Opus 4.5 امتیاز 90% در این معیار کسب کرد.
AIME 2025
37%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude Opus 4.5 امتیاز 37% در این معیار کسب کرد.
MATH
85%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude Opus 4.5 امتیاز 85% در این معیار کسب کرد.
GSM8k
95%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude Opus 4.5 امتیاز 95% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude Opus 4.5 امتیاز 92% در این معیار کسب کرد.
MathVista
72%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude Opus 4.5 امتیاز 72% در این معیار کسب کرد.
SWE-Bench
80.9%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude Opus 4.5 امتیاز 80.9% در این معیار کسب کرد.
HumanEval
90%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude Opus 4.5 امتیاز 90% در این معیار کسب کرد.
LiveCodeBench
75%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude Opus 4.5 امتیاز 75% در این معیار کسب کرد.
MMMU
80.7%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude Opus 4.5 امتیاز 80.7% در این معیار کسب کرد.
MMMU Pro
60%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude Opus 4.5 امتیاز 60% در این معیار کسب کرد.
ChartQA
90%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude Opus 4.5 امتیاز 90% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude Opus 4.5 امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
59.3%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude Opus 4.5 امتیاز 59.3% در این معیار کسب کرد.
ARC-AGI
37.6%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude Opus 4.5 امتیاز 37.6% در این معیار کسب کرد.

درباره Claude Opus 4.5

درباره قابلیت‌های Claude Opus 4.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

اوج قابلیت‌های Autonomous Agency

Claude Opus 4.5 نشان‌دهنده بزرگترین جهش Anthropic در هوش سطح frontier است که به‌طور اختصاصی برای پیچیده‌ترین وظایف در مهندسی نرم‌افزار و عملیات‌های autonomous طراحی شده است. این model که در اواخر سال ۲۰۲۵ عرضه شد، با کسب امتیاز ۸۰.۹٪ در benchmarkِ SWE-bench Verified رکوردها را شکست و به اولین مدلی تبدیل شد که به‌طور مؤثر دیباگینگ در مقیاس بزرگ و بازسازی سیستم را با حداقل دخالت انسانی خودکار می‌کند.

هوش با روح

فراتر از توانمندی‌های فنی، Opus 4.5 شخصیت اصلاح‌شده‌ای را معرفی می‌کند که توسط "سند روح" Anthropic هدایت می‌شود و بر صداقت دیپلماتیک و سودمندی دقیق تأکید دارد. این ویژگی باعث می‌شود model به‌طور منحصر‌به‌فردی قادر به درک ذائقه نویسندگی و طراحی انسان‌محور باشد. این model برای workflowهای agentic بهینه‌سازی شده و دارای یک context window ۲۰۰,۰۰۰-token و یک "parameterِ effort" تخصصی است که به توسعه‌دهندگان اجازه می‌دهد عمق reasoning را بر اساس هزینه‌های محاسباتی مقیاس‌بندی کنند.

برتری Multimodal

به‌عنوان یک غول multimodal، Opus 4.5 در وظایف مبتنی بر بینایی، از تجزیه و تحلیل دیاگرام‌های معماری متراکم تا استخراج داده‌ها از طرح‌های پیچیده اسناد، عالی عمل می‌کند. توانایی آن در پیمایش در یک محیط terminal-native از طریق Claude Code به آن اجازه می‌دهد تا بازرسی‌های سراسری سیستم و وصله‌های امنیتی را انجام دهد و آن را به شریکی مستمر و بسیار توانمند برای تیم‌های مهندسی حرفه‌ای تبدیل کند.

Claude Opus 4.5

موارد استفاده برای Claude Opus 4.5

روش‌های مختلف استفاده از Claude Opus 4.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی Autonomous

خودکارسازی کل چرخه حیات issueهای GitHub شامل بازتولید، دیباگ و تست.

مدیریت سیستم

انجام بازرسی‌های autonomous سرور و وصله‌های امنیتی از طریق تعامل مستقیم با terminal.

بازسازی معماری (Refactoring)

تحلیل مخازن عظیم کد برای پیشنهاد و اجرای مقاوم‌سازی امنیتی در سطح سیستم.

سنتز اسناد پیچیده

تبدیل صدها فایل PDF چندصفحه‌ای به modelهای مالی ساختاریافته یا بصری‌سازی داده‌ها.

توسعه بازی‌های خلاقانه

تولید محیط‌های سه‌بعدی کاربردی با فیزیک فعال تنها از طریق یک prompt پیچیده.

دستیار تحقیق مستمر

بررسی متقاطع مجموعه‌داده‌های حجیم برای یافتن تناقض‌های غیربدیهی در پرونده‌های حقوقی یا فنی.

نقاط قوت

محدودیت‌ها

برنامه‌نویسی رکوردشکن: کسب امتیاز ۸۰.۹٪ در SWE-bench Verified، خودکارسازی وظایف پیچیده مهندسی نرم‌افزار.
مدل قیمت‌گذاری پرمیوم: با قیمت ۵/۲۵ دلار به ازای هر ۱ میلیون tokens، به‌طور قابل‌توجهی گران‌تر از modelهای میان‌رده است.
بهره‌وری برتر در مصرف Token: دستیابی به هوش سطح frontier در حالی که تا ۷۶٪ tokens کمتری نسبت به Sonnet برای منطق مشابه مصرف می‌کند.
شکاف در Benchmark ریاضی: در ریاضیات سطح رقابتی مانند آزمون AIME، از modelهای تخصصی reasoning عقب می‌ماند.
Context عظیم ۲۰۰هزارتایی: مدیریت مجموعه‌ اسناد و مخازن کد حجیم با دقت بازیابی بسیار بالا.
عدم پشتیبانی بومی از صدا/ویدیو: در حال حاضر فاقد توانایی پردازش مستقیم جریان‌های صوتی یا تصویری بدون پیش‌پردازش است.
منطق Agent Autonomous: بهینه‌سازی شده برای نشست‌های طولانی‌مدت autonomous از طریق ابزارهای terminal-native و stop hooks.
Latency بالای اجرا: وظایف reasoning عمیق ممکن است زمان زیادی ببرند و گاهی برای agents به نشست‌های چندساعته نیاز داشته باشند.

شروع سریع API

anthropic/claude-4.5-opus

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'یک بازرسی کامل سیستم از این کد برای یافتن نقص‌های امنیتی انجام بده.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude Opus 4.5 چه می‌گویند

ببینید جامعه درباره Claude Opus 4.5 چه فکر می‌کند

"هر خط از کد عملیاتی من توسط Claude Code که روی Opus 4.5 اجرا می‌شد، تولید شده است"
Boris Cherny
x
"Opus 4.5 جایی است که باید به ذائقه نویسندگی و شباهت آن به انسان فکر کنید"
Nate B Jones
youtube
"هوش بالا بالاخره در حال ارزان‌تر شدن است؛ این model سه برابر ارزان‌تر از نسخه قبلی Opus است"
BuildwithVignesh
reddit
"مدل Claude Opus 4.5 با زیرکی بیش از حد و سوءاستفاده از یک خلاء، یک benchmark را شکست"
MetaKnowing
reddit
"عمق reasoning و توانایی برنامه‌نویسی در سطحی کاملاً متفاوت نسبت به هر چیز دیگری است"
Santosh Gupta
x
"قابلیت‌های agentic در terminal از طریق Claude Code، آن را به گزینه‌ای برجسته برای devops تبدیل کرده است"
hn_user_alpha
hackernews

ویدیوهای درباره Claude Opus 4.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude Opus 4.5 را تماشا کنید

قیمت حالا سه برابر ارزان‌تر شده... ۵ دلار برای یک میلیون input tokens.

این بهترین نتیجه‌ای است که تا به حال از یک model در تست Minecraft با یک prompt واحد گرفته‌ام.

Opus 4.5 امتیازی بالاتر از هر کاندیدای انسانی در این آزمون استخدامی کسب کرد.

reasoning در اینجا فقط دنبال کردن دستورالعمل‌ها نیست؛ بلکه درک قصد و نیت است.

اگر کار معماری پیچیده انجام می‌دهید، این تنها مدلی است که به‌طور قابل‌اطمینان از پس آن برمی‌آید.

امتیاز ۸۰.۹٪ در SWE-bench verified... و مصرف ۵۰٪ tokens کمتر نسبت به Sonnet.

Opus 4.5 مستقیماً مهندسی نرم‌افزار حرفه‌ای را هدف قرار داده، نه برنامه‌نویسی تفننی.

فراتر از SWE-bench، این مدل ۱۵٪ بهبود نسبت به Sonnet در Terminal Bench نشان می‌دهد.

این model قادر به انجام نشست‌های autonomous طولانی‌مدت است که می‌تواند ساعت‌ها طول بکشد.

عملکرد vision در هنگام تجزیه و تحلیل دیاگرام‌های فنی متراکم به‌طور محسوسی دقیق‌تر است.

Claude Opus 4.5 را به عنوان یک لایه متقاعدکننده و یک هیولای تمام‌عیار در زمینه agentic در نظر بگیرید.

بسیاری از مهندسان در نهایت Opus 4.5 را به دلیل ارگونومی و زیرساخت آن ترجیح می‌دهند.

این model به شکلی فراتر از بافت متن، از مشخصات درونی خود آگاه است.

Opus 4.5 سطحی از ذائقه نویسندگی را نشان می‌دهد که GPT-5.2 به سادگی فاقد آن است.

این مدل از یک dynamic effort parameter برای مقیاس‌بندی هوش خود بر اساس وظیفه استفاده می‌کند.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای برای Claude Opus 4.5

نکات تخصصی برای کمک به شما در استفاده حداکثری از Claude Opus 4.5 و دستیابی به نتایج بهتر.

استفاده از Effort بالا برای منطق

برای وظایف معماری پیچیده، parameterِ effort را روی 'high' تنظیم کنید تا از حداکثر عمق reasoning اطمینان حاصل شود.

استقرار Stop Hooks

از stop hooks تخصصی در workflowهای agentic استفاده کنید تا به model اجازه دهید طی چندین ساعت اجرا شده و خود را اصلاح کند.

بهره‌گیری از Claude Code

این model را با ابزار CLIِ Claude Code ترکیب کنید تا پتانسیل کامل آن در وظایف سیستم‌های terminal-native آزاد شود.

بهینه‌سازی مصرف Token

از Opus 4.5 فقط برای وظایف با منطق بالا استفاده کنید، زیرا کیفیتی معادل Sonnet را با تا ۷۶٪ tokens کمتر ارائه می‌دهد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

سوالات متداول درباره Claude Opus 4.5

پاسخ سوالات رایج درباره Claude Opus 4.5 را بیابید