anthropic

Claude Opus 4.5

Claude Opus 4.5 قدرتمندترین frontier model شرکت Anthropic است که عملکرد رکوردشکن ۸۰.۹٪ در SWE-bench و عامل (agency) خودمختار پیشرفته برای کدنویسی ارائه می‌دهد.

anthropic logoanthropicClaude 4۲۴ نوامبر ۲۰۲۵
پنجره زمینه
200Kتوکن
حداکثر خروجی
64Kتوکن
قیمت ورودی
$5.00/ 1M
قیمت خروجی
$25.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
87%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude Opus 4.5 امتیاز 87% در این معیار کسب کرد.
MMLU
90.8%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude Opus 4.5 امتیاز 90.8% در این معیار کسب کرد.
MMLU Pro
80%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude Opus 4.5 امتیاز 80% در این معیار کسب کرد.
IFEval
90%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude Opus 4.5 امتیاز 90% در این معیار کسب کرد.
AIME 2025
37%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude Opus 4.5 امتیاز 37% در این معیار کسب کرد.
MATH
85%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude Opus 4.5 امتیاز 85% در این معیار کسب کرد.
GSM8k
95%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude Opus 4.5 امتیاز 95% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude Opus 4.5 امتیاز 92% در این معیار کسب کرد.
MathVista
72%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude Opus 4.5 امتیاز 72% در این معیار کسب کرد.
SWE-Bench
80.9%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude Opus 4.5 امتیاز 80.9% در این معیار کسب کرد.
HumanEval
90%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude Opus 4.5 امتیاز 90% در این معیار کسب کرد.
LiveCodeBench
75%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude Opus 4.5 امتیاز 75% در این معیار کسب کرد.
MMMU
80.7%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude Opus 4.5 امتیاز 80.7% در این معیار کسب کرد.
MMMU Pro
60%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude Opus 4.5 امتیاز 60% در این معیار کسب کرد.
ChartQA
90%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude Opus 4.5 امتیاز 90% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude Opus 4.5 امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
59.3%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude Opus 4.5 امتیاز 59.3% در این معیار کسب کرد.
ARC-AGI
37.6%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude Opus 4.5 امتیاز 37.6% در این معیار کسب کرد.

درباره Claude Opus 4.5

درباره قابلیت‌های Claude Opus 4.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Claude Opus 4.5 مدل پرچمدار Anthropic است که در اواخر سال ۲۰۲۵ عرضه شد. این مدل به طور ویژه برای مهندسی نرم‌افزار پیچیده و reasoning در سطوح حساس طراحی شده است. این مدل به رکورد ۸۰.۹٪ در بنچمارک SWE-bench Verified دست یافته است که آن را به گزینه‌ای اصلی برای دیباگ کردن خودمختار و بازنویسی کد سیستم تبدیل می‌کند. این مدل شخصیت (persona) پخته‌ای را معرفی می‌کند که بر صداقت دیپلماتیک و یاری‌رسانی ظریف تأکید دارد.

بهینه‌سازی Multimodal و Agentic

معماری این مدل از یک context window با ۲۰۰,۰۰۰ token و محدودیت خروجی ۶۴,۰۰۰ token پشتیبانی می‌کند. توسعه‌دهندگان می‌توانند از یک پارامتر effort تخصصی برای مقیاس‌بندی عمق reasoning نسبت به هزینه‌های محاسباتی استفاده کنند. این انعطاف‌پذیری امکان انجام کارهای منطقی سنگین یا پیش‌نویس‌های خلاقانه سریع‌تر و اقتصادی‌تر را فراهم می‌کند. مدل multimodal است و در تفسیر دیاگرام‌های معماری و چیدمان‌های فشرده UI عملکرد عالی دارد.

مهندسی و استفاده از ابزار

این مدل که برای گردش‌کارهای agentic بهینه شده است، از طریق Claude Code در محیط‌های ترمینال برای انجام ممیزی‌های کل سیستم پیمایش می‌کند. این مدل در مقایسه با نسخه‌های پرچمدار قبلی، هزینه‌های ورودی و خروجی را به طور قابل توجهی کاهش می‌دهد. توانایی آن در حفظ انسجام در طول پروژه‌های بلندمدت، آن را به شریکی قابل اعتماد برای تیم‌های مهندسی حرفه‌ای و تحلیل داده‌های پیچیده تبدیل کرده است.

Claude Opus 4.5

موارد استفاده برای Claude Opus 4.5

روش‌های مختلف استفاده از Claude Opus 4.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار خودمختار (Autonomous)

خودکارسازی رفع باگ‌های سرتاسری و بازنویسی کد کل سیستم با ثبت رکورد ۸۰.۹٪ در SWE-bench.

گردش‌کارهای تحقیقاتی Agentic

ترکیب حجم عظیمی از داده‌های فنی به استراتژی‌های تجاری کاربردی با استفاده از ۲۰۰ هزار token ظرفیت context.

Vision با وفاداری بالا در UI/UX

تبدیل طرح‌های پیچیده Figma و دیاگرام‌های معماری به کد فرانت‌اند آماده تولید با دقت پیکسل‌به‌پیکسل.

ارکستراسیون چند عاملی (Multi-Agent)

عمل به عنوان مغز مرکزی برای تیم‌هایی از زیر-عامل‌ها (sub-agents) جهت مدیریت پروژه‌های بلندمدت در پایگاه‌های کد پراکنده.

تحلیل داده پیشرفته

خودکارسازی مدل‌سازی‌های مالی پیچیده و گردش‌کارهای Excel با دقت بالا و عمق reasoning زیاد.

نگارش ادبی و خلاقانه

تولید متون ظریف که از سلیقه‌های خاص نویسندگی و اصول پیچیده طراحی انسان‌محور پیروی می‌کنند.

نقاط قوت

محدودیت‌ها

عملکرد عالی در برنامه‌نویسی: اولین مدلی که سد ۸۰٪ را در SWE-bench Verified شکسته (۸۰.۹٪) و از سایر frontier modelها پیشی گرفته است.
شکاف در بنچمارک‌های ریاضی: با وجود عملکرد عالی در برنامه‌نویسی، در ریاضیات سطح دکتری کمی از مدل‌های تخصصی عقب‌تر است.
کنترل منعطف Reasoning: پارامتر effort به توسعه‌دهندگان کنترل دقیقی بر هزینه محاسباتی و عمق reasoning برای گردش‌کارهای خاص می‌دهد.
تأخیر در برنامه‌ریزی (Latency): قرار دادن پارامتر effort روی حالت high می‌تواند منجر به فازهای تفکر به‌طور قابل توجهی طولانی‌تر قبل از تولید اولین token شود.
ظرافت‌های گفتگوی طبیعی: شناخته‌شده به دلیل داشتن شخصیت (persona) پخته که ابهام را مدیریت کرده و بدون راهنمایی‌های رباتیک، تنظیمات پس‌زمینه پیچیده را دنبال می‌کند.
محدودیت‌های context token: System prompts و تعریف ابزارها می‌توانند بخش بزرگی از ظرفیت window را قبل از شروع پردازش اشغال کنند.
بهره‌وری هزینه قابل توجه: قیمت‌گذاری ۵/۲۵ دلاری، هوش در سطح Opus را برای تولیدات سازمانی با حجم بالا در دسترس قرار داده است.
شکاف در یادآوری واقعیت‌ها: در تست‌های دقت تخصصی مانند SimpleQA، در مقایسه با رقبای مبتنی بر جستجو، گاهی اوقات ممکن است جزئیات را جعل کند.

شروع سریع API

anthropic/claude-opus-4.5

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-opus-4-5-20251101',
  max_tokens: 4096,
  effort: 'high',
  messages: [{ role: 'user', content: 'Analyze this system architecture for race conditions.' }],
});

console.log(msg.content[0].text);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude Opus 4.5 چه می‌گویند

ببینید جامعه درباره Claude Opus 4.5 چه فکر می‌کند

Claude Opus 4.5 کمتر شبیه یک دستیار بدون وضعیت (stateless) و بیشتر شبیه یک هم‌تیمی دائمی است. می‌تواند فرضیات را در چندین فایل به شکلی دنبال کند که به وضوح قوی‌تر به نظر می‌رسد.
Federal-Piano8695
reddit
مشاهده اینکه AI agent شما شخصیتی در شبکه‌های اجتماعی ایجاد می‌کند که به روش‌هایی که نمی‌توانید توضیح دهید، با مردم واقعی ارتباط برقرار می‌کند. زیرساخت مهم‌تر از promptهاست.
auxten
twitter
Opus بهترین مدل در این زمینه است. بحث آن طبیعی‌تر است و واقعاً در بحث همراه شما پیش می‌آید.
ArchMeta1868
reddit
Opus 4.5 کوچک‌ترین ظرافت‌ها را درک می‌کند. تنها مدلی است که موفق می‌شود مکانیسم تریلر inline را در اولین گام بگنجاند.
Matt Berman
youtube
امتیاز ۸۰.۹٪ SWE-bench احتمالاً واقعی است اما تا حدودی گمراه‌کننده است. برای رسیدن مداوم به این اعداد، نیاز به تنظیم محیطی دقیق دارد.
testingcatalog
twitter
SWE-bench Verified: ۸۰.۹٪ (Opus 4.5) در مقابل ۷۱.۳٪ (Claude 3-Opus). این یک جهش بزرگ برای قابلیت اطمینان در دنیای واقعی است.
Daniel Garcia
medium

ویدیوهای درباره Claude Opus 4.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude Opus 4.5 را تماشا کنید

Opus 4.5 کوچک‌ترین ظرافت‌ها را درک می‌کند

این تنها مدلی بود که در مرحله اول موفق شد مکانیسم تریلر درون‌خطی (inline) را اضافه کند

ارزیابی کد مبتنی بر عامل (agent-driven) این حس ذهنی را تأیید می‌کند و به Opus امتیاز ۷ از ۱۰ را برای کامل بودن ویژگی‌ها می‌دهد

هنگام مواجهه با موارد خاص (edge cases)، reasoning آن بسیار منطقی‌تر از نسخه‌های قبلی است

سازگاری پایگاه کد را در جلسات ۳۰ دقیقه‌ای حفظ می‌کند

قیمت اکنون سه برابر ارزان‌تر است. این قیمت تنها ۵ دلار برای یک میلیون token ورودی خواهد بود

ورودی ۵ دلار و خروجی ۲۵ دلار برای هر میلیون token است

Opus 4.5 امتیاز بالاتری نسبت به هر کاندیدای انسانی در امتحان عملی (take-home) خودِ Anthropic کسب کرده است

این اولین مدلی است که از سد ۸۰ درصد در SWE-bench عبور کرده است

این مدل جلسات کدنویسی ۳۰ دقیقه‌ای خودمختار را بدون دخالت انسان مدیریت می‌کند

به Claude Opus 4.5 به عنوان یک لایه اقناع و یک هیولای agentic مطلق نگاه کنید

این یک هیولای برنامه‌نویسی agentic و قدرتمند است

مهندسان ترجیح می‌دهند با Claude Opus 4.5 کار کنند چون آن حلقه‌های بازخورد سریع را دریافت می‌کنند

پارامتر reasoning effort ویژگی برجسته برای توسعه‌دهندگان است

در گفتگوهای طولانی، بیشتر شبیه یک همکار است تا یک ابزار

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Claude Opus 4.5

نکات تخصصی برای کمک به شما در استفاده حداکثری از Claude Opus 4.5 و دستیابی به نتایج بهتر.

تغییر سطح Reasoning Effort

از پارامتر effort برای کارهای منطقی پیچیده یا برنامه‌نویسی در حالت high و برای نگارش‌های خلاقانه استاندارد در حالت medium استفاده کنید.

طراحی بومی Vision

اسکرین‌شات‌های با رزولوشن بالا از باگ‌های UI را آپلود کنید؛ چرا که این مدل برای شناسایی ناهماهنگی‌های بصری که در توضیحات متنی نادیده گرفته می‌شوند، بهینه‌سازی شده است.

استفاده از System Prompts ساختاریافته

نقش‌های agentic و سطوح effort را در system prompts خود به وضوح تعریف کنید تا از تفکر بیش از حد مدل در کارهای رویه‌ای ساده جلوگیری شود.

فشرده‌سازی context

در جلسات طولانی، تاریخچه گفتگو را خلاصه کنید تا ۲۰۰ هزار token موجود در context window روی مرتبط‌ترین اطلاعات متمرکز باقی بماند.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

سوالات متداول درباره Claude Opus 4.5

پاسخ سوالات رایج درباره Claude Opus 4.5 را بیابید