anthropic

Claude Sonnet 4.5

model Claude Sonnet 4.5 از Anthropic، قابلیت‌های کدنویسی پیشرو در جهان (۷۷.۲٪ در SWE-bench) و context window ۲۰۰ هزارتایی را ارائه می‌دهد که برای نسل بعدی...

کدنویسی با هوش مصنوعیAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
پنجره زمینه
200Kتوکن
حداکثر خروجی
64Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImageAudioVideo
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
83%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude Sonnet 4.5 امتیاز 83% در این معیار کسب کرد.
HLE
34%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 34% در این معیار کسب کرد.
MMLU
89%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude Sonnet 4.5 امتیاز 89% در این معیار کسب کرد.
MMLU Pro
78%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude Sonnet 4.5 امتیاز 78% در این معیار کسب کرد.
SimpleQA
52%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 52% در این معیار کسب کرد.
IFEval
88%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude Sonnet 4.5 امتیاز 88% در این معیار کسب کرد.
AIME 2025
87%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude Sonnet 4.5 امتیاز 87% در این معیار کسب کرد.
MATH
87%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 87% در این معیار کسب کرد.
GSM8k
98%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude Sonnet 4.5 امتیاز 98% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude Sonnet 4.5 امتیاز 92% در این معیار کسب کرد.
MathVista
72%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 72% در این معیار کسب کرد.
SWE-Bench
77%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude Sonnet 4.5 امتیاز 77% در این معیار کسب کرد.
HumanEval
94%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude Sonnet 4.5 امتیاز 94% در این معیار کسب کرد.
LiveCodeBench
68%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 68% در این معیار کسب کرد.
MMMU
78%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude Sonnet 4.5 امتیاز 78% در این معیار کسب کرد.
MMMU Pro
55%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude Sonnet 4.5 امتیاز 55% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 89% در این معیار کسب کرد.
DocVQA
92%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 92% در این معیار کسب کرد.
Terminal-Bench
50%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 50% در این معیار کسب کرد.
ARC-AGI
14%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 14% در این معیار کسب کرد.

Claude Sonnet 4.5 را رایگان امتحان کنید

با Claude Sonnet 4.5 رایگان گفتگو کنید. قابلیت‌ها را آزمایش کنید، سوال بپرسید و ببینید این مدل AI چه کارهایی می‌تواند انجام دهد.

پرامپت
پاسخ
Claude Sonnet 4.5

پاسخ AI شما اینجا ظاهر می‌شود

درباره Claude Sonnet 4.5

درباره قابلیت‌های Claude Sonnet 4.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

**مرزهای هوش Agentic**

Claude Sonnet 4.5 نشان‌دهنده بزرگترین جهش Anthropic در "frontier intelligence" است که به‌طور اختصاصی برای عصر agentهای هوش مصنوعی خودکار بهینه شده است. این model که در اواخر سال ۲۰۲۵ عرضه شد، اولین model واقعی با قابلیت hybrid reasoning در صنعت است که به توسعه‌دهندگان اجازه می‌دهد بین اجرای سریع برای وظایف روتین و thinking طولانی برای چالش‌های منطقی پیچیده سوییچ کنند. این مدل به‌ویژه در بنچمارک‌های استفاده از کامپیوتر و مدیریت ابزارها از رقبا پیشی گرفته و آن را به موتور ترجیحی برای agentهای مبتنی بر terminal و مهندسی نرم‌افزار چند-فایلی تبدیل کرده است.

**دقت و کاهش توهمات**

این model بر پایه‌ی معماری‌ای ساخته شده که به منطق "دو بار اندازه بگیر، یک بار ببر" اولویت می‌دهد و به‌طور قابل‌توجهی تملق (sycophancy) و توهماتی را که در سری ۳.۵ دیده می‌شد، کاهش داده است. با محدودیت خروجی عظیم ۶۴,۰۰۰-token و یک پنجره ورودی ۲۰۰,۰۰۰-token، می‌تواند کل repositoryها را دریافت کرده و در عین حال فایل‌های کامل اپلیکیشن را در یک مرحله تولید کند. همچنین قابلیت native "checkpoints" را برای جریان‌های کاری agentic معرفی کرده که به agentها اجازه می‌دهد به عقب بازگردند و اشتباهات خود را به صورت خودکار اصلاح کنند.

**مهارت در Multimodal و Reasoning**

فراتر از کدنویسی، Sonnet 4.5 در تحلیل اسناد multimodal و مدل‌سازی مالی پیچیده تسلط دارد. منطق داخلی آن برای اولویت‌بندی context معماری آموزش دیده است و آن را قادر می‌سازد تا codebaseهای مقیاس‌بزرگ را بهتر از هر پیشینه‌ای نقشه‌برداری کند. چه در حال پردازش یادداشت‌های دست‌نویس باشد و چه در حال پیاده‌سازی کامل درگاه Stripe، مدل Sonnet 4.5 سطح بالایی از دقت واقع‌گرایانه و پیروی از دستورالعمل‌ها را حفظ می‌کند.

Claude Sonnet 4.5

موارد استفاده برای Claude Sonnet 4.5

روش‌های مختلف استفاده از Claude Sonnet 4.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار خودگردان

از Claude Sonnet 4.5 برای پیمایش در codebaseهای پیچیده، پیاده‌سازی ویژگی‌ها در چندین فایل و اجرای تست‌ها به صورت مستقل استفاده کنید.

Agent‌های کنترل کامپیوتر

استقرار model برای کنترل دسکتاپ و مرورگرهای وب جهت استخراج داده، پیمایش در سیستم‌های قدیمی یا انجام وظایف اداری تکراری.

جستجوی Agentic سازمانی

مدیریت پرس‌وجوهای جستجوی چند مرحله‌ای و ترکیب اطلاعات پراکنده از مستندات داخلی و وب زنده.

مدل‌سازی مالی پیچیده

بهره‌گیری از امتیاز ۸۷٪ در AIME برای انجام استنتاج‌های منطقی عمیق روی گزارش‌های مالی و داده‌های بازار.

اصلاح محتوای فنی

تبدیل الزامات سطح بالا به PRDهای حرفه‌ای، مشخصات فنی و codebaseهای آماده برای استفاده.

تحلیل اسناد Multimodal

پردازش هزاران صفحه نمودار، یادداشت‌های دست‌نویس و دیاگرام‌های فنی با قابلیت‌های بینایی state-of-the-art.

نقاط قوت

محدودیت‌ها

قدرت کدنویسی Agentic: در حال حاضر رکورددار جهان در SWE-bench Verified با نرخ موفقیت ۷۷.۲٪ در حل مسائل واقعی GitHub است.
محدودیت‌های استفاده: کاربران حرفه‌ای اغلب گزارش می‌دهند که در پلن Pro ۲۰ دلاری، محدودیت‌های استفاده هفتگی را به سرعت لمس می‌کنند.
سرعت باورنکردنی: با سرعت ۴۰-۶۰ tokens در ثانیه عمل می‌کند که آن را برای استفاده‌های تعاملی به‌طور قابل‌توجهی سریع‌تر از frontier modelهای قبلی می‌کند.
Latency جستجو: وب‌گردی agentic (BrowseComp) در مقایسه با modelهای جستجوی تخصصی همچنان یک نقطه ضعف محسوب می‌شود.
انعطاف‌پذیری Hybrid Reasoning: اولین model که به‌طور مؤثر بین حالت "چت سریع" و "thinking طولانی" برای زنجیره‌های منطقی پیچیده تعادل برقرار می‌کند.
شکاف‌های دانش تخصصی: در وظایف بصری بسیار خاص، مانند شناسایی حرکات خاص اسکیت‌بورد، با مشکل مواجه است (۲۹٪ دقت در SkateBench).
پنجره خروجی عظیم: محدودیت ۶۴K برای output token اجازه تولید ویژگی‌های کامل چند-فایلی را در یک فراخوانی API واحد می‌دهد.
هزینه‌های Agentic: اجرای خودگردان model در حالت terminal می‌تواند برای یک جلسه ساخت اپلیکیشن پیچیده، بین ۵۰ تا ۱۰۰ دلار token مصرف کند.

شروع سریع API

anthropic/claude-sonnet-4.5

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude Sonnet 4.5 چه می‌گویند

ببینید جامعه درباره Claude Sonnet 4.5 چه فکر می‌کند

"Claude Sonnet 4.5 پادشاه جدید کدنویسی با هوش مصنوعی است... واقعاً عالی به نظر می‌رسد"
James Montemagno
youtube
"Sonnet 4.5 کارش را واقعاً خوب انجام می‌دهد... بسیار سریع‌تر و به طرز محسوسی بهتر بود"
Cole Medin
youtube
"من مبهوت Sonnet 4.5 شدم... این مدل در حال طراحی صفحات واقعاً خیره‌کننده‌ای است"
Savage Reviews
youtube
"این agent مبتنی بر ترمینال مثل یک 'برنامه‌نویس در ترمینال شماست'... می‌تواند codebaseها را بخواند و تست‌ها را به صورت خودکار اجرا کند"
DevUser_99
reddit
"قیمت‌گذاری مانند 3.5 باقی مانده، اما ویژگی 'Checkpoints' ارزش آن را برای جریان‌های کاری حرفه‌ای ۱۰ برابر کرده است"
AgentArchitect
x
"با امتیاز ۷۷.۲٪ در SWE-bench، این اولین مدلی است که واقعاً حس یک مهندس ارشد (Senior Engineer) را می‌دهد"
HackerNewsReader
hackernews

ویدیوهای درباره Claude Sonnet 4.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude Sonnet 4.5 را تماشا کنید

Anthropic ادعا می‌کند که این 'بهترین مدل کدنویسی در جهان' است که پیشرفت‌های چشمگیری در reasoning، ریاضی و استفاده از کامپیوتر داشته است.

در حالی که GPT-5 ممکن است برای برنامه‌ریزی‌های سطح بالا بهتر باشد، Claude 4.5 Sonnet در حال حاضر 'خوش‌دست‌ترین' مدل برای پیاده‌سازی است.

سرعت آن واقعاً خیره‌کننده است و باعث می‌شود کدنویسی تعاملی بسیار روان‌تر به نظر برسد.

این مدل تغییرات چند-فایلی را با سطحی از دقت مدیریت می‌کند که قبلاً ندیده بودیم.

کاهش توهمات (hallucinations) آن را به یک شریک قابل اعتماد برای کدهای تولیدی (production) تبدیل کرده است.

Claude Sonnet 4.5 بسیار سریع‌تر و به مقدار قابل‌توجهی بهتر از GPT-5 Codex بود.

تمام پیاده‌سازی Stripe را در ۱۵ دقیقه انجام داد... بیش از دو برابر سریع‌تر از Opus 4.1.

توانایی دنبال کردن دستورالعمل‌های پیچیده فراخوانی ابزار (tool-calling) رمز موفقیت آن است.

من شاهد موارد کمتری از 'تملق' (sycophancy) هستم که در آن مدل فقط با ایده‌های بد من موافقت می‌کرد.

این اولین مدلی است که من واقعاً برای اجرای یک agent مبتنی بر ترمینال بدون نظارت به آن اعتماد می‌کنم.

این یکی از بهترین لندینگ پیج‌هایی است، اگر نگوییم بهترین، که تا به حال از یک prompt ایجاد شده دیده‌ام.

این یک غول به تمام معناست... در حال طراحی صفحات واقعاً خیره‌کننده با کدهای بسیار عالی است.

قابلیت‌های بینایی برای تفسیر طراحی UI به‌طور قابل‌توجهی ارتقا یافته است.

احساس می‌شود که الزامات زیبایی‌شناختی را درک می‌کند، نه فقط الزامات فنی را.

Sonnet 4.5 رسماً benchmark جدیدی برای مهندسی خلاقانه فرانت‌اند است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای

نکات تخصصی برای کمک به شما در استفاده حداکثری از این مدل و دستیابی به نتایج بهتر.

بهره‌گیری از CLAUDE.md

از یک فایل CLAUDE.md در ریشه repository خود استفاده کنید تا خلاصه‌ها و راهنماهای کوتاهی به model بدهید؛ این کار هدررفت token را تا ۳۰٪ کاهش می‌دهد.

سوییچ Hybrid Reasoning

از پارامتر 'thinking' در فراخوانی‌های API خود فقط برای وظایف سنگین منطقی استفاده کنید تا در عملیات‌های روتین در latency و هزینه‌ها صرفه‌جویی شود.

پوشه .claude/context

یک فایل .claude/context.md برای ذخیره تصمیمات معماری ایجاد کنید؛ این model به‌طور خاص آموزش دیده تا برای نقشه‌برداری از codebase، این مسیر را در اولویت قرار دهد.

Prompt Caching

قابلیت prompt caching را برای مستندات استاتیک یا codebaseهای بزرگ فعال کنید تا تا ۹۰٪ در هزینه‌های ورودی برای پرس‌وجوهای تکراری صرفه‌جویی کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

سوالات متداول

پاسخ سوالات رایج درباره این مدل را بیابید