anthropic

Claude Sonnet 4.5

مدل Claude Sonnet 4.5 از شرکت Anthropic، پیشروترین کدنویسی در جهان (۷۷.۲٪ در SWE-bench) و ظرفیت ۲۰۰ هزار context window را ارائه می‌دهد که برای نسل بعدی...

کدنویسی با هوش مصنوعیAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude۲۹ سپتامبر ۲۰۲۵
پنجره زمینه
200Kتوکن
حداکثر خروجی
64Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImageAudioVideo
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
83%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude Sonnet 4.5 امتیاز 83% در این معیار کسب کرد.
HLE
34%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 34% در این معیار کسب کرد.
MMLU
89%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude Sonnet 4.5 امتیاز 89% در این معیار کسب کرد.
MMLU Pro
78%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude Sonnet 4.5 امتیاز 78% در این معیار کسب کرد.
SimpleQA
52%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 52% در این معیار کسب کرد.
IFEval
88%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude Sonnet 4.5 امتیاز 88% در این معیار کسب کرد.
AIME 2025
87%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude Sonnet 4.5 امتیاز 87% در این معیار کسب کرد.
MATH
87%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 87% در این معیار کسب کرد.
GSM8k
98%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude Sonnet 4.5 امتیاز 98% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude Sonnet 4.5 امتیاز 92% در این معیار کسب کرد.
MathVista
72%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 72% در این معیار کسب کرد.
SWE-Bench
77%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude Sonnet 4.5 امتیاز 77% در این معیار کسب کرد.
HumanEval
94%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude Sonnet 4.5 امتیاز 94% در این معیار کسب کرد.
LiveCodeBench
68%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 68% در این معیار کسب کرد.
MMMU
78%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude Sonnet 4.5 امتیاز 78% در این معیار کسب کرد.
MMMU Pro
55%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude Sonnet 4.5 امتیاز 55% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 89% در این معیار کسب کرد.
DocVQA
92%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 92% در این معیار کسب کرد.
Terminal-Bench
50%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 50% در این معیار کسب کرد.
ARC-AGI
14%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude Sonnet 4.5 امتیاز 14% در این معیار کسب کرد.

درباره Claude Sonnet 4.5

درباره قابلیت‌های Claude Sonnet 4.5، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

**مرز هوش Agentic**

Claude 4.5 Sonnet نمایانگر پیشرفت بزرگی در هوش frontier است که برای عصر هوش مصنوعی خودکار (autonomous AI agents) بهینه‌سازی شده است. این مدل که در اواخر سال ۲۰۲۵ عرضه شد، یک مدل reasoning ترکیبی است که به توسعه‌دهندگان اجازه می‌دهد بین اجرای پرسرعت برای کارهای روتین و تفکر گسترده برای چالش‌های منطقی پیچیده، جابه‌جا شوند. این مدل در benchmarkهای استفاده از کامپیوتر و ارکستراسیون ابزار پیشتاز است و آن را به موتور انتخابی برای عامل‌های ترمینال‌محور و مهندسی نرم‌افزار چندفایلی تبدیل کرده است.

**دقت و کاهش توهمات**

معماری این مدل منطق و دقت را در اولویت قرار داده و چاپلوسی و توهمات مشاهده شده در سری‌های قبلی را کاهش داده است. با محدودیت خروجی ۶۴,۰۰۰ token و پنجره ورودی ۲۰۰,۰۰۰ token، می‌تواند کل مخازن کد را پردازش کرده و در یک مرحله فایل‌های کامل برنامه را تولید کند. این نسخه نقاط بازرسی (checkpoints) بومی را برای جریان‌های کاری agentic معرفی می‌کند که به سیستم‌ها اجازه می‌دهد بدون دخالت انسان، اشتباهات را به صورت خودکار تصحیح کنند.

**توانایی Multimodal و Reasoning**

علاوه بر توسعه نرم‌افزار، Sonnet 4.5 در تحلیل اسناد multimodal و مدل‌سازی مالی می‌درخشد. منطق داخلی آن context معماری را در اولویت قرار می‌دهد و به آن اجازه می‌دهد سیستم‌های در مقیاس بزرگ را مؤثرتر از مدل‌های قبلی نقشه‌برداری کند. چه در حال پردازش یادداشت‌های دست‌نویس باشد و چه پیاده‌سازی ادغام‌های API، این مدل دقت واقعی بالا و پیروی دقیق از دستورالعمل‌ها را در کارهای طولانی‌مدت حفظ می‌کند.

Claude Sonnet 4.5

موارد استفاده برای Claude Sonnet 4.5

روش‌های مختلف استفاده از Claude Sonnet 4.5 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار خودکار

مدیریت صفر تا صد توسعه از نیازسنجی اولیه تا commitهای خودکار با استفاده از رابط‌های ترمینال.

اتوماسیون مبتنی بر GUI

خودکارسازی وب‌گردی و وارد کردن داده‌ها در برنامه‌های قدیمی (Legacy) با استفاده از قابلیت‌های بومی computer use.

ارکستراسیون چند عاملی (Multi-Agent)

محول کردن وظایف تخصصی به زیر-عامل‌هایی نظیر بررسی‌کنندگان و سازندگان در یک چرخه برنامه‌ریزی مرکزی.

ریفکتورینگ پیچیده کد

بازمهندسی کدهای چندفایلی در حالی که ثبات در ۲۰۰,۰۰۰ token از context فعال حفظ می‌شود.

تحلیل مالی دقیق

تحلیل گزارش‌های فصلی و صفحات گسترده با استفاده از قابلیت بینایی برای شناسایی مغایرت‌ها و بینش‌های سرمایه‌گذاری.

تجسم داده‌های تعاملی

تولید نمودارهای پویا از مجموعه داده‌های پیچیده با استفاده از اجرای کد و ساخت بلادرنگ.

نقاط قوت

محدودیت‌ها

قابلیت بومی Computer Use: مدل از طریق حرکت نشانگر و دستکاری رابط کاربری (GUI) با دقت ۶۱.۴ درصد با سیستم‌عامل تعامل برقرار می‌کند.
عدم ورودی صوتی بومی: مدل نمی‌تواند فایل‌های صوتی را به‌صورت بومی پردازش کند و نیاز به ابزارهای جانبی برای تبدیل گفتار به متن دارد.
عملکرد عالی در کدنویسی: این مدل با کسب امتیاز ۷۷.۲ درصد در SWE-bench Verified، از تمام مدل‌های دیگر در رفع مشکلات GitHub پیشی گرفته است.
هزینه token برای Reasoning: tokenهای استفاده شده در فرآیند Extended Thinking به‌عنوان token خروجی محاسبه می‌شوند که هزینه پرس‌وجوهای پیچیده را افزایش می‌دهد.
افق کاری ۳۰ ساعته: معماری این مدل امکان ۳۰ ساعت کار مداوم و خودکار را فراهم می‌کند، در حالی که وضعیت و تمرکز خود را حفظ می‌نماید.
تأخیر (Latency) در حالت Thinking: هنگامی که Extended Thinking فعال است، پردازش طرح‌های معماری پیچیده ممکن است چند دقیقه طول بکشد.
محدودیت خروجی ۶۴ هزار token: ظرفیت عظیم خروجی امکان تولید معماری‌های کامل نرم‌افزاری را در یک فراخوانی API واحد فراهم می‌کند.
تغییرات در ریاضیات رقابتی: با وجود پیشتازی در کدنویسی، این مدل در برخی benchmarkهای برنامه‌نویسی رقابتی خاص، گاهی از مدل‌های تخصصی reasoning عقب می‌ماند.

شروع سریع API

anthropic/claude-4-5-sonnet

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude Sonnet 4.5 چه می‌گویند

ببینید جامعه درباره Claude Sonnet 4.5 چه فکر می‌کند

Claude 4.5 Sonnet از امروز همه‌جا در دسترس است، بهترین مدل کدنویسی در جهان.
ClaudeOfficial
reddit
این یکی از دردناک‌ترین مشکلات مقیاس‌پذیری در تنظیمات MCP را حل می‌کند. قبلاً می‌دیدم که context قبل از شروع کار اصلی تبخیر می‌شد.
Simon Willison
twitter
Claude Code-Sonnet 4.5 برای کارهای پیچیده ریفکتورینگ در داکر، بسیار جلوتر از Gemini 3.0 Pro است.
Comfortable-Friend96
reddit
الگو این است: اشتباهات به مستندات تبدیل می‌شوند. یک قانون به CLAUDE.md اضافه می‌کنید و دیگر هرگز آن اتفاق تکرار نمی‌شود.
Boris Cherny
twitter
حالت reasoning ترکیبی برای دیباگ کردن منطق‌های async پیچیده که مدل‌های معمولی در آن گیر می‌کردند، یک نجات‌دهنده است.
AsyncDev
hackernews
برابری قیمت با 3.5 Sonnet این مدل را به یک ارتقای آسان برای تمام خطوط تولید agent ما تبدیل می‌کند.
StartupFounder2025
reddit

ویدیوهای درباره Claude Sonnet 4.5

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude Sonnet 4.5 را تماشا کنید

این مدل جدید 4.5 Sonnet حتی از Opus 4.1 در تست Swaybench verified هم بهتر عمل می‌کند

این مدل توانست بیش از ۳۰ ساعت روی کارهای پیچیده چندمرحله‌ای تمرکز خود را حفظ کند

با امتیاز ۶۱.۴ درصد در benchmark استفاده از کامپیوتر OS world پیشتاز است

موتور reasoning داخلی آن محیط‌های پایتون را با پایداری بسیار بیشتری نسبت به نسخه 3.5 مدیریت می‌کند

ادغام با ترمینال بسیار دقیق‌تر شده و تقریباً هیچ دستور shell اشتباهی تولید نمی‌کند

Sonnet 4.5 اکنون در استفاده از ابزارهای agentic پیشتاز است... یک جهش ۲۰ درصدی که بسیار هیجان‌انگیز است

Claude code با Sonnet 4.5 کل پیاده‌سازی Stripe را در ۱۵ دقیقه به پایان رساند

Claude Sonnet 4.5 بسیار سریع‌تر و به میزان قابل‌توجهی بهتر بود

گزینه Thinking به شما اجازه می‌دهد توان پردازشی بیشتری را به بلوک‌های خاصی از کد اختصاص دهید

حتی زمانی که ۱۵۰,۰۰۰ token در دل یک پروژه عظیم هستید، context را به صورت کامل حفظ می‌کند

این بهترین عملکردی است که یک مدل تا به حال هنگام کنترل کامپیوتر داشته است

کاهش نرخ خطا در کدنویسی از ۹ درصد به تقریباً صفر

Claude imagine شاید جذاب‌ترین ویژگی باشد... یک تجربه ساخت اپلیکیشن در لحظه

ادغام MCP به آن اجازه می‌دهد بدون اشغال کردن context شما، ابزارها را جستجو کند

تأخیر در بینایی (Vision) هنگام تحلیل چیدمان‌های پیچیده UI به طور قابل‌توجهی کاهش یافته است

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Claude Sonnet 4.5

نکات تخصصی برای کمک به شما در استفاده حداکثری از Claude Sonnet 4.5 و دستیابی به نتایج بهتر.

فعال‌سازی جستجوی ابزار MCP

از قابلیت جستجوی ابزار Model Context Protocol استفاده کنید تا مصرف context تا ۸۵ درصد کاهش یابد و فضای بیشتری برای فایل‌های فعال باقی بماند.

بهره‌گیری از Agentic Checkpoints

از دستور /checkpoint در رابط‌های ترمینال استفاده کنید تا قبل از تغییرات ساختاری بزرگ (refactor)، پیشرفت کار را ذخیره کرده و امکان بازگشت فوری فراهم باشد.

مدیریت بودجه Context

تاریخچه بین کارهای نامرتبط را پاک کنید تا از افت کیفیت context جلوگیری شده و دقت منطقی در سطح بالا حفظ شود.

سلسله‌مراتب System Prompt

پرسونای مدل و محدودیت‌های سخت‌گیرانه خروجی را در یک فایل پیکربندی اختصاصی تعریف کنید تا ثبات عملکرد در تمامی agentها حفظ شود.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

سوالات متداول درباره Claude Sonnet 4.5

پاسخ سوالات رایج درباره Claude Sonnet 4.5 را بیابید