anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet اولین مدل استدلال هیبریدی Anthropic است که قابلیت‌های برنامه‌نویسی در سطح state-of-the-art، context window دویست هزار توکنی و تفکر قابل...

anthropic logoanthropicClaude 3۲۴ فوریه ۲۰۲۵
پنجره زمینه
200Kتوکن
حداکثر خروجی
128Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
84.8%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude 3.7 Sonnet امتیاز 84.8% در این معیار کسب کرد.
HLE
34%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 34% در این معیار کسب کرد.
MMLU
89%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude 3.7 Sonnet امتیاز 89% در این معیار کسب کرد.
MMLU Pro
74%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude 3.7 Sonnet امتیاز 74% در این معیار کسب کرد.
SimpleQA
42%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 42% در این معیار کسب کرد.
IFEval
93.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude 3.7 Sonnet امتیاز 93.2% در این معیار کسب کرد.
AIME 2025
54.8%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude 3.7 Sonnet امتیاز 54.8% در این معیار کسب کرد.
MATH
96.2%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 96.2% در این معیار کسب کرد.
GSM8k
97%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude 3.7 Sonnet امتیاز 97% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude 3.7 Sonnet امتیاز 92% در این معیار کسب کرد.
MathVista
70%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 70% در این معیار کسب کرد.
SWE-Bench
70.3%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude 3.7 Sonnet امتیاز 70.3% در این معیار کسب کرد.
HumanEval
94%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude 3.7 Sonnet امتیاز 94% در این معیار کسب کرد.
LiveCodeBench
65%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 65% در این معیار کسب کرد.
MMMU
75%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude 3.7 Sonnet امتیاز 75% در این معیار کسب کرد.
MMMU Pro
55%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude 3.7 Sonnet امتیاز 55% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 89% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
35.2%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 35.2% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 12% در این معیار کسب کرد.

درباره Claude 3.7 Sonnet

درباره قابلیت‌های Claude 3.7 Sonnet، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

طراحی استدلال هیبریدی

مدل Claude 3.7 Sonnet از معماری جدیدی استفاده می‌کند که به کاربران امکان می‌دهد بین سرعت و عمق یکی را انتخاب کنند. این اولین مدلی است که امکان تغییر وضعیت (toggle) برای تفکر گسترش‌یافته را فراهم می‌کند و به سیستم اجازه می‌دهد قبل از ارائه پاسخ، روی منطق‌های پیچیده کار کند. این شفافیت به توسعه‌دهندگان اجازه می‌دهد دقیقاً ببینند مدل چگونه به نتیجه رسیده است که این امر احتمال خطاهای پنهان در کارهای فنی را کاهش می‌دهد.

حل مسائل فنی

این مدل برای مهندسی نرم‌افزار سطح بالا ساخته شده است. مدل در benchmark مدل SWE-bench Verified امتیاز ۶۲.۱٪ را کسب کرده که توانایی بالای آن در رفع مشکلات واقعی گیت‌هاب را نشان می‌دهد. هنگامی که با ابزارهایی مانند Claude Code استفاده می‌شود، ویرایش فایل و اجرای دستورات را در مخازن کد بزرگ مدیریت می‌کند. این مدل مسائل ریاضی و کدنویسی را با دقتی انجام می‌دهد که با مدل‌های پیشرو و سطح بالای فعلی استدلال برابری می‌کند یا از آن‌ها پیشی می‌گیرد.

ظرفیت عظیم context

با یک context window دویست هزار توکنی، این مدل مجموعه‌های بزرگی از مستندات یا پایگاه‌های کد را در یک‌بار پردازش بررسی می‌کند. این مدل تا ۱۲۸,۰۰۰ توکن خروجی را در زمانی که حالت تفکر فعال است پشتیبانی می‌کند که برای تولید اسکریپت‌های طولانی یا گزارش‌های دقیق مفید است. این مدل همچنین multimodal است؛ به این معنی که می‌تواند نمودارها و دیاگرام‌ها را در کنار متن تفسیر کند.

Claude 3.7 Sonnet

موارد استفاده برای Claude 3.7 Sonnet

روش‌های مختلف استفاده از Claude 3.7 Sonnet برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار Agentic

استفاده از ابزار ترمینال برای رفع باگ‌ها و بازنویسی (refactor) کد در ساختارهای بزرگ فایل.

تأیید اثبات‌های ریاضی

حل مسائل دشوار ریاضی با اجازه دادن به مدل برای طی کردن مراحل منطقی.

تحلیل مخزن کد (Repository Analysis)

استخراج داده‌ها و شناسایی الگوها از کل پایگاه‌های کد فنی در یک prompt واحد.

تجزیه داده‌های بصری

تبدیل نمودارهای پیچیده، فلوچارت‌ها و دیاگرام‌های فنی به داده‌های ساختاریافته JSON.

برنامه‌ریزی معماری سیستم

طراحی سیستم‌های نرم‌افزاری با بررسی‌های منطقی دقیق با استفاده از حالت reasoning گسترش‌یافته.

گردش‌کارهای Git خودکار

مدیریت پیام‌های commit، بازبینی کد و اجرای تست‌ها از طریق tool use به سبک agentic.

نقاط قوت

محدودیت‌ها

گزینه‌های تفکر هیبریدی: اولین مدلی که به کاربران اجازه می‌دهد بین پاسخ‌های سریع استاندارد و حالت‌های تفکر عمیق جابه‌جا شوند.
تاخیر (Latency) استدلال: فعال کردن حالت تفکر باعث افزایش قابل‌توجه زمان پاسخگویی مدل می‌شود.
برترین عامل برنامه‌نویسی: عملکرد سطح بالا در SWE-bench Verified با کسب امتیاز ۶۲.۱٪ برای رفع مشکلات در محیط production.
هزینه تفکر: توکن‌های استدلال داخلی با نرخ ۱۵ دلار به ازای هر میلیون توکن خروجی محاسبه می‌شوند که در وظایف طولانی هزینه‌بر است.
ظرفیت خروجی فوق‌العاده: تولید تا ۱۲۸,۰۰۰ توکن در یک پاسخ، که تولید کدها و اسناد حجیم را تسهیل می‌کند.
عدم پشتیبانی از ویدیو: برخلاف برخی رقبا، این مدل نمی‌تواند فایل‌های ویدیویی خام را به صورت بومی از طریق API دریافت یا تحلیل کند.
منطق شفاف: زنجیره تفکر برون‌سپاری شده (Externalized chain-of-thought) به کاربران اجازه می‌دهد فرایند تفکر داخلی مدل را حسابرسی و دیباگ کنند.
تاریخ انقضای دانش: داده‌های آموزشی مدل تنها تا اکتبر ۲۰۲۴ را پوشش می‌دهد و تحولات اخیر صنعت را شامل نمی‌شود.

شروع سریع API

anthropic/claude-3-7-sonnet

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "این نقص معماری را تحلیل کن..." }],
});

console.log(message.content);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude 3.7 Sonnet چه می‌گویند

ببینید جامعه درباره Claude 3.7 Sonnet چه فکر می‌کند

ترکیب Claude Code و 3.7 Sonnet در ترمینال من، اساساً یک برنامه‌نویس جونیورِ تقویت‌شده است. اولین بار است که هوش مصنوعی agentic را واقعی حس کردم.
dev_guru_99
reddit
استدلال هیبریدی یک آپدیت بزرگ است. من همیشه نیاز ندارم که ۳۰ ثانیه فکر کند، اما هنگام دیباگ کردن، فوق‌العاده است.
TechLead_X
twitter
Anthropic موفق شد مدلی بسازد که در ریاضیات با o1 رقابت کند و در عین حال برای چت‌های روزمره هم مفید باقی بماند.
logic_fanatic
hackernews
Claude گزارش‌های جامع و زیبایی را با فرمت‌بندی عالی و ارجاعات، در کمتر از پنج دقیقه ارائه می‌دهد.
ThinkingDeeplyAI_mod
reddit
محدودیت خروجی ۱۲۸ هزار توکنی یک قابلیت پنهان عالی است. بالاخره مدلی که وسط یک اسکریپت طولانی قطع نمی‌شود.
code_monk_42
reddit
ترکیب Claude 3.7 و MCP نزدیک‌ترین چیزی است که در حال حاضر به جارویس داریم. واقعاً از ابزارهای محلی من به‌درستی استفاده می‌کند.
julie_codes_it
twitter

ویدیوهای درباره Claude 3.7 Sonnet

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude 3.7 Sonnet را تماشا کنید

Claude 3.7 فوق‌العاده قدرتمند است. مدل پایه جدید خودش را شکست داد تا در برنامه‌نویسی بهتر شود.

مدل جدید 3.7 تمام مدل‌های دیگر از جمله OpenAI o3 mini را کاملاً کنار زد.

این مدل قادر است ۷۰٪ از issuesهای گیت‌هاب را حل کند.

تفکر گسترش‌یافته به مدل اجازه می‌دهد قبل از تولید کد، روی یک مسئله تأمل کند.

این یک پیروزی بزرگ برای تجربه توسعه‌دهندگان است.

چت‌بات‌ها به شما مشاوره می‌دهند، اما Claude Code اقدام (action) انجام می‌دهد. می‌تواند فایل بسازد، وب‌سایت بسازد و پکیج نصب کند.

تفکر گسترش‌یافته به این معناست که Claude قبل از انجام هر کاری، استدلال می‌کند.

این ابزار برای محیط ترمینال بهینه‌سازی شده است.

اتصال MCP چیزی است که واقعاً این مدل را از ChatGPT استاندارد متمایز می‌کند.

مدل هدف پشت دستورات مبهم ترمینال را درک می‌کند.

ادغام با ترمینال از طریق Claude Code سطحی از عاملیت را نشان می‌دهد که قبلاً ندیده بودیم.

توانایی Claude 3.7 Sonnet در نشان دادن فرایند تفکرش بسیار شفاف‌تر از رقباست.

در SWE-bench Verified، به امتیاز قابل‌توجه ۶۲٪ می‌رسد.

استدلال هیبریدی یعنی زمانی که به آن نیاز ندارید، هزینه‌ی تاخیر را پرداخت نمی‌کنید.

این مدل سبک نوشتاری باکیفیت مدل‌های قبلی Claude را حفظ می‌کند.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Claude 3.7 Sonnet

نکات تخصصی برای کمک به شما در استفاده حداکثری از Claude 3.7 Sonnet و دستیابی به نتایج بهتر.

تنظیم بودجه‌های Reasoning

از پارامتر thinking در API استفاده کنید تا تعداد reasoning tokens را برای مدیریت هزینه‌ها محدود کنید.

بررسی بلوک‌های فکری (Thought Blocks)

زنجیره تفکر (chain-of-thought) داخلی در پاسخ‌ها را بررسی کنید تا منطق پاسخ‌های پیچیده را تأیید نمایید.

استفاده از اتصالات MCP

مدل را به پایگاه‌های داده محلی و فضای ذخیره‌سازی ابری متصل کنید تا context پروژه به‌صورت real-time در دسترس باشد.

بازخوانی context

در حلقه‌های طولانی agentic از دستورات خلاصه‌سازی استفاده کنید تا context window بر روی داده‌های مرتبط متمرکز بماند.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

سوالات متداول درباره Claude 3.7 Sonnet

پاسخ سوالات رایج درباره Claude 3.7 Sonnet را بیابید