anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet اولین مدل hybrid reasoning شرکت Anthropic است که قابلیت‌های کدنویسی پیشرو، context window ۲۰۰ هزارتایی و تفکر بصری را ارائه می‌دهد.

anthropic logoanthropicClaude 3February 24, 2025
پنجره زمینه
200Kتوکن
حداکثر خروجی
128Kتوکن
قیمت ورودی
$3.00/ 1M
قیمت خروجی
$15.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
84.8%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude 3.7 Sonnet امتیاز 84.8% در این معیار کسب کرد.
HLE
34%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 34% در این معیار کسب کرد.
MMLU
89%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude 3.7 Sonnet امتیاز 89% در این معیار کسب کرد.
MMLU Pro
74%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude 3.7 Sonnet امتیاز 74% در این معیار کسب کرد.
SimpleQA
42%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 42% در این معیار کسب کرد.
IFEval
93.2%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude 3.7 Sonnet امتیاز 93.2% در این معیار کسب کرد.
AIME 2025
54.8%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude 3.7 Sonnet امتیاز 54.8% در این معیار کسب کرد.
MATH
96.2%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 96.2% در این معیار کسب کرد.
GSM8k
97%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude 3.7 Sonnet امتیاز 97% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude 3.7 Sonnet امتیاز 92% در این معیار کسب کرد.
MathVista
70%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 70% در این معیار کسب کرد.
SWE-Bench
70.3%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude 3.7 Sonnet امتیاز 70.3% در این معیار کسب کرد.
HumanEval
94%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude 3.7 Sonnet امتیاز 94% در این معیار کسب کرد.
LiveCodeBench
65%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 65% در این معیار کسب کرد.
MMMU
75%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude 3.7 Sonnet امتیاز 75% در این معیار کسب کرد.
MMMU Pro
55%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude 3.7 Sonnet امتیاز 55% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 89% در این معیار کسب کرد.
DocVQA
94%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 94% در این معیار کسب کرد.
Terminal-Bench
35.2%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 35.2% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude 3.7 Sonnet امتیاز 12% در این معیار کسب کرد.

Claude 3.7 Sonnet را رایگان امتحان کنید

با Claude 3.7 Sonnet رایگان گفتگو کنید. قابلیت‌ها را آزمایش کنید، سوال بپرسید و ببینید این مدل AI چه کارهایی می‌تواند انجام دهد.

پرامپت
پاسخ
anthropic/claude-3-7-sonnet-20250219

پاسخ AI شما اینجا ظاهر می‌شود

درباره Claude 3.7 Sonnet

درباره قابلیت‌های Claude 3.7 Sonnet، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Hybrid Reasoning و شفافیت

مدل Claude 3.7 Sonnet نشان‌دهنده یک چرخش تاریخی در معماری LLM به عنوان اولین مدل «hybrid reasoning» از Anthropic است. این مدل به‌طور منحصربه‌فردی به کاربران اجازه می‌دهد بین پاسخ‌های استاندارد با تاخیر کم و حالت «extended thinking» که زنجیره تفکر داخلی (chain-of-thought) آن را نمایش می‌دهد، جابجا شوند. این شفافیت دریچه‌ای روشن به منطق model برای کاربران فراهم می‌کند و آن را به‌ویژه برای عیب‌یابی‌های پیچیده و وظایف reasoning حساس، موثر می‌سازد.

تسلط بر مهندسی نرم‌افزار

این مدل که با تمرکز قوی بر مهندسی نرم‌افزار و خروجی‌های آماده برای محیط عملیاتی طراحی شده، استانداردهای جدیدی را در صنعت در benchmarkهایی مانند SWE-Bench Verified ثبت کرده است. این مدل در «vibe coding» عالی عمل می‌کند؛ جایی که توسعه‌دهندگان هدف کلی را توصیف کرده و model پیاده‌سازی را در چندین فایل مدیریت می‌کند. همچنین refactorهای پیچیده و تصمیمات معماری را با دقتی فراتر از frontier modelهای قبلی انجام می‌دهد.

Context حجیم و ابزارهای Agentic

با یک context window عظیم ۲۰۰,۰۰۰ tokens و مجموعه‌ای از ابزارهای agentic به نام Claude Code، این مدل از یک chatbot ساده به یک همکار فنی استراتژیک تبدیل می‌شود. این مدل قادر است کل چرخه حیات پروژه، از بازبینی اولیه مستندات گرفته تا workflowهای خودکار git و اجرای تست را مدیریت کند و اطمینان حاصل کند که توسعه سریع و بدون باگ باقی می‌ماند.

Claude 3.7 Sonnet

موارد استفاده برای Claude 3.7 Sonnet

روش‌های مختلف استفاده از Claude 3.7 Sonnet برای دستیابی به نتایج عالی را کشف کنید.

Vibe Coding

ساخت نرم‌افزارهای کاربردی از صفر با توصیف هدف به زبان طبیعی.

دیباگ پیشرفته

بهره‌گیری از extended thinking برای تحلیل logهای پیچیده و ارائه اصلاحات دقیق در یک مرحله (one-shot).

تحلیل Context بزرگ

بازبینی و refactoring کل codebase یا مستندات فنی طولانی در یک prompt واحد.

توسعه Agentic

قدرت‌بخشی به ابزارهای مبتنی بر ترمینال مانند Claude Code برای خودکارسازی workflowهای git و اجرای تست‌ها.

تولید UI فرانت‌اند

ساخت کامپوننت‌های ظریف و قابل نگهداری React و Svelte با درک بصری و سلیقه طراحی داخلی.

تحقیق مبتنی بر واقعیت

تحلیل اسناد PDF حجیم و مجموعه‌داده‌ها با دقت بالا و نرخ hallucination پایین.

نقاط قوت

محدودیت‌ها

کدنویسی پیشرو در صنعت: کسب امتیاز ۷۰.۳٪ در SWE-bench Verified و حل مشکلات واقعی GitHub با دقتی بی‌سابقه.
تاخیر در پاسخ‌دهی: فعال‌سازی حالت «extended thinking» در مقایسه با پاسخ‌های استاندارد، زمان رسیدن به اولین token را به‌طور قابل‌توجهی افزایش می‌دهد.
Reasoning شفاف: اولین model که قابلیت «extended thinking» قابل مشاهده و کنترل توسط کاربر را برای حل مسائل پیچیده و حساس ارائه می‌دهد.
قیمت‌گذاری سطح بالا: هزینه خروجی ۱۵ دلار به ازای هر ۱ میلیون tokens همچنان بسیار بالاتر از اکثر جایگزین‌های «mini» یا وزن‌های آزاد است.
یکپارچگی Agentic: بهینه‌سازی شده به‌طور خاص برای استفاده از ابزارها و تعامل با CLI از طریق فریم‌ورک Claude Code جهت خودکارسازی کامل وظایف.
عدم پشتیبانی بومی از صدا/ویدیو: برخلاف GPT-4o یا Gemini 2.0، این model فاقد قابلیت‌های پردازش مستقیم ورودی‌های صوتی و ویدیویی است.
سلیقه طراحی برتر: تولید کدهای UI ظریف‌تر، دردسترس‌تر و قابل‌نگهداری‌تر در مقایسه با سایر frontier modelها.
هزینه محاسباتی: جلسات reasoning عمیق در طول refactorهای بزرگ codebase می‌تواند به‌سرعت بودجه tokens و محدودیت‌های context را مصرف کند.

شروع سریع API

anthropic/claude-3-7-sonnet-20250219

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude 3.7 Sonnet چه می‌گویند

ببینید جامعه درباره Claude 3.7 Sonnet چه فکر می‌کند

"مدل Claude 3.7 Sonnet بهترین هوش مصنوعی کدنویسی در جهان است؛ در کارهای چالش‌برانگیز ذهن من را درگیر کرد."
rawcell4772
reddit
"با یک prompt واحد، همه‌چیز را در یک پروژه پیچیده TypeScript به بهترین شکل انجام داد."
rawcell4772
reddit
"ابزار Claude Code با Sonnet 3.7 بسیار بهتر از Cline و در حال حاضر بهترین ابزار است."
peterkrueck
reddit
"جهش کیفیت در مدل‌های سطح بالایی مثل ۳.۷، دیدگاه من را متحول کرده است."
lurking_horrors
reddit
"مدل Claude 3.7 واقعاً فوق‌العاده است... عملکردش در سطح دیگری است."
Fireship
youtube
"حالت reasoning در Claude 3.7 یک تغییر پارادایم کامل برای دیباگ کردن منطق است."
DevLead99
x

ویدیوهای درباره Claude 3.7 Sonnet

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude 3.7 Sonnet را تماشا کنید

مدل ۳.۷ جدید تمام مدل‌های دیگر را در هم کوبید... اکنون قادر به حل ۷۰.۳٪ از مشکلات گیت‌هاب است [۰۱:۳۱]

استفاده از یک زبان با تایپ قوی در کنار TDD روش‌هایی برای AI هستند تا معتبر بودن کدی که می‌نویسد را تأیید کند [۰۳:۰۸]

این model در پیروی از دستورات به‌طرز باورنکردنی هوشمند است [۰۰:۴۵]

عملکرد در SWE-bench واقعاً خیره‌کننده است [۰۱:۵۵]

قابلیت reasoning بصری یک تحول بزرگ برای شفافیت است [۰۲:۳۰]

مدل Claude 3.7 Sonnet... احتمالاً بهترین LLM برای تولید کد است [۰۰:۰۴]

اگر از API استفاده کنید، می‌توانید ۱۲۸,۰۰۰ tokens خروجی را در یک مرحله دریافت کنید [۱۱:۱۲]

محدودیت خروجی ۱۲۸ هزارتایی یک ارتقای عظیم است [۰۴:۲۰]

سلیقه طراحی آن برای کامپوننت‌های فرانت‌اند بی‌نظیر است [۰۷:۱۵]

استفاده از ابزار و قابلیت‌های agentic هسته اصلی این model هستند [۰۹:۵۰]

قابلیت reasoning باید یک توانایی یکپارچه در frontier modelها باشد تا یک مدل کاملاً مجزا [۰۱:۰۴]

مدل Claude 3.7 موفق می‌شود با اختلاف قابل‌توجهی از آن مدل‌ها [DeepSeek، o3] پیشی بگیرد [۰۷:۰۶]

تاخیر در حالت reasoning کمی بالاتر است [۰۴:۱۵]

این model در چندین وظیفه پیروی از دستورات، DeepSeek R1 را شکست می‌دهد [۰۸:۳۰]

شرکت Anthropic واقعاً بر خروجی‌های آماده برای محیط عملیاتی تمرکز کرده است [۱۲:۱۰]

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند
تماشای دمو

نکات حرفه‌ای

نکات تخصصی برای کمک به شما در استفاده حداکثری از این مدل و دستیابی به نتایج بهتر.

بودجه تفکر

از حالت «extended thinking» به‌طور خاص برای منطق‌های پیچیده یا برنامه‌ریزی معماری استفاده کنید تا نتایجی با کیفیت بالاتر دریافت کنید.

کنترل Context

به‌طور مرتب از دستور /clear استفاده کنید یا گفتگوها را از نو شروع کنید تا در هزینه‌های context صرفه‌جویی شده و از کند شدن model جلوگیری شود.

تأیید اعتبار

از Claude بخواهید با استفاده از ابزار Claude Code برای کدهای خود تست بنویسد و آن‌ها را اجرا کند تا از پایداری محصول نهایی مطمئن شوید.

مشخصات Markdown

برای پیروی بهتر از دستورات در پروژه‌های بزرگ، نیازمندی‌های ویژگی‌ها را در قالب فایل‌های Markdown ساختاریافته ارائه دهید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

سوالات متداول

پاسخ سوالات رایج درباره این مدل را بیابید