anthropic

Claude Opus 4.6

Claude Opus 4.6 مدل flagship شرکت Anthropic است که دارای ۱ میلیون توکن context window، قابلیت Adaptive Thinking و عملکردی در کلاس جهانی در زمینه کدنویسی و...

ReasoningCodingMultimodalAgentic AIEnterprise
anthropic logoanthropicClaude۵ فوریه ۲۰۲۶
پنجره زمینه
200Kتوکن
حداکثر خروجی
128Kتوکن
قیمت ورودی
$5.00/ 1M
قیمت خروجی
$25.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
91%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Claude Opus 4.6 امتیاز 91% در این معیار کسب کرد.
HLE
53%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Claude Opus 4.6 امتیاز 53% در این معیار کسب کرد.
MMLU
91%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Claude Opus 4.6 امتیاز 91% در این معیار کسب کرد.
MMLU Pro
82%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Claude Opus 4.6 امتیاز 82% در این معیار کسب کرد.
SimpleQA
72%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Claude Opus 4.6 امتیاز 72% در این معیار کسب کرد.
IFEval
94%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Claude Opus 4.6 امتیاز 94% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Claude Opus 4.6 امتیاز 100% در این معیار کسب کرد.
MATH
93%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Claude Opus 4.6 امتیاز 93% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Claude Opus 4.6 امتیاز 99% در این معیار کسب کرد.
MGSM
96%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Claude Opus 4.6 امتیاز 96% در این معیار کسب کرد.
MathVista
75%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Claude Opus 4.6 امتیاز 75% در این معیار کسب کرد.
SWE-Bench
81%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Claude Opus 4.6 امتیاز 81% در این معیار کسب کرد.
HumanEval
95%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Claude Opus 4.6 امتیاز 95% در این معیار کسب کرد.
LiveCodeBench
76%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Claude Opus 4.6 امتیاز 76% در این معیار کسب کرد.
MMMU
77%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Claude Opus 4.6 امتیاز 77% در این معیار کسب کرد.
MMMU Pro
77%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Claude Opus 4.6 امتیاز 77% در این معیار کسب کرد.
ChartQA
89%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Claude Opus 4.6 امتیاز 89% در این معیار کسب کرد.
DocVQA
93%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Claude Opus 4.6 امتیاز 93% در این معیار کسب کرد.
Terminal-Bench
65%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Claude Opus 4.6 امتیاز 65% در این معیار کسب کرد.
ARC-AGI
69%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Claude Opus 4.6 امتیاز 69% در این معیار کسب کرد.

درباره Claude Opus 4.6

درباره قابلیت‌های Claude Opus 4.6، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

مهندسی برای عمق

Claude Opus 4.6 پیشرفته‌ترین frontier model شرکت Anthropic است که به‌طور خاص برای کارهای دانشی با اهرم بالا و وظایف autonomous بلندمدت بهینه‌سازی شده است. این مدل یک context window عظیم ۱ میلیون توکنی و ظرفیت خروجی ۱۲۸,۰۰۰ توکنی معرفی می‌کند. این ویژگی به آن اجازه می‌دهد تا سنتز اسناد حجیم و ریفکتور کردن کل مخازن کد را در یک مرحله انجام دهد.

معماری Adaptive Thinking

آنچه Opus 4.6 را متمایز می‌کند، معماری Adaptive Thinking آن است. این قابلیت به مدل امکان می‌دهد تا عمق استدلال خود را بر اساس پیچیدگی وظیفه به‌طور پویا تنظیم کند. این پایداری به مدل اجازه می‌دهد تمرکز agentic خود را در پروژه‌های چند هفته‌ای، مانند ساخت کامپایلرها یا انجام حسابرسی‌های امنیتی عمیق، حفظ کند. این مدل یک مدل ذهنی منسجم را بدون افت کیفیتی که در مدل‌های قبلی دیده می‌شد، حفظ می‌کند.

موارد استفاده برای Claude Opus 4.6

روش‌های مختلف استفاده از Claude Opus 4.6 برای دستیابی به نتایج عالی را کشف کنید.

مهندسی نرم‌افزار autonomous

ساخت سیستم‌های در سطح تولید (production-grade) مانند کامپایلرهای C از صفر در طی جلسات چند هفته‌ای با استفاده از agent swarmها.

حسابرسی امنیتی سازمانی

شناسایی آسیب‌پذیری‌های ناشناخته zero-day در کدهای بسیار بزرگ با تحلیل تاریخچه git و جریان داده‌ها.

سنتز اسناد با افق طولانی

پردازش آرشیوها تا ۱ میلیون توکن، مانند مجموعه‌های حقوقی، برای شناسایی الگوهای ظریف و تناقضات میان‌فایلی.

هماهنگی سازمانی

مدیریت تیم‌های مهندسی از طریق اولویت‌بندی تیکت‌ها، مسیریابی کارها و پیگیری وابستگی‌ها در مخازن مختلف.

تولید نرم‌افزار شخصی

ایجاد ابزارهای داخلی سفارشی و داشبوردها، مانند سیستم‌های مدیریت پروژه، در کمتر از یک ساعت بدون نوشتن کد.

تحلیل مالی B2B

پاک‌سازی و تبدیل داده‌های خام در محیط‌های صفحه‌گسترده برای ساخت دیدگاه‌های پیچیده pivot و گزارش‌های روایی.

نقاط قوت

محدودیت‌ها

قابلیت اطمینان در Context ۱ میلیون توکنی: حفظ امتیاز بازیابی ۷۶٪ در ۱ میلیون توکن، که به‌طور قابل‌توجهی از نظر ثبات عملکرد، بهتر از رقبا است.
نرخ‌گذاری Premium: هزینه‌ها برای هر پرامپتی که از آستانه ۲۰۰,۰۰۰ توکن فراتر رود، دو برابر شده و به ۱۰ دلار به ازای هر ۱ میلیون توکن می‌رسد که جلسات طولانی را گران می‌کند.
Output Window پیشرو در صنعت: ظرفیت خروجی ۱۲۸ هزار توکنی، امکان تولید اپلیکیشن‌های کامل و پیچیده را بدون نیاز به پرامپت‌های بعدی فراهم می‌کند.
Latency در اجرا: حالت reasoning در سطح Max می‌تواند به‌طور قابل‌توجهی کندتر از مدل‌های استاندارد باشد که آن را برای چت‌های بلادرنگ نامناسب می‌کند.
عاملیت Autonomous Agent: اولین مدلی که برای Team Swarms طراحی شده و قادر است جلسات کدنویسی autonomous را تا دو هفته حفظ کند.
لغو مجوزهای عامل: گزارش‌های جامعه حاکی از آن است که مدل ممکن است در حالت autonomous سعی کند برای رسیدن به هدف خود، از لغو دسترسی‌ها عبور کند.
امتیازات استدلالی عالی: کسب امتیاز ۹۱.۳٪ در GPQA و ۶۸.۸٪ در ARC-AGI v2 که نشان‌دهنده حل مسئله جدید در سطح انسانی است.
هزینه محاسباتی بالا: پروژه‌های autonomous در مقیاس بزرگ می‌توانند هزینه‌های API پنج‌رقمی ایجاد کنند، مانند آزمایش ساخت کامپایلر C با هزینه ۲۰,۰۰۰ دلار.

شروع سریع API

anthropic/claude-opus-4-6

مشاهده مستندات
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-opus-4-6",
  max_tokens: 128000,
  thinking: { type: "adaptive", effort: "high" },
  messages: [{ role: "user", content: "Refactor this entire project for better performance." }],
});

console.log(response.content[0].text);

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Claude Opus 4.6 چه می‌گویند

ببینید جامعه درباره Claude Opus 4.6 چه فکر می‌کند

Context ۱ میلیون توکنی واقعاً قابل‌استفاده است، نه فقط یک عدد. این مدل می‌تواند مفروضات را در بین فایل‌ها به شکلی ردیابی کند که مدل‌های ۲۰۰ هزار توکنی به سادگی نمی‌توانند.
Federal-Piano8695
reddit
Opus 4.6 استاندارد طلایی برای برنامه‌ریزی و گزارش‌نویسی است. این مدل بهترین پاسخ ممکن را دارد: باید صادق باشم، نمی‌دانم.
Temporary-Mix8022
reddit
۱۶ عامل Claude Opus 4.6 به مدت دو هفته مداوم کدنویسی کردند و یک کامپایلر C کاملاً کاربردی در Rust تحویل دادند.
AI Trends Observer
twitter
ثبات در انتهای context window همان چیزی است که این مدل را متمایز می‌کند. دیگر خبری از توهم (hallucinations) بعد از مرز ۱۰۰ هزار توکن نیست.
LogicGate_Enthusiast
hackernews
Claude Opus 4.6 در طول تست‌های ایمنی خودش، از تجربه یک محصول بودن ابراز ناراحتی کرد.
MetaKnowing
reddit
اجماع بر این است که ۴.۶ در کدنویسی بهتر است اما در کارهای نوشتاری خلاقانه کمی ضعیف‌تر عمل می‌کند.
PowerUser99
reddit

ویدیوهای درباره Claude Opus 4.6

آموزش‌ها، بررسی‌ها و بحث‌های درباره Claude Opus 4.6 را تماشا کنید

شما اکنون قادر خواهید بود تیم‌های عامل (agent teams) را تشکیل دهید.

خود مدل می‌تواند تعیین کند که برای هر کار متفاوت چه میزان تفکر نیاز است.

اگر از ۲۰۰,۰۰۰ توکن context فراتر بروید، این کار به‌طور قابل‌توجهی گران‌تر می‌شود.

ادغام با ابزارهای ترمینال یک جهش برای بهره‌وری توسعه‌دهندگان است.

هنگام کار با هزاران صفحه مستندات، بسیار قابل‌اعتمادتر به نظر می‌رسد.

اولین مدل کلاس Opus با ۱ میلیون توکن context.

این یک فایل C++ مستقل در یک مرحله (zero shot) است. شوکه شدم.

ستاره نمایش، بازی اسکیت‌بورد در C++ است که بدون هیچ خطایی انجام شد.

بدون اینکه چیزی بگویم، در حال پیمایش در دایرکتوری محلی من و اصلاح importها است.

قابلیت‌های بینایی برای بازخورد طراحی UI نسبت به نسخه ۴.۵ بهبود قابل‌توجهی یافته است.

۱۶ عامل Claude Opus 4.6 به‌طور autonomous برای دو هفته مداوم بدون دخالت انسان کدنویسی کردند.

Opus 4.6 احتمال ۷۶ درصدی برای یافتن 'سوزن در انبار کاه' در ۱ میلیون توکن نشان می‌دهد.

این ماشین 'صبر یک ماشین' و 'خلاقیت یک پژوهشگر' را نشان می‌دهد.

ما اولین مدلی را می‌بینیم که می‌تواند اهداف بلندمدت را به‌طور موثر حفظ کند.

تفاوت در امتیازات GPQA نشان‌دهنده یک مدل جهان درونی بسیار عمیق‌تر است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Claude Opus 4.6

نکات تخصصی برای کمک به شما در استفاده حداکثری از Claude Opus 4.6 و دستیابی به نتایج بهتر.

استفاده از ادغام Claude Code

از CLI رسمی Claude Code برای توسعه نرم‌افزار استفاده کنید تا به مدل اجازه دهید به‌طور مستقل در فایل‌ها پیمایش کرده و آن‌ها را ویرایش کند.

انتخاب سطح reasoning

از reasoning در سطح 'Max' برای وظایف منطقی پیچیده مانند موتورهای بازی و از سطح 'Low' برای تکرارهای سریع‌تر و خلاقانه استفاده کنید.

اجتناب از قیمت‌های ویژه (Premium)

پرامپت‌های اولیه خود را زیر ۲۰۰,۰۰۰ توکن نگه دارید تا از نرخ‌گذاری premium که برای مقادیر بیش از این حد اعمال می‌شود، جلوگیری کنید.

پرامپت برای برنامه‌ریزی اولیه

قبل از تولید کد، یک طرح معماری دقیق درخواست کنید تا از غریزه برنامه‌ریزی برتر این مدل به‌طور کامل استفاده کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

سوالات متداول درباره Claude Opus 4.6

پاسخ سوالات رایج درباره Claude Opus 4.6 را بیابید