anthropic

Claude Opus 4.6

Claude Opus 4.6 là flagship model của Anthropic với context window 1M token, Adaptive Thinking và hiệu suất coding và reasoning đẳng cấp thế giới.

ReasoningCodingMultimodalAgentic AIDoanh nghiệp
anthropic logoanthropicClaudeNgày 5 tháng 2 năm 2026
Ngu canh
200Ktoken
Dau ra toi da
128Ktoken
Gia dau vao
$5.00/ 1M
Gia dau ra
$25.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
91%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude Opus 4.6 dat 91% trong benchmark nay.
HLE
53%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Claude Opus 4.6 dat 53% trong benchmark nay.
MMLU
91%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude Opus 4.6 dat 91% trong benchmark nay.
MMLU Pro
82%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude Opus 4.6 dat 82% trong benchmark nay.
SimpleQA
72%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Claude Opus 4.6 dat 72% trong benchmark nay.
IFEval
94%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude Opus 4.6 dat 94% trong benchmark nay.
AIME 2025
100%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude Opus 4.6 dat 100% trong benchmark nay.
MATH
93%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude Opus 4.6 dat 93% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude Opus 4.6 dat 99% trong benchmark nay.
MGSM
96%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude Opus 4.6 dat 96% trong benchmark nay.
MathVista
75%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude Opus 4.6 dat 75% trong benchmark nay.
SWE-Bench
81%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude Opus 4.6 dat 81% trong benchmark nay.
HumanEval
95%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude Opus 4.6 dat 95% trong benchmark nay.
LiveCodeBench
76%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude Opus 4.6 dat 76% trong benchmark nay.
MMMU
77%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude Opus 4.6 dat 77% trong benchmark nay.
MMMU Pro
77%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude Opus 4.6 dat 77% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude Opus 4.6 dat 89% trong benchmark nay.
DocVQA
93%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude Opus 4.6 dat 93% trong benchmark nay.
Terminal-Bench
65%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude Opus 4.6 dat 65% trong benchmark nay.
ARC-AGI
69%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude Opus 4.6 dat 69% trong benchmark nay.

Ve Claude Opus 4.6

Tim hieu ve kha nang cua Claude Opus 4.6, tinh nang va cach no co the giup ban dat ket qua tot hon.

Biên giới mới của Trí tuệ

Claude Opus 4.6 đại diện cho một bước tiến đáng kể trong khả năng của các large language models, được thiết kế đặc biệt cho các tác vụ nhận thức khắt khe nhất. Được phát hành vào ngày 5 tháng 2 năm 2026, model này giới thiệu Adaptive Thinking, một tính năng đột phá cho phép model linh hoạt mở rộng nỗ lực reasoning dựa trên độ phức tạp của truy vấn. Điều này đảm bảo rằng trong khi các truy vấn đơn giản vẫn được xử lý hiệu quả, thì các câu đố logic phức tạp và các tác vụ kỹ thuật quan trọng sẽ nhận được chiều sâu xử lý cần thiết.

Được xây dựng cho kỷ nguyên Agentic

Được thiết kế để vượt xa các cuộc trò chuyện đơn giản, Opus 4.6 là một cỗ máy mạnh mẽ cho các quy trình autonomous agentic. Với các điểm số dẫn đầu ngành trên Terminal-Bench 2.0 và SWE-Bench Verified, nó có khả năng điều hướng môi trường máy tính, quản lý debugging phần mềm đa bước và điều phối các dự án phức tạp với sự can thiệp tối thiểu của con người. Context window 1 triệu token được mở rộng (khả dụng ở bản beta) cho phép nó ghi nhớ toàn bộ hệ sinh thái kỹ thuật cùng một lúc.

Truong hop su dung cho Claude Opus 4.6

Kham pha cac cach khac nhau ban co the su dung Claude Opus 4.6 de dat ket qua tuyet voi.

Quy trình Autonomous Agent

Điều phối các tác vụ agentic đa bước trên môi trường visual desktop bằng cách sử dụng reasoning cấp độ OSWorld.

Full-Stack Vibe Coding

Tạo toàn bộ các ứng dụng chức năng như trò chơi 3D hoặc bảng điều khiển phức tạp từ một prompt cấp cao duy nhất.

Quản lý Repo quy mô lớn

Phân tích và refactor các codebase đồ sộ bằng cách sử dụng context window 1M token và Model Context Protocol.

Nghiên cứu khoa học chuyên sâu

Tổng hợp thông tin cấp độ Tiến sĩ về sinh học, hóa học và vật lý với hiệu suất GPQA Diamond ưu việt.

Phân tích tài chính chuyên gia

Thực hiện mô hình hóa tài chính agentic và tổng hợp dữ liệu đa nguồn cho việc ra quyết định cấp doanh nghiệp.

Lập kế hoạch dài hạn

Quản lý các dự án hoặc mô phỏng phức tạp kéo dài hàng tháng, đòi hỏi việc sử dụng công cụ và tuân thủ tác vụ nhất quán.

Diem manh

Han che

Elite Agentic Reasoning: Hiệu suất state-of-the-art trên Terminal-Bench 2.0 (65%) và OSWorld dành cho các autonomous agents.
API Latency cao hơn: Khi sử dụng mức nỗ lực reasoning tối đa hoặc context window khổng lồ, model có thể chậm hơn đáng kể so với các biến thể Sonnet.
Context Capacity khổng lồ: Window 1M token (beta) cho phép xử lý toàn bộ thư viện hoặc các kho lưu trữ phần mềm lớn mà không bị mất tập trung.
Mô hình giá Premium: Với mức $5/$25 trên mỗi triệu tokens, đây vẫn là một lựa chọn chi phí cao cho các nhà phát triển so với các model nhỏ hoặc flash đã được tối ưu hóa.
Dynamic Adaptive Thinking: Khả năng mở rộng nỗ lực reasoning đảm bảo hiệu suất tối ưu cho cả các truy vấn nhanh và các vấn đề toán học chuyên sâu.
Độ phức tạp khi tích hợp: Các tính năng như Adaptive Thinking yêu cầu cập nhật triển khai API và kiến thức sâu hơn về bộ công cụ đặc thù của Anthropic.
Làm chủ kỹ thuật vượt trội: Khả năng toán học và khoa học xuất sắc, đạt điểm tuyệt đối 100% trên AIME 2025 và 91% trên GPQA Diamond.
Hạn chế Multimodal đầu ra: Mặc dù đầu vào vision thuộc hàng đẳng cấp thế giới, model hiện vẫn thiếu khả năng tạo âm thanh và video thời gian thực gốc.

Bat dau nhanh API

anthropic/claude-opus-4-6

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

const message = await anthropic.messages.create({
  model: "claude-4-6-opus-20260205",
  max_tokens: 128000,
  messages: [
    { role: "user", content: "Tạo một trình mô phỏng vật lý 3D đầy đủ chức năng bằng Three.js." }
  ],
});

console.log(message.content[0].text);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude Opus 4.6

Xem cong dong nghi gi ve Claude Opus 4.6

"Claude Opus 4.6 mạnh mẽ đến mức gây sốc. Hãy tưởng tượng Deep Research + reasoning nâng cao + khả năng coding thực thụ."
Awa K. Penn
x
"Vượt qua GPT-5.2 xhigh reasoning... một bước nhảy vọt khổng lồ so với mức 4,6% của Opus 4.5!"
Minyang Tian
x
"Model này cực kỳ mạnh cho coding hiện nay... không bị lạc trong các chi tiết nhỏ."
Dinmukhanbet Aizharykov
x
"Tôi đã sử dụng nó được một tuần và khả năng duy trì ngữ cảnh (context retention) thực sự tốt đến mức đáng sợ."
CodeMaster99
reddit
"Adaptive thinking là một yếu tố thay đổi cuộc chơi cho việc quản lý chi phí trên các tác vụ phức tạp."
AI_Strategy_Expert
hackernews
"Opus 4.6 cơ bản là một thực tập sinh AGI thực sự biết lắng nghe phản hồi của bạn."
TechVlogger2026
youtube

Video ve Claude Opus 4.6

Xem huong dan, danh gia va thao luan ve Claude Opus 4.6

Model này đã vươn lên dẫn đầu so với mọi hệ thống frontier khác hiện có... nó ở một đẳng cấp hoàn toàn khác.

Hãy tưởng tượng một thư viện tài liệu khổng lồ và phần mềm thực sự nhớ được chú thích ở trang 400.

Model thực sự quyết định mức độ nỗ lực dựa trên độ khó... giống như việc sang số vậy.

Đây là lần đầu tiên tôi thấy một AI thực sự hiểu được 'vibe' của một yêu cầu kỹ thuật phức tạp.

Đây rõ ràng là bản dựng dành cho các nhà phát triển doanh nghiệp, những người cần độ chính xác zero-shot hơn là tốc độ.

Claude có một flagship model mới với Opus 4.6... Tiết lộ trước nhé, nó đơn giản là tốt hơn bất cứ thứ gì tôi từng thấy.

Model này tự chủ hơn nhiều so với bất kỳ thứ gì trước đây... sức mạnh agentic là có thật.

Cảm giác cá nhân của tôi là đây đáng lẽ phải là Opus 5. Đó là mức độ tôi hài lòng với cách nó vận hành.

Cảm giác như cuối cùng họ đã giải quyết được vấn đề 'trôi' (drifting) trong các cuộc hội thoại dài.

Nút gạt adaptive thinking là tính năng bị đánh giá thấp nhất năm 2026.

Đó là Opus 4.6, cá nhân tôi hào hứng hơn vì tôi luôn sử dụng các dòng Opus model.

Nó cung cấp cho tôi tất cả các quyền kiểm soát tuyệt vời này... Đây là kết quả tốt nhất cho việc này từ trước đến nay với một khoảng cách rất lớn.

Chỉ với một prompt... nó đã tạo ra một trò chơi đầy đủ chức năng mà tôi thấy có thể phát hành trực tiếp trên Steam.

Cách nó gọi các công cụ giờ đây đáng tin cậy hơn nhiều, không còn tình trạng hallucinate các đối số.

Đối với các dự án coding nặng, model này đã chính thức thay thế hoàn toàn thiết lập cũ của tôi.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Claude Opus 4.6

Meo chuyen gia giup ban tan dung toi da Claude Opus 4.6 va dat ket qua tot hon.

Tận dụng Adaptive Thinking

Sử dụng tham số thinking để chuyển đổi giữa các mức độ nỗ lực nhằm cân bằng chi phí và chiều sâu nhận thức cho các tác vụ khác nhau.

Context Compaction

Đối với các tác vụ agentic chạy trong thời gian dài, hãy bật tính năng context compaction bản beta để duy trì hiệu suất mà không vượt quá giới hạn token.

Sử dụng MCP Tools

Kết hợp Opus 4.6 với Model Context Protocol để cung cấp cho model quyền truy cập an toàn vào hệ thống tệp cục bộ và cơ sở dữ liệu.

Ứng dụng phức tạp One-Shot

Cung cấp một system prompt toàn diện; Opus 4.6 có khả năng tạo chính xác các tệp tin hơn 1.000 dòng code chỉ trong một lần thực hiện.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M

Cau hoi thuong gap ve Claude Opus 4.6

Tim cau tra loi cho cac cau hoi thuong gap ve Claude Opus 4.6