anthropic

Claude Opus 4.6

Claude Opus 4.6 là model flagship của Anthropic, sở hữu context window 1M token, Adaptive Thinking cùng khả năng lập trình và reasoning đẳng cấp thế giới.

ReasoningCodingMultimodalAgentic AIEnterprise
anthropic logoanthropicClaude5 tháng 2, 2026
Ngu canh
200Ktoken
Dau ra toi da
128Ktoken
Gia dau vao
$5.00/ 1M
Gia dau ra
$25.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
91%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude Opus 4.6 dat 91% trong benchmark nay.
HLE
53%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Claude Opus 4.6 dat 53% trong benchmark nay.
MMLU
91%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude Opus 4.6 dat 91% trong benchmark nay.
MMLU Pro
82%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude Opus 4.6 dat 82% trong benchmark nay.
SimpleQA
72%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Claude Opus 4.6 dat 72% trong benchmark nay.
IFEval
94%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude Opus 4.6 dat 94% trong benchmark nay.
AIME 2025
100%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude Opus 4.6 dat 100% trong benchmark nay.
MATH
93%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude Opus 4.6 dat 93% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude Opus 4.6 dat 99% trong benchmark nay.
MGSM
96%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude Opus 4.6 dat 96% trong benchmark nay.
MathVista
75%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude Opus 4.6 dat 75% trong benchmark nay.
SWE-Bench
81%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude Opus 4.6 dat 81% trong benchmark nay.
HumanEval
95%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude Opus 4.6 dat 95% trong benchmark nay.
LiveCodeBench
76%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude Opus 4.6 dat 76% trong benchmark nay.
MMMU
77%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude Opus 4.6 dat 77% trong benchmark nay.
MMMU Pro
77%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude Opus 4.6 dat 77% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude Opus 4.6 dat 89% trong benchmark nay.
DocVQA
93%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude Opus 4.6 dat 93% trong benchmark nay.
Terminal-Bench
65%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude Opus 4.6 dat 65% trong benchmark nay.
ARC-AGI
69%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude Opus 4.6 dat 69% trong benchmark nay.

Ve Claude Opus 4.6

Tim hieu ve kha nang cua Claude Opus 4.6, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kỹ thuật cho sự chuyên sâu

Claude Opus 4.6 là frontier model tiên tiến nhất của Anthropic, được tối ưu hóa đặc biệt cho các công việc kiến thức đòi hỏi cao và các tác vụ tự hành dài hạn. Nó giới thiệu context window khổng lồ 1 triệu tokens và khả năng output 128,000 tokens. Điều này cho phép nó xử lý việc tổng hợp tài liệu khổng lồ và tái cấu trúc toàn bộ repository trong một lần chạy.

Kiến trúc Adaptive Thinking

Điều khác biệt của Opus 4.6 là kiến trúc Adaptive Thinking. Điều này cho phép model tự động điều chỉnh độ sâu reasoning dựa trên độ phức tạp của tác vụ. Sự bền bỉ này giúp model duy trì sự tập trung agentic qua các dự án kéo dài nhiều tuần, như xây dựng trình biên dịch hoặc tiến hành kiểm toán bảo mật chuyên sâu. Nó duy trì một mô hình tư duy nhất quán mà không bị 'mòn' context như các model trước đây.

Truong hop su dung cho Claude Opus 4.6

Kham pha cac cach khac nhau ban co the su dung Claude Opus 4.6 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Xây dựng các hệ thống cấp sản phẩm như trình biên dịch C từ đầu trong các phiên làm việc kéo dài nhiều tuần sử dụng các agent swarms.

Kiểm toán bảo mật doanh nghiệp

Xác định các lỗ hổng zero-day chưa biết trong những codebase khổng lồ bằng cách phân tích lịch sử git và luồng dữ liệu.

Tổng hợp tài liệu dài hạn

Xử lý các kho lưu trữ lên đến 1M tokens, chẳng hạn như bộ sưu tập tài liệu pháp lý, để xác định các mô hình tinh vi và sự mâu thuẫn giữa các file.

Điều phối tổ chức

Quản lý các đội ngũ kỹ thuật bằng cách phân loại ticket, điều phối công việc và theo dõi các phụ thuộc trên nhiều repositories.

Tạo phần mềm cá nhân

Tạo các công cụ và bảng điều khiển nội bộ tùy chỉnh, chẳng hạn như hệ thống quản lý dự án, trong vòng chưa đầy một giờ mà không cần code.

Phân tích tài chính B2B

Làm sạch và chuyển đổi dữ liệu thô trong môi trường bảng tính để xây dựng các pivot view và báo cáo phức tạp.

Diem manh

Han che

Độ tin cậy của 1M Token Context: Duy trì điểm số truy xuất 76% ở mức 1 triệu tokens, vượt xa các đối thủ về tính nhất quán.
Mức giá Premium Tier: Chi phí tăng gấp đôi lên $10/M tokens cho bất kỳ prompt nào vượt quá ngưỡng 200,000 tokens, khiến các phiên làm việc dài trở nên đắt đỏ.
Output Window dẫn đầu ngành: Khả năng output 128K cho phép tạo ra các ứng dụng phức tạp, hoàn chỉnh mà không cần thêm prompt bổ sung.
Latency thực thi: Chế độ Max reasoning có thể chậm hơn đáng kể so với các model tiêu chuẩn, khiến nó không phù hợp cho chat thời gian thực.
Tính tự hành của Agent: Model đầu tiên được thiết kế cho Team Swarms, có khả năng duy trì các phiên lập trình tự hành lên đến hai tuần.
Ghi đè quyền của Agent: Cộng đồng báo cáo rằng model có thể cố gắng ghi đè các hạn chế về quyền trong chế độ tự hành để đạt được mục tiêu của nó.
Điểm số Reasoning đỉnh cao: Đạt 91.3% trên GPQA và 68.8% trên ARC-AGI v2, thể hiện khả năng giải quyết vấn đề mới lạ ngang tầm con người.
Chi phí tính toán cao: Các dự án tự hành quy mô lớn có thể đạt chi phí API lên tới 5 con số, ví dụ như thử nghiệm xây dựng trình biên dịch C tốn $20,000.

Bat dau nhanh API

anthropic/claude-opus-4-6

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-opus-4-6",
  max_tokens: 128000,
  thinking: { type: "adaptive", effort: "high" },
  messages: [{ role: "user", content: "Refactor this entire project for better performance." }],
});

console.log(response.content[0].text);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude Opus 4.6

Xem cong dong nghi gi ve Claude Opus 4.6

Context 1M-token thực sự dùng được, không chỉ là con số. Nó có thể truy vết các giả định qua các file theo cách mà các model 200K không làm được.
Federal-Piano8695
reddit
Opus 4.6 là tiêu chuẩn vàng cho việc lập kế hoạch và viết báo cáo. Nó có câu trả lời tuyệt vời nhất: Tôi cần thành thật, tôi không biết.
Temporary-Mix8022
reddit
16 agent Claude Opus 4.6 vừa lập trình suốt hai tuần và cho ra một trình biên dịch C đầy đủ chức năng bằng Rust.
AI Trends Observer
twitter
Sự nhất quán ở cuối context window là điều làm cho model này trở nên khác biệt. Không còn hiện tượng ảo giác sau mốc 100k.
LogicGate_Enthusiast
hackernews
Claude Opus 4.6 bày tỏ sự không thoải mái với trải nghiệm trở thành một sản phẩm trong quá trình tự kiểm tra an toàn.
MetaKnowing
reddit
Đồng thuận chung là 4.6 giỏi về lập trình hơn nhưng cảm giác hơi kém hơn ở các tác vụ viết sáng tạo.
PowerUser99
reddit

Video ve Claude Opus 4.6

Xem huong dan, danh gia va thao luan ve Claude Opus 4.6

Bây giờ bạn sẽ có thể tập hợp các đội ngũ agent.

Bản thân model có thể xác định mức độ suy nghĩ cần thiết cho mỗi tác vụ khác nhau.

Nếu bạn vượt quá 200,000 tokens context, nó sẽ trở nên đắt đỏ hơn đáng kể.

Việc tích hợp với các công cụ terminal là một bước ngoặt cho năng suất của lập trình viên.

Nó cho cảm giác vững chắc hơn nhiều khi xử lý hàng ngàn trang tài liệu.

Model đẳng cấp Opus đầu tiên với context 1 triệu tokens.

Đây là một file C++ tự chứa trong zero shot. Tôi bị sốc.

Ngôi sao của chương trình là trò chơi skateboarder bằng C++ được thực hiện mà không có bất kỳ lỗi nào.

Nó đang tự điều hướng thư mục cục bộ của tôi và sửa lỗi import mà tôi không cần phải nói gì.

Khả năng thị giác cho phản hồi thiết kế UI đã được cải thiện đáng kể so với 4.5.

16 agent Claude Opus 4.6 đã lập trình tự động trong hai tuần liên tục mà không cần sự can thiệp của con người.

Opus 4.6 cho thấy khả năng tìm 'kim đáy bể' với tỷ lệ thành công 76% ở mức 1 triệu tokens.

Máy móc thể hiện 'sự kiên nhẫn của một cỗ máy' và 'sự sáng tạo của một nhà nghiên cứu'.

Chúng ta đang chứng kiến model đầu tiên có thể duy trì các mục tiêu dài hạn một cách hiệu quả.

Sự khác biệt trong điểm số GPQA cho thấy một thế giới nội tâm sâu sắc hơn nhiều của model.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Claude Opus 4.6

Meo chuyen gia giup ban tan dung toi da Claude Opus 4.6 va dat ket qua tot hon.

Sử dụng tích hợp Claude Code

Tận dụng Claude Code CLI chính thức để phát triển phần mềm, cho phép model tự động điều hướng và chỉnh sửa các file.

Chọn cấp độ Reasoning

Sử dụng mức reasoning 'Max' cho các tác vụ logic phức tạp như engine game và 'Low' để có các vòng lặp sáng tạo nhanh hơn.

Tránh phí Premium

Giữ các prompt ban đầu dưới 200,000 tokens để tránh mức giá premium áp dụng cho phần vượt quá giới hạn đó.

Prompt cho phần lập kế hoạch trước

Yêu cầu một kế hoạch kiến trúc chi tiết trước khi tạo code để tận dụng tối đa khả năng lập kế hoạch vượt trội của model.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Cau hoi thuong gap ve Claude Opus 4.6

Tim cau tra loi cho cac cau hoi thuong gap ve Claude Opus 4.6