anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 cung cấp hiệu suất frontier model cho lập trình và Computer Use với context window 1M token khổng lồ chỉ với giá $3/1M token.

AI AgenticMultimodalLập trìnhComputer UseLong Context
anthropic logoanthropicClaudeNgày 17 tháng 2 năm 2026
Ngu canh
1.0Mtoken
Dau ra toi da
64Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
89.9%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude Sonnet 4.6 dat 89.9% trong benchmark nay.
HLE
49%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Claude Sonnet 4.6 dat 49% trong benchmark nay.
MMLU
89.3%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude Sonnet 4.6 dat 89.3% trong benchmark nay.
MMLU Pro
79.2%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude Sonnet 4.6 dat 79.2% trong benchmark nay.
SimpleQA
48.5%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Claude Sonnet 4.6 dat 48.5% trong benchmark nay.
IFEval
89.5%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude Sonnet 4.6 dat 89.5% trong benchmark nay.
AIME 2025
83%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude Sonnet 4.6 dat 83% trong benchmark nay.
MATH
85.3%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude Sonnet 4.6 dat 85.3% trong benchmark nay.
GSM8k
96.4%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude Sonnet 4.6 dat 96.4% trong benchmark nay.
MGSM
92.8%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude Sonnet 4.6 dat 92.8% trong benchmark nay.
MathVista
68.7%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude Sonnet 4.6 dat 68.7% trong benchmark nay.
SWE-Bench
79.6%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude Sonnet 4.6 dat 79.6% trong benchmark nay.
HumanEval
92.1%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude Sonnet 4.6 dat 92.1% trong benchmark nay.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude Sonnet 4.6 dat 72.4% trong benchmark nay.
MMMU
74.2%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude Sonnet 4.6 dat 74.2% trong benchmark nay.
MMMU Pro
75.6%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude Sonnet 4.6 dat 75.6% trong benchmark nay.
ChartQA
88.1%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude Sonnet 4.6 dat 88.1% trong benchmark nay.
DocVQA
93.4%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude Sonnet 4.6 dat 93.4% trong benchmark nay.
Terminal-Bench
59.1%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude Sonnet 4.6 dat 59.1% trong benchmark nay.
ARC-AGI
58.3%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude Sonnet 4.6 dat 58.3% trong benchmark nay.

Ve Claude Sonnet 4.6

Tim hieu ve kha nang cua Claude Sonnet 4.6, tinh nang va cach no co the giup ban dat ket qua tot hon.

**Một bước nhảy vọt mang tính thế hệ về trí tuệ**

Claude Sonnet 4.6 là model mạnh mẽ và linh hoạt nhất của Anthropic tính đến nay, được thiết kế để trở thành công cụ chủ lực hiệu suất cao cho các quy trình làm việc phức tạp của doanh nghiệp và nhà phát triển. Được phát hành vào ngày 17 tháng 2 năm 2026, nó đại diện cho một bước nhảy vọt lớn so với dòng 4.5, giới thiệu khả năng Computer Use cấp độ con người và một context window 1 triệu token khổng lồ ở phiên bản beta. Model này được tối ưu hóa cho các tác vụ agentic, nghĩa là nó không chỉ xử lý văn bản mà còn có thể tự chủ lập kế hoạch và thực hiện các thao tác đa bước trên nhiều môi trường phần mềm khác nhau.

**Sự tinh vi về kỹ thuật và Multimodal**

Về mặt kỹ thuật, Sonnet 4.6 thu hẹp khoảng cách giữa tốc độ của các model tầm trung và khả năng reasoning sâu của dòng Opus. Nó có tính năng Adaptive Thinking, cho phép nó mở rộng nỗ lực reasoning nội bộ dựa trên độ phức tạp của tác vụ. Model này đã trở thành lựa chọn mặc định mới cho người dùng Claude gói Miễn phí và Pro, cung cấp trí tuệ cấp flagship trong lập trình, phân tích tài chính và thấu hiểu tài liệu. Đây là model multimodal bản địa thực thụ, hỗ trợ đầu vào văn bản, hình ảnh, âm thanh và video để xử lý nhiều tác vụ phương tiện với độ chính xác state-of-the-art.

**Tiêu chuẩn ngành mới cho các Agent**

Với tỷ lệ hiệu suất trên chi phí vượt trội, Sonnet 4.6 được định vị là động cơ chính cho các AI agent. Nó đạt được điểm số dẫn đầu ngành trên SWE-bench Verified (79.6%)OSWorld-Verified (72.5%), chứng minh khả năng vượt trội trong việc giải quyết các vấn đề kỹ thuật phần mềm thực tế và các tác vụ hệ điều hành phức tạp. Bằng cách cung cấp trí tuệ gần mức Opus với chi phí chỉ bằng một phần nhỏ, nó trao quyền cho các nhà phát triển xây dựng các hệ thống tự chủ mà trước đây vốn bị hạn chế về mặt tính toán hoặc tài chính.

Claude Sonnet 4.6

Truong hop su dung cho Claude Sonnet 4.6

Kham pha cac cach khac nhau ban co the su dung Claude Sonnet 4.6 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự chủ

Sử dụng Claude Code để tái cấu trúc toàn bộ kho lưu trữ và triển khai các tính năng phức tạp với ngữ cảnh trên toàn bộ repository.

Computer Use cấp độ con người

Tự động hóa các phần mềm cũ và quy trình làm việc trên web bằng cách quan sát màn hình và tương tác qua chuột và bàn phím ảo.

Thấu hiểu tài liệu tài chính

Phân tích hàng ngàn trang hồ sơ và bảng biểu để thực hiện reasoning qua các chiến lược đầu tư hoặc rủi ro phức tạp.

Mô phỏng kinh doanh thời gian thực

Chạy các mô phỏng agentic nơi model quản lý một doanh nghiệp ảo và tối ưu hóa lợi nhuận.

Soạn thảo kỹ thuật đa ngôn ngữ

Tạo tài liệu kỹ thuật bằng hàng chục ngôn ngữ trong khi vẫn duy trì sự tuân thủ hoàn hảo các thông số kỹ thuật kiến trúc.

Tạo giao diện Frontend UI/UX

Tạo ra các giao diện bảng điều khiển hiện đại, trau chuốt với sự tập trung vào kiểu chữ, lý thuyết màu sắc và bố cục đáp ứng (responsive layout).

Diem manh

Han che

Dẫn đầu ngành về Lập trình: Đạt mức điểm state-of-the-art 79.6% trên SWE-bench Verified, vượt qua các đối thủ cạnh tranh trong việc giải quyết các vấn đề thực tế trên GitHub.
Độ trễ trong chế độ Thinking: Ngân sách thinking tokens cao làm tăng thời gian phản hồi token đầu tiên (time-to-first-token), khiến nó ít lý tưởng hơn cho chat thời gian thực tức thì.
Tỷ lệ Hiệu suất trên Chi phí tối ưu: Mang lại mức trí tuệ gần tương đương Opus với chi phí thấp hơn 5 lần, khiến nó trở thành lựa chọn kinh tế nhất cho các hệ thống tự động hóa lớn.
Rào cản về Rate Limiting: Người dùng gói Miễn phí và Pro gặp phải giới hạn tin nhắn nghiêm ngặt trong các phiên làm việc cường độ cao, buộc phải chuyển sang sử dụng API.
Điều hướng máy tính cấp độ con người: Đạt 72.5% trên OSWorld-Verified, cho thấy sự cải thiện vượt bậc trong việc điều hướng các phần mềm phức tạp mà không cần API.
Suy giảm ngữ cảnh trên 150k tokens: Bất chấp context window 1M, model thỉnh thoảng vẫn có thể mất đi các chi tiết cụ thể nằm ở giữa các prompt cực lớn.
Khả năng Reasoning thích ứng: Cung cấp chế độ Thinking có khả năng mở rộng, cho phép các nhà phát triển tăng cường nỗ lực reasoning cho các bài toán logic khó.
Lỗ hổng Prompt Injection: Tính năng Computer Use tiềm ẩn rủi ro khi các trang web độc hại có thể cố gắng chiếm quyền điều khiển phiên trình duyệt ảo của model.

Bat dau nhanh API

anthropic/claude-sonnet-4-6

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude Sonnet 4.6

Xem cong dong nghi gi ve Claude Sonnet 4.6

Claude Sonnet 4.6 đạt 94% trên benchmark bảo hiểm của chúng tôi, khiến nó trở thành model đạt hiệu suất cao nhất mà chúng tôi từng thử nghiệm cho Computer Use.
Swami Sivasubramanian
twitter
Sự phấn khích là có thật, đây chắc chắn là LLM tốt nhất (và thú vị nhất) mà tôi từng sử dụng! Vượt xa những gì tôi từng thấy cho đến nay.
WolframRavenwolf
reddit
Claude Sonnet 4.6 cực kỳ hài hước, không chỉ đơn thuần là 'thỉnh thoảng vui vẻ'. Nó rất nồng nhiệt, trung thực và hướng thiện.
Anton P.
twitter
Sonnet 4.6 tốt hơn nhiều so với Cline cho các tác vụ lập trình. Tôi thậm chí không còn tự mở tệp thủ công nữa.
semibaron
hackernews
context window 1M là một bước ngoặt cho việc di chuyển mã nguồn. Tôi vừa tải lên toàn bộ stack cũ của mình.
DevOpsDan
reddit
Nó xử lý các bảng tính phức tạp và biểu mẫu web với độ chính xác kinh ngạc. Bản beta Computer Use cuối cùng đã sẵn sàng.
AI_Insights_Daily
youtube

Video ve Claude Sonnet 4.6

Xem huong dan, danh gia va thao luan ve Claude Sonnet 4.6

Sonnet 4.6 đạt điểm cao hơn trên GDP val, thước đo các tác vụ có ý nghĩa trong thế giới thực.

Ngày càng khó để biết liệu các model này có khả năng thực hiện những thứ liên quan đến CBRN hay không.

Tỷ lệ giữa tốc độ và trí tuệ ở đây về cơ bản là không có đối thủ bởi bất kỳ model nào khác trên thị trường.

Anthropic rõ ràng đang tập trung vào khía cạnh agentic với bản phát hành này.

Cấu trúc chi phí biến đây thành lựa chọn mặc định mới cho bất kỳ nhà phát triển API lưu lượng cao nào.

model này nhanh hơn khoảng gấp đôi so với model opus của tháng trước.

Tóm lại, model này là lựa chọn đáng đồng tiền bát gạo nhất cho lập trình doanh nghiệp.

Khả năng vision để diễn giải các sơ đồ kiến trúc phức tạp đã được cải thiện đáng kể.

Tôi đã đưa cho nó 50 tệp và nó đã tái cấu trúc toàn bộ logic định tuyến một cách hoàn hảo.

Cảm giác giao tiếp của nó giống con người hơn nhiều so với GPT-4o.

Nó thực sự đánh bại Opus 4.6 ở một số lĩnh vực trong khi mức giá rẻ hơn 40%.

Khi chúng ta làm đầy context window, một khi đạt đến khoảng 150.000 tokens, hiệu quả có xu hướng giảm xuống.

Tính năng reasoning thích ứng cho phép bạn về cơ bản là chuyển đổi giữa tốc độ và logic chuyên sâu.

Bản phát hành này mang lại cảm giác như là model 'agent-first' thực thụ đầu tiên từ Anthropic.

Tôi sẽ sử dụng nó cho mọi thứ, ngoại trừ có lẽ là những bài viết sáng tạo ở cấp độ cao nhất tuyệt đối.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Claude Sonnet 4.6

Meo chuyen gia giup ban tan dung toi da Claude Sonnet 4.6 va dat ket qua tot hon.

Tận dụng Context Compaction

Bật tính năng Compaction trong API để tự động tóm tắt lịch sử hội thoại cũ cho các phiên làm việc dài.

Sử dụng thinking tokens một cách chiến lược

Đối với toán học hoặc logic phức tạp, hãy thiết lập ngân sách cao hơn cho thinking tokens để model khám phá nhiều lộ trình reasoning khác nhau.

Prompt để tuân thủ SPEC

Yêu cầu model tuân thủ rõ ràng các thực hành kiến trúc hiện đại, vì nó có xu hướng tự nhiên tìm đến các công cụ đã được cập nhật.

Sử dụng Artifacts cho UI

Khuyến khích model sử dụng UI Artifacts để tách biệt phần tạo mã khỏi luồng chat nhằm mục đích lặp lại (iteration) trong thời gian thực.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Cau hoi thuong gap ve Claude Sonnet 4.6

Tim cau tra loi cho cac cau hoi thuong gap ve Claude Sonnet 4.6