anthropic

Claude Sonnet 4.5

Claude Sonnet 4.5 của Anthropic mang đến khả năng coding hàng đầu thế giới (77,2% SWE-bench) và context window 200K, được tối ưu hóa cho thế hệ agent tự chủ...

Lập trình AIAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
Ngu canh
200Ktoken
Dau ra toi da
64Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
83%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude Sonnet 4.5 dat 83% trong benchmark nay.
HLE
34%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Claude Sonnet 4.5 dat 34% trong benchmark nay.
MMLU
89%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude Sonnet 4.5 dat 89% trong benchmark nay.
MMLU Pro
78%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude Sonnet 4.5 dat 78% trong benchmark nay.
SimpleQA
52%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Claude Sonnet 4.5 dat 52% trong benchmark nay.
IFEval
88%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude Sonnet 4.5 dat 88% trong benchmark nay.
AIME 2025
87%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude Sonnet 4.5 dat 87% trong benchmark nay.
MATH
87%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude Sonnet 4.5 dat 87% trong benchmark nay.
GSM8k
98%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude Sonnet 4.5 dat 98% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude Sonnet 4.5 dat 92% trong benchmark nay.
MathVista
72%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude Sonnet 4.5 dat 72% trong benchmark nay.
SWE-Bench
77%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude Sonnet 4.5 dat 77% trong benchmark nay.
HumanEval
94%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude Sonnet 4.5 dat 94% trong benchmark nay.
LiveCodeBench
68%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude Sonnet 4.5 dat 68% trong benchmark nay.
MMMU
78%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude Sonnet 4.5 dat 78% trong benchmark nay.
MMMU Pro
55%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude Sonnet 4.5 dat 55% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude Sonnet 4.5 dat 89% trong benchmark nay.
DocVQA
92%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude Sonnet 4.5 dat 92% trong benchmark nay.
Terminal-Bench
50%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude Sonnet 4.5 dat 50% trong benchmark nay.
ARC-AGI
14%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude Sonnet 4.5 dat 14% trong benchmark nay.

Thu Claude Sonnet 4.5 mien phi

Tro chuyen voi Claude Sonnet 4.5 mien phi. Kiem tra kha nang, dat cau hoi va kham pha nhung gi mo hinh AI nay co the lam.

Prompt
Phan hoi
Claude Sonnet 4.5

Phan hoi AI cua ban se xuat hien tai day

Ve Claude Sonnet 4.5

Tim hieu ve kha nang cua Claude Sonnet 4.5, tinh nang va cach no co the giup ban dat ket qua tot hon.

**Ranh giới của Agentic Intelligence**

Claude Sonnet 4.5 đại diện cho bước nhảy vọt đáng kể nhất của Anthropic trong lĩnh vực "frontier intelligence", được tối ưu hóa đặc biệt cho kỷ nguyên của các AI agent tự chủ. Được phát hành vào cuối năm 2025, đây là model "hybrid reasoning" thực thụ đầu tiên của ngành, cho phép các nhà phát triển chuyển đổi giữa thực thi tốc độ cao cho các tác vụ thông thường và suy nghĩ mở rộng cho các thử thách logic phức tạp. Nó đã làm lu mờ đáng kể các benchmark trước đó về khả năng sử dụng máy tính và điều phối công cụ, trở thành engine ưa thích cho các agent dựa trên terminal và kỹ thuật phần mềm đa file.

**Độ chính xác và giảm thiểu ảo giác**

Model được xây dựng trên một kiến trúc ưu tiên logic "cẩn tắc vô ưu", giảm đáng kể sự nịnh bợ và ảo giác đã từng thấy trong dòng 3.5. Với giới hạn output khổng lồ 64.000 tokencontext window đầu vào 200.000 token, nó có thể tiếp nhận toàn bộ repository trong khi tạo ra các file ứng dụng có độ dài đầy đủ chỉ trong một lần xử lý. Nó cũng giới thiệu các "checkpoints" gốc cho các workflow agentic, cho phép các agent tự quay lại và sửa lỗi của chính mình một cách tự chủ.

**Sức mạnh Multimodal và Reasoning**

Ngoài coding, Sonnet 4.5 chiếm ưu thế trong việc phân tích tài liệu multimodal và mô hình hóa tài chính phức tạp. Logic nội bộ của nó được huấn luyện để ưu tiên bối cảnh kiến trúc, cho phép nó lập bản đồ các codebase quy mô lớn tốt hơn bất kỳ phiên bản tiền nhiệm nào. Dù là xử lý ghi chú viết tay hay triển khai tích hợp Stripe toàn diện, Sonnet 4.5 vẫn duy trì mức độ chính xác thực tế và khả năng tuân thủ hướng dẫn cao.

Claude Sonnet 4.5

Truong hop su dung cho Claude Sonnet 4.5

Kham pha cac cach khac nhau ban co the su dung Claude Sonnet 4.5 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự chủ

Sử dụng Claude Sonnet 4.5 để điều hướng qua các codebase phức tạp, triển khai tính năng trên nhiều file và chạy test độc lập.

Agent sử dụng máy tính

Triển khai model để điều khiển máy tính để bàn và trình duyệt web nhằm trích xuất dữ liệu, điều hướng hệ thống cũ hoặc thực hiện các tác vụ hành chính lặp đi lặp lại.

Tìm kiếm Agentic cho doanh nghiệp

Điều phối các truy vấn tìm kiếm nhiều bước và tổng hợp thông tin rời rạc từ tài liệu nội bộ và web trực tiếp.

Mô hình tài chính phức tạp

Tận dụng điểm số AIME 87% của nó để thực hiện các suy luận logic chuyên sâu trên các báo cáo tài chính và dữ liệu thị trường.

Tinh chỉnh nội dung kỹ thuật

Chuyển đổi các yêu cầu cấp cao thành PRD chuyên nghiệp, đặc tả kỹ thuật và codebase sẵn sàng để sao chép.

Phân tích tài liệu Multimodal

Xử lý hàng nghìn trang biểu đồ, ghi chú viết tay và sơ đồ kỹ thuật với khả năng vision state-of-the-art.

Diem manh

Han che

Sức mạnh Agentic Coding: Hiện đang giữ kỷ lục thế giới trên SWE-bench Verified với tỷ lệ thành công 77,2% đối với các vấn đề thực tế trên GitHub.
Giới hạn sử dụng: Người dùng gói Professional thường phản hồi về việc nhanh chóng đạt giới hạn sử dụng hàng tuần trên gói Pro 20 USD/tháng.
Tốc độ đáng kinh ngạc: Hoạt động ở mức 40-60 tokens mỗi giây, nhanh hơn đáng kể so với các frontier model trước đó khi sử dụng tương tác.
Độ trễ tìm kiếm: Duyệt web agentic (BrowseComp) vẫn là một điểm yếu so với các model tìm kiếm chuyên dụng.
Linh hoạt Hybrid Reasoning: Model đầu tiên cân bằng hiệu quả giữa chế độ "chat nhanh" và "suy nghĩ mở rộng" cho các chuỗi logic phức tạp.
Lỗ hổng kiến thức ngách: Gặp khó khăn với các tác vụ visual chuyên biệt cao, chẳng hạn như xác định các kỹ thuật trượt ván cụ thể (độ chính xác 29% trên SkateBench).
Output window khổng lồ: Giới hạn output 64K token cho phép tạo toàn bộ các tính năng đa file chỉ trong một lần gọi API.
Chi phí Agentic: Chạy model tự chủ trong chế độ terminal có thể tiêu tốn 50-100 USD tiền tokens cho một phiên xây dựng ứng dụng phức tạp.

Bat dau nhanh API

anthropic/claude-sonnet-4.5

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude Sonnet 4.5

Xem cong dong nghi gi ve Claude Sonnet 4.5

"Claude Sonnet 4.5 là vị vua mới của coding AI... nó thực sự rất, rất hứa hẹn"
James Montemagno
youtube
"Sonnet 4.5 đang làm rất tốt... nó nhanh hơn nhiều và tốt hơn một cách rõ rệt"
Cole Medin
youtube
"Tôi bị choáng ngợp bởi Sonnet 4.5... model này đang thiết kế những trang web tuyệt đẹp"
Savage Reviews
youtube
"Agent chạy trên terminal giống như một 'lập trình viên sống trong terminal của bạn'... nó có thể đọc codebase và chạy test tự chủ"
DevUser_99
reddit
"Giá vẫn giữ nguyên như 3.5, nhưng tính năng 'Checkpoints' khiến nó đáng giá gấp 10 lần cho quy trình làm việc chuyên nghiệp"
AgentArchitect
x
"Với 77,2% trên SWE-bench, đây là model đầu tiên thực sự mang lại cảm giác như một Kỹ sư Cấp cao"
HackerNewsReader
hackernews

Video ve Claude Sonnet 4.5

Xem huong dan, danh gia va thao luan ve Claude Sonnet 4.5

Anthropic khẳng định đây là 'model code tốt nhất thế giới' với những cải tiến đáng kể về reasoning, toán học và khả năng sử dụng máy tính.

Trong khi GPT-5 có thể tốt hơn cho việc lập kế hoạch cấp cao, Claude 4.5 Sonnet hiện là model 'tuyệt vời nhất' để sử dụng cho việc triển khai.

Tốc độ thực sự đáng kinh ngạc, khiến trải nghiệm coding tương tác trở nên mượt mà hơn nhiều.

Nó xử lý việc chỉnh sửa đa file với mức độ chính xác mà chúng ta chưa từng thấy trước đây.

Việc giảm thiểu ảo giác khiến nó trở thành một đối tác đáng tin cậy cho code production.

Claude Sonnet 4.5 nhanh hơn rất nhiều và tốt hơn một lượng đáng kể so với GPT-5 Codex.

Nó đã hoàn thành toàn bộ việc triển khai Stripe trong 15 phút... nhanh hơn gấp hai lần so với Opus 4.1.

Khả năng tuân thủ các hướng dẫn gọi công cụ phức tạp chính là bí quyết thành công của nó.

Tôi thấy ít vấn đề về việc model 'nịnh bợ' – nơi model chỉ đơn thuần đồng ý với những ý tưởng tồi của tôi.

Đây là model đầu tiên tôi thực sự tin tưởng để chạy một agent dựa trên terminal mà không cần giám sát.

Đây là một trong những landing page tốt nhất, nếu không muốn nói là landing page TỐT NHẤT mà tôi từng thấy được tạo ra từ một prompt.

Nó là một con quái vật thực sự... nó đang thiết kế một số trang web tuyệt đẹp với code cực kỳ chất lượng.

Khả năng vision để diễn giải thiết kế UI đã được nâng cấp đáng kể.

Cảm giác như nó hiểu các yêu cầu về thẩm mỹ, chứ không chỉ là các yêu cầu kỹ thuật.

Sonnet 4.5 chính thức là benchmark mới cho kỹ thuật front-end sáng tạo.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep

Meo chuyen gia giup ban tan dung toi da mo hinh nay va dat ket qua tot hon.

Tận dụng CLAUDE.md

Sử dụng file CLAUDE.md ở thư mục gốc repository của bạn để cung cấp cho model các bản tóm tắt ngắn và gợi ý; điều này giúp giảm lãng phí token tới 30%.

Nút gạt Hybrid Reasoning

Chỉ sử dụng tham số 'thinking' trong các lần gọi API cho các tác vụ nặng về logic để tiết kiệm latency và chi phí trong các hoạt động thông thường.

Thư mục .claude/context

Tạo file .claude/context.md để lưu trữ các quyết định về kiến trúc; model được huấn luyện đặc biệt để ưu tiên đường dẫn này khi lập bản đồ codebase.

Prompt Caching

Kích hoạt prompt caching cho tài liệu tĩnh hoặc codebase lớn để tiết kiệm tới 90% chi phí input cho các truy vấn lặp lại.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Cau hoi thuong gap

Tim cau tra loi cho cac cau hoi thuong gap ve mo hinh nay