anthropic

Claude Sonnet 4.5

Claude Sonnet 4.5 của Anthropic mang đến khả năng lập trình dẫn đầu thế giới (77,2% trên SWE-bench) và context window 200K, được tối ưu hóa cho thế hệ AI tự...

AI CodingAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude29 tháng 9, 2025
Ngu canh
200Ktoken
Dau ra toi da
64Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
83%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude Sonnet 4.5 dat 83% trong benchmark nay.
HLE
34%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Claude Sonnet 4.5 dat 34% trong benchmark nay.
MMLU
89%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude Sonnet 4.5 dat 89% trong benchmark nay.
MMLU Pro
78%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude Sonnet 4.5 dat 78% trong benchmark nay.
SimpleQA
52%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Claude Sonnet 4.5 dat 52% trong benchmark nay.
IFEval
88%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude Sonnet 4.5 dat 88% trong benchmark nay.
AIME 2025
87%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude Sonnet 4.5 dat 87% trong benchmark nay.
MATH
87%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude Sonnet 4.5 dat 87% trong benchmark nay.
GSM8k
98%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude Sonnet 4.5 dat 98% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude Sonnet 4.5 dat 92% trong benchmark nay.
MathVista
72%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude Sonnet 4.5 dat 72% trong benchmark nay.
SWE-Bench
77%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude Sonnet 4.5 dat 77% trong benchmark nay.
HumanEval
94%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude Sonnet 4.5 dat 94% trong benchmark nay.
LiveCodeBench
68%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude Sonnet 4.5 dat 68% trong benchmark nay.
MMMU
78%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude Sonnet 4.5 dat 78% trong benchmark nay.
MMMU Pro
55%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude Sonnet 4.5 dat 55% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude Sonnet 4.5 dat 89% trong benchmark nay.
DocVQA
92%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude Sonnet 4.5 dat 92% trong benchmark nay.
Terminal-Bench
50%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude Sonnet 4.5 dat 50% trong benchmark nay.
ARC-AGI
14%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude Sonnet 4.5 dat 14% trong benchmark nay.

Ve Claude Sonnet 4.5

Tim hieu ve kha nang cua Claude Sonnet 4.5, tinh nang va cach no co the giup ban dat ket qua tot hon.

**Biên giới của trí tuệ Agentic**

Claude 4.5 Sonnet đại diện cho bước tiến lớn trong trí tuệ biên giới, được tối ưu hóa cho kỷ nguyên AI agents tự chủ. Ra mắt vào cuối năm 2025, đây là mô hình hybrid reasoning cho phép các nhà phát triển chuyển đổi giữa thực thi tốc độ cao cho các tác vụ thường lệ và suy nghĩ mở rộng (extended thinking) cho các thách thức logic phức tạp. Nó dẫn đầu các benchmark về computer use và điều phối công cụ, trở thành engine ưu tiên cho các agent dựa trên terminal và kỹ thuật phần mềm đa file.

**Độ chính xác và giảm thiểu ảo tưởng**

Kiến trúc mô hình ưu tiên tính logic và độ chính xác, giảm thiểu sự nịnh hót và ảo tưởng (hallucinations) từng thấy ở các dòng trước. Với giới hạn output 64.000 tokenscửa sổ input 200.000 tokens, nó có thể xử lý toàn bộ kho lưu trữ code trong khi tạo ra các file ứng dụng đầy đủ trong một lần chạy. Nó giới thiệu các điểm kiểm tra gốc cho quy trình làm việc agentic, cho phép các hệ thống tự động quay lại và sửa lỗi mà không cần sự can thiệp của con người.

**Sức mạnh Multimodal và Reasoning**

Ngoài việc phát triển phần mềm, Sonnet 4.5 còn xuất sắc trong việc phân tích tài liệu multimodal và mô hình hóa tài chính. Logic nội bộ của nó ưu tiên context kiến trúc, cho phép lập bản đồ các hệ thống quy mô lớn hiệu quả hơn so với những người tiền nhiệm. Cho dù là xử lý các ghi chú viết tay hay thực hiện tích hợp API, mô hình vẫn duy trì độ chính xác thực tế cao và tuân thủ chỉ dẫn nghiêm ngặt trong các tác vụ dài hạn.

Claude Sonnet 4.5

Truong hop su dung cho Claude Sonnet 4.5

Kham pha cac cach khac nhau ban co the su dung Claude Sonnet 4.5 de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự chủ

Quản lý quy trình phát triển từ yêu cầu ban đầu đến commit tự động thông qua giao diện terminal.

Tự động hóa dựa trên GUI

Tự động hóa duyệt web và nhập liệu vào các ứng dụng legacy bằng khả năng computer use gốc.

Điều phối đa agent

Ủy quyền các tác vụ chuyên biệt cho các sub-agent như người đánh giá và người xây dựng trong vòng lặp lập kế hoạch tập trung.

Tái cấu trúc code phức tạp

Tái kiến trúc các codebase nhiều file trong khi vẫn duy trì tính nhất quán trên 200.000 tokens của context đang hoạt động.

Phân tích tài chính chuyên sâu

Phân tích báo cáo hàng quý và bảng tính bằng thị giác để xác định các sai lệch và thông tin chi tiết về đầu tư.

Trực quan hóa dữ liệu tương tác

Tạo biểu đồ động từ các tập dữ liệu phức tạp bằng cách thực thi code nhúng và xây dựng thời gian thực.

Diem manh

Han che

Native Computer Use: Mô hình tương tác với hệ điều hành thông qua di chuyển con trỏ và thao tác GUI với độ chính xác 61,4%.
Không có đầu vào âm thanh gốc: Mô hình không thể xử lý trực tiếp các file âm thanh như một modality gốc và cần các công cụ chuyển đổi giọng nói thành văn bản bên ngoài.
Hiệu suất lập trình đỉnh cao: Đạt 77,2% trên SWE-bench Verified, dẫn đầu tất cả các mô hình khác trong việc giải quyết các issue trên GitHub.
Chi phí reasoning token: Các tokens được sử dụng trong quá trình extended thinking nội bộ được tính là output tokens, làm tăng chi phí cho các truy vấn phức tạp.
Chu kỳ tác vụ 30 giờ: Kiến trúc cho phép 30 giờ làm việc tự chủ liên tục trong khi vẫn duy trì trạng thái và sự tập trung.
Độ trễ trong Thinking Mode: Khi bật extended thinking, mô hình có thể mất vài phút để xử lý các kế hoạch kiến trúc phức tạp.
Giới hạn output 64K: Dung lượng output khổng lồ cho phép tạo ra toàn bộ kiến trúc ứng dụng trong một lần gọi API.
Biến động trong toán học thi đấu: Mặc dù dẫn đầu về lập trình, nhưng thỉnh thoảng nó vẫn chậm hơn các mô hình reasoning chuyên biệt trong các benchmark lập trình thi đấu cụ thể.

Bat dau nhanh API

anthropic/claude-4-5-sonnet

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude Sonnet 4.5

Xem cong dong nghi gi ve Claude Sonnet 4.5

Claude 4.5 Sonnet hiện đã có sẵn ở mọi nơi, mô hình lập trình tốt nhất thế giới.
ClaudeOfficial
reddit
Điều này khắc phục một trong những vấn đề mở rộng đau đầu nhất với các thiết lập MCP. Tôi từng thấy context bốc hơi trước khi bất kỳ công việc thực sự nào bắt đầu.
Simon Willison
twitter
Claude Code-Sonnet 4.5 vượt xa Gemini 3.0 Pro đối với các tác vụ tái cấu trúc Docker hóa phức tạp.
Comfortable-Friend96
reddit
Quy luật: Sai lầm trở thành tài liệu. Bạn chỉ cần thêm quy tắc vào CLAUDE.md và nó sẽ không bao giờ xảy ra lần nữa.
Boris Cherny
twitter
Chế độ hybrid reasoning là cứu cánh để debug các logic async phức tạp nơi mà các mô hình thông thường chỉ bị lặp.
AsyncDev
hackernews
Sự ngang bằng về giá với 3.5 Sonnet giúp đây trở thành bản nâng cấp dễ dàng cho tất cả các quy trình agent sản xuất của chúng tôi.
StartupFounder2025
reddit

Video ve Claude Sonnet 4.5

Xem huong dan, danh gia va thao luan ve Claude Sonnet 4.5

Mô hình 4.5 Sonnet mới này đang vượt trội hơn cả Opus 4.1 trên bài kiểm tra Swaybench verified

Nó có khả năng duy trì sự tập trung trong hơn 30 giờ cho các tác vụ phức tạp gồm nhiều bước

Nó dẫn đầu về benchmark computer use OS world với điểm số 61,4 phần trăm

Công cụ reasoning nội bộ xử lý các môi trường Python ổn định hơn nhiều so với bản 3.5

Tích hợp terminal có cảm giác chặt chẽ hơn nhiều với gần như không có lệnh shell bị ảo tưởng

Sonnet 4.5 hiện đang dẫn đầu trong việc sử dụng công cụ agentic... bước nhảy vọt 20%, thực sự rất thú vị

Claude code với Sonnet 4.5 đã hoàn thành toàn bộ quá trình triển khai Stripe trong 15 phút

Claude Sonnet 4.5 nhanh hơn đáng kể và tốt hơn một cách rõ rệt

Nút chuyển đổi thinking cho phép bạn phân bổ nhiều compute hơn cho các khối code cụ thể

Nó giữ context hoàn hảo ngay cả khi bạn đang xử lý sâu 150.000 tokens trong một dự án khổng lồ

Đây là mô hình hoạt động tốt nhất từ trước đến nay khi điều khiển máy tính của bạn

Tỷ lệ lỗi khi lập trình giảm từ 9% xuống gần như bằng không

Claude imagine có lẽ là tính năng thú vị nhất... trải nghiệm xây dựng ứng dụng thời gian thực

Tích hợp MCP cho phép nó tìm kiếm công cụ mà không làm tiêu tốn context của prompt

Độ trễ vision giảm đáng kể khi phân tích các bố cục UI phức tạp

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Claude Sonnet 4.5

Meo chuyen gia giup ban tan dung toi da Claude Sonnet 4.5 va dat ket qua tot hon.

Bật tính năng tìm kiếm công cụ MCP

Sử dụng Model Context Protocol Tool Search để giảm 85% mức sử dụng context và dành chỗ cho các file đang hoạt động.

Tận dụng các điểm kiểm tra agentic

Sử dụng lệnh /checkpoint trong giao diện terminal để lưu tiến trình trước các thay đổi lớn, cho phép khôi phục tức thì.

Quản lý ngân sách context

Xóa lịch sử giữa các tác vụ không liên quan để tránh làm loãng context và duy trì độ chính xác logic cao.

Hệ thống phân cấp system prompt

Xác định persona của mô hình và các ràng buộc output nghiêm ngặt trong một file cấu hình chuyên dụng để đảm bảo tính nhất quán giữa các agent.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Cau hoi thuong gap ve Claude Sonnet 4.5

Tim cau tra loi cho cac cau hoi thuong gap ve Claude Sonnet 4.5