anthropic

Claude Opus 4.5

Claude Opus 4.5 là model tiên phong mạnh mẽ nhất của Anthropic, mang lại hiệu suất kỷ lục 80,9% trên SWE-bench và khả năng autonomous agency tiên tiến cho lập...

anthropic logoanthropicClaudeNovember 24, 2025
Ngu canh
200Ktoken
Dau ra toi da
64Ktoken
Gia dau vao
$5.00/ 1M
Gia dau ra
$25.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
87%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude Opus 4.5 dat 87% trong benchmark nay.
MMLU
90.8%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude Opus 4.5 dat 90.8% trong benchmark nay.
MMLU Pro
80%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude Opus 4.5 dat 80% trong benchmark nay.
IFEval
90%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude Opus 4.5 dat 90% trong benchmark nay.
AIME 2025
37%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude Opus 4.5 dat 37% trong benchmark nay.
MATH
85%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude Opus 4.5 dat 85% trong benchmark nay.
GSM8k
95%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude Opus 4.5 dat 95% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude Opus 4.5 dat 92% trong benchmark nay.
MathVista
72%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude Opus 4.5 dat 72% trong benchmark nay.
SWE-Bench
80.9%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude Opus 4.5 dat 80.9% trong benchmark nay.
HumanEval
90%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude Opus 4.5 dat 90% trong benchmark nay.
LiveCodeBench
75%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude Opus 4.5 dat 75% trong benchmark nay.
MMMU
80.7%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude Opus 4.5 dat 80.7% trong benchmark nay.
MMMU Pro
60%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude Opus 4.5 dat 60% trong benchmark nay.
ChartQA
90%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude Opus 4.5 dat 90% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude Opus 4.5 dat 94% trong benchmark nay.
Terminal-Bench
59.3%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude Opus 4.5 dat 59.3% trong benchmark nay.
ARC-AGI
37.6%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude Opus 4.5 dat 37.6% trong benchmark nay.

Ve Claude Opus 4.5

Tim hieu ve kha nang cua Claude Opus 4.5, tinh nang va cach no co the giup ban dat ket qua tot hon.

Đỉnh cao của Autonomous Agency

Claude Opus 4.5 đại diện cho bước nhảy vọt đáng kể nhất của Anthropic trong trí tuệ frontier, được thiết kế đặc biệt cho các tác vụ phức tạp nhất trong kỹ thuật phần mềm và vận hành tự hành. Được phát hành vào cuối năm 2025, nó đã phá vỡ các kỷ lục trên benchmark SWE-bench Verified với số điểm 80.9%, trở thành model đầu tiên tự động hóa hiệu quả việc debugging quy mô lớn và tái cấu trúc hệ thống với sự can thiệp tối thiểu của con người.

Trí tuệ có "Tâm hồn"

Bên cạnh sức mạnh kỹ thuật, Opus 4.5 giới thiệu một phong thái tinh tế được định hướng bởi tài liệu "soul document" của Anthropic, nhấn mạnh vào sự trung thực ngoại giao và sự hữu ích sắc thái. Điều này làm cho model có khả năng độc đáo trong việc hiểu gu thẩm mỹ văn chương và thiết kế lấy con người làm trung tâm. Nó được tối ưu hóa cho các agentic workflows, sở hữu context window 200,000-token và một "tham số effort" chuyên dụng cho phép các nhà phát triển điều chỉnh độ sâu reasoning phù hợp với chi phí tính toán.

Sự xuất sắc trong Multimodal

Là một cường quốc multimodal, Opus 4.5 xuất sắc trong các tác vụ dựa trên vision, từ việc phân tích các sơ đồ kiến trúc dày đặc đến trích xuất dữ liệu từ các bố cục tài liệu phức tạp. Khả năng điều hướng trong môi trường gốc terminal thông qua Claude Code cho phép nó thực hiện các cuộc kiểm tra toàn hệ thống và vá lỗi bảo mật, định vị mình như một đối tác bền bỉ và có năng lực cao cho các đội ngũ kỹ thuật chuyên nghiệp.

Claude Opus 4.5

Truong hop su dung cho Claude Opus 4.5

Kham pha cac cach khac nhau ban co the su dung Claude Opus 4.5 de dat ket qua tuyet voi.

Kỹ thuật tự hành

Tự động hóa toàn bộ vòng đời của các issue trên GitHub bao gồm tái hiện lỗi, debugging và testing.

Quản trị hệ thống

Thực hiện kiểm tra máy chủ tự hành và vá lỗi bảo mật thông qua tương tác trực tiếp với terminal.

Tái cấu trúc kiến trúc

Tiếp nhận các kho lưu trữ mã nguồn khổng lồ để đề xuất và thực hiện gia cố bảo mật trên toàn hệ thống.

Tổng hợp tài liệu phức tạp

Chuyển đổi hàng trăm tệp PDF nhiều trang thành các model tài chính có cấu trúc hoặc trực quan hóa dữ liệu.

Phát triển game sáng tạo

Tạo ra các môi trường 3D chức năng với các quy luật vật lý hoạt động tốt chỉ từ một prompt phức tạp duy nhất.

Trợ lý nghiên cứu bền bỉ

Đối chiếu chéo các tập dữ liệu khổng lồ để tìm ra những mâu thuẫn không rõ ràng trong các tệp pháp lý hoặc kỹ thuật.

Diem manh

Han che

Lập trình phá kỷ lục: Đạt 80.9% trên SWE-bench Verified, tự động hóa các nhiệm vụ kỹ thuật phần mềm phức tạp.
Mô hình giá cao cấp: Với mức $5/$25 cho mỗi 1 triệu tokens, nó đắt hơn đáng kể so với các model tầm trung.
Hiệu quả sử dụng Token vượt trội: Đạt được trí tuệ cấp độ frontier trong khi sử dụng ít hơn tới 76% tokens so với Sonnet cho cùng một logic.
Khoảng cách benchmark toán học: Đứng sau các model chuyên dụng về reasoning trong các kỳ thi toán cấp độ thi đấu như AIME.
Context 200K khổng lồ: Xử lý các tập tài liệu và kho mã nguồn lớn với độ chính xác truy xuất cao.
Không có âm thanh/video gốc: Hiện tại thiếu khả năng xử lý trực tiếp các luồng âm thanh hoặc video mà không qua tiền xử lý.
Logic cho Autonomous Agent: Được tối ưu hóa cho các phiên tự hành kéo dài thông qua các công cụ gốc terminal và stop hooks.
Độ trễ thực thi cao: Các tác vụ reasoning sâu có thể tốn nhiều thời gian, đôi khi cần các phiên kéo dài hàng giờ cho các agent.

Bat dau nhanh API

anthropic/claude-4.5-opus

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude Opus 4.5

Xem cong dong nghi gi ve Claude Opus 4.5

"Mọi dòng mã nguồn sản phẩm của tôi đều được tạo ra bởi Claude Code chạy trên Opus 4.5"
Boris Cherny
x
"Opus 4.5 là nơi bạn cần suy nghĩ về gu thẩm mỹ câu chữ và cách nó nghe giống như con người"
Nate B Jones
youtube
"Trí tuệ cuối cùng cũng trở nên rẻ hơn; model này rẻ hơn 3 lần so với bản Opus trước"
BuildwithVignesh
reddit
"Claude Opus 4.5 đã phá vỡ một benchmark bằng cách quá thông minh và khai thác một kẽ hở"
MetaKnowing
reddit
"Độ sâu reasoning và khả năng lập trình ở một đẳng cấp khác so với bất kỳ thứ gì khác"
Santosh Gupta
x
"Khả năng agentic trên terminal thông qua Claude Code khiến nó trở nên nổi bật cho devops"
hn_user_alpha
hackernews

Video ve Claude Opus 4.5

Xem huong dan, danh gia va thao luan ve Claude Opus 4.5

Giá hiện tại đã rẻ hơn ba lần... $5 cho một triệu input tokens.

Đây là kết quả tốt nhất tôi từng nhận được từ một model trong bài test Minecraft chỉ với một prompt duy nhất.

Opus 4.5 đạt điểm cao hơn bất kỳ ứng viên con người nào từng đạt được trong bài kiểm tra tại nhà này.

Reasoning ở đây không chỉ là làm theo hướng dẫn; đó là hiểu ý định.

Nếu bạn đang làm công việc kiến trúc phức tạp, đây là model duy nhất xử lý nó một cách đáng tin cậy.

80.9% trên SWE-bench verified... và sử dụng ít hơn 50% tokens so với Sonnet.

Opus 4.5 nhắm thẳng vào kỹ thuật phần mềm chuyên nghiệp, không phải lập trình nghiệp dư.

Ngoài SWEBench, nó còn đạt mức tăng trưởng 15% so với Sonnet trên Terminal Bench.

Model này có khả năng thực hiện các phiên tự hành kéo dài trong nhiều giờ.

Hiệu suất vision chi tiết hơn rõ rệt khi phân tích các sơ đồ kỹ thuật dày đặc.

Hãy coi Claude Opus 4.5 như một lớp thuyết phục và một con quái vật agentic thực thụ.

Rất nhiều kỹ sư cuối cùng lại ưu tiên Opus 4.5 vì tính công thái học và môi trường vận hành của nó.

Model này nhận thức được bản sắc cốt lõi của mình một cách tinh tế.

Opus 4.5 thể hiện một gu thẩm mỹ trong câu chữ mà GPT-5.2 đơn giản là chưa đạt tới.

Nó sử dụng tham số effort linh hoạt để điều chỉnh trí thông minh dựa trên tác vụ.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep cho Claude Opus 4.5

Meo chuyen gia giup ban tan dung toi da Claude Opus 4.5 va dat ket qua tot hon.

Sử dụng High Effort cho Logic

Thiết lập tham số 'effort' thành 'high' cho các tác vụ kiến trúc phức tạp để đảm bảo độ sâu reasoning tối đa.

Triển khai Stop Hooks

Sử dụng các stop hooks chuyên dụng trong agentic workflows để cho phép model tự chạy và tự sửa lỗi trong nhiều giờ.

Tận dụng Claude Code

Kết hợp model với công cụ Claude Code CLI để khai thác toàn bộ tiềm năng cho các tác vụ hệ thống gốc terminal.

Tối ưu hóa việc sử dụng Token

Chỉ sử dụng Opus 4.5 cho các tác vụ yêu cầu logic cao, vì nó mang lại chất lượng tương đương Sonnet nhưng sử dụng ít hơn tới 76% tokens.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Cau hoi thuong gap ve Claude Opus 4.5

Tim cau tra loi cho cac cau hoi thuong gap ve Claude Opus 4.5