anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet là model hybrid reasoning đầu tiên của Anthropic, mang lại khả năng lập trình hiện đại, context window 200k và khả năng suy luận minh bạch.

anthropic logoanthropicClaude 324 tháng 2, 2025
Ngu canh
200Ktoken
Dau ra toi da
128Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
84.8%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Claude 3.7 Sonnet dat 84.8% trong benchmark nay.
HLE
34%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Claude 3.7 Sonnet dat 34% trong benchmark nay.
MMLU
89%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Claude 3.7 Sonnet dat 89% trong benchmark nay.
MMLU Pro
74%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Claude 3.7 Sonnet dat 74% trong benchmark nay.
SimpleQA
42%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Claude 3.7 Sonnet dat 42% trong benchmark nay.
IFEval
93.2%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Claude 3.7 Sonnet dat 93.2% trong benchmark nay.
AIME 2025
54.8%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Claude 3.7 Sonnet dat 54.8% trong benchmark nay.
MATH
96.2%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Claude 3.7 Sonnet dat 96.2% trong benchmark nay.
GSM8k
97%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Claude 3.7 Sonnet dat 97% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Claude 3.7 Sonnet dat 92% trong benchmark nay.
MathVista
70%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Claude 3.7 Sonnet dat 70% trong benchmark nay.
SWE-Bench
70.3%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Claude 3.7 Sonnet dat 70.3% trong benchmark nay.
HumanEval
94%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Claude 3.7 Sonnet dat 94% trong benchmark nay.
LiveCodeBench
65%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Claude 3.7 Sonnet dat 65% trong benchmark nay.
MMMU
75%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Claude 3.7 Sonnet dat 75% trong benchmark nay.
MMMU Pro
55%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Claude 3.7 Sonnet dat 55% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Claude 3.7 Sonnet dat 89% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Claude 3.7 Sonnet dat 94% trong benchmark nay.
Terminal-Bench
35.2%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Claude 3.7 Sonnet dat 35.2% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Claude 3.7 Sonnet dat 12% trong benchmark nay.

Ve Claude 3.7 Sonnet

Tim hieu ve kha nang cua Claude 3.7 Sonnet, tinh nang va cach no co the giup ban dat ket qua tot hon.

Thiết kế Hybrid Reasoning

Claude 3.7 Sonnet sử dụng kiến trúc mới cho phép người dùng lựa chọn giữa tốc độ và chiều sâu. Đây là model đầu tiên cung cấp tùy chọn chuyển đổi cho extended thinking, cho phép hệ thống suy luận qua các logic phức tạp trước khi đưa ra câu trả lời. Sự minh bạch này giúp các developer thấy rõ cách model đưa ra kết luận, giảm thiểu khả năng xảy ra lỗi ẩn trong các tác vụ kỹ thuật.

Giải quyết vấn đề kỹ thuật

Model này được xây dựng cho kỹ thuật phần mềm ở cấp độ cao. Nó đạt 62.1% trên benchmark SWE-bench Verified, cho thấy khả năng mạnh mẽ trong việc sửa các issue thực tế trên GitHub. Khi kết hợp với các công cụ như Claude Code, nó quản lý việc chỉnh sửa tệp và thực thi lệnh trên các repository lớn. Nó xử lý các tác vụ toán học và lập trình với độ chính xác ngang bằng hoặc vượt trội so với các model reasoning hàng đầu hiện nay.

Khả năng Context quy mô lớn

Với context window 200.000 tokens, model xử lý các bộ tài liệu hoặc codebase lớn trong một lần. Nó hỗ trợ tới 128.000 tokens output khi chế độ thinking được kích hoạt, khiến nó cực kỳ hữu ích cho việc tạo các script dài hoặc báo cáo chi tiết. Model này cũng là multimodal, nghĩa là nó có thể diễn giải các biểu đồ và sơ đồ cùng với văn bản.

Claude 3.7 Sonnet

Truong hop su dung cho Claude 3.7 Sonnet

Kham pha cac cach khac nhau ban co the su dung Claude 3.7 Sonnet de dat ket qua tuyet voi.

Agentic Software Engineering

Sử dụng công cụ terminal để sửa lỗi và refactor code trên cấu trúc tệp khổng lồ.

Xác minh chứng minh toán học

Giải quyết các bài toán khó bằng cách để model suy luận qua các bước logic.

Phân tích Repository

Trích xuất dữ liệu và xác định các mẫu từ toàn bộ codebase kỹ thuật trong một prompt.

Phân tích dữ liệu trực quan

Chuyển đổi các biểu đồ phức tạp, lưu đồ và sơ đồ kỹ thuật thành dữ liệu JSON có cấu trúc.

Lập kế hoạch kiến trúc hệ thống

Thiết kế hệ thống phần mềm với các bước kiểm tra logic chi tiết bằng chế độ thinking mở rộng.

Quy trình Git tự động

Quản lý commit message, code review và thực thi test thông qua việc sử dụng công cụ agentic.

Diem manh

Han che

Tùy chọn Hybrid Thinking: Model đầu tiên cho phép người dùng chuyển đổi giữa phản hồi tiêu chuẩn nhanh và chế độ reasoning chuyên sâu.
Reasoning Latency: Việc kích hoạt chế độ thinking làm tăng đáng kể thời gian chờ đợi để nhận phản hồi từ model.
Agent lập trình hàng đầu: Hiệu suất đẳng cấp trên SWE-bench Verified với số điểm 62.1% cho việc sửa lỗi production.
Chi phí cho Reasoning: Các reasoning tokens nội bộ được tính phí ở mức $15 mỗi triệu output tokens, chi phí sẽ tăng lên trong các tác vụ dài.
Công suất output cực đại: Tạo ra tới 128.000 tokens trong một phản hồi, hỗ trợ tạo code và tài liệu quy mô lớn.
Không hỗ trợ Video: Không giống như một số đối thủ cạnh tranh, nó không thể nhận hoặc phân tích trực tiếp các tệp video qua API.
Logic minh bạch: Chain-of-thought được hiển thị ra bên ngoài cho phép người dùng kiểm tra và debug quy trình reasoning nội bộ của model.
Giới hạn kiến thức: Dữ liệu huấn luyện chỉ cập nhật đến tháng 10 năm 2024, bỏ lỡ các phát triển gần đây của ngành.

Bat dau nhanh API

anthropic/claude-3-7-sonnet

Xem tai lieu
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analyze this architectural flaw..." }],
});

console.log(message.content);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Claude 3.7 Sonnet

Xem cong dong nghi gi ve Claude 3.7 Sonnet

Claude Code kết hợp với 3.7 Sonnet thực chất giống như một lập trình viên junior được 'tiêm steroid' ngay trong terminal của tôi. Đây là lần đầu tiên AI agentic mang lại cảm giác chân thực.
dev_guru_99
reddit
Hybrid reasoning là một cập nhật lớn. Tôi không phải lúc nào cũng cần nó suy nghĩ trong 30 giây, nhưng khi đang debug, nó thực sự đáng kinh ngạc.
TechLead_X
twitter
Anthropic đã thành công trong việc tạo ra một model cạnh tranh với o1 về toán học trong khi vẫn giữ được sự hữu dụng cho giao tiếp hàng ngày.
logic_fanatic
hackernews
Claude cung cấp các báo cáo toàn diện, được định dạng đẹp mắt kèm trích dẫn trong vòng chưa đầy năm phút.
ThinkingDeeplyAI_mod
reddit
Giới hạn output 128k là một tính năng ẩn cực chất. Cuối cùng cũng có một model không bị cắt ngang giữa chừng khi chạy script dài.
code_monk_42
reddit
Claude 3.7 + MCP là thứ gần nhất với Jarvis hiện nay. Nó thực sự sử dụng các công cụ cục bộ của tôi một cách chính xác.
julie_codes_it
twitter

Video ve Claude 3.7 Sonnet

Xem huong dan, danh gia va thao luan ve Claude 3.7 Sonnet

Claude 3.7 cực kỳ mạnh. Model cơ sở mới tự vượt qua chính mình để trở nên tốt hơn trong việc lập trình.

Model 3.7 mới hoàn toàn áp đảo các model khác bao gồm cả OpenAI o3 mini.

Nó có khả năng giải quyết 70% các issue trên GitHub.

Extended thinking cho phép model suy ngẫm về vấn đề trước khi xuất ra code.

Đây là một chiến thắng to lớn cho trải nghiệm của developer.

Chat bot đưa ra lời khuyên, nhưng Claude Code thực hiện hành động. Nó có thể tạo tệp, xây dựng trang web và cài đặt package.

Extended thinking là việc Claude suy luận trước khi thực hiện bất kỳ hành động nào.

Công cụ này được tối ưu hóa cho môi trường terminal.

Kết nối MCP là thứ thực sự tách biệt nó khỏi ChatGPT tiêu chuẩn.

Model hiểu được ý định đằng sau các câu lệnh terminal mơ hồ.

Việc tích hợp với terminal thông qua Claude Code là một cấp độ agentic mà chúng ta chưa từng thấy trước đây.

Khả năng hiển thị quy trình suy nghĩ của Claude 3.7 Sonnet minh bạch hơn nhiều so với các đối thủ.

Trên SWE-bench Verified, nó đạt mức 62% đáng kinh ngạc.

Hybrid reasoning đồng nghĩa với việc bạn không phải trả chi phí về latency khi không cần thiết.

Nó duy trì phong cách viết chất lượng cao của các model Claude trước đây.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Claude 3.7 Sonnet

Meo chuyen gia giup ban tan dung toi da Claude 3.7 Sonnet va dat ket qua tot hon.

Thiết lập Reasoning Budgets

Sử dụng tham số thinking trong API để giới hạn số lượng reasoning tokens nhằm quản lý chi phí.

Xem xét Thought Blocks

Kiểm tra chain-of-thought nội bộ trong các phản hồi để xác minh tính logic của những câu trả lời phức tạp.

Sử dụng MCP Connectors

Kết nối model với cơ sở dữ liệu cục bộ và lưu trữ đám mây để có context dự án theo thời gian thực.

Làm mới Context

Sử dụng các lệnh tóm tắt trong các vòng lặp agentic dài để giữ cho context window tập trung vào dữ liệu quan trọng.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Cau hoi thuong gap ve Claude 3.7 Sonnet

Tim cau tra loi cho cac cau hoi thuong gap ve Claude 3.7 Sonnet

Claude 3.7 Sonnet: Hybrid Reasoning & Context Window 200K