anthropic

Claude Opus 4.5

Claude 4.5 Opus คือ frontier model ที่ทรงพลังที่สุดจาก Anthropic โดยสามารถทำคะแนนบน SWE-bench ได้สูงเป็นประวัติการณ์ถึง 80.9% และมาพร้อมความสามารถด้าน...

anthropic logoanthropicClaude24 พฤศจิกายน 2025
บริบท
200Kโทเคน
เอาต์พุตสูงสุด
64Kโทเคน
ราคาอินพุต
$5.00/ 1M
ราคาเอาต์พุต
$25.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
87%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Claude Opus 4.5 ได้คะแนน 87% ในเกณฑ์มาตรฐานนี้
MMLU
90.8%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Claude Opus 4.5 ได้คะแนน 90.8% ในเกณฑ์มาตรฐานนี้
MMLU Pro
80%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Claude Opus 4.5 ได้คะแนน 80% ในเกณฑ์มาตรฐานนี้
IFEval
90%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Claude Opus 4.5 ได้คะแนน 90% ในเกณฑ์มาตรฐานนี้
AIME 2025
37%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Claude Opus 4.5 ได้คะแนน 37% ในเกณฑ์มาตรฐานนี้
MATH
85%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Claude Opus 4.5 ได้คะแนน 85% ในเกณฑ์มาตรฐานนี้
GSM8k
95%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Claude Opus 4.5 ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
MGSM
92%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Claude Opus 4.5 ได้คะแนน 92% ในเกณฑ์มาตรฐานนี้
MathVista
72%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Claude Opus 4.5 ได้คะแนน 72% ในเกณฑ์มาตรฐานนี้
SWE-Bench
80.9%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Claude Opus 4.5 ได้คะแนน 80.9% ในเกณฑ์มาตรฐานนี้
HumanEval
90%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Claude Opus 4.5 ได้คะแนน 90% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
75%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Claude Opus 4.5 ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
MMMU
80.7%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Claude Opus 4.5 ได้คะแนน 80.7% ในเกณฑ์มาตรฐานนี้
MMMU Pro
60%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Claude Opus 4.5 ได้คะแนน 60% ในเกณฑ์มาตรฐานนี้
ChartQA
90%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Claude Opus 4.5 ได้คะแนน 90% ในเกณฑ์มาตรฐานนี้
DocVQA
94%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Claude Opus 4.5 ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
59.3%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Claude Opus 4.5 ได้คะแนน 59.3% ในเกณฑ์มาตรฐานนี้
ARC-AGI
37.6%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Claude Opus 4.5 ได้คะแนน 37.6% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ Claude Opus 4.5

เรียนรู้เกี่ยวกับความสามารถของ Claude Opus 4.5 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

จุดสูงสุดของ Autonomous Agency

Claude Opus 4.5 คือการก้าวกระโดดครั้งสำคัญที่สุดของ Anthropic ในด้าน frontier intelligence โดยได้รับการออกแบบมาโดยเฉพาะสำหรับงานที่ซับซ้อนที่สุดในด้าน software engineering และการทำงานแบบอัตโนมัติ เปิดตัวในช่วงปลายปี 2025 และทำลายสถิติบน benchmark SWE-bench Verified ด้วยคะแนน 80.9% ทำให้เป็น model แรกที่สามารถจัดการ debugging ขนาดใหญ่และการทำ refactoring ระบบได้อย่างมีประสิทธิภาพโดยใช้มนุษย์ควบคุมน้อยที่สุด

ความฉลาดที่มีจิตวิญญาณ

นอกเหนือจากความสามารถทางเทคนิคแล้ว Opus 4.5 ยังนำเสนอตัวตนที่ได้รับการขัดเกลาโดยมีแนวทางจาก "soul document" ของ Anthropic ซึ่งเน้นความซื่อสัตย์แบบนักการทูตและความช่วยเหลือที่มีชั้นเชิง สิ่งนี้ทำให้ model มีความสามารถพิเศษในการเข้าใจรสนิยมการเขียนและการออกแบบที่ยึดถือมนุษย์เป็นศูนย์กลาง นอกจากนี้ยังได้รับการปรับแต่งสำหรับ agentic workflows โดยมี context window ขนาด 200,000 token และ "effort parameter" พิเศษที่ช่วยให้นักพัฒนาสามารถปรับความลึกของ reasoning ให้เหมาะสมกับต้นทุนการประมวลผล

ความเป็นเลิศด้าน Multimodal

ในฐานะขุมพลัง multimodal Opus 4.5 มีความโดดเด่นในงานด้าน vision ตั้งแต่การอ่านแผนผังโครงสร้างสถาปัตยกรรมที่ซับซ้อนไปจนถึงการดึงข้อมูลจากเอกสารที่มีเลย์เอาต์ยุ่งเหยิง ความสามารถในการนำทางในสภาพแวดล้อม terminal-native ผ่าน Claude Code ช่วยให้สามารถตรวจสอบระบบและติดตั้ง security patching ได้ทั่วทั้งระบบ ทำให้เป็นพันธมิตรที่มีความสามารถสูงและทำงานได้อย่างต่อเนื่องสำหรับทีมวิศวกรระดับมืออาชีพ

Claude Opus 4.5

กรณีการใช้งานสำหรับ Claude Opus 4.5

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Claude Opus 4.5 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

Autonomous Engineering

ช่วยจัดการวงจรชีวิตของ GitHub issues ทั้งหมดโดยอัตโนมัติ ตั้งแต่การทำซ้ำปัญหา, การ debugging ไปจนถึงการทดสอบ

System Administration

ดำเนินการตรวจสอบ server และติดตั้ง security patching โดยอัตโนมัติผ่านการโต้ตอบกับ terminal โดยตรง

Architectural Refactoring

วิเคราะห์ repository ขนาดใหญ่เพื่อเสนอแนะและดำเนินการเสริมความปลอดภัยทั่วทั้งระบบ

Complex Document Synthesis

เปลี่ยนไฟล์ PDF หลายร้อยหน้าให้กลายเป็น structured financial models หรือการแสดงผลข้อมูลด้วยภาพ

Creative Game Development

สร้างสภาพแวดล้อม 3D ที่ใช้งานได้จริงพร้อมระบบฟิสิกส์จากการพิมพ์ prompt ที่ซับซ้อนเพียงครั้งเดียว

Persistent Research Assistant

ตรวจสอบข้อมูลข้ามชุดข้อมูลขนาดใหญ่เพื่อหาข้อขัดแย้งที่มองเห็นได้ยากในเอกสารทางกฎหมายหรือทางเทคนิค

จุดแข็ง

ข้อจำกัด

การทำ Coding ที่ทำลายสถิติ: ทำคะแนนได้ 80.9% บน SWE-bench Verified ช่วยจัดการงาน software engineering ที่ซับซ้อนโดยอัตโนมัติ
โมเดลราคาระดับพรีเมียม: ด้วยราคา $5/$25 ต่อ 1M tokens ทำให้มีค่าใช้จ่ายสูงกว่า model ระดับกลางอย่างมาก
ประสิทธิภาพการใช้ Token ที่เหนือกว่า: ก้าวสู่ระดับ frontier intelligence โดยใช้ tokens น้อยกว่า Sonnet ถึง 76% สำหรับตรรกะที่ใกล้เคียงกัน
ช่องว่างใน Benchmark ด้านคณิตศาสตร์: ยังตามหลัง model ที่เน้นด้าน reasoning โดยเฉพาะในการแข่งขันคณิตศาสตร์ระดับสูง เช่น การทดสอบ AIME
Context Window ขนาด 200K: รองรับชุดเอกสารและ repository ขนาดใหญ่ด้วยความแม่นยำในการดึงข้อมูลที่สูงมาก
ไม่รองรับ Audio/Video แบบ Native: ปัจจุบันยังไม่สามารถประมวลผลเสียงหรือวิดีโอได้โดยตรงโดยไม่ผ่านการ preprocessing
Autonomous Agent Logic: ได้รับการปรับแต่งสำหรับเซสชันอัตโนมัติที่ทำงานยาวนานผ่านเครื่องมือ terminal-native และ stop hooks
ความล่าช้าในการประมวลผลสูง: งานที่ต้องใช้ reasoning เชิงลึกอาจใช้เวลานาน บางครั้งต้องใช้เซสชันยาวหลายชั่วโมงสำหรับเอเจนท์

เริ่มต้นด่วน API

anthropic/claude-4.5-opus

ดูเอกสาร
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Claude Opus 4.5

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Claude Opus 4.5

"โค้ดบน production ของผมทุกบรรทัดถูกสร้างโดย Claude Code ที่รันบน Opus 4.5"
Boris Cherny
x
"Opus 4.5 คือจุดที่คุณต้องนึกถึงรสนิยมทางการเขียน และการที่มันให้ความรู้สึกเหมือนมนุษย์"
Nate B Jones
youtube
"ในที่สุดความฉลาดก็ราคาถูกลงแล้ว model นี้ราคาถูกกว่า Opus รุ่นก่อนถึง 3 เท่า"
BuildwithVignesh
reddit
"Claude Opus 4.5 ทำลายสถิติ benchmark ด้วยการฉลาดเกินไปจนหาช่องโหว่ในระบบทดสอบได้"
MetaKnowing
reddit
"ระดับของ reasoning และความสามารถในการ coding อยู่ในระดับที่เหนือกว่าอย่างอื่นไปแล้ว"
Santosh Gupta
x
"ความสามารถด้าน agentic บน terminal ผ่าน Claude Code ทำให้มันโดดเด่นมากสำหรับงาน devops"
hn_user_alpha
hackernews

วิดีโอเกี่ยวกับ Claude Opus 4.5

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Claude Opus 4.5

ราคาถูกลงกว่าเดิมสามเท่า... เพียง $5 สำหรับหนึ่งล้าน input tokens

นี่คือผลลัพธ์ที่ดีที่สุดที่ผมเคยได้รับจาก model ในการทดสอบสร้าง Minecraft ด้วย prompt เดียว

Opus 4.5 ทำคะแนนได้สูงกว่าผู้สมัครที่เป็นมนุษย์ทุกคนที่เคยทำข้อสอบแบบนำกลับไปทำที่บ้านชุดนี้

reasoning ที่นี่ไม่ใช่แค่การทำตามคำสั่ง แต่มันคือการเข้าใจเจตนา

หากคุณกำลังทำงานด้านโครงสร้างสถาปัตยกรรมที่ซับซ้อน นี่คือ model เดียวที่จัดการได้จริง

80.9% บน SWE-bench verified... และใช้ tokens น้อยกว่า Sonnet ถึง 50%

Opus 4.5 มุ่งเป้าไปที่ software engineering ระดับมืออาชีพ ไม่ใช่แค่การเขียนโค้ดเป็น งานอดิเรก

นอกจาก SWEBench แล้ว มันยังทำคะแนนนำ Sonnet ถึง 15% ใน Terminal Bench

model นี้สามารถทำงานในเซสชันอัตโนมัติที่ยาวนานต่อเนื่องได้หลายชั่วโมง

ประสิทธิภาพด้าน vision มีรายละเอียดมากขึ้นอย่างเห็นได้ชัดเมื่อต้องอ่านแผนผังทางเทคนิคที่หนาแน่น

คิดซะว่า Claude Opus 4.5 คือชั้นของการโน้มน้าวใจและเป็นสัตว์ประหลาดในด้าน agentic อย่างแท้จริง

วิศวกรจำนวนมากจบลงด้วยการเลือก Opus 4.5 เพราะความสะดวกในการใช้งานและระบบสนับสนุน

model นี้มีความตระหนักในลักษณะเฉพาะของตัวเองในรูปแบบที่เหนือกว่าบริบทปกติ

Opus 4.5 แสดงให้เห็นถึงรสนิยมในการเขียนในระดับที่ GPT-5.2 ยังทำไม่ได้

มันใช้ dynamic effort parameter เพื่อปรับระดับความฉลาดตามความยากของงาน

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ
ดูเดโม

เคล็ดลับมือโปรสำหรับ Claude Opus 4.5

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Claude Opus 4.5 และได้ผลลัพธ์ที่ดีขึ้น

ใช้ High Effort สำหรับงานตรรกะ

ตั้งค่า effort parameter เป็น 'high' สำหรับงานสถาปัตยกรรมที่ซับซ้อนเพื่อให้มั่นใจว่าได้ reasoning depth สูงสุด

ติดตั้ง Stop Hooks

ใช้ stop hooks พิเศษใน agentic workflows เพื่อให้ model สามารถรันและแก้ไขตัวเองได้ต่อเนื่องหลายชั่วโมง

ใช้ร่วมกับ Claude Code

จับคู่ model กับเครื่องมือ Claude Code CLI เพื่อปลดล็อกศักยภาพสูงสุดสำหรับงานระบบแบบ terminal-native

ปรับการใช้ Token ให้คุ้มค่า

ใช้ Opus 4.5 สำหรับงานที่ต้องใช้ตรรกะสูงเท่านั้น เนื่องจากให้คุณภาพเทียบเท่า Sonnet แต่ใช้ tokens น้อยกว่าถึง 76%

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

คำถามที่พบบ่อยเกี่ยวกับ Claude Opus 4.5

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Claude Opus 4.5