anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet เป็น model ไฮบริด reasoning รุ่นแรกจาก Anthropic นำเสนอประสิทธิภาพการเขียนโค้ดระดับ state-of-the-art พร้อม 200k context window...

anthropic logoanthropicClaude 324 กุมภาพันธ์ 2025
บริบท
200Kโทเคน
เอาต์พุตสูงสุด
128Kโทเคน
ราคาอินพุต
$3.00/ 1M
ราคาเอาต์พุต
$15.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
84.8%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Claude 3.7 Sonnet ได้คะแนน 84.8% ในเกณฑ์มาตรฐานนี้
HLE
34%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง Claude 3.7 Sonnet ได้คะแนน 34% ในเกณฑ์มาตรฐานนี้
MMLU
89%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Claude 3.7 Sonnet ได้คะแนน 89% ในเกณฑ์มาตรฐานนี้
MMLU Pro
74%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Claude 3.7 Sonnet ได้คะแนน 74% ในเกณฑ์มาตรฐานนี้
SimpleQA
42%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง Claude 3.7 Sonnet ได้คะแนน 42% ในเกณฑ์มาตรฐานนี้
IFEval
93.2%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Claude 3.7 Sonnet ได้คะแนน 93.2% ในเกณฑ์มาตรฐานนี้
AIME 2025
54.8%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Claude 3.7 Sonnet ได้คะแนน 54.8% ในเกณฑ์มาตรฐานนี้
MATH
96.2%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Claude 3.7 Sonnet ได้คะแนน 96.2% ในเกณฑ์มาตรฐานนี้
GSM8k
97%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Claude 3.7 Sonnet ได้คะแนน 97% ในเกณฑ์มาตรฐานนี้
MGSM
92%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Claude 3.7 Sonnet ได้คะแนน 92% ในเกณฑ์มาตรฐานนี้
MathVista
70%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Claude 3.7 Sonnet ได้คะแนน 70% ในเกณฑ์มาตรฐานนี้
SWE-Bench
70.3%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Claude 3.7 Sonnet ได้คะแนน 70.3% ในเกณฑ์มาตรฐานนี้
HumanEval
94%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Claude 3.7 Sonnet ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
65%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Claude 3.7 Sonnet ได้คะแนน 65% ในเกณฑ์มาตรฐานนี้
MMMU
75%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Claude 3.7 Sonnet ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
MMMU Pro
55%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Claude 3.7 Sonnet ได้คะแนน 55% ในเกณฑ์มาตรฐานนี้
ChartQA
89%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Claude 3.7 Sonnet ได้คะแนน 89% ในเกณฑ์มาตรฐานนี้
DocVQA
94%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Claude 3.7 Sonnet ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
35.2%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Claude 3.7 Sonnet ได้คะแนน 35.2% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Claude 3.7 Sonnet ได้คะแนน 12% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ Claude 3.7 Sonnet

เรียนรู้เกี่ยวกับความสามารถของ Claude 3.7 Sonnet คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

การออกแบบ Hybrid Reasoning

Claude 3.7 Sonnet ใช้สถาปัตยกรรมใหม่ที่ให้ผู้ใช้เลือกความสมดุลระหว่างความเร็วและความลึกได้ เป็น model แรกที่มีปุ่มสลับสำหรับ extended thinking ทำให้ระบบสามารถขบคิดตรรกะที่ซับซ้อนก่อนให้คำตอบ ความโปร่งใสนี้ช่วยให้นักพัฒนาเห็นที่มาของข้อสรุปของ model ได้ชัดเจน ลดโอกาสในการเกิดข้อผิดพลาดที่ตรวจพบได้ยากในการทำงานเทคนิค

การแก้ปัญหาทางเทคนิค

model นี้สร้างมาเพื่อวิศวกรรมซอฟต์แวร์ระดับสูง โดยทำคะแนนได้ 62.1% ใน benchmark ของ SWE-bench Verified ซึ่งแสดงให้เห็นถึงความสามารถที่แข็งแกร่งในการแก้ไขปัญหา GitHub จริง เมื่อใช้คู่กับเครื่องมืออย่าง Claude Code มันสามารถจัดการแก้ไขไฟล์และสั่งการใน repositories ขนาดใหญ่ได้ รองรับงานคณิตศาสตร์และโค้ดด้วยความแม่นยำที่เทียบเท่าหรือเหนือกว่า frontier model ในปัจจุบัน

ความจุ Context มหาศาล

ด้วย context window ขนาด 200,000 tokens ทำให้ model สามารถประมวลผลชุดเอกสารหรือ codebase ขนาดใหญ่ได้ในครั้งเดียว รองรับการสร้างผลลัพธ์ได้สูงสุด 128,000 tokens เมื่อเปิดใช้งานโหมดคิดวิเคราะห์ ช่วยให้สะดวกในการเขียนสคริปต์ยาวหรือรายงานรายละเอียด นอกจากนี้ตัว model ยังเป็น multimodal ซึ่งสามารถตีความแผนภูมิและไดอะแกรมควบคู่ไปกับข้อความได้

Claude 3.7 Sonnet

กรณีการใช้งานสำหรับ Claude 3.7 Sonnet

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Claude 3.7 Sonnet เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

วิศวกรรมซอฟต์แวร์แบบ Agentic

ใช้เครื่องมือ terminal เพื่อแก้ไขบั๊กและ refactor โค้ดผ่านโครงสร้างไฟล์ขนาดใหญ่

การตรวจสอบบทพิสูจน์ทางคณิตศาสตร์

แก้โจทย์คณิตศาสตร์ที่ยากโดยให้ model คิดวิเคราะห์ผ่านขั้นตอนเชิงตรรกะ

การวิเคราะห์ Repository

ดึงข้อมูลและระบุรูปแบบจาก codebase เทคนิคทั้งหมดได้ใน prompt เดียว

การแยกวิเคราะห์ข้อมูลภาพ

แปลงแผนภูมิที่ซับซ้อน แผนผัง และไดอะแกรมเทคนิคให้เป็นข้อมูล JSON ที่มีโครงสร้าง

การวางแผนสถาปัตยกรรมระบบ

ออกแบบระบบซอฟต์แวร์พร้อมตรวจสอบตรรกะอย่างละเอียดโดยใช้โหมด extended thinking

เวิร์กโฟลว์ Git อัตโนมัติ

จัดการ commit message, ตรวจทานโค้ด และดำเนินการทดสอบผ่านการใช้เครื่องมือแบบ agentic

จุดแข็ง

ข้อจำกัด

ทางเลือก Hybrid Thinking: เป็น model แรกที่อนุญาตให้ผู้ใช้สลับโหมดระหว่างการตอบกลับแบบรวดเร็วและโหมด reasoning เชิงลึกได้
Latency ของการ Reasoning: การเปิดใช้งานโหมด thinking จะเพิ่มเวลาที่ model ใช้ในการตอบกลับอย่างเห็นได้ชัด
Coding Agent ระดับแนวหน้า: ประสิทธิภาพระดับท็อปบน SWE-bench Verified ด้วยคะแนน 62.1% ในการแก้ไขปัญหาหน้างานจริง
ค่าใช้จ่ายในการคิด: internal reasoning tokens ถูกคิดค่าใช้จ่ายในอัตรา $15 ต่อล้าน output tokens ซึ่งอาจสูงขึ้นในงานที่ยาวนาน
ความสามารถในการสร้าง Output มหาศาล: สร้างข้อความได้สูงสุดถึง 128,000 tokens ในการตอบกลับครั้งเดียว ช่วยอำนวยความสะดวกในการเขียนโค้ดและเอกสารขนาดใหญ่
ไม่รองรับวิดีโอ: ไม่สามารถนำเข้าหรือวิเคราะห์ไฟล์วิดีโอดิบผ่าน API ได้โดยตรงเหมือนคู่แข่งบางราย
ตรรกะที่โปร่งใส: chain-of-thought ที่แสดงออกมาให้เห็นช่วยให้ผู้ใช้สามารถตรวจสอบและ debug กระบวนการคิดภายในของ model ได้
Knowledge Cutoff: ข้อมูลที่ใช้เทรนมีถึงเพียงเดือนตุลาคม 2024 เท่านั้น ทำให้พลาดพัฒนาการในอุตสาหกรรมช่วงล่าสุด

เริ่มต้นด่วน API

anthropic/claude-3-7-sonnet

ดูเอกสาร
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "Analyze this architectural flaw..." }],
});

console.log(message.content);

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Claude 3.7 Sonnet

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Claude 3.7 Sonnet

Claude Code รวมกับ 3.7 Sonnet เหมือนมี junior developer ฝีมือฉกาจมาอยู่ใน terminal เลย นี่เป็นครั้งแรกที่ AI agentic รู้สึกเหมือนจริงมาก
dev_guru_99
reddit
Hybrid reasoning คืออัปเดตครั้งใหญ่ ผมไม่ได้ต้องการให้มันใช้เวลาคิด 30 วินาทีตลอดเวลาหรอกนะ แต่เวลา debug นี่มันน่าทึ่งมาก
TechLead_X
twitter
Anthropic ทำสำเร็จที่สร้าง model ซึ่งสู้กับ o1 ในเรื่องคณิตศาสตร์ได้โดยที่ยังใช้แชททั่วไปได้ดีเยี่ยม
logic_fanatic
hackernews
Claude ให้รายงานที่ครอบคลุม จัดรูปแบบสวยงาม พร้อมการอ้างอิงภายในเวลาไม่ถึง 5 นาที
ThinkingDeeplyAI_mod
reddit
ขีดจำกัด output 128k คือฟีเจอร์เด็ดที่หลายคนมองข้าม ในที่สุดก็มี model ที่ไม่หยุดตอบกลางคันตอนเขียนสคริปต์ยาวๆ
code_monk_42
reddit
Claude 3.7 + MCP คือสิ่งที่ใกล้เคียง Jarvis ที่สุดในตอนนี้ มันใช้เครื่องมือในเครื่องผมได้ถูกต้องจริงๆ
julie_codes_it
twitter

วิดีโอเกี่ยวกับ Claude 3.7 Sonnet

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Claude 3.7 Sonnet

Claude 3.7 เจ๋งมาก model ตัวใหม่นี้เก่งกว่าตัวเดิมและพัฒนาการเขียนโปรแกรมได้ดีขึ้นไปอีก

model 3.7 ใหม่ล่าสุดโค่นล้มทุกตัวรวมถึง OpenAI o3 mini

มันสามารถแก้ปัญหา GitHub ได้ถึง 70%

Extended thinking ช่วยให้ model ได้ทบทวนปัญหาก่อนจะเขียนโค้ดออกมา

นี่คือชัยชนะครั้งใหญ่สำหรับประสบการณ์ของนักพัฒนา

Chat bot ให้คำแนะนำคุณ แต่ Claude Code ลงมือทำจริงได้ สร้างไฟล์ สร้างเว็บ และติดตั้งแพ็กเกจได้

Extended thinking คือการที่ Claude ได้ใช้ความคิดก่อนที่จะลงมือดำเนินการใดๆ

เครื่องมือนี้ถูกปรับแต่งมาเพื่อสภาพแวดล้อม terminal

การเชื่อมต่อ MCP คือสิ่งที่ทำให้ตัวนี้ต่างจาก ChatGPT ทั่วไป

model เข้าใจความตั้งใจเบื้องหลังคำสั่ง terminal ที่กำกวมได้

การเชื่อมต่อกับ terminal ผ่าน Claude Code คือระดับความเป็น agentic ที่เรายังไม่เคยเห็นมาก่อน

ความสามารถของ Claude 3.7 Sonnet ในการแสดงกระบวนการคิดนั้นโปร่งใสกว่าคู่แข่งมาก

บน SWE-bench Verified มันทำคะแนนได้น่าทึ่งถึง 62%

Hybrid reasoning หมายความว่าคุณไม่ต้องเสียค่า latency ในตอนที่คุณไม่จำเป็นต้องใช้

ยังคงรักษาคุณภาพการเขียนที่ดีเยี่ยมของ Claude รุ่นก่อนหน้าไว้

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ Claude 3.7 Sonnet

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Claude 3.7 Sonnet และได้ผลลัพธ์ที่ดีขึ้น

กำหนดงบประมาณสำหรับการ Reasoning

ใช้พารามิเตอร์ thinking ของ API เพื่อจำกัดจำนวน reasoning tokens ช่วยในการจัดการค่าใช้จ่าย

ตรวจสอบ Thought Blocks

ตรวจสอบ internal chain-of-thought ในการตอบกลับเพื่อยืนยันตรรกะของคำตอบที่ซับซ้อน

ใช้ MCP Connectors

เชื่อมต่อ model เข้ากับฐานข้อมูลภายในเครื่องและ cloud storage เพื่อรับ context ของโปรเจกต์แบบเรียลไทม์

การรีเฟรช Context

ใช้คำสั่งสรุปผลในระหว่างการวนลูปแบบ agentic เพื่อให้ context window จดจ่ออยู่กับข้อมูลที่เกี่ยวข้อง

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

คำถามที่พบบ่อยเกี่ยวกับ Claude 3.7 Sonnet

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Claude 3.7 Sonnet