anthropic

Claude 3.7 Sonnet

Claude 3.7 Sonnet คือ model แบบ hybrid reasoning รุ่นแรกจาก Anthropic ที่มาพร้อมความสามารถในการเขียนโค้ดระดับ state-of-the-art และ context window ขนาด 200k

anthropic logoanthropicClaude 3February 24, 2025
บริบท
200Kโทเคน
เอาต์พุตสูงสุด
128Kโทเคน
ราคาอินพุต
$3.00/ 1M
ราคาเอาต์พุต
$15.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
84.8%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Claude 3.7 Sonnet ได้คะแนน 84.8% ในเกณฑ์มาตรฐานนี้
HLE
34%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง Claude 3.7 Sonnet ได้คะแนน 34% ในเกณฑ์มาตรฐานนี้
MMLU
89%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Claude 3.7 Sonnet ได้คะแนน 89% ในเกณฑ์มาตรฐานนี้
MMLU Pro
74%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Claude 3.7 Sonnet ได้คะแนน 74% ในเกณฑ์มาตรฐานนี้
SimpleQA
42%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง Claude 3.7 Sonnet ได้คะแนน 42% ในเกณฑ์มาตรฐานนี้
IFEval
93.2%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Claude 3.7 Sonnet ได้คะแนน 93.2% ในเกณฑ์มาตรฐานนี้
AIME 2025
54.8%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Claude 3.7 Sonnet ได้คะแนน 54.8% ในเกณฑ์มาตรฐานนี้
MATH
96.2%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Claude 3.7 Sonnet ได้คะแนน 96.2% ในเกณฑ์มาตรฐานนี้
GSM8k
97%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Claude 3.7 Sonnet ได้คะแนน 97% ในเกณฑ์มาตรฐานนี้
MGSM
92%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Claude 3.7 Sonnet ได้คะแนน 92% ในเกณฑ์มาตรฐานนี้
MathVista
70%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Claude 3.7 Sonnet ได้คะแนน 70% ในเกณฑ์มาตรฐานนี้
SWE-Bench
70.3%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Claude 3.7 Sonnet ได้คะแนน 70.3% ในเกณฑ์มาตรฐานนี้
HumanEval
94%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Claude 3.7 Sonnet ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
65%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Claude 3.7 Sonnet ได้คะแนน 65% ในเกณฑ์มาตรฐานนี้
MMMU
75%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Claude 3.7 Sonnet ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
MMMU Pro
55%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Claude 3.7 Sonnet ได้คะแนน 55% ในเกณฑ์มาตรฐานนี้
ChartQA
89%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Claude 3.7 Sonnet ได้คะแนน 89% ในเกณฑ์มาตรฐานนี้
DocVQA
94%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Claude 3.7 Sonnet ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
35.2%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Claude 3.7 Sonnet ได้คะแนน 35.2% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Claude 3.7 Sonnet ได้คะแนน 12% ในเกณฑ์มาตรฐานนี้

ลองใช้ Claude 3.7 Sonnet ฟรี

สนทนากับ Claude 3.7 Sonnet ฟรี ทดสอบความสามารถ ถามคำถาม และสำรวจว่าโมเดล AI นี้ทำอะไรได้บ้าง

พรอมต์
การตอบกลับ
anthropic/claude-3-7-sonnet-20250219

การตอบกลับ AI ของคุณจะปรากฏที่นี่

เกี่ยวกับ Claude 3.7 Sonnet

เรียนรู้เกี่ยวกับความสามารถของ Claude 3.7 Sonnet คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

Hybrid Reasoning และความโปร่งใส

Claude 3.7 Sonnet คือการเปลี่ยนแปลงครั้งสำคัญในสถาปัตยกรรม LLM ในฐานะ model แบบ 'hybrid reasoning' ตัวแรกของ Anthropic มีเอกลักษณ์ตรงที่ผู้ใช้สามารถสลับระหว่างการตอบสนองมาตรฐานที่มี latency ต่ำ และโหมด 'extended thinking' ที่แสดง chain-of-thought ภายใน ความโปร่งใสนี้ช่วยให้ผู้ใช้มองเห็นตรรกะของ model ได้อย่างชัดเจน ทำให้มีประสิทธิภาพอย่างยิ่งสำหรับการแก้ปัญหาที่ซับซ้อนและงานที่ต้องใช้ reasoning สูง

ความเชี่ยวชาญด้านวิศวกรรมซอฟต์แวร์

ถูกออกแบบมาโดยเน้นที่วิศวกรรมซอฟต์แวร์และผลลัพธ์ที่พร้อมสำหรับการใช้งานจริง model นี้ได้สร้างมาตรฐานใหม่ของอุตสาหกรรมใน benchmark อย่าง SWE-Bench Verified โดดเด่นในเรื่อง 'vibe coding' ที่นักพัฒนาอธิบายความต้องการระดับสูง และ model จะจัดการ implementation ในหลายๆ ไฟล์ จัดการการ refactor ที่ซับซ้อนและการตัดสินใจเชิงสถาปัตยกรรมด้วยความแม่นยำที่เหนือกว่า frontier models รุ่นก่อนหน้า

Context ขนาดมหาศาลและเครื่องมือแบบ Agentic

ด้วย context window ขนาดมหึมา 200,000 tokens และชุดเครื่องมือแบบ agentic ที่เรียกว่า Claude Code มันได้เปลี่ยนจาก chatbot ทั่วไปให้กลายเป็นคู่หูทางเทคนิคที่ร่วมมือกันได้ สามารถจัดการวงจรชีวิตของโปรเจกต์ได้ทั้งหมด ตั้งแต่การตรวจสอบเอกสารเบื้องต้นไปจนถึง git workflow อัตโนมัติและการรัน test เพื่อให้มั่นใจว่าการพัฒนายังคงรวดเร็วและปราศจาก bug

Claude 3.7 Sonnet

กรณีการใช้งานสำหรับ Claude 3.7 Sonnet

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Claude 3.7 Sonnet เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

Vibe Coding

การสร้างซอฟต์แวร์ที่ใช้งานได้จริงตั้งแต่เริ่มต้น โดยการอธิบายความต้องการด้วยภาษาธรรมชาติ

Advanced Debugging

การใช้ extended thinking เพื่อวิเคราะห์ log ที่ซับซ้อนและแก้ไขปัญหาได้อย่างแม่นยำในครั้งเดียว

Large Context Analysis

การตรวจสอบและ refactor codebase ทั้งหมดหรือเอกสารทางเทคนิคที่มีความยาวมากภายใน prompt เดียว

Agentic Development

การขับเคลื่อนเครื่องมือบน terminal อย่าง Claude Code เพื่อทำงาน git workflow และการรัน test โดยอัตโนมัติ

Frontend UI Generation

การสร้างส่วนประกอบ React และ Svelte ที่สวยงามและบำรุงรักษาง่าย พร้อมรสนิยมด้านดีไซน์ในตัว

Factual Research

การวิเคราะห์เอกสาร PDF และชุดข้อมูลขนาดใหญ่ด้วยความแม่นยำสูงและมีอัตราการเกิด hallucination ต่ำ

จุดแข็ง

ข้อจำกัด

การเขียนโค้ดชั้นนำของอุตสาหกรรม: ทำคะแนนระดับ state-of-the-art ที่ 70.3% บน SWE-bench Verified แก้ไขปัญหาจริงบน GitHub ได้ด้วยความแม่นยำที่ไม่เคยมีมาก่อน
ความหน่วงในการตอบสนอง: การเปิดโหมด 'extended thinking' จะเพิ่มระยะเวลาจนกว่าจะเริ่มแสดง token แรก (time to first token) อย่างมากเมื่อเทียบกับการตอบกลับแบบมาตรฐาน
Visible Reasoning: model แรกที่นำเสนอ 'extended thinking' แบบที่ผู้ใช้มองเห็นและควบคุมได้ สำหรับการแก้ปัญหาที่ซับซ้อนและมีความสำคัญสูง
ราคาระดับพรีเมียม: ค่าใช้จ่าย output ที่ $15 ต่อ 1M tokens ยังคงสูงกว่าทางเลือกที่เป็น 'mini' หรือ open-weights ส่วนใหญ่อย่างชัดเจน
การรวมระบบแบบ Agentic: ปรับแต่งมาเป็นพิเศษเพื่อการใช้งานเครื่องมือและการโต้ตอบผ่าน CLI ผ่าน framework เอเจนต์ Claude Code เพื่อการทำงานแบบ end-to-end อัตโนมัติ
ไม่รองรับ Audio/Video แบบ Native: แตกต่างจาก GPT-4o หรือ Gemini 2.0 ตรงที่ยังขาดความสามารถในการประมวลผล input ประเภทเสียงและวิดีโอแบบ native
รสนิยมด้านดีไซน์ที่เหนือกว่า: สร้างโค้ด UI ที่สวยงาม เข้าถึงง่าย และบำรุงรักษาง่ายกว่า model ระดับ frontier อื่นๆ อย่างสม่ำเสมอ
ต้นทุนการประมวลผล: เซสชันการทำ deep reasoning สามารถใช้ token และขีดจำกัด context ได้อย่างรวดเร็วในระหว่างการ refactor codebase ขนาดใหญ่

เริ่มต้นด่วน API

anthropic/claude-3-7-sonnet-20250219

ดูเอกสาร
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Claude 3.7 Sonnet

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Claude 3.7 Sonnet

"Claude 3.7 Sonnet คือ AI เขียนโค้ดที่เก่งที่สุดในโลก มันทำให้ผมทึ่งกับงานที่ท้าทายมาก"
rawcell4772
reddit
"ด้วย prompt เดียว มันจัดการทุกอย่างได้อย่างสมบูรณ์แบบในโปรเจกต์ TypeScript ที่ซับซ้อน"
rawcell4772
reddit
"Claude Code ร่วมกับ Sonnet 3.7 ดีกว่า Cline มาก และเป็นเครื่องมือที่ดีที่สุดในตอนนี้"
peterkrueck
reddit
"ก้าวกระโดดของคุณภาพใน model ระดับท็อปอย่าง 3.7 ได้เปลี่ยนมุมมองของผมไปอย่างสิ้นเชิง"
lurking_horrors
reddit
"Claude 3.7 นี่คือของจริง เจ๋งแบบคนละระดับ... ตึงสุดในรุ่น ของแท้แน่นอน"
Fireship
youtube
"โหมด reasoning ของ Claude 3.7 คือการเปลี่ยนผ่านของกระบวนทัศน์สำหรับกฎเกณฑ์การทำ debugging"
DevLead99
x

วิดีโอเกี่ยวกับ Claude 3.7 Sonnet

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Claude 3.7 Sonnet

model 3.7 ใหม่ถล่ม model อื่นๆ ราบคาบ... ตอนนี้สามารถแก้ปัญหา GitHub ได้ถึง 70.3%

การใช้ภาษาแบบ strongly typed ร่วมกับ TDD เป็นวิธีที่ AI ใช้ตรวจสอบว่าโค้ดที่เขียนนั้นใช้งานได้จริง

model นี้ฉลาดอย่างน่าเหลือเชื่อในการปฏิบัติตามคำสั่ง

ประสิทธิภาพบน SWE-bench นั้นบ้าไปแล้วจริงๆ

Visible reasoning คือจุดเปลี่ยนสำคัญในเรื่องความโปร่งใส

Claude 3.7 Sonnet... น่าจะเป็น LLM ที่ดีที่สุดสำหรับการสร้างโค้ด

หากคุณใช้ API คุณสามารถ output ได้ถึง 128,000 tokens ในครั้งเดียว

ขีดจำกัด output 128k คือการอัปเกรดที่ยิ่งใหญ่มาก

รสนิยมการออกแบบสำหรับ Frontend components นั้นไม่มีใครเทียบได้

การใช้งานเครื่องมือและความสามารถแบบ agentic คือหัวใจสำคัญของ model นี้

Reasoning ควรเป็นความสามารถที่รวมอยู่ใน frontier models แทนที่จะแยกเป็น model ต่างหาก

Claude 3.7 สามารถเอาชนะ model เหล่านั้น [DeepSeek, o3] ได้ในจำนวนที่ค่อนข้างมาก

latency จะสูงขึ้นเล็กน้อยในโหมด reasoning

มันเอาชนะ DeepSeek R1 ในงานด้านการปฏิบัติตามคำสั่งหลายอย่าง

Anthropic ให้ความสำคัญกับผลลัพธ์ที่พร้อมสำหรับการใช้งานจริงอย่างมาก

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ
ดูเดโม

เคล็ดลับมือโปร

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจากโมเดลนี้และได้ผลลัพธ์ที่ดีขึ้น

Thinking Budget

ใช้โหมด 'extended thinking' เฉพาะสำหรับการวางแผนตรรกะที่ซับซ้อนหรือสถาปัตยกรรมเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพสูงขึ้น

Context Control

หมั่นใช้ /clear หรือเริ่มแชทใหม่เพื่อประหยัดค่าใช้จ่ายด้าน context และป้องกันไม่ให้ model ทำงานช้าลง

Verification

ให้ Claude เขียนและรัน test สำหรับโค้ดของตัวเองโดยใช้เครื่องมือ Claude Code เพื่อให้มั่นใจในความเสถียรของโปรเจกต์

Markdown Specs

ระบุความต้องการของฟีเจอร์ในรูปแบบไฟล์ Markdown ที่มีโครงสร้างชัดเจน เพื่อให้การปฏิบัติตามคำสั่งในโปรเจกต์ขนาดใหญ่ดียิ่งขึ้น

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

คำถามที่พบบ่อย

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับโมเดลนี้