openai

GPT-5.1

GPT-5.1 คือ flagship ด้านการใช้เหตุผลขั้นสูงของ OpenAI ที่มาพร้อมกับการคิดแบบปรับตัว (adaptive thinking), ความสามารถ multimodal ในตัว และประสิทธิภาพระดับ...

openai logoopenaiGPT-512 พฤศจิกายน 2025
บริบท
400Kโทเคน
เอาต์พุตสูงสุด
128Kโทเคน
ราคาอินพุต
$1.25/ 1M
ราคาเอาต์พุต
$10.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
88.1%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% GPT-5.1 ได้คะแนน 88.1% ในเกณฑ์มาตรฐานนี้
HLE
32.5%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง GPT-5.1 ได้คะแนน 32.5% ในเกณฑ์มาตรฐานนี้
MMLU
90.2%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา GPT-5.1 ได้คะแนน 90.2% ในเกณฑ์มาตรฐานนี้
MMLU Pro
81%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น GPT-5.1 ได้คะแนน 81% ในเกณฑ์มาตรฐานนี้
SimpleQA
52%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง GPT-5.1 ได้คะแนน 52% ในเกณฑ์มาตรฐานนี้
IFEval
91%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด GPT-5.1 ได้คะแนน 91% ในเกณฑ์มาตรฐานนี้
AIME 2025
94%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง GPT-5.1 ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
MATH
91%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส GPT-5.1 ได้คะแนน 91% ในเกณฑ์มาตรฐานนี้
GSM8k
98.5%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา GPT-5.1 ได้คะแนน 98.5% ในเกณฑ์มาตรฐานนี้
MGSM
95%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา GPT-5.1 ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
MathVista
75%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ GPT-5.1 ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
SWE-Bench
76.3%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python GPT-5.1 ได้คะแนน 76.3% ในเกณฑ์มาตรฐานนี้
HumanEval
92.5%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง GPT-5.1 ได้คะแนน 92.5% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
74%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง GPT-5.1 ได้คะแนน 74% ในเกณฑ์มาตรฐานนี้
MMMU
85.4%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย GPT-5.1 ได้คะแนน 85.4% ในเกณฑ์มาตรฐานนี้
MMMU Pro
62%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น GPT-5.1 ได้คะแนน 62% ในเกณฑ์มาตรฐานนี้
ChartQA
89%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ GPT-5.1 ได้คะแนน 89% ในเกณฑ์มาตรฐานนี้
DocVQA
93%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร GPT-5.1 ได้คะแนน 93% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
58%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line GPT-5.1 ได้คะแนน 58% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ GPT-5.1 ได้คะแนน 12% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ GPT-5.1

เรียนรู้เกี่ยวกับความสามารถของ GPT-5.1 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

สถาปัตยกรรมด้านการใช้เหตุผล (Reasoning Architecture)

GPT-5.1 ใช้สถาปัตยกรรมแบบ System 2 thinking ซึ่งช่วยให้ model ปรับเวลาในการประมวลผลตามความซับซ้อนของคำถาม สำหรับบทพิสูจน์ทางคณิตศาสตร์ มันจะใช้การอนุมานเชิงตรรกะในระดับลึก ในขณะที่งานสนทนาทั่วไปจะรักษา latency ให้ต่ำ ระบบ adaptive reasoning ช่วยให้มั่นใจได้ว่าทรัพยากรประมวลผลจะถูกจัดสรรในส่วนที่ให้คุณค่าสูงสุด

ประสิทธิภาพแบบ Multimodal

model ใช้โครงสร้างแบบ omni multimodal สำหรับ input ทั้งแบบข้อความและ vision ช่วยลด latency ในงานการสกัดข้อมูลเอกสารระดับองค์กรได้ถึง 84% เมื่อเทียบกับรุ่นก่อนหน้า การปรับปรุงการจดจำบริบททำให้มั่นใจได้ว่าข้อมูลจะถูกรักษาไว้ตลอดเวิร์กโฟลว์ agentic ที่ยาวนาน ทำให้เหมาะสำหรับโครงการวิศวกรรมซอฟต์แวร์ขนาดใหญ่

ระบบปรับแต่งส่วนบุคคล (Personalization Systems)

มี engine ใหม่ที่ช่วยให้สามารถควบคุมน้ำเสียงและลักษณะนิสัยได้ ผู้ใช้สามารถตั้งค่าให้ model มีความเป็นมืออาชีพ, เป็นกันเอง, หรือดูมีชีวิตชีวาผ่านคำสั่ง system instructions ที่ชัดเจน คุณลักษณะเหล่านี้ช่วยให้นักพัฒนาสามารถปรับใช้บอทที่ตรงกับอัตลักษณ์ของแบรนด์และความต้องการของผู้ใช้ได้ดียิ่งขึ้นโดยไม่ต้องใช้การ prompt แบบ few-shot มากเกินไป

GPT-5.1

กรณีการใช้งานสำหรับ GPT-5.1

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ GPT-5.1 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

วิศวกรรมซอฟต์แวร์แบบ Agentic

model ช่วยทำ refactor โค้ดที่ซับซ้อนใน codebase ขนาดใหญ่โดยใช้การ reasoning ที่มีความแม่นยำสูง

งานวิจัยระดับปริญญาเอก

ช่วยแก้ปัญหาที่ซับซ้อนในด้านชีววิทยาและฟิสิกส์ที่ต้องการการอนุมานหลายขั้นตอนที่ผ่านการตรวจสอบแล้ว

การวิเคราะห์เอกสารสำหรับองค์กร

ระบบสามารถสกัดข้อมูลที่มีโครงสร้างจากเอกสารรูปแบบตารางจำนวนมหาศาลด้วยความแม่นยำทางสายตาสูง

การสนับสนุนลูกค้าแบบส่วนบุคคล

นักพัฒนาสามารถปรับใช้บอทที่มีลักษณะเฉพาะของแบรนด์ เช่น ความเป็นกันเองหรือความเป็นมืออาชีพ เพื่อให้ตรงกับความรู้สึกของผู้ใช้

การแก้ปัญหาทางคณิตศาสตร์

model ใช้คะแนน AIME 99.6% เพื่อตรวจสอบบทพิสูจน์และสอนนักเรียนในวิชาคณิตศาสตร์ขั้นสูง

Business Intelligence ด้วย Vision

วิเคราะห์แผนภูมิและรายงานทางการเงินที่ซับซ้อนเพื่อสรุปใจความสำคัญสำหรับผู้บริหารพร้อมบริบททางสายตา

จุดแข็ง

ข้อจำกัด

การใช้เหตุผลทางคณิตศาสตร์ระดับสูง: model ทำคะแนนได้ถึง 99.6% ใน AIME 2025 ซึ่งเหนือกว่า model ส่วนใหญ่ที่เคยมีมา
Output Latency สูง: การ reasoning ที่ใช้ความพยายามสูงอาจทำให้เวลาในการตอบสนองนานกว่า 20 วินาทีสำหรับคำถามที่ซับซ้อน
การประมวลผลแบบปรับตัว (Adaptive Processing): การปรับสเกลพลังประมวลผลแบบไดนามิกช่วยลด latency ได้ถึง 84% สำหรับงานเอกสารองค์กรทั่วไป
ไม่มี Audio ในตัว: ขาดความสามารถ speech-to-speech ในตัวเหมือนที่มีในคู่แข่งอย่าง Gemini 2.0
การควบคุมบุคลิกภาพที่ดียิ่งขึ้น: การควบคุมน้ำเสียงโดยตรงทำให้การโต้ตอบดูอบอุ่นและเป็นมนุษย์มากกว่า GPT-5 รุ่นดั้งเดิม
ราคา Output: ด้วยราคา 10 ดอลลาร์ต่อล้าน tokens ค่าใช้จ่ายของ output ที่เกิดจากการ reasoning ยาวๆ จะสูงกว่า model แบบทันทีอย่างมาก
Large Scale Context: context window ขนาด 400,000 tokens รวมกับการทำ caching นาน 24 ชั่วโมง ช่วยรองรับเวิร์กโฟลว์ agentic ขนาดใหญ่ได้
ลักษณะเฉพาะทางสไตล์ที่ยังคงอยู่: ผู้ใช้รายงานว่า model ยังคงมีปัญหาในการหลีกเลี่ยงรูปแบบเครื่องหมายวรรคตอนบางอย่าง แม้จะได้รับคำสั่งในหน่วยความจำที่ชัดเจนแล้วก็ตาม

เริ่มต้นด่วน API

openai/gpt-5.1

ดูเอกสาร
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ GPT-5.1

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ GPT-5.1

GPT-5.1 ใน Codex ยังคงเป็นตัวตรวจสอบที่ดีที่สุดสำหรับงานวางแผนและตรวจสอบโค้ด
darrenjr
twitter
การประเมินของเราพบว่า GPT-5 ทำงานได้ดีกว่า model ชั้นนำอื่นๆ ถึง 190% ในด้านการใช้เหตุผลที่ซับซ้อน
CodeRabbit
twitter
GPT-5.1 ถูกปรับจูนมาให้เข้ากับความยากของ prompt ได้ดีขึ้น ทำให้ใช้ tokens น้อยลงมากในงานที่ง่าย
Tech Titans
facebook
การเปิดตัวครั้งนี้เน้นไปที่บุคลิกภาพและการทำให้ ChatGPT รู้สึกถึงความเป็นทางการน้อยลงและไม่ดูไร้ชีวิตชีวาจนเกินไป
Theo
youtube
400k context window ช่วยชีวิตเราไว้ได้เยอะสำหรับการวิเคราะห์ repo ทั้งหมดของเรา
RedditUser99
reddit
ยังไม่มีระบบ audio ในตัวถือว่าน่าเสียดาย แต่การเพิ่มประสิทธิภาพในด้าน reasoning นั้นเกิดขึ้นจริง
HackerNewsGuy
hackernews

วิดีโอเกี่ยวกับ GPT-5.1

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ GPT-5.1

GPT 5.1 มาถึงแล้ว มันเร็วขึ้น แม่นยำขึ้น และโต้ตอบได้ดีขึ้น

เป็นครั้งแรกที่ GPT 5.1 Instant สามารถใช้ adaptive reasoning เพื่อตัดสินใจว่าควรจะคิดตอนไหน

ตรรกะในเวอร์ชันนี้ดีกว่า GPT 5 รุ่นมาตรฐานอย่างเห็นได้ชัด

มันสามารถรักษาโทนเสียงที่อบอุ่นกว่าที่เราเห็นในรุ่นพรีวิวที่ผ่านมาได้

หากคุณเป็นนักพัฒนา การขยาย prompt caching จะช่วยประหยัดเงินคุณได้มหาศาล

มันปรับแต่งส่วนบุคคลได้มากกว่าที่เคยเป็นมา

น้ำเสียงฟังดูเป็นธรรมชาติมากขึ้น... 5.1 ดีขึ้นมากในแง่ของพลังงาน

ผมสังเกตว่ามันหลอนน้อยลงในระหว่างขั้นตอนการทำงานที่ซับซ้อน

ความเร็วของโหมด instant ใกล้เคียงกับ GPT 4o mini แต่มีความฉลาดมากกว่า

คุณสมบัติการปรับแต่งส่วนบุคคลหมายความว่าคุณสามารถบอกให้มันเลิกเป็นทางการเกินไปได้จริง ๆ

นี่อาจเป็นหนึ่งในการอัปเดตแบบวนซ้ำที่ผ่อนคลายที่สุดสำหรับ Frontier model

มันสร้างผลลัพธ์เกม bumper car ที่ประสบความสำเร็จเมื่อเทียบกับการคิดของ GPT5

การประมวลผล vision บนเอกสารลายมือคมชัดขึ้นอย่างเห็นได้ชัด

ผมคิดว่าปุ่มสลับ reasoning effort เป็นฟีเจอร์ที่ดีที่สุดสำหรับการจัดการต้นทุน API

ในที่สุดมันก็รู้สึกเหมือนเป็น model ที่คุณสามารถคุยด้วยได้โดยไม่ฟังดูเหมือนตำราเรียน

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ GPT-5.1

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก GPT-5.1 และได้ผลลัพธ์ที่ดีขึ้น

ปรับระดับ Reasoning Effort

ใช้พารามิเตอร์ reasoning_effort เพื่อตั้งค่าระดับการคิดเป็น high สำหรับงานคณิตศาสตร์ และเป็น none สำหรับการแชททั่วไป เพื่อประหยัด latency

ใช้ประโยชน์จาก Large Context

ใช้ประโยชน์จาก 400k context window สำหรับโฟลเดอร์โปรเจกต์ทั้งหมด เนื่องจาก model สามารถจดจำข้อมูลได้ดีใน prompt ที่ยาว

การควบคุมระดับเสียง (Tone Steering)

เปิดใช้งานคุณลักษณะด้านน้ำเสียงในคำสั่ง system instructions เพื่อทำให้ model ฟังดูเป็นทางการน้อยลงและเหมือนเพื่อนร่วมงานมากขึ้น

การทำ Prompt Caching

ใช้ประโยชน์จากการทำ prompt caching นาน 24 ชั่วโมงเพื่อลดค่าใช้จ่ายเมื่อรันลูป agentic ซ้ำๆ บน codebase เดิม

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

คำถามที่พบบ่อยเกี่ยวกับ GPT-5.1

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ GPT-5.1