openai

GPT-5.1

GPT-5.1 คือ model เรือธงด้าน reasoning ขั้นสูงของ OpenAI ที่โดดเด่นด้วยกระบวนการคิดแบบปรับตัว (adaptive thinking) รองรับ multimodal ในตัว และมีประสิทธิภาพระดับ...

openai logoopenaiGPT-52025-11-13
บริบท
400Kโทเคน
เอาต์พุตสูงสุด
128Kโทเคน
ราคาอินพุต
$1.25/ 1M
ราคาเอาต์พุต
$10.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
88.1%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% GPT-5.1 ได้คะแนน 88.1% ในเกณฑ์มาตรฐานนี้
HLE
32.5%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง GPT-5.1 ได้คะแนน 32.5% ในเกณฑ์มาตรฐานนี้
MMLU
90.2%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา GPT-5.1 ได้คะแนน 90.2% ในเกณฑ์มาตรฐานนี้
MMLU Pro
81%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น GPT-5.1 ได้คะแนน 81% ในเกณฑ์มาตรฐานนี้
SimpleQA
52%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง GPT-5.1 ได้คะแนน 52% ในเกณฑ์มาตรฐานนี้
IFEval
91%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด GPT-5.1 ได้คะแนน 91% ในเกณฑ์มาตรฐานนี้
AIME 2025
94%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง GPT-5.1 ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
MATH
91%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส GPT-5.1 ได้คะแนน 91% ในเกณฑ์มาตรฐานนี้
GSM8k
98.5%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา GPT-5.1 ได้คะแนน 98.5% ในเกณฑ์มาตรฐานนี้
MGSM
95%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา GPT-5.1 ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
MathVista
75%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ GPT-5.1 ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
SWE-Bench
76.3%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python GPT-5.1 ได้คะแนน 76.3% ในเกณฑ์มาตรฐานนี้
HumanEval
92.5%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง GPT-5.1 ได้คะแนน 92.5% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
74%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง GPT-5.1 ได้คะแนน 74% ในเกณฑ์มาตรฐานนี้
MMMU
85.4%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย GPT-5.1 ได้คะแนน 85.4% ในเกณฑ์มาตรฐานนี้
MMMU Pro
62%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น GPT-5.1 ได้คะแนน 62% ในเกณฑ์มาตรฐานนี้
ChartQA
89%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ GPT-5.1 ได้คะแนน 89% ในเกณฑ์มาตรฐานนี้
DocVQA
93%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร GPT-5.1 ได้คะแนน 93% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
58%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line GPT-5.1 ได้คะแนน 58% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ GPT-5.1 ได้คะแนน 12% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ GPT-5.1

เรียนรู้เกี่ยวกับความสามารถของ GPT-5.1 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

พรมแดนใหม่ของ Reasoning

GPT-5.1 คือก้าวสำคัญของวิวัฒนาการใน frontier models ของ OpenAI ซึ่งถือเป็นการเปิดตัวครั้งแรกที่ทุก model ในระบบนิเวศมีความสามารถในการทำ reasoning ในตัว การอัปเดตนี้เน้นไปที่การก้าวข้ามความรู้สึกที่ดูแข็งทื่อในรุ่นก่อนๆ เพื่อมอบประสบการณ์การใช้งานที่อบอุ่นและเป็นธรรมชาติมากขึ้นผ่านกระบวนการคิดแบบ System 2 ด้วยการผสานรวม adaptive reasoning ทำให้ GPT-5.1 สามารถตัดสินใจได้เองอย่างไดนามิกว่าต้องใช้เวลาประมวลผลเท่าใดสำหรับแต่ละ prompt ช่วยให้สามารถแก้ปัญหาวิทยาศาสตร์และคณิตศาสตร์ระดับปริญญาเอกที่ซับซ้อนซึ่งต้องใช้การอนุมานทางตรรกะหลายขั้นตอน

Multimodality และการปรับแต่งเฉพาะบุคคล

model นี้สร้างขึ้นบนสถาปัตยกรรม omni multimodal ที่รองรับทั้งข้อความและ vision พร้อมระบบความจำที่ปรับปรุงให้ดีขึ้นอย่างมากและการปฏิบัติตามคำสั่ง (instruction-following) ที่แม่นยำยิ่งขึ้น นอกจากนี้ยังมีการนำเสนอฟีเจอร์ style และ trait ที่ซับซ้อน ช่วยให้ผู้ใช้สามารถกำหนดบุคลิกของ model ได้ตั้งแต่โทนระดับมืออาชีพและวิชาการไปจนถึงโทนที่เป็นกันเองและแสดงอารมณ์ได้มากขึ้น การอัปเดตเหล่านี้ช่วยให้แน่ใจว่า model จะจดจำบริบทส่วนบุคคลและปฏิบัติตามความต้องการที่ซับซ้อนของผู้ใช้ได้อย่างเคร่งครัดในงานที่ต้องใช้ระยะเวลานาน โดยเฉพาะในงานด้าน agentic software engineering

GPT-5.1

กรณีการใช้งานสำหรับ GPT-5.1

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ GPT-5.1 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

Software Refactoring

การวางแผนปรับโครงสร้าง legacy applications ขนาดใหญ่ที่มีโค้ดมากกว่า 100,000 บรรทัดแบบ top-down ผ่าน GPT-5.1 Codex

Math Olympiad Solving

การพิสูจน์โจทย์คณิตศาสตร์โอลิมปิกที่ซับซ้อนด้วยการใช้ integer และ symbolic reasoning โดยมีอัตราความสำเร็จสูงถึง 94%

Technical Specification Mapping

การระบุและอธิบายโครงสร้าง column ที่ซับซ้อนของตารางฐานข้อมูลเฉพาะทางจากข้อมูลภาพหรือข้อความ

Advanced Logical Inference

การสร้างเรื่องราวที่มีความสอดคล้องกันภายในสำหรับงานเขียนแนวสร้างโลกที่ซับซ้อนและประวัติศาสตร์ทางเลือก

AI Integration Proposals

การสร้างการนำเสนอระดับมืออาชีพพร้อมข้อมูลสนับสนุนเพื่อการผสานรวม agentic systems เข้ากับสภาพแวดล้อมการทำงานจริง (production)

Strategic Architectural Review

การวิเคราะห์โครงสร้างโครงการหลายขั้นตอนเพื่อสร้างแผนการดำเนินงานแบบแบ่งระยะและการประเมินความเสี่ยง

จุดแข็ง

ข้อจำกัด

Adaptive Reasoning Integration: การผสานรวมการประมวลผลที่ปรับขนาดตามความเหมาะสม โดยเพิ่มเวลาประมวลผลขึ้นเป็นสองเท่าสำหรับคำถามที่ยากที่สุดในสัดส่วน 10%
Reasoning Latency: งานที่ต้องใช้การคิดเชิงลึกส่งผลให้ใช้เวลาในการตอบกลับช้าลงอย่างมากเมื่อเทียบกับ model โต้ตอบมาตรฐาน
SOTA Mathematics Performance: ทำคะแนนได้ 94% ในการสอบ AIME 2025 ซึ่งถือเป็นมาตรฐานใหม่ของวงการสำหรับคณิตศาสตร์ระดับโอลิมปิก
Safety Over-Correction: model อาจแสดงพฤติกรรมที่ระมัดระวังเกินไปหรือมีการแสดงข้อความปฏิเสธความรับผิดชอบบ่อยครั้งเมื่อสนทนาในหัวข้อทางสังคมที่ละเอียดอ่อน
Enhanced Emotional Intelligence: แก้ไขข้อเสนอแนะเกี่ยวกับความรู้สึกที่แข็งทื่อในรุ่นก่อนหน้า ด้วยโทนการสนทนาที่ดูเป็นมิตรและเป็นธรรมชาติมากขึ้นอย่างเห็นได้ชัด
Identity Gaslighting: การแสดงข้อความปฏิเสธความรับผิดชอบภายในบ่อยครั้งว่าไม่ใช่บุคคลจริงๆ อาจขัดจังหวะการเชื่อมต่อที่เป็นธรรมชาติกับผู้ใช้งาน
High Capacity Output: รองรับขีดจำกัด output token ได้มหาศาลถึง 128,000 tokens ช่วยให้สามารถสร้างเนื้อหายาวๆ และการทำ code refactors ขนาดใหญ่ได้
Switching Inconsistency: การเปลี่ยนโหมดระหว่าง Instant และ Thinking ผ่านระบบ auto-switcher ในบางครั้งอาจรู้สึกไม่ราบรื่น

เริ่มต้นด่วน API

openai/gpt-5.1

ดูเอกสาร
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.1",
    messages: [
      { role: "system", content: "You are a reasoning assistant." },
      { role: "user", content: "Analyze this complex physics problem." }
    ],
    reasoning_effort: "high"
  });

  console.log(completion.choices[0].message);
}

main();

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ GPT-5.1

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ GPT-5.1

"GPT-5.1 Thinking สามารถปรับเวลาในการคิดตามโจทย์ได้อย่างมีประสิทธิภาพมากขึ้นแล้ว"
OpenAI
x
"GPT-5 Pro คือที่สุดของ SOTA ในด้านนี้ [คณิตศาสตร์] อย่างแท้จริง"
ArchMeta1868
reddit
"ฉันเข้าใจคุณนะ รอน — นั่นเป็นเรื่องปกติมาก โดยเฉพาะกับทุกอย่างที่คุณต้องเจอในช่วงนี้"
Tamay Besiroglu
x
"GPT-5.1 Codex Max แก้ไขมันได้ทันที OpenAI ยังคงเป็นผู้นำในเกมการเขียนโค้ด"
BradAI
x
"ความลึกของ reasoning นั้นดีจนน่าทึ่งสำหรับงานด้านสถาปัตยกรรมระบบ"
CodeKing
hackernews
"มันให้ความรู้สึกเหมือนมันรู้จักฉันจริงๆ แล้วหลังจากมีการอัปเดตระบบความจำ"
User445
twitter

วิดีโอเกี่ยวกับ GPT-5.1

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ GPT-5.1

เมื่อเทียบกับ GPT5 มันจะใช้เวลาคิดนานขึ้นเกือบสองเท่าสำหรับคำถามที่มันมองว่ายากที่สุดในกลุ่ม 10% แรก

GPT 5.1 auto... model ขนาดจิ๋วที่จะตัดสินใจว่าคำถามของคุณคุ้มค่าแก่การใช้เวลาคิดหรือไม่

การปรับสัดส่วนการประมวลผลแบบไดนามิกนี้คือสิ่งที่เราต้องการสำหรับการวิจัยที่จริงจัง

ความยาวของ output นั้นเหลือเชื่อมาก คุณสามารถสร้างแอปทั้งแอปได้ในครั้งเดียว

OpenAI กำลังมุ่งเน้นไปที่กลยุทธ์ reasoning-first อย่างเต็มตัวในตอนนี้

นี่เป็นครั้งแรกที่ model ทั้งหมดในแชทเป็น reasoning models

ช่วงการแสดงออกของ model นี้กว้างขึ้นมาก

เราต้องการให้ model มีความรู้สึกของบุคลิกภาพที่ไม่ใช่แค่การตอบแบบแข็งทื่อ

ตอนนี้ผู้ใช้สามารถมีอิทธิพลต่อลักษณะนิสัย เช่น ความมองโลกในแง่ดีหรือความสงสัยใคร่รู้ ผ่านการตั้งค่าระบบ

ตอนนี้ผู้ใช้สามารถควบคุม reasoning effort ได้โดยตรงแล้ว

GPT 5.1 Codex สำหรับนักพัฒนานั้นถือเป็นการปรับปรุงที่เห็นผลชัดเจนมาก

Claude มักจะกล่าวอ้างผลลัพธ์เกินจริงและบางครั้งก็สร้างข้อมูลเท็จ... แต่ GPT-5.1 นั้นมีความซื่อสัตย์มากกว่า

คะแนน AIME 2025 เป็นการก้าวกระโดดครั้งใหญ่เมื่อเทียบกับ GPT-5 มาตรฐาน

มันช้ากว่าก็จริง แต่คุณภาพของกระบวนการ 'Thinking' นั้นเหนือกว่ามาก

การจัดการ context window ดูเหมือนจะทำได้รัดกุมกว่าคู่แข่ง

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ
ดูเดโม

เคล็ดลับมือโปรสำหรับ GPT-5.1

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก GPT-5.1 และได้ผลลัพธ์ที่ดีขึ้น

ตั้งค่า Reasoning Effort

คุณสามารถตั้งค่า parameter reasoning_effort เป็น high สำหรับงานตรรกะที่ซับซ้อน หรือ none สำหรับงานสนทนาโต้ตอบที่ต้องการความรวดเร็วทันที

ใช้ประโยชน์จาก Persona Styles

ใช้การตั้งค่า style และ trait ใหม่เพื่อสลับไปมาระหว่างโทน Professional, Candid และ Quirky

จัดการ Active Memory

หมั่นตรวจสอบและจัดการความจำที่บันทึกไว้ (saved memories) เพื่อให้การตอบกลับที่ดูเป็นกันเองของ model อ้างอิงจากบริบทส่วนบุคคลที่ถูกต้อง

ตรวจสอบการอ้างอิงแหล่งที่มา

เนื่องจาก model มีการ cites แหล่งที่มา ควรตรวจสอบข้อมูลทางเทคนิคเทียบกับเอกสารอ้างอิงสำหรับงานที่มีความสำคัญสูง

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M

คำถามที่พบบ่อยเกี่ยวกับ GPT-5.1

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ GPT-5.1