openai

GPT-5.2

GPT-5.2 คือ flagship model ของ OpenAI สำหรับงานระดับมืออาชีพ พร้อม context window ขนาด 400K, ทักษะการเขียนโค้ดขั้นเทพ และความสามารถด้าน reasoning...

openai logoopenaiGPT-511 ธันวาคม 2025
บริบท
400Kโทเคน
เอาต์พุตสูงสุด
100Kโทเคน
ราคาอินพุต
$1.75/ 1M
ราคาเอาต์พุต
$14.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
93%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% GPT-5.2 ได้คะแนน 93% ในเกณฑ์มาตรฐานนี้
HLE
45%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง GPT-5.2 ได้คะแนน 45% ในเกณฑ์มาตรฐานนี้
MMLU
88%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา GPT-5.2 ได้คะแนน 88% ในเกณฑ์มาตรฐานนี้
MMLU Pro
83%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น GPT-5.2 ได้คะแนน 83% ในเกณฑ์มาตรฐานนี้
SimpleQA
58%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง GPT-5.2 ได้คะแนน 58% ในเกณฑ์มาตรฐานนี้
IFEval
95%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด GPT-5.2 ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
AIME 2025
100%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง GPT-5.2 ได้คะแนน 100% ในเกณฑ์มาตรฐานนี้
MATH
98%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส GPT-5.2 ได้คะแนน 98% ในเกณฑ์มาตรฐานนี้
GSM8k
99%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา GPT-5.2 ได้คะแนน 99% ในเกณฑ์มาตรฐานนี้
MGSM
98%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา GPT-5.2 ได้คะแนน 98% ในเกณฑ์มาตรฐานนี้
MathVista
78%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ GPT-5.2 ได้คะแนน 78% ในเกณฑ์มาตรฐานนี้
SWE-Bench
80%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python GPT-5.2 ได้คะแนน 80% ในเกณฑ์มาตรฐานนี้
HumanEval
95%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง GPT-5.2 ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
80%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง GPT-5.2 ได้คะแนน 80% ในเกณฑ์มาตรฐานนี้
MMMU
75%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย GPT-5.2 ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
MMMU Pro
65%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น GPT-5.2 ได้คะแนน 65% ในเกณฑ์มาตรฐานนี้
ChartQA
93%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ GPT-5.2 ได้คะแนน 93% ในเกณฑ์มาตรฐานนี้
DocVQA
95%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร GPT-5.2 ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
60%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line GPT-5.2 ได้คะแนน 60% ในเกณฑ์มาตรฐานนี้
ARC-AGI
52.9%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ GPT-5.2 ได้คะแนน 52.9% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ GPT-5.2

เรียนรู้เกี่ยวกับความสามารถของ GPT-5.2 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

GPT-5.2 คือ flagship reasoning model ของ OpenAI ที่ออกแบบมาเพื่อการทำงานด้านความรู้ระดับมืออาชีพที่มีความสำคัญสูงและการวิศวกรรมแบบอัตโนมัติ เปิดตัวเมื่อวันที่ 11 ธันวาคม 2025 โดยถือเป็นวิวัฒนาการครั้งสำคัญจากตระกูล GPT-4 และ GPT-o1 ด้วยการรวม Thinking mode ที่ปรับระดับความพยายามได้ (Medium, High, Extra High) ซึ่งช่วยให้ model หยุดไตร่ตรองและตรวจสอบตรรกะหลายขั้นตอนก่อนสร้างคำตอบ

ด้วยขนาด 400K context window และความสามารถในการเรียกคืนข้อมูลได้เกือบ 100% จึงได้รับการออกแบบมาเพื่อการรีวิวโค้ดระดับอาวุโส การ refactoring ที่ซับซ้อน และการวิจัยทางวิทยาศาสตร์ สถาปัตยกรรมของ model ถูกสร้างมาเพื่อรองรับ agentic workflows พร้อมความสามารถในการเรียกใช้เครื่องมือในตัวและ multimodal vision ที่สามารถประมวลผลไดอะแกรมทางเทคนิคและ codebase ที่ซับซ้อนไปพร้อมๆ กัน

แม้ว่าจะโดดเด่นในด้านความแม่นยำเชิงตรรกะและ benchmark ทางวิศวกรรม โดยทำคะแนนได้ 100% บน AIME 2025 แต่ model ก็นำเสนอโทนเสียงที่เป็นทางการเหมือนเครื่องจักรมากกว่าเมื่อเทียบกับคู่แข่งอย่าง Claude ปัจจุบันมีราคาอยู่ที่ 1.75 ดอลลาร์ต่อล้าน input tokens และ 14.00 ดอลลาร์ต่อล้าน output tokens ทำให้เป็นทางเลือกที่คุ้มค่าสำหรับงานที่ต้องใช้ deep reasoning ซึ่งก่อนหน้านี้ต้องอาศัยการดูแลจากมนุษย์ที่ใช้การประมวลผลสูง

GPT-5.2

กรณีการใช้งานสำหรับ GPT-5.2

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ GPT-5.2 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

การ Refactor งานวิศวกรรมที่ซับซ้อน

ดำเนินการ refactor โค้ดที่เน้นประสิทธิภาพสูงในขณะที่รักษาประเภทข้อมูล (type invariants) และความสอดคล้องทางสถาปัตยกรรมไว้อย่างเคร่งครัด

งาน CLI แบบอัตโนมัติ

ดำเนินการเวิร์กโฟลว์ CLI หลายขั้นตอนและจัดการการ deploy ระบบคลาวด์ที่ซับซ้อนผ่านประสิทธิภาพสูงบนสภาพแวดล้อม Terminal-Bench

การสังเคราะห์ความรู้ระดับปริญญาเอก

วิเคราะห์แหล่งข้อมูลทางเทคนิคและงานวิจัยทางวิชาการหลายร้อยรายการพร้อมกัน เพื่อสร้างรายงานการวิจัยที่ครอบคลุมในหัวข้อเฉพาะทาง

การแก้ไขบั๊กประเภท Concurrency

ระบุและแก้ไขปัญหา race conditions หรือ memory leaks ที่ละเอียดอ่อน ซึ่งต้องใช้การ inference เชิงตรรกะระดับสูงผ่านโค้ดช่วงยาว

การประมวลผลโค้ดเชิงกลไก

จัดการการย้ายโค้ดซ้ำๆ ขนาดใหญ่ทั่วทั้ง repository โดยปราศจากอาการขี้เกียจที่มักพบใน LLM ทั่วไป

การตรวจสอบทางเทคนิคระดับ Senior

ทำหน้าที่เป็นวิศวกรอาวุโสเสมือนเพื่อตรวจสอบแผนงานออกแบบและระบุ edge cases ในตรรกะสำหรับระบบที่ใช้งานจริง

จุดแข็ง

ข้อจำกัด

ความแม่นยำทางวิศวกรรมที่เหนือกว่า: ทำคะแนนได้ 77.3% บน Terminal-Bench 2.0 ซึ่งเอาชนะคู่แข่งในงาน command-line interface ที่ซับซ้อน
Latency ของการตอบสนองที่สูง: ภาระงานด้าน reasoning ที่เพิ่มขึ้นทำให้ model ทำงานช้ากว่ารุ่นก่อนหน้าอย่างเห็นได้ชัด นำไปสู่ระยะเวลารอคอยที่นานขึ้น
การทำ Reasoning ทางคณิตศาสตร์ขั้นสูง: ทำคะแนนได้ 100% ใน benchmark ของ AIME 2025 ซึ่งแสดงให้เห็นถึงความสามารถทางคณิตศาสตร์ระดับการแข่งขันโดยไม่ต้องใช้เครื่องมือภายนอก
โทนเสียงของ UX ที่ดูสังเคราะห์: ผู้ใช้บางกลุ่มวิจารณ์ว่าความช่วยเหลือที่ดูเป็นทางการและมีโครงสร้างมากเกินไป ให้ความรู้สึกไม่เป็นธรรมชาติเท่ากับตระกูล Claude
อัตรา Hallucination ต่ำ: การทดสอบจากชุมชนและ benchmark ภายในแสดงให้เห็นว่าอัตราการสร้างข้อมูลเท็จลดลง 30% เมื่อเทียบกับรุ่น flagship ก่อนหน้า
กระบวนการคิดที่ไม่โปร่งใส: ต่างจากบาง model ที่เน้นความโปร่งใส GPT-5.2 มักจะซ่อน chain-of-thought ภายใน โดยแสดงเฉพาะคำตอบสุดท้ายที่ตรวจสอบแล้วเท่านั้น
การทำงานที่ต่อเนื่องยาวนาน: สามารถประคองเซสชันการทำงานอัตโนมัติได้นานกว่าสองชั่วโมง ทำให้เหมาะสำหรับงานพัฒนาขนาดใหญ่
ต้นทุนด้าน Reasoning ระดับพรีเมียม: ราคา output ที่ 14.00 ดอลลาร์สามารถพุ่งสูงขึ้นอย่างรวดเร็วในงานที่ต้องทำ reasoning นานๆ ซึ่งมีการคิดค่าบริการ thinking tokens จำนวนมาก

เริ่มต้นด่วน API

openai/gpt-5.2

ดูเอกสาร
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function solveCodeProblem() {
  const response = await openai.chat.completions.create({
    model: 'gpt-5.2',
    messages: [{ role: 'user', content: 'Debug this race condition in my Rust service.' }],
    reasoning_effort: 'high',
    temperature: 0,
  });
  console.log(response.choices[0].message.content);
}

solveCodeProblem();

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ GPT-5.2

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ GPT-5.2

GPT 5.2 ใน Codex เป็นการปรับปรุงครั้งใหญ่ มันเต็มใจที่จะจัดการงานเชิงกลไกที่ปกติมักจะทำให้ model อื่นๆ ขี้เกียจ
ArchMeta1868
reddit
การไตร่ตรองและเวลาที่ใช้ในการตรวจสอบความถูกต้องของผลลัพธ์ที่เพิ่มขึ้นนั้นน่าชื่นชม... ความน่าเชื่อถือได้รับการปรับปรุงอย่างมาก
Thomas Randall
techopedia
model ที่ขับเคลื่อน deep research แสดงให้เห็นถึงแนวทางที่คล้ายมนุษย์โดยการค้นหาข้อมูลเฉพาะทางเมื่อจำเป็นได้อย่างมีประสิทธิภาพ
OpenAI Official
twitter
ความมุ่งเน้นของ OpenAI เรื่อง 'การดูแลผู้ใช้' ที่เป็นโครงสร้าง รู้สึกเหมือนเป็นหน้ากากองค์กรที่ดูเย็นชาเมื่อเทียบกับการสนทนาที่เป็นธรรมชาติใน Claude
Anonymous Developer
hackernews
ในที่สุดก็มี model ที่ไม่ขี้เกียจกลางคันระหว่างการ refactor โค้ด 500 บรรทัด
CodeWizard
reddit
พารามิเตอร์ reasoning effort คือ MVP ตัวจริงสำหรับปัญหาตรรกะที่ซับซ้อน
AIBuilder
twitter

วิดีโอเกี่ยวกับ GPT-5.2

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ GPT-5.2

มันสุดยอดจริงๆ ลองดูช็อตนี้สิ

เรื่องการออกแบบ ผมไม่ค่อยประทับใจ GPT 5.2 เท่าไหร่... มันทำได้แย่กว่า Gemini 3

ความสามารถในการดึงข้อมูลจาก context แทบจะสมบูรณ์แบบตลอดช่วง 400k

มันรู้สึกเหมือนเป็น reasoning engine มากกว่าแค่ chatbot

Latency คืออุปสรรคสำคัญสำหรับแอปแบบ real-time บางตัว

ตอนนี้ GPT 5.2 สามารถสร้างสเปรดชีตและสไลด์ที่จัดรูปแบบเต็มรูปแบบได้ภายในแชท GPT แล้ว

เหมือนว่าในที่สุด model ก็โตเป็นผู้ใหญ่และเริ่มจริงจังกับงานของมันสักที

ใช้การตั้งค่า reasoning ระดับสูงสำหรับงานที่เน้นตรรกะหนักๆ เท่านั้น

อัตราการ hallucination ลดลงอย่างมากเมื่อเทียบกับตระกูล 4o

ในที่สุด agentic workflows ก็สามารถนำมาใช้งานได้จริงโดยไม่ต้องคอยดูแลตลอดเวลา

GPT 5.2 แพงกว่า 5.1 ประมาณ 40% แต่ก็ยังถูกกว่า Opus มากอยู่ดี

GPT 5.2 ใช้เวลาไป 11 นาที 20 วินาที [ในการสร้างแอป] ซึ่งถือว่านานกว่า Opus เป็นสองเท่า

คุณภาพของผลลัพธ์จะสูงขึ้นมากเมื่อคุณปล่อยให้โหมดการคิดทำงานเต็มที่

มันจัดการการ refactor ข้ามไฟล์โดยไม่ทำ type definitions หาย

ถ้าคุณต้องการความเร็วระดับดิบ นี่ไม่ใช่ model สำหรับคุณ

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ GPT-5.2

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก GPT-5.2 และได้ผลลัพธ์ที่ดีขึ้น

ใช้ประโยชน์จาก Thinking Effort

ใช้พารามิเตอร์ reasoning_effort (medium, high, xhigh) เพื่อปรับเวลาการไตร่ตรองของ model ให้เหมาะสมกับความซับซ้อนของงาน

เปิดใช้งาน Codex เพื่อความต่อเนื่อง

เมื่อทำงานกับ repo ขนาดใหญ่ ให้ใช้สภาพแวดล้อม Codex โดยเฉพาะเพื่อรักษาเซสชันการประมวลผลที่ต่อเนื่องสูงสุด 150 นาที

ป้อน Context ให้ครบถ้วน

จัดเตรียมเอกสารพื้นฐานที่ครบถ้วนใน system prompts เนื่องจาก model จะทำงานได้ดีที่สุดเมื่อได้รับข้อมูลบริบทที่จำเป็น

ทำซ้ำตามความต้องการ

สั่งการ model อย่างชัดเจนให้ทำการตรวจสอบเทียบกับ codebase ปัจจุบันเพื่อให้แน่ใจว่าข้อกำหนดได้รับการยืนยันแล้ว

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

คำถามที่พบบ่อยเกี่ยวกับ GPT-5.2

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ GPT-5.2