xai

Grok-4

Grok-4 โดย xAI เป็น frontier model ที่มาพร้อม context window ขนาด 2M, การเชื่อมต่อแพลตฟอร์ม X แบบเรียลไทม์ และความสามารถในการ reasoning ระดับโลก

xai logoxaiGrok9 กรกฎาคม 2025
บริบท
2.0Mโทเคน
เอาต์พุตสูงสุด
8Kโทเคน
ราคาอินพุต
$3.00/ 1M
ราคาเอาต์พุต
$15.00/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่งการใช้เหตุผล
เกณฑ์มาตรฐาน
GPQA
87.5%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Grok-4 ได้คะแนน 87.5% ในเกณฑ์มาตรฐานนี้
HLE
44.4%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง Grok-4 ได้คะแนน 44.4% ในเกณฑ์มาตรฐานนี้
MMLU
94%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Grok-4 ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
MMLU Pro
81.2%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Grok-4 ได้คะแนน 81.2% ในเกณฑ์มาตรฐานนี้
SimpleQA
48%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง Grok-4 ได้คะแนน 48% ในเกณฑ์มาตรฐานนี้
IFEval
89.2%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Grok-4 ได้คะแนน 89.2% ในเกณฑ์มาตรฐานนี้
AIME 2025
100%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Grok-4 ได้คะแนน 100% ในเกณฑ์มาตรฐานนี้
MATH
92%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Grok-4 ได้คะแนน 92% ในเกณฑ์มาตรฐานนี้
GSM8k
98.4%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Grok-4 ได้คะแนน 98.4% ในเกณฑ์มาตรฐานนี้
MGSM
92.1%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Grok-4 ได้คะแนน 92.1% ในเกณฑ์มาตรฐานนี้
MathVista
72.4%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Grok-4 ได้คะแนน 72.4% ในเกณฑ์มาตรฐานนี้
SWE-Bench
81%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Grok-4 ได้คะแนน 81% ในเกณฑ์มาตรฐานนี้
HumanEval
88%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Grok-4 ได้คะแนน 88% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
79.4%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Grok-4 ได้คะแนน 79.4% ในเกณฑ์มาตรฐานนี้
MMMU
75%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Grok-4 ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
MMMU Pro
59.2%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Grok-4 ได้คะแนน 59.2% ในเกณฑ์มาตรฐานนี้
ChartQA
90.5%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Grok-4 ได้คะแนน 90.5% ในเกณฑ์มาตรฐานนี้
DocVQA
93.2%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Grok-4 ได้คะแนน 93.2% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
54.2%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Grok-4 ได้คะแนน 54.2% ในเกณฑ์มาตรฐานนี้
ARC-AGI
15.9%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Grok-4 ได้คะแนน 15.9% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ Grok-4

เรียนรู้เกี่ยวกับความสามารถของ Grok-4 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

ภาพรวมของ Model

Grok-4 คือ frontier multimodal model จาก xAI ที่สร้างขึ้นโดยเน้นการใช้เหตุผลตามหลักการพื้นฐานและการดึงข้อมูลแบบเรียลไทม์ ตัว model ได้เปรียบในการแข่งขันอย่างมากจากการผสานรวมเข้ากับแพลตฟอร์มโซเชียล X ซึ่งช่วยให้วิเคราะห์การสนทนาและข่าวสารทั่วโลกได้ในทันทีที่มีเหตุการณ์เกิดขึ้น และใช้ supercomputer Colossus ในการฝึกสอน จึงได้ประสิทธิภาพระดับสูงทั้งในด้านคณิตศาสตร์และงานด้านเทคนิค

ความสามารถทางเทคนิค

สถาปัตยกรรมของตัว model รองรับ context window ขนาด 2 ล้าน tokens ในเวอร์ชัน reasoning ซึ่งช่วยให้สามารถประมวลผลฐานโค้ดขนาดมหึมาและเอกสารทางเทคนิคที่ซับซ้อนโดยไม่สูญเสียข้อมูล มีระบบ dual-mode ที่ผู้ใช้เลือกได้ระหว่างโหมดความเร็วสูงสำหรับการโต้ตอบด่วน หรือโหมด deep-thinking สำหรับงานตรรกะหลายขั้นตอน ตัว model สามารถควบคุมอัตราการหลอน (hallucination) ได้ที่ประมาณ 4% โดยใช้กลไก consensus แบบ multi-agent ในโหมด Heavy

การผสานรวมในระบบนิเวศ

นอกจากการสร้างข้อความทั่วไป Grok-4 ยังถูกออกแบบมาเพื่อรองรับ tool use และ complex function calling รองรับการประมวลผลทั้งรูปภาพและเสียง ทำให้เป็นตัวเลือกที่อเนกประสงค์สำหรับนักพัฒนาที่สร้างแอปพลิเคชัน multimodal กลยุทธ์การปรับแต่ง model มุ่งเน้นไปที่การแสวงหาความจริงเชิงวัตถุวิสัยมากกว่ามาตรฐานความปลอดภัยทั่วไปในอุตสาหกรรม ส่งผลให้มีการปฏิเสธในการตอบคำถามในประเด็นที่ละเอียดอ่อนหรือถกเถียงกันน้อยกว่า frontier model อื่นๆ

Grok-4

กรณีการใช้งานสำหรับ Grok-4

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Grok-4 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

การวิเคราะห์ Sentiment แบบเรียลไทม์

วิเคราะห์โพสต์สดบน X เพื่อระบุปฏิกิริยาของผู้คนต่อข่าวสารสำคัญหรือการเปิดตัวผลิตภัณฑ์ใหม่

การตรวจสอบ Repository ขนาดใหญ่

ประเมินซอร์สโค้ดทั้ง repository โดยใช้ context window ขนาด 2M เพื่อหาจุดบกพร่องทางสถาปัตยกรรม

การแก้โจทย์คณิตศาสตร์ระดับโอลิมปิก

ให้คำตอบแบบทีละขั้นตอนสำหรับการพิสูจน์ทางคณิตศาสตร์ที่ซับซ้อนและโจทย์ระดับ AIME

เนื้อหาสร้างสรรค์ที่ไร้การกรอง

สร้างบทสนทนาตามตัวละครและมุกตลกโดยไม่มีฟิลเตอร์จำกัดเหมือนผู้ให้บริการ AI รายอื่น

การสังเคราะห์งานวิจัยทางวิทยาศาสตร์

สรุปงานวิจัยระดับปริญญาเอกหลายฉบับพร้อมกันโดยยังคงรักษาความถูกต้องทางเทคนิคเอาไว้

การดีบั๊กทางเทคนิค

ระบุบั๊กที่ซ่อนอยู่ในการผลิตโค้ดและแนะนำแนวทางการแก้ไขตาม best practices ปัจจุบัน

จุดแข็ง

ข้อจำกัด

การใช้เหตุผลทางคณิตศาสตร์ชั้นยอด: ทำคะแนนได้เต็ม 100% ใน benchmark AIME 2025 ซึ่งเหนือกว่า frontier model ส่วนใหญ่ในด้านตรรกะ
Latency ของโหมด Heavy: โหมดการใช้เหตุผลแบบหลาย agent อาจต้องใช้เวลาหลายนาทีกว่าจะได้คำตอบที่มีความแม่นยำสูง
Context window ชั้นนำของอุตสาหกรรม: ด้วย context window ขนาด 2M ช่วยให้สามารถวิเคราะห์เอกสารที่ลึกซึ้งและโปรเจกต์โค้ดขนาดใหญ่ได้อย่างไม่มีใครเทียบ
การรองรับวิดีโอยังไม่สมบูรณ์: แม้ว่าความสามารถด้านข้อความและรูปภาพจะอยู่ในระดับสูงสุด แต่การประมวลผลวิดีโอแบบเฟรมต่อเฟรมยังไม่พร้อมใช้งาน
ข้อมูลเชิงลึกจากโซเชียลแบบสด: การเข้าถึงแพลตฟอร์ม X โดยตรงทำให้ได้ข้อมูลที่เป็นปัจจุบัน ซึ่ง training data แบบคงที่ทั่วไปไม่สามารถทำได้
การเข้าถึงจำกัดในบางภูมิภาค: ฟีเจอร์หน่วยความจำถาวร (persistent memory) ถูกปิดใช้งานในสหภาพยุโรปเนื่องจากข้อกำหนดด้านกฎระเบียบ
อัตราการปฏิเสธต่ำ: สถาปัตยกรรมความปลอดภัยที่ยืดหยุ่นกว่า ช่วยให้สามารถสนทนาอย่างตรงไปตรงมาและเป็นกลางในประเด็นที่ถกเถียงกันได้
ขีดจำกัดความแม่นยำด้าน Vision: ผู้สร้างยอมรับว่า model ยังคงมีจุดบอดบางส่วนในการตีความรายละเอียดภาพที่มีความละเอียดสูงมาก

เริ่มต้นด่วน API

xai/grok-4

ดูเอกสาร
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Grok-4

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Grok-4

Grok 4 แบบ fast มี context window 2M!!! ทำไมเราต้องทนใช้ ChatGPT มาตลอด ผมไม่เข้าใจแล้วจริงๆ
myfuturewifee
reddit
ทำคะแนนได้ 15.88% บน ARC-AGI v2 private subset นี่มันบ้ามาก Grok 4 เป็น model แรกที่ทำลายกำแพง 10% ได้ในรอบหลายเดือน
Greg (ARC-AGI Lead)
twitter
แนวทางกลุ่มติว AI ใน Grok 4 Heavy เป็นวิธีที่ถูกต้องในการใช้ test-time compute มันหาจุดสำคัญของปัญหาได้จริงๆ
Tony_xAI
twitter
Grok 4: 79 คะแนนบน LiveCodeBench... benchmark ไม่ได้บอกคุณว่าการใช้ model เขียนโค้ดจริงรู้สึกอย่างไร แต่ตัวนี้รู้สึกไว้ใจได้
thankzr3ddit
reddit
Model นี้อยู่ในระดับปริญญาเอกในทุกด้าน มันฉลาดจนน่ากลัวและเร็วกว่าที่มนุษย์คนไหนจะเรียนรู้ได้
Elon Musk
youtube
การค้นหาแบบเรียลไทม์ไม่ได้แค่ scrape พาดหัวข่าว แต่มันวิเคราะห์เนื้อหาจากหลายแหล่ง
BitBiasedAI
youtube

วิดีโอเกี่ยวกับ Grok-4

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Grok-4

Grok 4 heavy เหมาะสำหรับงานที่ต้องใช้ตรรกะและการใช้เหตุผลเข้มข้น ส่วน Grok 4 ปกติจะรองรับงานอื่นๆ

มันติดตามมือและนิ้วมือของผมเพื่อวาดบนหน้าจอได้อย่างแม่นยำ

Grok 4 หา password ที่ผมซ่อนไว้ลึกใน context window ได้หลังจากคิดเพียง 15 วินาที

ความแม่นยำในการทดสอบ 2 ล้าน token แบบเข็มในกองฟางคือ 100%

model นี้เป็นตัวเลือกจริงจังสำหรับใครที่พบว่า context window ของ Gemini ไม่น่าเชื่อถือ

Grok 4 อยู่ในระดับปริญญาเอกในทุกด้าน ดีกว่าคนจบปริญญาเอกส่วนใหญ่

Grok 4 Heavy สร้าง agent หลายตัวขนานกัน... เหมือนกับการมีกลุ่มติวหนังสือ

มันอยู่ใน API และมีความยาว context 256k โดยมีแผนจะขยายเพิ่มอีกมาก

การฝึกสอนบนคลัสเตอร์ Colossus ทำให้มันมีความสามารถในการใช้เหตุผลที่เราไม่เคยเห็นมาก่อน

มันถูกออกแบบมาให้เป็น AI ที่แสวงหาความจริงมากที่สุดเท่าที่มีอยู่ในปัจจุบัน

Grok 4 Heavy รัน AI model ขนานกันสูงสุด 32 ตัวใน prompt เดียวของคุณ

การค้นหาแบบเรียลไทม์ไม่ได้แค่ scrape พาดหัวข่าว แต่มันวิเคราะห์เนื้อหาจากหลายแหล่ง

Think Mode ใช้เวลาคำนวณเพิ่มเติมในการวางแผนและตรวจจับข้อผิดพลาดก่อนที่จะตอบ

คุณสามารถเห็น agent โต้เถียงกันเองใน log ได้หากคุณมีสิทธิ์เข้าถึง API

ประสิทธิภาพ multimodal กับเสียงนั้นเร็วขึ้นกว่ารุ่นก่อนอย่างเห็นได้ชัด

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ Grok-4

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Grok-4 และได้ผลลัพธ์ที่ดีขึ้น

ใช้ Search Keywords

ระบุ hashtag หรือบัญชีผู้ใช้เฉพาะเจาะจงใน prompt ของคุณ เพื่อนำทางให้ model ค้นหาข้อมูลบน X ได้แม่นยำขึ้น

สลับไปใช้โหมด Heavy

เปิดใช้งาน Grok-4 Heavy สำหรับงานที่ความถูกต้องสำคัญกว่าความเร็วในการตอบสนอง

กำหนด Persona ให้ละเอียด

ใช้ประโยชน์จากแนวทางการตั้งค่าความปลอดภัยที่ยืดหยุ่น ด้วยการกำหนด persona ที่เฉพาะเจาะจงหรือเน้นความตลกขบขันสำหรับการเขียนเชิงสร้างสรรค์

วิเคราะห์ลิงก์ภายนอก

วาง URL สดลงในแชทโดยตรงเพื่อให้ model เข้าไปดึงข้อมูลและสรุปเนื้อหาล่าสุดจากหน้าเว็บได้

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

คำถามที่พบบ่อยเกี่ยวกับ Grok-4

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Grok-4