xai

Grok-4

Grok-4 của xAI là một frontier model sở hữu context window lên đến 2M tokens, tích hợp nền tảng X theo thời gian thực và đạt kỷ lục thế giới về khả năng...

xai logoxaiGrokJuly 9, 2025
Ngu canh
2.0Mtoken
Dau ra toi da
8Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
87.5%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Grok-4 dat 87.5% trong benchmark nay.
HLE
44.4%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Grok-4 dat 44.4% trong benchmark nay.
MMLU
94%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Grok-4 dat 94% trong benchmark nay.
MMLU Pro
81.2%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Grok-4 dat 81.2% trong benchmark nay.
SimpleQA
48%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Grok-4 dat 48% trong benchmark nay.
IFEval
89.2%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Grok-4 dat 89.2% trong benchmark nay.
AIME 2025
100%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Grok-4 dat 100% trong benchmark nay.
MATH
92%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Grok-4 dat 92% trong benchmark nay.
GSM8k
98.4%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Grok-4 dat 98.4% trong benchmark nay.
MGSM
92.1%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Grok-4 dat 92.1% trong benchmark nay.
MathVista
72.4%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Grok-4 dat 72.4% trong benchmark nay.
SWE-Bench
81%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Grok-4 dat 81% trong benchmark nay.
HumanEval
88%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Grok-4 dat 88% trong benchmark nay.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Grok-4 dat 79.4% trong benchmark nay.
MMMU
75%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Grok-4 dat 75% trong benchmark nay.
MMMU Pro
59.2%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Grok-4 dat 59.2% trong benchmark nay.
ChartQA
90.5%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Grok-4 dat 90.5% trong benchmark nay.
DocVQA
93.2%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Grok-4 dat 93.2% trong benchmark nay.
Terminal-Bench
54.2%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Grok-4 dat 54.2% trong benchmark nay.
ARC-AGI
15.9%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Grok-4 dat 15.9% trong benchmark nay.

Ve Grok-4

Tim hieu ve kha nang cua Grok-4, tinh nang va cach no co the giup ban dat ket qua tot hon.

Tổng quan

Grok-4 là frontier model AI mới nhất từ xAI, được thiết kế để trở thành một trợ lý tìm kiếm sự thật với khả năng truy cập thời gian thực vào nền tảng X. Được xây dựng trên cụm siêu máy tính Colossus với hơn 200.000 GPU, nó đại diện cho một bước nhảy vọt khổng lồ trong khả năng reasoning, giải quyết các vấn đề toán học và lập trình. Model sở hữu kiến trúc chế độ kép thống nhất, cho phép người dùng chuyển đổi giữa chế độ reasoning suy nghĩ sâu cho các câu đố phức tạp và chế độ tốc độ cao cho các phản hồi tức thì.

Những đổi mới kỹ thuật

Sự gia tăng đột phá về sức mạnh tính toán này đã cho phép đạt được hiệu suất cấp độ tiến sĩ trên tất cả các lĩnh vực học thuật cùng một lúc. Model được đặc trưng bởi chiến lược căn chỉnh (alignment strategy) chống lại các thiên kiến cực đoan (anti-woke), ưu tiên thông tin khách quan hơn là các rào cản an toàn tiêu chuẩn. Context window khổng lồ 2 triệu tokens và sự tích hợp vào hệ sinh thái của Musk, bao gồm X và xe Tesla, tạo nên một lợi thế cạnh tranh khác biệt. Mặc dù vượt trội trong STEM và reasoning kỹ thuật, nó vẫn hoạt động cực kỳ hiệu quả cho các tác vụ sáng tạo hàng ngày và phân tích tin tức thời gian thực.

Triết lý hiệu suất

Grok-4 ưu tiên tư duy dựa trên các nguyên tắc cơ bản (first-principles) và tổng hợp dữ liệu khách quan. Bằng cách sử dụng công cụ reasoning Quasarflux, nó có thể điều hướng qua các chuỗi logic đa bước mà các LLM truyền thống thường gặp khó khăn. Điều này khiến nó trở thành một công cụ thiết yếu cho các nhà phát triển và nhà nghiên cứu, những người yêu cầu đầu ra có độ trung thực cao trong các môi trường quan trọng, nơi tính chính xác của dữ kiện là không thể thương lượng.

Grok-4

Truong hop su dung cho Grok-4

Kham pha cac cach khac nhau ban co the su dung Grok-4 de dat ket qua tuyet voi.

Nghiên cứu STEM cấp độ sau đại học

Sử dụng chế độ Thinking để giải các bài toán vật lý cấp độ tiến sĩ và xác minh các chứng minh toán học phức tạp.

Debugging các kho lưu trữ khổng lồ

Tận dụng context window 2M để nạp toàn bộ mã nguồn và xác định các lỗi race condition tinh vi.

Tình báo tài chính thời gian thực

Theo dõi X Firehose để phân tích tâm lý thị trường và tin tức nóng hổi nhằm đưa ra các nhận định giao dịch.

Quy trình làm việc của Agent tự trị

Thúc đẩy các tác vụ agentic phức tạp thông qua function calling mạnh mẽ cho logistics và tự động hóa.

Phân tích pháp lý đa phương thức

Xem xét hàng nghìn trang tài liệu pháp lý đồng thời phân tích các ảnh chụp bằng chứng đã quét.

Gia sư học thuật nâng cao

Cung cấp dịch vụ gia sư cá nhân hóa dựa trên các nguyên tắc cơ bản (first-principles) trong các môn học STEM, thích ứng với tiến độ của học sinh.

Diem manh

Han che

Toán học & Logic vô đối: Đạt điểm số kỷ lục thế giới 100% trong kỳ thi AIME 2025, trở thành lựa chọn hàng đầu cho các tác vụ kỹ thuật.
Logic cơ bản thất thường: Mặc dù vượt qua các kỳ thi sau đại học, model đôi khi vẫn thất bại ở những tác vụ đơn giản như đếm số chữ cái trong một từ.
Context dẫn đầu thị trường: Context window 2 triệu tokens cho phép phân tích khoảng 1.500 trang văn bản chỉ trong một prompt duy nhất.
Rào cản gia nhập cao: Để truy cập toàn bộ sức mạnh của model Grok-4 Heavy và các khả năng reasoning, người dùng cần có gói đăng ký cao cấp.
Luồng dữ liệu trực tiếp: Quyền truy cập độc quyền vào luồng dữ liệu thời gian thực của nền tảng X đảm bảo các câu trả lời luôn cập nhật các sự kiện toàn cầu.
Khoảng cách về sắc thái sáng tạo: Model vẫn tụt hậu so với Claude 4.5 trong việc kể chuyện sáng tạo, thường mang tông giọng thực dụng hoặc có phần gai góc hơn.
Trí tuệ cảm xúc: Hiệu suất cao trên EQ-Bench3 cho thấy khả năng vượt trội trong việc thấu hiểu những sắc thái cảm xúc tinh tế của con người.
Tính nhất quán trong tạo hình ảnh: Các công cụ nội bộ gặp khó khăn trong việc duy trì tính nhất quán về hình ảnh qua nhiều khung hình.

Bat dau nhanh API

xai/grok-4

Xem tai lieu
xai SDK
import { xAI } from '@xai/sdk';

const client = new xAI({
  apiKey: process.env.XAI_API_KEY,
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'grok-4',
    messages: [{ role: 'user', content: 'Analyze the latest news about xAI from the Firehose.' }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Grok-4

Xem cong dong nghi gi ve Grok-4

"Grok 4 đang chính thức "dạy bảo" các đối thủ... chứng minh rằng xAI đã xây dựng một model có tư duy sắc bén như một kẻ săn mồi."
Mario Nawfal
x/twitter
"Grok 4 là một thiên tài cấp độ tiến sĩ chuyên phá vỡ các benchmark, nhưng thỉnh thoảng lại không biết đếm. Sự đối lập này thật kỳ lạ."
Beginning-Willow-801
reddit
"Bước nhảy vọt lên 2 triệu tokens không chỉ là một chiêu trò quảng cáo; nó thay đổi hoàn toàn cách chúng ta thực hiện debugging các kho lưu trữ."
AI Tech Reviews
youtube
"Grok 4 rõ ràng là model tốt nhất về khả năng hiểu tổng quát, vượt xa GPT-5."
YMist_
reddit
"Lượng sử dụng sẽ tăng vọt với Grok 4.20. Nó sẽ ra mắt sau 3 hoặc 4 tuần nữa."
Elon Musk
x/twitter
"Việc tích hợp X theo thời gian thực là điều duy nhất giúp nghiên cứu của tôi luôn cập nhật trong chu kỳ tin tức này."
DataScientist_Alpha
hackernews

Video ve Grok-4

Xem huong dan, danh gia va thao luan ve Grok-4

Số lượng từ trong phản hồi này chính xác là 43... Cực kỳ ấn tượng.

Nó không chỉ giải được bài toán Tháp Hà Nội trong chain-of-thought, mà thực tế còn chứng minh và trực quan hóa nó bằng mã code.

Tôi thích câu trả lời này. Đi thẳng vào vấn đề, trực tiếp. Không hề nói giảm nói tránh.

Khả năng reasoning ở đây rõ ràng là một bước tiến vượt bậc so với những gì chúng ta thấy ở thế hệ trước.

Cuối cùng cũng có một model mang lại cảm giác nó không hề che giấu sự thật chỉ để tỏ ra lịch sự.

Nút gạt thử nghiệm chế độ suy nghĩ cho Grok gần đây đã bị loại bỏ... dẫn đến việc nó bị coi là có phần lỗi thời.

Grok OS là thứ ít gây ấn tượng nhất, với phông nền trắng cơ bản và các biểu tượng bị lỗi.

Về khả năng truy xuất kiến thức thô, Grok-4 liên tục ghi điểm ở những chỗ mà GPT-5 bỏ lỡ.

latency trong chế độ reasoning cao hơn, nhưng chất lượng đầu ra hoàn toàn xứng đáng với sự chờ đợi.

Nếu bạn đang ở trong hệ sinh thái của Musk, sự tích hợp ở đây là một công cụ nhân bội năng suất khổng lồ.

Không ai muốn một model siêu nhanh nếu nó không thể giải quyết được logic. Tôi nói thật đấy các bạn.

Tôi sẽ cho điểm trừ 1 trên 10... Hoàn toàn rác rưởi. Thậm chí không thể xây dựng một trang web Next.js đơn giản.

Tốc độ thì có đó, nhưng nếu logic bị hỏng, thì tokens per second để làm gì?

Cảm giác như họ đã vội vàng tung ra biến thể coder chỉ để kịp chu kỳ phát hành.

Hãy trung thành với model reasoning tiêu chuẩn nếu bạn thực sự muốn thứ gì đó hoạt động hiệu quả.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep cho Grok-4

Meo chuyen gia giup ban tan dung toi da Grok-4 va dat ket qua tot hon.

Chuyển đổi chế độ

Sử dụng chế độ Quasarflux cho các logic phức tạp và chế độ Tensor để tăng tốc độ nhằm tối ưu hóa chi phí và hiệu suất.

Truy vấn thời gian thực

Hãy prompt rõ ràng về các chủ đề đang thịnh hành trên X để tận dụng luồng dữ liệu trực tiếp và bỏ qua các giới hạn về thời điểm kết thúc dữ liệu huấn luyện.

Tập trung vào STEM

Ưu tiên sử dụng Grok cho các bài toán toán học cấp độ sau đại học, nơi nó vượt xa các đối thủ trong các tác vụ zero-shot.

Xác minh logic cơ bản

Kiểm tra lại các tác vụ đếm hoặc sắp xếp danh sách đơn giản vì model có thể không nhất quán trong các tác vụ tầm thường.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M

Cau hoi thuong gap ve Grok-4

Tim cau tra loi cho cac cau hoi thuong gap ve Grok-4