xai

Grok-4

Grok-4 bởi xAI là frontier model với cửa sổ ngữ cảnh 2M tokens, tích hợp X thời gian thực và khả năng reasoning kỷ lục thế giới.

xai logoxaiGrokNgày 9 tháng 7 năm 2025
Ngu canh
2.0Mtoken
Dau ra toi da
8Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
87.5%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Grok-4 dat 87.5% trong benchmark nay.
HLE
44.4%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Grok-4 dat 44.4% trong benchmark nay.
MMLU
94%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Grok-4 dat 94% trong benchmark nay.
MMLU Pro
81.2%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Grok-4 dat 81.2% trong benchmark nay.
SimpleQA
48%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Grok-4 dat 48% trong benchmark nay.
IFEval
89.2%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Grok-4 dat 89.2% trong benchmark nay.
AIME 2025
100%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Grok-4 dat 100% trong benchmark nay.
MATH
92%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Grok-4 dat 92% trong benchmark nay.
GSM8k
98.4%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Grok-4 dat 98.4% trong benchmark nay.
MGSM
92.1%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Grok-4 dat 92.1% trong benchmark nay.
MathVista
72.4%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Grok-4 dat 72.4% trong benchmark nay.
SWE-Bench
81%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Grok-4 dat 81% trong benchmark nay.
HumanEval
88%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Grok-4 dat 88% trong benchmark nay.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Grok-4 dat 79.4% trong benchmark nay.
MMMU
75%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Grok-4 dat 75% trong benchmark nay.
MMMU Pro
59.2%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Grok-4 dat 59.2% trong benchmark nay.
ChartQA
90.5%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Grok-4 dat 90.5% trong benchmark nay.
DocVQA
93.2%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Grok-4 dat 93.2% trong benchmark nay.
Terminal-Bench
54.2%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Grok-4 dat 54.2% trong benchmark nay.
ARC-AGI
15.9%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Grok-4 dat 15.9% trong benchmark nay.

Ve Grok-4

Tim hieu ve kha nang cua Grok-4, tinh nang va cach no co the giup ban dat ket qua tot hon.

Tổng quan về Model

Grok-4 là frontier multimodal model từ xAI. Nó được xây dựng để ưu tiên khả năng suy luận logic cơ bản và truy xuất thông tin thời gian thực. Model này đạt được lợi thế cạnh tranh đáng kể nhờ sự tích hợp nguyên bản với nền tảng xã hội X. Điều này cho phép nó phân tích các cuộc trò chuyện toàn cầu và tin tức trực tiếp khi chúng xảy ra. Model tận dụng siêu máy tính Colossus để đào tạo, mang lại hiệu suất đỉnh cao trong các lĩnh vực toán học và kỹ thuật.

Khả năng kỹ thuật

Kiến trúc này hỗ trợ cửa sổ ngữ cảnh 2 triệu tokens trong các biến thể chuyên về reasoning. Công suất này cho phép xử lý các kho mã nguồn khổng lồ và tài liệu kỹ thuật dày đặc mà không bị mất dữ liệu. Nó có hệ thống dual-mode, nơi người dùng có thể chọn giữa chế độ tốc độ cao cho các tương tác nhanh và chế độ suy nghĩ sâu cho các tác vụ logic đa bước. Model kiểm soát tỷ lệ ảo giác (hallucination rate) ở mức khoảng 4% bằng cách sử dụng cơ chế đồng thuận đa tác nhân trong cấu hình Heavy.

Tích hợp hệ sinh thái

Ngoài việc tạo văn bản đơn thuần, Grok-4 được thiết kế cho mục đích sử dụng công cụ nguyên bản và function calling phức tạp. Nó hỗ trợ xử lý hình ảnh và âm thanh, trở thành lựa chọn linh hoạt cho các nhà phát triển xây dựng các ứng dụng multimodal. Chiến lược căn chỉnh của nó tập trung vào việc tìm kiếm sự thật khách quan thay vì các tiêu chuẩn an toàn công nghiệp thông thường. Điều này dẫn đến ít bị từ chối hơn đối với các chủ đề gây tranh cãi hoặc nhạy cảm so với các frontier model khác.

Grok-4

Truong hop su dung cho Grok-4

Kham pha cac cach khac nhau ban co the su dung Grok-4 de dat ket qua tuyet voi.

Phân tích cảm xúc thời gian thực

Phân tích các bài đăng trực tiếp trên X để xác định phản ứng của công chúng đối với tin tức nóng hoặc các đợt ra mắt sản phẩm.

Kiểm toán kho mã nguồn quy mô lớn

Đánh giá toàn bộ kho lưu trữ phần mềm bằng cửa sổ 2M tokens để tìm các lỗ hổng kiến trúc.

Giải toán cấp độ Olympic

Cung cấp các giải pháp từng bước cho các chứng minh toán học phức tạp và các bài toán cấp độ AIME.

Nội dung sáng tạo không bị lọc

Tạo kịch bản và nội dung hài hước dựa trên nhân vật mà không bị hạn chế bởi các bộ lọc khắt khe như các nhà cung cấp AI khác.

Tổng hợp nghiên cứu khoa học

Tóm tắt đồng thời nhiều bài báo học thuật cấp tiến sĩ trong khi vẫn duy trì độ chính xác về mặt kỹ thuật.

Gỡ lỗi kỹ thuật (Debugging)

Xác định các lỗi khó hiểu trong mã nguồn production và đề xuất bản sửa lỗi dựa trên các phương pháp tốt nhất hiện tại.

Diem manh

Han che

Khả năng reasoning toán học ưu việt: Đạt điểm tuyệt đối 100% trên benchmark AIME 2025, vượt xa hầu hết các frontier model về logic.
Độ trễ của Heavy Mode: Chế độ reasoning đa tác nhân (multi-agent) có thể mất vài phút để tạo ra một câu trả lời có độ chính xác cao.
Cửa sổ ngữ cảnh hàng đầu ngành: Cửa sổ 2M tokens cho phép phân tích tài liệu và thực hiện các dự án lập trình quy mô lớn với độ sâu chưa từng có.
Hỗ trợ video chưa hoàn thiện: Mặc dù khả năng văn bản và hình ảnh thuộc hàng top-tier, nhưng khả năng xử lý video từng khung hình vẫn chưa khả dụng.
Dữ liệu xã hội trực tiếp: Quyền truy cập trực tiếp vào nền tảng X cung cấp thông tin thời gian thực mà các dữ liệu đào tạo tĩnh không thể sao chép được.
Hạn chế quyền truy cập theo khu vực: Các tính năng bộ nhớ bền vững (persistent memory) hiện đang bị vô hiệu hóa tại Liên minh Châu Âu do các yêu cầu về quy định.
Tỷ lệ từ chối thấp: Cấu trúc an toàn cởi mở hơn cho phép thực hiện các cuộc đối thoại khách quan và trung thực về các chủ đề gây tranh cãi.
Giới hạn độ chính xác về thị giác: Đội ngũ sáng tạo thừa nhận model vẫn còn hạn chế khi diễn giải các chi tiết hình ảnh có độ trung thực cực cao.

Bat dau nhanh API

xai/grok-4

Xem tai lieu
xai SDK
import OpenAI from "openai";

const grok = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await grok.chat.completions.create({
    model: "grok-4",
    messages: [{ role: "user", content: "Search X for the latest news on SpaceX." }],
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || "");
  }
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Grok-4

Xem cong dong nghi gi ve Grok-4

Grok 4 fast có cửa sổ 2M tokens!!! Tại sao chúng ta lại phải chật vật và chấp nhận ChatGPT, tôi thực sự không biết nữa.
myfuturewifee
reddit
15,88% trên tập dữ liệu con ARC-AGI v2 là quá khủng khiếp. Grok 4 là model đầu tiên phá vỡ rào cản 10% đó trong nhiều tháng nay.
Greg (ARC-AGI Lead)
twitter
Cách tiếp cận theo nhóm học tập đa tác nhân trong Grok 4 Heavy là cách đúng đắn để sử dụng test-time compute. Nó thực sự tìm ra mẹo để giải quyết vấn đề.
Tony_xAI
twitter
Grok 4: 79 điểm trên LiveCodeBench... các benchmark không cho bạn biết cảm giác code với một model như thế nào, nhưng cảm giác này rất đáng tin cậy.
thankzr3ddit
reddit
Model này có trình độ sau đại học trong mọi thứ. Nó thông minh đến mức đáng sợ và nhanh hơn bất kỳ con người nào có thể học được.
Elon Musk
youtube
Tìm kiếm thời gian thực không chỉ là cào tiêu đề; nó đang phân tích nội dung từ nhiều nguồn khác nhau.
BitBiasedAI
youtube

Video ve Grok-4

Xem huong dan, danh gia va thao luan ve Grok-4

Grok 4 Heavy dành cho các tác vụ logic và reasoning chuyên sâu hơn, trong khi Grok 4 thông thường xử lý các tác vụ khác.

Nó theo dõi chính xác bàn tay và ngón tay của tôi để vẽ trên màn hình.

Grok 4 tìm thấy mật khẩu tôi ẩn sâu trong cửa sổ ngữ cảnh chỉ sau 15 giây suy nghĩ.

Độ chính xác trong bài kiểm tra 'kim đáy bể' với 2 triệu tokens là 100%.

Model này cuối cùng cũng là một sự thay thế thực sự cho những ai thấy cửa sổ ngữ cảnh của Gemini không đáng tin cậy.

Grok 4 đạt trình độ sau đại học như cấp tiến sĩ trong mọi lĩnh vực, tốt hơn hầu hết các tiến sĩ thực thụ.

Grok 4 Heavy tạo ra nhiều agents song song... giống như một nhóm học tập vậy.

Nó đã có mặt trên API và có độ dài context là 256k, với kế hoạch mở rộng hơn nữa.

Việc đào tạo trên cụm Colossus đã mang lại cho nó khả năng reasoning mà chúng ta chưa từng thấy.

Nó được thiết kế để trở thành AI theo đuổi sự thật nhất hiện nay.

Grok 4 Heavy chạy tới 32 AI models song song cho một prompt của bạn.

Tìm kiếm thời gian thực không chỉ là cào tiêu đề; nó đang phân tích nội dung từ nhiều nguồn khác nhau.

Think Mode dành thêm thời gian tính toán để lập kế hoạch và bắt lỗi trước khi trả lời.

Bạn thực sự có thể thấy các agents tranh luận với nhau trong nhật ký (logs) nếu có quyền truy cập API.

Hiệu suất multimodal với âm thanh nhanh hơn rõ rệt so với thế hệ trước.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Grok-4

Meo chuyen gia giup ban tan dung toi da Grok-4 va dat ket qua tot hon.

Sử dụng từ khóa tìm kiếm

Bao gồm các hashtag hoặc tài khoản cụ thể trong prompt để điều hướng tìm kiếm trên X của model theo thời gian thực.

Chuyển sang chế độ Heavy Mode

Kích hoạt Grok-4 Heavy cho các tác vụ đòi hỏi độ chính xác cao hơn là tốc độ phản hồi.

Cung cấp Personas chi tiết

Tận dụng sự tự do trong chính sách an toàn bằng cách định nghĩa các persona cụ thể và sắc sảo cho việc viết sáng tạo.

Phân tích các liên kết bên ngoài

Dán trực tiếp các URL đang hoạt động vào khung chat để model truy xuất và tóm tắt nội dung web mới nhất.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Cau hoi thuong gap ve Grok-4

Tim cau tra loi cho cac cau hoi thuong gap ve Grok-4