xai

Grok-3

Grok-3 là reasoning model flagship của xAI, với khả năng suy luận logic chuyên sâu, context window 128k và tích hợp thời gian thực với X cho nghiên cứu và lập...

xai logoxaiGrok17 tháng 2, 2025
Ngu canh
128Ktoken
Dau ra toi da
8Ktoken
Gia dau vao
$3.00/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
84.6%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Grok-3 dat 84.6% trong benchmark nay.
HLE
36%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Grok-3 dat 36% trong benchmark nay.
MMLU
87.5%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Grok-3 dat 87.5% trong benchmark nay.
MMLU Pro
76.5%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Grok-3 dat 76.5% trong benchmark nay.
SimpleQA
42%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Grok-3 dat 42% trong benchmark nay.
IFEval
91.2%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Grok-3 dat 91.2% trong benchmark nay.
AIME 2025
93.3%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Grok-3 dat 93.3% trong benchmark nay.
MATH
94.4%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Grok-3 dat 94.4% trong benchmark nay.
GSM8k
98.7%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Grok-3 dat 98.7% trong benchmark nay.
MGSM
92.4%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Grok-3 dat 92.4% trong benchmark nay.
MathVista
71.3%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Grok-3 dat 71.3% trong benchmark nay.
SWE-Bench
49%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Grok-3 dat 49% trong benchmark nay.
HumanEval
94.5%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Grok-3 dat 94.5% trong benchmark nay.
LiveCodeBench
79.4%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Grok-3 dat 79.4% trong benchmark nay.
MMMU
78%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Grok-3 dat 78% trong benchmark nay.
MMMU Pro
58.5%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Grok-3 dat 58.5% trong benchmark nay.
ChartQA
89.2%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Grok-3 dat 89.2% trong benchmark nay.
DocVQA
92.4%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Grok-3 dat 92.4% trong benchmark nay.
Terminal-Bench
52%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Grok-3 dat 52% trong benchmark nay.
ARC-AGI
12.5%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Grok-3 dat 12.5% trong benchmark nay.

Ve Grok-3

Tim hieu ve kha nang cua Grok-3, tinh nang va cach no co the giup ban dat ket qua tot hon.

Reasoning và trí tuệ đỉnh cao

Grok-3 là flagship frontier model của xAI, đại diện cho một bước nhảy vọt đáng kể về quy mô tính toán và logic. Được training trên cụm siêu máy tính Colossus với hơn 100.000 GPU NVIDIA H100, model xử lý các thách thức toán học và khoa học phức tạp. Model sở hữu chế độ reasoning chuyên biệt sử dụng thêm tài nguyên tính toán để xác minh logic của chính nó trước khi đưa ra câu trả lời cuối cùng.

Tích hợp tri thức thời gian thực

Điểm khác biệt chính là khả năng tích hợp gốc với nền tảng X. Điều này cho phép Grok-3 truy cập tin tức nóng hổi, biến động tài chính và xu hướng toàn cầu với độ trễ thấp hơn so với các model dựa trên việc thu thập dữ liệu web tiêu chuẩn. Kết hợp với context window 1 triệu token, nó cho phép các nhà nghiên cứu tổng hợp lượng dữ liệu khổng lồ cập nhật từng phút.

Khả năng Multimodal và Agentic

Ngoài văn bản, Grok-3 là một vision model mạnh mẽ có khả năng diễn giải các sơ đồ kỹ thuật, bản vẽ và dữ liệu hình ảnh. Nó hỗ trợ gọi hàm nâng cao để sử dụng trong các tác nhân tự hành (autonomous agents). Với số điểm 83,9% trên SWE-Bench Verified, đây là một trong những model có khả năng cao nhất để giải quyết các vấn đề kỹ thuật phần mềm trong thế giới thực.

Grok-3

Truong hop su dung cho Grok-3

Kham pha cac cach khac nhau ban co the su dung Grok-3 de dat ket qua tuyet voi.

Phân tích thị trường thời gian thực

Sử dụng dữ liệu X trực tiếp để phân tích tâm lý tài chính và tin nóng cho các nhà đầu tư.

Nghiên cứu khoa học trình độ Tiến sĩ

Giải quyết các vấn đề STEM cấp độ sau đại học và phân tích các tài liệu chuyên sâu với các chế độ reasoning.

Kỹ thuật phần mềm cạnh tranh

Tạo mã nguồn cấp độ production và giải quyết các issue trên GitHub với độ chính xác cao.

Chứng minh toán học phức tạp

Sử dụng khả năng tính toán trong lúc test (test-time compute) để giải các bài toán Olympic đòi hỏi suy luận nhiều bước.

Diễn giải tài liệu kỹ thuật

Phân tích bản vẽ và tài liệu hướng dẫn kỹ thuật thông qua hệ thống multimodal vision.

Logic cho agentic (tác nhân tự hành)

Đóng vai trò là cốt lõi nhận thức cho các agent cần lập kế hoạch và sử dụng công cụ với độ trung thực cao.

Diem manh

Han che

Reasoning cấp độ Olympic: Đạt điểm tuyệt đối 100% trong benchmark toán học AIME 2025 bằng cách sử dụng chế độ Deep Thinking.
Dấu chân môi trường lớn: Quá trình training đòi hỏi 200.000 GPU và tiêu thụ khoảng 150MW điện, gây lo ngại về tính bền vững.
Dung lượng context khổng lồ: Cung cấp context window 1 triệu token, cho phép nạp toàn bộ thư viện hoặc các dự án phần mềm.
Giá API cao cấp: Với mức 15 USD cho mỗi triệu output tokens, nó đắt hơn đáng kể so với các lựa chọn frontier model nhỏ hơn.
Dữ liệu thời gian thực vô song: Việc tích hợp trực tiếp với X mang lại luồng dữ liệu mới nhất mà bất kỳ AI model nào hiện có.
Giới hạn Output Token: Các phản hồi thường bị giới hạn ở 4.096 tokens, điều này có thể cắt bớt các báo cáo hoặc tệp mã cực dài.
Độ chính xác cao trong lập trình: Đạt 83,9% trên SWE-Bench Verified, vượt qua các đối thủ lớn trong việc giải quyết các issue phức tạp trên GitHub.
Hạn chế quyền truy cập: Các tính năng đầy đủ của model và API keys thường chỉ giới hạn cho người đăng ký X Premium Plus hoặc tại các khu vực cụ thể.

Bat dau nhanh API

xai/grok-3

Xem tai lieu
xai SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-3",
    messages: [{ role: "user", content: "Phân tích tâm lý thị trường hiện tại cho Nvidia trên X." }],
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Grok-3

Xem cong dong nghi gi ve Grok-3

Grok-3 là model AI tốt nhất cho các trader và nhà đầu tư nhờ khả năng phân tích tâm lý thời gian thực.
Austin Starks
reddit
Nó đã giải được một số prompt hoàn thiện mã HVM khó mà Gemini và Sonnet thất bại. Tôi cảm thấy mức độ 'chất lượng' còn cao hơn cả Sonnet-3.5.
Victor Taelin
twitter
Tốc độ cực nhanh. Reasoning, thông tin thời gian thực, có vẻ như là model flagship nhanh nhất hiện nay.
Matthew Berman
youtube
Grok có quyền truy cập dữ liệu thời gian thực và sẵn sàng đi những nơi mà các model khác không làm, biến nó thành lựa chọn 'edgy' cho người dùng chuyên nghiệp.
Beginning-Willow-801
reddit
Hiệu suất của Grok-3 trên GPQA thật đáng kinh ngạc. Nó chắc chắn đang cạnh tranh cho vị trí dẫn đầu về khả năng reasoning.
EpochAIResearch
twitter
Context window 1M thực sự hiệu quả. Nó xử lý toàn bộ kho mã nguồn cũ của tôi mà không bị mất ngữ cảnh trong các prompt ban đầu.
DevGuru42
hackernews

Video ve Grok-3

Xem huong dan, danh gia va thao luan ve Grok-3

Giới thiệu về Grok-3 và quy mô training của nó.

Model được xây dựng vì trí tuệ và việc tìm kiếm sự thật.

Khả năng reasoning của Grok 3... dường như đang đánh bại cả OpenAI o1 và DeepSeek R1 trên các benchmark khoa học.

Hiệu suất benchmark trên MMLU cho thấy đây là một model hàng đầu.

Grok 3 thậm chí sẽ cố gắng giải các vấn đề chưa có lời giải... trong khi các model khác chỉ đơn giản nói rằng nó chưa có lời giải.

Elon Musk khẳng định đây là AI mạnh mẽ nhất cho đến nay.

Grok 3 hiện đã giành vị trí đầu bảng trong bài kiểm tra mù (blind test), trở thành nhà vô địch trên Chatbot Arena.

Việc tích hợp với X mang lại lợi thế khác biệt về tính cập nhật.

Các tính năng multimodal đã được cải thiện đáng kể so với Grok-2.

Phiên bản mạnh mẽ nhất của Grok và phiên bản mới nhất sẽ là phiên bản web tại grok.com.

Khám phá kiến trúc kỹ thuật của cụm máy tính Colossus.

Thảo luận về đợt training quy mô lớn trên 100k GPU H100.

Big brain là một tính năng thực sự độc đáo của Grok 3... nó cho phép người dùng sử dụng nhiều agent reasoning để giải quyết các vấn đề phức tạp.

Sự phát triển của Grok 3 được đẩy nhanh nhờ siêu máy tính Colossus của X, sử dụng 100.000 GPU Nvidia H100 trong Giai đoạn 1.

Suy nghĩ cuối cùng về lý do tại sao Grok-3 là một bước tiến lớn cho sự minh bạch theo phong cách open-weights.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Grok-3

Meo chuyen gia giup ban tan dung toi da Grok-3 va dat ket qua tot hon.

Tận dụng Deep Search

Sử dụng deep search cho các truy vấn về tin tức trong vòng một giờ qua để có kết quả chính xác nhất.

Bật chế độ High Reasoning

Thiết lập mức độ reasoning ở mức cao cho các câu đố toán học để kích hoạt các bước tự kiểm chứng.

Sử dụng Collections API

Tải các tài liệu nhạy cảm lên Collections API để đảm bảo dữ liệu của bạn không bị đưa vào các vòng lặp training.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Cau hoi thuong gap ve Grok-3

Tim cau tra loi cho cac cau hoi thuong gap ve Grok-3