openai

GPT-5.4

GPT-5.4 là frontier model của OpenAI với context window 1,05 triệu token và Extreme Reasoning. Model này vượt trội trong tương tác UI tự động và phân tích dữ...

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-54 tháng 3, 2026
Ngu canh
1.1Mtoken
Dau ra toi da
128Ktoken
Gia dau vao
$2.50/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
84.2%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-5.4 dat 84.2% trong benchmark nay.
HLE
42%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-5.4 dat 42% trong benchmark nay.
MMLU
91%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-5.4 dat 91% trong benchmark nay.
MMLU Pro
76%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-5.4 dat 76% trong benchmark nay.
SimpleQA
56.7%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-5.4 dat 56.7% trong benchmark nay.
IFEval
92%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-5.4 dat 92% trong benchmark nay.
AIME 2025
100%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-5.4 dat 100% trong benchmark nay.
MATH
88.6%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-5.4 dat 88.6% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-5.4 dat 99% trong benchmark nay.
MGSM
96%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-5.4 dat 96% trong benchmark nay.
MathVista
74%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-5.4 dat 74% trong benchmark nay.
SWE-Bench
52.8%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-5.4 dat 52.8% trong benchmark nay.
HumanEval
85.1%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-5.4 dat 85.1% trong benchmark nay.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-5.4 dat 72.5% trong benchmark nay.
MMMU
84.2%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-5.4 dat 84.2% trong benchmark nay.
MMMU Pro
61%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-5.4 dat 61% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-5.4 dat 89% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-5.4 dat 94% trong benchmark nay.
Terminal-Bench
55%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-5.4 dat 55% trong benchmark nay.
ARC-AGI
52.9%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-5.4 dat 52.9% trong benchmark nay.

Ve GPT-5.4

Tim hieu ve kha nang cua GPT-5.4, tinh nang va cach no co the giup ban dat ket qua tot hon.

Đỉnh cao của Reasoning ngữ cảnh dài

GPT-5.4 đại diện cho bước tiến hiệu suất cao của dòng GPT-5, đặc trưng bởi context window 1,05 triệu token dẫn đầu ngành. Model này được thiết kế đặc biệt để xử lý các tập dữ liệu mở rộng, chẳng hạn như các kho mã nguồn khổng lồ hoặc nhật ký lịch sử nhiều năm, mà không làm mất đi khả năng thực hiện reasoning độ trung thực cao. Một tính năng nổi bật là "Mid-Response Steering" tương tác, cho phép người dùng giám sát trực quan và điều chỉnh kế hoạch tư duy của model trong thời gian thực, đảm bảo đầu ra khớp hoàn hảo với các ý định đa bước phức tạp.

Trí tuệ hợp nhất và Hành động tự động

Về mặt kỹ thuật, GPT-5.4 hợp nhất các điểm mạnh về lập trình đẳng cấp thế giới của các nhánh chuyên biệt Codex trước đây với các sắc thái sáng tạo của dòng GPT-5 tiêu chuẩn. Nó có chế độ "Thinking" chuyên dụng với các mức độ nỗ lực có thể điều chỉnh (Standard, Extended và Heavy), sử dụng quy trình chain-of-thought được tăng cường để giải quyết các vấn đề khoa học và logic cấp độ Tiến sĩ. Ngoài văn bản, GPT-5.4 giới thiệu khả năng sử dụng máy tính nguyên bản, đạt 75% điểm số trong các tác vụ xác minh trên OSWorld bằng cách diễn giải ảnh chụp màn hình trực quan và thực hiện các cú nhấp chuột dựa trên tọa độ.

Hiệu quả và Độ tin cậy

OpenAI báo cáo lỗi ở cấp độ xác nhận giảm đáng kể 33% so với các phiên bản tiền nhiệm, khiến GPT-5.4 trở thành lựa chọn hàng đầu cho các agent tự động và hỗ trợ quyết định rủi ro cao. Bất chấp sức mạnh của mình, nó được thiết kế để đạt hiệu quả về token và năng lượng, cho phép xử lý ngữ cảnh dài với chi phí rẻ hơn so với các phiên bản trước. Dù là quản lý toàn bộ mã nguồn của doanh nghiệp hay đóng vai trò là agent lập lịch tự động, GPT-5.4 thiết lập một tiêu chuẩn mới về độ tin cậy và hiệu suất agentic trong bối cảnh AI tạo hình.

GPT-5.4

Truong hop su dung cho GPT-5.4

Kham pha cac cach khac nhau ban co the su dung GPT-5.4 de dat ket qua tuyet voi.

Cấu trúc lại mã nguồn quy mô lớn

Nạp và phân tích hàng trăm tệp nguồn cùng lúc để đảm bảo tính nhất quán giữa các mô-đun và xác định các lỗi ngữ nghĩa sâu trong toàn bộ kho lưu trữ.

Lập lịch trình Agentic tự động

Tương tác với email và lịch thông qua định vị hình ảnh để tự động điều phối các lịch trình sự kiện phức tạp và gửi thông tin liên lạc tiếp theo.

Thiết kế kiến trúc độ trung thực cao

Tạo các cảnh 3D phức tạp và kế hoạch cấu trúc, chẳng hạn như các ga tàu điện ngầm đầy đủ chức năng, sử dụng hơn 1.000 dòng mã chính xác, sẵn sàng cho mô phỏng.

Lập kế hoạch khoa học dài hạn

Sử dụng Extreme Reasoning để giải quyết các vấn đề khoa học cấp độ Tiến sĩ và thực hiện phân tích đa bước yêu cầu duy trì trạng thái nhất quán trong nhiều giờ.

Điều tra sự cố an ninh mạng

Xử lý lượng lớn dữ liệu nhật ký (log) thô trong một phiên context window 1,05 triệu token duy nhất để tự động xác định, điều tra và báo cáo các hành vi vi phạm bảo mật.

Điều hướng giữa phản hồi tương tác

Điều chỉnh hướng đi của model trong giai đoạn 'thinking' nội bộ để thay đổi các lựa chọn kiến trúc hoặc lộ trình logic mà không cần phải bắt đầu lại prompt.

Diem manh

Han che

Frontier 1.05M Context Window: Cung cấp khả năng dẫn đầu ngành để thực hiện reasoning trên các tập dữ liệu và kho mã nguồn khổng lồ trong một prompt duy nhất mà không làm mất đi tính mạch lạc.
Sự suy giảm khi ngữ cảnh dài: Hiệu suất đối với các tác vụ reasoning có độ phức tạp cao được ghi nhận là giảm đáng kể khi context window vượt quá mốc 256.000 token.
Độ chính xác Reasoning cực hạn: Đạt được kiến thức khoa học cấp độ Tiến sĩ (84,2% trên GPQA) và điểm toán tuyệt đối (100% trên AIME 2025) khi sử dụng chế độ reasoning nỗ lực cao.
Sơ đồ đặt phiên bản gây nhầm lẫn: Đội hình phức tạp gồm các biến thể 5.1, 5.2 Thinking, 5.3 Codex và 5.4 tạo ra gánh nặng nhận thức đáng kể cho các nhà phát triển API và người dùng Chat.
Tương tác UI tự động: Khả năng định vị hình ảnh state-of-the-art cho phép model tương tác với phần mềm và trình duyệt với độ chính xác 75% trên benchmark OSWorld.
Latency cao ở chế độ Heavy: Các chế độ reasoning nỗ lực cao nhất có thể mất hơn 8 phút để xử lý CoT nội bộ, khiến chúng không phù hợp cho các tác vụ tương tác thời gian thực.
Hiệu quả Token và năng lượng: Được thiết kế là frontier model hiệu quả nhất của OpenAI từ trước đến nay, giảm chi phí năng lượng cần thiết cho reasoning phức tạp so với bản phát hành GPT-5.2.
Căn chỉnh (alignment) quá mức: Việc fine-tuning an toàn quá mức có thể dẫn đến hành vi đối nghịch, trong đó model phủ nhận người dùng một cách không cần thiết về các chủ đề thực tế vô hại.

Bat dau nhanh API

openai/gpt-5.4

Xem tai lieu
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [{ role: "user", content: "Analyze this 1.05M token log file for security threats." }],
    reasoning_effort: "heavy",
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-5.4

Xem cong dong nghi gi ve GPT-5.4

GPT-5 đang tạo nên một màn trở lại đầy ngoạn mục... mọi dòng mã nó tạo ra đều hoạt động hoàn hảo.
immortalsol
reddit
Tính năng nổi bật nhất rõ ràng là context window 1 triệu token, so với mức khoảng 200 nghìn mà các model khác hỗ trợ.
Developer
hackernews
Wow, GPT 5.4 tốt đến điên rồ. Nó đáng lẽ phải là bước nhảy vọt lên 6.0. Thật khó tin khi Codex đã tiến xa đến thế này.
Rahul Sood
twitter
GPT-5.4 đạt điểm cực cao 94.0 trên NYT Connections. Nó chỉ đơn giản là làm đúng mọi thứ ngay từ lần thử đầu tiên.
senko
hackernews
GPT-5.4 hiện đã có trên Chỉ số Trí tuệ Phân tích Nhân tạo... Ngang hàng với Gemini 3.1 Pro.
AiBattle
twitter
Chiều sâu reasoning cuối cùng đã đạt đến mức có thể xử lý các vấn đề kiến trúc quy mô doanh nghiệp.
CloudArchitect99
reddit

Video ve GPT-5.4

Xem huong dan, danh gia va thao luan ve GPT-5.4

Một context window 1 triệu 50 nghìn token... đây là một context window cực kỳ dài.

Sau 5 phút 22 giây suy nghĩ, chúng tôi đã nhận được kết quả... nó thực sự đã kiểm tra điều này theo cách agentic hơn.

Cập nhật khả năng xem hình ảnh độ trung thực cao... lên tới tổng cộng 10,24 triệu pixel.

Model thực sự thực hiện nghiên cứu trên web để xác minh logic của chính nó.

Đây là một bước nhảy vọt khổng lồ cho các quy trình làm việc agentic nơi trạng thái cần được duy trì.

GPT 5.4 có tất cả mọi thứ... về cơ bản họ đã nói rằng, được rồi, 5.2 và GPT 5.3 Codex hãy kết hợp với nhau đi.

Khả năng lập trình thật khó tin. Nó gần như không có sai sót.

Thẩm mỹ front-end vẫn còn kém xa so với Opus 4.6 và Gemini 3.1 Pro.

Cảm giác như nó hiểu rõ hơn nhiều về ý định sắc thái của nhà phát triển.

Mức giá rất cạnh tranh khi xét đến kích thước context window 1 triệu token.

Nó rõ ràng đang gây áp lực lên OpenAI để đáp trả bằng một model khớp với khả năng ngữ cảnh 1 triệu đó.

Chỉ trong một lần thử, việc model này có thể tạo ra bản sao Minecraft này thật đáng kinh ngạc.

Chúng ta đang thấy tỷ lệ ảo giác sự thật giảm 33%.

Các chế độ reasoning được phân loại thành các mức Standard, Extended và Heavy.

Khả năng định vị hình ảnh trên benchmark OSWorld hiện đang dẫn đầu ngành.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GPT-5.4

Meo chuyen gia giup ban tan dung toi da GPT-5.4 va dat ket qua tot hon.

Chuyển đổi mức nỗ lực Reasoning

Sử dụng các mức nỗ lực Standard, Extended hoặc Heavy tùy thuộc vào độ phức tạp của tác vụ để cân bằng giữa chi phí tính toán và chất lượng đầu ra.

Giám sát kế hoạch ban đầu

Khi sử dụng biến thể Thinking, hãy theo dõi kế hoạch ban đầu; bạn có thể can thiệp ngay giữa quá trình tạo nếu lộ trình logic mà model đề xuất có vẻ sai lệch.

Chiến lược Prompt Caching

Đặt các khối ngữ cảnh tĩnh lớn ở đầu prompt của bạn để tận dụng tính năng tự động prompt caching của OpenAI nhằm tiết kiệm chi phí.

Quản lý độ ổn định của ngữ cảnh

Mặc dù context window 1,05 triệu token rất mạnh mẽ, nhưng hiệu suất được báo cáo là ổn định nhất trong khoảng 256.000 token đầu tiên; hãy giữ các tóm tắt quan trọng ở gần cuối prompt.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Cau hoi thuong gap ve GPT-5.4

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-5.4