openai

GPT-5.4

GPT-5.4 là frontier model của OpenAI với context window 1,05M và Extreme Reasoning. Nó xuất sắc trong tương tác UI tự động và phân tích dữ liệu dài.

OpenAIGPT-51M ContextReasoningMultimodal
openai logoopenaiGPT-55 tháng 3, 2026
Ngu canh
1.1Mtoken
Dau ra toi da
128Ktoken
Gia dau vao
$2.50/ 1M
Gia dau ra
$15.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
84.2%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-5.4 dat 84.2% trong benchmark nay.
HLE
42%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-5.4 dat 42% trong benchmark nay.
MMLU
91%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-5.4 dat 91% trong benchmark nay.
MMLU Pro
76%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-5.4 dat 76% trong benchmark nay.
SimpleQA
56.7%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-5.4 dat 56.7% trong benchmark nay.
IFEval
92%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-5.4 dat 92% trong benchmark nay.
AIME 2025
100%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-5.4 dat 100% trong benchmark nay.
MATH
88.6%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-5.4 dat 88.6% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-5.4 dat 99% trong benchmark nay.
MGSM
96%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-5.4 dat 96% trong benchmark nay.
MathVista
74%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-5.4 dat 74% trong benchmark nay.
SWE-Bench
52.8%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-5.4 dat 52.8% trong benchmark nay.
HumanEval
85.1%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-5.4 dat 85.1% trong benchmark nay.
LiveCodeBench
72.5%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-5.4 dat 72.5% trong benchmark nay.
MMMU
84.2%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-5.4 dat 84.2% trong benchmark nay.
MMMU Pro
61%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-5.4 dat 61% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-5.4 dat 89% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-5.4 dat 94% trong benchmark nay.
Terminal-Bench
55%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-5.4 dat 55% trong benchmark nay.
ARC-AGI
52.9%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-5.4 dat 52.9% trong benchmark nay.

Ve GPT-5.4

Tim hieu ve kha nang cua GPT-5.4, tinh nang va cach no co the giup ban dat ket qua tot hon.

Đỉnh cao của Long-Context Reasoning

GPT-5.4 đại diện cho sự phát triển hiệu năng cao của series GPT-5. Nó sở hữu context window 1,05 triệu token hàng đầu ngành. Model này xử lý các tập dữ liệu mở rộng, chẳng hạn như các kho lưu trữ mã nguồn khổng lồ hoặc nhật ký lịch sử nhiều năm, mà không làm mất độ trung thực trong reasoning. Tính năng Mid-Response Steering tương tác cho phép người dùng theo dõi và điều chỉnh kế hoạch suy nghĩ của model trong thời gian thực. Điều này đảm bảo đầu ra phù hợp với các mục đích phức tạp, đa bước.

Trí tuệ thống nhất và Hành động tự động

Về mặt kỹ thuật, GPT-5.4 thống nhất thế mạnh lập trình đẳng cấp thế giới của các nhánh Codex trước đó với các sắc thái sáng tạo của series GPT-5 tiêu chuẩn. Nó có chế độ Thinking chuyên dụng với các mức độ nỗ lực có thể điều chỉnh. Các chế độ này bao gồm Standard, Extended và Heavy. Nó sử dụng xử lý chain-of-thought được tăng cường để giải quyết các vấn đề logic và khoa học cấp độ Tiến sĩ. Ngoài văn bản, GPT-5.4 giới thiệu các khả năng computer use tự nhiên. Nó đạt điểm số 75% trong các tác vụ OSWorld-Verified bằng cách diễn giải ảnh chụp màn hình trực quan và thực hiện các cú nhấp chuột dựa trên tọa độ.

Hiệu quả và Đáng tin cậy

OpenAI báo cáo mức giảm 33% các lỗi sai cấp độ khẳng định so với các phiên bản tiền nhiệm. Điều này khiến GPT-5.4 trở thành lựa chọn hàng đầu cho các agent tự động và hỗ trợ ra quyết định quan trọng. Nó được thiết kế để tối ưu hóa hiệu quả về token và năng lượng. Điều này cho phép xử lý context dài với chi phí rẻ hơn so với các lần lặp trước đó. Cho dù đang quản lý toàn bộ codebase doanh nghiệp hay đóng vai trò là một agent lập lịch tự động, GPT-5.4 đã thiết lập một tiêu chuẩn mới cho sự tin cậy và hiệu suất agentic.

GPT-5.4

Truong hop su dung cho GPT-5.4

Kham pha cac cach khac nhau ban co the su dung GPT-5.4 de dat ket qua tuyet voi.

Tái cấu trúc mã nguồn quy mô lớn

Viết lại một cách có hệ thống các codebase cũ vượt quá 300.000 dòng với sự tuân thủ nghiêm ngặt các tiêu chuẩn kiến trúc.

Lập mô hình tài chính tự động

Xây dựng các mô hình ba báo cáo phức tạp, trong đó AI đối chiếu báo cáo thu nhập, bảng cân đối kế toán và lưu chuyển tiền tệ.

Thiết kế hệ thống tương tác

Phát triển các mô phỏng 3D hoặc trò chơi dựa trên vật lý bằng cách điều khiển hướng logic của model trong quá trình tạo phản hồi.

Agentic Computer Use

Thực hiện các tác vụ máy tính nhiều bước như nhập liệu số lượng lớn, quản lý email và kiểm thử phần mềm thông qua tương tác UI trực tiếp.

Phân tích pháp lý với Long Context

Đối chiếu hàng trăm tài liệu pháp lý để xác định các điểm không nhất quán hoặc trích xuất các điều khoản cụ thể với độ chính xác cao.

Hỗ trợ nghiên cứu cấp độ Tiến sĩ

Giải quyết các bài toán chứng minh phức tạp và các vấn đề khoa học bằng cách sử dụng chế độ Heavy Reasoning cho các chuỗi logic đã được kiểm chứng.

Diem manh

Han che

Context khủng 1,05M: Cung cấp năng lực hàng đầu ngành cho việc phân tích chuyên sâu các codebase và tập tài liệu khổng lồ mà không bị suy giảm ngữ cảnh.
Độ trễ Reasoning: Việc bật chế độ Heavy Thinking có thể dẫn đến thời gian chờ đợi lên tới vài phút cho các logic phức tạp hoặc tạo mã nguồn lớn.
Thinking tương tác: Điều hướng giữa phản hồi độc đáo cho phép người dùng điều khiển các hướng reasoning, giảm đáng kể việc tạo phản hồi lãng phí và tiêu tốn tokens.
Giới hạn tỷ lệ (Rate Limiting): Trong giai đoạn triển khai ban đầu, người dùng có thể gặp phải giới hạn tin nhắn nghiêm ngặt hoặc các lỗi tài khoản tạm thời khi quy mô hệ thống mở rộng.
Native Computer Use: Khả năng tương tác UI độ chính xác cao (75% trên OSWorld) cho phép model làm việc trực tiếp trong môi trường desktop và trình duyệt.
Scaling phi tuyến tính: Trong một số tác vụ sáng tạo, các chế độ reasoning nhẹ hơn được phát hiện là vượt trội hơn các chế độ nặng ở khía cạnh chi tiết thẩm mỹ.
Hiệu suất Token tối ưu: Kiến trúc được tối ưu hóa mang lại hiệu suất frontier năm 2026 với độ trễ và mức tiêu thụ năng lượng thấp hơn so với các phiên bản GPT-5 trước đó.
Context Rot ở mức 1M: Mặc dù cửa sổ ngữ cảnh lớn, độ chính xác khi truy xuất dữ liệu giảm đáng kể khi chuyển từ 256K lên 1M tokens.

Bat dau nhanh API

openai/gpt-5.4

Xem tai lieu
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.4",
    messages: [
      { role: "user", content: "Refactor this controller for better error handling." }
    ],
    reasoning_effort: "heavy"
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-5.4

Xem cong dong nghi gi ve GPT-5.4

GPT 5.4 trong Codex là một bước tiến rất lớn... Tôi đã thực sự thấy nó làm việc trong 150 phút liên tục mà không mất ngữ cảnh.
ArchMeta1868
reddit
Khả năng thiết kế 3D của GPT 5.4 là vô đối. Cách nó xử lý độ trong suốt và vật lý trong mô phỏng tàu của tôi chính xác một cách đáng sợ.
AI_Creative_Daily
twitter
Tính năng sửa đổi hướng trong quá trình phản hồi thật đáng kinh ngạc. Tôi thực sự có thể thấy model đang đi đến đâu và sửa nó trước khi nó lãng phí tokens.
dev_guru_99
reddit
Nó đánh bại con người trong 83% các trường hợp trên 44 công việc khác nhau. Luật sư. Kế toán. Chuyên gia tài chính. Quản trị viên.
Josh Kale
twitter
OpenAI cuối cùng đã sửa được nút thắt cổ chai đầu ra. 128k output tokens là giấc mơ cho các lập trình viên đang xây dựng các ứng dụng full-stack.
TheCodeChannel
youtube
Độ trễ của computer use vẫn còn đó, nhưng độ chính xác đủ cao để xử lý các quy trình SAP phức tạp, điều này thật điên rồ.
enterprise_sysadmin
hackernews

Video ve GPT-5.4

Xem huong dan, danh gia va thao luan ve GPT-5.4

GPT 5.4 đã ở đây và chúng ta có thể thực sự có một model tốt nhất hành tinh.

Thinking của GPT 5.4 hiện có thể cung cấp kế hoạch sơ bộ về suy nghĩ của nó... cho phép bạn hướng dẫn model.

Yếu tố tương tác này giải quyết vấn đề hộp đen của các reasoning model.

Tốc độ so với o1-preview thực sự là một trời một vực đối với các tác vụ thông thường.

Bạn đang thấy quá trình suy luận thực sự nhất quán trong các cuộc trò chuyện dài.

GPT 5.4... không được xây dựng để tán gẫu. Nó được xây dựng để làm việc.

Deferred loading... giảm tổng lượng sử dụng token tới 47% mà không làm giảm độ chính xác.

Tính năng computer use theo dõi các thành phần UI với hệ thống dựa trên tọa độ.

Tôi đã thử nghiệm nó với một codebase Java cũ và nó thực sự hiểu được các phụ thuộc chéo giữa các tệp.

Chúng ta đang tiến vào một thế giới nơi AI là bộ điều khiển hệ điều hành.

Context window 1 triệu 50 ngàn token. Đây là một context window rất dài.

Điều hướng nó khi nó đang suy nghĩ, chắc chắn là cách sử dụng hiệu quả hơn.

Giá cả khá đắt nhưng với các tập tài liệu lớn, đây là model duy nhất hoạt động tốt.

Thinking mode có thể được điều chỉnh dựa trên độ phức tạp của prompt của bạn.

Nó cảm giác đáng tin cậy hơn về việc truy xuất thông tin thực tế so với bất kỳ phiên bản GPT nào trước đó.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GPT-5.4

Meo chuyen gia giup ban tan dung toi da GPT-5.4 va dat ket qua tot hon.

Bật/Tắt Thinking Effort

Sử dụng các tham số Standard, Extended, hoặc Heavy để cân bằng giữa nhu cầu về độ chính xác và tốc độ/chi phí tạo phản hồi.

Xem xét Thinking Plan

Theo dõi kế hoạch sơ bộ do model cung cấp và sử dụng Mid-Response Steering để điều chỉnh nếu logic đi chệch hướng.

Tận dụng Deferred Tool Loading

Đối với các quy trình agentic, hãy sử dụng registry tải chậm (deferred loading) để giảm chi phí token ban đầu tới 47%.

Sử dụng Completeness Contracts

Xác định rõ ràng thế nào là hoàn thành trong prompt của bạn để giúp model duy trì sự kiên trì trong các tác vụ dài hơi.

Tầm nhìn độ phân giải tối đa

Tải lên các hình ảnh có độ trung thực cao lên tới 10,24 triệu điểm ảnh để kiểm tra trực quan chính xác các thành phần UI hoặc sơ đồ kỹ thuật.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Cau hoi thuong gap ve GPT-5.4

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-5.4