openai

GPT-5.3 Codex

GPT-5.3 Codex là agent lập trình frontier năm 2026 của OpenAI, sở hữu context window 400K, điểm Terminal-Bench 77,3% và logic vượt trội cho các phần mềm phức...

Agent lập trìnhGPT-5OpenAIKỹ thuật phần mềmAI tự hành
openai logoopenaiGPT5 tháng 2, 2026
Ngu canh
400Ktoken
Dau ra toi da
128Ktoken
Gia dau vao
$1.75/ 1M
Gia dau ra
$14.00/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
81%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-5.3 Codex dat 81% trong benchmark nay.
HLE
36%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-5.3 Codex dat 36% trong benchmark nay.
MMLU
93%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-5.3 Codex dat 93% trong benchmark nay.
MMLU Pro
83%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-5.3 Codex dat 83% trong benchmark nay.
SimpleQA
58%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-5.3 Codex dat 58% trong benchmark nay.
IFEval
94%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-5.3 Codex dat 94% trong benchmark nay.
AIME 2025
94%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-5.3 Codex dat 94% trong benchmark nay.
MATH
96%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-5.3 Codex dat 96% trong benchmark nay.
GSM8k
99%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-5.3 Codex dat 99% trong benchmark nay.
MGSM
96%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-5.3 Codex dat 96% trong benchmark nay.
MathVista
78%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-5.3 Codex dat 78% trong benchmark nay.
SWE-Bench
57%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-5.3 Codex dat 57% trong benchmark nay.
HumanEval
93%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-5.3 Codex dat 93% trong benchmark nay.
LiveCodeBench
71%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-5.3 Codex dat 71% trong benchmark nay.
MMMU
84%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-5.3 Codex dat 84% trong benchmark nay.
MMMU Pro
64%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-5.3 Codex dat 64% trong benchmark nay.
ChartQA
91%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-5.3 Codex dat 91% trong benchmark nay.
DocVQA
95%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-5.3 Codex dat 95% trong benchmark nay.
Terminal-Bench
77.3%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-5.3 Codex dat 77.3% trong benchmark nay.
ARC-AGI
54%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-5.3 Codex dat 54% trong benchmark nay.

Ve GPT-5.3 Codex

Tim hieu ve kha nang cua GPT-5.3 Codex, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kỷ nguyên mới của phát triển tự hành

GPT-5.3 Codex là model lập trình agentic có năng lực nhất của OpenAI. Nó thu hẹp khoảng cách giữa việc tạo code tĩnh và kỹ thuật phần mềm tự hành. Được xây dựng trên kiến trúc GPT-5, nó tích hợp kiến thức chuyên môn với khả năng suy luận nâng cao để xử lý các tác vụ dài hạn như quản trị hệ thống, giám sát triển khai và tái cấu trúc kiến trúc. Model bao gồm tính năng điều hướng giữa tác vụ, cho phép lập trình viên tương tác và hướng dẫn agent theo thời gian thực khi nó điều hướng các dự án phức tạp.

Trí tuệ đệ quy và Hiệu suất

OpenAI đã huấn luyện model này bằng cách sử dụng chính các phiên bản trước đó của nó để debug và tối ưu hóa quá trình triển khai. Đây là bước tiến quan trọng hướng tới các hệ thống tự cải thiện. Nó xuất sắc trong các môi trường Terminal-Bench 2.0, thể hiện khả năng quản lý terminal trực tiếp, chạy unit test và lặp lại việc sửa lỗi mà không cần can thiệp của con người. Phương pháp huấn luyện đệ quy này dẫn đến việc sử dụng token hiệu quả và context window 400.000 token. Nó có thể tiêu hóa toàn bộ kho lưu trữ doanh nghiệp trong một lần đọc.

Tích hợp chuyên nghiệp liền mạch

Khả dụng thông qua ứng dụng Codex chuyên dụng, CLI và các tiện ích mở rộng IDE, model này tích hợp vào các quy trình hiện đại. Nó hiệu quả trong việc xác định các lỗ hổng zero-day, tối ưu hóa kiến trúc luồng dữ liệu và thực hiện kiểm toán cấp production cho các codebase cũ. Với logic vượt trội và giá cả cạnh tranh, đây là công cụ hiệu suất cao cho các tác vụ kỹ thuật phần mềm quan trọng.

GPT-5.3 Codex

Truong hop su dung cho GPT-5.3 Codex

Kham pha cac cach khac nhau ban co the su dung GPT-5.3 Codex de dat ket qua tuyet voi.

Kỹ thuật phần mềm tự hành

Kiến trúc và xây dựng các dự án phần mềm đa file, dạng module từ các đặc tả cấp cao.

Kiểm toán mã nguồn production

Phân tích codebase trực tiếp để tìm các vấn đề về concurrency, rò rỉ bộ nhớ và nợ kỹ thuật kiến trúc.

Tự động hóa DevOps thời gian thực

Quản lý các quy trình dựa trên terminal bao gồm thiết lập máy chủ, triển khai container và mở rộng quy mô cluster.

Khắc phục lỗ hổng bảo mật

Xác định và sửa chữa các lỗ hổng zero-day và các lỗ hổng phần mềm với logic phòng thủ năng lực cao.

Tạo mẫu tương tác

Tạo các trang landing page và web app sẵn sàng cho production từ các bản vẽ tay hoặc prompt chưa hoàn thiện.

Kiến trúc luồng dữ liệu

Truy vết và tối ưu hóa các luồng dữ liệu phức tạp trên nhiều lớp xử lý và môi trường bất đồng bộ.

Diem manh

Han che

Logic lập trình state-of-the-art: Đạt điểm 77,3% trên Terminal-Bench 2.0 dẫn đầu ngành và hiệu suất vượt trội trên SWE-Bench Pro.
Sự ngắn gọn về chức năng: Đôi khi ưu tiên sự ngắn gọn về chức năng hơn là chiều sâu kiến trúc cực hạn như các model như o3-pro.
Hiệu suất trên giá thành không đối thủ: Mang lại khả năng agentic ở cấp độ frontier với chi phí chỉ bằng khoảng 1/7 so với các đối thủ như Opus 4.6.
Mặc định về thẩm mỹ: Mặc dù logic hoàn hảo, nhưng các thiết kế UI ban đầu cho các ứng dụng đôi khi thiếu sự bóng bẩy về hình ảnh hiện đại.
Tự tối ưu hóa đệ quy: Được xây dựng bằng chính kiến trúc của nó để xác định lỗi và tối ưu hóa training nhằm đạt hiệu suất cao.
Khoảng trống tài nguyên trong các tình huống quan trọng: Đôi khi bỏ sót các tác vụ dọn dẹp tài nguyên cụ thể trong các mô phỏng phần cứng-phần mềm phức tạp.
Điều hướng thời gian thực tương tác: Khả năng độc đáo trong việc nhận chỉ đạo từ con người ngay giữa tác vụ, giảm nhu cầu lặp lại nhiều vòng.
Ma sát hệ sinh thái: Quyền truy cập chính được tối ưu hóa cho ứng dụng Codex chuyên dụng và CLI, tạo ra đường cong học tập cho người dùng API tiêu chuẩn.

Bat dau nhanh API

openai/gpt-5.3-codex

Xem tai lieu
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: 'user', content: 'Audit this Swift actor for race conditions' }],
    model: 'gpt-5.3-codex',
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-5.3 Codex

Xem cong dong nghi gi ve GPT-5.3 Codex

GPT-5.3 Codex cho cảm giác giống một model kỹ sư thuần túy hơn là một chatbot tổng quát.
Federal-Piano8695
reddit
Codex đang cung cấp mã nguồn tốt hơn với mức giá chỉ bằng khoảng 1/7. Hiệu suất trên giá thành thật vô lý.
sergeykarayev
reddit
Nó không chỉ thực thi hướng dẫn của tôi. Nó đang đưa ra các quyết định thông minh. Nó có thứ gì đó giống như khả năng phán đoán.
mattshumer_
twitter
Vừa di chuyển toàn bộ hệ thống backend orchestration của chúng tôi sang các agent Codex và độ tin cậy thực sự cao đến đáng sợ.
HackerNewsUser99
hackernews
GPT 5.3 Codex đã thiết lập kỷ lục mới trên Terminal-Bench 2.0. 77,3% là một bước nhảy vọt so với phiên bản trước.
bridgemindai
twitter
Khả năng xử lý context window 400k giúp kiểm toán toàn bộ kho lưu trữ doanh nghiệp chỉ trong một lần.
cdcore
other

Video ve GPT-5.3 Codex

Xem huong dan, danh gia va thao luan ve GPT-5.3 Codex

Codeex thực sự triển khai đúng cả một và hai khi thực hiện thay đổi view trong khi Claude chỉ map nó vào key một.

Codeex thực sự đã tìm ra nguyên nhân chính, nhưng cũng xác định đó như một vấn đề tiềm ẩn và đã sửa nó.

Tôi thích cách nó phản hồi từ các tòa nhà, vật lý cảm giác tự nhiên nhất.

So sánh với Gemini 3.1, Codex xử lý logic đa file với độ sai lệch ít hơn nhiều.

Tốc độ của các vòng lặp agentic ở đây nhanh hơn đáng kể so với Claude Opus 4.6.

Đây không phải là một trợ lý code thông thường. Đây là một AI tự xây dựng toàn bộ dự án khi bạn đang theo dõi.

Khả năng ném cả một bộ tài liệu vào prompt thực sự rất điên rồ.

Bạn có thể thấy nó tự sửa lỗi trong terminal theo thời gian thực.

Nếu bạn đang phát triển công cụ SEO, các script cào dữ liệu tự động mà nó viết đã sẵn sàng cho production.

Nó đã triển khai toàn bộ trang web lên Vercel mà tôi không cần chạm vào bất kỳ nút nào.

GPT-5.3 Codex là model đầu tiên của chúng tôi đóng vai trò quan trọng trong việc tự tạo ra chính nó.

Hiệu quả trong việc gia tăng những gì nó có thể làm với ít token hơn thực sự rất tuyệt vời.

Chúng ta đang thấy một bước nhảy vọt trong cách nó xử lý tích hợp phần cứng thực tế.

Công cụ reasoning đằng sau các quyết định lập trình mạnh mẽ hơn nhiều so với GPT-5 tiêu chuẩn.

Điểm Terminal-Bench là một chuyện, nhưng nhìn nó điều hướng hệ thống file linux lại là chuyện khác.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GPT-5.3 Codex

Meo chuyen gia giup ban tan dung toi da GPT-5.3 Codex va dat ket qua tot hon.

Bật tính năng điều hướng thời gian thực

Kích hoạt hành vi theo dõi (follow-up) trong cài đặt Codex để hướng dẫn model ngay trong quá trình build mà không mất context.

Tận dụng Plan Mode

Sử dụng lệnh Plan cho các tác vụ refactor phức tạp để model lập chiến lược trước khi thực hiện chỉnh sửa.

Batch Pull Request Reviews

Nạp toàn bộ các nhánh tính năng (feature branches) vào context window 400K để kiểm thử tích hợp chuyên sâu.

Nén ngữ cảnh (Context Compaction)

Sử dụng tính năng nén ngữ cảnh gốc cho các phiên làm việc agentic dài hạn để duy trì trọng tâm dự án.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Cau hoi thuong gap ve GPT-5.3 Codex

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-5.3 Codex