openai

GPT-5.1

GPT-5.1 là flagship reasoning nâng cao của OpenAI, nổi bật với tư duy thích ứng, khả năng multimodal nguyên bản và hiệu suất state-of-the-art trong toán học và...

openai logoopenaiGPT-512 tháng 11, 2025
Ngu canh
400Ktoken
Dau ra toi da
128Ktoken
Gia dau vao
$1.25/ 1M
Gia dau ra
$10.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
88.1%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-5.1 dat 88.1% trong benchmark nay.
HLE
32.5%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-5.1 dat 32.5% trong benchmark nay.
MMLU
90.2%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-5.1 dat 90.2% trong benchmark nay.
MMLU Pro
81%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-5.1 dat 81% trong benchmark nay.
SimpleQA
52%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-5.1 dat 52% trong benchmark nay.
IFEval
91%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-5.1 dat 91% trong benchmark nay.
AIME 2025
94%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-5.1 dat 94% trong benchmark nay.
MATH
91%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-5.1 dat 91% trong benchmark nay.
GSM8k
98.5%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-5.1 dat 98.5% trong benchmark nay.
MGSM
95%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-5.1 dat 95% trong benchmark nay.
MathVista
75%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-5.1 dat 75% trong benchmark nay.
SWE-Bench
76.3%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-5.1 dat 76.3% trong benchmark nay.
HumanEval
92.5%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-5.1 dat 92.5% trong benchmark nay.
LiveCodeBench
74%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-5.1 dat 74% trong benchmark nay.
MMMU
85.4%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-5.1 dat 85.4% trong benchmark nay.
MMMU Pro
62%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-5.1 dat 62% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-5.1 dat 89% trong benchmark nay.
DocVQA
93%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-5.1 dat 93% trong benchmark nay.
Terminal-Bench
58%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-5.1 dat 58% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-5.1 dat 12% trong benchmark nay.

Ve GPT-5.1

Tim hieu ve kha nang cua GPT-5.1, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kiến trúc Reasoning

GPT-5.1 có kiến trúc tư duy System 2. Điều này cho phép model điều chỉnh thời gian xử lý dựa trên độ phức tạp của truy vấn. Với các bài toán chứng minh, nó áp dụng suy luận logic sâu, trong khi các tác vụ trò chuyện đơn giản vẫn giữ được độ trễ thấp. Hệ thống reasoning thích ứng đảm bảo tính toán được phân bổ nơi nó mang lại giá trị cao nhất.

Hiệu suất Multimodal

Model sử dụng framework multimodal omni cho đầu vào văn bản và hình ảnh. Nó cung cấp độ trễ thấp hơn 84% trong các tác vụ trích xuất tài liệu doanh nghiệp so với phiên bản tiền nhiệm. Khả năng lưu giữ bộ nhớ cải tiến đảm bảo context được duy trì trong suốt các quy trình làm việc agentic dài hạn, giúp nó phù hợp với các dự án kỹ thuật phần mềm quy mô lớn.

Hệ thống cá nhân hóa

Một engine mới cho phép điều hướng giọng điệu và đặc điểm. Người dùng có thể cấu hình model trở nên chuyên nghiệp, thân thiện hoặc biểu cảm thông qua các chỉ dẫn hệ thống cụ thể. Những đặc điểm này cho phép các nhà phát triển triển khai các bot phù hợp hơn với nhận diện thương hiệu và sở thích người dùng mà không cần nhiều prompt few-shot.

GPT-5.1

Truong hop su dung cho GPT-5.1

Kham pha cac cach khac nhau ban co the su dung GPT-5.1 de dat ket qua tuyet voi.

Kỹ thuật phần mềm Agentic

Model tự động hóa các tác vụ tái cấu trúc phức tạp trên các codebase lớn bằng cách sử dụng reasoning có độ chính xác cao.

Nghiên cứu cấp độ Tiến sĩ

Nó giải quyết các vấn đề phức tạp trong sinh học và vật lý đòi hỏi các suy luận nhiều bước đã được kiểm chứng.

Phân tích tài liệu doanh nghiệp

Hệ thống trích xuất dữ liệu có cấu trúc từ các bộ tài liệu bảng biểu khổng lồ với độ chính xác hình ảnh cao.

Hỗ trợ khách hàng cá nhân hóa

Các nhà phát triển triển khai các bot với các đặc điểm thương hiệu cụ thể như vui vẻ hoặc chuyên nghiệp để phù hợp với cảm xúc người dùng.

Giải quyết vấn đề toán học

Model sử dụng điểm số 99.6% trên AIME để kiểm chứng các bài toán và hướng dẫn học sinh toán cao cấp.

Phân tích kinh doanh dựa trên thị giác

Nó phân tích các biểu đồ và báo cáo tài chính phức tạp để tạo ra các tóm tắt điều hành với context hình ảnh.

Diem manh

Han che

Reasoning toán học thượng thừa: Model đạt điểm số 99.6% trên AIME 2025, vượt trội hơn hầu hết các model cạnh tranh trước đây.
Output latency cao: Reasoning cần nỗ lực cao có thể kéo dài thời gian phản hồi lên hơn 20 giây cho các truy vấn phức tạp.
Xử lý thích ứng: Khả năng mở rộng tính toán linh hoạt giúp giảm latency tới 84% trong các tác vụ tài liệu doanh nghiệp đơn giản.
Không có âm thanh nguyên bản: Thiếu các khả năng speech-to-speech tích hợp như các đối thủ cạnh tranh như Gemini 2.0.
Kiểm soát tính cách nâng cao: Tính năng điều hướng giọng điệu nguyên bản giúp tương tác trở nên ấm áp và mang tính người hơn so với GPT-5 gốc.
Chi phí Output: Với mức giá $10 mỗi triệu token, chi phí cho các output reasoning dài cao hơn đáng kể so với các model phản hồi tức thì.
Context quy mô lớn: Context window 400.000 token kết hợp với caching 24 giờ cho phép thực hiện các quy trình làm việc agentic khổng lồ.
Các đặc điểm phong cách khó thay đổi: Người dùng phản hồi rằng model vẫn gặp khó khăn khi tránh các mẫu dấu câu cụ thể bất chấp các chỉ dẫn ghi nhớ rõ ràng.

Bat dau nhanh API

openai/gpt-5.1

Xem tai lieu
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-5.1

Xem cong dong nghi gi ve GPT-5.1

GPT-5.1 v.v trong Codex vẫn là công cụ đánh giá tốt nhất cho các tác vụ lập kế hoạch và review code.
darrenjr
twitter
Các đánh giá của chúng tôi cho thấy GPT-5 đạt hiệu suất cao hơn tới 190% so với các model hàng đầu khác trong việc reasoning phức tạp.
CodeRabbit
twitter
GPT-5.1 được tinh chỉnh tốt hơn theo độ khó của prompt, tiêu thụ ít token hơn trên các đầu vào dễ.
Tech Titans
facebook
Bản phát hành này tập trung hoàn toàn vào tính cách và làm cho ChatGPT bớt cảm giác lâm sàng và vô hồn.
Theo
youtube
Context window 400k thực sự là cứu cánh cho việc phân tích toàn bộ repository của chúng tôi.
RedditUser99
reddit
Vẫn không có âm thanh nguyên bản là một điểm trừ, nhưng sự cải thiện về reasoning là có thật.
HackerNewsGuy
hackernews

Video ve GPT-5.1

Xem huong dan, danh gia va thao luan ve GPT-5.1

GPT 5.1 đã có mặt. Nó nhanh hơn, chính xác hơn và giàu tính đối thoại hơn.

Lần đầu tiên, GPT 5.1 Instant có thể sử dụng reasoning thích ứng để quyết định khi nào cần suy nghĩ.

Logic ở đây vượt trội hơn đáng kể so với model GPT 5 tiêu chuẩn.

Nó duy trì tông giọng ấm áp hơn so với các phiên bản preview trước đó.

Nếu bạn là nhà phát triển, tính năng prompt caching mở rộng sẽ giúp bạn tiết kiệm rất nhiều chi phí.

Nó có khả năng cá nhân hóa cao hơn bao giờ hết.

Tông giọng nghe tự nhiên hơn nhiều... 5.1 tốt hơn nhiều cho nguồn năng lượng.

Tôi nhận thấy nó không bị ảo giác nhiều trong các bước làm việc phức tạp.

Tốc độ của chế độ instant gần tương đương với GPT 4o mini nhưng thông minh hơn.

Các tính năng cá nhân hóa đồng nghĩa với việc bạn có thể bảo nó bớt trang trọng đi.

Đây có lẽ là một trong những bản cập nhật lặp lại thoải mái nhất cho một frontier model.

Nó cho kết quả trò chơi xe điện đụng thành công so với tư duy của GPT5.

Khả năng xử lý hình ảnh trên các tài liệu viết tay sắc nét hơn đáng kể.

Tôi nghĩ nút gạt reasoning effort là tính năng tốt nhất để quản lý chi phí API.

Cuối cùng thì nó cũng cho cảm giác là một model bạn có thể trò chuyện cùng mà không nghe như một cuốn giáo khoa.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GPT-5.1

Meo chuyen gia giup ban tan dung toi da GPT-5.1 va dat ket qua tot hon.

Điều chỉnh Reasoning Effort

Sử dụng tham số reasoning_effort để đặt mức tư duy thành cao cho toán học nhưng để là 'none' cho trò chuyện đơn giản nhằm tiết kiệm latency.

Tận dụng Context lớn

Sử dụng context window 400k cho toàn bộ thư mục dự án vì model lưu giữ thông tin rất tốt trong các prompt dài.

Điều hướng giọng điệu (Tone Steering)

Bật các đặc điểm giọng điệu trong chỉ dẫn hệ thống để làm cho model bớt cứng nhắc và giống một cộng sự hơn.

Prompt Caching

Tận dụng tính năng prompt caching 24 giờ để giảm chi phí khi chạy các vòng lặp agentic lặp đi lặp lại trên cùng một codebase.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Cau hoi thuong gap ve GPT-5.1

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-5.1