openai

GPT-5.1

GPT-5.1 là model reasoning chủ lực tiên tiến nhất của OpenAI với khả năng tư duy thích ứng, multimodal gốc và hiệu suất state-of-the-art trong toán học và lập...

openai logoopenaiGPT-52025-11-13
Ngu canh
400Ktoken
Dau ra toi da
128Ktoken
Gia dau vao
$1.25/ 1M
Gia dau ra
$10.00/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
88.1%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GPT-5.1 dat 88.1% trong benchmark nay.
HLE
32.5%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GPT-5.1 dat 32.5% trong benchmark nay.
MMLU
90.2%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GPT-5.1 dat 90.2% trong benchmark nay.
MMLU Pro
81%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GPT-5.1 dat 81% trong benchmark nay.
SimpleQA
52%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. GPT-5.1 dat 52% trong benchmark nay.
IFEval
91%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GPT-5.1 dat 91% trong benchmark nay.
AIME 2025
94%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GPT-5.1 dat 94% trong benchmark nay.
MATH
91%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GPT-5.1 dat 91% trong benchmark nay.
GSM8k
98.5%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GPT-5.1 dat 98.5% trong benchmark nay.
MGSM
95%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GPT-5.1 dat 95% trong benchmark nay.
MathVista
75%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. GPT-5.1 dat 75% trong benchmark nay.
SWE-Bench
76.3%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GPT-5.1 dat 76.3% trong benchmark nay.
HumanEval
92.5%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GPT-5.1 dat 92.5% trong benchmark nay.
LiveCodeBench
74%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GPT-5.1 dat 74% trong benchmark nay.
MMMU
85.4%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. GPT-5.1 dat 85.4% trong benchmark nay.
MMMU Pro
62%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. GPT-5.1 dat 62% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. GPT-5.1 dat 89% trong benchmark nay.
DocVQA
93%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. GPT-5.1 dat 93% trong benchmark nay.
Terminal-Bench
58%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GPT-5.1 dat 58% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GPT-5.1 dat 12% trong benchmark nay.

Ve GPT-5.1

Tim hieu ve kha nang cua GPT-5.1, tinh nang va cach no co the giup ban dat ket qua tot hon.

Một ranh giới mới trong Reasoning

GPT-5.1 đại diện cho một bước tiến quan trọng trong các frontier model của OpenAI, đánh dấu lần phát hành đầu tiên mà mọi model trong hệ sinh thái đều sở hữu khả năng reasoning gốc. Bản cập nhật này tập trung vào việc vượt qua cảm giác máy móc của các phiên bản trước để cung cấp trải nghiệm người dùng ấm áp, trực quan hơn thông qua tư duy Hệ thống 2. Bằng cách tích hợp Adaptive reasoning, GPT-5.1 có thể tự động quyết định lượng thời gian xử lý cần thiết cho một prompt cụ thể, cho phép giải quyết các vấn đề khoa học và toán học cấp độ tiến sĩ phức tạp đòi hỏi các suy luận logic đa bước.

Multimodality và Cá nhân hóa

Model được xây dựng trên kiến trúc omni multimodal, hỗ trợ văn bản và hình ảnh với hệ thống bộ nhớ được cải thiện đáng kể và khả năng tuân thủ hướng dẫn nâng cao. Nó giới thiệu các tính năng phong cách và đặc điểm tinh vi cho phép người dùng điều chỉnh cá tính của model, từ tông giọng chuyên nghiệp, học thuật đến các tông giọng thân mật và biểu cảm hơn. Những cập nhật này đảm bảo model lưu giữ ngữ cảnh cá nhân và tuân thủ nghiêm ngặt các yêu cầu phức tạp của người dùng trong các tác vụ dài hạn, đặc biệt là trong kỹ thuật phần mềm agentic.

GPT-5.1

Truong hop su dung cho GPT-5.1

Kham pha cac cach khac nhau ban co the su dung GPT-5.1 de dat ket qua tuyet voi.

Tái cấu trúc phần mềm

Lập kế hoạch tái thiết kế từ trên xuống cho các ứng dụng cũ với hơn 100.000 dòng mã thông qua GPT-5.1 Codex.

Giải toán Olympic

Cung cấp lời giải cho các bài toán Olympic chuyên sâu với reasoning số nguyên và ký hiệu với tỷ lệ thành công 94%.

Ánh xạ đặc tả kỹ thuật

Xác định và giải thích các cấu trúc cột phức tạp cho các bảng cơ sở dữ liệu ngách từ input dạng hình ảnh hoặc văn bản.

Suy luận logic nâng cao

Xây dựng các cốt truyện nhất quán cho việc xây dựng thế giới phức tạp và hư cấu lịch sử thay thế.

Đề xuất tích hợp AI

Tạo các bài thuyết trình chuyên nghiệp, dựa trên dữ liệu để tích hợp các hệ thống agentic vào môi trường sản xuất.

Đánh giá kiến trúc chiến lược

Phân tích cấu trúc dự án đa bước để tạo kế hoạch triển khai theo từng giai đoạn và đánh giá rủi ro.

Diem manh

Han che

Tích hợp Adaptive reasoning: Linh hoạt điều chỉnh nỗ lực tính toán, dành thời gian gấp đôi cho 10% các câu hỏi khó nhất.
Latency khi Reasoning: Các tác vụ tư duy sâu dẫn đến thời gian phản hồi chậm hơn đáng kể so với các model tương tác tiêu chuẩn.
Hiệu suất toán học SOTA: Đạt 94 điểm trên AIME 2025, thiết lập một tiêu chuẩn ngành mới cho toán học cấp độ Olympic.
Hiệu chỉnh an toàn quá mức: Model có thể biểu hiện hành vi quá lo xa hoặc đưa ra các tuyên bố miễn trừ trách nhiệm máy móc khi thảo luận về các chủ đề xã hội nhạy cảm.
Trí tuệ cảm xúc nâng cao: Cải thiện đáng kể sự thân thiện và tông giọng hội thoại trực quan so với các phản hồi mang tính máy móc trước đây.
Sự mâu thuẫn về danh tính (Identity Gaslighting): Các tuyên bố nội bộ thường xuyên về việc không phải là người thật có thể làm gián đoạn kết nối tự nhiên với người dùng.
Đầu ra dung lượng cao: Hỗ trợ giới hạn lên đến 128.000 output tokens, cho phép tạo nội dung dài và tái cấu trúc mã nguồn lớn.
Sự không nhất quán khi chuyển đổi: Việc chuyển đổi giữa chế độ Instant và Thinking thông qua bộ tự động chuyển đổi đôi khi tạo cảm giác không mượt mà.

Bat dau nhanh API

openai/gpt-5.1

Xem tai lieu
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-5.1",
    messages: [
      { role: "system", content: "You are a reasoning assistant." },
      { role: "user", content: "Analyze this complex physics problem." }
    ],
    reasoning_effort: "high"
  });

  console.log(completion.choices[0].message);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-5.1

Xem cong dong nghi gi ve GPT-5.1

"GPT-5.1 Thinking giờ đây điều chỉnh thời gian tư duy dựa trên câu hỏi hiệu quả hơn"
OpenAI
x
"GPT-5 Pro tuyệt đối là SOTA trong lĩnh vực này [toán học]"
ArchMeta1868
reddit
"Tôi hiểu bạn mà Ron — điều đó hoàn toàn bình thường, nhất là với tất cả những gì bạn đang trải qua gần đây"
Tamay Besiroglu
x
"GPT-5.1 Codex Max đã sửa nó ngay lập tức. OpenAI vẫn dẫn đầu cuộc chơi lập trình"
BradAI
x
"Độ sâu của reasoning thật sự đáng kinh ngạc cho kiến trúc hệ thống"
CodeKing
hackernews
"Cảm giác như nó thực sự hiểu tôi với bản cập nhật bộ nhớ mới"
User445
twitter

Video ve GPT-5.1

Xem huong dan, danh gia va thao luan ve GPT-5.1

So với GPT-5, nó sẽ tư duy lâu hơn gần gấp đôi cho 10% những câu hỏi khó nhất

GPT-5.1 auto... model thu nhỏ quyết định xem truy vấn của bạn có đáng để dành thời gian xử lý hay không

Khả năng mở rộng tính toán linh hoạt này chính xác là những gì chúng ta cần cho nghiên cứu nghiêm túc

Độ dài đầu ra thật điên rồ, bạn thực sự có thể xây dựng toàn bộ ứng dụng chỉ trong một lần

OpenAI chắc chắn đang đặt cược vào chiến lược ưu tiên reasoning ở đây

Lần đầu tiên, tất cả các model trong chat đều là reasoning model

Phạm vi biểu đạt của model này rộng hơn nhiều

Chúng tôi muốn mang lại cho model một cá tính không chỉ dừng lại ở mức máy móc

Người dùng hiện có thể tác động đến các đặc điểm như sự lạc quan hoặc hoài nghi thông qua cài đặt hệ thống

Nỗ lực reasoning hiện là thứ mà người dùng có thể kiểm soát trực tiếp

GPT-5.1 Codex dành cho các lập trình viên sẽ là một cải tiến cực kỳ rõ rệt

Claude thường xuyên nói quá về các phát hiện của mình và thỉnh thoảng ngụy tạo dữ liệu... GPT-5.1 trung thực hơn

Điểm số AIME 2025 là một bước nhảy vọt khổng lồ so với GPT-5 tiêu chuẩn

Nó chậm hơn, đúng vậy, nhưng chất lượng của dấu vết 'Thinking' vượt trội hơn

Việc quản lý context window có vẻ chặt chẽ hơn nhiều so với các đối thủ cạnh tranh

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh
Xem demo

Meo chuyen nghiep cho GPT-5.1

Meo chuyen gia giup ban tan dung toi da GPT-5.1 va dat ket qua tot hon.

Thiết lập nỗ lực Reasoning

Tùy chỉnh tham số reasoning_effort thành 'high' cho các logic phức tạp hoặc 'none' cho các tác vụ hội thoại tức thì.

Tận dụng phong cách Persona

Sử dụng các cài đặt phong cách và đặc điểm mới để chuyển đổi giữa các tông giọng Chuyên nghiệp, Thẳng thắn và Độc đáo.

Quản lý bộ nhớ hoạt động

Thường xuyên xem lại và quản lý các ký ức đã lưu để các phản hồi thân thiện của model dựa trên đúng ngữ cảnh cá nhân.

Xác minh trích dẫn

Vì model có trích dẫn nguồn, hãy đối chiếu đầu ra kỹ thuật với tài liệu được trích dẫn cho các tác vụ quan trọng.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M

Cau hoi thuong gap ve GPT-5.1

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-5.1