Chi phí cho GPT-5.1 là bao nhiêu?

Input tokens có giá $1.25 trên một triệu và output tokens có giá $10.00 trên một triệu. Các mức giá này áp dụng cho các gói sử dụng API tiêu chuẩn.

Kích thước context window là bao nhiêu?

Model hỗ trợ lên đến 400.000 tokens trong một yêu cầu duy nhất. Dung lượng này gấp bốn lần so với phiên bản GPT-5-Turbo trước đó.

Model có hỗ trợ khả năng thị giác (vision) không?

Có, đây là một multimodal model có thể xử lý hình ảnh, biểu đồ và sơ đồ kỹ thuật. Nó hỗ trợ trích xuất tài liệu và nhận diện chữ viết tay.

Tôi có thể kiểm soát thời gian reasoning không?

Các nhà phát triển có thể điều chỉnh reasoning effort giữa các mức không, thấp và cao tùy thuộc vào độ khó của tác vụ. Điều này cho phép tối ưu hóa sự cân bằng giữa tốc độ và chiều sâu xử lý.

Tài liệu API nằm ở đâu?

Thông số kỹ thuật đầy đủ có sẵn tại trang tài liệu nền tảng chính thức của OpenAI trong mục model card của GPT-5.1.

Nó so sánh như thế nào với Claude 4.5?

GPT-5.1 cung cấp trí tuệ cảm xúc cao nhưng hiện đang dẫn đầu trong các benchmark toán học AIME và tốc độ xử lý tài liệu doanh nghiệp.

Đầu vào âm thanh có được hỗ trợ nguyên bản không?

Không, phiên bản này tập trung vào văn bản và hình ảnh. Âm thanh yêu cầu các luồng xử lý riêng biệt thông qua các endpoint dựa trên Whisper.

GPT-5.1

GPT-5.1 là flagship reasoning nâng cao của OpenAI, nổi bật với tư duy thích ứng, khả năng multimodal nguyên bản và hiệu suất state-of-the-art trong toán học và...

openaiGPT-512 tháng 11, 2025

Ngu canh

400Ktoken

Dau ra toi da

128Ktoken

Gia dau vao

$1.25/ 1M

Gia dau ra

$10.00/ 1M

Phuong thuc:TextImage

Kha nang:Thi giacCong cuTruyen truc tiepSuy luan

Diem chuan

GPQA

88.1%

HLE

32.5%

MMLU

90.2%

MMLU Pro

81%

SimpleQA

52%

IFEval

91%

AIME 2025

94%

MATH

91%

GSM8k

98.5%

MGSM

95%

MathVista

75%

SWE-Bench

76.3%

HumanEval

92.5%

LiveCodeBench

74%

MMMU

85.4%

MMMU Pro

62%

ChartQA

89%

DocVQA

93%

Terminal-Bench

58%

ARC-AGI

12%

Xem tai lieu API

Ve GPT-5.1

Tim hieu ve kha nang cua GPT-5.1, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kiến trúc Reasoning

GPT-5.1 có kiến trúc tư duy System 2. Điều này cho phép model điều chỉnh thời gian xử lý dựa trên độ phức tạp của truy vấn. Với các bài toán chứng minh, nó áp dụng suy luận logic sâu, trong khi các tác vụ trò chuyện đơn giản vẫn giữ được độ trễ thấp. Hệ thống reasoning thích ứng đảm bảo tính toán được phân bổ nơi nó mang lại giá trị cao nhất.

Hiệu suất Multimodal

Model sử dụng framework multimodal omni cho đầu vào văn bản và hình ảnh. Nó cung cấp độ trễ thấp hơn 84% trong các tác vụ trích xuất tài liệu doanh nghiệp so với phiên bản tiền nhiệm. Khả năng lưu giữ bộ nhớ cải tiến đảm bảo context được duy trì trong suốt các quy trình làm việc agentic dài hạn, giúp nó phù hợp với các dự án kỹ thuật phần mềm quy mô lớn.

Hệ thống cá nhân hóa

Một engine mới cho phép điều hướng giọng điệu và đặc điểm. Người dùng có thể cấu hình model trở nên chuyên nghiệp, thân thiện hoặc biểu cảm thông qua các chỉ dẫn hệ thống cụ thể. Những đặc điểm này cho phép các nhà phát triển triển khai các bot phù hợp hơn với nhận diện thương hiệu và sở thích người dùng mà không cần nhiều prompt few-shot.

Truong hop su dung cho GPT-5.1

Kham pha cac cach khac nhau ban co the su dung GPT-5.1 de dat ket qua tuyet voi.

Kỹ thuật phần mềm Agentic

Model tự động hóa các tác vụ tái cấu trúc phức tạp trên các codebase lớn bằng cách sử dụng reasoning có độ chính xác cao.

Nghiên cứu cấp độ Tiến sĩ

Nó giải quyết các vấn đề phức tạp trong sinh học và vật lý đòi hỏi các suy luận nhiều bước đã được kiểm chứng.

Phân tích tài liệu doanh nghiệp

Hệ thống trích xuất dữ liệu có cấu trúc từ các bộ tài liệu bảng biểu khổng lồ với độ chính xác hình ảnh cao.

Hỗ trợ khách hàng cá nhân hóa

Các nhà phát triển triển khai các bot với các đặc điểm thương hiệu cụ thể như vui vẻ hoặc chuyên nghiệp để phù hợp với cảm xúc người dùng.

Giải quyết vấn đề toán học

Model sử dụng điểm số 99.6% trên AIME để kiểm chứng các bài toán và hướng dẫn học sinh toán cao cấp.

Phân tích kinh doanh dựa trên thị giác

Nó phân tích các biểu đồ và báo cáo tài chính phức tạp để tạo ra các tóm tắt điều hành với context hình ảnh.

Diem manh

Han che

Reasoning toán học thượng thừa: Model đạt điểm số 99.6% trên AIME 2025, vượt trội hơn hầu hết các model cạnh tranh trước đây.

Output latency cao: Reasoning cần nỗ lực cao có thể kéo dài thời gian phản hồi lên hơn 20 giây cho các truy vấn phức tạp.

Xử lý thích ứng: Khả năng mở rộng tính toán linh hoạt giúp giảm latency tới 84% trong các tác vụ tài liệu doanh nghiệp đơn giản.

Không có âm thanh nguyên bản: Thiếu các khả năng speech-to-speech tích hợp như các đối thủ cạnh tranh như Gemini 2.0.

Kiểm soát tính cách nâng cao: Tính năng điều hướng giọng điệu nguyên bản giúp tương tác trở nên ấm áp và mang tính người hơn so với GPT-5 gốc.

Chi phí Output: Với mức giá $10 mỗi triệu token, chi phí cho các output reasoning dài cao hơn đáng kể so với các model phản hồi tức thì.

Context quy mô lớn: Context window 400.000 token kết hợp với caching 24 giờ cho phép thực hiện các quy trình làm việc agentic khổng lồ.

Các đặc điểm phong cách khó thay đổi: Người dùng phản hồi rằng model vẫn gặp khó khăn khi tránh các mẫu dấu câu cụ thể bất chấp các chỉ dẫn ghi nhớ rõ ràng.

Bat dau nhanh API

openai/gpt-5.1

Xem tai lieu

openai SDK

import OpenAI from 'openai';

const openai = new OpenAI();

const response = await openai.chat.completions.create({
  model: "gpt-5.1",
  messages: [{ role: "user", content: "Analyze the security of this smart contract." }],
  reasoning_effort: "high",
});

console.log(response.choices[0].message.content);

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GPT-5.1

Xem cong dong nghi gi ve GPT-5.1

“GPT-5.1 v.v trong Codex vẫn là công cụ đánh giá tốt nhất cho các tác vụ lập kế hoạch và review code.”

— darrenjr

twitter

“Các đánh giá của chúng tôi cho thấy GPT-5 đạt hiệu suất cao hơn tới 190% so với các model hàng đầu khác trong việc reasoning phức tạp.”

— CodeRabbit

twitter

“GPT-5.1 được tinh chỉnh tốt hơn theo độ khó của prompt, tiêu thụ ít token hơn trên các đầu vào dễ.”

— Tech Titans

facebook

“Bản phát hành này tập trung hoàn toàn vào tính cách và làm cho ChatGPT bớt cảm giác lâm sàng và vô hồn.”

— Theo

youtube

“Context window 400k thực sự là cứu cánh cho việc phân tích toàn bộ repository của chúng tôi.”

— RedditUser99

“Vẫn không có âm thanh nguyên bản là một điểm trừ, nhưng sự cải thiện về reasoning là có thật.”

— HackerNewsGuy

hackernews

Video ve GPT-5.1

Xem huong dan, danh gia va thao luan ve GPT-5.1

“GPT 5.1 đã có mặt. Nó nhanh hơn, chính xác hơn và giàu tính đối thoại hơn.”

“Lần đầu tiên, GPT 5.1 Instant có thể sử dụng reasoning thích ứng để quyết định khi nào cần suy nghĩ.”

“Logic ở đây vượt trội hơn đáng kể so với model GPT 5 tiêu chuẩn.”

“Nó duy trì tông giọng ấm áp hơn so với các phiên bản preview trước đó.”

“Nếu bạn là nhà phát triển, tính năng prompt caching mở rộng sẽ giúp bạn tiết kiệm rất nhiều chi phí.”

“Nó có khả năng cá nhân hóa cao hơn bao giờ hết.”

“Tông giọng nghe tự nhiên hơn nhiều... 5.1 tốt hơn nhiều cho nguồn năng lượng.”

“Tôi nhận thấy nó không bị ảo giác nhiều trong các bước làm việc phức tạp.”

“Tốc độ của chế độ instant gần tương đương với GPT 4o mini nhưng thông minh hơn.”

“Các tính năng cá nhân hóa đồng nghĩa với việc bạn có thể bảo nó bớt trang trọng đi.”

“Đây có lẽ là một trong những bản cập nhật lặp lại thoải mái nhất cho một frontier model.”

“Nó cho kết quả trò chơi xe điện đụng thành công so với tư duy của GPT5.”

“Khả năng xử lý hình ảnh trên các tài liệu viết tay sắc nét hơn đáng kể.”

“Tôi nghĩ nút gạt reasoning effort là tính năng tốt nhất để quản lý chi phí API.”

“Cuối cùng thì nó cũng cho cảm giác là một model bạn có thể trò chuyện cùng mà không nghe như một cuốn giáo khoa.”

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent

Tu dong hoa web

Quy trinh thong minh

Bat dau mien phi

Meo chuyen nghiep cho GPT-5.1

Meo chuyen gia giup ban tan dung toi da GPT-5.1 va dat ket qua tot hon.

Điều chỉnh Reasoning Effort

Sử dụng tham số reasoning_effort để đặt mức tư duy thành cao cho toán học nhưng để là 'none' cho trò chuyện đơn giản nhằm tiết kiệm latency.

Tận dụng Context lớn

Sử dụng context window 400k cho toàn bộ thư mục dự án vì model lưu giữ thông tin rất tốt trong các prompt dài.

Điều hướng giọng điệu (Tone Steering)

Bật các đặc điểm giọng điệu trong chỉ dẫn hệ thống để làm cho model bớt cứng nhắc và giống một cộng sự hơn.

Prompt Caching

Tận dụng tính năng prompt caching 24 giờ để giảm chi phí khi chạy các vòng lặp agentic lặp đi lặp lại trên cùng một codebase.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context

$0.40/$2.40/1M

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Cau hoi thuong gap ve GPT-5.1

Tim cau tra loi cho cac cau hoi thuong gap ve GPT-5.1