zhipu

GLM-5.2

GLM-5.2 là flagship model open-weight của Zhipu AI, với context window 1M và khả năng lập trình agentic chuyên biệt theo giấy phép MIT.

Open WeightsMIT LicenseCoding Assistant1M ContextReasoning
zhipu logozhipuGLM-516 tháng 6, 2026
Ngu canh
1.0Mtoken
Dau ra toi da
4Ktoken
Gia dau vao
$1.40/ 1M
Gia dau ra
$4.40/ 1M
Phuong thuc:Text
Kha nang:Cong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
83%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. GLM-5.2 dat 83% trong benchmark nay.
HLE
40%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. GLM-5.2 dat 40% trong benchmark nay.
MMLU
94%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. GLM-5.2 dat 94% trong benchmark nay.
MMLU Pro
86%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. GLM-5.2 dat 86% trong benchmark nay.
IFEval
85%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. GLM-5.2 dat 85% trong benchmark nay.
AIME 2025
99%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. GLM-5.2 dat 99% trong benchmark nay.
MATH
97%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. GLM-5.2 dat 97% trong benchmark nay.
GSM8k
98%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. GLM-5.2 dat 98% trong benchmark nay.
MGSM
91%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. GLM-5.2 dat 91% trong benchmark nay.
SWE-Bench
62%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. GLM-5.2 dat 62% trong benchmark nay.
HumanEval
97%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. GLM-5.2 dat 97% trong benchmark nay.
LiveCodeBench
65%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. GLM-5.2 dat 65% trong benchmark nay.
Terminal-Bench
81%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. GLM-5.2 dat 81% trong benchmark nay.
ARC-AGI
14%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. GLM-5.2 dat 14% trong benchmark nay.

Ve GLM-5.2

Tim hieu ve kha nang cua GLM-5.2, tinh nang va cach no co the giup ban dat ket qua tot hon.

Kiến trúc Mixture of Experts

GLM-5.2 là một flagship model Mixture of Experts (MoE) được thiết kế cho các tác vụ dài hạn và quy trình làm việc agentic tự động. Nó sử dụng kiến trúc khổng lồ 753 tỷ parameters với khoảng 40 tỷ active parameters trên mỗi token. Thiết kế này thể hiện một bước tiến lớn về hiệu suất cho dòng GLM bằng cách giảm chi phí compute trong khi vẫn duy trì hiệu năng cho các tác vụ logic phức tạp.

Hiệu quả IndexShare

Model giới thiệu IndexShare, một cải tiến kiến trúc mới giúp tái sử dụng các indexer trên các sparse attention layers. Đổi mới này giúp giảm các phép toán floating point trên mỗi token đi 2,9 lần ở độ dài context 1 triệu token. Hiệu suất này làm cho context window khổng lồ trở nên thực sự hữu dụng cho các dự án quy mô lớn thay vì chỉ là giới hạn lý thuyết.

Đào tạo Agentic chuyên biệt

Điều phân biệt GLM-5.2 với các lựa chọn thay thế là sự tập trung vào các quỹ đạo lập trình dài hạn. Nó được đào tạo chuyên biệt cho các tác vụ debug phức tạp và triển khai trên toàn bộ codebase. Các lập trình viên có thể chuyển đổi giữa các mức độ suy luận HighMax, cho phép model dành nhiều compute hơn cho việc suy luận nội bộ để tối ưu hóa hệ thống và giải quyết vấn đề toán học nâng cao.

GLM-5.2

Truong hop su dung cho GLM-5.2

Kham pha cac cach khac nhau ban co the su dung GLM-5.2 de dat ket qua tuyet voi.

Kỹ thuật phần mềm Agentic

Triển khai model trong các khung làm việc tự động để xử lý các tác vụ phát triển từ thu thập yêu cầu đến triển khai cuối cùng.

Tái cấu trúc mã nguồn quy mô lớn

Phân tích và viết lại các dự án phần mềm gồm nhiều file bằng cách nạp toàn bộ codebase vào context window 1M.

Xem xét tài liệu tự động

Xử lý các bộ tài liệu pháp lý hoặc kỹ thuật khổng lồ để xác định sự không nhất quán hoặc trích xuất dữ liệu có cấu trúc với độ chính xác suy luận cao.

Tạo cảnh 3D

Sử dụng thế mạnh chuyên biệt trong WebGL và HTML5 để tạo các mô hình trực quan 3D tương tác phức tạp từ prompt văn bản.

Tự động hóa logic kinh doanh

Kết nối model vào hệ điều hành agent để quản lý bộ nhớ dùng chung và thực hiện các quy trình công việc kéo dài nhiều giờ mà không cần giám sát.

Phát triển cục bộ ưu tiên quyền riêng tư

Chạy model open weight trên các cụm phần cứng riêng để đảm bảo chủ quyền dữ liệu hoàn toàn cho các dự án kỹ thuật nhạy cảm của doanh nghiệp.

Diem manh

Han che

Trí tuệ lập trình vượt trội: Model xếp hạng #3 trên FrontierSWE với điểm số 74,4%, chứng minh khả năng xử lý các dự án kỹ thuật kéo dài nhiều giờ.
Độ dài token cao: Model có xu hướng tạo ra số lượng tokens gấp khoảng 2 lần so với phiên bản tiền nhiệm để đạt kết quả, làm tăng latency.
Giá/Hiệu năng đột phá: Với mức giá 1,40 USD/4,40 USD mỗi triệu tokens, nó mang lại trí tuệ ở mức frontier model với chi phí chỉ bằng khoảng 1/6 so với các đối thủ độc quyền.
Yêu cầu phần cứng khổng lồ: Với dung lượng 753B parameters, việc triển khai cục bộ là bất khả thi đối với hầu hết lập trình viên cá nhân nếu không có quantization đáng kể.
1M Context thực dụng: Được tối ưu hóa cho các quỹ đạo lập trình dài hơi và phức tạp, nơi các model trước đây thường thất bại trong việc duy trì sự mạch lạc.
Tốc độ phản hồi chậm hơn: Thời gian phản hồi có thể chậm gấp 3 lần so với các model phương Tây do các chu kỳ suy luận nội bộ kéo dài.
Chủ quyền và Quyền riêng tư đầy đủ: Open weights theo giấy phép MIT cho phép lập trình viên chạy model cục bộ, tránh các rủi ro API bên ngoài và rò rỉ dữ liệu.
Khả năng sáng tạo thiết kế chưa cao: Dù thành thạo kỹ thuật trong lập trình frontend, nó có thể kém sáng tạo trong thiết kế thẩm mỹ hơn so với Claude Opus.

Bat dau nhanh API

zhipu/glm-5.2

Xem tai lieu
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve GLM-5.2

Xem cong dong nghi gi ve GLM-5.2

Tôi đã nói hàng tháng nay rằng các AI model open-source chậm hơn frontier model 6 tháng. Họ đã bắt kịp rồi. GLM 5.2 tốt ngang Opus 4.8.
Alex Finn
twitter
Bước nhảy giữa 5.1 và 5.2 là khá lớn... nó thực sự thích các chuỗi suy luận dài ở đây và đang đánh bại các model độc quyền.
Sam Witteveen
youtube
Model 2-bit vẫn giữ lại độ chính xác ~82% sau khi chúng tôi nén từ 1,51TB xuống 238GB. GLM-5.2 là model mở mạnh nhất hiện nay.
Unsloth AI
twitter
Nó dẫn đầu các model open-weight và giành vị trí số 1 trên Design Arena, vượt qua cả Claude Fable 5 hiện đã không còn khả dụng.
Brian Roemmele
twitter
Context window 1 triệu token là lossless, thực sự ấn tượng đối với một model open weight.
DevGuru
reddit
Điểm benchmark là một chuyện, nhưng trong các quy trình agent thực tế, nó rất mạnh mẽ.
TechInnovator
hackernews

Video ve GLM-5.2

Xem huong dan, danh gia va thao luan ve GLM-5.2

Bước nhảy vọt giữa 5.1 và 5.2 là rất lớn... nó thực sự ưa chuộng các chuỗi suy luận dài ở đây.

Tôi thực sự không thấy lý do gì để dùng các model như Sonnet hay Gemini Flash nếu thứ này có thể thay thế với giá rẻ hơn nhiều.

Context window 1 triệu token là lossless, điều này rất ấn tượng đối với một model open weight.

Nó rõ ràng nhắm vào các lập trình viên cần quyền kiểm soát cục bộ đối với các engine suy luận của họ.

Điểm số benchmark là một chuyện, nhưng trong các quy trình làm việc thực tế của agent, nó rất mạnh mẽ.

Đây là model open-weight đầu tiên vượt qua 80 điểm trên Terminal Bench và ngang hàng với GPT 5.5.

Bạn đã đi từ 15.000 tokens lên 30.000. Đây là sự lạm dụng token... bạn sẽ phải chờ lâu gấp đôi.

Kiểm thử cục bộ cho thấy nó xử lý các cấu trúc file phức tạp tốt hơn DeepSeek v4.

Mức reasoning effort Max thực sự đẩy phần cứng đến giới hạn, nhưng logic rất chắc chắn.

Giấy phép MIT có nghĩa là bạn có thể dùng nó cho gần như mọi thứ mà không lo về các điều khoản.

Tôi đã thấy vài benchmark điên rồ đạt điểm cao hơn Fable trên design bench và nó đang tạo ra tiếng vang.

Tôi yêu cầu GLM 5.2 thiết kế lại ứng dụng này... không có lỗi chỉnh sửa nào. Thành thật mà nói thì rất sạch.

Khả năng frontend là một điểm sáng chính cho phiên bản này.

Nó tạo cảm giác như một công cụ để xây dựng các công cụ khác hơn là chỉ một chatbot.

Khả năng kiểm tra các thinking tokens là giấc mơ của lập trình viên khi debug logic.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho GLM-5.2

Meo chuyen gia giup ban tan dung toi da GLM-5.2 va dat ket qua tot hon.

Bật Max Reasoning cho tác vụ Logic

Kích hoạt mức độ suy luận Max cho các tác vụ lập trình hoặc toán học phức tạp, nơi độ chính xác quan trọng hơn tốc độ phản hồi.

Nạp toàn bộ dự án

Sử dụng context window 1M để cung cấp cho model toàn bộ tài liệu dự án và hướng dẫn phong cách nhằm đảm bảo mã nguồn đầu ra nhất quán.

Tối ưu hóa với Quantization

Sử dụng FP8 hoặc 2-bit quantization cho việc triển khai cục bộ để đưa model với dung lượng 753B parameters vào phần cứng cao cấp.

Kiểm tra Thinking Tokens

Tận dụng hỗ trợ native cho thinking tokens để kiểm tra logic nội bộ trước khi có câu trả lời cuối cùng nhằm phát hiện lỗi sớm.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

Cau hoi thuong gap ve GLM-5.2

Tim cau tra loi cho cac cau hoi thuong gap ve GLM-5.2