zhipu

GLM-5

GLM-5 je Zhipu AI open-weight model od 744B parameters, koji briljira u agentic zadacima, kodiranju i tačnosti činjenica uz 200k context window.

Open WeightsAgentic EngineeringMoEZhipu AICoding AI
zhipu logozhipuGLM11. februar 2026.
Контекст
200Kтокена
Макс. излаз
128Kтокена
Улазна цена
$1.00/ 1M
Излазна цена
$3.20/ 1M
Модалитет:Text
Могућности:АлатиСтримингЗакључивање
Бенчмаркови
GPQA
68.2%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). GLM-5 је постигао 68.2% на овом бенчмарку.
HLE
32%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. GLM-5 је постигао 32% на овом бенчмарку.
MMLU
85%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. GLM-5 је постигао 85% на овом бенчмарку.
MMLU Pro
70.4%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. GLM-5 је постигао 70.4% на овом бенчмарку.
SimpleQA
48%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. GLM-5 је постигао 48% на овом бенчмарку.
IFEval
88%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. GLM-5 је постигао 88% на овом бенчмарку.
AIME 2025
84%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. GLM-5 је постигао 84% на овом бенчмарку.
MATH
88%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. GLM-5 је постигао 88% на овом бенчмарку.
GSM8k
97%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. GLM-5 је постигао 97% на овом бенчмарку.
MGSM
90%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. GLM-5 је постигао 90% на овом бенчмарку.
MathVista
0%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. GLM-5 је постигао 0% на овом бенчмарку.
SWE-Bench
77.8%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. GLM-5 је постигао 77.8% на овом бенчмарку.
HumanEval
90%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. GLM-5 је постигао 90% на овом бенчмарку.
LiveCodeBench
52%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. GLM-5 је постигао 52% на овом бенчмарку.
MMMU
0%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. GLM-5 је постигао 0% на овом бенчмарку.
MMMU Pro
0%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. GLM-5 је постигао 0% на овом бенчмарку.
ChartQA
0%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. GLM-5 је постигао 0% на овом бенчмарку.
DocVQA
0%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. GLM-5 је постигао 0% на овом бенчмарку.
Terminal-Bench
56.2%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. GLM-5 је постигао 56.2% на овом бенчмарку.
ARC-AGI
12%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. GLM-5 је постигао 12% на овом бенчмарку.

О моделу GLM-5

Сазнајте о могућностима, функцијама и начинима коришћења модела GLM-5.

GLM-5 je flagship foundation model kompanije Zhipu AI dizajniran za autonomne agentic radne procese i inženjering kompleksnih sistema. Koristi ogromnu Mixture-of-Experts (MoE) arhitekturu sa 744 milijarde parameters, pri čemu je 40 milijardi parameters aktivno tokom inference-a kako bi se balansirale performanse i brzina. Ovo je prvi open-weight sistem koji pokazuje paritet sa proprietary frontier modelima u zadacima softverskog inženjeringa, sa ocenom 77,8% na SWE-bench Verified.

Model je obučen na 28,5 triliona tokens koristeći domaći klaster od 100.000 Huawei Ascend čipova. Integrisani su specijalizovani mehanizmi kao što su Multi-head Latent Attention (MLA) i DeepSeek Sparse Attention (DSA) radi održavanja logičke doslednosti kroz 200.000 token context window. Ovaj tehnički stack omogućava GLM-5 modelu da upravlja planiranjem dugoročnih zadataka bez visokog latency-ja tipičnog za dense modele ove veličine.

Zhipu AI je objavio GLM-5 pod MIT licencom, omogućavajući korporativnim korisnicima da lokalno instaliraju težine radi obrade osetljivih podataka. Uz cenu od samo 1,00 $ po milion token-a, nudi cenovnu prednost od 6x u odnosu na rivalske modele kao što je Claude 4.5. Model uključuje namenski Thinking Mode koji značajno smanjuje stopu halucinacija u poređenju sa prethodnicima.

GLM-5

Случајеви употребе за GLM-5

Откријте различите начине коришћења модела GLM-5 за постизање одличних резултата.

Autonomni softverski inženjering

Rešavanje kompleksnih GitHub problema i obavljanje refaktorisanja na nivou celog repozitorijuma uz pomoć rezultata od 77,8% na SWE-bench Verified.

Orkestracija korporativnih alata

Izvršavanje agentic radnih procesa u više koraka kroz interne API-je radi automatizacije poslovanja u finansijskom i pravnom sektoru.

Analiza repozitorijuma sa dugim kontekstom

Korišćenje 200.000 token context window-a za obradu i analizu celokupne dokumentacije ili baza koda sa više datoteka u jednom prolazu.

Lični AI saradnici

Pokretanje open-source agenata poput OpenClaw-a za upravljanje email-ovima, kalendarima i pozadinskim zadacima 24/7 uz visoku pouzdanost.

Privatna inteligencija na sopstvenim serverima

Lokalno pokretanje open-weight modela pod MIT licencom radi osiguravanja potpune privatnosti podataka za osetljive korporativne operacije.

Isplativo skaliranje agenata

Pokretanje velikog broja agentic sesija uz 6-8 puta niže troškove u poređenju sa proprietary frontier modelima, bez žrtvovanja dubine reasoning-a.

Предности

Ограничења

Vrhunske performanse u kodiranju: Ostvaruje 77,8% na SWE-bench Verified, izjednačavajući se sa proprietary gigantima poput Claude Opus-a u autonomnom softverskom inženjeringu.
Nema izvornu podršku za vision: Model nema sposobnost direktne obrade slika, što ograničava njegovu upotrebu u savremenim multimodal UI/UX procesima.
Cenovna prednost od 6x: Nudi reasoning na nivou frontier modela po ceni od samo 1,00 $ po 1M input tokens, čineći masovne agentic implementacije ekonomski održivim.
Kašnjenje u terminalskim zadacima: Performanse na Terminal-Bench 2.0 iznose 56,2%, što je nešto sporije od apsolutno vrhunskih proprietary konkurenata.
Težine pod MIT licencom: Potpuna dostupnost open-weight modela na Hugging Face-u omogućava privatnu lokalnu instalaciju na Huawei Ascend ili NVIDIA hardveru.
Učestalost halucinacija: Rani benchmark-ovi pokazuju stopu halucinacija blizu 30% za specifične kompleksne reasoning zadatke u poređenju sa nižim stopama kod vodećih rivala.
Ogroman kapacitet konteksta: Context window od 200K token-a, uz 128K output tokens, idealan je za analizu celog repozitorijuma i dugačke tekstove.
Varijacije u hardveru: Obuka na Huawei Ascend hardveru može dovesti do manjih varijacija u performansama kada se model primenjuje na standardnim stack-ovima koji koriste samo NVIDIA hardver.

АПИ брзи старт

zai/glm-5

Погледај документацију
zhipu SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.ZHIPU_API_KEY,
  baseURL: "https://open.bigmodel.cn/api/paas/v4/",
});

const response = await client.chat.completions.create({
  model: "glm-5",
  messages: [{ role: "user", content: "Analiziraj strukturu ovog repo-a i refaktoriši ga u GraphQL." }],
  stream: true,
});

for await (const chunk of response) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу GLM-5

Погледајте шта заједница мисли о моделу GLM-5

GLM-5 je open-source model sa 744B parameters koji radi skoro na nivou Claude Opus-a pri kodiranju... ali razlika u ceni je značajna.
Odd-Coconut-2067
reddit
Context window od 200.000 token-a menja vaš radni proces: Analizirajte 20+ datoteka za jedno refaktorisanje ili pregledajte kompleksne PR diff-ove u jednom prolazu.
AskCodi
reddit
Troškove Claude API poziva smanjio sam sa ~90$/mesečno na manje od 15$ uz GLM-5 i nisam primetio smanjenje kvaliteta.
IulianHI
reddit
Stopa halucinacija mu je oko 30%, dok je kod Gemini 3 Pro ona oko 88%.
Sid
youtube
GLM-5 se pojavio pre nego što sam završio testiranje 4.7, a skok u reasoning-u se zaista primećuje u svakodnevnom kodiranju.
able_wong
twitter
To što je Zhipu objavio ovo pod MIT licencom je ogroman potez za lokalnu LLM zajednicu.
dev_tester
twitter

Видео снимци о моделу GLM-5

Гледајте туторијале, рецензије и дискусије о моделу GLM-5

Bori se rame uz rame sa modelima poput 5.2 codecs i Opus 4.5.

Ovo je prvi open-weight model na kojem sam uspešno pokrenuo posao koji je trajao preko sat vremena bez problema.

Stopa halucinacija mu je oko 30%, dok je kod Gemini 3 Pro ona oko 88%.

Gustina reasoning-a je znatno veća nego kod GLM-4.

U suštini zamenjuje Claude 3.5 Sonnet za moje interne zadatke kodiranja.

Bukvalno su udvostručili broj parameters... sve do 744 milijarde.

Iako je mnogo veći, radi gotovo brže nego stariji model.

Samoispravljanje. Ne budite snishodljivi. Tretirajte to kao legitimno pitanje.

Sparse attention mehanizam održava nisku potrošnju memorije za tako veliki model.

Dostupnost open-weight verzije čini ga novim šampionom za lokalni hosting.

Napravili su sopstveni RL engine pod nazivom Slime.

Context window od 200.000 token-a menja značenje korporativnog AI-a.

Ostvaruje 77,8 na SWE-bench Verified, pobeđujući Gemini 3 Pro koji ima 76,2.

Zhipu AI dokazuje da domaći hardver može da obuči modele svetske klase.

Agentic inženjering je ovde ključni fokus, a ne samo običan razgovor.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za GLM-5

Stručni saveti za maksimalno iskorišćenje GLM-5.

Aktivirajte agentic mod

Definišite planove u više koraka u svojim prompt-ovima jer je GLM-5 optimizovan za autonomni inženjering, a ne samo za jednostavne razgovore.

Alokacija lokalnog hardvera

Obezbedite dovoljno VRAM-a ili izvornog Huawei Ascend hardvera sa MindSpore framework-om za optimalan throughput.

Implementirajte fallback lance

Konfigurišite GLM-5 kao svoj primarni model za reasoning, uz GLM-4.7-Flash kao isplativu rezervnu opciju za jednostavnije instrukcije.

Koristite strukturirani output

GLM-5 briljira u generisanju preciznih .docx i .xlsx formata kada mu se daju jasni zahtevi za šemu isporuke.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M

Често Постављана Питања о GLM-5

Пронађите одговоре на честа питања о GLM-5