zhipu

GLM-5

GLM-5 je moćni open-weight model tvrtke Zhipu AI sa 744B parameters, izvrstan u dugotrajnim agentic zadacima, programiranju i činjeničnoj točnosti uz context...

Open WeightsAgentic EngineeringMoEZhipu AIAI za programiranje
zhipu logozhipuGLMFebruary 11, 2026
Kontekst
200Ktokena
Maks. izlaz
128Ktokena
Ulazna cijena
$1.00/ 1M
Izlazna cijena
$3.20/ 1M
Modalitet:Text
Mogućnosti:AlatiStreamingZaključivanje
Benchmarks
GPQA
68.2%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GLM-5 je postigao 68.2% na ovom benchmarku.
HLE
32%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GLM-5 je postigao 32% na ovom benchmarku.
MMLU
85%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GLM-5 je postigao 85% na ovom benchmarku.
MMLU Pro
70.4%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GLM-5 je postigao 70.4% na ovom benchmarku.
SimpleQA
48%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GLM-5 je postigao 48% na ovom benchmarku.
IFEval
88%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GLM-5 je postigao 88% na ovom benchmarku.
AIME 2025
84%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GLM-5 je postigao 84% na ovom benchmarku.
MATH
88%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GLM-5 je postigao 88% na ovom benchmarku.
GSM8k
97%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GLM-5 je postigao 97% na ovom benchmarku.
MGSM
90%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GLM-5 je postigao 90% na ovom benchmarku.
MathVista
0%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GLM-5 je postigao 0% na ovom benchmarku.
SWE-Bench
77.8%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GLM-5 je postigao 77.8% na ovom benchmarku.
HumanEval
90%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GLM-5 je postigao 90% na ovom benchmarku.
LiveCodeBench
52%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GLM-5 je postigao 52% na ovom benchmarku.
MMMU
0%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GLM-5 je postigao 0% na ovom benchmarku.
MMMU Pro
0%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GLM-5 je postigao 0% na ovom benchmarku.
ChartQA
0%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GLM-5 je postigao 0% na ovom benchmarku.
DocVQA
0%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GLM-5 je postigao 0% na ovom benchmarku.
Terminal-Bench
56.2%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GLM-5 je postigao 56.2% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GLM-5 je postigao 12% na ovom benchmarku.

O modelu GLM-5

Saznajte o mogućnostima, značajkama i načinima korištenja modela GLM-5.

GLM-5 je flagship foundation model nove generacije tvrtke Zhipu AI, posebno dizajniran da redefinira Agentic Engineering za open-weight sustave. Izgrađen na golemoj Mixture of Experts (MoE) arhitekturi od 744 milijarde parameters s 40 milijardi active parameters, on je prvi open-weights model koji premošćuje jaz u performansama u odnosu na vlasničke gigante kao što je Claude 4.5. Ovaj model briljira u gustoći logike i softverskom inženjerstvu, postižući revolucionarnih 77,8 % na benchmarku SWE-Bench Verified.

Tehnički gledano, GLM-5 integrira napredni Multi-head Latent Attention (MLA) i Sparse Attention mehanizme za optimizaciju učinkovitosti tokens i smanjenje memorijskog opterećenja za 33 %. Treniran na 28,5 bilijuna tokens koristeći isključivo domaći klaster od 100.000 Huawei Ascend čipova, GLM-5 pokazuje da je frontier reasoning moguć bez ovisnosti o vrhunskom NVIDIA hardveru. Sa svojim context window od 200.000 tokens i specijaliziranim 'Thinking Mode', pruža robusne rezultate s niskom stopom halucinacija za visokoprecizne tehničke workflowe.

Optimiziran za pouzdanost, GLM-5 služi kao osnova za autonomne tehničke agente sposobne održavati postojano stanje tijekom dugotrajnih izvršavanja. Njegova fleksibilna MIT licenca i konkurentna cijena od 1,00 USD po milijunu input tokens čine ga idealnim izborom za poduzeća koja traže lokalnu implementaciju ili integraciju API-ja velikog opsega bez restriktivnih uvjeta vlasničkih alternativa.

GLM-5

Slučajevi korištenja za GLM-5

Otkrijte različite načine korištenja modela GLM-5 za postizanje izvrsnih rezultata.

Inženjering složenih sustava

Dizajniranje i održavanje mikroservisnih arhitektura s autonomnim upravljanjem ovisnostima.

Dugotrajni agentic zadaci

Izvršavanje tehničkih workflowa u više koraka koji zahtijevaju postojanu memoriju tijekom više od sat vremena rada.

Migracija starih baza koda

Refactoring cijelih repozitorija i ažuriranje zastarjelih ovisnosti unutar 200k token windowa.

Tehničko istraživanje s niskom stopom halucinacija

Provođenje visokopreciznih tehničkih istraživanja gdje su činjenična točnost i suzdržavanje od nagađanja presudni.

Autonomne operacije u terminalu

Pokretanje dev-agenata koji mogu autonomno provoditi sigurnosne audite i naredbe za administraciju sustava.

Dvojezična globalna implementacija

Vrhunski reasoning na engleskom i kineskom jeziku za lokalizirane korporativne aplikacije u velikom opsegu.

Prednosti

Ograničenja

Vrhunska agentic inteligencija: Postiže najviši Agentic Index rezultat (63) među open-weight modelima za izvršavanje zadataka u više koraka.
Nema izvorni multimodalitet: Nedostaju mu mogućnosti obrade slike, zvuka i videa koje imaju multimodal konkurenti poput GPT-4o.
Niska stopa halucinacija: Pokazuje 56 % manje halucinacija u usporedbi s prethodnim generacijama, dajući prioritet činjeničnoj točnosti.
Ekstremni zahtvi za hosting: Weights od 1,5 TB u BF16 formatu čine lokalnu implementaciju nemogućom za gotovo sve korisnike bez cloud infrastrukture.
Golema MoE učinkovitost: Arhitektura od 744B parameters pruža flagship gustoću logike dok MLA smanjuje memorijsko opterećenje za 33 %.
Visoka inference latencija: Početno vrijeme do prvog tokena može biti dugo (preko 7 sekundi) na javnim API-jima u usporedbi s manjim „flash” modelima.
Fleksibilna MIT licenca: Objavljen pod pravom open-source licencom, što omogućuje neograničenu komercijalnu upotrebu bez restriktivnih uvjeta.
Nijanse u frontend dizajnu: Iako je izvrstan u logici, povremeno može imati poteškoća s finim poliranjem CSS estetike u usporedbi s modelom Claude.

API brzi početak

zai/glm-5

Pogledaj dokumentaciju
zhipu SDK
import { ZhipuAI } from "zhipuai-sdk";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-5",
    messages: [{ role: "user", content: "Analyze this repo for security vulnerabilities." }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GLM-5

Pogledajte što zajednica misli o modelu GLM-5

"GLM-5 je novi lider među open-weights modelima! Postigao je 50 na Intelligence Indexu, što je značajno smanjenje jaza."
Artificial Analysis
x
"Ovaj model je nevjerojatan. Uspješno sam pokrenuo zadatak koji je trajao više od sat vremena... oduševljen sam."
Theo - t3.gg
youtube
"GLM-5 nije koristio nijedan NVIDIA čip, ima 745B params i košta 1 USD po milijunu input tokens. To je budućnost."
Legendary
x
"Stopa halucinacija je nevjerojatna; model će puno radije reći 'ne znam' nego vas lagati."
DevUser456
reddit
"Zhipu AI je upravo bacio rukavicu svim open-source modelima za programiranje."
AIExplorer
hackernews
"Napokon open-weight model koji ne gubi razum usred složenog zadatka."
CodeMaster
reddit

Videozapisi o modelu GLM-5

Gledajte tutorijale, recenzije i diskusije o modelu GLM-5

Ovo je uvjerljivo najbolji open-weight model koji sam vidio, posebno za stvari vezane uz kod.

Činjenica da je ovo prvi open-weight model na kojem sam uspješno pokrenuo zadatak koji je trajao više od sat vremena... me oduševila.

Čini se da je ovo model koji najmanje halucinira od svih dosadašnjih modela.

Vidimo ogroman pomak u tome što open-weight modeli zapravo mogu raditi u produkciji.

Stabilnost ovog modela tijekom dugih sesija korištenja alata doista je bez presedana.

Osjećaj pri programiranju ovdje je vrlo, vrlo moćan... usporediv s GLM 4.7 koji je već bio prava rijetkost.

Uvođenje dynamic islanda u UI mockup bila je jako cool i neočekivana značajka.

Nadmašuje gotovo svaki drugi model u svojoj klasi u složenoj logici.

Dubina reasoninga podsjeća me na prvi put kad sam koristio o1, ali ovo je open-weight.

Za text-only model, vizualnu logiku u kodu obrađuje bolje od mnogih vision modela.

Potrošnja memorije je drastično pala... postigli smo 33x bolju iskoristivost memorije nego prije.

Prošao je car wash logički test s uključenim thinking načinom, pobijedivši Claude i GPT-4o.

Implementacija zahtijeva ozbiljan server rack, ali performanse po vatu su nevjerojatne.

Oradio je migraciju mog starog repozitorija bez ijednog haluciniranog naziva biblioteke.

Thinking mode nije samo marketinški trik; on iz temelja mijenja kvalitetu rezultata.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GLM-5

Stručni savjeti za maksimalno iskorištavanje GLM-5.

Aktivirajte Thinking Mode

GLM-5 postiže znatno bolje rezultate na složenim logičkim zadacima poput „car wash” testa kada je reasoning uključen.

Iskoristite MIT licencu

Iskoristite prednosti fleksibilnog licenciranja za neograničen komercijalni razvoj i interno hostanje.

Optimizacija korištenja alata

Koristite GLM-5 za zadatke u više koraka jer je namjenski izrađen za visoku stabilnost pri izvršavanju agentic alata.

Iskorištavanje context window

Učitajte čitave baze koda u 200k window za provođenje sigurnosnih revizija ili refactoringa na razini cijelog repozitorija.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Često Postavljana Pitanja o GLM-5

Pronađite odgovore na česta pitanja o GLM-5