zhipu

GLM-5.1

GLM-5.1 je flagship reasoning model tvrtke Zhipu AI, s 202K context window-om i autonomnom 8-satnom petljom izvršavanja za složeni agentic inženjering.

ReasoningAgentic AIOpen WeightsCodingMultimodal
zhipu logozhipuGLM2026-04-08
Kontekst
203Ktokena
Maks. izlaz
164Ktokena
Ulazna cijena
$1.40/ 1M
Izlazna cijena
$4.40/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
86.2%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GLM-5.1 je postigao 86.2% na ovom benchmarku.
HLE
31%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GLM-5.1 je postigao 31% na ovom benchmarku.
MMLU
89%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GLM-5.1 je postigao 89% na ovom benchmarku.
MMLU Pro
89%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GLM-5.1 je postigao 89% na ovom benchmarku.
IFEval
73%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GLM-5.1 je postigao 73% na ovom benchmarku.
AIME 2025
95.3%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GLM-5.1 je postigao 95.3% na ovom benchmarku.
MATH
80%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GLM-5.1 je postigao 80% na ovom benchmarku.
GSM8k
96%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GLM-5.1 je postigao 96% na ovom benchmarku.
MGSM
90%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GLM-5.1 je postigao 90% na ovom benchmarku.
MathVista
70%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GLM-5.1 je postigao 70% na ovom benchmarku.
SWE-Bench
58.4%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GLM-5.1 je postigao 58.4% na ovom benchmarku.
HumanEval
94.6%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GLM-5.1 je postigao 94.6% na ovom benchmarku.
LiveCodeBench
68%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GLM-5.1 je postigao 68% na ovom benchmarku.
MMMU
73%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GLM-5.1 je postigao 73% na ovom benchmarku.
MMMU Pro
58%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GLM-5.1 je postigao 58% na ovom benchmarku.
ChartQA
89%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GLM-5.1 je postigao 89% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GLM-5.1 je postigao 93% na ovom benchmarku.
Terminal-Bench
63.5%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GLM-5.1 je postigao 63.5% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GLM-5.1 je postigao 12% na ovom benchmarku.

O modelu GLM-5.1

Saznajte o mogućnostima, značajkama i načinima korištenja modela GLM-5.1.

GLM-5.1 je flagship temeljni model tvrtke Zhipu AI dizajniran za složeni sistemski inženjering i dugoročne agentic zadatke. Izgrađen na Mixture-of-Experts (MoE) arhitekturi sa 744 milijarde parametara i 40 milijardi aktivnih po prolazu, predstavlja značajan iskorak u izdržljivosti i autonomnom rješavanju problema. Model je posebno projektiran za prevladavanje stagnacije u reasoningu koja se viđala kod ranijih LLM-ova, održavajući produktivnost i kvalitetu koda kroz tisuće poziva alata i stotine iteracija. Identificira blokatore, provodi eksperimente i prilagođava vlastitu strategiju bez ljudske intervencije.

Tehnički, GLM-5.1 se ističe kao primarna reasoning jezgra u multi-agent sistemima. Rukuje odlukama visoke arhitektonske razine dok implementaciju delegira manjim modelima. Sadrži 202K context window podržan mehanizmom dinamičke rijetke pažnje, osiguravajući koherentnost kroz masivne kodne baze. Model je izdan kao open weights pod MIT licencom, pružajući održivu lokalnu alternativu zatvorenim frontier modelima za zadatke poput optimizacije baza podataka, GPU kernel inženjeringa i full-stack web razvoja.

KernelBench rezultati razine 3 pokazuju da GLM-5.1 održava značajno ubrzanje u agentic ML radnim opterećenjima tijekom dugih sesija u usporedbi s Claude Opus 4.6. Ova izdržljivost omogućuje programerima da pokrenu inženjerski zadatak ujutro i prime potpuno testiran, deployan servis do kraja dana. Rukuje cijelim životnim ciklusom ispravka bugova, od reproduciranja problema u sandboxu do predaje konačnog pull requesta.

GLM-5.1

Slučajevi korištenja za GLM-5.1

Otkrijte različite načine korištenja modela GLM-5.1 za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Radi autonomno 8+ sati kako bi dizajnirao, implementirao i debugirao mikroservise bez ljudske intervencije.

Optimizacija baza podataka visokih performansi

Model iterativno optimizira Rust implementacije za vector search kroz stotine ciklusa.

GPU kernel optimizacija

Analizira referentne implementacije kako bi proizveo brže GPU kernele koji nadmašuju zadane autotune kompajlere.

Multi-agent orkestracija

Djeluje kao jezgra za reasoning koja koordinira podzadacima i pozivima alata kroz skup specijaliziranih manjih modela.

Složeni terminalni zadaci

Izvršava operacije u stvarnom terminalu i višekoračnu sistemsku administraciju putem agentic CLI alata.

Full-stack web dizajn

Model generira vizualno konzistentne UI izglede i backend logiku za desktop okruženja temeljena na pregledniku.

Prednosti

Ograničenja

8-satni iterativni horizont: Održava produktivnost kroz tisuće poziva alata bez dosezanja limita reasoninga koji su uobičajeni kod drugih modela.
Visoka latencija: Arhitektura orijentirana na intenzivan reasoning rezultira znatno sporijim generiranjem tokena u usporedbi s modelima bez te komponente.
SOTA coding performanse: Postiže ocjenu 58,4 na SWE-Bench Pro, nadmašujući zatvorene modele kao što su GPT-5.4 i Claude Opus 4.6.
Ekstremni zahtjevi za resursima: Osnovni model zahtijeva 1.65TB prostora na disku; čak i kvantizirane verzije zahtijevaju 256GB VRAM-a/sistemskog RAM-a za pokretanje.
Pristup open weights: Izdan pod MIT licencom, omogućujući lokalnu implementaciju frontier model reasoning mogućnosti za enterprise upotrebu.
Osjetljivost na prompt: Otključavanje punih agentic performansi često zahtijeva izuzetno detaljne sistemske prompte dulje od 300 redaka kako bi se usmjerila reasoning petlja.
Koherentnost velikog contexta: Održava stabilnost i preciznost do 202k tokena, što je ključno za dugoročne agentic inženjerske zadatke.
Nestabilnost API-ja: Korisnici prijavljuju česte 500 pogreške i ograničenja brzine (rate-limiting) tijekom vršnih sati pekinškog vremena na službenom Z.ai endpointu.

API brzi početak

zhipu/glm-5.1

Pogledaj dokumentaciju
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.ZHIPU_API_KEY,
  baseURL: 'https://api.z.ai/api/paas/v4'
});

const chat = await client.chat.completions.create({
  model: 'glm-5.1',
  messages: [{ role: 'user', content: 'Optimiziraj ovu shemu baze podataka.' }],
  stream: true
});

for await (const chunk of chat) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GLM-5.1

Pogledajte što zajednica misli o modelu GLM-5.1

GLM-5.1 se vrtio na jednom promptu 8 sati bez prestanka. Nije odustao kao većina modela; nastavio je dodavati značajke i samostalno se revidirati.
ziwenxu_
twitter
Testirao sam ga s 140k context-a najmanje 5 puta i ostao je koherentan. SOTA možda ima dostojnog izazivača.
Sensitive_Song4219
reddit
GLM-5.1 je praktički rame uz rame s Opusom na ovom benchmarku. Sada je #1 open model u Areni.
tmuxvim
hackernews
Svaki put kad vidim da se NPC iskreno uvjeri kroz dijalog bez skripte s GLM-5.1, to je čista magija.
orblabs
reddit
Coding performanse su legitimne. Popravio je race condition u našem Go backendu o kojem je GPT-4o neprestano halucinirao.
DevScale_AI
twitter
Lokalno pokretanje s Unsloth-om mijenja pravila igre za privatnost podataka u našem pravnom tech stacku.
LawyerWhoCodes
reddit

Videozapisi o modelu GLM-5.1

Gledajte tutorijale, recenzije i diskusije o modelu GLM-5.1

GLM-5.1 je postigao 45,3% na ovom benchmarku, što je značajan skok za ovu obitelj modela.

Nevjerojatno je spor model... vjerojatno imaju većinu svojih GPU-a zauzetih servisiranjem GLM-5.

Način na koji rukuje pozivima alata puno je robusniji od standardnog GLM 5.

Trenutačno je to najsnažniji reasoning model koji možete preuzeti i pokrenuti na vlastitom hardveru.

Možete vidjeti kako zapravo prepoznaje vlastite pogreške u thinking logu.

Može raditi autonomno 8 sati, usavršavajući strategije kroz tisuće iteracija.

Nadmašuje Gemini 3.1 Pro i Qwen 3.6 Plus na popularnim benchmarkovima za generiranje koda repozitorija.

Agentic način rada je ono gdje ovaj model zaista briljira, ne odustaje kod teških bugova.

Z.ai je praktički uklonio paywall za frontier-level model sa 744 milijarde parametara.

Učinkovito rješava problem stagnacije gdje drugi LLM-ovi s vremenom gube fokus.

Smanjenje veličine od 80% s izvornih 1,65 TB na 236GB uz zadržavanje kvalitete.

Snaga open-sourcea: čak i u kvantiziranoj verziji, napisao je ispravan kod za fireworks.

Trebat će vam najmanje 256GB sistemskog RAM-a da uopće razmišljate o učitavanju ovog MoE diva.

Koristi mehanizam dinamičke rijetke pažnje (sparse attention) kako bi održao taj 202k context koherentnim.

Korištenje Unsloth-a čini proces treniranja i inference-a znatno učinkovitijim.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GLM-5.1

Stručni savjeti za maksimalno iskorištavanje GLM-5.1.

Uključite Thinking Mode

Provjerite je li 'Thinking' opcija omogućena u vašoj konfiguraciji kako biste otključali 8-satne autonomne mogućnosti iteracije.

Koristite kvote izvan špice

Izvodite velike inženjerske serije zadataka izvan vršnog opterećenja između 14:00 i 18:00 po pekinškom vremenu za povoljnije cijene.

Zahtjevi za lokalnu memoriju

Koristite Unsloth Dynamic GGUF kvantizaciju kako biste smjestili 1.6TB model u 256GB sistemskog RAM-a za lokalno pokretanje.

Strateški odabir zadataka

Rezervirajte GLM-5.1 za arhitektonsko reasoning i koristite GLM-4.7 za rutinske implementacije kako biste optimizirali troškove.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M

Često Postavljana Pitanja o GLM-5.1

Pronađite odgovore na česta pitanja o GLM-5.1