zhipu

GLM-4.7

GLM-4.7 tvrtke Zhipu AI je flagship 358B MoE model koji sadrži 200K context window, vrhunske performanse od 73,8% na SWE-benchu i izvorne Deep Thinking načine...

zhipu logozhipuGLM22. prosinca 2025.
Kontekst
200Ktokena
Maks. izlaz
131Ktokena
Ulazna cijena
$0.60/ 1M
Izlazna cijena
$2.20/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
85.7%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GLM-4.7 je postigao 85.7% na ovom benchmarku.
HLE
42.8%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GLM-4.7 je postigao 42.8% na ovom benchmarku.
MMLU
90.1%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GLM-4.7 je postigao 90.1% na ovom benchmarku.
MMLU Pro
84.3%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GLM-4.7 je postigao 84.3% na ovom benchmarku.
SimpleQA
46%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GLM-4.7 je postigao 46% na ovom benchmarku.
IFEval
88%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GLM-4.7 je postigao 88% na ovom benchmarku.
AIME 2025
95.7%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GLM-4.7 je postigao 95.7% na ovom benchmarku.
MATH
92%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GLM-4.7 je postigao 92% na ovom benchmarku.
GSM8k
98%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GLM-4.7 je postigao 98% na ovom benchmarku.
MGSM
94%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GLM-4.7 je postigao 94% na ovom benchmarku.
MathVista
74%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GLM-4.7 je postigao 74% na ovom benchmarku.
SWE-Bench
73.8%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GLM-4.7 je postigao 73.8% na ovom benchmarku.
HumanEval
94.2%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GLM-4.7 je postigao 94.2% na ovom benchmarku.
LiveCodeBench
84.9%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GLM-4.7 je postigao 84.9% na ovom benchmarku.
MMMU
74.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GLM-4.7 je postigao 74.2% na ovom benchmarku.
MMMU Pro
58%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GLM-4.7 je postigao 58% na ovom benchmarku.
ChartQA
86%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GLM-4.7 je postigao 86% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GLM-4.7 je postigao 93% na ovom benchmarku.
Terminal-Bench
41%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GLM-4.7 je postigao 41% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GLM-4.7 je postigao 12% na ovom benchmarku.

O modelu GLM-4.7

Saznajte o mogućnostima, značajkama i načinima korištenja modela GLM-4.7.

Pregled modela

GLM-4.7 je flagship veliki jezični model razvijen od strane Zhipu AI. Koristi Mixture-of-Experts (MoE) arhitekturu s ukupno 358 milijardi parametara. Model je posebno dizajniran za obavljanje složenih agentic zadataka i zaključivanje s dugim kontekstom kroz svoje jedinstvene mogućnosti Preserved Thinking i Interleaved Thinking. Ove značajke omogućuju modelu održavanje stabilne logike i međustanja zaključivanja kroz sesije s više krugova, rješavajući problem degradacije konteksta uobičajen u autonomnim tijekovima rada.

Performanse i arhitektura

Model nudi prostran context window od 200 000 tokens u kombinaciji s ogromnim izlaznim kapacitetom od 131 072 tokens. To ga čini pogodnim za generiranje cijelih aplikacija ili analizu opsežne dokumentacije u jednom prolazu. Objavljen pod MIT licencom kao model s otvorenim težinama, pruža visokoučinkovito kodiranje i zaključivanje po djeliću cijene vlasničkih alternativa.

Integracija i upotreba

U potpunosti je kompatibilan s OpenAI API formatom, što pojednostavljuje integraciju u postojeće softverske ekosustave. Programeri ga koriste za softverske inženjerske zadatke visokih uloga, gdje postiže rezultat od 73,8% na SWE-bench Verified. Njegova sposobnost obrade i analize velikih količina tehničke dokumentacije između engleskog i kineskog jezika uz nijanse na razini izvornog govornika čini ga svestranim alatom za međunarodne razvojne timove.

GLM-4.7

Slučajevi korištenja za GLM-4.7

Otkrijte različite načine korištenja modela GLM-4.7 za postizanje izvrsnih rezultata.

Autonomno softversko inženjerstvo

Korištenje sposobnosti od 73,8% na SWE-benchu za autonomno ispravljanje pogrešaka, refaktoriranje i implementaciju novih značajki u složenim repozitorijima.

Sinteza dokumenata velikog kapaciteta

Iskorištavanje ograničenja izlaza od 131k za generiranje sveobuhvatnih tehničkih priručnika ili cijelih poglavlja knjiga iz velikih skupova podataka.

Agentic tijekovi rada na duge staze

Implementacija agenata koji koriste Preserved Thinking za održavanje dosljednosti i logike tijekom stotina sekvencijalnih zadataka bez gubitka konteksta.

Dvojezična poslovna inteligencija

Obrada i analiza velikih količina tehničke dokumentacije između engleskog i kineskog jezika uz nijanse na razini izvornog govornika.

Automatizirano generiranje UI/UX koda

Generiranje kompletnih React ili Next.js front-end arhitektura s naprednim animacijama i stilovima spremnim za produkciju u jednom potezu.

Matematičko rješavanje na natjecateljskoj razini

Rješavanje složenih matematičkih problema na razini olimpijade i simboličkih logičkih zagonetki korištenjem namjenskog thinking modea fokusiranog na zaključivanje.

Prednosti

Ograničenja

Vrhunske performanse kodiranja: Ostvaruje rezultat od 73,8% na SWE-bench Verified, nadmašujući gotovo sve open-source modele i parirajući vrhunskim vlasničkim API-jima.
Modalitet samo za tekst: Za razliku od Gemini ili GPT-4o, GLM-4.7 nema izvornu obradu vizualnih ili audio podataka, što zahtijeva vanjske modele za multimodalne zadatke.
Masivno ograničenje izlaza: Ograničenje izlaza od 131 072 tokens jedno je od najviših u industriji, omogućujući generiranje cijelih aplikacija u jednom potezu.
Ogromni lokalni zahtjevi: S 358B parameters, pokretanje modela lokalno zahtijeva značajan hardver (približno 710 GB VRAM-a), što ga čini nedostupnim za potrošačke GPU-ove.
Arhitektura usmjerena na agente: Sadrži Preserved Thinking za održavanje logičke dosljednosti tijekom dugotrajnih zadataka, rješavajući problem gubitka konteksta u autonomnim agentima.
Povremeni skokovi latencije: Korisnici na osobnoj API razini prijavljuju povremena usporavanja tijekom vršnih sati u usporedbi s infrastrukturom većih pružatelja.
Visoka ekonomska vrijednost: Pruža inteligenciju na razini frontier modela po otprilike 4 do 7 puta nižoj cijeni od zapadnih konkurenata kao što su OpenAI ili Anthropic.
Specifičnosti u pridržavanju uputa: Iako je snažan u zaključivanju, model ponekad zanemaruje specifična ograničenja strukture datoteka u vrlo složenim sesijama kodiranja.

API brzi početak

zai/glm-4.7

Pogledaj dokumentaciju
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_ZAI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'glm-4.7',
    messages: [{ role: 'user', content: 'Design a scalable React architecture.' }],
    thinking: { type: 'enabled' }
  });
  console.log(response.choices[0].message.content);
}
main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GLM-4.7

Pogledajte što zajednica misli o modelu GLM-4.7

GLM-4.7 pouzdano obrađuje velike baze koda sa svojim kontekstom od 128k. Iznenađujuće je koristan za podzadatke agenata kako bi se uštedjelo na primarnim troškovima API-ja.
IulianHI
reddit
GLM-4.7 od Zhipu AI parira vlasničkim frontier modelima poput GPT-5.1 High u kodiranju. Značajka Preserved Thinking je ogromna pobjeda za autonomne agente.
Etienne Noumen
youtube
GLM-4.7 ostaje najinteligentniji model otvorenih težina u Intelligence Indexu v4.0, ispred DeepSeek V3.2.
Artificial Analysis
twitter
Kineski modeli brzo smanjuju jaz u korisnosti kodiranja. Ovaj rezultat od 73% na SWE-benchu nije šala za izdanje otvorenih težina.
Epoch AI
hackernews
Brzina zaključivanja je prilično pristojna za model ove veličine. Nosi se sa složenom logikom puno bolje od prethodnih iteracija.
Bijan Bowen
youtube
GLM-4.7 zauzima 6. mjesto na AI Indexu, nadmašivši Kimi K2. Otkrijte zašto ovaj model od 2 USD zamjenjuje GPT-5.2 u tijekovima rada kodiranja.
TowardsAI
twitter

Videozapisi o modelu GLM-4.7

Gledajte tutorijale, recenzije i diskusije o modelu GLM-4.7

Duljina konteksta ovdje je 200k, a maksimalni izlaz je 128k tokens, što je prilično moćno.

U redu, to je stvarno impresivno. Nitko od njih nije ubacio posebnu značajku s tom razinom složenosti.

Brzina zaključivanja je prilično pristojna za model ove veličine.

Nosi se sa složenom logikom puno bolje od prethodnih iteracija.

Ovaj model je značajan iskorak u smislu logičke dosljednosti.

GLM model je zapravo implementirao bolju arhitekturu postavljanjem svih mock podataka u jednu datoteku.

Ovo je definitivno veliki iskorak. Ti benchmarkovi su opravdani testiranjem koje sam proveo.

Razumio je kontekst cijelog projekta bez potrebe da ga podsjećam.

Sposobnost kodiranja je vjerojatno u rangu s najboljim modelima na tržištu.

Dobivate vrhunsko zaključivanje uz djelić cijene.

Ostvario je 73,8 posto na SWE-bench verified, što je apsolutno nevjerojatno za open-source model.

Možete vidjeti da funkcionira i da doista radi. Dok generiranje Gemini 3 Pro uopće ne radi.

Brzina generiranja za ovu razinu inteligencije je izvanredna.

Jasno je dizajniran za programere koji trebaju pouzdan izlazni kod.

Zhipu AI se stvarno nadmašio s ugađanjem MoE arhitekture ovdje.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za GLM-4.7

Stručni savjeti za maksimalno iskorištavanje GLM-4.7.

Aktivirajte Thinking Mode za logiku

Postavite thinking parameter na enabled za zadatke kodiranja ili matematike kako biste iskoristili interne tragove zaključivanja modela i poboljšali točnost.

Koristite SDK-ove kompatibilne s OpenAI

Integrirajte GLM-4.7 u postojeće tijekove rada koristeći OpenAI SDK i promjenom baznog URL-a na Z.ai endpoint.

Maksimizirajte 131K izlaz

Pri generiranju dugačkih sadržaja prvo pružite detaljan nacrt kako biste pomogli modelu da zadrži strukturnu koherentnost unutar ogromnog ograničenja za tokens.

Optimizirajte system prompts za agente

Definirajte zahtjeve za Preserved Thinking u sistemskoj poruci kako biste osigurali da model ponovno koristi stanja zaključivanja tijekom sesija s više krugova.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Često Postavljana Pitanja o GLM-4.7

Pronađite odgovore na česta pitanja o GLM-4.7