zhipu

GLM-4.7

GLM-4.7 tvrtke Zhipu AI je flagship 358B MoE model s context window-om od 200K, vrhunskim performansama od 73,8% na SWE-bench benchmarku i nativnim Deep...

zhipu logozhipuGLMDecember 22, 2025
Kontekst
200Ktokena
Maks. izlaz
131Ktokena
Ulazna cijena
$0.60/ 1M
Izlazna cijena
$2.20/ 1M
Modalitet:TextImage
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
85.7%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). GLM-4.7 je postigao 85.7% na ovom benchmarku.
HLE
42.8%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. GLM-4.7 je postigao 42.8% na ovom benchmarku.
MMLU
90.1%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. GLM-4.7 je postigao 90.1% na ovom benchmarku.
MMLU Pro
84.3%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. GLM-4.7 je postigao 84.3% na ovom benchmarku.
SimpleQA
46%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. GLM-4.7 je postigao 46% na ovom benchmarku.
IFEval
88%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. GLM-4.7 je postigao 88% na ovom benchmarku.
AIME 2025
95.7%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. GLM-4.7 je postigao 95.7% na ovom benchmarku.
MATH
92%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. GLM-4.7 je postigao 92% na ovom benchmarku.
GSM8k
98%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. GLM-4.7 je postigao 98% na ovom benchmarku.
MGSM
94%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. GLM-4.7 je postigao 94% na ovom benchmarku.
MathVista
74%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. GLM-4.7 je postigao 74% na ovom benchmarku.
SWE-Bench
73.8%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. GLM-4.7 je postigao 73.8% na ovom benchmarku.
HumanEval
94.2%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. GLM-4.7 je postigao 94.2% na ovom benchmarku.
LiveCodeBench
84.9%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. GLM-4.7 je postigao 84.9% na ovom benchmarku.
MMMU
74.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. GLM-4.7 je postigao 74.2% na ovom benchmarku.
MMMU Pro
58%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. GLM-4.7 je postigao 58% na ovom benchmarku.
ChartQA
86%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. GLM-4.7 je postigao 86% na ovom benchmarku.
DocVQA
93%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. GLM-4.7 je postigao 93% na ovom benchmarku.
Terminal-Bench
41%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. GLM-4.7 je postigao 41% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. GLM-4.7 je postigao 12% na ovom benchmarku.

Isprobaj GLM-4.7 besplatno

Razgovaraj s GLM-4.7 besplatno. Testiraj mogućnosti, postavljaj pitanja i istraži što ovaj AI model može.

Prompt
Odgovor
zhipu/glm-4-7

Vaš AI odgovor će se pojaviti ovdje

O modelu GLM-4.7

Saznajte o mogućnostima, značajkama i načinima korištenja modela GLM-4.7.

GLM-4.7 je najnoviji flagship AI model tvrtke Zhipu AI, koji predstavlja značajan skok u open-weight inteligenciji. Ovaj golemi 358-milijardi parameters Mixture-of-Experts (MoE) model posebno je dizajniran za napredni reasoning, automatizaciju kodiranja i složene agentic radne procese. Uvodi namjenski Deep Thinking način rada koji omogućuje planiranje u više koraka i oporavak od pogrešaka, dopuštajući modelu da rješava visokorizične zadatke softverskog inženjerstva s neviđenom pouzdanošću.

Model se ističe iznimnim tehničkim performansama, postižući state-of-the-art rezultat od 73,8% na SWE-bench Verified i 84,9 na LiveCodeBench v6. Sa svojim context window-om od 200.000 tokens i golemim izlaznim kapacitetom od 131.072 tokens, GLM-4.7 je optimiziran za generiranje cijelih aplikacija i provođenje dubinskog istraživanja na golemim skupovima podataka.

Kao open-weight izdanje pod MIT licencom, nudi moćnu i fleksibilnu alternativu vlasničkim API-jima, podržavajući integraciju u oblaku i lokalno udomljavanje. Njegove multimodal mogućnosti protežu se na napredni UI dizajn i analizu dokumenata, čineći ga svestranim rješenjem za moderan razvoj pokretan AI-jem.

GLM-4.7

Slučajevi korištenja za GLM-4.7

Otkrijte različite načine korištenja modela GLM-4.7 za postizanje izvrsnih rezultata.

Agentic softversko inženjerstvo

Autonomno rješavanje složenih GitHub problema i implementacija full-stack značajki kroz cijele repozitorije.

Vibe coding visoke vjernosti

Brzo generiranje modernih web sučelja spremnih za produkciju koristeći Tailwind CSS i interaktivne Framer Motion komponente.

Višejezična tehnička podrška

Pružanje napredne pomoći pri kodiranju i logičko rješavanje problema u više od 10 međunarodnih programskih okruženja.

Duboko akademsko istraživanje

Analiza golemih skupova dokumenata za izvlačenje provjerljivih informacija u više koraka pomoću BrowseComp okvira za pretraživanje.

Automatizirani dizajn prezentacija

Izrada strukturiranih, vizualno uravnoteženih slajdova s preciznim rasporedom i tipografijom iz uputa od samo jedne rečenice.

Automatizacija temeljena na terminalu

Izvršavanje složenih zadataka sistemske administracije i DevOps-a izravno u terminalskom sandboxu uz 41% točnosti na benchmark testovima.

Prednosti

Ograničenja

Vrhunska vještina kodiranja: Trenutno vodi među open-weight modelima sa SWE-bench rezultatom od 73,8%, nadmašujući mnoge komercijalne konkurente.
Ekstremni hardverski zahtjevi: Zbog 355B parameters, lokalno udomljavanje je neizvedivo za pojedinačne developere bez konfiguracija s više GPU-ova.
Ogroman broj izlaznih tokens: Ima limit od 131K izlaznih tokens, što omogućuje generiranje golemih baza koda spremnih za produkciju u jednom koraku.
Razlika između API-ja i weba: Primjetan je jaz u performansama između trenutnih API odgovora i dubljeg reasoning-a dostupnog u web sučelju.
Nativni reasoning engine: Uključuje 'Deep Thinking' mogućnosti koje omogućuju bolje planiranje i smanjuju odstupanja u dugotrajnim agentic zadacima.
Vremenske halucinacije: Korisnici su prijavili povremene netočnosti u vezi s trenutnim datumima i događajima neposredno nakon lansiranja modela.
Nenadmašan omjer cijene i performansi: Pruža inteligenciju na razini frontier model-a uz djelić cijene, počevši od samo 0,60 $ po milijunu ulaznih tokens.
Visoka latencija reasoning-a: Omogućavanje punog Deep Thinking načina rada može značajno povećati vrijeme odgovora za složene promptove u više koraka.

API brzi početak

zhipu/glm-4-7

Pogledaj dokumentaciju
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu GLM-4.7

Pogledajte što zajednica misli o modelu GLM-4.7

"GLM 4.7 RUŠI OPEN SOURCE REKORDE! ... dosegao 42,8% na Humanity's Last Exam"
MindColliers
x/twitter
"GLM-4.7... postiže 73,8% na SWE-Benchu uz 0,6 $/M tokens... AI utrka postaje uistinu multipolarna."
MateusGalasso
x/twitter
"GLM 4.7 donosi jasne pomake... u višejezičnom agentic kodiranju i zadacima temeljenim na terminalu"
Dear-Success-1441
reddit
"Ovaj model rastura na mnogim coding benchmark testovima za 2025."
cloris_rust
reddit
"GLM 4.7 pobjeđuje u brzini i stabilnosti, dok Minimax M2.1 dominira u multi-agent kodiranju"
JamMasterJulian
youtube
"Zhipu uistinu pokazuje što open weights mogu učiniti protiv velikih laboratorija u SAD-u."
DevGuru
hackernews

Videozapisi o modelu GLM-4.7

Gledajte tutorijale, recenzije i diskusije o modelu GLM-4.7

GLM 4.7 je model koji donosi značajna poboljšanja u kvaliteti koda, složenom reasoning-u i korištenju alata

Postigao je 73,8% na verificiranom SWE-benchu, što je apsolutno nevjerojatno za jedan open-source model

Čak nadmašuje Claude Sonnet 4.5 i GPT 5.1 u benchmark testovima korištenja alata

Mixture of experts pristup ovdje je vrlo dorađen, što vodi do veće učinkovitosti unatoč veličini

To je u osnovi prvi open-weight model koji nudi održivu alternativu za Claude 3.5 za zahtjevno kodiranje

To je uvjerljivo najbolji open model do sada

Stvara čišće, modernije web stranice i generira ljepše slajdove

Provodi reasoning, ali tragovi thinking-a nisu dostupni u API-ju za planiranje koda

Rezultati vibe coding-a su gotovo savršeni, čak i s kompleksnim Tailwind animacijama

Context od 200k obrađuje duge repozitorije s vrlo malo gubitka fokusa u usporedbi s prethodnim GLM verzijama

Važna nadogradnja je thinking prije djelovanja, što pomaže modelu da pouzdano rješava složene zadatke

Ističe se vibe coding, gdje GLM 4.7 poboljšava kvalitetu UI-ja

Cijena API-ja bit će oko istih 3 $, što ga čini vrlo isplativom opcijom

Multimodal performanse omogućuju mu pretvaranje Figma dizajna u kod s visokom točnošću

Lokalna implementacija je moguća ako imate ogromnu radnu stanicu, ali API je nevjerojatno brz

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi
Pogledaj demo video

Pro Savjeti

Stručni savjeti koji će vam pomoći izvući maksimum iz ovog modela.

Omogućite Deep Thinking

Za složene logičke zadatke eksplicitno aktivirajte thinking način rada putem API parameters kako biste omogućili planiranje u više koraka.

Iskoristite očuvani thinking

Održavajte dugu povijest razgovora kako biste iskoristili sposobnost modela da zadrži tragove reasoning-a kroz više poruka.

Lokalna kvantizacija

Koristite Unsloth-optimizirane 2-bitne ili 4-bitne GGUF verzije za pokretanje ovog modela s velikim brojem parameters na hardveru široke potrošnje.

Umetanje datuma

Ručno uključite trenutni datum u system prompt kako biste izbjegli vremenske halucinacije i poboljšali točnost planiranja.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Često Postavljana Pitanja

Pronađite odgovore na česta pitanja o ovom modelu