Berapa biaya GLM-4.7?

Biayanya adalah $0.60 per 1M input tokens dan $2.20 per 1M output tokens. Ini jauh lebih murah dibandingkan frontier model seperti Claude 3.7 untuk performa coding yang setara.

Berapa panjang output maksimumnya?

GLM-4.7 mendukung kapasitas output masif sebesar 131.072 tokens. Hal ini memungkinkan model untuk menghasilkan seluruh codebase atau dokumen yang sangat panjang dalam satu respons.

Apakah mendukung input visi atau gambar?

Tidak, flagship model GLM-4.7 hanya berbasis teks. Untuk tugas multimodal, Zhipu AI menawarkan model khusus GLM-4.6V atau GLM-4.1V-Thinking.

Bagaimana cara mengakses API-nya?

Akses melalui platform resmi Z.ai atau penyedia pihak ketiga seperti OpenRouter. Model ini sepenuhnya kompatibel dengan format OpenAI API.

Apa itu Preserved Thinking?

Ini adalah fitur yang memungkinkan model untuk mempertahankan status reasoning di beberapa giliran percakapan. Ini mencegah penurunan logika pada alur kerja agentic yang panjang dan kompleks.

Bisakah GLM-4.7 dijalankan secara lokal?

Ya, bobot (weights) tersedia secara open-source di bawah lisensi MIT. Namun, arsitektur 358B MoE membutuhkan sekitar 710GB VRAM untuk presisi penuh.

Berapa ukuran context window-nya?

Model ini memiliki context window sebesar 200.000 tokens. Ini setara dengan sekitar 150.000 kata, memungkinkan penyerapan rangkaian dokumentasi yang masif.

GLM-4.7

GLM-4.7 oleh Zhipu AI adalah flagship model MoE 358B yang menampilkan context window 200K, performa SWE-bench elit 73,8%, dan Deep Thinking bawaan untuk...

zhipuGLM22 Desember 2025

Konteks

200Ktoken

Output maks.

131Ktoken

Harga input

$0.60/ 1M

Harga output

$2.20/ 1M

Modalitas:TextImage

Kemampuan:VisiAlatStreamingPenalaran

Benchmarks

GPQA

85.7%

HLE

42.8%

MMLU

90.1%

MMLU Pro

84.3%

SimpleQA

46%

IFEval

88%

AIME 2025

95.7%

MATH

92%

GSM8k

98%

MGSM

94%

MathVista

74%

SWE-Bench

73.8%

HumanEval

94.2%

LiveCodeBench

84.9%

MMMU

74.2%

MMMU Pro

58%

ChartQA

86%

DocVQA

93%

Terminal-Bench

41%

ARC-AGI

12%

Lihat dokumentasi API

Tentang GLM-4.7

Pelajari tentang kemampuan, fitur, dan cara menggunakan GLM-4.7.

Tinjauan Model

GLM-4.7 adalah flagship large language model yang dikembangkan oleh Zhipu AI. Model ini menggunakan arsitektur Mixture-of-Experts (MoE) dengan 358 miliar total parameter. Model ini dirancang khusus untuk menangani tugas agentic yang kompleks dan long-context reasoning melalui kapabilitas Preserved Thinking dan Interleaved Thinking yang unik. Fitur-fitur ini memungkinkan model untuk mempertahankan logika yang stabil dan status reasoning menengah di seluruh sesi multi-turn, mengatasi penurunan context yang umum terjadi pada alur kerja otonom.

Performa dan Arsitektur

Model ini menawarkan context window 200.000-token yang luas dikombinasikan dengan kapasitas output 131.072-token yang masif. Hal ini membuatnya cocok untuk menghasilkan aplikasi secara menyeluruh atau menganalisis dokumentasi yang luas dalam satu kali proses. Dirilis di bawah lisensi MIT sebagai model open-weight, model ini memberikan coding dan reasoning berkinerja tinggi dengan sebagian kecil dari biaya alternatif proprietary.

Integrasi dan Penggunaan

Model ini sepenuhnya kompatibel dengan format OpenAI API, menyederhanakan integrasi ke dalam ekosistem perangkat lunak yang sudah ada. Developer menggunakannya untuk tugas-tugas rekayasa perangkat lunak berisiko tinggi, di mana model ini mencapai skor 73,8% pada SWE-bench Verified. Kemampuannya untuk memproses dan menganalisis volume dokumentasi teknis yang tinggi antara bahasa Inggris dan Mandarin dengan nuansa linguistik tingkat penutur asli menjadikannya alat yang serbaguna untuk tim pengembangan internasional.

Kasus Penggunaan untuk GLM-4.7

Temukan berbagai cara menggunakan GLM-4.7 untuk hasil yang luar biasa.

Rekayasa Perangkat Lunak Otonom

Memanfaatkan kemampuan SWE-bench sebesar 73,8% untuk secara otonom melakukan debug, refactor, dan mengimplementasikan fitur baru di seluruh repositori yang kompleks.

Sintesis Dokumen Kapasitas Tinggi

Memanfaatkan batas output 131k untuk menghasilkan manual teknis yang komprehensif atau seluruh bab buku dari dataset yang besar.

Alur Kerja Agentic Jangka Panjang

Menyebarkan agent yang menggunakan Preserved Thinking untuk menjaga konsistensi dan logika selama ratusan tugas berurutan tanpa kehilangan context.

Kecerdasan Bisnis Bilingual

Memproses dan menganalisis volume dokumentasi teknis yang tinggi antara bahasa Inggris dan Mandarin dengan nuansa linguistik tingkat penutur asli.

Pembuatan Kode UI/UX Otomatis

Menghasilkan arsitektur front-end React atau Next.js yang lengkap dengan animasi canggih dan styling siap produksi dalam satu kali eksekusi.

Pemecahan Masalah Matematika Tingkat Kompetisi

Menyelesaikan masalah matematika tingkat olimpiade yang kompleks dan teka-teki logika simbolik menggunakan mode reasoning-heavy thinking khusus.

Kelebihan

Keterbatasan

Performa Coding Elit: Mencapai skor 73,8% pada SWE-bench Verified, mengungguli hampir semua open-source model dan menandingi API proprietary tingkat atas.

Modalitas Hanya Teks: Tidak seperti Gemini atau GPT-4o, GLM-4.7 tidak memiliki pemrosesan visi atau audio bawaan, sehingga memerlukan model eksternal untuk tugas multimodal.

Batas Output Masif: Batas output 131.072-token adalah salah satu yang tertinggi di industri, memungkinkan pembuatan seluruh aplikasi dalam satu giliran.

Kebutuhan Lokal yang Masif: Dengan 358B parameters, menjalankan model secara lokal memerlukan perangkat keras yang signifikan (sekitar 710GB VRAM), sehingga tidak dapat diakses oleh GPU konsumen.

Arsitektur yang Mengutamakan Agent: Menampilkan Preserved Thinking untuk menjaga konsistensi logis di seluruh tugas jangka panjang, mengatasi penurunan context pada autonomous agents.

Lonjakan Latency Sesekali: Pengguna pada tingkat API pribadi melaporkan perlambatan berkala selama jam sibuk dibandingkan dengan infrastruktur penyedia yang lebih besar.

Nilai Ekonomi Tinggi: Menyediakan kecerdasan setingkat frontier model dengan biaya sekitar 4 hingga 7 kali lebih rendah dibandingkan kompetitor Barat seperti OpenAI atau Anthropic.

Keunikan Kepatuhan Instruksi: Meskipun kuat dalam reasoning, model terkadang mengabaikan batasan struktur file tertentu dalam sesi coding yang sangat kompleks.

Mulai Cepat API

zai/glm-4.7

Lihat Dokumentasi

zhipu SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_ZAI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'glm-4.7',
    messages: [{ role: 'user', content: 'Design a scalable React architecture.' }],
    thinking: { type: 'enabled' }
  });
  console.log(response.choices[0].message.content);
}
main();

Instal SDK dan mulai melakukan panggilan API dalam hitungan menit.

Apa Kata Orang Tentang GLM-4.7

Lihat apa yang dipikirkan komunitas tentang GLM-4.7

“GLM-4.7 menangani codebase besar dengan andal berkat context 128k-nya. Sangat berguna untuk tugas subagent guna menghemat biaya API utama.”

— IulianHI

“GLM-4.7 dari Zhipu AI menandingi proprietary frontier model seperti GPT-5.1 High dalam hal coding. Fitur Preserved Thinking adalah kemenangan besar bagi autonomous agents.”

— Etienne Noumen

youtube

“GLM-4.7 terus menjadi open-weights model paling cerdas di Intelligence Index v4.0, berada di depan DeepSeek V3.2.”

— Artificial Analysis

twitter

“Model China menutup kesenjangan dengan cepat dalam kegunaan coding. Skor SWE-bench 73% ini bukanlah lelucon untuk rilis open weight.”

— Epoch AI

hackernews

“Kecepatan reasoning sebenarnya cukup layak untuk model sebesar ini. Menangani logika kompleks jauh lebih baik daripada iterasi sebelumnya.”

— Bijan Bowen

youtube

“GLM-4.7 mendarat di posisi #6 di AI Index, melampaui Kimi K2. Temukan mengapa model seharga $2 ini menggantikan GPT-5.2 dalam alur kerja coding.”

— TowardsAI

twitter

Video Tentang GLM-4.7

Tonton tutorial, ulasan, dan diskusi tentang GLM-4.7

“Panjang context di sini adalah 200k dan maksimum output tokens adalah 128k yang sebenarnya sangat mumpuni.”

“Baiklah, itu sangat mengesankan. Tidak ada model lain yang memasukkan fitur khusus dengan tingkat kompleksitas seperti itu.”

“Kecepatan reasoning sebenarnya cukup layak untuk model sebesar ini.”

“Ini menangani logika kompleks jauh lebih baik daripada iterasi sebelumnya.”

“Model ini merupakan peningkatan signifikan dalam hal konsistensi logis.”

“Model GLM sebenarnya mengimplementasikan arsitektur yang lebih baik dengan menempatkan semua mock data dalam satu file.”

“Yang satu ini jelas merupakan lompatan besar. Benchmark tersebut dibenarkan oleh pengujian yang saya lakukan.”

“Model ini memahami context dari seluruh proyek tanpa saya perlu mengingatkannya.”

“Kemampuan coding-nya bisa dibilang setara dengan model terbaik yang ada.”

“Anda mendapatkan reasoning kelas atas dengan biaya yang jauh lebih murah.”

“Skornya 73,8 persen pada Swaybench verified, yang benar-benar luar biasa untuk open-source model.”

“Anda benar-benar dapat melihat bahwa model ini berfungsi dan benar-benar bekerja. Sedangkan generasi Gemini 3 Pro tidak berfungsi sama sekali.”

“Kecepatan generasi untuk tingkat kecerdasan ini sungguh luar biasa.”

“Ini jelas dirancang untuk developer yang membutuhkan output kode yang dapat diandalkan.”

“Zhipu AI benar-benar melampaui diri mereka sendiri dengan penyesuaian arsitektur MoE di sini.”

Lebih dari sekadar prompt

Tingkatkan alur kerja Anda dengan Otomatisasi AI

Automatio menggabungkan kekuatan agen AI, otomatisasi web, dan integrasi cerdas untuk membantu Anda mencapai lebih banyak dalam waktu lebih singkat.

Agen AI

Otomasi Web

Alur Kerja Cerdas

Mulai Gratis

Tips Pro untuk GLM-4.7

Tips ahli untuk memaksimalkan GLM-4.7.

Aktifkan Thinking Mode untuk Logika

Atur parameter thinking ke enabled untuk tugas coding atau matematika guna memanfaatkan jejak reasoning internal model dan meningkatkan akurasi.

Gunakan SDK yang Kompatibel dengan OpenAI

Integrasikan GLM-4.7 ke dalam alur kerja yang ada dengan menggunakan OpenAI SDK dan mengubah base URL ke endpoint Z.ai.

Maksimalkan Output 131K

Saat menghasilkan konten panjang, berikan kerangka terperinci terlebih dahulu untuk membantu model menjaga koherensi struktural hingga batas token yang masif.

Optimalkan System Prompt untuk Agent

Definisikan persyaratan Preserved Thinking di dalam system message untuk memastikan model menggunakan kembali status reasoning di sesi multi-turn.

Testimoni

Apa Kata Pengguna Kami

Bergabunglah dengan ribuan pengguna puas yang telah mengubah alur kerja mereka

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Terkait AI Models

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context

$1.75/$14.00/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context

$1.00/$3.20/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context

$0.60/$2.50/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context

$2.50/$15.00/1M

Pertanyaan yang Sering Diajukan tentang GLM-4.7

Temukan jawaban untuk pertanyaan umum tentang GLM-4.7