zhipu

GLM-5.2

GLM-5.2 — это флагманская open-weight модель от Zhipu AI с context window 1M, специализированными возможностями для агентской разработки и лицензией MIT.

Open WeightsMIT LicenseCoding Assistant1M ContextReasoning
zhipu logozhipuGLM-516 июня 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
4Kтокенов
Цена ввода
$1.40/ 1M
Цена вывода
$4.40/ 1M
Модальность:Text
Возможности:ИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
83%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GLM-5.2 набрал 83% в этом бенчмарке.
HLE
40%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GLM-5.2 набрал 40% в этом бенчмарке.
MMLU
94%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GLM-5.2 набрал 94% в этом бенчмарке.
MMLU Pro
86%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GLM-5.2 набрал 86% в этом бенчмарке.
IFEval
85%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GLM-5.2 набрал 85% в этом бенчмарке.
AIME 2025
99%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GLM-5.2 набрал 99% в этом бенчмарке.
MATH
97%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GLM-5.2 набрал 97% в этом бенчмарке.
GSM8k
98%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GLM-5.2 набрал 98% в этом бенчмарке.
MGSM
91%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GLM-5.2 набрал 91% в этом бенчмарке.
SWE-Bench
62%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GLM-5.2 набрал 62% в этом бенчмарке.
HumanEval
97%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GLM-5.2 набрал 97% в этом бенчмарке.
LiveCodeBench
65%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GLM-5.2 набрал 65% в этом бенчмарке.
Terminal-Bench
81%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GLM-5.2 набрал 81% в этом бенчмарке.
ARC-AGI
14%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GLM-5.2 набрал 14% в этом бенчмарке.

О модели GLM-5.2

Узнайте о возможностях, функциях и способах использования GLM-5.2.

Архитектура Mixture of Experts

GLM-5.2, это флагманская модель типа Mixture of Experts (MoE), разработанная для длительных задач и автономных agentic-процессов. Она использует архитектуру на 753 миллиарда parameters с примерно 40 миллиардами активных параметров на токен. Этот дизайн представляет собой значительный скачок в эффективности серии GLM, снижая расходы на compute и сохраняя высокую производительность в сложных логических задачах.

Эффективность IndexShare

Модель внедряет IndexShare, инновационное архитектурное улучшение, повторно использующее индексаторы в разреженных слоях внимания (sparse attention layers). Это нововведение снижает количество операций с плавающей запятой на 2.9 раза при полной длине context window в 1 миллион tokens. Такая эффективность делает использование колоссального контекста реальным, а не только теоретическим преимуществом для масштабных проектов.

Специализированное агентское обучение

От альтернатив GLM-5.2 отличает фокус на сложных долгосрочных траекториях программирования. Она была специально обучена решению задач отладки и реализации кода во всей кодовой базе. Разработчики могут переключаться между уровнями «High» и «Max» усилий для мышления (thinking effort), что позволяет модели выделять больше compute для внутреннего reasoning при оптимизации систем и решении передовых математических задач.

GLM-5.2

Варианты использования GLM-5.2

Откройте для себя различные способы использования GLM-5.2 для достижения отличных результатов.

Agentic Software Engineering

Развертывание модели внутри автономных фреймворков для выполнения задач разработки: от сбора требований до финального деплоя.

Масштабный рефакторинг кода

Анализ и переписывание программных проектов, состоящих из множества файлов, путем загрузки всего кодовой базы в context window объемом 1 млн tokens.

Автоматизированная проверка документов

Обработка огромных наборов юридической или технической документации для выявления несоответствий или извлечения структурированных данных с высокой точностью.

Генерация 3D-сцен

Использование специализированных навыков модели в WebGL и HTML5 для создания сложных интерактивных 3D-визуализаций по текстовым prompt.

Автоматизация бизнес-логики

Интеграция модели в ОС для агентов для управления разделяемой памятью и выполнения запланированных многочасовых рабочих процессов без надзора.

Локальная разработка с акцентом на конфиденциальность

Запуск модели с открытыми весами на частных кластерах для обеспечения полного контроля над данными в чувствительных корпоративных проектах.

Преимущества

Ограничения

Выдающийся интеллект в программировании: Модель занимает 3-е место в FrontierSWE с результатом 74.4%, подтверждая свою эффективность в многочасовых инженерных проектах.
Высокая избыточность tokens: Для достижения результата модель генерирует примерно в 2 раза больше tokens, чем ее предшественник, что увеличивает latency.
Прорывное соотношение цены и качества: При цене $1.40/$4.40 за миллион tokens она предлагает интеллект уровня frontier примерно за 1/6 стоимости проприетарных конкурентов.
Огромные требования к «железу»: Из-за 753B parameters локальное развертывание недоступно для большинства независимых разработчиков без существенного квантования.
По-настоящему полезный context 1M: Модель оптимизирована для длинных и сложных цепочек программирования, где предыдущие модели часто теряли связность.
Более медленный отклик: Время ответа может быть в 3 раза дольше, чем у западных моделей, из-за расширенных циклов внутреннего reasoning.
Полный суверенитет и приватность: Открытые веса под лицензией MIT позволяют разработчикам запускать модель локально, избегая рисков API и утечек данных.
Ограничения в творческом дизайне: Несмотря на техническое мастерство во фронтенд-кодинге, модель может уступать в эстетической креативности Claude Opus.

Быстрый старт API

zhipu/glm-5.2

Посмотреть документацию
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GLM-5.2

Посмотрите, что думает сообщество о GLM-5.2

Я месяцами говорил, что open-source модели отстают от frontier на полгода. Они догнали. GLM 5.2 так же хороша, как Opus 4.8.
Alex Finn
twitter
Скачок между 5.1 и 5.2 очень большой... модель любит длинные цепочки рассуждений и обыгрывает проприетарные модели.
Sam Witteveen
youtube
2-битная версия сохраняет ~82% точности после того, как мы сжали ее с 1.51 ТБ до 238 ГБ. GLM-5.2, сильнейшая open модель на сегодня.
Unsloth AI
twitter
Она лидирует среди моделей с открытыми весами и заняла первое место на Design Arena, обойдя недоступный ныне Claude Fable 5.
Brian Roemmele
twitter
Context window в 1 миллион tokens работает без потерь, что впечатляет для модели с открытыми весами.
DevGuru
reddit
Бенчмарки, это одно, но в реальных агентских рабочих процессах она очень надежна.
TechInnovator
hackernews

Видео о GLM-5.2

Смотрите обучающие материалы, обзоры и обсуждения о GLM-5.2

Скачок между 5.1 и 5.2 очень значительный... ей действительно нравятся длинные цепочки рассуждений.

Я правда не вижу смысла использовать модели вроде Sonnet или Gemini Flash, если эта штука может заменить их гораздо дешевле.

Context window в 1 миллион tokens работает без потерь, что впечатляет для open-weight модели.

Она явно нацелена на разработчиков, которым нужен локальный контроль над своими движками reasoning.

Бенчмарки, это одно, но в реальных агентских процессах она чувствует себя очень надежно.

Это первая модель с открытыми весами, преодолевшая отметку 80 в Terminal Bench; она на уровне GPT 5.5.

Вы перешли с 15 000 на 30 000 tokens. Это злоупотребление токенами... ждать придется в два раза дольше.

Локальное тестирование показывает, что она справляется со сложными структурами файлов лучше, чем DeepSeek v4.

Режим Max сильно нагружает оборудование, но логика безупречна.

Лицензия MIT означает, что вы можете использовать ее практически для чего угодно, не беспокоясь об ограничениях.

Видел сумасшедшие бенчмарки, где она обходит Fable в дизайне, это вызывает шум.

Попросил GLM 5.2 переделать приложение... ни одной ошибки. Если честно, очень чисто.

Возможности фронтенда, главное преимущество этой версии.

Она больше похожа на инструмент для создания других инструментов, чем на простой чат-бот.

Возможность инспектировать thinking tokens, мечта разработчика для отладки логики.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GLM-5.2

Экспертные советы для максимальной эффективности GLM-5.2.

Включите Max Reasoning для сложных задач

Активируйте режим Max reasoning для сложных задач по программированию или математике, где точность важнее скорости генерации.

Загружайте проекты целиком

Используйте context window в 1 млн tokens, чтобы предоставить модели всю документацию проекта и стайл-гайды для обеспечения единообразия кода.

Оптимизируйте с помощью квантования

Используйте квантование FP8 или 2-bit для локального развертывания, чтобы уместить огромный объем 753B parameters на мощном оборудовании.

Изучайте Thinking tokens

Используйте встроенную поддержку thinking tokens, чтобы проанализировать внутреннюю логику модели до получения итогового ответа и своевременно выявить ошибки.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

Часто задаваемые вопросы о GLM-5.2

Найдите ответы на частые вопросы о GLM-5.2