zhipu

GLM-5

GLM-5 — это мощная open-weight model от Zhipu AI с 744B parameters, превосходящая конкурентов в долгосрочных agentic задачах, программировании и...

Open WeightsAgentic EngineeringMoEZhipu AIAI для программирования
zhipu logozhipuGLM11 февраля 2026 г.
Контекст
200Kтокенов
Макс. вывод
128Kтокенов
Цена ввода
$1.00/ 1M
Цена вывода
$3.20/ 1M
Модальность:Text
Возможности:ИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
68.2%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GLM-5 набрал 68.2% в этом бенчмарке.
HLE
32%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GLM-5 набрал 32% в этом бенчмарке.
MMLU
85%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GLM-5 набрал 85% в этом бенчмарке.
MMLU Pro
70.4%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GLM-5 набрал 70.4% в этом бенчмарке.
SimpleQA
48%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GLM-5 набрал 48% в этом бенчмарке.
IFEval
88%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GLM-5 набрал 88% в этом бенчмарке.
AIME 2025
84%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GLM-5 набрал 84% в этом бенчмарке.
MATH
88%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GLM-5 набрал 88% в этом бенчмарке.
GSM8k
97%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GLM-5 набрал 97% в этом бенчмарке.
MGSM
90%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GLM-5 набрал 90% в этом бенчмарке.
MathVista
0%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GLM-5 набрал 0% в этом бенчмарке.
SWE-Bench
77.8%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GLM-5 набрал 77.8% в этом бенчмарке.
HumanEval
90%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GLM-5 набрал 90% в этом бенчмарке.
LiveCodeBench
52%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GLM-5 набрал 52% в этом бенчмарке.
MMMU
0%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GLM-5 набрал 0% в этом бенчмарке.
MMMU Pro
0%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GLM-5 набрал 0% в этом бенчмарке.
ChartQA
0%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GLM-5 набрал 0% в этом бенчмарке.
DocVQA
0%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GLM-5 набрал 0% в этом бенчмарке.
Terminal-Bench
56.2%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GLM-5 набрал 56.2% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GLM-5 набрал 12% в этом бенчмарке.

О модели GLM-5

Узнайте о возможностях, функциях и способах использования GLM-5.

GLM-5 — это flagship foundation model нового поколения от Zhipu AI, специально разработанная для того, чтобы переопределить стандарты Agentic Engineering для open-weight систем. Построенная на массивной архитектуре Mixture of Experts (MoE) мощностью 744 миллиарда parameters с 40 миллиардами active parameters, она является первой open-weights моделью, сократившей разрыв в производительности с проприетарными гигантами, такими как Claude 4.5. Эта model демонстрирует выдающиеся результаты в плотности логики и разработке программного обеспечения, достигая прорывных 77,8% на SWE-Bench Verified.

С технической точки зрения GLM-5 интегрирует передовые механизмы Multi-head Latent Attention (MLA) и Sparse Attention для оптимизации эффективности tokens и снижения накладных расходов на память на 33%. Обученная на 28,5 триллионах tokens с использованием чисто внутреннего кластера из 100 000 чипов Huawei Ascend, GLM-5 доказывает, что frontier-уровень reasoning возможен без зависимости от высокопроизводительного оборудования NVIDIA. Благодаря context window в 200 000 tokens и специализированному режиму 'Thinking Mode', она обеспечивает надежные результаты с низким уровнем галлюцинаций для высокоточных технических рабочих процессов.

Оптимизированная для обеспечения надежности, GLM-5 служит основой для автономных технических агентов, способных поддерживать стабильное состояние в ходе долгосрочных сессий выполнения. Разрешительная лицензия MIT и конкурентоспособная цена в 1,00 доллар за миллион входных tokens делают ее идеальным выбором для предприятий, стремящихся к локальному развертыванию или крупномасштабной интеграции API без ограничительных условий проприетарных альтернатив.

GLM-5

Варианты использования GLM-5

Откройте для себя различные способы использования GLM-5 для достижения отличных результатов.

Инженерия сложных систем

Проектирование и поддержка микросервисных архитектур с автономным управлением зависимостями.

Долгосрочные agentic задачи

Выполнение многоэтапных технических рабочих процессов, требующих сохранения памяти в течение более чем часа работы.

Миграция устаревшего кода

Рефакторинг целых репозиториев и обновление устаревших зависимостей в рамках 200k context window.

Технические исследования с низким уровнем галлюцинаций

Проведение высокоточных технических исследований, где критически важны фактологическая точность и умение модели признавать отсутствие знаний.

Автономные терминальные операции

Создание dev-агентов, способных самостоятельно проводить аудит безопасности и выполнять команды системного администрирования.

Двуязычное глобальное развертывание

Обеспечение первоклассного reasoning на английском и китайском языках для локализованных корпоративных приложений в масштабе.

Преимущества

Ограничения

Элитный agentic интеллект: Достигает самого высокого показателя Agentic Index (63) среди open-weight моделей при выполнении многоэтапных задач.
Отсутствие нативной мультимодальности: Не хватает возможностей обработки изображений, аудио и видео, которые есть у multimodal конкурентов, таких как GPT-4o.
Низкий уровень галлюцинаций: Демонстрирует снижение количества галлюцинаций на 56% по сравнению с предыдущими поколениями, уделяя приоритетное внимание фактологической точности.
Экстремальные требования к хостингу: Веса 1.5TB в формате BF16 делают локальное развертывание невозможным для большинства пользователей без облачной инфраструктуры.
Высокая эффективность MoE: Архитектура с 744B parameters обеспечивает флагманскую плотность логики, а MLA снижает накладные расходы на память на 33%.
Высокая latency при inference: Время до получения первого token может быть значительным (более 7 секунд) на публичных API по сравнению с более компактными 'flash' моделями.
Разрешительная лицензия MIT: Выпущена под настоящей open-source лицензией, позволяющей неограниченное коммерческое использование без ограничительных условий для пользователей.
Нюансы фронтенд-дизайна: Несмотря на отличную логику, модель иногда может испытывать трудности с тонкой эстетической доработкой CSS по сравнению с Claude.

Быстрый старт API

zai/glm-5

Посмотреть документацию
zhipu SDK
import { ZhipuAI } from "zhipuai-sdk";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-5",
    messages: [{ role: "user", content: "Analyze this repo for security vulnerabilities." }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GLM-5

Посмотрите, что думает сообщество о GLM-5

"GLM-5 — новый лидер в категории open weights! Она набрала 50 баллов в Intelligence Index, значительно сократив разрыв."
Artificial Analysis
x
"Эта model невероятна. Я успешно запустил задачу, которая заняла более часа... она меня поразила."
Theo - t3.gg
youtube
"GLM-5 не использовала чипы NVIDIA, имеет 745B params и стоит 1 доллар за миллион входных tokens. Это будущее."
Legendary
x
"Уровень галлюцинаций поражает; она гораздо охотнее скажет 'я не знаю', чем будет лгать вам."
DevUser456
reddit
"Zhipu AI бросила вызов всем open source моделям для программирования."
AIExplorer
hackernews
"Наконец-то появилась open-weight model, которая не теряет нить рассуждений на полпути к решению сложной задачи."
CodeMaster
reddit

Видео о GLM-5

Смотрите обучающие материалы, обзоры и обсуждения о GLM-5

Это, безусловно, лучшая open-weight model, которую я видел, особенно в плане кода.

Тот факт, что это первая open-weight model, на которой мне удалось успешно выполнить задачу, занявшую более часа... просто поразил меня.

Похоже, это model, которая галлюцинирует меньше всех остальных моделей на сегодняшний день.

Мы наблюдаем масштабный сдвиг в том, что open-weight модели действительно могут делать в продакшене.

Стабильность этой модели во время длительных сессий использования инструментов действительно беспрецедентна.

Ощущения при написании кода здесь очень, очень мощные... сравнимо с GLM 4.7, которая уже была уникумом.

Внедрение динамического острова в макет пользовательского интерфейса было очень крутой и неожиданной особенностью.

Она превосходит почти любую другую model в своем классе по сложности логики.

Глубина reasoning здесь напоминает мне первый опыт использования o1, но это open weight.

Для чисто текстовой модели она справляется с визуальной логикой в коде лучше, чем многие vision модели.

Использование памяти резко сократилось... мы получили 33-кратное улучшение памяти по сравнению с тем, что было раньше.

Она прошла логический тест «мойка машин» с включенным thinking, обойдя Claude и GPT-4o.

Для развертывания этого требуется серьезная серверная стойка, но производительность на ватт просто безумная.

Она справилась с миграцией моего старого репозитория без единой галлюцинации в названиях библиотек.

Режим Thinking Mode — это не просто маркетинговый ход; он фундаментально меняет качество вывода.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для GLM-5

Экспертные советы для максимальной эффективности GLM-5.

Включите режим Thinking Mode

GLM-5 справляется значительно лучше со сложными логическими задачами, такими как тест «мойка машин», когда активирован reasoning.

Используйте преимущества лицензии MIT

воспользуйтесь разрешительным лицензированием для неограниченной коммерческой разработки и внутреннего хостинга.

Оптимизация использования инструментов

используйте GLM-5 для многоэтапных задач, так как она специально разработана для обеспечения высокой стабильности при выполнении agentic инструментов.

Использование context window

загружайте целые кодовые базы в окно объемом 200k для проведения аудита безопасности или рефакторинга всего репозитория.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

Часто задаваемые вопросы о GLM-5

Найдите ответы на частые вопросы о GLM-5