zhipu

GLM-4.7

GLM-4.7 от Zhipu AI: flagship 358B MoE model с context window 200K, результатом 73.8% в SWE-bench и нативным Deep Thinking для agentic-кодинга.

zhipu logozhipuGLMDecember 22, 2025
Контекст
200Kтокенов
Макс. вывод
131Kтокенов
Цена ввода
$0.60/ 1M
Цена вывода
$2.20/ 1M
Модальность:TextImage
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
85.7%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). GLM-4.7 набрал 85.7% в этом бенчмарке.
HLE
42.8%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. GLM-4.7 набрал 42.8% в этом бенчмарке.
MMLU
90.1%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. GLM-4.7 набрал 90.1% в этом бенчмарке.
MMLU Pro
84.3%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. GLM-4.7 набрал 84.3% в этом бенчмарке.
SimpleQA
46%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. GLM-4.7 набрал 46% в этом бенчмарке.
IFEval
88%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. GLM-4.7 набрал 88% в этом бенчмарке.
AIME 2025
95.7%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. GLM-4.7 набрал 95.7% в этом бенчмарке.
MATH
92%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. GLM-4.7 набрал 92% в этом бенчмарке.
GSM8k
98%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. GLM-4.7 набрал 98% в этом бенчмарке.
MGSM
94%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. GLM-4.7 набрал 94% в этом бенчмарке.
MathVista
74%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. GLM-4.7 набрал 74% в этом бенчмарке.
SWE-Bench
73.8%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. GLM-4.7 набрал 73.8% в этом бенчмарке.
HumanEval
94.2%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. GLM-4.7 набрал 94.2% в этом бенчмарке.
LiveCodeBench
84.9%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. GLM-4.7 набрал 84.9% в этом бенчмарке.
MMMU
74.2%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. GLM-4.7 набрал 74.2% в этом бенчмарке.
MMMU Pro
58%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. GLM-4.7 набрал 58% в этом бенчмарке.
ChartQA
86%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. GLM-4.7 набрал 86% в этом бенчмарке.
DocVQA
93%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. GLM-4.7 набрал 93% в этом бенчмарке.
Terminal-Bench
41%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. GLM-4.7 набрал 41% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. GLM-4.7 набрал 12% в этом бенчмарке.

Попробуйте GLM-4.7 Бесплатно

Общайтесь с GLM-4.7 бесплатно. Протестируйте возможности, задавайте вопросы и изучайте, на что способна эта ИИ-модель.

Промпт
Ответ
zhipu/glm-4-7

Ваш ответ ИИ появится здесь

О модели GLM-4.7

Узнайте о возможностях, функциях и способах использования GLM-4.7.

GLM-4.7 — это новейшая flagship AI model от Zhipu AI, представляющая собой значительный скачок в развитии open-weight intelligence. Эта массивная модель с архитектурой Mixture-of-Experts (MoE) на 358 миллиардов parameters специально разработана для продвинутого reasoning, автоматизации кодинга и сложных agentic-процессов. В ней представлен выделенный режим Deep Thinking, который обеспечивает многошаговое планирование и исправление ошибок, позволяя model решать критически важные задачи программной инженерии с беспрецедентной надежностью.

Model выделяется исключительными техническими показателями, достигая state-of-the-art результата в 73.8% на SWE-bench Verified и 84.9 на LiveCodeBench v6. Благодаря context window в 200 000 tokens и огромной мощности генерации до 131 072 tokens, GLM-4.7 оптимизирована для создания целых приложений и проведения глубоких исследований на огромных массивах данных.

Будучи open-weight релизом под лицензией MIT, она предлагает мощную и гибкую альтернативу проприетарным API, поддерживая как облачную интеграцию, так и local hosting. Её multimodal возможности охватывают продвинутый UI-дизайн и анализ документов, превращая её в универсальный инструмент для современной AI-разработки.

GLM-4.7

Варианты использования GLM-4.7

Откройте для себя различные способы использования GLM-4.7 для достижения отличных результатов.

Agentic Software Engineering

решение сложных проблем на GitHub и автономное внедрение full-stack функционала в рамках целых репозиториев.

High-Fidelity Vibe Coding

быстрая генерация современных, готовых к продакшену веб-интерфейсов с использованием Tailwind CSS и интерактивных компонентов Framer Motion.

Мультиязычная техническая поддержка

продвинутая помощь в кодинге и логическое решение проблем в более чем 10 международных средах программирования.

Глубокие академические исследования

анализ массивов документов для извлечения проверяемой информации с использованием поискового фреймворка BrowseComp.

Автоматизированный дизайн презентаций

создание структурированных, визуально сбалансированных слайдов с точной версткой и типографикой по коротким prompt.

Автоматизация через терминал

выполнение сложных задач системного администрирования и DevOps в песочнице терминала с точностью 41% по результатам benchmark.

Преимущества

Ограничения

Элитный уровень кодинга: лидирует среди open-weight моделей с результатом 73.8% в SWE-bench, опережая многих проприетарных конкурентов.
Экстремальные требования к железу: из-за 355B parameters локальный хостинг практически недоступен для индивидуальных разработчиков без multi-GPU систем.
Огромный лимит Output Tokens: поддерживает вывод до 131K tokens, что позволяет генерировать масштабные, готовые к работе кодовые базы за один проход.
Разрыв между API и Web-версией: заметна разница в производительности между быстрыми ответами API и более глубоким reasoning в веб-интерфейсе.
Нативный Reasoning Engine: встроенные возможности Deep Thinking обеспечивают лучшее планирование и уменьшают ошибки в длительных agentic-задачах.
Временные галлюцинации: пользователи отмечали редкие неточности в отношении текущих дат и событий сразу после запуска model.
Непревзойденное соотношение цены и качества: интеллект уровня frontier model за долю стоимости — всего от $0.60 за миллион input tokens.
Высокая задержка (Latency) при рассуждении: включение полного режима Deep Thinking может значительно увеличить время ответа на сложные многошаговые prompt.

Быстрый старт API

zhipu/glm-4-7

Посмотреть документацию
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о GLM-4.7

Посмотрите, что думает сообщество о GLM-4.7

"GLM 4.7 РАЗРЫВАЕТ РЕКОРДЫ OPEN SOURCE! ... 42.8% на Humanity's Last Exam"
MindColliers
x/twitter
"GLM-4.7... 73.8% на SWE-Bench при цене $0.6/M tokens... Гонка AI становится по-настоящему многополярной."
MateusGalasso
x/twitter
"GLM 4.7 дает явные преимущества... в мультиязычном agentic-кодинге и задачах в терминале"
Dear-Success-1441
reddit
"Эта model просто разносит многие benchmark по кодингу 2025 года"
cloris_rust
reddit
"GLM 4.7 побеждает по скорости и стабильности, в то время как Minimax M2.1 доминирует в multi-agent кодинге"
JamMasterJulian
youtube
"Zhipu реально показывает, на что способны open weights против крупнейших лабораторий США."
DevGuru
hackernews

Видео о GLM-4.7

Смотрите обучающие материалы, обзоры и обсуждения о GLM-4.7

GLM 4.7 — это model, которая обеспечивает значительные улучшения в качестве кода, сложном reasoning и использовании инструментов

Набрала 73.8% на SWE-bench verified, что абсолютно невероятно для open-source модели

Она даже превосходит Claude Sonnet 4.5 и GPT 5.1 в benchmark на использование инструментов

Подход mixture of experts здесь очень отточен, что ведет к более высокой эффективности, несмотря на размер

По сути, это первая open-weight model, предоставляющая реальную альтернативу Claude 3.5 для серьезного кодинга

Это лучшая открытая model на данный момент с большим отрывом

Она создает более чистые и современные веб-страницы и генерирует более красивые слайды

Умеет в reasoning, но следы мышления недоступны в API для планов кодинга

Результаты Vibe coding близки к идеалу даже со сложными анимациями Tailwind

Context в 200k справляется с длинными репозиториями с минимальной потерей данных по сравнению с прошлыми версиями GLM

Важное обновление — мышление перед действием, что помогает model надежно решать сложные задачи

Стоит выделить vibe coding, где GLM 4.7 заметно улучшает качество UI

Цена API составит около $3, что делает её очень выгодным вариантом

Multimodal производительность позволяет конвертировать дизайны Figma в код с высокой точностью

Локальное развертывание возможно при наличии мощной рабочей станции, но API работает удивительно быстро

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы
Смотреть демо

Профессиональные Советы

Экспертные советы, которые помогут вам максимально использовать эту модель.

Включите Deep Thinking

для сложных логических задач явно активируйте режим мышления через API-parameters, чтобы включить многошаговое планирование.

Используйте сохраненный Reasoning

сохраняйте длинные истории диалогов, чтобы использовать способность model удерживать цепочки рассуждений на протяжении нескольких ходов.

Локальная Quantization

используйте оптимизированные Unsloth 2-bit или 4-bit GGUF-версии для запуска этой высокопараметрической model на потребительском оборудовании.

Указание даты

вручную добавляйте текущую дату в system prompt, чтобы избежать временных галлюцинаций и повысить точность планирования задач.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Часто Задаваемые Вопросы

Найдите ответы на частые вопросы об этой модели