google

Gemini 3.1 Pro

Gemini 3.1 Pro — элитная multimodal модель Google с движком DeepThink, context window 1M+ и лучшими в индустрии результатами логики ARC-AGI.

MultimodalГлубокий reasoningГенерация видеоWorkspace AIGoogle Gemini
google logogoogleGemini19 февраля 2026 г.
Контекст
2.0Mтокенов
Макс. вывод
66Kтокенов
Цена ввода
$2.50/ 1M
Цена вывода
$15.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
94.3%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Gemini 3.1 Pro набрал 94.3% в этом бенчмарке.
HLE
44.4%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Gemini 3.1 Pro набрал 44.4% в этом бенчмарке.
MMLU
80.6%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Gemini 3.1 Pro набрал 80.6% в этом бенчмарке.
MMLU Pro
79.2%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Gemini 3.1 Pro набрал 79.2% в этом бенчмарке.
SimpleQA
79.6%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Gemini 3.1 Pro набрал 79.6% в этом бенчмарке.
IFEval
92.4%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Gemini 3.1 Pro набрал 92.4% в этом бенчмарке.
AIME 2025
92%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Gemini 3.1 Pro набрал 92% в этом бенчмарке.
MATH
92%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Gemini 3.1 Pro набрал 92% в этом бенчмарке.
GSM8k
98.4%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Gemini 3.1 Pro набрал 98.4% в этом бенчмарке.
MGSM
96.5%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Gemini 3.1 Pro набрал 96.5% в этом бенчмарке.
MathVista
89.4%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Gemini 3.1 Pro набрал 89.4% в этом бенчмарке.
SWE-Bench
71%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Gemini 3.1 Pro набрал 71% в этом бенчмарке.
HumanEval
91.2%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Gemini 3.1 Pro набрал 91.2% в этом бенчмарке.
LiveCodeBench
82%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Gemini 3.1 Pro набрал 82% в этом бенчмарке.
MMMU
84.2%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Gemini 3.1 Pro набрал 84.2% в этом бенчмарке.
MMMU Pro
62.5%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Gemini 3.1 Pro набрал 62.5% в этом бенчмарке.
ChartQA
91.8%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Gemini 3.1 Pro набрал 91.8% в этом бенчмарке.
DocVQA
94.2%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Gemini 3.1 Pro набрал 94.2% в этом бенчмарке.
Terminal-Bench
58%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Gemini 3.1 Pro набрал 58% в этом бенчмарке.
ARC-AGI
77.1%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Gemini 3.1 Pro набрал 77.1% в этом бенчмарке.

О модели Gemini 3.1 Pro

Узнайте о возможностях, функциях и способах использования Gemini 3.1 Pro.

Gemini 3.1 Pro представляет собой зрелую реализацию фреймворка Sparse Mixture-of-Experts (MoE), встроенного в продвинутый multimodal движок обработки. Ключевой особенностью архитектуры является демократизация слоя DeepThink System 2, который позволяет модели обдумывать ответ перед генерацией выходного token. Модель представляет уникальную трехуровневую систему мышления (Low, Medium, High), позволяющую разработчикам явно контролировать баланс между latency, стоимостью и глубиной reasoning.

Благодаря огромному context window в 1 миллион tokens, Gemini 3.1 Pro максимально оптимизирована для сложных рабочих процессов в финансах, аналитике данных и миграции кодовых баз. Она демонстрирует эмерджентную способность решать новые логические паттерны, набрав рекордные 77.1% в benchmark ARC-AGI-2. Это делает ее предпочтительным выбором для разработчиков, которым требуются как низкая latency при multimodal взаимодействии, так и высокая когнитивная производительность для автономных agentic задач.

Gemini 3.1 Pro

Варианты использования Gemini 3.1 Pro

Откройте для себя различные способы использования Gemini 3.1 Pro для достижения отличных результатов.

Анализ кода целых репозиториев

Использование 1M context window для обработки целых программных репозиториев для рефакторинга и построения карт зависимостей.

Автономные комитеты агентов

Управление многошаговыми agentic рабочими процессами, где внутренние под-агенты обсуждают и проверяют решения перед выполнением.

Синтез научных исследований

Анализ тысяч научных работ и сложных наборов данных для извлечения структурированных данных и фактов.

Создание multimodal контента

Одновременная обработка текста, изображений и аудио для создания сложных учебных материалов и интерактивных медиа.

Терминальная автоматизация

Выполнение сложных bash-команд и манипуляция файловыми системами с высокой точностью через продвинутые режимы reasoning.

Аудит корпоративных данных

Парсинг неструктурированных финансовых и юридических документов для выявления пробелов в комплаенсе с почти идеальной точностью извлечения фактов.

Преимущества

Ограничения

Лидер в ARC-AGI-2 reasoning: Результат 77.1% в ARC-AGI-2 более чем вдвое превышает возможности reasoning предыдущих flagship моделей.
Штраф за большой context window: Цены на ввод и вывод удваиваются, как только prompt превышает порог в 200 000 tokens, что влияет на масштабные пакетные задания.
1M token context window: Обработка огромных многофайловых кодовых баз и длинных видео с state-of-the-art точностью и низкой latency.
Чрезмерная многословность вывода: Benchmarks показывают, что модель может быть слишком многословной, генерируя значительно больше tokens, чем требуется для простых задач.
Конкурентная ценовая стратегия: Цена $2/$12 за миллион tokens делает ее значительно доступнее аналогов от Anthropic или OpenAI.
Проблемы с нюансами тона: Отзывы сообщества свидетельствуют о том, что разговорный тон может казаться менее естественным или проработанным по сравнению с серией Claude 3.5.
Детализированные уровни вычислений: Трехуровневая система мышления для точного контроля разработчиком глубины внутреннего reasoning и стоимости.
Несогласованность уровней reasoning: Качество reasoning значительно варьируется между уровнями, часто требуя ручного тестирования для поиска оптимальных настроек.

Быстрый старт API

google/gemini-3.1-pro-preview

Посмотреть документацию
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { tier: "high" }
});

const prompt = "Analyze this entire codebase for security vulnerabilities.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Gemini 3.1 Pro

Посмотрите, что думает сообщество о Gemini 3.1 Pro

Результат 77.1% у Gemini 3.1 Pro, это самый разрушительный сдвиг на рынке; он более чем вдвое превышает предыдущий рекорд в ARC-AGI.
enoumen
reddit
Benchmarks кодирования не врут. Эта модель нашла ошибку в моем репозитории, которую пропустили 3.5 и GPT-4o.
SiliconValleyCoder
hackernews
Шумиха вокруг Gemini 3.1 действительно интересна. Она разгромила benchmarks, но реальные пользователи говорят, что тон и «вайб» модели непоследовательны.
cryptopunk7213
twitter
Движок DeepThink может приводить к значительным задержкам, иногда более 90 секунд, при выполнении задач, требующих глубокой логики.
TechReviewer2026
youtube
Context caching, это киллер-фича. Я запускаю целый бот для документации за копейки по сравнению с GPT-4o.
CloudArchitect
reddit
Gemini вообще не смогла обсудить Python в сложной задаче планирования... логика просто отсутствовала в финальном плане.
Temporary-Mix8022
reddit

Видео о Gemini 3.1 Pro

Смотрите обучающие материалы, обзоры и обсуждения о Gemini 3.1 Pro

Gemini 3.1 Pro генерирует самую детальную версию этой пагоды на данный момент

Gemini обладает самым широким окном в миллион tokens

Multimodal точность при обработке аудио заметно лучше, чем в 3.0

Пропускная способность tokens остается стабильной, даже когда context window заполняется

Долгосрочное удержание контекста практически идеально на всем миллионе tokens

В задачах, которых не должно быть в обучающих данных, серия Gemini 3 превосходит все остальные модели

3.1 Pro действительно может сократить время выполнения скрипта fine-tuning с 300 до 47 секунд

Шаги логики DeepThink четко видны в трассировке, показывая реальное обдумывание

Мы достигаем насыщения benchmarks, где для прогресса имеет значение только ARC-AGI

Траектория AGI ускоряется благодаря этим скачкам в abstract reasoning

Я действительно считаю, что 3.1, это шаг вперед, даже если он очень небольшой

Похоже, она превосходит Gemini 3.0 Pro при тестировании тех же самых prompts

Точность кодирования при сложных рефакторах Python, самая высокая из всех, что я видел

Надежность API значительно улучшилась за последний месяц тестирования

Реальная производительность наконец соответствует хайпу вокруг оценок в benchmark

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Gemini 3.1 Pro

Экспертные советы для максимальной эффективности Gemini 3.1 Pro.

Выбор уровня reasoning

Используйте режим High для сложных математических или логических задач, но переключайтесь на Low для стандартного форматирования, чтобы сэкономить ресурсы.

Context Caching

Внедрите context caching для статической документации, чтобы снизить затраты на ввод до 90% на миллион tokens.

Структурированные артефакты

Используйте способность модели генерировать структурированные списки задач для упрощения контроля человеком во время выполнения agentic процессов.

Multimodal prompting

Комбинируйте ввод видео и аудио, чтобы предоставить модели полный контекст реальных сценариев, а не только текстовые описания.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Часто задаваемые вопросы о Gemini 3.1 Pro

Найдите ответы на частые вопросы о Gemini 3.1 Pro