google

Gemini 3.1 Pro

Gemini 3.1 Pro — флагманская multimodal AI от Google с функцией reasoning DeepThink, context window 2M и нативными возможностями генерации видео Veo 3.1.

MultimodalDeep ReasoningГенерация видеоWorkspace AIGoogle Gemini
google logogoogleGemini 319 февраля 2026
Контекст
2.0Mтокенов
Макс. вывод
66Kтокенов
Цена ввода
$2.50/ 1M
Цена вывода
$15.00/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
94.3%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Gemini 3.1 Pro набрал 94.3% в этом бенчмарке.
HLE
44.4%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Gemini 3.1 Pro набрал 44.4% в этом бенчмарке.
MMLU
80.6%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Gemini 3.1 Pro набрал 80.6% в этом бенчмарке.
MMLU Pro
79.2%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Gemini 3.1 Pro набрал 79.2% в этом бенчмарке.
SimpleQA
79.6%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Gemini 3.1 Pro набрал 79.6% в этом бенчмарке.
IFEval
92.4%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Gemini 3.1 Pro набрал 92.4% в этом бенчмарке.
AIME 2025
92%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Gemini 3.1 Pro набрал 92% в этом бенчмарке.
MATH
92%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Gemini 3.1 Pro набрал 92% в этом бенчмарке.
GSM8k
98.4%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Gemini 3.1 Pro набрал 98.4% в этом бенчмарке.
MGSM
96.5%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Gemini 3.1 Pro набрал 96.5% в этом бенчмарке.
MathVista
89.4%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Gemini 3.1 Pro набрал 89.4% в этом бенчмарке.
SWE-Bench
71%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Gemini 3.1 Pro набрал 71% в этом бенчмарке.
HumanEval
91.2%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Gemini 3.1 Pro набрал 91.2% в этом бенчмарке.
LiveCodeBench
82%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Gemini 3.1 Pro набрал 82% в этом бенчмарке.
MMMU
84.2%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Gemini 3.1 Pro набрал 84.2% в этом бенчмарке.
MMMU Pro
62.5%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Gemini 3.1 Pro набрал 62.5% в этом бенчмарке.
ChartQA
91.8%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Gemini 3.1 Pro набрал 91.8% в этом бенчмарке.
DocVQA
94.2%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Gemini 3.1 Pro набрал 94.2% в этом бенчмарке.
Terminal-Bench
58%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Gemini 3.1 Pro набрал 58% в этом бенчмарке.
ARC-AGI
77.1%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Gemini 3.1 Pro набрал 77.1% в этом бенчмарке.

О модели Gemini 3.1 Pro

Узнайте о возможностях, функциях и способах использования Gemini 3.1 Pro.

Обзор модели

Gemini 3.1 Pro представляет собой существенный скачок в качестве reasoning внутри серии Gemini 3, представляя движок DeepThink, который использует обучение с подкреплением для решения сложных логических задач. Она выделяется своим беспрецедентным context window в 2 048 000 tokens, позволяя пользователям обрабатывать целые программные репозитории или несколько часов видео в одном prompt. model является нативно multimodal, предназначенной для одновременной обработки и reasoning по тексту, аудио, изображениям и видео.

Интеллект и reasoning

Оптимизированная для следующего поколения agentic рабочих процессов, Gemini 3.1 Pro отлично справляется с задачами, требующими стратегического планирования и пошаговых улучшений. Она имеет глубокую интеграцию с креативными инструментами Google, включая нативный Veo 3.1 для высококачественной генерации видео и Imagen 4 для продвинутого создания изображений. Благодаря переносу возможностей reasoning из более крупных models в высокоэффективную архитектуру, она предлагает интеллект уровня frontier model по конкурентоспособной цене.

Специализированные agentic инструменты

Построенная на революционной архитектуре Gemini 3, она использует сложную верификацию chain-of-thought, чтобы практически исключить логические ошибки в сложных научных и математических задачах. model представляет собой значительный скачок в возможностях zero-shot, особенно в способности к самокоррекции во время длительного inference, что делает ее окончательным выбором для автономной разработки программного обеспечения и мультимодального синтеза.

Gemini 3.1 Pro

Варианты использования Gemini 3.1 Pro

Откройте для себя различные способы использования Gemini 3.1 Pro для достижения отличных результатов.

Автономная разработка ПО

Навигация и рефакторинг целых репозиториев кода с использованием 2M context window для понимания всей кодовой базы.

Синтез multimodal исследований

Одновременная обработка многочасовых видеолекций, PDF-отчетов и аудиозаписей для создания комплексных отчетов.

Стратегическое бизнес-планирование

Использование движка DeepThink для симуляции рыночных сценариев и разработки пошаговых корпоративных стратегий с самокоррекцией.

Креативные рабочие процессы

Управление нативными движками Veo 3.1 и Imagen 4 через высокоуровневые prompt для генерации профессионального 4K-видео и высококачественных изображений.

Сложный анализ научных данных

Решение научных задач уровня докторантуры и анализ редких наборов данных с высокой точностью в benchmarks HLE и GPQA.

Agentic клиентская поддержка

Создание локализованных AI-ассистентов, понимающих культурные нюансы, такие как британский бизнес-этикет или региональные нормативно-правовые акты.

Преимущества

Ограничения

Непревзойденный reasoning: Достигает 77,1% на ARC-AGI-2, что более чем в два раза превышает возможности reasoning предыдущих поколений.
Latency в режиме DeepThink: Режиму с высоким уровнем reasoning может потребоваться несколько минут для генерации ответа на сложные задачи.
Огромный контекст: Окно в 2M tokens позволяет реализовать нативное обучение на длинном контексте для целых датасетов или медиабиблиотек.
Агрессивные фильтры безопасности: Защитные механизмы в пользовательском интерфейсе могут часто вызывать отказы даже при выполнении безобидных творческих задач.
Экономическая эффективность: Предлагает интеллект уровня frontier model примерно на 75% дешевле, чем у конкурентов, таких как Claude Opus 4.6.
Вариативность галлюцинаций: Хотя их уровень ниже, чем в предыдущих models, она все еще может галлюцинировать пространственными деталями в сложных визуальных задачах.
Нативная мультимодальность: Обрабатывает текст, аудио, изображения и видео за один проход без необходимости использования вспомогательных подмоделей.
Надежность API: В ранних preview-версиях сообщалось о периодических ошибках подключения к серверу в периоды пикового спроса.

Быстрый старт API

google/gemini-3.1-pro-preview

Посмотреть документацию
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "Реши уравнение 2x^2 + 5x - 3 = 0, используя движок DeepThink.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Gemini 3.1 Pro

Посмотрите, что думает сообщество о Gemini 3.1 Pro

Gemini идеально передала эту британскую энергию в духе: «Мне ужасно неудобно вас беспокоить, но вы должны нам £5 000».
Efficient_Degree9569
reddit
3.1 Pro — самая умная из «глупых» models, что я использовал. Блестящая в benchmarks, но порой капризная на практике.
David Lingenfelter, PhD
twitter
Она как скромный главный герой аниме. Стоит дать ей хорошо написанный prompt, и она включает режим Сайтамы.
Meng To
twitter
Gemini 3.1 Pro — безусловный лидер в анализе документов с огромным контекстом.
AIExpert77
hackernews
Движок DeepThink — это серьезная вещь для логических задач, на которых спотыкалась GPT-4o.
LogicLeaper
reddit
Наконец-то появилась model, которая действительно читает всю мою кодовую базу, не забывая о первом файле.
CoderX
twitter

Видео о Gemini 3.1 Pro

Смотрите обучающие материалы, обзоры и обсуждения о Gemini 3.1 Pro

Gemini 3.1 Pro намного лучше справляется с 3D и пространственным пониманием. Все выглядит гораздо плавнее и точнее.

В нее встроены определенные знания о композиции музыки, которая звучит очень гармонично.

Мультимодальность здесь — это не просто маркетинговый ход, а основа всего опыта.

В стандартном режиме она ощущается значительно более быстрой по сравнению с версией 3.0.

Мне удалось скормить ей 2-часовое 4K-видео, и она идеально проиндексировала каждую сцену.

Этот режим «thinking high» действительно похож на deep think mini... решение задачи математической олимпиады заняло 8 минут.

Это крупное обновление, которое возвращает model в ту же конкурентную зону, что и Opus 4.6.

Обучение с подкреплением проявляется в том, как она обрабатывает контраргументы.

Google устанавливает очень агрессивные цены, чтобы вернуть долю рынка разработчиков.

Мы наблюдаем огромный скачок производительности zero-shot в задачах кодинга.

На головоломках, которых не должно быть в обучающих данных, серия Gemini 3 превосходит все остальные models.

По сути, это выводит ее на уровень средней человеческой нормы (с учетом погрешности) в тестах на здравый смысл.

Архитектурный переход к нативному пониманию видео — это то, что делает окно в 2M жизнеспособным.

Она решает задачи ARC-AGI-2 с помощью реального reasoning, а не просто сопоставления шаблонов.

Возможно, это первый случай, когда Google имеет явное лидерство в «чистой» мощности reasoning.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Gemini 3.1 Pro

Экспертные советы для максимальной эффективности Gemini 3.1 Pro.

Используйте режим «High» Thinking

Для сложных математических или логических задач используйте настройку уровня мышления «High», чтобы задействовать всю мощь движка DeepThink reasoning.

Используйте визуальные референсы

Gemini 3.1 Pro отлично справляется с «vibe coding» и дизайном, если предоставить ему изображения или чертежи вместо простых текстовых описаний.

Учитывайте ограничения для пользователей

Если вы сталкиваетесь с «ограниченными» ответами в пользовательском приложении, попробуйте использовать API с настроенными фильтрами безопасности для более творческих или нестандартных задач.

Управление контекстом

При длительном взаимодействии периодически перезапускайте ветку диалога или предоставляйте свежее резюме, чтобы избежать «деградации контекста», когда model начинает путать инструкции.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Часто задаваемые вопросы о Gemini 3.1 Pro

Найдите ответы на частые вопросы о Gemini 3.1 Pro