google

Gemini 3.1 Pro

Gemini 3.1 Pro es el flagship multimodal de Google que incluye el reasoning DeepThink, una context window de 2M y capacidades nativas de generación de video...

MultimodalReasoning profundoGeneración de videoIA para WorkspaceGoogle Gemini
google logogoogleGemini 3February 19, 2026
Contexto
2.0Mtokens
Salida máx.
66Ktokens
Precio entrada
$2.50/ 1M
Precio salida
$15.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
94.3%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Gemini 3.1 Pro obtuvo 94.3% en este benchmark.
HLE
44.4%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Gemini 3.1 Pro obtuvo 44.4% en este benchmark.
MMLU
80.6%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Gemini 3.1 Pro obtuvo 80.6% en este benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Gemini 3.1 Pro obtuvo 79.2% en este benchmark.
SimpleQA
79.6%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Gemini 3.1 Pro obtuvo 79.6% en este benchmark.
IFEval
92.4%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Gemini 3.1 Pro obtuvo 92.4% en este benchmark.
AIME 2025
92%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Gemini 3.1 Pro obtuvo 92% en este benchmark.
MATH
92%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Gemini 3.1 Pro obtuvo 92% en este benchmark.
GSM8k
98.4%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Gemini 3.1 Pro obtuvo 98.4% en este benchmark.
MGSM
96.5%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Gemini 3.1 Pro obtuvo 96.5% en este benchmark.
MathVista
89.4%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Gemini 3.1 Pro obtuvo 89.4% en este benchmark.
SWE-Bench
71%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Gemini 3.1 Pro obtuvo 71% en este benchmark.
HumanEval
91.2%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Gemini 3.1 Pro obtuvo 91.2% en este benchmark.
LiveCodeBench
82%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Gemini 3.1 Pro obtuvo 82% en este benchmark.
MMMU
84.2%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Gemini 3.1 Pro obtuvo 84.2% en este benchmark.
MMMU Pro
62.5%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Gemini 3.1 Pro obtuvo 62.5% en este benchmark.
ChartQA
91.8%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Gemini 3.1 Pro obtuvo 91.8% en este benchmark.
DocVQA
94.2%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Gemini 3.1 Pro obtuvo 94.2% en este benchmark.
Terminal-Bench
58%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Gemini 3.1 Pro obtuvo 58% en este benchmark.
ARC-AGI
77.1%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Gemini 3.1 Pro obtuvo 77.1% en este benchmark.

Acerca de Gemini 3.1 Pro

Conoce las capacidades, características y formas de uso de Gemini 3.1 Pro.

Descripción general del modelo

Gemini 3.1 Pro representa un salto sustancial en el reasoning central dentro de la serie Gemini 3, introduciendo el motor DeepThink que aprovecha el aprendizaje por refuerzo para resolver patrones lógicos complejos. Se distingue por su context window sin precedentes de 2,048,000 tokens, lo que permite a los usuarios procesar repositorios de software completos o varias horas de video en un solo prompt. El model es nativamente multimodal, diseñado para ingerir y razonar a través de texto, audio, imágenes y video simultáneamente.

Inteligencia y reasoning

Optimizado para la próxima generación de flujos de trabajo de tipo agentic, Gemini 3.1 Pro destaca en tareas que requieren planificación estratégica y mejoras paso a paso. Cuenta con una integración profunda con las herramientas creativas de Google, incluyendo Veo 3.1 nativo para la generación de video de alta fidelidad e Imagen 4 para la creación avanzada de imágenes. Al destilar las capacidades de reasoning de modelos más grandes en una arquitectura altamente eficiente, ofrece inteligencia de nivel frontier model a un precio competitivo.

Herramientas especializadas de tipo agentic

Basado en la revolucionaria arquitectura Gemini 3, utiliza una sofisticada verificación de chain-of-thought para eliminar virtualmente los errores lógicos en tareas complejas de reasoning científico y matemático. El model representa un salto significativo en la capacidad zero-shot, particularmente en su habilidad para autocorregirse durante procesos de inference de largo horizonte, convirtiéndose en la opción definitiva para la ingeniería de software autónoma y la síntesis multimodal.

Gemini 3.1 Pro

Casos de uso de Gemini 3.1 Pro

Descubre las diferentes formas de usar Gemini 3.1 Pro para lograr excelentes resultados.

Ingeniería de software autónoma

Navegación y refactorización de repositorios de código completos utilizando la context window de 2M para una comprensión global del código base.

Síntesis de investigación multimodal

Ingesta simultánea de horas de conferencias en video, artículos de investigación en PDF y grabaciones de audio para generar informes exhaustivos.

Planificación estratégica de negocios

Utilización del motor DeepThink para simular escenarios de mercado y desarrollar estrategias corporativas paso a paso con autocorrección.

Flujos de trabajo de producción creativa

Dirección de los motores nativos Veo 3.1 e Imagen 4 mediante prompts de texto de alto nivel para generar video profesional en 4K e imágenes de alta fidelidad.

Análisis de datos científicos complejos

Resolución de problemas científicos de nivel de doctorado y análisis de conjuntos de datos poco comunes con alta precisión en los benchmarks HLE y GPQA.

Soporte al cliente agentic

Creación de asistentes de IA localizados que comprendan matices culturales, como la etiqueta empresarial británica o los marcos regulatorios regionales.

Fortalezas

Limitaciones

Reasoning inigualable: Alcanza un 77.1% en ARC-AGI-2, más que duplicando la capacidad de reasoning de las generaciones anteriores.
Latencia en DeepThink: El modo de alto reasoning puede tardar varios minutos en generar una respuesta para tareas complejas.
Context window masiva: La ventana de 2M de tokens permite un aprendizaje nativo de "contexto largo" a través de conjuntos de datos completos o bibliotecas multimedia.
Filtros de seguridad agresivos: Los guardrails orientados al consumidor pueden provocar rechazos frecuentes incluso en tareas de escritura creativa inofensivas.
Eficiencia de costos: Ofrece inteligencia de un frontier model a un costo aproximadamente un 75% menor que competidores como Claude Opus 4.6.
Variación de alucinaciones: Aunque es menor que en modelos anteriores, todavía puede alucinar detalles espaciales en tareas visuales complejas.
Multimodalidad nativa: Procesa texto, audio, imágenes y video en una sola pasada sin necesidad de sub-models auxiliares.
Fiabilidad de la API: Las versiones preliminares (preview) han reportado errores ocasionales de conexión al servidor durante periodos de alta demanda.

Inicio rápido de API

google/gemini-3.1-pro-preview

Ver documentación
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "Solve for x in 2x^2 + 5x - 3 = 0 using the DeepThink engine.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Gemini 3.1 Pro

Mira lo que la comunidad piensa sobre Gemini 3.1 Pro

Gemini capturó perfectamente esa energía británica de 'Siento muchísimo molestarle, pero nos debe £5,000'.
Efficient_Degree9569
reddit
3.1 Pro es el model tonto más inteligente que he usado. Brillante en los benchmarks. Roto en la práctica.
David Lingenfelter, PhD
twitter
Es como el protagonista modesto de un anime. Lánzale un prompt bien escrito y se convierte en Saitama.
Meng To
twitter
Gemini 3.1 Pro es el ganador para el análisis de documentos con context window masiva.
AIExpert77
hackernews
El motor DeepThink es real para los acertijos de lógica que dejaron perplejo a GPT-4o.
LogicLeaper
reddit
Finalmente un model que realmente lee todo mi código base sin olvidar el primer archivo.
CoderX
twitter

Videos sobre Gemini 3.1 Pro

Mira tutoriales, reseñas y discusiones sobre Gemini 3.1 Pro

Gemini 3.1 Pro es mucho mejor en 3D y comprensión espacial. Todo se ve mucho más fluido y preciso.

Tiene un conocimiento inherente de composición musical integrado que suena realmente armonioso.

La multimodalidad aquí no es solo un truco; es el núcleo de la experiencia.

Se siente significativamente más ágil en el modo estándar en comparación con la versión 3.0.

Logré alimentarlo con un video 4K de 2 horas e indexó cada escena a la perfección.

Este modo de pensamiento alto es realmente como un DeepThink mini... tardó 8 minutos en resolver un problema de la Olimpiada de Matemáticas.

Es una gran actualización que devuelve al model al mismo nivel competitivo que Opus 4.6.

El entrenamiento por aprendizaje de refuerzo se nota en cómo maneja los contraargumentos.

Google está fijando los precios de forma muy agresiva para recuperar la cuota de mercado de desarrolladores.

Estamos viendo un salto masivo en el rendimiento zero-shot para tareas de programación.

En acertijos que no deberían estar en sus datos de entrenamiento, la serie Gemini 3 supera a todos los demás modelos.

Esencialmente, se sitúa dentro del margen de error del promedio humano en pruebas de sentido común.

El cambio arquitectónico hacia la comprensión nativa de video es lo que hace viable la context window de 2M.

Resuelve las tareas de ARC-AGI-2 razonando de verdad, no solo mediante el emparejamiento de patrones.

Esta podría ser la primera vez que Google tiene una ventaja clara en capacidad bruta de reasoning.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Gemini 3.1 Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de Gemini 3.1 Pro.

Aprovecha el modo de pensamiento "High"

Para acertijos matemáticos o lógicos complejos, utiliza el ajuste de nivel de pensamiento "High" para activar todo el poder del motor de reasoning DeepThink.

Utiliza referencias visuales

Gemini 3.1 Pro destaca en el "vibe coding" y el diseño cuando se le proporcionan imágenes de referencia o planos en lugar de solo descripciones de texto.

Cuidado con los guardrails para el consumidor

Si experimentas respuestas limitadas en la aplicación de consumo, intenta usar la API con filtros de seguridad ajustados para tareas más creativas o divergentes.

Gestión del contexto

Para interacciones largas, reinicia el hilo ocasionalmente o proporciona un resumen fresco para evitar el "deterioro del contexto" donde el model confunde las instrucciones.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Preguntas Frecuentes Sobre Gemini 3.1 Pro

Encuentra respuestas a preguntas comunes sobre Gemini 3.1 Pro