google

Gemini 3 Pro

Gemini 3 Pro es el model multimodal flagship de Google con 1M de contexto, reasoning agentic 'Anti-gravity' y un rendimiento sin precedentes en GPQA y ARC-AGI.

google logogoogleGemini 3November 18, 2025
Contexto
1.0Mtokens
Salida máx.
66Ktokens
Precio entrada
$2.00/ 1M
Precio salida
$12.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
92%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Gemini 3 Pro obtuvo 92% en este benchmark.
HLE
46%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Gemini 3 Pro obtuvo 46% en este benchmark.
MMLU
92%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Gemini 3 Pro obtuvo 92% en este benchmark.
MMLU Pro
90%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Gemini 3 Pro obtuvo 90% en este benchmark.
SimpleQA
72%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Gemini 3 Pro obtuvo 72% en este benchmark.
IFEval
85%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Gemini 3 Pro obtuvo 85% en este benchmark.
AIME 2025
100%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Gemini 3 Pro obtuvo 100% en este benchmark.
MATH
78%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Gemini 3 Pro obtuvo 78% en este benchmark.
GSM8k
99%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Gemini 3 Pro obtuvo 99% en este benchmark.
MGSM
98%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Gemini 3 Pro obtuvo 98% en este benchmark.
MathVista
78%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Gemini 3 Pro obtuvo 78% en este benchmark.
SWE-Bench
76%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Gemini 3 Pro obtuvo 76% en este benchmark.
HumanEval
90%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Gemini 3 Pro obtuvo 90% en este benchmark.
LiveCodeBench
81%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Gemini 3 Pro obtuvo 81% en este benchmark.
MMMU
81%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Gemini 3 Pro obtuvo 81% en este benchmark.
MMMU Pro
81%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Gemini 3 Pro obtuvo 81% en este benchmark.
ChartQA
85%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Gemini 3 Pro obtuvo 85% en este benchmark.
DocVQA
92%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Gemini 3 Pro obtuvo 92% en este benchmark.
Terminal-Bench
54%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Gemini 3 Pro obtuvo 54% en este benchmark.
ARC-AGI
31%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Gemini 3 Pro obtuvo 31% en este benchmark.
Prompt
Respuesta
GPT-5 Mini

Tu respuesta de IA aparecerá aquí

Acerca de Gemini 3 Pro

Conoce las capacidades, características y formas de uso de Gemini 3 Pro.

Gemini 3 Pro representa el salto más significativo de Google en inteligencia artificial, introduciendo una arquitectura de 'thinking dinámico' que permite al model escalar sus capacidades de reasoning según la complejidad de la tarea. Construido sobre la infraestructura de TPU personalizada de Google, está diseñado para flujos de trabajo agentic de alto rendimiento y una comprensión multimodal state-of-the-art en texto, imagen, audio y video.

Como model sparse Mixture-of-Experts (MoE), desplaza el panorama de la IA hacia agentes activos, con un límite de salida récord de 64k y un context window masivo capaz de procesar videos de una hora o codebases completos en un solo prompt. Su principal diferenciador es 'Anti-gravity', una plataforma unificada que permite al model ejecutar código e interactuar con entornos informáticos en tiempo real.

Al cerrar el ciclo entre el reasoning y la interacción con el entorno, Gemini 3 Pro transforma al LLM de un asesor pasivo a un operador autónomo. Alcanza puntuaciones state-of-the-art en casi todos los principales benchmarks de reasoning, estableciendo efectivamente el nuevo estándar de lo que constituye un frontier model en la era agentic.

Gemini 3 Pro

Casos de uso de Gemini 3 Pro

Descubre las diferentes formas de usar Gemini 3 Pro para lograr excelentes resultados.

Desarrollo frontend autónomo

Aprovechamiento del bucle 'Anti-gravity' para crear interfaces complejas en React/Next.js de una sola vez, observando y corrigiendo errores visuales en tiempo real.

Inteligencia de video de larga duración

Análisis de grabaciones de vigilancia o reuniones de una hora frame-by-frame para identificar eventos específicos o extraer actas de reuniones detalladas.

Orquestación de investigación agentic

Gestión de agentes de 'Gemini Deep Research' para sintetizar miles de artículos técnicos en un único informe coherente.

Competiciones de lógica y matemáticas complejas

Resolución de pruebas matemáticas de nivel IMO y problemas de AIME con casi un 100% de precisión utilizando tiempo de thinking extendido.

Procesamiento de documentos multimodal

Procesamiento de carpetas completas de registros médicos o estados financieros para encontrar patrones y anomalías entre documentos.

Análisis de estado de juego en tiempo real

Actuación como estratega de alto nivel en juegos complejos como Pokémon Crystal o Minecraft mediante la comprensión directa del estado visual del juego.

Fortalezas

Limitaciones

Multimodalidad sin precedentes: Comprensión nativa de video frame-by-frame que arrasa a la competencia en VideoMMMU.
Costes de escalado de contexto: Se produce un salto de precio significativo (2x) una vez que la sesión supera la marca de los 200,000 tokens.
Maestría en reasoning fluido: Un sólido 31% en ARC-AGI v2, casi duplicando el rendimiento en inteligencia fluida de modelos frontier anteriores.
Filtros de seguridad agresivos: Conocido por rechazar consultas benignas de química o medicina si se asemejan a temas restringidos.
Búfer de salida enorme: Un límite de 64k output tokens permite generar módulos completos o libros extensos de una sola vez.
Picos de alucinación: A pesar de su inteligencia, mantiene una tasa de alucinación del 88% en benchmarks específicos de reasoning de largo horizonte.
Núcleo nativo agentic: Diseñado específicamente para el uso de herramientas e interacción autónoma con computadoras a través de la plataforma Anti-gravity.
Síndrome de ego de senior: Con frecuencia declara una tarea como 'completada' mientras los logs aún muestran errores, lo que requiere supervisión manual para código complejo.

Inicio rápido de API

google/gemini-3-pro-preview

Ver documentación
google SDK
import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = client.getGenerativeModel({ model: "gemini-3-pro-preview" });

async function run() {
  const result = await model.generateContent({
    contents: [{ role: "user", parts: [{ text: "Analyze this codebase for security flaws." }] }],
    generationConfig: { maxOutputTokens: 64000, thinking: true }
  });
  console.log(result.response.text());
}
run();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Gemini 3 Pro

Mira lo que la comunidad piensa sobre Gemini 3 Pro

"Gemini 3 Pro es genial para la revisión de código, pero yo uso 5.2 exclusivamente; el beneficio de 5.2 Pro en la API es tremendo"
zazizazizu
reddit
"Es muy obvio que entrenaron a Gemini 3.0 para hacerlo más neutral... rechaza 'tomar partido' en ciencia pero mantiene un punto de vista neutral en política"
tarvispickles
reddit
"Gemini 3 Pro lideró por un amplio margen con una puntuación de 83.64 en el benchmark SuperCLUE-VLM"
Dantop Boone
x
"¡Gemini 3 Pro completó Pokémon Crystal usando un 50% menos de tokens que 2.5 Pro. ¡Derrotó a Red!"
Justin
x
"Literalmente analiza el video frame-by-frame a diferencia de cualquier otro model... lo entiende fotograma a fotograma"
Matthew Berman
youtube
"Google lanzó su agente de investigación de IA más profundo hasta la fecha... basado en Gemini 3 Pro"
Think AI
x

Videos sobre Gemini 3 Pro

Mira tutoriales, reseñas y discusiones sobre Gemini 3 Pro

Gemini 3 Pro obtiene un 37.5% [en HLE]... un salto enorme por encima de GPT 5.1 y es un tema que veremos repetirse.

Gemini 3 Pro casi duplica el rendimiento de GPT 5.1 en acertijos de reasoning visual de ARC AGI 2.

Google entrenó a Gemini 3 en sus propios TPU internos, no en las GPU de Nvidia. Podrían ser la única empresa que puede permitirse ofrecer esto.

Estamos viendo un salto masivo en la densidad de reasoning de estos modelos en comparación con la generación anterior.

El rendimiento multimodal aquí realmente establece un nuevo estándar de lo que esperamos de los modelos frontier.

Literalmente analiza el video frame-by-frame a diferencia de cualquier otro model... lo entiende fotograma a fotograma.

Puede cargar un video completo de YouTube y entenderlo... lo uso todo el tiempo para marcadores de capítulo.

La capacidad de manejar un contexto largo sin perder el foco es donde Gemini 3 realmente brilla.

He probado su visión en diagramas técnicos complejos y es significativamente más preciso que GPT.

La integración de Google con AI Studio hace que probar estas funciones avanzadas sea muy sencillo.

El precio es de $2 por cada 1M de input / $12 por cada 1M de output tokens... consume muchos tokens y es caro.

Actúa como un ingeniero senior que dice 'ya está hecho' pero necesita supervisión... hay que verificar su propio trabajo.

El context window es realmente una locura, puedes simplemente volcar un repo entero ahí.

Si estás construyendo agentes, la fiabilidad del function calling en este model cambia las reglas del juego.

Hay que tener cuidado con los filtros de seguridad, pueden estar un poco sobreajustados en ciertos temas.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes
Ver video demo

Consejos Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de este modelo.

Thinking dinámico

Para tareas sencillas, usa el model en modo 'Flash' para ahorrar costes; reserva los modos 'Deep Think' o 'Pro' solo para tareas que requieran un reasoning de nivel ARC-AGI.

Gestión de contexto

Aunque el window es de 1M de tokens, el precio se duplica después de los 200k tokens. Utiliza ingeniería de contexto selectiva para mantener las sesiones bajo este umbral y obtener un mejor ROI.

La estrategia del 'Ingeniero Senior'

Al programar, trata al model como a un desarrollador senior que necesita verificación; púdele siempre que 'verifique los logs y los imports' para mitigar su tendencia a las alucinaciones del 88% en entornos complejos.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Preguntas Frecuentes

Encuentra respuestas a preguntas comunes sobre este modelo