google

Gemini 3 Pro

Gemini 3 Pro de Google es una potencia multimodal que cuenta con un context window de 1M de tokens, procesamiento de video nativo y un rendimiento de...

IA multimodalLong ContextFrontier ModelPreparado para AGI
google logogoogleGemini 318 de noviembre de 2025
Contexto
1.0Mtokens
Salida máx.
66Ktokens
Precio entrada
$2.00/ 1M
Precio salida
$12.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
91.9%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Gemini 3 Pro obtuvo 91.9% en este benchmark.
HLE
45.8%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Gemini 3 Pro obtuvo 45.8% en este benchmark.
MMLU
91.8%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Gemini 3 Pro obtuvo 91.8% en este benchmark.
MMLU Pro
85%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Gemini 3 Pro obtuvo 85% en este benchmark.
SimpleQA
72.1%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Gemini 3 Pro obtuvo 72.1% en este benchmark.
IFEval
85%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Gemini 3 Pro obtuvo 85% en este benchmark.
AIME 2025
100%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Gemini 3 Pro obtuvo 100% en este benchmark.
MATH
94%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Gemini 3 Pro obtuvo 94% en este benchmark.
GSM8k
99%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Gemini 3 Pro obtuvo 99% en este benchmark.
MGSM
93%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Gemini 3 Pro obtuvo 93% en este benchmark.
MathVista
79%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Gemini 3 Pro obtuvo 79% en este benchmark.
SWE-Bench
76.2%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Gemini 3 Pro obtuvo 76.2% en este benchmark.
HumanEval
93%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Gemini 3 Pro obtuvo 93% en este benchmark.
LiveCodeBench
81.3%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Gemini 3 Pro obtuvo 81.3% en este benchmark.
MMMU
81%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Gemini 3 Pro obtuvo 81% en este benchmark.
MMMU Pro
81%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Gemini 3 Pro obtuvo 81% en este benchmark.
ChartQA
81.4%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Gemini 3 Pro obtuvo 81.4% en este benchmark.
DocVQA
92%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Gemini 3 Pro obtuvo 92% en este benchmark.
Terminal-Bench
54.2%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Gemini 3 Pro obtuvo 54.2% en este benchmark.
ARC-AGI
31.1%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Gemini 3 Pro obtuvo 31.1% en este benchmark.

Acerca de Gemini 3 Pro

Conoce las capacidades, características y formas de uso de Gemini 3 Pro.

Una nueva frontera en la AGI

Gemini 3 Pro representa el salto definitivo de Google hacia la frontera de la Inteligencia Artificial General, recuperando el primer puesto en el panorama mundial de la IA tras su lanzamiento a finales de 2025. Basado en una arquitectura 'nativa multimodal' unificada, el model no se limita a interpretar diferentes tipos de datos a través de codificadores separados; percibe texto, imágenes de alta resolución, audio de calidad profesional y horas de video en un solo paso de transformer.

Reasoning y destreza técnica inigualables

Técnicamente, Gemini 3 Pro es un gigante científico y matemático, logrando un 100% perfecto en el examen de matemáticas AIME 2025 y estableciendo un nuevo estándar de referencia para el conocimiento de nivel experto en GPQA Diamond. Su masivo context window de 1 millón de tokens facilita flujos de trabajo de nivel empresarial como 'Deep Research', donde el model navega de forma autónoma por bases de código masivas o bibliotecas de video para sintetizar información accionable.

Gemini 3 Pro

Casos de uso de Gemini 3 Pro

Descubre las diferentes formas de usar Gemini 3 Pro para lograr excelentes resultados.

Investigación científica

Utilizando su puntuación de 91.9% en GPQA para analizar documentos científicos complejos de nivel de doctorado y formular nuevas hipótesis de investigación.

Análisis de video de larga duración

Aprovechando el context window de más de 1M para buscar y resumir de forma nativa horas de metraje de video para producción de medios.

Matemáticas avanzadas

Resolución de problemas matemáticos de nivel de olimpiada con una tasa de éxito verificada del 100% en el benchmark AIME 2025.

Coding automatizado

Generación y depuración de conjuntos de funcionalidades completos en un solo intento, superando a la competencia en simulaciones 3D complejas.

Simulación de mercado Agentic

Operar como un product manager virtual para simular condiciones de mercado y probar estrategias de negocio frente a presiones competitivas.

Generación de UI interactiva

Creación de 'Interfaces Generativas' que construyen minipáginas web y controles deslizantes interactivos dinámicamente en respuesta a las consultas de los usuarios.

Fortalezas

Limitaciones

Rendimiento matemático perfecto: Logró una puntuación del 100% en el benchmark AIME 2025 con uso de herramientas internas y ejecución de código.
Latency de contexto incrementada: Procesar el context window completo de 1M puede provocar un Time-To-First-Token elevado en comparación con las variantes Flash.
Arquitectura multimodal unificada: Procesa audio, video y texto en un solo flujo, captando matices temporales sutiles.
Salto en precios por niveles: Los costes se duplican de $2/$12 a $4/$18 por cada 1M de tokens una vez que un prompt supera los 200,000 tokens de contexto.
Elo más alto en LMArena: Recuperó el puesto #1 global con un Elo de lanzamiento de 1,501, por delante de GPT-5.1 y Claude 3.7.
Persistencia de alucinaciones: A pesar de las mejoras en conocimiento, mantiene una tasa de alucinación del 88% en evaluaciones específicas de factualidad.
Control informático Agentic: Excepcional grounding en entornos profesionales, con una puntuación del 72.7% en ScreenSpot Pro.
Sesgo de Rotary Encoding: Las conversaciones de Long Context con cambios rápidos de tema pueden causar fallos en el model o hacer que ignore prompts recientes.

Inicio rápido de API

google/gemini-3-pro-preview

Ver documentación
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-3-pro" });

async function run() {
  const prompt = "Synthesize the architectural differences in Gemini 3 Pro.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Gemini 3 Pro

Mira lo que la comunidad piensa sobre Gemini 3 Pro

"El 'vibe' de un LLM importa tanto como el reasoning; Gemini es el único que me dice que respire y piense."
Kargichauhan_
x
"Gemini 3 Pro es el nuevo líder. Google tiene el language model líder por primera vez."
Artificial Analysis
x
"La función de video es muy buena; es capaz de identificar muy fácilmente lo que tiene delante."
MartonPiller012
x
"Los model Gemini 3 han dado un salto significativo de 2X SOTA en ARC-AGI-2."
ARC Prize
x
"Que Gemini 3 Pro alcance más de 1500 de Elo el primer día es una locura. Google ha vuelto."
AI_Enthusiast_99
reddit
"La comprensión de audio nativa es el día y la noche en comparación con los pipelines de Whisper + LLM."
DevGuru
hackernews

Videos sobre Gemini 3 Pro

Mira tutoriales, reseñas y discusiones sobre Gemini 3 Pro

Marca un nuevo capítulo en la carrera hacia la verdadera inteligencia artificial.

Gemini 3 Pro establece un récord de casi el 92% en GPQA Diamond.

Google entrenó a Gemini 3 en sus propios TPU internos, no en los GPU de Nvidia.

El salto en reasoning aquí es el más grande que hemos visto desde GPT-4.

Este model es esencialmente una supercomputadora para la lógica.

Gemini 3 Pro está disponible en todos los niveles de Gemini. Toma nota de eso, OpenAI.

Lo califican como el mejor model del mundo para la comprensión multimodal.

Estos agentes son realmente capaces de abrir un navegador web y revisar su propio trabajo.

Google finalmente está usando su escala a su favor.

La comprensión temporal de video es realmente increíble comparada con los model anteriores.

Supera a Sonnet y GPT 5.1 en casi todos los benchmark.

Un Panda en SVG sosteniendo una hamburguesa... Ni siquiera el X58 era tan bueno.

Supera ambas preguntas de matemáticas al primer intento... Kingbench 2.0 se ha retirado.

La retención de contexto después de 500k tokens es sorprendentemente sólida.

Los agentes de coding construidos sobre esto están simplemente a otro nivel.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes
Ver video demo

Consejos Pro para Gemini 3 Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de Gemini 3 Pro.

Aprovecha el Prompt Caching

Para tareas repetitivas de Long Context, utiliza el prompt caching de Google para reducir el latency de Time-To-First-Token y bajar los costes hasta en un 90%.

Inputs multimodal nativos

Evita transcribir archivos multimedia antes de introducirlos; envía archivos de audio y video directamente para aprovechar la comprensión nativa.

Modo de Pensamiento Dinámico

Utiliza instrucciones de sistema específicas para activar el 'Deep Think' en tareas de matemáticas y lógica, manteniendo la velocidad estándar para la escritura creativa.

Gestión de instancias de contexto

En conversaciones muy largas, inicia nuevas instancias para cambios de tema importantes para asegurar que el model no pierda el hilo de las instrucciones recientes.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Preguntas Frecuentes Sobre Gemini 3 Pro

Encuentra respuestas a preguntas comunes sobre Gemini 3 Pro