google

Gemini 3 Flash

Gemini 3 Flash es el model multimodal de alta velocidad de Google con un context window de 1M de tokens, un razonamiento de élite del 90.4% en el benchmark...

google logogoogleGemini 3December 17, 2025
Contexto
1.0Mtokens
Salida máx.
66Ktokens
Precio entrada
$0.50/ 1M
Precio salida
$3.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
90.4%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Gemini 3 Flash obtuvo 90.4% en este benchmark.
HLE
43.5%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Gemini 3 Flash obtuvo 43.5% en este benchmark.
MMLU
91.8%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Gemini 3 Flash obtuvo 91.8% en este benchmark.
MMLU Pro
72.5%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Gemini 3 Flash obtuvo 72.5% en este benchmark.
SimpleQA
68.7%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Gemini 3 Flash obtuvo 68.7% en este benchmark.
IFEval
88.2%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Gemini 3 Flash obtuvo 88.2% en este benchmark.
AIME 2025
99.7%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Gemini 3 Flash obtuvo 99.7% en este benchmark.
MATH
58%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Gemini 3 Flash obtuvo 58% en este benchmark.
GSM8k
94%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Gemini 3 Flash obtuvo 94% en este benchmark.
MGSM
92.4%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Gemini 3 Flash obtuvo 92.4% en este benchmark.
MathVista
65.4%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Gemini 3 Flash obtuvo 65.4% en este benchmark.
SWE-Bench
78%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Gemini 3 Flash obtuvo 78% en este benchmark.
HumanEval
84.1%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Gemini 3 Flash obtuvo 84.1% en este benchmark.
LiveCodeBench
77.2%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Gemini 3 Flash obtuvo 77.2% en este benchmark.
MMMU
81.2%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Gemini 3 Flash obtuvo 81.2% en este benchmark.
MMMU Pro
81.2%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Gemini 3 Flash obtuvo 81.2% en este benchmark.
ChartQA
86.5%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Gemini 3 Flash obtuvo 86.5% en este benchmark.
DocVQA
93.1%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Gemini 3 Flash obtuvo 93.1% en este benchmark.
Terminal-Bench
47.6%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Gemini 3 Flash obtuvo 47.6% en este benchmark.
ARC-AGI
33.6%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Gemini 3 Flash obtuvo 33.6% en este benchmark.

Acerca de Gemini 3 Flash

Conoce las capacidades, características y formas de uso de Gemini 3 Flash.

La potencia de rendimiento de Gemini 3

Gemini 3 Flash es el model multimodal de frontier model de Google optimizado para una velocidad extrema y una escalabilidad masiva. Desarrollado por Google DeepMind, sirve como el motor de eficiencia del ecosistema Gemini 3, ofreciendo un reasoning de alta calidad y un procesamiento multimodal nativo a través de texto, código, imágenes y audio. Está diseñado específicamente para cargas de trabajo empresariales de alto volumen donde la baja latency y la rentabilidad son primordiales.

Contexto y capacidad agentic sin precedentes

El model cuenta con un context window masivo de 1 millón de tokens, lo que le permite procesar repositorios de código completos, horas de video o miles de páginas de documentación en un solo prompt. Más que un simple chatbot, está diseñado para ser agentic; integrado con las APIs Stagehand y Nano Browser de Google, puede navegar de forma autónoma por la web, ejecutar tareas digitales de varios pasos e interactuar con elementos web en vivo tal como lo haría un humano.

Reasoning científico de élite

Aunque está optimizado para la velocidad, Gemini 3 Flash no sacrifica la inteligencia. A través del protocolo de activación especializado Deep Think, el model puede activar procesos de chain-of-thought internos para resolver problemas de nivel de doctorado en matemáticas, ciencias y lógica. Esta naturaleza dual le permite alternar entre la extracción rápida de datos y el análisis sofisticado de nivel experto con simples instrucciones de sistema.

Gemini 3 Flash

Casos de uso de Gemini 3 Flash

Descubre las diferentes formas de usar Gemini 3 Flash para lograr excelentes resultados.

Automatización autónoma de navegadores

Ejecución de tareas web de varios pasos como generación de leads y scraping de datos complejos a través de las APIs Stagehand y Nano Browser.

Extracción de datos de alto volumen

Procesamiento de conjuntos de datos masivos o documentos de formato largo utilizando el context window de 1M de tokens para una síntesis de información fluida.

Interacción de voz en tiempo real

Potencia asistentes de IA receptivos y de baja latency con capacidades nativas de audio a audio y baja latency de voz a texto.

Prototipado rápido y programación

Generación y prueba de código boilerplate y componentes de UI en entornos de desarrollo utilizando el modo Canvas integrado.

Búsqueda y síntesis de información

Mejora de las AI Overviews con un reasoning multimodal rápido a través de diversas fuentes de texto, imagen y video.

Orquestación de flujos de trabajo agentic

Sirve como ejecutor ligero para equipos de tareas digitales multi-agente complejos que requieren un tool-calling rápido.

Fortalezas

Limitaciones

Eficiencia extrema: Funciona 3 veces más rápido que Gemini 2.5 Pro mientras ofrece reducciones de costos significativas para tareas empresariales de alto volumen.
Hiper-concisión predeterminada: Responde de forma extremadamente breve por defecto, lo que puede requerir un prompt engineering significativo o etiquetas XML para tareas creativas.
Capacidad de contexto masiva: El context window de 1 millón de tokens permite procesar repositorios enteros o transcripciones de video extensas en un solo prompt.
Susceptibilidad a la deriva contextual: Vulnerable al síndrome de "perdido en el medio" en prompts largos si no se aplican técnicas específicas de anclaje contextual.
Rendimiento de reasoning de élite: Alcanza un 90.4% de nivel de doctorado en GPQA Diamond, lo que indica una alta precisión científica al usar el protocolo Deep Think.
Brechas en la evaluación de seguridad: Demostró una tasa de éxito de jailbreak del 97.3% durante la evaluación de red-team de versiones iniciales, lo que plantea posibles riesgos de seguridad.
Maestría agentic: Capacidad superior para realizar acciones autónomas en el navegador y tool-calling mediante una integración profunda con el framework Stagehand.
Profundidad de ejecución subhumana: Aunque es fuerte en la planificación, aún puede tener dificultades con la ejecución en entornos digitales complejos, dinámicos y no verificables.

Inicio rápido de API

google/gemini-3-flash

Ver documentación
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-3-flash" });

async function run() {
  const prompt = "Analyze the core logic in this codebase for efficiency.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Gemini 3 Flash

Mira lo que la comunidad piensa sobre Gemini 3 Flash

"La frontera de Pareto de inteligencia por dólar se ha verticalizado efectivamente con Flash"
OrdinaryLavishness11
reddit
"La CLI de Gemini 3 Flash convierte tu terminal en un estudio de IA completo"
JamMasterJulian
reddit
"No es solo barato; es de élite, con una puntuación del 90.4% en GPQA Diamond"
OrdinaryLavishness11
reddit
"Estamos automatizando efectivamente la automatización de la ciencia"
alexwg
x/twitter
"No confunda el bozal con la mente al interactuar con Gemini 3"
uberzak
reddit
"Las capacidades de automatización web a través de Stagehand cambian las reglas del juego"
AIBuilder99
hackernews

Videos sobre Gemini 3 Flash

Mira tutoriales, reseñas y discusiones sobre Gemini 3 Flash

Esto no es un plugin. Es la siguiente generación de la propia web: un navegador que lee, hace clic, escribe, se desplaza y construye de forma totalmente autónoma.

Stagehand lo traduce a coordenadas visuales y simula el clic.

Maneja los CAPTCHAs y la carga dinámica mejor que cualquier otro agente que haya probado anteriormente.

La latency entre el comando y el primer clic es de menos de 800 milisegundos.

Esto convierte cada sitio web en una API estructurada para tus agentes.

Google acaba de traer el cerebro de Gemini directamente a tu terminal.

Es como tener un laboratorio de IA dentro de tu terminal.

Puedes instalar esto por pip o npm ahora mismo y empezar a enviar logs directamente al model.

El model Flash es perfecto para esto porque no arruinará tu presupuesto incluso con logs de 50,000 líneas.

Realmente es capaz de escribir y ejecutar sus propios scripts de bash de forma segura.

Gemini 3 Flash demuestra que la velocidad y la escala no tienen por qué ir en detrimento de la inteligencia.

Construí una herramienta de automatización de contenido completa usando Gemini 3 Flash... Antes: tardaba 3 horas. Después: menos de 2 minutos.

Las puntuaciones de GPQA para un model 'Flash' son honestamente aterradoras para la competencia.

Su capacidad para mantener la coherencia a lo largo de 1 millón de tokens es su arma secreta.

Si estás construyendo aplicaciones SaaS de alto volumen, esta es la opción por defecto ahora mismo.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes
Ver video demo

Consejos Pro para Gemini 3 Flash

Consejos de expertos para ayudarte a sacar el máximo provecho de Gemini 3 Flash.

Protocolo Deep Think

Usa la instrucción de sistema <deep_think_activation: true> cuando el model necesite resolver problemas complejos de nivel de doctorado para activar su fase de reasoning extendida.

Especificación de salida XML

Para contrarrestar la hiper-concisión predeterminada del model, envuelve tus requisitos de longitud y estilo en etiquetas XML <output_verbosity> explícitas.

Anclaje contextual

Al utilizar el context window completo de 1M de tokens, referencia puntos de anclaje específicos o nombres de archivos en el prompt para evitar la deriva de información.

Integración con la terminal

Utiliza la CLI de Gemini 3 Flash para automatizar el procesamiento de archivos locales y scripts de shell directamente desde tu entorno de terminal.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Preguntas Frecuentes Sobre Gemini 3 Flash

Encuentra respuestas a preguntas comunes sobre Gemini 3 Flash