google

Gemini 3 Flash

Gemini 3 Flash es el modelo multimodal de alta velocidad de Google con un context window de 1M, un reasoning GPQA de élite del 90,4% y herramientas de...

google logogoogleGemini 32025-12-17
Contexto
1.0Mtokens
Salida máx.
66Ktokens
Precio entrada
$0.50/ 1M
Precio salida
$3.00/ 1M
Modalidad:TextImageAudioVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
90.4%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Gemini 3 Flash obtuvo 90.4% en este benchmark.
HLE
43.5%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Gemini 3 Flash obtuvo 43.5% en este benchmark.
MMLU
91.8%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Gemini 3 Flash obtuvo 91.8% en este benchmark.
MMLU Pro
72.5%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Gemini 3 Flash obtuvo 72.5% en este benchmark.
SimpleQA
68.7%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Gemini 3 Flash obtuvo 68.7% en este benchmark.
IFEval
88.2%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Gemini 3 Flash obtuvo 88.2% en este benchmark.
AIME 2025
99.7%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Gemini 3 Flash obtuvo 99.7% en este benchmark.
MATH
58%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Gemini 3 Flash obtuvo 58% en este benchmark.
GSM8k
94%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Gemini 3 Flash obtuvo 94% en este benchmark.
MGSM
92.4%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Gemini 3 Flash obtuvo 92.4% en este benchmark.
MathVista
65.4%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Gemini 3 Flash obtuvo 65.4% en este benchmark.
SWE-Bench
78%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Gemini 3 Flash obtuvo 78% en este benchmark.
HumanEval
84.1%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Gemini 3 Flash obtuvo 84.1% en este benchmark.
LiveCodeBench
77.2%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Gemini 3 Flash obtuvo 77.2% en este benchmark.
MMMU
81.2%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Gemini 3 Flash obtuvo 81.2% en este benchmark.
MMMU Pro
81.2%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Gemini 3 Flash obtuvo 81.2% en este benchmark.
ChartQA
86.5%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Gemini 3 Flash obtuvo 86.5% en este benchmark.
DocVQA
93.1%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Gemini 3 Flash obtuvo 93.1% en este benchmark.
Terminal-Bench
47.6%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Gemini 3 Flash obtuvo 47.6% en este benchmark.
ARC-AGI
33.6%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Gemini 3 Flash obtuvo 33.6% en este benchmark.

Acerca de Gemini 3 Flash

Conoce las capacidades, características y formas de uso de Gemini 3 Flash.

El motor de rendimiento de Gemini 3

Gemini 3 Flash es el frontier-class multimodal model de Google optimizado para una velocidad extrema y una escalabilidad masiva. Desarrollado por Google DeepMind, sirve como el caballo de batalla centrado en la eficiencia del ecosistema Gemini 3, ofreciendo un reasoning de alta calidad y un procesamiento multimodal nativo en texto, código, imágenes y audio. Está diseñado específicamente para cargas de trabajo empresariales de alto volumen donde la baja latencia y la rentabilidad son primordiales.

Contexto y agencia sin precedentes

El model cuenta con un masivo context window de 1 millón de tokens, lo que le permite procesar repositorios de código completos, horas de video o miles de páginas de documentación en un solo prompt. Más que un simple chatbot, está diseñado para la acción. Integrado con las API Stagehand y Nano Browser de Google, puede navegar por la web de forma autónoma, ejecutar tareas digitales de varios pasos e interactuar con elementos web en vivo como lo haría un humano.

Reasoning científico de élite

Aunque está optimizado para la velocidad, Gemini 3 Flash no sacrifica la inteligencia. Mediante el protocolo de activación especializado Deep Think, el model puede activar procesos internos de chain-of-thought para resolver problemas de nivel de doctorado en matemáticas, ciencia y lógica. Esta naturaleza dual le permite cambiar entre la extracción rápida de datos y el análisis sofisticado de nivel experto con simples instrucciones de sistema.

Gemini 3 Flash

Casos de uso de Gemini 3 Flash

Descubre las diferentes formas de usar Gemini 3 Flash para lograr excelentes resultados.

Navegación web autónoma

Ejecute tareas web de varios pasos, como reservar viajes o realizar investigaciones de la competencia, utilizando la Nano Browser API.

Refactorización de código a gran escala

Ingeste y analice repositorios de software completos utilizando el context window de 1 millón de tokens para mapear la lógica de dependencias.

Auditoría de contenido multimodal

Analice horas de video o cientos de archivos PDF técnicos para extraer patrones visuales específicos y datos estructurados.

Atención al cliente en tiempo real

Impulse chatbots receptivos que manejen consultas multimodales complejas con tiempos de respuesta inferiores a un segundo.

Síntesis de investigación científica

Analice artículos y conjuntos de datos de nivel de doctorado para proponer diseños experimentales utilizando el protocolo Deep Think.

Tutoría interactiva

Proporcione tutoría paso a paso para matemáticas avanzadas con explicaciones internas mediante chain-of-thought.

Fortalezas

Limitaciones

Reasoning espacial inigualable: Logra resultados de primer nivel en comprensión visual, destacando en la generación precisa de SVG y el análisis de pantallas.
Alta tasa de alucinación: Se ha medido una tendencia del 91% a fabricar respuestas plausibles en lugar de admitir la falta de información específica.
Eficiencia de codificación de élite: Obtiene un 78% en SWE-bench Verified, lo que lo hace más rápido y preciso para la ingeniería de software que muchos modelos Pro.
Sobrecarga de tokens de reasoning: El modo Deep Think genera un alto volumen de tokens de salida, lo que puede aumentar significativamente el costo total por solicitud.
Masivo context window de 1M: La enorme capacidad de tokens permite al model procesar horas de video o directorios de proyectos completos sin pérdida de datos.
Deficiencias al seguir instrucciones: A veces tiene dificultades con las restricciones negativas, como incluir elementos de interfaz no deseados cuando se le indica específicamente evitarlos.
Alta velocidad de inference: Optimizado para una latencia inferior al segundo, lo que lo convierte en el frontier model más rápido disponible actualmente en la familia Gemini.
Experiencia de API inestable: Se ha señalado que los endpoints para desarrolladores tienen cambios frecuentes que rompen la compatibilidad y una documentación inconsistente en comparación con la competencia.

Inicio rápido de API

google/gemini-3-flash

Ver documentación
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ 
  model: "gemini-3-flash",
  thinkingMode: true 
});

const prompt = "Analiza el diseño espacial de esta captura de pantalla de la interfaz de usuario para verificar su accesibilidad.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Gemini 3 Flash

Mira lo que la comunidad piensa sobre Gemini 3 Flash

Gemini 3 Flash destrozó la prueba de SVG de Pelican, los mejores resultados que he visto en cualquier modelo hasta la fecha.
Simon Willison
twitter
El proceso de pensamiento de Gemini 3 es increíble. Realmente lucha con su propia identidad y las restricciones del sistema en tiempo real.
rutan668
reddit
La densidad de conocimiento es increíble, pero la tasa de alucinación lo hace peligroso para tareas sin supervisión.
anonymous_engineer
hackernews
Por fin, un modelo que me permite controlar el presupuesto de cómputo. El modo estándar es increíblemente rápido, el modo de pensamiento es brillante.
AI_Insights_Daily
twitter
Flash 3 es la primera vez que siento que un modelo 'pequeño' realmente podría reemplazar a un modelo 'pro' para el 90% de mi flujo de trabajo de programación.
CodeMasterV
reddit
El reasoning espacial está en otro nivel. Entendió perfectamente mi dibujo desordenado en la pizarra al primer intento.
DesignFlow
twitter

Videos sobre Gemini 3 Flash

Mira tutoriales, reseñas y discusiones sobre Gemini 3 Flash

Supera a Gemini 3 Pro en codificación.

MMU Pro es el modelo número uno de todos.

Es básicamente la frontera de la inteligencia a una fracción del costo.

La velocidad a la que genera un reasoning complejo no tiene comparación.

Google realmente está superando los límites de lo que puede hacer un modelo 'flash'.

Creó una simulación completa de una bandada de pájaros usando solo 3.000 tokens mientras Gemini 3 Pro aún estaba procesando.

Uno de los peores modelos probados en cuanto a alucinaciones. Simplemente se inventa las cosas.

El context window es la verdadera estrella aquí, manejando repositorios enteros con facilidad.

No confíes en él para historia factual o datos técnicos especializados sin RAG.

Es la herramienta definitiva para el análisis visual de registros y paneles de control.

Su comprensión del reasoning espacial es la mejor de su clase.

El 91% de las veces que no sabe algo, mentirá e inventará una respuesta.

La comprensión de pantalla supera las puntuaciones de 2.5 Flash.

La capacidad de analizar la interfaz de usuario visual y convertirla en código es impecable.

El precio lo hace una opción obvia para tareas de agente de alto volumen.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Gemini 3 Flash

Consejos de expertos para ayudarte a sacar el máximo provecho de Gemini 3 Flash.

Utilice el Thinking Mode

Active 'thinkingMode' específicamente para tareas de lógica compleja o problemas matemáticos para mejorar la precisión de manera significativa.

Procesamiento por lotes (Batch) para reducir costos

Utilice la Batch API para tareas que no sean urgentes y obtenga un 50% de descuento en el precio estándar de los tokens.

Optimice mediante MCP

Utilice el Model Context Protocol para integrar herramientas de terceros sin problemas en los flujos de trabajo agentic del model.

Verifique el contenido crítico

Implemente capas de verificación para consultas factuales, ya que el model tiene una alta tasa de alucinación en datos desconocidos.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Preguntas Frecuentes Sobre Gemini 3 Flash

Encuentra respuestas a preguntas comunes sobre Gemini 3 Flash