google

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model met een context window van 131K, high-fidelity multimodal reasoning en...

MultimodalAudio-to-AudioLow LatencyVoice AIReal-Time
google logogoogleGemini26 maart 2026
Context
131Ktokens
Max output
66Ktokens
Invoerprijs
$0.75/ 1M
Uitvoerprijs
$4.50/ 1M
Modaliteit:TextImageAudioVideo
Mogelijkheden:VisieToolsStreamingRedeneren
Benchmarks
GPQA
94%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Gemini 3.1 Flash Live Preview scoorde 94% op deze benchmark.
HLE
44%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Gemini 3.1 Flash Live Preview scoorde 44% op deze benchmark.
MMLU
91%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Gemini 3.1 Flash Live Preview scoorde 91% op deze benchmark.
MMLU Pro
89%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Gemini 3.1 Flash Live Preview scoorde 89% op deze benchmark.
SimpleQA
80%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Gemini 3.1 Flash Live Preview scoorde 80% op deze benchmark.
IFEval
88%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Gemini 3.1 Flash Live Preview scoorde 88% op deze benchmark.
AIME 2025
95%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Gemini 3.1 Flash Live Preview scoorde 95% op deze benchmark.
MATH
100%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Gemini 3.1 Flash Live Preview scoorde 100% op deze benchmark.
GSM8k
99%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Gemini 3.1 Flash Live Preview scoorde 99% op deze benchmark.
MGSM
92%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Gemini 3.1 Flash Live Preview scoorde 92% op deze benchmark.
MathVista
72%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Gemini 3.1 Flash Live Preview scoorde 72% op deze benchmark.
SWE-Bench
81%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Gemini 3.1 Flash Live Preview scoorde 81% op deze benchmark.
HumanEval
73%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Gemini 3.1 Flash Live Preview scoorde 73% op deze benchmark.
LiveCodeBench
80%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Gemini 3.1 Flash Live Preview scoorde 80% op deze benchmark.
MMMU
69%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Gemini 3.1 Flash Live Preview scoorde 69% op deze benchmark.
MMMU Pro
60%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Gemini 3.1 Flash Live Preview scoorde 60% op deze benchmark.
ChartQA
90%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Gemini 3.1 Flash Live Preview scoorde 90% op deze benchmark.
DocVQA
94%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Gemini 3.1 Flash Live Preview scoorde 94% op deze benchmark.
Terminal-Bench
69%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Gemini 3.1 Flash Live Preview scoorde 69% op deze benchmark.
ARC-AGI
77%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Gemini 3.1 Flash Live Preview scoorde 77% op deze benchmark.

Over Gemini 3.1 Flash Live Preview

Leer over de mogelijkheden van Gemini 3.1 Flash Live Preview, functies en hoe het je kan helpen betere resultaten te behalen.

Gemini 3.1 Flash Live Preview is een low-latency, multimodal model ontworpen voor real-time, audio-to-audio dialoog. Het draait op Google's Gemini 3-architectuur. Een Sparse Mixture-of-Experts (MoE) ontwerp handhaaft hoge prestaties terwijl de inference-kosten worden verlaagd. Traditionele modellen voeren spraak-naar-tekst uit, gevolgd door tekst-naar-spraak. Dit model verwerkt audiostromen native. Het detecteert akoestische nuances zoals toon, emotie en achtergrondgeluid voor natuurlijke interacties. Lees meer in de officiële documentatie.

Ontwikkelaars gebruiken dit model voor voice-first applicaties die numerieke precisie en onmiddellijke feedback vereisen. Het ondersteunt configureerbare thinking-niveaus, variërend van minimaal tot hoog. Hierdoor kunnen gebruikers de diepgang van reasoning afwegen tegen latency-vereisten. Met een context window van 131.072 tokens en ondersteuning voor tekst, afbeeldingen en video, fungeert het als een veelzijdige engine. Doelgroepen voor gebruik zijn onder andere real-time agents, geautomatiseerde klantenservice en collaboratieve codeeromgevingen.

Interrupt-afhandeling en ruisonderdrukking maken het geschikt voor implementaties in de echte wereld. Het model negeert sirenes en omgevingsgeluid terwijl de gespreksstroom behouden blijft. Ontwikkelaars hebben er toegang toe via de Live API, waarbij ze mobiele en kiosk-applicaties bouwen zonder afzonderlijke transcriptiediensten.

Gemini 3.1 Flash Live Preview

Gebruikscases voor Gemini 3.1 Flash Live Preview

Ontdek de verschillende manieren waarop je Gemini 3.1 Flash Live Preview kunt gebruiken voor geweldige resultaten.

Real-Time voice agents

Bouw conversationele AI die direct reageert op de spraak van gebruikers voor ondersteuning in hospitality, reizen en logistiek.

Live multimodal coaching

Biedt onmiddellijke fitness- of technische training door tegelijkertijd camerabeelden en audio van een gebruiker te analyseren.

Collaboratieve code-assistenten

Stuurt een IDE aan om code te refactoren en UI-componenten bij te werken via continue mondelinge instructies en schermdeling.

Low-Latency vertaling

Faciliteert gesprekken tussen verschillende talen door spraak-naar-spraak te vertalen met behoud van emotionele context.

Ondersteuning in rumoerige omgevingen

Drijft klantenservice-kiosken aan in drukke stedelijke gebieden waar het systeem omgevingsgeluid zoals sirenes en menigten moet filteren.

Interactieve NPC-gaming

Bestuurt niet-speelbare personages (NPC's) die reageren met natuurlijke stembuigingen en reageren op fysieke bewegingen van een speler.

Sterke punten

Beperkingen

Native audioverwerking: Werkt strikt spraak-naar-spraak en detecteert verbale nuances zoals frustratie of sarcasme die op tekst gebaseerde modellen missen.
Synchroon tool-gebruik: Function calling werkt opeenvolgend, wat betekent dat het model stopt met spreken terwijl het wacht op antwoorden van tools.
Hoge prestaties: Beschikt over een 2,5x snellere Time to First Token (TTFT) vergeleken met zijn voorgangers.
Lagere zero-shot logica: De ruwe reasoning-scores liggen onder die van de Gemini 3.1 Pro flagship voor complexe taken op PhD-niveau.
Robuuste ruisonderdrukking: Behoudt 95,9% nauwkeurigheid op de Big Bench Audio-benchmark, zelfs in rumoerige omgevingen zoals restaurants of drukke wegen.
Complexe prijzen: Meerdere tariefniveaus voor tekst, audio en video maken het lastig om budgetten voor multimodal applicaties te voorspellen.
Configureerbare reasoning: Stelt ontwikkelaars in staat om het 'thinkingLevel' aan te passen voor de optimale balans tussen logica en snelheid.
Preview-status: Momenteel in preview, waardoor ontwikkelaars te maken hebben met fluctuerende rate limits en onaangekondigde aanpassingen in gedrag.

API snelstart

google/gemini-3.1-flash-live-preview

Bekijk documentatie
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Analyseer deze audiostroom.");
  console.log(result.response.text());
}
run();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Gemini 3.1 Flash Live Preview

Bekijk wat de community denkt over Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash-Lite wordt uitgerold... het snelste en meest kostenefficiënte Gemini 3-serie model tot nu toe.
BuildwithVignesh
reddit
Evenaart de kwaliteit van 2.5 Flash tegen Flash-Lite kosten. Low-latency, audio-to-audio model geoptimaliseerd voor real-time dialoog.
Google AI
twitter
3 Flash gaat flink achteruit naarmate de context toeneemt, maar het is een enorme verbetering voor real-time responsiviteit.
Pasto_Shouwa
reddit
Google knijpt echt de marges op input-tokens met 3.1 Flash. Het wordt moeilijk om iets anders te verantwoorden voor simpele agents.
AI_Dev_Master
hackernews
De pure spraak-naar-spraak architectuur elimineert volledig de ongemakkelijke pauzes die je krijgt bij ketens van transcriptiemodellen.
AIExplorer
youtube
De nieuwe Gemini 3.1 Flash Live Preview aan het testen. De configureerbare thinking-niveaus zijn ongelooflijk nuttig voor het balanceren van snelheid en reasoning.
DevGuru_X
twitter

Video's over Gemini 3.1 Flash Live Preview

Bekijk tutorials, reviews en discussies over Gemini 3.1 Flash Live Preview

Je spreekt, het reageert direct. Geen vertraging, geen laden, geen vreemde pauzes. Het voelt als praten met een echt persoon.

Het scoort 95,9% op de Big Bench audio benchmark. Dat is best-in-class voor audio reasoning.

Je geeft het geen instructies en wacht af. Je bouwt samen in real-time.

Het model kan je scherm zien terwijl je codeert en met je praten over de wijzigingen.

De prijzen zijn verdeeld over tekst en audio, dus je moet je kosten zorgvuldig berekenen.

Dit vangt je toon, je tempo en je stemming op. Het detecteert frustratie of verwarring.

Gemini 3.1 Flash Live staat wereldwijd op nummer één voor de zwaarste AI voice-benchmarks.

Het begrijpt echt complexe onderwerpen. Je kunt reasoning toevoegen aan het niveau van AI dat je hebt.

Je kunt het midden in een zin onderbreken en het stopt direct om naar de nieuwe instructie te luisteren.

De 128K context window betekent dat het het begin van een gesprek van 30 minuten onthoudt.

Het doet niet langer spraak-naar-tekst en dan tekst-naar-spraak. Het is direct spraak-naar-spraak.

De agent die kan luisteren in rumoerige omgevingen... zoals langs de weg of in een druk restaurant.

Toen ik het onderbrak, hoe snel het stopte met praten... dat vond ik erg indrukwekkend.

Je kunt dit combineren met lokale code-agents om letterlijk spraakgestuurd software te ontwikkelen.

De time to first token is ongeveer 2,5 keer sneller dan de vorige generatie.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Gemini 3.1 Flash Live Preview

Experttips om je te helpen het maximale uit Gemini 3.1 Flash Live Preview te halen en betere resultaten te behalen.

Pas reasoning-niveaus aan

Stel de 'thinkingLevel' in op 'minimal' voor de snelste stem-antwoorden of op 'high' voor complexe logische taken in meerdere stappen.

Gebruik incrementele updates

Stuur tekst-updates via 'send_realtime_input' tijdens actieve audio-sessies om het model van veranderende context te voorzien.

Optimaliseer turn coverage

Stel turn coverage in op 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' voor een allesomvattend multimodal begrip.

Stel initiële context in

Gebruik 'send_client_content' om de gesprekshistorie op te bouwen voordat een Live API-sessie start voor een betere continuïteit.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Veelgestelde vragen over Gemini 3.1 Flash Live Preview

Vind antwoorden op veelvoorkomende vragen over Gemini 3.1 Flash Live Preview