Wat is de context window van Gemini 3.1 Flash Live?

Het model ondersteunt een context window van 131.072 tokens voor input en een output window van 65.536 tokens. Hierdoor kan het lange gesprekken onthouden en aanzienlijke documenthistorie verwerken tijdens een live sessie.

Tekst-input kost $0,75 per 1 miljoen tokens en output kost $4,50. Audio-input kost ongeveer $0,005 per minuut, terwijl audio-output $0,018 per minuut kost.

Ondersteunt dit model function calling?

Ja, Gemini 3.1 Flash Live ondersteunt synchrone function calling. Het model pauzeert zijn audio-antwoord om de tool uit te voeren en wacht op de tool-output voordat het verdergaat.

Hoe werkt thinking in dit model?

Gemini 3.1 Flash Live gebruikt configureerbare reasoning-niveaus (minimaal, laag, gemiddeld, hoog) in plaats van een vast token budget. Minimaal is de standaardinstelling om de laagste latency in voice-applicaties te garanderen.

Kan het mijn scherm in real-time zien?

Ja, het model kan continue video-frames verwerken via de Live API. Hierdoor kan het scherminformatie of camerabeelden analyseren terwijl het met de gebruiker spreekt.

Is er een gratis tier beschikbaar?

Ja, Google AI Studio biedt gratis toegang tot de Gemini 3.1 Flash Live Preview voor testen en ontwikkeling. Data uit de gratis tier kan worden gebruikt om Google-producten te verbeteren.

Welke talen worden ondersteund?

Het model ondersteunt meer dan 70 talen voor tekst en audio. Deze brede taalondersteuning faciliteert real-time vertalingen wereldwijd en gelokaliseerde klantenservice.

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model met een context window van 131K, high-fidelity multimodal reasoning en...

MultimodalAudio-to-AudioLow LatencyVoice AIReal-Time

googleGemini26 maart 2026

Context

131Ktokens

Max output

66Ktokens

Invoerprijs

$0.75/ 1M

Uitvoerprijs

$4.50/ 1M

Modaliteit:TextImageAudioVideo

Mogelijkheden:VisieToolsStreamingRedeneren

Benchmarks

GPQA

94%

HLE

44%

MMLU

91%

MMLU Pro

89%

SimpleQA

80%

IFEval

88%

AIME 2025

95%

MATH

100%

GSM8k

99%

MGSM

92%

MathVista

72%

SWE-Bench

81%

HumanEval

73%

LiveCodeBench

80%

MMMU

69%

MMMU Pro

60%

ChartQA

90%

DocVQA

94%

Terminal-Bench

69%

ARC-AGI

77%

Bekijk API-documentatie

Over Gemini 3.1 Flash Live Preview

Leer over de mogelijkheden van Gemini 3.1 Flash Live Preview, functies en hoe het je kan helpen betere resultaten te behalen.

Gemini 3.1 Flash Live Preview is een low-latency, multimodal model ontworpen voor real-time, audio-to-audio dialoog. Het draait op Google's Gemini 3-architectuur. Een Sparse Mixture-of-Experts (MoE) ontwerp handhaaft hoge prestaties terwijl de inference-kosten worden verlaagd. Traditionele modellen voeren spraak-naar-tekst uit, gevolgd door tekst-naar-spraak. Dit model verwerkt audiostromen native. Het detecteert akoestische nuances zoals toon, emotie en achtergrondgeluid voor natuurlijke interacties. Lees meer in de officiële documentatie.

Ontwikkelaars gebruiken dit model voor voice-first applicaties die numerieke precisie en onmiddellijke feedback vereisen. Het ondersteunt configureerbare thinking-niveaus, variërend van minimaal tot hoog. Hierdoor kunnen gebruikers de diepgang van reasoning afwegen tegen latency-vereisten. Met een context window van 131.072 tokens en ondersteuning voor tekst, afbeeldingen en video, fungeert het als een veelzijdige engine. Doelgroepen voor gebruik zijn onder andere real-time agents, geautomatiseerde klantenservice en collaboratieve codeeromgevingen.

Interrupt-afhandeling en ruisonderdrukking maken het geschikt voor implementaties in de echte wereld. Het model negeert sirenes en omgevingsgeluid terwijl de gespreksstroom behouden blijft. Ontwikkelaars hebben er toegang toe via de Live API, waarbij ze mobiele en kiosk-applicaties bouwen zonder afzonderlijke transcriptiediensten.

Gebruikscases voor Gemini 3.1 Flash Live Preview

Ontdek de verschillende manieren waarop je Gemini 3.1 Flash Live Preview kunt gebruiken voor geweldige resultaten.

Real-Time voice agents

Bouw conversationele AI die direct reageert op de spraak van gebruikers voor ondersteuning in hospitality, reizen en logistiek.

Live multimodal coaching

Biedt onmiddellijke fitness- of technische training door tegelijkertijd camerabeelden en audio van een gebruiker te analyseren.

Collaboratieve code-assistenten

Stuurt een IDE aan om code te refactoren en UI-componenten bij te werken via continue mondelinge instructies en schermdeling.

Low-Latency vertaling

Faciliteert gesprekken tussen verschillende talen door spraak-naar-spraak te vertalen met behoud van emotionele context.

Ondersteuning in rumoerige omgevingen

Drijft klantenservice-kiosken aan in drukke stedelijke gebieden waar het systeem omgevingsgeluid zoals sirenes en menigten moet filteren.

Interactieve NPC-gaming

Bestuurt niet-speelbare personages (NPC's) die reageren met natuurlijke stembuigingen en reageren op fysieke bewegingen van een speler.

Sterke punten

Beperkingen

Native audioverwerking: Werkt strikt spraak-naar-spraak en detecteert verbale nuances zoals frustratie of sarcasme die op tekst gebaseerde modellen missen.

Synchroon tool-gebruik: Function calling werkt opeenvolgend, wat betekent dat het model stopt met spreken terwijl het wacht op antwoorden van tools.

Hoge prestaties: Beschikt over een 2,5x snellere Time to First Token (TTFT) vergeleken met zijn voorgangers.

Lagere zero-shot logica: De ruwe reasoning-scores liggen onder die van de Gemini 3.1 Pro flagship voor complexe taken op PhD-niveau.

Robuuste ruisonderdrukking: Behoudt 95,9% nauwkeurigheid op de Big Bench Audio-benchmark, zelfs in rumoerige omgevingen zoals restaurants of drukke wegen.

Complexe prijzen: Meerdere tariefniveaus voor tekst, audio en video maken het lastig om budgetten voor multimodal applicaties te voorspellen.

Configureerbare reasoning: Stelt ontwikkelaars in staat om het 'thinkingLevel' aan te passen voor de optimale balans tussen logica en snelheid.

Preview-status: Momenteel in preview, waardoor ontwikkelaars te maken hebben met fluctuerende rate limits en onaangekondigde aanpassingen in gedrag.

API snelstart

google/gemini-3.1-flash-live-preview

Bekijk documentatie

google SDK

import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Analyseer deze audiostroom.");
  console.log(result.response.text());
}
run();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Gemini 3.1 Flash Live Preview

Bekijk wat de community denkt over Gemini 3.1 Flash Live Preview

“Gemini 3.1 Flash-Lite wordt uitgerold... het snelste en meest kostenefficiënte Gemini 3-serie model tot nu toe.”

— BuildwithVignesh

“Evenaart de kwaliteit van 2.5 Flash tegen Flash-Lite kosten. Low-latency, audio-to-audio model geoptimaliseerd voor real-time dialoog.”

— Google AI

twitter

“3 Flash gaat flink achteruit naarmate de context toeneemt, maar het is een enorme verbetering voor real-time responsiviteit.”

— Pasto_Shouwa

“Google knijpt echt de marges op input-tokens met 3.1 Flash. Het wordt moeilijk om iets anders te verantwoorden voor simpele agents.”

— AI_Dev_Master

hackernews

“De pure spraak-naar-spraak architectuur elimineert volledig de ongemakkelijke pauzes die je krijgt bij ketens van transcriptiemodellen.”

— AIExplorer

youtube

“De nieuwe Gemini 3.1 Flash Live Preview aan het testen. De configureerbare thinking-niveaus zijn ongelooflijk nuttig voor het balanceren van snelheid en reasoning.”

— DevGuru_X

twitter

Video's over Gemini 3.1 Flash Live Preview

Bekijk tutorials, reviews en discussies over Gemini 3.1 Flash Live Preview

“Je spreekt, het reageert direct. Geen vertraging, geen laden, geen vreemde pauzes. Het voelt als praten met een echt persoon.”

“Het scoort 95,9% op de Big Bench audio benchmark. Dat is best-in-class voor audio reasoning.”

“Je geeft het geen instructies en wacht af. Je bouwt samen in real-time.”

“Het model kan je scherm zien terwijl je codeert en met je praten over de wijzigingen.”

“De prijzen zijn verdeeld over tekst en audio, dus je moet je kosten zorgvuldig berekenen.”

“Dit vangt je toon, je tempo en je stemming op. Het detecteert frustratie of verwarring.”

“Gemini 3.1 Flash Live staat wereldwijd op nummer één voor de zwaarste AI voice-benchmarks.”

“Het begrijpt echt complexe onderwerpen. Je kunt reasoning toevoegen aan het niveau van AI dat je hebt.”

“Je kunt het midden in een zin onderbreken en het stopt direct om naar de nieuwe instructie te luisteren.”

“De 128K context window betekent dat het het begin van een gesprek van 30 minuten onthoudt.”

“Het doet niet langer spraak-naar-tekst en dan tekst-naar-spraak. Het is direct spraak-naar-spraak.”

“De agent die kan luisteren in rumoerige omgevingen... zoals langs de weg of in een druk restaurant.”

“Toen ik het onderbrak, hoe snel het stopte met praten... dat vond ik erg indrukwekkend.”

“Je kunt dit combineren met lokale code-agents om letterlijk spraakgestuurd software te ontwikkelen.”

“De time to first token is ongeveer 2,5 keer sneller dan de vorige generatie.”

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents

Webautomatisering

Slimme workflows

Gratis beginnen

Pro-tips voor Gemini 3.1 Flash Live Preview

Experttips om je te helpen het maximale uit Gemini 3.1 Flash Live Preview te halen en betere resultaten te behalen.

Pas reasoning-niveaus aan

Stel de 'thinkingLevel' in op 'minimal' voor de snelste stem-antwoorden of op 'high' voor complexe logische taken in meerdere stappen.

Gebruik incrementele updates

Stuur tekst-updates via 'send_realtime_input' tijdens actieve audio-sessies om het model van veranderende context te voorzien.

Optimaliseer turn coverage

Stel turn coverage in op 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' voor een allesomvattend multimodal begrip.

Stel initiële context in

Gebruik 'send_client_content' om de gesprekshistorie op te bouwen voordat een Live API-sessie start voor een betere continuïteit.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context

$2.00/$12.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Veelgestelde vragen over Gemini 3.1 Flash Live Preview

Vind antwoorden op veelvoorkomende vragen over Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview

Over Gemini 3.1 Flash Live Preview

Gebruikscases voor Gemini 3.1 Flash Live Preview

Real-Time voice agents

Live multimodal coaching

Collaboratieve code-assistenten

Low-Latency vertaling

Ondersteuning in rumoerige omgevingen

Interactieve NPC-gaming

Sterke punten

Beperkingen

API snelstart

Wat mensen zeggen over Gemini 3.1 Flash Live Preview

Video's over Gemini 3.1 Flash Live Preview

Supercharge je workflow met AI-automatisering

Pro-tips voor Gemini 3.1 Flash Live Preview

Pas reasoning-niveaus aan

Gebruik incrementele updates

Optimaliseer turn coverage

Stel initiële context in

Wat onze gebruikers zeggen

Gerelateerd AI Models

Claude Opus 4.7

Gemini 3.1 Pro

GPT-5.5

Grok-3

Kimi K3

GPT-5.2 Pro

Qwen 3.7 Max

Gemini 3 Pro

Veelgestelde vragen over Gemini 3.1 Flash Live Preview

Wat is de context window van Gemini 3.1 Flash Live?

Hoeveel kost de API?

Ondersteunt dit model function calling?

Hoe werkt thinking in dit model?

Kan het mijn scherm in real-time zien?

Is er een gratis tier beschikbaar?

Welke talen worden ondersteund?