Koliki je context window za Gemini 3.1 Flash Live?

Model podržava context window od 131.072 tokena za ulaz i 65.536 tokena za izlaz. To mu omogućuje pamćenje dugih razgovora i obradu znatne povijesti dokumenata tijekom sesije uživo.

Ulaz teksta iznosi 0,75 USD po 1 milijun tokena, a izlaz 4,50 USD. Audio ulaz košta približno 0,005 USD po minuti, dok audio izlaz košta 0,018 USD po minuti.

Podržava li ovaj model function calling?

Da, Gemini 3.1 Flash Live podržava sinkroni function calling. Model pauzira svoj audio odgovor kako bi izvršio alat i čeka rezultat alata prije nastavka.

Kako funkcionira reasoning u ovom modelu?

Gemini 3.1 Flash Live koristi podesive razine reasoninga (minimal, low, medium, high) umjesto fiksnog budžeta tokena. Minimal je zadana postavka kako bi se osigurala najniža latencija u glasovnim aplikacijama.

Može li vidjeti moj ekran u stvarnom vremenu?

Da, model može prihvaćati kontinuirane video okvire putem Live API-ja. To mu omogućuje analizu sadržaja ekrana ili video prijenosa kamere dok razgovara s korisnikom.

Postoji li besplatna razina pristupa?

Da, Google AI Studio nudi besplatan pristup Gemini 3.1 Flash Live Preview za testiranje i razvoj. Podaci s besplatne razine mogu se koristiti za poboljšanje Google proizvoda.

Koji su jezici podržani?

Model podržava više od 70 jezika za tekst i audio. Ova široka jezična pokrivenost omogućuje globalno prevođenje u stvarnom vremenu i lokaliziranu korisničku podršku.

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview je Googleov model za audio-to-audio razmjenu s ultra-niskom latencijom, koji sadrži 131K context window, multimodalni reasoning...

MultimodalAudio-to-AudioNiska latencijaVoice AIStvarno vrijeme

googleGemini26. ožujka 2026.

Kontekst

131Ktokena

Maks. izlaz

66Ktokena

Ulazna cijena

$0.75/ 1M

Izlazna cijena

$4.50/ 1M

Modalitet:TextImageAudioVideo

Mogućnosti:VidAlatiStreamingZaključivanje

Benchmarks

GPQA

94%

HLE

44%

MMLU

91%

MMLU Pro

89%

SimpleQA

80%

IFEval

88%

AIME 2025

95%

MATH

100%

GSM8k

99%

MGSM

92%

MathVista

72%

SWE-Bench

81%

HumanEval

73%

LiveCodeBench

80%

MMMU

69%

MMMU Pro

60%

ChartQA

90%

DocVQA

94%

Terminal-Bench

69%

ARC-AGI

77%

Pogledaj API dokumentaciju

O modelu Gemini 3.1 Flash Live Preview

Saznajte o mogućnostima, značajkama i načinima korištenja modela Gemini 3.1 Flash Live Preview.

Gemini 3.1 Flash Live Preview je multimodalni model s niskom latencijom dizajniran za audio-to-audio dijalog u stvarnom vremenu. Radi na Googleovoj Gemini 3 arhitekturi. Sparse Mixture-of-Experts (MoE) dizajn održava visoke performanse uz smanjenje troškova inferencea. Tradicionalni modeli izvode speech-to-text, a zatim text-to-speech. Ovaj model obrađuje audio streamove izvorno. Detektira akustičke nijanse poput tona, emocije i pozadinske buke za prirodne interakcije. Saznajte više u službenoj dokumentaciji.

Programeri koriste ovaj model za glasovne aplikacije koje zahtijevaju numeričku preciznost i trenutne povratne informacije. Podržava podesive razine reasoninga u rasponu od minimalne do visoke. To omogućuje korisnicima da balansiraju dubinu logike prema zahtjevima latencije. S context windowom od 131.072 tokena i podrškom za tekst, slike i video, djeluje kao svestran motor. Ciljani primjeri upotrebe uključuju agente u stvarnom vremenu, automatiziranu korisničku podršku i suradnička okruženja za kodiranje.

Upravljanje prekidima i filtriranje buke čine ga prikladnim za implementacije u stvarnom svijetu. Model ignorira buku sirena i gužve dok održava tijek razgovora. Programeri mu pristupaju putem Live API-ja, gradeći mobilne i kiosk aplikacije bez potrebe za zasebnim uslugama transkripcije.

Slučajevi korištenja za Gemini 3.1 Flash Live Preview

Otkrijte različite načine korištenja modela Gemini 3.1 Flash Live Preview za postizanje izvrsnih rezultata.

Glasovni agenti u stvarnom vremenu

Izgradnja konverzacijskog AI-a koji trenutno odgovara na govor korisnika za podršku u hotelijerstvu, putovanjima i logistici.

Multimodalno treniranje uživo

Pružanje trenutnog fitness ili tehničkog treninga analizom video prijenosa kamere i audija korisnika istovremeno.

Suradnički asistenti za kodiranje

Usmjeravanje IDE-a na refaktoriranje koda i ažuriranje UI komponenti putem kontinuiranih glasovnih uputa i dijeljenja ekrana.

Prevođenje s niskom latencijom

Olakšavanje međujezičnih razgovora prevođenjem govora u govor uz očuvanje emocionalnog konteksta.

Podrška u bučnim okruženjima

Pokretanje kioska za korisničku podršku u prometnim urbanim područjima gdje sustav mora filtrirati buku sirena i gužve.

Interaktivni NPC-ovi u igrama

Pokretanje ne-igrivih likova (NPC) koji odgovaraju prirodnom vokalnom intonacijom i reagiraju na fizičke pokrete igrača.

Prednosti

Ograničenja

Izvorna audio obrada: Radi isključivo speech-to-speech, detektirajući verbalne nijanse poput frustracije ili sarkazma koje modeli temeljeni na tekstu propuštaju.

Sinkrono korištenje alata: Function calling radi sekvencijalno, što znači da model potpuno prestaje govoriti dok čeka odgovor alata.

Visoke performanse brzine: Sadrži 2,5 puta brži Time to First Token (TTFT) u usporedbi s prethodnicima.

Niža logika u zero-shot scenarijima: Rezultati sirovog reasoninga su ispod Gemini 3.1 Pro flagship modela za složene zadatke na razini doktorata.

Robusno filtriranje buke: Održava 95,9% točnosti na Big Bench Audio benchmarku čak i u bučnim okruženjima poput restorana ili prometnih cesta.

Složenost cijena: Višestruke razine cijena za tekst, audio i video čine planiranje budžeta za multimodalne aplikacije teškim za predviđanje.

Podesivi reasoning: Omogućuje programerima da povećaju ili smanje 'thinkingLevel' kako bi pronašli optimalnu ravnotežu između logike i brzine.

Status pregleda: Trenutno u fazi pregleda (preview), što znači da su programeri podložni promjenama ograničenja brzine (rate limit) i nenajavljenim podešavanjima ponašanja.

API brzi početak

google/gemini-3.1-flash-live-preview

Pogledaj dokumentaciju

google SDK

import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Analyze this audio stream.");
  console.log(result.response.text());
}
run();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Gemini 3.1 Flash Live Preview

Pogledajte što zajednica misli o modelu Gemini 3.1 Flash Live Preview

“Gemini 3.1 Flash-Lite izlazi... najbrži i najisplativiji model iz Gemini 3 serije do sada.”

— BuildwithVignesh

“Odgovara kvaliteti 2.5 Flash uz cijenu Flash-Lite-a. Audio-to-audio model s niskom latencijom optimiziran za dijalog u stvarnom vremenu.”

— Google AI

twitter

“3 Flash dosta gubi na kvaliteti kako se kontekst povećava, ali ovo je ogromno poboljšanje za brzinu odgovora u stvarnom vremenu.”

— Pasto_Shouwa

“Google stvarno smanjuje marže na ulaznim tokenima s 3.1 Flash. Postaje teško opravdati korištenje ičeg drugog za jednostavne agente.”

— AI_Dev_Master

hackernews

“Sirova speech-to-speech arhitektura potpuno eliminira neugodne pauze koje dobivate kod povezanih transkripcijskih modela.”

— AIExplorer

youtube

“Testiram novi Gemini 3.1 Flash Live Preview. Podesive razine reasoninga su nevjerojatno korisne za balansiranje između brzine i logike.”

— DevGuru_X

twitter

Videozapisi o modelu Gemini 3.1 Flash Live Preview

Gledajte tutorijale, recenzije i diskusije o modelu Gemini 3.1 Flash Live Preview

“Govorite, on odgovara trenutno. Nema kašnjenja, nema učitavanja, nema čudnih pauza. Zvuči kao razgovor sa stvarnom osobom.”

“Ostvaruje 95,9% na Big Bench audio benchmarku. To je najbolje u klasi za audio reasoning.”

“Ne dajete mu upute i čekate. S njim gradite u stvarnom vremenu.”

“Model može vidjeti vaš ekran dok kodirate i razgovarati s vama o promjenama.”

“Cijene su podijeljene između teksta i audija, pa morate pažljivo izračunati svoje troškove.”

“Ovo prepoznaje vaš ton, tempo i raspoloženje. Prepoznaje frustraciju ili zbunjenost.”

“Gemini 3.1 Flash Live je na prvom mjestu na svijetu prema najtežim AI benchmarkovima za glas.”

“Stvarno razumije složene teme. Možete dodati reasoning na razinu AI-a koju koristite.”

“Možete ga prekinuti usred rečenice i on odmah prestaje te sluša novu uputu.”

“128K context window znači da pamti početak 30-minutnog razgovora.”

“Više ne radi speech-to-text pa text-to-speech. Radi izravno speech-to-speech.”

“Agent koji može slušati u bučnim okruženjima... poput ceste ili bučnog restorana.”

“Kako brzo je prestao govoriti kad sam ga prekinuo... mislim da je to stvarno impresivno.”

“Možete ovo kombinirati s lokalnim kodnim agentima za doslovno glasovno upravljanje razvojem softvera.”

“Time to first token je otprilike 2,5 puta brži nego kod prethodne generacije.”

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti

Web Automatizacija

Pametni Tokovi

Zapocnite Besplatno

Pro Savjeti za Gemini 3.1 Flash Live Preview

Stručni savjeti za maksimalno iskorištavanje Gemini 3.1 Flash Live Preview.

Prilagodite razine reasoninga

Postavite 'thinkingLevel' na 'minimal' za najbrže glasovne odgovore ili 'high' za složene logičke zadatke u više koraka.

Koristite inkrementalna ažuriranja

Šaljite tekstualna ažuriranja putem 'send_realtime_input' tijekom aktivnih audio sesija kako biste modelu pružili kontekst koji se mijenja.

Optimizirajte pokrivenost sesije

Postavite turn coverage na 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' za sveobuhvatno multimodalno razumijevanje.

Postavite inicijalni kontekst

Koristite 'send_client_content' za uspostavljanje povijesti razgovora prije početka Live API sesije radi bolje kontinuiteta.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context

$2.00/$12.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Često Postavljana Pitanja o Gemini 3.1 Flash Live Preview

Pronađite odgovore na česta pitanja o Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview

O modelu Gemini 3.1 Flash Live Preview

Slučajevi korištenja za Gemini 3.1 Flash Live Preview

Glasovni agenti u stvarnom vremenu

Multimodalno treniranje uživo

Suradnički asistenti za kodiranje

Prevođenje s niskom latencijom

Podrška u bučnim okruženjima

Interaktivni NPC-ovi u igrama

Prednosti

Ograničenja

API brzi početak

Što ljudi kažu o modelu Gemini 3.1 Flash Live Preview

Videozapisi o modelu Gemini 3.1 Flash Live Preview

Poboljšajte svoj radni tijek sa AI Automatizacijom

Pro Savjeti za Gemini 3.1 Flash Live Preview

Prilagodite razine reasoninga

Koristite inkrementalna ažuriranja

Optimizirajte pokrivenost sesije

Postavite inicijalni kontekst

Sto Kazu Nasi Korisnici

Povezani AI Models

Claude Opus 4.7

Gemini 3.1 Pro

GPT-5.5

Grok-3

Kimi K3

GPT-5.2 Pro

Qwen 3.7 Max

Gemini 3 Pro

Često Postavljana Pitanja o Gemini 3.1 Flash Live Preview

Koliki je context window za Gemini 3.1 Flash Live?

Koliko košta API?

Podržava li ovaj model function calling?

Kako funkcionira reasoning u ovom modelu?

Može li vidjeti moj ekran u stvarnom vremenu?

Postoji li besplatna razina pristupa?

Koji su jezici podržani?