Koliki je context window za Gemini 3.1 Flash Live?

Model podržava context window od 131.072 token-a za ulaz i 65.536 token-a za izlaz. To mu omogućava da pamti duge razgovore i obrađuje veliku istoriju dokumenata tokom sesije uživo.

Tekstualni ulaz košta $0,75 na milion token-a, a izlaz $4,50. Audio ulaz košta približno $0,005 po minutu, dok audio izlaz košta $0,018 po minutu.

Da li ovaj model podržava function calling?

Da, Gemini 3.1 Flash Live podržava sinhroni function calling. Model pauzira svoj audio odgovor kako bi izvršio alat i čeka rezultat alata pre nego što nastavi dalje.

Kako funkcioniše thinking u ovom modelu?

Gemini 3.1 Flash Live koristi podesive nivoe reasoning-a (minimalni, niski, srednji, visoki) umesto fiksnog budžeta token-a. Minimalni nivo je podrazumevana postavka kako bi se obezbedila najniža latency u glasovnim aplikacijama.

Da li može da vidi moj ekran u realnom vremenu?

Da, model može da prima neprekidan video zapis kroz Live API. To mu omogućava da analizira sadržaj ekrana ili feed kamere dok razgovara sa korisnikom.

Da li postoji besplatan nivo korišćenja?

Da, Google AI Studio nudi besplatan pristup za Gemini 3.1 Flash Live Preview radi testiranja i razvoja. Podaci iz besplatnog nivoa mogu se koristiti za poboljšanje Google proizvoda.

Koji su jezici podržani?

Model podržava preko 70 jezika za tekst i audio. Ova široka jezička pokrivenost podržava globalno prevođenje u realnom vremenu i lokalizovanu korisničku podršku.

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview je Google-ov model sa ultra-niskom latency-om, audio-to-audio mogućnostima, 131K context window-om i multimodalnim reasoning-om.

MultimodalAudio-to-AudioLow LatencyVoice AIReal-Time

googleGemini26. mart 2026.

Контекст

131Kтокена

Макс. излаз

66Kтокена

Улазна цена

$0.75/ 1M

Излазна цена

$4.50/ 1M

Модалитет:TextImageAudioVideo

Могућности:ВидАлатиСтримингЗакључивање

Бенчмаркови

GPQA

94%

HLE

44%

MMLU

91%

MMLU Pro

89%

SimpleQA

80%

IFEval

88%

AIME 2025

95%

MATH

100%

GSM8k

99%

MGSM

92%

MathVista

72%

SWE-Bench

81%

HumanEval

73%

LiveCodeBench

80%

MMMU

69%

MMMU Pro

60%

ChartQA

90%

DocVQA

94%

Terminal-Bench

69%

ARC-AGI

77%

Погледај АПИ документацију

О моделу Gemini 3.1 Flash Live Preview

Сазнајте о могућностима, функцијама и начинима коришћења модела Gemini 3.1 Flash Live Preview.

Gemini 3.1 Flash Live Preview je multimodalni model sa niskom latency-om dizajniran za audio-to-audio dijalog u realnom vremenu. Radi na Google Gemini 3 arhitekturi. Dizajn Sparse Mixture-of-Experts (MoE) održava visoke performanse uz smanjenje troškova inference-a. Tradicionalni modeli rade speech-to-text, a zatim text-to-speech. Ovaj model obrađuje audio streamove izvorno. Detektuje akustičke nijanse poput tona, emocije i pozadinske buke za prirodne interakcije. Saznajte više u zvaničnoj dokumentaciji.

Developeri koriste ovaj model za glasovne aplikacije koje zahtevaju numeričku preciznost i trenutnu povratnu informaciju. Podržava podesive nivoe thinking-a, od minimalnog do visokog. To omogućava korisnicima da balansiraju dubinu reasoning-a prema potrebama za latency-om. Sa 131.072-token context window-om i podrškom za tekst, slike i video, on funkcioniše kao svestran motor. Ciljani primeri upotrebe uključuju agente u realnom vremenu, automatizovanu korisničku podršku i kolaborativna okruženja za pisanje koda.

Upravljanje prekidima i filtriranje buke čine ga pogodnim za primenu u stvarnom svetu. Model ignoriše buku sirena i gužve dok održava tok razgovora. Developeri mu pristupaju putem Live API-ja, gradeći mobilne i kiosk aplikacije bez potrebe za posebnim uslugama transkripcije.

Случајеви употребе за Gemini 3.1 Flash Live Preview

Откријте различите начине коришћења модела Gemini 3.1 Flash Live Preview за постизање одличних резултата.

Glasovni agenti u realnom vremenu

Izgradnja konverzacionog AI-ja koji trenutno odgovara na govor korisnika za potrebe ugostiteljstva, putovanja i logistike.

Multimodalni koučing uživo

Pružanje trenutnih fitnes ili tehničkih instrukcija analizom kamere i audio ulaza korisnika istovremeno.

Asistenti za kolaborativno programiranje

Direktno upravljanje IDE-om za refaktorisanje koda i ažuriranje UI komponenti putem kontinuiranih glasovnih instrukcija i deljenja ekrana.

Prevođenje sa niskom latency-om

Omogućavanje međujezičkih razgovora prevođenjem govora u govor uz očuvanje emocionalnog konteksta.

Podrška u bučnom okruženju

Pokretanje kioska za korisničku podršku u prometnim urbanim sredinama gde sistem mora da filtrira buku sirena i gužve.

Interaktivni NPC likovi u igrama

Pokretanje neigrivih likova (NPC) koji odgovaraju prirodnom intonacijom glasa i reaguju na fizičke pokrete igrača.

Предности

Ограничења

Izvorna audio obrada: Radi isključivo speech-to-speech, detektujući verbalne nijanse poput frustracije ili sarkazma koje tekstualni modeli propuštaju.

Sinhrono korišćenje alata: Function calling radi sekvencijalno, što znači da model potpuno prestaje da govori dok čeka odgovor alata.

Visoke performanse brzine: Odlikuje se 2,5 puta bržim Time to First Token (TTFT) u poređenju sa prethodnicima.

Niža zero-shot logika: Rezultati reasoning-a su ispod flagship modela Gemini 3.1 Pro za složene zadatke na doktorskom nivou.

Robusno filtriranje buke: Održava 95,9% preciznosti na Big Bench Audio benchmark-u čak i u bučnim okruženjima poput restorana ili prometnih ulica.

Kompleksnost cena: Višestruki nivoi tarifa za tekst, audio i video čine planiranje budžeta za multimodalne aplikacije teškim za predviđanje.

Podesiv reasoning: Omogućava developerima da povećaju ili smanje 'thinkingLevel' kako bi pronašli optimalan balans između logike i brzine.

Status pregleda (Preview): Trenutno je u fazi pregleda, što znači da developeri mogu biti izloženi promenama limita brzine i nenajavljenim podešavanjima ponašanja modela.

АПИ брзи старт

google/gemini-3.1-flash-live-preview

Погледај документацију

google SDK

import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Analyze this audio stream.");
  console.log(result.response.text());
}
run();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Gemini 3.1 Flash Live Preview

Погледајте шта заједница мисли о моделу Gemini 3.1 Flash Live Preview

“Gemini 3.1 Flash-Lite je u procesu lansiranja... najbrži i najisplativiji model iz Gemini 3 serije do sada.”

— BuildwithVignesh

“Parira kvalitetu 2.5 Flash uz cenu Flash-Lite modela. Audio-to-audio model sa niskom latency-om optimizovan za dijaloge u realnom vremenu.”

— Google AI

twitter

“3 Flash dosta gubi na performansama kako se context povećava, ali je ogromno poboljšanje za responsivnost u realnom vremenu.”

— Pasto_Shouwa

“Google zaista smanjuje margine kod ulaznih token-a sa 3.1 Flash. Postaje teško opravdati korišćenje bilo čega drugog za jednostavne agente.”

— AI_Dev_Master

hackernews

“Arhitektura čistog speech-to-speech potpuno eliminiše nezgodne pauze koje dobijate sa povezanim transkripcionim modelima.”

— AIExplorer

youtube

“Testiram novi Gemini 3.1 Flash Live Preview. Podesivi nivoi thinking-a su neverovatno korisni za balansiranje brzine i reasoning-a.”

— DevGuru_X

twitter

Видео снимци о моделу Gemini 3.1 Flash Live Preview

Гледајте туторијале, рецензије и дискусије о моделу Gemini 3.1 Flash Live Preview

“Govoriš, on odgovara trenutno. Nema kašnjenja, nema učitavanja, nema čudnih pauza. Zvuči kao razgovor sa stvarnom osobom.”

“Ostvaruje 95,9% na Big Bench audio benchmark-u. To je najbolje u klasi za audio reasoning.”

“Ne daješ mu instrukcije i čekaš. Ti gradiš zajedno sa njim u realnom vremenu.”

“Model može da vidi tvoj ekran dok programiraš i da razgovara sa tobom o izmenama.”

“Cene su podeljene između teksta i audija, pa moraš pažljivo da izračunaš troškove.”

“Ovo prepoznaje tvoj ton, tvoj tempo i tvoje raspoloženje. Prepoznaje frustraciju ili zbunjenost.”

“Gemini 3.1 Flash Live je prvi na svetu po najtežim AI benchmark-ovima glasa.”

“Zapravo razume složene teme. Možeš dodati reasoning na nivo AI-ja koji koristiš.”

“Možeš ga prekinuti usred rečenice i on odmah prestaje i sluša novu instrukciju.”

“128K context window znači da pamti početak 30-minutnog razgovora.”

“Više ne radi speech-to-text pa onda text-to-speech. To je čisto speech-to-speech.”

“Agent koji može da sluša u bučnom okruženju... poput strane ulice ili bučnog restorana.”

“Kada sam ga prekinuo, brzina kojom je prestao da govori... mislim da je zaista impresivna.”

“Možeš ovo kombinovati sa lokalnim kod agentima da bukvalno glasovno komanduješ razvoj softvera.”

“Vreme do prvog token-a je otprilike 2,5 puta brže nego kod prethodne generacije.”

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти

Веб Аутоматизација

Паметни Токови

Pocnite Besplatno

Pro Saveti za Gemini 3.1 Flash Live Preview

Stručni saveti za maksimalno iskorišćenje Gemini 3.1 Flash Live Preview.

Prilagođavanje nivoa thinking-a

Podesite 'thinkingLevel' na 'minimal' za najbrže glasovne odgovore ili na 'high' za složene logičke zadatke u više koraka.

Korišćenje inkrementalnih ažuriranja

Šaljite tekstualna ažuriranja putem 'send_realtime_input' tokom aktivnih audio sesija kako biste modelu pružili kontekst koji se menja.

Optimizacija pokrivenosti sesije

Podesite turn coverage na 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' za sveobuhvatno multimodalno razumevanje.

Postavljanje početnog konteksta

Koristite 'send_client_content' da definišete istoriju razgovora pre početka Live API sesije radi bolje kontinuiteta.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context

$2.00/$12.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Често Постављана Питања о Gemini 3.1 Flash Live Preview

Пронађите одговоре на честа питања о Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview

О моделу Gemini 3.1 Flash Live Preview

Случајеви употребе за Gemini 3.1 Flash Live Preview

Glasovni agenti u realnom vremenu

Multimodalni koučing uživo

Asistenti za kolaborativno programiranje

Prevođenje sa niskom latency-om

Podrška u bučnom okruženju

Interaktivni NPC likovi u igrama

Предности

Ограничења

АПИ брзи старт

Шта људи кажу о моделу Gemini 3.1 Flash Live Preview

Видео снимци о моделу Gemini 3.1 Flash Live Preview

Побољшајте свој радни ток са AI Automatizacijom

Pro Saveti za Gemini 3.1 Flash Live Preview

Prilagođavanje nivoa thinking-a

Korišćenje inkrementalnih ažuriranja

Optimizacija pokrivenosti sesije

Postavljanje početnog konteksta

Sta Kazu Nasi Korisnici

Povezani AI Models

Claude Opus 4.7

Gemini 3.1 Pro

GPT-5.5

Grok-3

Kimi K3

GPT-5.2 Pro

Qwen 3.7 Max

Gemini 3 Pro

Често Постављана Питања о Gemini 3.1 Flash Live Preview

Koliki je context window za Gemini 3.1 Flash Live?

Koliko košta API?

Da li ovaj model podržava function calling?

Kako funkcioniše thinking u ovom modelu?

Da li može da vidi moj ekran u realnom vremenu?

Da li postoji besplatan nivo korišćenja?

Koji su jezici podržani?