google

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview je Google-ov model sa ultra-niskom latency-om, audio-to-audio mogućnostima, 131K context window-om i multimodalnim reasoning-om.

MultimodalAudio-to-AudioLow LatencyVoice AIReal-Time
google logogoogleGemini26. mart 2026.
Контекст
131Kтокена
Макс. излаз
66Kтокена
Улазна цена
$0.75/ 1M
Излазна цена
$4.50/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтримингЗакључивање
Бенчмаркови
GPQA
94%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Gemini 3.1 Flash Live Preview је постигао 94% на овом бенчмарку.
HLE
44%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Gemini 3.1 Flash Live Preview је постигао 44% на овом бенчмарку.
MMLU
91%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Gemini 3.1 Flash Live Preview је постигао 91% на овом бенчмарку.
MMLU Pro
89%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Gemini 3.1 Flash Live Preview је постигао 89% на овом бенчмарку.
SimpleQA
80%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Gemini 3.1 Flash Live Preview је постигао 80% на овом бенчмарку.
IFEval
88%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Gemini 3.1 Flash Live Preview је постигао 88% на овом бенчмарку.
AIME 2025
95%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Gemini 3.1 Flash Live Preview је постигао 95% на овом бенчмарку.
MATH
100%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Gemini 3.1 Flash Live Preview је постигао 100% на овом бенчмарку.
GSM8k
99%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Gemini 3.1 Flash Live Preview је постигао 99% на овом бенчмарку.
MGSM
92%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Gemini 3.1 Flash Live Preview је постигао 92% на овом бенчмарку.
MathVista
72%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Gemini 3.1 Flash Live Preview је постигао 72% на овом бенчмарку.
SWE-Bench
81%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Gemini 3.1 Flash Live Preview је постигао 81% на овом бенчмарку.
HumanEval
73%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Gemini 3.1 Flash Live Preview је постигао 73% на овом бенчмарку.
LiveCodeBench
80%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Gemini 3.1 Flash Live Preview је постигао 80% на овом бенчмарку.
MMMU
69%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Gemini 3.1 Flash Live Preview је постигао 69% на овом бенчмарку.
MMMU Pro
60%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Gemini 3.1 Flash Live Preview је постигао 60% на овом бенчмарку.
ChartQA
90%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Gemini 3.1 Flash Live Preview је постигао 90% на овом бенчмарку.
DocVQA
94%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Gemini 3.1 Flash Live Preview је постигао 94% на овом бенчмарку.
Terminal-Bench
69%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Gemini 3.1 Flash Live Preview је постигао 69% на овом бенчмарку.
ARC-AGI
77%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Gemini 3.1 Flash Live Preview је постигао 77% на овом бенчмарку.

О моделу Gemini 3.1 Flash Live Preview

Сазнајте о могућностима, функцијама и начинима коришћења модела Gemini 3.1 Flash Live Preview.

Gemini 3.1 Flash Live Preview je multimodalni model sa niskom latency-om dizajniran za audio-to-audio dijalog u realnom vremenu. Radi na Google Gemini 3 arhitekturi. Dizajn Sparse Mixture-of-Experts (MoE) održava visoke performanse uz smanjenje troškova inference-a. Tradicionalni modeli rade speech-to-text, a zatim text-to-speech. Ovaj model obrađuje audio streamove izvorno. Detektuje akustičke nijanse poput tona, emocije i pozadinske buke za prirodne interakcije. Saznajte više u zvaničnoj dokumentaciji.

Developeri koriste ovaj model za glasovne aplikacije koje zahtevaju numeričku preciznost i trenutnu povratnu informaciju. Podržava podesive nivoe thinking-a, od minimalnog do visokog. To omogućava korisnicima da balansiraju dubinu reasoning-a prema potrebama za latency-om. Sa 131.072-token context window-om i podrškom za tekst, slike i video, on funkcioniše kao svestran motor. Ciljani primeri upotrebe uključuju agente u realnom vremenu, automatizovanu korisničku podršku i kolaborativna okruženja za pisanje koda.

Upravljanje prekidima i filtriranje buke čine ga pogodnim za primenu u stvarnom svetu. Model ignoriše buku sirena i gužve dok održava tok razgovora. Developeri mu pristupaju putem Live API-ja, gradeći mobilne i kiosk aplikacije bez potrebe za posebnim uslugama transkripcije.

Gemini 3.1 Flash Live Preview

Случајеви употребе за Gemini 3.1 Flash Live Preview

Откријте различите начине коришћења модела Gemini 3.1 Flash Live Preview за постизање одличних резултата.

Glasovni agenti u realnom vremenu

Izgradnja konverzacionog AI-ja koji trenutno odgovara na govor korisnika za potrebe ugostiteljstva, putovanja i logistike.

Multimodalni koučing uživo

Pružanje trenutnih fitnes ili tehničkih instrukcija analizom kamere i audio ulaza korisnika istovremeno.

Asistenti za kolaborativno programiranje

Direktno upravljanje IDE-om za refaktorisanje koda i ažuriranje UI komponenti putem kontinuiranih glasovnih instrukcija i deljenja ekrana.

Prevođenje sa niskom latency-om

Omogućavanje međujezičkih razgovora prevođenjem govora u govor uz očuvanje emocionalnog konteksta.

Podrška u bučnom okruženju

Pokretanje kioska za korisničku podršku u prometnim urbanim sredinama gde sistem mora da filtrira buku sirena i gužve.

Interaktivni NPC likovi u igrama

Pokretanje neigrivih likova (NPC) koji odgovaraju prirodnom intonacijom glasa i reaguju na fizičke pokrete igrača.

Предности

Ограничења

Izvorna audio obrada: Radi isključivo speech-to-speech, detektujući verbalne nijanse poput frustracije ili sarkazma koje tekstualni modeli propuštaju.
Sinhrono korišćenje alata: Function calling radi sekvencijalno, što znači da model potpuno prestaje da govori dok čeka odgovor alata.
Visoke performanse brzine: Odlikuje se 2,5 puta bržim Time to First Token (TTFT) u poređenju sa prethodnicima.
Niža zero-shot logika: Rezultati reasoning-a su ispod flagship modela Gemini 3.1 Pro za složene zadatke na doktorskom nivou.
Robusno filtriranje buke: Održava 95,9% preciznosti na Big Bench Audio benchmark-u čak i u bučnim okruženjima poput restorana ili prometnih ulica.
Kompleksnost cena: Višestruki nivoi tarifa za tekst, audio i video čine planiranje budžeta za multimodalne aplikacije teškim za predviđanje.
Podesiv reasoning: Omogućava developerima da povećaju ili smanje 'thinkingLevel' kako bi pronašli optimalan balans između logike i brzine.
Status pregleda (Preview): Trenutno je u fazi pregleda, što znači da developeri mogu biti izloženi promenama limita brzine i nenajavljenim podešavanjima ponašanja modela.

АПИ брзи старт

google/gemini-3.1-flash-live-preview

Погледај документацију
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Analyze this audio stream.");
  console.log(result.response.text());
}
run();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Gemini 3.1 Flash Live Preview

Погледајте шта заједница мисли о моделу Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash-Lite je u procesu lansiranja... najbrži i najisplativiji model iz Gemini 3 serije do sada.
BuildwithVignesh
reddit
Parira kvalitetu 2.5 Flash uz cenu Flash-Lite modela. Audio-to-audio model sa niskom latency-om optimizovan za dijaloge u realnom vremenu.
Google AI
twitter
3 Flash dosta gubi na performansama kako se context povećava, ali je ogromno poboljšanje za responsivnost u realnom vremenu.
Pasto_Shouwa
reddit
Google zaista smanjuje margine kod ulaznih token-a sa 3.1 Flash. Postaje teško opravdati korišćenje bilo čega drugog za jednostavne agente.
AI_Dev_Master
hackernews
Arhitektura čistog speech-to-speech potpuno eliminiše nezgodne pauze koje dobijate sa povezanim transkripcionim modelima.
AIExplorer
youtube
Testiram novi Gemini 3.1 Flash Live Preview. Podesivi nivoi thinking-a su neverovatno korisni za balansiranje brzine i reasoning-a.
DevGuru_X
twitter

Видео снимци о моделу Gemini 3.1 Flash Live Preview

Гледајте туторијале, рецензије и дискусије о моделу Gemini 3.1 Flash Live Preview

Govoriš, on odgovara trenutno. Nema kašnjenja, nema učitavanja, nema čudnih pauza. Zvuči kao razgovor sa stvarnom osobom.

Ostvaruje 95,9% na Big Bench audio benchmark-u. To je najbolje u klasi za audio reasoning.

Ne daješ mu instrukcije i čekaš. Ti gradiš zajedno sa njim u realnom vremenu.

Model može da vidi tvoj ekran dok programiraš i da razgovara sa tobom o izmenama.

Cene su podeljene između teksta i audija, pa moraš pažljivo da izračunaš troškove.

Ovo prepoznaje tvoj ton, tvoj tempo i tvoje raspoloženje. Prepoznaje frustraciju ili zbunjenost.

Gemini 3.1 Flash Live je prvi na svetu po najtežim AI benchmark-ovima glasa.

Zapravo razume složene teme. Možeš dodati reasoning na nivo AI-ja koji koristiš.

Možeš ga prekinuti usred rečenice i on odmah prestaje i sluša novu instrukciju.

128K context window znači da pamti početak 30-minutnog razgovora.

Više ne radi speech-to-text pa onda text-to-speech. To je čisto speech-to-speech.

Agent koji može da sluša u bučnom okruženju... poput strane ulice ili bučnog restorana.

Kada sam ga prekinuo, brzina kojom je prestao da govori... mislim da je zaista impresivna.

Možeš ovo kombinovati sa lokalnim kod agentima da bukvalno glasovno komanduješ razvoj softvera.

Vreme do prvog token-a je otprilike 2,5 puta brže nego kod prethodne generacije.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Gemini 3.1 Flash Live Preview

Stručni saveti za maksimalno iskorišćenje Gemini 3.1 Flash Live Preview.

Prilagođavanje nivoa thinking-a

Podesite 'thinkingLevel' na 'minimal' za najbrže glasovne odgovore ili na 'high' za složene logičke zadatke u više koraka.

Korišćenje inkrementalnih ažuriranja

Šaljite tekstualna ažuriranja putem 'send_realtime_input' tokom aktivnih audio sesija kako biste modelu pružili kontekst koji se menja.

Optimizacija pokrivenosti sesije

Podesite turn coverage na 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' za sveobuhvatno multimodalno razumevanje.

Postavljanje početnog konteksta

Koristite 'send_client_content' da definišete istoriju razgovora pre početka Live API sesije radi bolje kontinuiteta.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Често Постављана Питања о Gemini 3.1 Flash Live Preview

Пронађите одговоре на честа питања о Gemini 3.1 Flash Live Preview