Gemini 3.1 Flash Live için context window nedir?

Model, 131.072 token'lık bir giriş context window ve 65.536 token'lık bir çıkış penceresini destekler. Bu, modelin uzun konuşmaları hatırlamasını ve canlı bir oturum sırasında yüklü miktarda doküman geçmişini işlemesini sağlar.

API'nin maliyeti nedir?

Metin girişi 1 milyon token başına 0,75 dolar, çıkış ise 4,50 dolardır. Ses girişi dakikada yaklaşık 0,005 dolar, ses çıkışı ise dakikada 0,018 dolar maliyetindedir.

Bu model function calling destekliyor mu?

Evet, Gemini 3.1 Flash Live eşzamanlı function calling özelliğini destekler. Model, aracı yürütmek için sesli yanıtını duraklatır ve devam etmeden önce araç çıktısını bekler.

Bu modelde düşünme (thinking) süreci nasıl çalışır?

Gemini 3.1 Flash Live, sabit bir token bütçesi yerine yapılandırılabilir reasoning seviyeleri (minimal, düşük, orta, yüksek) kullanır. Ses uygulamalarında en düşük latency değerini sağlamak için varsayılan ayar 'minimal'dir.

Ekranımı gerçek zamanlı olarak görebiliyor mu?

Evet, model Live API aracılığıyla sürekli video karelerini işleyebilir. Bu, kullanıcıyla konuşurken ekran içeriğini veya kamera beslemelerini analiz etmesine olanak tanır.

Ücretsiz bir katman mevcut mu?

Evet, Google AI Studio, test ve geliştirme için Gemini 3.1 Flash Live Preview'a ücretsiz erişim sunar. Ücretsiz katman verileri Google ürünlerini iyileştirmek için kullanılabilir.

Hangi diller destekleniyor?

Model, metin ve ses için 70'ten fazla dili destekler. Bu geniş dil kapsamı, küresel çapta gerçek zamanlı çeviriyi ve yerelleştirilmiş müşteri hizmetlerini destekler.

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview; 131K context window, yüksek sadakatli multimodal reasoning ve gerçek zamanlı diyalog özelliklerine sahip, Google'ın ultra-düşük...

MultimodalAudio-to-AudioLow LatencyVoice AIReal-Time

googleGemini26 Mart 2026

Bağlam

131Ktoken

Maks. çıktı

66Ktoken

Giriş fiyatı

$0.75/ 1M

Çıkış fiyatı

$4.50/ 1M

Modalite:TextImageAudioVideo

Yetenekler:GörüntüAraçlarAkışAkıl Yürütme

Benchmarks

GPQA

94%

HLE

44%

MMLU

91%

MMLU Pro

89%

SimpleQA

80%

IFEval

88%

AIME 2025

95%

MATH

100%

GSM8k

99%

MGSM

92%

MathVista

72%

SWE-Bench

81%

HumanEval

73%

LiveCodeBench

80%

MMMU

69%

MMMU Pro

60%

ChartQA

90%

DocVQA

94%

Terminal-Bench

69%

ARC-AGI

77%

API belgelerini görüntüle

Gemini 3.1 Flash Live Preview Hakkında

Gemini 3.1 Flash Live Preview'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Gemini 3.1 Flash Live Preview, gerçek zamanlı, audio-to-audio diyaloglar için tasarlanmış, düşük latency değerli bir multimodal modeldir. Google'ın Gemini 3 mimarisi üzerinde çalışır. Sparse Mixture-of-Experts (MoE) tasarımı, inference maliyetlerini düşürürken yüksek performansı korur. Geleneksel modeller önce speech-to-text, ardından text-to-speech işlemleri gerçekleştirir. Bu model ise ses akışlarını yerel olarak işler. Doğal etkileşimler için ton, duygu ve arka plan gürültüsü gibi akustik nüansları algılar. Daha fazla bilgiyi resmi belgelerde bulabilirsiniz.

Geliştiriciler bu modeli, sayısal hassasiyet ve anında geri bildirim gerektiren ses öncelikli uygulamalar için kullanır. Minimal ile yüksek arasında değişen yapılandırılabilir reasoning seviyelerini destekler. Bu, kullanıcıların reasoning derinliği ile latency gereksinimleri arasında denge kurmasını sağlar. 131.072-token'lık context window ve metin, resim ve video desteği ile çok yönlü bir motor görevi görür. Hedef kullanım durumları arasında gerçek zamanlı agent'lar, otomatik müşteri desteği ve işbirlikçi kodlama ortamları yer alır.

Kesinti yönetimi ve gürültü filtreleme özellikleri, onu gerçek dünya dağıtımları için uygun hale getirir. Model, konuşma akışını korurken siren ve kalabalık seslerini göz ardı eder. Geliştiriciler, ayrı transkripsiyon hizmetlerine ihtiyaç duymadan mobil ve kiosk uygulamaları oluşturmak için Live API aracılığıyla bu modele erişir.

Gemini 3.1 Flash Live Preview için Kullanım Alanları

Harika sonuçlar elde etmek için Gemini 3.1 Flash Live Preview'i kullanmanın farklı yollarını keşfedin.

Gerçek Zamanlı Sesli Agent'lar

Konaklama, seyahat ve lojistik desteği için kullanıcı konuşmalarına anında yanıt veren conversational AI çözümleri oluşturun.

Canlı Multimodal Koçluk

Kullanıcının kamera beslemesini ve sesini eşzamanlı analiz ederek anında fitness veya teknik eğitim sağlayın.

İşbirlikçi Kodlama Asistanları

Sürekli sesli talimatlar ve ekran paylaşımı aracılığıyla bir IDE'nin kodu yeniden düzenlemesini ve UI bileşenlerini güncellemesini sağlayın.

Düşük Latency ile Çeviri

Duygusal bağlamı koruyarak speech-to-speech çeviri yoluyla diller arası konuşmaları kolaylaştırın.

Gürültülü Ortam Desteği

Sistemlerin siren ve kalabalık seslerini filtrelemesi gereken yoğun trafiğe sahip kentsel alanlardaki müşteri hizmetleri kiosklarını güçlendirin.

Etkileşimli NPC Oyunculuğu

Doğal ses tonlamalarıyla yanıt veren ve oyuncunun fiziksel hareketlerine tepki veren oyun karakterleri oluşturun.

Güçlü Yönler

Sınırlamalar

Yerel Ses İşleme: Kesinlikle speech-to-speech çalışır; metin tabanlı modellerin kaçırdığı hayal kırıklığı veya alaycılık gibi sözlü nüansları algılar.

Eşzamanlı Araç Kullanımı: Function calling ardışık çalışır; yani model, araç yanıtlarını beklerken konuşmayı tamamen durdurur.

Yüksek Hız Performansı: Önceki modellere göre 2,5 kat daha hızlı Time to First Token (TTFT) değerine sahiptir.

Daha Düşük Zero-Shot Mantık Performansı: Ham reasoning puanları, karmaşık doktora seviyesindeki görevler için Gemini 3.1 Pro flagship modelinin altındadır.

Güçlü Gürültü Filtreleme: Restoran veya yoğun yollar gibi gürültülü ortamlarda bile Big Bench Audio üzerinde %95,9 doğruluk oranını korur.

Fiyatlandırma Karmaşıklığı: Metin, ses ve video için birden fazla fiyat katmanı, multimodal uygulamalar için bütçe planlamasını tahmin etmeyi zorlaştırır.

Yapılandırılabilir Reasoning: Geliştiricilerin mantık ve hız arasında optimum dengeyi bulmak için 'thinkingLevel' değerini ayarlamasına olanak tanır.

Önizleme Durumu: Şu anda önizleme aşamasında olması, geliştiricileri hız sınırı dalgalanmalarına ve önceden haber verilmeyen davranışsal ayarlamalara maruz bırakır.

API Hızlı Başlangıç

google/gemini-3.1-flash-live-preview

Belgeleri Görüntüle

google SDK

import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Bu ses akışını analiz et.");
  console.log(result.response.text());
}
run();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Gemini 3.1 Flash Live Preview Hakkında Ne Diyor

Topluluğun Gemini 3.1 Flash Live Preview hakkında ne düşündüğünü görün

“Gemini 3.1 Flash-Lite kullanıma sunuluyor... şimdiye kadarki en hızlı ve en maliyet verimli Gemini 3 serisi modeli.”

— BuildwithVignesh

“Flash-Lite maliyetiyle 2.5 Flash kalitesini sunuyor. Gerçek zamanlı diyaloglar için optimize edilmiş, düşük latency değerli, audio-to-audio model.”

— Google AI

twitter

“3 Flash, context arttıkça çok fazla performans kaybediyor ancak gerçek zamanlı yanıt verebilirlik açısından büyük bir gelişme.”

— Pasto_Shouwa

“Google, 3.1 Flash ile input token marjlarını gerçekten zorluyor. Basit agent'lar için başka bir şey kullanmayı haklı çıkarmak giderek zorlaşıyor.”

— AI_Dev_Master

hackernews

“Ham speech-to-speech mimarisi, zincirleme transkripsiyon modellerinde karşılaştığınız tuhaf duraklamaları tamamen ortadan kaldırıyor.”

— AIExplorer

youtube

“Yeni Gemini 3.1 Flash Live Preview'u test ediyorum. Yapılandırılabilir reasoning seviyeleri, hız ve mantık arasında denge kurmak için inanılmaz derecede faydalı.”

— DevGuru_X

twitter

Gemini 3.1 Flash Live Preview Hakkında Videolar

Gemini 3.1 Flash Live Preview hakkında eğitimler, incelemeler ve tartışmalar izleyin

“Konuşursunuz, anında yanıt verir. Gecikme yok, yükleme yok, tuhaf duraklamalar yok. Gerçek bir insanla konuşuyormuşsunuz gibi hissettiriyor.”

“Big Bench ses benchmark testinde %95,9 puan alıyor. Bu, sesli reasoning konusunda sınıfının en iyisi.”

“Ona talimat verip beklemiyorsunuz. Onunla gerçek zamanlı olarak birlikte inşa ediyorsunuz.”

“Model siz kod yazarken ekranınızı görebilir ve değişiklikler hakkında sizinle konuşabilir.”

“Fiyatlandırma metin ve ses arasında bölündüğü için maliyetlerinizi dikkatlice hesaplamanız gerekiyor.”

“Bu, tonunuzu, hızınızı ve ruh halinizi yakalıyor. Hayal kırıklığını veya kafa karışıklığını anlıyor.”

“Gemini 3.1 Flash Live, dünyadaki en zorlu AI ses benchmark testlerinde birinci sırada yer alıyor.”

“Karmaşık konuları gerçekten anlıyor. Sahip olduğunuz AI seviyesine reasoning ekleyebilirsiniz.”

“Cümlenin ortasında sözünü kesebilirsiniz ve o hemen durup yeni talimatı dinler.”

“128K context window, 30 dakikalık bir konuşmanın başlangıcını hatırladığı anlamına geliyor.”

“Artık önce speech-to-text sonra text-to-speech yapmıyor. Doğrudan speech-to-speech çalışıyor.”

“Agent'ın gürültülü ortamlarda dinleyebilmesi... yol kenarı veya gürültülü bir restoran gibi.”

“Sözünü kestiğimde konuşmayı ne kadar hızlı durdurduğu gerçekten etkileyiciydi.”

“Bunu yerel kod agent'larıyla birleştirerek yazılım geliştirme sürecinizi kelimenin tam anlamıyla sesli komutlarla yönetebilirsiniz.”

“İlk token süresi, önceki nesle göre yaklaşık 2,5 kat daha hızlı.”

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları

Web Otomasyonu

Akıllı İş Akışları

Ucretsiz Basla

Gemini 3.1 Flash Live Preview için Pro İpuçları

Gemini 3.1 Flash Live Preview'den en iyi şekilde yararlanmak için uzman ipuçları.

Reasoning Seviyelerini Ayarlayın

En hızlı sesli yanıtlar için 'thinkingLevel' değerini 'minimal' olarak, karmaşık çok adımlı mantıksal görevler için ise 'high' olarak ayarlayın.

Artımlı Güncellemeleri Kullanın

Modele değişen context bilgisini sağlamak için aktif ses oturumları sırasında 'send_realtime_input' üzerinden metin güncellemeleri gönderin.

Turn Coverage'ı Optimize Edin

Kapsamlı bir multimodal anlayış için turn coverage ayarını 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' olarak yapılandırın.

İlk Context Bilgisini Tanımlayın

Daha iyi süreklilik sağlamak için bir Live API oturumu başlatmadan önce konuşma geçmişini oluşturmak amacıyla 'send_client_content' kullanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context

$5.00/$25.00/1M

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context

$2.00/$12.00/1M

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context

$5.00/$30.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context

$3.00/$15.00/1M

Kimi K3

Moonshot

Kimi K3 is Moonshot AI's 2.8T MoE model with a 1M token context window, native multimodal vision, and frontier-tier coding performance for complex agents.

1M context

$3.00/$15.00/1M

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context

$21.00/$168.00/1M

Qwen 3.7 Max

alibaba

Qwen 3.7 Max is Alibaba’s flagship AI model for deep reasoning and autonomous agent tasks, featuring a 256k context window and top-tier coding performance.

256K context

$1.20/$6.00/1M

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context

$2.00/$12.00/1M

Gemini 3.1 Flash Live Preview Hakkında Sık Sorulan Sorular

Gemini 3.1 Flash Live Preview hakkında sık sorulan soruların cevaplarını bulun