google

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview; 131K context window, yüksek sadakatli multimodal reasoning ve gerçek zamanlı diyalog özelliklerine sahip, Google'ın ultra-düşük...

MultimodalAudio-to-AudioLow LatencyVoice AIReal-Time
google logogoogleGemini26 Mart 2026
Bağlam
131Ktoken
Maks. çıktı
66Ktoken
Giriş fiyatı
$0.75/ 1M
Çıkış fiyatı
$4.50/ 1M
Modalite:TextImageAudioVideo
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
94%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Gemini 3.1 Flash Live Preview bu benchmark'ta 94% puan aldı.
HLE
44%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Gemini 3.1 Flash Live Preview bu benchmark'ta 44% puan aldı.
MMLU
91%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Gemini 3.1 Flash Live Preview bu benchmark'ta 91% puan aldı.
MMLU Pro
89%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Gemini 3.1 Flash Live Preview bu benchmark'ta 89% puan aldı.
SimpleQA
80%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Gemini 3.1 Flash Live Preview bu benchmark'ta 80% puan aldı.
IFEval
88%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Gemini 3.1 Flash Live Preview bu benchmark'ta 88% puan aldı.
AIME 2025
95%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Gemini 3.1 Flash Live Preview bu benchmark'ta 95% puan aldı.
MATH
100%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Gemini 3.1 Flash Live Preview bu benchmark'ta 100% puan aldı.
GSM8k
99%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Gemini 3.1 Flash Live Preview bu benchmark'ta 99% puan aldı.
MGSM
92%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Gemini 3.1 Flash Live Preview bu benchmark'ta 92% puan aldı.
MathVista
72%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Gemini 3.1 Flash Live Preview bu benchmark'ta 72% puan aldı.
SWE-Bench
81%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Gemini 3.1 Flash Live Preview bu benchmark'ta 81% puan aldı.
HumanEval
73%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Gemini 3.1 Flash Live Preview bu benchmark'ta 73% puan aldı.
LiveCodeBench
80%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Gemini 3.1 Flash Live Preview bu benchmark'ta 80% puan aldı.
MMMU
69%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Gemini 3.1 Flash Live Preview bu benchmark'ta 69% puan aldı.
MMMU Pro
60%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Gemini 3.1 Flash Live Preview bu benchmark'ta 60% puan aldı.
ChartQA
90%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Gemini 3.1 Flash Live Preview bu benchmark'ta 90% puan aldı.
DocVQA
94%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Gemini 3.1 Flash Live Preview bu benchmark'ta 94% puan aldı.
Terminal-Bench
69%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Gemini 3.1 Flash Live Preview bu benchmark'ta 69% puan aldı.
ARC-AGI
77%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Gemini 3.1 Flash Live Preview bu benchmark'ta 77% puan aldı.

Gemini 3.1 Flash Live Preview Hakkında

Gemini 3.1 Flash Live Preview'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Gemini 3.1 Flash Live Preview, gerçek zamanlı, audio-to-audio diyaloglar için tasarlanmış, düşük latency değerli bir multimodal modeldir. Google'ın Gemini 3 mimarisi üzerinde çalışır. Sparse Mixture-of-Experts (MoE) tasarımı, inference maliyetlerini düşürürken yüksek performansı korur. Geleneksel modeller önce speech-to-text, ardından text-to-speech işlemleri gerçekleştirir. Bu model ise ses akışlarını yerel olarak işler. Doğal etkileşimler için ton, duygu ve arka plan gürültüsü gibi akustik nüansları algılar. Daha fazla bilgiyi resmi belgelerde bulabilirsiniz.

Geliştiriciler bu modeli, sayısal hassasiyet ve anında geri bildirim gerektiren ses öncelikli uygulamalar için kullanır. Minimal ile yüksek arasında değişen yapılandırılabilir reasoning seviyelerini destekler. Bu, kullanıcıların reasoning derinliği ile latency gereksinimleri arasında denge kurmasını sağlar. 131.072-token'lık context window ve metin, resim ve video desteği ile çok yönlü bir motor görevi görür. Hedef kullanım durumları arasında gerçek zamanlı agent'lar, otomatik müşteri desteği ve işbirlikçi kodlama ortamları yer alır.

Kesinti yönetimi ve gürültü filtreleme özellikleri, onu gerçek dünya dağıtımları için uygun hale getirir. Model, konuşma akışını korurken siren ve kalabalık seslerini göz ardı eder. Geliştiriciler, ayrı transkripsiyon hizmetlerine ihtiyaç duymadan mobil ve kiosk uygulamaları oluşturmak için Live API aracılığıyla bu modele erişir.

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live Preview için Kullanım Alanları

Harika sonuçlar elde etmek için Gemini 3.1 Flash Live Preview'i kullanmanın farklı yollarını keşfedin.

Gerçek Zamanlı Sesli Agent'lar

Konaklama, seyahat ve lojistik desteği için kullanıcı konuşmalarına anında yanıt veren conversational AI çözümleri oluşturun.

Canlı Multimodal Koçluk

Kullanıcının kamera beslemesini ve sesini eşzamanlı analiz ederek anında fitness veya teknik eğitim sağlayın.

İşbirlikçi Kodlama Asistanları

Sürekli sesli talimatlar ve ekran paylaşımı aracılığıyla bir IDE'nin kodu yeniden düzenlemesini ve UI bileşenlerini güncellemesini sağlayın.

Düşük Latency ile Çeviri

Duygusal bağlamı koruyarak speech-to-speech çeviri yoluyla diller arası konuşmaları kolaylaştırın.

Gürültülü Ortam Desteği

Sistemlerin siren ve kalabalık seslerini filtrelemesi gereken yoğun trafiğe sahip kentsel alanlardaki müşteri hizmetleri kiosklarını güçlendirin.

Etkileşimli NPC Oyunculuğu

Doğal ses tonlamalarıyla yanıt veren ve oyuncunun fiziksel hareketlerine tepki veren oyun karakterleri oluşturun.

Güçlü Yönler

Sınırlamalar

Yerel Ses İşleme: Kesinlikle speech-to-speech çalışır; metin tabanlı modellerin kaçırdığı hayal kırıklığı veya alaycılık gibi sözlü nüansları algılar.
Eşzamanlı Araç Kullanımı: Function calling ardışık çalışır; yani model, araç yanıtlarını beklerken konuşmayı tamamen durdurur.
Yüksek Hız Performansı: Önceki modellere göre 2,5 kat daha hızlı Time to First Token (TTFT) değerine sahiptir.
Daha Düşük Zero-Shot Mantık Performansı: Ham reasoning puanları, karmaşık doktora seviyesindeki görevler için Gemini 3.1 Pro flagship modelinin altındadır.
Güçlü Gürültü Filtreleme: Restoran veya yoğun yollar gibi gürültülü ortamlarda bile Big Bench Audio üzerinde %95,9 doğruluk oranını korur.
Fiyatlandırma Karmaşıklığı: Metin, ses ve video için birden fazla fiyat katmanı, multimodal uygulamalar için bütçe planlamasını tahmin etmeyi zorlaştırır.
Yapılandırılabilir Reasoning: Geliştiricilerin mantık ve hız arasında optimum dengeyi bulmak için 'thinkingLevel' değerini ayarlamasına olanak tanır.
Önizleme Durumu: Şu anda önizleme aşamasında olması, geliştiricileri hız sınırı dalgalanmalarına ve önceden haber verilmeyen davranışsal ayarlamalara maruz bırakır.

API Hızlı Başlangıç

google/gemini-3.1-flash-live-preview

Belgeleri Görüntüle
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-live-preview",
  generationConfig: { thinkingLevel: "minimal" }
});

async function run() {
  const result = await model.generateContent("Bu ses akışını analiz et.");
  console.log(result.response.text());
}
run();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Gemini 3.1 Flash Live Preview Hakkında Ne Diyor

Topluluğun Gemini 3.1 Flash Live Preview hakkında ne düşündüğünü görün

Gemini 3.1 Flash-Lite kullanıma sunuluyor... şimdiye kadarki en hızlı ve en maliyet verimli Gemini 3 serisi modeli.
BuildwithVignesh
reddit
Flash-Lite maliyetiyle 2.5 Flash kalitesini sunuyor. Gerçek zamanlı diyaloglar için optimize edilmiş, düşük latency değerli, audio-to-audio model.
Google AI
twitter
3 Flash, context arttıkça çok fazla performans kaybediyor ancak gerçek zamanlı yanıt verebilirlik açısından büyük bir gelişme.
Pasto_Shouwa
reddit
Google, 3.1 Flash ile input token marjlarını gerçekten zorluyor. Basit agent'lar için başka bir şey kullanmayı haklı çıkarmak giderek zorlaşıyor.
AI_Dev_Master
hackernews
Ham speech-to-speech mimarisi, zincirleme transkripsiyon modellerinde karşılaştığınız tuhaf duraklamaları tamamen ortadan kaldırıyor.
AIExplorer
youtube
Yeni Gemini 3.1 Flash Live Preview'u test ediyorum. Yapılandırılabilir reasoning seviyeleri, hız ve mantık arasında denge kurmak için inanılmaz derecede faydalı.
DevGuru_X
twitter

Gemini 3.1 Flash Live Preview Hakkında Videolar

Gemini 3.1 Flash Live Preview hakkında eğitimler, incelemeler ve tartışmalar izleyin

Konuşursunuz, anında yanıt verir. Gecikme yok, yükleme yok, tuhaf duraklamalar yok. Gerçek bir insanla konuşuyormuşsunuz gibi hissettiriyor.

Big Bench ses benchmark testinde %95,9 puan alıyor. Bu, sesli reasoning konusunda sınıfının en iyisi.

Ona talimat verip beklemiyorsunuz. Onunla gerçek zamanlı olarak birlikte inşa ediyorsunuz.

Model siz kod yazarken ekranınızı görebilir ve değişiklikler hakkında sizinle konuşabilir.

Fiyatlandırma metin ve ses arasında bölündüğü için maliyetlerinizi dikkatlice hesaplamanız gerekiyor.

Bu, tonunuzu, hızınızı ve ruh halinizi yakalıyor. Hayal kırıklığını veya kafa karışıklığını anlıyor.

Gemini 3.1 Flash Live, dünyadaki en zorlu AI ses benchmark testlerinde birinci sırada yer alıyor.

Karmaşık konuları gerçekten anlıyor. Sahip olduğunuz AI seviyesine reasoning ekleyebilirsiniz.

Cümlenin ortasında sözünü kesebilirsiniz ve o hemen durup yeni talimatı dinler.

128K context window, 30 dakikalık bir konuşmanın başlangıcını hatırladığı anlamına geliyor.

Artık önce speech-to-text sonra text-to-speech yapmıyor. Doğrudan speech-to-speech çalışıyor.

Agent'ın gürültülü ortamlarda dinleyebilmesi... yol kenarı veya gürültülü bir restoran gibi.

Sözünü kestiğimde konuşmayı ne kadar hızlı durdurduğu gerçekten etkileyiciydi.

Bunu yerel kod agent'larıyla birleştirerek yazılım geliştirme sürecinizi kelimenin tam anlamıyla sesli komutlarla yönetebilirsiniz.

İlk token süresi, önceki nesle göre yaklaşık 2,5 kat daha hızlı.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Gemini 3.1 Flash Live Preview için Pro İpuçları

Gemini 3.1 Flash Live Preview'den en iyi şekilde yararlanmak için uzman ipuçları.

Reasoning Seviyelerini Ayarlayın

En hızlı sesli yanıtlar için 'thinkingLevel' değerini 'minimal' olarak, karmaşık çok adımlı mantıksal görevler için ise 'high' olarak ayarlayın.

Artımlı Güncellemeleri Kullanın

Modele değişen context bilgisini sağlamak için aktif ses oturumları sırasında 'send_realtime_input' üzerinden metin güncellemeleri gönderin.

Turn Coverage'ı Optimize Edin

Kapsamlı bir multimodal anlayış için turn coverage ayarını 'TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO' olarak yapılandırın.

İlk Context Bilgisini Tanımlayın

Daha iyi süreklilik sağlamak için bir Live API oturumu başlatmadan önce konuşma geçmişini oluşturmak amacıyla 'send_client_content' kullanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Gemini 3.1 Flash Live Preview Hakkında Sık Sorulan Sorular

Gemini 3.1 Flash Live Preview hakkında sık sorulan soruların cevaplarını bulun