Berapa biaya Gemini 3.5 Flash untuk developer?

Model ini mengenakan biaya $1,50 per 1 juta input tokens dan $9,00 per 1 juta output tokens. Google menawarkan diskon 90% untuk input tokens yang di-cache, sehingga kueri yang berulang menjadi sangat ekonomis.

Berapa context window untuk model ini?

Gemini 3.5 Flash mendukung context window sebesar 1.048.576 tokens. Ini memungkinkan pengguna untuk memasukkan sekitar 700.000 kata atau konten video berdurasi beberapa jam dalam satu permintaan.

Apakah model ini dapat memproses file video dan audio secara native?

Ya, model ini mendukung input langsung untuk file video, audio, gambar, dan PDF. Model ini menganalisis aliran tersebut secara native untuk menjaga konteks spasial dan temporal selama proses reasoning.

Bagaimana perbandingannya dengan Gemini 3.1 Pro?

Gemini 3.5 Flash mengungguli model 3.1 Pro pada banyak benchmark agentic dan coding. Model ini menghasilkan output tokens sekitar empat kali lebih cepat dengan tetap menjaga logika yang superior.

Apakah Gemini 3.5 Flash mendukung function calling?

Ya, model ini sangat dioptimalkan untuk penggunaan tool dan function calling. Model ini dapat berinteraksi dengan API eksternal, IDE, dan lingkungan terminal untuk alur kerja multi-langkah.

Berapa batas maksimum output token?

Model ini dapat menghasilkan hingga 65.536 tokens dalam satu respons. Kapasitas ini cukup untuk memproduksi aplikasi lengkap atau laporan teknis yang ekstensif.

Apakah tersedia mode reasoning atau mode berpikir?

Ya, model ini memiliki mode berpikir chain-of-thought yang dapat diaktifkan. Hal ini memungkinkan developer untuk mengaudit proses perencanaan internal model.

Gemini 3.5 Flash

Gemini 3.5 Flash adalah model multimodal berkecepatan tinggi dari Google dengan context window 1M, dioptimalkan untuk agentic loops di bawah satu detik dan...

Multimodal AIAgentic Workflows1M ContextHigh-Speed LLM

googleGemini19 Mei 2026

Konteks

1.0Mtoken

Output maks.

66Ktoken

Harga input

$1.50/ 1M

Harga output

$9.00/ 1M

Modalitas:TextImageAudioVideo

Kemampuan:VisiAlatStreamingPenalaran

Benchmarks

GPQA

74%

HLE

34%

MMLU

89%

MMLU Pro

83%

SimpleQA

76.7%

IFEval

88%

AIME 2025

68%

MATH

88%

GSM8k

97%

MGSM

92%

MathVista

74%

SWE-Bench

55.1%

HumanEval

92%

LiveCodeBench

56%

MMMU

84%

MMMU Pro

88.3%

ChartQA

89%

DocVQA

94%

Terminal-Bench

76.2%

ARC-AGI

12%

Lihat dokumentasi API

Tentang Gemini 3.5 Flash

Pelajari tentang kemampuan, fitur, dan cara menggunakan Gemini 3.5 Flash.

Performa Agentic dengan Efisiensi Tinggi

Gemini 3.5 Flash adalah model multimodal yang dirancang untuk kecepatan dan reasoning yang kompleks. Model ini mendukung context window 1 juta token, memungkinkan pengguna untuk memproses kumpulan data masif termasuk video berdurasi satu jam dan seluruh repositori kode dalam satu prompt. Arsitekturnya dioptimalkan untuk latency di bawah satu detik, menyasar developer yang membangun AI agents interaktif dan alur kerja otomatis.

Multimodalitas dan Reasoning Native

Model ini memperkenalkan mode berpikir untuk logika chain-of-thought tingkat lanjut. Ia secara native memproses teks, gambar, audio, video, dan PDF, yang menghilangkan kebutuhan akan pipeline prapemrosesan terpisah. Benchmark menunjukkan bahwa model ini mengungguli Gemini 3.1 Pro sebelumnya dalam tugas coding dan penggunaan tool dengan tetap menjaga efisiensi tier Flash.

Skalabilitas Siap Produksi

Dengan biaya $1,50 per juta input tokens, model ini menyediakan jalur hemat biaya untuk aplikasi bervolume tinggi. Model ini secara khusus disetel untuk function calling dan tugas berbasis terminal, mencapai skor tinggi pada benchmark agentic seperti SWE-bench dan Terminal-Bench. Hal ini menjadikannya pilihan utama untuk asisten coding real-time dan sistem kurasi data.

Kasus Penggunaan untuk Gemini 3.5 Flash

Temukan berbagai cara menggunakan Gemini 3.5 Flash untuk hasil yang luar biasa.

Kurasi Ruang Berita Otomatis

Memindai ribuan feed RSS dan utas media sosial untuk memberi skor dan memeringkat cerita berdasarkan profil editorial tertentu secara real-time.

Analisis Dokumen Bervolume Tinggi

Memproses arsip masif seperti riwayat kasus hukum untuk mengekstrak ringkasan terstruktur dan wawasan yang dapat ditindaklanjuti tanpa kehilangan konteks.

Sintesis Musik Real-time

Menghasilkan tool audio interaktif dan antarmuka musik menggunakan pemahaman native tentang teori musik dan bentuk gelombang audio.

Pembuatan Browser OS Interaktif

Membuat simulasi sistem operasi yang berfungsi penuh dan dasbor UI yang kompleks dari prompt bahasa alami.

Refactoring Kode Cepat

Mengeksekusi pembaruan logika di seluruh codebase besar tanpa menghabiskan kredit lebih besar yang diperlukan oleh flagship models.

Otomatisasi Terminal Agentic

Melakukan tugas sistem multi-langkah dan iterasi coding menggunakan harness terminal untuk mengorkestrasi lingkungan pengembangan.

Kelebihan

Keterbatasan

Context 1M Token yang Masif: Mendukung analisis mendalam terhadap data panjang termasuk video berdurasi penuh dan seluruh repositori perangkat lunak.

Harga yang Meningkat: Biaya token telah naik tiga kali lipat dibandingkan model pratinjau Flash sebelumnya, menjadi $1,50 untuk input dan $9 untuk output per juta token.

Logika Sintesis yang Luar Biasa: Performa terdepan dalam menghasilkan tool audio interaktif yang kompleks dan simulasi sistem operasi berbasis browser modern.

Ketidakakuratan Aritmatika: Terkadang kesulitan dengan operasi matematika dasar, gagal pada prompt sederhana yang dapat diselesaikan dengan mudah oleh model reasoning khusus.

Latency di Bawah Satu Detik: Dioptimalkan untuk throughput ekstrem, mencapai kecepatan output hingga 1500 tokens per detik di lingkungan produksi.

Degradasi Context Window: Pengguna melaporkan bahwa reliabilitas pengambilan data dapat sedikit berkurang saat context window mendekati batas 1 juta token.

Peningkatan Performa Agentic: Mengungguli banyak flagship models yang lebih besar pada tugas coding dunia nyata dan benchmark agentic berbasis terminal.

Ketidakkonsistenan Pencahayaan 3D: Dapat menghasilkan lingkungan yang terlalu gelap atau kurang pencahayaan dalam simulasi 3D yang kompleks, memerlukan prompting berulang untuk memperbaikinya.

Mulai Cepat API

google/gemini-3.5-flash

Lihat Dokumentasi

google SDK

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = client.getGenerativeModel({ 
  model: "gemini-3.5-flash",
  generationConfig: { maxOutputTokens: 65536 }
});

async function run() {
  const prompt = "Build a fully interactive 3D synthwave landscape using Three.js.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

run();

Instal SDK dan mulai melakukan panggilan API dalam hitungan menit.

Apa Kata Orang Tentang Gemini 3.5 Flash

Lihat apa yang dipikirkan komunitas tentang Gemini 3.5 Flash

“Gemini 3.5 Flash adalah pemimpin yang jelas di frontier Pareto Kecerdasan vs Kecepatan dan memberikan keuntungan besar pada tugas-tugas agentic dunia nyata.”

— Artificial Analysis

twitter

“Gemini 3 sangat brilian untuk penggunaan bisnis di UK. Ia menangkap tingkat kesantunan yang bernuansa dan asumsi pajak spesifik UK dengan lebih baik daripada model yang berpusat pada US.”

— Efficient_Degree9569

“Model ini sangat menyukai hal-hal musik. Ia sangat, sangat cepat dan synthesizer audio yang dihasilkannya membuat saya benar-benar yakin.”

— Bjaman

youtube

“Gemini 3.5 Flash jelas mengungguli model Pro sebelumnya pada hal-hal yang berkaitan dengan coding, yang sangat besar bagi developer agentic.”

— DevGuru99

“Google baru saja merilis Gemini 3.5 Flash. Bagian yang menarik bukan hanya karena lebih cepat. Google memposisikan ini sebagai raja agentic.”

— TestingCatalog

twitter

“Gemini 3.5 Flash adalah model yang sangat kuat di kelasnya. Mengalahkan Gemini 3.1 Pro di banyak benchmark.”

— AI_Expert

twitter

Video Tentang Gemini 3.5 Flash

Tonton tutorial, ulasan, dan diskusi tentang Gemini 3.5 Flash

“Gemini 3.5 Flash telah dirilis oleh Google. Dan secara hipotetis ini adalah lompatan performa yang cukup besar.”

“Ini adalah yang terbaik yang pernah saya lihat. Bahkan jika tidak berhasil, model ini sangat menyukai hal-hal musik.”

“Saya perhatikan model ini sangat, sangat cepat dan tampaknya sangat menyukai musik.”

“Kemampuan reasoning untuk model sekecil dan secepat ini benar-benar mengesankan selama tes kode ini.”

“Model ini berhasil membuat lingkungan synth tiga dimensi yang berfungsi dari satu prompt tanpa kesalahan.”

“Gemini 3.5 Flash benar-benar mengejutkan saya. Tidak hanya sangat cepat tetapi juga menyelesaikan tugas dengan lebih baik daripada Opus.”

“Gemini 3.5 Flash menyelesaikan tugas ini dalam waktu kurang dari satu menit. Ini sungguh gila. Kecepatan Gemini 3.5 Plus luar biasa.”

“Gemini 3.5 Flash melakukannya hanya dengan $0,36, sedangkan Claude Opus melakukannya dengan harga hampir dua kali lipat.”

“Pemahaman multimodal di sini jelas setingkat lebih baik daripada versi Flash sebelumnya.”

“Anda mendapatkan kecerdasan setingkat flagship dengan sebagian kecil dari biaya token.”

“Ini adalah model yang diposisikan sebagai model coding agentic terkuat Google sejauh ini, di atas Gemini 3.1 Pro.”

“Lompatan kualitasnya sangat terasa. Tingkat halusinasi dilaporkan berkurang dari 91% menjadi 61% yang sangat luar biasa.”

“Gemini 3.5 Flash unggul karena harga dan kualitas seni SVG serta kemampuannya bekerja di 3JS.”

“Model ini secara native memproses video dan audio, memungkinkan ekstraksi data temporal yang jauh lebih akurat.”

“Mode berpikir baru membantu developer mengaudit dengan tepat bagaimana model merencanakan penggunaan tool-nya.”

Lebih dari sekadar prompt

Tingkatkan alur kerja Anda dengan Otomatisasi AI

Automatio menggabungkan kekuatan agen AI, otomatisasi web, dan integrasi cerdas untuk membantu Anda mencapai lebih banyak dalam waktu lebih singkat.

Agen AI

Otomasi Web

Alur Kerja Cerdas

Mulai Gratis

Tips Pro untuk Gemini 3.5 Flash

Tips ahli untuk memaksimalkan Gemini 3.5 Flash.

Aktifkan Thinking Mode

Aktifkan pengaturan berpikir di API atau Google AI Studio untuk mengaktifkan reasoning chain-of-thought tingkat lanjut untuk masalah teknik.

Manfaatkan Multimodalitas Native

Unggah file audio atau video mentah secara langsung untuk dianalisis guna menjaga data temporal dan tonal alih-alih menggunakan transkrip eksternal.

Tentukan Batasan Secara Mendetail

Model mengikuti batasan negatif dengan ketat. Gunakan instruksi seperti 'Tanpa penjelasan' untuk output kode mentah guna meminimalkan latency.

Terapkan Strategi High-Low

Gunakan Flash untuk tugas bervolume tinggi seperti draf UI dan gunakan model Pro hanya untuk verifikasi arsitektur final.

Testimoni

Apa Kata Pengguna Kami

Bergabunglah dengan ribuan pengguna puas yang telah mengubah alur kerja mereka

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Terkait AI Models

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context

$3.00/$15.00/1M

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context

$3.00/$15.00/1M

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context

$1.75/$14.00/1M

Kimi K2.7 Code

Moonshot

Kimi K2.7 Code is a 1T parameter MoE model from Moonshot AI. It features a 262k context window and 30% more efficient reasoning for software engineering.

262K context

$0.95/$4.00/1M

GLM-5.2

Zhipu (GLM)

GLM-5.2 is Zhipu AI's flagship open-weight model featuring a 1M context window and specialized agentic coding capabilities under an MIT license.

1M context

$1.40/$4.40/1M

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context

$0.40/$4.80/1M

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context

$2.50/$15.00/1M

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context

$0.60/$2.50/1M

Pertanyaan yang Sering Diajukan tentang Gemini 3.5 Flash

Temukan jawaban untuk pertanyaan umum tentang Gemini 3.5 Flash