Gemini 3.5 Flash có giá bao nhiêu cho các nhà phát triển?

Model này có giá 1,50 đô la cho mỗi 1 triệu input tokens và 9,00 đô la cho mỗi 1 triệu output tokens. Google cung cấp mức chiết khấu 90% cho các input tokens được lưu trữ (cached), giúp việc thực hiện các truy vấn lặp lại trở nên cực kỳ tiết kiệm.

Context window của model này là bao nhiêu?

Gemini 3.5 Flash hỗ trợ context window lên tới 1.048.576 tokens. Điều này cho phép người dùng nhập khoảng 700.000 từ hoặc nhiều giờ nội dung video trong một yêu cầu duy nhất.

Model này có thể xử lý trực tiếp các tệp video và âm thanh không?

Có, nó hỗ trợ đầu vào trực tiếp cho các tệp video, âm thanh, hình ảnh và PDF. Model phân tích các luồng dữ liệu này một cách nguyên bản (natively) để duy trì bối cảnh không gian và thời gian trong quá trình reasoning.

Nó so sánh với Gemini 3.1 Pro như thế nào?

Gemini 3.5 Flash vượt trội hơn model 3.1 Pro trên nhiều benchmark về agentic và lập trình. Nó tạo ra output tokens nhanh hơn khoảng bốn lần trong khi vẫn duy trì logic ưu việt.

Gemini 3.5 Flash có hỗ trợ function calling không?

Có, nó được tối ưu hóa cao cho việc sử dụng công cụ (tool use) và gọi hàm (function calling). Model có thể tương tác với các API bên ngoài, IDE và môi trường terminal cho các quy trình làm việc nhiều bước.

Giới hạn output token tối đa là bao nhiêu?

Model có thể tạo ra tối đa 65.536 tokens trong một phản hồi duy nhất. Dung lượng này đủ để tạo ra các ứng dụng hoàn chỉnh hoặc các báo cáo kỹ thuật chuyên sâu.

Có chế độ reasoning hoặc thinking mode khả dụng không?

Có, model có tính năng chế độ suy nghĩ (thinking mode) dạng chain-of-thought có thể bật/tắt. Điều này cho phép các nhà phát triển kiểm tra quy trình lập kế hoạch nội bộ của model.

Gemini 3.5 Flash

Gemini 3.5 Flash là model multimodal tốc độ cao của Google với context window 1M, được tối ưu hóa cho các vòng lặp agentic dưới một giây và các tác vụ lập...

Multimodal AIAgentic Workflows1M ContextHigh-Speed LLM

googleGemini19 tháng 5, 2026

Ngu canh

1.0Mtoken

Dau ra toi da

66Ktoken

Gia dau vao

$1.50/ 1M

Gia dau ra

$9.00/ 1M

Phuong thuc:TextImageAudioVideo

Kha nang:Thi giacCong cuTruyen truc tiepSuy luan

Diem chuan

GPQA

74%

HLE

34%

MMLU

89%

MMLU Pro

83%

SimpleQA

76.7%

IFEval

88%

AIME 2025

68%

MATH

88%

GSM8k

97%

MGSM

92%

MathVista

74%

SWE-Bench

55.1%

HumanEval

92%

LiveCodeBench

56%

MMMU

84%

MMMU Pro

88.3%

ChartQA

89%

DocVQA

94%

Terminal-Bench

76.2%

ARC-AGI

12%

Xem tai lieu API

Ve Gemini 3.5 Flash

Tim hieu ve kha nang cua Gemini 3.5 Flash, tinh nang va cach no co the giup ban dat ket qua tot hon.

Hiệu suất Agentic hiệu quả cao

Gemini 3.5 Flash là một model multimodal được thiết kế cho tốc độ và khả năng suy luận phức tạp. Nó hỗ trợ context window 1 triệu token, cho phép người dùng xử lý các tập dữ liệu khổng lồ bao gồm video dài một giờ và toàn bộ kho mã nguồn trong một prompt duy nhất. Kiến trúc được tối ưu hóa cho latency dưới một giây, nhắm đến các nhà phát triển xây dựng các AI agent tương tác và quy trình làm việc tự động.

Multimodality nguyên bản và Reasoning

Model này giới thiệu Thinking mode cho logic chain-of-thought nâng cao. Nó xử lý trực tiếp văn bản, hình ảnh, âm thanh, video và PDF, loại bỏ nhu cầu về các quy trình tiền xử lý riêng biệt. Các benchmark cho thấy nó vượt trội hơn Gemini 3.1 Pro trước đây trong các tác vụ lập trình và sử dụng công cụ trong khi vẫn duy trì hiệu quả của phân khúc Flash.

Khả năng mở rộng sẵn sàng cho sản xuất

Với mức giá 1,50 đô la cho mỗi triệu input token, nó cung cấp một lộ trình hiệu quả về chi phí cho các ứng dụng khối lượng lớn. Model này được điều chỉnh đặc biệt cho các tác vụ gọi hàm và terminal, đạt điểm cao trên các benchmark agentic như SWE-bench và Terminal-Bench. Điều này biến nó thành lựa chọn ưu tiên cho các trợ lý lập trình thời gian thực và hệ thống quản lý dữ liệu.

Truong hop su dung cho Gemini 3.5 Flash

Kham pha cac cach khac nhau ban co the su dung Gemini 3.5 Flash de dat ket qua tuyet voi.

Quản trị tòa soạn tự động

Quét hàng nghìn nguồn cấp RSS và các luồng xã hội để chấm điểm và xếp hạng tin tức dựa trên hồ sơ biên tập cụ thể trong thời gian thực.

Phân tích tài liệu khối lượng lớn

Xử lý các kho lưu trữ khổng lồ như lịch sử các vụ án pháp lý để trích xuất các bản tóm tắt có cấu trúc và thông tin chi tiết có thể hành động mà không làm mất context.

Tổng hợp âm nhạc thời gian thực

Tạo ra các công cụ âm thanh và giao diện âm nhạc tương tác bằng cách sử dụng khả năng hiểu biết tự nhiên về lý thuyết âm nhạc và dạng sóng âm thanh.

Tạo hệ điều hành trình duyệt tương tác

Tạo các mô phỏng hệ điều hành và bảng điều khiển UI phức tạp từ các prompt ngôn ngữ tự nhiên.

Tái cấu trúc mã nguồn nhanh chóng

Thực hiện cập nhật logic trên các codebase lớn mà không tiêu tốn nhiều credit như các flagship model.

Tự động hóa Terminal bằng Agentic

Thực hiện các tác vụ hệ thống nhiều bước và các lần lặp lại mã nguồn bằng cách sử dụng công cụ hỗ trợ terminal để điều phối môi trường phát triển.

Diem manh

Han che

Context 1M Token khổng lồ: Hỗ trợ phân tích chuyên sâu dữ liệu dài, bao gồm video toàn thời lượng và toàn bộ kho lưu trữ phần mềm.

Giá tăng: Chi phí token đã tăng gấp ba lần so với các model Flash preview trước đó, lên mức 1,50 đô la cho input và 9 đô la cho output trên mỗi triệu tokens.

Logic tổng hợp đặc biệt: Hiệu suất dẫn đầu trong việc tạo ra các công cụ âm thanh tương tác phức tạp và các mô phỏng hệ điều hành hiện đại trên trình duyệt.

Không chính xác trong toán học: Đôi khi gặp khó khăn với các phép toán cơ bản, thất bại trước các prompt đơn giản mà các model chuyên về reasoning có thể giải quyết dễ dàng.

Latency dưới một giây: Được tối ưu hóa cho thông lượng (throughput) cực cao, đạt tốc độ output lên tới 1500 tokens mỗi giây trong môi trường sản xuất.

Suy giảm Context Window: Người dùng báo cáo rằng độ tin cậy khi truy xuất (retrieval) có thể giảm nhẹ khi context window tiến gần đến giới hạn 1 triệu token.

Hiệu suất Agentic vượt trội: Vượt qua nhiều flagship model lớn hơn trên các tác vụ lập trình thực tế và các benchmark agentic dựa trên terminal.

Sự không nhất quán về ánh sáng 3D: Có thể tạo ra các môi trường quá tối hoặc ánh sáng kém trong các mô phỏng 3D phức tạp, đòi hỏi phải prompt lặp lại để sửa lỗi.

Bat dau nhanh API

google/gemini-3.5-flash

Xem tai lieu

google SDK

import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = client.getGenerativeModel({ 
  model: "gemini-3.5-flash",
  generationConfig: { maxOutputTokens: 65536 }
});

async function run() {
  const prompt = "Build a fully interactive 3D synthwave landscape using Three.js.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

run();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Gemini 3.5 Flash

Xem cong dong nghi gi ve Gemini 3.5 Flash

“Gemini 3.5 Flash là người dẫn đầu rõ ràng trên đường biên Pareto giữa Trí thông minh so với Tốc độ và đạt được những bước tiến lớn trong các tác vụ agentic thực tế.”

— Artificial Analysis

twitter

“Gemini 3 rất xuất sắc cho việc kinh doanh tại Anh. Nó nắm bắt được mức độ lịch sự tinh tế và các giả định về thuế cụ thể của Vương quốc Anh tốt hơn các model tập trung vào thị trường Mỹ.”

— Efficient_Degree9569

“Model này giống như rất yêu thích các nội dung về âm nhạc. Nó rất, rất nhanh và bộ tổng hợp âm thanh mà nó tạo ra đã hoàn toàn thuyết phục tôi.”

— Bjaman

youtube

“Gemini 3.5 Flash chắc chắn đang vượt qua model Pro trước đó trong các tác vụ liên quan đến lập trình, điều này rất lớn lao đối với các nhà phát triển agentic.”

— DevGuru99

“Google vừa phát hành Gemini 3.5 Flash. Phần thú vị không chỉ là nó nhanh hơn. Google đang định vị đây là ông vua agentic.”

— TestingCatalog

twitter

“Gemini 3.5 Flash là một model siêu mạnh trong phân khúc của nó. Đánh bại Gemini 3.1 Pro trên rất nhiều benchmark.”

— AI_Expert

twitter

Video ve Gemini 3.5 Flash

Xem huong dan, danh gia va thao luan ve Gemini 3.5 Flash

“Gemini 3.5 Flash đã được Google ra mắt. Và đây được cho là một bước nhảy vọt đáng kể về hiệu suất.”

“Đây là model tốt nhất mà tôi từng thấy, chấm hết. Ngay cả khi nó không hoạt động hoàn hảo, model này dường như rất yêu thích các nội dung về âm nhạc.”

“Tôi nhận thấy nó rất, rất nhanh và thực sự dường như rất thích âm nhạc.”

“Khả năng reasoning cho một model nhỏ và nhanh như vậy thực sự ấn tượng trong các bài kiểm tra lập trình này.”

“Nó đã tạo ra được một môi trường 3D synthwave hoạt động tốt từ một prompt duy nhất mà không có lỗi.”

“Gemini 3.5 Flash hoàn toàn làm tôi sốc. Nó không chỉ nhanh đến điên rồ mà còn hoàn thành tác vụ tốt hơn cả Opus.”

“Gemini 3.5 Flash hoàn thành tác vụ này trong vòng một phút. Điều này thực sự điên rồ. Tốc độ của Gemini 3.5 Flash thật đáng kinh ngạc.”

“Gemini 3.5 Flash chỉ tốn 0,36 đô la, trong khi Claude Opus tốn gần gấp đôi giá đó.”

“Khả năng hiểu đa phương thức (multimodal) ở đây rõ ràng là một bước tiến so với phiên bản Flash trước.”

“Bạn đang nhận được trí thông minh gần như flagship với chi phí chỉ bằng một phần nhỏ.”

“Đây là model được định vị là model lập trình dạng agentic mạnh nhất của Google cho đến nay, vượt trên cả Gemini 3.1 Pro.”

“Bước nhảy vọt về chất lượng là rất rõ ràng. Tỷ lệ ảo giác (hallucination) được cho là đã giảm từ 91% xuống còn 61%, điều này rất đáng chú ý.”

“Gemini 3.5 Flash xuất sắc rõ ràng nhờ vào giá cả và chất lượng tạo SVG cũng như làm việc với 3JS.”

“Nó xử lý trực tiếp video và âm thanh, cho phép trích xuất dữ liệu thời gian chính xác hơn nhiều.”

“Chế độ thinking mới giúp các nhà phát triển kiểm tra chính xác cách model lập kế hoạch sử dụng công cụ của nó.”

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent

Tu dong hoa web

Quy trinh thong minh

Bat dau mien phi

Meo chuyen nghiep cho Gemini 3.5 Flash

Meo chuyen gia giup ban tan dung toi da Gemini 3.5 Flash va dat ket qua tot hon.

Bật Thinking Mode

Bật cài đặt thinking trong API hoặc Google AI Studio để kích hoạt khả năng reasoning dạng chain-of-thought nâng cao cho các bài toán kỹ thuật.

Tận dụng tính năng Multimodal nguyên bản

Tải trực tiếp các tệp âm thanh hoặc video thô để phân tích nhằm bảo toàn dữ liệu thời gian và âm sắc thay vì sử dụng các bản ghi (transcript) bên ngoài.

Chỉ định các ràng buộc một cách chính xác

Model tuân thủ nghiêm ngặt các ràng buộc phủ định. Hãy sử dụng các chỉ dẫn như 'No explanations' (Không giải thích) cho output mã nguồn thô để giảm thiểu latency.

Áp dụng chiến lược High-Low

Sử dụng Flash cho các tác vụ khối lượng lớn như soạn thảo UI và chỉ sử dụng các model Pro cho bước xác minh kiến trúc cuối cùng.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context

$3.00/$15.00/1M

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context

$3.00/$15.00/1M

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context

$1.75/$14.00/1M

Kimi K2.7 Code

Moonshot

Kimi K2.7 Code is a 1T parameter MoE model from Moonshot AI. It features a 262k context window and 30% more efficient reasoning for software engineering.

262K context

$0.95/$4.00/1M

GLM-5.2

Zhipu (GLM)

GLM-5.2 is Zhipu AI's flagship open-weight model featuring a 1M context window and specialized agentic coding capabilities under an MIT license.

1M context

$1.40/$4.40/1M

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context

$0.40/$4.80/1M

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context

$2.50/$15.00/1M

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context

$0.60/$2.50/1M

Cau hoi thuong gap ve Gemini 3.5 Flash

Tim cau tra loi cho cac cau hoi thuong gap ve Gemini 3.5 Flash