google

Gemini 3.5 Flash

Gemini 3.5 Flash là model multimodal tốc độ cao của Google với context window 1M, được tối ưu hóa cho các vòng lặp agentic dưới một giây và các tác vụ lập...

Multimodal AIAgentic Workflows1M ContextHigh-Speed LLM
google logogoogleGemini19 tháng 5, 2026
Ngu canh
1.0Mtoken
Dau ra toi da
66Ktoken
Gia dau vao
$1.50/ 1M
Gia dau ra
$9.00/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
74%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Gemini 3.5 Flash dat 74% trong benchmark nay.
HLE
34%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Gemini 3.5 Flash dat 34% trong benchmark nay.
MMLU
89%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Gemini 3.5 Flash dat 89% trong benchmark nay.
MMLU Pro
83%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Gemini 3.5 Flash dat 83% trong benchmark nay.
SimpleQA
76.7%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Gemini 3.5 Flash dat 76.7% trong benchmark nay.
IFEval
88%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Gemini 3.5 Flash dat 88% trong benchmark nay.
AIME 2025
68%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Gemini 3.5 Flash dat 68% trong benchmark nay.
MATH
88%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Gemini 3.5 Flash dat 88% trong benchmark nay.
GSM8k
97%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Gemini 3.5 Flash dat 97% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Gemini 3.5 Flash dat 92% trong benchmark nay.
MathVista
74%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Gemini 3.5 Flash dat 74% trong benchmark nay.
SWE-Bench
55.1%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Gemini 3.5 Flash dat 55.1% trong benchmark nay.
HumanEval
92%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Gemini 3.5 Flash dat 92% trong benchmark nay.
LiveCodeBench
56%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Gemini 3.5 Flash dat 56% trong benchmark nay.
MMMU
84%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Gemini 3.5 Flash dat 84% trong benchmark nay.
MMMU Pro
88.3%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Gemini 3.5 Flash dat 88.3% trong benchmark nay.
ChartQA
89%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Gemini 3.5 Flash dat 89% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Gemini 3.5 Flash dat 94% trong benchmark nay.
Terminal-Bench
76.2%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Gemini 3.5 Flash dat 76.2% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Gemini 3.5 Flash dat 12% trong benchmark nay.

Ve Gemini 3.5 Flash

Tim hieu ve kha nang cua Gemini 3.5 Flash, tinh nang va cach no co the giup ban dat ket qua tot hon.

Hiệu suất Agentic hiệu quả cao

Gemini 3.5 Flash là một model multimodal được thiết kế cho tốc độ và khả năng suy luận phức tạp. Nó hỗ trợ context window 1 triệu token, cho phép người dùng xử lý các tập dữ liệu khổng lồ bao gồm video dài một giờ và toàn bộ kho mã nguồn trong một prompt duy nhất. Kiến trúc được tối ưu hóa cho latency dưới một giây, nhắm đến các nhà phát triển xây dựng các AI agent tương tác và quy trình làm việc tự động.

Multimodality nguyên bản và Reasoning

Model này giới thiệu Thinking mode cho logic chain-of-thought nâng cao. Nó xử lý trực tiếp văn bản, hình ảnh, âm thanh, video và PDF, loại bỏ nhu cầu về các quy trình tiền xử lý riêng biệt. Các benchmark cho thấy nó vượt trội hơn Gemini 3.1 Pro trước đây trong các tác vụ lập trình và sử dụng công cụ trong khi vẫn duy trì hiệu quả của phân khúc Flash.

Khả năng mở rộng sẵn sàng cho sản xuất

Với mức giá 1,50 đô la cho mỗi triệu input token, nó cung cấp một lộ trình hiệu quả về chi phí cho các ứng dụng khối lượng lớn. Model này được điều chỉnh đặc biệt cho các tác vụ gọi hàm và terminal, đạt điểm cao trên các benchmark agentic như SWE-bench và Terminal-Bench. Điều này biến nó thành lựa chọn ưu tiên cho các trợ lý lập trình thời gian thực và hệ thống quản lý dữ liệu.

Gemini 3.5 Flash

Truong hop su dung cho Gemini 3.5 Flash

Kham pha cac cach khac nhau ban co the su dung Gemini 3.5 Flash de dat ket qua tuyet voi.

Quản trị tòa soạn tự động

Quét hàng nghìn nguồn cấp RSS và các luồng xã hội để chấm điểm và xếp hạng tin tức dựa trên hồ sơ biên tập cụ thể trong thời gian thực.

Phân tích tài liệu khối lượng lớn

Xử lý các kho lưu trữ khổng lồ như lịch sử các vụ án pháp lý để trích xuất các bản tóm tắt có cấu trúc và thông tin chi tiết có thể hành động mà không làm mất context.

Tổng hợp âm nhạc thời gian thực

Tạo ra các công cụ âm thanh và giao diện âm nhạc tương tác bằng cách sử dụng khả năng hiểu biết tự nhiên về lý thuyết âm nhạc và dạng sóng âm thanh.

Tạo hệ điều hành trình duyệt tương tác

Tạo các mô phỏng hệ điều hành và bảng điều khiển UI phức tạp từ các prompt ngôn ngữ tự nhiên.

Tái cấu trúc mã nguồn nhanh chóng

Thực hiện cập nhật logic trên các codebase lớn mà không tiêu tốn nhiều credit như các flagship model.

Tự động hóa Terminal bằng Agentic

Thực hiện các tác vụ hệ thống nhiều bước và các lần lặp lại mã nguồn bằng cách sử dụng công cụ hỗ trợ terminal để điều phối môi trường phát triển.

Diem manh

Han che

Context 1M Token khổng lồ: Hỗ trợ phân tích chuyên sâu dữ liệu dài, bao gồm video toàn thời lượng và toàn bộ kho lưu trữ phần mềm.
Giá tăng: Chi phí token đã tăng gấp ba lần so với các model Flash preview trước đó, lên mức 1,50 đô la cho input và 9 đô la cho output trên mỗi triệu tokens.
Logic tổng hợp đặc biệt: Hiệu suất dẫn đầu trong việc tạo ra các công cụ âm thanh tương tác phức tạp và các mô phỏng hệ điều hành hiện đại trên trình duyệt.
Không chính xác trong toán học: Đôi khi gặp khó khăn với các phép toán cơ bản, thất bại trước các prompt đơn giản mà các model chuyên về reasoning có thể giải quyết dễ dàng.
Latency dưới một giây: Được tối ưu hóa cho thông lượng (throughput) cực cao, đạt tốc độ output lên tới 1500 tokens mỗi giây trong môi trường sản xuất.
Suy giảm Context Window: Người dùng báo cáo rằng độ tin cậy khi truy xuất (retrieval) có thể giảm nhẹ khi context window tiến gần đến giới hạn 1 triệu token.
Hiệu suất Agentic vượt trội: Vượt qua nhiều flagship model lớn hơn trên các tác vụ lập trình thực tế và các benchmark agentic dựa trên terminal.
Sự không nhất quán về ánh sáng 3D: Có thể tạo ra các môi trường quá tối hoặc ánh sáng kém trong các mô phỏng 3D phức tạp, đòi hỏi phải prompt lặp lại để sửa lỗi.

Bat dau nhanh API

google/gemini-3.5-flash

Xem tai lieu
google SDK
import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = client.getGenerativeModel({ 
  model: "gemini-3.5-flash",
  generationConfig: { maxOutputTokens: 65536 }
});

async function run() {
  const prompt = "Build a fully interactive 3D synthwave landscape using Three.js.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

run();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Gemini 3.5 Flash

Xem cong dong nghi gi ve Gemini 3.5 Flash

Gemini 3.5 Flash là người dẫn đầu rõ ràng trên đường biên Pareto giữa Trí thông minh so với Tốc độ và đạt được những bước tiến lớn trong các tác vụ agentic thực tế.
Artificial Analysis
twitter
Gemini 3 rất xuất sắc cho việc kinh doanh tại Anh. Nó nắm bắt được mức độ lịch sự tinh tế và các giả định về thuế cụ thể của Vương quốc Anh tốt hơn các model tập trung vào thị trường Mỹ.
Efficient_Degree9569
reddit
Model này giống như rất yêu thích các nội dung về âm nhạc. Nó rất, rất nhanh và bộ tổng hợp âm thanh mà nó tạo ra đã hoàn toàn thuyết phục tôi.
Bjaman
youtube
Gemini 3.5 Flash chắc chắn đang vượt qua model Pro trước đó trong các tác vụ liên quan đến lập trình, điều này rất lớn lao đối với các nhà phát triển agentic.
DevGuru99
reddit
Google vừa phát hành Gemini 3.5 Flash. Phần thú vị không chỉ là nó nhanh hơn. Google đang định vị đây là ông vua agentic.
TestingCatalog
twitter
Gemini 3.5 Flash là một model siêu mạnh trong phân khúc của nó. Đánh bại Gemini 3.1 Pro trên rất nhiều benchmark.
AI_Expert
twitter

Video ve Gemini 3.5 Flash

Xem huong dan, danh gia va thao luan ve Gemini 3.5 Flash

Gemini 3.5 Flash đã được Google ra mắt. Và đây được cho là một bước nhảy vọt đáng kể về hiệu suất.

Đây là model tốt nhất mà tôi từng thấy, chấm hết. Ngay cả khi nó không hoạt động hoàn hảo, model này dường như rất yêu thích các nội dung về âm nhạc.

Tôi nhận thấy nó rất, rất nhanh và thực sự dường như rất thích âm nhạc.

Khả năng reasoning cho một model nhỏ và nhanh như vậy thực sự ấn tượng trong các bài kiểm tra lập trình này.

Nó đã tạo ra được một môi trường 3D synthwave hoạt động tốt từ một prompt duy nhất mà không có lỗi.

Gemini 3.5 Flash hoàn toàn làm tôi sốc. Nó không chỉ nhanh đến điên rồ mà còn hoàn thành tác vụ tốt hơn cả Opus.

Gemini 3.5 Flash hoàn thành tác vụ này trong vòng một phút. Điều này thực sự điên rồ. Tốc độ của Gemini 3.5 Flash thật đáng kinh ngạc.

Gemini 3.5 Flash chỉ tốn 0,36 đô la, trong khi Claude Opus tốn gần gấp đôi giá đó.

Khả năng hiểu đa phương thức (multimodal) ở đây rõ ràng là một bước tiến so với phiên bản Flash trước.

Bạn đang nhận được trí thông minh gần như flagship với chi phí chỉ bằng một phần nhỏ.

Đây là model được định vị là model lập trình dạng agentic mạnh nhất của Google cho đến nay, vượt trên cả Gemini 3.1 Pro.

Bước nhảy vọt về chất lượng là rất rõ ràng. Tỷ lệ ảo giác (hallucination) được cho là đã giảm từ 91% xuống còn 61%, điều này rất đáng chú ý.

Gemini 3.5 Flash xuất sắc rõ ràng nhờ vào giá cả và chất lượng tạo SVG cũng như làm việc với 3JS.

Nó xử lý trực tiếp video và âm thanh, cho phép trích xuất dữ liệu thời gian chính xác hơn nhiều.

Chế độ thinking mới giúp các nhà phát triển kiểm tra chính xác cách model lập kế hoạch sử dụng công cụ của nó.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Gemini 3.5 Flash

Meo chuyen gia giup ban tan dung toi da Gemini 3.5 Flash va dat ket qua tot hon.

Bật Thinking Mode

Bật cài đặt thinking trong API hoặc Google AI Studio để kích hoạt khả năng reasoning dạng chain-of-thought nâng cao cho các bài toán kỹ thuật.

Tận dụng tính năng Multimodal nguyên bản

Tải trực tiếp các tệp âm thanh hoặc video thô để phân tích nhằm bảo toàn dữ liệu thời gian và âm sắc thay vì sử dụng các bản ghi (transcript) bên ngoài.

Chỉ định các ràng buộc một cách chính xác

Model tuân thủ nghiêm ngặt các ràng buộc phủ định. Hãy sử dụng các chỉ dẫn như 'No explanations' (Không giải thích) cho output mã nguồn thô để giảm thiểu latency.

Áp dụng chiến lược High-Low

Sử dụng Flash cho các tác vụ khối lượng lớn như soạn thảo UI và chỉ sử dụng các model Pro cho bước xác minh kiến trúc cuối cùng.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M

Cau hoi thuong gap ve Gemini 3.5 Flash

Tim cau tra loi cho cac cau hoi thuong gap ve Gemini 3.5 Flash

Gemini 3.5 Flash: 1M Context & Latency dưới một giây