Thứ 6, 19/12/2025, 18:07 PM
Bạn đọc đăng tin
Hotline: 0918658465

Google ra mắt Gemini 3 Flash, mô hình AI cấp Pro siêu tốc

Google ra mắt Gemini 3 Flash, mô hình AI cấp Pro siêu tốc
(Tieudung.vn) - Google vừa giới thiệu Gemini 3 Flash, mô hình mới trong dòng Gemini 3, được thiết kế để mang lại năng lực AI “frontier” nhưng với tốc độ phản hồi cực nhanh và chi phí vận hành thấp hơn đáng kể, hướng tới cả người dùng phổ thông lẫn doanh nghiệp.

Gemini 3 Flash là thành viên trong gia đình mô hình ngôn ngữ lớn (LLM) Gemini 3 của Google, kết hợp trí tuệ cấp độ chuyên gia với tốc độ xử lý nhanh gấp 3 lần bản tiền nhiệm. Sản phẩm nổi bật nhờ khả năng lập trình xuất sắc, phân tích đa phương thức mượt mà với mức chi phí rẻ.

Gemini 3 Flash được Google định vị là sự kết hợp giữa năng lực suy luận “cấp Pro” của Gemini 3 với độ trễ thấp kiểu Flash, cho phép xử lý tốt cả tác vụ thường ngày lẫn các quy trình agentic phức tạp. Mô hình hỗ trợ đầy đủ đa phương thức (văn bản, hình ảnh, video, audio) và được tối ưu cho các tình huống cần phản hồi nhanh, lặp thử nghiệm nhiều vòng và triển khai ở quy mô lớn với chi phí hợp lý.

Google ra mắt Gemini 3 Flash, mô hình AI cấp Pro siêu tốc

Ảnh minh họa. (Nguồn ảnh: Internet)

Trên các bài kiểm tra, Gemini 3 Flash đạt 90.4% trên GPQA Diamond và 33.7% trên Humanity’s Last Exam (không dùng công cụ), vượt Gemini 2.5 Pro và tiến rất sát Gemini 3 Pro trên MMMU Pro với 81.2%. Google cho biết mô hình này cải thiện ranh giới tối ưu giữa chất lượng, chi phí và tốc độ. Trong workload thực tế, Gemini 3 Flash dùng ít hơn khoảng 30% token so với 2.5 Pro, nhanh hơn tới 3 lần và chi phí rẻ hơn đáng kể.

Về giá, Gemini 3 Flash được công bố với mức 0.50 USD cho mỗi 1 triệu token đầu vào, 3 USD cho mỗi 1 triệu token đầu ra và 1 USD cho mỗi 1 triệu token đầu vào audio, cho phép doanh nghiệp triển khai AI ở quy mô lớn mà vẫn kiểm soát tốt ngân sách. Nhờ đó, Google hướng Gemini 3 Flash trở thành lựa chọn là mô hình chủ lực cho đa số tác vụ sản xuất thay vì chỉ dùng cho thử nghiệm.

Gemini 3 Flash được tối ưu mạnh cho các workflow phát triển phần mềm, tác vụ coding và hệ thống agentic nhiều bước. Trên benchmark SWE-bench Verified, mô hình đạt 78%, vượt các dòng Gemini 2.5 và cả Gemini 3 Pro, cho thấy khả năng hiểu, sửa lỗi và sinh mã trong những tình huống phức tạp ở mức cao.

Google định hướng Gemini 3 Flash cho các use case như: phân tích video, trích xuất dữ liệu có cấu trúc, hỏi đáp trên nội dung hình ảnh, trợ lý trong game, A/B testing thông minh gần thời gian thực hay cơ chế điều phối agent AI phức tạp trong doanh nghiệp. Với độ trễ thấp, nhà phát triển có thể lặp mẫu nhanh, thử nhiều agent chain và đưa vào sản xuất mà không đánh đổi quá nhiều về chất lượng so với các mô hình lớn hơn.

Gemini 3 Flash trở thành mô hình mặc định trong ứng dụng Gemini, thay thế Gemini 2.5 Flash, nghĩa là người dùng trên toàn cầu được nâng cấp lên mô hình thế hệ mới mà không cần trả thêm phí. Nhờ năng lực đa phương thức, người dùng có thể gửi video, hình ảnh hoặc mô tả bằng giọng nói để Gemini phân tích, tóm tắt, đề xuất kế hoạch hành động hoặc chuyển ý tưởng thành nội dung và công cụ cụ thể.

Google nhấn mạnh các tình huống như: người dùng quay lại một buổi hội thảo, nhờ Gemini trích xuất insight và lập kế hoạch, hoặc mô tả ý tưởng ứng dụng bằng lời nói để mô hình tự động thiết kế, sinh mã và tạo ra một ứng dụng hoạt động trong vài phút mà không đòi hỏi kỹ năng lập trình.

Trên Search, Gemini 3 Flash sẽ trở thành mô hình mặc định cho AI Mode, cho phép hệ thống xử lý truy vấn phức tạp với nhiều ràng buộc, nguồn dữ liệu thời gian thực, bối cảnh địa phương và trả về câu trả lời có cấu trúc, dễ hành động kèm liên kết tham khảo. Điều này giúp người dùng nhận được kết quả tổng hợp sâu hơn, thay vì chỉ là danh sách đường dẫn truyền thống.

Ở mảng doanh nghiệp, Gemini 3 Flash được cung cấp thông qua các nền tảng như Vertex AI, Gemini for Workspace/Enterprise, Google AI Studio, Google Antigravity, Gemini CLI và Android Studio, cho phép tích hợp vào ứng dụng nội bộ, sản phẩm khách hàng, quy trình phân tích dữ liệu và công cụ phát triển phần mềm. Google cho biết nhiều khách hàng như JetBrains, Bridgewater Associates, Figma… đã sử dụng Gemini 3 Flash để tăng tốc workflow nhờ sự cân bằng giữa hiệu năng suy luận, tốc độ và chi phí.

Sự kiện Gemini 3 Flash ra mắt đánh dấu sự chuyển dịch quan trọng của Google khi biến các mô hình AI cấp Pro trở nên bình dân hóa về chi phí và tốc độ. Điều này không chỉ cải thiện trải nghiệm tra cứu, làm việc hàng ngày của người dùng mà còn mở ra cơ hội lớn cho các nhà phát triển sáng tạo nên những ứng dụng AI phức tạp.

Tags:
4.1 27 5 Nhấn vào đây để đánh giá
Tin liên quan

Chuyên trang Tiêu dùng - Báo Kinh tế & Đô thị điện tử, Cơ quan của UBND TP. Hà Nội
Giấy phép số: 27/GP-CBC do Bộ Thông tin & Truyền thông cấp ngày 17/05/2022
Tổng Biên tập: Nguyễn Thành Lợi

() Không sao chép dưới mọi hình thức khi chưa có sự đồng ý bằng văn bản của Tieudung.kinhtedothi.vn

Share facebook Share google Share twitter Share linkedin Share pinterest
2.15475 sec| 790.438 kb