Google vừa công bố Gemma 3n, mô hình trí tuệ nhân tạo mới nhất được thiết kế đặc biệt để hoạt động trơn tru trên điện thoại di động, máy tính xách tay và máy tính bảng. Sự kiện này diễn ra trong khuôn khổ hội nghị Google I/O 2025 hôm thứ Ba vừa qua, đánh dấu một bước tiến quan trọng trong việc đưa AI mạnh mẽ đến gần hơn với người dùng cá nhân.
Đặc điểm nổi bật của Gemma 3n
Gemma 3n sở hữu nhiều tính năng vượt trội so với các phiên bản trước đây:
- Đa phương tiện: Có khả năng xử lý văn bản, hình ảnh, âm thanh và video, mang đến trải nghiệm AI toàn diện
- Hiệu quả cao về bộ nhớ: Có thể hoạt động trên thiết bị với RAM dưới 2GB nhờ công nghệ Per-Layer Embeddings (PLE) tiên tiến
- Bảo mật cao: Xử lý dữ liệu trực tiếp trên thiết bị, không cần truyền thông tin về trung tâm dữ liệu đám mây
- Nâng cao khả năng đa ngôn ngữ: Cải thiện hiệu suất đặc biệt với tiếng Nhật, Đức, Hàn, Tây Ban Nha và Pháp
Theo Gus Martins, Quản lý Sản phẩm Gemma tại Google: “Gemma 3n chia sẻ cùng kiến trúc với Gemini Nano và được thiết kế để mang lại hiệu suất đáng kinh ngạc.”
Tương lai của AI trên thiết bị di động
Các mô hình AI hiệu quả đủ để chạy ngoại tuyến mà không cần điện toán đám mây đã ngày càng phổ biến trong cộng đồng AI những năm gần đây. Những mô hình này không chỉ tiết kiệm chi phí hơn so với các mô hình lớn, mà còn bảo vệ quyền riêng tư bằng cách loại bỏ nhu cầu truyền dữ liệu đến trung tâm dữ liệu từ xa.
Gemma 3n đặc biệt nổi bật nhờ khả năng phản hồi nhanh hơn khoảng 1,5 lần trên thiết bị di động với chất lượng tốt hơn đáng kể (so với Gemma 3 4B) và dấu chân bộ nhớ giảm đáng kể đạt được thông qua các đổi mới như Per Layer Embeddings, chia sẻ KVC và lượng tử hóa kích hoạt nâng cao.
Mở rộng hệ sinh thái Gemma
Ngoài Gemma 3n, Google còn phát hành MedGemma thông qua chương trình Health AI Developer Foundations và SignGemma – một họ mô hình mới được đào tạo để dịch ngôn ngữ ký hiệu thành văn bản ngôn ngữ nói, đặc biệt hiệu quả với Ngôn ngữ Ký hiệu Mỹ và tiếng Anh.
Gia đình mô hình Gemma của Google đã đạt được hơn 150 triệu lượt tải xuống và có hơn 70.000 biến thể trên nền tảng phát triển AI Hugging Face, chứng tỏ sự phổ biến ngày càng tăng của các mô hình AI mã nguồn mở.
Sẵn sàng sử dụng
Gemma 3n đã có sẵn ở bản xem trước từ ngày 21/5. Các nhà phát triển có thể truy cập và tích hợp mô hình này vào ứng dụng của họ thông qua Google AI Studio, Hugging Face, Ollama hoặc Kaggle.
Sự ra mắt của Gemma 3n đánh dấu một bước tiến quan trọng trong nỗ lực của Google nhằm đưa AI mạnh mẽ, hiệu quả và riêng tư đến với mọi thiết bị cá nhân, mở ra tiềm năng to lớn cho các ứng dụng AI mới trong tương lai.