Google vừa công bố loạt cập nhật đáng chú ý cho ứng dụng Gemini AI trong sự kiện Google I/O 2025, bao gồm tính năng video AI thời gian thực, công cụ Deep Research nâng cao và nhiều cải tiến quan trọng khác nhằm tăng cường khả năng của trợ lý AI này trong cuộc đua với các đối thủ như ChatGPT của OpenAI và Siri của Apple.
Video AI thời gian thực với Gemini Live
Kể từ hôm thứ Ba (20/5), Google đã bắt đầu triển khai tính năng chia sẻ camera và màn hình của Gemini Live đến tất cả người dùng iOS và Android. Được hỗ trợ bởi Project Astra, tính năng này cho phép người dùng trò chuyện bằng giọng nói theo thời gian thực với Gemini, đồng thời truyền video từ camera hoặc màn hình của điện thoại thông minh đến mô hình AI.
Ví dụ thực tế: khi đi bộ quanh một thành phố mới, người dùng có thể hướng điện thoại vào một tòa nhà và hỏi Gemini Live về kiến trúc hoặc lịch sử của nó, và nhận được câu trả lời với độ trễ rất thấp hoặc gần như không có.
Trong vài tuần tới, Google cho biết Gemini Live sẽ tích hợp sâu hơn với các ứng dụng khác của hãng. Theo công bố, Gemini Live sẽ sớm có khả năng cung cấp chỉ đường từ Google Maps, tạo sự kiện trong Google Calendar và lập danh sách việc cần làm với các ứng dụng khác trong hệ sinh thái Google.
Deep Research – Trợ lý nghiên cứu AI cá nhân
Tính năng Deep Research – vốn được giới thiệu lần đầu vào tháng 12 năm ngoái – giờ đây đã được nâng cấp với Gemini 2.5 Flash Thinking Experimental và mở rộng đến nhiều người dùng hơn. Deep Research hoạt động như một trợ lý nghiên cứu AI cá nhân, giúp người dùng tìm kiếm và tổng hợp thông tin từ khắp web chỉ trong vài phút, tiết kiệm hàng giờ nghiên cứu.
Phiên bản cập nhật mới nâng cao khả năng của Gemini trong tất cả các giai đoạn nghiên cứu – từ lập kế hoạch và tìm kiếm đến lập luận, phân tích và báo cáo – tạo ra các báo cáo đa trang chất lượng cao, chi tiết và sâu sắc hơn. Đặc biệt, Gemini giờ đây hiển thị quá trình suy nghĩ của nó trong khi duyệt web, cho người dùng cái nhìn theo thời gian thực về cách nó giải quyết nhiệm vụ nghiên cứu.
Bắt đầu từ hôm nay, người dùng có thể kết hợp dữ liệu công khai với các tệp PDF và hình ảnh riêng tư của mình để có được báo cáo Deep Research hoàn chỉnh và được cá nhân hóa. Điều này giúp người dùng có được sự hiểu biết toàn diện, kết hợp kiến thức riêng của họ với xu hướng rộng lớn hơn.
Mô hình AI mới và cải tiến hình ảnh/video
Google cũng đang cập nhật mô hình mặc định trong Gemini thành Gemini 2.5 Flash, hứa hẹn mang lại câu trả lời chất lượng cao hơn với độ trễ thấp hơn. Người dùng miễn phí của Gemini cũng sẽ nhận được mô hình hình ảnh AI cập nhật, Imagen 4, giúp tạo ra hình ảnh sống động với chi tiết chân thực và đầu ra văn bản và kiểu chữ tốt hơn.
Đối với người đăng ký gói mới Google AI Ultra (250 USD/tháng), họ sẽ được quyền truy cập vào mô hình video AI mới nhất của Google, Veo 3. Mô hình này nổi bật với khả năng tạo âm thanh tương ứng với cảnh video thông qua tính năng tạo âm thanh gốc – cho phép tạo ra không chỉ cảnh video mà còn cả âm thanh thành phố nhộn nhịp, tiếng xào xạc của lá cây hoặc thậm chí là đối thoại của nhân vật, tất cả chỉ từ các lệnh văn bản đơn giản.
Các gói dịch vụ mới và đối tượng người dùng
Google đã công bố hai gói đăng ký AI mới: Google AI Pro (đổi tên từ gói Gemini Advanced 20 USD/tháng) và Google AI Ultra, một gói cao cấp mới với giá 250 USD/tháng, cạnh tranh trực tiếp với ChatGPT Pro.
Gói Ultra cung cấp cho người dùng giới hạn tỷ lệ rất cao, quyền truy cập sớm vào các mô hình AI mới và quyền truy cập độc quyền vào một số tính năng nhất định như Veo 3 và Agent Mode sắp ra mắt. Ngoài ra, người đăng ký Pro và Ultra tại Hoa Kỳ sử dụng tiếng Anh trong Chrome sẽ được quyền truy cập Gemini trong trình duyệt Chrome.
Để phục vụ số lượng ngày càng tăng của sinh viên sử dụng chatbot AI, Google cho biết Gemini giờ đây sẽ tạo các bài kiểm tra được cá nhân hóa tập trung vào các lĩnh vực mà người dùng gặp khó khăn. Khi người dùng trả lời sai câu hỏi, Gemini sẽ giúp tạo các bài kiểm tra bổ sung và kế hoạch hành động để củng cố những lĩnh vực đó.
Tích hợp sâu hơn với các ứng dụng Google
Trong những tuần tới, Gemini Live sẽ tích hợp sâu hơn vào cuộc sống hàng ngày. Chẳng hạn, khi lên kế hoạch đi chơi với bạn bè, bạn có thể thảo luận chi tiết trong Gemini Live, và nó sẽ ngay lập tức tạo một sự kiện trong Google Calendar của bạn. Hoặc nếu bạn đang thèm bánh pizza, bạn có thể hỏi và nhận thông tin mới nhất từ Google Maps.
Google đang bắt đầu tích hợp Google Maps, Calendar, Tasks và Keep, với nhiều kết nối hệ sinh thái Google hơn nữa được lên kế hoạch. Người dùng luôn có thể quản lý các kết nối ứng dụng này và thông tin của họ bất kỳ lúc nào trong cài đặt của ứng dụng.
Với những cập nhật này, Google đang cố gắng cải thiện vị thế của mình trong cuộc đua AI đang diễn ra với các công ty công nghệ lớn khác. Theo thông báo tại Google I/O 2025, Gemini hiện có 400 triệu người dùng hoạt động hàng tháng, và công ty chắc chắn hy vọng sẽ mở rộng cơ sở người dùng đó với những cập nhật này.