Nhân dịp Ngày Nâng cao Nhận thức Hỗ trợ Tiếp cận Toàn cầu (Global Accessibility Awareness Day), Google vừa công bố hàng loạt tính năng mới tích hợp AI và cải thiện khả năng tiếp cận cho các sản phẩm Android và Chrome của mình. Những cập nhật này tập trung vào việc giúp người dùng khiếm thị và khiếm thính tương tác tốt hơn với thiết bị của họ.
Tính năng mới trên Android
Gemini tăng cường cho TalkBack
Google đã mở rộng tích hợp Gemini vào TalkBack, trình đọc màn hình của Android, vốn được giới thiệu từ năm ngoái. Với bản cập nhật mới, người dùng không chỉ nhận được mô tả về hình ảnh mà còn có thể đặt câu hỏi và nhận phản hồi về nội dung hình ảnh.
Ví dụ, khi một người bạn gửi ảnh cây đàn guitar mới, người dùng có thể nhận mô tả chi tiết và đặt câu hỏi tiếp theo về nhãn hiệu, màu sắc hoặc các chi tiết khác trong hình. Đặc biệt, người dùng còn có thể yêu cầu mô tả và đặt câu hỏi về toàn bộ màn hình điện thoại. Khi mua sắm trên ứng dụng, họ có thể hỏi Gemini về chất liệu của một sản phẩm hoặc liệu có khuyến mãi nào không.
Expressive Captions cải tiến
Tính năng Expressive Captions, vốn cung cấp phụ đề thời gian thực cho bất kỳ nội dung có âm thanh nào trên điện thoại, đã được nâng cấp với khả năng nhận biết cảm xúc tốt hơn. Google đã phát triển tính năng “duration” (kéo dài) mới cho Expressive Captions, giúp người dùng nhận biết khi người nói kéo dài âm thanh của từ, ví dụ như khi bình luận viên thể thao gọi một cú sút là “tuyệệệệt vờiiiii” thay vì chỉ là “tuyệt vời”.
Người dùng cũng sẽ nhận được nhiều nhãn âm thanh hơn, như khi ai đó huýt sáo hoặc tằng hắng. Phiên bản mới này đang được triển khai bằng tiếng Anh tại Mỹ, Anh, Canada và Australia cho các thiết bị chạy Android 15 trở lên.
Cải tiến trên Chrome
Nhận dạng ký tự quang học (OCR) cho PDF
Trước đây, khi mở một tệp PDF được quét trong trình duyệt Chrome trên máy tính, người dùng không thể sử dụng trình đọc màn hình để tương tác với nó. Giờ đây, với công nghệ Nhận dạng Ký tự Quang học (OCR), Chrome tự động nhận diện các loại PDF này, cho phép người dùng đánh dấu, sao chép và tìm kiếm văn bản như bất kỳ trang nào khác, đồng thời sử dụng trình đọc màn hình để đọc chúng.
Page Zoom trên Chrome dành cho Android
Tính năng Page Zoom giờ đây cho phép người dùng tăng kích thước văn bản trên Chrome dành cho Android mà không ảnh hưởng đến bố cục trang web – tương tự như cách nó hoạt động trên Chrome máy tính. Người dùng có thể tùy chỉnh mức độ phóng to và dễ dàng áp dụng tùy chọn cho tất cả các trang họ truy cập hoặc chỉ một số trang cụ thể.
Để bắt đầu sử dụng tính năng này, chỉ cần nhấn vào menu ba chấm ở góc trên bên phải của Chrome và thiết lập tùy chọn zoom.
Cải thiện công nghệ nhận dạng giọng nói
Từ năm 2019, Google đã ra mắt Project Euphonia để tìm cách làm cho công nghệ nhận dạng giọng nói dễ tiếp cận hơn cho những người có cách nói không chuẩn. Hiện nay, Google đang hỗ trợ các nhà phát triển và tổ chức trên toàn thế giới để mang công nghệ này đến nhiều ngôn ngữ và bối cảnh văn hóa hơn.
Google đã cung cấp các kho mã nguồn mở thông qua trang GitHub của Project Euphonia. Các nhà phát triển giờ đây có thể phát triển các công cụ âm thanh cá nhân hóa cho nghiên cứu hoặc đào tạo mô hình của họ cho các mẫu giọng nói đa dạng.
Công ty cũng hợp tác với Google.org để hỗ trợ Đại học College London trong việc thành lập Trung tâm Hòa nhập Ngôn ngữ Kỹ thuật số (CDLI). CDLI đang nỗ lực cải thiện công nghệ nhận dạng giọng nói cho người nói tiếng không phải tiếng Anh ở châu Phi bằng cách tạo ra các bộ dữ liệu mã nguồn mở bằng 10 ngôn ngữ châu Phi.
Mở rộng tùy chọn tiếp cận cho học sinh
Công cụ hỗ trợ tiếp cận đặc biệt hữu ích cho học sinh khuyết tật, từ việc sử dụng cử chỉ khuôn mặt để điều hướng Chromebook với Face Control đến tùy chỉnh trải nghiệm đọc với Reading Mode.
Hơn nữa, khi sử dụng Chromebook với ứng dụng kiểm tra Bluebook của College Board (nơi học sinh có thể làm bài thi SAT và hầu hết các kỳ thi Advanced Placement), người dùng sẽ có quyền truy cập vào tất cả các tính năng hỗ trợ tiếp cận tích hợp của Google. Điều này bao gồm trình đọc màn hình ChromeVox và Dictation, cùng với các công cụ kiểm tra kỹ thuật số của College Board.
Những cập nhật này tiếp tục thể hiện cam kết của Google trong việc làm cho công nghệ trở nên dễ tiếp cận hơn cho tất cả mọi người, đặc biệt là những người có nhu cầu đặc biệt. Với hơn 2 tỷ người sử dụng Chrome mỗi ngày, những cải tiến này sẽ tạo ra tác động tích cực đáng kể đối với trải nghiệm người dùng toàn cầu.