Tại cuộc thi Tech4Good, do Huawei tổ chức trong năm 2021, nhóm VN01 được vinh danh ở vị trí thứ hai trên tổng số 390 đội thi toàn cầu. Nhóm có bốn thành viên, là sinh viên của Học viện Công nghệ Bưu chính Viễn thông, Đại học Công nghệ Swinburne, Đại học Bách khoa Đà Nẵng và Đại học Công nghệ, Đại học Quốc gia Hà Nội.
Bằng cách sử dụng AI trong nhận diện cử chỉ và giọng nói, ứng dụng Earlie của nhóm giúp người khiếm thính giao tiếp dễ dàng hơn thông qua smartphone. Ứng dụng sẽ sử dụng camera để nhận diện ngôn ngữ ký hiệu và chuyển thành giọng nói trên loa của điện thoại. Người giao tiếp cũng được chuyển đổi giọng nói thành chữ viết để người khiếm thính có thể đọc được.
Theo trưởng nhóm Nguyễn Quốc Hùng, AI của Earlie có độ chính xác 91,25% với 20 ký tự phổ biến và đã có thể sử dụng trong các giao tiếp cơ bản của người khiếm thính.
Ý tưởng xây dựng Earlie đến từ chính trải nghiệm của thành viên trong nhóm. Nguyễn Quốc Hùng bẩm sinh bị hỏng một mắt nên hiểu được những khó khăn trong cuộc sống của người khuyết tật.
"Nghĩ đến nhiều người thậm chí không nghe, không thấy được gì, tôi thực sự muốn được giúp đỡ họ bằng công nghệ. Một trong rất nhiều ý tưởng mà tôi ấp ủ là hỗ trợ người khiếm thính hòa nhập với mọi người một cách dễ dàng", Hùng kể.
Với giấc mơ chuyển đổi số cho người khuyết tật, cậu sinh viên sinh năm 1998 tại Học viện Công nghệ Bưu chính Viễn thông và các bạn khác bắt tay thực hiện Earlie. "Chúng tôi khá tự tin khi đây là sản phẩm phiên dịch ảo đầu tiên tại Việt Nam hỗ trợ phiên dịch ngôn ngữ khiếm thính", Hùng nói. Theo cậu, Earlie được thiết kế theo hướng đơn giản để tập trung vào việc phiên dịch. So với nhiều giải pháp từng có ở nước ngoài, ứng dụng đã loại bỏ các thành phần như việc dạy học, đồ họa, hình ảnh... Theo nhóm, những tính năng này có thể gây khó khăn khi sử dụng, trong khi nhu cầu lớn nhất của người khiếm thính là là có thể nói chuyện một cách bình thường.
Sản phẩm mang đi thi được nhóm hoàn thành trong hơn một tháng. Khi mô hình AI đạt độ chính xác 80%, Hùng chia sẻ với một số người và nhận được đánh giá rằng "sản phẩm quá tệ". Điều đó không khiến Hùng lo ngại, mà càng trở thành động lực để nhóm hoàn thiện, tinh chỉnh sản phẩm.
Trước ngày thuyết trình cuối cùng, sản phẩm đạt độ chính xác 91%. Ngoài ra, Earlie cũng được bổ sung công nghệ nhận diện khuôn mặt, từ đó trích xuất giới tính của người giao tiếp, giúp cho cuộc trò chuyện trở nên tự nhiên hơn.
Thời gian tới, nhóm sinh viên Việt Nam này dự định hợp tác với các tổ chức của người khiếm thính nói riêng và người khuyết tật nói chung nhằm mở rộng tập dữ liệu, tăng độ chính xác cho AI, đồng thời hiểu rõ nhu cầu của người dùng để cải tiến sản phẩm.
Tại lễ trao giải Tech4Good diễn ra trực tuyến tuần này, ông Nguyễn Minh Hồng, Chủ tịch Hội Truyền thông số Việt Nam, nói: "Tôi rất vui và tự hào khi đội Việt Nam đã đạt giải Nhì trong cuộc thi, đặc biệt là khi biết về ý nghĩa của dự án đối với người khiếm thính trong giao tiếp. Tôi mong rằng, trong tương lai, các bạn học sinh, sinh viên Việt Nam vẫn tiếp tục duy trì và phát triển các ý tưởng, cải tiến sản phẩm công nghệ để đóng góp nhiều hơn nữa cho xã hội".
Cuộc thi Tech4Good lần đầu được tổ chức năm 2021 và nằm trong khuôn khổ chương trình Hạt giống cho Tương lai (Seeds for the Future) của Huawei. Cuộc thi có 3.500 thí sinh tham dự, thuộc 390 đội thi và đến từ 117 quốc gia. Ba giải cao nhất lần lượt thuộc về đội của Thái Lan, Việt Nam và Libya.
Lưu Quý