Tham gia cuộc thi sinh viên nghiên cứu khoa học khu vực châu Á - Thái Bình Dương (IEEE Region 10) do Hiệp hội Kỹ sư Điện và Điện tử (IEEE) tổ chức gồm hai sinh viên năm tư Huỳnh Thanh Sơn, Huỳnh Tấn Phong (khoa Toán - Tin học, trường Đại học Khoa học Tự nhiên) và Nguyễn Hữu Đắc (học viên cao học viện John Von Neumann). Người hướng dẫn là TS Nguyễn Thanh Bình, trưởng bộ môn Ứng dụng tin học (Khoa Toán - Tin học, Đại học Khoa học Tự nhiên).
Tên đề tài nhóm là Xây dựng thuật toán cải tiến cho hệ thống gợi ý nộp bài báo nghiên cứu khoa học.
TS Nguyễn Thanh Bình cho biết, ý tưởng đề tài xuất phát từ những khó khăn của nhóm trong việc lựa chọn hội nghị hoặc tạp chí khoa học chất lượng tốt, phù hợp với kết quả của các nghiên cứu. Nhóm quyết định tạo ra một ứng dụng để giải quyết vấn đề này, vừa giúp mình vừa có thể giúp các nhà khoa học trong nước, nhất là những nhà nghiên cứu trẻ. Họ bắt tay làm việc từ tháng 9 năm ngoái.
Theo ông Bình, việc xây dựng các hệ thống gợi ý được nghiên cứu sâu rộng, có nhiều ứng dụng với vai trò quan trọng trong thời đại số, nhất là cuộc Cách mạng công nghiệp 4.0. Nhiều tập đoàn lớn đẩy mạnh đầu tư lĩnh vực này nhằm tăng khả năng kinh doanh, tối ưu hóa lợi nhuận.
Trong lĩnh vực khoa học - công nghệ, các nhà khoa học hiện có nhiều lựa chọn để nộp các công trình nghiên cứu của mình thông qua các hội nghị trong nước, quốc tế, hội thảo khoa học hoặc các tạp chí khoa học. Tuy nhiên, số lượng các hội nghị, tạp chí rất lớn, chỉ tính riêng lĩnh vực khoa học máy tính đã vượt qua con số 13.000 nên gây khó khăn trong việc lựa chọn.
Chưa kể, mỗi nơi lại có các chủ đề khác nhau, chỉ số (index) và thứ hạng khác nhau để các nhà nghiên cứu lựa chọn. Với những người chưa có kinh nghiệm, việc lựa chọn hội nghị hoặc tạp chí rất mất thời gian, công sức, nguy cơ bị từ chối bản nộp rất cao.
Nghiên cứu của nhóm TS Bình đưa ra giải pháp đáp ứng được những yêu cầu về truy vấn và tìm kiếm thông tin liên quan đến tạp chí hay hội nghị chuyên ngành. Hệ thống sẽ dựa vào dữ liệu nhập liệu từ người dùng gồm tên bài báo (tittle), bản tóm tắt (abstract) bài báo, các từ khóa chính (keywords) để đưa ra các kết quả tìm kiếm thích hợp.
Đề tài có cách tiếp cận mới cho bài toán bằng cách kết hợp các phương pháp nhúng từ (GloVe, FastText) cùng với mô hình mạng nơron tích chập một chiều (CNN 1D) hoặc mạng bộ nhớ dài - ngắn (Long Short Term Memory networks) để xây dựng thuật toán gợi ý có độ chính xác tốt hơn.
"Kết quả thực nghiệm cho thấy việc kết hợp các phương pháp nhúng từ với mô hình mạng nơron tích chập một chiều không chỉ cho độ chính xác tốt hơn so với các phương pháp và tập dữ liệu trước đó mà còn có tốc độ huấn luyện và dự đoán hiệu quả hơn", ông Bình cho biết.
Nhóm nghiên cứu dành nhiều thời gian khảo sát kỹ bài toán, thu thập dữ liệu, phân tích những điểm mạnh và điểm yếu của các phương pháp đã đề xuất trước đó để đưa ra cái nhìn tổng thể bài toán. Thầy trò gặp nhau hàng tuần, cùng bàn bạc, nhận xét các kết quả đạt được, đề ra ý tưởng mới để thực hiện các thực nghiệm cần thiết.
Quá trình nghiên cứu khá vất vả khi thiếu máy móc và thiết bị cần thiết. Phần lớn các thí nghiệm thực hiện bằng cách dùng Google Colab hoặc mượn máy của đồng nghiệp. Nhiều lúc hạn nộp kết quả nghiên cứu sắp đến, thầy trò "trực chiến" online, chạy thêm thực nghiệm rồi nộp bài báo cáo khi thời hạn chỉ còn tính bằng phút.
Nhóm đạt được một số kết quả khả quan khi có một số bài báo về đề tài trên được chấp nhận ở các hội nghị khoa học IEA/AEI 2020 (tại Nhật Bản), ACM ICMR 2020 (Ireland), SOFSEM 2021 (Italy).
"Sơn, Phong, Đắc đều rất yêu thích bài toán này. Niềm vui lớn nhất của thầy trò là khi kết quả bài báo của các em được chấp nhận. Trong nghiên cứu khoa học, lòng đam mê, kiên trì và sự quyết định cao độ sẽ giúp ích rất nhiều vì muốn đạt kết quả tốt, chặng đường thường rất gian khổ", ông Bình chia sẻ.
Sắp tới, nhóm sẽ nghiên cứu sâu hơn về bài toán và mở rộng kết quả với những loại tạp chí và các nhà xuất bản khác nhau. Họ dự kiến xây dựng một ứng dụng thực tế như thiết kế một trang web, các nhà khoa học có thể truy vấn những thông tin cần thiết nhằm có thể lựa chọn hội nghị, tạp chí phù hợp nhất.
Đề tài nghiên cứu của nhóm cũng được Đại học Quốc gia TP HCM chấp thuận cấp kinh phí nghiên cứu vào năm sau. Với các học trò, TS Bình cho biết sẽ giúp họ có những bước chuẩn bị tốt nhất giành học bổng thạc sĩ, tiến sĩ tại các đại học lớn.
IEEE là hiệp hội chuyên môn kỹ thuật lớn thế giới với gần 500.000 thành viên, gồm các kỹ sư, nhà khoa học và sinh viên đến từ các đại học và viện nghiên cứu lớn. Đây cũng là một trong những hiệp hội uy tín khi xuất bản trên một phần ba các ấn phẩm nghiên cứu khoa học trong các lĩnh vực Điện, Điện tử, Điều khiển, Truyền thông, Công nghệ thông tin và các ngành có liên quan.
IEEE Region 10 dành cho sinh viên đến từ các đại học lớn ở Nhật Bản, Hàn Quốc, Trung Quốc, Australia, New Zealand, Ấn Độ và các nước Đông Nam Á.