← VnExpress Khoa học công nghệ

Nguyễn Trọng Hoàng Việt

Nguyễn Trọng Hoàng Việt

Bản thân tôi mong muốn thu hẹp khoảng cách giữa việc nghiên cứu với việc ứng dụng AI ở Việt Nam để giúp các tổ chức, doanh nghiệp nâng cao lợi thế cạnh tranh. Với trí tuệ nhân tạo AI, sản phẩm xây dựng trở nên khó hơn nhiều tuy nhiên mang lại kết quả vượt trội về tự động hóa quy trình, giúp tiết kiệm chi phí về lâu dài.

1. Quá trình xây dựng nền tảng kiến thức:
Tôi tốt nghiệp Kỹ sư ngành Toán Tin tại Đại học Bách Khoa Hà Nội vào năm 2019, sau đó tôi học lên Thạc sĩ ngành Toán và Tin học cũng tại Đại học Bách Khoa Hà Nội. Nền tảng học vấn này đã trang bị cho tôi kiến thức chuyên sâu về các thuật toán và mô hình AI.

2. Kinh nghiệm làm việc và phát triển sản phẩm AI:
Trong quá trình phát triển sự nghiệp, tôi đã đảm nhiệm nhiều vai trò quan trọng, thể hiện sự thăng tiến và đóng góp của tôi trong lĩnh vực AI:
- CTO tại Uland từ tháng 01/2015 đến tháng 08/2017.
- AI Team Lead tại Cinnamon AI lab từ tháng 09/2017 đến tháng 10/2019.
- CEO & CTO tại Techainer từ tháng 10/2019 đến hiện tại.
Những vị trí này cho thấy tôi không chỉ tham gia vào quá trình nghiên cứu và phát triển kỹ thuật mà còn có vai trò quản lý, định hướng sản phẩm và lãnh đạo các nhóm phát triển AI. Tham gia vào lãnh đạo, nghiên cứu, triển khai các dự án từ hàng trăm nghìn đến hàng chục triệu đô la, triển khai đến hàng triệu người dùng

3. Các dự án nghiên cứu và phát triển AI tiêu biểu:
Quá trình nghiên cứu và phát triển AI của tôi được thể hiện rõ nét qua hàng loạt các dự án đa dạng, áp dụng AI vào các lĩnh vực khác nhau:

- Xử lý ảnh và Thị giác máy tính:

+ Dự án tự động hóa xử lý Báo cáo tài chính (Financial Statement Understanding): Phục vụ bài toán tối ưu quyết định tài chính, tôi đã xây dựng mô hình Siamese để phân loại, bóc tách các thông tin bên trong Báo cáo tài chính, và huấn luyện mô hình BERT để phát hiện tác động (tốt/xấu) của thông tin lên công ty từ BCTC và Mạng xã hội. Các công nghệ sử dụng bao gồm Tensorflow, Pytorch, Scikit-learn, Django, Redis, Graphql, Neo4j. Độ chính xác lên đến 98% trên tập mẫu 10000 công ty.

+ Dự án nhận diện vân tay (FingerPrint Biometrics): Với yêu cầu nhận diện độ chính xác 100% cho dữ liệu vân tay của ngân hàng, Tôi đã phát triển hệ thống nhận dạng vân tay từ paper "Deep and Accurate Fingerprint Recognition based on Minutiae detection" để nhận diện giữa hàng triệu vân tay, với mục tiêu F1 Score 88% và thời gian khớp dưới 1 giây. Các nhiệm vụ của tôi bao gồm huấn luyện mô hình phân đoạn sâu để phát hiện vân tay từ thẻ căn cước và ảnh cảm biến, huấn luyện mô hình phát hiện chi tiết nhỏ (minutiae) và loại chi tiết nhỏ, và triển khai thuật toán khớp vân tay hiệu suất cao. Các công nghệ chính là Tensorflow, Cuda, ElasticSearch, MongoDB.

+ Dự án nhận diện và chống giả mạo khuôn mặt: Với yêu cầu triển khai hệ thống Face Camera AI nhận diện khách hàng cho ngân hàng và tổ chức tài chính. Tôi đã phát triển hệ thống nhận diện khuôn mặt để phát hiện, theo dõi, nhận diện và thông báo từ nhiều luồng camera (>400 luồng trên toàn quốc) cho ngành ngân hàng, với mục tiêu độ chính xác >95% cho VIP/Non-VIP và >90% khi xác định khách hàng vào chi nhánh ngân hàng. Tôi đã cải thiện mô hình phát hiện khuôn mặt và điểm mốc khuôn mặt lên 98% và huấn luyện mô hình nhận diện tốt hơn trên khuôn mặt người Việt. Các framework sử dụng gồm Tensorflow, Keras, Pytorch, Mxnet, ElasticSearch, Open Distro.

+ Dự án nhận diện giấy tờ tùy thân eKYC: Tôi đã xây dựng pipeline nhận dạng giấy tờ tùy thân (Chứng minh thư, bằng lái xe, hộ chiếu,...) với độ chính xác >98% và xử lý dưới 1 giây cho 1 loại thẻ và 200 loại hộ chiếu. Các công việc của tôi bao gồm huấn luyện phát hiện thẻ bằng Mask RCNN (>99% độ chính xác), phát hiện và nhận dạng dòng chữ (>99% độ chính xác), và huấn luyện Named Entity Recognition và Address Normalization. Frameworks: Tensorflow, Pytorch, Tensorflow Lite, Tensorflow JS. Dự án triển khai trên một số ngân hàng, nhiều tổ chức tài chính, xử lý hàng trăm nghìn GTTT mỗi tháng.

+ Dự án Smart AI Camera: Tôi đã xây dựng hệ thống xử lý ảnh bao gồm các module phân loại/phát hiện/theo dõi đối tượng. Tôi đã cải thiện hiệu suất thuật toán trích xuất đặc trưng cho phân loại đối tượng bị bỏ rơi/di chuyển (ARO) và cải thiện độ chính xác của phân loại ARO trong thời gian thực, đếm số lượng người bằng thuật toán Faster RCNN cải tiến. Triển khai trên hàng trăm Camera của nhiều nhà máy. Framework: Caffe-SSD.

+ Dự án Camera AI bệnh viện thông minh: Tôi đã phát triển module nhận dạng tư thế người (gập người, nằm, ngồi, đứng, ngã), biểu cảm khuôn mặt người (buồn bã, hạnh phúc, tức giận, ngạc nhiên, buồn chán, sợ hãi) sử dụng các đặc trưng HOG, SURF, mô hình KNN, BOW và SVM. Phục vụ triển khai việc hỗ trợ chăm sóc người già trong bệnh viện.

- Xử lý Ngôn ngữ Tự nhiên (NLP):
+ Natural Language Processing: Tôi đã phát triển hệ thống NLP trong lĩnh vực giải trí, bao gồm xây dựng cơ sở dữ liệu và cải thiện hiệu suất module tìm kiếm mờ (fuzzy searching) sử dụng khoảng cách Levenshtein.
+ Dự án AI Tutor: Tôi đã phát triển hệ thống LLM tiếng Việt, tập trung vào khả năng xử lý tiếng Việt và khả năng hỗ trợ học theo tiêu chuẩn giáo dục (đưa ra hỗ trợ + kiến thức giải chứ không đưa đáp án ngay). Kiến thức được hỗ trợ được được đưa đến học sinh qua một hệ thống kiểm duyệt chặt chẽ để đảm bảo nội dung chuẩn từ Nhà xuất bản giáo dục. Hệ thống được đặt mục tiêu triển khai đến hàng chục triệu học sinh của Việt Nam.

- Tối ưu hóa và Phát triển hệ thống AI

4. Thành tựu và Giải thưởng:
Quá trình nghiên cứu và phát triển AI của tôi là một chuỗi các hoạt động liên tục, từ việc nắm vững lý thuyết đến việc triển khai các mô hình phức tạp và xây dựng các hệ thống AI có tính ứng dụng cao trong nhiều lĩnh vực khác nhau. Tôi không chỉ là một kỹ sư có chuyên môn sâu mà còn là một người có khả năng lãnh đạo và định hướng phát triển công nghệ.

Về thành tựu, tôi đã tham gia và đồng tác giả nhiều dự án và công trình AI quan trọng, tập trung vào các lĩnh vực xử lý ảnh, thị giác máy tính và xử lý ngôn ngữ tự nhiên:

- Hệ thống nhận dạng vân tay và khuôn mặt cho Ngân hàng P: Phát triển hệ thống nhận dạng vân tay để nhận diện hàng triệu dấu vân tay với độ chính xác cao và thời gian khớp dưới 1 giây, số lượng người sử dụng vào khoảng: 2,360,000. Đồng thời, phát triển hệ thống nhận diện khuôn mặt có khả năng mở rộng cho ngành ngân hàng, đạt độ chính xác cao trong việc nhận diện khách hàng VIP/Non-VIP và nhận diện khách hàng khi vào chi nhánh. Mô hình phát hiện khuôn mặt và điểm mốc đã cải thiện lên 98% và huấn luyện mô hình nhận dạng tốt hơn trên khuôn mặt người Việt.

- Hệ thống Biometrics (sinh trắc học) cho một ngân hàng trong Top 10 Ngân hàng thương hiệu giá trị nhất Việt Nam 2024, số lượng người sử dụng 7,000,000: đảm bảo khả năng ngăn chặn những khách hàng giả mạo mà không quá ảnh hưởng đến trải nghiệm khách hàng. Giải pháp đang được ứng dụng để giải pháp đang được triển khai để thực hiện các nghiệp vụ mở tài khoản hay các nghiệp vụ khác cần định danh người dùng trực tiếp. Hệ thống đang xử lý hàng tháng gần 300,000 lượt xác thực khuôn mặt với tỷ lệ sai sót dưới 5%.

- Hệ thống EKYC cho nhà mạng Vietnamobile có thể triển khai bán SIM qua kênh địa lý. Hiện tại phối hợp để đẩy bán SIM lên kênh trực tuyến. Hệ thống EKYC được triển khai tại chuỗi chi nhánh Vietnamobile lên đến hơn 5000 khách hàng Vietnamobile mỗi tháng đăng ký dịch vụ từ xa nhờ eKYC.

- Hệ thống hỗ trợ đăng ký kích hoạt SIM của nhà mạng Mytel tại thị trường Myanmar: Đạt tỷ lệ chính xác 90% trong việc trích xuất thông tin từ chữ viết tay trên thẻ National Identity Card (NRC) và tăng tỷ lệ chống giả mạo lên 50%, giúp định danh người dùng nhanh chóng và an toàn.

- Hệ thống Biometrics & OCR: Giải pháp đang được triển khai để thực hiện các nghiệp vụ mở tài khoản hay các nghiệp vụ khác cần định danh người dùng trực tiếp. Sau quá trình chuyển giao đào tạo, đội ngũ nhân viên ngân hàng đã nắm được cách thức vận hành và tự chủ được việc vận hành Giải pháp.

- Hệ thống học trực tuyến cấp quốc gia triển khai trên một số trường trọng điểm đưa các khóa học và sinh viên của các trường có thể học và được công nhận tín chỉ chéo giữa các trường. - Giải pháp loa phường IP Radio: hiện nay đã được ứng dụng trên 10 tỉnh thành của VN. Dự kiến sẽ phủ ít nhất 50% số tỉnh thành trên cả nước, nhằm đem đến giá trị truyền thông bền vững. Với nền tảng công nghệ điều khiển qua Internet thì loa phường thế hệ mới là biểu hiện sinh động của chuyển đổi số (IoT, cloud, AI...).

Giải thưởng:
- Dự án Camera AI - Giải nhất Yody Hackathon 2022.
- Giải nhất AWS Hackdays Vietnam cho giải pháp thu thập kiến thức về báo cáo tài chính năm 2018.
- Dự án Camera AI - Giải ba Youth Innovation 2022.
- Dự án eKYC đạt giải Top 13 Hệ thống giải AI Tech Matching 2022.
- Giải nhất thử thách xe tự lái của Đại học Bách khoa Hà Nội năm 2016.
- Giải nhì Olympic Tin học Việt Nam năm 2014.