Nguyễn Hoàng Quân, sinh năm 1999, du học sinh Mỹ là một trong những gương mặt trẻ đặc biệt của cộng đồng AI Việt Nam. Trước khi về Việt Nam xây dựng các mô hình ngôn ngữ lớn (LLM) nói tiếng Việt miễn phí cho cộng đồng, Quân từng làm kỹ sư nghiên cứu tại OpenAI, tham gia trực tiếp vào các dự án đình đám như ChatGPT, Bing Chat và Dall-E 2.
Dấu ấn kỹ sư Việt tại OpenAI
Kết thúc năm cuối đại học, chuyên ngành Khoa học Máy tính, Quân về OpenAI thực tập. Tại đây anh được giao nhiệm vụ cải tiến Dall-E 2 - mô hình AI vẽ tranh từng gây sốt thế giới. Quân chia sẻ, thời gian đầu, Dall-E 2 khá khó dùng, để tạo được một hình ảnh đẹp, người dùng phải viết những prompt rất dài, nhiều dấu phẩy, thiếu tự nhiên. Do đó anh đã đề xuất dùng chính mô hình GPT sẵn có ở OpenAI để biến những câu lệnh phức tạp đó trở nên đơn giản hơn.
"Dựa trên mô hình này, với bản cập nhật Dall-E 3, người dùng đã có thể tương tác với AI một cách tự nhiên, không còn cần prompt phức tạp như lúc đầu. Đặc biệt hơn, code này tiếp tục được phát triển và tích hợp vào ChatGPT để chatbot có thể nói chuyện với con người một cách tự nhiên hơn rất nhiều", Quân kể về điều thú vị nhất anh từng làm ở OpenAI.
Sau ba tháng thực tập, Quân được quản lý cũ mời về, tham gia vào một dự án mới, lúc này vẫn chưa biết sẽ làm ChatGPT. Tuy nhiên lúc này cậu đã quay về Việt Nam, tham gia vào một chương trình đào tạo tài năng AI của FPT Software nên chưa có dự định quay lại Mỹ. Sau một thời gian thương lượng, OpenAI cho phép Quân làm việc từ xa.
Anh được phân công làm ở nhóm Huma Data, trực tiếp tham gia vào quá trình kiểm tra chất lượng của dữ liệu trước khi cho máy học. Công việc của Quân là viết ra quy trình tự đồng hóa để kiểm tra thông tin, đảm bảo dữ liệu dùng để đào tạo chatbot luôn mới nhất, sạch nhất, hạn chế tối đa thông tin sai. Hệ thống sau đó được dùng cho cả BingChat của Microsoft.
Cuối năm đó, ChatGPT chính thức được giới thiệu ra cộng đồng và gây sốt khắp thế giới. Quân cũng phát hiện ra một nhược điểm lớn của các LLM là chúng tập trung quá nhiều vào tiếng Anh, không có mô hình nào nói tiếng Việt hoàn chỉnh. Cùng lúc này, phong trào mã nguồn AI mở bùng nổ ở Mỹ, mọi người đều có thể tiếp cận để xây dựng các sản phẩm mới. Cuối cùng, anh quyết định nghỉ OpenAI để tập trung làm các sản phẩm cá nhân, mang dấu ấn Việt Nam nhiều hơn.
Kỹ sư GenZ dạy AI nói tiếng Việt
Nghỉ OpenAI, Quân tập trung vào các dự án AI tại FPT, sau đó chuyển sang Zalo. Song song với đó, anh bắt đầu kết nối với cộng đồng kỹ sư, nhà nghiên cứu người Việt tại các trường đại học của Mỹ như Đại học Oregon để xây dựng các mô hình LLM nói tiếng Việt.
Tháng 6/2023, anh đồng sáng lập tổ chức phi lợi nhuận VILM - phát triển các mô hình AI miễn phí cho cho cộng đồng. Đến nay, Quân đã phát triển hai mô hình lớn của VILM là Vietcuna, VinaLlama. Ngoài ra, anh còn tham gia vào việc phát triển mô hình Vistral, dự án dẫn đầu bởi viện nghiên cứu ngôn ngữ tự nhiên thuộc trường Đại học Oregon (Mỹ). Đây là những hệ thống nền, giúp AI có thể hiểu và hành động theo ý người dùng. Chúng có thể áp dụng trong nhiều lĩnh vực từ chatbot chăm sóc khách hàng đến giúp lập trình viên sửa lỗi, hỗ trợ người khuyết tật hoặc ứng dụng trong lĩnh vực robot, tự động hóa.
"Trong những bài kiểm tra, Vistral đều cho điểm cao hơn GPT 3.5 về những kiến thức hiểu về Việt Nam. Đây là điều khiến tôi tự hào nhất khi hoạt động trong lĩnh vực AI", Quân nói.
Trong khi đó, mô hình trí tuệ nhân tạo hỏi đáp Vietcuna sau khi ra mắt vào tháng 6/2023 đã đạt 27.000 lượt tải xuống. VinaLlama ra mắt tháng 12/2023, đã nhận được 35.000 tin nhắn hỏi đáp từ người dùng trong 24 giờ đầu tiên. Còn OpenHermes-2.5 và OpenHermes-2.5-Vision có khả năng trả lời tương tự ChatGPT. Chúng cho phép người dùng tải mô hình về máy tính cá nhân sử dụng mà không cần Internet. Hiện ứng dụng này nhận được hơn 50.000 lượt tải mỗi tháng. OpenHermes-2.5 và OpenHermes-2.5-Vision đang được hơn 40 nhà khởi nghiệp tại Silicon Valley dùng.
Tương lai AI cho mọi người
Quân đánh giá, tương lai AI sẽ nằm trong túi của mỗi người khi các nhà sản xuất di động hàng đầu như Samsung, Google hay Apple tích hợp chúng lên smartphone. "Samsung đang có những chiến lược rất thú vị. Họ không chỉ tiên phong đưa GenAI lên những dòng điện thoại đầu bảng như Galaxy S24 mà còn đưa AI vào các bản cập nhật để ngay cả smartphone đời cũ cũng được dùng những công nghệ mới này. Đây là một trong những cách nhanh nhất, an toàn nhất và rẻ nhất để ai cũng có thể tiếp cận AI", Quân nhận định.
Hiện tại có nhiều cách tiếp cận AI khác nhau từ các thiết bị phần cứng, tuy nhiên cựu kỹ sư OpenAI cho rằng cách tốt nhất vẫn là đưa công nghệ mới vào những thứ có sẵn, quen thuộc với người dùng để nâng cấp trải nghiệm, thay vì làm mới. Quân ví dụ: "Bây giờ đưa cho bố mẹ tôi một chiếc Rabbit R1 hay AI Pin, chắc chắn mọi người sẽ rất khó dùng, dù đây được cho những smartphone AI đời mới. Đổi lại, nếu đưa một chiếc smartphone tích hợp sẵn GenAI như Galaxy S24, chắc chắn ai cũng có thể dùng ngay. Thậm chí có nhiều tác vụ được cải thiện tốt hơn mà người dùng không cần biết có AI phía sau".
Quân nói GenAI đang là cơn sốt nhưng thực ra từ lâu, các nhà sản xuất phần cứng đã dùng AI rất nhiều trên thiết bị. Ví dụ khu chụp hình bằng smartphone, AI đã giúp xử lý rất nhiều trước khi cho ra kết quả cuối cùng. "Trước đây tôi có thời gian dài dùng Galaxy Note. Mọi thứ đều rất hài lòng cho đến khi đổi sang Galaxy S24 Ultra, nhiều trải nghiệm của tôi đã được nâng lên tầm cao mới nhờ tích hợp GenAI. Tôi nghĩ đây là cách tiếp cận thông minh và tối ưu nhất với người dùng đầu cuối".
Quân ví dụ, trước đây, để tự làm một hình nền, anh phải cài nhiều phần mềm hoặc dùng các nền tảng khác nhau để tạo ảnh sau đó tải về máy rồi cài đặt, đổi ảnh. Nhưng với GenAI trên Galaxy S24 anh có thể tự tạo ảnh, đổi ảnh mỗi ngày chỉ bằng vài thao tác đơn giản. "Đây là tính năng AI tôi thích nhất trên Galaxy S24 vì có thể làm mới tôi mỗi ngày một cách rất đơn giản, sáng tạo", Quân nói.
Một tính năng khác cựu kỹ sư OpenAI đánh giá cao trên Galaxy S24 là Khoanh tròn để tìm kiếm bằng S Pen. Anh cho rằng trước đây Samsung đã tối ưu hóa rất tốt trải nghiệm người dùng cho S Pen trên dòng Galaxy Note. Nhưng với việc tích hợp thêm GenAI, hãng di động Hàn Quốc đã đưa trải nghiệm người dùng lên một tầm cao mới, người dùng có thể tìm kiếm bất kỳ thứ gì xuất hiện trên người dùng chỉ với một vòng tròn nhỏ. Quân đánh giá đây không đơn thuần là một tính năng mà còn cho thấy Samsung đã nghiên cứu rất kỹ hành vi của người dùng, lựa chọn những tính năng cần thiết, quan trọng với người dùng để tích hợp GenAI.
Quân đánh giá GenAI sẽ là bước tiến tiếp theo không thể chối bỏ, tuy nhiên người dùng không nhất thiết cần một thiết bị hoàn toàn mới, thay vào đó họ cần trí tuệ nhân tạo để cá nhân hóa trải nghiệm, đưa các tác vụ hàng ngày lên một tầm cao mới. "Cách tiếp cận AI tốt nhất là để nó biến những thứ có sẵn trở nên tốt hơn. Những thiết bị phần cứng như smartphone, đồng hồ, kính VR đã đủ tốt. Việc các nhà sản xuất cần là nghiên cứu để cải thiện các tính năng người dùng thật sự dùng hàng ngày để cải thiện thay vì nhồi nhét quá nhiều khiến máy nặng hơn. Khi đó, AI sẽ thật sự giải quyết nhu cầu thiết yếu trong cuộc sống, thay vì một tiêu chuẩn để chạy đua", Quân nhận định.
Minh Huy