Tại Hội nghị châu Á-Thái Bình Dương về Khai phá Dữ liệu cuối tháng 5 vừa qua, khi bàn về cách mạng công nghiệp lần thứ tư, nhận định của giáo sư Sang Kyun Cha - nhà khoa học rất uy tín trong cả hai giới hàn lâm và công nghiệp Hàn Quốc - đã làm tôi bần thần.
Nếu nhận định này là đúng, thì một số ít quốc gia thắng cuộc sẽ là ai? Là các nước G7? Là ai nữa trong các nước G20? Việt Nam có nằm trong số đông các nước sẽ thua cuộc không? Nếu có thì làm sao vượt ra?
Là nước nông nghiệp đang phát triển và đã dựa nhiều vào tài nguyên thiên nhiên đang cạn dần, ta chừng mực nào đó đã đi theo và dùng được thành quả của ba cuộc cách mạng công nghiệp đã qua.
Lưới điện của hơn một thế kỷ trước nay đã đến hầu hết mọi làng xóm xa xôi của đất nước. Máy tính cá nhân, Internet và thiết bị điện tử đã phổ biến rất nhanh dù ta không sản xuất ra chúng. Nhìn chung, ta mới là người tiêu dùng và chưa tham gia được vào việc tạo ra sản phẩm công nghiệp trong các cuộc cách mạng công nghiệp đã diễn ra. Sản xuất của ta lúc này vẫn phần nhiều là những việc các nước G7, G20 đã ngừng để theo đuổi các sản xuất có hàm lượng khoa học và giá trị cao hơn.
Cốt lõi của cách mạng công nghiệp lần thứ tư là sản xuất thông minh dựa trên các đột phá của công nghệ số. Có thể hiểu công nghệ số gồm hai nội dung chính: số hoá và dùng dữ liệu số hoá. Tiến bộ của khoa học đã cho phép con người dần số hoá được hầu hết mọi thực thể trên đời (hệ gien người, cây lúa, chiếc ôtô, khách sạn, doanh nghiệp, cơ quan công quyền…), và trên Internet con người có thể kết nối các thực thể với nhau nhờ các phiên bản số của chúng (Internet vạn vật). Việc kết nối này thực chất là kết nối dữ liệu của các thực thể và do đó tạo ra một không gian dữ liệu số hoá của các thực thể rất lớn và rất phức tạp, hiện vượt quá khả năng xử lý của con người, gọi là hiện tượng dữ liệu lớn (big data).
Mối đe dọa giáo sư Sang Kyun Cha nói đến chính là chỉ một số ít quốc gia làm chủ được công nghệ số và sẽ thắng trong cuộc cách mạng công nghiệp vừa bắt đầu.
Trong vài năm qua, các nước phát triển đều xây dựng chương trình chiến lược quốc gia cho sự phát triển của mình trong những thập kỷ tới, và nội dung công nghệ, phần cốt lõi của các chương trình, chính là câu chuyện của số hoá, kết nối và phân tích dữ liệu lớn. Xuyên suốt ba khía cạnh công nghệ này chính là khoa học dữ liệu.
“Thế giới sẽ là dữ liệu. Tôi nghĩ đây mới chỉ là khởi đầu cho thời đại dữ liệu” - Jack Ma, người sáng lập công ty thương mại điện tử lớn nhất thế giới, tuyên bố. Tiến sĩ Yoram Singer, người phụ trách nhóm nghiên cứu lý thuyết của công ty Google - bây giờ là công ty có giá trị vốn hóa lớn nhất thế giới dưới tên Alphabet - trong lần đến làm việc ở Việt Nam năm 2014 đã khẳng định về bản chất Google là một công ty về học máy (machine learning). Học máy và thống kê toán học, hai thành phần chính của khoa học dữ liệu, nhằm vào việc phân tích dữ liệu, đặc biệt những nguồn dữ liệu rất lớn và phức tạp.
Nếu phân tích được dữ liệu về nhu cầu thị trường, ta có thể quyết định cần nuôi bao nhiêu lợn mỗi nơi mỗi lúc. Nếu phân tích được dữ liệu mô phỏng các phương án xả lũ vào mùa mưa, ta có thể chọn được cách xả lũ ít thiệt hại nhất. Nếu phân tích được các bệnh án điện tử của người bệnh, ta có thể biết khi uống thuốc những hiệu ứng phụ nào có thể xảy ra. Amazon đã phân tích các lần mua hàng trước của bạn để gợi ý bạn mua những món đồ thích hợp...
Những thách thức của đời sống mà chúng ta gặp trên báo chí hàng ngày, đều có thể giải quyết một phần bằng khoa học dữ liệu.
Các nước quanh ta như Singapore, Hàn Quốc, Trung Quốc… trong hai ba năm qua đều thúc đẩy nhiều chương trình nhằm đưa khoa học dữ liệu thành thế mạnh của họ, để họ thành “người thắng cuộc” trong những thập kỷ đang tới.
Nhìn trên thực trạng của bức tranh toàn cầu, nếu không duy ý chí thì có thể nói Việt Nam khó nằm trong số ít thắng cuộc, nhưng có thể nói ta có những yếu tố để làm được và dùng được khoa học dữ liệu một cách hiệu quả, rộng hơn là công nghệ số, cho những mục tiêu phát triển của đất nước.
Giáo dục toán học của ta có truyền thống. Ta có lực lượng làm về công nghệ thông tin khá đông đảo và có kỹ năng tốt. Quan trọng hơn cả, ta có những thế hệ người trẻ tuổi thông minh, khát vọng vươn lên cho đời mình và cho đất nước. Trong khoá học ngắn hạn về khoa học dữ liệu do Viện nghiên cứu cao cấp về Toán (VIASM) tổ chức giữa tháng 5 vừa qua ở hai đầu đất nước, đã có hơn một nghìn người đăng ký và tham gia. Phần lớn họ còn trẻ. Tôi cảm nhận được khát khao hiểu biết và mong muốn vươn lên trên từng khuôn mặt và trong từng câu hỏi của người học.
Trong những năm qua, một số nhà nghiên cứu người Việt làm việc ở đại học và các công ty lớn trên thế giới đã và đang nắm bắt được cũng như tham gia vào giải quyết những bài toán thời sự nhất, khó khăn nhất của khoa học dữ liệu. Với những gì tôi biết, phần lớn trong số họ đều sẵn sàng và mong muốn được học hỏi cũng như chia sẻ kinh nghiệm và hiểu biết của mình với đồng nghiệp trong nước.
Câu nói của giáo sư Sang Kyun Cha hẳn sẽ khiến nhiều người nhớ đến ca khúc nổi tiếng của ban nhạc ABBA: “The winner takes it all” - Kẻ thắng lấy tất. Và tôi muốn biên dịch câu đó, thành: “Được ăn cả, ngã về không”.
Hồ Tú Bảo