Trong quá trình chuyển đổi công nghiệp 4.0, các công ty đang đầu tư nhiều hơn vào việc thu thập và tạo dữ liệu từ các mạng lưới vạn vật kết nối Internet (IoT). Sự phát triển của công nghệ kết nối mạng 5G, trí tuệ nhân tạo (AI) và Machine Learning góp phần đẩy nhanh hành trình hướng tới các nhà máy thông minh hoàn toàn tự động, thành phố thông minh, xe tự hành và nhiều lĩnh vực khác.
Dữ liệu nhanh (Fast Data) là lượng dữ liệu được thu thập, truyền tải và xử lý theo thời gian thực từ nhiều nguồn, bao gồm: thiết bị thiết bị di động, cảm biến, camera giám sát. Số lượng nguồn có thể lên đến hàng trăm, thậm chí hàng triệu thiết bị khác nhau.
Đặc điểm của Fast Data là dung lượng dữ liệu thấp nhưng cần xử lý nhanh, độ trễ thấp và liên tục. Các ứng dụng, phần mềm đóng vai trò quan trọng trong việc tối ưu hóa khả năng phân tích và xử lý Fast Data. Bên cạnh đó, việc lựa chọn thiết bị phần cứng và lưu trữ phải phù hợp với yêu cầu về tốc độ, độ trễ, độ tin cậy, có thể hoạt động trong điều kiện, môi trường khắc nghiệt.
Fast Data hiện ứng dụng trong hai lĩnh vực chính, gồm xe tự hành và thiết bị bay giám sát an ninh (drone).
Hệ thống xe tự hành yêu cầu hiệu suất cao và khả năng quản lý hiệu quả đối với lượng lớn dữ liệu tốc độ cao từ các cảm biến, hệ thống thông tin giải trí, hệ điều hành, bản đồ. Dữ liệu cảm biến sẽ chiếm phần lớn nhất trong kho lưu trữ dữ liệu trên xe, với hầu hết dữ liệu đến từ hệ thống hỗ trợ người lái tiên tiến (ADAS) và giao tiếp giữa phương tiện với môi trường xung quanh (V2X). Một phần dung lượng sẽ dành cho giải trí đa phương tiện, trò chơi, ứng dụng AI bằng giọng nói và các tính năng khác. Ngoài ra, "hộp đen" sẽ trở thành một yêu cầu pháp lý và an toàn bởi các cơ quan quản lý.
Không giống như bản đồ điều hướng 2D hiện tại, bản đồ độ nét cao (HD) khác rất nhiều về tốc độ cập nhật, phương pháp định vị và lượng dữ liệu thu thập. Do tần suất cập nhật dữ liệu cao, bản đồ HD thường sử dụng cập nhật trực tuyến theo thời gian thực thông qua mạng di động 5G. Bản đồ bao gồm lớp tĩnh, lớp bán tĩnh, lớp bán động và lớp động; lớp tĩnh cơ sở cập nhật hàng tháng hoặc khi cần.
Giải pháp lưu trữ sử dụng nand flash đóng một vai trò quan trọng trong các hệ thống xe tự hành, cung cấp khả năng lưu trữ, khởi động nhanh và lưu trữ dữ liệu để ghi lại các sự kiện quan trọng, lưu trữ các mô hình AI lẫn bản đồ HD. Hệ thống sẽ cần xử lý nhiều dữ liệu với tốc độ nhanh và độ tin cậy cao khi xe trở nên thông minh hơn.
Thứ hai, drone có khả năng tạo ra một lượng lớn dữ liệu hình ảnh và video, hỗ trợ theo dõi, giám sát từ xa hay vận chuyển hàng hóa.
Với thời gian bay trung bình khoảng 30 phút, lượng dữ liệu lưu mới có thể tạo ra ít nhất là 150 GB. Với bản đồ độ phân giải cao, mô hình 3D và tích hợp AI sẽ tạo ra lượng dữ liệu nhiều hơn.
Thẻ nhớ MicroSD vẫn là thiết bị lưu trữ chính trong thiết bị bay. Tuy nhiên, để cung cấp dung lượng lưu trữ và tốc độ cao hơn, một số thiết bị bay chuyên dụng đang triển khai tích hợp bộ nhớ nhúng eMMC, UFS, thậm chí cả SSD để phục vụ một số mục đích đặc biệt.
Thiết bị bay tích hợp AI với khả năng tự chủ và quãng đường bay dài hơn trong tương lai sẽ yêu cầu dung lượng lưu trữ cao hơn. Đi cùng là các yêu cầu về điều hướng bản đồ HD nâng cao, dữ liệu được chụp có độ phân giải cao hơn (video, hình ảnh 4K) và các dữ liệu khác.
Trong hai ứng dụng trên, cũng như trong những lĩnh vực phân tích dữ liệu theo thời gian thực khác, khoảng cách giữa thiết bị lưu trữ và tính toán, phân tích dữ liệu đang có xu hướng thiết lập gần nhau hơn, thậm chí là lưu trữ cục bộ ngay trên thiết bị đó.
Ngoài hình thức lưu trữ truyền thống như: bộ nhớ nand flash nhúng, thẻ nhớ và SSD, một số đơn vị ứng dụng giải pháp lưu trữ với công nghệ mới, quy mô lớn hơn, dung lượng và tốc độ nhanh hơn. Một ví dụ điển hình là bộ lưu trữ WD Ultrastar Data24 sử dụng công nghệ NVMe-over-Fabric (NVMe-oF). Đây là hệ thống lưu trữ tốc độ cao 100 Gbps, dung lượng lên đến 368 TB chuyên được kết nối trực tiếp vào các máy chủ biên (Edge server) nhằm lưu trữ, phân tích Fast Data theo thời gian thực.
Dữ liệu có nhiều tiềm năng trong tương lai. Hầu hết đơn vị đều tìm cách thu thập và tạo ra nhiều giá trị hơn từ nó, bao gồm sự kết hợp giữa con người cùng máy móc. Cơ sở hạ tầng lưu trữ là một phần giúp tận dụng giá trị của dữ liệu. Việc lựa chọn các thiết bị, giải pháp lưu trữ phù hợp sẽ giúp tối ưu chi phí đầu tư, vận hành, mở ra những cơ hội mới trong kinh doanh. Trong đó, công nghệ NVMe-oF được xem là giải pháp lưu trữ Fast Data của tương lai.
Minh Huy