Khi các doanh nghiệp đều sở hữu những nhân sự xuất sắc, công nghệ tiên tiến và sản phẩm tốt, điều gì sẽ khiến mỗi doanh nghiệp tạo ra sự khác biệt và bứt phá? Trước câu hỏi này, nhiều nhà lãnh đạo của các tập đoàn lớn trên thế giới đều nhận định đó là dữ liệu và cách mà mỗi doanh nghiệp khai thác dữ liệu đó.
Theo ông John Roese, CTO của Dell Technologies, lần đầu tiên trong lịch sử, chúng ta không chỉ có khối lượng lớn và đa dạng dữ liệu, mà con người còn sáng chế ra những phương thức mới và mang tính kinh tế hơn trong việc lưu trữ và xử lý dữ liệu.
Có một sự phân cấp trong dữ liệu. Đầu tiên là mức dữ liệu - data, khi mọi thứ ở mức thô, chưa được quy hoạch và khai thác. Tiếp theo là thông tin - information, khi dữ liệu được tổ chức dưới dạng các cấu trúc. Cao hơn nữa là kiến thức -knowledge, từ việc tìm thấy những sự thấu hiểu (insight) từ những thông tin trước đó. Cuối cùng, sự thông thái - wisdom, có được khi chúng ta biến những kiến thức thành những dự đoán cho tương lai, thành sự thấu hiểu quá khứ và thành những hành động thiết thực nhằm đạt được một múc đích nào đó.
"Chúng ta đang tiến vào một kỷ nguyên mà hạ tầng công nghệ thông tin, khối lượng dữ liệu cũng như những giải thuật phần mềm kết hợp lại với nhau và đem lại cho con người kiến thức và sự thông thái trong hầu hết ngành nghề. Tôi nghĩ những điều này đã đủ chứng minh việc chúng ta đang bước và một kỷ nguyên mới - kỷ nguyên dữ liệu", ông John Roese, chia sẻ thêm.
Theo IDC, tổng dung lượng dữ liệu trên toàn thế giới đến năm 2025 có thể đạt đến 175 Zettabytes (175 tỷ Terabytes). Thực tế, các công nghệ mới như 5G đang là tiền đề giúp cho nhiều doanh nghiệp cung cấp nhiều dịch vụ cao cấp hơn cho khách hàng, nhằm tận dụng sức mạnh của mạng 5G. Điều này đã khiến cho nhiều loại dữ liệu mới sẽ được sinh ra và xử lý ở vùng biên (Edge) thay vì trong trung tâm dữ liệu tập trung. Theo dự đoán của Gartner, đến năm 2025 sẽ có khoảng 75% dữ liệu được tạo ra và xử lý bên ngoài các trung tâm dữ liệu tập trung.
Cũng theo Gartner, sự tăng trưởng về dữ liệu này được tạo ra từ một nhóm dữ liệu, đó là "dữ liệu phi cấu trúc - unstructured data", hiện chiếm 80% tổng dung lượng trên toàn thế giới và được dự đoán sẽ tăng gấp ba lần trong năm 2023. Dữ liệu có cấu trúc, là một nhóm dữ liệu đã quen thuộc - dữ liệu thường nằm trong các cơ sở dữ liệu quan hệ và có thể được truy vấn thông qua các câu lệnh SQL (ví dụ Oracle DB, IBM DB2, MS SQL). Dữ liệu phi cấu trúc là tất cả loại dữ liệu còn lại, như file văn bản, email, video, ảnh, dữ liệu di động, dữ liệu mạng xã hội, dữ liệu từ cảm biến, ảnh chụp vệ tinh... Đây là nhóm dữ liệu không thể được lưu trữ dưới dạng hàng và cột như dữ liệu có cấu trúc và cũng không thể dùng những kỹ thuật truy vấn dữ liệu truyền thống để khai thác.
Với việc chiếm 80% tổng dung lượng dữ liệu hiện nay, dữ liệu phi cấu trúc đang giữ những thông tin và sự thấu hiểu quan trọng trong kinh doanh mà chưa được khai thác hết.
Theo nhiều chuyên gia, dữ liệu có cấu trúc rất quan trọng, nhưng dữ liệu phi cấu trúc lại đóng vai trò then chốt trong việc tạo ra sự bứt phá cho doanh nghiệp nhờ việc đem lại sự phong phú về thông tin và kiến thức mà những kết quả thông kê thông thường qua dữ liệu có cấu trúc không thể đem lại. Vì vậy, các doanh nghiệp và tổ chức cần tìm ra phương pháp để quản lý và phân tích dữ liệu phi cấu trúc nhằm đưa ra các quyết định quan trọng trong kinh doanh, làm cơ sở tạo ra ưu thế cạnh tranh trong thị trường.
Thế Đan
Thấu hiểu những khó khăn và thách thức trong việc quản lý và phân tích dữ liệu phi cấu trúc, Dell Technologies đồng hành cùng các doanh nghiệp thông qua các giải pháp trong nhóm UDS – Unstructured Data Solution(Giải pháp dữ liệu phi cấu trúc)bao gồm: PowerScale (NAS), ECS (Object Storage) và SDP (Streaming Data Platform).
NT&T Solution là nhà phân phối và đối tác dịch vụ ủy quyền bởi Dell Technologies sẵn sàng tư vấn và cung cấp đến các doanh nghiệp tại Việt Nam những dịch vụ và giải pháp quản lý dữ liệu phi cấu trúc cao cấp.
Website: http://nttsolution.com