Nhiều giờ sau vụ tấn công khủng bố vào hai nhà thờ Hồi giáo ở New Zealand khiến 49 người chết, video ghi lại cảnh xả súng liên tục xuất hiện trên YouTube hay Facebook. Một số chuyên gia cho rằng các công ty nên áp dụng rộng rãi công nghệ hashing để chặn những nội dung này.

Khoảnh khắc nghi phạm bắt đầu tấn công nhà thờ trong vụ xả súng ở New Zealand. Ảnh: Al Jazeera.
Theo CNN, hashing đã tồn tại hơn một thập kỷ, không giúp chặn các video bạo lực được phát trực tiếp lên Internet nhưng có thể ngăn các bản sao lan rộng. "Công nghệ để chặn các video xấu lan truyền trên mạng đã có sẵn, tuy nhiên các mạng xã hội lại không áp dụng nó", David Ibsen, giám đốc một dự án chống cực đoan, nói.
YouTube cho biết đang sử dụng công nghệ hashing để chặn các video thảm sát ở New Zealand được tải lên trang chia sẻ này. Ngoài ra, công ty còn dựa vào "các hệ thống gắn cờ tự động và báo cáo từ người dùng" để ngăn chặn clip bạo lực phát tán.
Facebook cho biết: "Chúng tôi đang thêm từng video tìm thấy vào cơ sở dữ liệu nội bộ (hashing), cho phép phát hiện và xóa tự động các video bản sao khi chúng được tải lên". Twitter từ chối trả lời về việc chặn video bằng hashing.
"Hashing cực kỳ hiệu quả trong việc ngăn hoàn toàn việc tải lên các nôi dung bất hợp pháp, bất kể bối cảnh nào, chẳng hạn nội dung lạm dụng tình dục trẻ em", người phát ngôn của YouTube cho biết. Tuy nhiên hash cũng có thể "bắt lỗi" cả những video hợp pháp có sử dụng hình ảnh gốc, chẳng hạn trong video tin tức.
Hashing hoạt động thế nào
Băm video hoạt động bằng cách chia nhỏ video thành các khung chính và gắn cho chúng một chữ ký số hoặc hash duy nhất. Băm đó được thu thập vào cơ sở dữ liệu trung tâm, trong đó mọi video hoặc hình ảnh được tải lên sẽ được so sánh với tập cơ sở dữ liệu đó.
Hệ thống sẽ truy suất tới cơ sở dữ liệu hình ảnh để xác định những gì xuất hiện trong video. Nó chỉ xác định sự trùng khớp giữa ảnh, video được tải lên với nội dung gốc, không sử dụng công nghệ trí tuệ nhân tạo (AI).
Năm 2008, Farid, giáo sư khoa học máy tính tại Đại học Dartmouth, đã hợp tác cùng Microsoft để tạo ra PhotoDNA, một hệ thống cho phép xác định nội dung khiêu dâm trẻ em trên quy mô lớn. PhotoDNA vẫn được sử dụng trên hầu hết các nền tảng công nghệ lớn nhờ khả năng làm việc quy mô rộng.
Các nền tảng trực tuyến cũng sử dụng hashing để xác định vi phạm bản quyền. Chẳng hạn khi người dùng cố tình tải bộ phim Avengers lên YouTube, video sẽ bị cắm cờ vi phạm, nhờ hashing.
Các nền tảng công nghệ quan tâm nhiều hơn đến hasing trong những năm qua nhằm ngăn chặn nội dung khủng bố. Facebook, YouTube, Twitter và Microsoft đã tham gia Diễn đàn Internet toàn cầu về chống khủng bố, một tổ chức xây dựng cơ sở dữ liệu về các vụ khủng bố cực đoan đã xảy ra.
Các hãng công nghệ ngần ngại
Hashing được sử dụng bởi nhiều công ty hàng đầu từ nhiều năm qua, nhưng Facebook và Google cho biết tương lai của kiểm duyệt nội dung nằm ở AI. "Nếu chúng ta tiến nhanh hơn trong 5-10 năm nữa, tôi nghĩ rằng AI sẽ tham gia vào nhiều lĩnh vực hơn", Mark Zuckerberg nói.
Nhưng Farid cho rằng câu trả lời đó không đủ: "Tôi không biết bạn sẽ làm gì trong khoảng thời gian 10 năm đó. Không lẽ sẽ sống chung với nó?"
"Hashing đã chứng minh khả năng ngăn chặn nội dung lạm dụng trẻ em, chống vi phạm bản quyền và bây giờ là chặn video cực đoan", Faird nói. "Bạn không thể nói mình không có công nghệ. Việc không làm quyết liệt thuộc về tư tưởng và chính sách - không phải vấn đề của công nghệ".