Từ 10 năm trước, mạng xã hội lớn nhất thế giới kiểm duyệt dựa trên báo cáo của người dùng về nội dung mà họ cho là không phù hợp. Báo cáo này được gửi tới nhóm Hoạt động toàn cầu để xem xét và gỡ bỏ nếu vi phạm các quy tắc của Facebook.
Tuy nhiên, trong sự kiện trực tuyến AI Press Day ngày 17/11, đại diện Facebook cho biết, mỗi ngày có 1,82 tỷ người truy cập vào Facebook, sử dụng hàng trăm ngôn ngữ khác nhau để đăng hàng tỷ nội dung từ ảnh, video cho đến văn bản. Do đó, bên cạnh mô hình report và thuê ngoài đội ngũ kiểm duyệt viên, Facebook đang đặt cược vào AI để tự động nhận diện thông tin thù địch và sai lệch trên nền tảng của mình.
AI này nằm trong hàng trăm máy chủ tại các trung tâm dữ liệu của công ty, được đào tạo để xác định nội dung xấu độc bất cứ khi nào một bài đăng mới xuất hiện ở bất kỳ đâu trên Facebook. Một số công cụ AI có nhiệm vụ tìm kiếm nội dung thù ghét, một số tìm thông tin sai lệch, số khác tìm hành vi bắt nạt hoặc ảnh khoả thân... Phần lớn các post vi phạm được gửi đến đội ngũ kiểm duyệt viên để thực hiện các hành động tiếp theo, nhưng một số nội dung sẽ được tự động phân tích và quyết định xóa bằng AI.
Các nội dung được chia sẻ lên mạng không chỉ có tiếng Anh mà còn nhiều ngôn ngữ khác, như tiếng Việt. Các kỹ sư tại Facebook đã phát triển công nghệ XLM-R có thể hiểu văn bản bằng 160 ngôn ngữ khác nhau để phục vụ việc kiểm duyệt nội dung toàn cầu.
Tuy nhiên, trên thực tế, rất khó phát hiện nội dung vi phạm bởi thông điệp thù ghét có thể nằm giữa các ảnh, video, meme..., nhất là khi người chia sẻ cố tình áp dụng thủ thuật để tránh bị phát hiện, như viết sai chính tả, tránh những cụm từ đặc biệt...
Do đó, công cụ của Facebook không chỉ nhận diện ngôn ngữ mà còn phân tích hình ảnh thông qua AI thị giác máy tính, bối cảnh nội dung đó được chia sẻ, cũng như xem xét các phản ứng và nhận xét... Nhờ vậy, Facebook có thể chủ động phát hiện và xóa nội dung vi phạm trước khi người dùng báo cáo, thậm chí trước khi người dùng nhìn thấy nội dung đó.
Như các công cụ AI khác, thuật toán của Facebook vẫn còn tồn tại nhiều vấn đề, hoạt động chưa hoàn hảo và nhận diện sai, nhầm lẫn. Dù vậy, nhờ AI, hãng có thể gỡ hàng triệu nội dung vi phạm một cách nhanh chóng.
"Công việc của chúng tôi là ngăn bất kỳ thông tin độc hại nào trên nền tảng, tuy nhiên, kẻ xấu luôn tìm ra cách vượt mặt", bà Sheryl Sandberg chia sẻ trên WSJ hồi tháng 8. "Bạn biết đấy, quan điểm cá nhân của người này có thể trở thành phát ngôn gây thù ghét với một người khác".
Đại diện Facebook cho biết, phần lớn nội dung được gỡ khỏi mạng xã hội được thực hiện một cách chủ động. Từ tháng 4 đến tháng 6, 99,6% tài khoản giả mạo, 99,8% tin rác, 99,5% nội dung và hình ảnh bạo lực, 98,5% nội dung khủng bố và 99,3% ảnh khỏa thân trẻ em và nội dung xâm hại tình dục đã được xác định và xóa bằng công nghệ mà không cần người dùng báo cáo.