Shane Jones, trưởng nhóm kỹ sư của Microsoft, cho biết Dall-E 3 của OpenAI tồn tại lỗ hổng bảo mật, cho phép người dùng ra lệnh cho AI tạo những bức ảnh khiêu dâm, tương tự deepfake nhắm vào Taylor Swift. Tuy nhiên, ông cho rằng nhóm pháp lý của công ty đã ngăn ông cảnh báo lỗ hổng tới công chúng. Do đó, ông quyết định gửi thư tới Quốc hội Mỹ vào ngày 30/1.
Trong thư, Jones cho rằng Dall-E 3 nên bị loại khỏi danh mục sử dụng công cộng cho đến khi OpenAI khắc phục vấn đề. Ông phát hiện cách vượt qua lớp bảo vệ của Dall-E 3 đầu tháng 12/2023 và báo với cấp trên tại Microsoft. Người này đề nghị ông thông báo sang cho OpenAI. Sau khi làm theo chỉ dẫn, Jones công khai thông tin trên mạng xã hội LinkedIn, kêu gọi ban giám đốc OpenAI dừng cung cấp Dall-E 3 với lý do Microsoft cũng là thành viên hội đồng quản trị công ty.
Jones cũng thông báo với Microsoft về bài đăng. Tuy nhiên, người quản lý trực tiếp nói bộ phận pháp lý của tập đoàn yêu cầu ông xóa thông tin ngay lập tức và sẽ sớm đưa ra lời giải thích. Ông đã thực hiện theo nhưng không nhận được phản hồi từ nhóm pháp lý, thậm chí khi ông liên hệ cũng không được hồi đáp.
Trong khi đó, người phát ngôn của OpenAI cho biết công ty đã tiến hành điều tra ngay sau khi nhận được thông cáo và đánh giá những kỹ thuật của Jones không thể vượt qua được hệ thống bảo vệ. Mô hình Dall-E 3 cơ bản đã lọc nội dung phản cảm về tình dục hay bạo lực khỏi dự liệu đào tạo, đồng thời cũng phân loại hình ảnh để mô hình AI này không tạo hình ảnh độc hại. Bên cạnh đó, OpenAI nói đã triển khai biện pháp bảo vệ bổ sung cho ChatGPT và Dall-E, như từ chối yêu cầu tạo nội dung về người nổi tiếng.
Về phía Microsoft, người phát ngôn khẳng định công ty sẽ giải quyết mọi mối lo ngại của nhân viên theo chính sách, đánh giá cao nỗ lực của nhân viên trong việc nghiên cứu và thử nghiệm công nghệ mới nhằm nâng cao sự an toàn. Vì báo cáo của Shane Jones liên quan đến sản phẩm của OpenAI, công ty khuyến khích ông thông báo tới các kênh của công ty này. Ngoài ra, Microsoft cho biết đã kiểm tra và xác nhận những kỹ thuật mà Jones báo cáo không vượt qua được các bộ lọc an toàn trong bất kỳ công cụ tạo hình ảnh bằng AI nào của công ty.