Bên cạnh ChatGPT của OpenAI, Midjourney cũng đang gây chú ý ở lĩnh vực AI khi có khả năng tạo ảnh như thật chỉ thông qua một đoạn mô tả ngắn bằng văn bản. Tháng trước, AI này tạo ảnh cựu tổng thống Mỹ Donald Trump bị bắt, hay Giáo hoàng Francis mặc áo khoác trắng thời trang. Hai bức ảnh được chia sẻ rầm rộ trên mạng xã hội với đa số người dùng tin là thật, theo Washington Post.
Midjourney ra mắt từ 2021 nhưng rộ lên từ giữa năm ngoái sau khi cho phép tạo những bức tranh nghệ thuật và những bức ảnh như thật. Chỉ sau vài tháng, hàng triệu người đã dùng AI để tạo ảnh, dựng phim, làm bìa tạp chí, tranh minh họa... Nhưng sau đó, công cụ này liên tiếp gây tranh cãi khi được sử dụng cho mục đích chính trị, hay bị giới họa sĩ phản ứng khi giúp một họa sĩ giành giải trong cuộc triển lãm hội họa tại Hội chợ bang Colorado 2022.
Đội ngũ phát triển ẩn mình
Midjourney được đánh giá là một ví dụ rõ ràng cho thấy sự phát triển của trí tuệ nhân tạo nhanh đến mức nào. Chỉ trong hơn một năm, AI này đã thu hút hơn 13 triệu người dùng. Nền tảng từng hoạt động miễn phí, còn hiện thu phí 10-30 USD cho các gói từ cơ bản đến nâng cao.
Là một trong số những công ty tiên phong về AI vẽ tranh, website Midjourney liệt kê số lượng thành viên rất ít, với đồng sáng lập kiêm CEO David Holz, bốn cố vấn, một nhóm nghiên cứu và kỹ thuật gồm 8 người, cùng hai người khác ở bộ phận pháp lý và tài chính. Công ty cho biết đội ngũ hơn 30 người "làm nhiệm vụ điều hành, hướng dẫn" và đang tuyển dụng thêm. Con số này ít hơn so với hàng trăm người của OpenAI hay hàng nghìn người trong bộ phận AI của Microsoft, Google.
Trong phỏng vấn với Washington Post tháng 9 năm ngoái, Holz nói Midjourney là một phòng thí nghiệm nhỏ gồm 10 người, không có nhà đầu tư, làm vì đam mê, mục tiêu là tạo ra nhiều tác phẩm đẹp cùng khả năng mở rộng sức mạnh và trí tưởng tượng của thế giới. Ngoài ra, gần 40 người làm nhiệm vụ phụ trách thị trường trên toàn cầu, nhưng không phải nhân viên chính thức và chỉ số ít được nhận tiền công.
Theo hồ sơ trên LinkedIn, Holz có kinh nghiệm về nghiên cứu ở Viện Max Planck, sau đó phát triển cảm biến từ xa tại NASA với vai trò nghiên cứu sinh vào năm 2008. Khi đang theo học chương trình tiến sĩ về toán ứng dụng tại Đại học Bắc Carolina năm 2010, ông nghỉ học để thành lập Leap Motion - công ty chuyên phát triển công nghệ nhận dạng cử chỉ cho trải nghiệm VR. Các công nghệ của Leap Motion đã được nghiên cứu từ 2008, nhưng hai năm sau startup này mới chính thức ra đời.
Năm 2021, Holz rời Leap Motion để thành lập Midjourney. Chỉ một năm sau, công ty trở nên nổi tiếng trong lĩnh vực AI khi tạo ra nhiều tác phẩm với độ chân thực cao chỉ bằng các mô tả đơn giản. Tuy nhiên, đến nay đội ngũ phía sau vẫn là ẩn số, trừ một ít thông tin về CEO. Theo hồ sơ do Washington Post thu thập, Holz cũng là người duy nhất "có lợi ích tài chính trong công ty". Năm ngoái, Emad Mostaque, Giám đốc Stability AI - công ty phát triển Stable Diffusion, cho biết trên Discord rằng đã đầu tư vào Midjourney. Đại diện Stability AI sau đó nói lại là họ chỉ "góp một khoản rất nhỏ".
AI gây tranh cãi
Shane Kittelson, nhà thiết kế và nghiên cứu web ở Boca Raton, dành khoảng vài giờ mỗi đêm để sử dụng Midjourney. Ông chủ yếu dùng AI này để tạo các nhân vật cổ điển hoặc viễn tưởng và đăng lên Twitter. Gần đây, ông thử các hình ảnh nhạy cảm hơn, liên quan đến chính trị như Donald Trump bất tỉnh trên cát hay Barack Obama ngập trong tiền USD. Trong mỗi ảnh, ông dán nhãn do AI tạo ra, vì "độ chân thực của nó rất lớn và sợ người dùng hiểu nhầm".
Seb Diaz, người dùng ở Ontario, cũng có sở thích tạo ảnh từ Midjourney. Ông ra lệnh cho AI này cho ra ảnh giả có nội dung như những đứa trẻ sững sờ ở sân bay Portland; đội cứu hộ giải thoát người dân bị mắc kẹt khỏi đống đổ nát; hay ảnh của phóng viên đang đưa tin trực tiếp tại hiện trường.
Sau khi đăng trên Reddit, một số người xem nói "choáng váng" về độ chân thực của những hình ảnh đó. "Mọi người ở năm 2100 sẽ không biết phần nào của lịch sử là sự thật", một tài khoản bình luận. "Không sớm thì muộn, công cụ này sẽ được dùng cho mục đích chiến tranh", một tài khoản khác lo ngại.
Trong cuộc đua xây dựng AI tạo ảnh, Midjourney đã sớm dẫn đầu so với các đối thủ, nhưng cũng khiến họ bị nhiều người phản đối. Đầu năm nay, ba nghệ sĩ đệ trình lên tòa án Quận Bắc California, cáo buộc Midjourney và hai công ty khác vi phạm luật bản quyền bằng cách sử dụng "hàng tỷ hình ảnh có bản quyền mà không được phép" để đào tạo AI, đồng thời yêu cầu "chấm dứt sự vi phạm trắng trợn và quy mô lớn này".
Đầu năm ngoái, trên Discord, Holz thừa nhận sử dụng các tác phẩm từ 4.000 nghệ sĩ. Dù vậy, ông dẫn điều khoản của công ty để không chịu trách nhiệm về việc Midjourney tự động thu thập thông tin.
Trong buổi livestream trên Discord ngày 29/3, Holz nói với khoảng 2.000 người xem rằng đội ngũ Midjourney đang gặp khó khăn trong việc xác định quy tắc về nội dung, đặc biệt là khả năng mô tả người thật. "Khi hình ảnh càng chân thực hơn và các công cụ càng trở nên mạnh mẽ hơn, sự phân biệt sẽ càng khó", ông nói. "Có một cuộc tranh cãi giữa việc chọn Disney hay miền Tây hoang dã. Hiện tại, chúng tôi đang ở giữa với cảm giác đau đớn".
Thực tế, khả năng kiểm duyệt nội dung của Midjourney đang ở lưng chừng. Nếu như Dall-E của OpenAI từ chối tạo hình ảnh liên quan đến chính trị gia, Stable Diffusion hạn chế hình ảnh khiêu dâm, bạo lực, Midjourney có cả hai nội dung này.
Trước các phản ứng, Holz cho biết Midjourney đang tinh chỉnh công cụ kiểm duyệt AI nhằm xem xét các hình ảnh được tạo, từ đó phát hiện hành vi sai trái. Công ty cũng ngừng cho dùng thử miễn phí vì "nhu cầu cao bất thường và lạm dụng" từ phía người dùng kể từ đầu tuần trước.
Bảo Lâm