Được tuyển dụng để cải tiến đầu ra cho AI của Google, nhiều chuyên viên cảm thấy áp lực, lương thấp và bấp bênh dù đang trong thời kỳ "sốt AI".

Mùa xuân 2024, chuyên viên viết tài liệu kỹ thuật Rachael Sawyer nhận được lời mời tuyển dụng trên LinkedIn cho vị trí mơ hồ: nhà phân tích văn bản. Sawyer tưởng mình sẽ viết nội dung tương tự những gì từng làm, nhưng ngay ngày đầu tiên, cô phát hiện công việc thực chất là đánh giá và điều chỉnh nội dung do AI tạo ra.

Sawyer là một trong số hàng nghìn nhân viên AI được Google ký hợp đồng thông qua công ty GlobalLogic thuộc tập đoàn Hitachi (Nhật Bản) để đánh giá và kiểm duyệt đầu ra của sản phẩm AI, gồm chatbot chủ lực Gemini và tính năng tóm tắt kết quả tìm kiếm AI Overviews. Google cũng ký hợp đồng với các công ty khác, ví dụ Accenture, để cung cấp dịch vụ đánh giá.

"Là người đánh giá, chúng tôi đóng vai trò quan trọng vì các kỹ sư không có thời gian tinh chỉnh và nhận phản hồi cần thiết cho bot giữa lúc phải xử lý code và các thứ khác. Chúng tôi giống như đội cứu hộ trên bãi biển, giúp đảm bảo không có điều gì xấu xảy ra", Alex, chuyên viên đánh giá kết quả đầu ra của AI từ năm 2023, giải thích với Wired.

Logo Gemini trên website cho smartphone. Ảnh: Bảo Lâm

Quy trình tuyển dụng

Google dần trở lại cuộc đua AI trong năm qua với hàng loạt sản phẩm cạnh tranh với ChatGPT của OpenAI. Mô hình lý luận tiên tiến nhất của hãng, Gemini 2.5 Pro, được đánh giá tốt hơn o3 của OpenAI, theo LMArena - bảng xếp hạng hiệu suất các mô hình trí tuệ nhân tạo.

Mỗi mô hình mới đều đi kèm lời hứa về độ chính xác cao hơn, đồng nghĩa với mỗi phiên bản, đội ngũ đánh giá AI phải nỗ lực ngày đêm để kiểm tra xem phản hồi có an toàn cho người dùng hay không. Họ dạy chatbot cách trả lời thích hợp về nhiều lĩnh vực như y học, kiến trúc, vật lý thiên văn, sửa lỗi và tránh kết quả đầu ra độc hại.

Google, giống nhiều công ty công nghệ khác, tuyển nhân viên dữ liệu thông qua các công ty trung gian, như GlobalLogic. Tại đây, đội ngũ đánh giá AI được chia thành hai nhóm lớn: chuyên viên tổng quát và chuyên viên cấp cao. Trong nhóm cấp cao, có những nhóm nhỏ với kiến thức chuyên môn sâu rộng. Guardian dẫn nguồn tin thân cận cho biết, đa số chuyên viên được tuyển dụng ban đầu cho vị trí này là giáo viên, ngoài ra có nhà văn, thạc sĩ mỹ thuật, tiến sĩ vật lý.

Những nhân viên như Sawyer nằm ở tầng giữa của chuỗi cung ứng AI toàn cầu. Họ nhận lương cao hơn nhân viên dán nhãn dữ liệu ở châu Phi và Nam Mỹ, nhưng thấp hơn nhiều so với các kỹ sư thiết kế mô hình ở Mountain View (Mỹ). Người đánh giá tổng quát nhận lương khởi điểm 16 USD một giờ còn chuyên gia là 21 USD.

GlobalLogic tuyển dụng cho Google từ năm 2023, ban đầu có 25 chuyên viên cấp cao. Khi cuộc đua cải tiến chatbot trở nên khốc liệt, công ty mở rộng đội ngũ này lên gần 2.000 người, đa số làm tại Mỹ và kiểm duyệt nội dung tiếng Anh.

Các mô hình AI được con người đào tạo dựa trên khối lượng dữ liệu khổng lồ từ Internet. Ảnh: Rita Liu/Guardian

Công việc áp lực và bấp bênh

10 chuyên viên đánh giá AI của Google chia sẻ với Guardian, họ ngày càng chán nản vì phải làm việc tách biệt, đối mặt với thời hạn ngày càng gấp rút, cảm thấy đang đưa ra một sản phẩm không an toàn cho người dùng.

Một chuyên viên cho biết, ban đầu cô có 30 phút cho mỗi nhiệm vụ, nhưng sau 6 tháng, thời gian giảm còn 15 phút, trong khi phải đọc, xác thực, đánh giá khoảng 500 từ với mỗi phản hồi, đôi khi nhiều hơn. Những giới hạn khắt khe khiến cô nghi ngờ về chất lượng công việc cũng như độ tin cậy của AI.

Sawyer, chuyên viên đánh giá tổng quát cho AI của Google từ tháng 3/2024, ban đầu chỉ phân tích ghi chú cuộc họp và cuộc trò chuyện được chatbot Gemini tóm tắt, đồng thời đánh giá phim ngắn do AI tạo. Đôi khi, cô được yêu cầu xử lý, xóa nội dung cực đoan, trong đó có tài liệu bạo lực và tình dục do Gemini tạo ra, chủ yếu là văn bản. Nhưng dần dần, cô bị giao nhiệm vụ chuyên kiểm duyệt những nội dung này.

"Tôi rất sốc khi công việc của mình đòi hỏi xử lý nội dung gây khó chịu như vậy", cô nói và khẳng định không được báo trước về vấn đề này trong quá trình tuyển dụng. Sawyer chia sẻ, áp lực phải hoàn thành hàng chục nhiệm vụ như vậy mỗi ngày, mỗi nhiệm vụ trong vòng 10 phút, khiến cô rơi vào vòng xoáy lo lắng và hoảng loạn mà không có sự hỗ trợ nào về sức khỏe tinh thần từ công ty.

Alex, chuyên viên đánh giá tổng quát từ năm 2023, chưa được tăng lương đáng kể dù phải tham gia những dự án cần nhiều công sức hơn. Cô hiện đã có một vị trí toàn thời gian tại GlobalLogic, nhưng 80% nhân viên dự án của cô vẫn tiếp tục làm theo hợp đồng, không có bất kỳ phúc lợi hay ngày nghỉ được trả lương nào.

Dù ngành AI bùng nổ, công việc của chuyên viên đánh giá lại thiếu ổn định. Từ đầu 2025, GlobalLogic tiến hành nhiều đợt sa thải, khiến tổng số chuyên viên tổng quát và cấp cao giảm còn khoảng 1.500 người.

Andrew Lauzon, chuyên viên đánh giá AI gia nhập GlobalLogic tháng 3/2024, nhận được thông báo sa thải ngày 15/8. Lauzon chia sẻ với Wired: "Tôi đã hỏi lý do, họ chỉ nói là giảm quy mô dự án". Lauzon cho biết. "Làm sao chúng tôi cảm thấy an toàn trong nghề này khi biết mình có thể ra đi bất cứ lúc nào?"

Nhiều chuyên viên cũng mất niềm tin vào sản phẩm mà họ đang giúp hoàn thiện. Họ tránh sử dụng mô hình ngôn ngữ lớn (LLM) hoặc chặn tính năng tóm tắt AI vì giờ đã biết những vấn đề trong quá trình phát triển. Họ cũng không khuyến khích gia đình và bạn bè dùng AI với lý do tương tự.

"Tôi chỉ muốn mọi người biết rằng AI đang được quảng bá như 'phép màu công nghệ' - đó là lý do có một biểu tượng lấp lánh nhỏ bên cạnh phản hồi của AI", Sawyer giải thích. "Nhưng không phải vậy. Nó được xây dựng trên mồ hôi của những người làm việc quá sức và bị trả lương thấp".

Thu Thảo tổng hợp