Prompt engineer - kỹ sư ra lệnh - là nghề mới, được săn đón khi các mô hình AI tạo sinh trở nên phổ biến trong cộng đồng. Điểm đặc biệt của kỹ sư prompt là không yêu cầu bằng cấp về máy tính hay kỹ năng lập trình, nhưng cần một số yếu tố nhất định.
Ngoại ngữ
Theo tiến sĩ Đinh Viết Sang, Trưởng phòng thí nghiệm Foundation Models, Phó Giám đốc Trung tâm BKAI - Đại học Bách khoa Hà Nội, điểm mạnh của mô hình ngôn ngữ lớn là có thể cho ra câu trả lời nhanh dựa trên việc tổng hợp lượng thông tin lớn. Tuy nhiên, một hạn chế của chúng là dễ cho ra câu trả lời "ảo giác" nếu người dùng không hỏi đúng cách. Công việc của kỹ sư prompt là đặt câu hỏi đúng để AI có thể đưa ra các câu trả lời theo ý muốn.
Ông Sang cho rằng một trong những rào cản lớn với người Việt khi muốn trở thành kỹ sư prompt giỏi là ngôn ngữ. Hầu hết mô hình AI tạo sinh lớn hiện nay dùng tiếng Anh làm ngôn ngữ chính để huấn luyện. Một số AI như ChatGPT có thể hiểu tiếng Việt, nhưng chưa hoạt động hiệu quả như tiếng Anh khi cần làm việc với các câu lệnh chuyên sâu để giải quyết các tác vụ phức tạp. Do đó, để trở thành một kỹ sư prompt cần có khả năng giao tiếp với AI bằng tiếng Anh.
Khả năng diễn đạt
Khác với kỹ sư lập trình, kỹ sư prompt không cần giỏi ngôn ngữ lập trình nhưng phải có khả năng diễn đạt tốt. Để tìm được câu trả lời hoặc đáp án chính xác phụ thuộc nhiều vào việc kỹ sư prompt có biết cách đặt câu hỏi đúng hay không. Các mô hình học máy không có khả năng phân tích trực giác tốt để hiểu người dùng muốn gì nếu không được yêu cầu rõ ràng.
Ông Sang lấy ví dụ một người dùng Midjourney để vẽ tranh có thể gõ lệnh cho AI vẽ một tác phẩm về đồng quê Việt Nam. Nhưng với một prompt, họ sẽ thêm các câu lệnh như ảnh không được mờ, độ phân giải cao...
Tương tự lập trình viên, họ cũng phải biết cách hỏi làm sao để hạn chế việc AI bịa câu trả lời. Kỹ sư prompt sẽ thêm các mệnh đề như: Nếu điều gì bạn không chắc chắn thì đừng trả lời, hoặc bắt đầu câu hỏi bằng từ khóa như: giả sử bạn là chuyên gia trong lĩnh vực tài chính, hãy cho tôi biết...
Ngoài ra, không nhập câu hỏi chung chung, có phạm vi quá rộng như: "Phim thắng giải điện ảnh?". Với câu hỏi này, AI sẽ liệt kê danh sách dài những bộ phim thắng giải thưởng liên quan đến phim ảnh mỗi năm. Kỹ sư prompt sẽ biết cách giới hạn chủ đề, như "phim giành giải Oscar cho Phim hay nhất 2019?".
Kiến thức nền tảng
Theo ông Sang, dù không cần quá am hiểu chuyên sâu về công nghệ, người làm prompt cần có kiến thức nền tảng trong lĩnh vực mình theo đuổi. Ví dụ với việc lập trình, họ cần biết lập trình cơ bản và tư duy phân tích thiết kế hệ thống để mô-đun hóa thành từng phần nhỏ và ra lệnh để AI lập trình từng phần. Sau đó, họ sẽ chỉnh sửa, ghép nối thành hệ thống hoàn chỉnh và kiểm thử toàn hệ thống.
Tương tự trong lĩnh vực hội họa, để tạo được bức tranh đúng ý, người dùng không chỉ cần nhập các lệnh prompt chuẩn mà còn có hiểu biết nhất định về các phong cách hội họa, chất liệu, màu sắc, ánh sáng...
Một vấn đề khác của prompt là các mô hình nền tảng, điển hình là mô hình ngôn ngữ lớn vẫn đang phát triển, nên prompt cũng sẽ thay đổi. Kỹ sư phải liên tục cập nhật về mô hình AI, các mẫu câu lệnh mới nhất để nâng cao hiệu quả công việc.
"Nghề kỹ sư prompt" sẽ là một trong các chủ đề được thảo luận tại sự kiện CTO Summit 2023. Sự kiện diễn ra trong khuôn khổ Ngày hội Trí tuệ nhân tạo Việt Nam - AI4VN 2023, do Bộ Khoa học và Công nghệ chỉ đạo, báo VnExpress tổ chức vào ngày 21-22/9 tại Riverside Palace, 360D Bến Vân Đồn, quận 4, TP HCM. Chương trình có nhiều hoạt động như: AI workshop; AI Summit; Vinh danh các công ty có môi trường công nghệ nhất; triển lãm AI Expo, AI Show, gian hàng tuyển dụng.
Khương Nha