Theo tiến sĩ Joseph Atick thuộc Đại học Rockerfeller, thành phố New York (Mỹ), phương pháp "huấn luyện" phần mềm nhận dạng khuôn mặt sẽ trải qua ba bước:
Với phần mềm chưa được huấn luyện, ảnh chụp khuôn mặt ban đầu chỉ là tập hợp nhiều điểm ảnh ("pixel"). Những điểm ảnh này sau đó sẽ được chuyển đổi thành một chuỗi các con số đại diện cho cường độ và phương hướng của ánh sáng và bóng tối ở mỗi điểm. Từ đó, phần mềm sẽ có thể nhận ra những hình mẫu tương ứng với bộ phận trên mặt như hốc mắt, quai hàm, và chóp mũi...
Để học cách nhận biết khuôn mặt, phần mềm sẽ được dạy cách quan sát một số những điểm mốc cụ thể, thường là 68 điểm trên mặt với vị trí đặc trưng cho mỗi người (ví dụ như khoảng cách giữa hai khóe mắt, độ sâu hốc mắt, độ dài quai hàm, độ rộng chóp mũi,...).
Tập hợp những điểm mốc này vì thế cũng thường được nhà nghiên cứu và nhà khoa học gọi là "dấu vân mặt", tương tự như "dấu vân tay".
Tới bước thứ ba, phần mềm đã có thể nhận diện khuôn mặt, nhưng chỉ khi đối tượng nhìn trực diện vào ống kính. Vì vậy, phần mềm tiếp theo sẽ được dạy cách tự thu phóng và xoay lại dữ liệu "điểm mốc" của gương mặt bị lệch hướng về đúng hướng trực diện.
Tiến sĩ Joseph Atick chia sẻ trước kia, ông cùng đồng nghiệp thường phải tự tay viết thuật toán nhận diện khuôn mặt. Hiện, quá trình này chủ yếu ứng dụng thuật toán học máy ("machine learning"), nhưng con người vẫn tham gia với vai trò cung cấp thêm hình ảnh để khiến công nghệ chính xác hơn.
Theo Joseph Atick, phần mềm nhận diện khuôn mặt chỉ có độ chính xác tương đương với bộ dữ liệu đầu vào. Nếu những hình ảnh đầu vào chỉ bao gồm một nhóm người, phần mềm sẽ phát sinh lỗi khi nhận diện những cá nhân không có mặt trong nhóm ấy. Đây là vấn đề với nhiều hệ thống nhận diện khuôn mặt tại Mỹ vì các bộ dữ liệu đầu vào thường chủ yếu bao gồm những đối tượng là đàn ông và da trắng.
Bên cạnh phương pháp nhận diện khuôn mặt trên, Joseph Atick cho biết còn tồn tại một số kỹ thuật khác nhưng cũng sẽ hoạt động theo nguyên lý tương tự.
Ví dụ, với phương pháp Phân tích Kết cấu Da, chuyên gia sẽ chụp ảnh một vùng da, gọi là "dấu vân da". Vùng da này sẽ được chia thành nhiều khối nhỏ hơn và được thuật toán xử lý với mục đích nhận dạng đường nét, nếp nhăn, và lỗ chân lông. Độ chính xác của phương pháp Phân tích Kết cấu Da được cho là có thể phân biệt được hai người sinh đôi với nhau, trong khi đây là điều bất khả thi đối với phương pháp nhận diện khuôn mặt thông thường.
Quốc Đạt (Theo California Sunday, How Stuff Works)