Năm 1971, một người đàn ông tên Clifford Irving đến New York giao dịch với các nhà xuất bản để cho ra mắt cuốn tự truyện của Howard Hughes, nhà tỷ phú sống ẩn dật tại quần đảo Bahamass từ 15 năm qua. Irving cam đoan Hughes đã thỏa thuận hợp tác để hướng dẫn anh ta viết tự truyện và ủy quyền tìm đối tác tổ chức xuất bản. Để chứng minh mối quan hệ, Irving trưng ra một số thư từ của Hughes. Nhà xuất bản McGraw-Hill nhanh tay mua bản quyền 1.200 trang bản thảo với số tiền trả trước 765.000 USD. Sau đó, Hughes lên tiếng bác bỏ câu chuyện bịa đặt của Irving.
Trước tình huống này, các phóng viên hãng NBC đã phỏng vấn Hughes qua điện thoại và đối chiếu băng ghi âm với những lần phỏng vấn năm 1947. Họ khẳng định đúng là giọng của Hughes. Irving cãi chày cãi cối rằng có người mạo danh nhà tỷ phú. NBC gõ cửa chuyên gia nhờ phân tích giọng nói và kết luận đúng là giọng của Hughes. Irving bị bắt, tòa buộc hắn phải trả tiền lại cho nhà xuất bản và nhận án 30 tháng tù.
Cách đây 100 năm, nhà khoa học Mỹ Alecxander Melville Bell đã chứng minh mỗi người đều có giọng nói riêng. Sau đó, con trai ông là Alecxander Graham Bell đã thành lập phòng thí nghiệm và năm 1941 đã chế tạo thành công máy phổ ký thanh âm có chức năng hiển thị giọng nói thành biểu đồ. Kỹ sư Kersta áp dụng kỹ thuật này để phân tích hơn 50.000 giọng nói với kết quả chính xác đạt 99,65%.
Giọng nói mỗi người khác nhau, nhờ hai yếu tố không ai giống ai: kích cỡ vòm âm thanh như vòm họng, vòm miệng và vòm mũi; cũng như hình dạng, chiều dài, độ căng của các dây thanh âm trong thanh quản; cơ chế phối hợp giữa các cơ quan phát âm và các cơ môi (răng, môi, lưỡi, ngạc mềm, cơ hàm…). Trong công tác điều tra tội phạm, các giám định viên sử dụng máy phổ ký để so sánh giọng nói. Điều tiên quyết là họ phải có bản ghi giọng nói của nghi can và bản ghi giọng nói gốc của người bị giả giọng. Khi ghi âm, giám định viên thường yêu cầu nghi can lặp lại chính xác từng từ trong bản gốc (nếu thể hiện đúng trạng thái tình cảm thì càng tốt). Sau đó, giám định viên sử dụng kết hợp hai phương pháp xác minh:
- Nghe băng ghi âm để tìm ra sự khác nhau và giống nhau giữa các đơn âm và các chuỗi âm; so sánh nhịp thở, sự uyển chuyển, trọng âm, phương ngữ và các thói quen không bình thường khi nói.
- Cho máy phổ ký đọc băng ghi âm và phân tích kết quả ảnh phổ.
Trong biên bản kết luận, giám định viên sẽ ghi 1 trong 5 kết luận: chắc chắn giống nhau (có 20 âm tiết trở lên giống nhau); có thể giống nhau; chắc chắn khác nhau (có 20 âm trở lên khác nhau); có thể không giống nhau và không quyết định được.
Ứng dụng ảnh phổ trong điều tra xét xử
Tại Mỹ, cơ quan điều tra tại Michigan là đơn vị đầu tiên áp dụng kỹ thuật phân tích ảnh phổ giọng nói. Không bao lâu sau, ảnh phổ giọng nói bắt đầu được tòa án Mỹ sử dụng như chứng cứ khoa học trước tòa. |
Năm 1923, tòa phúc thẩm, quận Columbia bang Washington đưa ra ý kiến này và sau đã trở thành án lệ trong tiệc chấp nhận các chứng cứ khoa học trước tòa. Đó là một phương pháp luận mới về bằng chứng khoa học phải được giới khoa học cùng lĩnh vực truyền thông công nhận. Ngoài ra, cũng đòi hỏi bồi thẩm đoàn phải hiểu được phương pháp luận đã nêu ở trên. Dù vậy, mãi đến năm 1975, Mỹ với ban hành Quy tắc vàng về bằng chứng của liên bang, cho phép thẩm phán chấp nhận các phương pháp luận mới về bằng chứng, trong đó có phương pháp phân tích ảnh phổ giọng nói.
Theo phán quyết về bằng chứng của liên bang, thẩm phán là người quyết định độ tin cậy của các phương pháp luận mới về bằng chứng khoa học. Khi chấp nhận phương pháp nào thì họ phải chấp nhận kết quả của phương pháp ấy, và có thể yêu cầu giám định viên trình bày ý kiến trước tòa.
Đối với phương pháp phân tích ảnh phổ giọng nói, trong thực tế khi giám định viên đưa ra kết luận giống nhau, thẩm phán không thể nhận định mức độ có thể này như thế nào. Do đó thường yêu cầu giám định viên trình bày thêm tỷ lệ phần trăm đáng tin cậy theo nhận định của giám định viên. Ví dụ như: “Tôi tin tưởng kết quả có thể giống nhau chính xác khoảng 90%”.
Những người thường xuyên làm việc với kỹ thuật so sánh ảnh phổ giọng nói khẳng định kỹ thuật đạt độ tin cậy rất cao. Năm 1996, Cục điều tra liên bang Mỹ đã tiến hành khảo sát và nhận thấy trong 2.000 trường hợp dược phân tích, so sánh âm giọng, tỷ lệ sai chỉ có 0,31%. Dù vậy cho đến nay vẫn chưa có công trình nghiên cứu quy mô nào về kỹ thuật này nên trong giới nghiên cứu ngôn ngữ học và ngữ âm học vẫn còn thấy nhiều ý kiến khác nhau. Nói chung, các nhà khoa học cho rằng kỹ thuật so sánh ảnh phổ giọng nói không thể chính xác như ký thuật so sánh vân tay. Từ đó cũng phát sinh hai quan điểm trong các thẩm phán: chấp nhận và không chấp nhận kỹ thuật này như chứng cứ khoa học hợp lệ.
Tháng 5/1976, một kẻ nặc danh gọi đến Sở cảnh sát Augusta (bang Maine) đe dọa sẽ cho nổ bom sân bay Augusta. Cảnh sát đã ghi âm cuộc gọi điện đàm và điều tra, phát hiện giọng nói hăm dọa trên điện thoại giống với giọng của nghi can Thomas Williams. Cảnh sát triệu tập anh ta và yêu cầu đọc một câu đe dọa khủng bố có nội dung như câu của kẻ nặc danh, sau đó gửi hai cuộn băng đến một tiến sĩ đại học Michigan và trung úy cảnh sát Michigan nhờ xác minh giọng nói. Cả hai phân tích được tiến hành độc lập, nhưng cùng có chung kết luận rằng hai giọng nói là chắc chắn giống nhau - Williams chính là thủ phạm gọi điện thoại đe dọa khủng bố. Phiên sơ thẩm đã chấp nhận chứng cứ khai thác từ phương pháp phân tích giọng nói bằng ảnh phổ. Williams kháng cáo với lý do tòa làm sai luật, khi giới khoa học chưa công nhận rộng rãi độ tin cậy của phương pháp phân tích giọng nói. Tuy nhiên, Quy tắc về bằng chứng của bang Maine ban hành năm 1976 tương quan với Quy tắc về bằng chứng của liên bang năm 1975, khẳng định: “Nếu kiến thức về khoa học, kỹ thuật hoặc về các chuyên môn khác giúp người xét xử nắm được tình tiết vụ án, giám định viên có thể trình bày ý kiến trước tòa để thẩm phán xem xét”. Do vậy, tòa án tối cao bang Maine khẳng định tòa sơ thẩm áp dụng đúng luật và bác đơn kháng cáo của Williams. |
Pháp Luật TP HCM (theo Expertpages&Forensic Voiceprints)