"Xin cảm ơn quý khách H đã mua sản phẩm B có giá 1.390.000 đồng tại fptshop và nhận hàng tại FPT Shop 216 Thái Hà. Vui lòng nhấn phím 1 để xác nhận đơn hàng, nhấn phím 2 để hủy đơn hàng, nhấn phím 0 để nhận cuộc gọi tư vấn từ tổng đài viên" là giọng nói quen thuộc gọi đến người đặt mua một số sản phẩm trên website của Công ty cổ phần bán lẻ kỹ thuật số FPT (FRT) sau 5 phút.
Nhiều người nghe đều nghĩ là tiếng của nhân viên tổng đài mà không biết đó là tính năng chuyển đổi text to speech (từ văn bản sang giọng nói) đang được Công ty FRT triển khai trong hệ thống bán hàng từ đầu năm nay. Trước đây khi chưa dùng tính năng trên, FRT cần 5-7 nhân viên làm nhiệm vụ này.
Ông Từ Hoàng Thái, Trưởng phòng Kinh doanh Ecommerce FRT cho biết, khi khách hàng đặt mua sản phẩm online trên hệ thống, phần mềm text to speech sẽ nhận diện đúng tên khách hàng, thời gian, địa điểm, sản phẩm và tự động gọi lại. Phần mềm có thể nhận diện người đó thuộc vùng miền nào để đưa ra giọng nói phù hợp. "Đây là ưu điểm nhiều công nghệ khác không làm được", ông Thái nói.
Thời gian tới, đơn vị sẽ áp dụng công nghệ này trong việc nhắc thời hạn thanh toán, chấm điểm chất lượng dịch vụ, thay thế dần con người làm những công việc lặp đi lặp lại với năng suất cao hơn rất nhiều. Dự kiến hết năm 2018, công ty sẽ tiết kiệm khoảng 150 triệu mỗi tháng cho các chi phí văn phòng, vận hành, nhân sự. Công việc này thường phải sử dụng tới 20 nhân sự.
Text to speech FRT đang sử dụng là một trong những sản phẩm trí tuệ nhân tạo (AI) của Ban công nghệ Tập đoàn FPT - doanh nghiệp tiên phong ở Việt Nam đưa AI ứng dụng vào cuộc sống. Năm 2017, tập đoàn đã trình làng FPT.AI là nền tảng hỗ trợ con người trong quá trình tự động ra quyết định.
Giám đốc Công nghệ Lê Hồng Việt cho biết, hệ thống tổng đài tự động sử dụng dịch vụ chuyển đổi văn bản thành giọng nói của FPT.AI đã thực hiện hơn 750.000 cuộc gọi mỗi tháng và có thể triển khai đồng thời 15.000 cuộc gọi, mỗi cuộc kéo dài 2 phút. Trong khi để làm việc này trong một giờ cần tới 500 người.
Tính năng này được phát triển cách đây khoảng 5 năm, với độ đa dạng về giọng (nam, nữ) và vùng miền (Bắc, Trung, Nam). Phiên bản hiện tại hỗ trợ ba thứ tiếng là Việt, Nhật và Anh.
Không chỉ áp dụng cho các tổng đài, doanh nghiệp viễn thông cũng có thể sử dụng text to speech trong việc thông báo đứt cáp hoặc nối mạng. Ví dụ đơn vị muốn thực hiện 5.000 cuộc gọi thông báo sự cố đứt mạng khu vực Cầu Giấy, yêu cầu trong 30 phút người dùng phải nhận được thông tin này. Lúc này, doanh nghiệp không thể huy động tới 500 nhân viên gọi điện, mà thay vào đó chỉ một cuộc gọi là có thể thông báo một lúc tới 500 người.
Chuyển giọng nói sang văn bản
Hiện FPT còn tạo ra nhiều module tiện ích cho người dùng gồm: speech to text (từ giọng nói sang văn bản), xử lý ngôn ngữ tự nhiên, thị giác máy tính và cơ sở tri thức. Trong đó, speech to text cũng được áp dụng cho các tổng đài chăm sóc khách hàng, hay điều khiển thiết bị thông minh qua giọng nói.
Với tính năng xử lý ngôn ngữ tự nhiên, ông Việt cho biết máy có thể hiểu được con người yêu cầu gì và đưa ra câu trả lời nhờ sự hỗ trợ của công nghệ. FPT đã sử dụng ứng dụng trên để xây dựng các chatbot (trợ lý ảo) trong nhiều lĩnh vực.
Như lĩnh vực tài chính ngân hàng, chatbot sẽ trả lời tự động, giúp người dùng tra cứu tỷ giá, chương trình khuyến mại, vị trí cây ATM hay chuyển khoản, tra cứu số dư. Các đại học có thể sử dụng chatbot để tư vấn tuyển sinh, tra cứu điểm. Trong y tế, người dùng đặt lịch khám với bác sĩ, khuyến nghị đơn thuốc.
Video: Ban công nghệ FPT
Xử lý ảnh (thị giác máy tính) là module mới của FPT.AI, tập trung vào việc cho phép tự động hóa các quy trình xử lý cho doanh nghiệp. Trong đó, nhận dạng hình ảnh, nhận dạng mẫu, nhận dạng ký tự quang học là các tính năng chính.
Tính năng này nhằm chụp và số hóa tất cả giấy tờ căn bản như chứng minh thư nhân dân, bằng lái xe, hóa đơn. Ví dụ, ngân hàng muốn làm thủ tục cho khách hàng thì chỉ cần lựa chọn tính năng này, máy có thể tự điền thông tin đúng theo mẫu chung mà không cần công đoạn nhập liệu thủ công.
Với hệ cơ sở tri thức, máy sẽ có suy nghĩ như con người. FPT.AI cung cấp nền tảng giúp máy móc có thể học, trích xuất và khám phá kiến thức. Trên cơ sở này, doanh nghiệp có thể kết hợp các dữ liệu riêng của mình như thông tin về sản phẩm, hướng dẫn sử dụng với kiến thức ngành riêng biệt để tạo nên mạng lưới khái niệm và mối liên hệ.
Từ sơ đồ này, nền tảng sẽ cung cấp khả năng đặt câu hỏi và trả lời dựa trên dữ liệu kiến thức cung cấp đầu vào. Module cơ sở trí thức sẽ đóng vai trò như một bộ não, cung cấp thông tin để giao tiếp với con người.
Trí tuệ nhân tạo (Artificial Intelligence - AI) được hiểu là trí tuệ của máy móc do con người tạo ra. Nó có thể nghe, nhìn, tư duy, suy nghĩ, thậm chí học hỏi yếu tố mới như con người. Không chỉ vậy, AI có khả năng xử lý dữ liệu ở mức rộng lớn hơn, thậm chí nhanh hơn so với con người. Tại Việt Nam, việc nghiên cứu AI bắt đầu manh nha từ đầu những năm 1970 khi môn học về AI đã được đưa vào giảng dạy cho sinh viên ngành tin học ở một vài trường đại học. Những thế hệ tiên phong trong nghiên cứu, phát triển, và đào tạo nguồn nhân lực AI tại Việt Nam là giáo sư Nguyễn Văn Ba, Bạch Hưng Khang, Phan Đình Diệu, Hoàng Kiếm. Đến nay, nhiều doanh nghiệp lớn ở Việt Nam cũng bắt tay vào nghiên cứu như Viettel đẩy mạnh nghiên cứu và cho ra đời những giải pháp Chính phủ điện tử, quản lý giáo dục, quản lý và đôn đốc bán hàng cho chuỗi phân phối, hệ thống văn phòng điện tử (Voffice). |