Filter... dành cho giọng nói

Người dùng mạng xã hội ngày nay chắc chắn đã quá quen thuộc với filter - bộ lọc chỉnh sửa khiến mỗi tấm ảnh của người dùng trở nên đẹp hơn, thú vị hơn, nhưng Tập đoàn Công nghệ SoftBank, trụ sở chính tại Nhật Bản, lại đang phát triển ứng dụng trí tuệ nhân tạo (AI) để tạo ra filter… cho âm thanh, với mục tiêu biến những la hét giận dữ trở nên êm dịu hơn.

Thứ sáu, ngày 18/10/2024 - 16:54

0:00 / 0:00

0:00

Quy trình xử lý âm thanh. Ảnh: SOFTBANK

Theo đại diện phát ngôn của SoftBank: “Gánh nặng lớn nhất đối với các nhân viên chăm sóc khách hàng là phải lắng nghe những ngôn từ lăng mạ, khiếm nhã đến từ khách hàng, thậm chí là mắc kẹt trong các cuộc hội thoại như vậy hàng giờ đồng hồ mỗi ngày!”, do đó để cải thiện môi trường làm việc cho những nhân viên trực tổng đài chăm sóc khách hàng, các công ty, nhà điều hành doanh nghiệp cần đến những giải pháp công nghệ.

Trên thực tế, họ có thể ứng dụng AI ngay trong việc xử lý khiếu nại của khách hàng, chẳng hạn như dịch vụ trả lời tự động, nhưng điều mà một khách hàng đang giận dữ luôn đòi hỏi lại là… lời xin lỗi chân thành đến từ một cá nhân cụ thể.

Toshiyuki Nakatani, nhân viên phát triển phần mềm của SoftBank đã nảy ra ý tưởng về filter dành cho giọng nói… khi đang xem một chương trình truyền hình: “Nếu giọng la hét của khách hàng dễ nghe giống như nhân vật hoạt hình thì chắc chắn sẽ bớt đáng sợ hơn!”.

Ngay khi đề xuất ý tưởng, Nakatani đã được lãnh đạo thông qua. Nhóm của anh bắt đầu bằng việc “dạy” cho AI những cách biểu đạt, bao gồm các giọng nói la hét, quát mắng, để cải thiện khả năng chuyển đổi giọng nói. Họ thuê 10 diễn viên, ghi âm lại hơn 100 cụm từ phổ biến với nhiều cảm xúc khác nhau, tạo thành hơn 10.000 mẩu dữ liệu giọng nói để đào tạo AI. Sau khi nhận dạng, công nghệ biến đổi âm thanh sẽ chỉnh sửa độ cao và độ uốn của giọng nói để làm dịu đi đoạn hội thoại mà không thay đổi nội dung. Thí dụ, giọng the thé của phụ nữ sẽ được hạ thấp để ít chói tai hơn, âm trầm đanh thép của người đàn ông có thể được nâng lên cao để trở nên… nhẹ nhàng hơn. Và nội dung đương nhiên được giữ nguyên nhằm bảo đảm nhân viên chăm sóc khách hàng có thể nhận được đủ thông tin để tư vấn chính xác nhất với yêu cầu.

Bên cạnh đó, với công nghệ này, nếu AI xác định rằng cuộc nói chuyện độc hại đã kéo dài quá lâu, thông báo tự động sẽ được gửi đi, thí dụ: “Chúng tôi rất tiếc phải thông báo với bạn rằng chúng tôi sẽ tạm dừng dịch vụ của mình”.

Với tất cả biện pháp đó, Nakatani cùng đội ngũ của mình hy vọng rằng: “AI cùng công nghệ của chúng tôi có thể trở thành lá chắn tinh thần, giúp nhân viên tư vấn, chăm sóc khách hàng không bị căng thẳng quá mức!”.

NAM NAM