Xuất phát từ mong muốn cho ra đời sản phẩm “made in Vietnam”, có thể được sử dụng thông dụng với nhiều tiện ích, thậm chí có thể thay thế các sản phẩm dịch tự động của nước ngoài, nhóm nghiên cứu thuộc Viện Công nghệ thông tin (Viện Hàn lâm Khoa học và Công nghệ Việt Nam) mới đây đã phát triển thành công phần mềm dịch các ngôn ngữ có ít tài nguyên dữ liệu; có thể dịch tự động tiếng Việt ra các ngôn ngữ ở khu vực Đông Nam Á như Khmer, Lào, Thái Lan, Malaysia…
Phó Giáo sư, Tiến sĩ Nguyễn Việt Anh, Trưởng phòng Thí nghiệm khoa học dữ liệu và Ứng dụng (Viện Công nghệ Thông tin) cho biết, dịch máy (dịch tự động) là việc dịch một văn bản từ một ngôn ngữ sang một hoặc nhiều ngôn ngữ khác một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Hiện nay, có nhiều sản phẩm dịch tự động được sử dụng phổ biến như: Google Translate của Google, Bing Translator của Microsoft,… với chất lượng dịch rất tốt cho các câu đơn.
Tuy nhiên, việc dịch một đoạn văn bản dài hơn, có tham chiếu thực thể, ngữ cảnh giữa các câu thì chất lượng dịch bị ảnh hưởng. Ngoài ra, các sản phẩm dịch thuật thương mại yêu cầu khách hàng trả tiền theo thời gian sử dụng hoặc số lượng câu dịch. Bên cạnh đó, các hệ thống này không có chất lượng dịch tốt đồng đều cho tất cả các cặp ngôn ngữ.
Thí dụ, với các ngôn ngữ nghèo tài nguyên dữ liệu như tiếng dân tộc thiểu số của Việt Nam hoặc các ngôn ngữ hiếm như tiếng Lào, Khmer…, chất lượng dịch của Google Translate hay Bing Translator chưa thật sự cao, và chất lượng dịch chưa hiệu quả trong các miền ngôn ngữ mang tính chuyên môn như y tế, luật pháp, an ninh…
Nhóm nghiên cứu tại Viện Công nghệ thông tin đã khắc phục được các bất cập nêu trên. Hệ thống dịch thuật do Viện phát triển lấy tiếng Việt làm trung tâm, có khả năng dịch hai chiều sang các ngôn ngữ nghèo tài nguyên dữ liệu với chất lượng tốt.
Quá trình thử nghiệm cho thấy, phần mềm dịch thuật này có chất lượng tương đương hoặc cao hơn Google Translate đối với cùng văn bản. Ngoài ra, phần mềm không hạn chế độ dài của văn bản cần dịch. Phần mềm dịch chạy riêng, lưu trữ dữ liệu tại chỗ, không phải sử dụng API của hãng cung cấp dịch vụ, bảo đảm an ninh, an toàn và không lộ lọt thông tin cho bên thứ ba.
Sản phẩm phù hợp cho các đơn vị có nhu cầu dịch thuật, hỗ trợ dịch ở các cửa khẩu, hay các công ty đa quốc gia.
Nhóm nghiên cứu cho biết, trước mắt, để đáp ứng nhu cầu của một số khách hàng, hệ thống tập trung triển khai kỹ thuật mô hình ngôn ngữ lớn vào việc ưu tiên các cặp ngôn ngữ giữa Việt Nam và Khmer; Việt Nam và Lào; Việt Nam và Thái Lan; Việt Nam và Indonesia; Việt Nam và Malaysia.
Do hệ thống được nhóm nghiên cứu phát triển, dựa trên hạ tầng kỹ thuật hỗ trợ lưu trữ dữ liệu ngôn ngữ lớn và năng lực siêu tính toán trí tuệ nhân tạo/học máy (AI/ML) mạnh nhất Việt Nam sử dụng dòng chip tiên tiến trên thế giới là Nvidia GPU A100 80GB, Viện Công nghệ thông tin hoàn toàn làm chủ các công nghệ liên quan và dễ dàng mở rộng ứng dụng sang các ngôn ngữ đích mới bao gồm các ngôn ngữ dân tộc thiểu số tại Việt Nam như tiếng Mường, tiếng Thái… và các ngôn ngữ nước ngoài phổ biến khi cần. Đáng chú ý, hệ thống có khả năng tinh chỉnh để thích ứng với các miền ngôn ngữ chuyên sâu như y tế, luật … theo nhu cầu của người dùng.
Phó Giáo sư, Tiến sĩ Nguyễn Việt Anh chia sẻ, sản phẩm dịch thuật nêu trên chỉ là một trong số rất nhiều sản phẩm ứng dụng trí tuệ nhân tạo mà các nghiên cứu viên của Viện Công nghệ thông tin tập trung phát triển để theo kịp xu thế của thế giới cũng như phục vụ nhu cầu trong nước. Trên cơ sở khai thác hệ thống trang thiết bị hiện đại được Nhà nước đầu tư, thời gian qua, các nghiên cứu viên đã phát triển các phần mềm có tính ứng dụng cao như: Hệ thống trợ lý ảo hỗ trợ người dân sử dụng dịch vụ hành chính công; hệ thống lắng nghe mạng xã hội; phần mềm phân tích, tìm kiếm các xu thế khoa học, công nghệ, sáng chế trên thế giới; phần mềm phân tích, nhận diện khách hàng dành cho ngân hàng; phầm mềm phát hiện hành vi trốn thuế... Các sản phẩm này đã được ứng dụng tại một số địa phương, đơn vị trong nước.
Theo các nhà nghiên cứu, thị trường Việt Nam hiện rất phù hợp để ứng dụng các sản phẩm trí tuệ nhân tạo. Với việc làm chủ công nghệ và có hệ thống trang thiết bị hiện đại, thời gian tới, các nghiên cứu viên của Viện Công nghệ thông tin sẽ dần mở rộng các lĩnh vực ứng dụng trí tuệ nhân tạo, như phân tích các hợp chất thiên nhiên để hỗ trợ chế tạo thuốc, giúp giảm khối lượng các công việc thực nghiệm; xây dựng hệ thống tư vấn sức khỏe cho người dân trên cơ sở khai thác dữ liệu nghiên cứu về thực phẩm dinh dưỡng của Việt Nam…
Tuy nhiên, khó khăn nhất hiện nay trong việc phát triển, ứng dụng sản phẩm trí tuệ nhân tạo là thiếu nhân lực do không có cơ chế thu hút, thiếu nguồn vốn đầu tư cho phát triển sản phẩm, thiếu cơ chế hỗ trợ đầu ra cho sản phẩm.
Nhiều ý kiến cho rằng, cần thúc đẩy việc ứng dụng sản phẩm trí tuệ nhân tạo thông qua cơ chế ưu tiên đặt hàng nghiên cứu đối với các nhà khoa học. Cùng với việc đầu tư máy móc, trang thiết bị, các cơ quan hữu quan cần có các chính sách thúc đẩy ứng dụng, nếu không các sản phẩm của nước ngoài sẽ dần chiếm lĩnh thị trường trong thời gian tới.