1. Trước đây, việc khảo sát ngôn ngữ chủ yếu dựa vào đọc văn bản và ghi chép thủ công. Các nhà nghiên cứu phải mất nhiều thời gian để thống kê cách một từ được sử dụng trong một số lượng tài liệu nhất định.
Ngày nay, với sự hỗ trợ của các công cụ xử lý ngôn ngữ hiện đại, việc này có thể được thực hiện trên quy mô dữ liệu lớn gấp hàng nghìn lần. Một trong những hướng nghiên cứu đang phát triển mạnh là ngôn ngữ học khối liệu (corpus linguistics) - phương pháp nghiên cứu dựa trên các kho văn bản rất lớn, có thể chứa hàng triệu hoặc hàng chục triệu câu. Các công cụ như Sketch Engine, AntConc hay Word Sketch cho phép phân tích cách một từ xuất hiện trong hàng triệu câu văn, từ đó nhận diện xu hướng sử dụng từ vựng, cấu trúc ngữ pháp hoặc phong cách diễn đạt.
Chẳng hạn, khi khảo sát tiếng Việt trên báo chí hoặc mạng xã hội, các hệ thống này có thể thống kê tần suất xuất hiện của một từ, xác định những từ thường đi kèm với nhau hoặc theo dõi sự thay đổi của cách diễn đạt theo thời gian. Nhờ đó, các nhà nghiên cứu có thể quan sát rõ hơn những biến đổi của tiếng Việt trong đời sống hiện đại - điều trước đây rất khó thực hiện bằng phương pháp thủ công.
2. AI cũng đang tạo ra nhiều phương thức mới trong giảng dạy ngôn ngữ. Theo TS Nguyễn Ngọc Bình, Trưởng khoa Khoa Ngôn ngữ học, tiếng Việt và Việt Nam học, Trường đại học Khoa học xã hội và nhân văn Hà Nội: “Trong môi trường số, dữ liệu ngôn ngữ trở thành nguồn tài nguyên tri thức. Vì vậy, việc xây dựng các kho khối liệu tiếng Việt và ứng dụng AI trong nghiên cứu, giảng dạy là bước đi tất yếu nếu muốn tiếng Việt phát triển mạnh trong không gian số”, ông Bình nhận định.
“AI không thay thế người dạy ngôn ngữ, nhưng nó giúp mở rộng khả năng học tập. Người học có thể luyện phát âm, viết và giao tiếp với các hệ thống thông minh bất cứ lúc nào, từ đó tăng hiệu quả tiếp thu ngôn ngữ”, ông Bình nói.
Trong thực tế, nhiều nền tảng học ngôn ngữ trực tuyến đã bắt đầu tích hợp AI để hỗ trợ người học. Các hệ thống có thể gợi ý từ vựng theo ngữ cảnh, tự động đánh giá bài viết hoặc phân tích giọng nói để giúp người học điều chỉnh phát âm. Ở nhiều lớp học ngôn ngữ hiện nay, sinh viên thậm chí có thể luyện phát âm với phần mềm AI ngay trên điện thoại và nhận phản hồi gần như tức thì, thay vì phải chờ giáo viên chỉnh sửa như trước.
3. Ứng dụng công nghệ số trong giảng dạy tiếng Việt cũng được xem là một hướng đi quan trọng để mở rộng phạm vi tiếp cận ngôn ngữ này ra ngoài biên giới quốc gia. Theo ông Nguyễn Trung Kiên, Chủ nhiệm Ủy ban Nhà nước về người Việt Nam ở nước ngoài, Bộ Ngoại giao Việt Nam, cộng đồng người Việt hiện sinh sống tại nhiều quốc gia và vùng lãnh thổ. “Trong bối cảnh đó, việc xây dựng các nền tảng học tiếng Việt trực tuyến ứng dụng công nghệ số sẽ giúp mở rộng khả năng tiếp cận tiếng Việt, đồng thời tăng cường sự gắn kết văn hóa giữa kiều bào và quê hương”, ông Kiên cho biết.
Các nền tảng học tập tích hợp AI có thể hỗ trợ người học luyện nghe, nói, đọc và viết thông qua hệ thống phản hồi tự động. Điều này đặc biệt hữu ích đối với những người học không có điều kiện tham gia các lớp học tiếng Việt truyền thống.
Các chuyên gia cho rằng, để tận dụng tốt các cơ hội từ công nghệ, việc phát triển tiếng Việt trong không gian số cần được thực hiện một cách đồng bộ. Điều này bao gồm xây dựng các kho dữ liệu ngôn ngữ lớn, phát triển học liệu số và thúc đẩy các công nghệ xử lý ngôn ngữ dành riêng cho tiếng Việt. Khi những nguồn dữ liệu và công cụ này được kết nối với nhau, chúng có thể hình thành một hệ sinh thái số phục vụ cho nghiên cứu, giảng dạy và học tập tiếng Việt.
AI còn hỗ trợ mạnh mẽ trong nghiên cứu lời nói. Các phần mềm như Praat hay Kaldi cho phép phân tích chi tiết các đặc điểm âm thanh của giọng nói, từ cao độ, trường độ đến cấu trúc âm vị. Trong nhiều trường hợp, AI có thể tự động phân đoạn âm vị và nhận dạng tiếng nói, giúp việc xử lý dữ liệu ngữ âm nhanh và chính xác hơn rất nhiều so với trước đây.