Xây dựng nền tảng cho AI với dữ liệu tiếng Việt mã nguồn mở

Trung tâm Đổi mới sáng tạo quốc gia phối hợp Meta và Tổ chức AI for Việt Nam xây dựng các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khóa tiềm năng các ứng dụng AI tại Việt Nam.
Khu trưng bày của Google tại Trung tâm Đổi mới sáng tạo Quốc gia (NIC) Láng Hòa Lạc.
Khu trưng bày của Google tại Trung tâm Đổi mới sáng tạo Quốc gia (NIC) Láng Hòa Lạc.

Tại cuộc họp báo khởi động Chương trình Thách thức Đổi mới sáng tạo 2025 diễn ra ngày 14/3/2025, ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia (NIC) cho biết, Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình nguồn ngữ lớn (LLMs).

Từ việc triển khai thực hiện dự án sẽ giúp các mô hình trí tuệ nhân tạo (AI) hiểu rõ hơn về văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án này được kỳ vọng sẽ nâng cao sự hiện diện của Tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.

Dự án ViGen khởi nguồn từ hợp tác ba bên, gồm Tập đoàn Meta (Hoa Kỳ), NIC và tổ chức AI for Việt Nam. Trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia Việt Nam.

Theo ông Võ Xuân Hoài, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách trong bối cảnh AI đang chuyển đổi thế giới.

Trong bối cảnh đó, việc triển khai thực hiện dự án ViGen phù hợp với Nghị quyết 57 của Bộ Chính trị về đột phá phát triển khoa học-công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia và đòi hỏi sự nỗ lực chung từ các nhà hoạch định chính sách, các nhóm nghiên cứu, nhà phát triển, các chuyên gia và người dùng.

Với sự chung tay của các bên, các đơn vị xây dựng dự án kỳ vọng sẽ biến AI trở thành công cụ mạnh mẽ cho người Việt và đưa Việt Nam trở thành cường quốc AI toàn cầu.

Là một trong ba đơn vị tham gia xây dựng dự án, ông Trần Việt Hùng, nhà sáng lập Tổ chức AI for Việt Nam cho biết, ViGen là dự án lớn, thu hút sự đồng hành của các đối tác chiến lược như NVIDIA, Viettel, Viện Hàn lâm Khoa học và Công nghệ Việt Nam với sự hỗ trợ tài chính, kỹ thuật từ Meta.

Thách thức Đổi mới sáng tạo Việt Nam là chương trình thường niên nằm trong khuôn khổ Sáng kiến Đổi mới sáng tạo Việt Nam (Innovate VN) do NIC khởi xướng với sự đồng hành của các đối tác công nghệ lớn trong và ngoài nước. Mục tiêu của Chương trình nhằm tìm kiếm các giải pháp đổi mới sáng tạo trên toàn thế giới, nhằm giải quyết những thách thức quan trọng tầm quốc gia, hướng đến một Việt Nam phát triển thịnh vượng và bền vững. Khởi động từ năm 2022, mỗi năm, Chương trình thu hút hơn 750 giải pháp từ hơn 20 quốc gia, cùng lãnh thổ trên thế giới tham gia.

Dự án sẽ đóng góp cho cộng đồng những bộ dữ liệu lớn và chất lượng cao bằng tiếng Việt nhằm cải thiện tình trạng Tiếng Việt đang còn hiện diện hết sức khiêm tốn trong AI.

ViGen cũng cho thấy sức mạnh và giá trị của những mô hình mã nguồn mở như Llama, cho phép phát triển các giải pháp sáng tạo có tác động toàn cầu có tính đến ngữ cảnh của Tiếng Việt.

“Mục tiêu của dự án ViGen là xây dựng các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt Nam. ViGen sẽ xây dựng các bộ dữ liệu Tiếng Việt mã nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI. Dự án cũng đóng góp vào việc bảo đảm sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cảnh địa phương và có trách nhiệm”, ông Trần Việt Hùng nói.

Chia sẻ về quá trình thực hiện dự án, ông Sarim Aziz, Giám đốc Chính sách công của Meta cho biết, năm 2025 là năm bản lề với tiến trình phát triển AI tại Việt Nam.

Thông qua hỗ trợ các nhà nghiên cứu, nhà phát triển và doanh nghiệp Việt Nam, dự án ViGen sẽ tiếp cận những mô hình AI mã nguồn mở cùng các nguồn lực phù hợp với bối cảnh địa phương nhằm phát huy tối đa tiềm năng và thúc đẩy sáng kiến AI mang tính ứng dụng cao, phù hợp với nhu cầu của Việt Nam.

Cũng tại cuộc họp báo, Meta phối hợp với Deloite đã chọn Việt Nam là quốc gia đầu tiên trong khu vực châu Á-Thái Bình Dương ra mắt cẩm nang “Đổi mới sáng tạo trong khu vực công ở châu Á-Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama”.

Cẩm nang này cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm: tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế, an ninh công…

Có thể bạn quan tâm

Bên lề Đại hội, các đại biểu tham quan gian hàng của Công ty cổ phần Khoa học công nghệ Việt Nam (Busadco).

Doanh nghiệp khoa học-công nghệ: Củng cố nội lực để bứt phá

Trong bối cảnh đất nước bước vào kỷ nguyên kinh tế tri thức, với những đột phá mạnh mẽ về trí tuệ nhân tạo, chuyển đổi số và chuyển đổi xanh, cộng đồng doanh nghiệp khoa học-công nghệ đang đứng trước yêu cầu phải đổi mới tư duy, tái cấu trúc nguồn lực và đầu tư chiều sâu để tạo ra năng lực cạnh tranh mới.

[Video] Việt Nam tiên phong xây dựng khung pháp lý cho trí tuệ nhân tạo

[Video] Việt Nam tiên phong xây dựng khung pháp lý cho trí tuệ nhân tạo

Dự thảo Luật Trí tuệ nhân tạo không chỉ là khung pháp lý cho một công nghệ mới mà là bước đi chiến lược giúp Việt Nam chủ động nắm bắt cơ hội của kỷ nguyên số. Khi được ban hành, luật sẽ tạo nền tảng để AI phát triển an toàn nhân văn và hiệu quả, góp phần nâng cao năng lực cạnh tranh quốc gia và thúc đẩy đổi mới sáng tạo.

Các diễn giả trao đổi tại Diễn đàn. (Ảnh: Ủy ban Nhà nước về người Việt Nam ở nước ngoài)

Thúc đẩy hợp tác khoa học-công nghệ, kinh tế xanh và chuyển đổi số vì tương lai bền vững

Diễn đàn Tây Australia -Việt Nam “Tăng cường hợp tác khoa học và công nghệ vì tương lai bền vững” là cơ hội để lãnh đạo, chuyên gia, doanh nghiệp Việt Nam và Australia chia sẻ tầm nhìn, tăng cường hiểu biết và thúc đẩy hợp tác trong các lĩnh vực khoa học-công nghệ, kinh tế xanh, năng lượng tái tạo và chuyển đổi số.

Đại biểu tham dự hội thảo.

Vĩnh Long: Phối hợp chuyển giao ứng dụng khoa học-công nghệ phục vụ phát triển kinh tế-xã hội

Chiều 4/12, Văn phòng Bộ Khoa học và Công nghệ tại miền nam phối hợp Sở Khoa học và Công nghệ Vĩnh Long tổ chức Hội thảo với chủ đề “Phối hợp giữa Bộ Chủ trì Chương trình Khoa học-công nghệ cấp quốc gia với các địa phương trong chuyển giao ứng dụng kết quả nghiên cứu phục vụ phát triển kinh tế- xã hội khu vực phía nam”.

Ảnh minh họa.

Cảnh báo chiến dịch ‘Hanoi Thief’ tấn công mạng doanh nghiệp Việt Nam

Hàng loạt email giả mạo hồ sơ xin việc, đính kèm tệp “Le Xuan Son CV.zip”, được gửi đến các doanh nghiệp lớn, nhỏ tại Việt Nam. Đây là lớp vỏ ngụy trang cho chiến dịch tấn công mạng mang tên Hanoi Thief, với mục tiêu xâm nhập mạng nội bộ, chiếm quyền hệ thống và đánh cắp dữ liệu khách hàng, bí mật doanh nghiệp.

Toàn cảnh tọa đàm.

Những nghiên cứu mới hỗ trợ ngành nông nghiệp giảm phát thải, chăn nuôi bền vững

Các giải pháp đổi mới trong nông nghiệp và chăn nuôi bền vững, bao gồm việc áp dụng công nghệ gene, hệ vi sinh vật, nông nghiệp chính xác, AI và IoT để cải thiện năng suất, giảm hóa chất và phát thải, nâng cao khả năng chống chịu với biến đổi khí hậu vừa được giới thiệu tại tọa đàm “Đổi mới trong nông nghiệp và thực phẩm”.

Lễ khai mạc triển lãm “Tỏa V-Điểm chạm khoa học”.

Chín nghệ sĩ tiêu biểu của nghệ thuật đương đại Việt Nam trưng bày tác phẩm tại triển lãm "Tỏa V-Điểm chạm khoa học"

Triển lãm “Tỏa V-Điểm chạm khoa học” tôn vinh những thành tựu khoa học và ứng dụng sáng tạo vì sự phát triển bền vững và tương lai của nhân loại. Sự kiện nghệ thuật đặc biệt đánh dấu cột mốc kỷ niệm 5 năm Giải thưởng VinFuture cũng như 5 mùa triển lãm "Tỏa" của VCCA.

Lãnh đạo Thành phố Hồ Chí Minh chụp hình lưu niệm cùng các đại biểu dự hội nghị.

Khai mạc Hội nghị thượng đỉnh toàn cầu Diễn đàn cộng đồng thông minh thế giới 2025

Sáng 3/12, tại phường Bình Dương (Thành phố Hồ Chí Minh), đã diễn ra Lễ khai mạc Hội nghị thượng đỉnh toàn cầu Diễn đàn cộng đồng thông minh thế giới (ICF Global Summit 2025) do Ủy ban nhân dân Thành phố Hồ Chí Minh phối hợp Diễn đàn cộng đồng thông minh thế giới (ICF) và Tập đoàn Becamex đăng cai tổ chức.