Phiên bản thử nghiệm đầu tiên hệ sinh thái AI Việt Nam - Dữ liệu mở tiếng Việt

Chiều 2/10, trong khuôn khổ Ngày hội Đổi mới Sáng tạo Quốc gia 2025, Hội thảo “Xây dựng bộ dữ liệu mở cho tiếng Việt phục vụ nghiên cứu và ứng dụng trí tuệ nhân tạo” do Tập đoàn Meta, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) và Tổ chức “AI for Vietnam” cùng phối hợp tổ chức đã thu hút đông đảo đại biểu quan tâm.

Giới thiệu phiên bản thử nghiệm AI Việt Nam. (Ảnh: HNV)
Giới thiệu phiên bản thử nghiệm AI Việt Nam. (Ảnh: HNV)

Tại hội thảo, Tập đoàn Meta, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) và Tổ chức “AI for Vietnam” đã cùng công bố các kết quả nổi bật từ dự án xây dựng bộ dữ liệu mở cho tiếng Việt - ViGen. Sáng kiến này nhằm thúc đẩy nghiên cứu và phát triển trí tuệ nhân tạo thông qua việc cung cấp bộ dữ liệu mở tiếng Việt với chất lượng cao cho cộng đồng trí tuệ nhân tạo tại Việt Nam.

Bảo đảm phát triển AI phù hợp giá trị văn hóa, chuẩn mực Việt Nam

Việc ra mắt phiên bản thử nghiệm đầu tiên của nền tảng ViGen trực tiếp hỗ trợ Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo đến năm 2030, cũng như góp phần quan trọng trong việc phát triển các mô hình ngôn ngữ lớn tiếng Việt - được xác định là sản phẩm công nghệ chiến lược theo Quyết định số 1131/QĐ-TTg của Thủ tướng Chính phủ. Dự án sẽ góp phần định vị trí tuệ nhân tạo (AI) là động lực then chốt cho tăng trưởng kinh tế và chuyển đổi số.

Theo đánh giá của các bên, thông qua việc phát triển các bộ dữ liệu mở tiếng Việt, quy mô lớn và chất lượng cao phục vụ huấn luyện và đánh giá AI, Dự án ViGen bảo đảm sự phát triển AI tại Việt Nam phù hợp với giá trị văn hóa, chuẩn mực đạo đức. Đây cũng là giải pháp xây dựng một hệ sinh thái AI mở một cách có trách nhiệm và gắn với bối cảnh địa phương.

ndo_br_aitv2.jpg
Hội thảo thu hút đại biểu trong nước và quốc tế tham dự. (Ảnh: HNV)

Cụ thể hơn, trong giai đoạn đầu tiên (đến tháng 10/2025), dự án ViGen đạt các kết quả đột phá. Bao gồm việc ra mắt phiên bản Vi-Primer 1.0, bộ dữ liệu mở tiền huấn luyện (pre-training) tiếng Việt lớn nhất từ trước đến nay; giới thiệu bộ 5 Khung đánh giá được thiết kế chuyên sâu để đo lường và đánh giá toàn diện năng lực của các mô hình AI tiếng Việt, với 4.020 mẫu đánh giá được xây dựng công phu, các bộ tiêu chuẩn này kiểm tra AI trên nhiều phương diện (từ kiến thức chuyên sâu, khả năng lập trình, tư duy logic, cho đến sự an toàn, mức độ am hiểu văn hóa và các sắc thái ngôn ngữ đặc trưng của người Việt).

Dự án cũng chính thức ra mắt nền tảng ViGen phiên bản thử nghiệm. Đây là một không gian hợp tác mở, nơi người dùng (được xác thực qua ứng dụng định danh điện tử - VNeID) có thể trực tiếp đóng góp dữ liệu, sử dụng tài nguyên để huấn luyện mô hình, cũng như kiểm tra và đánh giá chất lượng AI. Nền tảng tích hợp cơ chế thi đua và khen thưởng để theo dõi và vinh danh những người đóng góp hàng đầu, qua đó thúc đẩy việc xây dựng kho dữ liệu Việt vì người Việt, cho người Việt một cách trực quan.

Cam kết đồng hành của hệ sinh thái AI với sự phát triển AI của Việt Nam

Dịp này, ông Philip Chua, Giám đốc Chính sách công và sản phẩm khu vực châu Á-Thái Bình Dương, Tập đoàn Meta, nhấn mạnh: Việc ra mắt phiên bản thử nghiệm của nền tảng ViGen là một cột mốc quan trọng của dự án và tiếp nối cam kết đồng hành cùng hệ sinh thái AI của Việt Nam của Meta. Nền tảng này thể hiện niềm tin của chúng tôi rằng AI mã nguồn mở có thể mở rộng khả năng tiếp cận công nghệ tiên tiến, giúp các nhà phát triển, nhà nghiên cứu và doanh nghiệp Việt Nam xây dựng các giải pháp AI thực sự am hiểu bối cảnh địa phương và phục vụ cộng đồng.

ndo_br_aitv1.jpg
Hội thảo “Xây dựng bộ dữ liệu mở cho tiếng Việt phục vụ nghiên cứu và ứng dụng trí tuệ nhân tạo”. (Ảnh: HNV)

“Bằng cách cung cấp dữ liệu và công cụ tiếng Việt mã nguồn mở chất lượng cao, chúng tôi không chỉ chuyển giao công nghệ mà còn tạo động lực để Việt Nam trở thành một cường quốc AI trên toàn cầu, với những giải pháp phản ánh văn hóa và giá trị Việt Nam.” – ông Philip Chua nói.

Cũng dịp này, ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia, cho rằng: Nền tảng ViGen thể hiện rõ vai trò của các quan hệ đối tác công - tư trong việc đẩy nhanh việc triển khai các mục tiêu của Nghị quyết số 57-NQ/TW của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Theo ông Hoài, cách tiếp cận mở của dự án ViGen bảo đảm AI mang lại lợi ích cho tất cả người dân Việt Nam, từ các công ty khởi nghiệp, doanh nghiệp vừa và nhỏ, tập đoàn công nghệ đến các trường đại học, viện nghiên cứu và cơ quan Nhà nước, đồng thời vẫn giữ vững giá trị văn hóa và chuẩn mực đạo đức. “Chúng ta đang xây dựng không chỉ công nghệ, mà còn một nền tảng cho tăng trưởng kinh tế bền vững và toàn diện dựa trên AI.”- Phó Giám đốc Võ Xuân Hoài cho hay.

Trong khi đó, ông Trần Việt Hùng, nhà sáng lập và CEO, Tổ chức “AI for Vietnam” chia sẻ: “Thông qua việc mở rộng khả năng tiếp cận bộ dữ liệu tiếng Việt chất lượng cao cho toàn cộng đồng, chúng tôi đang giải quyết thực trạng tiếng Việt lâu nay ít được hiện diện trong các hệ thống AI hiện nay. Nền tảng này sẽ tạo điều kiện cho các nhà nghiên cứu, nhà phát triển và các đơn vị đổi mới sáng tạo trên khắp Việt Nam hợp tác, đóng góp và xây dựng các giải pháp AI ‘Made in Vietnam’ nhưng có khả năng phục vụ thị trường toàn cầu.”

Song song với Dự án ViGen, Meta cũng khởi động nhiều chương trình hỗ trợ ứng dụng AI tại Việt Nam, bao gồm: Chương trình tăng tốc khởi nghiệp, quỹ Llama Grants, các hội thảo dành riêng cho doanh nghiệp vừa và nhỏ, cùng chương trình phổ cập kiến thức AI trong cộng đồng. Meta cũng hỗ trợ hạ tầng tính toán và đào tạo nhân lực - yếu tố then chốt để mở rộng quy mô ứng dụng AI trên toàn quốc.

ndo_br_aitv.jpg
Các đại biểu lưu lại kỷ niệm khi tham dự hội thảo. (Ảnh: HNV)

Hướng tới giai đoạn 2026-2027, Dự án ViGen triển khai theo một lộ trình ba năm toàn diện. Trong năm 2026, dự án sẽ phát triển các bộ dữ liệu tinh chỉnh, xây dựng các công cụ hỗ trợ lập trình viên trong việc phát triển ứng dụng AI, mở rộng lên mười bộ khung đánh giá và tổ chức các cuộc thi hackathon cấp quốc gia. Đến năm 2027, dự án sẽ cập nhật các bộ dữ liệu và phát triển các công cụ nâng cao nhằm phục vụ ứng dụng AI trong doanh nghiệp.

Trong tương lai, dự án ViGen sẽ tiếp tục triển khai các hoạt động liên quan đến AI, bao gồm giới thiệu bộ công cụ toàn diện dành cho doanh nghiệp, cùng các chương trình, khóa đào tạo và hội thảo chuyên đề nhằm thúc đẩy tích hợp AI vào hoạt động của các tổ chức và doanh nghiệp Việt Nam.

Có thể bạn quan tâm

Đường phố được trang hoàng băng-rôn, cờ hoa cho ngày lễ lớn của dân tộc.

Hà Nội rực rỡ sắc màu văn hóa trong kỳ nghỉ lễ 30/4-1/5

Hòa chung không khí vui tươi, tự hào của cả nước, Thủ đô Hà Nội những ngày này hiện lên như một bức tranh văn hóa sống động, nơi mà di sản ngàn năm và nghệ thuật đương đại cùng hòa nhịp, tạo nên trải nghiệm khó quên cho người dân lẫn du khách thập phương.

Hoạt động trình diễn flyboard ánh sáng trên mặt nước Hồ Kỳ Lân.

Đa dạng trải nghiệm cho du khách dịp nghỉ lễ 30/4-1/5 tại Ninh Bình

Nhằm chào mừng dịp lễ 30/4-1/5, với mục tiêu tạo dựng không gian văn hóa-giải trí đặc sắc, kết hợp hài hòa giữa các giá trị truyền thống và hoạt động hiện đại, chuỗi sự kiện “Tự hào Hoa Lư” diễn ra từ ngày 28/4 đến 3/5 tại Phố cổ Hoa Lư đã thu hút đông đảo người dân và du khách, tạo nên không khí sôi động, hấp dẫn.

Khu di tích đền thờ/Nhà tưởng niệm bà Hoàng Thị Loan. (Ảnh: NGỌC ĐINH - MẠNH HÀO)

Đồng thuận từ lòng dân

Mỗi buổi chiều ở Vân Nội, loa truyền thanh vang lên những thông tin nổi bật về kinh tế-xã hội của xã Việt Tiến (Hưng Yên) nói chung và của thôn nói riêng. Ở sân nhà văn hóa, nhiều người dân quây quần trò chuyện. Những chia sẻ xoay quanh mùa vụ, tình làng nghĩa xóm, và những đổi thay đang hiện hữu trên quê hương.

Lãnh đạo thành phố Đông Hưng tặng hoa chào mừng Đoàn đại biểu các xã, phường tỉnh Quảng Ninh sang dự kỷ niệm 30 năm Ngày thành lập thành phố Đông Hưng.

Tăng cường quan hệ hợp tác hữu nghị biên giới Quảng Ninh (Việt Nam) và Quảng Tây (Trung Quốc)

Ngày 29/4, Đoàn đại biểu các xã, phường tỉnh Quảng Ninh (Việt Nam) gồm Móng Cái 1, Móng Cái 2, Móng Cái 3 và xã Hải Sơn do đồng chí Hồ Quang Huy, Bí thư Đảng ủy, Chủ tịch Hội đồng nhân dân phường Móng Cái 1 làm Trưởng đoàn đã tham dự chương trình kỷ niệm 30 năm Ngày thành lập thành phố Đông Hưng, Trung Quốc 29/4 (1996-2026).

Các đại biểu thực hiện nghi thức phát động Tháng Nhân đạo năm 2026.

Trung ương Hội Chữ thập đỏ Việt Nam phát động Tháng Nhân đạo năm 2026

Lễ phát động Tháng Nhân đạo năm 2026 không chỉ là một sự kiện thường niên, mà là dấu mốc đặc biệt nhìn lại chặng đường “80 năm – Hành trình nhân ái vì cộng đồng”, góp phần huy động sức mạnh của toàn xã hội chăm lo cho người nghèo, người yếu thế; thể hiện hình ảnh một Việt Nam tích cực đóng góp vào các hoạt động nhân đạo quốc tế.

Công an xã Ô Diên làm việc với trường hợp vi phạm.

Xử lý nghiêm các trường hợp đăng tải, chia sẻ thông tin sai sự thật trên mạng xã hội

Thời gian qua, tình trạng đăng tải, chia sẻ thông tin sai sự thật trên mạng xã hội vẫn tiềm ẩn nhiều nguy cơ gây hoang mang dư luận, ảnh hưởng đến uy tín của cơ quan, tổ chức và cá nhân. Trước thực trạng trên, Công an Hà Nội đã xử lý nghiêm các trường hợp đăng tải, chia sẻ thông tin sai sự thật trên mạng xã hội.