Phiên bản thử nghiệm đầu tiên hệ sinh thái AI Việt Nam - Dữ liệu mở tiếng Việt

Chiều 2/10, trong khuôn khổ Ngày hội Đổi mới Sáng tạo Quốc gia 2025, Hội thảo “Xây dựng bộ dữ liệu mở cho tiếng Việt phục vụ nghiên cứu và ứng dụng trí tuệ nhân tạo” do Tập đoàn Meta, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) và Tổ chức “AI for Vietnam” cùng phối hợp tổ chức đã thu hút đông đảo đại biểu quan tâm.

Giới thiệu phiên bản thử nghiệm AI Việt Nam. (Ảnh: HNV)
Giới thiệu phiên bản thử nghiệm AI Việt Nam. (Ảnh: HNV)

Tại hội thảo, Tập đoàn Meta, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) và Tổ chức “AI for Vietnam” đã cùng công bố các kết quả nổi bật từ dự án xây dựng bộ dữ liệu mở cho tiếng Việt - ViGen. Sáng kiến này nhằm thúc đẩy nghiên cứu và phát triển trí tuệ nhân tạo thông qua việc cung cấp bộ dữ liệu mở tiếng Việt với chất lượng cao cho cộng đồng trí tuệ nhân tạo tại Việt Nam.

Bảo đảm phát triển AI phù hợp giá trị văn hóa, chuẩn mực Việt Nam

Việc ra mắt phiên bản thử nghiệm đầu tiên của nền tảng ViGen trực tiếp hỗ trợ Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo đến năm 2030, cũng như góp phần quan trọng trong việc phát triển các mô hình ngôn ngữ lớn tiếng Việt - được xác định là sản phẩm công nghệ chiến lược theo Quyết định số 1131/QĐ-TTg của Thủ tướng Chính phủ. Dự án sẽ góp phần định vị trí tuệ nhân tạo (AI) là động lực then chốt cho tăng trưởng kinh tế và chuyển đổi số.

Theo đánh giá của các bên, thông qua việc phát triển các bộ dữ liệu mở tiếng Việt, quy mô lớn và chất lượng cao phục vụ huấn luyện và đánh giá AI, Dự án ViGen bảo đảm sự phát triển AI tại Việt Nam phù hợp với giá trị văn hóa, chuẩn mực đạo đức. Đây cũng là giải pháp xây dựng một hệ sinh thái AI mở một cách có trách nhiệm và gắn với bối cảnh địa phương.

ndo_br_aitv2.jpg
Hội thảo thu hút đại biểu trong nước và quốc tế tham dự. (Ảnh: HNV)

Cụ thể hơn, trong giai đoạn đầu tiên (đến tháng 10/2025), dự án ViGen đạt các kết quả đột phá. Bao gồm việc ra mắt phiên bản Vi-Primer 1.0, bộ dữ liệu mở tiền huấn luyện (pre-training) tiếng Việt lớn nhất từ trước đến nay; giới thiệu bộ 5 Khung đánh giá được thiết kế chuyên sâu để đo lường và đánh giá toàn diện năng lực của các mô hình AI tiếng Việt, với 4.020 mẫu đánh giá được xây dựng công phu, các bộ tiêu chuẩn này kiểm tra AI trên nhiều phương diện (từ kiến thức chuyên sâu, khả năng lập trình, tư duy logic, cho đến sự an toàn, mức độ am hiểu văn hóa và các sắc thái ngôn ngữ đặc trưng của người Việt).

Dự án cũng chính thức ra mắt nền tảng ViGen phiên bản thử nghiệm. Đây là một không gian hợp tác mở, nơi người dùng (được xác thực qua ứng dụng định danh điện tử - VNeID) có thể trực tiếp đóng góp dữ liệu, sử dụng tài nguyên để huấn luyện mô hình, cũng như kiểm tra và đánh giá chất lượng AI. Nền tảng tích hợp cơ chế thi đua và khen thưởng để theo dõi và vinh danh những người đóng góp hàng đầu, qua đó thúc đẩy việc xây dựng kho dữ liệu Việt vì người Việt, cho người Việt một cách trực quan.

Cam kết đồng hành của hệ sinh thái AI với sự phát triển AI của Việt Nam

Dịp này, ông Philip Chua, Giám đốc Chính sách công và sản phẩm khu vực châu Á-Thái Bình Dương, Tập đoàn Meta, nhấn mạnh: Việc ra mắt phiên bản thử nghiệm của nền tảng ViGen là một cột mốc quan trọng của dự án và tiếp nối cam kết đồng hành cùng hệ sinh thái AI của Việt Nam của Meta. Nền tảng này thể hiện niềm tin của chúng tôi rằng AI mã nguồn mở có thể mở rộng khả năng tiếp cận công nghệ tiên tiến, giúp các nhà phát triển, nhà nghiên cứu và doanh nghiệp Việt Nam xây dựng các giải pháp AI thực sự am hiểu bối cảnh địa phương và phục vụ cộng đồng.

ndo_br_aitv1.jpg
Hội thảo “Xây dựng bộ dữ liệu mở cho tiếng Việt phục vụ nghiên cứu và ứng dụng trí tuệ nhân tạo”. (Ảnh: HNV)

“Bằng cách cung cấp dữ liệu và công cụ tiếng Việt mã nguồn mở chất lượng cao, chúng tôi không chỉ chuyển giao công nghệ mà còn tạo động lực để Việt Nam trở thành một cường quốc AI trên toàn cầu, với những giải pháp phản ánh văn hóa và giá trị Việt Nam.” – ông Philip Chua nói.

Cũng dịp này, ông Võ Xuân Hoài, Phó Giám đốc Trung tâm Đổi mới sáng tạo Quốc gia, cho rằng: Nền tảng ViGen thể hiện rõ vai trò của các quan hệ đối tác công - tư trong việc đẩy nhanh việc triển khai các mục tiêu của Nghị quyết số 57-NQ/TW của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Theo ông Hoài, cách tiếp cận mở của dự án ViGen bảo đảm AI mang lại lợi ích cho tất cả người dân Việt Nam, từ các công ty khởi nghiệp, doanh nghiệp vừa và nhỏ, tập đoàn công nghệ đến các trường đại học, viện nghiên cứu và cơ quan Nhà nước, đồng thời vẫn giữ vững giá trị văn hóa và chuẩn mực đạo đức. “Chúng ta đang xây dựng không chỉ công nghệ, mà còn một nền tảng cho tăng trưởng kinh tế bền vững và toàn diện dựa trên AI.”- Phó Giám đốc Võ Xuân Hoài cho hay.

Trong khi đó, ông Trần Việt Hùng, nhà sáng lập và CEO, Tổ chức “AI for Vietnam” chia sẻ: “Thông qua việc mở rộng khả năng tiếp cận bộ dữ liệu tiếng Việt chất lượng cao cho toàn cộng đồng, chúng tôi đang giải quyết thực trạng tiếng Việt lâu nay ít được hiện diện trong các hệ thống AI hiện nay. Nền tảng này sẽ tạo điều kiện cho các nhà nghiên cứu, nhà phát triển và các đơn vị đổi mới sáng tạo trên khắp Việt Nam hợp tác, đóng góp và xây dựng các giải pháp AI ‘Made in Vietnam’ nhưng có khả năng phục vụ thị trường toàn cầu.”

Song song với Dự án ViGen, Meta cũng khởi động nhiều chương trình hỗ trợ ứng dụng AI tại Việt Nam, bao gồm: Chương trình tăng tốc khởi nghiệp, quỹ Llama Grants, các hội thảo dành riêng cho doanh nghiệp vừa và nhỏ, cùng chương trình phổ cập kiến thức AI trong cộng đồng. Meta cũng hỗ trợ hạ tầng tính toán và đào tạo nhân lực - yếu tố then chốt để mở rộng quy mô ứng dụng AI trên toàn quốc.

ndo_br_aitv.jpg
Các đại biểu lưu lại kỷ niệm khi tham dự hội thảo. (Ảnh: HNV)

Hướng tới giai đoạn 2026-2027, Dự án ViGen triển khai theo một lộ trình ba năm toàn diện. Trong năm 2026, dự án sẽ phát triển các bộ dữ liệu tinh chỉnh, xây dựng các công cụ hỗ trợ lập trình viên trong việc phát triển ứng dụng AI, mở rộng lên mười bộ khung đánh giá và tổ chức các cuộc thi hackathon cấp quốc gia. Đến năm 2027, dự án sẽ cập nhật các bộ dữ liệu và phát triển các công cụ nâng cao nhằm phục vụ ứng dụng AI trong doanh nghiệp.

Trong tương lai, dự án ViGen sẽ tiếp tục triển khai các hoạt động liên quan đến AI, bao gồm giới thiệu bộ công cụ toàn diện dành cho doanh nghiệp, cùng các chương trình, khóa đào tạo và hội thảo chuyên đề nhằm thúc đẩy tích hợp AI vào hoạt động của các tổ chức và doanh nghiệp Việt Nam.

Có thể bạn quan tâm

Giáo sư, Tiến sĩ Trần Văn Thuấn, Thứ trưởng Y tế phát biểu.

Ra mắt Thuật ngữ Răng Hàm Mặt Anh-Việt

“Thuật ngữ Răng Hàm Mặt Anh-Việt” là một công trình khoa học có giá trị, được biên soạn bởi các chuyên gia hàng đầu trong lĩnh vực răng hàm mặt Việt Nam. Cuốn sách ra đời là kết quả của quá trình lao động khoa học nghiêm túc, tâm huyết và trách nhiệm của tập thể các chuyên gia, nhà khoa học, giảng viên và bác sĩ trong ngành.

Đoàn kiểm tra của Ủy ban Bầu cử tỉnh Quảng Ninh do Thiếu tướng Nguyễn Tiến Trung, Giám đốc Công an tỉnh, làm Trưởng đoàn khảo sát thực địa tại điểm bầu cử thuộc đặc khu Vân Đồn.

Công an Quảng Ninh tăng cường bảo đảm an ninh, an toàn phục vụ bầu cử

Cuộc bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp nhiệm kỳ 2026-2031 đang đến gần. Công an tỉnh Quảng Ninh đã chủ động triển khai phương án nhằm bảo đảm tuyệt đối an ninh, an toàn, tạo điều kiện thuận lợi để mọi cử tri thực hiện đầy đủ quyền và nghĩa vụ công dân trong ngày hội lớn của toàn dân.

Hồ đầu mối Mễ Trì đang được đơn vị thi công tập trung triển khai theo lệnh khẩn cấp. (Ảnh: TUẤN LƯƠNG)

Hà Nội: Phân luồng giao thông phục vụ thi công khẩn cấp hồ đầu mối Mễ Trì

Từ ngày 15-31/3/2026, Hà Nội sẽ điều chỉnh tổ chức giao thông tại một số tuyến đường khu vực phường Đại Mỗ để phục vụ thi công công trình khẩn cấp hồ đầu mối Mễ Trì (hồ Đồng Bông 2). Việc phân luồng nhằm bảo đảm an toàn giao thông, đồng thời tạo điều kiện triển khai các hạng mục thoát nước cấp bách trong khu vực.

Tổng vệ sinh, chỉnh trang hạ tầng giao thông, tạo diện mạo sáng-xanh-sạch-đẹp cho Thủ đô trong thời gian diễn ra bầu cử.

Hà Nội ra quân tổng vệ sinh hạ tầng giao thông, chỉnh trang đô thị phục vụ bầu cử

Nhằm bảo đảm điều kiện hạ tầng giao thông, cảnh quan đô thị phục vụ bầu cử Quốc hội và Hội đồng nhân dân các cấp, các đơn vị chức năng tại Hà Nội đang đồng loạt triển khai tổng vệ sinh, kiểm tra và sửa chữa hệ thống kết cấu hạ tầng giao thông trên toàn địa bàn, đặc biệt tại các khu vực và tuyến đường dẫn tới điểm bầu cử.

Đoàn giám sát xã Thanh Trì khảo sát thực tế tại các địa điểm tổ chức bỏ phiếu.

Hà Nội: Tăng cường giám sát, bảo đảm công tác bầu cử diễn ra đúng quy định

Trước thềm cuộc bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp nhiệm kỳ 2026-2031, công tác giám sát việc chuẩn bị bầu cử đang được Ủy ban Mặt trận Tổ quốc Việt Nam các cấp trên địa bàn Thủ đô Hà Nội triển khai đồng bộ, nhằm bảo đảm cuộc bầu cử diễn ra dân chủ, đúng quy định và an toàn.

Lãnh đạo xã Gia Viễn kiểm tra công tác chuẩn bị bầu cử trên địa bàn xã.

Xã Gia Viễn hướng tới ngày hội lớn

Công tác lãnh đạo, chỉ đạo và tổ chức thực hiện cuộc bầu cử đại biểu Quốc hội Khóa XVI và đại biểu Hội đồng nhân dân các cấp nhiệm kỳ 2026-2031 trên địa bàn xã Gia Viễn, tỉnh Ninh Bình được triển khai chủ động, bài bản, đồng bộ, theo đúng trình tự, thủ tục của pháp luật.

Các vận động viên người khuyết tật thi đấu tại Giải "Pickleball vì cộng đồng" tại Thành phố Hồ Chí Minh. (Ảnh: PLO)

Tổ chức nhiều hoạt động đồng hành Giải Para Natuh Pickleball năm 2026 với chủ đề “Thể thao hòa nhập”

Giải Para Natuh Pickleball năm 2026 với nhiều hoạt động có chủ đề “Thể thao hòa nhập-Lan tỏa tinh thần Việt Nam kiên cường, nhân ái, đoàn kết toàn dân tộc” sẽ diễn ra ngày 2/5 tại phường Bắc Giang, tỉnh Bắc Ninh, do Ủy ban Paralympic Việt Nam; Sở Văn hóa, Thể thao và Du lịch tỉnh Bắc Ninh, Công ty cổ phần Đầu tư Natuh tổ chức.

Các chư tăng, phật tử chùa Trúc Lâm Cô Tô theo dõi thông tin của các ứng cử viên ứng cử lần này.

Cử tri Quảng Ninh hướng về Ngày hội non sông

Đến thời điểm này, công tác chuẩn bị bầu cử trên địa bàn tỉnh Quảng Ninh đã cơ bản hoàn tất, bảo đảm đúng quy trình và thời gian theo luật định. Cử tri Quảng Ninh đang náo nức đón chờ ngày hội non sông để thực hiện quyền và nghĩa vụ của mình.

Các cử tri khu vực bỏ phiếu số 10 phường Khương Đình.

Phường Khương Đình sẵn sàng cho “Ngày hội non sông”


Tính đến sáng 13/3, toàn bộ 28 khu vực bỏ phiếu trên địa bàn phường Khương Đình, thành phố Hà Nội đã chuẩn bị sẵn sàng cho Ngày hội non sông 15/3 – Ngày cử tri cả nước thực hiện quyền công dân, cầm lá phiếu bầu đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp nhiệm kỳ 2026-2031.

Cờ, pano, khẩu hiệu được trang hoàng tại các khu vực bỏ phiếu.

Đảng viên cao tuổi gửi trọn niềm tin trước ngày bầu cử

Trước thềm bầu cử, nhiều đảng viên cao tuổi không giấu được sự háo hức, bồi hồi. Với họ, mỗi kỳ bầu cử không chỉ là sự kiện chính trị quan trọng của đất nước mà còn là dịp để tiếp tục thực hiện trách nhiệm công dân, gửi gắm niềm tin và kỳ vọng vào đội ngũ đại biểu sẽ đại diện cho ý chí, nguyện vọng của nhân dân.

Cử tri đồng bào dân tộc thiểu số xã Phú Long, tỉnh Ninh Bình nghiên cứu tiểu sử của các ứng cử viên.

Các xã miền núi Ninh Bình hướng về ngày bầu cử

Những ngày này, không khí hướng về ngày bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp nhiệm kỳ 2026-2031 đang lan tỏa khắp các xã miền núi của tỉnh Ninh Bình. Công tác chuẩn bị được các địa phương triển khai đồng bộ, tạo khí thế phấn khởi để cử tri sẵn sàng tham gia ngày hội lớn của toàn dân.