Bảo đảm dòng chảy liên thông và liền mạch

Để chuyển đổi dữ liệu thành tư liệu sản xuất và động lực cho quá trình phát triển, Việt Nam phải phá “ốc đảo dữ liệu” bằng những phương pháp chuẩn hóa và quản trị thống nhất.

Thiếu tướng Nguyễn Ngọc Cương, Giám đốc Trung tâm dữ liệu quốc gia (NDC), Phó Chủ tịch Hiệp hội Dữ liệu quốc gia (NDA)
Thiếu tướng Nguyễn Ngọc Cương, Giám đốc Trung tâm dữ liệu quốc gia (NDC), Phó Chủ tịch Hiệp hội Dữ liệu quốc gia (NDA)

Thiếu tướng Nguyễn Ngọc Cương, Giám đốc Trung tâm dữ liệu quốc gia (NDC), Phó Chủ tịch Hiệp hội Dữ liệu quốc gia (NDA), đã có những chia sẻ đầy tâm huyết của mình với Nhân Dân cuối tuần về vấn đề này.

- Với vai trò tại Hiệp hội Dữ liệu quốc gia, ông nhìn nhận thế nào về thực trạng các “ốc đảo” dữ liệu tại Việt Nam?

- Thực trạng giai đoạn trước năm 2025 cho thấy: Hiện tượng “ốc đảo dữ liệu” ở Việt Nam là có thật và khá phổ biến.

Mặc dù Chính phủ đã ban hành Quyết định số 06/QĐ-TTg: Phê duyệt Đề án phát triển ứng dụng dữ liệu về dân cư, định danh và xác thực điện tử phục vụ chuyển đổi số quốc gia giai đoạn 2022 - 2025, tầm nhìn đến năm 2030 (Đề án 06), từng bước hình thành kết nối, chia sẻ dữ liệu dân cư để phục vụ năm nhóm tiện ích, tạo ra những kết quả bước đầu rất quan trọng, nhưng nhìn tổng thể, dữ liệu của nhiều bộ, ngành, địa phương và các cơ sở dữ liệu chuyên ngành vẫn tồn tại theo mô hình phân tán, cát cứ.

Nguyên nhân cốt lõi không chỉ nằm ở hạ tầng kỹ thuật, mà còn ở thiếu chuẩn dữ liệu và từ điển dữ liệu dùng chung, thiếu cơ chế quản trị, phân quyền, trách nhiệm rõ ràng, cùng với tâm lý e ngại rủi ro khi chia sẻ dữ liệu. Vì vậy, “có dữ liệu” chưa đồng nghĩa với “dùng được dữ liệu”, và dữ liệu dù lớn vẫn khó chuyển hóa thành dữ liệu sạch, sẵn sàng phục vụ nghiên cứu, đổi mới sáng tạo và phát triển AI.

Trước thực trạng đó, Ban Chỉ đạo Trung ương ban hành Kế hoạch số 02 giao Bộ Công an xây dựng, trình Chính phủ ban hành Nghị định số 278/2025/NĐ-CP quy định về kết nối, chia sẻ dữ liệu bắt buộc trong hệ thống chính trị và Quyết định số 2439/QĐ-TTg Khung kiến trúc dữ liệu quốc gia, Khung quản trị, quản lý dữ liệu quốc gia, Từ điển dữ liệu dùng chung phiên bản 1.0.

Trung tâm Dữ liệu quốc gia đã được khai trương, vận hành và đưa vào hoạt động, đến nay đã đồng bộ được hơn 160 triệu bản ghi của 16 cơ sở dữ liệu theo chuẩn dữ liệu bảo đảm “đúng, đủ, sạch, sống, thống nhất, dùng chung”… Tuy nhiên, theo lộ trình đặt ra, trong năm 2025 cần bảo đảm xây dựng và đồng bộ 116 cơ sở dữ liệu về Trung tâm Dữ liệu quốc gia. Trong khi đó, đến nay mới hoàn thành đồng bộ bước đầu một phần các cơ sở dữ liệu trọng điểm, vì vậy việc hình thành đầy đủ Kho dữ liệu quốc gia theo đúng mục tiêu, quy mô và mức độ bao phủ vẫn chưa bảo đảm, đòi hỏi phải tiếp tục tăng tốc chuẩn hóa, làm sạch, kết nối liên thông và tổ chức đồng bộ dữ liệu theo kế hoạch đã được phê duyệt.

- Nghị quyết số 57-NQ/TW coi dữ liệu là tư liệu sản xuất mới. Theo ông, rào cản pháp lý và kỹ thuật lớn nhất khiến chia sẻ dữ liệu giữa Nhà nước và doanh nghiệp công nghệ vẫn có độ trễ là gì?

- Quan điểm của tôi, với vai trò là Giám đốc Trung tâm Dữ liệu quốc gia, độ trễ trong chia sẻ dữ liệu giữa Nhà nước và doanh nghiệp công nghệ hiện nay không xuất phát chủ yếu từ thiếu pháp lý hay thiếu kỹ thuật.

Về định hướng, Nghị quyết số 57-NQ/TW đã đặt rất rõ yêu cầu “làm giàu, khai thác tối đa tiềm năng của dữ liệu, đưa dữ liệu thành tư liệu sản xuất chính”.

Về thực tiễn, hệ thống pháp luật về dữ liệu đã cơ bản đầy đủ và đưa vào thực thi. Trong đó, chủ trương về kinh tế dữ liệu đã được giao nhiệm vụ; xây dựng và phát triển Sàn Dữ liệu để tổ chức, cá nhân tham gia giao dịch dữ liệu, phát triển các sản phẩm, dịch vụ về dữ liệu. Ngoài ra, các dịch vụ về dữ liệu giữa Nhà nước và doanh nghiệp cũng đã có như: Dịch vụ tin cậy, dịch vụ xác thực điện tử, dịch vụ xác thực, xác nhận dữ liệu…

Tuy nhiên, để bảo đảm liên thông, liền mạch giữa các cơ quan nhà nước và toàn bộ hệ thống chính trị theo đúng nguyên tắc tại Quy định số 05-QĐ/BCĐTW, qua đó khắc phục căn bản độ trễ về dữ liệu, cần tập trung đẩy nhanh việc tuân thủ và triển khai đồng bộ các trụ cột sau: Khung kiến trúc dữ liệu quốc gia, Từ điển dữ liệu dùng chung, Nền tảng kết nối, chia sẻ dữ liệu quốc gia (NDOP); đồng thời phát triển Sàn Dữ liệu và Cổng xác thực, xác nhận dữ liệu quốc gia để bảo đảm dữ liệu được chuẩn hóa, xác thực, chia sẻ an toàn và khai thác hiệu quả.

- NDA sẽ đóng vai trò ra sao, trong việc xây dựng bộ tiêu chuẩn dữ liệu?

- NDA định vị mình là cầu nối chuẩn hóa và điều phối giữa ba khối: cơ quan nhà nước, doanh nghiệp, viện/trường/startup. Trọng tâm thời gian tới là:

1. Chuẩn dữ liệu và chuẩn chia sẻ: xây dựng bộ khung tiêu chuẩn về mô tả dữ liệu (metadata), chất lượng dữ liệu, định danh - phân loại dữ liệu, chuẩn API, chuẩn đánh giá dữ liệu phục vụ AI. Tiêu chuẩn phải đủ rõ để “đo được, kiểm được, chịu trách nhiệm được”.

2. Bộ hồ sơ pháp lý mẫu cho chia sẻ dữ liệu: khung NDA/DPA, điều khoản sử dụng dữ liệu, ma trận phân quyền truy cập (Data Access Matrix), cơ chế ghi log, điều kiện ẩn danh hóa, điều kiện tái sử dụng, điều khoản kiểm tra, thanh tra kỹ thuật.

3. Mô hình “một cửa” kết nối bài toán-dữ liệu-năng lực: doanh nghiệp/đơn vị nhà nước đưa bài toán; NDC/NDA điều phối dữ liệu và môi trường; startup/nhà khoa học triển khai PoC theo KPI, có nghiệm thu, có chuẩn đầu ra. Làm như vậy sẽ giảm “đi xin dữ liệu”, chuyển sang “đặt hàng theo bài toán” - minh bạch và có trách nhiệm.

- Ông đánh giá thế nào về nguy cơ “chảy máu dữ liệu”, cũng như trách nhiệm của NDC và NDA trong việc kiến tạo hệ sinh thái dữ liệu nội địa đủ mạnh?

- Nguy cơ “chảy máu dữ liệu” không chỉ là dữ liệu “đi ra ngoài”, mà còn là mất quyền chủ động: dữ liệu hành vi, dữ liệu thị trường, dữ liệu nội dung số… nếu nằm chủ yếu ngoài hệ sinh thái trong nước, thì năng lực phát triển AI và dịch vụ số nội địa sẽ phụ thuộc, khó tạo đột phá dài hạn.

Trách nhiệm của NDC và NDA là kiến tạo hệ sinh thái dữ liệu nội địa đủ mạnh theo ba lớp:

Lớp 1: Chủ quyền và an toàn dữ liệu: Thúc đẩy phân loại dữ liệu, quản trị rủi ro, chuẩn an toàn và cơ chế giám sát, truy vết; đồng thời tạo hạ tầng đáng tin cậy để dữ liệu trong nước có “nơi ở” an toàn.

Lớp 2: Thị trường dữ liệu minh bạch: Có cơ chế định giá, chia sẻ lợi ích, hợp đồng mẫu, chuẩn chất lượng… để dữ liệu trở thành tài sản có thể giao dịch/khai thác hợp pháp thay vì “tắc nghẽn” hoặc phát sinh thị trường phi chính thức.

Lớp 3: Năng lực sử dụng dữ liệu để tạo giá trị: thúc đẩy chương trình nhân lực dữ liệu - AI, các cuộc thi thực chiến, vườn ươm, PoC theo bài toán thật. Khi dữ liệu tạo ra sản phẩm và giá trị kinh tế - xã hội, hệ sinh thái nội địa mới mạnh lên một cách bền vững.

- Xin trân trọng cảm ơn Thiếu tướng!

Với những nhiệm vụ của Trung tâm Dữ liệu quốc gia đang thực hiện, tôi tin tưởng trong năm 2026 sẽ khắc phục tối đa độ trễ giữa doanh nghiệp và người dân để phục vụ chuyển đổi số”.

Thiếu tướng Nguyễn Ngọc Cương