Tiềm năng vô tận
Loài người đã bắt đầu thu thập và lưu trữ dữ liệu từ những ngày đầu của nền văn minh nhân loại. Những dữ liệu này thường tồn tại riêng rẽ và giá trị không cao. Nhưng nếu dữ liệu đủ lớn, đủ đa dạng từ bảng biểu, hình ảnh, văn bản đến video (Dữ liệu lớn - Big Data) và được phân tích dưới lăng kính của ngành khoa học dữ liệu thì sẽ mang đến những lợi thế quyết định thành-bại của một mô hình kinh doanh.
Thí dụ, những dữ liệu đơn giản về lịch sử mua hàng, sở thích của khách hàng cũng sẽ giúp các nhân viên bán hàng cải thiện doanh số. Nghiên cứu của McKinsey chỉ ra: Nếu các doanh nghiệp sử dụng hiệu quả các công cụ phân tích dữ liệu ngay từ ở cấp thấp nhất, doanh thu có thể tăng gấp 40 lần.
Khoa học dữ liệu cũng đưa ra những mô hình dự báo biến động, giúp các doanh nghiệp đưa ra quyết định dựa trên căn cứ cụ thể thay vì mò mẫm "cảm tính". Chuyển sang mô hình kinh doanh dựa trên dữ liệu có thể giúp các doanh nghiệp phản ứng tốt hơn trước những biến số làm đảo lộn mọi trật tự, như đại dịch hoặc chiến tranh…
Tiềm năng của khoa học dữ liệu gần như là vô tận. Các trang mạng xã hội phân tích hàng trăm gigabyte dữ liệu mỗi giây để phục vụ cho quảng cáo và ngăn chặn sự lan truyền tin giả. Hay như Vườn quốc gia Kruger của Nam Phi phân tích cảnh quay video theo thời gian thật để cảnh báo về những kẻ săn bắn thú rừng…
Hứa hẹn bùng nổ
Về ngắn hạn (3 đến 5 năm tới), thế giới sẽ chứng kiến sự trỗi dậy và ngày càng phổ biến của Big Data, thay thế cho các loại hình dữ liệu truyền thống. Những công cụ ứng dụng khoa học dữ liệu sẽ quen thuộc hơn với xã hội, nhất là trong lĩnh vực y tế và tài chính, như các ứng dụng chăm sóc sức khỏe trực tuyến. Các ứng dụng/hệ thống này đã được "huấn luyện" bằng một kho dữ liệu khổng lồ liên quan sức khỏe của các cá nhân, nên sẽ có khả năng nhận định, đánh giá chính xác hơn, giúp can thiệp y tế nhanh chóng.
Theo dự báo, 75% số tổ chức và các tập đoàn trên thế giới sẽ có nhóm phân tích dữ liệu chuyên biệt vào năm 2024. Tuy nhiên, chi phí xây dựng đội ngũ chuyên gia rất đắt đỏ. Đây là cơ hội để các dịch vụ dữ liệu (data as a service) cung cấp những công cụ phân tích hữu dụng có mức chi phí dễ tiếp cận với phần đông các doanh nghiệp. Trong năm 2023, quy mô thị trường cho các dịch vụ này rơi vào khoảng 10,7 tỷ USD theo Statista.
Khoa học dữ liệu sẽ tiếp tục là nền tảng cho lĩnh vực được nhiều người quan tâm là trí tuệ nhân tạo (AI). Bên cạnh AI truyền thống vốn được "dạy" dựa trên một cơ sở dữ liệu cố định, các mô hình AI thích ứng cũng sẽ xuất hiện nhiều hơn, có khả năng phản hồi những thay đổi theo thời gian thực. Thí dụ như hệ thống xe tự lái xử lý những chướng ngại trên đường theo thời gian thật.
Những ông lớn trong ngành công nghệ như Google, Meta, Microsoft... đang dành nhiều nguồn lực để phát triển các mô hình AI trong tương lai và đây có thể là động lực tăng trưởng nhanh chóng của trí tuệ nhân tạo. Nhưng AI cũng để lại nỗi lo, như việc một số mô hình có thể làm giả giọng nói, ghép video một người bất kỳ với độ chính xác cao mà không cần người dùng có nhiều kiến thức. Điều này đòi hỏi các quốc gia cần phải có hành lang pháp lý đặc biệt với AI.
Việt Nam cần làm gì?
Nền công nghiệp số, với nền tảng là khoa học dữ liệu, là xu thế không thể khác trên thế giới. Việt Nam là một trong những quốc gia đầu tiên trên thế giới ban hành chương trình hay chiến lược về Chuyển đổi số quốc gia. Tuy nhiên, chúng ta cần phải chú trọng hơn vào hoạt động nghiên cứu và phát triển (R&D). Năm 2019, ngân sách cho R&D tại Việt Nam bằng 0,53% tổng GDP, thấp hơn nhiều so với các nước láng giềng. Trong khi đó, một số quốc gia phát triển như Đức và Nhật Bản chi đến 3-4% GDP cho R&D. Đầu tư mạnh mẽ vào nghiên cứu khoa học công nghệ chính là nền tảng để Việt Nam "đi tắt, đón đầu" trong thời đại công nghệ số.
Các doanh nghiệp Việt Nam cũng chỉ chi 1,6% doanh thu hằng năm cho hoạt động R&D, thấp hơn nhiều quốc gia trong khu vực, như Philippines (3,6%), Malaysia (2,6%). Họ cần những dự án đầu tư có tầm nhìn dài hạn, để đưa ra những giải pháp làm chủ công nghệ, qua đó tối ưu hóa các chi phí sản xuất thay vì cứ dựa dẫm vào việc chuyển giao công nghệ. Vì việc mua lại/chuyển giao công nghệ sẽ giúp rút ngắn thời gian/chi phí, tuy nhiên sẽ hạn chế khả năng tìm ra các công nghệ/thành tựu mang tính đột phá, cũng như làm suy yếu động lực nghiên cứu của thị trường trong nước.
Để đáp ứng nhân lực cho ngành khoa học dữ liệu, giáo dục cũng phải tiên phong chuyển đổi số trong nội dung đào tạo, nhất là đào tạo về khoa học thống kê, khoa học dữ liệu. Việc này không chỉ giúp đào tạo đội ngũ lao động có năng lực phân tích dữ liệu mà còn giúp các học sinh, sinh viên có năng lực sử dụng các kết quả của việc phân tích dữ liệu trong các mặt đời sống-xã hội. Nếu có thể kết hợp đồng bộ giữa chính sách, nguồn lực và giáo dục, Việt Nam hoàn toàn có cơ hội cạnh tranh với những quốc gia hàng đầu trên thế giới.