Vai trò của dữ liệu lớn trong chuyển đổi số

Thuật ngữ “big data”, còn gọi là “dữ liệu lớn” được chú ý nhiều từ đầu thế kỷ 21, để đặt tên cho khối lượng dữ liệu ngày càng lớn, đa dạng và phức tạp mà không thể dễ dàng quản lý bằng các phương pháp quản lý dữ liệu truyền thống. Trong những năm gần đây, khi nhu cầu chuyển đổi số (CĐS) tăng lên, dữ liệu lớn (DLL) nổi lên như động lực chính cho tiến trình này.
0:00 / 0:00
0:00
Chuyển đổi số và dữ liệu lớn có mối quan hệ mật thiết với nhau. Ảnh: EUROPA
Chuyển đổi số và dữ liệu lớn có mối quan hệ mật thiết với nhau. Ảnh: EUROPA

CĐS là con đường, DLL là phương tiện

Theo bài viết đăng trên tạp chí khoa học MDPI của hai tác giả Panagiotis Kostakis và Antonios Kargas, thuộc Khoa Tin học và viễn thông, Trường đại học Athens (Hy Lạp), định nghĩa “dữ liệu lớn” được chấp nhận rộng rãi nhất hiện nay là của Nhóm Công tác về DLL tại Viện Tiêu chuẩn và công nghệ quốc gia Mỹ (NIST). Nhóm nghiên cứu của NIST đã chỉ ra năm đặc trưng cơ bản của DLL, gồm khối lượng, tốc độ, sự đa dạng, tính xác thực và giá trị.

Ngày nay, con người tạo ra và thu thập nhiều dữ liệu hơn bất kỳ thời điểm nào trong quá khứ. Tất cả dữ liệu này đến từ các nguồn khác nhau như các nền tảng truyền thông xã hội, điện thoại, đồng hồ thông minh, máy tính cá nhân, thiết bị chăm sóc sức khỏe, công cụ khoa học, tổ chức tài chính... DLL cung cấp cho các doanh nghiệp cơ hội hiểu người tiêu dùng tốt hơn nhiều so trước đây. Các doanh nghiệp hiện sử dụng thông tin cụ thể cũng như những hiểu biết sâu sắc về khách hàng và hành vi của họ từ dữ liệu thu thập được để tự chuyển đổi, đồng thời điều chỉnh chiến lược bán hàng và tiếp thị.

Trong một nghiên cứu, Trung tâm Kinh doanh kỹ thuật số (CDB) của Viện Công nghệ Massachusetts và Công ty tư vấn Capgemini cho rằng, “chuyển đổi kỹ thuật số” đề cập việc sử dụng công nghệ để từng bước cải thiện hiệu suất của doanh nghiệp. Các nhà khoa học chỉ ra bốn cấp độ của CĐS gồm: Dữ liệu kỹ thuật số (thu thập, xử lý và phân tích dữ liệu kỹ thuật số giúp dự báo và ra quyết định tốt hơn); Tự động hóa (sự tích hợp công nghệ với trí tuệ nhân tạo (AI) tạo động lực cho các hệ thống hoạt động tự động và có tổ chức, giúp giảm lỗi và chi phí vận hành, đồng thời tăng tốc độ); Khả năng kết nối (sự kết nối của tất cả các hệ thống thông qua mạng viễn thông băng thông rộng đồng bộ hóa chuỗi cung ứng và giảm thời gian sản xuất); Tiếp cận khách hàng kỹ thuật số (việc truy cập internet cho phép doanh nghiệp tiếp cận khách hàng tức thì, minh bạch, đầy đủ).

Prashant Kelker, đối tác về chiến lược và giải pháp kỹ thuật số tại công ty tư vấn và nghiên cứu công nghệ ISG nói với The Enterprisers Project: “Nếu CĐS là con đường, thì DLL là một trong những phương tiện”. Trong khi đó, Rahul Singh, Giám đốc điều hành Công ty Tư vấn chuyển đổi dịch vụ kinh doanh và IT Pace Harmon cho rằng, khả năng phân tích một lượng lớn dữ liệu để có được những thông tin chi tiết, thường là theo thời gian thực, là cơ sở nền tảng của hầu hết các nỗ lực CĐS, vì thông tin chi tiết thu được thông qua phân tích DLL được sử dụng để thúc đẩy quá trình số hóa và tự động hóa quy trình làm việc.

Todd Wright, người đứng đầu bộ phận quản lý dữ liệu cá nhân tại SAS, công ty chuyên cung cấp các giải pháp chuyển đổi dữ liệu nhận định: “CĐS là quá trình chuyển đổi doanh nghiệp để đưa ra quyết định dựa trên dữ liệu, và DLL là công cụ thu thập tất cả dữ liệu có sẵn mà một tổ chức có thể tạo ra hoặc tiêu thụ. Việc nắm bắt tất cả dữ liệu có sẵn (DLL) là điều cần thiết cho các nỗ lực CĐS”.

Lộ trình phát triển hàng tỷ USD

Trong báo cáo “Chuyển đổi số: Lộ trình cho các tổ chức tỷ USD”, Viện Công nghệ Massachusetts đã chỉ ra rằng, việc tận dụng tiến trình CĐS giúp các công ty chuyển mình mạnh mẽ và tạo được đà bứt phá. Tuy nhiên, các nhà nghiên cứu cũng lưu ý rằng, CĐS thành công không đến từ việc triển khai các công nghệ mới, mà từ việc chuyển đổi tổ chức để tận dụng các khả năng mà công nghệ mới mang lại. Các sáng kiến ​​chuyển đổi kỹ thuật số chính tập trung vào việc hình dung lại trải nghiệm khách hàng, quy trình hoạt động và mô hình kinh doanh. Các công ty đang thay đổi cách thức hoạt động của các chức năng, xác định lại cách các chức năng tương tác và thậm chí mở rộng ranh giới hoạt động của công ty.

Netflix, nền tảng phát nội dung trực tuyến, thành lập năm 1997, nổi lên là một trong những công ty tận dụng hiệu quả DLL trong tiến trình CĐS. Theo số liệu do công ty này công bố, tính đến hết tháng 6/2022, Netflix có hơn 220 triệu lượt đăng ký trên toàn thế giới. Tính đến tháng 2/2022, Netflix là công ty truyền thông, giải trí lớn thứ hai thế giới theo vốn hóa thị trường, xếp thứ 115 trong bảng xếp hạng “Fortune 500” và đứng thứ 219 trong bảng xếp hạng “Forbes Global 2000”. Tỷ lệ “giữ chân khách hàng” Netflix từng có thời điểm là 93% so mức 64% và 75% của các đối thủ chính là Hulu và Amazon Prime.

Theo báo cáo của Công ty tư vấn IZZI Asia, Netflix thu thập dữ liệu từ hàng trăm triệu người đăng ký và triển khai các mô hình phân tích dữ liệu để khám phá hành vi của khách hàng, cũng như mô hình mua hàng. Sau đó, sử dụng thông tin đã thu thập để giới thiệu phim và chương trình truyền hình dựa trên sở thích của người đăng ký. Công ty này thu thập chi tiết dữ liệu tương tác và phản hồi của khách hàng cho một chương trình truyền hình dựa trên các khía cạnh như: Thời gian người dùng xem một chương trình; thiết bị được sử dụng; thời gian người dùng hoàn thành một chương trình… Khi giới thiệu chương trình “House of Cards” vào năm 2013, thay vì trình chiếu hằng tuần trên các đài như thường lệ, 13 tập phim được Netflix cho ra mắt trọn vẹn trong cùng một ngày. Thông qua phân tích dữ liệu hành vi người dùng, Netflix đã thật sự thỏa mãn nhu cầu của khách hàng.

Nhờ việc thu thập dữ liệu từ các phân cảnh mà người dùng tua lại nhiều lần, nội dung xếp hạng được đưa ra hay số lượng tìm kiếm và thông tin được tìm kiếm, Netflix tạo lập hồ sơ chi tiết về người dùng từ đó sử dụng thuật toán đề xuất để gợi ý các chương trình phù hợp sở thích của từng người đăng ký. Netflix kiếm được hàng tỷ USD nhờ giữ chân khách hàng vì hệ thống đề xuất chiếm hơn 80% nội dung được phát trực tuyến trên nền tảng này.

Những thách thức còn tồn tại

Tạp chí The European Business Review cho rằng, một trong những thách thức lớn nhất đối với việc sử dụng và phân tích DLL lại chính là dữ liệu. Nhiều doanh nghiệp thu thập nhiều dữ liệu hơn mức cần thiết, hay thậm chí thu thập các loại dữ liệu mà họ không cần dùng đến. Khi khối lượng và loại dữ liệu mà doanh nghiệp thu thập tăng lên, độ phức tạp của việc phân tích dữ liệu này cũng tăng theo. Trong bối cảnh CĐS bùng nổ, khi nhiều doanh nghiệp nhận ra giá trị của DLL, nhu cầu về nhân sự có kỹ năng phân tích dữ liệu sẽ tiếp tục tăng. Đây là một trong những lý do tại sao các kỹ năng phân tích và khoa học dữ liệu ngày nay lại có nhu cầu cao như vậy. Hầu hết các tổ chức thường gặp khó khăn trong việc sử dụng DLL do thiếu nhân viên, không đủ cơ sở hạ tầng và không có khả năng thích ứng với công nghệ này.

DLL cũng tạo ra những thách thức liên quan khả năng lưu trữ và mở rộng. Điều này gây ra những lo ngại về việc phát triển các hệ thống xử lý dữ liệu phức tạp nhằm đáp ứng nhu cầu lưu trữ dữ liệu. Một thách thức đáng kể khác đối với các doanh nghiệp là quyền riêng tư và bảo mật dữ liệu. DLL có thể được lưu trữ và truy cập dễ dàng thông qua các thiết bị điện toán đám mây, tuy nhiên, mối đe dọa về quyền riêng tư dữ liệu luôn tiềm ẩn với các thông tin nhạy cảm như chi tiết cuộc gọi, thông tin thẻ tín dụng... Các vấn đề đạo đức phát sinh từ việc lưu trữ và phân tích dữ liệu cá nhân của người dùng được coi là một trong những thách thức lớn đối với các công ty sử dụng tài nguyên DLL.

Do đó, lời khuyên mà các chuyên gia đưa ra đối với các tổ chức, doanh nghiệp là nên thu hẹp các loại dữ liệu hữu ích nhất, giúp giảm khối lượng dữ liệu cần thu thập, lưu trữ và xử lý. Trước khi dữ liệu được thu thập, một doanh nghiệp cần xác định những thách thức lớn nhất mà doanh nghiệp phải đối mặt cả trong ngắn hạn và dài hạn.