“Xây móng” từ đào tạo nhân lực

Sự bùng nổ của các mô hình ngôn ngữ lớn đã thúc đẩy dữ liệu lên vị trí trung tâm, quyết định sự thành bại của các hệ thống thông minh. Do đó, bài toán đào tạo đội ngũ nhân sự đủ năng lực chưng cất “mỏ vàng” ấy thành tri thức số có giá trị cạnh tranh cũng sẽ đóng vai trò then chốt.

Sinh viên Trường đại học Anh Quốc Việt Nam trao đổi với giảng viên về lĩnh vực dữ liệu số. (Ảnh Thế Đại)
Sinh viên Trường đại học Anh Quốc Việt Nam trao đổi với giảng viên về lĩnh vực dữ liệu số. (Ảnh Thế Đại)

Đưa lý thuyết đào tạo đến gần với thực tế

Nhiều năm qua, hệ thống giáo dục đại học Việt Nam có những bước tiến dài trong việc quốc tế hóa thông qua các bộ tiêu chuẩn như ABET hay khung đào tạo CDIO... Tuy nhiên, từ góc độ “thực chiến”, Tiến sĩ Nguyễn Thọ Chương (CTO -
Giám đốc công nghệ của start-up AI Hay) nhìn nhận: Ở trường đại học, các bạn trẻ thường làm việc với những bài toán nhỏ: Huấn luyện mô hình trên vài nghìn dữ liệu, chạy thử trên máy cá nhân là xong. Nhưng khi sản phẩm phục vụ hàng trăm nghìn, thậm chí hàng triệu người dùng, mọi thứ thay đổi hoàn toàn. Chỉ chậm thêm một phần mười giây cũng đủ khiến người dùng rời bỏ. Một lỗi nhỏ cũng có thể ảnh hưởng tới rất nhiều người. Vì vậy, các kỹ sư trẻ thường cần từ sáu tháng đến một năm để chuyển từ suy nghĩ “chương trình chạy được” sang “chương trình chạy ổn định, an toàn trong môi trường thực tế”.

Thực tế hiện nay, nhiều kỹ sư trẻ có thể nắm vững thuật toán nhưng lại thiếu kinh nghiệm lần theo từng bước xử lý để tìm điểm nghẽn khi tài nguyên bị sử dụng không hợp lý. Đáng chú ý, theo nhiều chuyên gia, kỹ năng Trade-off (đánh giá sự đánh đổi) giữa tốc độ phản hồi và độ chính xác - yêu cầu sống còn của các sản phẩm dữ liệu thương mại - chưa được giảng dạy bài bản trong nhà trường. Giáo sư, Tiến sĩ Chử Đức Trình (Hiệu trưởng Trường đại học Công nghệ, Đại học Quốc gia Hà Nội) cảnh báo về việc “lệch pha” trong quy hoạch nhân lực. Nếu chỉ tập trung vào nhân lực ứng dụng bề nổi, Việt Nam sẽ rơi vào tình trạng thiếu hụt trầm trọng các kỹ sư công nghệ lõi về lưu trữ, bán dẫn và hạ tầng dữ liệu - những yếu tố được ví như “khung xương và cơ bắp” để nuôi dưỡng “phần hồn” là thuật toán.

Trí tuệ nhân tạo (AI) được tạo nên từ thuật toán, hạ tầng và dữ liệu. Khi thuật toán ngày càng được phổ biến rộng rãi, khác biệt cạnh tranh trước mắt thường đến từ khả năng tự chủ hạ tầng và nguồn dữ liệu. Thế nhưng, đây lại là khâu yếu nhất trong đào tạo hiện nay. Anh Lê Minh Hưng, nhà sáng lập startup MH Solution chuyên về mảng dữ liệu lớn (bigdata), nhận định: Sự khan hiếm dữ liệu được chuẩn hóa là nguyên nhân hàng đầu khiến các doanh nghiệp công nghệ trong nước “khốn đốn”. Khi nguồn dữ liệu công chưa được khơi thông, nhân sự dữ liệu phải tiêu tốn 80% nguồn lực cho việc thu thập và gán nhãn thủ công. Điều này đòi hỏi nhân sự phải có năng lực clean (làm sạch) và standardize (chuẩn hóa) dữ liệu thực tế - một kỹ năng mà theo anh Hưng, phần lớn sinh viên hiện nay phải được đào tạo lại hoàn toàn tại doanh nghiệp, thông qua lộ trình cho người mới.

Kiến tạo thị trường nhân lực dữ liệu

Trong bối cảnh thị trường lao động công nghệ đang sàng lọc gắt gao, chuyên môn sâu về data chính là chìa khóa hóa giải mọi lo âu về việc làm. Kỹ sư dữ liệu Trần Nguyễn Quốc Cường chia sẻ: Nhờ vào việc được đào tạo bài bản và đào sâu về lĩnh vực dữ liệu, cơ hội việc làm của anh luôn rộng mở với mức thu nhập vượt trội so với mặt bằng chung. Anh Cường khẳng định: Nhân sự lĩnh vực dữ liệu sẽ không bao giờ phải lo lắng về sự đào thải, nếu thật sự được đào tạo chuyên sâu từ ghế nhà trường và duy trì tinh thần cập nhật kiến thức và kinh nghiệm thực chiến khi đi làm. Điều này là vô cùng cần thiết, bởi sự dịch chuyển về tiêu chuẩn nhân lực trong ngành AI nói chung, dữ liệu nói riêng đang diễn ra với tốc độ ngày một nhanh hơn. Nhà sáng lập MH Solution Lê Minh Hưng cho rằng: Thay vì tuyển 10 nhân sự mới để đào tạo từ đầu như trước, các công ty công nghệ hiện nay chỉ chọn ba người, nhưng phải ưu tiên những nhân sự có kinh nghiệm và kỹ năng sử dụng các công cụ hỗ trợ AI thành thạo để tối ưu năng suất.

Nhờ nỗ lực trong rất nhiều năm, công tác đào tạo nhân lực công nghệ ở Việt Nam đã tạo cầu nối hiệu quả từ nhà trường đến doanh nghiệp, khi chất lượng giáo dục trong nước không còn quá cách biệt với thế giới. Tuy nhiên, để thật sự tạo ra một thị trường nhân lực dữ liệu trước yêu cầu cấp thiết hiện nay thì vẫn cần có các giải pháp ở tầm vĩ mô.

Giáo sư, Tiến sĩ Chử Đức Trình đề xuất thành lập Hội đồng quốc gia Đại học-Doanh nghiệp, nơi doanh nghiệp trực tiếp đặt hàng chuẩn đầu ra và giám sát đào tạo để sinh viên “ra trường dùng được ngay”. Đồng thời, các chuyên gia kiến nghị Nhà nước sớm triển khai cơ chế sandbox (khung chính sách thử nghiệm). Tiến sĩ Nguyễn Thọ Chương mong muốn có một Data room (Phòng dữ liệu) quốc gia giúp các startup đủ điều kiện tiếp cận nguồn dữ liệu từ văn bản pháp luật, thống kê hành chính. Việc chia sẻ hạ tầng GPU Cluster (cụm đơn vị xử lý đồ họa) quốc gia sẽ là động lực quan trọng để các kỹ sư dữ liệu Việt Nam huấn luyện và tối ưu hóa các mô hình phù hợp thực tế trong nước.

Có thể thấy, dữ liệu là “máu” của nền kinh tế số, nhưng nếu không có một đội ngũ “bác sĩ” đủ trình độ, mỏ tài nguyên này sẽ mãi nằm yên trong các kho lưu trữ phân mảnh. Giải quyết “độ trễ” trong đào tạo không chỉ là nhiệm vụ của ngành giáo dục, mà cần sự hợp lực từ thiết chế Nhà nước đến năng lực thực chiến của doanh nghiệp để hiện thực hóa mục tiêu Nghị quyết số 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia ■

AI thế giới có thể dịch thuật tốt nhưng không thể hiểu sâu sắc các sắc thái văn hóa, y học cổ truyền hay quy trình pháp lý đặc thù... của Việt Nam. Việc đào tạo nhân lực dữ liệu nếu chỉ bám theo giáo trình ngoại mà bỏ quên việc “chưng cất” dữ liệu bản địa sẽ khiến sản phẩm Việt khó có cửa cạnh tranh ngay trên sân nhà”.

Tiến sĩ Nguyễn Thọ Chương