Ứng dụng AI phát hiện tin giả trên không gian mạng

Trong bối cảnh tin giả lan truyền chóng mặt trên không gian mạng, việc ứng dụng AI đa phương thức trong phát hiện thông tin sai lệch và phân tích mạng xã hội đang trở thành yêu cầu cấp thiết. Đây được xem là giải pháp quan trọng nhằm kiểm chứng và cảnh báo sớm rủi ro thông tin trên môi trường số.

Tiến sĩ Phạm Ngọc Minh, Phó trưởng phòng Kỹ thuật điều khiển và Tự động hóa cùng nhóm tác giả triển khai nhiệm vụ nghiên cứu ứng dụng AI đa phương thức trong phát hiện thông tin sai lệch và phân tích mạng xã hội. (Ảnh: TL)
Tiến sĩ Phạm Ngọc Minh, Phó trưởng phòng Kỹ thuật điều khiển và Tự động hóa cùng nhóm tác giả triển khai nhiệm vụ nghiên cứu ứng dụng AI đa phương thức trong phát hiện thông tin sai lệch và phân tích mạng xã hội. (Ảnh: TL)

Sự phát triển mạnh mẽ của các nền tảng như Facebook, TikTok, Instagram và YouTube trong những năm gần đây đã làm thay đổi sâu sắc cách con người giao tiếp, tiếp nhận và lan truyền thông tin. Không gian mạng ngày nay không còn giới hạn ở văn bản mà mở rộng sang hình ảnh, video, âm thanh cùng nhiều hình thức tương tác đa dạng khác. Mỗi phút, hàng triệu bài đăng, bình luận và video mới được tạo ra, hình thành nguồn dữ liệu khổng lồ, giàu giá trị cho việc phân tích xu hướng xã hội, nghiên cứu hành vi người dùng, theo dõi dư luận và hỗ trợ hoạch định chính sách.

Tuy nhiên, quá trình xử lý dữ liệu mạng xã hội vẫn đối mặt với nhiều thách thức kỹ thuật. Một trong những khó khăn lớn nhất là khoảng cách ngữ nghĩa giữa các loại dữ liệu khác nhau. Văn bản, hình ảnh hay video thường bổ sung ý nghĩa cho nhau, nhưng các mô hình xử lý đơn phương thức truyền thống lại phân tích tách rời từng thành phần, dẫn tới nguy cơ bỏ sót ngữ cảnh tổng thể.

Bên cạnh đó, dữ liệu mạng xã hội thường thiếu cấu trúc, chứa nhiều nhiễu, tiếng lóng, từ viết tắt hoặc nội dung có chất lượng không đồng đều, khiến việc trích xuất thông tin chính xác trở nên phức tạp hơn. Đặc biệt, tốc độ lan truyền thông tin gần như tức thời trên môi trường số đòi hỏi các hệ thống AI phải có khả năng phân tích đồng thời nhiều loại dữ liệu và xử lý theo thời gian thực để kịp thời phát hiện xu hướng hoặc cảnh báo rủi ro.

Trước yêu cầu đó, các nhà khoa học thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam gồm Tiến sĩ Phạm Ngọc Minh; Phó Giáo sư, Tiến sĩ Nguyễn Long Giang, Phó Giáo sư, Tiến sĩ Nguyễn Việt Anh (Viện Công nghệ thông tin) và Tiến sĩ Ngô Duy Tân (Trung tâm Vũ trụ Việt Nam) đã triển khai nghiên cứu về ứng dụng AI đa phương thức trong hỗ trợ phát hiện, đánh giá mức độ đáng tin cậy hoặc khả năng sai lệch của thông tin và phân tích mạng xã hội. Nghiên cứu được kỳ vọng mở ra hướng tiếp cận mới trong giám sát xu hướng thông tin và nâng cao hiệu quả phát hiện tin giả trên không gian mạng.

Chia sẻ về nghiên cứu này, Tiến sĩ Phạm Ngọc Minh, Phó trưởng phòng Kỹ thuật điều khiển và Tự động hóa (Viện Công nghệ thông tin) cho biết: AI đa phương thức là mô hình trí tuệ nhân tạo có khả năng tiếp nhận và xử lý đồng thời nhiều dạng dữ liệu như văn bản, hình ảnh, âm thanh và video. Điểm nổi bật của công nghệ này nằm ở khả năng liên kết và phân tích mối quan hệ giữa các phương thức dữ liệu, thay vì xử lý tách rời từng thành phần như các mô hình truyền thống.

Một hệ thống AI đa phương thức thường gồm ba thành phần chính: mô-đun đầu vào để trích xuất đặc trưng từ từng loại dữ liệu; mô-đun hợp nhất nhằm kết nối và đồng bộ các đặc trưng; cùng mô-đun đầu ra phục vụ các tác vụ như phân loại, dự đoán hoặc tạo nội dung. Sự phát triển của mô hình này được hỗ trợ bởi nhiều công nghệ nền tảng như học sâu, xử lý ngôn ngữ tự nhiên, thị giác máy tính và xử lý âm thanh. Trong đó, các công nghệ nhận diện giọng nói và phân tích cảm xúc giúp AI hiểu sâu hơn nội dung từ video, podcast hay các dữ liệu đa phương tiện khác.

Nhằm đáp ứng yêu cầu xử lý khối lượng dữ liệu lớn từ mạng xã hội, nhóm nghiên cứu đã xây dựng hệ thống theo mô hình phân tầng, cho phép mở rộng linh hoạt và tăng khả năng xử lý đồng thời. Hệ thống kết hợp các giao diện lập trình ứng dụng (API) chính thống với cơ chế thu thập dữ liệu công khai để khai thác thông tin từ nhiều nền tảng mạng xã hội khác nhau. Dữ liệu sau đó được đưa vào nền tảng xử lý theo thời gian thực như Apache Kafka nhằm giảm độ trễ và nâng cao tốc độ phân tích.

Ở tầng lưu trữ, hệ thống được thiết kế theo hướng kết hợp nhiều mô hình cơ sở dữ liệu nhằm đáp ứng đặc thù đa dạng của dữ liệu mạng xã hội. Các dữ liệu đặc trưng được lưu trữ dưới dạng vector để phục vụ quá trình tìm kiếm và đối chiếu thông tin với tốc độ cao. Tuy nhiên, do dữ liệu trên không gian mạng thường thiếu đồng nhất và chứa nhiều nhiễu, hệ thống phải trải qua bước tiền xử lý trước khi đưa vào phân tích.

Cụ thể, với dữ liệu văn bản, hệ thống tiến hành chuẩn hóa ngôn ngữ, xử lý biểu tượng cảm xúc và loại bỏ những thành phần dư thừa; với hình ảnh, các kỹ thuật tăng cường và chuẩn hóa dữ liệu được áp dụng nhằm nâng cao chất lượng đầu vào. Đối với video, hệ thống chỉ lựa chọn những khung hình quan trọng để tối ưu tài nguyên xử lý, trong khi dữ liệu âm thanh được khử nhiễu và phân đoạn nhằm nâng cao độ chính xác trong phân tích. Mỗi loại dữ liệu sẽ được xử lý bằng các mô hình chuyên biệt phù hợp với đặc trưng riêng.

anh-2-tin-gia.jpg
Tiến sĩ Phạm Ngọc Minh, Phó trưởng phòng Kỹ thuật điều khiển và Tự động hóa chia sẻ về nghiên cứu ứng dụng AI đa phương thức trong phát hiện thông tin sai lệch và phân tích mạng xã hội. (Ảnh: TL)

Theo nhóm nghiên cứu, hệ thống có thể triển khai trên các nền tảng mã nguồn mở như Apache Spark, PyTorch hay Milvus, qua đó hỗ trợ xử lý dữ liệu quy mô lớn với chi phí tối ưu. Một trong những ứng dụng nổi bật của mô hình là hỗ trợ đa phương thức để phát hiện, đánh giá mức độ đáng tin cậy hoặc khả năng sai lệch của thông tin. Hệ thống có khả năng phát hiện các dấu hiệu không nhất quán giữa nội dung văn bản và hình ảnh, đồng thời phân tích cảm xúc từ nhiều nguồn dữ liệu nhằm đánh giá mức độ xác thực của thông tin. Bên cạnh đó, quy trình vận hành và cập nhật mô hình học máy cũng được tích hợp, giúp hệ thống liên tục học hỏi từ dữ liệu mới và duy trì khả năng hoạt động ổn định.

Nhóm nghiên cứu cũng đề xuất áp dụng kỹ thuật “chưng cất tri thức” (Knowledge Distillation) nhằm giảm chi phí tính toán nhưng vẫn bảo đảm hiệu quả xử lý, tạo điều kiện triển khai hệ thống trên quy mô lớn.

Theo Tiến sĩ Phạm Ngọc Minh, việc kết hợp mô hình xử lý tiếng Việt PhoBERT, mô hình thị giác máy tính Vision Transformer cùng cơ chế chú ý chéo đã cho thấy tiềm năng lớn trong giải quyết bài toán phân mảnh dữ liệu giữa văn bản, hình ảnh, âm thanh và video. Việc hợp nhất các nguồn dữ liệu không chỉ nâng cao độ chính xác trong phân tích thông tin mà còn hỗ trợ hiệu quả cho các hệ thống giám sát xu hướng truyền thông, hỗ trợ phát hiện, đánh giá mức độ đáng tin cậy hoặc khả năng sai lệch của thông tin và phản ứng nhanh trước các biến động xã hội. Đồng thời, kết quả phân tích của AI cần được kết hợp với chuyên gia hoặc hệ thống kiểm chứng để bảo dảm độ tin cậy của mô hình.

Trong bối cảnh AI thế hệ mới phát triển mạnh mẽ, mô hình này được đánh giá là nền tảng quan trọng cho việc xây dựng các hệ thống quản trị nội dung số thông minh trong tương lai.

Có thể bạn quan tâm

Cơ quan chức năng khuyến cáo người tiêu dùng không nên giao dịch chỉ dựa vào video quảng cáo, livestream.

Cảnh báo lừa đảo công nghệ cao khi mua hàng online

Ủy ban Cạnh tranh quốc gia vừa phát đi cảnh báo về việc các đối tượng sử dụng trí tuệ nhân tạo (AI), nội dung giả mạo bằng trí tuệ nhân tạo (deepfake) để giả mạo người nổi tiếng, chuyên gia, cơ quan chức năng nhằm quảng cáo sai sự thật, lừa đảo người tiêu dùng trên môi trường mạng.

Các đội tham Cuộc thi “Hành trình truy vết tội phạm mạng” do Cục An ninh mạng và Phòng, chống tội phạm sử dụng công nghệ cao, Bộ Công an tổ chức. Ảnh: Cổng thông tin điện tử Bộ Công an

Nhân lực cho mặt trận phòng chống tội phạm công nghệ cao

Trong bối cảnh tội phạm sử dụng công nghệ cao ngày càng tinh vi, có yếu tố xuyên quốc gia và liên tục đổi mới phương thức, thủ đoạn, nguồn nhân lực chuyên sâu về an ninh mạng được xác định là yếu tố then chốt. Tuy nhiên, thực tiễn cho thấy công tác đào tạo, bồi dưỡng và giữ chân lực lượng này đang đối mặt với nhiều khó khăn.

Khi “mất danh tính” đáng sợ hơn mất mã OTP

Khi “mất danh tính” đáng sợ hơn mất mã OTP

Nếu như trước đây, các đường dây lừa đảo chủ yếu tìm cách khiến nạn nhân đọc mã OTP để chiếm đoạt tiền trong tài khoản, thì hiện nay, nhiều nhóm tội phạm đã chuyển sang thu thập dữ liệu eKYC (định danh điện tử) gồm: ảnh căn cước công dân, khuôn mặt, video xác thực, giọng nói, số điện thoại, tài khoản ngân hàng...

Một tin rao cho thuê nhà ở trên mạng xã hội.

Cảnh giác thủ đoạn lừa đảo mới nhắm vào người cho thuê nhà

Trong bối cảnh thị trường cho thuê nhà ở các thành phố lớn có nhiều biến động khi khách thuê trả mặt bằng, nhu cầu tìm người thuê mới tăng lên. Lợi dụng tình huống này, các đối tượng lừa đảo sử dụng thủ đoạn giả làm người thuê nhà, chủ động đặt cọc rồi yêu cầu chủ nhà bấm vào đường link lạ để chiếm đoạt tiền trong tài khoản.

Xây dựng "hệ miễn dịch số" trên trận địa tư tưởng

Xây dựng "hệ miễn dịch số" trên trận địa tư tưởng

Vượt qua những đường biên hữu hình, biên giới quốc gia hôm nay đã mở rộng trên không gian mạng, nơi thông tin lan tỏa với tốc độ chưa từng có, nơi mỗi chiếc điện thoại thông minh có thể trở thành một “cánh cửa thần kỳ” đưa con người bước vào “thế giới phẳng”.

Người dân chỉ nên thực hiện qua VNeID, ứng dụng chính thức của nhà mạng hoặc điểm giao dịch hợp pháp để được hỗ trợ chuẩn hóa thông tin thuê bao di động; tuyệt đối không cung cấp OTP, mật khẩu, ảnh khuôn mặt hay bấm vào đường link lạ. (Ảnh ĐOÀN THỦY)

Lừa đảo dưới chiêu xác thực thông tin thuê bao di động

Lợi dụng quy định mới về xác thực thông tin thuê bao di động, nhiều đối tượng đã giả danh cơ quan chức năng, nhà mạng để chiếm quyền kiểm soát SIM, từ đó đánh cắp mã OTP và rút tiền trong tài khoản ngân hàng. Thủ đoạn ngày càng tinh vi, có tổ chức, gây thiệt hại lớn cho người dân.

Bài 5: Báo chí kiến tạo niềm tin và đồng thuận xã hội

Bài 5: Báo chí kiến tạo niềm tin và đồng thuận xã hội

Bước vào thời đại số, cuộc cạnh tranh về thông tin, niềm tin và khả năng dẫn dắt dư luận xã hội diễn ra ngày càng khốc liệt. Mỗi ngày, hàng triệu video, bài viết, livestream, bình luận xuất hiện trên các nền tảng số, tạo nên “ma trận” hỗn tạp, lan truyền với tốc độ chóng mặt.

Bài 4: Trách nhiệm gọi tên mỗi cá nhân

Bài 4: Trách nhiệm gọi tên mỗi cá nhân

Không gian mạng là mặt trận tư tưởng đầy cam go và phức tạp, nơi đó ranh giới giữa cái đúng và cái sai, giữa sự thật và tin giả thường xuyên bị xóa nhòa bởi các thuật toán và ý đồ của những người đứng sau.

Bài 3: Phát huy sức mạnh tổng hợp, bảo vệ vùng “lãnh thổ thứ năm”

Bài 3: Phát huy sức mạnh tổng hợp, bảo vệ vùng “lãnh thổ thứ năm”

Nếu trước đây, chủ quyền quốc gia được xác lập trên bốn không gian truyền thống gồm đất liền, vùng nước-biển, vùng trời và không gian vũ trụ, thì ngày nay, không gian mạng đã thật sự trở thành “lãnh thổ thứ năm”, nơi diễn ra các hoạt động kinh tế, chính trị, văn hóa, xã hội với quy mô và cường độ chưa từng có.

Bài 2: Củng cố bản lĩnh cho thế hệ trẻ

Bài 2: Củng cố bản lĩnh cho thế hệ trẻ

Không gian mạng mở ra cánh cửa rộng lớn, kết nối cá nhân với thế giới, tạo cơ hội để học hỏi, sáng tạo và phát triển. Tuy nhiên, môi trường ấy dần trở thành “mặt trận không tiếng súng”, nơi các giá trị, niềm tin và lý tưởng phải đối mặt sự cạnh tranh quyết liệt và sự chống phá tinh vi, nham hiểm của thế lực thù địch.

Bài 1: Khi già làng trở thành “lá chắn số”

Bài 1: Khi già làng trở thành “lá chắn số”

Sự bùng nổ của công nghệ số và sự phát triển như vũ bão của mạng xã hội đã tạo ra những thay đổi to lớn về phương thức truyền tải thông tin, tạo ra môi trường giao tiếp đa chiều, với độ mở gần như không giới hạn.

Điểm tin an ninh mạng tháng 4/2026.

[Video] Điểm tin an ninh mạng tháng 4/2026

Trong thời gian từ nửa cuối tháng 3 đến nửa đầu tháng 4 vừa qua, cuộc đấu tranh phòng ngừa tội phạm sử dụng công nghệ cao tại Việt Nam đã có nhiều diễn biến đa dạng và phong phú. Liên tiếp các vụ án được triệt phá ở nhiều lĩnh vực đã thể hiện sự liên tục đấu tranh trấn áp trên mọi mặt trận của lực lượng an ninh.

Cạm bẫy từ các fanpage thu hút người tham gia mua thẻ cào trúng thưởng.

Bẫy vé số cào online với chiêu trò “trúng trước mất sau”

Những lời mời gọi “trúng thưởng dễ dàng, rút tiền trong vài phút” từ vé số cào online đang lan rộng trên mạng xã hội và thu hút không ít người tham gia. Tuy nhiên, phía sau những khoản “trúng nhẹ” ban đầu lại là cả một kịch bản lừa đảo công nghệ cao được dàn dựng tinh vi, khiến người chơi càng tham gia sâu càng dễ mất tiền.

Hội thảo "An toàn dữ liệu tài chính trong kỷ nguyên AI"

An toàn dữ liệu tài chính trong kỷ nguyên trí tuệ nhân tạo

Việt Nam hiện là một trong những thị trường tài chính năng động nhất khu vực, nhưng đồng thời cũng là mục tiêu hàng đầu của tội phạm mạng. Khi trí tuệ nhân tạo (AI) thâm nhập sâu vào các dịch vụ ngân hàng, chứng khoán và ví điện tử, khái niệm an toàn dữ liệu tài chính đã thay đổi hoàn toàn về bản chất. 

Cảnh giác với những bài thuốc đông y trên mạng.

[Video] Thận trọng với những quảng cáo bài thuốc đông y trên mạng xã hội

Các nhà thuốc mạo danh và những “lương y” giả đã lợi dụng tâm lý “có bệnh thì vái tứ phương” của người dân, ngang nhiên rao bán các bài thuốc đông y “gia truyền” trên mạng xã hội để trục lợi. Chính sự nhẹ dạ, cả tin này đã khiến không ít người phải trả giá đắt bằng sức khỏe, thậm chí cả tính mạng của mình.