Có thể chống lại bằng AI?

Gửi một câu hỏi tới ChatGPT, rằng liệu trí tuệ nhân tạo (AI) có phát hiện được những nội dung giả mạo rẻ tiền (Cheapfake) hay không, bạn sẽ nhận lại hồi đáp rất chi tiết, cùng câu khẳng định là có. Nhưng thật ra, đấy mới chỉ là một nửa vấn đề.
Những công cụ AI tạo sinh như ChatGPT hiện trong quá trình phát triển, nên vẫn còn nhiều giới hạn kỹ thuật trong việc phát hiện Cheapfake.
Những công cụ AI tạo sinh như ChatGPT hiện trong quá trình phát triển, nên vẫn còn nhiều giới hạn kỹ thuật trong việc phát hiện Cheapfake.

Cheapfake - một thứ bệnh dịch

Cũng như Deepfake (nội dung giả mạo được thực hiện bởi AI công nghệ cao), Cheapfake đang là một ngành công nghiệp phát triển. Thậm chí, do không cần sử dụng các ứng dụng AI chuyên sâu mà chỉ cần các phần mềm chỉnh sửa ảnh, video phổ thông (thậm chí là miễn phí) để sản xuất, nên Cheapfake đang lan tràn “như nấm sau mưa”, xuất hiện ở mọi ngóc ngách của cuộc sống.

Và bởi ai cũng có thể dễ dàng tạo ra Cheapfake, nên những nội dung giả mạo này đang gây ra ảnh hưởng tiêu cực ngày càng lớn cho xã hội. Điều này đã được chứng minh trên thực tế, với vô số thí dụ, từ những việc mang tính chất cá nhân như sử dụng bằng lái xe, giấy khám sức khỏe hay bằng đại học giả cho tới những câu chuyện có sức lan tỏa như chuyện một đôi vợ chồng dàn dựng video ôm con trong chiếc chậu để chạy lũ trong đợt bão Yagi nhằm “câu view”, hoặc những biên lai chuyển tiền hỗ trợ đồng bào vùng lũ bị chỉnh sửa.

Ai cũng có thể dễ dàng thấy tác hại của Cheapfake. Song, không dễ để phát hiện những nội dung giả mạo rẻ tiền này. Ranh giới thật giả rất mờ nhạt, do dấu ấn của sự can thiệp kỹ thuật vào nội dung đôi khi rất ít. Thậm chí, người ta có thể tạo ra Cheapfake mà không cần sử dụng bất kỳ phần mềm nào, chỉ cần thay đổi bối cảnh của hình ảnh/video và đưa ra các tuyên bố gây hiểu lầm. Do đó, trong một số trường hợp, việc phát hiện Cheapfake đòi hỏi phải có file gốc để tham chiếu.

Trong một báo cáo có tiêu đề “MMSys’21 Grand Challenge on Detecting Cheap Fakes” đăng tải trên cổng thông tin của Đại học Cornell (Mỹ), một nhóm nhà nghiên cứu cũng chỉ ra: Chúng ta vẫn còn rất thiếu nhiều công cụ để phát hiện Cheapfake, do sự đa dạng của kiểu nội dung giả mạo này.

“Tùy thuộc vào loại nội dung deep fake, cần phải phát triển các công cụ phát hiện khác nhau. Thí dụ, các phương pháp phát hiện thao tác chỉnh sửa hình ảnh bằng các phần mềm như Photoshop và ghép ảnh đã được nghiên cứu. Tuy nhiên, việc tái ngữ cảnh hóa hoặc lạm dụng ngoài ngữ cảnh, bao gồm việc liên kết các tuyên bố sai lệch hoặc không liên quan với một hình ảnh thật để xuyên tạc sự kiện hoặc con người, lại tương đối hẹp và chưa được khám phá”, báo cáo viết.

AI có thể là điều kiện cần, nhưng chưa thể là điều kiện đủ

Đến đây, hẳn nhiều bạn đọc sẽ trở lại với vấn đề được nhắc tới ở đầu bài viết này: Tại sao không dùng AI, đặc biệt là AI tạo sinh (Generative AI), để phát hiện Cheapfake? Lời đáp sẽ là “Có thể!”, nếu bạn đặt câu hỏi cho một trong những ứng dụng AI tạo sinh nổi tiếng nhất hiện nay, ChatGPT.

Để tiện cho độc giả hiểu rõ vấn đề, chúng tôi đã đặt câu hỏi với ChatGPT, và nhận được đáp án tương đối chi tiết. ChatGPT cho biết: AI tạo sinh có thể được sử dụng để phát hiện Cheapfake (chẳng hạn những video, hình ảnh đã được chỉnh sửa) đồng thời cũng chỉ ra một số phương pháp phát hiện các nội dung giả mạo này.

Trong số đó, có thể kể đến kỹ thuật phân tích hình ảnh, khi các thuật toán học sâu được huấn luyện để nhận diện những dấu hiệu của chỉnh sửa trong hình ảnh, như bóng đổ không tự nhiên, lỗi kết cấu hoặc các đường viền giả tạo chung quanh đối tượng... Hoặc kỹ thuật phát hiện video giả mạo, khi AI sẽ phân tích các video để tìm kiếm sự không nhất quán trong chuyển động hoặc âm thanh, cũng như phát hiện các biểu hiện không tự nhiên hoặc các hình ảnh bị lồng ghép.

Ngoài ra còn có kỹ thuật GAN (Generative Adversarial Networks), một mô hình AI được huấn luyện để phát hiện những mẫu không tự nhiên trong hình ảnh hoặc video đã qua chỉnh sửa. Ngoài ra, cũng có thể sử dụng việc phân tích metadata (siêu dữ liệu) của hình ảnh hoặc video để kiểm tra thời gian, địa điểm và thông tin khác, nhằm xác thực.

Việc sử dụng AI tạo sinh trong phát hiện nội dung giả mạo đang là một lĩnh vực nghiên cứu tích cực và ngày càng trở nên quan trọng, trong bối cảnh thông tin sai lệch tràn lan hiện nay. Nhưng theo một số chuyên gia, AI tạo sinh không phải chìa khóa vạn năng, do bản thân những công cụ này cũng chỉ đang trong quá trình hoàn thiện.

Trong một bài viết trên tạp chí Forbes, Tiến sĩ Lance Eliot - nhà nghiên cứu hàng đầu thế giới về AI và học máy cũng tiết lộ: Ông từng ghi nhận nhiều phát hiện sai lầm của các máy dò AI, khi cố gắng xác định xem bài luận của sinh viên có được viết bởi AI hay do chính tay sinh viên thực hiện. “Có rất nhiều kết quả dương tính giả và âm tính giả, và đôi khi những sinh viên dành hết tâm huyết để viết bài luận lại bị bôi nhọ danh tiếng một cách bất công”, Tiến sĩ Eliot cho biết. “Điều này là do các máy dò AI không đáng tin cậy, hoặc do những người sử dụng AI không hiểu được hạn chế của ứng dụng và không phân biệt được những phát hiện sai lầm”.

Vì thế, Tiến sĩ Eliot cho rằng, chúng ta vẫn còn một chặng đường dài phía trước để có thể dùng các công cụ AI phát hiện Cheapfake hiệu quả, nhất là khi những kẻ sản xuất nội dung giả mạo cũng phát triển nhiều phương thức đánh lạc hướng AI. “Và trên lộ trình này, chúng ta cần phải tỉnh táo, không để sự xuất hiện của các công cụ AI tự nhận là máy phát hiện Cheapfake đáng tin cậy gây ảnh hưởng xấu đến xã hội”, ông nhấn mạnh.

Ở thời điểm hiện tại, theo Tiến sĩ Eliot, AI chỉ nên được xem như một phương tiện cảnh báo và hỗ trợ phát hiện Cheapfake, còn giải pháp ý nghĩa hơn lại nằm ở khía cạnh xã hội. “Chúng ta cần tạo động lực cho việc sản xuất và chia sẻ nội dung đã được xác minh, nội dung trung thực… đồng thời tăng cường hành động pháp lý đối với Cheapfake. Nguy cơ bị truy tố hình sự sẽ khiến những ai muốn tạo ra nội dung giả mạo phải nghĩ lại”, Tiến sĩ Eliot khẳng định.