Khả năng nhận biết tin giả của ChatGPT và các mô hình ngôn ngữ lớn

Mới đây, một nhà khoa học tại Đại học Wisconsin-Stout (Mỹ) đã thực hiện một nghiên cứu nhằm đánh giá khả năng nhận biết tin giả của các các mô hình ngôn ngữ lớn phổ biến trên thế giới hiện nay. Những phát hiện của ông cung cấp cái nhìn sâu sắc có giá trị, góp phần vào triển vọng sử dụng các mô hình tinh tế này để đối phó với vấn nạn tin giả, tin thất thiệt trong tương lai.
Theo kết quả nghiên cứu, mô hình GPT-4.0 của OpenAI vượt trội các mô hình khác trong thực hiện nhiệm vụ kiểm chứng thông tin. (Ảnh minh họa: Getty Images)
Theo kết quả nghiên cứu, mô hình GPT-4.0 của OpenAI vượt trội các mô hình khác trong thực hiện nhiệm vụ kiểm chứng thông tin. (Ảnh minh họa: Getty Images)

Mô hình ngôn ngữ lớn (LLMs) là sự phát triển của các kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) có thể nhanh chóng tạo ra những đoạn văn bản gần giống với văn bản do con người viết và hoàn thành một số tác vụ đơn giản khác liên quan đến ngôn ngữ.

Những mô hình này ngày càng trở nên phổ biến sau màn ra mắt bùng nổ của ứng dụng chatbot Chat GPT, một LLM hiệu suất cao do công ty khởi nghiệp OpenAI phát triển.

Cho đến nay, các nghiên cứu về LLMs chủ yếu tập trung vào đánh giá khả năng của chúng trong việc tạo văn bản, giải thích các thuật ngữ, viết luận hay tạo code máy tính. Tuy nhiên, những mô hình này còn có thể giúp con người giải quyết nhiều vấn đề khác trong thế giới thực, bao gồm phát hiện tin tức giả mạo và thông tin sai lệch.

Kevin Matthe Caramancion, một nhà khoa học tại Đại học Wisconsin-Stout (Mỹ) gần đây đã thực hiện một nghiên cứu nhằm xem xét khả năng nhận biết tin giả của các LLM phổ biến trên thế giới hiện nay. Những phát hiện của ông cung cấp cái nhìn sâu sắc có giá trị, góp phần vào việc sử dụng các mô hình tinh tế này để đối phó với vấn nạn tin giả, tin thất thiệt trong tương lai.

Chia sẻ với Tech Xplore, ông Caramancion cho biết: “Mục đích của nghiên cứu là đánh giá kỹ lưỡng tính hiệu quả của các LLM trong việc phân biệt tin thật với tin giả, sử dụng một trình mô phỏng có kiểm soát và dựa trên tiêu chuẩn là các cơ quan chuyên về kiểm chứng thông tin”.

Theo đó, nhóm nghiên cứu kiểm tra hiệu suất của các mô hình này bằng cách sử dụng bộ thử nghiệm gồm 100 đầu mục tin tức đã được kiểm chứng bởi các tổ chức kiểm chứng độc lập.

“Chúng tôi đưa từng đầu mục tin tức vào các LLM trong điều kiện được kiểm soát, phân loại những phản hồi thành một trong ba loại: Đúng, Sai và Đúng/Sai một phần. Hiệu quả của các mô hình được đo lường dựa trên mức độ chính xác mà chúng phân loại các đầu mục tin tức so với thông tin thực tế đã được xác minh do các cơ quan kiểm chứng độc lập cung cấp”, ông Caramancion cho hay.

Thông tin sai lệch đã trở thành một thách thức lớn trong những thập kỷ gần đây, khi internet và mạng xã hội khiến thông tin được lan truyền một cách nhanh chóng, bất kể thông tin đó là đúng hay sai. Do đó, nhiều nhà khoa học máy tính đã cố gắng tạo ra các công cụ và nền tảng kiểm chứng tốt hơn, cho phép người dùng kiểm tra tính xác thực của tin tức mà họ đọc trực tuyến.

Mặc dù cho đến nay đã có nhiều công cụ kiểm chứng thông tin được tạo ra và thử nghiệm, nhưng vẫn còn thiếu một mô hình đáng tin cậy và có thể áp dụng rộng rãi để chống lại việc đưa thông tin thất thiệt. Là một phần trong nghiên cứu của mình, ông Caramancion bắt đầu xác định xem liệu các LLM hiện có có thể giải quyết vấn đề toàn cầu này một cách hiệu quả hay không.

Nhà nghiên cứu thuộc Đại học Wisconsin-Stout đánh giá cụ thể hiệu suất của 4 LLM gồm: Chat GPT-3.0 và Chat GPT-4.0 của OpenAI, Bard/LaMDA của Google, và Bing AI của Microsoft. Ông cung cấp cho các mô hình này những mẩu tin tức giống nhau đã được kiểm chứng, sau đó so sánh khả năng phân loại Đúng, Sai hay Đúng/Sai một phần của 4 LLM nói trên.

Theo kết quả thu được, mô hình GPT-4.0 của OpenAI vượt trội so với các mô hình khác về thực hiện các nhiệm vụ kiểm chứng, điều này cho thấy sự tiến bộ trong các phiên bản LLM mới hơn. Tuy nhiên, tất cả các mô hình đều không đạt được hiệu quả như các cơ quan kiểm chứng, qua đó nhấn mạnh giá trị không thể thay thế của nhận thức con người.

“Những phát hiện này có thể thu hút sự quan tâm lớn hơn đối với việc phát triển các khả năng của trí tuệ nhân tạo (AI) trong lĩnh vực kiểm chứng thông tin trong khi vẫn bảo đảm sự tích hợp cân bằng, cộng sinh với các kỹ năng của con người”, ông Caramancion nói.

Có thể bạn quan tâm

Chỉ cần quét mã QR, cử tri Hà Nội tìm hiểu các thông tin về bầu cử một cách thuận lợi. (Ảnh: KIM CHI)

Tăng cường sự tương tác giữa chính quyền với người dân

Với sự chủ động và linh hoạt trong ứng dụng công nghệ số, công tác chuẩn bị bầu cử tại nhiều địa phương đang được triển khai thuận lợi, góp phần hướng tới mục tiêu tổ chức một cuộc bầu cử dân chủ, đúng luật, an toàn và thành công.

Tiến sĩ Nguyễn Nhật Linh hướng dẫn sinh viên kiểm tra mẫu sản phẩm hạt nano vàng thu được từ quá trình tổng hợp plasma. (Ảnh: MINH ĐỨC)

Làm chủ công nghệ plasma lạnh cho vật liệu nano

Đề tài “Nghiên cứu chế tạo nguồn phát plasma lạnh ứng dụng trong tổng hợp vật liệu nano kim loại có hiệu ứng cộng hưởng plasmon bề mặt (Au, Ag)” đã mở ra hướng tiếp cận xanh, an toàn trong tổng hợp nano kim loại quý, góp phần nâng cao năng lực làm chủ công nghệ plasma và vật liệu tiên tiến trong nước.

Thủ tướng Phạm Minh Chính trao Quyết định cho đồng chí Trần Hồng Thái giữ chức Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

[Ảnh] Thủ tướng Phạm Minh Chính trao Quyết định bổ nhiệm Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Chiều 12/3, tại Hà Nội, Bí thư Đảng ủy Chính phủ, Thủ tướng Chính phủ Phạm Minh Chính đã trao Quyết định bổ nhiệm đồng chí Trần Hồng Thái, Ủy viên Ban Chấp hành Trung ương Đảng, Phó Chủ tịch Thường trực Viện Hàn lâm Khoa học và Công nghệ Việt Nam, giữ chức Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Các doanh nghiệp công nghệ được vinh danh tại Lễ biểu dương Top Công nghiệp 4.0 Việt Nam lần thứ tư.

Tìm kiếm và vinh danh những thành tựu công nghệ xuất sắc của hệ sinh thái số

Chương trình “Biểu dương thành tựu tác động vì Việt Nam số (Vietnam I4 Impact Awards) 2026” đã chính thức được khởi động với cách tiếp cận mới nhấn mạnh yếu tố “impact”- giá trị thực tiễn của công nghệ; được kỳ vọng trở thành nơi các doanh nghiệp công nghệ khẳng định năng lực đổi mới sáng tạo, lan tỏa các mô hình chuyển đổi số.

Phố phường khu vực Lâm Đồng ngàn hoa rực rỡ cờ hoa, pa-nô chào mừng ngày hội non sông.

Phường Lâm Viên-Đà Lạt chủ động xây dựng phần mềm phục vụ bầu cử

Chuẩn bị cho ngày bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp vào ngày 15/3, phường Lâm Viên-Đà Lạt, tỉnh Lâm Đồng đã chủ động xây dựng phần mềm quản lý danh sách cử tri và theo dõi tiến độ bầu cử theo thời gian thực, góp phần nâng cao hiệu quả điều hành trong ngày bầu cử.

Hiệu năng mạnh mẽ trên Galaxy S26 series là nền tảng cho các tác vụ Galaxy AI hoạt động trơn tru.

Galaxy S26: Khi Samsung định nghĩa lại “AI Phone tích hợp” từ phần cứng

AI trên smartphone ngày càng phổ biến nhưng không phải lúc nào cũng thực sự hữu ích. Với Galaxy S26, Samsung tiếp cận theo hướng khác: xây dựng một Galaxy AI Phone tích hợp, nơi phần cứng, hệ điều hành và Galaxy AI được phát triển song song để AI hoạt động ổn định và liền mạch hơn trong sử dụng hằng ngày.

Năm 2025, lượng chất thải rắn sinh hoạt phát sinh ở Việt Nam vào khoảng 70 nghìn tấn mỗi ngày, chủ yếu từ khu vực đô thị. Ảnh minh họa.

Giảm phát thải khí mê-tan từ chất thải

Năm 2025, lượng chất thải rắn sinh hoạt phát sinh ở Việt Nam vào khoảng 70 nghìn tấn mỗi ngày, chủ yếu từ khu vực đô thị. Bức tranh chất thải cho thấy rác sinh hoạt có thành phần rất đa dạng nhưng rác thải thực phẩm chiếm tỷ lệ lớn nhất, phần còn lại là các nhóm có thể tái chế, chất thải nguy hại và các loại khác.

Đại diện VNPT Cyber Immunity và BIC ký kết hợp tác chiến lược phân phối sản phẩm bảo hiểm rủi ro giao dịch

Giảm thiểu thiệt hại trước lừa đảo trực tuyến

Các hình thức lừa đảo trực tuyến và rò rỉ dữ liệu cá nhân ngày càng gia tăng, gây thiệt hại hàng nghìn tỷ đồng mỗi năm khiến người dùng cá nhân đang phải đối mặt với nhiều rủi ro hơn trong môi trường số. Thực tế này đặt ra yêu cầu cấp thiết về các giải pháp phòng ngừa và hỗ trợ người dùng giảm thiểu thiệt hại khi sự cố xảy ra.