Ứng dụng trí tuệ nhân tạo trong sáng tạo nội dung báo chí số

NDO - Trong bài tham luận gửi tới Hội thảo “Trí tuệ nhân tạo AI và quản trị sáng tạo nội dung trong toà soạn” sáng 18/3, PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam nhấn mạnh các cơ quan báo chí cần đẩy mạnh ứng dụng trí tuệ nhân tạo trong toà soạn, trong sáng tạo nội dung số nhưng phải chú trọng an toàn và an ninh thông tin. 
0:00 / 0:00
0:00
PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam phát biểu ý kiến tại Hội thảo. (Ảnh: THÀNH ĐẠT)
PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam phát biểu ý kiến tại Hội thảo. (Ảnh: THÀNH ĐẠT)

Báo Nhân Dân trân trọng giới thiệu toàn văn tham luận của PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam

Bản chất của báo chí số là sử dụng công nghệ số vận hành đồng thời sáng tạo nội dung, sản xuất các dòng sản phẩm số, kinh doanh, phát hành trên các nền tảng số, trong một hệ sinh thái số. Chuyển đổi số báo chí thực chất là chuyển đổi từ báo chí đơn loại hình sang nền báo chí lấy báo mạng điện tử làm trung tâm, ứng dụng công nghệ số trong toàn bộ hoạt động của toà soạn hội tụ.

Trí tuệ nhân tạo (Artificial Intelligence – viết tắt là AI) cùng với các công nghệ số mới như bockchain, xR… là công cụ không thể thiếu của ngành công nghiệp nội dung số, cũng là một thách thức lớn trong quản trị nội dung trong toà soạn, bởi nguy cơ gia tăng tin giả với tốc độ sản xuất cao của báo chí tự động, cũng như các rắc rối pháp lý và đạo đức báo chí truyền thông.

ChatGPT, một chatbot do công ty OpenAI của phát triển là một ví dụ điển hình về AI. Tiến sĩ Alan D. Thompson (tháng 2/2023) trích dẫn báo cáo của Cục Nghiên cứu Kinh tế Quốc gia rằng: ChatGPT được huấn luyện với 300 tỷ từ, 175 tỷ tham số, tổng thời gian huấn luyện gộp là 300 năm với chi phí huấn luyện hơn 5 triệu USD và được OpenAI phát triển từ 2015 với số tiền đầu tư 1 tỷ USD. Là một ứng dụng AI mới, với điểm khác biệt là nằm ở “kho” kiến thức đã học được, ChatGPT có thể hiểu được nội dung câu hỏi và nhanh chóng đưa ra câu trả lời lưu loát.

Đây là ứng dụng AI được tạo ra từ dữ liệu lớn (big data) và công nghệ học sâu (Deep Learning). Trong Hội thảo “ChatGPT trong báo chí truyền thông - Cơ hội và thách thức” do Hội Nhà báo Việt Nam và Báo Tuyên Quang đồng tổ chức tháng 2/2023, hầu hết các ý kiến của các nhà báo, nhà quản lý báo chí, chuyên gia công nghệ và bản quyền số đều cho rằng ứng dụng trí tuệ nhân tạo trong báo chí là một công cụ tốt.

Sử dụng tính ưu việt của ChatGPT và ứng dụng AI để phục vụ cho các hoạt động nghiệp vụ như tóm tắt nội dung văn bản và tài liệu lớn, tạo câu hỏi với một chủ đề mà người dùng không quen thuộc hoặc đang tìm kiếm những góc nhìn mới, gợi ý chủ đề, đề tài phù hợp hoặc xác định chiều hướng dư luận xã hội và nhu cầu công chúng, tìm kiếm câu trích dẫn từ một nhân vật nào đó, dùng để đặt tiêu đề bài viết, dịch thuật nội dung bài từ ngôn ngữ này sang ngôn ngữ khác, và các thử nghiệm khác nhau, thậm chí gợi ý kịch bản, nhân vật, chủ đề phỏng vấn...

Trợ lý ảo của nhà báo và toà soạn

Có nhiều cách khác nhau để áp dụng AI trong hoạt động nghiệp vụ báo chí như: tóm tắt nội dung văn bản và tài liệu, trả lời theo yêu cầu và chủ đề của người dùng hoặc sáng tạo các nội dung, các tác phẩm theo góc nhìn mới, đặt tiêu đề cho các bài báo, dịch thuật đa ngôn ngữ. Các ứng dụng này giúp nhà báo tiết kiệm thời gian và công sức lao động nghề nghiệp. AI có thể là trợ lý ảo đắc lực cho nhà báo trong tìm kiếm, xác định thông tin. Có thể sử dụng các phần mềm ứng dụng công nghệ AI để phát hiện đề tài, thu thập xử lý thông tin để theo dõi sự kiện, trích xuất thông tin và xác định xu hướng.

Các chức năng được AI hỗ trợ phổ biến gồm: Phát hiện tự động các chủ đề đang được quan tâm và thông báo cho nhà báo; tự động quét website và tải dữ liệu về thiết bị cá nhân; Khai thác thông tin từ các trang mạng xã hội; Tạo dựng kho dữ liệu từ báo giấy đã xuất bản bằng phần mềm chuyển từ hình ảnh sang văn bản (OCR); Tìm kiếm, khai thác nội dung sẵn có trong kho dữ liệu; Tìm và kiểm tra nội dung, xác định trùng lặp; Nhận dạng từ hình ảnh…

Một số phần mềm AI miễn phí như Google Alerts, Meltwater, Google trend, Tubular Labs hay các phần mềm thu phí như Chartbeat, Sharablee, Parsley, Newswhip, Social News… có thể giúp nhà báo nhận được thông tin mới nhất từ các từ khoá đã được ta cài đặt với các chủ đề từ đời sống xã hội đến khoa học, thể thao, chứng khoán... thông qua email hoặc tin nhắn.

Hiện có một số phần mềm miễn phí có thể làm trợ lý ảo tự động quét website và tải dữ liệu xuống như: Scan Web Pro, Portia, UiPath, Dịch vụ dựa trên đám mây để quét web, trích xuất dữ liệu Diggernaut. Các toà soạn cũng có thể sử dụng dịch vụ quét web giúp cho khâu thu thập dữ liệu từ các trang web Datahut, hay ứng dụng web dựa trên trình duyệt sử dụng công nghệ thu thập dữ liệu độc quyền để thu thập dữ liệu khổng lồ từ nhiều kênh… Một số phần mềm miễn phí như Social Pilot trên Google, Hootsuite, Sprout Social là những trợ lý ảo tốt cho các nhà báo và cơ quan báo chí khai thác thông tin từ mạng xã hội, gợi ý cho họ phát hiện chủ đề, đề tài.

Để số hoá dữ liệu trong toà soạn, có thể sử dụng các phần mềm ứng dụng OCR để nhận dạng các ký tự trên một file ảnh chụp hoặc pdf, sau đó trích xuất các trường thông tin trên hình ảnh và lưu trữ dưới dạng text nhằm số hóa tài liệu, cụ thể là các thông tin, dữ liệu trên ảnh chụp đó thành văn bản. Sử dụng công cụ này, các tòa soạn có thể lưu trữ các thông tin từ báo giấy một cách nhanh chóng và chính xác trong các cơ sở dữ liệu của mình. Bộ Thông tin và Truyền thông khuyên các nhà báo và cơ quan báo chí sử dụng các phần mềm AI “nội địa” như: Dịch vụ số hóa tài liệu VNPT edig, công cụ Smart RPA của VNPT, Viettel AI open platform, Viettel OCR, IONE - Giải pháp nhận dạng và bóc tách thông tin tự động, VietOCR

Các phần mềm ứng dụng AI có thể tự động phân loại, sắp xếp và trích xuất thông tin từ văn bản để xác định nguồn trích dẫn, mối quan hệ giữa các văn bản (dựa trên từ khóa), tóm tắt nội dung văn bản. Tòa soạn có thể sử dụng phần mềm phân tích văn bản để xử lý văn bản thu thập từ các nguồn khác nhau trên môi trường số một cách hiệu quả và chính xác như con người như: Amazon Comprehend, Plagiarism Detector, Wordsmith của Automated Insight…

Các nhà báo, các cơ quan báo chí cũng có thể sử sụng các phần mềm AI có tính năng nhận dạng hình ảnh để phân tích giới tính, tuổi,... để xác định các nhân vật trong ảnh. Các phần mềm các nhà báo tham khảo và lựa chọn bao gồm: Animetrics Face Recognition; Eyedea Recognition, Betaface, Imagga…

Trợ lý ảo trong sản xuất và phân phối nội dung số

AI xuất hiện giúp các người dùng tăng tốc sản xuất nội dung. Sử dụng các công cụ AI hỗ trợ quá trình viết bài, biên tập, quản trị nội dung để gia tăng tốc độ sản xuất tin bài, các tòa soạn báo. Trong sản xuất nội dung, AI có thể hỗ trợ các tính năng sau: Nhập văn bản bằng giọng nói; Chuyển văn bản thành giọng nói; Phiên dịch nội dung; Hỗ trợ kiểm chứng thông tin độc lập (fact-checking); tự động xác định các yêu cầu từ độc giả; Hỗ trợ tổ chức các thông tin và gợi ý liên kết giữa các chủ đề; Trực quan hóa dữ liệu; Phân tích hình ảnh và nhận dạng; Tự động viết các nội dung, tạo tin bài từ dữ liệu có sẵn.

Ngoài việc dùng phần mềm ứng dụng AI để làm phiên bản audio cho tất cả các bài đăng có text đang khá phổ biến ở các toà soạn báo chí có hai phiên bản trở lên, nhiều nhà báo và cơ quan báo chí đã và đang kiểm tra tính thực tế, xác minh tính chính xác của thông tin đã công bố trước đó (thông cáo báo chí...) thông qua tính năng Fact check của Google, thậm chí có thể tự mình xây dựng phần mềm phần mềm dựa trên mẫu trong thư viện AI như NLTK, Scikit-Learn…

AI có thể là trợ lý ảo trong tổ chức các thông tin và gợi ý liên kết giữa các chủ đề. Với các phần mềm thực hiện chức năng quản lý và lưu trữ thông tin văn bản/ số liệu/ bảng tính (dữ liệu), IA có thể tích hợp tính năng gợi ý liên kết giữa các văn bản trong hệ thống thông qua các từ khóa được đặt khi lưu trữ dữ liệu, hoặc dựa vào các từ khóa có tần suất xuất hiện cao nhất trong văn bản. Chẳng hạn: NodeXL là một phần mềm hỗ trợ việc biểu diễn và phân tích các mối quan hệ trên mạng xã hội; Phần mềm Google Fusion tables là một công cụ tốt cho việc phân tích dữ liệu, biểu diễn các tập dữ liệu lớn và lập bản đồ (mapping).

Một số Đài Phát thanh - Truyền hình và các toà soạn hội tụ có thể ứng dụng tính năng tự động sản xuất các nội dung có cấu trúc lặp lại cho một số tin tức như tin về thời tiết, thể thao, công nghệ… bằng cách xây dựng phần mềm tạo văn bản tự động (NLG). Gần đây nhất, Nhóm nghiên cứu của Đài Truyền hình TP Hồ Chí Minh đã thử nghiệm thành công trong việc ứng dụng ChatGPT sản xuất phóng sự truyền hình về chính mảng nội dung công nghệ.

Trong phân phối nội dung, công cụ AI có thể thông qua chatbot giúp toà soạn tiếp cận công chúng, kiểm soát thông tin phản hồi từ công chúng, hỗ trợ và tăng tốc công tác nghiên cứu công chúng, phân khúc thị trường và công chúng. Các công cụ phân tích nội dung số giúp cho toà soạn có cơ sở để từ đó cá nhân hoá nội dung hoặc xác định loại nội dung phù hợp cho từng nền tảng. AI cũng giúp việc phân tích trang website và gợi ý cách tối ưu hóa cấu trúc trang chủ của các tờ báo điện tử cũng như các nền tảng số khác của cơ quan báo chí. AI cũng là công cụ marketing số khá hiệu quả, với những phần mềm ứng dụng trong nâng thứ hạng của trang web (SEO), quảng bá nội dung qua email và đặc biệt là thu phí.

AI chỉ là công cụ số

Các phần mềm ứng dụng AI dù có nhiều tính năng vượt trội, nhưng xét đến cùng, đó cũng chỉ là một công cụ mà nhà báo phải học cách để làm chủ nó, sử dụng nó phục vụ cho hoạt động tác nghiệp của mình nhằm tạo ra tác phẩm, sản phẩm báo chí theo nguyên tắc của nghề nghiệp. Chúng có thể là công cụ đắc lực cho công tác biên tập, sản xuất báo chí tự động, nhưng nhưng nó không thể thay thế lao động sống của nhà báo tại hiện trường.

Chúng cũng không có nhạy cảm chính trị, không có lý tưởng, không có tính nhân văn, hoàn toàn không có trách nhiệm xã hội và đạo đức báo chí. Do đó để làm chủ và sử dụng được công cụ số nói chung và các phần mềm ứng dụng AI nói riêng, mỗi nhà báo Việt Nam càng phải trau dồi năng lực và phẩm chất của một nhà báo cách mạng, học hỏi, thảo luận để có thể làm chủ công nghệ, chứ không để công nghệ dẫn dắt và làm chủ chúng ta.

Nguy cơ dùng dữ liệu và tin giả trong tác phẩm báo chí là rất cao, nếu quản trị nội dung trong toà soạn không theo kịp được sự phát triển của công nghệ số. Trong bối cảnh hành lang pháp lý cho nền báo chí số của Việt Nam còn chưa theo kịp thực tiễn, những rắc rối pháp lý, sự đe doạ an ninh truyền thông, các vụ việc vi phạm bản quyền và các tranh cãi về đạo đức báo chí, trách nhiệm xã hội của báo chí khi ứng dụng báo chí tự động… là những thách thức lớn hiện nay.

Các phần mềm ứng dụng AI có thể trở thành trợ lý ảo cho các nhà báo và cơ quan báo chí trong sáng tạo nội dung, tổ chức sản xuất nội dung và phân phối nội dung báo chí số. Sự xuất hiện AI vừa là cơ hội, đồng thời là thách thức lớn với nhà báo và cơ quan báo chí, đặc biệt là với các cơ quan hữu quan quản lý nhà nước về báo chí truyền thông.

Các cơ quan báo chí cần chủ động xây dựng chiến lược chuyển đổi số, trong đó đẩy mạnh ứng dụng AI trong toà soạn. Cần chú ý là không có kịch bản chung cho việc ứng dụng AI trong quản trị sáng tạo nội dung báo chí. Với các cơ quan báo chí đang ở bước cơ bản trong chuyển đổi số, cần tập trung các ứng dụng AI trong sáng tạo nội dung và tổ chức sản xuất, nghiên cứu và phân khúc công chúng trên phiên bản báo điện tử, chú trọng an toàn và an ninh thông tin.

Với cấp độ cao hơn, các toà soạn nên triển khai ứng dụng AI trong một, một vài hoặc toàn bộ quy trình của toà soạn như: ứng dụng trong quản trị nội bộ (ứng dụng trong phần mềm quản lý tác giả, tác phẩm, quản lý đăng ký kế hoạch tin bài phóng viên…); sản xuất nội dung, phân phối, phát hành với các tính năng gợi ý nêu trên.

Với các toà soạn đã ứng dụng tốt cả quy trình, có thể triển khai ứng dụng AI cho khối tương tác, quản lý; phát triển dịch vụ giá trị gia tăng để phát triển kinh tế báo chí số, xây dựng chương trình tương tác và ứng dụng tin tức có tính năng vượt trội, giải quyết các vấn đề bản quyền và thực thi các mô hình báo chí số với cả 3 khu vực: nội dung số - công nghệ số - kinh tế số, phát triển hệ sinh thái số cho cơ quan báo chí.