Ứng dụng trí tuệ nhân tạo trong sáng tạo nội dung báo chí số

Trong bài tham luận gửi tới Hội thảo “Trí tuệ nhân tạo AI và quản trị sáng tạo nội dung trong toà soạn” sáng 18/3, PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam nhấn mạnh các cơ quan báo chí cần đẩy mạnh ứng dụng trí tuệ nhân tạo trong toà soạn, trong sáng tạo nội dung số nhưng phải chú trọng an toàn và an ninh thông tin. 
PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam phát biểu ý kiến tại Hội thảo. (Ảnh: THÀNH ĐẠT)
PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam phát biểu ý kiến tại Hội thảo. (Ảnh: THÀNH ĐẠT)

Báo Nhân Dân trân trọng giới thiệu toàn văn tham luận của PGS,TS Đỗ Thị Thu Hằng, Trưởng Ban Nghiệp vụ, Hội Nhà báo Việt Nam

Bản chất của báo chí số là sử dụng công nghệ số vận hành đồng thời sáng tạo nội dung, sản xuất các dòng sản phẩm số, kinh doanh, phát hành trên các nền tảng số, trong một hệ sinh thái số. Chuyển đổi số báo chí thực chất là chuyển đổi từ báo chí đơn loại hình sang nền báo chí lấy báo mạng điện tử làm trung tâm, ứng dụng công nghệ số trong toàn bộ hoạt động của toà soạn hội tụ.

Trí tuệ nhân tạo (Artificial Intelligence – viết tắt là AI) cùng với các công nghệ số mới như bockchain, xR… là công cụ không thể thiếu của ngành công nghiệp nội dung số, cũng là một thách thức lớn trong quản trị nội dung trong toà soạn, bởi nguy cơ gia tăng tin giả với tốc độ sản xuất cao của báo chí tự động, cũng như các rắc rối pháp lý và đạo đức báo chí truyền thông.

ChatGPT, một chatbot do công ty OpenAI của phát triển là một ví dụ điển hình về AI. Tiến sĩ Alan D. Thompson (tháng 2/2023) trích dẫn báo cáo của Cục Nghiên cứu Kinh tế Quốc gia rằng: ChatGPT được huấn luyện với 300 tỷ từ, 175 tỷ tham số, tổng thời gian huấn luyện gộp là 300 năm với chi phí huấn luyện hơn 5 triệu USD và được OpenAI phát triển từ 2015 với số tiền đầu tư 1 tỷ USD. Là một ứng dụng AI mới, với điểm khác biệt là nằm ở “kho” kiến thức đã học được, ChatGPT có thể hiểu được nội dung câu hỏi và nhanh chóng đưa ra câu trả lời lưu loát.

Đây là ứng dụng AI được tạo ra từ dữ liệu lớn (big data) và công nghệ học sâu (Deep Learning). Trong Hội thảo “ChatGPT trong báo chí truyền thông - Cơ hội và thách thức” do Hội Nhà báo Việt Nam và Báo Tuyên Quang đồng tổ chức tháng 2/2023, hầu hết các ý kiến của các nhà báo, nhà quản lý báo chí, chuyên gia công nghệ và bản quyền số đều cho rằng ứng dụng trí tuệ nhân tạo trong báo chí là một công cụ tốt.

Sử dụng tính ưu việt của ChatGPT và ứng dụng AI để phục vụ cho các hoạt động nghiệp vụ như tóm tắt nội dung văn bản và tài liệu lớn, tạo câu hỏi với một chủ đề mà người dùng không quen thuộc hoặc đang tìm kiếm những góc nhìn mới, gợi ý chủ đề, đề tài phù hợp hoặc xác định chiều hướng dư luận xã hội và nhu cầu công chúng, tìm kiếm câu trích dẫn từ một nhân vật nào đó, dùng để đặt tiêu đề bài viết, dịch thuật nội dung bài từ ngôn ngữ này sang ngôn ngữ khác, và các thử nghiệm khác nhau, thậm chí gợi ý kịch bản, nhân vật, chủ đề phỏng vấn...

Trợ lý ảo của nhà báo và toà soạn

Có nhiều cách khác nhau để áp dụng AI trong hoạt động nghiệp vụ báo chí như: tóm tắt nội dung văn bản và tài liệu, trả lời theo yêu cầu và chủ đề của người dùng hoặc sáng tạo các nội dung, các tác phẩm theo góc nhìn mới, đặt tiêu đề cho các bài báo, dịch thuật đa ngôn ngữ. Các ứng dụng này giúp nhà báo tiết kiệm thời gian và công sức lao động nghề nghiệp. AI có thể là trợ lý ảo đắc lực cho nhà báo trong tìm kiếm, xác định thông tin. Có thể sử dụng các phần mềm ứng dụng công nghệ AI để phát hiện đề tài, thu thập xử lý thông tin để theo dõi sự kiện, trích xuất thông tin và xác định xu hướng.

Các chức năng được AI hỗ trợ phổ biến gồm: Phát hiện tự động các chủ đề đang được quan tâm và thông báo cho nhà báo; tự động quét website và tải dữ liệu về thiết bị cá nhân; Khai thác thông tin từ các trang mạng xã hội; Tạo dựng kho dữ liệu từ báo giấy đã xuất bản bằng phần mềm chuyển từ hình ảnh sang văn bản (OCR); Tìm kiếm, khai thác nội dung sẵn có trong kho dữ liệu; Tìm và kiểm tra nội dung, xác định trùng lặp; Nhận dạng từ hình ảnh…

Một số phần mềm AI miễn phí như Google Alerts, Meltwater, Google trend, Tubular Labs hay các phần mềm thu phí như Chartbeat, Sharablee, Parsley, Newswhip, Social News… có thể giúp nhà báo nhận được thông tin mới nhất từ các từ khoá đã được ta cài đặt với các chủ đề từ đời sống xã hội đến khoa học, thể thao, chứng khoán... thông qua email hoặc tin nhắn.

Hiện có một số phần mềm miễn phí có thể làm trợ lý ảo tự động quét website và tải dữ liệu xuống như: Scan Web Pro, Portia, UiPath, Dịch vụ dựa trên đám mây để quét web, trích xuất dữ liệu Diggernaut. Các toà soạn cũng có thể sử dụng dịch vụ quét web giúp cho khâu thu thập dữ liệu từ các trang web Datahut, hay ứng dụng web dựa trên trình duyệt sử dụng công nghệ thu thập dữ liệu độc quyền để thu thập dữ liệu khổng lồ từ nhiều kênh… Một số phần mềm miễn phí như Social Pilot trên Google, Hootsuite, Sprout Social là những trợ lý ảo tốt cho các nhà báo và cơ quan báo chí khai thác thông tin từ mạng xã hội, gợi ý cho họ phát hiện chủ đề, đề tài.

Để số hoá dữ liệu trong toà soạn, có thể sử dụng các phần mềm ứng dụng OCR để nhận dạng các ký tự trên một file ảnh chụp hoặc pdf, sau đó trích xuất các trường thông tin trên hình ảnh và lưu trữ dưới dạng text nhằm số hóa tài liệu, cụ thể là các thông tin, dữ liệu trên ảnh chụp đó thành văn bản. Sử dụng công cụ này, các tòa soạn có thể lưu trữ các thông tin từ báo giấy một cách nhanh chóng và chính xác trong các cơ sở dữ liệu của mình. Bộ Thông tin và Truyền thông khuyên các nhà báo và cơ quan báo chí sử dụng các phần mềm AI “nội địa” như: Dịch vụ số hóa tài liệu VNPT edig, công cụ Smart RPA của VNPT, Viettel AI open platform, Viettel OCR, IONE - Giải pháp nhận dạng và bóc tách thông tin tự động, VietOCR

Các phần mềm ứng dụng AI có thể tự động phân loại, sắp xếp và trích xuất thông tin từ văn bản để xác định nguồn trích dẫn, mối quan hệ giữa các văn bản (dựa trên từ khóa), tóm tắt nội dung văn bản. Tòa soạn có thể sử dụng phần mềm phân tích văn bản để xử lý văn bản thu thập từ các nguồn khác nhau trên môi trường số một cách hiệu quả và chính xác như con người như: Amazon Comprehend, Plagiarism Detector, Wordsmith của Automated Insight…

Các nhà báo, các cơ quan báo chí cũng có thể sử sụng các phần mềm AI có tính năng nhận dạng hình ảnh để phân tích giới tính, tuổi,... để xác định các nhân vật trong ảnh. Các phần mềm các nhà báo tham khảo và lựa chọn bao gồm: Animetrics Face Recognition; Eyedea Recognition, Betaface, Imagga…

Trợ lý ảo trong sản xuất và phân phối nội dung số

AI xuất hiện giúp các người dùng tăng tốc sản xuất nội dung. Sử dụng các công cụ AI hỗ trợ quá trình viết bài, biên tập, quản trị nội dung để gia tăng tốc độ sản xuất tin bài, các tòa soạn báo. Trong sản xuất nội dung, AI có thể hỗ trợ các tính năng sau: Nhập văn bản bằng giọng nói; Chuyển văn bản thành giọng nói; Phiên dịch nội dung; Hỗ trợ kiểm chứng thông tin độc lập (fact-checking); tự động xác định các yêu cầu từ độc giả; Hỗ trợ tổ chức các thông tin và gợi ý liên kết giữa các chủ đề; Trực quan hóa dữ liệu; Phân tích hình ảnh và nhận dạng; Tự động viết các nội dung, tạo tin bài từ dữ liệu có sẵn.

Ngoài việc dùng phần mềm ứng dụng AI để làm phiên bản audio cho tất cả các bài đăng có text đang khá phổ biến ở các toà soạn báo chí có hai phiên bản trở lên, nhiều nhà báo và cơ quan báo chí đã và đang kiểm tra tính thực tế, xác minh tính chính xác của thông tin đã công bố trước đó (thông cáo báo chí...) thông qua tính năng Fact check của Google, thậm chí có thể tự mình xây dựng phần mềm phần mềm dựa trên mẫu trong thư viện AI như NLTK, Scikit-Learn…

AI có thể là trợ lý ảo trong tổ chức các thông tin và gợi ý liên kết giữa các chủ đề. Với các phần mềm thực hiện chức năng quản lý và lưu trữ thông tin văn bản/ số liệu/ bảng tính (dữ liệu), IA có thể tích hợp tính năng gợi ý liên kết giữa các văn bản trong hệ thống thông qua các từ khóa được đặt khi lưu trữ dữ liệu, hoặc dựa vào các từ khóa có tần suất xuất hiện cao nhất trong văn bản. Chẳng hạn: NodeXL là một phần mềm hỗ trợ việc biểu diễn và phân tích các mối quan hệ trên mạng xã hội; Phần mềm Google Fusion tables là một công cụ tốt cho việc phân tích dữ liệu, biểu diễn các tập dữ liệu lớn và lập bản đồ (mapping).

Một số Đài Phát thanh - Truyền hình và các toà soạn hội tụ có thể ứng dụng tính năng tự động sản xuất các nội dung có cấu trúc lặp lại cho một số tin tức như tin về thời tiết, thể thao, công nghệ… bằng cách xây dựng phần mềm tạo văn bản tự động (NLG). Gần đây nhất, Nhóm nghiên cứu của Đài Truyền hình TP Hồ Chí Minh đã thử nghiệm thành công trong việc ứng dụng ChatGPT sản xuất phóng sự truyền hình về chính mảng nội dung công nghệ.

Trong phân phối nội dung, công cụ AI có thể thông qua chatbot giúp toà soạn tiếp cận công chúng, kiểm soát thông tin phản hồi từ công chúng, hỗ trợ và tăng tốc công tác nghiên cứu công chúng, phân khúc thị trường và công chúng. Các công cụ phân tích nội dung số giúp cho toà soạn có cơ sở để từ đó cá nhân hoá nội dung hoặc xác định loại nội dung phù hợp cho từng nền tảng. AI cũng giúp việc phân tích trang website và gợi ý cách tối ưu hóa cấu trúc trang chủ của các tờ báo điện tử cũng như các nền tảng số khác của cơ quan báo chí. AI cũng là công cụ marketing số khá hiệu quả, với những phần mềm ứng dụng trong nâng thứ hạng của trang web (SEO), quảng bá nội dung qua email và đặc biệt là thu phí.

AI chỉ là công cụ số

Các phần mềm ứng dụng AI dù có nhiều tính năng vượt trội, nhưng xét đến cùng, đó cũng chỉ là một công cụ mà nhà báo phải học cách để làm chủ nó, sử dụng nó phục vụ cho hoạt động tác nghiệp của mình nhằm tạo ra tác phẩm, sản phẩm báo chí theo nguyên tắc của nghề nghiệp. Chúng có thể là công cụ đắc lực cho công tác biên tập, sản xuất báo chí tự động, nhưng nhưng nó không thể thay thế lao động sống của nhà báo tại hiện trường.

Chúng cũng không có nhạy cảm chính trị, không có lý tưởng, không có tính nhân văn, hoàn toàn không có trách nhiệm xã hội và đạo đức báo chí. Do đó để làm chủ và sử dụng được công cụ số nói chung và các phần mềm ứng dụng AI nói riêng, mỗi nhà báo Việt Nam càng phải trau dồi năng lực và phẩm chất của một nhà báo cách mạng, học hỏi, thảo luận để có thể làm chủ công nghệ, chứ không để công nghệ dẫn dắt và làm chủ chúng ta.

Nguy cơ dùng dữ liệu và tin giả trong tác phẩm báo chí là rất cao, nếu quản trị nội dung trong toà soạn không theo kịp được sự phát triển của công nghệ số. Trong bối cảnh hành lang pháp lý cho nền báo chí số của Việt Nam còn chưa theo kịp thực tiễn, những rắc rối pháp lý, sự đe doạ an ninh truyền thông, các vụ việc vi phạm bản quyền và các tranh cãi về đạo đức báo chí, trách nhiệm xã hội của báo chí khi ứng dụng báo chí tự động… là những thách thức lớn hiện nay.

Các phần mềm ứng dụng AI có thể trở thành trợ lý ảo cho các nhà báo và cơ quan báo chí trong sáng tạo nội dung, tổ chức sản xuất nội dung và phân phối nội dung báo chí số. Sự xuất hiện AI vừa là cơ hội, đồng thời là thách thức lớn với nhà báo và cơ quan báo chí, đặc biệt là với các cơ quan hữu quan quản lý nhà nước về báo chí truyền thông.

Các cơ quan báo chí cần chủ động xây dựng chiến lược chuyển đổi số, trong đó đẩy mạnh ứng dụng AI trong toà soạn. Cần chú ý là không có kịch bản chung cho việc ứng dụng AI trong quản trị sáng tạo nội dung báo chí. Với các cơ quan báo chí đang ở bước cơ bản trong chuyển đổi số, cần tập trung các ứng dụng AI trong sáng tạo nội dung và tổ chức sản xuất, nghiên cứu và phân khúc công chúng trên phiên bản báo điện tử, chú trọng an toàn và an ninh thông tin.

Với cấp độ cao hơn, các toà soạn nên triển khai ứng dụng AI trong một, một vài hoặc toàn bộ quy trình của toà soạn như: ứng dụng trong quản trị nội bộ (ứng dụng trong phần mềm quản lý tác giả, tác phẩm, quản lý đăng ký kế hoạch tin bài phóng viên…); sản xuất nội dung, phân phối, phát hành với các tính năng gợi ý nêu trên.

Với các toà soạn đã ứng dụng tốt cả quy trình, có thể triển khai ứng dụng AI cho khối tương tác, quản lý; phát triển dịch vụ giá trị gia tăng để phát triển kinh tế báo chí số, xây dựng chương trình tương tác và ứng dụng tin tức có tính năng vượt trội, giải quyết các vấn đề bản quyền và thực thi các mô hình báo chí số với cả 3 khu vực: nội dung số - công nghệ số - kinh tế số, phát triển hệ sinh thái số cho cơ quan báo chí.

Có thể bạn quan tâm

Phối cảnh công trình biểu tượng bông lúa Cà Mau.

"Biểu tượng bông lúa" ở Cà Mau: Không thể bóp méo giá trị văn hóa bằng vỏ bọc "thương dân"

Sự phát triển của một địa phương trong kỷ nguyên mới không chỉ được đong đếm một cách cơ học bằng những con đường rải nhựa, hay những cây cầu bê-tông nối nhịp đôi bờ. Tầm vóc và sức sống của một vùng đất còn được khắc họa đậm nét qua những biểu tượng văn hóa mang tầm nhìn chiến lược.

Đào tạo an ninh mạng tại CyRadar giúp doanh nghiệp nâng cao năng lực phòng thủ.

Tăng năng lực phòng vệ của doanh nghiệp

Chuyển đổi số đang mở ra nhiều cơ hội tăng trưởng cho doanh nghiệp Việt Nam nhưng cũng kéo theo những rủi ro an ninh mạng phức tạp. Khi dữ liệu trở thành tài sản chiến lược, khả năng bảo vệ hệ thống và thông tin không còn là vấn đề kỹ thuật mà trở thành năng lực phòng vệ quan trọng đối với mỗi doanh nghiệp.

Hoạt động nghiên cứu tại Phòng Thí nghiệm trọng điểm Công nghệ Lọc, Hóa dầu (Viện Hóa học công nghiệp Việt Nam).

Đầu tư hạ tầng nghiên cứu cho công nghệ chiến lược

Phát triển hệ thống phòng thí nghiệm trọng điểm quốc gia là một trong những giải pháp để hiện thực hóa mục tiêu đột phá về khoa học, công nghệ và đổi mới sáng tạo theo Nghị quyết 57-NQ/TW. Thực trạng lạc hậu về công nghệ đặt ra yêu cầu cấp thiết phải tổ chức lại hạ tầng nghiên cứu theo hướng tập trung, đồng bộ và hiệu quả.

Phòng An ninh mạng và phòng, chống tội phạm sử dụng công nghệ cao Công an thành phố Đà Nẵng đấu tranh tội phạm trên không gian mạng. (Ảnh: Công Vinh)

Nâng cao ý thức làm chủ, bảo vệ không gian mạng

Tại Hội nghị Trung ương 2 khóa XIV, Tổng Bí thư Tô Lâm tiếp tục khẳng định chủ trương của Đảng về bảo đảm quốc phòng, an ninh, đối ngoại, hội nhập quốc tế trong giai đoạn mới, khi nhấn mạnh yêu cầu: Tự chủ chiến lược, có năng lực kiểm soát rủi ro, có thể chế vững, có trật tự xã hội ổn định, có sự hội nhập quốc tế sâu rộng...

UAV được thử nghiệm phun thuốc cho cây cà-phê tại xã Mường Ảng, tỉnh Điện Biên.

Cơ chế sandbox đã sang giai đoạn triển khai thực tế

Bộ Khoa học và Công nghệ cho biết, bên cạnh chuẩn bị cấp phép mô hình thử nghiệm có kiểm soát đầu tiên về phát triển kinh tế tầm thấp, ứng dụng phương tiện bay không người lái (UAV) tại tỉnh Điện Biên, một số địa phương, doanh nghiệp cũng bày tỏ quan tâm đến việc triển khai thử nghiệm mô hình sandbox.

Định vị vị thế Việt Nam trên bản đồ sở hữu trí tuệ toàn cầu

Định vị vị thế Việt Nam trên bản đồ sở hữu trí tuệ toàn cầu

Trong tiến trình hội nhập kinh tế quốc tế, sở hữu trí tuệ ngày càng khẳng định vai trò là một trụ cột quan trọng của nền kinh tế tri thức. Những năm qua, Việt Nam đã chủ động hoàn thiện thể chế, từng bước xây dựng hệ thống sở hữu trí tuệ tương thích với chuẩn mực quốc tế và đạt được nhiều kết quả tích cực.

Bảo đảm pháp lý khi chuyển chất xám trí tuệ thành dòng vốn trên thị trường

Bảo đảm pháp lý khi chuyển chất xám trí tuệ thành dòng vốn trên thị trường

Luật Sở hữu trí tuệ sửa đổi 2025 được thông qua cho thấy những vấn đề pháp lý sở hữu trí tuệ đã được điều chỉnh gần và sát thực tiễn hiện nay. Trong đó, việc định giá tài sản sở hữu trí tuệ làm tài sản bảo đảm đang là nội dung thu hút sự quan tâm của đông đảo dư luận, nhất là với giới khởi nghiệp liên quan đổi mới sáng tạo.

Các sản phẩm của Hợp tác xã sản xuất và tiêu thụ dược liệu Yên Sơn (thành phố Tam Điệp, tỉnh Ninh Bình) tăng mạnh về số lượng bán ra thị trường nhờ thực hiện truy xuất nguồn gốc. (Ảnh: Hà An)

Hạ tầng số nông nghiệp và môi trường

Việc nhanh chóng xây dựng hạ tầng số cho ngành nông nghiệp và môi trường không chỉ để đáp ứng các điều kiện cần của thị trường mà còn là cơ sở cho quá trình chuẩn hóa kỹ thuật, quản lý tài nguyên, bảo vệ môi trường, ứng phó với biến đổi khí hậu và nâng cao chất lượng cuộc sống của con người.