Ra mắt dịch vụ đầu tiên trên thế giới chặn AI thu thập dữ liệu website khi chưa được phép

Cloudflare - công ty công nghệ hàng đầu thế giới trong lĩnh vực kết nối đám mây vừa công bố trở thành nhà cung cấp hạ tầng Internet đầu tiên trên thế giới chặn mặc định các trình thu thập dữ liệu AI (AI crawler) nếu chưa được sự cho phép của chủ sở hữu trang web.

Cloudflare trở thành nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí. (Ảnh: Cloudflare)
Cloudflare trở thành nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí. (Ảnh: Cloudflare)

Theo đó, từ tháng 7/2025, mọi tên miền sử dụng dịch vụ của Cloudflare (Mỹ) sẽ mặc định từ chối truy cập từ các trình thu thập dữ liệu AI, trừ khi có xác nhận đồng ý rõ ràng từ phía chủ trang.

Chính sách mới này nhằm ngăn chặn tình trạng các công ty phát triển trí tuệ nhân tạo (AI) tự ý “quét” nội dung văn bản, hình ảnh từ website để huấn luyện mô hình AI mà không xin phép hay chi trả cho chủ sở hữu dữ liệu.

Phát biểu về quyết định mang tính tiên phong này, ông Matthew Prince, đồng sáng lập kiêm Giám đốc điều hành Cloudflare nhấn mạnh: Nếu Internet muốn tồn tại trong thời đại AI, cần phải trả lại quyền kiểm soát cho những người sáng tạo nội dung, đồng thời vẫn giúp các công ty AI đổi mới và xây dựng một mô hình kinh tế mới phù hợp cho tất cả mọi người - nhà sáng tạo, người tiêu dùng, những nhà sáng lập AI trong tương lai và chính tương lai của web.

Trong nhiều thập kỷ qua, nội dung trên Internet được tạo ra với kỳ vọng sẽ được công cụ tìm kiếm lập chỉ mục và hướng người dùng trở lại trang gốc, tạo ra lưu lượng truy cập và nguồn thu từ quảng cáo.

Tuy nhiên, theo Cloudflare, mô hình này đang sụp đổ khi nhiều hệ thống AI hiện đại “hút” nội dung như văn bản, bài viết và hình ảnh để tạo ra câu trả lời mà không đưa người truy cập đến nguồn dữ liệu gốc, khiến các nhà sáng tạo mất cả doanh thu lẫn động lực sáng tác.

Chính sách của Cloudflare không chỉ giúp các website dễ dàng chặn AI crawler bằng một cú nhấp chuột, mà còn buộc các công ty AI phải minh bạch trong khai báo mục đích sử dụng dữ liệu, như đào tạo mô hình, tìm kiếm, hay suy luận trước khi xin phép truy cập.

Nhiều tập đoàn truyền thông và công nghệ lớn trên thế giới đã ủng hộ động thái của Cloudflare. Ông Roger Lynch, Giám đốc điều hành Tập đoàn Condé Nast cho rằng, đây là bước tiến quan trọng hướng tới việc tạo ra một sự trao đổi giá trị công bằng trên Internet nhằm bảo vệ nhà sáng tạo, hỗ trợ báo chí chất lượng và buộc các công ty AI phải có trách nhiệm.

Steve Huffman, đồng sáng lập kiêm Giám đốc điều hành của Reddit cho biết, toàn bộ hệ sinh thái gồm các nhà sáng tạo, nền tảng, người dùng web và trình thu thập dữ liệu sẽ trở nên tốt hơn khi việc thu thập dữ liệu trở nên minh bạch và được kiểm soát tốt hơn.

Sở hữu một trong những mạng lưới lớn nhất thế giới, Cloudflare hiện quản lý và bảo vệ lưu lượng truy cập cho 20% website toàn cầu. Từ tháng 9/2024, công ty đã cung cấp tùy chọn chặn AI crawler cho hơn 1 triệu khách hàng. Bước đi mới trong tháng 7/2025 là nâng tùy chọn này thành mặc định cho tất cả tên miền mới, trao quyền kiểm soát ngay từ đầu cho người sở hữu nội dung.

Theo đó, các công ty AIhiện sẽ phải có được sự cho phép rõ ràng từ trang web trước khi tiến hành thu thập dữ liệu. Khi đăng ký với Cloudflare, mọi tên miền mới sẽ được hỏi xem họ có muốn cho phép trình thu thập dữ liệu AI hay không, giúp khách hàng có quyền lựa chọn ngay từ đầu cho phép hay không cho phép trình thu thập dữ liệu AI truy cập.

Sự thay đổi này có nghĩa là mọi tên miền mới sẽ mặc định được kiểm soát và chủ trang web không còn cần phải tự mình cấu hình từ chối nữa. Khách hàng có thể dễ dàng kiểm tra cài đặt của mình và cho phép thu thập dữ liệu bất kỳ lúc nào nếu họ muốn nội dung của mình được truy cập tự do.

Bên cạnh đó, Cloudflare cũng đang phối hợp phát triển một giao thức chuẩn giúp các bot AI có thể xác thực cũng như để các trang web nhận dạng các bot này, tạo điều kiện để hệ sinh thái nội dung trở nên minh bạch và có trách nhiệm hơn.

Có thể bạn quan tâm

Các đại biểu tham dự hội thảo quốc tế do Trường đại học Intracom phối hợp các đơn vị tổ chức. (Ảnh: NHẬT MINH)

Ứng dụng khoa học và công nghệ vào cuộc sống - Từ lý luận đến thực tiễn

Ngày 28/1, tại Hà Nội, Trường đại học Intracom phối hợp Tạp chí Pháp luật và Phát triển, Viện khoa học và Bổ trợ Tư pháp (Liên hiệp Hội Người khuyết tật Việt Nam), Tạp chí Vận động, Nghiên cứu và Giáo dục (JARE)… tổ chức hội thảo quốc tế “Thúc đẩy ứng dụng khoa học và công nghệ vào cuộc sống - Từ lý luận đến thực tiễn”.

Người dân đến giải quyết thủ tục hành chính tại Trung tâm Phục vụ Hành chính công-Chi nhánh số 3-phường Đống Đa, Hà Nội. (Ảnh: nhandan.vn)

Khai thác hiệu quả cơ sở dữ liệu quốc gia

Cơ sở dữ liệu quốc gia về cán bộ, công chức, viên chức có vai trò thống nhất và chuẩn hóa thông tin nhân sự trong toàn bộ hệ thống cơ quan nhà nước, từ đó có cái nhìn toàn diện về số lượng, chất lượng, cơ cấu đội ngũ nhằm đưa ra các quyết định quản lý và sử dụng nhân sự một cách khoa học, hợp lý.

Sinh viên Trường đại học Khoa học xã hội và nhân văn Thành phố Hồ Chí Minh thực hành nghiên cứu khoa học.

Đổi mới nghiên cứu liên ngành trong lĩnh vực khoa học xã hội

Trong thời đại ngày nay, nhiều vấn đề không chỉ là sự quan tâm của một quốc gia đơn lẻ, mà trở thành vấn đề chung của cả khu vực và thế giới. Theo đó, thúc đẩy nghiên cứu đa ngành là con đường tất yếu để giải quyết các vấn đề thực tiễn một cách toàn diện và hiệu quả.

100% cử tri có mặt tại Hội nghị nhất trí giới thiệu đồng chí Vũ Hải Quân, Ủy viên Trung ương Đảng, Thứ trưởng Thường trực Bộ Khoa học và Công nghệ ứng cử đại biểu Quốc hội khóa XVI.

Bộ Khoa học và Công nghệ giới thiệu Thứ trưởng Thường trực Vũ Hải Quân ứng cử Đại biểu Quốc hội khóa XVI

150/150 cử tri có mặt tại hội nghị lấy ý kiến cử tri nơi công tác đối với người được dự kiến giới thiệu ứng cử Đại biểu Quốc hội khóa XVI của Bộ Khoa học và Công nghệ đã nhất trí giới thiệu Thứ trưởng Thường trực Bộ Khoa học và Công nghệ Vũ Hải Quân ứng cử Đại biểu Quốc hội khóa XVI.

Đông đảo người dân tham dự triển lãm.

Đẩy mạnh ứng dụng khoa học tiên tiến để bảo tồn và phát triển dược liệu

Sáng 23/1, Viện Dược liệu phối hợp UBND phường Cửa Nam (Hà Nội) tổ chức Triển lãm Sách và Dược liệu Việt Nam với chủ đề “Kết nối tri thức vì sức khỏe cộng đồng” tại Phố Sách Hà Nội. Triển lãm nhằm chào mừng Đại hội đại biểu toàn quốc lần thứ XIV của Đảng, kỷ niệm 96 năm Ngày thành lập Đảng và 71 năm Ngày Thầy thuốc Việt Nam.

Người dân cần kiểm tra kỹ thông tin trước khi nộp tiền phạt qua mã QR để tránh bị lừa.

Nhận diện chiêu thức lừa đảo nộp phạt “nguội” qua Zalo

Lợi dụng việc mã QR được sử dụng rộng rãi trong các thủ tục hành chính, nhiều đối tượng xấu đã giả mạo thông báo “phạt nguội”, yêu cầu người dân chuyển tiền qua mã QR trên Zalo. Người dân cần nhận diện rõ quy trình nộp phạt hợp pháp và nâng cao cảnh giác để tránh bị lừa.

Cán bộ Sở Khoa học và Công nghệ Thái Nguyên khảo sát để cấp chỉ dẫn địa lý cho gạo nếp Khẩu Nua Lếch. (Ảnh: THU HIỀN)

Đổi mới sáng tạo ở Thái Nguyên

Tỉnh Thái Nguyên đã và đang khẳng định quyết tâm biến khoa học, công nghệ trở thành khâu đột phá để thúc đẩy kinh tế-xã hội. Với hệ sinh thái đổi mới sáng tạo, Thái Nguyên từng bước đẩy nhanh phát triển kinh tế số, nâng cao năng suất, chất lượng và sức cạnh tranh của nền kinh tế.

Thủ tướng Chính phủ Phạm Minh Chính và các đồng chí lãnh đạo Đảng, Nhà nước tham quan các khu vực bên lề lễ khởi công nhà máy chế tạo chip bán dẫn Hòa Lạc.

Việt Nam sẽ bước vào nhóm số ít quốc gia sở hữu năng lực chế tạo chip bán dẫn

Chip bán dẫn hiện là “đòn bẩy” của những nước chi phối công nghệ sản xuất, sử dụng như công cụ chính trị để kiểm soát, kìm hãm kinh tế, công nghiệp an ninh quốc phòng. Việt Nam xác định bán dẫn là một trong những công nghệ chiến lược cần làm chủ, với mắt xích then chốt vừa được công bố: nhà máy sản xuất chip tại Hòa Lạc.

Ứng dụng khoa học, công nghệ là giải pháp hiệu quả để quản lý, bảo vệ tài nguyên biển.

Ứng dụng công nghệ trong quản lý các khu bảo tồn biển

Đến năm 2030, Việt Nam có 27 khu bảo tồn biển, trong đó có 16 khu bảo tồn biển cấp quốc gia, 11 cấp tỉnh với khoảng 20 hệ sinh thái, 11.000 loại thủy sản, khoảng 3.000 đảo. Đây là địa điểm lý tưởng để thực hiện nhiệm vụ lưu giữ, bảo tồn giống, nguồn gen, đa dạng sinh học; phát triển kinh tế, du lịch; phục vụ nghiên cứu khoa học…