Ra mắt dịch vụ đầu tiên trên thế giới chặn AI thu thập dữ liệu website khi chưa được phép

Cloudflare - công ty công nghệ hàng đầu thế giới trong lĩnh vực kết nối đám mây vừa công bố trở thành nhà cung cấp hạ tầng Internet đầu tiên trên thế giới chặn mặc định các trình thu thập dữ liệu AI (AI crawler) nếu chưa được sự cho phép của chủ sở hữu trang web.

Cloudflare trở thành nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí. (Ảnh: Cloudflare)
Cloudflare trở thành nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí. (Ảnh: Cloudflare)

Theo đó, từ tháng 7/2025, mọi tên miền sử dụng dịch vụ của Cloudflare (Mỹ) sẽ mặc định từ chối truy cập từ các trình thu thập dữ liệu AI, trừ khi có xác nhận đồng ý rõ ràng từ phía chủ trang.

Chính sách mới này nhằm ngăn chặn tình trạng các công ty phát triển trí tuệ nhân tạo (AI) tự ý “quét” nội dung văn bản, hình ảnh từ website để huấn luyện mô hình AI mà không xin phép hay chi trả cho chủ sở hữu dữ liệu.

Phát biểu về quyết định mang tính tiên phong này, ông Matthew Prince, đồng sáng lập kiêm Giám đốc điều hành Cloudflare nhấn mạnh: Nếu Internet muốn tồn tại trong thời đại AI, cần phải trả lại quyền kiểm soát cho những người sáng tạo nội dung, đồng thời vẫn giúp các công ty AI đổi mới và xây dựng một mô hình kinh tế mới phù hợp cho tất cả mọi người - nhà sáng tạo, người tiêu dùng, những nhà sáng lập AI trong tương lai và chính tương lai của web.

Trong nhiều thập kỷ qua, nội dung trên Internet được tạo ra với kỳ vọng sẽ được công cụ tìm kiếm lập chỉ mục và hướng người dùng trở lại trang gốc, tạo ra lưu lượng truy cập và nguồn thu từ quảng cáo.

Tuy nhiên, theo Cloudflare, mô hình này đang sụp đổ khi nhiều hệ thống AI hiện đại “hút” nội dung như văn bản, bài viết và hình ảnh để tạo ra câu trả lời mà không đưa người truy cập đến nguồn dữ liệu gốc, khiến các nhà sáng tạo mất cả doanh thu lẫn động lực sáng tác.

Chính sách của Cloudflare không chỉ giúp các website dễ dàng chặn AI crawler bằng một cú nhấp chuột, mà còn buộc các công ty AI phải minh bạch trong khai báo mục đích sử dụng dữ liệu, như đào tạo mô hình, tìm kiếm, hay suy luận trước khi xin phép truy cập.

Nhiều tập đoàn truyền thông và công nghệ lớn trên thế giới đã ủng hộ động thái của Cloudflare. Ông Roger Lynch, Giám đốc điều hành Tập đoàn Condé Nast cho rằng, đây là bước tiến quan trọng hướng tới việc tạo ra một sự trao đổi giá trị công bằng trên Internet nhằm bảo vệ nhà sáng tạo, hỗ trợ báo chí chất lượng và buộc các công ty AI phải có trách nhiệm.

Steve Huffman, đồng sáng lập kiêm Giám đốc điều hành của Reddit cho biết, toàn bộ hệ sinh thái gồm các nhà sáng tạo, nền tảng, người dùng web và trình thu thập dữ liệu sẽ trở nên tốt hơn khi việc thu thập dữ liệu trở nên minh bạch và được kiểm soát tốt hơn.

Sở hữu một trong những mạng lưới lớn nhất thế giới, Cloudflare hiện quản lý và bảo vệ lưu lượng truy cập cho 20% website toàn cầu. Từ tháng 9/2024, công ty đã cung cấp tùy chọn chặn AI crawler cho hơn 1 triệu khách hàng. Bước đi mới trong tháng 7/2025 là nâng tùy chọn này thành mặc định cho tất cả tên miền mới, trao quyền kiểm soát ngay từ đầu cho người sở hữu nội dung.

Theo đó, các công ty AIhiện sẽ phải có được sự cho phép rõ ràng từ trang web trước khi tiến hành thu thập dữ liệu. Khi đăng ký với Cloudflare, mọi tên miền mới sẽ được hỏi xem họ có muốn cho phép trình thu thập dữ liệu AI hay không, giúp khách hàng có quyền lựa chọn ngay từ đầu cho phép hay không cho phép trình thu thập dữ liệu AI truy cập.

Sự thay đổi này có nghĩa là mọi tên miền mới sẽ mặc định được kiểm soát và chủ trang web không còn cần phải tự mình cấu hình từ chối nữa. Khách hàng có thể dễ dàng kiểm tra cài đặt của mình và cho phép thu thập dữ liệu bất kỳ lúc nào nếu họ muốn nội dung của mình được truy cập tự do.

Bên cạnh đó, Cloudflare cũng đang phối hợp phát triển một giao thức chuẩn giúp các bot AI có thể xác thực cũng như để các trang web nhận dạng các bot này, tạo điều kiện để hệ sinh thái nội dung trở nên minh bạch và có trách nhiệm hơn.

Có thể bạn quan tâm

Bên lề Đại hội, các đại biểu tham quan gian hàng của Công ty cổ phần Khoa học công nghệ Việt Nam (Busadco).

Doanh nghiệp khoa học-công nghệ: Củng cố nội lực để bứt phá

Trong bối cảnh đất nước bước vào kỷ nguyên kinh tế tri thức, với những đột phá mạnh mẽ về trí tuệ nhân tạo, chuyển đổi số và chuyển đổi xanh, cộng đồng doanh nghiệp khoa học-công nghệ đang đứng trước yêu cầu phải đổi mới tư duy, tái cấu trúc nguồn lực và đầu tư chiều sâu để tạo ra năng lực cạnh tranh mới.

[Video] Việt Nam tiên phong xây dựng khung pháp lý cho trí tuệ nhân tạo

[Video] Việt Nam tiên phong xây dựng khung pháp lý cho trí tuệ nhân tạo

Dự thảo Luật Trí tuệ nhân tạo không chỉ là khung pháp lý cho một công nghệ mới mà là bước đi chiến lược giúp Việt Nam chủ động nắm bắt cơ hội của kỷ nguyên số. Khi được ban hành, luật sẽ tạo nền tảng để AI phát triển an toàn nhân văn và hiệu quả, góp phần nâng cao năng lực cạnh tranh quốc gia và thúc đẩy đổi mới sáng tạo.

Các diễn giả trao đổi tại Diễn đàn. (Ảnh: Ủy ban Nhà nước về người Việt Nam ở nước ngoài)

Thúc đẩy hợp tác khoa học-công nghệ, kinh tế xanh và chuyển đổi số vì tương lai bền vững

Diễn đàn Tây Australia -Việt Nam “Tăng cường hợp tác khoa học và công nghệ vì tương lai bền vững” là cơ hội để lãnh đạo, chuyên gia, doanh nghiệp Việt Nam và Australia chia sẻ tầm nhìn, tăng cường hiểu biết và thúc đẩy hợp tác trong các lĩnh vực khoa học-công nghệ, kinh tế xanh, năng lượng tái tạo và chuyển đổi số.

Đại biểu tham dự hội thảo.

Vĩnh Long: Phối hợp chuyển giao ứng dụng khoa học-công nghệ phục vụ phát triển kinh tế-xã hội

Chiều 4/12, Văn phòng Bộ Khoa học và Công nghệ tại miền nam phối hợp Sở Khoa học và Công nghệ Vĩnh Long tổ chức Hội thảo với chủ đề “Phối hợp giữa Bộ Chủ trì Chương trình Khoa học-công nghệ cấp quốc gia với các địa phương trong chuyển giao ứng dụng kết quả nghiên cứu phục vụ phát triển kinh tế- xã hội khu vực phía nam”.

Ảnh minh họa.

Cảnh báo chiến dịch ‘Hanoi Thief’ tấn công mạng doanh nghiệp Việt Nam

Hàng loạt email giả mạo hồ sơ xin việc, đính kèm tệp “Le Xuan Son CV.zip”, được gửi đến các doanh nghiệp lớn, nhỏ tại Việt Nam. Đây là lớp vỏ ngụy trang cho chiến dịch tấn công mạng mang tên Hanoi Thief, với mục tiêu xâm nhập mạng nội bộ, chiếm quyền hệ thống và đánh cắp dữ liệu khách hàng, bí mật doanh nghiệp.

Toàn cảnh tọa đàm.

Những nghiên cứu mới hỗ trợ ngành nông nghiệp giảm phát thải, chăn nuôi bền vững

Các giải pháp đổi mới trong nông nghiệp và chăn nuôi bền vững, bao gồm việc áp dụng công nghệ gene, hệ vi sinh vật, nông nghiệp chính xác, AI và IoT để cải thiện năng suất, giảm hóa chất và phát thải, nâng cao khả năng chống chịu với biến đổi khí hậu vừa được giới thiệu tại tọa đàm “Đổi mới trong nông nghiệp và thực phẩm”.

Lễ khai mạc triển lãm “Tỏa V-Điểm chạm khoa học”.

Chín nghệ sĩ tiêu biểu của nghệ thuật đương đại Việt Nam trưng bày tác phẩm tại triển lãm "Tỏa V-Điểm chạm khoa học"

Triển lãm “Tỏa V-Điểm chạm khoa học” tôn vinh những thành tựu khoa học và ứng dụng sáng tạo vì sự phát triển bền vững và tương lai của nhân loại. Sự kiện nghệ thuật đặc biệt đánh dấu cột mốc kỷ niệm 5 năm Giải thưởng VinFuture cũng như 5 mùa triển lãm "Tỏa" của VCCA.