Ra mắt dịch vụ đầu tiên trên thế giới chặn AI thu thập dữ liệu website khi chưa được phép

Cloudflare - công ty công nghệ hàng đầu thế giới trong lĩnh vực kết nối đám mây vừa công bố trở thành nhà cung cấp hạ tầng Internet đầu tiên trên thế giới chặn mặc định các trình thu thập dữ liệu AI (AI crawler) nếu chưa được sự cho phép của chủ sở hữu trang web.

Cloudflare trở thành nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí. (Ảnh: Cloudflare)
Cloudflare trở thành nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí. (Ảnh: Cloudflare)

Theo đó, từ tháng 7/2025, mọi tên miền sử dụng dịch vụ của Cloudflare (Mỹ) sẽ mặc định từ chối truy cập từ các trình thu thập dữ liệu AI, trừ khi có xác nhận đồng ý rõ ràng từ phía chủ trang.

Chính sách mới này nhằm ngăn chặn tình trạng các công ty phát triển trí tuệ nhân tạo (AI) tự ý “quét” nội dung văn bản, hình ảnh từ website để huấn luyện mô hình AI mà không xin phép hay chi trả cho chủ sở hữu dữ liệu.

Phát biểu về quyết định mang tính tiên phong này, ông Matthew Prince, đồng sáng lập kiêm Giám đốc điều hành Cloudflare nhấn mạnh: Nếu Internet muốn tồn tại trong thời đại AI, cần phải trả lại quyền kiểm soát cho những người sáng tạo nội dung, đồng thời vẫn giúp các công ty AI đổi mới và xây dựng một mô hình kinh tế mới phù hợp cho tất cả mọi người - nhà sáng tạo, người tiêu dùng, những nhà sáng lập AI trong tương lai và chính tương lai của web.

Trong nhiều thập kỷ qua, nội dung trên Internet được tạo ra với kỳ vọng sẽ được công cụ tìm kiếm lập chỉ mục và hướng người dùng trở lại trang gốc, tạo ra lưu lượng truy cập và nguồn thu từ quảng cáo.

Tuy nhiên, theo Cloudflare, mô hình này đang sụp đổ khi nhiều hệ thống AI hiện đại “hút” nội dung như văn bản, bài viết và hình ảnh để tạo ra câu trả lời mà không đưa người truy cập đến nguồn dữ liệu gốc, khiến các nhà sáng tạo mất cả doanh thu lẫn động lực sáng tác.

Chính sách của Cloudflare không chỉ giúp các website dễ dàng chặn AI crawler bằng một cú nhấp chuột, mà còn buộc các công ty AI phải minh bạch trong khai báo mục đích sử dụng dữ liệu, như đào tạo mô hình, tìm kiếm, hay suy luận trước khi xin phép truy cập.

Nhiều tập đoàn truyền thông và công nghệ lớn trên thế giới đã ủng hộ động thái của Cloudflare. Ông Roger Lynch, Giám đốc điều hành Tập đoàn Condé Nast cho rằng, đây là bước tiến quan trọng hướng tới việc tạo ra một sự trao đổi giá trị công bằng trên Internet nhằm bảo vệ nhà sáng tạo, hỗ trợ báo chí chất lượng và buộc các công ty AI phải có trách nhiệm.

Steve Huffman, đồng sáng lập kiêm Giám đốc điều hành của Reddit cho biết, toàn bộ hệ sinh thái gồm các nhà sáng tạo, nền tảng, người dùng web và trình thu thập dữ liệu sẽ trở nên tốt hơn khi việc thu thập dữ liệu trở nên minh bạch và được kiểm soát tốt hơn.

Sở hữu một trong những mạng lưới lớn nhất thế giới, Cloudflare hiện quản lý và bảo vệ lưu lượng truy cập cho 20% website toàn cầu. Từ tháng 9/2024, công ty đã cung cấp tùy chọn chặn AI crawler cho hơn 1 triệu khách hàng. Bước đi mới trong tháng 7/2025 là nâng tùy chọn này thành mặc định cho tất cả tên miền mới, trao quyền kiểm soát ngay từ đầu cho người sở hữu nội dung.

Theo đó, các công ty AIhiện sẽ phải có được sự cho phép rõ ràng từ trang web trước khi tiến hành thu thập dữ liệu. Khi đăng ký với Cloudflare, mọi tên miền mới sẽ được hỏi xem họ có muốn cho phép trình thu thập dữ liệu AI hay không, giúp khách hàng có quyền lựa chọn ngay từ đầu cho phép hay không cho phép trình thu thập dữ liệu AI truy cập.

Sự thay đổi này có nghĩa là mọi tên miền mới sẽ mặc định được kiểm soát và chủ trang web không còn cần phải tự mình cấu hình từ chối nữa. Khách hàng có thể dễ dàng kiểm tra cài đặt của mình và cho phép thu thập dữ liệu bất kỳ lúc nào nếu họ muốn nội dung của mình được truy cập tự do.

Bên cạnh đó, Cloudflare cũng đang phối hợp phát triển một giao thức chuẩn giúp các bot AI có thể xác thực cũng như để các trang web nhận dạng các bot này, tạo điều kiện để hệ sinh thái nội dung trở nên minh bạch và có trách nhiệm hơn.

Có thể bạn quan tâm

Chim về tổ – Trí tuệ Việt chung tay xây dựng ngành bán dẫn

Chim về tổ – Trí tuệ Việt chung tay xây dựng ngành bán dẫn

Trên bản đồ bán dẫn thế giới, có nhiều kỹ sư, nhà khoa học Việt Nam đang làm việc thầm lặng. Họ giống như những cánh chim bay xa trên bầu trời công nghệ toàn cầu, nhưng vẫn mang trong mình khát vọng trở về xây dựng ngành công nghiệp mới cho quê hương.

Trí tuệ nhân tạo (AI) là một ngành khoa học máy tính đề cập đến quá trình tái tạo trí thông minh của con người trong máy móc.

Thiết lập khung đạo đức cho trí tuệ nhân tạo

Bộ Khoa học và Công nghệ đã ban hành Thông tư số 05/2026/TT-BKHCN về quy định Khung đạo đức trí tuệ nhân tạo quốc gia, nhằm định hướng việc nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo (AI) theo hướng an toàn, có trách nhiệm và vì lợi ích của con người, cộng đồng và xã hội.

Chỉ cần quét mã QR, cử tri Hà Nội tìm hiểu các thông tin về bầu cử một cách thuận lợi. (Ảnh: KIM CHI)

Tăng cường sự tương tác giữa chính quyền với người dân

Với sự chủ động và linh hoạt trong ứng dụng công nghệ số, công tác chuẩn bị bầu cử tại nhiều địa phương đang được triển khai thuận lợi, góp phần hướng tới mục tiêu tổ chức một cuộc bầu cử dân chủ, đúng luật, an toàn và thành công.

Tiến sĩ Nguyễn Nhật Linh hướng dẫn sinh viên kiểm tra mẫu sản phẩm hạt nano vàng thu được từ quá trình tổng hợp plasma. (Ảnh: MINH ĐỨC)

Làm chủ công nghệ plasma lạnh cho vật liệu nano

Đề tài “Nghiên cứu chế tạo nguồn phát plasma lạnh ứng dụng trong tổng hợp vật liệu nano kim loại có hiệu ứng cộng hưởng plasmon bề mặt (Au, Ag)” đã mở ra hướng tiếp cận xanh, an toàn trong tổng hợp nano kim loại quý, góp phần nâng cao năng lực làm chủ công nghệ plasma và vật liệu tiên tiến trong nước.

Thủ tướng Phạm Minh Chính trao Quyết định cho đồng chí Trần Hồng Thái giữ chức Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

[Ảnh] Thủ tướng Phạm Minh Chính trao Quyết định bổ nhiệm Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Chiều 12/3, tại Hà Nội, Bí thư Đảng ủy Chính phủ, Thủ tướng Chính phủ Phạm Minh Chính đã trao Quyết định bổ nhiệm đồng chí Trần Hồng Thái, Ủy viên Ban Chấp hành Trung ương Đảng, Phó Chủ tịch Thường trực Viện Hàn lâm Khoa học và Công nghệ Việt Nam, giữ chức Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Các doanh nghiệp công nghệ được vinh danh tại Lễ biểu dương Top Công nghiệp 4.0 Việt Nam lần thứ tư.

Tìm kiếm và vinh danh những thành tựu công nghệ xuất sắc của hệ sinh thái số

Chương trình “Biểu dương thành tựu tác động vì Việt Nam số (Vietnam I4 Impact Awards) 2026” đã chính thức được khởi động với cách tiếp cận mới nhấn mạnh yếu tố “impact”- giá trị thực tiễn của công nghệ; được kỳ vọng trở thành nơi các doanh nghiệp công nghệ khẳng định năng lực đổi mới sáng tạo, lan tỏa các mô hình chuyển đổi số.

Phố phường khu vực Lâm Đồng ngàn hoa rực rỡ cờ hoa, pa-nô chào mừng ngày hội non sông.

Phường Lâm Viên-Đà Lạt chủ động xây dựng phần mềm phục vụ bầu cử

Chuẩn bị cho ngày bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp vào ngày 15/3, phường Lâm Viên-Đà Lạt, tỉnh Lâm Đồng đã chủ động xây dựng phần mềm quản lý danh sách cử tri và theo dõi tiến độ bầu cử theo thời gian thực, góp phần nâng cao hiệu quả điều hành trong ngày bầu cử.

Hiệu năng mạnh mẽ trên Galaxy S26 series là nền tảng cho các tác vụ Galaxy AI hoạt động trơn tru.

Galaxy S26: Khi Samsung định nghĩa lại “AI Phone tích hợp” từ phần cứng

AI trên smartphone ngày càng phổ biến nhưng không phải lúc nào cũng thực sự hữu ích. Với Galaxy S26, Samsung tiếp cận theo hướng khác: xây dựng một Galaxy AI Phone tích hợp, nơi phần cứng, hệ điều hành và Galaxy AI được phát triển song song để AI hoạt động ổn định và liền mạch hơn trong sử dụng hằng ngày.

Năm 2025, lượng chất thải rắn sinh hoạt phát sinh ở Việt Nam vào khoảng 70 nghìn tấn mỗi ngày, chủ yếu từ khu vực đô thị. Ảnh minh họa.

Giảm phát thải khí mê-tan từ chất thải

Năm 2025, lượng chất thải rắn sinh hoạt phát sinh ở Việt Nam vào khoảng 70 nghìn tấn mỗi ngày, chủ yếu từ khu vực đô thị. Bức tranh chất thải cho thấy rác sinh hoạt có thành phần rất đa dạng nhưng rác thải thực phẩm chiếm tỷ lệ lớn nhất, phần còn lại là các nhóm có thể tái chế, chất thải nguy hại và các loại khác.