Trong bối cảnh những hệ thống tạo sinh văn bản, hình ảnh, âm thanh có khả năng thu thập và biến đổi dữ liệu ở mức độ ngày càng tinh vi, câu hỏi về quyền sở hữu trí tuệ, quyền tác giả và giới hạn trong việc sử dụng dữ liệu để huấn luyện AI trở thành chủ đề gây tranh cãi tại nhiều quốc gia.
Các nước phát triển đã và đang có những cách tiếp cận, có thể khác nhau về phương thức, song đều nhằm mục tiêu chung: Cân bằng giữa việc thúc đẩy đổi mới sáng tạo và bảo vệ quyền lợi của giới văn nghệ sĩ.
Tại Mỹ, việc sử dụng dữ liệu có bản quyền để huấn luyện AI đang là tâm điểm của rất nhiều những tranh chấp pháp lý, đặc biệt trong lĩnh vực sáng tạo nội dung. Một trong những sự việc gây chấn động là tờ The New York Times khởi kiện các công ty công nghệ như OpenAI và Microsoft vào cuối năm 2023, cáo buộc rằng các hệ thống AI trên đã sử dụng hàng triệu bài báo mà không được cho phép để phục vụ quá trình huấn luyện. Theo nội dung đơn kiện, các mô hình này không chỉ có thể “đọc” những bài báo, mà còn có khả năng xây dựng những nội dung mới với sự tương đồng đáng kể, cho thấy lằn ranh mỏng manh giữa học hỏi và sao chép.
Nhiều họa sĩ Mỹ cũng đã lên tiếng và tiến hành những vụ kiện tập thể nhằm vào các công ty phát triển AI tạo sinh hình ảnh, cho rằng tác phẩm của họ đã bị sử dụng nhằm mục đích huấn luyện mà không có sự đồng thuận hay bồi thường thỏa đáng. Đáng chú ý hơn, phong cách của nhiều tác giả cũng có thể bị tái tạo thông qua AI, khiến họ lo ngại về việc bản sắc cá nhân bị khai thác như một dạng dữ liệu. Trong khi đó, phía công ty công nghệ lại lập luận rằng việc sử dụng dữ liệu trong huấn luyện AI là “fair use” (được sử dụng hợp lý), do quá trình này có sự biến đổi và không sao chép trực tiếp các tác phẩm gốc. Tuy nhiên, luận điểm này đang dần bị bẻ gãy khi nhiều sản phẩm đầu ra có sự tương đồng đáng kể với nội dung hoặc phong cách gốc.
Trước thực tế như vậy, hệ thống tòa án Mỹ đã và đang từng bước làm rõ cách áp dụng các bộ luật hiện hành đối với AI thông qua các phán quyết cụ thể, tập trung vào việc xác định liệu quá trình huấn luyện AI có được coi là “mang tính biến đổi” hay không, cũng như giới hạn cho mức độ tương đồng giữa dữ liệu đầu vào và sản phẩm đầu ra. Các vụ kiện, vì thế, không chỉ dừng ở mức độ tranh chấp, mà còn trực tiếp góp phần thiết lập những tiêu chí đánh giá trách nhiệm pháp lý đối với các mô hình AI.
Song song đó, Cơ quan Bản quyền tác giả Mỹ (U.S. Copyright Office) đã triển khai các đợt tham vấn công chúng từ năm 2023. Cơ quan này đồng thời công bố các báo cáo chuyên sâu về AI và quyền tác giả, trong đó làm rõ lập trường rằng các sản phẩm do AI tạo ra sẽ không được bảo hộ nếu thiếu yếu tố sáng tạo của con người. Cơ quan này cũng xem xét các đề xuất liên quan tới trách nhiệm/nghĩa vụ minh bạch dữ liệu huấn luyện và cơ chế cấp phép đối với việc sử dụng tác phẩm có bản quyền.
Một số doanh nghiệp công nghệ cũng đã bắt tay vào việc điều chỉnh chính sách sử dụng dữ liệu, bao gồm việc ký kết thỏa thuận cấp phép nội dung đối với các nhà xuất bản hoặc xây dựng cơ chế loại trừ (opt-out) theo yêu cầu của chủ sở hữu tác quyền. Những động thái này cho thấy nước Mỹ đang dần hình thành một hệ thống vận hành đa tầng, trong đó tòa án, cơ quan quản lý và doanh nghiệp cùng tham gia định hình cách thức sử dụng của AI trong lĩnh vực sáng tạo.
Còn Liên minh châu Âu (EU) lựa chọn hướng tiếp cận khác: Chủ động xây dựng các khung pháp lý dành riêng cho AI. Nổi bật nhất trong số đó là Đạo luật AI (AI Act), được thông qua năm 2024, thể hiện nỗ lực điều chỉnh toàn diện việc phát triển và ứng dụng AI, bao gồm các vấn đề liên quan tác quyền. Một trong những điểm đáng chú ý của AI Act là yêu cầu về tính minh bạch đối với các hệ thống AI tạo sinh. Theo đó, các nhà phát triển mô hình AI phải công bố thông tin tổng quan về dữ liệu được sử dụng trong quá trình huấn luyện, bao gồm cả việc sử dụng nội dung có bản quyền. Ngoài ra, các hệ thống này còn phải bảo đảm nội dung được tạo ra không vi phạm pháp luật, đồng thời có cơ chế nhận diện rõ ràng đối với sản phẩm AI. Những yêu cầu này nhằm tăng cường khả năng truy vết và xác định trách nhiệm trong trường hợp phát sinh tranh chấp liên quan tác quyền.
Bên cạnh Đạo luật AI, EU duy trì áp dụng các quy định trong Chỉ thị Bản quyền (EU Copyright Directive) 2019, đặc biệt trong cơ chế khai thác dữ liệu và văn bản (text and data mining - TDM). Theo những quy định này, các tổ chức có thể sử dụng dữ liệu để huấn luyện AI trong một số trường hợp cụ thể, nhưng chủ sở hữu tác phẩm đồng thời có quyền loại trừ (opt-out) việc sử dụng tác phẩm của mình. Điều này tạo ra một công cụ pháp lý cụ thể nhằm giúp những nhà sáng tạo kiểm soát cách thức tác phẩm của mình được khai thác trong môi trường số.
Nhìn chung, các tranh chấp về tác quyền trước AI, thực tế, vẫn thường xuyên xảy ra, đã và đang góp phần kiểm nghiệm hiệu lực của các công cụ pháp lý nói trên. Trong bối cảnh công nghệ đang tiếp tục phát triển nhanh chóng, những khoảng trống pháp lý và sự giằng co giữa đổi mới công nghệ và quyền lợi của người sáng tạo lại càng cần được con người nhìn nhận một cách điềm tĩnh với tất cả sự minh bạch, công bằng dành cho chính con người ■