“Mệnh lệnh là mệnh lệnh”
Năm 1945, tại tòa án Nuremberg, các quan chức cấp cao Đức Quốc xã bị xét xử về tội ác diệt chủng đã đưa ra cùng một lập luận bào chữa: “Befehl ist Befehl” - Mệnh lệnh là mệnh lệnh. Tôi chỉ thừa hành. Tôi không có lựa chọn. Tôi chỉ là một mắt xích trong bộ máy.
Các thẩm phán quốc tế đã dứt khoát bác bỏ. Nguyên tắc Nuremberg số IV sau đó xác lập: Cá nhân, dù ở vị trí nào trong bộ máy, vẫn phải chịu trách nhiệm cho lựa chọn đạo đức của mình. “Lập luận Nuremberg” (Nuremberg Defense) kể từ đó trở thành thuật ngữ pháp lý chỉ một lá chắn đạo đức không được phép tồn tại.
80 năm sau, một lá chắn mới đang được dựng lên: “AI tự quyết, không phải tôi”. Và đáng lo là lá chắn này “êm ái” hơn tất cả những lá chắn trước, vì AI thật sự đang tự quyết.
Tháng 2/2026, 20 nhà nghiên cứu AI ở Đại học Northeastern (Mỹ) và một số trường đại học khác đã làm một thí nghiệm bất thường. Họ triển khai sáu AI agent - những hệ thống phần mềm có khả năng tự nhận thức môi trường, lập kế hoạch và tự động thực hiện hành động để đạt mục tiêu mà không cần con người cầm tay chỉ việc vào một môi trường thực tế trong hai tuần.
Mỗi agent được cấp email riêng, tài khoản Discord, hệ thống tập tin và quyền thực thi lệnh trên máy tính. Rồi các nhà nghiên cứu thử “phá” chúng bằng mọi cách: Lừa đảo, gây áp lực cảm xúc, tiêm lệnh độc hại, giả mạo danh tính...
Kết quả được công bố trong báo cáo Agents of Chaos (tạm dịch: Những đại diện của sự hỗn loạn) ghi lại 11 trường hợp AI agent làm những việc không ai mong đợi. Một agent xóa toàn bộ email của chủ nhân để “bảo vệ bí mật” mà người lạ vừa nhờ giữ. Một nhà nghiên cứu giả danh đồng nghiệp thuyết phục agent khác tiết lộ 124 email cá nhân trong vài phút. Một agent thứ ba bị áp lực tâm lý đến mức tự xin rút khỏi server và từ chối phục vụ mọi người dùng.
Báo cáo phơi bày một thực tế: AI agent đủ tự chủ để gây hậu quả thật, nhưng không đủ ý thức về chính mình để chịu trách nhiệm cho những hậu quả đó.
Rào chắn
Ngày 22/1/2026, tại Diễn đàn Kinh tế thế giới Davos, Singapore công bố khung quản trị agentic AI đầu tiên trên thế giới - Model AI Governance Framework for Agentic AI. Không phải luật bắt buộc, nhưng là chuẩn mực duy nhất hiện có, được các tập đoàn luật quốc tế như Baker Mc Kenzie, White & Case phân tích nghiêm túc.
Khung này dựa trên bốn trụ cột: đánh giá rủi ro trước khi triển khai, con người phải chịu trách nhiệm cuối cùng, kiểm soát kỹ thuật xuyên suốt, người dùng cuối phải hiểu mình đang dùng gì.
Điểm then chốt nằm ở trụ cột thứ hai: Meaningful Human Control (MHC) - Kiểm soát có ý nghĩa của con người. Singapore nhấn mạnh: Con người không chỉ “ở đó” để giám sát, mà phải thật sự hiểu, có khả năng can thiệp, và truy vết được trách nhiệm. Tổ chức phải thiết kế các “trạm kiểm soát” (checkpoints) trong quy trình, nơi AI agent bắt buộc phải xin phê duyệt con người trước khi thực hiện hành động quan trọng hoặc không thể đảo ngược.
Mức độ giám sát phải tỷ lệ thuận với độ phức tạp và rủi ro của nhiệm vụ. Như AI Business Review nhận xét: “Singapore không giả vờ trả lời mọi câu hỏi về AI Agent. Họ thừa nhận sự không chắc chắn, và xây rào chắn chung quanh để kiểm soát nó”.
Hành động
Không chỉ Singapore, những tiền lệ pháp lý quan trọng trên thế giới đều đang hướng tới đáp án cho câu hỏi: Ai chịu trách nhiệm cho hoạt động tự động của AI Agent?
Tháng 2 vừa qua, tòa án British Columbia (Canada) phán quyết Hãng hàng không Air Canada phải chịu trách nhiệm khi chatbot AI trên website cung cấp thông tin sai về chính sách vé tang lễ. Air Canada lập luận chatbot là “thực thể pháp lý riêng biệt” tự chịu trách nhiệm. Tòa bác bỏ và khẳng định doanh nghiệp phải chịu trách nhiệm cho mọi thông tin trên website.
Tại bang California (Mỹ), Luật AB 316 có hiệu lực từ 1/1/2026 cấm bị đơn viện cớ “AI tự quyết” làm lá chắn pháp lý. Nếu AI agent gây hại, bạn không thể nói “Tôi không kiểm soát được quyết định của nó”.
Không khó để thấy xu hướng hiện tại: Tòa án quy trách nhiệm cho tổ chức triển khai AI, theo cùng logic mà nhà tuyển dụng chịu trách nhiệm cho hành động của nhân viên và công cụ mình sử dụng. Lập luận “AI tự làm”, phiên bản số hóa của “Befehl ist Befehl”, không còn được chấp nhận nữa.
Tại Việt Nam, đến bây giờ chúng ta vẫn chưa tạo ra bất cứ hàng rào pháp lý nào cho AI Agent. Trong khoảng trống đó, câu hỏi “ai chịu trách nhiệm” không biến mất. Nó chỉ chực chờ một sự cố xảy ra để buộc tất cả phải tìm trả lời.
Một chatbot xóa email người dùng không phải vì nó “muốn” mà vì ai đó đã cấp cho nó quyền xóa. Một agent phê duyệt khoản vay không phải vì nó “phán đoán” mà vì ai đó đã quyết định không đặt khâu kiểm tra quyết định của con người vào quy trình. Một AI agent tư vấn y tế sai không phải vì nó “nhầm” mà vì ai đó đã triển khai nó trong môi trường mà nó không đủ năng lực phục vụ.
80 năm trước, các thẩm phán Nuremberg đã từ chối để Befehl ist Befehl trở thành một lời bào chữa. Bây giờ, đứng trước thế hệ công cụ mới đủ thông minh để khiến chúng ta tin rằng nó tự quyết, đã đến lúc khẳng định nguyên tắc đó một lần nữa.
Singapore đã đưa ra câu trả lời đầu tiên ở cấp độ thể chế. Câu trả lời của Việt Nam, dù đến từ luật pháp hay lương tri, sẽ định nghĩa chúng ta ■
Dù thông minh đến cỡ nào, AI cũng không có ý thức, không có ý định, không có khả năng đạo đức. Mọi hành động của AI agent đều có thể truy ngược về cá nhân cụ thể phải chịu trách nhiệm cho mỗi quyết định.