CHUYÊN ĐỀ: NHẠC AI: RANH GIỚI GIỮA “TẠO RA” VÀ “SÁNG TẠO”

Có không ca khúc AI thành công trong vài giây?

Vào một đêm khuya tháng 3 năm 2026, trong đầu tôi hiện ra một câu chuyện thần thoại tình yêu về canh Mạnh Bà. Nhưng tôi không có đủ công cụ để phối khí, cũng không có diễn viên để quay hình. AI đã giúp tôi chạm tới giấc mơ” - Uy Mãnh Tiên Sinh, tác giả gốc của ca khúc tỷ view Trung Quốc "Mạnh Bà chê ta phiền" chia sẻ.

Hình ảnh 2D ca khúc "Mạnh Bà chê ta phiền" của Uy Mãnh Tiên Sinh.
Hình ảnh 2D ca khúc "Mạnh Bà chê ta phiền" của Uy Mãnh Tiên Sinh.

Câu chuyện của những nhà sản xuất “cô đơn”

Uy Mãnh Tiên Sinh (Mr. Wei - 40 tuổi), là Giám đốc công nghệ của một công ty Internet tại Trung Quốc. Công việc chính của anh là lập trình viên. Anh có đam mê âm nhạc từ rất sớm, ước mơ của anh trong những năm tuổi trẻ là được “nhuộm một mái đầu bạc, đeo đàn guitar đi lãng du”.

Anh cho biết: “Năm 18 tuổi, tôi vốn muốn đi học nhạc. Nhưng gia đình không ủng hộ, nên cuối cùng tôi phải chọn học ngành máy tính để có một công việc và thu nhập ổn định”. Dù vậy, anh vẫn tự mình theo đuổi công việc sáng tác, ban ngày đi làm, ban đêm viết nhạc. Hàng trăm ca khúc đã được anh viết ra trên giấy nhưng lại cất đi và từng có những đêm anh bật khóc khi nghe lại bài hát do chính mình viết vì nuối tiếc cho giấc mơ chưa thành hiện thực.

Khi trí tuệ nhân tạo (AI) xuất hiện và bùng nổ trên toàn thế giới, Trung Quốc là một trong những đất nước phát triển mạnh nhất về công nghệ này. Vốn là một người làm trong ngành công nghệ, Uy Mãnh Tiên Sinh sớm tiếp cận và thấu hiểu sức mạnh của AI. Một đêm khuya năm 2026, ý tưởng về một ca khúc liên quan đến câu chuyện tình yêu thần thoại về bát canh Mạnh Bà nổi tiếng trong truyền thuyết Trung Hoa, thứ nước uống vào sẽ xóa sạch mọi ký ức trần gian, xuất hiện trong đầu anh. Khao khát đưa câu chuyện đó vào âm nhạc trở nên mãnh liệt trong đầu của Uy Mãnh. Không có nhạc cụ để phối khí, cũng chẳng có diễn viên để quay hình, hay một ekip hùng hậu để sản xuất, anh đã có quyết định thử nghiệm việc sản xuất ca khúc của mình bằng công cụ AI. Quá trình này diễn ra nhanh chóng, “Giọng nữ là tôi dùng AI tạo ra, còn giọng nam là do tôi tự thu âm, sau đó tôi cũng dùng phần mềm Seedance để tạo lên một video hoàn chỉnh”, Uy Mãnh Tiên Sinh chia sẻ.

Ngay trong ngày đầu tiên phát hành, video ca khúc “Mạnh Bà chê ta phiền” đã đạt 7 triệu lượt xem và tiếp tục tăng lên mức hàng chục triệu lượt nghe. Cùng với AI, Uy Mãnh Tiên Sinh tạo ra hàng loạt những ca khúc triệu view như: “Nguyệt Lão uống say rồi”, “Hai mái đầu bạc”, “Lần đầu tôi qua cầu (Nại Hà)”..., anh chính thức trở thành một nhà sáng tạo nội dung nổi tiếng. Anh cũng quyết định từ bỏ công việc kỹ thuật để dành 100% thời gian cho đam mê anh theo đuổi từ tuổi 18 là sáng tác và sản xuất âm nhạc.

Một câu chuyện mang nhiều tâm tư hơn là hành trình của Trọng Nhân ở Việt Nam. Anh là một nhạc công, nhạc sĩ và nhà sản xuất với 12 năm theo đuổi âm nhạc, 10 năm học nhạc cụ và 5 năm tự học về sản xuất âm nhạc, mix, master… Là một nhà sản xuất đơn độc như anh tự nhận, trong quá trình làm nhạc, Trọng Nhân phải đối mặt với những rào cản lớn về chi phí nếu muốn có một sản phẩm âm nhạc chất lượng và chỉn chu, như chi phí sản xuất (quay, dựng, hậu kỳ…), chi phí thuê ca sĩ thể hiện, chi phí thu âm.

Căn phòng của anh là đàn guitar, máy tính với thiết bị thu âm và những bản thảo sáng tác dang dở ngổn ngang. Mọi gánh nặng tài chính và nhân lực tưởng chừng đã bóp nghẹt giấc mơ làm nghề. Và rồi AI xuất hiện như một bước ngoặt. Và thế là Trọng Nhân tạo ra Tiểu Mỹ, một thực thể AI có khả năng hát, trình diễn, biểu lộ cảm xúc.

162.jpg
Ca khúc "Hôn lễ của em", với hình ảnh và giọng hát kết hợp Trọng Nhân và thực thể AI TIểu Mỹ đạt lượt xem cao trên các nền tảng số.

“Không có sản phẩm âm nhạc thành công trong 3 giây”

Tính đến thời điểm hiện tại, với ca sĩ AI Tiểu Mỹ, Trọng Nhân đã liên tiếp tạo ra những bản phối đạt lượt nghe cao trên các nền tảng số như “Nếu cả đời này không rực rỡ”, “Hôn lễ của em”, hay “Mãi mãi là bao lâu”... Trên nền tảng YouTube, kênh “Tiểu Mỹ Official” đã thu hút gần 9 nghìn người đăng ký. Đáng chú ý nhất, ca khúc “Hôn lễ của em” hiện tại đạt hơn 12 triệu lượt xem chỉ sau 2 tháng ra mắt. Các ca khúc khác như “Nếu cả đời này không rực rỡ” cũng đạt 951 nghìn lượt xem và “Mãi mãi là bao lâu” thu về 133 nghìn lượt xem chỉ trong 1 tháng. Hiện tại, Tiểu Mỹ trở thành thực thể AI số 1 tại Việt Nam hiện nay trong lĩnh vực âm nhạc.

Ngày nay, sự ra đời của các nền tảng tạo nhạc bằng AI như Suno, Udio hay Soundraw cho phép người dùng chỉ cần nhập câu lệnh, công cụ sẽ trả ngay sản phẩm trong thời gian tính bằng giây hoặc phút. Điều này hình thành quan điểm cho rằng, việc làm nhạc hiện nay diễn ra tự động và tức thời, hoặc ai cũng có thể tạo ra các sản phẩm âm nhạc.

Thực tế, việc tạo ra sản phẩm âm nhạc AI thì ai cũng làm được. Nhưng để có một tác phẩm đủ chất lượng, sự độc đáo và được đón nhận cũng đòi hỏi những tiêu chuẩn nhất định cả về tư duy, kiến thức và kỹ năng nghệ thuật.

Quy trình tạo ra Tiểu Mỹ được Trọng Nhân kết hợp giữa kỹ thuật sản xuất truyền thống và các công cụ AI. Ý tưởng, câu chuyện gốc, nội dung bài hát, giai điệu chính và cách sắp xếp các lớp nhạc cụ đều do Trọng Nhân trực tiếp thực hiện, AI được sử dụng để hỗ trợ xử lý âm thanh và giọng hát theo định hướng nghệ thuật. Phần hình ảnh được anh sử dụng các công cụ sản xuất video như Kling và Veo để tạo ra các chuyển động và hiệu ứng thị giác sống động.

Cuối cùng, ở khâu hậu kỳ, Trọng Nhân đã thực hiện các thao tác can thiệp thủ công bằng cách chủ động tạo ra những độ lệch nhẹ trong cách nhả chữ và giữ lại những âm thanh như tiếng hơi thở nhỏ giữa các câu hát; đồng thời áp dụng kiến thức chuyên môn về mixing, mastering, xử lý cao độ, trường độ, không gian để tạo ra một Tiểu Mỹ với khuôn mặt khả ái và giọng hát nữ cao bay bổng, nhẹ nhàng phù hợp với xu hướng nghe nhạc hiện đại.

Hay trong những sản phẩm của Uy Mãnh Tiên Sinh, AI có thể tạo ra một hình ảnh tiêu chuẩn, một giọng ca đẹp, một giai điệu dễ nghe với đoạn hook thật bắt tai, nhưng AI không thể thay tác giả chọn những chất liệu dân gian và điển tích văn học Trung Hoa như canh Mạnh Bà, “Nguyệt lão và sợi chỉ đỏ”, “Tây Sương ký”… Hay ý tưởng kết hợp folk, rock pha cổ phong cùng chất liệu dân gian như sáo, tranh, nhị, trống hội… để tạo nên những bản nhạc đậm chất Trung Hoa lại đầy tính hiện đại, được giới trẻ yêu thích, tất cả là công sức làm việc nghiêm túc của nhà sản xuất.

Thực tế, nền tảng chuyên môn âm nhạc đóng vai trò quan trọng nhất trong toàn bộ quá trình sáng tạo. Để tạo ra một sản phẩm có chất lượng, người sáng tạo cần áp dụng các kiến thức chuyên sâu của một nhà sản xuất và kỹ sư mixing để trực tiếp xử lý cường độ, không gian, xếp lớp âm thanh, đồng thời xây dựng các đoạn cao trào hợp lý và tinh chỉnh để giọng hát có những rung cảm tự nhiên như người thật.

Chất lượng được “bộ lọc” tiêu chuẩn của các nhà sản xuất giỏi và có chuyên môn, tinh tế để biết tạo ra những nốt luyến láy, lấy hơi, những đoạn gằn hay bỏ nhỏ, sử dụng giọng ngực hay giọng giả thanh để xử lý tác phẩm một cách tinh tế, chạm tới trái tim người nghe vốn rất kỹ tính trong thời đại bão hòa nội dung ngày nay.

AI có thể phân tích hàng triệu dữ liệu để mô phỏng lại các dữ liệu được nhập vào, nhưng AI khó có thể tạo ra những ý tưởng, câu chuyện độc đáo mang tính trải nghiệm cá nhân. Như trường hợp của Uy Mãnh Tiên Sinh, phần lời của các ca khúc có sự pha trộn giữa các truyền thuyết dân gian lẫn câu chuyện hiện đại, bắt đúng những trend mà giới trẻ quan tâm, như việc Nguyệt lão xuống trần gian đi xem mắt và bị xua đuổi, hay Mạnh Bà và Nguyệt lão se nhầm chỉ hồng, múc nhầm canh khiến những cặp đôi trần thế oan gia ra sao. Đó là sáng tạo của riêng Uy Mãnh Tiên Sinh. Đến nay, Uy Mãnh không giấu tham vọng xây dựng một vũ trụ âm nhạc - hoạt hình với các nhân vật chính trong truyền thuyết Trung Hoa, gắn liền với đời sống hiện đại, chứ không dừng ở một vài bài hát viral. Phần hình ảnh hoạt hình 2D cũng là lĩnh vực mà chính công ty anh đã đầu tư, “một công đôi việc”. Bây giờ, đằng sau Uy Mãnh là cả một công ty hoạt động bài bản, có chuyên môn để đẩy dự án theo những hướng đi mới.

Mặc dù AI có khả năng tạo ra vô số phương án khác nhau, nhưng nếu thiếu đi chuyên môn, người làm nhạc sẽ rất khó có thể phân biệt được đâu là một giai điệu thật sự tốt, cũng như không thể kiểm soát tốt hòa âm, phối khí để tạo ra những điểm chạm cảm xúc cho người nghe.

Trọng Nhân chia sẻ: “Người ta hay nói AI có thể viết một bài hát trong 3 giây. Nhưng thật sự phía sau một ca khúc thành công là một chặng đường rất dài. Thật sự không có cái nào mất 3 giây cả”.