OpenAI ra mắt Sora: AI tạo video từ văn bản gây choáng ngợp người dùng

Sora có khả năng tạo ra các video dài tới một phút với chất lượng hình ảnh đáng kinh ngạc trong khi vẫn tuân thủ yêu cầu của người dùng.

Ngày 16/2, OpenAI ra mắt trí tuệ nhân tạo (AI) tạo video từ văn bản, có tên gọi là Sora ở cấp độ thử nghiệm. Cụ thể, công nghệ này chỉ được chia sẻ với một nhóm người dùng nhỏ để thu thập các lỗi và nguy cơ tiềm ẩn.

Điều đáng nói là những thước phim do Sora tạo ra có độ chân thật đến mức kinh ngạc. Sora có thể tạo ra các video dài tới một phút trong khi vẫn duy trì chất lượng hình ảnh và tuân thủ yêu cầu của người dùng.

Trên website của mình, OpenAI cho biết: “Chúng tôi đang đào tạo để AI hiểu và mô phỏng thành công thế giới vật lý trong chuyển động”.

Câu lệnh: Một người phụ nữ đi dạo trên đường phố Tokyo đầy ánh sáng neon ấm áp. Cô ấy mặc một chiếc áo khoác da màu đen, một chiếc váy dài màu đỏ, đi đôi bốt màu đen và cầm một chiếc túi xách màu đen. Cô gái đeo kính râm và dùng son môi màu đỏ. Dáng đi tự tin và thoải mái. Con phố ẩm ướt và phản chiếu, tạo ra hiệu ứng gương với ánh sáng đầy màu sắc. Nhiều người đi bộ xuất hiện trên đường. Video: OpenAI

Vào tháng 4/2023, Runway AI - một công ty khởi nghiệp tại New York (Mỹ) đã giới thiệu công nghệ cho phép người dùng tạo ra video chỉ bằng cách gõ một câu lệnh. Tuy nhiên các video có thời lượng ngắn - 4 giây thường rất nhòe, giật gân và méo mó.

Chỉ sau 10 tháng, OpenAI đã ra mắt một công nghệ tương tự nhưng có khả năng tạo ra những video như được lấy từ một bộ phim Hollywood.

Trong chiến dịch ra mắt của mình, OpenAI nhận định: “Sora có khả năng tạo ra các cảnh phức tạp với nhiều nhân vật. Các loại chuyển động của chủ thể và khung nền có thể chính xác đến từng chi tiết. Mô hình không chỉ hiểu những gì người dùng đã yêu cầu trong đề bài, mà còn hiểu cách những thứ đó tồn tại trong thế giới vật lý”.

Đây là một bước tiến rất lớn trong công nghệ tạo ra hình ảnh, video từ văn bản. Công nghệ này có khả năng làm tăng tốc độ làm việc của các nhà làm phim, đồng thời thay thế hoàn toàn những nghệ sĩ kỹ thuật số ít kinh nghiệm.

Câu lệnh: Một bầy voi lông dày, khổng lồ chạy qua một cánh đồng tuyết phủ. Bộ lông dày nhẹ nhàng bay trong gió khi đàn voi di chuyển. Cây và những ngọn núi ở phía xa đều bị tuyết phủ. Ánh sáng ban ngày. Trời có những đám mây nhẹ, mặt trời cao, tạo hiệu ứng ánh sáng ấm áp. Góc quay thấp, chụp lại bộ lông đẹp mắt, tiêu cự sâu. Video: OpenAI.

Tuy nhiên, bên cạnh các lợi ích trước mắt, Sora vẫn còn một số hạn chế. Chính OpenAI đã cảnh báo rằng: “Mô hình có thể gặp khó khăn trong việc mô phỏng tính vật lý một cách chính xác trong các phân cảnh phức tạp và có thể không hiểu rõ các trường hợp cụ thể về nguyên nhân và hậu quả. Ví dụ, một người có thể cắn một miếng bánh quy, nhưng sau đó chiếc bánh quy lại không có dấu răng cắn”.

Ngoài ra, mô hình cũng có thể gây nhầm lẫn về chi tiết không gian trong câu lệnh như lẫn lộn bên trái và bên phải; có thể gặp khó khăn trong việc mô tả chính xác các sự kiện diễn ra theo thời gian,...

Điều đáng lo ngại nhất là Sora có thể trở thành một công cụ tạo ra hình ảnh, thông tin sai lệch một cách nhanh chóng và tiết kiệm chi phí. Trạng thái này sẽ khiến cho người dùng ngày càng gặp nhiều khó khăn trong việc phân biệt điều gì là thật, điều gì là giả trên internet.

Hiện tại, OpenAI cho biết công ty vẫn chưa phát hành Sora cho công chúng. Các nhà nghiên cứu vẫn đang nỗ lực tìm hiểu những nguy cơ tiềm ẩn của hệ thống bằng cách chia sẻ với một nhóm nhỏ các nhà nghiên cứu và các chuyên gia ngoài công ty để "kiểm tra và thử thách" công nghệ mới.

Câu lệnh: Hoạt hình, một con quỷ nhỏ, lông xù ngồi bên cạnh một cây nến đỏ. Phong cách nghệ thuật 3D, chân thực, tập trung vào ánh sáng và kết cấu. Tâm trạng: Sự kỳ diệu và tò mò. Con quỷ nhìn chằm chằm vào ngọn lửa với đôi mắt to và miệng mở. Tư thế và biểu cảm truyền tải cảm giác ngây thơ và vui tươi như đang khám phá thế giới xung quanh trong lần đầu tiên. Sử dụng màu sắc ấm áp và ánh sáng ấn tượng, tăng thêm không khí ấm cúng của hình e. Video: OpenAI

Trong tiếng Nhật, “sora” có nghĩa là bầu trời. Nhóm nghiên cứu đứng sau công nghệ này, bao gồm Tim Brooks và Bill Peebles đã chọn cái tên Sora vì nó "gợi lên ý tưởng về tiềm năng sáng tạo không giới hạn."

OpenAI là công ty đứng sau chatbot ChatGPT và công cụ tạo hình ảnh tĩnh DALL-E.

Hiện tại, OpenAI đã gắn nhãn tất cả các video do Sora tạo ra để người dùng có thể phân biệt được. Tuy nhiên, chính công ty này cũng nhận định rằng các nhãn dán này có thể dễ dàng bị loại bỏ và cũng khá khó để phát hiện.

OpenAI vẫn từ chối tiết lộ số lượng và nguồn gốc của các video đã dùng để đào tạo Sora. Mặc dù các video do Sora có thể gây ấn tượng mạnh nhưng thường chứa những hình ảnh kỳ lạ và không logic.

Trước sự xuất hiện của Sora, Reid Southen, một nghệ sĩ làm phim ở Michigan (Mỹ) nhắc lại sự ra đời của Midjourney: "Chúng ta đã cười vào năm 2022 khi Midjourney mới ra mắt và nói 'ôi, thật đáng yêu'. Còn bây giờ nhiều người đang mất việc vì Midjourney".

Có thể bạn quan tâm

Chỉ cần quét mã QR, cử tri Hà Nội tìm hiểu các thông tin về bầu cử một cách thuận lợi. (Ảnh: KIM CHI)

Tăng cường sự tương tác giữa chính quyền với người dân

Với sự chủ động và linh hoạt trong ứng dụng công nghệ số, công tác chuẩn bị bầu cử tại nhiều địa phương đang được triển khai thuận lợi, góp phần hướng tới mục tiêu tổ chức một cuộc bầu cử dân chủ, đúng luật, an toàn và thành công.

Tiến sĩ Nguyễn Nhật Linh hướng dẫn sinh viên kiểm tra mẫu sản phẩm hạt nano vàng thu được từ quá trình tổng hợp plasma. (Ảnh: MINH ĐỨC)

Làm chủ công nghệ plasma lạnh cho vật liệu nano

Đề tài “Nghiên cứu chế tạo nguồn phát plasma lạnh ứng dụng trong tổng hợp vật liệu nano kim loại có hiệu ứng cộng hưởng plasmon bề mặt (Au, Ag)” đã mở ra hướng tiếp cận xanh, an toàn trong tổng hợp nano kim loại quý, góp phần nâng cao năng lực làm chủ công nghệ plasma và vật liệu tiên tiến trong nước.

Thủ tướng Phạm Minh Chính trao Quyết định cho đồng chí Trần Hồng Thái giữ chức Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

[Ảnh] Thủ tướng Phạm Minh Chính trao Quyết định bổ nhiệm Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Chiều 12/3, tại Hà Nội, Bí thư Đảng ủy Chính phủ, Thủ tướng Chính phủ Phạm Minh Chính đã trao Quyết định bổ nhiệm đồng chí Trần Hồng Thái, Ủy viên Ban Chấp hành Trung ương Đảng, Phó Chủ tịch Thường trực Viện Hàn lâm Khoa học và Công nghệ Việt Nam, giữ chức Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Các doanh nghiệp công nghệ được vinh danh tại Lễ biểu dương Top Công nghiệp 4.0 Việt Nam lần thứ tư.

Tìm kiếm và vinh danh những thành tựu công nghệ xuất sắc của hệ sinh thái số

Chương trình “Biểu dương thành tựu tác động vì Việt Nam số (Vietnam I4 Impact Awards) 2026” đã chính thức được khởi động với cách tiếp cận mới nhấn mạnh yếu tố “impact”- giá trị thực tiễn của công nghệ; được kỳ vọng trở thành nơi các doanh nghiệp công nghệ khẳng định năng lực đổi mới sáng tạo, lan tỏa các mô hình chuyển đổi số.

Phố phường khu vực Lâm Đồng ngàn hoa rực rỡ cờ hoa, pa-nô chào mừng ngày hội non sông.

Phường Lâm Viên-Đà Lạt chủ động xây dựng phần mềm phục vụ bầu cử

Chuẩn bị cho ngày bầu cử đại biểu Quốc hội khóa XVI và đại biểu Hội đồng nhân dân các cấp vào ngày 15/3, phường Lâm Viên-Đà Lạt, tỉnh Lâm Đồng đã chủ động xây dựng phần mềm quản lý danh sách cử tri và theo dõi tiến độ bầu cử theo thời gian thực, góp phần nâng cao hiệu quả điều hành trong ngày bầu cử.

Hiệu năng mạnh mẽ trên Galaxy S26 series là nền tảng cho các tác vụ Galaxy AI hoạt động trơn tru.

Galaxy S26: Khi Samsung định nghĩa lại “AI Phone tích hợp” từ phần cứng

AI trên smartphone ngày càng phổ biến nhưng không phải lúc nào cũng thực sự hữu ích. Với Galaxy S26, Samsung tiếp cận theo hướng khác: xây dựng một Galaxy AI Phone tích hợp, nơi phần cứng, hệ điều hành và Galaxy AI được phát triển song song để AI hoạt động ổn định và liền mạch hơn trong sử dụng hằng ngày.

Năm 2025, lượng chất thải rắn sinh hoạt phát sinh ở Việt Nam vào khoảng 70 nghìn tấn mỗi ngày, chủ yếu từ khu vực đô thị. Ảnh minh họa.

Giảm phát thải khí mê-tan từ chất thải

Năm 2025, lượng chất thải rắn sinh hoạt phát sinh ở Việt Nam vào khoảng 70 nghìn tấn mỗi ngày, chủ yếu từ khu vực đô thị. Bức tranh chất thải cho thấy rác sinh hoạt có thành phần rất đa dạng nhưng rác thải thực phẩm chiếm tỷ lệ lớn nhất, phần còn lại là các nhóm có thể tái chế, chất thải nguy hại và các loại khác.

Đại diện VNPT Cyber Immunity và BIC ký kết hợp tác chiến lược phân phối sản phẩm bảo hiểm rủi ro giao dịch

Giảm thiểu thiệt hại trước lừa đảo trực tuyến

Các hình thức lừa đảo trực tuyến và rò rỉ dữ liệu cá nhân ngày càng gia tăng, gây thiệt hại hàng nghìn tỷ đồng mỗi năm khiến người dùng cá nhân đang phải đối mặt với nhiều rủi ro hơn trong môi trường số. Thực tế này đặt ra yêu cầu cấp thiết về các giải pháp phòng ngừa và hỗ trợ người dùng giảm thiểu thiệt hại khi sự cố xảy ra.