Lưu trữ dữ liệu kỹ thuật số bằng chuỗi DNA

NDO - NDĐT - Các nhà khoa học tại Viện Tin – Sinh học châu Âu (EBI) vừa tìm ra được một phương thức hữu hiệu để biến các đoạn mã di truyền DNA thành một phương tiện lưu trữ các dữ liệu số.
Một đoạn văn bản của Shakespeare đã được mã hóa
Một đoạn văn bản của Shakespeare đã được mã hóa

Các acid deoxyribonucleic lưu trữ các đoạn mã di truyền giúp tạo ra con người hoặc những loài sinh vật khác. Điều đó cho thấy rằng các chuỗi DNA là một loại phương tiện lưu trữ có độ mật độ lưu trữ cực cao, có thể chứa được toàn bộ sự đa dạng và phức tạp của các sự sống hữu cơ trong một lượng vật chất sinh học cực nhỏ. Nhưng việc biến các chuỗi DNA thành phương tiện lưu trữ thông tin kỹ thuật số mà không phải là thông tin sinh học là rất khó khăn bởi việc sử dụng các biện pháp nhân tạo để mã hóa một cách hữu hiệu và đáng tin cậy là một việc cực kỳ khó khăn.

Tuy nhiên, các nhà khoa học tại Viện Tin – Sinh học châu Âu (EBI) đã tìm ra cách để đọc dữ liệu được lưu trữ trong một chuỗi DNA không hoạt động trong một thời gian dài. Họ cho biết đã vượt qua được các rào cản trước đây và phát minh ra được một phương thức mới để ghi dữ liệu lên chuỗi DNA. Trong số mới nhất của tờ tạp chí khoa học nổi tiếng Nature, hai nhà khoa học của EBI là Nick Goldman và Ewan Birney đã giải thích rằng nghiên cứu đột phá của họ có thể sẽ giúp “lưu trữ được dữ liệu của ít nhất 100 triệu giờ phim độ phân giải cao trong một chén DNA”.

Trong bản thông cáo của mình, ông Goldman viết: “Chúng ta đã biết rằng các chuỗi DNA là một vật liệu rất tốt để lưu trữ dữ liệu bởi chúng ta có thể tách chúng từ các mảnh xương voi ma-mút có niên đại hàng chục nghìn năm trước đây và đọc được các thông tin từ chúng. Nó cực kỳ nhỏ bé, số lượng cực lớn và không cần bất cứ nguồn năng lượng nào để lưu trữ. Bởi vậy việc di chuyển và lưu giữ nó là cực kỳ dễ dàng”.

Tuy vậy, các nhà khoa học cho biết vẫn còn tồn tại một vài thách thức để lưu trữ dữ liệu kỹ thuật số trên các chuỗi DNA. Họ lưu ý rằng cho đến nay họ vẫn chỉ có thể tạo ra được các chuỗi DNA ngắn và sự lặp đi lặp lại của các ký tự DNA khiến cho việc đọc và viết dữ liệu rất khó khăn.

Ông Goldman và Birney nói rằng họ đã phải nhờ tới sự trợ giúp của hãng chế tạo thiết bị phân tích sinh học Agilent Technologies để tổng hợp ra các chuỗi DNA từ các thông tin số mã hóa. Các nhà khoa học đã tìm cách mã hóa được một file MP3 ghi bài phát biểu của mục sư Martin Luther King, một file văn bản chứa một bài thơ của Shakespeare, một file PDF chứa tài liệu gốc miêu tả về cấu trúc của gen di truyền DNA của các nhà khoa học James Watson và Francis Crick cùng một file miêu tả việc mã hóa bản thân nó.

Ông Goldman nói: “Chúng tôi đã tạo ra một dạng mã có khả năng tồn tại đến 10 nghìn năm hoặc có thể là lâu hơn trong các điều kiện thích hợp. Chừng nào còn ai đó biết mã là gì, thì người ta vẫn có thể đọc lại dữ liệu nếu họ có một chiếc máy có thể đọc các chuỗi DNA”.

Tuy nhiên, chi phí quá cao của việc đọc và ghi dữ liệu DNA đã cản trở việc mở rộng việc ứng dụng phương tiện lưu trữ DNA vào thực tế. Nhóm nghiên cứu EBI ước tính rằng để mã hóa một Megabyte dữ liệu mất khoảng 12.400 USD, trong khi việc đọc các dữ liệu thì rẻ hơn, chỉ mất khoảng 220 USD. Tuy nhiên, chi phí này đang giảm xuống nhanh chóng và nhờ thế, kỹ thuật này sẽ sớm khả thi để lưu trữ những tài liệu cần duy trì trong một thời gian dài, nhưng không cần phải truy cập tới nhiều. Các nhà khoa học cho biết, chi phí đọc và ghi DNA đã giảm khoảng một triệu lần trong vòng 9 năm qua, điều chưa từng xảy ra ngay cả với ngành điện tử.