Giải trình tự hệ gien virus SARS-CoV-2 không cần hệ gien tham chiếu

NDO -

Viện Hàn lâm Khoa học và Công nghệ Việt Nam vừa cho biết, các nhà khoa học của Viện đã xây dựng thành công quy trình công nghệ giải trình tự virus SARS-CoV-2 bằng hệ máy giải trình tự thế hệ mới PacBio Sequel.

Vận hành hệ thống giải trình tự gien thế hệ mới PacBio Sequel.
Vận hành hệ thống giải trình tự gien thế hệ mới PacBio Sequel.

Đây là kết quả của đề tài “Giải trình tự de novo virus SARS-CoV-2 gây bệnh viêm đường hô hấp cấp Covid-19 bằng hệ máy giải trình tự thế hệ mới PacBio Sequel”, do Viện Hàn lâm Khoa học và Công nghệ Việt Nam giao cho Viện Công nghệ sinh học (CNSH) thực hiện, nhằm đáp ứng nhu cầu hỗ trợ xử lý dịch bệnh Covid-19 tại Việt Nam.

BacBio Sequel là hệ thống giải trình tự gien thế hệ mới, hiện đại và duy nhất hiện nay ở Việt Nam. Hệ thống cho phép giải trình tự các đoạn DNA dài với thời gian ngắn và chính xác nhất so với các thiết bị khác hiện có ở Việt Nam.

Để thực hiện nhiệm vụ này, Viện CNSH đã phối hợp Viện Pasteur TP Hồ Chí Minh và Viện Vệ sinh dịch tễ T.Ư (NIHE) xây dựng quy trình kỹ thuật giải trình tự toàn bộ hệ gien virus SARS-CoV-2 bằng công nghệ giải trình tự đoạn dài của hệ thống PacBio Sequel. Nhiệm vụ đã hoàn thành sau một năm thực hiện, với việc xây dựng thành công quy trình giải trình tự hệ gien virus ARN gồm sáu bước: Nuôi cấy và tách chiết ARN virus; tổng hợp DNA sợi đôi từ ARN virus; chuẩn bị thư viện DNA để giải trình tự gien; giải trình tự toàn bộ hệ gien virus SARS-CoV-2; lắp ráp de novo hệ gien virus; chú giải và phân tích hệ gien virus. Thời gian thực hiện các bước này khoảng 48 giờ, trong khi các phương pháp khác mất khoảng 72 giờ.

Đề tài đã phân tích bốn mẫu virus, trong đó một mẫu virus phân lập bởi Viện Pasteur TP Hồ Chí Minh (phân lập từ bệnh nhân Việt Nam trở về từ bang Pennsylvania, Mỹ, nhập cảnh tại TP Hồ Chí Minh ngày 17-3-2020) và ba mẫu virus còn lại do NIHE cung cấp, có nguồn gốc từ ổ dịch của Bệnh viện Bạch Mai thu thập các ngày 25 và 28-3-2020).

Kết quả, đã giải trình tự toàn bộ hệ gien của bốn chủng virus SARS-CoV-2 với chiều dài trên 29.500 nucleotide/hệ gien, và chú giải thành công 14 khung đọc mở (ORF) của virus. Kết quả lắp ráp hệ gien cho một đoạn trình tự liên tục (contig), không có các lỗi đọc hay đoạn trống với độ chính xác 99,99%. Bốn chủng virus đều chứa đột biến D614G ở protein S. Đặc biệt, đây là lần đầu tiên tại Việt Nam, quá trình lắp ráp hệ gien không phụ thuộc vào hệ gien tham chiếu của quốc tế. Trong khi đó, các phương pháp khác được sử dụng tại các viện nghiên cứu ở Việt Nam hiện nay phải dựa trên trình tự gien tham chiếu của thế giới.

Phân tích dựa vào các trình tự đã được đưa lên cơ sở dữ liệu của Tổ chức Sáng kiến toàn cầu chia sẻ dữ liệu cúm (GISAID) cho đến ngày 25-8-2020 cho thấy, sự có mặt đủ của sáu nhóm virus tại Việt Nam, gồm: L, S, V, G, GR và GH. Phân bố của các nhóm virus tại Việt Nam chịu ảnh hưởng lớn của các chủng virus lưu hành trên thế giới: Các chủng thuộc các nhóm S, L, V chiếm chủ yếu trong số những người trở về từ Trung Quốc hay có sự liên hệ với các nước châu Á nơi có nhiều giao thương với Trung Quốc trong tháng 1 và 2-2020; chủng GH liên quan nhiều những trường hợp trở về từ Bắc Mỹ; chủng GR là từ khu vực châu Âu. 

Kết quả phân tích cũng cho thấy, chủng do viện Pasteur TP Hồ Chí Minh cung cấp nằm trong nhóm GH, lưu hành chủ yếu ở Bắc Mỹ. Ba chủng do Viện NIHE cung cấp nằm trong nhóm GR, cho thấy nguồn gốc châu Âu, với khả năng lây truyền từ đợt có nhiều người nhập cảnh vào đầu tháng 3-2020 tại Hà Nội. 

Kết quả so sánh trình tự hệ gien của các chủng virus lưu hành ở Việt Nam cho đến 1-4-2021 cho thấy, hiện nay ở Việt Nam đã xuất hiện đủ tám nhóm của virus SARS-CoV-2 theo phân loại của GISAID với hàng chục biến thể khác nhau: S,L,V,G,GR,GH,GV và GRY.

Theo Viện Công nghệ sinh học, dữ liệu giải trình tự hệ gien từ kết quả nghiên cứu nêu trên góp phần vào việc xác định nguồn gốc virus và số lượng nguồn lây (F0) trong các ổ dịch, là cơ sở khoa học, thông tin quan trọng trong xây dựng chiến lược, phương án phòng, chống hiệu quả sự lây lan của virus trong cộng đồng.

Việc ứng dụng thành công kỹ thuật giải trình tự hệ gien đoạn dài của hệ thống PacBio Sequel đối với virus SARS-CoV-2 mở ra khả năng giải trình tự hệ gien virus nhanh, chính xác mà không cần dựa vào trình tự gien tham chiếu quốc tế. Điều này cho phép các nhà khoa học Việt Nam có thể giải trình tự những đối tượng virus gây bệnh mới trong tương lai mà không cần hệ gien tham chiếu.

Với việc làm chủ quy trình công nghệ, năng lực và điều kiện hiện có, Viện Hàn lâm Khoa học và Công nghệ Việt Nam sẵn sàng tham gia hợp tác với các đơn vị ngành y tế trong việc giải trình tự hệ gien của virus SARS-CoV-2 với quy mô lớn trong các trường hợp cấp bách.

Tập trung khống chế dịch Covid-19 lây lan