Hoàn thành nghiên cứu giải mã gene người Việt đầu tiên

Ngày 16/12, Viện Nghiên cứu Dữ liệu lớn VinBigData (Tập đoàn Vingroup) công bố đã hoàn thiện Dự án “Xây dựng cơ sở dữ liệu biến dị di truyền cho quần thể người Việt” được đầu tư hơn 4.5 triệu USD để giải trình tự 1.000 hệ gene với hơn 40 triệu biến thể di truyền được phát hiện. Đây được xem là cột mốc quan trọng trong nghiên cứu y sinh của nước nhà.

Thứ Năm, ngày 16/12/2021 - 10:30

Prefer Nhan Dan on Google

Sau khi thu thập, mẫu sinh học được đưa vào xử lý tại phòng Lab đạt chuẩn quốc tế ISO 15189 thuộc Bệnh viện Đa khoa quốc tế Vinmec.

Dự án về hệ gene có quy mô lớn nhất Việt Nam

Khởi động từ cuối năm 2018, đến nay, dự án “Xây dựng cơ sở dữ liệu biến dị di truyền cho quần thể người Việt” đã được VinBigData hoàn tất, đây là dự án về hệ gene có quy mô lớn nhất Việt Nam tính đến thời điểm này.

Nghiên cứu không chỉ mở ra bộ cơ sở dữ liệu quý cho cộng đồng mà còn tạo tiền đề cho sự phát triển của nghiên cứu y sinh và y học chính xác, góp phần cảnh báo điều trị sớm đến từng cá nhân người Việt trong tương lai.

Đây là bộ dữ liệu toàn hệ gene người Việt đầu tiên bảo đảm tính đại diện và phổ quát cho quần thể, phù hợp với phân bố dân cư về địa lý (miền bắc: 37%; miền trung 22%; miền nam: 41%) và giới tính (cân bằng tỷ lệ nam nữ). Đặc biệt, bộ dữ liệu gene có đầy đủ chú giải về chức năng sinh học cũng như nguy cơ bệnh lý.

Hoàn thành nghiên cứu giải mã gen người Việt đầu tiên -0 — Dữ liệu hệ gene của người Việt được xử lý bằng những công nghệ hiện đại từ Google, Illumina (hãng công nghệ hàng đầu thế giới về giải trình tự gene), và NVIDIA (tập đoàn công nghệ đa quốc gia của Mỹ).

Dự án có sự tham gia của hơn 40 nhà khoa học gồm các chuyên gia nhiều kinh nghiệm của VinBigData, các chuyên gia tư vấn cao cấp từ các đơn vị nghiên cứu hàng đầu như Đại học Harvard, Đại học Chicago, Trung tâm Ung thư MD Anderson... cùng hàng trăm chuyên gia và tình nguyện viên Việt Nam và thế giới.

Trong 3 năm, nhóm nghiên cứu đã giải trình tự toàn bộ hệ gene của hơn 1.000 người trưởng thành khỏe mạnh, từ 35-55 tuổi, không có quan hệ huyết thống và có đủ thông tin kiểu hình và nhân khẩu học; phân tích một phần hệ gene hơn 4.000 trường hợp liên quan đến các bệnh lý phổ biến và khả năng đáp ứng thuốc. Kết quả phát hiện hơn 40 triệu biến thể di truyền, trong đó có gần 2 triệu biến thể gene phổ biến đặc trưng cho quần thể người Việt.

Quy trình phân tích dữ liệu gene và chú giải biến thể gene do VinBigData được đánh giá là tiên tiến hàng đầu thế giới. Công đoạn xử lý mẫu được triển khai tại phòng Lab đạt chuẩn quốc tế ISO 15189 (tiêu chuẩn quy định các yêu cầu về năng lực và chất lượng đối với các phòng xét nghiệm y tế) thuộc Bệnh viện Đa khoa quốc tế Vinmec.

Khối lượng dữ liệu khổng lồ được xử lý bằng công nghệ hiện đại của Google, Illumina (hãng công nghệ hàng đầu thế giới về giải trình tự gene), và NVIDIA (Tập đoàn công nghệ đa quốc gia của Mỹ). Bên cạnh đó, VinBigData cũng triển khai hợp tác với khoảng 20 tổ chức nghiên cứu, bệnh viện hàng đầu trong và ngoài nước như: Đại học John Hopkins (Mỹ), The GoldenHelix Foundation (Anh Quốc), Trường Đại học Y Hà Nội, Bệnh viện Trung ương Quân đội 108…

Giải mã gene để chữa bệnh cho người Việt

GS Vũ Hà Văn, Giám đốc Khoa học VinBigData (Tập đoàn Vingroup) cho biết, phần lớn các nghiên cứu và thực hành lâm sàng tại Việt Nam đang dựa vào cơ sở dữ liệu di truyền của các quần thể khác trên thế giới. Điều này ảnh hưởng đến kết quả của công bố khoa học cũng như chất lượng khám chữa bệnh trên người Việt.

"Thực tế đó là điều tôi luôn đau đáu khi nghĩ về nền khoa học nước nhà, và cũng là một trong các lý do để tôi quyết tâm trở về Việt Nam", GS Vũ Hà Văn tâm sự.

"Tại Việt Nam trước đây, các bác sĩ thường sử dụng mô hình chữa bệnh “một liệu pháp cho nhiều người”, có nghĩa là áp dụng cùng một phương pháp, cùng một loại thuốc, cùng một liều lượng để điều trị cho nhiều bệnh nhân khi mắc cùng một bệnh. Tuy nhiên, đã đến lúc chúng ta cần thay đổi tư duy và bắt kịp mô hình y học chính xác trên thế giới, bằng những liệu pháp được điều chỉnh phù hợp với từng nhóm cá thể, nhằm gia tăng hiệu quả chữa trị cho người bệnh", GS Vũ Hà Văn nói.

Và điều kiện để y học chính xác đi đến thành công là mỗi quốc gia cần có cơ sở dữ liệu biến dị di truyền đặc trưng cho quần thể, được xây dựng dựa trên nền tảng nghiên cứu chặt chẽ, chính xác với quy mô lớn.

"Dự định của tôi khi bắt đầu công việc với VinBigData là tập trung giải những bài toán của người Việt, triển khai những nghiên cứu có khả năng mang lại ứng dụng cao cho tương lai nước nhà, và trước hết chính là dự án giải trình tự 1.000 hệ gene người Việt. Với nền tảng cơ sở dữ liệu biến dị di truyền dành riêng cho người Việt, chúng tôi kỳ vọng sẽ mở ra hướng đi mới, giúp phát triển y học chính xác tại Việt Nam", GS Văn chia sẻ.

Đây là bộ dữ liệu mang tính đại diện cho quần thể người Việt, phù hợp với phân bố dân cư về địa lý và giới tính. Kết quả từ nghiên cứu mang lại giá trị lớn cho cộng đồng, đóng góp quan trọng trong mục tiêu nâng cao sức khỏe người dân.

Đặc biệt, GS Vũ Hà Văn cho biết, VinBigData đã tiến hành mở một phần dữ liệu của dự án để cộng đồng truy cập thông qua Hệ thống quản lý, phân tích và chia sẻ dữ liệu y sinh (MASH Portal). Từ đây giới nghiên cứu y sinh nước nhà có thể phát triển những ứng dụng phân tích gene chính xác hơn, nhạy hơn, thúc đẩy y học dự phòng, giảm thiểu gánh nặng y tế và chi phí chăm sóc sức khỏe cho cộng đồng.

"Tôi tin rằng y học chính xác tại Việt Nam không chỉ là những bài báo lý thuyết hay giấc mơ xa vời mà còn là lời cam kết chắc chắn thành hiện thực!", GS Vũ Hà Văn khẳng định.

Tiền đề thúc đẩy sự phát triển của y học Việt Nam

Với tổng mức đầu tư để hoàn thiện trên 4,5 triệu USD, dự án giải mã gene của Vingroup được đánh giá là có quy mô lớn nhất Việt Nam tính đến thời điểm hiện tại. VinBigData đã trở thành đơn vị tiên phong tại Việt Nam tiến hành giải trình tự toàn bộ hệ gene người Việt.

Hoàn thành nghiên cứu giải mã gen người Việt đầu tiên -1

Phát biểu tại lễ công bố, Thứ trưởng Khoa học - Công nghệ Bùi Thế Duy cho biết, Bộ rất trân trọng sự tham gia của những đơn vị tư nhân trong việc hình thành cơ sở dữ liệu nghiên cứu lớn để từ đó đóng góp cho cộng đồng nghiên cứu khoa học Việt Nam. Đây cũng là một phần trong hợp tác của Bộ Khoa học - Công nghệ và VinBigData trong việc thiết lập các bộ dữ liệu khoa học để từ đó thúc đẩy trong việc nghiên cứu hướng tới độ chính xác cao trong nhiều lĩnh vực.

Thứ trưởng hy vọng nghiên cứu này sẽ thu hút lôi cuốn được thêm nhiều viện nghiên cứu tư nhân và tập đoàn cùng nhau phát triển thêm nhiều bộ dữ liệu để thúc đẩy phát triển khoa học Việt Nam.

Ông Bùi Thế Duy mong các nhà khoa học trong nhóm nghiên cứu sẽ không chỉ dừng lại ở giải trình tự gene mà sử dụng dữ liệu này cùng những dữ liệu nghiên cứu khác trong ngành y học để hướng đến chăm sóc sức khỏe tốt hơn cho người Việt cũng như mở ra dịch vụ đối với thế giới.

Đánh giá về ý nghĩa của nghiên cứu, GS, TS Tạ Thành Văn (Chủ tịch Hội đồng Trường Đại học Y Hà Nội) chia sẻ: “Hiện nay, các bác sĩ chủ yếu dựa vào lâm sàng, xét nghiệm sinh hóa hoặc tiền sử bệnh để thăm khám và ra quyết định điều trị. Nếu có thêm dữ liệu hệ gene, đây sẽ là một thông tin giàu giá trị, giúp gia tăng tính chính xác cũng như hiệu quả chẩn đoán, điều trị bệnh. Trên phạm vi toàn dân, cơ sở dữ liệu hệ gene người Việt được kỳ vọng sẽ là tiền đề thúc đẩy sự phát triển của y học dự phòng và thực hành y học chính xác, từ đó góp phần cải thiện sức khỏe cộng đồng”.

Trên thế giới, hiện chỉ có một số quốc gia phát triển như Mỹ, Vương quốc Anh, Pháp, Nhật Bản, Trung Quốc… mới đủ tiềm lực để giải mã trọn bộ gene người với quy mô lớn.

Việc đẩy mạnh khai phá hệ gene của các quần thể được kỳ vọng sẽ góp phần thiết lập những nền tảng cơ bản về nhân chủng học, bệnh lý học, thúc đẩy y học dự phòng và điều trị cá thể hóa.

Kết quả dự án sẽ được VinBigData ứng dụng trực tiếp vào các sản phẩm giải mã gene, với độ chính xác và tốc độ vượt trội, dành riêng cho người Việt. Nghiên cứu sẽ tạo tiền đề hỗ trợ khám phá đặc điểm sinh lý - tâm lý của cá nhân, cũng như dự đoán nguy cơ mắc bệnh phổ biến, bệnh di truyền lặn, đánh giá mức độ đáp ứng thuốc trong tương lai.

Một phần dữ liệu của dự án đã được mở để cộng đồng truy cập thông qua Hệ thống quản lý, phân tích và chia sẻ dữ liệu y sinh (MASH Portal). Người dùng có thể tra cứu nhằm mục đích tham khảo, phục vụ các nghiên cứu y sinh.

Hệ thống cũng cung cấp thử nghiệm một số công cụ phân tích tốc độ cao (từ 30 phút đến 1 giờ) cho dữ liệu toàn hệ gene người.

Cổng dữ liệu MASH đang lưu trữ hơn 2.500 Terabyte dữ liệu gene người Việt đã được chú giải, bao gồm cả dữ liệu nhân khẩu học và cận lâm sàng, phù hợp với tiêu chuẩn của Viện Y tế Quốc gia Mỹ (NIH).