Việc ứng dụng thành công kỹ thuật giải trình tự hệ gene đoạn dài của PacBio đối với nCoV mở ra khả năng giải trình tự hệ gene virus nhanh, chính xác mà không cần dựa vào trình tự gene tham chiếu quốc tế. Điều này cho phép các nhà khoa học Việt Nam có thể giải trình tự các virus gây bệnh mới trong tương lai mà không cần hệ gene tham chiếu.
Quy trình gồm 6 bước: Nuôi cấy và tách chiết ARN virus; Tổng hợp cDNA sợi đôi từ ARN virus; Chuẩn bị thư viện DNA để giải trình tự gene; Giải trình tự toàn bộ hệ gene virus nCoV; Lắp ráp de novo hệ gene virus; Chú giải và phân tích hệ gene virus.
Kết quả này có được từ đề tài "Giải trình tự de novo virus SARS-CoV-2 gây bệnh viêm đường hô hấp cấp Covid-19 bằng hệ máy giải trình tự thế hệ mới PacBio Sequel" do Viện Công nghệ Sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam thực hiện, đáp ứng nhu cầu hỗ trợ xử lý dịch bệnh Covid-19 tại Việt Nam từ năm 2020.
Viện Công nghệ sinh học phối hợp với Viện Pasteur TP HCM và Viện Vệ sinh Dịch tễ Trung ương Hà Nội (NIHE) đã phối hợp xây dựng quy trình kỹ thuật giải trình tự toàn bộ hệ gene nCoV bằng công nghệ giải trình tự đoạn dài của PacBio. Đây là hệ thống giải trình tự thông lượng cao, hoàn toàn tự động với chi phí thấp và thời gian khoảng 48 giờ sau khi có kết quả nuôi cấy và tách chiết ARN virus và tổng hợp cDNA sợi đôi ARN virus.
Theo nhóm nghiên cứu, so sánh trình tự hệ gene của các chủng virus lưu hành ở Việt Nam đến 1/4/2021 cho thấy, hiện ở Việt Nam đã xuất hiện đủ 8 nhóm (clade S,L,V,G,GR,GH,GV và GRY) của nCoV theo phân loại của GISAID với hàng chục biến thể khác nhau.
Kỹ thuật giải trình tự gene này góp phần vào việc xác định nguồn gốc virus và số lượng nguồn lây (F0) trong các ổ dịch, là cơ sở khoa học, thông tin quan trọng trong xây dựng chiến lược, phương án phòng, chống hiệu quả sự lây lan của virus trong cộng đồng.
Với việc làm chủ quy trình công nghệ, năng lực và điều kiện hiện có, đại diện Viện Hàn lâm Khoa học và Công nghệ Việt Nam cho biết, Viện sẵn sàng tham gia hợp tác với các đơn vị ngành y tế trong việc giải trình tự hệ gen của virus SARS-CoV-2 với quy mô lớn trong các trường hợp cấp bách.
Đề tài đã giải trình tự toàn bộ hệ gene của bốn chủng virus SARS-CoV-2 với chiều dài trên 29500 nucleotide/hệ gene, và chú giải thành công 14 ORF của virus.
Kết quả lắp ráp hệ gen cho một contig, không có các lỗi đọc hay đoạn trống. Chất lượng giải trình tự đạt độ chính xác 99,99%. Kết quả phân tích cho thấy chủng virus phân lập bởi Viện Pasteur TPHCM chứa 10 đột biến liên quan đến các gene mã hóa Nsp2, Nsp3, RNA primase, helicase, protein S, và protein N. Đây là chủng virus phân lập từ bệnh nhân Việt Nam trở về từ bang Pennsylvania, Mỹ ngày 15/3/2020, hạ cánh tại TPHCM ngày 17/3/2020.
Ba mẫu virus còn lại do NIHE cung cấp đều có nguồn gốc từ ổ dịch của Bệnh viện Bạch Mai thu thập trong các ngày 25 và 28/3/2020. Các chủng này chứa 5 đột biến giống nhau và có một chủng chứa 6 đột biến. Các đột biến liên quan đến các gene mã hóa protein Nsp3, RNA primase, protein S và N. Cả bốn chủng virus trên đều chứa đột biến D614G ở protein S.
Hệ gene bốn chủng virus trong đề tài do Viện CNSH giải trình tự được phân tích so sánh với trình tự các mẫu virus do các đơn vị khác trong nước thực hiện (gồm Đơn vị nghiên cứu lâm sàng thuộc Đại học Oxford (OUCRU), Viện Pasteur TPHCM và NIHE).