1.6.1. Chuẩn bị thư viện
Mẫu DNA được tiến hành tạo thư viện (phân cắt bởi các fragmentase, gắn adapter, index và nhân bản bằng Polymerase chain reaction - PCR) bằng bộ kit NEBNext ΜLtra II DNA Library Prep kit for Illumina (NEB). Quy trình tạo thư viện được tiến hành theo hướng dẫn của nhà sản xuất23. Các thư viện sau đó được giải trình tự bằng NGS trên hệ thống MiniSeq (Illumina) với chiều dài đoạn giải 2x150 bp. Dữ liệu giải trình tự được tinh sạch trình tự apdater và các trình tự chứa nucleotide không xác định.
Hình 1.5 Quy trình chuẩn bị thư viện bằng NEBNext®
Ultra™ II DNA Library Prep Kit24
11
Trước tiên cần có 500 pg – 1 ug DNA đã được phân mảnh bằng sóng siêu âm hoặc enzyme NEBNext dsDNA fragmentase, mặc dù bộ kit có thể sử dụng với một lượng nhỏ DNA đầu vào nhưng nên sử dụng lượng nhiều nhất có thể để tối thiểu số vòng PCR cần thiết.
Bước đầu tiên chuẩn bị thư viện là Ending Repair và dA-Tailing. Ở bước này, DNA được làm đầu bằng (blunt) và được phosphorylate hóa, một Adenin được thêm vào đầu 3’ của mỗi đoạn fragment. Bước kế tiếp là gắn Adaptor, ở bước này Adaptor với một T- overhang được gắn vào hai đầu của fragment đã được gắn đuôi dA. Nếu lượng DNA ban đầu thấp hơn 100 ug, lượng Adaptor nên được giảm bớt để tránh nguy cơ tạo thành adaptor-dimer.
Để loại bỏ những fragment với các kích thước không mong muốn, ta tiến hành sàng lọc kích thước. Vì khi phân mảnh, sợi DNA bị phân tách thành các fragment có kích thước khác nhau, để thu được những fragment có độ dài phù hợp và có gắn Adaptor ta sử dụng những hạt từ tính.
Bảng 1.2 Kích thước fragment insert mong muốn và sau khi chuẩn bị thư viện 24
Kích thước fragment insert 150 bp 200 bp 250 bp 300-400 bp
400-500 bp
500-700 bp Kích thước fragment cuối
(insert + adaptor + primers) 270 bp 320 bp 370 bp 480 bp 600 bp 750-800 bp
Bước cuối cùng của chuẩn bị thư viện là khuếch đại thư viện bằng PCR. Không chỉ giúp tăng kích thước thư viện mà còn sàng lọc những phân tử đã được gắn adapter ở mỗi đầu. Đối với các thư viện đa hợp, chỉ số hoặc barcode có thể được sử dụng ở bước này nếu NEBNext Adaptor and Primer được sử dụng. Số vòng PCR tùy thuộc vào lượng DNA input ban đầu.
Bảng 1.3 Số vòng PCR thích hợp để tạo thư viện
Lượng DNA đầu vào
Số vòng PCR cần để khuếch đại thư viện
1 àg* 3–4*,**
500 ng* 4–5*
100 ng* 6–7*
12
50 ng 7–8
10 ng 9–10
5 ng 10–11
1 ng 10–11
0.5 ng 14–15
* Số chu kỳ được xác định cho kích thước thư việc được chọn
** NEBNext adaptors chứa một thiết kế cắt ngắn độc đáo.
Các thư viện được xây dựng với các NEBNext adaptors yêu cầu tối thiểu 3 chu kỳ khuếch đại để thêm hoàn toàn các trình tự adaptor cho quy các trình phía sau.
Sau phản ứng PCR, sử dụng từ trường để loại bỏ các những thành phần không gắn vào hạt bean, sau bước này sẽ thu được DNA-library gắn vào hạt bean và sẵn sàng cho quy trình giải trình tự .
1.6.2. Giải trình tự Illumina
Công nghệ Illumina sequencing dựa theo ý tưởng của Shankar Balasubramanian, và David Klenerman từ những năm 90 của thế kỷ trước25, và được thực hiện bởi Turcatti và cộng sự26. Giải trình tự Illumina cũng là một phương pháp giải trình tự tổng hợp, nhưng ngược với 454 sequencing, nó sử dụng sự kết thúc hóa học thuận nghịch của các chất tương tự nucleotide27. Công ty Solexa được thành lập vào năm 1998. Sau 8 năm
Hình 1.6 Quy trình giải trình tự Illumina
13
nghiên cứu và phát triển và hợp nhất với công ty công nghệ cụm phân tử Manteia vào năm 2004 và công ty phân tích dữ liệu Lynx Therapeutics vào năm 2005, Solexa có thể tung ra DNA được trình tự đầu tiên của họ, Máy Genome Analyzer, ra thị trường vào năm 2006. Một năm sau Solexa được Illumina mua lại.
Quy trình giải trình tự của Illumina sequencing bao gồm các bước cũng giống như như sau:
1. Chuẩn bị thư viện DNA bằng các phân mảnh DNA sử dụng kỹ thuật nebulization, tạo đầu bằng enzyme và gắn adaptor hai đầu DNA.
2. Quá trình khuếch đại DNA được thực hiện trên bề mặt thủy tinh của một flowcell bằng cách sử dụng solid-phase bridge PCR28,29. Tại đây, các đoạn DNA có cạnh bộ tiếp hợp được liên kết với một bề mặt được bao phủ bởi oligonucleotide.
3. Thay đổi chu kỳ kéo dài của và bst polymerase và biến tính bằng cách sử dụng formamide tạo ra các bản sao của đoạn DNA khuôn mẫu và sự cố định đảm bảo rằng tất cả các amplicon có nguồn gốc từ một khuôn mẫu được nhóm lại với nhau trên bề mặt. Mỗi cụm bao gồm ~ 1.000 bản sao của mẫu.
4. Quá trình giải trình tự được bắt đầu bằng cách lai một đoạn mồi trình tự.
Nhóm chặn 3’-O-azidometyl đảm bảo rằng chỉ một base được kết hợp. Ở mỗi chu kỳ, một loại base được liên kết với các nucleotide bị biến đổi về mặt hóa học bởi DNA polymerase đã sửa đổi27 và một trong bốn nhãn huỳnh quang cho phép phát hiện các DNA khác nhau26,27.
5. Sau khi thu được bốn hình ảnh ở các kênh khác nhau, chu trình giải trình tự kết thúc với sự phân cắt hóa học và giải phóng nhóm fluorophore ở các cụm và nhóm chặn, cho phép kết hợp base ở chu kỳ giải trình tự tiếp theo.
Sau đó, hình ảnh được chuyển đổi thành các tệp trình tự bằng cách phân tích hình ảnh, nhận biết base và lọc bỏ các trình tự chất lượng kém. Đầu ra là các tệp giải trình tự bằng Illumina ở định dạng *.fastq. Do việc sử dụng polymerase và nucleotide đã sửa đổi, lỗi giải trình tự thường gặp nhất đối với Illumina sequencing được báo cáo là do sự thay thế30,31. Độ dài đọc của Illumina bị giới hạn bởi các yếu tố, chẳng hạn như sự phân
14
cắt không hoàn toàn của nhóm fluorophore hoặc nhóm chặn gây ra sự phân rã và giảm tín hiệu32,33.