hệ thống MiSeq FGx mới được đưa ra thị trường vào đầu năm 2015 đang được nhiều phòng thí nghiệm cũng như nhiều đơn vị có uy tín trong lĩnh vực hình sự đánh giá là phương pháp của tương l
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Nguyễn Thị Hồng Nhung
ĐÁNH GIÁ BỘ KIT FORENSEQ TRÊN HỆ THỐNG MiSeq FGx ỨNG DỤNG TRONG ĐỊNH DANH CÁ THỂ
NGƯỜI VIỆT NAM
dẫNLUẬN VĂN THẠC SĨ KHOA HỌC
Trang 2TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 3Để thực hiện thành công khóa luận tốt nghiệp này, em xin gửi lời cảm ơn sâu sắc đến Đại tá Hà Quốc Khanh nguyên Viện phó Viện Khoa học Hình sự cùng với thầy Nguyễn Văn Sáng, người đã hướng dẫn, chỉ bảo tận tình trong suốt thời gian
em thực hiện đề tài
Em xin gửi lời cảm ơn đến Thạc sĩ – Trung tá Trịnh Tuấn Toàn và Thạc sĩ Nguyễn Quang Vinh, và các cán bộ giám định viên tại Phòng giám định Sinh học Pháp lý, các nhân viên tại công ty Cổ phần và dịch vụ phân tích di truyền GENTIS, các nhân viên tại công ty Cổ phẩn Khoa học Vật tư BIOMEDIC đã cung cấp các mẫu hiện trường, mẫu trong quần thể người Việt và những thông tin cần thiết tạo điều kiện thuận lợi cho em thực hiện tốt đề tài
Trong thời gian hoàn thành khóa luận, em đã nhận được sự quan tâm, giúp
đỡ và động viên của Đại tá Hà Quốc Khanh và các anh chị cùng các bạn trong Phòng Kỹ thuật Ứng dụng, thuộc công ty BIOMEDIC Em xin chân thành cảm ơn!
Cuối cùng em xin gửi lòng biết ơn tới gia đình, bạn bè thân thiết đã động viên, bên cạnh em trong thời gian em thực hiện khóa luận này
Hà Nội, ngày 20 tháng 12 năm 2016 Sinh viên
Nguyễn Thị Hồng Nhung
Trang 4KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT
Cluster : Cụm khuếch đại của ADN khuôn được gắn trên bề mặt flowcell
Mỗi cụm được khuếch đại từ một sợi ADN khuôn ban đầu cho đến khi có khoảng 1000 bản sao Mỗi cluster sẽ tạo ra một trình
Index : Là trình tự ADN tag được gắn vào các trình tự đích, cho phép
kết hợp nhiều mẫu trong một bể thư viện và phân tách dữ liệu sau khi đã hoàn thành lần chạy
NGS : Next – Generation Sequencing
PCR : Polymerase Chain Reaction
STR : Short Tandem Repeats
SNP : Single Nucleotide Polymorphism
SBS : Sequencing by Synthesis
stutter : Hiện tượng polymerase bị trượt có thể xuất hiện trong quá trình
khuếch đại các trình tự lặp lại, quy trình chuẩn bị thư viện, tạo cluster Có thể tạo ra các đoạn ADN đích có kích thước bé đi hoặc là lớn hơn kích thước trình tự đích
RFLP : Restriction Fragment Length Polymorphism
Trang 5Bảng 3.2: Kết quả thí nghiệm trên bộ kit Identifiler Plus 29
Bảng 3.3: Kết quả thí nghiệm trên bộ kit ForenSeq 30
Bảng 3.5: Độ độ bao phủ của từng alen trong từng locus khác nhau 38
Bảng 3.6: Bảng khảo sát tần số SNPs trong quần thể người Việt Nam 38
Bảng 3.7: Tần suất xuất hiện các alen trên 5 locus mới của hệ ForenSeq 40
Bảng 3.8: Số lượng kiểu gen quan sát được ở locus D4S2408 41
Bảng 3.9: Số lượng kiểu gen quan sát được ở locus D6S1043 42
Bảng 3.10: Số lượng kiểu gen quan sát được ở locus D9S1122 43
Bảng 3.11: Số lượng kiểu gen quan sát được ở locus D17S1301 44
Bảng 3.12: Số lượng kiểu gen quan sát được ở locus D20S482 44
Trang 6DANH MỤC CÁC HÌNH
Trang
Hình 1.1: Hệ thống CODIS 13 STR loci và vị trí trên nhiễm sắc thể 6
Hình 1.2: Hình ảnh máy điện di mao quản 3130xl với 16 mao quản 11
Hình 1.3: Quy trình giải trình tự thế hệ mới của Illumina 16
Hình 1.4: Bộ kit chuẩn bị thư viện ForenSeqTM DNA Signature Prep 17
Hình 2.1: Khái quát về bộ kit ForenSeqTM DNA Signature Prep 23
Hình 3.1:
Số lượng của các đoạn đọc trong đại diện mẫu từ dải pha loãng
Hình 3.3: Kết quả mẫu chất lượng kém bằng hai phương pháp 33
Hình 3.4: Hồ sơ ADN của hai mẫu cho nhận ngẫu nhiên 15/16 locus 34
Hình 3.5: Hồ sơ ADN của hai mẫu A và B khi thực hiện bằng bộ ForenSeq 35
Hình 3.6: Hiện tượng isometric alen ở alen 29 locus D21S11 của hai mẫu A và B 36
Hình 3.7: Phân biệt alen cùng kích thước nhưng khác trình tự trong mẫu lẫn 37
Trang 7MỤC LỤC
Mở đầu 1
Chương 1: TỔNG QUAN TÀI LIỆU 3
1.1 Lịch sử nghiên cứu chỉ thị ADN ứng dụng trong khoa học hình sự 3
1.2 Chỉ thị ADN sử dụng trong khoa học hình sự 4
1.2.1 STR – Short Tandem Repeats 4
1.2.2 SNP – Single Nucleotide Polymorphism 7
1.3 Các phương pháp phân tích sử dụng chỉ thị ADN 9
1.3.1 Đa hình chiều dài các đoạn cắt giới hạn (RFLP – Retriction Fragment Length Polymorphism) 9
1.3.2 Phương pháp PCR các chỉ thị STRs 10
1.3.3 Điện di và phát hiện STRs 10
1.3.4 Giải trình tự thế hệ mới – Next Generation Sequencing (NGS) 11
1.4 Hệ thống giải trình tự thế hệ mới của ILLUMINA – MiSeq FGx 14
1.4.1 Công nghệ giải trình tự của Illumina 14
1.4.2 Giải pháp NGS cho linh vực hình sự của Illumina 16
1.4.3 Tình hình thực tế ở Việt Nam 17
Chương 2: NGUYÊN LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 19
2.1 Nguyên liệu, hóa chất và thiết bị 19
2.1.1 Đối tượng nghiên cứu 19
2.1.2 Hóa chất 19
2.1.3 Dụng cụ thí nghiệm 19
2.2 Phương pháp nghiên cứu 19
Trang 82.2.1 Tách chiết mẫu ADN bằng chelex 20
2.2.2 Tách chiết mẫu ADN bằng giấy FTA 20
2.2.3 Tinh sạch mẫu ADN 21
2.2.4 Định lượng nồng độ ADN sau khi tách chiết 21
2.2.5 Chuẩn bị thư viện mẫu ADN cho giải trình tự thế hệ mới 22
2.2.6 Phương pháp giải trình tự thế hệ mới MiSeq FGx 24
2.2.7 Xử lý thống kê số liệu và tính tần suất của các locus gen 24
2.3 Sơ đồ nghiên cứu 26
Chương 3: KẾT QUẢ VÀ THẢO LUẬN 27
3.1 Thông tin các lần chạy máy MiSeq FGx 27
3.2 Đánh giá độ nhạy 27
3.3 Đánh giá độ tương đồng 29
3.4 Đánh giá độ phân giải 31
3.5 Trường hợp các mẫu có chất lượng kém 32
3.6 Trường hợp các mẫu cho nhận ngẫu nhiên trong quần thể 33
3.7 Trường hợp mẫu lẫn 36
3.8 Khảo sát tần suất iSNPs trong quần thể người Việt Nam (Kinh) 38
3.9 Khảo sát tần suất 5 locus STR mới trong bộ ForenSeq trong quần thể người Việt Nam (Kinh) 40
3.9.1 Locus D4S2408 41
3.9.2 Locus D6S1043 42
3.9.3 Locus D9S1122 43
3.9.4 Locus D17S1301 44
Trang 93.9.5 Locus D20S482 44
KẾT LUẬN VÀ KIẾN NGHỊ 45 Tài liệu tham khảo 48
Trang 10Mở đầu
Từ khi Ray White lần đầu tiên mô tả chỉ thị ADN (DNA marker) dựa trên phương pháp đa hình chiều dài đoạn cắt giới hạn (Restriction Fragment Length Polymorphisms – RFLP) vào năm 1980 thì một loạt các chỉ thị ADN đã được nghiên cứu và ứng dụng trong di truyền học động vật nói chung và di truyền người nói riêng Đến năm 1984, Alec J Jeffreys đã nghiên cứu và phát hiện ra chỉ thị minisatellite khi ông nhận thấy tính đa hình của các đoạn gen mã hóa cho myoglobin ở người Ông phát hiện ra rằng ở những cá thể khác nhau thì số lượng những đoạn lặp khác nhau hay còn được gọi là số lượng đa hình của những đoạn lặp (Variable Number of Tandem Repeat – VNTR) Từ đó, ông và những cộng sự trong phòng thí nghiệm đã liệt kê những ứng dụng của chỉ thị minisatellite Và một trong những ứng dụng quan trọng của chị thị này được Jeffreys nghiên cứu là sử dụng trong giám định ADN hình sự (DNA Forensic) để phân biệt giữa người này và người khác
Trong khoảng hơn 15 năm phát triển, những ứng dụng của các chỉ thị phân
tử trong lĩnh vực hình sự đã có những tiến bộ vượt bậc và đạt được nhiều thành tựu mới Các quy trình được xây dựng, hoàn thiện và được phổ biến sử dụng trong phân tích các mẫu sinh học hình sự Theo ông Bruce Budowle – Cục điều tra Liên bang
Mỹ, không có bất cứ lĩnh vực nào được hưởng lợi ích nhiều từ những công cụ sinh học phân tử hơn là trong khoa học hình sự Với công nghệ ADN, các nhà khoa học
có thể loại bỏ những đối tượng tình nghi sai với mẫu thu nhận được, từ đó khoanh vùng, định hướng điều tra Những chứng cứ phạm tội là những bằng chứng mạnh
mẽ để kết luận tội phạm
Công nghệ giải trình tự bằng phương pháp điện di mao quản là tiêu chuẩn vàng để thực hiện các phân tích ADN hình sự Tuy nhiên, công nghệ này còn bị giới hạn với những khó khăn đặc thù về những mẫu án hình sự như là hàm lượng mẫu ít,
độ đứt gãy cao, nhiều tạp chất, thậm chí là lẫn từ nhiều nguồn khác nhau,… Hệ thống giải trình tự thế hệ mới (Next Generation Sequencing – NGS) của Illumina –
Trang 11hệ thống MiSeq FGx mới được đưa ra thị trường vào đầu năm 2015 đang được nhiều phòng thí nghiệm cũng như nhiều đơn vị có uy tín trong lĩnh vực hình sự đánh giá là phương pháp của tương lai cũng như là giải pháp hoàn thiện nhất, đồng
bộ nhất cho những phân tích trong hình sự
Trung tâm Sinh học Pháp lý, Viện Khoa học Hình sự là đơn vị đầu tiên mua
và cũng là một trong những đơn vị đầu tiên ứng dụng hệ thống giải trình tự thế hệ
mới – MiSeq® FGx trên thế giới Vì vậy, chúng tôi thực hiện đề tài: “Đánh giá bộ kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể người Việt Nam” Trước đây, chưa có một nghiên cứu nào đánh giá khả năng ứng dụng
hệ thống MiSeq® FGx trong phân tích ADN hình sự với đối tượng là người Việt Nam, do vậy đề tài của chúng tôi thực hiện là một trong những đề tài đầu tiên đánh giá thử nghiệm bộ kit cũng như hệ thống giải trình tự thế hệ mới trên mẫu người Việt Nam Mục tiêu của đề tài nghiên cứu này gồm có hai mục tiêu chính: Đầu tiên,
so sánh và đánh giá bộ kit ForenSeqTM DNA Signature Prep trên hệ thống giải trình
tự thế hệ mới MiSeq® FGx với bộ AmpFℓSTR® Identifiler® Plus PCR Amplification Kit trên hệ thống điện di mao quản Thứ hai là khảo sát và xây dựng tần số của 5 locus STR là D4S2408, D6S1043, D9S1122, D17S1301, D20S482 và
94 SNP mang thông tin nhận dạng ứng dụng trong định danh cá thể người Việt Nam Đề tài được thực hiện tại Trung tâm giám định Sinh học Pháp lý, Viện Khoa học Hình sự, với sự cộng tác của Công ty BIOMEDIC, Công ty GENTIS và Viện Công nghệ Sinh học
Trang 12
Chương 1 - TỔNG QUAN TÀI LIỆU 1.1 Lịch sử nghiên cứu chỉ thị ADN ứng dụng trong khoa học hình sự
Người đặt nền móng cho ứng dụng những chỉ thị ADN trong lĩnh vực hình
sự là Alec J Jeffreys Khi Jeffreys nghiên cứu gen mã hóa cho myoglobin ở người thì ông cũng phát hiện được một đoạn minisatellite ADN ngắn song song lặp đi lặp lại [21] Những đoạn ADN ngắn này có sự biến đổi giữa những cá thể khác nhau Ngay sau khi Jeffreys và cộng sự công bố những kết quả nghiên cứu của mình, đã
có nhiều nghi vấn xuất hiện xung quanh việc sử dụng chỉ thị minisatellite để giải quyết những khó khăn tranh chấp đến có liên quan đến các vấn đề hình sự Đến năm
1986 thì những dấu vân ADN (DNA Fingerprint) đã thực sự được sử dụng trong những giám định của khoa học hình sự bằng phương pháp lai đầu dò với việc kết hợp nhiều minisatellite [21] Thuật ngữ “DNA fingerprint” ra đời do các chỉ thị ADN có giá trị phân biệt cá thể như dấu vân tay Chính vì vậy, ngay từ khi ra đời, các chỉ thị ADN đã được áp dụng và phục vụ cho công tác điều tra tội phạm và tư pháp nên thuật ngữ “Forensic DNA” đã tồn tại và được sử dụng rộng rãi cho đến ngày nay
Đến những năm 1983, Karry Mullis đã phát minh ra kỹ thuật phản ứng chuỗi trùng hợp (PCR – polymerase Chain Reaction) Cùng với những thử nghiệm thành công của Jeffreys trên chỉ thị đoạn lặp ngắn nối tiếp (STR – Short Tandem Repeats), việc ứng dụng phương pháp PCR trong phân tích ADN hình sự đã cho thấy những ưu điểm rõ rệt như là độ nhạy cao hơn, có thể kết hợp thực hiện đồng thời nhiều locus gen khác nhau, cách thức tiến hành đơn giản, nhanh chóng hơn, có thể phân tích được những mẫu có chất lượng kém, bị đứt gãy nhiều [21] Đến năm
1988, cục điều tra liên bang Mỹ - FBI bắt đầu ứng dụng dấu vết ADN trong điều tra những vụ án Tháng 11 năm 1988, trung tâm Bandury của phòng thí nghiệm Cold Spring Harbor được đặt là nơi để mọi người tìm đến nếu có quan tâm đến những ứng dụng trong hình sự của dấu vân ADN Đến năm 1993, bộ kit STR đầu tiên được ứng dụng Sau đó, lần lượt các đơn vị lớn như là Cảnh sát Hoàng gia Anh xây dựng
Trang 13cơ sở dữ liệu tội phạm (năm 1995) [14] và cục điều tra liên bang Mỹ xây dựng cơ
sở dữ liệu gen tội phạm bằng hệ thống CODIS với 13 locus
Những ứng dụng của phân tích chỉ thị ADN trong khoa học hình sự tập trung vào xác định kiểu ADN của cá thể; xác định mối quan hệ huyết thống cha – con, mẹ
- con, anh – em trai, chị - em gái, bà nội – cháu gái, ông nội – cháu trai, …; xác định nạn nhân trong những vụ tìm người mất tích do thảm họa hoặc chiến tranh; xây dụng cơ sở dữ liệu tàng thư tội phạm quốc gia; thẻ ADN cá nhân, …
1.2 Chỉ thị ADN sử dụng trong khoa học hình sự
Để thực hiện được mục đích phân biệt cá thể, điều quan trọng là các chỉ thị ADN phải có tính đa hình cao hoặc có thể kết hợp số lượng lớn với những chỉ thị ít
đa hình để có khả năng phân biệt giữa các mẫu [5] Tính đa hình của các chỉ thị ADN được thể hiện ở hai dạng là tính đa hình trong trình tự và tính đa hình trong độ dài [5] Trong phân tích ADN hình sự, có hai chỉ thị ADN truyền thống được nghiên cứu và được ứng dụng trong giám định ADN hình sự để phân biệt giữa người này với người khác Đó là chỉ thị những trình tự ngắn lặp đi lặp lại nối tiếp nhau (STR – Short Tandem Repeats) và chỉ thị đa hình đơn nucleotide (SNP – Single Nucleotide Polymorphism) [5]
1.2.1 STRs – Short Tandem Repeats
STR là các đoạn ngắn có tính lặp lại nối tiếp nhau trong trình tự (thường là 2 – 6 nucleotide) Trong hình sự, các nhà nghiên cứu thường chọn những STR có đơn
vị lặp là 4 nucleotide để sử dụng trong phân tích Số lần lặp lại của các đơn vị có thể rất khác nhau giữa những cá thể khác nhau Thậm chí là có sự khác nhau trong trình
tự của chính các alen có số đơn vị lặp giống nhau Chính tính đa hình trong độ dài
và trình tự của STRs tạo nên hiệu quả trong mục đích nhận dạng người, định danh
cá thể trong các vụ việc mang tính hình sự [5]
STRs là công cụ được ứng dụng trong phân tích ADN hình sự từ những năm
1991 Tính đa hình của STRs không chỉ thể hiện ở số lượng các đơn vị lặp lại mà
Trang 14còn thể hiện trong trình tự của chúng STRs thường được chia làm một số loại dựa trên phương thức lặp lại của các tiểu đơn vị [5]
- STRs lặp lại đơn giản gồm những đơn vị có trình tự và chiều dài giống hệt nhau Trình tự của STRs gồm hai hay nhiều hơn các đơn vị lặp lại liên tiếp nhau
- STRs lặp lại phức tạp gồm một vài trình tự lặp lại có sự khác nhau về độ dài và trình tự
Một số yếu tố được đề ra khi lựa chọn những locus khác nhau:
- Có mức độ đa hình cao trong một locus, có khả năng phân biệt cao với tỉ
lệ di hợp tử quan sát được là 70%
- Có tỉ lệ đột biến thấp, chiều dài của alen phải ở trong kích thước 90 – 500
bp để đảm bảo có khả năng phân tích những mẫu đứt gãy
- Các locus được chọn phải nằm trên những nhiễm sắc thể riêng nhau (hoặc
có vị trí các khá xa nhau) để đảm bảo các locus liên kết cùng nhau là không được chọn
- Có tính ổn định và độ lặp lại khi thực hiện thí nghiệm
- Dễ dàng giải thích kết quả, tức là chọn những locus ít có hiện tượng stutter (Hiện tượng polymerase bị trượt có thể xuất hiện trong quá trình khuếch đại các trình tự lặp lại, quy trình chuẩn bị thư viện, tạo cluster Có thể tạo ra các đoạn ADN đích có kích thước bé đi hoặc là lớn hơn kích thước trình tự đích)
Bộ kit STRs đầu tiên được ứng dụng trong hình sự là bộ kit có 4 locus
“quadruplex” và được mở rộng sử dụng cho xét xử tại tòa án Lúc đấy, khả năng cho nhận là khá cao theo tiêu chuẩn hiện đại, chỉ khoảng 10-4 Năm 1996, hệ thống kết hợp gồm có 6 locus với locus Amelogenin kiểm tra trên nhiễm sắc thể giới tính
Y được giới thiệu [4] Đến năm 1998, hệ thống CODIS – Combined ADN Index System là chương trình được FBI hỗ trợ để xây dựng cơ sở dữ liệu tội phạm cũng như phần mềm để có thể thực hiện được để phân tích ADN Hệ thống CODIS gồm
Trang 15một hệ gồm 13 locus nằm trên các nhiễm sắc thể khác nhau, ngoài ra còn được bổ sung thêm locus Amelogenin cho nhiễm sắc thể giới tính
Hình 1.1 Hệ thống CODIS 13 STR loci và vị trí trên nhiễm sắc thể
Bên cạnh đó, nguồn cơ sở dữ liệu có tính đa dạng dựa trên việc lựa chọn phân tích các STR khác nhau tùy thuộc vào từng khu vực địa lí như là nguồn dữ liệu của Châu Âu hoặc là các loci mở rộng hơn của U.S Từ năm 2000, cả hai hãng lớn Promega và Applied Biosystems đều xây dựng bộ kit thương mại có kết hợp 16 loci trong cùng một phản ứng PCR; với cốt lõi vẫn là các locus có trong hệ 13 CODIS, Amelogenin và thêm 2 STRs nữa Hiện nay, trên thị trường có rất nhiều bộ kit của nhiều hãng khác nhau như là QIAGEN, Promega, Applied Biosystems, … đưa ra thị trường những bộ kit tách biệt STRs nằm trên nhiễm sắc thể thường và STRs nằm trên nhiễm sắc thể giới tính [5]
Bảng 1.1 Các bộ kit STRs thương mại phổ biến trên thị trường
Hãng Nhiễm sắc thể thường Nhiễm sắc thể Y Nhiễm sắc thể X
Applied
Biosystems
AmpFLSTR®
Identifiler® Plus PCR Amplification Kit (16 locus)
AmpFLSTR®
Amplification Kit (16 locus)
Trang 16AmpFLSTR®
Identifiler® Direct PCR Amplification Kit (16 locus)
GlobalFiler STR kit (24 locus)
Promega PowerPlex 16 (16 locus)
Power Plex Fusion (24 locus)
PowerPlex 23 (23 locus)
Qiagen Investigator HDPlex Kit
(12 locus)
Investigator Argus – X Kit (12 locus)
1.2.2 SNP – Single Nucleotide Polymorphism
Một biến đổi trong trình tự giữa những cá thể tại một điểm cụ thể trong hệ gen thường được gọi là tính đa hình đơn nucleotide hay còn gọi là SNP (Single Nucleotide Polymorphism) [5] SNP rất phong phú trong hệ gen của người cũng như được sử dụng để nghiên cứu mối tương quan với các bệnh di truyền Hàng triệu SNP tồn tại trong các cá thể riêng biệt Do vậy SNP có thể được sử dụng để giúp phân biệt giữa những cá thể [5, 6]
Có nhiều nghiên cứu đã chỉ ra SNP là chỉ thị phân tử đầy tiềm năng SNP có
đủ khả năng để thay thế STRs và sẽ được ứng dụng trong tương lai [6] Những SNPs có một số ưu điểm vượt trội hơn so với STRs Đầu tiên và quan trọng nhất là sản phẩm PCR của các SNPs có kích thước bé hơn 100bp Điều này có nghĩa là chỉ thị SNPs có khả năng khôi phục lại thông tin ADN từ những mẫu bị đứt gãy mạnh tốt hơn so với STRs (các amplicon có kích thước từ 300bp – 400bp) [6] Thứ hai là theo nguyên tắc có thể kết hợp nhiều SNPs hơn so với STRs do không bị giới hạn bởi phương pháp phát hiện Thứ ba là xử lý mẫu và phân tích dữ liệu có thể được tự
Trang 17động hóa hoàn toàn Thứ tư là không có hiện tượng stutter, do vậy có thể đơn giản hóa và dễ dàng giải thích được kết quả gọi tên alen Cuối cùng, khả năng dự đoán nguồn gốc chủng tộc và những đặc điểm kiểu hình có thể thực hiện với sự lựa chọn cẩn thận các SNPs ancestry và SNPs phenotype [5,6]
Bảng 1.2 So sánh chỉ thị STRs và SNPs [5]
Đặc điểm STRs – Short Tandem
Repeats
SNPs – Single Nucleotide Polymorphism
Số lượng alen Thường là từ 5 – 20 Phổ biến là 2
Trang 18Thông tin kiểu
hình
kiểu hình như màu mắt, màu tóc, … Lợi thế chính
trong ứng dụng
khoa hoc hình sự
Nhiều alen cho phép tăng tỉ lệ thành công hơn trong việc phát hiện những mẫu lẫn
Sản phẩm PCR có kích thước nhỏ hơn cho phép tăng tỉ lệ thành công với những mẫu đứt gãy
Tỉ lệ đột biến thấp có thể hỗ trợ trong phân tích quan hệ huyết thống
Yêu cầu cần kết hợp nhiều locus Gặp khó khăn trong giải quyết mẫu lẫn
Cả hai chỉ thị phân tử là STRs và SNPs đều có những ưu điểm và nhược điểm nhất định trong phân tích ADN hình sự Theo nghiên cứu của các nhà khoa học, nếu phân tích 50 SNP thì độ tin cậy đạt tương đương với hệ thống CODIS Hiện nay, một số phòng thí nghiệm phân tích ADN trên thế giới đã ứng dụng SNP trong giải quyết các vụ việc nhằm xác định quan hệ huyết thống trực hệ
1.3 Các phương pháp phân tích sử dụng chỉ thị ADN
1.3.1 Đa hình chiều dài các đoạn cắt giới hạn (RFLP – Restriction Fragment
Length Polymorphism)
Phương pháp đầu tiên phân tích ADN đã được sử dụng để nhận dạng người chính là phương pháp RFLP Trong phương pháp này, hệ gen sẽ được cắt ngẫu nhiên bằng các enzyme cắt giới hạn tại vị trí đặc hiệu đã biết trước trình tự Kỹ thuật này nhận biết sự khác nhau giữa người này với người khác thông qua độ dài
Trang 19đoạn ADN sau khi nó được điện di để phân tách dựa vào kích thước Sự xuất hiện hay vắng mặt của các vị trí đặc hiệu trên mẫu ADN sẽ tạo ra sản phẩm có kích thước khác nhau Sau đó, sản phẩm ADN được phân tách trên gel và phát hiện bằng cách lai với một đầu dò là trình tự bổ sung với ADN mẫu
RFLP không được sử dụng lâu trong hình sự nhận dạng ADN người và nhanh chóng bị thay thế bởi phương pháp khác sử dụng kỹ thuật PCR Nguyên nhân
là do các phương pháp dựa vào PCR giúp làm tăng số lượng bản copy trong một lượng mẫu tương đối nhỏ, có thể giúp phân tích mẫu bị đứt gãy Ngược lại, phương pháp RFLP yêu cầu một lượng lớn mẫu tốt, không bị đứt gãy [12]
1.3.2 Phương pháp PCR các chỉ thị STRs
Chỉ thị STRs có tính đa hình rất cao Trong quần thể người có một số lượng lớn tính đa hình dựa vào độ dài của chỉ thị STRs Sự khác biệt giữa người này và người khác chính là số lần lặp lại của các đơn vị trong trình tự Mỗi cá thể bình thường sẽ có 2 alen trên một cặp nhiễm sắc thể được sử dụng để xác định các mối quan hệ trực hệ (bố - con, mẹ - con) Nhiễm sắc thể Y cũng có STRs Các Y – STRs chỉ xuất hiện ở nam giới được ứng dụng để xác định quan hệ huyết thống theo dòng nội [5] Ngoài ra, trên nhiễm sắc thể X cũng có các STR và cũng được ứng dụng để phân tích một số mối quan hệ huyết thống có liên quan đến nhiễm sắc thể X [5]
Mồi cho phản ứng PCR của các STRs được thiết kế bổ sung với trình tự nằm
ở vùng biên (flanking regions) của trình tự lặp lại Phương pháp hiện nay sử dụng
để phân tích ADN hình sự, một trong hai mồi được gắn màu huỳnh quang Các alen khác nhau của các locus khác nhau phải được phân biệt bằng màu sắc khác nhau khi kết hợp nhiều locus trong một phản ứng PCR Như vậy việc gắn huỳnh quang để ngăn chặn những alen của các locus khác nhau bị trùng kích thước lên nhau [12]
1.3.3 Điện di và phát hiện STRs
Điện di trên gel đã từng được sử dụng để phân tách các đoạn ADN trong sử dụng phương pháp RFLP và phân tích STRs trước khi những hệ thống điện di mao quản trở nên có sẵn Sử dụng kết quả điện di mao quản giúp phân tích nhanh và chính xác hơn Hiện nay, công nghệ điện di mao quản đang được coi là “tiêu chuẩn
Trang 20vàng” trong phân tích giám định hình sự [20] Hầu hết những hệ thống điện di mao quản đều được sản xuất bởi công ty Applied Biosystems Điện di mao quản sử dụng một mao quản dài và hẹp có chứa polymer đặc biệt cho phép phân tách các đoạn ADN khác nhau theo kích thước Sản phẩm PCR được bổ sung vào ống mao quản Trong suốt quá trình điện di, những đoạn có kích thước nhỏ sẽ chạy nhanh hơn những đoạn lớn Trong quá trình phân tách, các đoạn sản phẩm PCR sẽ được chiếu chùm tia laser cho phép phát hiện những màu huỳnh quang khác nhau được gắn ở mồi để phát ra ánh sáng có bước sóng riêng Hệ thống sẽ phát hiện các bước sóng
và cho phép so sánh với hệ thống thang chuẩn được điện di song song với mẫu Từ
đó, một loạt các đỉnh được dựng lên và thể hiện mối quan hệ giữa tín hiệu huỳnh quang được gắn vào mỗi đoạn STR với một thuốc nhuộm đặc biệt so với thời gian
di chuyển của nó Hệ thống phần mềm của máy tính sẽ xử lí thông tin cũng như cung cấp kích thước của các alen khác nhau trong quá trình điện di và kiểu gen của chúng (số lần đơn vị lặp lại) [12]
Hình 1.2 Hình ảnh máy điện di mao quản 3130xl với 16 mao quản
1.3.4 Giải trình tự thế hệ mới – Next Generation Sequencing (NGS)
1.3.4.1 Tổng quan về NGS
Trang 21Công nghệ giải trình tự thế hệ mới với những đặc điểm như là hiệu suất cao, giảm chi phí đã phát triển nhanh chóng trong những năm gần đây và trở thành một công cụ phân tích quan trọng cho nhiều nhà di truyền học Hàng triệu hoặc hàng tỉ phân tử ADN có thể được giải trình tự đồng thời Do đó, hiệu suất của quá trình giải trình tự được tăng lên một cách đáng kể và giảm thiểu việc phải tách dòng trình tự đích giống như phương pháp Sanger trước đó [20]
Năm 2005, Roche giới thiệu hệ thống giải trình tự hệ genome 454 – là hệ thống giải trình tự dữ liệu đầu ra lớn theo phương pháp pyrosequencing đầu tiên trên thế giới Hệ thống này có thể tạo ra 200 000 đoạn đọc có độ dài khoảng 110bp [13] Năm 2007, Applied Biosystems (ABI) giới thiệu hệ thống giải trình tự thế hệ thứ hai SOLiD dựa trên công nghệ nối các đoạn oligonucleotide Hệ thống SOLiD
sử dụng việc nhân bản cầu pha cứng (solid – phase bridge amplification), trong đó các đoạn tiếp hợp đầu 5’ và 3’ được gắn vào mỗi đầu của khuôn ADN Cũng trong thời gian đó, Illumina cho ra mắt hệ thống giải trình tự Solexa Hệ thống này đơn giản hóa phương pháp xây dựng thư viện và đảo đầu bằng phương pháp huỳnh quang dẫn dến việc tạo ra các đoạn đọc có độ dài 35bp [3] Năm 2010, một hệ thống giải trình tự nhanh hơn, chi phí thấp hơn dựa trên công nghệ bán dẫn Ion Torrent được giới thiệu Đây là hệ thống duy nhất xác định trình tự không dựa vào tín hiệu huỳnh quang mà dựa vào việc đo sự thay đổi pH do việc giải phóng ra ion H+ khi gắn nucleotide bằng công nghệ bán dẫn [16]
Tất cả những phương pháp giải trình tự mới đã dẫn tới ba cải tiến đáng kể so với công nghệ truyền thống [20]
- Đầu tiên là các công nghệ này không yêu cầu tách dòng các đoạn ADN,
mà thay vào đó cần chuẩn bị của các thư viện NGS theo từng mục đích
- Thứ hai là thay vì hàng trăm phản ứng giải trình tự thì những công nghệ mới có thể thực hiện được hàng triệu phản ứng đồng thời
- Thứ ba, trình tự được xuất ra trực tiếp mà không cần phải điện di Số lần đọc của NGS là vô cùng lớn, cho phép quá trình giải trình tự toàn bộ hệ
Trang 22gen trong thời gian ngắn và được ứng dụng rộng rãi trong nhiều lĩnh vực khoa học và đời sống
Tuy nhiên, nhược điểm của các hệ thống giải trình tự mới này là độ dài đoạn đọc tương đối ngắn, dẫn đến những khó khăn trong việc cắt nối các trình tự, lắp ráp, chú thích và phân tích tin sinh học [20]
1.3.4.2 Triển vọng ứng dụng của công nghệ NGS trong phân tích ADN hình sự
So với các lĩnh vực nghiên cứu khác, phân tích ADN trong hình sự phải đối mặt với nhiều thách thức như là lượng mẫu ít, số bản sao thấp, nhiều chất ức chế, mẫu đứt gãy mạnh và bị nhiễm giữa nhiều nguồn mẫu khác nhau, phải có độ chính xác cao cũng như phải cân nhắc vấn đề thời gian và chi phí [20]
Hiện nay, công nghệ chính được sử dụng trong phân tích hình sự là PCR kết hợp với điện di mao quản dựa trên phương pháp phân tích các đoạn ADN và phát hiện sự khác nhau về độ dài của các chỉ thị STR Đây đang được coi là tiêu chuẩn vàng của phân tích với những ưu điểm của công nghệ này là:
- Thời gian thực hiện từ khâu tách chiết mẫu tới khi phân tích được kết quả tương đối ngắn
- Quy trình thực hiện đơn giản, có khả năng linh động trong việc lựa chọn các bộ kit khác nhau tùy theo mối quan hệ muốn phân tích
Tuy nhiên, công nghệ này vẫn còn tồn tại nhiều hạn chế nhất định trong quá trình PCR cũng như giới hạn trong việc phát hiện do còn tồn tại các yếu tố nhiễu làm ảnh hưởng tới quá trình đọc kết quả [5, 12, 20]
- Đòi hỏi kỹ thuật viên có kinh nghiệm và trình độ tốt để nhận định kết quả trong các trường hợp nhiễu như nhận định alen thật, alen giả, alen hiếm, mẫu lẫn từ nhiều nguồn
- Trong trường hợp các mẫu hiện trường thường là các mẫu có chất lượng kém, bị đứt gãy mạnh thì độ phân giải của hệ thống là không được cao
Trang 23Thường không đủ số locus => các giám định viên phải thực hiện lại nhiều lần mới thu được kết quả để đối chiếu và so sánh
- Các yếu tố nhiễu phát sinh trong quá trình PCR như hiện tượng stutter, phát sinh trong quá trình điện di mao quản như là hiện tượng lẫn màu, các băng không đặc hiệu, tín hiệu nền cao, các hiện tượng alen hiếm cũng không được gọi một cách tự động
Từ những khó khăn còn tồn đọng trong hệ thống giải trình tự thế hệ cũ, các nhà khoa học hình sự đã nghiên cứu và khám phá ra những lợi thế của hệ thống giải trình tự thế hệ mới Đồng thời các nhà nghiên cứu cũng nhận định hệ thống giải trình tự mới là giải pháp đầy hứa hẹn cho giám định ADN khoa học hình sự trong tương lai [17]
1.4 Hệ thống giải trình tự thế hệ mới của Illumina - MiSeq FGx
1.4.1 Công nghệ giải trình tự của Illumina [22]
Hệ thống máy giải trình tự của Illumina sử dụng công nghệ giải trình tự theo phương pháp tổng hợp (Sequencing by Synthesis) kết hợp với việc sử dụng các nucleotide có gắn tín hiệu huỳnh quang và khóa dừng thuận nghịch để đọc và nhận biết trình tự một cách trực tiếp
Nguyên tắc của công nghệ giải trình tự của Illumina cũng giống với giải trình
tự bằng điện di mao quản ADN polymerase xúc tác cho quá trình ghép các deoxyribonucleotide triphosphates được gắn huỳnh quang vào mạch khuôn ADN trong suốt các chu kì tổng hợp Trong suốt mỗi chu kì, tại nucleotit có sự kết hợp sẽ được phát hiện bằng các bức xạ huỳnh quang Đặc điểm khác nhau ở đây chính là thay vào việc chỉ giải trình tự trên một sợi ADN, công nghệ giải trình tự thế hệ mới cho phép giải trình tự đồng thời nhiều gen cùng một lúc Công nghệ giải trình tự bằng phương pháp tổng hợp (SBS) sẽ đưa ra kết quả có sự chính xác cao, tăng tỉ lệ đọc được của các đoạn ADN Quy trình giải trình tự thế hệ mới gồm có 4 bước chính:
Chuẩn bị thư viện (Library Preparation)
Trang 24Bao gồm việc chuẩn bị thực hiện theo quy trình của bộ kit ForenSeq DNA Signature Prep Mẫu sẽ được khuếch đại những đoạn ADN đặc hiệu và gắn thêm các adapter riêng biệt để có thể phân biệt giữa các mẫu với nhau Cuối cùng, các mẫu sẽ được trộn lại chung và đưa vào máy giải trình tự
Tạo Cluster
Thư viện sau khi được chuẩn bị sẽ được máy đưa tự động lên flow cell – nơi có các đoạn nhỏ oligo nucleotit đã được gắn lên trên bề mặt có sự tương thích với các adapter Mỗi đoạn sẽ khuếch đại riêng biệt và tách thành từng nhóm cluster thông qua phản ứng khuếch đại đường cầu Sau quá trình tạo ra các cluster thì mạch khuôn đã sẵn sàng cho việc giải trình tự
Trang 25Hình 1.3 Quy trình giải trình tự thế hệ mới của Illumina
1.4.2 Giải pháp NGS cho lĩnh vực hình sự của Illumina [23]
Hệ thống MiSeq FGx là hệ thống được hãng Illumina giới thiệu sử dụng riêng cho hình sự Hệ thống được ra mắt vào tháng 1 năm 2015 và đã được đứng thứ hai trên top 10 danh sách các sản phẩm khoa học đổi mới cho năm 2015
Hệ thống MiSeq FGx đang được đánh giá là một giải pháp hoàn chỉnh cho lĩnh vực hình sự Với những đặc điểm như:
- Chỉ sử dụng một bộ kit duy nhất hoàn thiện phân tích được cả 2 chỉ thị ADN trong hình sự là STRs và SNPs
- Tổng số dấu chuẩn trong bộ kit chuẩn bị thư viện là 233 Từ đó cung cấp được lượng thông tin lớn mang độ tin cậy và chính xác cao
- Kết hợp đồng thời các STR trên nhiễm sắc thể thường (28 locus), nhiễm sắc thể giới tính Y (24 locus) và nhiễm sắc thể giới tính X (7 locus) Bên
Tạo
Cluster
Giải trình
tự
Trang 26cạnh đó còn có 94 SNPs mang thông tin giúp phân biệt và nhận diện cá thể
- Kích thước của các đoạn amplicon sau khi khuếch đại từ 60 – 460bp Điều này có ý nghĩa khi phân tích các mẫu bị đứt gãy mạnh, các mẫu có chất lượng kém và mẫu xương
- Có khả năng dự đoán được kiểu hình và nguồn gốc chủng tộc của cá thể
do có chứa các ancestry SNPs và phenotyping SNPs
- Số lượng mẫu tối đa có thể thực hiện được là 96 mẫu
- Lượng ADN khuyến cáo tương đối thấp 1ng
- Tất cả mọi hóa chất phải sử dụng đều được gói gọn trong bộ kit
Hình 1.4 Bộ kit chuẩn bị thư viện ForenSeqTM DNA Signature Prep
1.4.3 Tình hình thực tế ở Việt Nam
Hiện nay ở Việt Nam, giải trình tự bằng phương pháp điện di mao quản vẫn đang là tiêu chuẩn vàng trong phòng giám định gen của Viện Khoa học Hình sự Tuy nhiên sau một thời gian dài sử dụng, những giới hạn về mặt công nghệ của phương pháp cũ cũng đã xuất hiện mà vẫn chưa có giải pháp cụ thể nào giải quyết những trường hợp án khó
Tháng 3 năm 2015, Viện đã bắt kịp và cũng là một trong những đơn vị đầu tiên mua và cài đặt hệ thống máy MiSeq FGx của Illumina Để đánh giá thực tế
những lợi thế của máy MiSeq FGx mang lại, chúng tôi đã tiến hành đề tài: “Đánh giá bộ kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể người Việt Nam” Đề tài được thực hiện ở Trung tâm giám định Sinh học pháp
Trang 27lý - Viện Khoa học Hình sự và Trung tâm dịch vụ và phân tích di truyền - GENTIS dưới sự hỗ trợ của công ty BIOMEDIC và hãng ILLUMINA
Trang 28Chương 2 – NGUYÊN LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Nguyên liệu, hóa chất và thiết bị
2.1.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu trong luận văn này gồm có 104 mẫu không có quan hệ huyết thống được chọn lọc ngẫu nhiên và 14 mẫu án được thu thập ở Trung tâm phân tích và dịch vụ di truyền GENTIS và Trung tâm giám định Sinh học pháp lý của Viện Khoa học Hình sự trong thời gian từ tháng 03 năm 2015 đến hết tháng 12 năm 2015
2.1.2 Hóa chất
- ForenSeqTM DNA Signature Prep Kit (Illumina)
- Primer Mix A (Illumina)
- MiSeq® FGx reagent kit (Illumina)
- Chelex (Sigma – Aldrich)
- Protease K (Epicenter)
- FTA Card (Sigma – Aldrich)
- FTA Reagent solution (Sigma – Aldrich)
- Kit tinh sạch ADN – DNA Clean & Concentrator™-5 Capped (ZymoResearch)
- AmpFℓSTR® Identifiler® Plus PCR Amplification Kit (Thermo Fisher Scientific)
- Qubit® dsDNA HS Assay Kit (Thermo Fisher Scientific)
- Các hóa chất thông dụng trong phòng thí nghiệm đều đạt độ tinh khiết được dùng trong nghiên cứu sinh học phân tử
2.1.3 Dụng cụ thí nghiệm
- Máy PCR GeneAmp® PCR System 9700 – Applied Biosystems
- Máy MiSeq FGx – Illumina
- Các máy móc, thiết bị, dụng cụ hóa chất phục vụ cho nghiên cứu thuộc Trung tâm giám định Sinh học Pháp lý – Viện Khoa học Hình sự và phòng xét nghiệm của Trung tâm phân tích và dịch vụ di truyền GENTIS
2.2 Phương pháp nghiên cứu
Trang 292.2.1 Tách chiết mẫu ADN bằng chelex
Được giới thiệu vào năm 1991 với hội đồng ADN hình sự, Chelex 100 là một loại nhựa trao đổi ion được sử dụng trong tách chiết ADN từ các mẫu hình sự [18] Chelex là hợp chất trùng ngưng styrene divinylbenzen có chứa các cặp ion imminodiaxetat hoạt động là chất tạo nhóm phức liên kết với các ion kim loại đa hóa trị như là Mg++ Với việc liên kết với ion Mg++, enzyme phá hủy ADN – DNA nuclease sẽ bị bất hoạt và nhờ đó sợi ADN sẽ được bảo toàn
Hầu hết các quy trình tách chiết sử dụng chelex, đối với những mẫu sinh phẩm như là máu, mẫu niêm mạc miệng, tóc, … đều sử dụng dung dịch chelex 5%
Quy trình tách chiết gồm các bước chính sau:
- Cắt mảnh dấu vết máu, đầu tăm bông (đối với mẫu niêm mạc miệng) cỡ khoảng 3 mm x 3 mm hoặc 3-5 sợi tóc có chân cho vào ống eppendoft
- Bổ sung 200 µl (đối với mẫu tóc) hoặc 500 µl (đối với mẫu máu và niêm mạc miệng) dung dịch Chelex 5% Vortex trong vòng 10 giây
- Bổ sung thêm 2 µl dung dịch Protease K (50 µg/µl) Vortex trong vòng 10 giây
- Ủ mẫu trong bể ủ nhiệt khô ở 56oC trong vòng 30 phút đến 1 tiếng hoặc qua đêm
- Tiếp theo ủ mẫu trong bể ủ nhiệt khô ở 100oC trong vòng 5 phút
- Ly tâm 13.000 vòng/phút trong 2 phút ở nhiệt độ phòng Chuyển dịch nổi sang ống eppendoft mới để sử dụng ADN chứa trong dịch tách chiết
- ADN sau khi tách chiết được bảo quản ở -20oC
2.2.2 Tách chiết mẫu ADN trên giấy FTA
Tách ADN trên giấy FTA là một phương pháp mới được thiết kế để làm đơn giản hóa quy trình thu thập, vận chuyển, lưu trữ và tinh sạch ADN từ nhiều nguồn khác nhau Giấy FTA được thấm với một số hợp chất hóa học có tác dụng làm tan màng tế bào và biến tính protein Vật chất di truyền được giữ lại, cố định và ổn định
để lưu trữ tại nhiệt độ phòng Giấy FTA bảo vệ ADN khỏi nuclease, quá trình oxy hóa, tia UV và ảnh hưởng từ các vi sinh vật như là vi khuẩn hay là nấm [15]