Một số CSDL về TSAL của các locus STR trên NST thường được sử dụng cho hoạt động nghiên cứu di truyền quần thể và giám định ADN trên thế giới 38 Bảng 1.5.. Hiện nay, có khoảng hơn 20.000
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
TRẦN TRỌNG HỘI
NGHIÊN CỨU HOÀN THIỆN BỘ KIT PCR 16 LOCUS GẮN HUỲNH QUANG ỨNG DỤNG TRONG NGHIÊN CỨU
DÂN TỘC HỌC VÀ GIÁM ĐỊNH ADN
LUẬN ÁN TIẾN SĨ SINH HỌC
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
LUẬN ÁN TIẾN SĨ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS.TS Trịnh Đình Đạt
2 PGS.TS Nguyễn Văn Hà
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan tất cả các kết quả nghiên cứu trong luận án là trung thực và chưa từng được công bố trong bất kỳ công trình nào khác Nếu sai tôi xin chịu trách nhiệm hoàn toàn
Tác giả
Trần Trọng Hội
Trang 4PGS.TS Nguyễn Văn Hà, Trung tâm Giám định Sinh học pháp lý, Viện Khoa học Hình sự, Tổng cục Cảnh sát, Bộ Công an đã tận tình hướng dẫn, giúp đỡ tôi trong quá trình hoàn thành luận án
PGS.TS Phạm Đăng Khoa và ThS Hồ Quang Huy, Bộ môn Sinh lý bệnh-Miễn dịch, Trường Đại học Y Hà Nội đã giúp đỡ tôi trong quá trình hoàn thành luận án
Các đồng chí Lãnh đạo và cán bộ thuộc Phòng 4, Cục A67, Bộ Công an
và Phòng PC54, CATP Hải Phòng đã giúp đỡ tôi trong quá trình hoàn thành luận án
ThS Trần Minh Đôn và ThS Lương Thị Yến, Viện H57, Tổng cục IV,
Bộ Công an đã giúp đỡ và đóng góp những ý kiến quý báu cho tôi trong quá trình hoàn thành luận án này
Tôi cũng xin chân thành cảm ơn PGS.TS Nguyễn Thị Hồng Vân cùng tập thể cán bộ, giảng viên Bộ môn Di truyền học, Khoa Sinh học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội và Lãnh đạo Viện H57, đã ủng hộ và luôn tạo điều kiện thuận lợi cho tôi trong quá trình hoàn thành luận
án
Cuối cùng xin gửi lời cảm ơn tới toàn thể cán bộ Phòng Kỹ thuật Sinh học nghiệp vụ, Viện H57 cùng gia đình, bạn bè luôn bên tôi, quan tâm, động viên và tạo điều kiện thuận lợi nhất để tôi có thể hoàn thành bản luận án này
Tác giả luận án
Trang 51.1 Các chỉ thị di truyền sử dụng trong nghiên cứu di truyền quần
thể và giám định ADN hình sự
15
1.1.1 Chỉ thị di truyền và các trình tự ADN lặp lại 15
1.1.3 Các locus STR sử dụng trong nghiên cứu di truyền quần thể và
1.1.4.2 Bộ CODIS 13 locus STR lõi (13 CODIS Core STR Loci) 21
1.1.4.7 Một số bộ kit STR thương mại đang được sử dụng phổ biến
trong nghiên cứu di truyền quần thể và giám định ADN hình sự
26
1.1.4.8 Một số loại chỉ thị di truyền khác được sử dụng trong giám định
ADN hình sự
28
a) Chỉ thị di truyền đa hình đơn nucleotide (SNP) 28
1.2 Các công nghệ phân tích STR sử dụng trong khoa học hình sự 29
1.2.1 Điện di gel polyacrylamide biến tính-nhuộm bạc 29
1.2.2 Đánh dấu huỳnh quang - điện di mao quản CE 30
1.2.3 Điện di mao quản vi mạch sử dụng microchip 35
Trang 61.2.4 Công nghệ phân tích khối phổ (mass spectrometry) 36
1.2.5 Công nghệ pyrosequencing (giải trình tự bằng tổng hợp) 36
1.3 Tổng quan về tình hình nghiên cứu ứng dụng của các locus STR
trong nghiên cứu di truyền quần thể và giám định ADN hình sự
37
1.5 Luận giải các vấn đề nghiên cứu của luận án 46
2.1 Đối tượng, vật liệu, hóa chất và trang thiết bị nghiên cứu 52
2.2.1.2 Tách chiết ADN hệ gen người bằng phương pháp “salting out” 61
2.2.1.3 Tách chiết ADN hệ gen người từ mẫu xương bằng kit DNA IQ
Systems
62
2.2.1.6 Phương pháp xây dựng thang alen bằng PCR đa mồi 63
2.2.1.7 Phương pháp chế tạo kit PCR 16 locus gắn huỳnh quang phân
tích được trên hệ thống điện di mao quản
64
Trang 72.2.1.8 Phương pháp PCR sử dụng kit PCR 16 locus gắn huỳnh quang 66
2.2.1.9 Kỹ thuật điện di mao quản trên hệ thống máy 3130 Gentic
Analyzer
67
2.2.2 Các phương pháp tin sinh học và xử lý số liệu bằng phần mềm 67
2.2.2.1 Kiểm tra mồi bằng phần mềm FastPCR, OligoAnalyzer và
BLAST
67
2.2.2.2 Phân tích kiểu gen bằng phần mềm GeneMapper® ID 68
2.2.2.3 Xử lý dữ liệu thống kê bằng phần mềm EasyDNA_PopuData 68
2.2.2.4 Xây dựng cây phát sinh chủng loại bằng phần mềm POPTREE 2 68
2.2.3 Xây dựng thẻ ADN cá nhân thử nghiệm cho 1.000 đối tượng có
nguy cơ rủi ro cao
70
3.1 Kết quả nghiên cứu hoàn thiện bộ kit PCR 16 locus gắn huỳnh
quang phân tích được trên hệ thống điện di mao quản
71
3.1.1 Kết quả lựa chọn các điều kiện PCR đa mồi cho 16 cặp mồi gắn
huỳnh quang
71
3.1.2 Kết quả xây dựng thang alen cho 16 locus nghiên cứu 73
3.1.3 Kết quả chế tạo bộ kit PCR 16 locus gắn huỳnh quang 75
3 3.1.3.1 Thành phần bộ kit PCR 16 locus gắn huỳnh quang 76 3.1.3.2 Kết quả thử nghiệm, đánh giá bộ kit PCR 16 locus gắn huỳnh
quang tại hai PTN giám định ADN tại Việt Nam
78
3.1.3.3 Kết quả kiểm tra thời hạn sử dụng của bộ kit PCR 16 locus gắn
huỳnh quang tại PTN
81
3.1.3.4 Chi phí mua nguyên vật liệu để chế tạo bộ kit PCR 16 locus gắn
huỳnh quang
82
3.2 Kết quả ứng dụng bộ kit PCR 16 locus gắn huỳnh quang trong
nghiên cứu di truyền quần thể ở 3 tộc người phổ biến ở Việt
Nam
84
3.2.1 Khảo sát TSAL của 15 locus STR trên NST thường ở 3 tộc người
phổ biến ở Việt Nam (Kinh, Mường và Khmer)
84
Trang 83.2.1.3 Sự phân bố tần số alen của 15 locus STR nghiên cứu 91
3.2.2 Mối quan hệ di truyền giữa 3 quần thể nghiên cứu với 14 quần
thể tham khảo
108
3.3 Kết quả ứng dụng bộ kit PCR 16 locus gắn huỳnh quang trong
giám định ADN tại Việt Nam
111
3.3.1 Phân tích một số loại mẫu sinh phẩm thu được tại hiện trường
của một số vụ án hình sự bằng bộ kit PCR 16 locus gắn huỳnh
quang
111
3.3.2 Phân tích một số loại dấu vết ADN thu được từ 10 đối tượng cần
KSAN bằng bộ kit PCR 16 locus gắn huỳnh quang
116
3.3.3 Xây dựng thẻ ADN cá nhân thử nghiệm cho 1.000 đối tượng có
nguy cơ rủi ro cao bằng bộ kit PCR 16 locus gắn huỳnh quang
121
3.4.1 Nghiên cứu hoàn thiện bộ kit PCR 16 locus gắn huỳnh trên hệ
thống điện di mao quản
122
3.4.2 Ứng dụng bộ kit PCR 16 locus gắn huỳnh quang trong nghiên
cứu di truyền quần thể ở 3 tộc người phổ biến ở Việt Nam (Kinh,
Mường và Khmer)
124
3.4.3 Ứng dụng bộ kit PCR 16 locus gắn huỳnh quang trong giám
định ADN tại Việt Nam
128
DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN
QUAN TỚI LUẬN ÁN
133
PHỤ LỤC
Trang 9DANH MỤC CÁC CHỮ VIẾT TẮT
ADN Deoxyribonucleic acid Axít deoxyribo nucleic
BLAST Basic Local Alignment Searh
Tool
Công cụ so sánh mức độ tương đồng về trình tự nucleotide/axit amin trực tuyến của NCBI
CCD Charged-Coupled Device Thiết bị tích điện kép CCD
CE Capillary electrophoresis Điện di mao quản
CMI Combined Marternity Index Chỉ số quan hệ huyết thống mẹ-con kết
Trình tự tham khảo Cambridge
diH2O Nuclease-free water Nước deion không có nuclease
dNTP 2’-deoxyribonucleoside
5’-triphosphate 2’-deoxyribonucleoside 5’-triphosphate
ESS European Standard Set Bộ locus chuẩn châu Âu
Investigation
Cục Điều tra Liên bang Mỹ
FSS Forensic Science Service Sở Dịch vụ Khoa học Hình sự (Anh) HPLC High Performance Liquid
Chromatography Sắc ký lỏng hiệu năng cao ILS 600 Internal Lane Standard 600 Kích thước ADN chuẩn 600 bp
Interpol International Criminal Police
Organization
Tổ chức Cảnh sát Hình sự Quốc tế
JOE 6-carboxy-4’, 5’dichloro-2’,
7’-dimethoxyfluorescein
Chất nhuộm huỳnh quang JOE
Trang 10MI Marternity Index Chỉ số quan hệ huyết thống mẹ-con
mtGenome mitochondrial DNA genome Hệ gen ty thể
Biotechnology Information
Trung tâm thông tin về Công nghệ sinh học (Mỹ)
NCS Research student Nghiên cứu sinh
Standards and Technology
Viện Quốc gia về Tiêu chuẩn và Công nghệ (Mỹ)
OH Straws for drinking water Ống hút dùng để uống nước
PCR Polymerase Chain Reaction Phản ứng chuỗi trùng hợp
PD Power of Discrimination Khả năng phân biệt
PE Probability of Exclusion Khả năng loại trừ
rCRS revised Cambridge
Reference Sequence
Trình tự tham khảo Cambridge sửa đổi
RFLP Restriction Fragment Length
Polymorphism
Đa hình chiều dài đoạn giới hạn
Polymorphism
Đa hình đơn nucleotide
STR Short Tandem Repeat Trình tự ngắn lặp lại liên tiếp
cốc-chén
Tm Melting Temperature Nhiệt độ nóng chảy của mồi
VNTR Variable Number of Tandem
Repeats
Trình tự lặp lại liên tục có số lượng thay đổi
Trang 11DANH MỤC CÁC BẢNG
Bảng 1.1 Thông tin của 23 locus STR trên NST thường đang được
sử dụng trong nghiên cứu di truyền quần thể và giám định ADN hình sự
23
Bảng 1.2 Thông tin của một số bộ kit STR thương mại đã và đang
được sử dụng phổ biến trong nghiên cứu di truyền quần thể và giám định ADN hình sự
27
Bảng 1.3 Một số chất nhuộm huỳnh quang thường được sử dụng
trong các bộ kit STR xác định cá thể người
31
Bảng 1.4 Một số CSDL về TSAL của các locus STR trên NST
thường được sử dụng cho hoạt động nghiên cứu di truyền quần thể và giám định ADN trên thế giới
38
Bảng 1.5 Mô tả tám nhóm dân tộc được chia theo ngôn ngữ hiện
đang sống trên đất nước Việt Nam
43-44
Bảng 1.6 So sánh các bộ locus STR đang được sử dụng phổ biến
trong các bộ kit STR thương mại với bộ locus STR được lựa chọn nghiên cứu
48
Bảng 2.1 Thông tin đặt tổng hợp 16 cặp mồi PCR gắn huỳnh
quang
56
Bảng 2.2 Dải các nồng độ sử dụng để lựa chọn thành phần PCR đa
mồi cho 16 cặp mồi gắn huỳnh quang
63
Bảng 2.3 Thành phần phản ứng PCR đa mồi xây dựng thang alen
cho 16 locus nghiên cứu
Bảng 2.6 Các quần thể tham khảo được sử dụng để so sánh với 3
quần thể nghiên cứu
69
Bảng 3.1 Thành phần được lựa chọn cho PCR đa mồi của 16 cặp
mồi nghiên cứu
73
Bảng 3.2 Các alen trong bộ thang alen của 16 locus nghiên cứu
xây dựng được
75
Trang 12Bảng 3.3 Bảng thành phần của bộ kit PCR 16 locus gắn huỳnh
quang
77
Bảng 3.4 Kết quả kiểm tra thời hạn sử dụng bộ kit PCR 16 locus
gắn huỳnh quang sau 12 tháng bảo quản ở -20oC tại PTN
81
Bảng 3.5 Dự toán kinh phí mua nguyên vật liệu để chế tạo 10 bộ
kit PCR 16 locus gắn huỳnh quang (100 phản ứng/bộ) ở phòng thí nghiệm
82
Bảng 3.6 Tần số alen và các chỉ số thống kê của 15 locus STR trên
NST thường ở quần thể người Kinh (N=300)
85
Bảng 3.7 Tần số alen và các chỉ số thống kê của 15 locus STR trên
NST thường ở quần thể người Mường (N=104)
86
Bảng 3.8 Tần số alen và các chỉ số thống kê của 15 locus STR trên
NST thường ở quần thể người Khmer (N=110)
87
Bảng 3.9 Mô tả các giá trị khoảng cách di truyền chuẩn của Nei
(DST) giữa 3 quần thể nghiên cứu với 14 quần thể tham khảo trên thế giới
108
Bảng 3.10 Kết quả phân tích ADN từ mẫu DV_MÁU_DAO và
mẫu MÁU_NN trong một vụ án mạng xảy ra tại quận Lê
Chân, Tp Hải Phòng bằng bộ kit PCR 16 locus gắn huỳnh quang
112
Bảng 3.11 Kết quả phân tích ADN từ mẫu DV_Q LÓT_NN và
mẫu MÁU_ĐT_01 trong một vụ án hiếp dâm xảy ra tại quận Dương Kinh, Tp Hải Phòng bằng bộ kit PCR 16 locus gắn huỳnh quang
114
Bảng 3.12 Kết quả phân tích ADN từ mẫu RĂNG_NN và mẫu
MÁU_ĐTL trong một vụ án truy tìm tung tích nạn nhân xảy ra tại phường Anh Dũng, quận Dương Kinh, Tp Hải Phòng bằng bộ kit PCR 16 locus gắn huỳnh quang
116
Bảng 3.13 Kết quả kiểu gen 16 locus được phân tích từ 30 mẫu dấu
vết ADN thu được của 10 đối tượng cần KSAN bằng bộ kit PCR 16 locus gắn huỳnh quang
117-118
Bảng 3.14 Kết quả phân tích kiểu gen 16 locus nghiên cứu của 10
đối tượng cần KSAN bằng bộ kit PCR 16 locus gắn huỳnh quang
120
Trang 13DANH MỤC CÁC HÌNH
Hình 1.1 Mô tả trình tự ADN của alen số 11 thuộc locus D16S539 có 11
đơn vị lặp lại GATA với kích thước là 288 bp
19
Hình 1.2 Mô tả vị trí tương đối của 13 locus STR lõi và locus
Amelogenin xác định giới tính trong bộ CODIS (FBI-Mỹ) trên các NST tương ứng
phân tích ADN
32
Hình 1.7 Sơ đồ mô tả các bước phân tách và phát hiện các alen STR với
hệ thống máy điện di mao quản của hãng Applied Biosystems
33
Hình 1.8 Sơ đồ phân tích xác định kiểu gen của mẫu bằng phần mềm
chuyên dụng trên hệ thống máy điện di mao quản của hãng Applied Biosystems
34
Hình 1.9 Kết quả phân tích 8 locus STR của bộ PowerPlex 1.1 bằng kỹ
thuật điện di mao quản vi mạch sử dụng microchip
35
Hình 2.1 Sơ đồ minh họa các chất nhuộm huỳnh quang và dải kích
thước sản phẩm PCR tương đối của 16 cặp mồi nghiên cứu
Hình 3.1 Kết quả xây dựng thang alen 16 locus nghiên cứu bằng
phương pháp PCR đa mồi, được điện di trên hệ thống máy
3130 Gentic Analyzer và phân tích bằng phần mềm GeneMapper® software v.3.2.1
74
Hình 3.2 Sơ đồ mô tả quy trình nghiên cứu chế tạo kit PCR 16 locus gắn
huỳnh quang trong PTN
Trang 14Hình 3.5 Đồ thị so sánh sự phân bố tần số alen locus D3S1358, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
91
Hình 3.6 Đồ thị so sánh sự phân bố tần số alen locus TH01, giữa 3 quần
thể nghiên cứu với 3 quần thể tham khảo
92
Hình 3.7 Đồ thị so sánh sự phân bố tần số alen locus D21S11, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
94
Hình 3.8 Đồ thị so sánh sự phân bố tần số alen locus D18S51, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
95
Hình 3.8 Đồ thị so sánh sự phân bố tần số alen locus Penta E, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
96
Hình 3.10 Đồ thị so sánh sự phân bố tần số alen locus D5S818, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
97
Hình 3.11 Đồ thị so sánh sự phân bố tần số alen locus D13S317, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
98
Hình 3.12 Đồ thị so sánh sự phân bố tần số alen locus D7S820, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
99
Hình 3.13 Đồ thị so sánh sự phân bố tần số alen locus D16S539, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
100
Hình 3.14 Đồ thị so sánh sự phân bố tần số alen locus CSF1PO, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
101
Hình 3.15 Đồ thị so sánh sự phân bố tần số alen locus Penta D, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
102
Hình 3.16 Đồ thị so sánh sự phân bố tần số alen locus vWA, giữa 3 quần
thể nghiên cứu với 3 quần thể tham khảo
104
Hình 3.17 Đồ thị so sánh sự phân bố tần số alen locus D8S1179, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
105
Hình 3.18 Đồ thị so sánh sự phân bố tần số alen locus TPOX, giữa 3
quần thể nghiên cứu với 3 quần thể tham khảo
105
Hình 3.19 Đồ thị so sánh sự phân bố tần số alen locus FGA, giữa ba quần
thể nghiên cứu với ba quần thể tham khảo
107
Hình 3.20 Cây phát sinh chủng loại mô tả mối quan hệ di truyền giữa 3
quần thể nghiên cứu với 14 quần thể tham khảo trên thế giới
109
Hình 3.21 Mô tả mặt trước và mặt sau của mẫu thẻ ADN cá nhân thử
nghiệm
121
Trang 15MỞ ĐẦU
Ở mức độ di truyền, người ta đã ước tính khoảng 99,7% hệ gen người
là giống nhau, sự khác biệt giữa hai cá thể được tìm thấy trong 0,3% của toàn
bộ hệ gen còn lại có trong cơ thể của mỗi cá thể [38] Hệ gen người có rất nhiều các trình tự ADN lặp lại, trong đó có các trình tự ngắn lặp lại liên tiếp được gọi là các locus STR (Short Tandem Repeat) Các locus STR này thường có kích thước ngắn khoảng từ 100-400 bp, mang các đơn vị lặp lại, mỗi đơn vị lặp thường có 2-7 bp và thường được tìm thấy ở vùng ADN không
mã hóa Chúng nằm phân bố rải rác trên tất cả 23 cặp NST ở người và có vai trò quan trọng trong việc nghiên cứu di truyền quần thể và giám định ADN hình sự [67]
Vào những năm 1990, các locus STR đã được sử dụng trong các phòng thí nghiệm (PTN) giám định ADN nhận dạng cá thể người Ngày nay, kỹ thuật phân tích các locus STR là một công cụ hữu ích, không thể thiếu được trong các PTN giám định ADN hình sự [50, 66, 123] Hiện nay, có khoảng hơn 20.000 locus STR được xác định có trong hệ gen người [44] và bộ CODIS (Combined DNA Index System) 13 locus STR lõi (do FBI-Mỹ lựa chọn) là bộ locus STR trên NST thường đang được sử dụng rộng rãi nhất hiện nay trong hoạt động nghiên cứu di truyền quần thể và giám định ADN hình sự [67]
Ở Việt Nam, hoạt động giám định ADN được triển khai từ năm 1999 tại Viện Khoa học Hình sự (KHHS) - Bộ Công an, kể từ đó hoạt động giám định này đã tham gia giải quyết hàng nghìn vụ việc hình sự và dân sự mỗi năm Hiện nay, hoạt động giám định ADN đã được triển khai tại nhiều đơn vị giám định ở Việt Nam như: Viện Pháp y Quốc gia, Viện Pháp y Quân đội, các trung tâm phân tích ADN tư nhân… Tuy nhiên, chỉ tính riêng các vụ án hình
sự trung bình mỗi năm PTN giám định ADN của Viện KHHS tham gia giám định trên 1.000 vụ việc, tương đương với khoảng 3.000-5.000 mẫu vật, ngoài
ra nhiệm vụ xây dựng tàng thư ADN tội phạm quốc gia cũng đã phân tích được gần 50.000 mẫu
Hoạt động giám định ADN đã góp phần quan trọng trong công tác đấu tranh phòng chống tội phạm giữ gìn an ninh chính trị, trật tự an toàn xã hội và
Trang 16dân sinh ở Việt Nam Đây là lĩnh vực giám định đòi hỏi phải có hệ thống trang thiết bị phương tiện hiện đại, có độ nhạy và chính xác cao, đặc biệt là các hóa chất phục vụ cho hoạt động giám định này, trong đó có các bộ kit PCR sử dụng để nhân bộ các locus STR phục vụ cho mục đích nhận dạng cá thể người Các bộ kit này đều được các hãng trên thế giới độc quyền sản xuất, bán thương mại với giá thành rất cao cho các PTN và luôn trong tình trạng thay đổi gây ra sự bị động, cũng như sự phụ thuộc của các PTN giám định ADN ở Việt Nam vào các hãng sản xuất này
Từ năm 2001 - 2011, Viện Kỹ thuật Hóa học, Sinh học và Tài liệu nghiệp vụ (H57), Bộ Công an đã nghiên cứu chế tạo được 05 bộ kit PCR nhân bội 15 locus STR và sử dụng kỹ thuật điện di gel polyacrylamide biến tính - nhuộm bạc để phát hiện các alen của các locus STR này Do việc phân tích kết quả chưa thực hiện tự động được nên các bộ kit này có độ nhạy và độ chính xác chưa cao
Xuất phát từ thực trạng trên, việc thực hiện luận án với tên đề tài
“Nghiên cứu hoàn thiện bộ kit PCR 16 locus gắn huỳnh quang ứng dụng trong nghiên cứu dân tộc học và giám định ADN” là hết sức có ý nghĩa và
mang tính cấp thiết ở Việt Nam Sự thành công của đề tài này sẽ góp phần giúp cho việc chủ động về công nghệ phân tích, tiết kiệm kinh phí và phù hợp với điều kiện của Việt Nam
Mục tiêu nghiên cứu
1 Hoàn thiện được bộ kit PCR 16 locus gắn huỳnh quang phân tích được trên hệ thống điện di mao quản
2 Ứng dụng bộ kit này trong nghiên cứu di truyền quần thể và giám định ADN tại Việt Nam
Đối tượng và phạm vi nghiên cứu
1 Nhóm đối tượng nghiên cứu chính là các cá thể người thuộc ba tộc người phổ biến ở Việt Nam là: 300 cá thể người Kinh không có quan hệ huyết thống, sống ở khu vực Hà Nội và Tp Hồ Chí Minh (N=300); 104 cá thể người Mường không có quan hệ huyết thống, sống ở tỉnh Hòa Bình
Trang 17(N=104) và 110 cá thể người Khmer không có quan hệ huyết thống, sống tỉnh Sóc Trăng (N=110)
2 Bộ 15 locus STR trên nhiễm sắc thể thường (D3S1358, TH01, D21S11, D18S51, Penta E, D5S818, D13S317, D7S820, D16S539, CSF1PO, Penta
D, vWA, D8S1179, TPOX và FGA) và 1 locus Amelogenin dùng để xác định giới tính ở người
Nội dung nghiên cứu
1 Nghiên cứu hoàn thiện bộ kit PCR 16 locus gắn huỳnh quang phân tích được trên hệ thống điện di mao quản
2 Ứng dụng bộ kit PCR 16 locus gắn huỳnh quang trong nghiên cứu di truyền quần thể ở ba tộc người phổ biến ở Việt Nam (Kinh, Mường và Khmer)
3 Ứng dụng bộ kit PCR 16 locus gắn huỳnh quang trong giám định ADN tại Việt Nam
Ý nghĩa khoa học và thực tiễn của luận án
1 Bổ sung nguồn dẫn liệu mới về tần số alen (TSAL) của 15 locus STR trên nhiễm sắc thể (NST) thường (D3S1358, TH01, D21S11, D18S51, Penta
E, D5S818, D13S317, D7S820, D16S539, CSF1PO, Penta D, vWA, D8S1179, TPOX và FGA) ở 3 tộc người phổ biến ở Việt Nam (Kinh, Mường và Khmer) vào CSDL của các locus STR ở người Việt Nam phục
vụ cho hoạt động nghiên cứu di truyền quần thể và giám định ADN tại Việt Nam
2 Đã chế tạo thành công bộ kit PCR 16 locus gắn huỳnh quang phân tích được trên hệ thống điện di mao quản góp phần giúp cho việc chủ động về công nghệ phân tích, tiết kiệm chi phí và phù hợp với điều kiện ở Việt Nam
3 Đã xây dựng được cây phát sinh chủng loại trên dữ liệu TSAL của 13 locus STR thuộc bộ CODIS của 3 quần thể nghiên cứu (Kinh, Mường và Khmer) và 14 quần thể tham khảo Kết quả này góp phần cung cấp thêm bằng chứng khoa học mới về ADN trong lĩnh vực nghiên cứu dân tộc học tại Việt Nam
Trang 18 Những kết quả mới của luận án
1 Đây có thể được coi là nghiên cứu đầu tiên ở Việt Nam về việc lựa chọn các điều kiện PCR đa mồi cho 16 cặp mồi gắn huỳnh quang trong cùng 1 phản ứng và đã chế tạo thành công bộ kit PCR 16 locus gắn huỳnh quang phân tích được trên hệ thống điện di mao quản
2 Đã khảo sát, xây dựng được bảng dữ liệu mới về TSAL và các chỉ số thống kê của 15 locus STR nghiên cứu ở 3 tộc người phổ biến ở Việt Nam: người Kinh (N=300, Hà Nội và Tp Hồ Chí Minh) thu được 173 alen/15 locus; người Mường (N=104, Hòa Bình) thu được 132 alen/15 locus, người Khmer (N=110, Sóc Trăng) thu được 145 alen/15 locus và
đã phát hiện được 32 alen mới so với kết quả nghiên cứu trước đây
3 Đã xây dựng được cây phát sinh chủng loại mô tả mối quan hệ di truyền giữa 3 quần thể nghiên cứu (Kinh, Mường và Khmer) với 14 quần thể tham khảo theo phương pháp neighbor-joining bằng phần mềm POPTREE 2 [109] Đây có thể được coi là một hướng nghiên cứu mới tại Việt Nam và cũng đã chỉ ra được người Kinh, người Mường có mối quan hệ gần gũi với nhau hơn so với người Khmer về mặt di truyền
4 Đã xây dựng được 9/10 hồ sơ ADN cá nhân của 10 đối tượng cần kiểm soát an ninh (KSAN) và làm được 1.000 thẻ ADN cá nhân thử nghiệm trên 1.000 đối tượng có nguy cơ rủi ro cao (phi công, tiếp viên hàng không và ngư dân) Kết quả này cũng đã góp phần bổ sung thêm một giải pháp mới về quản lý con người bằng hồ sơ ADN cá nhân tại Việt Nam, rất cần thiết và phù hợp với xu hướng phát triển chung của một
xã hội hiện đại
Bố cục của luận án
Luận án gồm 122 trang (không tính: mục lục, tài liệu tham khảo và phụ lục), được bố cục gồm 5 phần: Mở đầu 4 trang; Tổng quan 37 trang; Đối tượng và phương pháp nghiên cứu 19 trang; Kết quả và bàn luận 60 trang; Kết luận và kiến nghị 2 trang Ngoài ra, có 1 trang liệt kê danh mục các công trình khoa học đã công bố
Trang 19CHƯƠNG 1 TỔNG QUAN TÀI LIỆU
1.1 Các chỉ thị di truyền sử dụng trong nghiên cứu di truyền quần thể và giám định ADN hình sự
1.1.1 Chỉ thị di truyền và các trình tự ADN lặp lại
Ngày nay, người ta đã phát hiện ra trong hệ gen người có chứa rất nhiều trình tự ADN lặp lại Những trình tự lặp lại này thường nằm giữa các gen, chúng có thể khác nhau về kích thước ở các cá thể khác nhau mà không ảnh hưởng đến sức khỏe di truyền của cá thể đó [38]
Các trình tự ADN lặp lại này thường được tìm thấy ở vùng vệ tinh (DNA satellite), cánh dài, vùng eo thắt thứ nhất (quanh tâm động) và thứ 2của NST Các vùng ADN mà có các đơn vị lặp lại với độ dài trung bình là từ
8 bp đến 100 bp, đôi khi được gọi là tiểu vệ tinh (minisatellite) hay còn được gọi là các locus VNTR [49, 111] Locus VNTR được sử dụng phổ biến nhất trong nghiên cứu di truyền quần thể và phân tích ADN hình sự vào đầu những năm 1990 là locus D1S80 có các đơn vị lặp lại mang 16 bp với số lượng đơn
vị lặp lại là từ 14 đến 41 đơn vị lặp lại (tương ứng từ alen 14 đến alen 41) [37, 78]
Bên cạnh đó, các trình tự ngắn lặp lại liên tiếp còn được gọi là các locus STR, cũng được tìm thấy trong hệ gen người Các locus STR này thường có kích thước ngắn (100-400 bp), mang các đơn vị lặp lại, mỗi một đơn vị lặp lại có từ 2-7 bp và có số lượng các đơn vị lặp lại ở các cá thể khác nhau là khác nhau Các locus STR này đã trở thành các chỉ thị di truyền được
sử dụng phổ biến hơn trong nghiên cứu di truyền quần thể và giám định ADN hình sự vì chúng dễ dàng được phân tích bằng kỹ thuật PCR đa mồi và là công cụ hữu ích cho mục đích nhận dạng cá thể người [38]
Các locus STR này nằm phân bố rải rác khắp trong hệ gen người và xảy
ra ở trung bình cứ khoảng mỗi 10.000 nucleotide [51, 58, 106] Tuy nhiên, không phải tất cả locus STR nào cũng thể hiện có sự khác nhau ở giữa các cá
Trang 20thể khác nhau Một số lượng lớn các locus STR đã được phát hiện bởi các PTN khoa học và thương mại Các locus STR này thường được sử dụng trong các nghiên cứu về vị trí của các gen gây bệnh Ví dụ, Quỹ nghiên cứu y tế Marshfield ở Marshfield, Wisconsin đã thu thập dữ liệu kiểu gen của hơn 8.000 locus STR nằm rải rác trên cả 23 cặp NST ở người phục vụ cho mục đích phát triển bản đồ di truyền ở người [29, 65]
Để thực hiện phân tích các locus STR, vùng bảo thủ ở hai sườn của mỗi đoạn lặp lại phải được xác định Khi biết được trình tự nucleotide ở vùng bảo thủ này, các mồi PCR có thể được thiết kế và vùng lặp lại được nhân bội để phân tích Các locus STR mới thường được xác định bằng một trong hai cách như sau: (1) tìm kiếm trong cơ sở dữ liệu trình tự ADN của ngân hàng gen (GenBank) với các vùng ADN có nhiều hơn 6 đơn vị lặp lại liên tiếp [51, 106] hoặc (2) thực hiện bằng các phương pháp sinh học phân tử [49, 57]
1.1.2 Các kiểu lặp lại của các locus STR
Các kiểu lặp lại của các locus STR thường được đặt tên theo chiều dài của các đơn vị lặp lại Lặp lại 2, 3, 4, 5 hoặc 6 nucleotide, có nghĩa là có 2, 3,
4, 5 hoặc 6 nucleotide trong mỗi đơn vị lặp lại tương ứng Như vậy, về mặt lý thuyết sẽ có 16, 64, 256, 1024 và 4096 kiểu cấu trúc đối với các trình tự lặp lại 2, 3, 4, 5 và 6 nucleotide tương ứng [77] Tuy nhiên, vì các locus STR thường được lặp một cách ngẫu nhiên, nên một số kiểu lặp lại có thể là giống nhau ở những cá thể người khác nhau
Các locus STR không những chỉ khác nhau về độ dài của các đơn vị lặp lại và số lượng lặp lại mà còn được thể hiện ở tính đồng nhất của các đơn vị lặp Các locus STR thường được chia thành nhiều nhóm dựa trên các kiểu cấu
trúc lặp lại Kiểu lặp lại đơn giản chứa các đơn vị lặp có chiều dài và trình tự giống hệt nhau Kiểu lặp lại phức gồm có hai hoặc nhiều loại lặp lại đơn giản liền kề nhau Kiểu lặp lại phức tạp có thể bao gồm vài khối lặp lại có chiều dài và trình tự đơn vị lặp lại khác nhau [114] Kiểu lặp lại phức tạp siêu biến
mang số lượng lớn alen không đồng nhất Các alen này khác nhau cả về kích
Trang 21thước và trình tự [61, 113] Các locus STR thuộc nhóm lặp lại phức tạp siêu biến này hầu như ít được sử dụng trong lĩnh vực phân tích ADN hình sự vì những khó khăn đối với cách gọi tên alen theo danh pháp phụ thuộc vào từng PTN phân tích ADN Mặc dù vậy hiện nay, một số bộ kit STR thương mại vẫn sử dụng các STR phức tạp siêu biến như locus SE33, còn được gọi là ACTBP2 [113]
Hơn nữa, không phải tất cả các alen có trong một số locus STR đều mang các đơn vị lặp lại đầy đủ Thậm chí ở các trình tự lặp lại đơn giản cũng
có thể mang các alen không đầy đủ (alen biến thể) chèn vào giữa các alen mang các đơn vị lặp lại đầy đủ Các vi biến thể (microvariants) là các alen chứa các đơn vị lặp lại không đầy đủ hay còn được gọi là các alen lẻ Ví dụ phổ biến nhất của một vi biến thể là alen 9.3 của locus TH01, nó có 9 đơn vị lặp lại 4 nucleotide và một đơn vị lặp lại chỉ mang có 3 nucleotide vì đơn vị lặp lại thứ bảy bị mất một adenine ở đơn vị lặp lại AATG bình thường [96]
1.1.3 Các locus STR sử dụng trong nghiên cứu di truyền quần thể và giám định ADN hình sự
Đối với mục đích nhận dạng cá thể người, điều quan trọng là phải có các chỉ thị di truyền mang các biến dị cao hoặc một số chỉ thị đa hình thấp nhưng có thể kết hợp được với nhau để có khả năng phân biệt cá thể Các mẫu dấu vết sinh học thu được tại hiện trường trong các vụ án hình sự (mẫu án hình sự) thường gặp khó khăn khi PCR nhân bội bởi vì ADN có trong các mẫu này có thể đã bị phân hủy (do bị đứt, gẫy thành những đoạn nhỏ) Các mẫu lẫn cũng thường hay gặp ở một số mẫu án hình sự, chẳng hạn như các mẫu sinh học thu được từ các vụ án hiếp dâm thường bị lẫn của cả thủ phạm
Trang 22phản ứng PCR đa mồi cho các locus STR cũng dễ dàng được thực hiện hơn so với các locus VNTR [112] Hơn nữa, với kỹ thuật điện di mao quản thì việc phân tách một base của các đoạn ADN có kích thước nhỏ hơn 500 bp (STR)
dễ dàng thực hiện được hơn so với các đoạn ADN có kích thước lớn hơn 500
bp (VNTR) Như vậy, các locus STR với kích thước ngắn sẽ được lựa chọn
và có nhiều thuận lợi hơn cho việc phân tích ADN hình sự
Trong số các kiểu lặp lại khác nhau của các locus STR, lặp lại bốn nucleotide thường được sử dụng phổ biến trong phân tích ADN hình sự hơn
so với lặp lại hai, ba, năm và sáu nucleotide [25] Ngoài ra, một hiện tượng sinh học gọi là các kết quả alen giả (stutter) khi mà các alen của locus STR (alen STR) được PCR nhân bội Các sản phẩm alen giả là các đơn vị sao chép được tạo ra mà thường chỉ có ít hơn một đơn vị lặp lại so với sản phẩm của alen đặc hiệu (alen thật) và được tạo ra trong quá trình PCR do bị trượt sợi khuôn trong quá trình tổng hợp [117] Lượng sản phẩm alen giả thay đổi tùy vào từng locus STR và thậm chí cả chiều dài của các alen trong locus STR nhưng thường ít hơn 15% lượng sản phẩm của alen thật đối với kiểu lặp lại bốn nucleotide Nhưng đối với kiểu lặp lại hai và ba nucleotide, tỷ lệ alen giả
có thể cao hơn (30% hoặc cao hơn) làm cho việc nhận định kết quả trở nên khó khăn hơn trong trường hợp đối với các mẫu lẫn
Những lợi thế của việc sử dụng các locus STR có kiểu lặp lại bốn nucleotide trong nghiên cứu di truyền quần thể và phân tích ADN hình sự hơn
so với các locus VNTR hoặc STR có kiểu lặp lại hai và ba nucleotide bao gồm:
- Dải alen có kích thước ngắn cho phép dễ dàng kết hợp nhiều locus trong cùng một bộ phức nhiều locus (multiplex);
- Việc xây dựng thang alen cho các locus STR bằng phản ứng PCR dễ dàng thực hiện hơn so với các locus VNTR;
- Phản ứng PCR dễ dàng thành công hơn đối với các mẫu ADN đã bị phân hủy;
Trang 23- Thuận lợi với việc phân tích các mẫu lẫn hơn so với các locus STR có kiểu lặp lại hai và ba nucleotide do có tỷ lệ alen giả thấp (< 15%)
Hình 1.1 mô tả một đoạn trình tự ADN của alen 11 thuộc locus D16S539 có 11 đơn vị lặp lại GATA với kích thước sản phẩm PCR là 288 bp khi sử dụng cặp mồi PCR được đánh dấu bằng phần gạch chân với chữ màu xanh lá cây [83] Hai mồi PCR bắt cặp bổ sung với vùng sườn bảo thủ ở hai bên của đoạn lặp lại Theo cách này, các alen khác nhau ở các cá thể khác nhau sẽ được PCR nhân bội (ví dụ: 9 đơn vị lặp lại GATA hoặc 13 đơn vị lặp lại GATA thay vì 11 đơn vị lặp lại GATA) Các alen này, được xác định kích thước bằng cách so sánh với một thang ADN kích thước chuẩn được chạy cùng trong quá trình điện di Các alen khác nhau bởi một đơn vị lặp lại GATA nếu được phân tách bằng điện di mao quản và có thang ADN kích thước chuẩn chạy cùng thì hai alen này sẽ di chuyển cách nhau một khoảng cách xấp xỉ 4 bp Do vậy, khi sử dụng cặp mồi này để nhân bội đoạn ADN mang
11 đơn vị lặp lại GATA (alen 11) của locus D16S539 sẽ thu được sản phẩm PCR có kích thước tương ứng khoảng 288 bp Như vậy, với alen 11 có kích
Hình 1.1 Mô tả trình tự ADN của alen 11 thuộc locus D16S539 có 11 đơn vị
lặp lại GATA với kích thước là 288 bp [38]
Hai vùng trình tự được gạch chân phía dưới (đoạn trình tự có chữ màu xanh lá cây) là hai vị trí thiết kế mồi xuôi và mồi ngược tương ứng [83]
Vị trí “T” với chữ màu đỏ là một điểm đột biến trên mồi ngược được tìm thấy trong một alen null [88]
Trang 24thước là 288 bp, alen 10 sẽ là 284 bp (nhỏ hơn 4 bp), alen 12 sẽ là 292 bp (lớn hơn 4 bp)
Tóm lại: Trong hơn hai thập kỷ qua, một số lượng lớn các locus STR
có kiểu lặp lại bốn nucleotide đã được thử nghiệm trong nghiên cứu di truyền quần thể và giám định ADN hình sự Các loại locus STR đã được tìm kiếm bao gồm: các locus STR có kích thước ngắn được gọi là các locus miniSTR
sử dụng để phân tích các mẫu sinh phẩm đã bị phân hủy [46]; các locus STR
có tỷ lệ alen giả thấp sử dụng để phân tích các mẫu sinh phẩm bị lẫn [25]; các locus STR nằm trên NST Y của nam giới (Y-STR) sử dụng để phân tích trong trường hợp mẫu sinh phẩm bị lẫn nam - nữ thu được trong các vụ án hiếp dâm [45] và các locus STR nằm trên NST X sử dụng để phân tích các mẫu trong trường hợp cần mở rộng xét nghiệm [106, 130] Các tiêu chí để lựa chọn các locus STR sử dụng trong nghiên cứu di truyền quần thể và phân tích ADN hình sự bao gồm [62, 45]:
1.1.4 Đặc điểm chung của các bộ locus STR đang được sử dụng trên thế giới
Để các chỉ thị di truyền sử dụng trong phân tích ADN hình sự có tính chất pháp lý, một bộ chung các locus chuẩn phải được sử dụng trong quy trình phân tích mẫu Các locus STR được sử dụng phổ biến hiện nay, ban đầu đã được xác định và phát triển trong PTN của tiến sĩ Thomas Caskey tại trường Đại học Y khoa Baylor (Baylor College of Medicine) [57, 68] và tại FSS
Trang 25(Anh) [81, 114] Ban đầu, tập đoàn Promega (Madison, Wisconsin) mua bản quyền thương mại hóa rất nhiều các locus STR của PTN Thomas Caskey, trong khi hãng Applied Biosystems (Foster City, California) lại mua bản quyền thương mại hóa các locus STR của FSS đồng thời phát triển thêm một
số locus mới [38]
1.1.4.1 Giai đoạn phát triển sớm
Vào năm 1993, FSS (Anh) đã phát triển bộ kit STR phức thế hệ đầu tiên (FGM) với tên gọi là Quadruplex bao gồm 4 locus STR trên NST thường (TH01, FES/FPS, vWA và F13A1) [80] Bộ kit này cho khả năng trùng lặp là khoảng 1/10.000 Tiếp theo đó, vào năm 1996, FSS đã cho ra đời bộ kit STR phức thế hệ thứ hai với tên gọi là SGM, gồm có 6 locus STR trên NST thường (TH01, vWA, FGA, D8S1179, D18S51 và D21S11) và locus Amelogenin dùng để xác định giới tính [81, 107] Bộ kit này cho khả năng trùng lặp khoảng 1 trong 50 triệu
Vào năm 1994, tập đoàn Promega (Mỹ) đã phát triển bộ kit STR thương mại đầu tiên có khả năng nhân bội đồng thời 3 locus STR (CSF1PO, TPOX và TH01) với tên gọi là CTT triplex và sử dụng công nghệ điện di gel polyacrylamide biến tính-nhuộm bạc để phát hiện các alen của locus STR này Bộ kit này cho khả năng trùng lặp khoảng 1 trong 500 và được sử dụng rộng rãi tại Mỹ vào cuối những năm 1990 [38]
1.1.4.2 Bộ CODIS 13 locus STR lõi (13 CODIS Core STR Loci)
Vào năm 1997, FBI (Mỹ) đã đồng ý lựa chọn bộ CODIS 13 locus STR
lõi làm cơ sở cho việc xây dựng tàng thư ADN quốc gia của Mỹ và phục vụ
cho công tác điều tra phá án [32] Bộ 13 locus STR được lựa chọn bao gồm: CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51 và D21S11 (xem Hình 1.2 và Bảng 1.1)
Nếu sử dụng bộ CODIS 13 locus STR lõi này trong các xét nghiệm thì khả năng trùng lặp sẽ là khoảng 1 trong 1.000 tỷ giữa các cá thể không có quan hệ huyết thống [48]
Bộ CODIS 13 locus STR lõi này, được chia thành bốn nhóm lặp lại như sau:
Trang 26- Lặp lại đơn giản gồm một trình tự lặp đi lặp lại: TPOX, CSF1PO, D5S818, D13S317 và D16S539;
- Lặp lại đơn giản với alen không đồng nhất (ví dụ: 9.3): TH01,
sơ ADN thuộc Hệ thống tàng thư ADN Quốc gia và công tác điều tra của FBI trong tương lai [69, 70]
Hình 1.2 Mô tả vị trí tương đối của 13 locus STR lõi và locus Amelogenin dùng để xác định giới tính trong bộ CODIS (FBI-Mỹ) trên các NST tương ứng [129]
Trang 27Bảng 1.1 Thông tin của 23 locus STR trên NST thường đang được sử dụng trong nghiên cứu di truyền quần thể và giám định ADN hình sự
Bộ CODIS 13 locus STR lõi (FBI-Mỹ) là các locus được đánh dấu bằng chữ màu xanh ( Nguồn: Butler (2006) và Thanakiatkrai & Welch (2010)).
6 FGA 4q31.3 alpha fibrinogen, Intron 3 Chr 4 155.509 Mb M64982 (21) Phức CTTT/TTCC 12.2 đến 51.2
9 SE33 6q14 beta-actin related pseudogene Chr 6 88.987 Mb V00481 (26.2) Phức tạp AAAG 3 đến 49
14 vWA 12p13.31 von Willebrand Factor, Intron 40 Chr 12 6.093 Mb M25858 (18) Phức TCTA/TCTG 10 đến 25
Trang 281.1.4.3 Bộ locus STR chuẩn cho người châu Âu ESS (European Standard Set)
Vào năm 1999, FSS đã đưa ra mục tiêu khởi điểm ban đầu là việc lựa chọn một bộ locus STR chuẩn cho người châu Âu và đặt tên là ESS (European Standard Set) [102] Bộ ESS này ban đầu gồm có 7 locus STR trên NST thường là: FGA, TH01, vWA, D3S1358, D8S1179, D18S51 và D21S11
Bộ locus này có 6 locus STR thuộc bộ SGM và cộng thêm locus D3S1358 Ngoài ra, locus D16S539 cũng được lựa chọn trong trường hợp cần mở rộng
bộ ESS với mục đích để tạo ra các hồ sơ ADN có 8 locus STR trùng nhau giữa các xét nghiệm ADN ở châu Âu và Mỹ Tổ chức Cảnh sát Hình sự Quốc
tế (Interpol) cũng sử dụng các locus STR thuộc bộ ESS để làm bộ locus chuẩn cho mình và được gọi là ISSOL (Interpol Standard Set of Loci) [102]
Tuy nhiên, khi cơ sở dữ liệu ADN phát triển về số lượng mẫu, nhiều locus mới được yêu cầu bổ sung thêm để tránh các sự trùng lặp ngẫu nhiên Ở Đức, locus SE33 được sử dụng bổ sung trong cơ sở dữ liệu ADN quốc gia của
họ Đến tháng 04 năm 2009, các viện Mạng lưới Khoa học Hình sự châu Âu (ENFSI - European Network of Forensic Science Institutes) đã đồng ý nâng cấp bộ ESS lên tới 12 locus (bộ ESS gốc có bảy locus cộng thêm 5 locus STR mới là D2S441, D10S1248, D22S1045, D1S1656 và D12S391 [64]) (xem Bảng 1.1) Bộ ESS mở rộng 12 locus này, được Liên minh châu Âu thông qua chính thức từ tháng 11 năm 2009 để cho phép trao đổi dữ liệu ADN trên khắp châu Âu
1.1.4.4 Locus Amelogenin dùng để xác định giới tính
Amelogenin là một gen mã hóa cho protein được tìm thấy trong men răng của người FSS (Anh) là đơn vị đầu tiên thiết kế cặp mồi PCR đặc hiệu cho locus Amelogenin để xác định giới tính ở người và đang được sử dụng phổ biến trong các PTN phân tích ADN hình sự hiện nay [59, 107] Cặp mồi này được thiết kế 2 vùng sườn (flank) của đoạn mất 6 bp bên trong vùng intron 1 của gen Amelogenin trên NST X Khi sử dụng cặp mồi này để PCR nhân bội vùng gen Amelogenin này kết quả thu được sản phẩm PCR có kích thước là 106 bp và 112 bp từ nhiễm sắc thể X và Y tương ứng (xem Hình 1.3)
Trang 291.1.4.5 Bộ locus STR trên NST giới tính Y (Y-STR)
Là các locus STR nằm dọc theo chiều dài của NST Y và được gọi là các Y-STR Các locus Y-STR này, có 3 ứng dụng chính là xác định giới tính nam giới, xác định quan hệ huyết thống theo dòng cha và nghiên cứu phả hệ theo dòng cha Tuy nhiên, các locus Y-STR có khả năng phân biệt cá thể thấp hơn so với các locus STR trên NST thường [34, 41]
Vào năm 1997, cộng đồng khoa học hình sự châu Âu đề xuất lựa chọn một bộ locus Y-STR lõi hay còn được gọi là bộ "haplotype tối thiểu" bao gồm
9 locus Y-STR (DYS19, DYS389I/II, DYS390, DYS391, DYS392, DYS393
và DYS385a/b) (xem Hình 1.4.) và locus YCAIIa/b là locus tùy chọn để tạo
ra một bộ "haplotype mở rộng" (xem Hình 1.4) [79]
Hình 1.3 Sơ đồ mô tả phương pháp xác định giới tính sử
dụng locus Amelogenin [38]
Trang 30Đến đầu năm 2003, tập đoàn SWGDAM (Scientific Working Group on DNA Analysis Methods) của Mỹ đã chọn một bộ locus lõi bao gồm 9 locus trong bộ “haplotype tối thiểu” và cộng thêm hai locus mới là DYS438 và DYS439 để tạo ra bộ locus lõi gồm 11 locus Y-STR cho riêng họ [38]
1.1.4.6 Bộ locus STR trên NST giới tính X (X-STR)
Là các locus STR rất phổ biến nằm dọc theo NST X và được gọi là các locus X-STR Tuy nhiên, các trình tự lặp lại bốn nucleotide [GATA]n thường thấy xẩy ra ở xung quanh vị trí 10 Mb của cánh ngắn (p) trên NST X [106]
Năm 2007, giáo sư Szibor và các đồng nghiệp là những người đầu tiên đưa các locus X-STR vào sử dụng trong cộng đồng phân tích ADN hình sự [108] và đã thành lập một trang mạng cung cấp các thông tin về các locus X-STR ứng dụng trong phân tích ADN hình sự (xem Hình 1.5) [130]
1.1.4.7 Một số bộ kit STR thương mại đang được sử dụng phổ biến trong nghiên cứu di truyền quần thể và giám định ADN hình sự
Hiện nay, có hai nhà cung cấp chính các bộ kit STR thương mại này là: Tập đoàn Promega (Madison, Wisconsin, Mỹ) và Applied Biosystems (Foster City, California, Mỹ) Trong suốt hơn 15 năm qua, các công ty này đã nghiên
Hình 1.5 Mô tả vị trí tương đối của các locus X-STR trên nhiễm sắc thể X [130].
Trang 31cứu để cho ra đời những bộ kit STR phục vụ cho nghiên cứu di truyền quần thể và cộng đồng phân tích ADN hình sự như hiện nay (xem Bảng 1.2)
Bảng 1.2 Thông tin của một số bộ kit STR thương mại đã và đang được sử dụng phổ biến trong nghiên cứu di truyền quần thể và giám định ADN hình sự [38]
Tên bộ KIT STR thương mại Hãng sản xuất Năm ra đời
AmpFlSTR Profiler Plus Applied Biosystems Tháng 12/1997
AmpFlSTR SGM Plus Applied Biosystems Tháng 2/1999
AmpFlSTR Identifiler Applied Biosystems Tháng 7/2001 AmpFlSTR MiniFiler Applied Biosystems Tháng 3/2007
PowerPlex ESX 16 & ESX 17 Promega Tháng 9/2009
Investigator Hexaplex ESS
Investigator Nonaplex ESS
AmpFlSTR NGM SElect Applied Biosystems Tháng 12/2010
Bên cạnh đó, ở châu Âu các công ty như: Qiagen (Hilden, Đức) và Biotype (Dresden, Đức) cũng đã bắt đầu cung cấp các bộ kit STR thương mại, nhưng việc phân phối bị giới hạn Ví dụ, Qiagen (Hilden, Đức) chỉ được bán các bộ kit STR của họ ở thị trường châu Âu mà không được bán ở Mỹ [38]
Trang 32Các nhà sản xuất thương mại của các bộ kit STR đã nỗ lực nghiên cứu, thiết kế được các cặp mồi PCR đặc hiệu cho các locus STR và có khả năng kết hợp tốt với nhau trong cùng một phản ứng PCR đa mồi [83, 116] Promega đã công bố và đăng ký bằng sáng chế cho các trình tự mồi PCR của mình [83, 86] trong khi Applied Biosystems đã giữ độc quyền các trình tự mồi của họ
1.1.4.8 Một số loại chỉ thị di truyền khác được sử dụng trong giám định ADN hình sự
c) Chỉ thị di truyền đa hình đơn nucleotide (SNP)
Một trình tự đơn base khác nhau giữa các cá thể ở một điểm nhất định trong hệ gen người thường được gọi là đa hình đơn nucleotide hay SNP (phát
âm là "snip") Các SNP phân bố rất phong phú trong hệ gen người và đang được sử dụng cho các nghiên cứu về các bệnh di truyền [30] Có hàng triệu SNP tồn tại ở trong mỗi cá thể, do đó sự đa hình của SNP rất có nghĩa cho mục đích nhận dạng cá thể người
Phần lớn các SNP là các chỉ thị hai alen, do đó sẽ có ba kiểu gen có thể trong mỗi chỉ thị SNP Ví dụ, nếu các alen trong một locus SNP là M và N (trong đó M (N) có thể là 1 trong 4 base: C, T, A, hoặc G) ba kiểu gen có thể
sẽ là MM, NN, hoặc MN Việc phân tích mẫu lẫn có thể là một thách thức đối với các locus SNP vì nó có thể gặp khó khăn để phân biệt giữa một dị hợp tử thật với một mẫu lẫn có chứa hai đồng hợp tử hoặc một dị hợp tử và một đồng hợp tử [42]
Thông thường cần sử dụng từ 50-100 locus SNP sẽ cho kết quả tương đương với từ 10 đến 16 locus STR trong nhận dạng cá thể người [63] Các locus SNP có thể được phân loại theo bốn ứng dụng chính [31, 43] như sau: (1) Nhóm các SNP xác định danh tính cá thể người (2) Nhóm các SNP xác định thông tin di truyền theo dòng (3) Nhóm các SNP xác định thông tin tổ tiên và (4) Nhóm các SNP xác định thông tin kiểu hình
Trang 33d) Chỉ thị di truyền ADN ty thể (mtDNA)
ADN ty thể có kích thước khoảng 16.569 bp, mã hóa cho 37 sản phẩm gen được sử dụng trong các quá trình oxy hóa phosphoryl hóa hoặc sản xuất năng lượng tế bào Trong đó, 37 gen phiên mã của mtDNA đều được tìm thấy
ở "vùng mã hóa" bao gồm 13 protein, 2 RNA ribosome (rRNA) và 22 RNA vận chuyển (tRNA) Ngoài ra, còn có một vùng “điều khiển” hay còn gọi là vùng D-loop (displacement loop) với kích thước là 1.122 bp có chứa điểm khởi đầu sao chép trên chuỗi nặng (OH) của phân tử mtDNA nhưng không mã hóa cho bất kỳ sản phẩm gen nào, do đó đôi khi còn được gọi là vùng "không
mã hóa" [38]
Các ứng dụng phân tích mtDNA hình sự hiện nay là chủ yếu tập trung vào phân tích hai vùng siêu biến (hypervariable) của vùng D-loop được gọi là HV1 và HV2 để kiểm tra thông tin di truyền theo dòng mẹ Trong trường hợp cần mở rộng xét nghiệm, vùng thứ ba của D-loop được gọi là HV3 cũng được phân tích để cung cấp thêm thông tin đối với các mẫu xét nghiệm
ADN ty thể của người lần đầu tiên được giải trình tự vào năm 1981 tại PTN của Frederick Sanger ở Cambridge, Anh [17] Trong nhiều năm, bản trình tự gốc "Anderson" là trình tự tham khảo (có mã GenBank: M63933) được sử dụng để so sánh và xác định vị trí của các nucleotide trên các trình tự mới Trình tự Anderson cũng được gọi là trình tự tham khảo Cambridge (CRS: Cambridge Reference Sequence) Năm 1999, Andrews và các đồng nghiệp tiến hành giải trình tự lại ADN ty thể gọi là trình tự tham khảo Cambridge sửa đổi (rCRS) [19] Trình tự rCRS được đăng ký trong GenBank với mã là NC_012920.1
1.2 Các công nghệ phân tích STR sử dụng trong khoa học hình sự
1.2.1 Điện di gel polyacrylamide biến tính- nhuộm bạc
Trong hệ gel polyacrylamide có một liên kết ngang được tạo thành do phản ứng trùng hợp giữa acrylamide và bisacrylamide Các tính chất vật lý và
Trang 34kích thước lỗ của gel được điều chỉnh bởi tỷ lệ acrylamide/bisacrylamide trong gel và mức độ của liên kết ngang được hình thành Với khả năng phân tách cao của gel polyacrylamide biến tính nên thường được sử dụng để giải trình tự ADN và có thể phân tách được một base Những gel giải trình tự này
đã được sử dụng phổ biến trong điện di phân tách các alen STR [99]
Ngoài ra, trong thành phần của gel polyacrylamide biến tính thường sử dụng thêm các tác nhân biến tính ở nồng độ cao như urea và kết hợp với điều kiện chạy điện di ở nhiệt độ cao (50-60oC) Với gel polyacrylamide biến tính, các đoạn ADN được phân tách ở trạng thái sợi đơn và di chuyển trong môi trường gel với vận tốc khác nhau tùy theo kích thước của sợi ADN (các sợi ADN có kích thước nhỏ chạy nhanh hơn so với các sợi ADN có kích thước lớn) [99]
Sau khi điện di phân tách kết thúc, các đoạn ADN có thể được phát hiện bằng phương pháp nhuộm bạc [27] Nhuộm bạc là phương pháp ít tốn kém hơn so với các phương pháp phát hiện huỳnh quang bởi vì nó không đòi hỏi các hệ thống máy đắt tiền và có thể đọc kết quả bằng mắt thường Tuy nhiên, cả hai sợi ADN đều được phát hiện là băng ADN đôi nếu sử dụng điện
di bằng gel polyacrylamide biến tính có độ phân tách cao Các băng ADN đôi
có thể sẽ gây khó khăn cho việc nhận định kết quả khi phân tích các mẫu lẫn (do xuất hiện thêm các băng ADN) Phương pháp nhuộm bạc được sử dụng phổ biến hiện nay để phát hiện các alen STR là phương pháp nhuộm bạc của Bassam và các đồng nghiệp (1991) [27]
1.2.2 Đánh dấu huỳnh quang-điện di mao quản CE
Đánh dấu huỳnh quang vào các đoạn ADN có thể được thực hiện bằng nhiều cách khác nhau Tuy nhiên, phương pháp phổ biến nhất được sử dụng đánh dấu các alen STR là sử dụng một loại thuốc nhuộm huỳnh quang (xem Bảng 1.3) đánh dấu ở đầu 5' của một mồi PCR (mồi xuôi hoặc mồi ngược) Quá trình đánh dấu này, được thực hiện ngay từ khi đặt tổng hợp mồi Sau đó,
Trang 35sử dụng các mồi này để PCR nhân bội các locus STR tương ứng sẽ tạo các sản phẩm PCR được đánh dấu [85] Các sản phẩm PCR này được điện di phân tách trên hệ thống điện di mao quản, hai sợi ADN được tách ra trong quá trình điện di và chỉ sợi ADN được đánh dấu huỳnh quang được phát hiện bằng thiết bị phát hiện huỳnh quang chuyên dụng [35]
Bảng 1.3 Một số chất nhuộm huỳnh quang thường được sử dụng
trong các bộ kit STR nhận dạng cá thể người [35]
Thuốc nhuộm Tên hóa học thích cực đại (nm) Bước sóng kích
Bước sóng phát quang cực đại (nm)
JOE 6- carboxy-2’,7’-dim
eoxy-4’,5’-dichl orofluorescein
Trang 36nhớt; Hai bộ phận đựng đệm điện di cho điện cực âm và điện cực dương; Hai điện cực (âm và dương) được kết nối với nguồn cung cấp điện cao áp (5-20 kV); Nguồn lazer kích thích; Bộ phận quang học phát hiện các chất huỳnh quang theo bước sóng phát quang; Khay đựng mẫu và lấy mẫu tự động và Hệ thống máy tính thu thập dữ liệu (xem Hình 1.6)
Giống như các đệm được sử dụng trong điện di gel polyacrylamide cũng có thể được sử dụng với CE Tuy nhiên, thay vì sử dụng một ma trận gel
để phân tách các đoạn ADN, bằng việc sử dụng một dung dịch polymer nhớt
có vai trò như là môi trường sàng lọc tùy theo kích thước của các phân tử ADN Các chuỗi polymer linh hoạt có tác dụng để phân tách các đoạn ADN
Máy tính thu thập dữ liệu
Khay đựng mẫu di chuyển tự động dưới
cathode và đầu cuối của mao quản để phục
vụ cho việc lấy mẫu lần lượt vào mao quản
theo sự điều khiển của máy tính
5-20 kV
Trang 37tích điện âm trên đường di chuyển tới điện cực dương của CE Các đoạn ADN
có kích thước lớn di chuyển trong môi trường polymer nhớt có trong mao quản tới điện cực dương chậm hơn so với các đoạn ADN có kích thước nhỏ hơn [35] Điều này cho phép các đoạn ADN được phân tách ra dựa trên kích thước của chúng (xem Hình 1.7)
Trước khi lấy mẫu vào mao quản, một loại gel mới được tự động bơm vào mao quản là dung dịch polymer mới Mao quản của CE có vai trò như một đường chạy trong điện di gel polyacrylamide và chỉ vừa đủ cho một mẫu tại một thời điểm Các mẫu ADN được trộn với một thang ADN có kích thước chuẩn (gồm các đoạn ADN đã biết kích thước) theo một tỷ lệ nhất định
Phân tách các màu Huỳnh
quang
ABI Prism spectrograph
Phân tách theo
kích thước
Phân tích bằng phần mềm GeneMapper ID
2 Lấy mẫu vào mao quản
3 Phân tách mẫu
4 Phát hiện mẫu
5 Phân tích kết quả
1 Chuẩn bị mẫu
Mao quản
(chứa dung dịch polymer)
Hình 1.7 Sơ đồ mô tả các bước phân tách và phát hiện các alen STR với hệ thống máy điện di mao quản của hãng Applied Biosystems [35]
Trang 38để giúp cho việc xác định kích thước tương quan giữa mẫu ADN điện di với thang ADN kích thước chuẩn chạy cùng Một sự khác biệt quan trọng giữa điện di mao quản và điện di gel polyacrylamide là điện trường được sử dụng trong CE cao hơn gấp từ 10 đến 100 lần so với điện di gel polyacrylamide (tức là 300 V/cm thay vì 10 V/cm), vì vậy kết quả chạy điện di CE nhanh hơn nhiều so với chạy điện di gel polyacrylamide [38]
Sự phát hiện mẫu ở hệ thống máy CE được thực hiện một cách tự động bằng cách đo khoảng thời gian từ khi lấy mẫu vào mao quản đến khi phát hiện mẫu với một nguồn laser được đặt ở phần cửa sổ phát hiện (gần phía điện cực dương của CE) Ánh sáng laser chiếu vào cửa sổ phát hiện trên mao quản và các đoạn ADN được chiếu sáng khi chúng đi qua cửa sổ này Các đoạn ADN
có kích thước nhỏ hơn di chuyển đến trước tiên tại các điểm phát hiện trên cửa sổ phát hiện và tiếp theo là các đoạn ADN có kích thước lớn hơn theo thứ
Hình 1.8 Sơ đồ phân tích xác định kiểu gen của mẫu bằng phần mềm chuyên dụng trên hệ thống máy điện di mao quản của hãng Applied Biosystems [35]
Dữ liệu điện di thu được từ hệ thống điện di mao quản
Phân tách màu
và kích thước các đỉnh
Kích thước ADN chuẩn Kích thước ADN chuẩn
Kết quả kiểu gen của mẫu được xác định bằng cách so sánh với thang alen chuẩn
Trang 39tự tốc độ di chuyển của chúng tương ứng với chiều dài hoặc số lượng các cặp base Dữ liệu phân tách của mẫu sẽ được tự động lưu vào phần mềm máy tính
và được phân tích bằng phần mềm chuyên dụng để xác định kiểu gen của các mẫu cần phân tích (xem Hình 1.8) [35, 38]
1.2.3 Điện di mao quản vi mạch sử dụng microchip
Vào năm 1997, Dieter Schmalzing và các đồng nghiệp tại Viện Whitehead MIT đã chứng minh sự phân tách các alen STR nhanh chóng bằng cách sử dụng hai chất nhuộm màu huỳnh quang và một hệ thống phát hiện huỳnh quang cảm ứng bước sóng laser kép [101] Các alen lặp bốn nucleotide
từ bộ phức 4 locus (CSF1PO, TPOX, TH01 và vWA) đã được tách ra trong
45 giây bằng cách sử dụng một kênh phân tách dài 2,6 cm Sự phân tách một base cần được giải quyết đối với alen 9.3 và 10 của locus TH01, bằng cách giảm tốc độ phân tách với thời gian là 10 phút [101] Các mẫu được xác định kiểu gen bằng cách trộn sản phẩm PCR với thang alen chuẩn ở nồng độ thấp hơn (xem Hình 1.9)
Hình 1.9 Kết quả phân tích 8 locus STR của bộ PowerPlex 1.1 bằng kỹ thuật điện
di mao quản vi mạch sử dụng microchip [101]
(Các điện di đồ được quét mỗi kênh màu của phân tích đồng thời hai màu được chia theo màu tương ứng Các sản phẩm PCR được trộn với các thang alen trước khi tra mẫu để cung cấp một khung tham chiếu cho kiểu gen mẫu Các alen được xác định cho mỗi locus được ghi bên cạnh các đỉnh tương ứng.)
Trang 40Vào năm 2010, FSS và University of Arizona Center for Applied NanoBioscience and Medicine đã chế tạo được một thiết bị tích hợp để phân tích ADN hình sự [74] Kết quả phân tích mẫu chỉ mất trong vòng chưa đầy bốn giờ với một mô đun xử lý ADN bao gồm đầy đủ hóa chất các dụng cụ cần thiết cho phép thực hiện các bước phân tích ADN như tinh sạch ADN, PCR nhân bội và phân tách các sản phẩm PCR Một chip CE đi kèm kết nối bằng ống Telfon thực hiện việc phân tách ADN [74, 76]
1.2.4 Công nghệ phân tích khối phổ (mass spectrometry)
Khối phổ là một kỹ thuật phân tích đa năng dựa trên cơ sở việc phát hiện các ion và phép đo tỷ lệ khối lượng với điện tích Bằng cách xác định khối lượng thực tế của phân tử ADN cho nên kỹ thuật khối phổ cho phép chính xác hơn phép đo kích thước tương đối như trong các kỹ thuật điện di
Để thực hiện phân tích ADN bằng khối phổ, có hai kỹ thuật ion hóa khác nhau được sử dụng là MALDI (matrix-assisted laser desorption-ionization) và ESI (electrospray ionization) [38]
Hơn một thập kỷ trước, các locus STR đã được phân tích thành công bằng thiết bị khối phổ MALDI-TOF và kết hợp với việc thiết kế lại các đoạn mồi PCR để nhân bội các vùng lặp lại có kích thước ngắn hơn [39] Trong khi
kỹ thuật MALDI có một giới hạn kích thước các đoạn ADN phân tích được khoảng 150 bp, thì với kỹ thuật ESI gần đây đã mở rộng phạm vi kích thước của các đoạn ADN cho phép đo phổ khối lượng chính xác là khoảng 250 bp
1.2.5 Công nghệ pyrosequencing (giải trình tự bằng tổng hợp)
Pyrosequencing dựa trên sự phát hiện pyrophosphate được giải phóng khi một dNTP kết hợp vào một sợi ADN đang được tổng hợp [100] Trong phương pháp giải trình tự bằng tổng hợp này, dNTP được thêm vào theo kiểu từng bước thông qua việc tự động bơm trực tiếp từng loại nucleotide A, T, C, hoặc G vào quá trình tổng hợp Nếu nucleotide nào được kết hợp bổ sung với sợi ADN đích, pyrophosphate được giải phóng Thông qua một loạt các phản ứng enzyme liên quan đến sự hình thành của ATP và luciferin được chuyển