Mục tiêu nghiên cứu của bài viết nhằm xác định trình tự và phân tích tính đa hình nucleotid đơn vùng gen ty thể HV1, HV2 trên dân tộc Chăm Việt Nam.
Trang 1PHÂN TÍCH TRÌNH TỰ VÙNG GEN TY THỂ HV1 VÀ HV2
TRÊN DÂN TỘC CHĂM VIỆT NAM
Trần Thị Thúy Hằng, Trần Huy Thịnh, Trần Vân Khánh
Trường Đại học Y Hà Nội Nghiên cứu được thực hiện với mục tiêu xác định trình tự và phân tích tính đa hình nucleotid đơn (Single nucleotid polymorphisms - SNP) vùng gen ty thể HV1, HV2 trên dân tộc Chăm Việt Nam Kỹ thuật giải trình
tự gen được được áp dụng để phân tích 100 mẫu DNA của người dân tộc Chăm, kết quả được so sánh với trình tự chuẩn rCRS, từ đó phân tích tính đa hình nucleotid đơn (SNP) của vùng gen HV1 và HV2 Kết quả cho thấy đã xác định được trình tự hoàn chỉnh vùng gen HV1, HV2 và phát hiện được nhiều SNP
ở các mẫu nghiên cứu Xác định được tỷ lệ một số SNP hay gặp: SNP A73G và A263G, 315insC gặp ở 100% mẫu nghiên cứu, 309insC là 64%, T16189C là 56%, A16183C là 44%, C16223T là 37%, G16129A
là 23%, T16304C là 21%, C16261T là 20%; C150T là 20%; A210G là 20% Đây là số liệu đầu tiên, hoàn chỉnh về trình tự vùng gen ty thể HV1 và HV2 của dân tộc Chăm với số lượng mẫu tương đối lớn.
I ĐẶT VẤN ĐỀ
Từ khóa: DNA ty thể, gen HV1, gen HV2, dân tộc Chăm.
Vùng gen ty thể HV1 và HV2 được Anderson
và cộng sự xác định năm 1981 nằm trong vùng
điều khiển D-loop của DNA ty thể được gọi là
vùng siêu biến 1 (HV1- Hypervariable region 1)
có kích thước 359bp ở vị trí 16024 - 16383 và
vùng siêu biến 2 (HV2 - Hypervariable region
2) có kích thước 315bp nằm ở vị trí 57 - 372
[1] Đây là vùng có tần số đột biến cao nhất
trong hệ gen ty thể người [2]
Cũng giống như hệ gen trong nhân, hệ gen
ty thể mang những trình tự đa hình Đa hình là
sự khác biệt về chuỗi DNA giữa những cá thể,
các nhóm, hoặc các quần thể Nó bao gồm đa
hình nucleotid đơn (SNP), các chuỗi lặp, thêm
đoạn, mất đoạn và tái tổ hợp Đa hình gen có
thể là kết quả của quá trình tiến hóa hoặc được tạo nên bởi yếu tố bên ngoài (như virus hoặc chiếu xạ) Người ta cho rằng đa hình giúp ty thể ít nhạy cảm với sự thay đổi năng lượng, do
đó tạo nhiều nhiệt và các gốc tự do, giúp con người thích ứng khi di cư tới nơi có khí hậu lạnh hơn như từ châu Phi sang châu Âu [3] Cho đến nay người ta đã thống kê được 623 kiểu đa hình trên genom ty thể người, trong
đó trên gen HV1 có 49 vị trí nucleotid thay đổi, trên gen HV2 có 105 vị trí nucleotid thay đổi được công bố trong (http://www.mitomap.org) năm 2013 [4 - 7]
Những nghiên cứu gần đây, cho thấy đa hình trên gen HV1 và HV2 có liên quan đến nhiều bệnh, các bệnh ty thể thường gặp như: hội chứng Leigh, bệnh thần kinh Leber, bệnh LHON, hội chứng Kearns - Sayre, hội chứng Pearson, hội chứng NARP các bệnh liên quan đến quá trình chuyển hóa, lão hóa như: Đái
Địa chỉ liên hệ: Trần Vân Khánh, Trung tâm Nghiên
cứu Gen - Protein, Trường Đại học Y Hà Nội
Email: khanhvan7364@gmail.com
Ngày nhận: 02/03/2017
Ngày được chấp nhận: 26/6/2017
Trang 2tháo đường, Alzheimer, Pakinson; các bệnh
liên quan đến ung thư [8 - 12]
Đề tài được thực hiện với mục tiêu: Xác
định trình tự và phân tích tính đa hình nucleotid
đơn vùng gen ty thể HV1, HV2 trên dân tộc
Chăm Việt Nam
II ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
1 Đối tượng
100 mẫu máu ngoại vi (chống đông bằng
EDTA) của người bình thường, khỏe mạnh
thuộc dân tộc Chăm Việt Nam (sống ở tỉnh
Bình Thuận)
2 Phương pháp
DNA tổng số được tách chiết từ các mẫu
máu toàn phần theo phương pháp sử dụng
en-zym protease K và phenol:chloroform:isoamyl
alcohol
Sử dụng cặp mồi đặc hiệu khuếch đại vùng
gen HV1 và HV2:
HV1F: 5’- CTC CAC CAT TAG CAC CCA
AAG C -3’
HV1-R: 5’- CCT GAA GTA GGA ACC AGA
TG -3’
HV2-F: 5’- GGT CTA TCA CCC TAT TAA
CCA C -3’
HV2-R: 5’- CTG TTA AAA GTG CAT ACC GCC A -3’
Thành phần của phản ứng PCR: 1X đệm PCR; 2,5 mM dNTP; 0,2 µl mồi xuôi và ngược; 0,5 unit Taq polymerase; 50ng DNA và H2O, tổng thể tích 20 µl
Chu trình nhiệt của phản ứng PCR: 94oC - 5 phút; 30 chu kỳ [94oC- 30 giây, 54oC - 30 giây,
72oC - 30 giây]; 72oC - 5 phút; bảo quản mẫu
ở 15o C
Giải trình tự gen theo qui trình BigDye termi-nator sequencing (Applied Biosystems, Foster city, USA) Tiến hành trên máy 3100-Avant Ge-netic Analyzer của hãng ABI-PRISM So sánh với trình tự GeneBank để xác định đa hình Kết quả giải trình tự gen được đối chiếu và so sánh với trình tự chuẩn J01415 trên GeneBank (National center for biotechnology information, NCBI) phân tích bằng phần mềm CLC Main Workbench 6.01 để xác định đa hình hai vùng siêu biến HV1 và HV2
3 Đạo đức nghiên cứu
Đối tượng tham gia nghiên cứu hoàn toàn
tự nguyện và có quyền rút khỏi nghiên cứu khi không đồng ý tiếp tục tham gia Các thông tin
cá nhân sẽ được đảm bảo bí mật
III KẾT QUẢ
1 Khuếch đại vùng gen HV1 và HV2
DNA sau khi được tách chiết có chất lượng tốt sẽ được sử dụng để khuếch đại gen HV1 và HV2 bằng các cặp mồi đặc hiệu với điều kiện thành phần phản ứng và chu trình nhiệt như đã mô tả ở phần phương pháp
Hình 1 Sản phẩm khuếch đại vùng gen HV1 của (A) và HV2 (B)
1-22: 22 mẫu nghiên cứu người dân tộc Chăm M: Thang chuẩn 100bp
Trang 3Sản phẩm khuyếch đại vùng gen HV1 và HV2 có chất lượng tốt chỉ gồm một băng đặc hiệu có kích thước 543 bp và 422 bp
2 Kết quả phân tích trình tự vùng gen HV1 và HV2
2.1 Trình tự nucleotid vùng gen ty thể HV1
Hình 2 Các vị trí đa hình nucleotid đơn (SNP) của vùng gen HV1
được đối chiếu với trình tự chuẩn do Anderson và cs công bố năm 1981 [1]
Hình 3 Hình ảnh giải trình tự một số SNP vùng gen ty thể HV1
của mẫu nghiên cứu mã số 12 (MS12)
(SNP: C16278T; C16291A; T16297C)
Trang 42.2 Trình tự nucleotid vùng gen ty thể HV2
Hình 4 Các vị trí đa hình nucleotid đơn (SNP) của vùng gen HV2
được đối chiếu với trình tự chuẩn do Anderson và cs công bố năm 1981 [1]
Hình 5 Hình ảnh giải trình tự một số SNP vùng gen ty thể HV2
của mẫu nghiên cứu mã số 15 (MS15)
(SNP: 249DelA; A263G)
Trang 52.3 Đa hình nuleotid đơn (SNP) vùng gen
ty thể HV1 và HV2
Kết quả giải trình tự gen HV1 và HV2 của
100 mẫu nghiên cứu được tiến hành so sánh
với trình tự chuẩn, cho thấy có khá nhiều vị trí
đa hình so với trình tự chuẩn Mẫu có ít vị trí
đa hình nhất là 7, trong khi mẫu có nhiều vị trí
đa hình nhất là 19 Chúng tôi cũng nhận thấy
rằng, các vị trí đa hình tập trung nhiều hơn ở
gen HV1
Các vị trí đa hình hay gặp ở các mẫu nghiên
cứu là 309insC là 64%, T16189C là 56%, A16183C là 44%, C16223T là 37%, G16129A
là 23%, T16304C là 21%, C16261T là 20%, C150T là 20%, A210G là 20%, đặc biệt là ba
vị trí đa hình A73G, A263G và 315insC gặp ở 100% mẫu nghiên cứu Các đột biến thay thế là phổ biến nhất, các nucleotid thêm vào thường
là C trong khi các nucleotide mất thường là A Các kết quả thu được về các vị trí đa hình trên hai vùng gen HV1 và HV2 phản ánh tốc độ đột biến rất cao của vùng gen này
Bảng 1 Bảng các vị trí đa hình thường gặp trên gen HV1 và HV2
A16183C 44/100 44% 315insC 100/100 100%
IV BÀN LUẬN
Trình tự vùng gen ty thể HV1 và HV2 đã
phân tích được có kích thước tương ứng là
543bp và 422bp theo trình tự chuẩn CRS/
rCRS của gen ty thể Trong thực tế, các tài
liệu khác nhau xác định độ dài vùng gen HV1
và HV2 là rất khác nhau Vùng gen HV1 của
trình tự chuẩn CRS có kích thước 359bp (từ
vị trí 16024 – 16383) và vùng gen HV2 có kích
thước 325bp (từ vị trí 057 – 372) [1] Theo
TWGDAM (Technical Working Groups for DNA
Analysis Methods) cho rằng trình tự tối thiểu
được chấp nhận cho vùng gen HV1 là từ vị trí
16024 – 16365 và cho vùng gen HV2 là từ vị
trí 073 – 340 Trình tự chuẩn Cambridge sau
khi chỉnh sửa (rCRS) cho thấy vùng điều khiển
D-loop nằm từ vị trí 16104 đến 16569 và từ 1
đến 191 và không chỉ rõ vị trí vùng gen ty thể
HV1 và HV2 [4] Như vậy, trong nghiên cứu này chúng tôi đã xác định được trình tự hoàn chỉnh của vùng gen HV1 và HV2
Trình tự của các mẫu nghiên cứu được đối chiếu và so sánh với trình tự chuẩn, kết quả cho thấy có rất nhiều đa hình nucleotid đơn (có từ 7 đến 19 SNP ở mỗi mẫu nghiên cứu) Nghiên cứu năm 1999, trên 50 người Việt Nam
đã phát hiện được 20 đa hình vị trí các enzym cắt trên DNA ty thể, trong đó 3 vị trí của enzym HaeII - 13Viet, MspI - 19Viet, MspI - 20Viet là các đa hình mới [5] Khi giải trình tự 2 vùng gen HV1 và HV2 trên 2 mẫu dân tộc Kinh, 2 mẫu dân tộc Tày và một mẫu dân tộc H’Mông, đã phát hiện 26 vị trí đa hình trên HV1 và 5 vị trí đa hình trên HV2 [6] Sự đa hình trên hai vùng siêu biến HV1 và HV2 hầu hết là các đa hình đơn
Trang 6nucleotid (SNP) Các vị trí đa hình có thể là các
đột biến đồng hoán (transition) - đột biến thay
thế nucleotid có cùng gốc purin (A - G) hoặc
pyrimidin (C - T); hoặc là các đột biến dị hoán
(transversion) - đột biến thay thế nucleotid có
gốc purin thành pyrimidin hoặc ngược lại (A - T,
C - G) Các đa hình hay gặp nhất là sự thay thế
nucleotid, các nucleotid chèn vào thường là C
trong khi các nucleotid bị mất thường là A, [7]
Nghiên cứu của chúng tôi cũng nhận thấy các
đa hình thường gặp là sự thay thế nucleotid C
Dạng dị hợp tử của vùng lặp Cystein
(C-stretch) trong trình tự HV1 và HV2 đã được
nghiên cứu nhiều và tỷ lệ đa hình vùng này
có sự khác biệt có ý nghĩa thống kê giữa các
chủng tộc người khác nhau Vì vậy, đa dạng
di truyền trong vùng C-stretch có ý nghĩa
quan trọng trong giám định hình sự gen và
nghiên cứu di truyền quần thể Năm 2009,
một nghiên cứu về đa dạng di truyền của
vùng C-stretch trên 919 người Trung Quốc,
thuộc 8 chủng tộc khác nhau Kết quả cho
thấy, haplogroup AAAACCCCTCCCCC và
AACCCCCCTCCCCC là các haplogroup đặc
trưng cho quần thể người dân tộc Tibetan và
Salar của Trung quốc và tỷ lệ đa hình T16189C
thuộc vùng lặp nucleotide Cystein của gen
HV1 là 25,14% [13] Tỷ lệ đa hình nuleotid đơn
T16189C trên dân tộc Chăm trong nghiên cứu
của chúng tôi là 56%, cần có thêm nghiên cứu
trên các dân tộc khác để tìm ra các haplogroup
đặc trưng cho từng dân tộc
Nghiên cứu cũng đã thống kê ra một số
vị trí đa hình nucleotid đơn hay gặp trên gen
HV1 và HV2 của DNA ty thể: 309insC là 64%,
T16189C là 56%, A16183C là 44%, C16223T
là 37%, G16129A là 23%, T16304C là 21%,
C16261T là 20%, C150T là 20%, A210G là
20%, đặc biệt là ba vị trí đa hình A73G, A263G
và 315ins (C hoặc CC) gặp ở 100% mẫu
nghiên cứu Kết quả này cũng tương đồng với
kết quả trong nghiên cứu của các tác giả (năm 2008) khi nghiên cứu trên 78 người Việt Nam
đã thống kê được 10 vị trí đa hình hay gặp như T16172C (22/78), A16183C (23/78), T16189C (31/78), C16223T (26/78), T16304 (26/78), C150T (20/78), 249DelA (25/78), A263G (75/78), 315C (24/78), A73G (78/78) trong đó
vị trí A73G cũng gặp ở 100% mẫu nghiên cứu, [7]
Tính đa hình/đột biến của DNA ty thể có thể liên quan đến các loại bệnh khác nhau trong đó
có các bệnh về chuyển hóa, lão hóa như: Đái tháo đường, Alzheimer, Pakinson; các bệnh liên quan đến ung thư [9 - 12],…Vì vậy, các phát hiện về đa hình/đột biến của DNA ty thể
có vai trò rất quan trọng trong việc tìm hiểu về phát sinh bệnh ở người Các số liệu thu được
về trình tự DNA ty thể cùng với các vị trí đa hình DNA ty thể đã phát hiện là những tư liệu cần thiết cho những nghiên cứu tiếp theo về bệnh
lý di truyền liên quan đến DNA ty thể người ở Việt Nam Như vậy, nghiên cứu đã xác định được trình tự hoàn chỉnh vùng gen HV1 và HV2, xác định được các vị trí đa hình trên gen HV1, HV2 Đây là số liệu đầu tiên hoàn chỉnh
về trình tự gen HV1 và HV2 của dân tộc Chăm Việt Nam với số lượng mẫu tương đối lớn
V KẾT LUẬN
Nghiên cứu đã xác định được trình tự hoàn chỉnh vùng gen HV1 và HV2 của 100 mẫu người dân tộc Chăm Việt Nam Tỷ lệ một số SNP hay gặp là: 309insC là 64%, T16189C
là 56%, A16183C là 44%, C16223T là 37%, G16129A là 23%, T16304C là 21%, C16261T
là 20%, C150T là 20%, A210G là 20%, đặc biệt
là ba vị trí đa hình A73G, A263G và 315insC gặp ở 100% mẫu nghiên cứu
Lời cảm ơn
Đề tài được thực hiện với sự hỗ trợ kinh phí của đề tài nhánh cấp nhà nước “Nghiên
Trang 7cứu một số chỉ số sinh học, trình tự gen ty thể
người Việt Nam trưởng thành và đột biến gen
gây bệnh thalassemia” thuộc đề tài nhiệm vụ
Quỹ gen “Đánh giá đặc điểm di truyền người
Việt Nam”
TÀI LIỆU THAM KHẢO
1 Anderson A, Bankier AT, Barrel BG et
al (1981) Sequence and organisation of the
human mitochondrial genome Nature 290,
457 - 465
2 Greenberg, B.D., J.E Newbold, and
A Sugino (1983) Intraspecific nucleotide
sequence variability surrounding the origin of
replication in human mitochondrial DNA Gene
21, 33 - 49.
3 Solano, A., et al., (2001) Genetic
diseases of the mitochondrial DNA in humans
Salud Publica Mex 43, 151 - 61.
4 Andrews RM, Kubacka I, Chinnery PE
et al (1999) Reanalysis and revision of the
Cambridge reference sequence for human
mitochondrial DNA Nature Genetics 23, 147.
5 Ivanova R, A.V.T, at el, (1999)
Mitochondrial DNA polymorphism in the
Vietnamese population European Journal of
Immunogenetics 26, 417 - 422.
6 Huỳnh Thị Thu Huệ, Nguyễn Đăng
Tôn, (2005) Phân tích trình tự vùng điều khiển
(D-LOOP) trên genome ty thể của 5 cá thể
người Việt Nam Tạp chí Công nghệ Sinh học
3, 15 - 22.
7 Nguyễn Đăng Tôn, Nguyễn Thị Tú Linh, Vũ Hải Chi, (2008) Đa hình đơn bội
DNA ty thể của các cá thể người Việt Nam
Tạp chí Công nghệ sinh học 6, 579 - 590
8 Davidzon, et al (2005) Mitochondrial
DNA and disease Annals of Medicine 37, 222
- 232
9 Lowell BB, S.G (2005) Mitochondrial
dysfunction and type 2 diabetes Science 307,
384 - 387
10 Chagnon P, et al (1999) Phylogenetic
analysis of the mitochondrial genome indicates significant differences between patients with Alzheimer disease and controls in a
French-Canadian founder population Am J Med
Genet 85, 20 - 30.
11 Walt JM, et al (2003) Mitochondrial
polymorphisms significantly reduce the risk of
Parkinson disease Am J Hum Genet 72, 804
- 811
12 Claus Desler, M.L.M., 1 Keshav K Singh and Lene Juel Rasmussen (2011)
The Importance of Mitochondrial DNA in Aging
and Cancer Journal of Aging Research 9.
13 Chen F., Dang Y., Yan C et al (2009)
Sequence-length variation of mtDNA HVS-I
C-stretch in Chinese ethenic groups J Zhejiang
Univ Sci B 10, 711 - 720
Summary SEQUENCING ANALYSIS OF mtDNA HYPERVARIABLE 1 AND HYPERVARIABLE 2 OF CHAM ETHIC IN VIETNAM
The objective of this study was to perform the sequencing analysis of mtDNA HV1, HV2 and to identify single nucleotide polymorphisms (SNP) of the HV1 and HV2 on Cham people in Vietnam Sequencing method is used to analyze 100 DNA samples of Cham The results were compared with the rCRS sequence, reported in the Human mitochondrial database, and then classified those sequences into the mitochondrial DNA haplogroups We have performed sequencing analysis of
Trang 8the HV1, HV2 and discovered many SNPs in the sample It was found that the frequencies of SNP A73G and A263G are 100%, 315insC is 100%, 309insC is 64%, T16189C is 56%, A16183C is 44%, C16223T is 37%, G16129A is 23%, T16304C is 21%, C16261T is 20%, C150T is 20%, A210G is 20% In conclusion, we have assessed the single nucleotide polymorphisms of mitochondrial DNA HV1 and HV2 of 100 Cham ethnic samples
Key words: mitochondrial DNA, HV1 gene, HV2 gene, Chăm ethnic.