Nhận thức được tầm quan trọng của việc nghiên cứu đa dạng di truyền - tiến hóa của các dân tộc Việt Nam, chúng tôi thực hiện đề tài “Nghiên cứu đặc điểm đa hình nucleotide đơn ở hai vùng
Trang 1LÊ VĂN TÀU
NGHIÊN CỨU ĐẶC ĐIỂM ĐA HÌNH NUCLEOTIDE ĐƠN Ở HAI VÙNG SIÊU BIẾN HVS-I VÀ HVS-II TRÊN D-LOOP TY THỂ CỦA MỘT SỐ DÂN TỘC
VIỆT NAM
LUẬN VĂN THẠC SĨ SINH HỌC
Bình Định - Năm 2019
Trang 2LÊ VĂN TÀU
NGHIÊN CỨU ĐẶC ĐIỂM ĐA HÌNH NUCLEOTIDE ĐƠN Ở HAI VÙNG SIÊU BIẾN HVS-I VÀ HVS-II TRÊN D-LOOP TY THỂ CỦA MỘT SỐ DÂN TỘC
Người hướng dẫn: HD1: TS Nguyễn Thị Mộng Điệp
HD2: TS Nguyễn Thùy Dương
Trang 3dẫn khoa học của TS Nguyễn Thị Mộng Điệp, TS Nguyễn Thùy Dương Cácnội dung nghiên cứu, kết quả trong đề tài này là trung thực và chưa từng được
ai công bố dưới bất kỳ hình thức nào Luận văn cũng sử dụng thông tin, sốliệu từ các bài báo và nguồn tài liệu của các tác giả khác đều có trích dẫn vàchú thích nguồn gốc đầy đủ Nếu có bất kỳ sự gian lận nào tôi xin hoàn toànchịu trách nhiệm về nội dung luận văn
Học viên
Lê Văn Tàu
Trang 4học Quy Nhơn, TS Nguyễn Thùy Dương và tập thể cán bộ phòng Hệ gen họcngười, Viêṇ Nghiên cứu hê ̣gen, Viện Hàn lâm Khoa Học và Công Nghệ ViệtNam, đã tận tình hướng dẫn, chỉ bảo và tạo mọi điều kiện giúp đỡ tôi trongquá trình thực hiện luận văn.
Xin chân thành và trân trọng cảm ơn Ban giám hiệu, phòng Đào tạoSau đại học, khoa Sinh - KTNN, quý Thầy Cô trường Đại học Quy Nhơn vàquý Thầy Cô đã trực tiếp giảng dạy tôi trong suốt quá trình học tập
Học viên
Lê Văn Tàu
Trang 5MỞ ĐẦU
1 Lý do chọn đề tài
Sau khi bản đồ gen người được công bố trên hai tạp chí Nature (Anh)
và Science (Mỹ) vào tháng 2 năm 2002, các nhà khoa học đã chỉ ra cấu trúc
hệ gen của các cá thể người giống nhau đến 99,9% và chỉ khác nhau một tỉ lệrất nhỏ (khoảng 0,1%) Tuy nhiên phần khác biệt nhỏ này lại có ý nghĩa quyếtđịnh đối với đặc điểm nhân chủng học của một dân tộc, là yếu tố di truyềnliên quan đến sức khỏe của mỗi cá thể Trong 0,1% khác biệt thì có đến 80%
là các đa hình nucleotide đơn Do đó việc nghiên cứu các SNP là vô cùngquan trọng Ngày nay, đa hình nucleotide đơn (SNP) được sử dụng nhiềutrong nghiên cứu Cụ thể, nhiều SNP đang được sử dụng làm công cụ hữu íchtrong các lĩnh vực như y dược học và pháp y, cung cấp nhiều kiến thức quantrọng làm sáng tỏ lịch sử tiến hóa và mối liên quan giữa các dân tộc Mặt kháccác SNP cũng tiến hóa ổn định, không thay đổi nhiều từ thế hệ này sang thế
hệ khác cho phép dễ dàng nghiên cứu chúng
Việt Nam là một quốc gia đa dân tộc với 54 dân tộc anh em thuộc 8 nhómngôn ngữ khác nhau Việc tiến hành các nghiên cứu về nguồn gốc và mối quan
hệ giữa các dân tộc là cần thiết, góp phần giải thích về nguồn gốc và tiến hóa củacác dân tộc Việt Nam, đồng thời cung cấp các dữ liệu cần thiết cho mô hình di
cư của loài người Tuy nhiên, ở Việt Nam hiện nay các nghiên cứu về vấn đề nàychưa nhiều, chủ yếu tập trung vào sự liên quan của các đa hình nucleotide trên tythể với bệnh Nhận thức được tầm quan trọng của việc nghiên cứu đa dạng di
truyền - tiến hóa của các dân tộc Việt Nam, chúng tôi thực hiện đề tài “Nghiên cứu đặc điểm đa hình nucleotide đơn ở hai vùng siêu biến HVS-I và HVS-II trên D-loop ty thể của một số dân tộc Việt Nam”.
Trang 62 Mục tiêu nghiên cứu
và HVS-II trên D-loop ty thể ở các cá thể thuộc 3 dân tộc Kinh, La Hủ, Si La
đến đa hình nucleotide đơn (SNPs) ở hai vùng siêu biến HVS-I và HVS-II trên D-loop ty thể giữa 3 dân tộc Kinh, La Hủ và Si La
3 Ý nghĩa của đề tài
Kinh, La Hủ và Si La
Si La, giúp cung cấp các thông tin cần thiết cho nghiên cứu nhân chủng học tiếnhóa ở Việt Nam
Trang 7Chương 1 TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU 1.1 Hệ gen ty thể
Ty thể là một trong những cơ quan chuyên hóa cao, có mặt trong hầuhết các tế bào nhân chuẩn với vai trò chủ yếu là sản xuất năng lượng tế bàothông qua quá trình phosphoryl oxy hóa (OXPHOS) Ngoài ra ty thể cũng làthành phần quan trọng trong việc truyền tín hiệu canxi, oxy hóa acid béo, điềuhòa chuyển hóa tế bào, tổng hợp hem, tổng hợp steroid và lập trình cho sựchết của tế bào [33]
1.1.1 Đặc điểm cấu trúc và di truyền hệ gen ty thể
Đặc điểm cấu trúc hệ gen ty thể
Hệ gen ty thể là phân tử DNA mạch kép, dạng vòng có kích thước nhỏ(khoảng 16569 bp), không liên kết với protein histon và nằm trong tế bàochất, cùng với đặc tính đa bản sao (mỗi tế bào có thể chứa từ 100 đến 10000bản sao mtDNA) [28] Điều này giúp cho việc tách chiết, thu nhận DNA tythể dễ dàng Hơn nữa DNA ty thể bền theo thời gian trong các mô khó phânhủy như mô xương, răng và tóc Những đặc tính này là điều kiện cần thiết choviệc phân tích các mẫu DNA cổ xưa hay các mẫu DNA đã phân hủy
Phân tử DNA ty thể người gồm có 2 chuỗi: chuỗi nặng (H) rất giàuguanine, chuỗi nhẹ (L) rất giàu cytosine và chứa 37 gen khác nhau (Hình 1.1).Trong 37 gen này thì 28 gen nằm trên chuỗi H và 9 gen nằm trên chuỗi L Có
24 gen mã hóa cho RNA: 22 phân tử tRNA ty thể, rRNA 16-s (tiểu đơn vịribosome lớn) và rRNA 12-s (tiểu đơn vị ribosome nhỏ) [10] 13 gen mã hóacho một số thành phần polypeptide cụ thể của chuỗi hô hấp ty thể:
MTND6 lần lượt mã hóa cho 7 tiểu phần (1, 2, 3, 4L, 4, 5, 6) trong số 44 tiểu phần
của phức hệ I (NADH: ubiquinone oxyoreductase) [18]
Trang 8- MTCYB mã hóa cho 1 tiểu đơn vị trong số 11 tiểu đơn vị của phức
hợp III (ubiquinol: cytochrom coxyoreductase) [30]
polypeptide (cytochrom c oxyase I, II, III) trong số 13 polypeptide của phức hợp IV (cytochrom c oxyase)
synthase F0 tiểu đơn vị 8, 6) trong số 19 tiểu đơn vị của phức hợp V (ATPsynthase)
Hầu hết các gen trên DNA ty thể là liên tục không chứa các đoạnintron, chỉ cách nhau bởi một hoặc hai cặp base không mã hóa Mã di truyềntrên DNA ty thể chỉ sử dụng hai codon kết thúc: 'AGA' và 'AGG', trong khiDNA nhân sử dụng ba codon kết thúc: 'UAA', 'UGA' và 'UAG'
Quá trình sao chép DNA ty thể chịu sự điều khiển của vùng D-loop haycòn gọi là vùng điều khiển trên DNA ty thể Vùng này chứa vị trí bắt đầu saochép DNA ty thể (nguồn gốc của tổng hợp chuỗi nặng, OH) và cũng là vùngchứa cả hai bộ khởi động phiên mã chuỗi H (HSP1 và HSP2)
Hình 1.1 Cấu trúc DNA ty thể
Trang 9Ở người kích thước bộ gen ty thể chỉ bằng 0,0005% kích thước bộ gentrong nhân, nhưng nó có 4 đặc điểm quan trọng trong việc đánh giá mối quan hệ ditruyền tiến hóa giữa các quần thể có mối quan hệ gần gũi:
với DNA nhân, khoảng 2% - 4% trong một triệu năm [13] Tốc độ đột biếnnày có thể là do trong quá trình sao chép mắc nhiều lỗi và ty thể thiếu cơ chế
để sửa chữa các sai hỏng như ở DNA nhân Mặt khác, ty thể là nơi luôn diễn
ra các quá trình oxy hóa sản sinh ra các chất oxy hóa mạnh như các gốc tự do.Các chất này sẽ tác động đến hệ gen của ty thể và phát sinh ra các đột biến
nhưng lại có tỷ lệ đột biến cao gấp 10 lần so với vùng mã hóa Tuy nhiên biến thểtrên vùng này phân bố không đều, mật độ cao nhất của các vị trí đa hình trên vùngđiều khiển được tìm thấy tập trung ở hai vùng siêu biến HVS-I và HVS-II [14]
trong hệ gen ty thể, cả ở vùng mã hóa và không mã hóa
lọc mà chúng được di truyền từ thế hệ này sang thế hệ khác, do đó chúng
trở nên phổ biến
Nhìn chung, tốc độ biến đổi nhanh chóng của các chỉ thị DNA ty thểlàm nó trở nên hoàn toàn phù hợp với các nghiên cứu tiến hóa gần
Đặc điểm di truyền của DNA ty thể
DNA ty thể có đặc tính di truyền theo dòng mẹ [17], không có sự kếthợp vật chất di truyền từ bố Điều này có thể giải thích vì DNA ty thể trongtinh trùng sớm biến mất trong phôi bởi sự phá hủy có chọn lọc, sự bất hoạt,hoặc đơn giản bởi sự áp đảo về số lượng bản sao DNA ty thể của trứng [31],
do đó phân tử DNA ty thể của hợp tử không khác so với phân tử DNA ty thể
Trang 10ban đầu của trứng Chính điều này đã tạo nên tính đa hình đặc trưng theo quầnthể của DNA ty thể, hình thành nên các nhóm đơn bội (haplogroup) của DNA
ty thể
1.1.2 Cấu trúc vùng điều khiển D-loop
Trình tự hoàn chỉnh vùng D-loop của nhiều dân tộc thuộc các châu lụctrên thế giới đã được công bố trong ngân hàng dữ liệu gen quốc tế(EMBL/Genbank/DDBJ) Cho đến nay đã có vài nghìn trình tự vùng D-loopđược công bố, trong đó có 349 trình tự hoàn chỉnh của hệ gen ty thể ngườithuộc các chủng tộc khác nhau được nghiên cứu và đăng ký [39] Số lượngcác trình tự D-loop cũng như toàn bộ hệ gen ty thể của các cá thể người thuộccác dân tộc khác nhau trên thế giới được giải mã vẫn tăng lên không ngừng
Vùng điều khiển D-loop có kích thước 1121 bp, nằm từ vị trí 16569/0 - 576 và nằm giữa hai gen tRNA vận chuyển cho Phenyanalin vàProlin, chiếm khoảng 7% tổng lượng DNA ty thể Vùng này chứa các trình tựkhởi đầu cho quá trình tái bản DNA ty thể và chứa các đoạn điều khiển choquá trình phiên mã của các gen chức năng trong vùng được mã hóa [16]
16024-Năm 1981, Anderson và cộng sự đã xác định được hai đoạn DNA trongvùng D-loop được gọi là vùng siêu biến 1 (HVS-I Hypervariable Segment 1)
có kích thước 359 bp, nằm ở vị trí 16024 - 16383 trên DNA ty thể và vùngsiêu biến 2 (HVS-II Hypervariable Segment 2) có kích thước 315 bp, nằm ở
vị trí 57 - 372 [13] Trên hai vùng siêu biến có các đoạn lặp lại nucleotidecytosine, thường được gọi là đoạn poly C Ở trình tự chuẩn rCRS (trình tựDNA ty thể hoàn chỉnh của người đầu tiên được Anderson và cộng sự công
bố năm 1981) [36], tại vị trí 16189 là nucleotide thymin do đó đoạn poly Ccủa gen HVS-I được ngắt quãng, tuy nhiên rất nhiều trình tự DNA ty thể cóđột biến T16189C tạo thành chuỗi có 10 nucleotide cystosin liên tiếp, đột biếnnày được xem là đột biến có tốc độ cao nhất trong hệ gen ty thể người [38]
Trang 11Các nghiên cứu cho thấy, trong tế bào có nhiều loại DNA ty thể có chiều dàiđoạn poly C khác nhau Tỷ lệ phần trăm các phân tử DNA ty thể có độ dàiđoạn poly C khác nhau là ổn định ở mỗi cá thể Các đoạn poly C này được ditruyền theo dòng mẹ và được tạo mới trong quá trình phát triển.
Hình1.2 Cấu trúc vùng điều khiển (D-loop) DNA ty thể.
CSB domain (Conserved Sequences Block domain): vùng các khối trình tự bảo thủ liên quan đến quá trình khởi đầu sao chép và phiên mã; Central conserved domain: Vùng trung tâm; ETAS domain (Extended Termination-associated Sequences
domain): vùng trình tự liên quan đến kết thúc sao chép.
Có rất nhiều loại đột biến trong vùng điều khiển của DNA ty thể: độtbiến thay thế, mất đoạn, thêm đoạn nhưng hay gặp nhất là loại đột biến thaythế nucleotide Tốc độ đột biến của DNA ty thể cao nhất ở vùng D-loop, đặcbiệt là ở vùng siêu biến, tốc độ này phụ thuộc vào vị trí các nucleotide khácnhau [19] Đây là vùng được xem là có nhiều đột biến nhất với tần số đột biếncao hơn các vùng khác của hệ gen ty thể khoảng từ 1,8 đến 4,4 lần [21] Mộtvài vị trí nucleotide trong vùng điều khiển bị đột biến thường xuyên hơn các
vị trí khác được gọi là vùng đột biến phổ biến (mutational hotspots) Việcnghiên cứu hệ gen ty thể, giải mã trình tự nucleotide vùng điều khiển D-loopcũng như các gen khác của DNA ty thể, dẫn đến việc giải mã toàn bộ hệ gen
ty thể của nhiều đại diện dân tộc người khác nhau trên thế giới, cùng với các
Trang 12nghiên cứu về đặc điểm, tính đa hình thái của hai vùng siêu biến sẽ cung cấp sốliệu cần thiết cho các nghiên cứu về di truyền tiến hóa và các lĩnh vực khác.
1.1.3 Tình hình nghiên cứu hệ gen ty thể trên thế giới
Hiện nay, các nghiên cứu trên DNA ty thể, đặc biệt trên hai vùng siêubiến HVS-I, HVS-II nhằm xác định đa hình nucleotide đơn (SNP) và tìm hiểu
về sự đa dạng di truyền - tiến hóa của các dân tộc được nhiều nước quan tâm
Có thể kể đến một số công trình đáng chú ý, bao gồm:
và các tác giả công bố năm 1981 Đến năm 1999, Adrews và các tác giả đãchỉnh sửa lại trình tự này và hiện nay được gọi là “trình tự chuẩn Cabridge đãchỉnh sửa - rCRS” [10]
109 người Amerind thuộc 3 bộ lạc khác nhau và đã phân tích lại dữ liệu được công
bố trên 482 cá thể từ 18 bộ lạc khác Nghiên cứu này xác nhận sự tồn tại của 4dòng haplotype chính Ngoài ra cũng tìm thấy bằng chứng ủng hộ sự tồn tại củamột số haplotypes khác ngoài bốn dòng được báo cáo [11]
DNA ty thể từ 200 người da trắng ở Đức, xác định được xác suất của hai cáthể được chọn ngẫu nhiên từ một quần thể có mtDNA giống hệt nhau là 0,6%.Trong nghiên cứu này các đa hình thay thế nucleotide chiếm phần lớn(khoảng 90%), các đa hình thêm nucleotide chỉ chiếm (6%) và đa hình mấtnucleotide chỉ chiếm (4%) [23]
vùng điều khiển (D-loop) từ nhiều dòng vô tính của mỗi DNA ty thể, kết quả đãxác định 30/80 mẫu được phân tích cho thấy sự chuyển đổi T-to-C ở vị trí 16189(T16189C) của vùng C-stretch trong vùng siêu biến HVS-I của
mtDNA Có 7 cặp có sự chuyển đổi này khi được chọn ngẫu nhiên từ 15 cặp
Trang 13(mẹ - con) Các phân tích thống kê về số lượng lặp lại nucleotide cytosine chothấy không có sự khác biệt đáng kể giữa mẹ và con trong mỗi dòng nhưng có
sự khác biệt giữa các dòng [27] Cùng năm Zhonghua và cộng sự sử dụngphương pháp đa hình chiều dài đoạn cắt giới hạn (RFLP) phân tích với 6enzyme cắt giới hạn trên 10 vị trí tạo ra 14 đoạn giới hạn Tần số thay thếnucleotide trung bình được tính toán (dựa trên công thức Nei) trên mỗi vị trítrên vùng điều khiển mtDNA của người Hán ở Trung Quốc là 0,029 Nghiêncứu này đã xác định được tần số thay thế nucleotide trung bình trên mỗi vị trítrong vùng điều hòa cao gấp 10 lần so với mtDNA [38]
vùng điều khiển DNA ty thể người từ sáu nhóm dân tộc ở Thái Lan, gồm các
bộ lạc: Hill (Lisu và Mussur), Phuthai, Lao Song, Chong và thổ dân Sakai.Trình tự vùng điều khiển của các dân tộc trong nghiên cứu được so sánh vớitrình tự những người dân bản địa Thái Lan từ hai tỉnh Chiang Mai và KhonKaen Dựa trên sự so sánh các trình tự 563 bp ở 215 cá thể Thái Lan, đã có
137 loại trình tự khác nhau được tìm thấy Trong số đó, có 124 trình tự là duynhất trong mỗi dân tộc, 13 trình tự có sự chia sẻ từ hai đến năm dân tộc khác.Việc xóa COII / tRNALys 9 bp xen kẽ đã được tìm thấy ở các dân tộc TháiLan được kiểm tra (ngoại trừ Sakai) với tần số khác nhau từ 18% đến 40%
Từ các biến thể trình tự vùng điều hòa và phân tích phát sinh gen cho thấyrằng, việc xóa 9 bp đã xảy ra trong một tổ tiên rất cổ xưa của người ĐôngNam Á Khoảng cách di truyền dựa trên sự đa dạng nucleotide giữa các quầnthể cho thấy Sakai có mối liên hệ xa với các dân tộc khác ở Thái Lan LaoSong và Chong có quan hệ mật thiết với nhau, mối quan hệ di truyền gần gũicũng được thấy giữa các bộ lạc Hill, Phuthai và Đông Bắc Thái Lan (KhonKaen), cho thấy rằng họ có tổ tiên chung [16]
Trang 14- Năm 2003, V Troesch và cộng sự phân tích trình tự hai vùng siêubiến (HVS- I và HVS-II) của DNA ty thể từ 100 cá thể sống ở miền Đôngnước Pháp, kết quả có 91 kiểu haplotypes khác nhau đã được phát hiện Trênhai vùng siêu biến có 72 vị trí đa hình trong đoạn HVS-I và 49 ở HVS-II.Phân tích dữ liệu cho thấy tính đa hình của hai vùng siêu biến là do đột biếnđồng hoán “transition” (đột biến thay thế nucleotid có cùng gốc purin A - Ghoặc pyrimidin C - T) chiếm 75,5%, không phải do đột biến dị hoán
“transversion” (đột biến thay thế nucleotid có gốc purin thành pyrimidin hoặcngược lại A - T, C - G) chỉ chiếm 1,5% Sự đa dạng di truyền được tìm thấy là0,9836 [34]
1.1.4 Tình hình nghiên cứu hệ gen ty thể ở Việt Nam
Nghiên cứu đầu tiên về DNA ty thể của người Việt Nam do Ballinger
SW và cộng sự thực hiện năm 1992, sử dụng phương pháp PCR - RFLP nhằmđánh giá di truyền quần thể của người Châu Á, tuy nhiên số lượng mẫu nhỏ vàkhông rõ nguồn gốc nên kết quả thu được còn hạn chế [12] Năm 1999,Ivanova cùng cộng sự nghiên cứu về sự đa hình DNA ty thể của 50 ngườiKinh sống tại Hà Nội, đã đưa ra kết luận người Kinh có nguồn gốc kép từngười Trung Quốc và các nhóm quần thể người Thái - Indonesia [20]
Trong những năm gần đây các nghiên cứu trên DNA ty thể ở nước tađược tiến hành chủ yếu theo hai hướng:
Năm 2003, Đái Duy Ban và cộng sự nghiên cứu chỉ thị phân tử vùngD- loop trên một số bệnh nhân ung thư vú Kết quả phân tích đã cho thấy cóđột biến điểm và đột biến mất đoạn 280 bp trong vùng D-loop của bệnh nhânung thư vú người Việt Nam [2]
Trang 15Năm 2008, nhóm nghiên cứu của Nguyễn Hữu Nghĩa sử dụng phươngpháp giải trình tự tách dòng đã xác định được 14 vị trí đột biến trên vùng D-loop ở một người lao động thường xuyên tiếp xúc với bức xạ ion hóa [4].
Năm 2012, Trương Thị Huệ và cộng sự đã sử dụng kỹ thuật PCR-RFLP
và xác định trình tự nucleotide, đã thiết lập được cách thức phát hiện 15 loạiđột biến điểm trong hệ gen ty thể có liên quan đến các bệnh ở người Việt Nambao gồm: các đột biến T3271C và T3291C (hội chứng MELAS); A8344G vàT8356C (hội chứng MERRF); G11778A, G3460A và T14484C (hội chứngLHON); T8993G/C và T9176G (hội chứng Leigh); A1555G (hội chứng điếc)
và các đột biến G4298A, T10010C, T14727C, T14728C và T14709C (hộichứng cơ não nói chung) [5]
Năm 2014, Hoàng Hiếu Ngọc và cộng sự đã sử dụng phương pháp giảitrình tự trực tiếp DNA ty thể tách chiết từ máu bệnh nhân bị bệnh LEBER, và
đã xác định thấy 9/12 ca có đột biến DNA ty thể [6]
đến đa hình nucleotide đơn ở các dân tộc Việt Nam:
Phan Văn Chi và cộng sự (2006) khi nghiên cứu giải mã hệ gen ty thểcác dân tộc Việt Nam đã tìm thấy một số biến đổi của DNA ty thể ở ngườiViệt Nam thuộc vùng điều khiển D-loop [3]
Năm 2008, Nguyễn Đăng Tôn và các tác giả khác đã sử dụng phươngpháp giải trình tự Sanger để nghiên cứu đa hình kiểu đơn bội DNA ty thể của
78 cá thể người Việt Nam thuộc ba dân tộc Kinh, Tày, Mường Nhóm tác giả
đã xác định được 1043 điểm đa hình, tương ứng với sự thay đổi nucleotid ở
176 vị trí [8]
Năm 2018, Nguyễn Thy Ngọc và cộng sự sử dụng kỹ thuật PCR và đọctrình tự trực tiếp từ sản phẩm PCR tinh sạch Sau đó so sánh trình tự DNA thuđược với trình tự hệ gen ty thể tham chiếu rCRS công bố trên Genbank
Trang 16(NC_012920.1), kết quả đã phát hiện 96 điểm đa hình ở nhóm người Kinh và
36 điểm đa hình nhóm người Mảng Trong số các điểm đa hình này, 16 điểm
có tần suất thu được khác nhau có ý nghĩa thống kê giữa 2 nhóm (p<0,05).Ngoài ra, 8/16 đa hình (T146C, T199C, A16182C, T16217C, T16297C,T16140C, A16183C và T16189C) xuất hiện khá phổ biến ở nhóm người Kinhnhưng ít hoặc không xuất hiện ở nhóm người Mảng và bốn đa hình C151T,A16162G, A16269G và T16271C xuất hiện phổ biến ở người Mảng nhưng ítxuất hiện ở người Kinh Kết quả nghiên cứu này cho thấy mặc dù cùng thuộcnhóm ngữ hệ Nam Á, hệ gen ty thể giữa 2 dân tộc trong cộng đồng các dântộc Việt Nam vẫn tồn tại những khác biệt đáng chú ý [7]
1.2 Tổng quan về đa hình nucleotide đơn (SNPs)
Đa hình nucleotide đơn hay SNP (đọc là snip) được viết tắt từ “SingleNucleotide Polymorphisms” Chúng chính là những biến thể trình tự DNAxảy ra khi một đơn nucleotide (A, T, C, hoặc G) trong trình tự bộ gen bị thayđổi so với các cá thể khác trong cùng một loài sinh học hoặc so với nhiễm sắcthể còn lại trong cặp nhiễm sắc thể tương đồng Ví dụ một SNP có thể thay
nhiên để được coi là một SNP, chúng phải xảy ra trong ít nhất 1% dân số Nếutần số xảy ra bé hơn 1% thì biến thể chỉ được coi là một đột biến điểm Vềmặt nguyên lý, việc phát sinh SNP và đột biến điểm là giống nhau, điểm khácbiệt giữa chúng chỉ nằm ở tần suất xảy ra trong quần thể
Hình 1.3 Đa hình T146C trên đoạn HVS-II
Trang 17Ở người, trung bình SNP xảy ra một lần trong mỗi 300 nucleotide, như vậy cónghĩa là có khoảng 10 triệu SNP trong hệ gen của con người Đến nay các nhàkhoa học đã thiết lập nhận diện được 1.4 triệu SNP và hai phần ba trong sốchúng là sự thay thế từ cytosine (C) sang thymine (T).
1.2.1 Các dạng đa hình nucleotide đơn (SNP)
Dựa vào vị trí trong hệ gen, các SNP được chia ra làm 3 loại: Các SNPnằm trong trình tự mã hóa (coding region), trình tự không mã hóa của 1 gen(non-coding region) hoặc ở vùng giữa các gen (intergenic region)
Nhờ vào tính chất thoái hóa của mã di truyền, các SNP trong một trình tự
mã hóa không nhất thiết sẽ làm thay đổi trình tự các amino acid trong proteinđược tạo ra Chúng bao gồm đa hình đồng nghĩa (SNPs synonymous) và đa hìnhthay thế (SNPs nonsynonymous) Một đa hình được coi là đồng nghĩa nếu cácalen sản xuất ra cùng 1 trình tự chuỗi polypeptide (đôi khi chúng còn được gọi làđột biến câm) Còn nếu chuỗi polypeptide được tạo ra có sự thay đổi thì chúng sẽđược gọi là đa hình thay thế Sản phẩm của loại đa hình này có thể có nghĩa haysai nghĩa (missense) hoặc vô nghĩa (nonsense) Các SNP sai nghĩa dẫn đến việcthay thế 1 amino acid này thành 1 amino acid khác trong chuỗi protein Còn SNP
vô nghĩa, thay vì thế một amino acid này bằng amino acid khác, sự biến đổi trình
tự DNA dẫn đến hình thành codon kết thúc Codon kết thúc báo hiệu tế bàongưng tổng hợp protein dẫn tới hình thành protein có chức năng không hoànchỉnh hoặc không có chức năng, thường ảnh hưởng có hại đến cơ thể Thực tếcho thấy có tới hơn một nửa trong số những đột biến bệnh hiện nay được xácđịnh có nguồn gốc từ các đa hình loại này [32] Các SNP không nằm trong vùng
mã hóa protein có thể gây ảnh hưởng đến quá trình ghép nối các gen, tác độngđến các yếu tố phiên mã, làm suy thoái RNA thông tin, hoặc trình tự của RNAkhông mã hóa Biểu hiện
Trang 18gen bị ảnh hưởng bởi loại hình SNP này được gọi là eSNP (sự biểu hiện SNP)
và dẫn đến tăng hoặc giảm biểu hiện gen
Hình 1.4 Các dạng SNP
Ngoài ra, dựa vào mức độ ảnh hưởng đến chức năng cơ thể, SNP cònđược chia làm 3 dạng: vô hại (không gây bệnh), có hại (gây các bệnh như tiểuđường, ung thư, bệnh tim, bệnh Huntington và chứng Haemophilia) và tiềmtàng (các biến thể xảy ra trong vùng mã hóa và các vùng điều khiển khônggây hại trong điều kiện bình thường nhưng khi đáp ứng một số điều kiện cụthể thì chúng làm tăng khả năng phát triển thành bệnh, ví dụ như tính mẫncảm của ung thư phổi) [24]
1.2.2 Tính chất của SNP
Thông thường, SNP có tính chất “diallelic” trong quần thể và tần sốalen của nó có thể được ước đoán dễ dàng trong bất cứ quần thể nào, thôngqua một loạt xét nghiệm kỹ thuật
Tần số SNP được xem xét ở 2 cấp độ: trong 1 hệ gen và trong 1 quầnthể Trong một hệ gen, tần số SNP không đồng nhất, phụ thuộc vào sự phân
bố của chúng và các yếu tố khác như tái tổ hợp di truyền và tỷ lệ đột biến
hiện diện của các AT microsatellite, cụ thể các đoạn lặp (AT) dài có xu hướng
Trang 19được tìm thấy trong các khu vực mà mật độ SNP giảm đáng kể và nồng độ(GC) thấp [25] Còn trong một quần thể, tần số SNP được chỉ định là tần sốalen thấp nhất tại một locus được tìm thấy tại một thời điểm trong một quầnthể nhất định Khi xét ở mức độ quần thể, do có những khác biệt di truyềngiữa các quần thể người, SNP có thể phổ biến (tần số cao) trong một nhóm địa
lý hoặc quần thể này nhưng có thể trở nên hiếm hơn trong một quần thể khác(tần số thấp)
1.2.3 Ứng dụng và tầm quan trọng của đa hình đơn nucleotide
Là kiểu đa hình cực kỳ phổ biến, chiếm đến 80% sự biến đổi trong hệgen, các SNP cũng tiến hóa ổn định, không thay đổi nhiều từ thế hệ này sangthế hệ khác cho phép dễ dàng nghiên cứu chúng Do vậy SNP rất có giá trịtrong các nghiên cứu về sinh học phân tử và y sinh học
Bản đồ SNP
Các nhà khoa học tin rằng việc thiết lập một bản đồ SNP sẽ đem lạiphần thưởng tiềm năng rất lớn, giúp họ xác định được nhiều gen liên quan đếncác bệnh phức tạp như ung thư, tiểu đường hay một số dạng bệnh tâm thần.Chính vì vậy hai nhóm nghiên cứu gồm Human Genome Project (HGP) vàmột nhóm lớn các công ty dược phẩm gọi là SNP Consortium - dự án TSC đãtập trung vào tìm kiếm, xác định và thiết lập một bản đồ SNP vào tháng 10năm 2000, thành quả của cả 2 nhóm đã được công bố rộng rãi trên thế giới
Sự xuất hiện của bản đồ SNP đã cung cấp một công cụ chưa từng có,cho phép nghiên cứu đặc tính của các biến thể trình tự DNA trên hệ genngười Những dữ liệu này được sử dụng để mô tả phổ gen, cung cấp nguyênliệu cho các nghiên cứu đa dạng di truyền quần thể người
Trang 20Ngoài ra bằng cách sử dụng bản đồ SNP mô tả sự đa dạng haplotypetrên hệ gen, các nhà khoa học sẽ có được những hiểu biết về lịch sử tiến hóacủa con người Phần lớn cấu trúc haplotype vẫn chưa được khám phá, và bản
đồ này cho phép xác định quy mô, sự biến đổi của các haplotype giống nhau,
số lượng và tần số của haplotype phổ biến, sự phân bố giữa chúng và cácnhóm dân tộc hiện có
Hình 1.3 Cách thiết lập bản đồ SNP (1) Giải mã bộ gen trên số lượng lớn người; (2) So sánh bộ gen giữa các cá thể
để tìm kiếm SNP; (3) Xây dựng 1 bản đồ chứa các SNP đã tìm thấy
Trang 21thể trong một vài gen Gen APOE chứa đến hai SNP trong ba alen của nó: E2,
E3, E4 Mỗi allele khác nhau bởi một base DNA, và các sản phẩm protein củamỗi gen sẽ khác bởi một amino axit Nghiên cứu cho thấy rằng một ngườiđược thừa hưởng ít nhất một E4 allele sẽ có một khả năng lớn để phát triểnbệnh Alzheimer Rõ ràng, sự thay đổi của một amino acid trong các proteinE4 làm thay đổi cấu trúc và chức năng của protein và tạo điều kiện cho sựphát triển của bệnh Còn nếu một người kế thừa allele E2 thì có ít khả năngphát triển bệnh Alzheimer Tất nhiên, SNP không phải là chỉ số tuyệt đối của
sự phát triển của bệnh Cụ thể, đối với bệnh Alzheimer nếu một người đượcthừa hưởng hai alen E4 sẽ không bao giờ có thể phát triển bệnh, trong khi mộtngười đã được thừa hưởng hai alen E2 thì có thể phát triển bệnh
Trong chuẩn đoán bệnh, các SNP còn được sử dụng như các markerphân tử để xác định chính xác một căn bệnh trên bản đồ hệ gen của conngười, bởi chúng thường nằm gần một gen được tìm thấy có liên quan đếnmột căn bệnh nào đó Đôi khi, một SNP thực sự có thể gây ra một căn bệnh,
và do đó, cũng có thể được sử dụng để tìm kiếm và cô lập các gen gây bệnh
Cụ thể, để tiến hành nghiên cứu liên hệ giữa SNP và một căn bệnh, các nhàkhoa học sẽ thu thập mẫu máu từ một nhóm các bệnh nhân và phân tích DNAcủa họ để cho ra các mẫu SNP Tiếp theo, các nhà nghiên cứu tiếp tục phântích DNA từ một nhóm các cá nhân không bị ảnh hưởng bởi căn bệnh này vàtiến hành so sánh các mẫu thu được Nhờ các so sánh này các nhà khoa học cóthể phát hiện sự khác biệt giữa các mô hình SNP của hai nhóm, thông qua đóxác định sự liên quan của SNP với gen gây bệnh Và cuối cùng, hồ sơ SNPđặc trưng của nhiều loại bệnh khác nhau sẽ được thành lập Sau đó, chỉ là vấn
đề thời gian, các bác sĩ có thể xác định một người có thể nhạy cảm với mộtcăn bệnh nào đó chỉ bằng cách phân tích các mẫu DNA của họ dựa trên một
mô hình cụ thể SNP
Trang 22Ngoài ra các đa hình DNA như SNP cũng rất hữu ích trong việc giúpcác nhà nghiên cứu xác định và hiểu lý do tại sao các cá nhân khác nhau trongkhả năng của mình có thể hấp thụ các loại thuốc nhất định, cũng như xác định
lý do tại sao một cá nhân có thể chịu một tác dụng phụ bất lợi cho một loạithuốc cụ thể Vì vậy, các nghiên cứu về SNP hứa hẹn sẽ mang đến một cuộccách mạng lớn trong quá trình phát hiện, phòng ngừa và chữa bệnh
để điều trị các bệnh mới Tuy nhiên cho đến hiện tại, việc xác định một bệnhnhân sẽ đáp ứng với một loại thuốc cụ thể hay không vẫn là một vấn đề nangiải Cụ thể một loại thuốc được chứng minh có hiệu quả trong các bệnh nhân
“thông thường” nhưng lại không hiệu quả ở một số người khác hoặc tệ hơnnữa nó có thể đem lại các tác dụng phụ không tốt Do đó các công ty dượcphẩm mới chỉ phát triển các sản phẩm đáp ứng các bệnh nhân "thông thường"
và loại thuốc dành cho số ít bệnh nhân “bất thường” vẫn chưa được sản xuất
Như đã đề cập ở trên, các đa hình SNP rất hữu ích cho việc nghiên cứu
sự hấp thu và thanh thải cũng như tác dụng phụ của thuốc Do đó các nhàkhoa học rất kì vọng, bằng cách phân tích hồ sơ SNP sẽ tạo ra các loại thuốcthích hợp cho từng cá nhân và phù hợp với cấu trúc di truyền của riêng từngngười Nhờ vậy sẽ cho phép các công ty dược phẩm cung ứng nhiều loạithuốc hơn cho thị trường và giúp các bác sĩ kê toa điều trị một cách hiệu quả.Các nhà khoa học dự kiến chỉ tính riêng ở Hoa Kỳ, "thuốc cá nhân hoá” sẽ có
Trang 23khả năng làm giảm khoảng 100.000 trường hợp tử vong và 2 triệu ca nhậpviện do phản ứng phụ với thuốc xảy ra mỗi năm.
1.3 Đặc điểm dân tộc học của người Kinh, La Hủ, Si La
1.3.1 Dân tộc Kinh
Người Kinh hay người Việt là một dân tộc hình thành tại khu vực địa lý
mà ngày nay là miền Bắc Việt Nam và miền nam Trung Quốc Đây là dân tộcchính, chiếm khoảng 86,2% dân số Việt Nam và được gọi chính thức là dântộc Kinh để phân biệt với những dân tộc thiểu số tại Việt Nam Ngôn ngữchính sử dụng là tiếng Việt theo nhóm Việt - Mường Người Kinh sinh sốngtrên khắp toàn thể nước Việt Nam và một số nước khác nhưng đông nhất vẫn
đô thị và các khu công nghiệp đang ngày càng phát triển trong tiến trình côngnghiệp hoá và hiện đại hoá đất nước
Ðại bộ phận người Việt sinh sống thành từng làng, nhiều làng họp lạithành một xã Trong làng thường có nhiều xóm, có xóm lớn tương đương vớithôn, thôn được dùng ở miền Bắc và Trung còn miền Nam gọi là ấp TrướcCách mạng tháng Tám, mỗi làng có một tổ chức hành chính tự quản riêng kháchặt chẽ Những làng thủ công còn có tổ chức phường hội của những ngườicùng nghề nghiệp Ðặc biệt, trong làng, sự phân chia dân nội tịch và dân
Trang 24ngoại tịch (ngụ cư) được quy định rõ trong Hương khoán ước của làng Lệlàng được quy định một cách tương đối toàn diện và chặt chẽ về các mặt hoạtđộng của làng buộc mọi người thừa nhận và tự giác thực hiện.
Gia đình của người Việt hầu hết là những gia đình nhỏ gồm 2 thế hệtheo chế độ phụ quyền nhưng phụ nữ vẫn giữ vai trò quan trọng, thường làngười quản lý kinh tế trong gia đình
Người Việt có rất nhiều dòng họ, có những họ rất phổ biến nhưNguyễn, Trần, Lê, Phạm, Vũ hầu như địa phương nào cũng có Mỗi tộc họ,thường có nhà thờ tổ riêng, họ lại chia ra làm nhiều chi phái và mỗi chi pháilại bao gồm nhiều nhánh Mỗi nhánh lại bao gồm các anh em cùng bố mẹ, ông
bà Quan hệ họ nội được truyền giữ bền chắc qua nhiều đời
Thờ cúng tổ tiên là tín ngưỡng quan trọng nhất của người Việt Bàn thờđược đặt ở nơi trang trọng nhất trong nhà: được cúng lễ vào các ngày giỗ, tết
và các dịp tuần tiết trong năm Tục thờ thổ công, táo quân, ông địa phổ biến ởcác nơi Rất nhiều gia đình thờ Thành hoàng, chùa thờ Phật, nơi thờ ÐứcKhổng Tử hay đền thờ phúc thần Một bộ phận cư dân ở nông thôn haythành thị còn theo đạo Thiên Chúa, Tin Lành và và các tôn giáo khác như CaoĐài, Hoà Hảo
1.3.2 Dân tộc La Hủ
Người La Hủ sinh sống tại Trung Quốc, Việt Nam, Thái Lan, Myanma
và Lào; còn có các tên gọi khác như Xá Lá Vàng, Cò Xung, Khù Sung, KhảQuy…
Theo Tổng điều tra dân số và nhà ở năm 2009, người La Hủ ở ViệtNam có dân số 9.651 người, cư trú tại 16 trên tổng số 63 tỉnh, thành phố Đại
đa số người La Hủ cư trú tập trung tại tỉnh Lai Châu (9.600 người, chiếm99,47% tổng số người La Hủ tại Việt Nam), ngoài ra còn có ở Thái Nguyên(20 người), các tỉnh còn lại có không nhiều hơn 10 người [1] Tiếng nói của
Trang 25người La Hủ thuộc nhóm ngôn ngữ Tạng - Miến (ngữ hệ Hán - Tạng), gần vớiMiến hơn.
Trước kia, người La Hủ làm nương du canh, chủ yếu trồng ngô; về sau
họ đã dần dần làm ruộng nước, lúa là cây lương thực chính Hái lượm, sănbắn và bắt cá có vai trò quan trọng trong đời sống Nghề đan lát khá pháttriển, các sản phẩm như mâm, ghế mây, chiếu mây, không chỉ dùng tronggia đình, mà còn được làm cho mục đích trao đổi với người Thái, người HàNhì để lấy vải, muối, nông cụ Phụ nữ La Hủ mặc quần và áo Thường ngày
họ mặc áo dài, cài khuy bên nách phải, khi lễ tết hay đi chơi xa, mặc thêmchiếc áo ngắn ra ngoài Loại áo này cài khuy đằng trước, không có ống tay,vạt trước được trang trí nhiều đồng xu bạc
Từ chỗ khoảng 200 chòm xóm nhỏ rải rác, mỗi xóm chỉ 3 - 4 gia đình,trong quá trình thực hiện "định canh định cư" đã xuất hiện nhiều bản La Hủtương đối đông người Xưa kia nhà của người La Hủ rất đơn sơ, thậm chí lợp
lá chuối, khi lá chuối ngả vàng thì họ bỏ đi nơi khác (nên họ còn được gọi là
"Xá lá vàng") Ngày nay nhà cửa của họ khá ổn định, đa số là nhà trệt, đadạng về cả kiểu dáng nhà và hình thức bố trí trong nhà
Hiện nay người La Hủ có những họ phổ biến như: Ly, Pờ, Vàng,Phùng, Giàng… Bên cạnh những tên gọi dòng họ ảnh hưởng từ các dân tộckhác này, người La Hủ còn có các tên gọi dòng họ theo ngôn ngữ của mình vàhầu hết mang tên loài thú hoặc chim, như: họ Ly là La lò (hổ) hay Phạ la thó
lò (sóc nâu), họ Pờ là Pò ngá lò (một loại chim), họ Vàng là Pa thô ngác lò(chim gõ kiến)…Trong thờ cúng tổ tiên, tập quán của các nhóm La Hủ khônghoàn toàn giống nhau, nhưng thường họ chỉ khấn gọi bố mẹ đã quá cố Trong
xã hội phụ hệ của La Hủ, tuy con gái không được thừa kế tài sản, nhưng phụ
nữ khá bình đẳng với nam giới trong đời sống gia đình và việc trai gái tự dotìm hiểu nhau trước khi cưới được tôn trọng
Trang 26Xuất phát từ tín ngưỡng về hồn, các gia đình thường tổ chức lễ gọi hồncho người ốm, cho lợn bị bệnh hoặc chậm lớn, gọi hồn lúa, hồn ngô khi gieotrồng xong, lúc thu hoạch Hằng năm, sau vụ trồng ngô, dân bản cùng nhau
tổ chức lễ cúng thần đất để cầu an, cầu mùa màng bội thu Những gia đìnhlàm nghề rèn còn có lễ cúng tổ sư, tổ chức trong tháng 10 hằng năm Khoảngtháng 11 dương lịch, sau khi thu hoạch xong ngô và lúa, là thời gian ăn Tếtcủa các bản La Hủ, sớm muộn khác nhau tuỳ theo từng bản
1.3.3 Dân tộc Si La
Theo Tổng điều tra dân số và nhà ở năm 2009, người Si La ở Việt Nam
có dân số 709 người, có mặt tại 17 trên tổng số 63 tỉnh, thành phố Người Si
La cư trú tập trung tại các tỉnh: Lai Châu (530 người, chiếm 74,75% tổng sốngười Si La tại Việt Nam), Điện Biên (148 người, chiếm 20,87% tổng sốngười Si La tại Việt Nam), các tỉnh khác mỗi tỉnh có không quá 10 người [1]
Người Si La nói tiếng Si La, là một ngôn ngữ thuộc ngôn ngữ Tạng Miến trong ngữ hệ Hán - Tạng Tiếng Si La có quan hệ gần gũi với tiếng HàNhì
-Người Si La có nhiều dòng họ Quan hệ họ hàng rất khắng khít Trưởngtộc của một chi họ là người đàn ông cao tuổi nhất Người này giữ vai trò lãnhđạo, có trách nhiệm tổ chức các sinh hoạt chung cho họ mình
Người Si La sống bằng nghề trồng lúa, làm nương ngô Họ vỡ đất ởsườn núi và bìa rừng để trồng trọt Khoảng vài thập niên gần đây, người Si Lahọc trồng thêm lúa nước Mặc dầu nông nghiệp đóng vai trò chính nhưng sănbắn và hái lượm vẫn giữ vai trò quan trọng trong cuộc sống Nhìn chung, mứcsống của người Si La còn thấp Tình trạng thiếu ăn khá phổ biến Bệnhthường gặp là bướu cổ và sốt rét Do tử xuất cao nên tổng dân số thấp
Trang 27Cộng đồng người Si La theo chế độ phụ hệ, có phong tục làm lễ cướihai lần Lần cưới thứ hai sau lần đầu khoảng một năm Nhà trai phải trình mộtkhoản tiền cưới cho nhà gái để được rước dâu.
Theo phong tục Si La, khi có người chết, người trong bản tổ chức vuichơi, ca hát nhưng không khóc Người chết được chôn tại nghĩa trang nằmphía dưới khu cư trú của dân bản, quan tài làm bằng gỗ độc mộc Tại nghĩatrang, mộ của những người cùng họ được quây quần bên nhau Người Si Ladựng nhà mồ xong mới đào huyệt bên trong Con cái để tang cho cha mẹ 3năm Mỗi bàn thờ phải có chén thờ lấy từ chén cúng cơm bố mẹ trong ngàylàm ma Nhà có bao nhiêu con trai thì có bấy nhiêu chén và tất cả để lên bànthờ Ðến khi chia nhà thì mang chén đó ra lập bàn thờ riêng Thờ tổ tiên từ đờiông trở lên do người trưởng họ đảm nhận
Lễ cúng bản là lễ cúng quan trọng nhất cầu mong cả bản không ốmđau, bệnh tật, lợn gà không bị thú rừng bắt trong năm Cứ 7 năm lại làm lễcúng hồn lúa, dùng vợt bắt cá, gạo đưa đường để đưa hồn lúa từ nương vềbản, tới nhà rồi cất kỹ trên bồ thóc
Trang 28Chương 2 ĐỐI TƯỢNG, NỘI DUNG VÀ PHƯƠNG PHÁP
NGHIÊN CỨU 2.1 Đối tượng nghiên cứu
Đối tượng của nghiên cứu là các mẫu máu được lấy từ những người bìnhthường của 3 dân tộc Kinh, La Hủ và Si La ở Việt Nam (30 mẫu ở mỗi dântộc) Sau khi được cung cấp thông tin về nghiên cứu và giải thích các nộidung, các đối tượng cho mẫu sẽ điền các thông tin xác nhận vào “Phiếu đồng
mẫu hoặc người được uỷ quyền, việc lấy mẫu mới được phép tiến hành
Mỗi đối tượng nghiên cứu được lấy từ 2-5 ml máu toàn phần, các mẫu
2.2 Hóa chất và thiết bị
Các hóa chất và thiết bị phục vụ cho nghiên cứu thuộc phòng Hệ genhọc người, Viện nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệViệt Nam
Các hóa chất: Kit GeneJET Whole Blood Genomic DNA Purification(Thermo Fisher Scientific Inc., Vilnius, Lithuania); Nước khử ion vô trùng;Dream Taq Buffer; dNTPs; Mồi xuôi; Mồi ngược; Dream Taq polymerase.GeneJET PCR Purification Kit -Thermo; Agarose, đệm TAE, ethidiumbromide -EtBr, được mua của các hãng Fermentas, Invitrogen, Merck, Sigma
Các thiết bi ̣chinh́ sửdung ̣ trong thao tác thưc ̣ hiêṇ thínghiêm:̣ Bể ổnnhiệt, Máy khuấy trộn, Lò vi sóng , Hệ thống điện di Mupid- exu, Máy chụpảnh GEL-DOC, Máy ly tâm Eppendorf - Centrifuge 5424R, Máy GeneAmpPCR System 9700 (ABI, Mỹ), Tủ lạnh sâu
Dụng cụ: thìa vô trùng, ống eppendorf 2ml; 1,5ml và 0,2ml, cột, pipet
và đầu tip các loại
Trang 292.3 Nội dung nghiên cứu
HVS-II của các mẫu thuộc các dân tộc trong nghiên cứu
2.4 Phương pháp nghiên cứu
2.4.1 Tách chiết DNA tổng số
DNA tổng số được tách chiết từ mẫu máu đông lạnh, sử dụng KitGeneJET Whole Blood Genomic DNA Purification (Thermo Fisher ScientificInc., Vilnius, Lithuania) Các bước thực hiện:
Bước 1: Máu cất giữ ở -20oC được lấy ra và để vào tủ ấm 37oC trongthời gian 30 phút
Bước 2: Thêm 20 µl Proteinase K vào 200 µl máu, mix bằng vortex.
Thêm 400 µl Lysis, mix hoàn toàn bằng vortex hoăc ̣ pipet
Bước 3: Ủ mâũ ở56oC trong 10 phút vàthỉnh thoảng vortex hoăc ̣ sửdung ̣ bểlắc đến khi tếbào tan hoàn toàn
Bước 4: Thêm 200 µl ethanol (96-100%) vàmix bằng pipet.
Bước 5: Chuyển hỗn hơp ̣ vào côṭly tâm Ly tâm ở8000 vòng/phút trong
vòng 1 phút Loaịbỏống thu cóchứa dicḥ Đăṭcôṭvào môṭống thu 2ml mới
Bước 6: Thêm 500 µl Wash Buffer I (đã thêm ethanol) Ly tâm ởtốc đô
̣tối đa trong 3 phút (>= 10.000 vòng/phút) Loaịbỏdịch trong ố ng thu
Bước 7: Thêm 500 µl Wash Buffer II vào cột Ly tâm ởtốc đô ̣tối đa
trong 3 phút (>= 11.000 vòng/phút) Loaịbỏống thu cóchứa dicḥ Đăṭcôṭ vàomôṭống thu 1,5ml mới
Bước 8: Thêm 200µl Elution Buffer vào giữa màng côṭ đểpha loãng
DNA Ủ ởnhiêṭđô ̣phòng trong 2 phút vàly tâm 10.000 vòng/phút trong 1 phút
Trang 30Bước 9: Bỏcôṭ Thu dung dịch DNA.
Sau đó các mẫu DNA tổng số được tiến hành điện di kiểm tra trên gelagarose
2.4.2 Phương pháp điện di trên gel agarose
Hóa chất sử dụng: (1) Agarose; (2) Dung dịch TAE 1 X (Tris base 48,8g/l; acetic acid 10,2 ml/l; EDTA 0,5M 20 ml/l pH 8,0); (3) EtBr 0,5 µg/ml; (4)Đệm tra mẫu (Dye 6 X); Thermo hyper ladder 1kb Các bước thực hiện như sau:
Bước 1: Chuẩn bị gel: Cân 1g agarose hoà tan trong 100 ml dung dịch
TAE 1X Đun sôi trong lò vi sóng cho agarose tan hoàn toàn Để nguộikhoảng 60oC, đổ dung dịch vào khuôn gel điện di đã cài sẵn lược Sau khoảng
30 - 45 phút, khi gel đông cứng tháo lược ra khỏi bản gel, đặt bản gel vào bểđiện di Đổ đệm TAE 1X ngập bản gel
Bước 2: Tra mẫu: Trộn đều mẫu theo tỉ lệ (5 µl DNA mẫu + 1µl Dye
6X) và dùng pipet tra vào giếng
Bước 3: Điện di DNA tổng số và sản phẩm PCR: Điện thế dùng để điện
di 100V DNA di chuyển từ cực âm sang cực dương Quan sát sự di chuyểnmàu của bromophenol để biết thời gian ngừng điện di
Bước 4: Nhuộm gel: Bản gel chạy xong được nhuộm trong Ethilium
bromide (EtBr) 0,5 ng/ml trong 5 phút, rửa sạch bằng nước
Bước 5: Quan sát: Soi gel trên đèn UV và chụp ảnh bằng máy GEL-DOC 2.4.3 Phương pháp nhân đoạn DNA bằng phản ứng PCR
Hai vùng gen siêu biến HVS-I và HVS-II được khuếch đại bằng phảnứng chuỗi polymerase (Polymerase Chain Reaction - PCR) sử dụng 2 cặp mồiđặc hiệu:
HVSI-F: 5’- CTC CAC CAT TAG CAC CCA AAG C -3’
HVSI-R: 5’- CCT GAA GTA GGA ACC AGA TG -3’
HVSII-F: 5’- GGT CTA TCA CCC TAT TAA CCA C -3’
Trang 31HVSII-R: 5’- CTG TTA AAA GTG CAT ACC GCC A -3
Thành phần của phản ứng chuỗi polymerase (Polymerase ChainReaction - PCR) được thể hiện trong Bảng 2.1 Tổng thể tích của mỗi phản
ứng PCR là 10 µl Phản ứng đươc ̣ thực hiện trên máy chu trinh̀ nhiêṭGeneAmp PCR System 9700 (ABI, Mỹ) Chu trình nhiệt sử dụng trong nghiêncứu được thể hiện ở Bảng 2.2
Bảng 2.1 Thành phần của phản ứng PCR
Bảng 2.2 Chu trình nhiệt PCR
Biến tính
Các bước toàn bộ tính mồi Kéo dài kết thúc quản
Trang 322.4.4 Phương pháp tinh sạch sản phẩm PCR
Sản phẩm PCR được tinh sạch bằng kit tách chiết vàtinh sacḥ thương maị(GeneJET PCR Purification Kit - Thermo)
Bước 1: Chuyển toàn bộ thể tích sản phẩm PCR sang ống eppendorf
1,5 ml Bổ sung Binding Buffer với tỉ lệ thể tích 1:1 Mix đều bằng pipet Chúthích: kiểm tra màu của dung dịch Màu vàng biểu thị độ pH tối ưu cho DNA Nếu màu của dung dịch là màu cam hoặc tím, thêm 10 µl dung dịch natri axetat 3 M, dung dịch pH 5,2 và mix đều
Bước 2: Chuyển toàn bộ dung dịch thu được lên cột và ly tâm 10.000
vòng/phút trong 1phút ở nhiệt độ phòng Đổ bỏ dịch trong ống thu sau ly tâm
và đặt lại cột vào ống thu
Bước 3: Bổ sung 700 µl dung dịch Wash buffer và ly tâm với tốc độ
10.000 vòng/phút trong thời gian 2 phút ở nhiệt độ phòng Đổ bỏ dịch trongống thu sau ly tâm và đặt lại cột vào ống thu
Bước 4: Tiếp tục ly tâm 14.000 vòng/phút trong 1 phút để loại bỏ hết
buffer Bỏ ống thu
Bước 5: Chuyển cột sang ống eppendorf 1,5ml mới và bổ sung 10 µl
elution buffer vào trung tâm của màng cột, ủ 2 phút ở nhiệt độ phòng và lytâm 10.000 vòng/phút trong 1 phút Loại bỏ cột, thu dịch DNA ở ốngeppendorf 1,5 ml
Điện di kiểm tra 2 µl sản phẩm thu được trên gel agarose 1%
2.4.5 Phương pháp giải trình tự DNA
Trình tự nucleotide quan tâm được xác định trên nguyên tắc củaphương pháp Sanger: tạo ra các đoạn DNA một sợi hơn kém nhau mộtnucleotide, kết thúc bởi các ddNTP đã được đánh dấu huỳnh quang Để tạo racác đoạn kết thúc bằng các ddNTP khác nhau, các mẫu được tiến hành giảitrình tự trên máy đọc trình tự tự động_ABI PRISM 3500 Avant Genetic
Trang 33Analyzer - sử dụng BigDye Terminator v3.1 Cycle Sequencing Kit đã có sẵncác hóa chất cần thiết của phản ứng nhân gen để xác định trình tự như dNTP,ddNTPs, DNA polymerase Do đó, chỉ cần bổ sung thêm DNA khuôn (sảnphẩm PCR) và mồi phù hợp Phản ứng được thực hiện trong một ống vì 4 loạiddNTP đã được đánh dấu bằng các màu khác nhau.
Thành phần của phản ứng khuếch đại gen để đọc trình tự bao gồm: Mồi1,6 pM, DNA plasmid 200 ng, BigDye và đệm tương ứng với tổng thể tích 10μl.l
Chu trình nhiệt cho phản ứng PCR trong máy GenAmp® PCR System
9700 như sau: 96 oC – 1 phút; (96 oC – 10 giây; 50 oC – 5 giây; 60 oC – 4phút) x 25 chu kỳ Sau đó giữ sản phẩm ở 4 oC
Sản phẩm PCR được tinh sạch bằng phương pháp EtOH/EDTA Saubước này, nguyên liệu được đưa vào máy đọc trình tự tự động ABI PRISM
3500 Avant Genetic Analyzer Các ống được điện di trong ống vi mao quản
Data Collection Software và DNA Sequencing Analysis
2.4.6 Phương pháp xử lý số liệu thống kê và so sánh
Trình tự các đoạn gen mang các đa hình sau khi được xác định trên máygiải trình tự tự động ABI PRISM 3500 Avant Genetic Analyzer sẽ được kiểm
tra, xử lýthô vàso sánh với trình tư ̣chuẩn rCRS bằng BioEdit nhằm xác địnhcác đa hình ở 2 vùng siêu biến HVS-I và HVS-II ở 3 dân tộc Các đa hìnhxuất hiện với tần suất ít nhất 10% ở 1 trong 3 dân tộc sẽ được lựa chọn đểthực hiện các phân tích thống kê nhằm đánh giá sự khác biệt di truyền Cácphân tích được thực hiên trên phần mềm SPSS bản 23.0 và phần mềm excelbản Office 2010, sử dụng kiểm định Fisher exact (2 phía) Mức ý nghĩa đượclấy với α = 0,05
Trang 34Chương 3 KẾT QUẢ VÀ THẢO LUẬN 3.1 Tách chiết và tinh sạch DNA tổng số từ các mẫu máu
Tách chiết DNA tổng số từ máu toàn phần là một trong những bướcquan trọng khi tiến hành các kỹ thuật sinh học phân tử Độ tinh sạch và hàmlượng DNA tách chiết được sẽ ảnh hưởng trực tiếp đến sự thành công củanghiên cứu Trong thí nghiệm này, chúng tôi sử dụng vật liệu là 90 mẫu máuđược lấy từ 3 dân tộc Kinh, La Hủ và Si La ở Việt Nam Các mẫu DNA saukhi tách chiết được kiểm tra bằng điện di trên gel agarose (Hình 3.1, Hình 3.2,Hình 3.3) Kết quả điện di cho thấy các mẫu DNA ít bị đứt gãy với các băngđiện di sáng và rõ nét, đảm bảo đủ tiêu chuẩn để tiến hành những thí nghiệmtiếp theo
Hình 3.1 Kết quả điện di kiểm tra DNA tổng số từ 30 mẫu máu của nhóm dân tộc Kinh
Trang 35Hình 3.2 Kết quả điện di kiểm tra DNA tổng số từ 30 mẫu máu của nhóm dân tộc La
Trang 36Hình 3.4 Sản phẩm PCR khuếch đại đoạn gen HVS-I của nhóm dân tộc Kinh (kích thước lý thuyết 543 bp) trên gel agarose 1% M: Thermo hyper ladder 1kb; N: Đối
chứng âm (không có khuôn DNA).
Hình 3.5 Sản phẩm PCR khuếch đại đoạn gen HVS-II của nhóm dân tộc Kinh (kích thước lý thuyết 429 bp) trên gel agarose 1% M:Thermo hyper ladder 1kb, N: Đối
chứng âm (không có khuôn DNA).
Hình 3.6 Sản phẩm PCR khuếch đại đoạn gen HVS-I của nhóm dân tộc La Hủ (kích thước lý thuyết 543 bp) trên gel agarose 1% M: Thermo hyper ladder 1kb; N: Đối
chứng âm (không có khuôn DNA).