Nghiên cứu đặc điểm đa hình nucleotide đơn SNPs của một số vùng DNA ty thể và nhiễm sắc thể Y ở người Mường và người Katu Abstract: Tách chiết DNA tổng số từ mẫu máu của 108 cá thể người
Trang 1Nghiên cứu đặc điểm đa hình nucleotide đơn (SNPs) của một số vùng DNA ty thể và nhiễm sắc thể Y ở người Mường và người Katu
Abstract: Tách chiết DNA tổng số từ mẫu máu của 108 cá thể người Việt thuộc hai
dân tộc Mường và Katu Nhân vùng điều khiển D-loop của DNA ty thể và một số chỉ thị trên nhiễm sắc thể Y Xác định trình tự nucleotide của các trình tự được nhân từ các mẫu nghiên cứu Phân tích đa hình nucleotide đơn (SNP) trình tự các mẫu nghiên
cứu thuộc hai dân tộc Mường và Katu
Keywords: Sinh học thực nghiệm; Di truyền; Nhiễm sắc thể
Content
MỞ ĐẦU
Sự kiện toàn bộ hệ gen của con người được giải trình tự và công bố trên 2 tạp chí khoa học danh tiếng nhất là Nature, Anh và Science, Mỹ vào tháng 2 năm 2001 đã tạo ra một cột mốc vô cùng quan trọng trong sinh học Trình tự hệ gen sau đó đã được công khai để các nhà khoa học trên khắp thế giới có thể tiếp cận và cùng sử dụng tạo ra một điều kiện mới, thuận lợi hơn rất nhiều cho các nghiên cứu sinh học, đặc biệt là sinh học phân tử Trình tự đầu tiên này được xem là “trình tự chuẩn” hay “trình tự tham chiếu” giúp chúng ta tiếp tục đến với những nghiên cứu sâu hơn
Kết quả quan trọng nhất sau khi có bản đồ gen người cho chúng ta thấy rằng, các chủng tộc, các cá thể người giống nhau đến 99,9% và chỉ khác nhau một tỷ lệ rất nhỏ (0,1%)
về cấu trúc hệ gen Tuy nhiên, phần khác biệt rất nhỏ này lại có có ý nghĩa quyết định đối với đặc điểm nhân chủng học của một dân tộc, là yếu tố di truyền liên quan đến sức khỏe của cả dân tộc và mỗi cá thể Trong 0.1% khác biệt giữa hai người thì có đến hơn 80% là các đa hình nucleotide đơn (SNP) Do đó, việc nghiên cứu các SNP là vô cùng quan trọng, cụ thể đã có nhiều SNP đang được sử dụng làm công cụ hữu ích trong những lĩnh vực như y dược học, hình sự, và nghiên cứu di truyền tiến hóa…
Kể từ những năm 80 của thế kỷ trước, các SNP của DNA ty thể và nhiễm sắc thể Y đã được sử dụng trong nhiều lĩnh vực khác nhau của sinh học và y học Chúng ta có thể dễ dàng nhận thấy, với các đặc tính như di truyền đơn dòng, rất ít trao đổi chéo, đồng thời lại lưu giữ
Trang 22
nhiều chỉ thị quạn trọng, những SNP này đặc biệt hữu ích đối với việc nghiên cứu quá trình tiến hóa của con người Trong một số công bố gần đây, các nghiên cứu liên quan đến DNA ty thể và nhiễm sắc thể Y đã cung cấp những kiến thức hữu ích về các vấn đề chủ chốt trong quá trình tiến hóa và làm sáng tỏ lịch sử di truyền của các quần thể người ở các vùng địa lý trong các bối cảnh và khoảng thời gian khác nhau
Việc nghiên cứu di truyền tiến hóa đối với các dân tộc Việt Nam là hết sức thiết thực, tuy nhiên việc tiến hành các nghiên cứu này vẫn còn là một vấn đề mới ở nước ta và chưa có nhiều công trình được công bố Nhận thức rõ được tầm quan trọng của việc nghiên cứu nguồn gốc tiến hóa và tìm hiểu dữ liệu di truyền của các dân tộc Việt Nam, chúng tôi định hướng nghiên cứu đặc điểm đa hình nucleotide đơn ở cả DNA ty thể và nhiễm sắc thể Y Theo
hướng nghiên cứu này, đề tài luận văn thạc sĩ: “Nghiên cứu đặc điểm đa hình nucleotide đơn
(SNPs) của một số vùng DNA ty thể và nhiễm sắc thể Y ở người Mường và người Katu” đã
được thực hiện Các nội dung chính của đề tài luận văn gồm:
- Tách chiết DNA tổng số từ mẫu máu của 108 cá thể người Việt thuộc hai dân tộc Mường và Katu Nhân vùng điều khiển D-loop của DNA ty thể và một số chỉ thị trên nhiễm sắc thể Y
- Xác định trình tự nucleotide của các trình tự được nhân từ các mẫu nghiên cứu
- Phân tích đa hình nucleotide đơn (SNP) trình tự các mẫu nghiên cứu thuộc hai dân tộc Mường và Katu
Chương 1 TỔNG QUAN
1.1 Nghiên cứu đa hinh nucleotide đơn (SNP)
1.1.1 Các dạng SNP
1.1.2 Ứng dụng và tầm quan trọng
1.2 Đặc điểm đa hình của DNA ty thể
1.2.1 Cấu trúc của DNA ty thể
1.2.2 Đặc điểm di truyền của DNA ty thể và ứng dụng trong nghiên cứu di truyền tiến hóa 1.2.3 Vùng điều khiển (D-loop) ở DNA ty thể
1.3 Đặc điểm đa hình của nhiễm sắc thể Y
1.3.1 Cấu trúc nhiễm sắc thể Y
1.3.2 Các loại chỉ thị trên nhiễm sắc thể Y
1.3.3 Đa hình nhiễm sắc thể Y và ứng dụng trong nghiên cứu lịch sử di truyền tiến hóa loài
Trang 3Chương 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu là các mẫu máu ngoại vi của các cá thể người bình thường, khỏe mạnh, thuộc hai dân tộc Mường và Katu Giới tính của các đối tượng được xác định trên cơ sở
tự khai và đặc điểm nhận dạng hình thái Trong tổng số 108 mẫu cá thể nghiên cứu thì có 47 mẫu cá thể thuộc dân tộc Mường đều là nam giới được thu thập tại huyện Như Xuân, tỉnh Thanh Hóa và 61 mẫu cá thể thuộc dân tộc Katu (20 nam và 41 nữ) được thu thập tại các xã Thượng Long, Hương Sơn, Hương Hữu, huyện Nam Đông, tỉnh Thừa Thiên Huế Nguồn gốc dân tộc dựa trên cơ sở người tình nguyện cho máu tự khai báo 3 đời Các đối tượng trong nghiên cứu này đều tình nguyện cung cấp máu phục vụ mục đích nghiên cứu khoa học và có
độ tuổi từ 18 đến 50 Tên, kí hiệu và số lượng các mẫu cá thể nghiên cứu được trình bày ở bảng
Các mẫu máu sau khi lấy vô trùng được bảo quản ở 80oC cho đến khi sử dụng
2.2 Hóa chất, thiết bị
Các hóa chất sử dụng trong thí nghiệm được mua từ các hãng hóa chất như Sigma, Merck, Invitrogen, Promega, Fermentas Các thiết bị máy móc sử dụng hiện đại, được sản xuất tại Đức, Mỹ, Nhật Bản, Thụy Sĩ
2.3 Phương pháp nghiên cứu
2.3.1 Tách chiết DNA tổng số từ máu
DNA tổng số được tách chiết theo phương pháp của Sambrook và Russell với một số cải tiến
2.3.2 Nhân các đoạn DNA quan tâm bằng kỹ thuật PCR
Các đoạn trình tự được nhân gồm :
- Đoạn trình tự D-loop của DNA ty thể
- Các đoạn chỉ thị trên nhiễm sắc thể Y : P186, M175, M216, P191:
Kết quả điện di sản phẩm tách chiết của một số mẫu như trong hình 3.1
Hình 3.1 Ảnh điện di DNA tổng số trên gel agarose 0,8%
Giếng 1 → 12: DNA tổng số của các mẫu tương ứng là: NSTY1, NSTY2, NSTY3, NSTY4, NSTY5, NSTY6, NSTY7, NSTY8, NSTY9, NSTY10, NSTY12, NSTY13
Trang 44
Kết quả tách DNA như ở hình 3.1 cho thấy: ở tất cả các đường chạy đều xuất hiện một băng DNA Các băng này sáng rõ nét, không có vệt sáng kéo dài ở phía dưới chứng tỏ DNA ít
bị đứt gãy
3.2 Nhân vùng D-loop và các chỉ thị trên nhiễm sắc thể Y
Sau khi thu được DNA tổng số, chúng tôi tiến hành nhân vùng D-loop và các đoạn chỉ thị trên nhiễm sắc thể Y bằng kỹ thuật PCR sử dụng các cặp mồi đặc hiệu Kết quả PCR được điện di trên gel agarose để kiểm tra
3.2.1 Nhân vùng D-loop
Vùng loop trên DNA ty thể được nhân lên bằng phản ứng PCR với cặp mồi loopF và D-loopR với kích thước đoạn DNA được nhân lên khoảng 1,4 kb Sản phẩm được kiểm tra bằng kỹ thuật điện di trên gel agarose 0,8% Kết quả thu được trong hình 3.2
D-Hình 3.2 Ảnh điện di sản phẩm PCR vùng D-loop của một số mẫu nghiên cứu sử dụng
cặp mồi D-loop F và D-loop R trên gel agarose 0,8%
Giếng 1: thang DNA chuẩn (marker 1 kb)
Giếng 2 → 10: sản phẩm PCR của các mẫu NSTY1, NSTY2, NSTY3, NSTY4, NSTY5, NSTY6, NSTY7, NSTY8, NSTY9, NSTY10
Giếng 11: Đối chứng âm (-)
Dựa trên hình ảnh điện di sản phẩm cho thấy: khi sử dụng cặp mồi loop F và loop R thu được sản phẩm PCR đặc hiệu, rõ nét ở tất cả các mẫu nghiên cứu Kích thước của các sản phẩm PCR này đều tương ứng phù hợp với kích thước lý thuyết là khoảng 1,4 kb
D-3.2.2 Nhân các chỉ thị M175, P186, P191 và M216 trên nhiễm sắc thể Y
Đoạn chỉ thị M175 (178 bp), P186 (168 bp), P191 (177 bp) và M216 được nhân lên với các cặp mồi tương ứng là: M175F + M175R, P186F + P186R, P191F + P191R, M216F + M216R) Do có kích thước nhỏ( dưới 200 bp) nên sản phẩm PCR được điện di trên gel agarose 2% để kiểm tra kết quả khuếch đại Kết quả điện di sản phẩm PCR thu được trong hình 3.3
Trang 5Hình 3.3 Ảnh điện di sản phẩm PCR hai đoạn chỉ thị M175, M216, P191 và P186 một số
mẫu nghiên cứu trên gel agarose 2%
Giếng 1 hình A, B, C, D: thang DNA chuẩn (marker 100 bp)
Giếng 2 → 6 hình A, B, C, D: sản phẩm PCR của các mẫu NSTY1, NSTY5, NSTY8, NSTY9, NSTY15, NSTY36 với các cặp mồi tương ứng
Giếng 7 hình A, B, C, D: Đối chứng âm (-)
Sản phẩm điện di kiểm tra cho thấy các đoạn trình tự DNA được nhân lên đặc hiệu, các vạch rõ ràng và có kích thước tương đương với các tính toán lý thuyết Sau đó các sản phẩm PCR của các mẫu nghiên cứu sẽ được tinh sạch và giải trinhg tự trên máy tự động ABI PRISM 3100 Genetic Analyzer, sử dụng BigDye Terminator v3.1 Cycle Sequencing Kit
3.3 Phân tích và xử lý số liệu trình tự vùng D-loop của DNA ty thể ở các mẫu nghiên cứu
3.3.1 Phân tích và xử lý số liệu trình tự vùng D-loop của DNA ty thể ở các mẫu cá thể
người Mường
Chúng tôi tiến hành xác định trình tự vùng điều khiển D-loop của DNA ty thể theo phương pháp đọc trực tiếp từ sản phẩm PCR tinh sạch của tất cả các mẫu nghiên cứu theo 2 chiều bằng cặp mồi D-loop F và D-loop R Điều này làm tăng độ tin cậy của số liệu thu được bởi vì nếu đọc một chiều thì không kiểm tra được sai sót có thể xảy ra
Sau khi kiểm tra, so sánh và xử lý các vùng trùng nhau bằng phần mềm SeqScapev2.6 chúng tôi đã thu được trình tự nucleotide hoàn chỉnh của vùng D-loop của 38 mẫu dân tộc Mường với kích thước 1121 bp, tương ứng với vị trí nucleotide của vùng D-loop trên bản đồ gen ty thể là 16024 – 16569/0 – 576 Sau đó, chúng tôi tiến hành so sánh các trình tự vùng D-loop của 38 mẫu cá thể nghiên cứu với nhau và với trình tự vùng D-loop chuẩn (rCRS) đã được công bố trên Ngân hàng dữ liệu về DNA ty thể MITOMAP
Số liệu thu thập được khi so sánh với trình tự chuẩn rCRS cho thấy có khá nhiều vị trí
đa hình so với trình tự chuẩn Tổng cộng 38 mẫu Mường có 494 vị trí sai khác so với trình tự chuẩn Đây là một số lượng khá lớn song phù hợp với những nghiên cứu trước đây thấy rằng vùng điều khiển D-loop có tần số đa hình cao nhất trong hệ gen ty thể Các mẫu thì có mức độ
đa hình không giống nhau Cụ thể, mẫu có ít vị trí đa hình nhất là 8, trong khi đó mẫu có nhiều vị trí đa hình nhất là 19
Trang 66
Từ kết quả so sánh những vị trí đa hình của các mẫu được thống kê trong hình 3.4, chúng tôi thấy rằng các vị trí đa hình của các mẫu tập trung nhiều nhất vào đoạn HV1, sau đó
là đoạn HV2 và ít thay đổi hơn ở vùng xen giữa 2 đoạn HV1 và HV2
Các đa hình thay thế là phổ biến nhất (chiếm 71,59%) so với đa hình mất nucleotide (chiếm 18,75%) và đa hình thêm nucleotide (chiếm 9,66%) Các nucleotide chèn vào thường
là C trong khi các nucleotide bị mất thường liên quan đến 2 nucleotide C và A Nhìn chung,
số liệu thu được về các vị trí đa hình trong vùng điều khiển D-loop phản ánh tốc độ đột biến rất cao của vùng này, đặc biệt là vùng siêu biến HV1
Như vậy trình tự nucleotide được xác định từ 38 mẫu cá thể trong nghiên cứu của chúng tôi là những số liệu đầu tiên về vùng điều khiển D-loop ty thể người dân tộc Mường Toàn bộ hơn 1100 nucleotide thuộc vùng D-loop đã được xác định rất có ý nghĩa trong việc nghiên cứu tiếp theo về di truyền quần thể và tiến hóa của người Việt Nam
3.3.2 Phân tích và xử lý số liệu trình tự vùng HV1 của DNA ty thể ở các mẫu cá thể người Katu
Với các mẫu của người dân tộc Katu, chúng tôi tiến hành giải trình tự và phân tích số liệu vùng HV1 Sản phẩm khuếch đại trình tự D-loop các mẫu người dân tộc Katu được giải trình tự với mồi HV1-C5’-F sau đó các trình tự được phân tích và tiến hành so sánh với trình
tự chuẩn để xác định các SNP
Theo số liệu thu được, chúng ta thấy có tổng công 187 vị trí sai khác trên tổng số 41 mẫu nghiên cứu được đọc trình tự hoàn chỉnh Tính ra chúng ta có trung bình 4.56 điểm khác biệt trên mỗi trình tự vùng HV1 (có kích thước 359 bp), vậy, chúng ta có thể thấy tỷ lệ xảy ra
đa hình trên vùng này lên tới 1.27%
Để tìm hiểu mối liên quan di truyền và nguồn gốc tiến hóa của các nhóm cá thể đã nghiên cứu của hai dân tộc Mường và Katu, chúng tôi đã tiến hành so sánh và phân tích chủng loại phát sinh dựa trên trình tự vùng HV1 của các mẫu nghiên cứu này với các trình tự đã công bố của các dân tộc trong khu vực Dữ liệu trình tự của các dân tộc được tải về từ trang mạng (http://www.mtdb.igp.uu.se/) bao gồm các trình tự vùng D-loop của người Ấn Độ, Australia, Campuchia, Đài Loan, Hàn Quốc, Indonesia, Malaysia, Nhật Bản, Pakistan, Các quốc đảo khu vực Papua New Guine (PNG), Philippines, Thái Lan và người miền nam Trung Quốc Từ các trình tự trên chúng tôi xây dựng được bảng thông tin khoảng các di truyền giữa các dân tộc bằng phần mềm MEGA5.1 và thu được kết quả trong bảng 3.1
Bảng 3.1 Khoảng cách di truyền giữa các dân tộc dựa trên trình tự HV1
Từ bảng số liệu chúng ta có thể thấy hai nhóm cá thể người Mường và người Katu có khoảng cách di truyền là 0.023 Nhóm người Katu thì có khoảng cách di truyền gần nhất với người Campuchia là 0.017 Điều này phù hợp vì người Katu thuộc nhóm ngôn ngữ Môn-Khmer và có địa bàn cư trú gần với Campuchia Khoảng cách di truyền của người Katu với Katu Muong Indian Australi
an Cambo dian Taiwan ese KoreanIndone sian Malaysi an Japane se Pakista
n PNGPhilippi
ne ThaiChines e Katu 0.023 0.024 0.030 0.017 0.028 0.035 0.025 0.023 0.026 0.025 0.029 0.027 0.023 0.029
Trang 7người Thái và người Malaysia bằng với người Mường là 0.023 Nhìn chung cả người Mường
và người Katu đều có khoảng cách di truyền rất gần với các nhóm người trong khu vực Đông Nam Á Bên cạnh đó khoảng cách di truyền giữa người Mường và người Katu với người ở khu vực Nam Á cũng khá gần, cụ thể là với người Ấn Độ (0.024) và người Pakistan (0.025) trong khi đó khoảng cách của hai dân tộc này với nhóm người Bắc Á là tương đối xa như với Hàn Quốc (0.035) và Đài Loan (0.029)
Để tìm hiểu rõ hơn, chúng tôi tiến hành xây dựng cây chủng loại phát sinh dựa trên những số liệu mình có về đặc điểm đa hình trên vùng HV1 của ty thể và đã cho những kết quả như hình 3.4
Hình 3.4 Cây phát sinh chủng loại giữa các cá thể người Mường, người Katu và
các dân tộc trong khu vực
3.4 Xác định các chỉ thị đa hình nucleotide (SNP) trên nhiễm sắc thể Y
Đông Nam Á được ghi nhận là khu vực có một số lượng lớn các nhóm đơn bội và các phân nhóm đơn bội nhiễm sắc thể Y Trong đó O và C là hai nhóm đơn bội chính ở khu vực
Do đó chúng tôi quyết định lựa chọn một số chỉ thị đặc trưng để nghiên cứu đa hình trên hai nhóm này
3.4.1 Lựa chọn các chỉ thị SNP
Để tìm hiểu về sự phân bố của 2 nhóm đơn bội chính này ở người Mường và người Katu, chúng tôi tiến hành xác định đa hình ở các chỉ thị SNP tiêu biểu của các nhóm, cụ thể là các chỉ thị: M175, P186, P191 đại diện cho nhóm đơn bội O và chỉ thị M216 đại diện cho nhóm đơn bội C Chỉ thị M175 có đa hình là – 5bp (±/TTCTC) từ vị trí nucleotide 14018100 đến 14018104 trên nhiễm sắc thể Y Chỉ thị P186 có đa hình CA tương ứng với vị trí
7628568 và 14263707, chỉ thị P191 có đa hình là AG ở vị trí 13924509 và chỉ thị M216 có
đa hình CT ở vị trí nucleotide 13946958 trên nhiễm sắc thể Y.Để xác định các điểm đa hình này, 4 cặp mồi đã thiết kế được để nhân các đoạn có mang các SNP trên cơ sở trình tự nhiễm sắc thể Y đã công bố trên ngân hàng Genbank
3.4.2 Nhân các đoạn mang các chỉ thị SNP
Với mục đích xác định các SNP thuộc nhóm đơn bội O và C, chúng tôi đã tiến hành nhân các đoạn chứa các SNP cần phân tích Theo tính toán lý thuyết các đoạn M175, P186, P191 và M216 có kích thước lần lượt là 178 bp, 168, 177 bp và 160 bp Kết quả cho thấy,
Trang 8Kết quả xác định các SNP thuộc nhóm đơn bội O và C cho thấy, tất cả 4 chỉ thị đều xuất hiện đa hình trong các mẫu nghiên cứu Trong đó, có 2 chỉ thị có mức độ đa hình rất lớn
đó là P186 chiếm 97,06% số mẫu có đa hình và P191 có 94,12% đa hình là AG Chỉ thị M175 ở hai dân tộc này cũng rất cao lên đến 70,6% trong khi đó chỉ thị duy nhất của nhóm đơn bội C là M216 có mức độ đa hình rất thấp , chỉ với 1 cá thể mang đa hình T chiếm 1.47% được nhận diện trong các mẫu nghiên cứu
Nhóm đơn bội O*-M175/P186/P191
Nhóm đơn bội O là dòng chủ đạo ở Đông và Đông Nam Á, bao gồm hơn 1/4 tất cả đàn ông trên thế giới với tần số xuất hiện trung bình trên toàn khu vực này lên đến trên 60% Theo phương pháp phân loại nhóm đơn bội trên nhiễm sắc thể Y đã được đưa ra năm 2002 và được cập nhật lại năm 2008 nhóm đơn bội O được xác định bằng 4 chỉ thị (M175, P186, P191
và P196 ) Cận nhóm O chỉ mang 1 trong 4 chỉ thị đã nêu ở trên, không mang các đa hình thuộc các nhánh phát sinh từ O Từ những số liệu thu được cho thấy, có 48 cá thể mang các đa hình thuộc cận nhóm O-M175, 66 cá thể mang đa hình thuộc cận nhóm O-P186 và 64 thuộc cận nhóm O-P191 với tần số phân bố tương ứng là 70,59%, 97,06% và 94,12 % Tuy nhiên, trong nghiên cứu này, chúng tôi chưa có điều kiện để phân tích toàn bộ các chỉ thị của các nhánh được sinh ra từ nhóm đơn bội O Vì vậy những số liệu thống kê trên đây có thể bị thay đổi khi có những phân tích đầy đủ về đa hình các thỉ thị của các nhánh thuộc nhóm đơn bội này
Nhóm đơn bội O chiếm khoảng 80 đến 90% đàn ông ở Đông và Đông Nam Á và gần như không tìm thấy ở các nơi khác Chỉ thị M175 không xuất hiện ở Tây Siberia, Tây Á và châu Âu, đặc biệt là hoàn toàn không tìm thấy ở Châu Phi và Châu Mỹ, một số nhánh của nhóm đơn bội O xuất hiện với tần số tương đối ở các bộ lạc ở Nam Á, các nhóm người thuộc nhóm ngôn ngữ Altaic ở Trung Á và các nhóm người thuộc nhóm ngôn ngữ Austronesia ở châu Đại Dương
Trang 9Hình 3.5 Bản đồ phân bố của nhóm đơn bội O trên thế giới
Nhóm đơn bội O phân bố chủ yếu ở khu vực Châu Á Thái Bình Dương và đảo Madagasca Tần số phân bố của nhóm đơn bội này được miêu tả bằng mức độ đậm nhạt của màu xanh lá cây trong hình 3.5
Nhóm đơn bội O được tách ra từ nhóm đơn bội NO (M214), nhóm đơn bội này có thể xuất hiện đầu tiên ở Siberia hoặc phía Đông của Trung Á khoảng 35 000 năm trước Thuộc nhóm đơn bội O, ngoài 3 nhánh O1, O2 và O3 còn có cận nhóm O* Cận nhóm O* không mang các đa hình xác định các nhánh O1, O2 và O3 Cận nhóm này có tần số thấp ở người Trung và Đông Á hiện đại Trong một điều tra tổng thể về đa hình nhiễm sắc thể Y ở các nhóm người sống trong khu vực trung đại lục Á-Âu, người ta đã tìm thấy nhóm đơn bội O* - M175 xuất hiện với tần số: 2,5% (1/40 cá thể) ở người Tajik ở Samarkand, 4,5% (1/22) ở người Crimean Tatar sống ở Uzbekistan, 1,5% (1/68) ở người Uzbek sống ở Surkhandarya, 1,4% (1/70) ở người Uzbek sống ở Khorezm, 6,3% (1/16) của người Tajik sống ở Dushanbe, 1,9% (1/54) của người Kazakh sống ở Kazakhstan, 4,5% (2/41) của người Uyghur sống ở Kazakhstan và 31,1% (14/45) của người Triều Tiên
Nhóm đơn bội C*-M216
Nhóm đơn bội C xuất hiện ngay sau khi loài người di cư ra ngoài châu Phi khoảng 50 nghìn năm trước Nhóm đơn bội này có thể theo con đường từ Nam bán đảo Ả Rập qua Pakistan và Ấn Độ đến Sri Lanka, Đông Nam Á và Australia Cận nhóm C* được tìm thấy ở
Ấn Độ, Sri Lanka, một số nơi ở Đông Nam Á C1 xuất hiện chủ yếu ở người Nhật Bản, trong khi đó C2 có tần số phân bố cao ở New Guinea, Melanesia, Polynesia C3 có thể có nguồn gốc ở Đông Nam Á hoặc Trung Á, từ đó phân bố lên Bắc Á và di cư sang châu Mỹ
Chỉ thị M216, cùng với 4 chỉ thị khác (RPS4Y711, P184, P255 và P260) xác định nhóm đơn bội C Với tổng số cá thể là 68 được tiến hành phân tích, đã phát hiện được 1 cá thể
có đa hình ở chỉ thị này, với tỷ lệ xuất hiện là 1,47% Từ kết quả này cho thấy, C-M216 có tần
số phân bố tương đối thấp trong cộng đồng người Việt Nam Tần số phân bố của nhóm đơn bội C-M216 ở một số dân tộc sống tại các tỉnh phía Nam của Trung Quốc (Quảng Đông và Quảng Tây) từ 2,9% ở người Biao cho đến 10% ở người Man-Caolan Trong khi đó, tần số phân bố của nhóm đơn bội này ở một số dân tộc sống ở khu vực Đông Nam Á và một số vùng của châu Đại Dương tương đối cao, từ 7,7% ở người Bangka cho đến 45,5% ở người Irian
Từ các dữ liệu của nghiên cứu này chúng ta có thể thấy: Với tần số xuất hiện rất lớn của các chỉ thị nhóm đơn bội O (từ trên 70% của chỉ thị M175 và trên 90% của chỉ thị P186
và p191) cùng với tỉ lệ xuất hiện rất nhỏ của chỉ thị nhóm C (1.47% của chỉ thị M216) Người
Trang 1010
Mường và Người Katu có đặc điểm đa hình nhiễm sắc thể Y tương đồng với các dân tộc khác trong khu vực Đông Á và đặc biệt là khu vực Đông Nam Á
Hình 3.6 Bản đồ mô tả thuyết di cƣ của các quần thể theo phụ hệ vào Đông Á Bản đồ
hiển thị các tuyến đường di cư của người hiện đại đến Đông Á và sự phát tán đầu tiên trên lãnh thổ này
Các quần thể người ở Đông Nam Á được ghi nhận là có độ đa dạng lớn của các nhóm và các phân nhóm đơn bội Qúa trình lịch sử hình thành và di cư của các nhóm đơn bội cũng rất phức tạp Một số học thuyết cho rằng hai nhóm đơn bội C và D là những nhóm đầu tiên xuất hiện ở khu vực này và có khả năng hai nhóm này đã từng đạt được chỗ đứng trong khu vực này khoảng 45000 năm trước, trong thời kỳ đồ đá cũ trước khi di cư lên phía bắc Sau đó, khoảng
35000 năm trước, nhóm đơn bội O xuất hiện và phát triển rộng khắp khu vực Đông Á Sự phát triển của nhóm đơn bội O được cho là do chúng xuất hiện và phát triển cùng với sự gia tăng dân số của loài người trong thời kỳ đồ đá mới khi con người bắt đầu phát triển các kỹ thuật nông nghiệp sơ khai
Dựa vào bản đồ di cư của các nhóm đơn bội (hình 3.6) chúng ta có thể thấy: Việt Nam gần như nằm ở giao điểm giữa con đường di cư của các nhóm và trong hình 3.6 thể hiện nước
ta nằm trong những vùng có tần số xuất hiện nhóm đơn bội O lớn nhất Cụ thể sự phân bố được mô tả trong hình 3.7
Hình 3.7 Sự phân bố của các nhóm đơn bội Y ở Đông Á và khu vực xung quanh
Nhóm đơn bội C và N chiếm ưu thế ở phía Bắc lục địa Các nhóm đơn bội P, R và J phổ biến
ở phía Tây, và O ở khắp các khu vực phía Đông, Đông Nam và phía Nam Nhóm đơn bội D