HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ---Bùi Anh Tuấn XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ HỆ GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT SỐ TỈNH MIỀN BẮC VIỆT NAM LUẬN ÁN TIẾN SĨ SINH HỌC
Trang 1HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-Bùi Anh Tuấn
XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ
HỆ GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT
SỐ TỈNH MIỀN BẮC VIỆT NAM
LUẬN ÁN TIẾN SĨ SINH HỌC
Hà Nội - Năm 2020
Trang 2HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-Bùi Anh Tuấn
XÁC ĐỊNH VÀ PHÂN TÍCH HOÀN CHỈNH TRÌNH TỰ
HỆ GEN TY THỂ CỦA 6 GIỐNG LỢN BẢN ĐỊA TẠI MỘT
SỐ TỈNH MIỀN BẮC VIỆT NAM
Chuyên ngành: Công nghệ sinh học
Mã sỗ: 94 20 20 1
LUẬN ÁN TIẾN SĨ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 GS.TS Nghiêm Ngọc Minh
2 PGS.TS Võ Thị Bích Thủy
Hà Nội - Năm 2020
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình do chính tôi thực hiện và một số kết quảcùng cộng tác với các đồng nghiệp khác Các số liệu, kết quả nêu trong luận án làtrung thực, một phần đã được công bố trên các tạp chí khoa học chuyên ngành với
sự đồng ý và cho phép của các đồng tác giả Phần nội dung còn lại chưa được aicông bố trong bất kỳ công trình nào khác
Hà Nội, ngày tháng năm 2020
Tác giả
Bùi Anh Tuấn
Trang 4LỜI CẢM ƠN
Tôi xin được bày tỏ lòng biết ơn sâu sắc tới GS TS Nghiêm Ngọc Minh - Phó Viện trưởng Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam
- Người thầy đã gieo mầm, định hướng nghiên cứu, tận tình hướng dẫn, giúp đỡ tôi
tháo gỡ những khó khăn trong suốt quá trình nghiên cứu và làm luận án.
Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc đến PGS TS Võ Thị Bích Thủy - Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam - Người thầy đã sát sao dìu dắt, truyền lại cho tôi phương pháp mới về nghiên cứu phân tích trình tự hệ gen ty thể cũng như niềm say mê nghiên cứu về Hệ gen học.
Trong suốt quá trình thực hiện Đề tài nghiên cứu, tôi đã nhận được sự giúp
đỡ tận tình về chuyên môn của các nhà khoa học, các cán bộ nghiên cứu công tác tại Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam Bằng những tình cảm chân thành nhất, tôi xin trân trọng cảm ơn những sự giúp đỡ quý báu đó.
Nhân dịp này, tôi xin chân thành cảm ơn Ban Giám đốc, tập thể cán bộ Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Lãnh đạo Khoa Công nghệ sinh học và các phòng ban nghiệp vụ trong Học viện đã giúp đỡ, tạo điều kiện thuận lợi nhất cho tôi trong suốt quá trình học tập và tham gia nghiên cứu đề tài luận án.
Nhân đây, tôi xin bày tỏ lòng biết ơn sâu sắc tới lãnh đạo Viện Khoa học hình sự - Bộ Công an; lãnh đạo, đồng nghiệp tại Trung tâm Giám định Sinh học - Viện Khoa học hình sự đã hết sức tạo điều kiện thuận lợi, giúp đỡ tôi trong công việc học tập và tham gia nghiên cứu để hoàn thành luận án này.
Tôi xin gửi lời cám ơn thân ái tới gia đình, những người thân và bạn bè đã luôn bên cạnh, yêu thương, khích lệ và ủng hộ tôi trong suốt thời gian qua.
Hà Nội, ngày tháng năm 2020
Tác giả
Bùi Anh Tuấn
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIỆT TẮT v
DANH MỤC CÁC BẢNG vi
DANH MỤC CÁC HÌNH vii
MỞ ĐẦU 1
Chương 1 TỔNG QUAN TÀI LIỆU 4
1.1 Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà 4
1.1.1 Nguồn gốc 4
1.1.2 Phân loại 5
1.1.3 Quá trình thuần hóa 5
1.2 Đặc điểm và một số ứng dụng của hệ gen ty thể 7
1.2.1 Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú 7
1.2.2 Một số ứng dụng của hệ gen ty thể 9
1.3 Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh chủng loại phân tử 11
1.3.1 Cây phát sinh chủng loại 11
1.3.2 Phân tích phát sinh chủng loại 13
1.4 Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn 17
1.4.1 Nghiên cứu các giống lợn trên thế giới 17
1.4.2 Nghiên cứu giống lợn Việt Nam 19
Chương 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 25
2.1 Đối tượng và địa điểm nghiên cứu 25
2.1.1 Đối tượng 25
2.1.2 Địa điểm 25
2.2 Hóa chất và thiết bị 28
2.2.1 Hóa chất 28
2.2.2 Thiết bị 30
2.3 Phương pháp nghiên cứu 30
2.3.2 Phương pháp tách chiết DNA tổng số 32
2.3.3 Khuếch đại mtDNA 33
2.3.4 Xác định trình tự hệ gen ty thể 33
2.3.5 Nhóm phương pháp lắp ráp, dóng hàng trình tự, dự đoán và chú giải hệ gen 35
Trang 62.3.6 Phân tích trình tự và phương pháp xác định mức độ tương đồng trình tự
38
2.3.7 Phương pháp xây dựng cây và phân tích chủng loại phát sinh 39
Chương 3 KẾT QUẢ VÀ THẢO LUẬN 41
3.1 Chọn lựa, thu thập mẫu 41
3.2 Trình tự hệ gen ty thể của 6 giống lợn bản địa 45
3.2.1 Tách chiết DNA tổng số của 6 giống lợn nghiên cứu 45
3.2.2 Khuếch đại phân đoạn hệ gen ty thể (mtDNA) của 6 giống lợn bằng PCR 48 3.2.3 Xác định trình tự các phân đoạn DNA của hệ gen ty thể 49
3.3 Phân tích hệ gen ty thể 53
3.3.1 Phân tích thành phần hệ gen ty thể 53
3.3.2 Chú giải cấu trúc hệ gen ty thể 66
3.3.3 Cấu trúc thành phần của các gen RNA vận chuyển 69
3.3.4 Phân tích cấu trúc bậc hai của các tRNA 70
3.4 So sánh đa hình trình tự 82
3.4.1 Trình tự vùng D-loop 74
3.4.2 Trình tự vùng mã hóa hệ gen ty thể 80
3.5 Phân tích về quan hệ phát sinh chủng loại 86
3.5.1 Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự vùng D-loop.87 3.5.2 Phân tích cây phát sinh chủng loại dựa trên dữ liệu trình tự hoàn chỉnh 91
4.1 Kết luận 99
4.2 Kiến nghị 99
DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ 100
TÀI LIỆU THAM KHẢO 101
PHỤ LỤC 110
Phụ lục 1 - Nguồn gốc, phân bố, đặc điểm ngoại hình, khả năng sinh trưởng 6 giống lợn bản địa Việt Nam 110
Phụ lục 2 - Điện di đồ sản phẩm PCR sau tinh sạch của 6 giống lợn bản địa Việt Nam 113
Phụ lục 3 - Trình tự hoàn chỉnh hệ gen ty thể của 6 giống lợn bản địa Việt Nam 118
Trang 7Internal transcribed spacer.
Monte Carlo Markov ChainMitochondrial DNA
National Center for Biotechnology Information
Operational taxonomic unitPolymerase chain reactionRibosomal DNA
Ribonucleic acidRibosome RNAStandard deviationSingle nucleotide polymorphismTransfer RNA
Unweighted-pair group method with arithmetic mean
Trang 8DANH MỤC CÁC BẢNG
Bảng 1.1 Phân loại lợn nhà 5
Bảng 1.2 Các loại thay thế đơn phân trong phân tử DNA 12
Bảng 1.3 Phân bố các giống lợn bản địa Việt Nam 22
Bảng 2.1 Mã số truy cập dữ liệu trình tự hệ gen ty thể của các giống lợn Âu Á và phân bố địa lý được sử dụng trong nghiên cứu 27
Bảng 2.2 Các cặp mồi được sử dụng cho PCR và vị trí các phân đoạn 29
được khuếch đại 29
Bảng 2.3 Thành phần phản ứng PCR 33
Bảng 2.4 Thành phần phản ứng giải trình tự 34
Bảng 3.1 Kết quả khảo sát lông da của 6 giống lợn bản địa 43
Bảng 3.2 Kết quả khảo sát đặc khối lượng và kích thước của 6 giống lợn bản địa413 Bảng 3.3 Khảo sát đặc điểm hình dáng cơ thể của 6 giốn bản địa 43
Bảng 3.4 Kết quả định lượng và kiểm tra độ tinh sạch của DNA tổng số 45
Bảng 3.5 Kết quả sau chỉnh sửa chuẩn bị cho lắp ráp 50
Bảng 3.6 Kết quả lắp ráp hệ gen hoàn chỉnh 6 giống lợn bản địa Việt Nam 51
Bảng 3.7 Tỷ lệ thành phần các loại base trong trình tự hệ gen ty thể của 6 giống lợn bản địa Việt Nam. 53
Bảng 3.8 Thành phần trình tự của các nhóm lợn phân bố theo khu vực địa lý 55
Bảng 3.9 Cấu trúc của hệ gen ty thể lợn Móng Cái 59
Bảng 3.10 Cấu trúc của hệ gen ty thể lợn Mường Lay 60
Bảng 3.11 Cấu trúc của hệ gen ty thể lợn Mường Khương 70
Bảng 3.12 Cấu trúc của hệ gen ty thể lợn Hạ Lang 62
Bảng 3.13 Cấu trúc của lợn Hương 62
Bảng 3.14 Cấu trúc của hệ gen ty thể lợn Ỉ 64
Bảng 3.15 Thành phần nucleotide của 22 gen tRNA của hệ gen 6 giống lợn bản địa Việt Nam 69
Bảng 3.16 So sánh độ tương đồng giữa các trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam với các giống lợn trên thế giới 75
Bảng 3.17 Các vị trí SNP trình tự vùng D-loop của 6 giống lợn bản địa Việt Nam 77 Bảng 3.18 So sánh tương đồng các trình tự vùng mã hóa hệ gen ty thể của 6 giống lợn Việt Nam với các giống lợn trên thế giới 81
Trang 9DANH MỤC CÁC HÌNH
Hình 1.1 Nguồn gốc thuần hóa lợn nhà 4
Hình 1.2 Cấu trúc hệ gen ty thể ở động vật có vú 8
Hình 1.3 Mô tả phương pháp neighbor-joining 15
Hình 2.1 Bản đồ địa điểm thu mẫu 26
Hình 2.2 Sáu giống lợn bản địa Việt Nam được sử dụng trong nghiên cứu 27
Hình 2.3 Sơ đồ tổng quát các bước nghiên cứu 30
Hình 2.4 Các bước lắp ráp hệ gen ty thể 35
Hình 3.1 A Điện di đồ DNA tổng số của giống lợn Ỉ và Hạ Lang 47
Hình 3.1 B Điện di đồ DNA tổng số của giống lợn Mường Lay và Hương 47
Hình 3.1 C Điện di đồ DNA tổng số tách chiết từ giống lợn Móng Cái và Mường Khương 48
Hình 3.2 Sản phẩm PCR sau tinh sạch đối với giống lợn Hương 49
Hình 3.3.A.B Cấu trúc dạng vòng của hệ gen ty thể lợn Móng Cái, lợn Mường Lay được xây dựng bởi phần mềm GenomeVx. 66
Hình 3.3.C.D Cấu trúc dạng vòng của hệ gen ty thể lợn Mường Khương, Hạ Lang được xây dựng bởi phần mềm GenomeVx. 67
Hình 3.3.E.F Cấu trúc dạng vòng của hệ gen ty thể lợn Hương và Ỉ được xây dựng bởi phần mềm GenomeVx. 68
Hình 3.4.A,B,C,D,E,F Cấu trúc bậc hai của 22 loại tRNA được mã hóa trên hệ gen ty thể lợn Móng Cái (A), Mường Lay (B), Mường Khương (C), Hạ Lang (D), Hương (E) và Ỉ (F). 73
Hình 3.5 Vị trí khác biệt trên trình tự vùng D-loop của các giống lợn bản địa Việt Nam và các giống lợn đã được công bố sau khi dóng hàng đa trình tự 78
Hình 3.6 Một phần trình tự D-loop của lợn Ỉ và các giống lợn đã được công bố sau khi tiến hành sắp xếp. 79
Hình 3.7 Biến thể trình tự tại vị trí nucleotide 2250 vùng mã hóa hệ gen ty thể các giống lợn 82
Hình 3.8 Biến thể trình tự tại vị trí nucleotide 11318 trình tự vùng mã hóa hệ gen ty thể các giống lợn 83
Hình 3.9 Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được công bố sau khi tiến hành sắp xếp. 85
Hình 3.10 Cây phát sinh chủng loại vùng D-loop 90
Hình 3.11 Cây phát sinh chủng loại của trình tự hoàn chỉnh 92
Trang 10MỞ ĐẦU
Lợn nhà là loài vật có mối liên hệ lâu đời với con người, là một chi động vậtmóng guốc có nguồn gốc ở đại lục Á - Âu Ngành chăn nuôi lợn phát triển vớinhững xu hướng cải tạo năng suất, chất lượng của vật nuôi, nhiều giống lợn đượcnhập nội để cải tiến các giống lợn địa phương cùng với việc khai thác theo kiểu tậndiệt đã tạo ra không ít áp lực đối với vấn đề bảo tồn nguồn gen bản địa Bên cạnh
đó, hiện nay cũng có xu hướng quay lại chăn nuôi các giống lợn bản địa vì các ưuđiểm nổi trội: thịt ngon, ít bệnh tật, khả năng thích nghi cao, giá trị kinh tế lớn
Việt Nam có khoảng 26 giống lợn bản địa, trong số đó có những giống thuộcDanh mục nguồn gen vật nuôi quý hiếm cần được bảo tồn Lợn Ỉ nguồn gốc ở tỉnhNam Định, ngày nay ít được nuôi do hiệu quả kinh tế không cao và đang đối diệnnguy cơ lớn tuyệt chủng Đặc biệt, lợn Ỉ được đưa vào Danh mục nguồn gen vậtnuôi quý hiếm cần được bảo tồn Lợn Móng Cái là giống lợn nội được hình thành
và phát triển lâu đời, xuất xứ từ thành phố Móng Cái, tỉnh Quảng Ninh, với khảnăng sinh sản khá cao Lợn Mường Khương với ưu điểm thích ứng tốt trong điềukiện tự nhiên, có chất lượng thịt thơm ngon và là một giống lợn gắn liền với đờisống người H’Mông, thuộc tỉnh Lào Cai Giống lợn Hương có lớp mỡ mang mùithơm tự nhiên, được nuôi rộng rãi ở địa bàn biên giới phía Bắc thuộc tỉnh Cao Bằng.Lợn Mường Lay được chăn nuôi chủ yếu ở địa bàn thị xã Mường Lay, tỉnh ĐiệnBiên, đây là giống lợn phàm ăn, có tính kháng bệnh tốt Lợn Hạ Lang cũng phân bố
ở tỉnh Cao Bằng, như các giống lợn bản địa khác, quần thể lợn Hạ Lang đang ngàycàng bị thu hẹp
Hiện tại, các giống lợn bản địa đang giảm dần về số lượng, đang mất đi mộtnguồn gen quý của địa phương và quốc gia Để cứu vãn các giống lợn bản địa quýhiếm, hiện các nhà khoa học đang cố gắng nỗ lực bảo tồn nguồn gen của chúng.Đến nay, chưa có công trình nghiên cứu khoa học đầy đủ nào về hệ gen của cácgiống lợn bản địa Việt Nam, nhằm làm sáng tỏ nguồn gốc và quan hệ phát sinhchủng loại, phục vụ cho công tác bảo tồn nguồn tài nguyên quý hiếm này Việc xâydựng cơ sở dữ liệu phân tử về nguồn gen của các giống lợn này vẫn chưa được tiếnhành và khai thác một cách đầy đủ Để giải quyết các vấn đề nêu trên, chúng tôi tiến
hành nghiên cứu đề tài: “Xác định và phân tích hoàn chỉnh trình tự hệ gen ty thể
Trang 11của 6 giống lợn bản địa tại một số tỉnh Miền Bắc Việt Nam” với các mục tiêu và
nội dung sau:
Mục tiêu nghiên cứu:
- Thu được dữ liệu hoàn chỉnh hệ gen ty thể của sáu giống lợn bản địa ViệtNam (lợn Ỉ, lợn Móng Cái, lợn Mường Lay, lợn Hương, lợn Mường Khương và lợn
Hạ Lang), đăng ký trên Ngân hàng gen
- Xác định được thành phần, cấu trúc hệ gen ty thể, so sánh sự sai khác trình
tự, xác định đặc điểm di truyền đặc trưng của sáu giống lợn bản địa trên, qua đóđóng góp vào cơ sở dữ liệu phục vụ công tác nhận dạng và bảo tồn
- Xác định được mối quan hệ về di truyền, nhận định nguồn gốc, phát sinh chủng loại của sáu giống lợn bản địa Việt Nam
Nội dung nghiên cứu:
- Điều tra, khảo sát về giống, nơi cư trú, thu thập mẫu máu của của 6 giống lợn bản địa nghiên cứu
- Giải trình tự toàn bộ hệ gen ty thể của 6 giống lợn bản địa
- Lắp ráp, xác định trình tự hoàn chỉnh toàn bộ hệ gen ty thể và chú giải
- Phân tích thành phần, cấu trúc hệ gen
- Nghiên cứu đa hình trình tự, so sánh trình tự hệ gen ty thể của 6 giống lợn này với một số giống lợn ở Châu Á, Châu Âu
- Xây dựng cây phát sinh chủng loại dựa trên trình tự vùng D-loop và trình tựhoàn chỉnh của hệ gen ty thể, phân tích mối quan hệ nguồn gốc phát sinh chủng loạigiữa 6 giống lợn bản địa và một số giống lợn khác trên thế giới
Đóng góp mới của luận án:
- Đã giải trình tự hoàn chỉnh hệ gen ty thể của sáu cá thể lợn bản địa ViệtNam (lợn Ỉ, lợn Móng Cái, lợn Mường Khương, lợn Mường Lay, lợn Hương và lợn
Hạ Lang) dữ liệu đã công bố trên ngân hàng Genbank
- Đã phân tích, chú giải, dự đoán cấu trúc chức năng hệ gen ty thể của sáu cá thể lợn nghiên cứu
- Xây dựng giả thuyết về nguồn gốc của giống lợn Hương và Hạ Lang có thể
là cùng một nguồn gốc
Ý nghĩa khoa học và thực tiễn:
- Luận án có ý nghĩa thực tiễn trong việc xác định nguồn gốc di truyền của
Trang 12sáu giống lợn bản địa sử dụng trong nghiên cứu Kết quả của luận án là nguồn dữliệu quan trọng trong các nghiên cứu về phát sinh chủng loại, tiến hóa phân tử, cũngnhư các nghiên cứu khác nhằm nhận diện, đánh giá và sử dụng giống lợn bản địaViệt Nam, góp phần hiệu quả cho việc bảo tồn và sử dụng bền vững nguồn gen này.
- Các bài báo đăng tải trên các tạp chí khoa học - công nghệ quốc tế và trongnước cùng với các trình tự hệ gen công bố trên Ngân hàng Gen (GenBank - NCBI)
là những tư liệu có giá trị tham khảo trong nghiên cứu và giảng dạy
- Những kết quả của nghiên cứu đã đóng góp vào thư viện nguồn gen củamột số giống bản địa trong ngân hàng gen quốc gia và quốc tế Luận án sẽ tạo tiền
đề cho phát triển các nghiên cứu tiếp theo trên các giống lợn bản địa, cũng như cácgiống vật nuôi khác của Việt Nam
Trang 13Chương 1 TỔNG QUAN TÀI LIỆU
1.1 Nguồn gốc, phân loại và quá trình thuần hóa lợn nhà
1.1.1 Nguồn gốc
Có quan điểm cho rằng giống lợn nhà hiện nay (S scrofa) bắt nguồn từ hai nhóm lợn rừng hoang dã là lợn rừng Châu Âu (S scrofaferus) và lợn rừng Châu Á (Sus orientalis, Sus cristatus, Sus vittatus), được con người thuần hoá trong thời
gian dài mà thành Căn cứ vào hình dáng của tai, người ta chia cả hai nhóm lợnnguyên thuỷ Châu Âu và Châu Á thành hai loại: Lợn tai dài và lợn tai ngắn Cácgiống lợn nhà nuôi hiện nay hình thành từ các giống lợn cổ đại trước kia thông quacác phương pháp tạp giao khác nhau [1] Nguồn gốc các giống lợn được tóm tắt ởhình 1.1
Đang
tiếp tục
~ 200 năm
~ 10.000 năm
Phân chia ~ 1,2 triệu năm
Hình thành loài Sus ~ 4-2 triệu năm
Hình 1.1 Nguồn gốc thuần hóa lợn nhà [2]
Lịch sử nguồn gốc của lợn nhà được cho là đã trải qua 5 sự kiện lớn: (1) Sựhình thành loài Sus ở khu vực Đông Nam Á, (2) Quá trình phân ly thành hai dòngChâu Âu và Châu Á, (3) Quá trình thuần hóa độc lập dẫn đến sự phân tách thành hainhánh Châu Âu và Châu Á, (4) Sự tạp giao giữa lợn nhà Châu Âu và Châu Á và (5)
là quá trình hình thành các giống lợn ngày nay [2]
Trang 141.1.2 Phân loại
Lợn nhà thường được cho là một phân loài từ tổ tiên hoang dã của chúng
-lợn rừng, chúng được đặt tên sinh học là S scrofa domesticus [3] Một số nhà phân loại học lại cho rằng lợn nhà là một loài riêng và gọi tên chúng là Sus domesticus, lợn rừng là S scrofa [4] Bảng 1.1 minh họa về cách phân loại khoa học lợn nhà
thuộc các đơn vị phân loại sau:
Họ lợn bao gồm 3 họ phụ (Phacochoerinae warthogs, Suinae, Babyrouinae).
Các giống lợn được phân thành các giống lợn chính và phụ, có 25 giống lợn phụ và
4 giống lợn chính 4 giống phụ trong 25 giống phụ đã được thuần hóa và đưa vào sửdụng hiện nay đã cho thấy mối quan hệ họ hàng và nguồn gốc chung của các loạigiống lợn trên thế giới [5]
Trong loài Sus (bao gồm các chủng và thứ chủng) có nhiều đại diện rải rác
khắp các lục địa, chính là nguồn gốc trực tiếp của các giống lợn nguyên thủy còntồn tại cho đến ngày nay
1.1.3 Quá trình thuần hóa
Tổ tiên xa xưa của lợn là lợn rừng, đã được săn bắn để cung cấp thực phẩmcho cuộc sống của người nguyên thủy Dần dần họ nhận ra thay vì săn bắn, việcthuần hóa nuôi dưỡng lợn được tiến hành dễ dàng và thuận lợi hơn để cung cấp thựcphẩm cho con người Quá trình thuần hóa và chăn nuôi lợn là quá trình phát triểnliên tục, phụ thuộc lớn vào sự lai tạo giữa lợn đã được thuần hóa với lợn rừng địaphương, đặc biệt là lợn nái hoang dã Nhiều loài lợn rừng tồn tại trên thế giới hiện
nay như loài lợn rừng Châu Phi (warthog) Phacochoreus africanus, lợn lùn (pigmy hog) Porcula salvania và lợn nhỏ (pig-deer) Babyrousa babyrussa; nhưng chỉ có S.
Trang 15scrofa (lợn rừng) là đã được thuần hóa Do đó, tất cả các giống lợn hiện nay được
coi là các dạng của S scrofa domestica [2].
Các bằng chứng về phát sinh chủng loại địa lý cho thấy quá trình thuần hóalợn diễn ra nhiều lần ở nhiều nơi trên thế giới Về thời điểm thuần hóa, các nhà khảo
cổ học dựa vào những di chỉ khảo cổ (chủ yếu là xương sọ) đã cho rằng lợn đượcthuần hóa vào khoảng 9000 năm về trước [6], thậm chí từ rất sớm vào khoảng13.000 đến 12.700 năm trước Công nguyên ở Cận Đông [7] Lợn nhà đã được xácđịnh có mặt ở đảo Síp từ khoảng 11.400 năm trước Công Nguyên, chúng được dunhập từ đất liền, đồng nghĩa với việc chúng đã được thuần hóa trong đất liền
[8] Cũng có nghiên cứu khẳng định sự thuần hóa lợn diễn ra một cách riêng biệt ở Trung Quốc cách đây khoảng 8000 năm [1]
Về địa điểm thuần hóa, quá trình thuần hóa lợn diễn ra đầu tiên ở khu vựcCận Đông và diễn ra lặp lại từ các quần thể lợn hoang dã ở từng khu vực khác nhautrên thế giới [9] Sau khi được thuần hóa, lợn được phân tán đến Châu Âu và đếncác vùng nội địa khác Cũng có giả thuyết về sự thuần hóa lợn diễn ra ở một sốtrung tâm thuần hóa lợn trên thế giới, đầu tiên có thể kể đến là lục địa Đông Nam Á.Theo một nghiên cứu của Larson (2005), các giống lợn được thuần hóa bắt nguồn từcác quần thể lợn hoang, tổ tiên của lợn ngày nay được xác định là lợn rừng nguyênthủy và quê hương của chúng chính là vùng Đông Nam Á [10] Sau khi được thuầnhóa ở Đông Nam Á, lợn theo con người đến các vùng khác của lục địa Á Âu(Eurasia) và ra các đảo Thái Bình Dương [11] Trong một nghiên cứu khác, DNAcủa các giống lợn thuộc các hải đảo Thái Bình Dương và lợn không lông ở Vanuatu
đã được phân tích để khẳng định rằng, lợn tại các hải đảo này cũng xuất phát vàđược thuần hóa từ lục địa Đông Nam Á (đặc biệt là từ Việt Nam) khoảng 3000 nămtrước đây [11] Sau đó, chúng theo con người "di cư" ra khỏi lục địa và đến các hảiđảo như Vanuatu và Lưu Cầu
Ở Trung Quốc, có công bố cho rằng những con lợn thuần hóa đầu tiên tạivùng Jiahu ở thời kỳ Đồ đá mới [12] Từ quá trình thuần hóa đầu tiên, lợn đã trởthành vật nuôi chính ở Trung Quốc Tập tục nuôi nhốt từ sớm của người nông dânTrung Quốc làm cho quá trình thuần hóa lợn ở Trung Quốc diễn ra nhanh hơn sovới ở khu vực Tây Á, Châu Âu
Trang 16Nghiên cứu của Larson và cs (2007) cho rằng sự hiện diện tại Châu Âu củalợn nhà có tổ tiên ở vùng Cận Đông vào thời kỳ Đồ đá mới [13] Bằng chứng khảo
cổ học cũng chứng minh lợn nhà lần đầu được khai thác ở Bắc Âu vào khoảng 4100năm trước Công Nguyên [14] Ngay sau khi lợn có nguồn gốc Cận Đông được đưavào Châu Âu, những người nông dân đã kết hợp lợn rừng địa phương vào đàn lợncủa họ Bắt đầu từ khoảng 7.000 năm trước, người Trung Á chuyển đến Châu Âu,mang theo vật nuôi bản địa và cả cây trồng Nhưng có thể cùng thời điểm ấy, lợnrừng tại Châu Âu cũng được thuần hóa, khi đó lợn rừng bản địa Châu Âu nhanhchóng thay thế sự có mặt của lợn nhà có nguồn gốc Cận Động trên phạm vi khắpChâu Âu Do đó, không phải con lợn nào có nguồn gốc Cận Đông cũng trở thành tổtiên của giống lợn Châu Âu ngày nay
Công trình nghiên cứu dựa trên trình tự mtDNA của 48 giống lợn bản địa tạiTrung Quốc và Đông Nam Á cho thấy khoảng cách tiến hóa tương đương và tươngđối gần giữa lợn rừng Châu Âu với các giống lợn kiểu Âu và giống lợn kiểu Á, đưađến một luận điểm là lợn rừng Châu Âu có thể là tổ tiên của cả giống lợn nhà Châu
Âu và Châu Á [15] Theo Kim và cs (2002), đa dạng di truyền ở lợn thương phẩmlớn hơn trong các quần thể lợn rừng hiện nay Các ghi chép lịch sử cho thấy lợnChâu Á đã được đưa vào Châu Âu trong thế kỷ 18 và đầu thế kỷ 19 [15] Thời điểmnày ở nước Anh, nhu cầu về thịt lợn tăng cao, các nhà lai tạo giống đã nhập khẩumột số cá thể lợn của Trung Quốc và lai chúng với những con lợn Châu Âu Đadạng di truyền lớn trong các giống lợn thương mại hiện nay là kết quả của phép laigiữa lợn Châu Âu và lợn Trung Quốc trong khoảng 200 năm về trước Các bằngchứng phân tử về sự du nhập gen đã chỉ ra nguồn gốc lai của một số giống lợn Châu
Âu chính Lợn thương phẩm của Châu Âu hiện đại có chứa DNA nguồn gốc từ lợnChâu Á [15]
1.2 Đặc điểm và một số ứng dụng của hệ gen ty thể
1.2.1 Đặc điểm cấu trúc hệ gen ty thể ở động vật có vú
Ty thể là một bào quan dạng hình gậy hoặc hình hạt nằm trong nguyên sinhchất của tế bào, có hệ di truyền độc lập và di truyền theo dòng mẹ Hệ gen ty thể củađộng vật có vú có cấu tạo DNA mạch vòng với kích thước tổng thể khoảng 16,6 kb
mã hóa 13 chuỗi polypeptide Hai sợi trên mạch kép của mtDNA được phân biệtthành chuỗi nặng (H) và chuỗi nhẹ (L) dựa theo tỷ lệ thành phần bất đối xứng của
Trang 17Guanine và Cytosine [16] Bên cạnh các gen mã hóa protein, mtDNA cũng mã hóa
cho 22 tRNA và 2 rRNA (12S và 16S rRNAs) Các rRNA và 14 trong số 22 tRNA
được mã hóa bởi các gen nằm trên chuỗi H [17] Các gen không chứa intron vàngoại trừ một số vùng điều hòa bao gồm các promoter và điểm khởi đầu sao chéptrên chuỗi H [18] Sơ đồ cấu trúc hệ gen ty thể ở động vật có vú được trình bày tại
hình 1.2.
Chuỗi H
mtDNA genome
Chuỗi L
Hình 1.2 Cấu trúc hệ gen ty thể ở động vật có vú [19]
Trong nhiều trường hợp, một phần của bộ ba kết thúc tuy không được mã hóanhưng được tạo ra bởi quá trình gắn đuôi polyA sau phiên mã [20] Mã di truyềncủa mtDNA ở động vật có xương sống khác mã di truyền trong nhân Cụ thể, thay
vì là một bộ ba kết thúc, bộ ba TGA mã hóa Tryptophan trong ty thể của động vật
có xương sống Bộ ba ATA mã hóa Methinonine ở ty thể nhưng lại mã hóa choIsoleucine, và AGA hoặc AGG trong mã bộ ba của ty thể là bộ ba kết thúc thay vì
mã hóa Arginine [21]
So với hệ gen nhân, hệ gen ty thể chứa rất ít trình tự không mã hóa xen kẽ
với vùng mã hóa Vùng D-loop nằm giữa gen tRNAPhe (gen MT-TK) và tRNAPro
(gen MT-TP) là vùng không mã hóa lớn nhất và có vai trò quan trọng trong điều hòaquá trình sao chép và phiên mã của hệ gen ty thể, chứa promoter cho sự phiên mãchuỗi H và chuỗi L, chứa điểm khởi đầu của quá trình sao chép Hệ gen ty thể saochép độc lập với hệ gen nhân bằng một hệ thống riêng trong ty thể nhưng cácenzyme cho quá trình sao chép lại do hệ gen nhân mã hóa [18] Quá trình phiên mã
Trang 18và dịch mã của DNA ty thể lại được điều khiển bởi gen nhân Hệ gen ty thể đƣợcphiên mã từ một điểm khởi đầu nằm trên vùng D-loop, bản phiên mã sau đó đượcendonuclease phân cắt để hình thành nên phân tử rRNA 12S và 16S, tRNA vàmRNA tiền thân Phân tử mRNA hoàn thiện của ty thể không được gắn mũ nhưng
có đuôi polyA [22]
Vùng D-loop của hệ gen ty thể ở động vật có vú có mức độ bảo thủ nhất định
ở các vùng promoter và ba vùng CSB (Conserved Sequence Blocks) Các vùngCSB được cho là có liên quan đến quá trình sao chép của mtDNA, đặc biệt vùngCSB-I nằm ngay vị trí khởi đầu tổng hợp chuỗi H DNA Vùng D-loop không mãhóa cho bất kì một protein nào và có tốc độ tiến hóa cao hơn nhiều so với các khuvực khác của hệ gen ty thể Phần chính của vùng D-loop bao gồm các trình tựkhông mã hóa và các vùng siêu biến (HV1 và HV2) Mặc dù tỉ lệ đột biến chungtrong các vùng siêu biến là cao hơn hẳn so với phần còn lại của mtDNA, tuy nhiênmột số vị trí nucleotide được xem là những điểm nóng (hot-spot) cho sự biến đổi.Hai vùng HV1 và HV2 tương ứng ở khoảng vị trí 16024-16383 và 57-372 [18]
mtDNA có độ bảo tồn cao, dễ khuếch đại bởi tồn tại nhiều bản sao trong tếbào, trình tự hệ gen ty thể có sự bảo thủ nhất định giữa các loài động vật, với ít sựtrùng lặp, không chứa intron, các vùng intergenic ngắn [23] Đây là những đặc điểmgiúp mtDNA được ứng dụng trong nhận dạng cá thể, phân loại, phát sinh chủng loại
và xác định nguồn gốc
1.2.2 Một số ứng dụng của hệ gen ty thể
1.2.2.1 Ứng dụng trong phân loại học và định danh loài
Hệ gen ty thể mặc dù có kích thước nhỏ so với kích thước toàn bộ hệ gen củasinh vật nhưng nó lại được coi là một chỉ thị phân tử phổ biến ở động vật Đã có rấtnhiều những nhà di truyền học quần thể và hệ thống học áp dụng các trình tự trên hệgen ty thể trong nghiên cứu Một số nghiên cứu đã sử dụng các gen ty thể như là
những marker phân tử (DNA barcode) Bên cạnh gen 16S rRNA, 12S rRNA,
Cytochrome b, nhiều nghiên cứu đã xác định rằng gen ty thể cytochrome c oxidasesubunit I [24] có thể đóng vai trò cốt lõi như một hệ thống xác định sinh học phân
loại động vật [25] Sự tiến hóa của gen COI cho phép phân biệt không chỉ giữa các
loài gần nhau, mà còn trong cùng một loài [26] Trong phân loại phân tử hoặc địnhdanh sinh vật, trình tự DNA được sử dụng như “barcodes”, dùng để phân loại
Trang 19nhóm Một nghiên cứu tiêu biểu sử dụng gen COI trong định danh loài bò, lợn, gia
cầm là công trình của Spychaj và cs (2016) Nghiên cứu này đã phát triển một
phương pháp tự thiết kế mồi để khuếch đại trình tự gen COI để nhận dạng sản phẩm thịt từ 3 loài động vật trên [27] Cũng sử dụng đoạn gen COI, nhưng nhóm tác giả
Dawnay sử dụng cặp mồi phổ dụng để phân định loài gia súc và gia cầm [28] Cácnghiên cứu đã cho thấy mtDNA trở thành một công cụ hữu hiệu trong việc địnhdanh sinh vật ở cấp độ loài hoặc dưới loài
1.2.2.2 Ứng dụng trong nghiên cứu phát sinh chủng loại, xác định nguồn gốc
mtDNA có độ đa dạng cao trong quần thể tự nhiên do tỷ lệ đột biến lớn, trởthành các bằng chứng cho lịch sử phát triển của quần thể
Các kĩ thuật phân tích trình tự mtDNA để xác định mối quan hệ về phát sinhchủng loại đã được sử dụng phổ biến dựa trên nguyên lý: thông tin về quá trình tiếnhóa có thể thu được qua phân tích dữ liệu về trình tự Một số tác giả đã tiến hành sosánh sự đa hình các trình tự để xác định mối quan hệ về tiến hóa giữa những cá thểtrong cùng loài hoặc các loài có quan hệ gần, thời gian phân ly ngắn [29, 15, 30].Bên cạnh đó, mức độ đa dạng và tiểu cấu trúc địa lý trong một nhóm hay giữa các
nhóm cá thể sinh vật cũng sẽ được làm sáng tỏ [31] Hệ gen ty thể của lợn (S.
scrofa) được giải trình tự hoàn chỉnh đầu tiên vào năm 1998 [32], là tiền đề cho các
công trình khoa học được tiến hành dựa trên những dữ liệu hoàn chỉnh hệ gen ty thểcủa các giống lợn nhà và lợn rừng
Ở mtDNA, sự tiến hóa đa dạng hơn so với DNA nhân [33, 34] Sự tiến hóacủa mtDNA ở động vật có vú diễn ra trước hết từ sự thay thế các cặp base đơn, hơn
là việc tái sắp xếp các phân đoạn lớn của trình tự [18] mtDNA di truyền theo dòng
mẹ, đơn bội và không tái tổ hợp [35] Những đặc điểm trên đây khiến mtDNA làmột trong những chỉ thị phổ biến nhất được sử dụng nhằm xác định mối quan hệgiữa các cá thể trong cùng loài và giữa các loài có mối quan hệ gần, thời gian phân
ly ngắn
Đối với hệ gen ty thể, vùng D-loop được cho là vùng có nhiều sự biến đổihơn các vùng khác [36] Trong suốt nhiều thập kỷ qua, vùng D-loop của hệ gen tythể đã được sử dụng trong các phân tích chủng loại phát sinh Hai vùng siêu biến(HV1 và HV2) được sử dụng nhiều cho nghiên cứu tiến hóa, xác định quan hệ huyếtthống dòng mẹ ở sinh vật nhân thực Eukaryotes và đặc biệt ở người [37, 38] Thông
Trang 20qua phân tích hệ gen ty thể ở các loài động vật có vú, sự phân ly về trình tự mtDNAđược xác định cứ mỗi 2 triệu năm diễn ra khoảng 2%, tương đương với tốc độ thaythế nucleotide là 1x10-8 sự thay thế/vịtrí/năm ở mỗi giống [34] Ở các loài gia súcnói riêng, tốc độ thay thế các nucleotide ở vùng D-loop được cho là khoảng 1,5.10-
7
/vị trí/năm [39] Một số công trình nghiên cứu dựa trên độ đa hình trình tự vùng loop nhằm xác định khoảng thời gian từ lúc phân ly thành các nhánh lợn Châu Âu
D-và Châu Á, qua đó đưa ra những đánh giá về phát sinh chủng loại [15, 40]
Tất cả những đặc điểm, cấu trúc, đặc tính sinh học đã giúp hệ gen ty thể trởthành một chỉ thị phân tử phổ biến được sử dụng trong nghiên cứu đa dạng sinh học
và quan hệ phát sinh chủng loại cũng như xác định nguồn gốc tiến hóa
1.3 Phát sinh chủng loại phân tử, xây dựng và phân tích cây phát sinh
chủng loại phân tử
Nghiên cứu về phát sinh chủng loại có thể sử dụng các bằng chứng về hìnhthái từ những loài đang sống và dữ liệu hóa thạch hoặc dựa trên lượng dữ liệukhổng lồ về phân tử [41] Trong ngành phát sinh chủng loại phân tử, người tanghiên cứu mối quan hệ giữa các loài sinh vật thông qua các bằng chứng phân tử, cụthể là trình tự DNA và protein Như vậy, sự khác biệt giữa các trình tự quy định sựphân ly di truyền, được coi là kết quả của tiến hóa phân tử theo tiến trình thời gian.Các mối quan hệ về tiến hóa được suy luận ra, chúng thường được biểu diễn dướidạng cây tiến hóa, qua đó có thể cung cấp các giả thuyết về những sự kiện sinh họcxảy ra trong quá khứ [42] Tất cả các dạng sống đều có chung một nguồn gốc tổ tiên
và là một phần của cây sự sống Hơn 99% các loài từng sống sót đã bị tuyệt chủng[43], do đó, suy luận phát sinh chủng loại là suy luận các dữ kiện trong quá khứ.Suy luận phát sinh chủng loại sử dụng các đặc điểm chung giữa hai loài (có thể làđặc điểm hình thái hoặc đặc điểm ở cấp độ nhiễm sắc thể, các trình tự phân tử) Phátsinh chủng loại cũng giúp ước lượng khoảng thời gian phân ly giữa các sinh vật tính
từ thời điểm chúng cùng chia sẻ một tổ tiên chung cuối cùng
1.3.1 Cây phát sinh chủng loại
Cây phát sinh chủng loại nêu lên một giả thuyết về các sinh vật trên cây đã
có quan hệ họ hàng với nhau như thế nào [42] Mỗi nhóm loài có thể có nhiều dạngphát sinh, phải lựa chọn dạng phát sinh nào được coi là đúng nhất Cách lựa chọnphụ thuộc vào các phương pháp suy luận chứ không phải là quan sát hoặc tiến
Trang 21hành thí nghiệm bởi những sự kiện phân chia trong tiến hóa đã xảy ra Việc xâydựng cây chỉ mang tính suy luận, ở đó biểu diễn các sự kiện trong quá khứ Các cây
mô tả một chuỗi các sự kiện tiến hóa được suy luận từ các dữ liệu sẵn có, dựa trênmột số mô hình [42]
Có hai thông tin chính trong cây phát sinh chủng loại: thông tin về hình học
tô-pô và chiều dài nhánh Hình học tô-tô-pô của một cây xác định các mối quan hệ của cácthực thể được đại diện trên cây phát sinh Chiều dài nhánh phản ánh mức độ quan hệcủa các đối tượng trên cây Cây phát sinh là một biểu đồ bao gồm các nhánh và các nút.Chỉ duy nhất một nhánh là nối giữa hai nút Các nút đại diện cho các đơn vị phân loại(các taxon mà cụ thể ở đây là các trình tự DNA hoặc protein), nút là giao điểm hayđiểm tận cùng của hai hoặc nhiều nhánh [44] Một đơn vị phân loại hoạt động [44] làmột taxon hiện có có mặt ở một nút ngoài cùng hay còn gọi là lá Ở đây, các OTU sẽ làcác chuỗi nucleic acid hoặc protein đang được phân tích trên cây đó Các nút phía trongđại diện cho các trình tự tổ tiên mà chúng ta có thể suy ra nhưng hiếm khi có thể quansát được (ví dụ như trường hợp trình tự DNA từ các cơ thể đã tuyệt chủng) Một sốOTU có thể được đổi chỗ cho nhau (chuyển đổi hoặc xoay vị trí) mà không thay đổitrạng thái hình học tô-pô của cây Nhìn chung, các OTU hoặc các nhánh chia sẻ mộtnút tổ tiên gần nhất có thể xoay ngay trên nút đó [42]
Chiều dài nhánh cần phải được xác định khi dựng cây Ở một số cây, chiềudài nhánh đại diện cho số thay đổi nucleotide hoặc amino acid xảy ra trong nhánh
đó (số khác biệt trên mỗi vị trí) Định dạng cây này (phylogram) cho phép khảo sát
rõ ràng các mối quan hệ của các OTU khác nhau trong cây đó Một số cây lại được
vẽ không theo tỷ lệ với số lượng thay đổi, dạng cây này (cladogram) biểu diễn cácOTU thẳng hàng theo chiều dọc, được áp dụng khi cây đó có rất nhiều OTU [40]
Xây dựng cây từ dữ liệu trình tự DNA thực chất là nghiên cứu sự thay thếtrong DNA qua phép dóng hàng, chẳng hạn như sự thay thế từng nucleotide đơn, sựthay thế liên tiếp và sự thay thế ngẫu nhiên (được thể hiện tại bảng 1.2)
Bảng 1.2 Các loại thay thế đơn phân trong phân tử DNA[42]
Trình tự Trình tự phân rẽ Trình tự phân rẽ Các loại thay thế
Trang 22Trình tự Trình tự phân rẽ Trình tự phân rẽ Các loại thay thế
1.3.2 Phân tích phát sinh chủng loại
Phân tích phát sinh chủng loại phân tử được chia làm năm bước: 1- thu nhận,chọn lựa các trình tự để phân tích; 2 - dóng hàng đa trình tự của các trình tự nucleicacid hay protein tương đồng; 3 - lựa chọn mô hình thống kê cho tiến hóa củanucleotide hoặc amino acid; 4 - xây dựng cây; và 5 - phân tích cây
1.3.2.1 Thu nhận trình tự, lựa chọn trình tự
Có thể thu nhận trình tự từ cơ sở dữ liệu HomoloGene của NCBI bao gồmhàng ngàn họ protein của sinh vật nhân thực, hay các kết quả từ công cụ BLASTgiúp lựa chọn được các họ protein, được quan sát trong NCBI Protein hoặc NCBINucleotide Các trình tự có thể thu được từ cơ sở dữ liệu Viện Công nghệ tin sinhhọc Châu Âu hoặc Ensembl Cũng có thể thu nhận trình tự từ các cơ sở dữ liệu rộnglớn với định dạng đầu ra FASTA (hoặc dóng hàng đa trình tự) Với RNA, các cơ sở
dữ liệu này bao gồm Rfam và Ribosomal Database Với protein các cơ sở dữ liệugồm Pfam và InterPro
1.3.2.2 Dóng hàng đa trình tự
Một họ gen (hoặc protein) được xác định bởi phép dóng hàng đa trình tự củamột nhóm các trình tự tương đồng (homologous) Dóng hàng đa trình tự là một tậphợp của ba hay nhiều trình tự protein (hoặc nucleic acid) được dóng hàng từng phầnhoặc toàn bộ Các đơn phân tương đồng được dóng hàng theo cột dọc suốt chiều dàicủa trình tự Các đơn phân được dóng hàng này là tương đồng theo ý nghĩa tiến hóa:chúng được thu về từ một tổ tiên chung Đây là bước then chốt trong phân tích phátsinh chủng loại Để chuẩn bị dóng hàng đa trình tự phục vụ phân tích phát sinhchủng loại, các trình tự phải có chung nguồn gốc và tương đồng
1.3.2.3 Lựa chọn mô hình thay thế trong chuỗi DNA và amino acid
Trang 23Phân tích phát sinh chủng loại dựa trên các mô hình của sự thay thế trongchuỗi DNA hoặc amino acid Mô hình Jukes-Cantor mô tả quá trình tiến hóa bởinhững sự thay đổi các đơn phân trong một phép dóng hàng trình tự Mô hình nàygiả định rằng mỗi loại nucleotide có khả năng như nhau để chuyển thành 3 loại cònlại và bốn loại có mặt với tỷ lệ bằng nhau, tỷ lệ của đồng hoán bằng với tỷ lệ dịhoán Trong mô hình hai thông số Kimura cũng mô tả sự thay đổi các đơn phânnhưng thường thì dị hoán sẽ được chú trọng hơn về tính khả dĩ Ở mô hình Tamuragiải thích cho sự đa dạng trong thành phần GC, đây là điển hình cho một mô hìnhphức tạp hơn của sự thay thế nucleotide.
Trước khi chuỗi dữ liệu được tính toán và phân tích, chúng phải trải qua quátrình kiểm tra dò tìm mô hình tiến hóa thích hợp
1.3.2.4 Xây dựng cây
Có bốn phương pháp chính để dựng cây: dựa vào khoảng cách, maximumparsimony, maximum likelihood và suy luận Bayes Một trong những phần mềmtiên tiến hiện nay là MrBayes được phát triển bởi John Huelsenbeck và FredrikRonquist [45] Công cụ này giúp suy luận dựa trên việc xác lập một phương phápphân tích Bayes và các phương pháp dựa trên mô hình để phân tích phát sinh chủngloại MrBayes lượng giá một phân bố xác suất tiên nghiệm, là khả năng mà một câytạo ra thỏa mãn dữ liệu quan sát
- Nhóm phương pháp dựa trên khoảng cách
Phương pháp này sử dụng khoảng cách tiến hóa giữa các OTU để suy luậnlịch sử phát sinh loài Nếu khoảng cách phân tử giữa các loài có sự gia tăng khôngđổi theo thời gian, thì cặp loài nào có khoảng cách ngắn nhất sẽ có chung tổ tiên gầnnhất Các cá thể cùng có một tổ tiên chung gần thì có sự tương đồng với nhau hơn lànhững cá thể có chung tổ tiên ở xa hơn (lâu đời hơn) Do đó, ta có thể suy luận cácmối quan hệ tiến hóa từ các kiểu tương đồng trong số các cá thể
+ Phương pháp dựa trên khoảng cách UPGMA (Unweighted-Pair Group
Method with Arithmetic mean) được giới thiệu bởi Sokal và Michener [46] Trong
phương pháp này, dựa trên việc gom cụm các trình tự, mỗi trình tự được xem nằmtrong cụm của chính nó Thông qua ma trận khoảng cách, có thể xác định đượcchiều dài khoảng cách giữa mỗi đối tượng Các taxon có khoảng cách gần nhất sẽnối lại với nhau và đặt tên cho một nút phía trong là Cứ thế, xác
Trang 24định các khoảng cách gần nhất tương ứng giữa các taxon, cuối cùng tất cả các trình
tự được kết nối lại trong một cây có gốc
+ Tạo cây bằng nhóm phương pháp dựa trên khoảng cách - neighbor
joining:
Hình 1.3 Mô tả phương pháp neighbor-joining [47]
Phương pháp này sử dụng thuật toán khoảng cách được minh họa trên hình 1.3:(a) các OTU trước hết được gom cụm trong một cây hình sao Các lân cận được xácđịnh là các OTU được liên kết bởi một nút duy nhất ở bên trong của cây phân nhánhkhông gốc (b) hai OTU gần nhất được xác định, chẳng hạn là OTU số 1 và 2 Hailân cận này được nối với các OTU khác thông qua nhánh nội là XY OTU đượcchọn là lân cận sao cho tổng chiều dài nhánh là nhỏ nhất Quá trình này được lặp lạicho đến khi toàn bộ cây được tạo ra
- Nhóm phương pháp Maximum Parsimony
Phương pháp sử dụng nguyên lý suy luận phát sinh chủng loại dựa trên ítnhất những biến đổi trong quá trình tiến hóa, nghĩa là cây tốt nhất là cây có chiềudài nhánh ngắn nhất có thể [48]
- Phương pháp Maximum Likelihood
Đây là một phương pháp được thiết kế để xác định kiểu hình học tô-pô chocây và chiều dài nhánh có tính khả dĩ cao nhất đối với tập hợp dữ liệu quan sátđược Tính khả dĩ được tính toán cho mỗi đơn phân (residue) trong một phép dónghàng, bao gồm một vài mô hình của quá trình thay thế nucleotide hoặc amino acid.Đây là phương pháp phải sử dụng dung lượng máy tính nhiều nhất và cũng là nhómphương pháp linh động nhất [49]
- Nhóm phương pháp dựa trên lý thuyết Bayes
Suy luận Bayes thực chất là việc tính toán khả năng của một số dữ liệu đangquan sát với một vài mô hình xác suất đã cho Suy luận Bayes tìm kiếm xác suất củamột cây với điều kiện dựa trên những dữ liệu sẵn có (dựa trên sự quan sát một phép
Trang 25dóng hàng đa trình tự nào đó) [50] Ước lượng Bayes của phát sinh chủng loại đượcchú trọng vào một đại lượng được gọi là phân bố xác suất tiên nghiệm của cây Vớimột cây đã cho, xác suất tiên nghiệm là xác suất để cây đúng, mục đích là tìm ra cây
có xác suất cao nhất Suy luận Bayes trong nghiên cứu phát sinh chủng loại tương tựnhư maximum likelihood bởi mỗi phương pháp đều tìm kiếm một đại lượng gọi là
tỷ lệ khả dĩ với dữ liệu điều kiện đang quan sát của cây Khác biệt là việc xác địnhcác thông tin ban đầu và sử dụng thuật toán MCMC (Markov chain Monte Carlo) đểxác định phân phối xác suất hậu nghiệm Nhóm phương pháp dựa trên nguyên lýBayes được coi là công cụ tiên tiến, khắc phục được một số hạn chế của các phươngpháp khác Các nghiên cứu gần đây có xu hướng sử dụng phương pháp Bayes nhiềuhơn thay vì các phương pháp khác
1.3.2.5 Hoàn thiện cây phát sinh chủng loại
- Phân tích giá trị bootstrap
Sau khi dựng được một cây phát sinh chủng loại, cần đánh giá mức độ chínhxác, tin cậy và hiệu quả Tính chính xác của cây được đánh giá bằng phương phápphổ biến nhất là phân tích bootstrap [51, 52] Bootstrap mô tả độ mạnh về hình họctô-pô của cây Nghĩa là, với một trật tự phân nhánh cụ thể nào đó, xác định mức độtin cậy của thuật toán được sử dụng để dựng cây, để tìm ra trật tự phân nhánh sửdụng các phép hoán vị ngẫu nhiên đối với các dữ liệu nguồn Phân tích bootstrapcho phép suy luận mức độ biến thiên trong một phân phối chưa biết mà dữ liệu đượcrút ra từ đó [52] Bootstrap là kĩ thuật xử lí thống kê các phép đo lường về độ chínhxác với các khoảng ước lượng về mẫu nghiên cứu Cho phép sự ước lượng các giátrị khác biệt trong một phân bố các mẫu nghiên cứu, qua đó kiểm định giả thuyếttrong thống kê bằng số lần thử lại (resampling) với sự thay thế từ nguồn dữ liệu gốc
Con số phần trăm thể hiện trên nhóm nào đó thể hiện trên cây gốc được cungcấp dựa trên mức độ ủng hộ của bootstrap đối với hình học tô-pô của cây gốc Giátrị bootstrap lớn hơn 70% cung cấp giá trị ủng hộ cho việc tạo nhóm Nếu nhìn vàomột nhóm (một nhóm trình tự có cùng tổ tiên) có giá trị ủng hộ bootstrap là 100%,nghĩa là trong tất cả 500 phép bootstrap lặp lại, nhánh đó vẫ duy trì trạng thái (sốlượng, thành phần các trình tự vẫn không thay đổi trong nhánh) Nếu một nhánh chỉnhận được giá trị bootstrap là 52% ủng hộ, nghĩa là khoảng một nửa cơ hội mộttrình tự thuộc nhánh lân cận với nhóm có giá trị bootstrap 52% là có khả năng thuộc
Trang 26nhóm này [51] Tóm lại, nhìn vào giá trị bootstrap, có thể đánh giá được độ tin cậy của mỗi nhánh trong một cây.
- Phân tích gốc của cây:
Để suy luận tổ tiên cho các nút trên một cây, thì điều quan trọng phải biếtgốc của cây nằm ở đâu, điều này cho phép đánh giá tổng thể chiều hướng biến đổi
Có hai phương pháp thường được sử dụng để xác định gốc của cây
Phương pháp xác định gốc của cây dựa vào trung điểm: đơn giản nhưng độ
chính xác không cao Phương pháp này xác định gốc như là trung tâm tập hợp củacác nhánh và cách đều một cách tương đối với các đỉnh
Phương pháp thứ hai dựa vào nhóm đối chứng (nhóm ngoại - outgroup) chính
xác hơn, nhưng không phải lúc nào cũng sử dụng được bởi yêu cầu một nhómngoài, một taxon được phân tách từ cây từ trước cho tới hiện tại của tổ tiên chungsau cùng của tất cả các taxon khác đang được nghiên cứu
1.4 Tình hình nghiên cứu sử dụng mtDNA trên các giống lợn
1.4.1 Nghiên cứu các giống lợn trên thế giới
Phương pháp mô hình hóa dữ liệu di truyền từ lợn nhà và lợn rừng đã được
áp dụng để giải quyết các quan điểm mâu thuẫn và làm sáng tỏ quá trình thuần hóalợn [53] Dữ liệu cho thấy lợn nhà ngày nay là một thể khảm của các quần thể lợnrừng khác nhau Kết quả của các nghiên cứu này đã không ủng hộ giả thuyết trước
đó cho rằng có nhiều trung tâm thuần hóa lợn bên ngoài khu vực Tây Á và TrungQuốc [10]
Đã có nhiều nhà di truyền học quần thể và hệ thống học sử dụng dữ liệu trình
tự của hệ gen ty thể trong các nghiên cứu về nguồn gốc các giống lợn Trình tự hoàn
chỉnh hệ gen ty thể của lợn (S scrofa) được công bố vào năm 1998 [32], đây là tiền
đề cho một loạt các công trình khoa học tiến hành nghiên cứu trên dữ liệu hệ gen tythể của các giống lợn nhà và lợn rừng Kim và cs (2002) đã xác định quan hệ phátsinh chủng loại của các giống lợn Châu Âu và Châu Á bằng sự đa hình trình tự vùngD-loop với chiều dài 1036 bp của mtDNA [15] Watanobe và cs (2003) đã công bốcấu trúc quần thể của lợn rừng Nhật Bản và địa lý phát sinh chủng loại thông quaphân tích biến thể trình tự mtDNA [54] Công trình của Wang và cs (2014) đã công
bố dữ liệu của hệ gen ty thể ở giống lợn Duroc [55], … Bên cạnh đó, có nhiều côngtrình nghiên cứu đã công bố những bằng chứng rõ ràng từ trình tự
Trang 27mtDNA của các mẫu lợn hiện đại và cổ đại để chứng minh một số vùng được xem
là trung tâm thuần hóa lợn nhà từ các giống lợn rừng trên thế giới trải dài từ Âusang Á [10, 56] Một số công trình nghiên cứu thông qua độ đa hình trình tự vùngD-loop, xác định khoảng thời gian từ lúc phân rẽ thành nhánh lợn Châu Âu và Châu
Á đã được nghiên cứu đánh giá trong các phân tích về phát sinh chủng loại [15, 40].Giuffra và cs đã tiến hành giải trình tự mtDNA và một số gen nhân tế bào từ cácgiống lợn rừng, lợn nhà Châu Âu, Châu Á Nhóm tác giả đã phát hiện sự đa hìnhtrình tự và sử dụng công thức tính toán đồng hồ phân tử, kết luận rằng lợn nhà có
nguồn gốc từ lợn rừng Âu Á (S scrofa), các bằng chứng về sự thuần hóa diễn ra độc
lập từ các loài phụ của lợn hoang ở Châu Âu và Châu Á cũng được đưa ra [1]
Fernández đã tiến hành nghiên cứu mối quan hệ giữa đa hình mtDNA và chấtlượng thịt ở giống lợn Iberia Kết quả đã phát hiện một số đa hình đóng vai trò như cácchỉ thị phân tử đóng góp vào quá trình chọn giống lợn này [57] Công trình nghiên cứumối liên hệ của 4 haplotype mtDNA với các đặc điểm năng suất ở giống lợn Landrace
và khẳng định các kiểu gen đơn bội của mtDNA có mối liên hệ lớn tới các tính trạnghình thái ở giống lợn này [58] Trình tự hệ gen ty thể hoàn chỉnh của giống lợnVisayan, lợn Java được xác định với kích thước 16.475 bp, hệ gen có cấu trúc đặc trưngcủa 13 gen mã hóa protein, 2 gen rRNA, 22 gen tRNA và một vùng điều khiển không
mã hóa D-loop, đây là nguồn dữ liệu di truyền giúp nghiên cứu sâu hơn về sự tiến hóacủa lợn [59] Việc nghiên cứu hoàn chỉnh trình tự vùng D-loop ty thể của giống lợntrắng Pudong ở vùng Taihu - Trung Quốc, đã cho thấy không có sự trao đổi di truyềngiữa các quần thể và giống lợn này chỉ xuất hiện duy nhất tại đây Do vậy cần có nhữngchính sách để bảo tồn nguồn gen bản địa quý hiếm này [60] Sự đa dạng di truyền trong
hệ gen ty thể cũng đã được xác định trong 17 giống lợn bản địa Trung Quốc và 3 giốnglợn bản địa Châu Âu Qua phân tích đa dạng nucleotide cho thấy mức độ khác biệt ditruyền rất lớn giữa các giống có nguồn gốc Châu Âu so với Châu Á, tuy nhiên ít có sựbiến động trong 17 giống bản địa của Trung Quốc [61] Nghiên cứu của Wu và cs(2007) đã khẳng định hai vị trí phát sinh chủng loại của các giống lợn nhà và lợn rừngChâu Á nằm trên hai nhánh tách biệt, trong đó giống lợn hoang Malaysia có sự táchbiệt lớn nhất khi nằm ra ngoài khỏi nhánh lợn lưu vực sông Mekong và Nam TrungQuốc nhưng giống lợn này vẫn là lợn kiểu Châu
Á [56] Nghiên cứu về các giống lợn bản địa Trung Quốc, nhóm của Yu đã cho rằng
Trang 28lợn Lanyu phân ly từ các giống lợn Trung Quốc khác và nằm tại nhánh phát sinhriêng [30].
Từ các kết quả nghiên cứu, có thể thấy thông tin về quá trình tiến hóa có thể thuđược thông qua dữ liệu về trình tự Qua việc so sánh mức độ đa hình các trình tự, cácmối quan hệ về tiến hóa giữa những cá thể trong cùng loài hoặc các loài có quan hệgần, thời gian phân ly ngắn, cũng như độ đa dạng và tiểu cấu trúc địa lý trong mộtnhóm hay giữa các nhóm cá thể động vật sẽ được làm sáng tỏ [62, 29, 63, 31]
1.4.2 Nghiên cứu giống lợn Việt Nam
1.4.2.1 Tình hình nghiên cứu chung
Việt Nam được coi là một trong những nơi bắt nguồn của lợn nhà Châu Á[64] Tuy nhiên, đến nay còn khá ít các công trình nghiên cứu xác định nguồn gốcphát sinh chủng loại và đa dạng di truyền sử dụng hệ gen ty thể trên đối tượng là cácgiống lợn bản địa Việt Nam Nguyễn Thị Phương Mai (2017) đã sử dụng dữ liệutrình tự hệ gen ty thể để xác định vị trí phân loại của heo rừng bản địa khu vực TâyNguyên trong mối quan hệ phát sinh loài của heo rừng trên thế giới Cùng với đó, 3
vị trí SNP mới của vùng D-loop và 3 vị trí SNP mới của gen cytochrome b của heorừng Tây Nguyên cũng được xác định, giúp phân biệt giữa heo rừng Tây Nguyên vàcác nhóm heo rừng khác [65]
Công trình nghiên cứu của Trần Thị Thúy Nhiên (2016) đã công bố giải trình
tự hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái [66] Trong nghiên cứu này,trình tự hoàn chỉnh hệ gen ty thể của giống lợn Móng Cái được công bố có chiều dài16.632 bp bao gồm vùng không mã hóa (D-loop), 2 gen rRNA, 13 gen mã hóaprotein và 22 gen tRNA Cây phát sinh chủng loại cũng được tái dựng lên, sử dụngphương pháp khoảng cách UPGMA với 162 trình tự hoàn chỉnh của hệ gen ty thểcủa lợn Qua phân tích phát sinh chủng loại, nhóm tác giả đã xác định được mốiquan hệ gần gũi giữa lợn Móng Cái của Việt Nam với giống lợn Bama miniature ởMiền Nam Trung Quốc Bên cạnh đó các số liệu phân tích về thành phần hệ gen củagiống lợn Móng Cái cũng được tác giả công bố Ishihara và cs đã nghiên cứu mốiquan hệ di truyền trong số các giống lợn địa phương sử dụng các chỉ thị SNP [67].Đại diện của 15 giống lợn địa phương trải dài từ Bắc, Trung và Nam đã được thuthập Qua phân tích các chỉ thị SNP cho thấy có sự đa hình cao trong các giống lợnViệt Nam Hầu hết các giống được gom nhánh đều tương quan với nguồn gốc địa lý
Trang 29của chúng Một số giống lợn Việt Nam khác lại được gom nhánh khi cùng liên quan
về mặt di truyền với giống lợn Landrace của Châu Âu
Trái với công bố khoa học cho rằng một số giống lợn địa phương ở Việt Nam
có nguồn gốc từ Trung Quốc, qua phân tích di truyền sử dụng vùng kiểm soát của
hệ gen ty thể đã chứng minh rằng các giống lợn Việt Nam ở khu vực Đông Bắc cóthể có mối quan hệ với giống lợn ở Campuchia hoặc Lào [68] Nghiên cứu củaHongo và cs (2002) xác định mối liên hệ về mặt di truyền giữa giống lợn bản địaViệt Nam với một số giống lợn trên thế giới [69] Cụ thể, Hongo đã dựa vào hìnhthái giải phẫu bộ xương để phân ra nhóm lợn to và nhóm lợn nhỏ, nhóm lợn rừng to
có mối quan hệ gần với giống lợn hoang Ryukyu ở miền Nam Nhật Bản, nhóm lợnnhỏ có mối liên hệ gần nhất với một số giống lợn nhà tại khu vực Đông Á có nguồngốc từ lợn bản địa Trung Quốc [69] Các nhà khoa học Trung Quốc cũng đã có cáccông bố về nguồn gốc và sự khác biệt di truyền của giống lợn bản địa phía Tây NamTrung Quốc thông qua nghiên cứu đa hình mtDNA Kết quả cho thấy, mối quan hệgiữa lợn rừng và lợn Tứ Xuyên ở Trung Quốc là tương đối xa so với lợn rừng ViệtNam dựa trên các điểm đột biến tồn tại trong hệ gen ty thể của lợn
[70] Trong nghiên cứu về đa hình mtDNA, Lan và Shi (1993) cho rằng tồn tạikhoảng cách tiến hóa tương đối xa giữa lợn Vân Nam ở Trung Quốc với lợn ViệtNam, mặc dù khu vực Đông Nam Trung Quốc và Việt Nam có vị trí địa lý khá gần[70] Các giống lợn tại Việt Nam có mức độ đa dạng di truyền cao Hầu hết kiểu genđơn bội của nhóm lợn nhỏ Việt Nam có mối liên hệ gần với các nhóm lợn nhà Đông
Á Điều này chứng tỏ nhóm lợn nhỏ Việt Nam là lợn nhà và là cơ sở đề hình thànhhai giả thuyết giải thích cho quá trình thuần hóa lợn nhà Việt Nam: một là chúngđược thuần hóa ngay tại Việt Nam, hai là chúng được di cư từ khu vực lân cận nhưmiền Tây Nam Trung Quốc Lợn Việt Nam bao gồm quần thể lợn hoang và lợn nhà
có thể có cùng tổ tiên với các nhóm lợn Đông Á Hai công trình nghiên cứu đượctiến hành độc lập vào năm 2006 và 2014, đã sử dụng chỉ thị microsatelite khẳngđịnh nhánh các giống lợn Việt Nam khác biệt với các nhánh lợn nhà Châu Âu,giống Meishan của Trung Quốc và lợn rừng Châu Á, cho rằng các giống lợn ViệtNam đã trải qua quá trình thuần hóa trong thời gian lịch sử dài [71, 72] Mối quan
hệ di truyền của lợn Việt Nam ở vùng Tây Nguyên thông qua việc phân tích trình tựCytochrome b đã được thực hiện trong công trình nghiên cứu của
Trang 30Lê Thành Long và cs (2014) [73] Kết quả cho thấy, nhóm lợn rừng Việt Nam I táchbiệt di truyền với nhóm lợn rừng châu Á và có sự đa dạng di truyền cao trong cácgiống lợn rừng và lợn nhà ở Tây Nguyên Trong một số nghiên cứu trước đây, cácnhà khoa học trong nước chủ yếu tập trung nghiên cứu đánh giá, phân tích về quátrình sinh trưởng và phát triển, tiêu tốn thức ăn, chỉ tiêu sinh lý và sinh hóa, khảnăng sinh sản ở lợn Một số tác giả như Nguyễn Văn Thiện và cs (1995) có các đánhgiá trên lợn Ỉ và lợn Móng Cái [74]; Lê Viết Ly và cs (1999) đánh giá ở 2 giống lợnbản địa khác là Ba Xuyên và Thuộc Nhiêu [75]; Trần Văn Do và cs (2005) nghiêncứu trên lợn Lang, lợn Móng Cái và lợn Vân Pa [76]; Trần Thanh Vân và Đinh Thu
Hà (2005) có các nghiên cứu trên lợn Mẹo [77]
Tính đến nay, những nghiên cứu về sinh học phân tử đối với các giống lợnnội ở Việt Nam, phần lớn mới chỉ dừng ở mức kiểm tra sự biểu hiện của một số genliên quan đến tính trạng sinh trưởng, sinh sản và phòng chống bệnh Lê Thị Thúy và
cs (2004) đã tiến hành nghiên cứu đa hình kiểu gen leptin liên quan trên một sốgiống lợn nuôi tại Việt Nam [78] Nghiên cứu phát hiện đa hình gen mã hóa
Mannan-Binding lectin serine protease 1 (MASP1) ở lợn do Đỗ Võ Anh Khoa và cs
tiến hành [79] Trần Xuân Hoàn và cs (2013) đã xác định các chỉ thị phân tử trongchọn lọc lợn giống thuần chủng đạt năng suất và chất lượng thịt cao, bao gồm 4 chỉthị phân tử DNA liên quan với tốc độ tăng trọng, 4 chỉ thị phân tử DNA liên quanvới chất lượng thịt, 4 chỉ thị phân tử DNA liên quan với số con sơ sinh sống của lợn
bố mẹ Yorkshire, Móng Cái và giải trình tự gen Mc4R của lợn Móng Cái nhưng
không phát hiện được sai khác đặc thù [80] Kiểu gen halothan của lợn cũng đượcxác định bằng phân tích DNA nhằm chọn lọc những cá thể có kiểu gen kháng stress
(CC và CT) do nhóm tác giả Đặng Vũ Bình và cs 2012 [81] Nguyễn Thị Diệu Thúy
và cs (2004) đã xác định đa hình di truyền gen hormone sinh trưởng ở giống lợnMóng Cái bằng phương pháp PCR-RFLP với mục đích ứng dụng các kết quả của ditruyền chất lượng vào công tác chọn tạo đàn giống lợn nội kinh tế phổ biến ở MiềnBắc Việt Nam [82] Nguyễn Thị Hoa (2013) sử dụng phương pháp PCR-RFLP đểphân tích đa hình một số gen liên quan đến chất lượng thịt lợn [83] Cụ thể là xác
định các biến thể DNA của gen H-FABP và Lpin1 nhằm hỗ trợ công tác chọn giống.
Lê Thị Thu Phương (2003) cũng đã công bố kết quả trong nghiên cứu xác định tần
số kiểu gen và phân tích ảnh hưởng của kiểu gen halothan cũng như kiểu gen thụ
Trang 31thể estrogen đến năng suất sinh sản của heo nái [84] Nguyễn Văn Cường và cs(2009) đã có các nghiên cứu phân tích đa hình DNA trong một số gen kháng bệnh ởlợn nuôi Việt Nam và phát triển chỉ thị di truyền phân tử hỗ trợ chọn giống lợnkháng bệnh [85].
Đối với các giống lợn bản địa Việt Nam, những nghiên cứu tổng thể về hệgen, đặc biệt là giải mã toàn bộ hệ gen ty thể của lợn nhằm xác định nguồn gốc,đánh giá các đặc tính di truyền chưa được nhiều tác giả Việt Nam nghiên cứu Đây
là một khía cạnh khoa học cần nghiên cứu sâu hơn, làm cơ sở nền tảng cho công tácbảo tồn nguồn gen và chọn tạo giống lâu dài
1.4.2.2 Đặc điểm ngoại hình một số giống lợn bản địa Việt Nam
Tại Việt Nam có các giống lợn bản địa đặc trưng đại diện cho mỗi vùng miền Theo định nghĩa về giống của FAO: “Một giống hoặc một nhóm giống trong loài có đặc điểm bên ngoài có thể ghi nhận và phân biệt mà nó có thể cho phép tách biệt bởi hình thức bên ngoài với các nhóm khác thì được gọi là một giống" Bên cạnh đó cũng theo quy ước của FAO: "Các nhóm có ngoại hình giống nhau có thể được xem là giống khác nhau nếu như xa nhau về địa lý" [5] Trên cơ sở đó tính đếnnay, các giống lợn bản địa của Việt Nam được xác định có khoảng 26 giống, được nuôi chủ yếu ở vùng nông thôn miền núi, vùng sâu, vùng xa Danh sách các giống lợn bản địa và đặc điểm phân bố được liệt kê ở bảng 1.3:
Bảng 1.3 Phân bố các giống lợn bản địa Việt Nam [5]
Trang 3213 Lợn Móng Cái Quảng Ninh
18 Lợn Cỏ A Lưới Thừa Thiên Huế Trung và Nam
19 Lợn Cỏ Quảng Nam Quảng Nam
Trung bộ
20 Lợn Kiềng Sắt Quảng Ngãi
21 Lợn Trắng Phú Khánh* Phú Yên, Khánh Hòa
Nguyên (Đắc Lắc) Tây Nguyên
23 Lợn Chư-Prông Gia Lai
25 Lợn Ô Lâm An Giang, Kiên Giang
Cửu Long
26 Lợn Thuộc Nhiêu* Kiên Giang
Ghi chú: * Các giống hiện nay không còn tìm thấy con có đặc điểm ngoại hình đặc trưng.
Có thể thấy, các giống lợn bản địa Việt Nam được phân bố rải rác ở các tỉnhvùng xa theo chiều dài đất nước, càng về các tỉnh miền xuôi thì sự đa dạng về đặcđiểm ngoại hình của các giống càng giảm [5]
Phân tích các đặc điểm ngoại hình thường dựa vào một số các chỉ tiêu, trong
đó có đặc điểm màu sắc lông da là một tính trạng chất lượng có ý nghĩa trong việcchọn giống Nhiều dấu hiệu màu sắc của lông da đặc trưng cho nòi giống Mỗi mộtgiống vật nuôi có một màu sắc lông da đặc trưng, từ đó có thể dựa vào màu sắc bộlông mà phát hiện được sự lẫn gen hoặc nhầm lẫn khi xác định phả hệ, nguồn gốc[5] Qua nghiên cứu điều tra, các giống lợn bản địa có các đặc điểm ngoại hình đadạng Hiện trạng của 6 giống lợn bản địa (lợn Ỉ, lợn Móng Cái, lợn Hương, lợn HạLang, lợn Mường Khương và lợn Mường Lay) như sau [5, 86]:
a Giống lợn Ỉ
Giống lợn Ỉ hiện đang có nguy cơ cao tuyệt chủng do số lượng lợn sinh sảncòn quá ít, lợn bị suy thoái đồng huyết Hiện nay chỉ còn sót lại ở một số xã của tỉnhThanh Hóa và Viện Chăn nuôi Từ con số hai triệu con năm 1969, tới nay số lợn Ỉtrên toàn quốc còn không được bao nhiêu, tại Viện Chăn Nuôi và tỉnh Thanh Hóacũng chỉ còn chưa đến 100 con giống
Trang 33c Giống lợn Hạ Lang
Giống có nguồn gốc từ huyện Hạ Lang, tỉnh Cao Bằng, qua phỏng vấn ngườichăn nuôi trực tiếp và tài liệu thu thập được, lợn Hạ Lang được du nhập từ TrungQuốc từ hàng ngàn năm trước, thông qua giao lưu buôn bán giữa hai tỉnh giáp biêngiới Việt Nam - Trung Quốc Hiện nay số lượng lợn nái Hạ Lang giảm đáng kể, tínhđến tháng 10/2012, tổng đàn nái Hạ Lang còn khoảng 500-1000 con
d Giống lợn Mường Lay (14 vú)
Là giống lợn được nuôi dưỡng lâu đời theo hình thức thả rông Đến nay vẫnchưa xác định chính xác giống lợn Mường Lay có nguồn gốc từ đâu Giống lợn này
có đặc điểm chịu đựng tốt với điều kiện hoàn cảnh nông hộ nghèo, không đòi hỏithức ăn dinh dưỡng cao, ít bệnh tật, khả năng đẻ con tốt và thịt thơm ngon LợnMường Lay 14 vú đã được Viện Chăn Nuôi đề nghị nhà nước đưa vào danh sáchbảo tồn
e Giống lợn Mường Khương
Là giống lợn địa phương, có từ lâu đời được các dân tộc ít người nuôi trênvùng núi cao hiểm trở của huyện Mường Khương, tỉnh Lào Cai Đây là giống dễnuôi vì phàm ăn, chịu dịch bệnh tốt, thịt thơm ngon, nhiều nạc Lợn Mường Khươnghiện có khoảng trên 1000 con sống chủ yếu tại vùng núi cao, hiểm trở
f Giống lợn Hương
Lợn Hương là giống lợn được nuôi phổ biến ở các huyện biên giới Việt Nam
- Trung Quốc thuộc tỉnh Cao Bằng gồm Bảo Lạc, Bảo Lâm, Hạ Lang… Đây là mộtnguồn gen quý, được bảo tồn ở Việt Nam từ năm 2008 và ngày càng phát triển về sốlượng ở Cao Bằng So với các giống lợn bản địa khác, thịt lợn Hương có mùi thơmđặc trưng riêng nên được người dân địa phương gọi là “lợn Hương” từ xưa [5]
Trang 34Chương 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Đối tượng và địa điểm nghiên cứu
2.1.1 Đối tượng:
Các cá thể lợn được lựa chọn ngẫu nhiên trong các đàn lợn, thuộc 6 giống lợnbản địa Việt Nam (Ỉ, Móng Cái, Mường Khương, Mường Lay, Hương và Hạ Lang).Riêng đối với quần thể lợn Ỉ thu tại tỉnh Thanh Hóa, do không còn tìm thấy cá thểnào mang đặc điểm tương ứng của nhóm lợn Ỉ Mỡ nên toàn bộ cá thể khảo sát vàthu mẫu thuộc nhóm lợn Ỉ Pha Đối tượng nghiên cứu được chọn lựa dựa trên điềutra khảo sát các đặc điểm ngoại hình đặc trưng, thông tin về phả hệ, địa lý phân bốcủa Viện Chăn nuôi Quốc gia và Trung tâm Giống vật nuôi - Sở Nông nghiệp vàphát triển nông thôn tại một số địa phương: Điện Biên, Lào Cai, Cao Bằng, HảiPhòng và Thanh Hóa
+ Lợn Móng Cái - tại thành phố Hải Phòng: Trung tâm Giống Tràng Duệ thuộc Công ty Cổ phần Đầu tư và Phát triển Nông nghiệp, huyện An Dương
+ Lợn Mường Lay - tại tỉnh Điện Biên: Thị xã Mường Lay (phường La Nay, phường Sông Đà, Xã Lay Nưa)
+ Lợn Hương và lợn Hạ Lang - tại tỉnh Cao Bằng: Trung tâm giống cây trồng, vật nuôi, thủy sản Cao Bằng, xã Bạch Đằng, huyện Hoà An
+ Lợn Mường Khương - tại tỉnh Lào Cai: huyện Mường Khương, xã Tả Gia Khâu (thôn Lao Chải, thôn Sảng Chải, thôn Sín Pao Chải)
Ngoại hình các cá thể từ 6 giống lợn bản địa và địa điểm thu mẫu được trình bày ở hình 2.1 và 2.2.
Trang 36Lợn Hạ Lang Lợn Mường Khương
Hình 2.2 Sáu giống lợn bản địa Việt Nam được sử dụng trong nghiên cứu
Trình tự hệ gen ty thể của các giống lợn Châu Âu, Châu Á được tải từGenBank (NCBI) cùng với các mã số truy cập được xếp vào 6 khu vực địa lý chính:Đông Bắc Á, Khu vực Mekong, Lưu vực sông Hoàng Hà, Nam Trung Quốc, Lưuvực sông Dương Tử và các quốc gia Châu Âu được thể hiện ở bảng 2.1
Bảng 2.1 Mã số truy cập dữ liệu trình tự hệ gen ty thể của các giống lợn Âu
Á và phân bố địa lý được sử dụng trong nghiên cứu
Các giống lợn Mã số truy cập
Lợn rừng Hàn Quốc WB-Korea AY574047.1Đông Bắc Á Lợn rừng Đông Bắc WB-China EU333163.1
Trung Quốc northeastLợn rừng Việt Nam WB -Vietnam EF545584.1Ban-na mi-ni Banna mini GQ220328.1
Lợn rừng Malaysia WB-Malaysia EF545592.1Lợn rừng Vân Nam WB-Yunnan EF545573.1Lợn rừng Phúc Kiến WB-Fujian EF545569.1Nam Trung Quốc Lợn rừng Hải Nam WB-Hainan EF545572.1
Lưu vực sông Lợn rừng Jiangxi WB- Jiangxi EF545579.1
Trang 37Các giống lợn Mã số truy cập
Đu - rốc (Heo bò) Duroc AY337045.1Lợn đen I-bê-ria Iberian FJ236994.1
Lợn rừng Châu Âu WB-European FJ237000.1
- Các thí nghiệm về sinh học phân tử được tiến hành tại Phòng thí nghiệm của Viện Nghiên cứu hệ gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam
2.2 Hóa chất và thiết bị
2.2.1 Hóa chất
Các hóa chất được sử dụng trong thí nghiệm đều ở dạng tinh khiết, các bộ kítthương mại Hóa chất để tách DNA tổng số và kiểm tra sản phẩm sau tách chiết:phenol - chloroform - isoamyl alcohol (tỷ lệ: 25: 24: 1), EDTA, proteinase K,
Rnase, agarose, ethidium bromide, của các hãng Sigma, Invitrogen, Merk; thangchuẩn DNA của hãng Thermo Fisher (Mỹ)
Các bộ kít được sử dụng trong nghiên cứu gồm: Phản ứng PCR được tiếnhành sử dụng bộ kít GoTaq® Green Master Mix (hãng Promega - Mỹ), bộ kít tinhsạch sản phẩm PCR QIAquick® PCR Purification Kit (hãng Qiagen - Mỹ), bộ kítgiải trình tự nucleotide (Bigdye® 3.1 terminator) của hãng Thermo Fisher - Mỹ
Ba mươi cặp mồi được sử dụng để khuếch đại trình tự các phân đoạn
mtDNA được thể hiện tại bảng 2.2 Mồi được kế thừa và hiệu chỉnh dựa trên trình
tự 30 cặp mồi công bố bởi Yu và cs (2013) [63]
Trang 38Bảng 2.2 Các cặp mồi được sử dụng cho PCR và vị trí các phân đoạn
được khuếch đại
( o C)
D-loop AGGAGACTAACTCCGCCAT GCGGATACTTGCATGTGT 54 16556-1306
Trang 39Trình tự nucleotide hoàn chỉnh hệ gen ty thể của lợn (S scrofa) với mã số
truy cập GenBank: NC000845.1 được sử dụng làm trình tự tham khảo, để thiết kế,hiệu chỉnh các cặp mồi và thực hiện các phép dóng hàng trình tự
2.2.2 Thiết bị
Thiết bị lấy mẫu và bảo quản mẫu máu: Phích lạnh, đá khô, quần áo bảo hộ,khẩu trang, găng tay, ủng, giấy tờ ghi chép Dụng cụ lấy mẫu đều được tiệt trùng.Ống đựng mẫu máu có bổ sung chất chống đông (EDTA)
Các thiết bị thí nghiệm được sử dụng trong nghiên cứu bao gồm: Máy giảitrình tự ABI 3500 Genetic Analyzer, Máy luân nhiệt GeneAmp® PCR System 9700(Thermo Fisher, Mỹ) Tủ lạnh sâu (Sanyo, Nhật), máy soi DNA Mini -transllumminator (hãng Biorad, Mỹ), máy voltex (Minishaker, IKA, Đức), máy lytâm Eppendorf, máy định lượng DNA Nanodrop Spectrophotomer (Thermo Fisher,Mỹ), pipetman các loại (Gilson, Pháp),
2.3 Phương pháp nghiên cứu
Các thí nghiệm, tiến trình nghiên cứu được tiến hành theo sơ đồ tổng quát mô
tả ở hình 2.3
Khảo sát điều tra các giống Dóng hàng đa trình tự, xác
Thu mẫu, tách chiết DNA Phân tích tương đồng, đa
hình trình tự
Khuếch đại, giải trình tự Xây dựng cây phát sinh
chủng loại
Lắp ráp, phân tích, chú giải Đánh giá cây và phân tích
Hình 2.3 Sơ đồ tổng quát các bước nghiên cứu
Trang 402.3.1 Phương pháp điều tra dựa trên đặc điểm ngoại hình lợn
Ngoại hình của các cá thể giới tính cái thuộc 6 giống lợn bản địa: Ỉ, MóngCái, Hương, Hạ Lang, Mường Khương và Mường Lay được đánh giá thông quaquan sát bên ngoài con vật bởi các nhóm chỉ tiêu màu sắc lông, da và nhóm chỉ tiêuđánh giá về hình dạng, đặc điểm của các bộ phận trên cơ thể lợn, đo đạc các chỉ tiêu
về tầm vóc, khối lượng
Các giống lợn nghiên cứu được nuôi trong các trại giống và hộ nông dân cóđiều kiện chăn nuôi cơ bản tương đồng nhau, toàn bộ các giống lợn được nuôi nhốthoàn toàn trong chuồng xây, nền xi măng, mái lợp phi-brô xi măng Lợn được ănvới tiêu chuẩn dinh dưỡng tương đương nhau ở các điểm thu mẫu
Tiến hành phỏng vấn các hộ chăn nuôi theo các câu hỏi đã đặt sẵn trên cơ sởtìm hiểu trước về thông tin từ trại giống, các hộ chăn nuôi, thông tin về phả hệ củaViện Chăn nuôi Quốc gia và Trung tâm giống vật nuôi - Sở Nông nghiệp và pháttriển nông thôn tại một số địa phương
Lập phiếu điều tra, ghi chép số liệu và dùng máy chụp ảnh ghi lại hình ảnh các giống lợn bản địa đang nuôi của từng hộ, trạị giống cu ̣thể Đánh giá sơ bô ̣về nguồn gốc, chất lượng từng giống lợn đang nuôi
Đối với việc khảo sát nhóm chỉ tiêu về kích thước, lợn được cố định bằngdây thừng và đo các chỉ số: dài thân, vòng ngực và cao vai bằng thước dây theo đơn
- Vòng ngực: đo chu vi lồng ngực sau bả vai (thước dây)
- Khối lượng: sử dụng cân bàn
Tiêu chí đánh giá là dựa vào đặc điểm ngoại hình đã được nghiên cứu vàcông bố (theo Át lát Các giống vật nuôi ở Việt Nam và Chuyên khảo Bảo tồn và khai thác nguồn gen vật Nuôi Việt Nam - Phụ lục 1) [5, 86]