Là một trong những nghiên cứu đầu tiên về di truyền phân tử đối với giống lợn Ỉ, trong nghiên cứu này chúng tôi lựa chọn phương pháp giải trình tự toàn bộ hệ gen ty thể làm công cụ nghiê
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Nguyễn Đức Hiếu
XÁC ĐỊNH VÀ PHÂN TÍCH TRÌNH TỰ
HỆ GENE TY THỂ HOÀN CHỈNH CỦA
GIỐNG LỢN Ỉ TẠI VIỆT NAM
LUẬN VĂN THẠC SĨ KHOA HỌC
Trang 2TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Nguyễn Đức Hiếu
XÁC ĐỊNH VÀ PHÂN TÍCH TRÌNH TỰ
HỆ GENE TY THỂ HOÀN CHỈNH CỦA
GIỐNG LỢN Ỉ TẠI VIỆT NAM
Chuyên ngành : Sinh học thực nghiệm
Trang 3Lời cảm ơn
Trước tiên, tôi xin dành lời cảm ơn sâu sắc tới TS Võ Thị Bích Thủy và TS Hoàng Thị Mỹ Hạnh những người đã tận tình hướng dẫn tôi trong suốt quá trình
nghiên cứu, thực hiện luận văn thạc sĩ này
Tôi xin gửi lời cảm ơn chân thành tới PGS TS Nghiêm Ngọc Minh, người đã
luôn tạo điều kiện nghiên cứu tốt nhất cho tôi, cũng như luôn quan tâm, giúp đỡ và trao đổi những kinh nghiệm quý báu trong suốt quá trình nghiên cứu
Tôi cũng xin gửi lời cảm ơn đến PGS TS Nguyễn Lai Thành, người đã giúp
đỡ, định hướng ban đầu cho tôi trong thời gian tôi học tập tại trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
Cuối cùng, tôi xin được gửi lời cảm ơn đến gia đình, và bạn bè tôi vì đã luôn bên tôi trong công việc cũng như ngoài cuộc sống
Hà Nội, ngày tháng năm 2017
Học viên cao học
Nguyễn Đức Hiếu
Trang 4
MỤC LỤC
DANH MỤC BẢNG iii
DANH MỤC HÌNH iv
DANH MỤC TỪ VIẾT TẮT v
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN 2
1.1 Giới thiệu về giống lợn Ỉ 2
1.1.1 Nguồn gốc giống vật nuôi 2
1.1.2 Giống lợn nhà (Sus scrofa) 2
1.1.3 Giống lợn Ỉ 3
1.2 Tầm quan trọng của các nghiên cứu về lợn tại Việt Nam 6
1.3 Marker trong nghiên cứu đa dạng di truyền 7
1.3.1 Cấu trúc hệ gen ty thể 9
1.3.2 Ty thể trong nghiên cứu đa dạng di truyền 10
1.4 Phương pháp giải trình tự Sanger 12
1.5 Phương pháp phân tích sự chủng loại phát sinh 17
1.5.1 Cây chủng loại phát sinh 17
1.5.2 Phương pháp Bayesian 19
CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP 21
2.1 Đối tượng 21
2.2 Vật liệu và trang thiết bị 21
2.3 Phương pháp 21
2.3.1 Thu mẫu 21
2.3.2 Tách chiết mẫu DNA tổng số (với nguồn mẫu là máu) 21
2.3.3 Thiết kế mồi 22
2.3.4 Khuếch đại trình tự hệ gen ty thể bằng kỹ thuật PCR 23
2.3.5 Giải trình tự trên máy ABI 3500 24
Trang 52.3.6 Xử lí kết quả giải trình tự 25
2.3.7 Phân tích trình tự 26
2.3.8 Phân tích sự chủng loại phát sinh 26
CHƯƠNG 3 KẾT QUẢ VÀ THẢO LUẬN 27
3.1 Thu thập và giải trình tự hệ gen ty thể lợn Ỉ 27
3.1.1 Thu mẫu 27
3.1.2 Tách chiết DNA tổng số 27
3.1.3 Khuếch đại hệ gen ty thể 28
3.1.4 Tinh sạch sản phẩm PCR 31
3.1.5 Kiểm tra kết quả giải trình tự 32
3.2 Phân tích hệ gen ty thể lợn Ỉ 32
3.2.1 Dự đoán gen ty thể 33
3.2.2 Kết quả sắp xếp trình tự 42
3.2.3 Cây chủng loại phát sinh sử dụng trình tự hoàn chỉnh 46
3.2.4 Cây chủng loại phát sinh sử dụng trình tự D loop 47
3.2.5 Sự chủng loại phát sinh ở Sus scrofa 49
KẾT LUẬN VÀ KIẾN NGHỊ 53
TÀI LIỆU THAM KHẢO 54
PHỤ LỤC 65
Trang 6DANH MỤC BẢNG
Bảng 1.1 Khối lượng lợn Ỉ và Ỉ pha qua các mốc tuổi (kg) 4
Bảng 1.2 Khối lượng lợn Ỉ pha và Ỉ mỡ 5
Bảng 2.1 Trình tự mồi PCR 22
Bảng 2.2 Thành phần phản ứng PCR 24
Bảng 2.3 Thành phần phản ứng giải trình tự 25
Bảng 3.1 Cấu trúc của hệ gen ty thể lợn Ỉ 34
Bảng 3.2 Khu vực địa lý và các thông số thành phần trình tự của các giống lợn 38
Trang 7DANH MỤC HÌNH
Hình 1.1 Cấu trúc của ba loại đường năm carbon ribose, deoxyribose và
dideoxyribose 13
Hình 1.2 Sơ đồ phản ứng giải trình tự Sanger Ở đây, các mồi giải trình tự được gắn phóng xạ và các phản ứng tạo ra các đoạn trình tự bổ sung với khuôn DNA 14
Hình 1.3 Cấu trúc và phổ phát xạ huỳnh quang của bốn loại dye succinylfluorescein được phát triển bởi DuPont 15
Hình 1.4 Sơ đồ biểu diễn của một hệ thống giải trình tự DNA mao quản 16
Hình 3.1 Hình ảnh các cá thể lợn Ỉ 27
Hình 3.2 DNA tổng số được tách từ mẫu máu lợn Ỉ 28
Hình 3.3 Sản phẩm PCR khuếch đại các mồi 1-30 với nhiệt độ gắn mồi 54 o C 29
Hình 3.4 Sản phẩm PCR khếch đại tại nhiệt độ gắn mồi 53 o C và 51 o C 30
Hình 3.5 Kết quả tinh sạch sản phẩm PCR hệ gen ty thể 31
Hình 3.6 Ví dụ cho phần kết quả giải trình tự đủ độ tin cậy và được lựa chọn 32
Hình 3.7 Cấu trúc dạng vòng của hệ gen ty thể lợn Ỉ được xây dựng bởi phần mềm GenomeVX 33
Hình 3.8 Cấu trúc bậc hai của 22 loại tRNA được mã hóa trên hệ gen ty thể lợn Ỉ 41
Hình 3.9 Một phần trình tự D loop của lợn Ỉ và các giống lợn đã được công bố sau khi tiến hành sắp xếp 43
Hình 3.10 Một phần trình tự hoàn chỉnh của lợn Ỉ và các giống lợn đã được công bố sau khi tiến hành sắp xếp 44
Hình 3.11 Cây chủng loại phát sinh sử dụng trình tự hoàn chỉnh được phân tích theo phương pháp Bayesian 47
Hình 3.12 Cây chủng loại phát sinh sử dụng trình tự D loop được phân tích theo phương pháp Bayesian 49
Trang 8DANH MỤC TỪ VIẾT TẮT
Trang 9
MỞ ĐẦU
Lợn Ỉ đã từng là một giống lợn được nuôi rất phổ biến tại các tỉnh Bắc Bộ của Việt Nam Giống lợn này mang nhiều đặc điểm di truyền quý như mắn đẻ, khả năng chống chịu bệnh tốt, chất lượng thịt thơm ngon Tuy nhiên do kích thước nhỏ, tốc độ sinh trưởng chậm, không kinh tế, vì vậy số lượng lợn Ỉ được nuôi đang ngày một giảm
đi và giống này có nguy cơ sẽ biến mất Là một trong những nghiên cứu đầu tiên về di truyền phân tử đối với giống lợn Ỉ, trong nghiên cứu này chúng tôi lựa chọn phương pháp giải trình tự toàn bộ hệ gen ty thể làm công cụ nghiên cứu nguồn gốc di truyền của lợn Ỉ Hệ gen ty thể rất dễ khuếch đại, kích thước nhỏ, bên cạnh đó chúng còn được coi là dấu hiệu phân tử (marker) trong lĩnh vực đa dạng sinh học Những kết quả trong nghiên cứu này sẽ trở thành cơ sở phân phục vụ cho các hoạt động bảo tồn nguồn gen cũng như các nghiên cứu sâu hơn về di truyền phân tử trên đối tượng lợn Ỉ Mục tiêu và
phương pháp này đã được chúng tôi thực hiện trong đề tài “Xác định và phân tích trình
tự hệ gen ty thể hoàn chỉnh của giống lợn Ỉ tại Việt Nam”
Trang 10CHƯƠNG 1 TỔNG QUAN 1.1 Giới thiệu về giống lợn Ỉ
1.1.1 Nguồn gốc giống vật nuôi
Quá trình thuần hóa vật nuôi được diễn ra khoảng 8,000 - 10,000 năm trước tại Tây Nam Á, Đông Á và Châu Mỹ, [16] Điều này không hoàn toàn là ngẫu nhiên bởi tại thời điểm đó, sau khi Kỷ băng hà (12,200–11,100 năm trước) kết thúc, khí hậu bắt đầu trở nên ấm hơn và theo mùa hơn Một số quần thể người bắt đầu phát triển nhanh chóng và trở thành các trung tâm dân cư, hình thành nên các khu vực quan trọng Quá trình định cư này thường diễn ra tại các khu vực đất đai màu mỡ tự nhiên, thích hợp cho nông nghiệp, hoặc tại các vị trí nằm giữa các vùng đất rộng lớn, đóng vai trò liên kết các vùng đất này lại với nhau, và là điểm dừng chân của những người di cư Sự tăng lên của cả dân số bản địa và di cư đã khiến nhu cầu cung cấp thực phẩm tăng lên, kích thích kinh tế nông nghiệp và các quá trình thuần hóa các giống nông nghiệp [43,
72, 82]
Ba khu vực Tây Nam Á (Vùng Trăng lưỡi liềm màu mỡ và rìa phía đông của nó, hướng về phía lưu vực Ấn Độ) [77], Đông Á (Trung Quốc và các nước phía nam Trung Quốc) và khu vực dãy Andean của Nam Mỹ [16] được coi là các khu vực chính diễn ra quá trình thuần hóa giống vật nuôi Gia súc, cừu, dê, lợn và trâu được thuần hóa tại hai khu vực châu Á, trong khi lạc đà không bướu và lạc đà Alpaca được thuần hóa ở Nam
Mỹ Ngựa là ngoại lệ, chúng được thuần hóa tại các khu vực độc lập phía bắc, ngoài ra ngựa dường như là loài gia súc lớn được thuần hóa gần đây nhất (khoảng 6000 năm trước) [39, 93]
1.1.2 Giống lợn nhà (Sus scrofa)
Giống lợn nhà hiện nay (Sus scrofa) bắt nguồn từ hai nhóm lợn rừng hoang dại
Đó là lợn rừng Châu Âu (Sus scrofaferus) và lợn rừng Châu Á (Sus orientalis, Sus
cristatus sus vittatus) được con người thuần hoá trong thời gian dài mà thành Căn cứ
vào hình dáng của tai, người ta chia cả hai nhóm lợn nguyên thuỷ Châu Âu và Châu Á
Trang 11thành hai loại: Lợn tai dài và lợn tai ngắn Giống lợn lai cổ đại là do giống lợn nguyên thuỷ Châu Âu và nguyên thuỷ Châu Á tạp giao mà thành Giống lợn này được nuôi chủ yếu tại các nước dọc theo Địa Trung Hải Trong đó lấy giống lợn lông xoăn Roman và lợn ở bán đảo Balkan lai với lợn Trung Quốc là giống thành thục sớm, phẩm chất thịt ngon, mềm, ở đời sau cho tự giao và hình thành giống lợn lai cổ đại Các giống lợn nhà nuôi hiện nay là do các giống lợn Cổ đại trước kia thông qua các phương pháp tạp giao cải lương khác nhau mà dần hình thành nên [5]
Trước những năm 70 lợn Ỉ được nuôi hầu như ở khắp các tỉnh đồng bằng Bắc bộ như Nam Định, Hà Nam, Hà Tây, Hưng Yên, Hà Nội, Vĩnh Phúc, Hải Dương, Thái Bình, Quảng Ninh, Ninh Bình, Thanh Hoá, Hải Phòng Vị trí phổ biến của nó dần dần phải nhường cho lợn Móng Cái có sức sinh sản tốt hơn, và từ cuối những năm 70 lợn Ỉ thu hẹp dần lại số lượng như ngày nay, chỉ còn sót lại ở một số xã của tỉnh Thanh Hoá
b Đặc điểm sinh học
Đặc điểm ngoại hình: Lợn Ỉ có nhiều loại hình trong đó phổ biến là Ỉ mỡ và Ỉ pha
Lợn Ỉ mỡ: Lợn Ỉ mỡ cũng có lông da đen bóng, đa số có lông nhỏ thưa, một số
có lông rậm (lông móc) như Ỉ pha Đầu hơi to, khi béo trán dô ra, mặt nhăn nhiều, nọng
cổ và má sệ từ khi lợn 5-6 tháng tuổi, mắt híp, mõm to bè và ngắn, môi dưới thường dài hơn môi trên, lợn nái càng già mõm càng dài và cong lên nhưng luôn ngắn hơn Ỉ
Trang 12hơn, bụng to sệ, mông nở từ lúc 2-3 tháng, phía sau mông hơi cúp Chân thấp hơn Ỉ pha, lợn thịt hoặc hậu bị có hai chân trước thẳng, hai chân sau hơi nghiêng, lợn nái thì thường đi chữ bát, hai chân sau yếu
Lợn Ỉ pha: Lợn Ỉ pha có lông da đen bóng, đa số có lông nhỏ thưa, một số có lông rậm lông móc) Đầu to vừa phải, trán gần phẳng, mặt ít nhăn, khi béo thì nọng cổ
và má chảy sệ, mắt híp Mõm to và dài vừa phải, lợn nái càng già mõm càng dài và cong lên Vai nở vừa phải, từ 8-9 tháng vai bằng hoặc lớn hơn mông, ngực sâu Thân mình dài hơn so với ỉ mỡ, lưng đa số hơi võng, khi béo thì trông phẳng, bụng to, mông lúc nhỏ hơi lép về phía sau, từ 6-7 tháng mông nở dần Chân thấp, lợn thịt hoặc hậu bị thì hai chân trước tương đối thẳng, hai chân sau hơi nghiêng, lợn nái thì nhiều con đi vòng kiềng hoặc chữ bát [1]
c Khả năng sản xuất
Khả năng sinh trưởng và tầm vóc của hai nòi lợn Ỉ pha và Ỉ mỡ là tương đương nhau, chúng được thể hiện qua khối lượng và kích thước các chiều của chúng ở các bảng sau (bảng 1.1 và 1.2):
Bảng 1.1 Khối lượng lợn Ỉ và Ỉ pha qua các mốc tuổi (kg) [1]
Trang 13Bảng 1.2 Khối lượng lợn Ỉ pha và Ỉ mỡ [1]
(kg)
Cao (cm)
Dài thân (cm)
Vòng ngực (cm)
ml, thời gian sử dụng đực giống tốt nhất trong 2 - 3 năm
Lợn cái Ỉ 4 - 5 tháng tuổi là động dục và có khả năng thụ thai, tuy nhiên tuổi phối giống tốt nhất là khoảng 7 tháng tuổi Chu kỳ động dục của lợn Ỉ trung bình trong khoảng 19 - 20 ngày (biến động từ 17 đến 24 ngày) Thời gian động dục trung bình 3 -
4 ngày, thời điểm phối giống tốt nhất là ngày động dục thứ hai Thời gian mang thai trung bình trong khoảng 110 - 115 ngày
Ở đàn lợn Ỉ Thanh Hóa, lợn cái thành thục về tính sớm, lúc 3 tháng tuổi có biểu hiện động dục, 4 tháng tuổi có khả năng thụ thai Chu kỳ động dục thường từ 19 - 21 ngày, thời gian động dục kéo dài 4 - 5 ngày (biến động 3 - 8 ngày) Tuổi phối giống đầu tiên tốt nhất là 8 tháng tuổi, lúc đó khối lượng cơ thể đạt 35 - 40 kg Thời gian
Trang 14mang thai trung bình là 110 ngày, số con đẻ ra trung bình đạt 8.8 - 11.3 con/ lứa và con cái có tuổi sử dụng có thể tới 10 - 11 năm [1]
1.2 Tầm quan trọng của các nghiên cứu về lợn tại Việt Nam
Việt Nam là một nước nông nghiệp với 80% dân số sống ở nông thôn và 70% lấy nông nghiệp làm nguồn kinh tế chính của họ [62] Trong lĩnh vực nông nghiệp, trồng lúa nước và chăn nuôi lợn được liên kết chặt chẽ với đời sống của người nông dân Việt Nam Chăn nuôi luôn chiếm một vị trí quan trọng trong hệ thống nông nghiệp Việt Nam nói chung và ở các gia đình nông thôn nói riêng [21]
Chăn nuôi lợn là một nghề truyền thống ở Việt Nam, đóng một vai trò chủ chốt đối với đời sống kinh tế và văn hóa của người nông dân [49] Lợn được nuôi giữ lâu đời và vô cùng phổ biến, trở thành một trong những giống vật nuôi quan trọng nhất Phần lớn chăn nuôi lợn ở Việt Nam là chăn nuôi nhỏ Có tới 80% sản lượng thịt lợn đến từ các cơ sở chăn nuôi nhỏ với một đến hai lợn nái và dưới mười con lợn nuôi lấy thịt [48] Trong khu vực chăn nuôi, nuôi nhỏ lẻ tại miền Bắc Việt Nam chiếm tới 41% tổng thu nhập từ lợn, đóng góp chủ yếu từ các khu vực dân tộc thiểu số [38]
Lợn được nuôi nhỏ lẻ vừa để bán vừa để phục vụ tiêu dùng cho chính các hộ gia đình Do đó, chúng quan trọng ở nhiều khía cạnh như cung cấp hàng hóa cho kinh tế, tăng cường thu nhập, tạo công ăn việc làm bảo đảm sinh kế cho người nông dân, cải thiện chất lượng bữa ăn cho gia đình Tại các khu vực miền núi, nuôi lợn gắn bó chặt chẽ với văn hóa truyền thống, phong tục tập quán của các dân tộc thiểu số, như các ngày lễ hội đón năm mới hay các dịp đặc biệt trong suốt một năm [35]
Số lượng lợn tại Việt Nam trong những năm gần đây đã tăng lên nhanh chóng Năm 2001, số lượng lợn được nuôi là khoảng 21,8 triệu con, và đạt xấp xỉ 24,7 triệu con vào năm 2005, tăng bình quân 6,3% một năm Năm 2005, 2,3 triệu tấn thịt lợn được tạo ra, và 2006 là 2,4 triệu tấn, chiếm lần lượt 81% và 71,5% tổng sản lượng thịt của các năm tương ứng [71] Hơn 90% lượng thịt lợn được cung cấp trong nước bởi các hộ nông dân và hơn 98% các hộ gia đình Việt Nam tiêu thụ sản phẩm thịt lợn [6]
Trang 15Đặc biệt là tại các hộ gia đình ở các tỉnh miền núi, phần lớn các hộ đều sử dụng chính sản phẩm thịt họ nuôi
Một số nghiên cứu đã được tiến hành để đánh giá hiệu suất của các giống lợn tại các trang trại và các trung tâm giống về các giống ngoại lai, các giống lai và một số đặc điểm của các giống bản địa như khả năng sinh sản, sinh trưởng, cũng như phần trăm thịt nạc [2-4] Do điều kiện chăn nuôi nhỏ, hiệu suất của chăn nuôi lợn tại Việt Nam nhìn chung vẫn ở mức thấp
Những thông tin di truyền về các giống lợn bản địa Việt Nam còn khá hạn chế Mặc dù việc phân biệt các giống bản địa Việt Nam có thể được thực hiện thông qua các đặc điểm hình thái rất riêng biệt của chúng, nhưng thông tin về di truyền vẫn hết sức quan trọng Chúng giúp kiểm soát tốt hơn, chính xác hơn các giống và có thể tìm ra mối liên hệ giữa chúng với các tính trạng quý Ngoài ra, những nghiên cứu đánh giá năng suất, chất lượng thịt và liên hệ chúng với sự đa dạng di truyền của các giống lợn vẫn chưa được thực hiện nhiều ở Việt Nam
1.3 Marker trong nghiên cứu đa dạng di truyền
Việc áp dụng di truyền phân tử trong nghiên cứu đa dạng di truyền có thể tác động lớn tới hiểu biết của chúng ta về những sự kiện đã từng diễn ra Cụ thể, các nghiên cứu gần đây cho phép tìm ra tổ tiên của các loài gia súc hiện nay cũng như quá trình phát triển chăn nuôi trong hàng ngàn năm qua [56, 77] Những thông tin thú vị này đã cho chúng ta hiểu biết thêm về sự sống, đặc biệt là cách thức con người tạo nên
sự đa dạng sinh học nông nghiệp trong một khoảng thời gian tương đối ngắn Hơn nữa, kết hợp các nghiên cứu tiến hóa ở người [30], vật nuôi [73, 80] và cây trồng [77] có thể cung cấp cho chúng ta một cái nhìn toàn diện về xã hội loài người trên khắp thế giới
Cho đến nay vẫn có rất nhiều tranh luận giữa các nhà khảo cổ học động vật về thời điểm xuất hiện và thời gian của những thay đổi trong cấu trúc tuổi, giới tính của các quần thể động vật thuần hóa [7, 101] Điều này để lại những câu hỏi mở về những
Trang 16độ đóng góp của chúng vào nguồn gen hiện đại ngày nay Nghiên cứu phân tử cho phép trả lời các câu hỏi đó, các dấu hiệu DNA có thể được áp dụng và nghiên cứu chủng loại phát sinh, đa dạng quần thể, xác định di truyền của cá thể, được phát triển từ những năm 1970 [41, 86] nhưng chỉ được áp dụng phổ biến cho các nghiên cứu động vật thuần hóa và đa dạng từ những năm đầu thập niên 1990 [54, 56]
Một trong những mối quan tâm toàn cầu hiện nay là sự mất dần của đa dạng sinh học nông nghiệp khi phải đối mặt với những áp lực ngày càng tăng của quá trình canh tác hiện đại Việc xây dựng các khái niệm về tạo giống hiện đại từ giữa những năm 1800 đã gây ra nhưng thay đổi đáng kể trong lĩnh vực chăn nuôi, đặc biệt là ở mức
độ quy mô lớn [66] Hệ quả là người nông dân dần dần thay thế các giống vật nuôi bản địa ít hiệu quả bằng các giống quốc tế có năng suất cao., do vậy một lượng đáng kể gia súc đã biến mất hoặc đang bị đe dọa [90] Những dữ liệu này cũng cho thấy tầm quan trọng của việc quản lý và bảo tồn các nguồn gen động vật và thực vật ngày nay Nhiều
sự đa dạng đang mất đi mà không rõ nguyên nhân, bao gồm số lượng lớn các giống vật nuôi, mà không hề được quản lý và thống kê tại thời điểm hiện tại trong khi sự đa dạng sinh học này có thể chứa những vật liệu di truyền (ví dụ như các loài thích nghi bản địa) có giá trị cho sản xuất trong tương lai Có khả năng là một lượng lớn các giống đang và sẽ tiếp tục biến mất trước khi các đặc điểm cũng như tiềm năng của chúng được nghiên cứu và đánh giá Do đó, trong hoàn cảnh này, những chiến lược để bảo tồn đa dạng gia súc là rất quan trọng và các dữ liệu nghiên cứu phân tử của các giống vật nuôi có thể sẽ trở thành cơ sở hỗ trợ việc bảo tồn sự đa dạng [16]
Để xác định được nguồn gốc thuần hóa của một loài vật nuôi, các nhà khoa học phải dựa vào một số dấu hiệu phân tử Các marker này cần có một số đặc điểm, đầu tiên, nó nên đủ bảo thủ để cho phép xác định các đơn vị phân loại hoặc quần thể từ mức loài trở xuống Thứ hai, nó vẫn đủ đa dạng theo phạm vi địa lý của loài để có thể xác định gần đúng sự phân bố của quá trình thuần hóa Thứ ba, các dấu hiệu phân tử nên tiến hóa nhưng với tỉ lệ không đổi, cho phép xác định thời điểm nguồn gốc của một
Trang 17đa hình Do đáp ứng được các yêu cầu này, hiện nay DNA ty thể là một công cụ được
sử dụng rộng rãi nhất trong nghiên cứu về quá trình thuần hóa
1.3.1 Cấu trúc hệ gen ty thể
Hệ gen ty thể của động vật có vú bao gồm một DNA mạch vòng có kích thước 16.6 kb Hai sợi trên mạch kép của DNA ty thể được phân biệt thành hai sợi sợi nặng (H) và sợi nhẹ (L) dựa theo tỷ lệ thành phần các nucleotide [42] Hầu hết thông tin được mã hóa trên sợi nặng, với gen mã hóa cho hai rRNA, mười bốn tRNA, và mười hai protein Sợi nhẹ mã hóa cho tám tRNA và một protein lớn Tất cả các sản phẩn protein là thành phần của các phức hợp enzyme tham gia vào quá trình phosphoryl oxy hóa [19] Các gen không chứa intron và ngoại trừ một số vùng điều hòa, trình tự intergentic thường không tồn tại hoặc chỉ có giới hạn ở một số vùng Cả hai loại phân
tử tRNA và rRNA đều có kích thước nhỏ bất thường [97] Một số gen mã hóa protein nằm chồng chéo và trong nhiều trường hợp, một phần của bộ ba kết thúc tuy không được mã hóa nhưng được tạo ra sau khi phiên mã bởi quá trình gắn đuôi polyA sau phiên mã [63]
Với những trình tự DNA ty thể đã được nghiên cứu, so sánh các chuỗi protein ty thể cho thấy những khác biệt so với mã di truyền chuẩn và có những thay đổi trong việc quy định mã bộ ba đã được tìm ra ở những loài khác nhau [64] Ví dụ, trong hệ gen ty thể của hầu hết các loài, TGA được sử dụng như mã bộ ba mã hóa cho Tryptophan chứ không phải là stop codon Tương tự, AGR (R=A, G) mã hóa cho mã
bộ ba kết thúc ở hệ gen ty thể của động vật có xương sống, serine ở hệ gen ty thể động vật da gai và mã hóa cho Arginine ở hệ gen ty thể nấm men cũng như bộ mã di truyền chuẩn
Một đặc điểm đáng ngạc nhiên của hệ thống di truyền ty thể đó là sử dụng một
cơ chế mã hóa đơn giản, cho phép dịch mã các codon với ít hơn 32 loại tRNA, điều này
là do việc sử dụng chỉ một tRNA duy nhất với nucleotide tại vị trí đầu tiên (vị trí biến
Trang 18thể của nấm sử dụng Uracil tại vị trí biến đổi để đọc hai họ bộ ba mã hóa với một purine nằm tại vị trí thứ ba của mã bộ ba [36] Cơ chế này ngăn ngừa việc đọc sai của hai họ mã bộ ba bằng cách sử dụng một Pyrimidine tại vị trí thứ ba và nó được coi là không thay đổi ở các hệ gen ty thể của động vật có xương Hơn nữa với bộ ba AGR ở động vật có xương đóng vai trò bộ ba kết thúc, đồng thời việc biến đổi mã khởi đầu cho phép chỉ cần 22 tRNA là đủ để dịch mã tất cả 13 gen mã hóa cho protein của hệ gen ty thể [60, 64]
Ở các tế bào động vật có xương sống diễn ra quá trình trao đổi chất, có một tỷ lệ lớn các DNA ty thể có chứa cấu trúc sợi ba, được gọi là vòng lặp thay thế hoặc D loop, trong đó bao gồm một cấu trúc sợi nucleic acid ngắn, bổ sung với sợi L và chiếm chỗ
của sợi H [42] Vùng D loop nằm giữa các gen mã hóa cho tRNA Phe and tRNA Pro
và đóng vai trò vị trí kiểm soát chính quá trình biểu hiện của DNA ty thể, chứa vị trí khởi đầu tái bản và các promoter chính của quá trình phiên mã [94]
Ty thể không thể trực tiếp tự vận hành Quá trình tái bản và phiên mã phụ thuộc vào các yếu tố được mã hóa trong nhân Các tRNA ty thể được điều khiển với các enzyme amino acyl-tRNAsynthases và trong các động vật có xương sống tất cả các protein của ribosome ty thể đều được mã hóa và tổng hợp bên ngoài bào quan Các enzyme của các con đường dị hóa khác nhau nằm trong ty thể cũng như các các thành phần của ty thể đều được mã hóa trong DNA nhân Thậm chí cả các phức hợp enzyme của hệ thống phosphoryl oxy hóa cũng có nguồn gốc di truyền kết hợp từ cả DNA ty thể và nhân [75]
1.3.2 Ty thể trong nghiên cứu đa dạng di truyền
Hệ gen ty thể mặc dù có kích thước rất nhỏ trong kích thước toàn bộ hệ gen của sinh vật nhưng nó lại được coi là một marker đa dang phân tử phổ biến nhất ở động vật trong suốt nhiều thập kỷ qua Đã có rất nhiều những nhà di truyền học quần thể và hệ thống học áp dụng công cụ này trong nghiên cứu của họ [8, 59]
Trang 19Trong các nghiên cứu về về nguồn gốc của các giống lợn bản địa, Fernández (2008, 2011) đã tiến hành nghiên cứu mối quan hệ giữa đa hình DNA ty thể và chất lượng thịt ở giống lợn Iberia Kết quả đã phát hiện một số đa hình đóng vai trò như các chỉ thị phân tử đóng góp vào quá trình chọn giống lợn này [25, 26] Năm 2008, Wu và
cs cũng sử dụng các phân tích đa hình DNA ty thể như một công cụ để xác định nguồn gốc của các giống lợn bản địa phân bố ở khu vực sông Mê Kông và các vùng trung và
hạ lưu sông Dương Tử [25] Xác định trình tự hệ gen ty thể hoàn chỉnh của giống lợn Visayan, lợn Java với tổng 16.475 bp cho thấy nó có cấu trúc đặc trưng của 13 gen mã hóa protein, 2 gen rRNA, 22 gen tRNA và một vùng điều khiển không mã hóa D-loop
Sự sắp xếp của các gen này tương tự như ở các giống lợn khác Hệ gen ty thể phân tích
ở đây sẽ cung cấp nguồn tài nguyên di truyền mới để khám phá sự phát triển của lợn [23, 52]
Những lý do của việc DNA ty thể trở thành một lựa chọn tốt cho marker phân tử
đó là: DNA ty thể tương đối dễ khuếch đại bởi nó có nhiều bản sao trong tế bào, trình
tự gen ty thể được bảo tồn rất mạnh giữa các loài động vật, với rất ít sự trùng lặp, không chứa intron, các vùng intergenic ngắn [28] DNA ty thể có độ đa dạng cao trong quần thể tự nhiên do tỷ lệ đột biến lớn, điều này có thể trở thành các bằng chứng cho lịch sử phát triển của quần thể Các vùng biến đổi (Ví dụ vùng D loop) thường đặt giữa các vùng bảo tồn cao (DNA ribosome), ở đó các mồi PCR có thể được thiết kế Quá trình khuếch đại không đặc hiệu chỉ xảy ra khi các cặp mồi PCR khuếch đại cả những vùng gen ty thể đã được chuyển vào hệ gen nhân ở một số loài Rõ ràng, DNA ty thể là một giải pháp tiện lợi nhất và rẻ nhất cho việc khám phá gen của các loài mới trong tự nhiên
Vùng D loop không mã hóa cho bất kì một protein nào và có tốc độ tiến hóa cao hơn nhiều so với các các khu vực khác của hệ gen ty thể Trong suốt hai mươi năm qua, D loop đã được sử dụng trong các phân tích chủng loại phát sinh Sự khác biệt của
Trang 20của hai giống bò Bos taurus và Bos indicus bản địa là từ hai vùng riêng biệt [13]
Ngoài ra, trình tự D loop còn được sử dụng để nghiên cứu sự đa dạng và tính bản địa ở các loài chó, ngựa, và dê Việc nghiên cứu hoàn chỉnh trình tự vùng D-loop ty thể của giống lợn trắng Pudong ở vùng Taihu - Trung Quốc, đã cho thấy không có sự trao đổi
di truyền giữa các quần thể, và giống lợn này chỉ xuất hiện duy nhất tại đây, do vậy cần
có những chính sách để bảo tồn nguồn gen bản địa quý hiếm này [95]
Bên cạnh đó, DNA ty thể có một số đặc tính sinh học cụ thể [9, 10], để trở thành một marker phân tử sử dụng trong lĩnh vực đa dạng sinh học Đầu tiên, ty thể được di truyền vô tính theo dòng mẹ, có nghĩa là nó sẽ không xảy ra quá trình tái tổ hợp – tất cả các vùng trên hệ gen đều có nguồn gốc di truyền chung Điều này giúp giảm bớt số lượng mẫu và lượng dữ liệu cần phân tích so với khi phân tích các loại đối tượng biến đổi mạnh Thứ hai, mức độ biến đổi của DNA ty thể là thấp Do tham gia các chức năng trao đổi chất cơ bản, các gen mã hóa trên hệ gen ty thể được coi là ít có khả năng biến đổi hơn so với các gen khác liên quan đến quá trình thích nghi Cuối cùng, tốc độ tiến hóa của DNA ty thể được giả định là theo thời gian, chỉ chứa các đột biến được tích lũy dần theo thời gian mà không liên quan đến sự chọn lọc Rõ ràng DNA ty thể là một marker lý tưởng
1.4 Phương pháp giải trình tự Sanger
Phương pháp này được phát triển bởi Fred Sanger vào khoảng thời gian giữa những năm 1970 [79] Thay vì sử dụng phản ứng hóa học, Sanger lựa chọn một phương pháp sử dụng tới một dạng cấu trúc thứ ba của gốc đường ribose Như thể hiện trong hình 1.1, ribose có một nhóm hydroxyl tại cả hai vị trí carbon 2’ và 3’ trong khi deoxyribose chỉ có duy nhất một nhóm hydroxyl tại vị trí carbon 3’ Dạng thứ ba của ribose trong đó loại bỏ hydroxyl tại cả hai vị trí carbon 2’ và 3’ Dạng này được gọi là dideoxyribose, và bất cứ khi nào một dideoxyribose được gắn vào một chuỗi polynucleotide, quá trình kéo dài chuỗi đó sẽ bị dừng lại Như vậy, sự kết hợp của các dideoxynucleotide riêng biệt sẽ tạo ra các chuỗi có kết thúc có chọn lọc
Trang 21Hình 1.1 Cấu trúc của ba loại đường năm carbon ribose, deoxyribose và
dideoxyribose [92]
Các nhóm hydroxyl được biểu diễn bằng màu đỏ
Sanger đã tiến hành thiết lập quy trình trong đó bốn phản ứng được thực hiện riêng biệt, kết hợp một loại dideoxynucleotide khác nhau cùng với bốn deoxynucleotide, sẽ tạo ra các đoạn có két thúc tại tất cả các vị trí gắn của nhóm dideoxynucleotide nếu tỷ lệ dideoxynucleotide và deoxynucleotide tương ứng được thiết lập đúng
Sự ra đời của giải trình tự Sanger đã thức đẩy các nghiên cứu giải trình tự DNA nói chung, sự gia tăng của các dữ liệu trình tự trong các nghiên cứu khoa học cũng dẫn đến việc thành lập các kho lưu trữ trình tự DNA đầu tiên bởi Walter Goad tại Phòng thí nghiệm Quốc gia Los Alamos năm 1979 Kho dữ liệu này sau đó trở thành GenBank [61]
Trang 22Hình 1.2 Sơ đồ phản ứng giải trình tự Sanger [92]
Ở đây, các mồi giải trình tự được gắn phóng xạ và các phản ứng tạo ra các đoạn trình tự bổ sung với khuôn DNA Các đoạn trình tự được phân tách trên gel polyacrylamide và được chụp
ảnh phóng xạ Trình tự được xác định nhờ các băng trên gel.
Một trong những phát triển quan trọng nhất trong phương pháp giải trình tự nhằm tạo nên một hệ thống thông lượng cao là sự ra đời của các hệ thống giải trình tự
sử dụng kết thúc dideoxy gắn huỳnh quang Năm 1986, Leroy Hood và các đồng nghiệp đã đưa ra một phương pháp giải trình tự DNA trong đó các tín hiệu phóng xạ được thay thế bằng tín hiệu huỳnh quang, sử dụng laser cảm ứng huỳnh quang liên kết với hệ thống máy tính [83] Trong phương pháp của họ, mồi sẽ được gắn một trong bốn loại tín hiệu huỳnh quang khác nhau và được đưa vào các phản ứng giải trình tự riêng biệt cùng với một trong bốn loại dideoxynucleotides Khi phản ứng đã hoàn tất, bốn phản ứng được gộp lại và chạy cùng nhau trong một làn của gel giải trình tự polyacrylamide Một cảm biến laser bốn màu sẽ quét qua các đoạn di chuyển trong gel Tín hiệu huỳnh quang của từng đoạn sau đó được gửi tới một máy tính với phần mềm
Trang 23được thiết kế để nhận diện các base (hình 1.2) Phương pháp này được thương mại hóa vào năm 1987 bởi Applied Biosystems
Hình 1.3 Cấu trúc và phổ phát xạ huỳnh quang của bốn loại dye succinylfluorescein
được phát triển bởi DuPont [92]
A Cấu trúc của bốn loại dye succinylfluorescein B Phổ phát xạ huỳnh quang của các loại
dye tại bước sóng kích thích 480 nm
James M Prober và các đồng nghiệp tại DuPont đã thực hiện bước phát triển tiếp theo của phương pháp giải trình tự gắn huỳnh quang Trong đó thay vì gắn huỳnh quang vào mồi, họ gắn tín hiệu vào chính các kết thúc dideoxy Một bộ dye sẽ bao gồm các succinylfluorescein, thay đổi bước sóng phản xạ thông qua các nhóm phụ khác nhau Các dye SF505, SF512, SF519, và SF526 được gắn lần lượt vào ddG, ddA, ddC,
và ddT Phổ phát xạ của bốn loại thuốc nhuộm được thể hiện trong hình 1.3 Tất cả bốn loại dye đều được kích thích bằng laser bước sóng 480 nm và mỗi loại sẽ phát ra một tín hiệu khác nhau được phát hiện bởi hệ thống cảm biến Với hệ thống phát hiện này, phản ứng giải trình tự có thể được thực hiện trong một ống duy nhất với tất cả bốn loại ddNTP và quá trình đọc trình tự được thực hiện chỉ trong một làn duy nhất [67]
Trang 24DuPont thương mãi hóa công nghệ của chính mình trong một thời gian ngắn và sau đó bán cho Applied Biosystems
Hình 1.4 Sơ đò biểu diễn của một hệ thống giải trình tự DNA mao quản [92]
A Các thiết lập cơ bản của một hệ thống mao quản Phản ứng giải trình tự được chứa trong ngăn chứa mẫu, đệm điện di được chứa trong ngăn thứ hai, mao quản được bơm đầy polymer, một điện thế được đưa vào hai đầu mao quản B Tín hiệu phát ra từ các đoạn giải trình tự khi
đi qua laser quét được thu nhận thông qua các cảm biến sáng và thông tin sẽ được chuyền về
máy tính C Biểu đồ tín hiệu đầu ra
Vào những năm 1990, Applied Biosystems đã tiếp tục có những sự tinh chỉnh đối với các hóa chất và thiết bị cảm biến Các thuốc nhuộm huỳnh quang đã được thay đổi thành một loạt các dẫn xuất của rhodamine, ddG, ddA, ddC, và ddT lần lượt được gắn với dichloroROX, dichloroR6G, dichloroR110 và dichloroTAMRA Mặc dù những cải thiện này dẫn đến tăng đáng kể hiệu suất giải trình tự DNA, hệ thống vẫn
Trang 25phải sử dụng gel acrylamide vốn cần quá nhiều thao tác và không phù hợp với một hệ thống thông lượng cao Đến những năm 1990, Harold Swerdlow và các đồng nghiệp đã
sử dụng điện di mao quản trong giải trình DNA [88, 89] Mao quản có kích thước nhỏ, đường kính bên trong chỉ 50μm, chúng có khả năng tản nhiệt rất hiệu quả do diện tích
bề mặt lớn Điều này có nghĩa rằng hệ thống mao quản có thể chạy với điện áp cao hơn nhiều từ đó giảm đáng kể thời gian chạy Quan trọng nhất, các hệ thống mao quản có thể chạy tự động, ưu điểm lớn so với hệ thống dựa trên gel Cuối cùng vào năm 1993, B.L Karger và các đồng nghiệp báo cáo về việc sử dụng một loại chất nền phân tách
độ nhớt thấp có thể bơm vào các mao quản với áp suất tương đối thấp [74] Loại polyme này có thể rửa ra và thay thế sau quá trình sử dụng Đây là tất cả các yếu tố cần thiết để phát triển một nền tảng giải trình tự thông lượng cao (hình 1.4) Hiện nay hệ thống được phát triển có thể giải trình tự các đoạn DNA có độ dài 500-1000 base chỉ trong vài giờ
1.5 Phương pháp phân tích sự chủng loại phát sinh
1.5.1 Cây chủng loại phát sinh
Trước thời điểm ra đời công nghệ giải trình tự DNA, thuật ngữ cây chủng loại phát sinh hầu như chỉ được sử dụng để mô tả các mối quan hệ giữa các loài trong hệ thống học (systematic) và phân loại học (taxonomy) Ngày nay, khái niệm này được sử dụng trong hầu hết các ngành của sinh học Ngoài việc thể hiện các mối quan hệ của các loài, cây còn có thể được sử dụng để mô tả mối quan hệ về nguồn gốc của các họ gen [58], lịch sử phát sinh quần thể [22], quá trình biến đổi dịch tễ của các tác nhân gây bệnh [32, 57], mối quan hệ của các tế bào sinh dưỡng trong suốt quá trình biệt hóa hoặc phát triển của ung thư [78] Gần đây, phân tích sự chủng loại phát sinh sử dụng công cụ phân tử đã trở thành một công cụ không thể thiếu khi so sánh các hệ gen, phân loại các trình tự metagenomics [14], để xác định gen, các yếu tố điều hòa và các RNA không mã hóa nằm trên các hệ gen sau khi đã được giải trình tự [44, 51, 65], phân tích
Trang 26genome của các cá thể hiện đại và cổ đại [31, 33, 50], hoặc tái tạo lại genome tổ tiên [55]
Một cây chủng loại phát sinh sẽ bao gồm các điểm nút và từ các điểm nút đó sẽ chia ra thành các nhánh Mỗi nhánh biểu diễn cho sự tồn tại của một đối tượng di truyền theo thời gian và mỗi điểm nút đánh dấu thời điểm ra của các đối tượng mới Nếu cây biểu diễn mối quan hệ di truyền giữa một nhóm các loài, mỗi điểm nút sẽ đại diện cho một sự kiện đặc biệt nào đó Ví dụ, trong một cây được xây dựng dựa trên trình tự của các đối tượng cần nghiên cứu, mỗi điểm nút sẽ đại diện cho sự phát sinh của các cá thể được coi là tổ tiên của các mẫu này, trong khi đó đối với cây được xây dựng để biểu diễn một họ gen, các điểm nút sẽ đại diện cho các điểm trùng lặp gen [99]
Cây chủng loại phát sinh không được vẽ trực tiếp mà được suy ra từ các dữ liệu của trình tự hoặc các loại dữ liệu khác Phương pháp xây dựng cây chủng loại phát sinh
sẽ dựa vào khoảng cách tính toán được hoặc các đặc điểm của dữ liệu Đối với các phương pháp sử dụng ma trận khoảng cách, tùy theo từng loại phương pháp riêng khoảng cách giữa các giữa các trình tự được tính toán lần lượt theo cặp, sau đó ma trận
sẽ tổng hợp các kết quả khoảng cách lại và sử dụng chúng để dựng cây Ví dụ, phương pháp Neighbor joining áp dụng thuật toán gộp nhóm vào tính toán ma trận khoảng cách
để xác định sự chủng loại phát sinh [76] Các phương pháp phân tích dựa trên các đặc điểm của dữ liệu phân tích như Maximum parsimony, Maximum likelihood và Bayesian Những phương pháp này sẽ đồng thời so sánh tất cả các trình tự đã được sắp xếp, xem xét các đặc điểm tại cùng một vị trí sắp xếp, cùng một thời điểm để tính toán
ra một loại chỉ số gọi là điểm số của cây “Điểm số của cây” được tính toán theo công thức khác nhau tùy theo phương pháp, đối với Maximum parsimony là giá trị thay đổi nhỏ nhất, đối với Maximum likelihood là log của khả năng xảy ra (log-likelihood) và đối với Bayesian là xác suất hậu nghiệm Theo lí thuyết, cây có điểm số cao nhất được xác định bằng cách so sánh điểm số của tất cả các cây có khả năng xảy ra Tuy nhiên
Trang 27trong thực tế, do số lượng cây có thể xảy ra rất lớn, việc tìm kiếm toàn bộ là không khả thi ngoại trừ trường hợp đối với lượng dữ liệu nhỏ Thay vào đó, các thuật toán tìm kiếm cây mô phỏng được sử dụng Cách tiếp cận này thường tạo ra các cây ban đầu bằng các thuật toán nhanh, sau đó thực hiện sắp xếp lại tại các vị trí để tăng điểm số của cây lên Cách tìm kiếm cây mô phỏng sẽ không đảm bảo tìm ra được cây tốt nhất theo lý thuyết nhưng đó là một phương pháp khả thi khi phân tích lượng dữ liệu lớn
Để biểu diễn số liệu, cả phương pháp ma trận khoảng cách, Maximum likelihood và Bayesian đều sử dụng những mô hình thay thế được đặt ra trong khi Maximum pasrsimony không có một mô hình rõ ràng và các giá trị của nó được ẩn đi [99]
1.5.2 Phương pháp Bayesian
Cơ sở cho phân tích Bayesian cũng là các phương pháp chung của suy luận thống kê Tuy nhiên phương pháp này khác với Maximum likelihood ở các tham số được sử dụng, chúng là các biến ngẫu nhiên đối với phương pháp Bayesian và là các hằng số cố định chưa biết đối với phương pháp Maximum likelihood Trước khi phân tích các dữ liệu, các tham số được gắn cho một phân bố tiền nghiệm, sau đó kết hợp với các dữ liệu để tìm ra phân bố hậu nghiệm Hiện này phân tích Bayesian trở nên phổ biến nhờ những tiến bộ trong phương pháp tính toán, đặc biệt là thuật toán Markov chain Monte Carlo (MCMC) [99]
Cả hai phương pháp Bayesian và likelihood đều sử dụng hàm “khả năng có thể xảy ra” và do đó chúng có chung nhiều ưu điểm thống kê như tính thống nhất và hiệu quả [98] Tuy nhiên, cách suy luận thống kê của hai phương pháp này là đối lập, do đó điểm mạnh và điểm yếu của phương pháp sẽ phụ thuộc vào của từng loại phương pháp
Điểm mạnh của phân tích Bayesian là phương pháp này có thể đưa ra câu trả lời trực tiếp và hiệu quả các kết quả thông qua việc biểu diễn xác suất hậu nghiệm, đó đơn giản chỉ là xác suất để cây đó là chính xác, biểu diễn nó dưới dạng dữ liệu và mô hình Ngược lại, trong khi việc phân tích chủng loại phát sinh vẫn chưa thể xác định một
Trang 28thể gây khó khăn cho người sử dụng Việc áp dụng phổ biến phương pháp bootstrap trong Maximum likelihood có thể gây khó khăn cho người sử dụng giải thích [12, 24, 87]
Tuy nhiên, Bayesian cũng có yếu điểm, xác suất hậu nghiệm tính toán theo Bayesian thường quá cao [68] Xác suất tiền nghiệm mặc dù cho phép kết hợp các dữ liệu ban đầu để sử dụng cho chúng, tuy các dữ liệu này thường không có sẵn và việc tính toán chúng gây khó khăn cho người sử dụng Do đó, hầu như tất cả các phân tích
dữ liệu đều được thực hiện bằng cách sử dụng các dữ liệu ban đầu “mặc định” của chương trình tính toán [15, 69]
1.6 Định hướng nghiên cứu
Trong nghiên cứu này chúng tôi tập trung vào việc tiến hành tách và khuếch đại toàn bộ hệ gen ty thể của đối tượng lợn Ỉ bằng phương pháp PCR Sản phẩm khuếch đại sẽ được giải trình tự bằng phương pháp Sanger Trình tự hoàn chỉnh của hệ gen ty thể thu được sẽ được sử dụng phân tích nhằm tìm ra mối quan hệ di truyền của lợn Ỉ với một số giống lợn trên thế giới
Trang 29CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP 2.1 Đối tượng
Mẫu máu được thu từ các cá thể lợn Ỉ được nuôi tại tỉnh Thanh Hóa theo dự án bảo tồn giống lợn Ỉ của Viện Chăn nuôi
2.2 Vật liệu và trang thiết bị
Nghiên cứu này sử dụng bộ sinh phẩm GoTaq® Green Master Mix (Promega), Kit QIAquick PCR Purification Kit (Qiagen), hệ thống giải trình tự ABI 3500 cùng bộ sinh phẩm đi kèm (ThermoFisher)
2.3 Phương pháp
2.3.1 Thu mẫu
Lấy 5 ml máu tĩnh mạch cổ của lợn Ỉ, chuyển mẫu vào ống đựng máu có bổ sung chất chống đông EDTA Bảo quản mẫu ở điều kiện 10oC trong quá trình chuyển mẫu về phòng thí nghiệm
2.3.2 Tách chiết mẫu DNA tổng số (với nguồn mẫu là máu)
− Lặp lại bước 3 đến khi hồng cầu bị dung giải hết
− Bổ sung 900µl dung dịch Lysis Buffer; trộn đều bằng pipet; ủ ở 370C trong 1 giờ
− Cho 20µl Proteinase K (2.5mg/ml) vào dung dịch; trộn đều; ủ ở 650C/2 giờ
− Thêm 450µl P:C:I (25:24:1) vào các eppendorf; trộn đều; ly tâm ở 12000rpm/15 phút/40C Thu pha trên
Trang 30− Thêm 450µl P:C:I (25:24:1) vào các eppendorf; trộn đều; ly tâm ở 12000rpm/15 phút/40C Thu pha trên
đều, ủ
− Ly tâm 12000rpm/15 phút/40C
− Hòa tan cặn trong 1000µl EtOH 10%; ly tâm ở 12000rpm/10 phút/40C
− Để khô DNA tự nhiên (hoặc sử dụng máy làm khô Speedvac) Hòa tan DNA trong 100µl dH2O
Trang 31Bảng 2.1 Trình tự mồi PCR (tiếp)
(oC)
Kích thước Mồi xuôi (trình tự 5’-3’) Mồi ngược (trình tự 5’-3’)
2.3.4 Khuếch đại trình tự hệ gen ty thể bằng kỹ thuật PCR
− Chuẩn bị cho 25l hỗn hợp phản ứng trên đá theo tỉ lệ của nhà sản xuất:
Trang 32− Kiểm tra sản phẩm PCR bằng cách điện di trên agarose 1%
− Tinh sạch sản phẩm PCR bằng kit QIAquick PCR Purification Kit (Qiagen)
2.3.5 Giải trình tự trên máy ABI 3500
Quy trình được tiến hành theo hướng dẫn đi kèm máy:
− Chạy phản ứng với chu trình nhiệt: 96oC trong 1 phút, 25 chu kì (96oC, 10 giây;
50oC, 5 giây; 60oC, 4 phút); sau đó giữ ở 4oC
o Bổ sung 5l EDTA 125 mM
Trang 33o Chuyển mẫu sang plate
o Đặt chương trình cho máy đọc trình tự
− Xử lí thô kết quả
2.3.6 Xử lí kết quả giải trình tự
Trình tự đọc được từ hệ thống giải trình tự ABI3500 được trả về dưới dạng file AB1 bao gồm hai loại dữ liệu: trình tự nucleic acid và cường độ của tín hiệu mà hệ thống ghi nhận được Tiến hành đọc và chỉnh sửa trên phần mềm BioEdit v7.2.5 Thông qua độ mạnh yếu của tín hiệu thu được, chúng tôi có thể xác định một cách tương đối chất lượng của đoạn trình tự đã đọc được Từ đó, tiến hành cắt bỏ đoạn trình
tự có chất lượng thấp, nhằm làm tăng độ tin cậy cho đoạn trình tự thu được (contig) Đồng thời trình tự này được lưu dưới dạng file FASTA phù hợp với các phần mềm phân tích sau đó
Các đoạn contig thu được từ quá trình cắt gọt sẽ được ghép nối lại dựa trên phần
Trang 34nối các phần trùng nhau lại với nhau là phần mềm DNA Dragon v1.6.0 (http://www.dna-dragon.com/) Trình tự cuối cùng thu được chính là trình tự hoàn chỉnh của ty thể Trình tự này cũng được lưu dưới dạng file FASTA
2.3.7 Phân tích trình tự
Với đoạn trình tự thu được, chúng tôi tiến hành phân tích các chỉ số cơ bản nhất như phần trăm của các nucleic acid sử dụng phần mềm DAMBE v6.3.17 (http://dambe.bio.uottawa.ca/), cùng với đó là hai chỉ số GC skew và AT skew được tính toán dựa theo công thức sau:
2.3.8 Phân tích sự chủng loại phát sinh
Trình tự của đoạn D loop và trình tự toàn bộ hệ gen ty thể cùng với các trình tự của các giống lợn đã được công bố được đưa vào bắt cặp thông qua thuật toán MUSCLE của phần mềm MEGA6 (http://www.megasoftware.net/) [91] nhằm xác định các vị trí tương đồng Dựa trên trình tự đã bắt cặp, các mô hình tiền nghiệm ban đầu phù hợp nhất cho trình tự bắt cặp D loop và toàn bộ hệ gen cũng được xác định lần lượt
là HKY+G và TN93+I Thuật toán phân tích Bayesian trên phần mềm BEAST v1.8.3 (http://beast.bio.ed.ac.uk) với thiết lập ban đầu Yule process và MCMC 1000000 được
sử dụng để tính toán và phần mềm Figure Tree v1.4.2 sau đó sẽ sử dụng kết quả tính toán được để vẽ cây chủng loại phát sinh
Trang 35CHƯƠNG 3 KẾT QUẢ VÀ THẢO LUẬN 3.1 Thu thập và giải trình tự hệ gen ty thể lợn Ỉ
3.1.1 Thu mẫu
Việc lấy mẫu được chúng tôi thực hiện tại một số hộ hiện đang còn lưu giữ giống lợn Ỉ thuần chủng trên địa bàn tỉnh Thanh Hóa Mẫu máu sẽ được thu trực tiếp thông qua tĩnh mạch cổ của các cá thể lợn Ỉ khỏe mạnh được nuôi tại các hộ gia đình trên (hình 3.1) Tổng cộng chúng tôi đã thu được đủ 30 mẫu máu Mẫu máu thu được sau quá trình vận chuyển về Viện Nghiên cứu hệ gen sẽ được bảo quản ở -20oC trước khi tiến hành tách chiết DNA
Hình 3.1 Hình ảnh các cá thể lợn Ỉ
3.1.2 Tách chiết DNA tổng số
Nhằm mục đích khuếch đại hệ gen ty thể đồng thời có thể lưu giữ bộ gen của giống lợn Ỉ lâu dài,chúng tôi tiến hành tách chiết DNA tổng số từ toàn bộ số lượng mẫu máu thu được trong quá trình lấy mẫu Quá trình tách chiết hoàn toàn tuân thủ theo phương pháp đã được mô tả trong phần 2.3.2
Trang 36Hình 3.2 DNA tổng số được tách từ mẫu máu lợn Ỉ
Giếng 1-6 tương ứng với mẫu DNA tổng số của các cá thể lợn Ỉ được đánh số từ 1-6
Kết quả tách DNA tổng số từ mẫu máu lợn Ỉ được kiểm tra thông qua kết quả điện di gel Agarose 1% được thể hiện trong hình 3.2 Kết quả điện di cho thấy, ở tất cả các giếng, băng DNA tổng số đều lên rõ, mẫu đứt gãy không nhiều và không lẫn quá nhiều tạp chất Tất cả các mẫu DNA tổng số thông qua kiểm tra đều đã đủ chất lượng cho các thí nghiệm tiếp theo Tuy nhiên, trong phạm vi đề tài này, chúng tôi chỉ sử dụng duy nhất mẫu DNA tổng số của cá thể lợn Ỉ 01 để khuếch đại trình tự ty thể phục
vụ quá trình giải trình tự Toàn bộ số DNA tổng số còn lại sẽ được cất giữ ở -20oC để
sử dụng cho các nghiên cứu tính đồng nhất về di truyền của quần thể sau này hay tìm kiếm các SNP đặc trưng cho giống lợn Ỉ
3.1.3 Khuếch đại hệ gen ty thể
Sử dụng 30 cặp mồi đã được thiết kế và thể hiện như ở bảng 2.1, chúng tôi tiến hành khuếch đại trình tự toàn bộ hệ gen ty thể bằng PCR để tạo thành 30 đoạn DNA ngắn Thành phần phản ứng PCR được mô tả trong bảng 2.2 và chu kỳ nhiệt được mô
tả trong phần phương pháp Kết quả khuếch đại được kiểm tra trên gel Agarose 1% (hình 3.3)
Trang 37Hình 3.3 Sản phẩm PCR khuếch đại tại nhiệt độ gắn mồi 54 o C
Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.1,
(-): Đối chứng âm, M: Marker 1kb
Với mỗi giếng được chạy và đánh số tương ứng với số thứ tự của mồi được sử dụng để thực hiện phản ứng PCR (bảng 2.1) Tại nhiệt độ gắn mồi ban đầu được lựa
Trang 3825, 26, 27 cho kết quả đặc hiệu, không xuất hiện băng phụ, lượng sản phẩm lớn thể hiện qua độ rõ nét của băng Tại các giếng 1, 2, 5, 6, 11, 17, 19, 20, mặc dù lượng sản phẩm khuêch đại ít nhưng băng lên đặc hiệu, do đó thông qua việc tăng gấp đôi lượng thể tích phản ứng PCR chúng tôi vẫn đảm bảo được lượng DNA cần thiết cho quá trình tinh sạch và giải trình tự Các giếng 3, 4, 15, 16, 21, 23, 28, 29, 30 không quan sát thấy
có sản phẩm PCR được tiến hành lại phản ứng với nhiệt độ gắn mồi giảm xuống 53oC (hình 3.4 A,B,C) và 51oC (hình 3.4 D), kết quả các mồi đều cho sản phẩm đặc hiệu Tiếp tục tiến hành chạy tăng lượng mồi 3, 4, 15, 16 Kiểm tra lại kích thước các băng với kích thước thiết kế cho kết quả giống nhau, do đó các đoạn trình tự khuếch đại đã đảm bảo yêu cầu cho việc giải trình tự
Hình 3.4 Sản phẩm PCR khuếch đại tại nhiệt độ gắn mồi 53 o C và 51 o C
Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.1, (-): Đối chứng âm, M:Marker Phản ứng diễn ra với nhiệt độ gắn mồi 53 o C (A, B, C), 51 o C (D)
(-): Đối chứng âm, M: Marker 1kb
Trang 393.1.4 Tinh sạch sản phẩm PCR
Do quá trình giải trình tự yêu cầu đối với mẫu phải có độ tinh sạch cao Sản phẩm PCR sau khi đủ lượng và thông qua bước kiểm tra độ đặc hiệu được đưa qua kit tinh sạch nhằm loại bỏ các thành phần phản ứng dư
Hình 3.5 Kết quả tinh sạch sản phẩm PCR hệ gen ty thể
Số thứ tự của giếng tương ứng với số thứ tự của mồi được trình bày tại bảng 2.1,
Trang 40Kết quả kiểm tra cho thấy, các băng đều rất rõ nét (Hình 3.5) Như vậy sản phẩm PCR đã đủ độ tinh sạch để tiến hành giải trình tự
3.1.5 Kiểm tra kết quả giải trình tự
Mẫu đã khuếch đại trong quá trình phản ứng PCR sẽ được sử dụng làm khuôn
và sử dụng chính các cặp mồi khuếch đại để thực hiện phản ứng giải trình tự Quá trình thực hiện phản ứng và đọc kết quả được thực hiện tự động bởi hệ thống ABI3500
Hình 3.6 Ví dụ cho phần kết quả giải trình tự đủ độ tin cậy và được lựa chọn
Tín hiệu giải trình tự có cường độ khá cao, không hề xuất hiện các tín hiệu phụ hay các tín hiệu chồng chéo (hình 3.6), như vậy chất lượng đoạn giải trình tự là khá tốt, trình tự thu được là đáng tin cậy Các đoạn trình tự sau khi cắt gọt được ghép nối với phần mềm DNA Dragon như đã mô tả để thu được trình tự hoàn chỉnh Trình tự kết quả giải trình tự và trình tự của toàn bộ hệ gen ty thể lợn Ỉ được chúng tôi đưa ra trong phần phụ lục
3.2 Phân tích hệ gen ty thể lợn Ỉ
Thông qua việc phân tích trình tự hoàn chỉnh thu được chúng tôi mong muốn có được một cái nhìn tổng quát về hệ gen ty thể lợn Ỉ, bao gồm trình tự, vị trí, cấu trúc của các gen được mã hóa trên hệ gen ty thể và sau đó so sánh hệ gen của giống lợn này với các giống lợn đã được công bố thuộc các vùng của cả châu Á và châu Âu nhằm đưa ra một đánh giá ban đầu về mối quan hệ di truyền của giống lợn Ỉ thông qua phân tích trình tự ty thể