BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ TP.HCM BÁO CÁO KHÓA LUẬN TỐT NGHIỆP Tên đề tài: HỖ TRỢ ĐỊNH DANH CÁC MẪU NẤM KÝ SINH CÔN TRÙNG DỰA TRÊN PHÂN TÍCH PHÁT SINH CHỦNG LOÀI CÁC GEN
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ TP.HCM
BÁO CÁO KHÓA LUẬN TỐT NGHIỆP
Tên đề tài:
HỖ TRỢ ĐỊNH DANH CÁC MẪU NẤM KÝ SINH CÔN TRÙNG DỰA TRÊN PHÂN TÍCH PHÁT SINH CHỦNG LOÀI CÁC GEN
Khóa: 2011-2015
Tp Hồ Chí Minh, tháng 05 năm 2015
Trang 2LỜI CẢM ƠN
Lời đầu tiên, em xin chân thành gửi tới thầy Lao Đức Thuận và anh Vũ Tiến Luyện - người luôn tận tình, kiên nhẫn và quan tâm hướng dẫn em trong suốt quá trình làm đề tài để hoàn thành khóa luận tốt nghiệp Người luôn tạo điều kiện cho em học tập, trau dồi kiến thức và rút ra nhiều bài học trong khoảng thời gian vừa qua
Em xin cảm ơn các bạn cùng nhóm đề tài và tập thể trong phòng thí nghiệm sinh học phân tử, trường Đại Học Mở TP Hồ Chí Minh đã giúp đỡ, tạo điều kiện trong suốt thời gian thực hiện đề tài
Trên hết, con xin cảm ơn bố mẹ và gia đình đã luôn yêu thương và giúp đỡ con
Bình Dương, ngày 05 tháng 05 năm 2015
Trang 3Danh mục bảng biểu
Bảng 2.1 Trình tự các mồi sử dụng trong phản ứng PCR
Bảng 2.2 Chu kỳ nhiệt cho phản ứng PCR
Bảng 3.1 Các đặc tính vật lý của mồi LR0R/LR5 và ATP6-C1A/ATP6-C2A Bảng 3.2 Thông tin trình tự tham chiếu dùng để xây dựng dữ liệu vùng trình tự nrLSU và Atp6
Bảng 3.3 Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 3 mẫu nấm
ký sinh côn trùng được tách chiết theo phương pháp Phenol:Chloroform
Bảng 3.4 Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 3 mẫu nấm
ký sinh côn trùng được tách chiết theo phương pháp Phenol:Chloroform bổ sung β-mercaptoethanol và CTAB
Bảng 3.5 Hiệu chỉnh các nucleotide tại các vị trí (1) đến (10)
Bảng 3.6 Tổng hợp kết quả hiệu chỉnh trình tự các mẫu nấm ký sinh côn trùng Bảng 3.7 Kết quả chiều dài trình tự trước và sau hiệu chỉnh
Bảng 3.8 Kết quả các thông số của mô hình tiến hóa tốt nhất
Bảng 3.9 Tổng hợp kết quả định danh các mẫu nấm từ dữ liệu phân tử và hình
thái
Trang 4Danh mục hình ảnh
Hình 1.1 Cordyceps sinensis
Hình 1.2 Cấu trúc của rDNA
Hình 1.3 Vị trí các mồi khuếch đại gen nrLSU
Hình 2.1 Hình thái giải phẫu nấm mẫu DL004
Hình 2.2 Hình thái giải phẫu nấm mẫu DL0075
Hình 3.6 Kết quả Annhyb cặp mồi LR0R và LR5 trên trình tự gen nrLSU Hình 3.7 Kết quả kiểm tra mồi ATP6-C1A/ATP6-C2A bằng BLAST trên
GenBank
Hình 3.8 Kết quả kiểm tra mồi LR0R/LR5 bằng BLAST trên GenBank
Hình 3.9 Kết quả điện di sản phẩm PCR của 3 mẫu DL004, DL0075, DL0077
với cặp mồi LR0R/LR5 được tách chiết theo phương pháp Phenol:Chloroform
Hình 3.10 Kết quả điện di sản phẩm PCR của 3 mẫu DL004, DL0075, DL0077
với cặp mồi ATP6-C1A/ATP6-C2A được tách chiết theo phương pháp Phenol:Chloroform
Hình 3.11 Kết quả điện di sản phẩm PCR cặp mồi LR0R/LR5 theo phương
pháp Phenol:Chloroform có sử dụng β - mercaptoethanol và CTAB
Trang 5Hình 3.12 Kết quả điện di sản phẩm PCR cặp mồi ATP6-C1A/ATP6-C2A theo
phương pháp Phenol:Chloroform có sử dụng β - mercaptoethanol và CTAB
Hình 3.13 Trình tự DNA của mạch xuôi và ngược chưa hiệu chỉnh của gen Atp6 trên giao diện Chromas lite
Hình 3.14 Mô tả sự sai khác mucleotide ở hai mạch xuôi và ngược gen Atp6 Hình 3.15 Vị trí sai lệch của hai kết quả giải trình tự ở đầu mạch xuôi của Atp6
Hình 3.16 Kết quả BLAST trình tự gen Atp6 mạch xuôi đã hiệu chỉnh
Hình 3.17 Cây phả hệ phân tử gen nrLSU được xây dựng bằng phương pháp
Maximum Likelihood với bộ cơ sở dữ liệu (Các con số hiển thị trên cây là giá trị bootstrap của 1000 lần lặp lại lần lượt của các cây NJ/MP/ML)
Hình 3.18 Cây phả hệ phân tử gen Atp6 được xây dựng bằng phương pháp
Maximum Likelihood với bộ cơ sở dữ liệu (Các con số hiển thị trên cây là giá trị bootstrap của 1000 lần lặp lại lần lượt của các cây NJ/MP/ML)
Hình 3.19 Cây phả hệ phân tử gen nrLSU-Atp6 được xây dựng bằng phương
pháp Maximum Likelihood với bộ cơ sở dữ liệu (Các con số hiển thị trên cây là
giá trị bootstrap của 1000 lần lặp lại, lần lượt của các cây NJ/MP/ML)
Trang 6Danh mục những chữ viết tắt
ATP: Adenosine triphosphate
BLAST: Basic Local Alignment Search Tool
Bp: Base-pair
Nu: Nucleotide
DNA: Deoxyribonucleotide triphosphate
RNA: Ribonucleic acid
ITS: Internal transcribed spacer
SSU: Small subunit
LSU: Large subunit
MP: Maximum parsimony
ML: Maximum likelihood
NJ: Neighbor-joining
rDNA: Ribosomal DNA
CTAB: Cetyl Trimethylammonium Bromide
Trang 7MỤC LỤC
ĐẶT VẤN ĐỀ 1
PHẦN I: TỔNG QUAN 1.1 NẤM KÝ SINH CÔN TRÙNG 3
1.1.1 Đặc điểm chung 3
1.1.2 Sự phân bố và thành phần loài 4
1.1.3 Ứng dụng của nấm Cordyceps 4
1.2 NGHIÊN CỨU ĐỊNH DANH VÀ PHÁT SINH LOÀI 5
1.2.1 Đặc điểm nhận dạng và định danh 5
1.2.2 Định danh phân tử 7
1.2.3 Gen MT-Atp6 (Mitochondrially encoded ATP synthase 6) 7
1.2.4 DNA ribosome và gen nrLSU (nuclear ribosomal large subunit) 8
1.3 TÁCH CHIẾT DNA VÀ KỸ THUẬT PCR 11
1.3.1 Tách chiết DNA 11
1.3.2 Kỹ thuật PCR 12
1.3.3 Giải trình tự 12
1.4 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC 13
1.5 PHẢ HỆ PHÂN TỬ [11] 15
PHẦN II: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 20
2.1.1 Phần mềm trong khảo sát in silico 20
2.1.2 Vật liệu sử dụng trong thực nghiệm 20
2.2 TIẾN TRÌNH THÍ NGHIỆM 23
2.2.1 Khai thác và thu thập tài liệu 24
Trang 82.2.2 Khảo sát in silico 24
2.2.3 Thực nghiệm 25
2.2.4 Giải trình tự 28
2.2.5 Hiệu chỉnh trình tự 28
2.2.6 Xây dựng cây phát sinh loài bằng phần mềm MEGA6.0 28
PHẦN III: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 3.1 KẾT QUẢ ĐÁNH GIÁ MỒI 30
3.2 CƠ SỞ DỮ LIỆU CỤC BỘ TRÌNH TỰ nrLSU VÀ ATP6 NHÓM NẤM KÝ SINH CÔN TRÙNG 38
3.3 KẾT QUẢ THỰC NGHIỆM 44
3.4 KẾT QUẢ HIỆU CHỈNH TRÌNH TỰ 47
3.5 KẾT QUẢ XÂY DỰNG CÂY PHÁT SINH LOÀI 52
PHẦN IV: KẾT LUẬN VÀ ĐỀ NGHỊ 4.1 KẾT LUẬN 60
4.2 ĐỀ NGHỊ 60
TÀI LIỆU THAM KHẢO 61 PHỤ LỤC
Trang 9ĐẶT VẤN ĐỀ
Nấm Cordyceps là nấm ký sinh trên côn trùng được biết đến và sử dụng phổ
biến trong các bài thuốc cổ truyền của Trung Quốc kể cả các nước Châu Á Đại
diện tiêu biểu của chi này là Cordyceps sinensis, chứa các chất có hoạt tính cao
ứng dụng trong y dược như kháng khối u, đáp ứng miễn dịch, chống oxi hóa, chống tăng đường huyết, hiệu quả bảo vệ thận, nâng cao hoạt động tình dục và
sinh sản,… Chi nấm Cordyceps có hơn 400 loài đã được phát hiện Trong đó,
chúng được định danh chủ yếu bằng phương pháp truyền thống thông qua định danh hình thái gồm các đặc tính: quả thể, sinh bào tử, hình thái sinh sản….
Tuy nhiên, việc định danh hình thái chi Cordyceps cũng còn gặp nhiều khó khăn và hạn chế trong việc phân loại, vì chi Cordyceps có thành phần loài rất
phong phú Đặc biệt, nhóm này tồn tại ở hình thức sinh sản vô tính và hữu tính
Ngoài ra, kiểu hình chi Cordyceps bị ảnh hưởng bởi điều kiện môi trường khác
nhau tạo nên dị hình thái dễ nhầm lẫn cho các nhà nấm học khi phân loại Trong những năm gần đây, các tiến bộ của sinh học phân tử và ứng dụng tin sinh học,
đã đóng góp rất nhiều cho việc giải quyết những khó khăn trên Chẳng hạn như
việc sử dụng các gen thuộc nhóm gen giữ nhà (house-keeping gen) để xây dựng cây phát sinh loài đã mang lại hiệu quả (Sung et al., 2007)
Trong đó, gen nrLSU-rRNA mã hóa RNA 25S-28S của ribosome (tiểu phần lớn của ribosome) có nhiều vùng bảo tồn và đa dạng Ngoài ra, nrLSU-rRNA còn
bao gồm những vùng domain D1, D2, D3, gọi là vùng biến động (D-divergence region) chứa nhiều thông tin duy truyền, có độ bảo tồn cao và có thể khuếch đại bằng cặp mồi phổ quát do đó nó thích hợp cho nghiên cứu cấp độ loài thậm chí
còn vượt qua cả mức độ loài Hơn nữa, nrLSU-rRNA được coi như là một chỉ
thị phân tử (marker) để phân loại và xác định tên loài trong một phạm vi rộng
Cùng với gen Atp6 mã hóa cho enzym ATPase trong ty thể tiểu phần số 6 của
phức hợp F1-F0 ATPase Mà ATPase là enzyme có vai trò quan trọng tham gia vào quá trình tạo ATP từ ADP trong ty thể, với sự hiện diện của kênh gradient
Trang 10proton qua màng, được tạo ra bởi tổ hợp vận chuyển điện tử của chuỗi hô hấp,
cung cấp năng lượng cho tế bào sử dụng Vì vậy, kết hợp gen ribosome nrLSU (Artjariyasripong et al., 2001, Sung et al., 2001, Stensrud et al., 2005) với gen
Atp6 sẽ giúp cải thiện khả năng phân nhánh của cây phát sinh loài (Sung et al.,
2007) dẫn đến tăng thêm mức độ chính xác trong việc định danh loài Nên gen
nrLSU và Atp6 là gen mục tiêu được sử dụng trong nghiên cứu phát sinh loài để
tìm ra độ tương quan và mức độ di truyền giữa các loài.Xuất phát từ những vấn
đề trên tôi đề xuất đề tài: “Hỗ trợ định danh các mẫu nấm ký sinh côn trùng
dựa trên phân tích phát sinh chủng loài các gen nrLSU và Atp6”
Trang 11PHẦN I: TỔNG QUAN
Trang 121.1 NẤM KÝ SINH CÔN TRÙNG 1.1.1 Đặc điểm chung
Cordyceps là nấm ký sinh trên côn trùng thuộc ngành nấm túi Ascomycota, lớp Pyrenomycetes, bộ Hypocreales, họ Clavicipitaceae[43] Cordyceps sinensis
được biết đến nhiều nhất trên thế giới vì có giá trị dược liệu quý hiếm và độc đáo, được phát hiện đầu tiên trong Đông y Trung Quốc hơn 50.000 năm trước[34]
Cordyceps sp ký sinh trên côn trùng, động vật chân đốt (arthropods)
và một số ít ký sinh trên nấm khác[29].Đại diện, C sinensis chủ yếu sống ký sinh trên ấu trùng của các loài sâu thuộc họ sâu bướm thuộc chi Hepialus, thường gặp nhất là ký sinh trên ấu trùng loài Hepialus biruensis chúng thường được gọi là
„Đông trùng hạ thảo‟[26] C sinensis xâm nhiễm vào sâu non và bắt đầu làm chết
ký chủ, sống ký sinh suốt mùa đông Khi gặp điều kiện thích hợp vào mùa hè, các sợi nấm mọc ra từ miệng của xác sâu non và phát tán bào tử Quả thể nấm có hình trụ, đỉnh túi dày, các bào tử có thể ngắt rời nhau[43]
cicadae hay ức chế các tế bào khối u của C Ophioglossoides, C cicadae và
Trang 13chống oxy hóa của C Militaris, [27] Đặc biệt, một số loài Cordyceps còn được ứng dụng trong kiểm soát sinh học điển hình chi nấm Beauveria và
Metarhizium[8]
Các thành phần có hoạt tính chính của C sinensis thường có bản chất là các
nucleoside, cordycepin (3‟-deoxyadenosin), polysaccharide, protein, sterol [26] Các chất này thường được phân lập từ hệ sợi hay quả thể[26]
Ngoài ra, nó còn chứa các nguyên tố vi lượng như K, Na, Ca, Mg, Fe, Cu, Mn,
Zn, Pi, Se, Al, Si, Ni…[26]
1.1.2 Sự phân bố và thành phần loài
Cordyceps chủ yếu tìm thấy vào mùa hè và phát triển mạnh ở độ cao trên 3800
m trên mực nước biển cấp, trong lạnh, cây cỏ hoặc đồng cỏ núi cao trên dãy cao nguyên Himalaya Tây Tạng và các tỉnh của Trung Quốc Tứ Xuyên, Cam Túc,
Hồ Bắc, Chiết Giang, Sơn Tây, Thanh Hải và Vân Nam[26]
Cordyceps là chi đa dạng nhất trong họ Clavicipitaceae, ước tính hơn 400 loài
đã được mô tả trên toàn thế giới[33] Trong đó, khoảng 90 loài được phát hiện tại Trung Quốc[50] Chúng phân bố khắp thế giới ở tất cả các vùng trên mặt đất trừ
Nam Cực và sinh sôi nảy nở tốt chủ yếu ở vùng nhiệt đới và cận nhiệt đới, đặc biệt là khu vực Đông và Đông Nam Á dẫn đến sự đa dạng loài tại đây[43]
1.1.3 Ứng dụng của nấm Cordyceps
1.1.3.1 Ứng dụng trong y dược
Cordyceps có polysaccharides chiếm khoảng 3 - 8% tổng trọng lượng, chống
ung thư, điều trị bệnh tim và hỗ trợ cải thiện khả năng giải độc gan…[26]
.Các ergosterol và các đồng phân có hoạt tính kháng virus, điều hoà tim mạch, điều trị bệnh thận[51].Cùng với hợp chất cordycepin và beta - glucans trong quả thể có tác dụng làm tăng trưởng chất ức chế chống lại tế bào ung thư Chính vì vậy,
Cordyceps trong tương lai sẽ được ứng dụng trị liệu trong điều trị ung thư, như
là một loại thuốc hỗ trợ cho hóa trị liệu, xạ và cả trong điều trị ung thư truyền thống[26]
Hơn nữa, Cordyceps có tác dụng tăng cường miễn dịch vì sản xuất và bảo vệ tế
bào T làm nâng cao hoạt tính đại thực bào và tế bào NK (natural killer cell-tế
Trang 14bào bạch cầu có khả năng nhận dạng và tiêu diệt vi trùng), cải thiện các kháng thể[34]
Cordyceps có khả năng điều trị rối loạn tình dục ở cả nam giới và nữ giới đã
được chứng minh qua nhiều nghiên cứu tại các nước chủ yếu là Trung Quốc Bởi vì trong quả thể của chúng có chứa hợp chất steroid có khả năng chống rối loạn tình dục[1][26]
1.1.3.2 Ứng dụng trong sinh học
Nấm Cordyceps sp ngoài ứng dụng trong y dược còn được ứng dụng rộng rãi và thành công trong kiểm soát sinh học Bởi vì nấm Cordyceps mang đặc điểm là
ký sinh trên côn trùng nên Cordyceps trở thành thiên địch của các loài côn trùng
gây hại Chính vì vậy nhiều loài đã được sử dụng rộng rãi trong kiểm soát sinh
học chống các loài sâu hại hay dịch bệnh Tiêu biểu như loài nấm Beauveria
bassiana và Metarhizium, trong đó nấm Beauveria bassiana sử dụng như thuốc
trừ sâu vi sinh vật thay thế cho thuốc trừ sâu hóa học, bởi vì chúng có khả năng gây độc cho ký chủ cao, tác dụng nhanh, có phổ ký chủ rộng và an toàn cho người (McCoy, 1990)[45]
Hơn nữa, nấm Beauveria và Metarhizium dùng để
phòng trừ sâu hại cây trồng, cây rừng, đồng thời phát triển công nghệ, hoàn thiện môi trường Cụ thể, năm 2010 viện bảo vệ thực vật đã sản xuất và sử dụng
chế phẩm nấm Beauveria bassiana phòng trừ sâu róm hại thông và nấm
Metarhizium anisopliae trừ châu chấu hại ngô, mía, bọ cánh cứng hại dừa và
một số sâu hại rau khác,…mang lại hiệu quả cao[8]
1.2 NGHIÊN CỨU ĐỊNH DANH VÀ PHÁT SINH LOÀI
1.2.1 Đặc điểm nhận dạng và định danh
Trước đây, nấm ký sinh côn trùng chủ yếu được định danh dựa trên phân tích đặc điểm hình thái: màu sắc, quả thể, sinh sản, bào tử Trong đó, họ
Clavicipitaceae được nhận biết bởi các đặc điểm: thể túi dạng trụ, đỉnh túi dày
và các bào tử túi dạng sợi thường có thể ngắt rời thành nhiều bào tử thứ cấp[43] Bên cạnh đó, năm 1982 Kobayasi đã tiến hành định danh nấm này dựa vào vật chủ ký sinh của chúng, bởi vì giữa nấm này với vật chủ khi chúng chọn để ký sinh có mối liên quan mật thiết với nhau[43]
Trang 15Thông qua những đặc điểm về hình thái và vật chủ ký sinh, họ Clavicipitaceae
gồm nhóm:
Cordyceps, Hypocrella và Torrubiella: ký sinh trên động vật chân đốt và
nấm[43] [44]
Claviceps, Balansia và Epichloe: ở các loài cỏ cộng sinh[43] [44]
Elaphocordyceps bao gồm tất cả các loài sống ký sinh ở Elaphomyces hay
ký sinh trên nhộng ve sầu[43] [44]
Cordyceps s.s: thường có màu vàng nhạt, sáng, quả thể mềm (Cordyceps militaris) Có chất nền dày mang sắc tố nhạt hoặc màu sáng rực rỡ, sợi nấm tổ
chức lỏng lẻo, bào tử hình trụ Đặc biệt, loài của Cordyceps s.s sinh chủ yếu 3 loại bào tử bao gồm: Bào tử tách rời (C.militaris); Bào tử nguyên (C.cardinalis
và C.pseudomilitaris); Bào tử dạng Bola (C.bifusispora) Vật chủ ký sinh của
chúng trong môi trường dễ tiếp cận như lá cây, rêu hoặc các lớp đất trên cùng[43] [44]
Metarcordyceps: quả thể nấm tươi có màu từ trắng (Metarcordyceps youngmunensis), màu hoa cà, màu tím, màu xanh lá cây Các mẫu nấm khô có
màu sẫm hơn hoặc màu đen (Metarcordyceps taii) Kết cấu của quả thể gồm hệ sợi và ít cùi hơn chi Cordyceps s.s[43] [44]
Ophiocordyceps: sắc tố đậm được tìm thấy trong đất (Ophiocordyceps
sinensis) và trong gỗ mục (Ophiocordyceps variabilis) Hình thái quả thể đa
dạng tùy theo loài, có thể có hình chỉ, dẻo dai hay hình chùy, có hệ sợi…[43][44] Tuy nhiên, việc định danh bằng hình thái vẫn gặp khó khăn do chi nấm này có thành phần loài rất phong phú và hình dạng bị ảnh hưởng bởi điều kiện môi trường Những đặc điểm hình thái như màu sắc, hình dạng quả thể của từng cá thể khác nhau trong cùng một loài cũng có những biến đổi lớn Hơn nữa, chúng tồn tại ở thể lưỡng danh là thể vô tính và hữu tính nên khó phân biệt, dẫn đến dễ nhầm lẫn khi định danh qua hình thái Vì vậy, định danh thông qua hình thái còn gặp nhiều khó khăn và hạn chế[29][43]
Trong những năm gần đây, các tiến bộ của sinh học phân tử và ứng dụng phần mềm tin sinh đã đóng góp rất nhiều cho việc giải quyết những khó khăn trong
Trang 16việc định danh nấm ký sinh côn trùng[19] Chẳng hạn như, dựa trên kết quả phân tích cây phát sinh loài để suy luận mối quan hệ và lịch sử tiến hóa của các loài nấm ký sinh côn trùng, cây phát sinh loài này được xây dựng chủ yếu dựa trên
bộ cơ sở dữ liệu gồm các vùng gen như: gen ITS (interrnal transcribed spacer)[48], gen ribosome (SSU nrDNA, LSU nrDNA) hay các gen thuộc nhóm gen giữ nhà (Atp6, Tef1, Rpb1, Rpb2,…) đã được ứng dụng rộng rãi[16][30][43]
1.2.2 Định danh phân tử
Định danh phân tử là xác định và phân loại thành phần loài ở mức độ phân tử thông qua việc so sánh các trình tự nucleotide và acid amin của DNA, protein hay RNA Thực chất, của phương pháp định danh này dựa vào các đặc điểm của kiểu gen thay vì sử dụng kiểu hình như trong phân loại hình thái học
Hiện nay, định danh phân tử thông qua vùng gen giữ nhà “house-keeping gen”,
phân tích cây phát sinh loài kết hợp với giá trị bootstrap được nhiều nhà khoa học đã và đang sử dụng hiệu quả trong việc định danh của các loài nấm thuộc chi nấm ký sinh côn trùng và một số nấm khác cùng với loài sinh vật khác với phạm vi rộng rãi[43][44]. Hơn nữa, định danh phân tử có vai trò quan trọng hỗ trợ cho phương pháp định danh hình thái để giúp giải quyết những hạn chế trong việc xây dựng hệ thống học và định danh các loài nấm về tính di truyền hay phát sinh loài,…[19] Hiện nay, các nhà nghiên cứu dựa vào việc xây dựng và phân tích địa hình học của cây phát sinh loài, phân nhóm của cây và dựa vào giá trị bootstrap để định danh, xác định các loài sinh vật quan tâm
1.2.3 Gen MT-Atp6 (Mitochondrially encoded ATP synthase 6)
Gen Atp6 là gen thuộc nhóm gen giữ nhà Gen giữ nhà “house-keeping gen” là
gen mã hóa cho các protein giữ vai trò quan trọng duy trì chức năng của tế bào
và bao gồm những gen có biểu hiện tương đối ở bất kỳ điều kiện nào[56]
Gen Atp6 mã hóa cho enzyme ATPase của ty thể tiểu phần số 6 ATPase là
enzyme giúp ty thể thực hiện quá trình tạo năng lượng từ ADP chuyển đổi thành ATP với sự hiện diện của kênh gradient proton qua màng, được tạo ra bởi tổ hợp vận chuyển điện tử của chuỗi hô hấp, cung cấp năng lượng cho tế bào hoạt động[42][58]
Atp6 là tiểu đơn vị của phức hợp F1-F0 ATPase trong ty thể, được
Trang 17tìm thấy hầu hết ở sinh vật nhân chuẩn F1 có chứa các lõi xúc tác trên màng và F0 nằm trong màng ty thể, có chứa các kênh proton màng, liên kết với nhau bởi một thân cây trung ương và một cuống ngoại vi[27] Tiểu đơn vị này là một thành
phần quan trọng của các kênh proton và đóng một vai trò trực tiếp trong việc di
chuyển của proton qua màng Do gen Atp6 có chức năng quan trọng trên và gen
có kích thước nhỏ thuộc DNA ty thể nên được coi là đối tượng lý tưởng để khảo sát sự biến đổi trong hệ gen phục vụ nghiên cứu về phân loại Điển hình gen
Atp6 trong DNA ty thể của nấm men Saccharomyces cerevisiae có vị trí từ
28.487 bp đến 29.266 bp, chiều dài khoảng 779 bp[20]
Gần đây các nhà nghiên cứu nấm học như Spatafora et al., 2007, Sung et al.,
2007 đã tiến hành sử dụng các gen mã hóa cho protein có vai trò quan trọng
trong tế bào để bổ sung trong nghiên cứu phát sinh loài (Atp6, Rpb1, Rpb2, Tef1,
Tub )[43][44]
Hơn nữa, các nghiên cứu đều dựa vào DNA vì chúng có ưu điểm là cho nhiều thông tin hơn, trong khi acid amin có tính thoái hóa Do DNA đột biến nhiều hơn nhờ đó giúp chỉ ra mối quan hệ gần gũi giữa các loài tốt hơn dựa vào các vùng biến động Cụ thể, Zuckerkandl và Pauling nhận ra rằng trình tự chính của acid nucleic chứa một nhguồn thông tin phong phú về lịch sử tiến hóa[35] Vì
vậy, gen Atp6 giúp cải thiện được những hạn chế việc phân loại giữa chi và loài;
cho thấy kiến thức về các mối quan hệ tiến hóa của các loài trong cùng họ
Clavicipitaceae[43][44] Một số nghiên cứu đã sử dụng gen Atp6 như: Atp6 dùng kiểm tra mối quan hệ phát sinh loài giữa 27 đơn vị phân loại từ Boletales và 4 nhóm đối chứng (outgroup); phát hiện loài nấm mới Stachybotrys chartarum dựa trên cây phát sinh loài đa gen; phân loại phát sinh loài của nấm Cordyceps
và Clavicipitaceous[16][30][41]
1.2.4 DNA ribosome và gen nrLSU (nuclear ribosomal large subunit)
Trong nghiên cứu định danh về sinh học phân tử, nhóm nấm ký sinh côn trùng hay ở nhiều loài sinh vật khác thì việc lựa chọn trình tự DNA là vô cùng quan trọng Đòi hỏi trình tự DNA có độ bảo tồn cao trong cùng một loài và biến động lớn giữa các loài khác nhau Đặc biệt, trong định danh loài nấm ký sinh côn
Trang 18trùng thì vùng gen mã hóa cho RNA ribosome được sử dụng phổ biến RNA ribosome là một trong hai thành phần chính của ribosome, được phiên mã từ DNA ribosome Các gen RNA ribosome khuếch đại mồi phổ quát, có tính bảo tồn cao cho phép phân loại vượt mức độ loài[37]
Ribosome là một bộ máy phân tử lớn và phức tạp, có mặt trong tất cả tế bào
sống Đảm nhiệm chức năng sinh tổng hợp protein của tế bào Ribosome gồm hai tiểu đơn vị, mỗi tiểu đơn vị gồm một hoặc nhiều phân tử RNA ribosome và nhiều phân tử protein[54] Hai tiểu đơn vị này chỉ kết hợp với nhau tạo ra một ribosome hoạt động khi quá trình dịch mã trên mRNA bắt đầu
Ở sinh vật nhân sơ, tiểu phần nhỏ (30S) của ribosome chứa 16S RNA, tiểu phần lớn (50S) chứa 5S, 23S Hai tiểu đơn vị nhỏ và lớn khi kết hợp với nhau sẽ tạo
ra một rãnh ở chỗ tiếp giáp của chúng để cho mRNA đi qua[54] Sinh vật nhân chuẩn, tiểu phần nhỏ (40S) của ribosome chứa 18S RNA, tiểu phần lớn (60S) chứa 28S, 5.8S và 5S[54]
Hình 1.2 Cấu trúc của rDNA[52]
Trang 19DNA ribosme là nhóm gen mã hóa cho rRNA ribosome Đây là vùng gen bảo tồn cao nên được xem là cơ sở chính xác để tìm ra sự tương đồng và các khác biệt của các sinh vật cùng loài hay khác loài, cung cấp nhiều thông tin và có nhiều bản sao nên đóng vai trò quan trọng trong các nghiên cứu quá trình tiến hóa, phát sinh loài[24] Ngoài ra, dựa vào vùng bảo tồn của gen rRNA có thể thiết
kế các cặp mồi phổ quát (universal primer) sử dụng khuếch đại trình tự của vùng gen rDNA từ nhiều loài trong định danh sinh học phân tử[24]
rDNA bao gồm nhiều đơn vị lặp lại, mỗi đơn vị lặp lại bao gồm vùng ITS (internal transcribed spacer), vùng 18S, 5.8S, 25-28S, 5S RNA và vùng IGS (intergenic spacer) Cụ thể, một đơn vị lặp lại bao gồm vùng theo thứ tự IGS2-18S (SSU)-ITS1-5.8S-28S (LSU)-IGS1-5S-IGS2 Giữa các đơn vị lặp lại của gen rDNA là một vùng không phiên mã (NTS)[24]
Trong đó, vùng 18S-28S là vùng phiên mã chính (Vilgalys, 2004), vùng 18S
hình thành tiểu đơn vị nhỏ (SSU), vùng 28S, 5,8S và 5S hình thành tiểu đơn vị lớn (LSU) của ribosome RNA Vùng 5,8S rRNA có cấu trúc và chức năng liên quan chặt chẽ với tiểu đơn vị lớn của rRNA và có nguồn gốc từ một phần của 23S ở sinh vật nhân sơ[24] Vùng 5S rDNA thường không có vị trí cố định, chỉ có
ở nhân, không có ở ty thể của một số loài nấm (Guarro, 1999)
Các rDNA 5,8S; 18S; 28S nằm xen kẽ với các vùng phiên mã bên trong (ITS1
và ITS2) và các vùng phiên mã bên ngoài (ETS) Vùng ETS (external transcribed spacer) nằm ở đầu 5‟ của 18S và đầu 3‟ của 28S Hơn nữa, vùng IGS bao gồm phần ETS (external transcribed spacer) và phần không phiên mã NTS (non-transcribed spacer) Vùng IGS (intergenic spacer) là vùng kém bảo tồn nhất của rDNA[51]
Trang 20đơn vị lặp lại nên số bản sao của gen nrLSU rất nhiều Hơn nữa, nrLSU chứa
các vùng bảo tồn, biến thiên có giá trị trong việc hỗ trợ định danh loài[39][43]
nrLSU-rRNA còn được coi như là một chỉ thị phân tử (marker) để phân loại và
xác định tên loài tốt hơn về mặt duy truyền trong một phạm vi rộng[37][39][41]
Vùng D1/D2 mã hóa cho tiểu phần lớn của ribosome được coi là tiềm năng ứng
dụng trong phân loại phần lớn các loài nấm kỵ khí[41] Cặp mồi LR0R/LR5 là
cặp mồi phổ quát được biết đến nhiều nhất và được ứng dụng trong nhiều nghiên cứu phả hệ phân tử định danh loài nấm ký sinh côn trùng và các loài sinh vật khác trong những năm gần đây[44] Cặp mồi này được thiết kế để khuếch đại
vùng D1/D2 và cho kết quả khuếch đại khoảng 800 - 1300 bp (Sonnenberg et
al., 2007) Gen nrLSU đã ứng dụng thành công trong nghiên cứu định danh ở
loài nấm ký sinh côn trùng hay các loài nấm khác như: sử dụng vùng D1/D2 của
tiểu đơn vị lớn nrLSU (28S) vùng rDNA trong phân loại ở cấp độ loài khác biệt trong Orpinomyces spp.[41]…
Hình 1.3 Vị trí các mồi khuếch đại vùng gen nrLSU (tự vẽ)[57]
1.3 TÁCH CHIẾT DNA VÀ KỸ THUẬT PCR
1.3.1 Tách chiết DNA
DNA chứa thông tin di truyền, các nghiên cứu ứng dụng phương pháp sinh học phân tử đều bắt đầu bằng việc thu nhận các acid nucleic tinh sạch để tiến hành các thí nghiệm tiếp theo Tùy thuộc vào loại DNA mà các nhà nghiên cứu lựa chọn các phương pháp tách chiết khác nhau Hơn nữa, mỗi quy trình tách chiết DNA phải theo nguyên tắc[17]:
Trang 21Phá màng tế bào; loại bỏ protein; tủa DNA Để thu nhận DNA tinh sạch, cần loại bỏ những thành phần tạp nhiễm, quan trọng nhất là protein Sự tách chiết dựa trên nguyên tắc hòa tan khác nhau của các phân tử khác nhau (acid nucleic/ protein) trong hai pha không hòa tan (phenol, chloroform/nước)
Để thực hiện được mục tiêu của đề tài, thì việc xây dựng quy trình tách chiết hợp lý là vô cùng cần thiết
kỳ nhiệt với từng nhiệt độ thích hợp cho mỗi phản ứng[8].Gồm nhiều chu kỳ, với mỗi chu kỳ gồm các bước: biến tính (DNA biến tính thành mạch đơn nhiệt độ khoảng 950C), bắt cặp mồi (khoảng 37 - 650C, nhiệt độ cần cho sự bắt cặp giữa mồi với mạch khuôn là Ta, Ta< Tm khoảng 50C, Tm là nhiệt nóng chảy mồi) và kéo dài (ở 720C)[7] DNA được khuếch đại theo cấp số nhân PCR đã được ứng dụng nhiều và rộng rãi trong nghiên cứu y sinh học như: sao chép DNA để sắp xếp, chuẩn đoán di truyền,… Hơn nữa, nó là một bước thí nghiệm quan trọng để góp phần xây dựng cây phát sinh loài Với mục tiêu của đề tài chúng tôi nhằm
mong muốn khuếch đại được vùng gen nrLSU và Atp6 của loài nấm ký sinh côn
trùng Vì vậy, việc khuếch đại được vùng gen này rất quan trọng Cũng chính vì vậy mà kỹ thuật PCR này có ý nghĩa cách mạng trong sự phát triển sinh học phân tử và kỹ thuật duy truyền[7][9][53]
1.3.3 Giải trình tự
Giải trình tự gen là phương pháp nhằm phát hiện thứ tự sắp xếp 4 loại nucleotide
A (adenine), T (Thymine), G (Guanine), C (Cytosine) trên phân tử DNA
Phương pháp enzyme giải trình tự được Sanger et al., 1977 phát minh, trên
nguyên tắc dựa vào hoạt động của enzyme DNA polymerase để tổng hợp mạch
bổ sung của trình tự cần xác định Phản ứng có sự tham gia của dNTP và ddNTP thiếu nhóm 3‟OH Các bước thực hiện: (1) các đoạn DNA cần xác định trình tự
Trang 22được tạo dòng vào một vector, sau đó tách chiết và tinh khiết các vector từ vi khuẩn để thành các vector tự do; (2) phản ứng được thực hiện trong 4 ống, mỗi ống chứa: vector có gắn chèn đoạn DNA cần xác định trình tự, đoạn mồi bổ sung đặc hiệu với trình tự của vector tại vị trí chèn đoạn DNA, enzyme DNA polymerase, bốn loại dNTP và mỗi loại ddNTP (được đánh dấu bằng đồng vị phóng xạ 35P hay 32S); (3) bắt đầu DNA polymerase sẽ kéo các dNTP vào tổng hợp mạch đơn và sự tổng hợp này bị dừng lại tại vị trí mà ddNTP kéo vào thay thế Kết quả sẽ tạo những mạch DNA có chiều dài khác nhau 1 nucleotide tương ứng với trình tự nucleotide trên đoạn DNA gốc Sau khi điện di trên gel polyacrylamide, các vạch điện di này được hiển thị bằng kỹ thuật phóng xạ tự ghi[21]
Ngày nay, việc giải trình tự được thực hiện dễ dàng nhờ có sự hỗ trợ của máy giải trình tự tự động Máy giải trình tự hoạt động dựa theo nguyên lý của phương pháp Sanger có cải biến Trong đó các ddNTP không được đánh dấu phóng xạ mà được đánh dấu bằng chất huỳnh quang có màu khác nhau cho mỗi
loại ddNTP
1.4 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC
Tại Việt Nam, nhiều nghiên cứu về thành phần loài nấm Cordyceps đã được công bố, như năm 1996 và 2001 có 3 loài nấm thuộc chi Cordyceps đó là
Cordyceps sinensis, Cordyceps militaris và Cordyceps sabrolifera[8] Cho đến năm 2009, Viện khoa học Lâm Nghiệp Việt Nam và trường Đại Học Lâm
Nghiệp đã tiến hành điều tra và thu mẫu nấm Cordyceps là Cordyceps nutans
(Phạm Quang Thu, 2009) Đây là loài nấm đầu tiên được mô tả và ghi nhận tại Việt Nam[6]
Năm 2010, nhóm nghiên cứu Lê Tuấn Hưng và cộng sự đã thu thập được 259 mẫu nấm ký sinh côn trùng, phân bố chủ yếu trên lá của những cây bụi, ký sinh trên các ký chủ thuộc tám bộ côn trùng khác nhau tại vườn quốc gia Cát Tiên, thông qua định danh sơ bộ về hình thái có tất cả 17 chi nấm côn trùng được ghi
nhận bao gồm Akanthomyces, Aschersonia, Beauveria, Conoideocrella,
Cordyceps, Gibellula, Hirsutella, Hymenostilbe, Hypocrella, Isaria,
Trang 23Metarhizium, Moelleriella, Nomuraea, Ophiocordyceps, Paecilomyces, Torrubiella và Verticillium Tất cả các chi ghi nhận được đều thuộc ngành Ascomycota, bộ Hypocreales Trong đó đa số các loài ghi nhận được ở trạng thái
vô tính, riêng loài hữu tính của Aschersonia là Hypocrella và Moelleriella là
những loài có ký chủ đặc hiệu là rệp sáp (bộ Homoptera) sống bám trên mặt dưới lá cây[4]
Năm 2011, tại viện Công Nghệ Sinh Học, Trường Đại Học Cần Thơ đã phân lập
và định danh được 5 chủng nấm ký sinh côn trùng thuộc loài Metarhizium
anisopliae và Beauveria bassiana ở đồng bằng sông Cửu Long bằng phương
pháp PCR[3]
Một số nhóm nghiên cứu đã hợp tác với chuyên gia nước ngoài để điều tra nấm
Cordyceps tại các vườn quốc gia như Hoàng Liên, Tam Đảo, Cúc Phương, Cát
Tiên,… Cụ thể, năm 2009-2014, nhà nghiên cứu Đinh Minh Hiệp và Trương Bình Nguyên và cộng sự đã thu thập 124 mẫu nấm ký sinh côn trùng thuộc
nhóm nấm Cordyceps tại Tây Nguyên cho kết quả 37 mẫu thuộc chi Cordyceps,
8 mẫu thuộc chi Ophiocordyceps, 15 mẫu thuộc Isaria, 7 mẫu thuộc chi
Metarhizium, 6 mẫu thuộc Beauveria, 4 mẫu thuộc Hirsutella, 2 mẫu thuộc chi Torrubiella, 2 mẫu thuộc chi Gibellula, 1 mẫu thuộc chi Hypocrella, 1 mẫu
thuộc chi Akanthomyces, 1 mẫu thuộc chi Aschersonia và 1 mẫu thuộc chi
Hymenostibe thông qua định danh hình thái - giải phẫu và xây dựng bộ tiêu bản
mẫu vật được lưu tại Công ty Cổ Phần Nguyên Long (Lâm Đồng)[2] Đồng thời, nhóm nghiên cứu đã xây dựng được cơ sở dữ liệu cục bộ vùng gene ITS1-5, 8S-
ITS2 nhóm nấm Cordyceps, dựa vào sự biến động của vùng gen ITS và kết hợp
với ứng dụng tin - sinh học đã định danh được 27 mẫu trong các mẫu nói trên[2] Năm 2010, Lê và cs cũng đã thành công trong việc phát hiện loài nấm ký sinh
côn trùng Cordyceps neovolkiana tại núi Langbian - Đà Lạt là mẫu DL004,
thông qua kết hợp định danh hình thái học cùng với phân tích phát sinh loài dựa
trên vùng trình tự ITS rDNA[5]
Đến năm 2015, nhóm nghiên cứu Vu và cs đã thành công trong việc định danh 2 mẫu nấm DL0038A, DL0038B thu được từ núi Langbian, Đà Lạt là loài nấm ký
Trang 24sinh côn trùng Cordyceps Takaomontana dựa vào xác định hình thái và phân tích phát sinh loài của gen nrLSU với gen rpb1[47]
Phả hệ phân tử là nghiên cứu về lịch sử tiến hóa của các loài sinh vật Thông thường việc phân tích cây phát sinh loài dựa trên so sánh các trình tự nucleotide, các cặp base hoặc acid amin trong một chuỗi trình tự, kết hợp với thuật toán máy tính để suy ra mối quan hệ tiến hóa giữa các loài sinh vật, nó trở thành cơ sở cho việc phân loại nói chung và phân tích tiến hóa nói riêng[17][23] Một trong các mục tiêu xây dựng cây phát sinh loài dựa trên các trình tự phân tử, là nhằm mô
tả lại lịch sử tiến hoá của các loài sinh vật theo thời gian, chúng có những đặc tính khác nhau, nhưng cùng có mối quan hệ họ hàng với nhau và cùng hình thành từ một tổ tiên chung trong quá khứ Cụ thể, lịch sử tiến hóa được suy luận
từ việc phân tích cây phát sinh loài dựa trên sự phân nhánh (clade), mỗi nhánh đại diện cho một nhóm loài có những đặc điểm hình thái hay gen tương đồng
nhau Đồng thời, một cây phát sinh loài được xây dựng bởi bộ dữ liệu có thể chứa hàng trăm loài khác nhau, mỗi loài trong số đó có thể thay đổi tỷ lệ đột biến theo thời gian ảnh hưởng đến sự thay đổi của quá trình tiến hóa[17][33]
Hiện nay, các nhà nghiên cứu kết hợp giữa thuật giải máy tính với sự phát triển khoa học công nghệ để xây dựng cây phát sinh loài chính xác nhất từ các dữ liệu sinh học[23] Một số phần mềm được sử dụng hiện nay: MEGA6, PHYLIP, PAUP,… Hơn nữa, độ chính xác của quá trình suy luận này còn phụ thuộc rất lớn vào cấu trúc và kích thước dữ liệu sử dụng cùng với việc chọn mô hình phù hợp để đánh giá các đặt tính phân tử trên[33][46]
Để mô tả lại mối quan hệ của các loài qua cây phả hệ phân tử các nhà nghiên
cứu chủ yếu qua ba bước:
Sắp cột thẳng hàng (xây dựng mô hình dữ liệu và khai thác bộ dữ liệu của cây phát sinh loài)
Xác định mô hình thay thế
Xây dựng cây phát sinh loài
Trang 25Mỗi bước đều có vai trò quan trọng cho việc phân tích và cần xử lý phù hợp, các bước này phải có liên kết để tạo ra một cây tốt
Bước 1: Sắp cột thẳng hàng (xây dựng mô hình dữ liệu và xử lý bộ dữ liệu của cây phát sinh loài)
Bước sắp cột thẳng hàng này là một trong những bước quan trọng nhất trong phân tích phát sinh loài bởi vì nó tạo ra bộ dữ liệu để sử dụng cho mô hình của
sự tiến hóa Bước đầu tiên là xác định bộ dữ liệu cục bộ bao gồm protein hay các chuỗi trình tự DNA mục tiêu[17][21]
Bộ dữ liệu trình tự phát sinh loài thường bao gồm nhiều trình tự sắp xếp thẳng
hàng Vị trí sắp xếp các trình tự đại diện cho việc kết luận trong phân tích phát
sinh loài, vì chứa các ký tự mà có thể dựa vào đặc tính của ký tự này để biết mức độ tương đồng hoặc mối quan hệ giữa các loài Phần mềm điển hình được
áp dụng cho quá trình sắp xếp gióng cột là Clustal W cho phép chỉnh sửa sắp xếp thẳng hàng bằng mắt và xem xét đưa ra xây dựng cây Clustal W sắp xếp theo một tiêu chuẩn phát sinh loài là cây định hướng (guide tree), những cây định hướng được tạo ra chủ yếu dựa trên cơ sở sắp xếp cặp đôi (pairwise) trình
tự ban đầu theo thuật toán phân nhóm và cây được định dạng ở tiêu chí cây
PHYLIP
Phương pháp này sẽ cho phép xác định và xử lý những vùng trình tự không rõ ràng và kiểm tra việc chèn hoặc xóa vùng indels (gap) để xây dựng cây phát
sinh loài
Trong bước sắp xếp thẳng hàng chiều dài của trình tự sẽ không đồng nhất và bộ
dữ liệu phát sinh loài thường không giống nhau Nguyên nhân dẫn đến sự không đồng nhất về chiều dài là xuất hiện các vùng indels Cách giải quyết indels là tiến hành đồng bộ hóa chiều dài trình tự bằng cách loại bỏ phân tích tất
cả các vùng chứa “gap” (Swofford et al., 1996) Cách này có ưu điểm chọn mô
hình tiến hóa phù hợp nhất Nhược điểm của phương pháp này là tín hiệu phát sinh loài chứa trong vùng indels sẽ bị loại bỏ
Bước 2: Xác định mô hình tiến hóa
Trang 26Mô hình tiến hóa có vai trò quan trọng trong phân tích cây phát sinh loài, mô hình tiến hóa phụ thuộc vào kết quả dữ liệu sau sắp gióng cột
Mức phí hao tổn của mỗi thay thế phát sinh sẽ được kiểm một cách chính xác trong phương pháp xây dựng cây thông qua sự cố định của lịch trình phí hao tổn Phương pháp Maximum Parsimony xây dựng cây sẽ dựa trên ma trận trọng
số đặc tính ký tự, lúc này gọi là phương pháp “hà tiện trọng số” (weighted parsimony) Ma trận trọng số này đã chỉ ra rằng phí hao tổn của sự đảo chuyển
sẽ gấp đôi so với một quá trình chuyển đổi Đối với phương pháp khoảng cách
và Maxsimum Likelihood để xây dựng cây, các phí hao tổn có thể bắt nguồn từ
ma trận đại diện cho tốc độ tức thời, trong đó Maxsimum Likelihood ước lượng các xác suất thay thế có thể xảy ra, ma trận này có thể liên quan đến đại số phức tạp
Một mô hình tiến hóa tốt nhất không phải luôn luôn bao gồm hầu hết các thông
số Mà ngược lại, càng ít thông số thì sẽ tốt hơn Bởi vì mỗi thông số ước tính đều liên quan đến mức độ sai số khi xây dựng cây
Một chiến lược tốt nhất để xác định mô hình tiến hóa cho các trình tự DNA là
“mô tả cây” tính năng trong PAUP, trong đó sử dụng khả năng ước tính đồng thời sáu tỷ lệ thay thế đảo ngược, các thông số đặc trưng trong bảng phân phối gamma và tỷ lệ của các vùng bất biến Các thông số này có thể được ước tính bằng phương tiện của tần số ngang hàng hoặc tần số đặc trưng
Tóm lại, mô hình tiến hóa như một giả định là những thay đổi giữa tất cả các nucleotide (hoặc các acid amin) có thể xảy ra là như nhau Chương trình sau đó
sẽ gán tất cả các nucleotide có thể đến trong các mấu (node) của cây lần lượt và tính toán xác suất mà mỗi trình tự như thế sẽ tạo ra dữ liệu (ví dụ, đơn vị phân loài (taxa) của 2 chị em có nucleotide “A”, xây dựng lại và cho rằng nguồn gốc
từ một “C”, sau đó chương trình sẽ gán “C” vào trong mấu (node) cho kết quả xác suất thấp hơn so với “A”, nên kết luận nguồn gốc là một “A”) Xác xuất khả năng cho cây là xác xuất của tất cả các vị trí sắp xếp trong tập dữ liệu
Bước 3: Xây dựng cây phát sinh loài
Trang 27Phương pháp xây dựng cây được thực hiện trong phần mềm có sẵn và được mô
tả trên internet Phương pháp xây dựng cây bao gồm chủ yếu hai phương pháp
là dựa trên khoảng cách hay đặc tính
Phương pháp khoảng cách tiến hóa (Distance-Based Methods)
Phương pháp khoảng cách tiến hóa sử dụng số lượng khác biệt (khoảng cách) giữa hai trình tự sắp thẳng hàng phù hợp để xây dựng cây, số lượng này được xem như khoảng cách tiến hóa, kích thước chính xác của nó phụ thuộc vào việc chọn mô hình tiến hóa sử dụng Phương pháp sẽ cho cây đúng nếu tất cả các sự kiện phân tách di truyền đã được ghi lại một cách chính xác trong trình tự
(Swofford et al., 1996)
Đồng thời, cây sẽ được suy ra sau khi tính toán ma trận của giá trị khoảng cách bằng việc sử dụng thuật toán phân nhóm bắt đầu chạy với các trình tự tương tự nhất (khoảng cách giữa các trình tự là ngắn nhất) hoặc bằng cách cố gắng giảm thiểu tổng chiều dài các nhánh của cây
Thuật toán Neighbor-joining được áp dụng phổ biến trong xây dựng cây phát sinh loài dựa trên khoảng cách, không phụ thuộc bất kể các tiêu chí tối ưu Cây được xây dựng dựa trên mô hình phân rã hình ngôi sao Hai trình tự có mức tương đồng cao nhất được phân nhóm với nhau, gọi là một nhánh Sự so sánh xảy ra giữa nhóm vừa tạo với một trình tự khác để tìm khoảng cách tiến hóa Bước này lặp đi lặp lại cho đến trình tự cuối cùng phân chia nhánh Phương pháp này tương đối nhanh chóng Do phương pháp Neighbor-joining là một trong những phương pháp nhanh nhất để dò tìm cây phát sinh loài nên nó được
sử dụng để phân tích khối dữ liệu lớn với nhiều taxa
Phương pháp Hà tiện tối đa (Maximum Parsimony)
Maximum Parsimony (MP) là một tiêu chuẩn tối ưu hóa tuân theo nguyên tắc tìm kiếm một cây phát sinh loài đòi hỏi sự thay đổi số lượng khác nhau giữa hai trình tự là nhỏ nhất, tức là thay đổi giữa các loài là thấp nhất hay đột biến ít nhất
để giải thích sự khác nhau giữa các đơn vị phân loài qua OTUs Vì vậy cây có điểm thấp nhất (hà tiện) theo tiêu chuẩn định sẵn Trong thực tế, cây MP là cây
Trang 28ngắn nhất và một số biến thể của MP có sự khác biệt liên quan đến việc cho
phép định hướng của thay đổi đặc tính ký tự (Swofford et al., 1996)
Phương pháp khả năng tối đa (Maximum Likelihood)
Maximum Likelihood tìm kiếm các mô hình tiến hóa dựa trên hàm toán học để tính toán khả năng xác xuất một cây tiến hóa tạo ra từ dữ liệu quan sát Thực tế,
ML bắt nguồn từ mỗi vị trí base trong sắp xếp thẳng hàng Maximum Likelihood chọn cây phát sinh loài dựa trên mô hình tiến hóa với xác xuất tối đa được tạo ra từ việc nhân các xác xuất của tất cả các ký tự với nhau
Ngoài ra, để đánh giá cây phát sinh loài thường kết hợp với phân tích giá trị bootstrap Kết quả phân tích bootstrap thường là một con số điển hình với một chi nhánh cụ thể trong cây phát sinh loài, tỷ lệ của bootstrap tái tạo để hỗ trợ các đơn ngành của nhánh
Ban đầu nó được gợi ý rằng giá trị bootstrap là một biện pháp của lặp lại (Felsenstein, 1985) Trong diễn đàn gần đây, nó đã được coi là một biện pháp chính xác, một thông số sinh học phù hợp hơn, cho phép xác suất mà phát sinh loài chính xác đã tìm lại được
Trên cơ sở mô phỏng nghiên cứu, có ý kiến cho rằng, trong điều kiện thuận lợi (tỷ lệ thay đổi như nhau, chi nhánh đối xứng), giá trị bootstrap lớn hơn 70% tương ứng với một xác suất lớn hơn 95% mà các phát sinh loài đúng đã được tìm thấy (Hillis và Bull, 1993) Tương tự như vậy, trong điều kiện giá trị bootstrap kém thuận lợi lớn hơn 50% sẽ được đánh giá cao hơn của mức chính xác (Hillis và Bull, 1993) Đơn giản chỉ cần đặt điều kiện nhất định, giá trị bootstrap cao có thể làm cho sự phát sinh loài sai trông ổn Do đó, các điều kiện của phân tích phải được xem xét Bootstrap có thể được sử dụng trong các thí nghiệm trong đó cây được tính toán lại sau khi chi nhánh nội bộ được xóa một lúc
Trang 29PHẦN II: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN
CỨU
Trang 302.1 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Clustalw2: là một phần mềm miễn phí, dùng cho việc so sánh sự tương đồng của hai hay nhiều trình tự
SeaView: phiên bản 4.2.12 (Manolo Gouy), phần mềm miễn phí có các tính
năng hỗ trợ cho các phân tích tương đồng, sắp gióng cột các trình tự
Annhyb: phiên bản 4.946 (2012) là phân mềm miễn phí giúp làm việc và quản
lý các trình tự nucleotid dưới nhiều định dạng
Chromas Lite: phiên bản 2.1.1 là phần mềm miễn phí hỗ trợ cho hiệu chỉnh
trình tự
BLAST ( http://blast.be-md.ncbi.nlm.nih.gov/ ): với các thông số mặc định sẵn
trên NCBI: nhằm xác định độ đặc hiệu của mồi
NCBI ( http://www.ncbi.nlm.nih.gov/ ): giúp khai thác dữ liệu
IDT analyzer ( https://sg.idtdna.com/calc/analyzer ): giúp xác định các thông
số quan trọng của mồi như kích thước, thành phần GC, nhiệt độ lai, khả năng hairpin loop, primer-dimer, hetero-dimer,…
MEGA phiên bản 6.06, phần mềm miễn phí dùng để xây dựng cây phát sinh
loài theo các phương pháp Maximum Parsimony, Maximum Likelihood, Neighbor Joining
2.1.2.1 Bộ mẫu ký sinh côn trùng
Mẫu nấm được phân lập và làm thuần từ các nấm ký sinh côn trùng tại vùng núi Langbiang tỉnh Lâm Đồng, thành phố Đà Lạt Do Đại Học Đà Lạt cung cấp, mẫu được ký hiệu là DL004, DL0075 và DL0077 và hình thái của 3 mẫu được thể hiện qua hình sau:
Trang 31Hình 2.1 Hình thái giải phẫu nấm mẫu DL004 a thể bó ngoài tự nhiên; b
thể chén; c thể túi; d bào tử túi; e khuẩn lạc phát triển trên môi trường PGA; f thể bình [5]
Hình 2.2 Hình thái giải phẫu nấm mẫu DL0075 a bào tử đính; b vách
ngăn trên hệ sợi; c hệ sợi
Hình 2.3 Hình thái nấm mẫu DL0077 a mẫu nấm DL0077; b,c bào tử vô
tính; d, f hệ sợi được nuôi cấy trên lame và cấu trúc sinh bào tử ở dạng thể bình; e nhánh thứ cấp của thể bình
Trang 32Máy vortex (Vortex ZX3, Velp Ý)
Máy ly tâm lạnh (Hettich Universal 320R, Đức)
Bộ điện di DNA (BioRad)
Tủ lạnh (LG)
Tủ đông (Sanyo)
Tủ ủ nhiệt (Multitemp)
Cân kỹ thuật (Satorious, Đức)
Tủ tách chiết và tủ PCR (ESCO ADC-4B1)
Máy quang phổ kế (Smart Spec, BioRad)
Máy luân nhiệt ( My-Cycler Thermal, BioRad)
Máy chụp ảnh gel (Gel Doc XR System, BioRad)
Trang 33Agarose 1,5 g (Bio Rad)
TBE 1X 100 ml (Bio Rad)
Ethidium bromide 1,7 µl (Bio Rad)
2.2 TIẾN TRÌNH THÍ NGHIỆM
Trang 34Mẫu nấm ký sinh côn trùng
Tách chiết DNA các mẫu nấm ký sinh côn trùng theo phương pháp Phenol-Chloroform
Khuếch đại gen nrLSU và Atp6 với các cặp
Kết luận tên loài cho mẫu phân tích
Tìm kiếm và khai thác những nguồn tài liệu có thông tin liên quan tới hướng đề tài định danh nấm ký sinh côn trùng Để việc tìm kiếm thông tin tin cậy và có hiệu quả thì nên tìm những bài báo được đăng tải trên Internet tại những trang tạp chí khoa học chuyên ngành hay tìm kiếm trên công cụ sinh học như NCBI, Pubmed sẽ đáng tin cậy hơn Đặc biệt, những thông tin thu được mang tính tổng
quan liên quan tới gen nrLSU và Atp6 của nấm Cordyceps mà đề tài đang thực
hiện
Trang 352.2.2.1 Thu thập trình tự gen
Tiến hành thu thập trình tự tham chiếu gen Atp6 và nrLSU của các loài nấm ký
sinh côn trùng, được lấy từ ngân hàng gen (Genbank) tại NCBI thông qua các
mã số truy cập (Accession number) từ bài báo của Sung và cộng sự (2007) làm
bộ dữ liệu cục bộ được trình bày ở bảng 3.2
2.2.2.2 Thu thập và đánh giá mồi
Cặp mồi khuếch đại vùng gen nrLSU và Atp6 của nấm Cordyceps sẽ được đánh
giá bằng các công cụ và phần mềm: ClustalW, Annhyb, BLAST, IDT Tiếp tục
nhận xét, đánh giá và so sánh kết quả với cặp mồi mà Sung et al.,2007 hay các
nhà nghiên cứu trước đã dùng Sau đó, chọn cặp mồi thích hợp để chạy thực nghiệm Trong nghiên cứu này, sử dụng cặp mồi là LR0R/LR5 có tính phổ quát
khuếch đại gen nrLSU chiều dài sản phẩm là 950 bp và cặp mồi C1A/ATP6-C2A khuếch đại gen Atp6 chiều dài sản phẩm là 700 bp[40]
2.2.3.1 Tách chiết DNA hệ nấm ký sinh côn trùng
Trong nghiên cứu này, chúng tôi tiến hành tách chiết DNA theo phương pháp Phenol:Chloroform bổ sung CTAB (Cetyltrimethyl ammonium bromide) và β -mercaptoethanol[34] Hóa chất CTAB có vai trò quan trọng trong việc kết tủa DNA với trọng lượng phân tử cao, giúp thu nhận DNA có độ tinh sạch cao[28][30][57] và β - mercaptoethanol là chất khử làm phá vỡ liên kết disulfide của protein dẫn đến quá trình biến tính protein dễ dàng[55] Bên cạnh đó, sẽ giúp tăng hiệu suất tách chiết DNA và độ tinh sạch DNA cao hơn so với phương pháp tách chiết thông thường
Ly giải tế bào với lysis buffer không bổ sung β - mercaptoethanol và CTAB
Dùng que cấy vòng (vô trùng) tiến hành lấy một phần hệ sợi nấm (khoảng 1.5 g) hòa tan trong ống eppendorf chứa sẵn 700µl dung dịch lysis buffer (70 µl Tris-HCl pH 1M, 14 µl EDTA 0.5M, 140 µl SDS 10%, 140 µl NaCl 0.5 M, 266
µl dd H2O, 70 µl Proteinase K 1mg/ml), đảo ống đều Sau đó, ủ qua đêm ở nhiệt độ 65o
C
Trang 36 Ly giải tế bào với lysis buffer bổ sung β - mercaptoethanol và CTAB
Dùng que cấy vòng (vô trùng) tiến hành lấy một phần hệ sợi nấm hòa tan trong ống eppendorf chứa sẵn 700 µl dung dịch lysis buffer (70 µl Tris-HCl pH 1 M,
392 µl NaCl 2,5 M, 140 µl CTAB 10 %, 14 µl β - mercaptoethanol 99,9 %, 14
µl dd H2O, 70 µl Proteinase K 1 mg/ml), đảo ống đều Sau đó, ủ 2 giờ ở nhiệt độ
650C
Tách chiết DNA
Chúng tôi tiến hành ly tâm 13.000 vòng/phút trong 10 phút và loại bỏ phần cặn, thu dịch nổi, bổ sung 700 µl dung dịch PCI (phenol/chloroform/isoamylalcohol với tỷ lệ 25:24:1), lắc đều ống và ly tâm 13.000 vòng/phút trong 10 phút
Sau đó, thu dịch nổi, bổ sung 1 V chloroform, lắc đều và ly tâm 13.000 vòng/phút
Tiếp tục thu dịch nổi, bổ sung 1/10V dung dịch NaOAc 3 M, lắc đều Tiến hành
bổ sung 1 V isopropanol, lắc đều và ủ ở nhiệt độ 40C trong vòng 2 giờ Sau đó ly tâm 13.000 vòng/phút trong 20 phút Loại bỏ dịch nổi, thu tủa bổ sung 1 ml ethanol 700 và ly tâm 13.000 vòng/phút trong 10 phút ở 40C, loại dịch nổi
Cuối cùng loại bỏ ethanol, làm khô cặn tại 500C và bổ sung 50 µl TE 1 X
Kiểm tra sản phẩm DNA tách chiết
Kiểm tra nồng độ DNA bằng phương pháp đo mật độ quang ở bước sóng 260nm
và 280nm
Xác định độ tinh sạch thông qua tỷ số OD260/OD280
2.2.3.2 PCR
2.2.3.2.1 Cặp mồi sử dụng trong phản ứng PCR
Trang 37Sun (1994)
Trang 38Trên gel agarose 1,5 %, đệm TBE 1 X, điện thế 80 V, trong 30 phút Kết quả hiển thị qua máy chụp ảnh gel
có thể được giải quyết dựa vào mồi ngược và ngược lại Tiến hành loại bỏ những tín hiệu (peak) không rõ ràng ở đầu và cuối mồi Vì đối với base ở những vùng này hoàn toàn không đảm bảo được độ tin cậy Trình tự DNA được giải trình tự hai lần với mồi xuôi và mồi ngược Vì vậy, trình tự sẽ được đọc theo hai chiều, trước khi so sánh mồi ngược sẽ được bổ sung đảo ngược và hai trình
tự sẽ được sắp gióng cột qua phần mềm Seaveiw để tìm mức độ tương đồng Sau khi được sắp gióng cột cho thấy tương đồng sẽ tiến hành tìm sai lệch giữa 2 kết quả giải trình tự (mồi xuôi và mồi ngược) thực hiện bằng Alignment của SeaView
Trình tự cuối cùng chính xác nhất của đoạn DNA được xuất ra với phần mềm Chromas lite 2.1.1 Kết quả sau hiệu chỉnh được kiểm tra lại thật kỹ bằng mắt
và so sánh trên cở sở dữ liệu nucleotide trên Genbank
Xác định mô hình tiến hóa là bước quan trọng trong xây dựng cây phát sinh loài, được thực hiện dựa trên phần mềm MEGA6.0 Lựa chon mô hình tiến hóa phù hợp nhất với giá trị điểm BIC là thấp nhất và các thông số của mô hình tiến hóa này được áp dụng xây dựng cây phát sinh loài bằng phương pháp Maximum Likelihood Cây phát sinh loài được xây dựng dựa trên phương pháp: Neighbor-
Trang 39joining, Maximum Parsimony, Maximum Likelihood và giá trị bootstrap lặp lại
1000 lần
Trang 40PHẦN III: KẾT QUẢ NGHIÊN CỨU VÀ THẢO
LUẬN