Định danh các loài nấm ký sinh côn trùng là một vấn đề cấp thiết nhưng còn gặp nhiều khó khăn và hạn chế trong công tác định danh dựa trên hình thái do chúng được phân biệt với nhau dựa
Trang 1KHÓA LUẬN TỐT NGHIỆP
Tên đề tài:
HỖ TRỢ ĐỊNH DANH CÁC MẪU NẤM KÝ SINH CÔN TRÙNG BẰNG PHÂN TÍCH PHÁT SINH CHỦNG LOÀI DỰA TRÊN
VÙNG GEN nrLSU VÀ Rpb1
KHOA CÔNG NGHỆ SINH HỌC
CHUYÊN NGÀNH: VI SINH – SINH HỌC PHÂN TỬ
CBHD: ThS Lao Đức Thuận
CN Vũ Tiến Luyện SVTH: Nguyễn Thị Thu Thảo MSSV: 1153010761
Khóa: 2011 - 2015
Bình Dương, tháng 05 năm 2015
Trang 2Để hoàn thành đề tài này, ngoài sự cố gắng của bản thân còn có sự hướng dẫn của thầy cô, anh chị và sự giúp đỡ của bạn bè
Đầu tiên, em xin chân thành cảm ơn tất cả các thầy cô Khoa Công nghệ Sinh Học Trường Đại học Mở Thành phố Hồ Chí Minh đã truyền đạt cho em những kiến thức nền tảng nhất, em xin cảm ơn thầy Lao Đức Thuận, người đã trực tiếp hướng dẫn
em trong suốt quá trình thực hiện và hoàn thành chuyên đề khóa luận tốt nghiệp, luôn bên cạnh định hướng, truyền đạt kinh nghiệm, động viên em hoàn thành đề tài Bên cạnh đó, em cũng xin cảm ơn anh Vũ Tiến Luyện đã luôn nhiệt tình giúp đỡ, hướng dẫn, chia sẻ cho em nhiều kinh nghiệm giúp em thực hiện tốt đề tài
Con cảm ơn mẹ và gia đình đã luôn bên con, tạo mọi điều kiện tốt nhất để con hoàn thành việc học của mình
Em xin chân thành cảm ơn những anh, chị và các bạn trong phòng thí nghiệm Sinh học phân tử Trường Đại học Mở Thành phố Hồ Chí Minh đã luôn quan tâm, giúp
đỡ em trong quá trình làm đề tài
Một lần nữa, em xin gửi đến tất cả các thầy cô, anh chị, bạn bè lời biết ơn và kính chúc sức khỏe, may mắn, gặt hái nhiều thành công trong tương lai
Bình Dương, Ngày 05 tháng 05 năm 2015 SINH VIÊN
Nguyễn Thị Thu Thảo
Trang 3Hình 1.1 Ophiocordyceps sinensis
Hình 1.2 Cấu trúc của rDNA và vùng gen nrLSU với cặp mồi LR0R/LR5
Hình 1.3 Cấu trúc vùng gen Rpb1
Hình 2.1 Hình thái giải phẫu mẫu nấm DL0038A
Hình 2.2 Hình thái giải phẫu mẫu nấm DL0038B
Hình 2.3 Hình thái giải phẫu nấm DL0069
Hình 2.4 Hình thái giải phẫu mẫu nấm DL0075
Hình 3.1 Kết quả kiểm tra cặp mồi LR0R/LR5 bằng BLAST (NCBI)
Hình 3.2 Kết quả kiểm tra cặp mồi CRPB1/RPB1Cr bằng BLAST (NCBI)
Hình 3.3 Mồi xuôi LR0R được sắp gióng cột với các trình tự nrLSU của các loài trong chi Cordyceps
Hình 3.4 Mồi ngược LR5 được sắp gióng cột với các trình tự nrLSU của các loài trong chi Cordyceps
Hình 3.5 Mồi xuôi CRPB1 được sắp gióng cột với các trình tự Rpb1 của các loài trong chi Cordyceps
Hình 3.6 Mồi xuôi RPB1Cr được sắp gióng cột với các trình tự Rpb1 của các loài trong chi Cordyceps
Hình 3.7 Sử dụng Annhyb để kiểm tra vị trí bắt cặp và kích thước sản phẩm với
Hình 3.10 Kết quả điện di sản phẩm PCR gen nrLSU và Rpb1 tách chiết theo
phương pháp phenol:chloroform bổ sung β-mercaptoethanol
Hình 3.11 Kết quả điện di sản phẩm PCR gen nrLSU và Rpb1 tách chiết theo
phương pháp phenol:chloroform bổ sung β-mercaptoethanol và CTAB
Hình 3.12 Mô tả sự sai khác nu ở hai mạch xuôi và ngược gen nrLSU ở đầu 3‟
Trang 4Hình 3.15 Vị trí sai lệch của hai kết quả giải trình tự ở đầu mạch xuôi của nrLSU Hình 3.16 Mô tả sự sai khác nu ở hai mạch xuôi và ngược gen nrLSU ở đầu 5‟ Hình 3.17 Hình kết quả BLAST trình tự nrLSU mạch xuôi đã hiệu chỉnh
Hình 3.18 Kết quả xây dựng cây phát sinh loài dựa trên vùng gen nrLSU bằng
phương pháp Maximum Likelihood
Hình 3.19 Kết quả xây dựng cây phát sinh loài dựa trên vùng gen Rpb1 bằng
phương pháp Maximum Likelihood
Hình 3.20 Kết quả xây dựng cây phát sinh loài dựa trên vùng gen nrLSU kết hợp với Rpb1 bằng phương pháp Maximum Likelihood
Trang 5Bảng 2.1 Trình tự các mồi đánh giá trong đề tài
Bảng 2.2 Các thông số thiết lập cho chu kì nhiệt trong phản ứng PCR khuếch đại
vùng gen nrLSU và Rpb1
Bảng 3.1 Thông tin về trình tự và các thông số vật lí của cặp mồi được sử dụng để
khuếch đại vùng gen nrLSU và Rpb1
Bảng 3.2 Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 4 mẫu nấm ký sinh côn trùng được tách chiết theo phương pháp phenol:chlloroform
Bảng 3.3 Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 4 mẫu nấm ký sinh côn trùng được tách chiết theo phương pháp phenol:chlloroform có bổ sung β-mercaptoethanol
Bảng 3.4 Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 4 mẫu nấm ký sinh côn trùng được tách chiết theo phương pháp phenol:chlloroform có bổ sung β-mercaptoethanol và CTAB
Bảng 3.5 Hiệu chỉnh các nu tại các vị trí (1) đến (8)
Bảng 3.6 Tổng hợp kết quả hiệu chỉnh trình tự các mẫu nấm ký sinh côn trùng Bảng 3.7 Kết quả chiều dài các trình tự trước và sau hiệu chỉnh
Bảng 3.8 Thông tin các trình tự được sử dụng để xây dựng cơ sở dữ liệu vùng gen
nrLSU, Rpb1 sau khi tinh chế
Bảng 3.9 Tổng hợp kết quả dò tìm mô hình tiến hóa bằng chức năng Find Best DNA/Protein Models (ML) trong phần mềm MEGA 6.06 dựa trên bộ CSDL gen
nrLSU , Rpb1 và nrLSU_Rpb1
Bảng 3.10 Tổng hợp kết quả định danh các mẫu nấm từ dữ liệu phân tử và hình thái
Trang 6ĐẶT VẤN ĐỀ 1
PHẦN 1 TỔNG QUAN TÀI LIỆU 1.1 Tổng quan về các loài nấm ký sinh công trùng 3
1.1.1 Đặc điểm chung và thành phần loài 3
1.1.2 Tiềm năng ứng dụng 4
1.2 Nghiên cứu hỗ trợ định danh và phát sinh loài 6
1.2.1 Đặc điểm nhận dạng và định danh 6
1.2.2 Trình tự nrLSU và Rpb1 trong định danh phân tử nấm 8
1.3 Tình hình nghiên cứu trong nước 11
1.4 Kỹ thuật PCR và giải trình tự 13
1.4.1 Kỹ thuật PCR 13
1.4.2 Kỹ thuật giải trình tự 14
1.5 Nghiên cứu phát sinh loài 14
PHẦN 2 VẬT LIỆU VÀ PHƯƠNG PHÁP 2.1 Bộ mẫu nấm ký sinh côn trùng 21
2.2 Dụng cụ - thiết bị - hóa chất 23
2.2.1 Dụng cụ 23
2.2.2 Thiết bị 23
2.2.3 Hóa chất 24
2.3 Danh mục các phần mềm sử dụng 24
2.4 Phương pháp nghiên cứu 25
2.4.1 Khảo sát In silico 25
2.4.2 Thực nghiệm 26
2.4.3 Phân tích phát sinh loài 30
PHẦN 3 KẾT QUẢ - BIỆN LUẬN 3.1 Kết quả đánh giá mồi 31
3.1.1 Kết quả đánh giá mồi bằng IDT 31
Trang 73.1.4 Kết quả kiểm tra Annhyb 36
3.2 Kết quả thực nghiệm 38
3.3 Kết quả hiệu chỉnh trình tự 42
3.5 Xây dựng bộ cơ sở dữ liệu 47
3.6 Kết quả dựng cây phát sinh loài 50
PHẦN 4 KẾT LUẬN VÀ ĐỀ NGHỊ 4.1 Kết luận 60
4.2 Đề nghị 60
TÀI LIỆU THAM KHẢO 62
Trang 8DANH SÁCH CHỮ VIẾT TẮT
DNA: Deoxyribonucleic acid
RNA: Ribonucleic acid
rDNA: ribosomal deoxyribonucleic acid
rRNA: ribosomal ribonucleic acid
PCR: Polymerase Chain Reaction
BLAST: Basic Local Alignment Search Tool
NCBI: National Center for Biotechnology Information
IDT: Integrated DNA Technologies
Trang 9ĐẶT VẤN ĐỀ
Cordyceps là một chi nấm ký sinh trên côn trùng thuộc ngành nấm túi Ascomycota,
với hơn 400 loài đã được mô tả Trong đó, Cordyceps sinensis (Đông Trùng Hạ
Thảo) là loài được biết đến nhiều nhất và là một dược liệu đã được sử dụng từ lâu trong y học cổ truyền của nhiều nước châu Á Những nghiên cứu, đánh giá về
Cordyceps và các thành phần hóa học của chúng cho thấy nhiều ứng dụng điều trị
tiềm năng, điển hình như: khả năng ức chế các tế bào khối u, điều hòa hệ thống miễn dịch, có tác dụng chống viêm và tác dụng tích cực đối với các bệnh tim mạch, tiểu đường, cải thiện chức năng gan, thận,
Định danh các loài nấm ký sinh côn trùng là một vấn đề cấp thiết nhưng còn gặp nhiều khó khăn và hạn chế trong công tác định danh dựa trên hình thái do chúng được phân biệt với nhau dựa theo màu sắc và hình dạng quả thể, bào tử hay ký chủ, Bên cạnh đó, khả năng biến đổi cao theo điều kiện môi trường, vùng địa lý, thành phần loài phong phú và sự biến đổi giữa thể vô tính (anamorph) và thể hữu tính (teleomorph) cũng là những nguyên nhân dẫn đến nhiều mâu thuẫn trong thành phần loài của chi nấm này Để giải quyết những vấn đề trên, các kỹ thuật phân tử đã được áp dụng để hỗ trợ công tác phân loại các loài nấm Vùng gene mã hoá cho RNA ribosome (DNA ribosome, rDNA) đã được sử dụng phổ biến để nghiên cứu trong nhiều năm gần đây rDNA là nhóm gene có nhiều bản sao, không mã hóa cho bất kì protein nào và là vùng gen bảo tồn nên được xem là cơ sở chính xác để tìm ra
sự tương đồng hay khác biệt giữa các sinh vật cùng loài hay khác loài Tuy nhiên, cây phát sinh loài được xây dựng dựa trên dữ liệu của những vùng gen mã hóa rRNA của ribosome vẫn chưa giải quyết được mối quan hệ ở cấp độ chi và loài
House-keeping genes là những gen được biểu hiện thường xuyên ở mức tương đối
ổn định trong bất kì điều kiện nào, chúng mã hóa cho các protein giữ vai trò quan trọng liên quan đến những chức năng cần thiết cho quá trình nuôi dưỡng và duy trì
tế bào Nhờ vậy, trong định danh phân tử nấm housekeeeping genes đã được sử
dụng nhiều vì chúng là những vùng trình tự bảo tồn cao giúp ích cho việc so sánh và phân tích mối quan hệ giữa các loài Hiện nay, hướng nghiên cứu kết hợp nhiều gen
Trang 10gồm gen mã hóa rRNA của ribosome và gen mã hóa protein đang phổ biến và đem lại nhiều kết quả giúp định danh tốt hơn
Đông Trùng Hạ Thảo đã được sử dụng từ lâu, tuy nhiên, do sự khan hiếm và giá cao, nhiều sản phẩm không rõ nguồn gốc được bày bán trên thị trường dẫn đến sự cần thiết phải kiểm soát và thẩm định chất lượng Do đó, việc hiểu biết đầy đủ về thành phần loài sẽ tạo diều kiện cho việc khai thác, nuôi trồng nội địa nguồn dược liệu quý này, đồng thời, góp phần làm giảm giá thành và kiểm soát chất lượng sản phẩm Hơn nữa, việc có được những thông tin khoa học đầy đủ và chính xác sẽ là
cơ sở cho các nghiên cứu ứng dụng sau này ở Việt Nam
Trong giới hạn đề tài, chúng tôi sẽ tiếp cận vùng gen nrLSU kết hợp Rpb1 và xây
dựng cơ sơ dữ liệu cục bộ vùng gen này, tiến hành thực nghiệm xây dựng quy trình tách chiết DNA từ hệ sợi nấm, quy trình PCR để khuếch đại vùng gen mục tiêu
nrLSU, Rpb1, giải trình tự, xây dựng và so sánh các cây phả hệ phân tử từ cơ sở dữ
liệu thu thập được Quy trình này nhằm hỗ trợ định danh chính xác các loài nấm ký sinh côn trùng, góp phần xây dựng một quy trình định danh nấm tin cậy, làm cơ sở cho các nghiên cứu ứng dụng ở Việt Nam
Trang 11PHẦN 1 TỔNG QUAN
TÀI LIỆU
Trang 121.1 TỔNG QUAN VỀ CÁC LOÀI NẤM KÝ SINH CÔNG
TRÙNG
2.1.1 Đặc điểm chung và thành phần loài
Cordyceps là một chi nấm ký sinh trên côn trùng thuộc họ Clavicipitaceae, bộ
Hypocreales, lớp Sordariomycetes, ngành nấm túi Ascomycota [47] Trong đó, Cordyceps sinensis là loài được biết đến sớm nhất với tên gọi Đông Trùng Hạ Thảo
Đây là dạng ký sinh của Cordyceps sinensis trên trên các ấu trùng của các loài sâu thuộc chi Hepialus Phần lớn các loài trong chi Cordyceps được biết đến với những
giá trị y dược độc đáo và quý hiếm được sử dụng trong y học cổ truyền một số quốc gia Đông Á như Trung Hoa hay Tây Tạng [24]
Phân loại khoa học:
Giới (Kingdom): Fungi
Phân giới (Subkingdom): Dikarya
Chi (Genus): Cordyceps
Trong tự nhiên, Cordyceps sinh sôi nảy nở tốt trong các khu rừng ôn đới và nhiệt
đới ẩm ướt Chúng phải trải qua nhiều giai đoạn phát triển phức tạp để hoàn thành chu kỳ sinh trưởng, từ giai đoạn sống trong đất tới sau khi lây nhiễm vào cơ thể ấu trùng và chịu sự cạnh tranh với các vi khuẩn khác, thậm chí cả sự tham gia của
nhiều loài khác thuộc chi nấm Cordyceps Ở giai đoạn đầu, bào tử nấm nhiễm vào
cơ thể sâu non, nhộng, sâu trưởng thành nằm dưới đất hoặc trên mặt đất Trong suốt mùa đông, những ấu trùng này sẽ ngủ đông, lượng dinh dưỡng tích trữ được đủ để duy trì sự sống trong bốn tháng Nấm ký sinh sẽ tấn công cơ thể các ấu trùng ngủ
Hình 1.1 Ophiocordyceps sinensis [62]
Trang 13đông này và sử dụng các chất hữu cơ trong cơ thể côn trùng làm thức ăn, trong nhiều trường hợp, nấm ký sinh còn tác động đến hành vi của vật chủ Vào mùa đông, nhiệt độ và ẩm độ không khí thấp, nấm ký sinh ở dạng hệ sợi, phát triển trên toàn thân sâu để hút chất dinh dưỡng làm cho sâu chết Đến mùa hè, nhiệt độ và ẩm
độ không khí cao, nấm chuyển sang giai đoạn sinh sản hữu tính, hình thành thể quả
Do vậy, quả thể của Cordyceps thường được tìm thấy trên xác nhộng hoặc ấu trùng
của côn trùng sau một thời gian nhiễm nấm [25, 57]
Cordyceps là một chi nấm có thành phần loài phong phú với hơn 400 loài đã được
mô tả, phân bố chủ yếu ở Châu Á, đặc biệt là vùng Đông Á, ngoài ra còn có ở Châu
Úc và một số nước Châu Âu Chúng thường được tìm thấy ở các cao nguyên ở độ cao trên 4.000 - 5.000 m so với mặt nước biển như Himalaya, Tây Tạng, Tứ Xuyên, Thanh Hải, Cam Túc, Vân Nam… [25, 47]
2.1.2 Tiềm năng ứng dụng
1.1.2.1 Y dược
Trên thế giới, các nghiên cứu về Đông Trùng Hạ Thảo rất được các nhà khoa học quan tâm, phần dược tính của thuốc đã được chứng minh là do các chất chiết xuất từ
nấm Cordyceps sinensis Các phân tích hoá học cho thấy trong sinh khối của
Cordyceps sinensis có chứa nhiều thành phần dinh dưỡng như: các amino acid,
vitamin E, K, B1, B2, B12, C… Ngoài ra, chúng còn chứa nhiều đường (bao gồm
cả mono-, di-, oligosaccharide và nhiều phức hợp polysaccharide), protein, sterol, nucleoside và các nguyên tố vi lượng như K, Na, Ca, Mg, Fe, Cu, Mn, Zn, Pi, Se,
Al, Si, Ni, Sr, Ti, Cr, Ga, V, và Zr [25] Trong dịch nuôi cấy và sinh khối
Cordyceps sinensis có nhiều hoạt chất sinh học có giá trị dược liệu cao như
cordycepin, acid cordyceptic, adenosin, hydroxyethyl-adenosin, nhóm hoạt chất Hydroxy-Etyl-Adenosin- Analogs (HEAA),… [25]
Cordycepin (3'-deoxyadenosine,C10H13N5O3) là một trong những hoạt chất sinh học
quan trọng nhất được tìm thấy ở các loài Cordyceps thể hiện tính kháng khuẩn,
chống ung thư, chống di căn, điều hòa miễn dịch [44].Ngoài ra, cordycepin trong tế bào có thể chuyển đổi thành 5'-mono-, di- và triphosphate ức chế sự hoạt động của một số enzyme trong con đường sinh tổng hợp purine [38]
Trang 14Ngoài Cordyceps sinensis, nhiều loài khác trong chi Cordyceps cũng có tiềm năng ứng dụng trong y dược rất lớn, tiêu biểu như Cordyceps militaris [41, 30],
Cordyceps pruinosa [31], Cordyceps cicadae [51],… Những nghiên cứu, đánh giá
về Cordyceps và các thành phần hóa học của chúng cho thấy nhiều ứng dụng điều
trị tiềm năng, điển hình là: khả năng ức chế các tế bào khối u [25, 19], điều hòa hệ thống miễn dịch [54, 25] và tác dụng chống viêm [52, 33] Ngoài ra, chúng còn có tác dụng tích cực đối với các bệnh tim mạch, tiểu đường, cải thiện chức năng gan, thận [25], thúc đẩy việc tiết ra các hormone tuyến thượng thận [50], giảm huyết áp
và sự căng cơ [20], điều hòa đường máu[34]…
Hiệu quả chống ung thư: khả năng ức chế sự phát triển của các khối u được phát
hiện ở nhiều loài của chi Cordyceps, các thành phần hoạt tính sinh học có tác động
chống ung thư chủ yếu là polysaccharide, sterols và adenosine Trong đó, sterols và adenosine là các chủ đề nghiên cứu đang rất được quan tâm về khả năng chống ung thư [53]
Tác động điều hòa miễn dịch: các tác động chính của Cordyceps là đáp ứng tăng
sinh lymph, tế bào giết tự nhiên (NK), và kích thích tạo thành: ngưng kết tố thực vật (PHA), interleukin-2 (IL-2), hoại tử tế bào ung thư (TNF- α) trên các tế bào đơn nhân ở người do sự sản xuất của cytokines Các tác động trị liệu như ngăn chặn bệnh tự miễn, dị ứng cũng có liên quan đến tác động điều hòa miễn dịch [53] Tác động bảo vệ gan: các thử nghiệm trên động vật và dữ liệu từ các phòng khám
cho thấy Cordyceps có tác dụng bảo vệ gan của bệnh nhân viêm gan A, viêm gan B
mạn tính, viêm gan C, xơ gan Chúng làm tăng các tế bào hữu cơ có chức năng điều hòa, tăng cường chức năng gan và ức chế xơ gan [53]
Trong những năm gần đây, Cordyceps trở thành nguồn nguyên liệu rất quan trọng cho làm thuốc và thực phẩm chức năng Hiện nay, sự phát triển của Cordyceps và
các chế phẩm của chúng chủ yếu tập trung vào ba hướng là thuốc ăn kiêng, thực phẩm chức năng và phát triển dược tính Hầu hết các hoạt chất sinh học chiết xuất
từ Cordyceps đều là các chất chống lão hóa, giúp điều hòa giấc ngủ và đã được cấp
phép như một nguồn thuốc mới bởi SFDA (Trung Quốc) [53]
Trang 151.1.2.2 Kiểm soát sinh học
Nấm ký sinh côn trùng là thiên địch phổ biến của các loài chân khớp và được xem
là các đối tượng kiểm soát sinh học [23, 42] Nhiều loài nấm ký sinh côn trùng đã được ứng dụng rộng rãi trong đấu tranh sinh học kiểm soát dịch hại, trong đó phổ
biến là các loài Beauveria bassiana, Metarhizium anisopliae và Normurea rileyi [13, 5] Trên thị trường hiện có sản phẩm thuốc trừ sâu sinh học Green Muscle được làm từ nấm Metarhizium anisopliae var acridum giúp thay thế thuốc trừ sâu hóa
học để kiểm soát châu chấu ở Châu Phi Tại Việt Nam, nhiều nghiên cứu đã thành công trong việc sử dụng nấm ký sinh côn trùng phòng trị các loại côn trùng và sâu
hại cây trồng, điển hình như nấm Metarhizium anisopliae và Beauveria bassiana đã
được ứng dụng trong phòng trừ mối nhà [4], sâu khoang hại cải xanh [14], sâu hại đậu tương và đậu xanh [11], rầy mềm và các loài sâu hại lúa [6, 12]
1.2 NGHIÊN CỨU HỖ TRỢ ĐỊNH DANH VÀ PHÁT SINH
LOÀI
1.2.1 Đặc điểm nhận dạng và định danh
Trước đây, việc định danh và xây dựng hệ thống học các loài nấm ký sinh côn trùng chủ yếu dựa trên phân tích hình thái Năm 1982, Kobayashi đã xây dựng nên khóa
định danh cho nhóm Cordyceps và Torrubiella bao gồm 282 loài Cordyceps, 59 loài
Torrubiella và 75 loài thuộc về các chi lân cận khác Đến nay, khóa phân loại này
vẫn được xem là hữu hiệu nhất trong việc định danh nhóm nấm này theo phương pháp cổ điển [32]
Họ Clavicipitaceae được nhận biết qua các đặc điểm như: thể túi dạng trụ, đỉnh túi
dày và các túi bào tử dạng sợi thường có thể ngắt rời thành nhiều bào tử thứ cấp [47] Theo kết quả nghiên cứu của Sung và cộng sự (2007), hệ thống nhóm nấm
Cordyceps và Clavicipitaceae được phân loại lại thành ba họ đơn ngành: Clavicipitaceae s.s (Clavicipitaceae clade A), Cordycipitaceae (Clavicipitaceae
clade B) và Ophiocordycipitaceae (Clavicipitaceae clade C) Dựa theo sự phát sinh loài này, Cordyceps sensu Kobayasi và Mains được chia thành bốn chi là Cordyceps
s s., Elaphocordyceps, Metacordyceps và Ophiocordyceps Hệ thống phân loại hiện
Trang 16tại của các loài nấm ký sinh côn trùng như sau: Clavicipitaceae gồm
Conoideocrella, Hypocrella, Metacordyceps, Moelleriella, Orbiocrella, Regiocrella, Samuelsia, Shimizuomyces, Villosiclava; Cordycipitaceae gồm Ascopolyporus, Cordyceps, Hyperdermium, Torrubiella và Ophiocordycipitaceae
gồm Cordyceps s.l., Elaphocordyceps, Ophiocordyceps [47, 58]
Một số đặc điểm định danh hình thái điển hình của các chi nấm ký sinh côn trùng
như Cordyceps s s có quả thể mềm, màu vàng nhạt hoặc màu sáng (điển hình là
Cordyceps militaris), ký sinh trên ấu trùng/nhộng Lepidoptera và Coleoptera, tìm
thấy trong các lớp lá mục, rêu hoặc tầng đất mặt; Elaphocordyceps ký sinh trên nhộng ve sầu; Metacordyceps quả thể nấm có màu từ trắng (Metarcordyceps
youngmunensis) đến màu hoa cà, màu tím hoặc xanh lá cây, các mẫu nấm khô có
màu sẫm hơn hoặc màu đen (Metarcordyceps taii), chất nền xơ và không dày như của chi Cordyceps s.s., ký chủ thường ở sâu trong đất; Ophiocordyceps có sắc tố sẫm, thường tấn công sâu non, được tìm thấy trong đất (Ophiocordyceps sinensis) hoặc gỗ mục (Ophiocordyceps variabilis), hình thái quả thể đa dạng tùy theo loài,
có thể dạng sợi, dẻo dai hoặc hình chùy, xơ [58]
Định danh các loài nấm ký sinh côn trùng, đặc biệt là chi nấm Cordyceps là một vấn
đề cấp thiết nhưng còn gặp nhiều khó khăn trong công tác định danh dựa trên hình thái do chúng được phân biệt với nhau dựa theo màu sắc và hình dạng quả thể, bào
tử hay ký chủ, [43, 47, 49] Đồng thời, khả năng biến đổi cao theo điều kiện môi trường, vùng địa lý, sự biến đổi giữa thể vô tính (anamorph) và thể hữu tính (teleomorph) và thành phần loài phong phú cũng là những nguyên nhân dẫn đến những mâu thuẫn trong thành phần loài của chi nấm này Mặt khác, Đông Trùng Hạ Thảo đã được sử dụng từ lâu, tuy nhiên, do sự khan hiếm và giá cao, nhiều sản phẩm không rõ nguồn gốc được bày bán trên thị trường, dẫn đến sự cần thiết phải kiểm soát và thẩm định chất lượng [16, 37] Do đó, việc hiểu biết đầy đủ về thành phần loài sẽ tạo điều kiện cho việc khai thác, nuôi trồng nội địa nguồn dược liệu quý này, đồng thời, góp phần làm giảm giá thành và kiểm soát chất lượng sản phẩm Hơn nữa, việc có được những thông tin khoa học đầy đủ và chính xác sẽ là cơ sở
Trang 17cho các nghiên cứu ứng dụng sau này Để giải quyết những vấn đề trên, các kỹ thuật phân tử đã được áp dụng để hỗ trợ công tác phân loại các loài nấm [26]
1.2.2 Trình tự nrLSU và Rpb1 trong định danh phân tử nấm
Định danh phân tử là phương pháp phân loại sinh vật ở mức độ phân tử dựa trên cơ
sở so sánh trình tự nucleotide và axit amin của các phân tử DNA, RNA và Protein Trong nghiên cứu định danh phân tử, việc lựa chọn vùng trình tự DNA, RNA, Protein để khảo sát giữa các loài là một bước quan trọng, trình tự này cần đảm bảo tính bảo tồn cao trong cùng một loài nhưng biến động lớn giữa các loài khác nhau Hiện nay, định danh phân tử đang trở thành ngành khoa học mũi nhọn trong phân loại học, bổ sung trong phân loại học truyền thống những phương pháp nghiên cứu mới và giải quyết các vấn đề còn chưa sáng tỏ như tính đa dạng di truyền, phát sinh loài, hỗ trợ định danh các loài mà định danh hình thái còn hạn chế
1.2.2.1 Vùng gen nrLSU (nuclear ribosomal large subunit)
Đối với các loài Cordyceps, vùng gen mã hoá cho RNA ribosome đã được sử dụng
phổ biến để nghiên cứu trong nhiều năm gần đây rDNA có nhiều bản sao và không
mã hóa cho bất kì protein nào và là vùng gen bảo tồn nên được xem là cơ sở chính xác để tìm ra sự tương đồng hoặc khác biệt của các sinh vật cùng loài hay khác loài, đóng vai trò quan trọng trong các nghiên cứu về quá trình tiến hóa, phát sinh loài, định danh và xác định tính đa dạng di truyền của sinh vật, đặc biệt là nấm do việc phân loại chúng dựa vào đặc điểm hình thái và sinh hóa thường cho kết quả chưa thuyết phục và tốn nhiều thời gian
Ribosome là bào quan nhỏ có trong tất cả các tế bào của sinh vật nhân sơ và sinh vật nhân chuẩn, đảm nhiệm chức năng thực hiện quá trình sinh tổng hợp protein của
tế bào Các ribosome được cấu tạo từ rRNA và ribosome protein Một ribosome gồm tiểu phần nhỏ và tiểu phần lớn Hai tiểu đơn vị này chỉ kết hợp với nhau tạo ra một ribosome hoạt động khi quá trình dịch mã trên mRNA thực sự bắt đầu Ribosome có thể nằm tự do trong tế bào chất, hay bám trên màng của mạng lưới nội chất RNA ribosome là một trong hai thành phần chính của ribosome Ở sinh vật nhân chuẩn, tiểu phần nhỏ của ribosome (40S) chứa 18S RNA, tiểu phần lớn (60S) chứa 28S, 5.8S và 5S RNA ribosome được phiên mã từ rDNA, rDNA bao gồm
Trang 18nhiều đơn vị lặp lại, mỗi đơn vị lặp lại bao gồm vùng LSU (ribosomal large subunit, 25-28S), vùng 18S, ITS (internal transcribed spacer), 5.8S, 5S RNA và vùng IGS (intergenic spacer) (hình 1.2) Vùng IGS bao gồm phần ETS (external transcribed
spacer) và phần không phiên mã NTS (non-transcribed spacer) Vùng gen nrLSU là
vùng gen mã hóa cho RNA 25S-28S của ribosome (tiểu phần lớn của ribosome), có tính bảo tồn cao nên phù hợp cho các nghiên cứu ở cấp họ hay xa hơn
Một đơn vị lặp lại bao gồm vùng IGS2-18S (SSU)-ITS1-5.8S-ITS2-28S (LSU)- IGS1-5S-IGS2 Trong đó vùng 18S-28S là vùng phiên mã chính, chứa thông tin di truyền phiên mã cho rRNA - thành phần cấu trúc chính của ribosome (LSU, SSU) Bởi rDNA gồm nhiều đơn vị lặp lại nên sau khi khuếch đại bằng mồi, kết quả sẽ thu được một số lượng rất lớn các đoạn DNA cần khảo sát Đây cũng là một trong
những thuận lợi của trình tự nrLSU
Hình 1.2 Cấu trúc của rDNA và vùng gen nrLSU với cặp mồi LR0R/LR5 [55]
Cấu trúc của nrLSU ngoài những vùng bảo tồn còn có những vùng biến động gọi là
các domain D1/D2/D3 (D-divergence region, các số được đánh thứ tự 1, 2, 3… bắt đầu từ đầu 5‟ – 3‟) Các domain khác nhau của 25-28S rDNA chứa nhiều thông tin cho phép so sánh các cấp phân loài từ cao xuống đến cấp độ loài Đặc biệt, vùng
Trang 19domain D1-D2 của LSU rDNA gần đây được xem là rất hữu ích cho việc phân loài
nhiều loài nấm Cặp mồi LR0R/LR5 là cặp mồi phổ quát khuếch đại vùng D1-D2
trên gen nrLSU và cho sản phẩm khuếch đại khoảng 800-1000 bp Đây là cặp mồi
được ứng dụng phổ biến trong nhiều nghiên cứu phả hệ phân tử hỗ trợ định danh nấm ký sinh côn trùng và các loài sinh vật khác [48, 46]
1.2.2.2 Trình tự gen Rpb1 trong định danh phân tử nấm
Vùng gen giữ nhà - housekeeping genes là những gen được biểu hiện thường xuyên
ở mức tương đối ổn định trong bất kì điều kiện nào, chúng mã hóa cho các protein giữ vai trò quan trọng, liên quan đến những chức năng cần thiết cho quá trình nuôi dưỡng và duy trì tế bào Đây cũng là những vùng trình tự bảo tồn cao giúp ích cho
việc so sánh và phân tích mối quan hệ giữa các loài Do vậy, vùng gen giữ nhà đã
được sử dụng phổ biến đối với định danh phân tử nấm Các gen đơn bản sao mã hóa các chuỗi polypeptide có độ dài khoảng 400 acid amin và hiện diện 65-70% trong
số tất cả các loài là những đại diện thích hợp để giải quyết các mối quan hệ phát sinh loài sâu trong nấm [17, 45]
Rpb1 (the largest subunit of RNA polymerase II) là gen mã hóa tiểu phần lớn nhất
của RNA polymerase II (enzyme xúc tác quá trình phiên mã trong tế bào nhân
chuẩn) Rbp1 có chứa vùng lặp lại heptapeptide hay chuỗi amino acid
Tyr-Ser-Pro-Thr-Ser-Pro- (Tyrosine-Serine-Proline-Threonine-Serine-Proline-) có tên là CTD (C-terminal domain), trong đó Ser ở vị trí thứ 5 phosphoryl hóa bởi hoạt động kinase của TFII, kích hoạt enzyme RNA polymerase II chuyển dịch qua promotor
và phiên mã Nhờ cấu trúc lặp lại đặc biệt này mà gen Rpb1 có độ bảo tồn cao giúp
phân biệt giữa các nhóm loài [28]
Hình 1.3 Cấu trúc vùng gen Rpb1 [60]
Trang 20Nghiên cứu của P Brandon Matheny và cộng sự (2002) đã chứng minh sự hữu ích
của cùng gen Rpb1 trong việc phân tích phát sinh loài khi công bố các kết quả cho
thấy vùng gen này đem lại kết quả phân tích phát sinh loài ổn định và phù hợp hơn
vùng gen nrLSU Theo đó, một cuộc điều tra so sánh phát sinh học của nấm sử dụng các trình tự gen Rpb1 và nrLSU trên cùng một tập hợp các loài trong chi Inocybe
(Agaricales, Basidiomycota).Kết quả cho thấy cả hai bộ CSDL đều thích hợp để sử
dụng trong phân tích phát sinh học, mặc dù bộ dữ liệu nrLSU cho thấy các mâu
thuẫn giữa các vị trí của hai loài Ngược lại, độ dài các nhánh khá đồng nhất và hỗ
trợ bootstrap tăng lên đối với các nhánh trong Rpb1 Đặc biệt, bộ dữ liệu kết hợp
làm tăng mức độ tin cậy đối với một số mối quan hệ [40]
Trên thế giới đã có nhiều công trình nghiên cứu theo hướng kết hợp nhiều gen gồm gen mã hóa rRNA của ribosome và gen mã hóa protein, trong đó có sử dụng trình tự
nrLSU và Rbp1 hỗ trợ định danh phân tử, điển hình là công trình của Sung và cộng
sự (2007) tiến hành tinh chỉnh lại phân loại của Cordyceps và Clavicipitaceae dựa
trên phân tích mối quan hệ phát sinh loài của 162 loài dựa trên 5-7 locus gen bao
gồm (nrSSU, nrLSU, Tef1, Rpb1, Rpb2, Tub và Atp6) kết hợp với phân tích hình thái Kết quả cho thấy sự tồn tại của ba nhánh Clavicipitaceae và bác bỏ các đơn ngành của cả Cordyceps và Clavicipitaceae trước đó, nhóm tác giả đề xuất thêm họ mới Ophiocordycipitaceae và hai chi mới là Elaphocordyceps và Metacordyceps, đồng thời có thêm hai loài mới được mô tả (Metacordyceps yongmunensis và
Ophiocordyceps communis) [47]
1.3 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC
Ở Việt Nam, việc nghiên cứu về nấm ký sinh côn trùng đang ngày càng được quan tâm, một số kết quả có thể kể đến như:
Năm 2006, Lê Tấn Hưng và cộng sự tiến hành khảo sát nhóm nấm này trong vườn quốc gia Cát Tiên Kết quả công bố vào năm 2007 cho biết họ đã thu được tổng cộng 259 mẫu nấm Phân loại, định danh bằng phương pháp hình thái học dựa trên các đặc điểm về ký chủ, màu sắc, loại bào tử, kích thước và hình dạng bào tử,… cho
thấy có tổng cộng 41 loài được ghi nhận thuộc 17 chi bao gồm Akanthomyces,
Aschersonia, Beauveria, Conoideocrella, Cordyceps, Gibellula, Hirsutella,
Trang 21Hymenostilbe, Hypocrella, Isaria, Metarhizium, Moelleriella, Nomuraea, Ophiocordyceps, Paecilomyces, Torrubiella và Verticillium Trong đó, có 1 loài
thuộc chi Cordyceps và 2 loài thuộc chi Ophiocordyceps [3]
Năm 2009, Viện Khoa học Lâm nghiệp Việt Nam và Trường Đại học Lâm Nghiệp
đã tiến hành điều tra thu mẫu nấm ĐTHT tại Khu bảo tồn Tây Yên Tử, Sơn Động, Bắc Giang, tác giả Phạm Quang Thu đã công bố phát hiện được loài nấm ký sinh
côn trùng và được giám định là loài Cordyceps nutans [7] Tại Vườn quốc gia Tam Đảo, Vĩnh Phúc, tác giả cũng đã phát hiện nấm ký sinh côn trùng Cordyceps gunnii [8] Tại Vườn quốc gia Hoàng Liên, Lào Cai đã phát hiện nấm ĐTHT Cordyceps
militaris [9] GS Đái Duy Ban và cộng sự cũng công bố phát hiện mới của mình về
loài ĐTHT lần đầu tiên được tìm thấy ở Việt Nam là Isaria cerambycidae trên ấu
spI (ở Sơn Động, Bắc Giang) Đồng thời, tác giả cũng xác định được một số giá trị
dược liệu của nấm ĐTHT Cordyceps militaris gồm Cordycepin, HEAA, một số
vitamin và nguyên tố vi lượng [11]
Nghiên cứu phát hiện các chủng nấm Cordyceps bản địa tại vùng cao nguyên
Langbiang, Lâm Đồng và khảo sát một số hoạt tính sinh học của các loài nấm này của nhóm tác giả Trương Bình Nguyên, Đinh Minh Hiệp, Lê Huyền Ái Thúy năm
2010 [64] Từ năm 2009 đến năm 2013, Đinh Minh Hiệp và Trương Bình Nguyên
đã tiến hành nghiên cứu nhóm nấm Cordyceps ở Tây Nguyên Kết quả công bố
trong Hội thảo quốc tế “Hợp tác khoa học công nghệ vì sự phát triển bền vững nông nghiệp Lâm Đồng - Tây Nguyên năm 2014” cho biết họ đã thu 124 mẫu nấm, phân tích hình thái - giải phẫu 85 mẫu và sơ bộ định danh đến mức chi, gồm 37 mẫu
thuộc chi Cordyceps, 8 mẫu thuộc chi Ophiocordyceps, 15 mẫu thuộc Isaria, 7 mẫu thuộc chi Metarhizium, 6 mẫu thuộc Beauveria, 4 mẫu thuộc Hirsutella, 2 mẫu thuộc chi Torrubiella, 2 mẫu thuộc chi Gibellula, 1 mẫu thuộc chi Hypocrella, 1
Trang 22mẫu thuộc chi Akanthomyces, 1 mẫu thuộc chi Aschersonia và 1 mẫu thuộc chi
Hymenostibe Bên cạnh đó, nhóm nghiêm cứu cũng đã xây dựng thành công
phương pháp định danh bằng sinh học phân tử kết hợp tin - sinh học dựa trên việc phân tích vùng trình tự ITS [2]
sự tiến hoá của sinh vật ở mức độ phân tử,…
Phương pháp PCR được thực hiện hoàn toàn trong các eppendoff và trong thời gian ngắn ta có thể thu nhận rất nhiều bản sao DNA Các thành phần chính của phản ứng PCR gồm: ADN khuôn, dNTPs, mồi (primer), enzym Taq-polymerase, MgCl2 và dung dịch đệm PCR Primer là những đoạn DNA ngắn, có khả năng bắt cặp bổ sung với một mạch của đoạn DNA khuôn và nhờ hoạt động của DNA polymerase đoạn primer này được kéo dài để hình thành mạch mới Kỹ thuật PCR được hình thành dựa trên đặc tính này của DNA polymerase, đoạn DNA nằm giữa hai primer sẽ được khuếch đại thành số lượng lớn bản sao và được phát hiện sau khi nhuộm bằng ethidium bromide, có thể thu nhận đoạn DNA này cho các mục đích khác nhau bằng các thao tác trên gel Như vậy, để khuếch đại một trình tự DNA xác định, cần phải có những thông tin tối thiểu về trình tự của DNA, đặc biệt là trình tự base ở hai đầu đoạn DNA đủ để tạo các primer bổ sung chuyên biệt Phản ứng được thực hiện trong máy luân nhiệt (máy PCR) Chu kì nhiệt của phản ứng gồm các bước: biến tính (95oC), bắt cặp mồi (37-65oC, nhiệt độ bắt cặp của mồi Ta< Tm khoảng 5oC với
Tm là nhiệt nóng chảy của mồi) và kéo dài (72oC) Tuỳ theo nồng độ DNA đích có trong mẫu mà xác định số lượng chu kỳ cần thực hiện, số lượng trình tự khuyếch đại càng nhiều nếu số chu kỳ càng tăng
Trang 231.4.2 Kỹ thuật giải trình tự [22]
Giải trình tự là xác định thứ tự sắp xếp của các nucleotide trên phân tử DNA Hai phương pháp chính trong xác định trình tự là phương pháp hóa học của Maxam và Gilbert (1977) và phương pháp enzzyme học của Sanger và cộng sự (1977) Nguyên tắc của phương pháp hóa học dựa vào các phản ứng hóa học thủy giải đặc hiệu phân
tử DNA, tạo thành một tập hợp nhiều phân đoạn có kích thước khác nhau Nguyên tắc enzyme học của Sanger dựa vào sự tổng hợp mạch bổ sung cho trình tự cần xác định nhờ DNA polymerase Với việc sử dụng thêm các dideoxynucleotide cùng các deoxynucleotide thông thường, kết quả tổng hợp cũng là sự hình thành một tập hợp nhiều đoạn DNA có kích thước khác nhau Ở cả hai trường hợp, các phân đoạn DNA sẽ được phân tách thông qua điện di trên gel polyacrylamide hay polymer trong các mao quản có khả năng phân tách hai đoạn DNA chỉ chênh lệch nhau một nucleotide Với phương pháp đánh dấu bằng đồng vị phóng xạ 32P và 35S, các vạch điện di được phát hiện bằng kỹ thuật xạ ký tự ghi, từ các vạch này giải được trình tự đoạn DNA mục tiêu
Các phòng thí nghiệm hiện nay thường dùng phương pháp giải trình tự bằng máy tự động, đây là phương pháp cải tiến của phương pháp Sanger Lúc này, ddNTP được đánh dấu bằng các phân tử phát huỳnh quang màu khác nhau và được chạy phản ứng PCR sau đó điện di trên gel polyacrylamide Các trình tự có độ dài nu khác nhau sẽ có khối lượng khác nhau và đi qua vị trí phát tín hiệu vào thời gian khác nhau dưới tác dụng của lực mao dẫn, kết quả được máy báo cáo tự động
1.5 NGHIÊN CỨU PHÁT SINH LOÀI
Nghiên cứu phát sinh loài là nghiên cứu về mối quan hệ tiến hóa của loài dựa vào phân tích sự khác biệt di truyền phân tử (DNA, RNA, protein) Phân tích phát sinh loài nghĩa là suy luận hoặc ước lượng các mối quan hệ tiến hóa đó Kết quả phân tích phả hệ phân tử thường được thể hiện qua một sơ đồ phân nhánh gọi là cây phả
hệ phân tử [29]
Bộ cơ sở dữ liệu phát sinh loài có thể chứa hàng trăm loài khác nhau, mỗi một loài
có thể có tỷ lệ đột biến thay đổi làm ảnh hưởng đến tiến hóa Đồng thời, có rất nhiều
mô hình tiến hóa và các phương pháp phân tích phát sinh chủng loài khác nhau Do
Trang 24đó, các phương pháp tối ưu cho phân tích phát sinh loài phụ thuộc vào bản chất của nghiên cứu và cơ sở dữ liệu sử dụng [21, 35, 36]
Các bước trong phân tích phát sinh loài [15]:
(1) Sắp gióng cột: xây dựng mô hình dữ liệu cục bộ và xử lý dữ liệu phát sinh loài
Bất kỳ thông tin sinh học nào có thể được sử dụng để suy ra các mối quan hệ tiến hóa giữa các loài được biết đến như là một marker thông tin phát sinh loài như DNA, RNA, protein,… Xác định các locus gen được bảo tồn (mã hóa hoặc không
mã hóa) là bước đầu tiên trong việc phân tích các mối quan hệ phát sinh loài Cả vùng gen mã hóa và không mã hóa đều có thể được sử dụng để phân tích các mối quan hệ phát sinh loài [39]
Dữ liệu trình tự phát sinh loài thường bao gồm nhiều trình tự được sắp gióng cột Vị trí dãy thẳng hàng để phân tích phát sinh loài đại diện cho một kết luận phát sinh loài ưu tiên bởi những vị trí này thể hiện sự liên quan hoặc tương đồng về mặt phả
hệ Các vùng trình tự có độ tương đồng cao và có chứa những thay đổi trong trạng thái đặc thù hữu ích cho việc phân tích phát sinh loài được thường được gọi là
“vùng thông tin” (informative sites)
Các bước trong việc sắp gióng cột bao gồm lựa chọn cách thức sắp gióng cột và khai thác dữ liệu phát sinh loài được thiết lập từ sự sắp xếp đó Các quy trình sau đó đòi hỏi phải xác định được những vùng không tương đồng và việc chèn/xóa các gap (còn gọi là indel, nghĩa là các khoảng trống) sẽ được quyết định theo phương pháp dựng cây Một quy trình sắp gióng cột điển hình thường áp dụng một chương trình tin sinh như CLUSTAL W, sau đó được hiệu chỉnh lại bằng tay và đưa vào một chương trình dựng cây Việc sắp gióng cột trình tự được khuyến khích thực hiện hoàn toàn bằng máy tính với lý do chỉnh sửa bằng tay là không rõ ràng, khách quan nhưng sau đó cần phải tự hiệu chỉnh lại bằng mắt bởi vì các thuật toán và các chương trình sắp gióng cột không được tối ưu để phù hợp cho sự phân tích phát sinh loài
Một số phương pháp sắp gióng cột nhiều trình tự trên máy tính thực hiện sắp gióng cột trình tự một cách chặt chẽ dựa trên thứ tự đầu vào mà không có bất kỳ xem xét
Trang 25nào về mối quan hệ của chúng Hiện nay đã có nhiều phương pháp sắp xếp theo một tiêu chí phát sinh loài rõ ràng - “cây định hướng” (guide tree), ví dụ như CLUSTAL
W, PileUp, ALIGN trong ProPack , những cây định hướng này được tạo ra trên cơ
sở sắp xếp trình tự theo từng cặp ban đầu Cây định hướng từ CLUSTAL W được định dạng như một tập tin cây PHYLIP và có thể được nhập vào nhiều chương trình
vẽ cây
Việc sắp gióng cột trình tự cũng làm thay đổi chiều dài trình tự, do đó, bộ dữ liệu phát sinh loài ban đầu thường không đồng nhất với bộ dữ liệu sau khi sắp gióng cột, ngay cả khi sắp gióng cột các trình tự có cùng chiều dài bởi nội dung bộ dữ liệu có thể khác nhau Trong trường hợp các trình tự có chiều dài không đồng nhất, mức độ khác biệt giữa bộ dữ liệu đã sắp thẳng hàng và bộ dữ liệu phát sinh loài ban đầu được xác định chủ yếu bởi những vùng sắp xếp không rõ ràng và việc xử lý indels Cách xử lý indels điển hình nhất là loại bỏ tất cả các vùng có gap, cách tiếp cận này
có lợi thế là cho phép tất cả các biến thể trong các trình tự được mô tả trong giới hạn của mô hình thay thế, mà không cần một mô hình đặc biệt để giải thích cho indel, nhưng phương pháp này cũng có nhược điểm là tín hiệu phát sinh loài chứa trong vùng indel cũng bị loại bỏ
Tóm lại, sắp gióng cột trình tự là phương pháp gần nhất để hiểu được mối quan hệ tiến hóa giữa các trình tự được kiểm tra, trừ khi các mối quan hệ phát sinh loài thực
tế được biết trước, không có cách nào để xác định rõ ràng phương thức nào là tốt nhất cho một phân tích phát sinh loài nhất định Khi thực hiện sắp gióng cột nhiều trình tự cho một phân tích phát sinh loài cần xem xét các điểm sau đây:
• Sắp gióng cột trình tự trong phân tích phát sinh loài là một trong những bước quan trọng nhất bởi bước này tạo ra những bộ dữ liệu mà trên đó mô hình của sự tiến hóa được sử dụng
• Dữ liệu sắp gióng cột thường được chỉnh sửa, xóa đi những vùng không thẳng hàng và chèn hoặc xóa khoảng trống để phản ánh chính xác hơn quá trình tiến hóa
có thể xảy ra dẫn đến sự phân hóa giữa các trình tự
Trang 26• Việc phân tích phát sinh loài dựa trên một chuỗi các sắp xếp được thay đổi một cách sơ lược được xem là hữu ích để xác định các vùng không tương đồng ảnh hưởng đến mức độ tin cậy của kết quả
(2) Xác định mô hình tiến hóa
Mô hình thay thế có ảnh hưởng đến kết quả sắp gióng cột cũng như xây dựng cây phát sinh loài, do đó, việc xác định mô hình thay thế cần được chú trọng Hiện nay
có hai yếu tố của mô hình thay thế có thể được đánh giá tính toán cho dữ liệu nucleotide, một yếu tố là các mô hình thay thế giữa các nu riêng biệt, yếu tố còn lại
là tỷ lệ tương đối của toàn bộ sự thay thế giữa các vùng khác biệt trong dãy trình tự Trong trường hợp của DNA, bốn loại chuyển tiếp (A → G, G → A, C → T, T → C) thường gặp hơn tám loại đảo chuyển (A → C, A → T, C → G, G → T, và ngược lại) Những khuynh hướng thay thế này sẽ ảnh hưởng đến sự phân kỳ được ước lượng giữa hai trình tự
Mô hình thay thế tốt nhất không phải luôn là mô hình có đầy đủ các thông số, ngược lại, càng ít thông số càng tốt bởi mỗi tham số ước lượng đều có phương sai liên quan, nhiều tham số được đưa vào sẽ làm tăng phương sai tổng thể Một chiến lược tốt để mô tả rõ mô hình thay thế cho các trình tự DNA là tính năng “mô tả cây” trong PAUP sử dụng khả năng ước tính đồng thời sáu tỷ lệ thay thế đảo nghịch, các tham số đặc trưng trong bảng phân phối gamma và tỷ lệ của các vùng bất biến Một mô hình duy nhất không thể kết hợp được tất cả các thông tin, do đó, lựa chọn
mô hình phù hợp nhất cho các trình tự được nghiên cứu nên được thực hiện trước khi phân tích Mô hình tiến hóa tốt nhất giải thích các dữ liệu trình tự quan sát có thể được suy ra bằng cách sử dụng phần mềm Model Test hoặc jModel Test Nó sử dụng ba tiêu chí khác nhau như một thước đo để suy ra mô hình phù hợp nhất, cụ thể là hLRT (hierarchical Likelihood Ratio Test), AIC (Akaike Information Content), hoặc BIC (Bayesian Information Content)
(3) Xây dựng cây phát sinh loài
Đề xây dựng cây phát sinh loài, các thuật toán được áp dụng để xác định cấu trúc địa hình học của cây và tính toán độ dài các nhánh (branch) sao cho mô tả được tốt nhất mối quan hệ phát sinh loài của các chuỗi trình tự đã sắp xếp trong bộ cơ sở dữ
Trang 27liệu Các phương pháp phổ biến nhất được áp dụng hiện nay bao gồm phương pháp khoảng cách, ví dụ như phương pháp Neighbor-Joining và phương pháp đặc tính, ví
dụ như phương pháp Maximum Parsimony và Maximum Likelihood [29]
Phương pháp khoảng cách: xác định số lượng sai khác giữa hai trình tự được sắp
gióng cột từ đó suy ra cây, khoảng cách tiến hóa này phụ thuộc vào mô hình tiến hóa được sử dụng Cây thực tế là cây sau khi tính toán từ ma trận của các giá trị khoảng cách bằng cách chạy một thuật toán phân nhóm bắt đầu với các trình tự tương đồng cao nhất (khoảng cách ngắn nhất) hoặc bằng cách cố gắng giảm thiểu tổng chiều dài các nhánh của cây Một phương pháp khoảng cách sẽ tái tạo lại cây đúng nếu tất cả các trường hợp phân kỳ di truyền được phản ánh chính xác trong trình tự Khoảng cách cặp được tính theo ước lượng xác suất tối đa của tỷ lệ thay thế Các chương trình dựng cây dựa trên khoảng cách phổ biến nhất có số lượng mô hình thay thế hạn chế, riêng chương trình PAUP 4,0 thực hiện đầy đủ một số mô hình, bao gồm cả các mô hình thực tế ước tính từ dữ liệu sử dụng phương pháp xác suất tối đa (maximum likelihood), cũng như phương pháp khoảng cách log-det Ưu điểm lớn nhất của phương pháp này là có thể sử dụng các mô hình tương tự của sự tiến hóa, nhược điểm là các dữ liệu đặc trưng thực tế bị loại bỏ Các phương pháp khoảng cách được áp dụng phổ biến nhất là phương pháp nhóm cặp không trọng số với số học trung bình (UPGMA), Neighbor-Joining (NJ),…
Neighbor-Joining: thuật toán neighbor-joining được áp dụng phổ biến đối với dựng
cây dựa trên khoảng cách và không phụ thuộc vào các tiêu chuẩn tối ưu hóa Thuật toán này làm việc theo phương pháp phân tách hình sao (Star decomposition), đầu tận cùng tương đồng nhất được nhập làm một sau đó một nhánh (branch) được chèn vào giữa chúng và phần còn lại của “ngôi sao” Giá trị của những nhánh mới được tổng hợp này được tính bằng trung bình của hai giá trị ban đầu
Nguyên tắc của phương pháp này là tìm ra thứ tự các cặp hàng xóm (neighbor) hợp
lý nhất làm giảm tổng chiều dài của cây tiến hóa, là một trong những phương pháp nhanh nhất để dò tìm cây tiến hóa nên thường được sử dụng để phân tích khối dữ liệu lớn với nhiều taxa Cây NJ là cây không gốc nên chỉ cho biết mối quan hệ giữa các nhánh
Trang 28Maximum Parsimony (hà tiện tối đa): giả định rằng cây tiến hóa tốt nhất là cây
ngắn nhất, có ít thay đổi nhất Nghĩa là phương pháp này tìm kiếm một cây sao cho
số lượng thay đổi tiến hóa là thấp nhất để giải thích những sự khác nhau được nhìn thấy qua các đơn vị phân loại hiện hữu, cách đơn giản nhất là tạo ra một bước ma trận trọng số, tuy nhiên, bước này làm tiêu tốn nhiều thời gian Cây tốt nhất là cây tính điểm thấp nhất nên phương pháp MP thường chọn cây có tổng chiều dài nhỏ nhất [29] Phương pháp MP làm việc không hiệu quả khi tỷ lệ giữa các vùng quan trọng không đồng nhất Phân tích MP mang lại rất nhiều cây có cùng số điểm bởi mỗi cây đều được thiết lập để được tối ưu như nhau, do đó, chỉ có những nhóm hiện diện trong vùng đồng nhất của tất cả các cây mới được coi là được hỗ trợ bởi dữ liệu
phân tích dựa trên một hàm toán học tính toán xác suất Phương pháp ML chọn lựa cây tiến hóa khi phân tích các dữ liệu dưới một mô hình nào đó có xác xuất tối đa Đây là phương pháp tiêu tốn nhiều thời gian nhưng lại cho kết quả đáng tin cậy nhất [29]
Trong thực tế, xác suất tối đa được tính toán chuyển hóa từ mỗi nu trong một trình
tự được sắp gióng cột Xác suất xảy ra của biến thể ở một vùng được tính theo mô hình được thiết lập bởi một quá trình thay thế đặc biệt cho ra một cây cụ thể và các tần số nu quan sát tổng thể Xác suất của từng vùng là tổng các xác suất của từng tái thiết có thể có theo một quy trình thay thế riêng Các xác suất của tất cả các vùng được nhân với nhau để đưa ra một xác xuất tổng của cây (tức là, xác suất của dữ liệu cho cây và quá trình thay thế) Đối với một cây cụ thể, xác suất của dữ liệu có thể là thấp tại một số vùng nhưng cao ở những vùng khác Đối với một cây được xem là tốt hơn khi có nhiều vùng có xác suất cao hơn dẫn đến xác suất sản phẩm cao hơn
Các mô hình tiến hóa nên được tối ưu hóa để phù hợp với những dữ liệu quan sát, một cây có thể đem lại xác suất cao nhất theo mô hình tiến hóa này nhưng cũng có thể đem lại xác suất thấp hơn nhiều với mô hình tiến hóa khác
(4) Đánh giá cây tiến hóa đã dựng [29, 39]
Trang 29Thuật toán xây dựng cây có thể tạo ra một hoặc nhiều cây tối ưu, do vậy, các cây được dựng phải được đánh giá để xác định được cây hợp lí nhất Phương pháp phổ biến để đánh giá cây là phân tích giá trị bootstrap
Phân tích bootstrap là một phương pháp thống kê thường dùng để kiểm tra độ tin
cậy của cây, cụ thể là đánh giá độ tin cậy của sự phân nhóm loài trên một cây dựa vào các trình tự nucleotide hay acid amin làm mẫu phụ Ưu điểm của phương pháp này là nó có thể áp dụng cho tất cả các phương pháp dựng cây cơ bản Phương pháp này được phát minh vào năm 1979 và giới thiệu như là một phương pháp đánh giá cây trong phân tích phát sinh loài của Felsenstein (1985)
Bootstrap là một quá trình hai bước bao gồm việc tạo ra (nhiều) bộ dữ liệu mới từ các thiết lập ban đầu và tính toán số lần mà một nhánh cụ thể (một đơn vị phân loại) xuất hiện trong cây Con số này thường được gọi là giá trị bootstrap Bộ dữ liệu mới được tạo ra từ các dữ liệu ban đầu được thiết lập bằng cách lấy mẫu các cột trạng thái ngẫu nhiên từ các dữ liệu ban đầu thiết lập với mỗi vùng có thể được lấy mẫu một lần nữa với xác suất tương tự vùng khác Như vậy, mỗi tập dữ liệu mới được tạo ra có cùng số tổng các vị trí như bộ dữ liệu ban đầu nhưng một số vị trí được nhân đôi hoặc nhân ba và một số khác bị mất Do đó, có thể thấy một số bộ dữ liệu mới được tạo ra hoàn toàn giống với bộ dữ liệu gốc hoặc hoặc hoàn toàn khác, chỉ một vùng được nhân lên Kết quả phân tích bootstrap thường là một chữ số liên kết với một nhánh cụ thể trong cây phát sinh loài, con số này cho phép tỷ lệ lặp lại (bootstrap) hỗ trợ các đơn ngành của nhánh
Bootstrap được coi là một biện pháp chính xác - một thông số sinh học phù hợp hơn nhằm xác định xác suất của sự phát sinh loài thực được phục hồi Trên cơ sở nghiên cứu mô phỏng, trong điều kiện thuận lợi (khoảng giá trị thay đổi thương đương nhau, các nhánh đối xứng), giá trị bootstrap lớn hơn 70% tương ứng với xác suất lớn hơn 95% trong thực tế các phát sinh học được tìm thấy Tương tự như vậy, trong điều kiện kém thuận lợi, giá trị bootstrap lớn hơn 50% sẽ được xem là chính xác Tuy nhiên, dưới những điều kiện nhất định, giá trị bootstrap cao có thể làm cho kết quả phát sinh loài sai giống như đúng, do đó, các điều kiện của phân tích phải được xem xét
Trang 30PHẦN 2 VẬT LIỆU VÀ
PHƯƠNG PHÁP
Trang 312.1 BỘ MẪU NẤM KÝ SINH CÔN TRÙNG
Mẫu nấm được phân lập và làm thuần từ các nấm ký sinh côn trùng tại vùng núi Langbiang tỉnh Lâm Đồng, thành phố Đà Lạt Do Đại Học Đà Lạt cung cấp, mẫu được ký hiệu là DL0038A, DL0038B, DL0069, DL0075
Hình 2.1 Hình thái giải phẫu mẫu nấm DL0038A
A Quả thể nấm DL0038A trong tự nhiên; B Kí chủ bị bao bọc bởi lớp sợi dày tạo
giả hạch màu trắng; C Thể chén nhô cao; D Hệ sợi phát triển trên môi trường Agar, màu vàng khi già; E Hệ sợi phân nhánh mạnh; F Thể bình; G Hình thành
bào tử đốt; H Bào tử đốt
Trang 32Hình 2.2 Hình thái giải phẫu mẫu nấm DL0038B
A Quả thể DL0038B còn non, được bao phủ bởi lớp bụi bào tử màu trắng, thể chén
chưa nhô lên khỏi bề mặt quả thể; B Hệ sợi phát triển trên môi trường PGA;
C,D Một số dạng bào tử vô tính; E Hệ sợi với nhiều cấu trúc thể bình
Hình 2.3 Hình thái giải phẫu nấm DL0069
A Mẫu nấm DL0069; B Thể chén; C,D Bào tử đính; E,F Thể bình
Trang 33Hình 2.4 Hình thái giải phẫu mẫu nấm DL0075
A Bào tử đính; B Vách ngăn trên hệ sợi; C Hệ sợi
- Máy vortex (Vortex ZX3, Velp Ý)
- Máy ly tâm lạnh (Hettich Universal 320R, Đức)
- Bộ điện di DNA (BioRad)
- Tủ lạnh (LG)
- Tủ đông (Sanyo)
- Tủ ủ nhiệt (Multitemp)
- Cân kỹ thuật (Satorious, Đức)
- Tủ tách chiết và tủ PCR (ESCO ADC-4B1)
- Máy quang phổ kế (Smart Spec, BioRad)
- Máy luân nhiệt ( My-Cycler Thermal, BioRad)
- Máy chụp ảnh gel (Gel Doc XR System, BioRad)
- Lò vi sóng (Sharp)
Trang 34Agarose 1,5 g (Bio Rad)
TBE 1X 100 ml (Bio Rad)
Ethidium bromide 1,7 µl (Bio Rad)
2.3 DANH MỤC CÁC PHẦN MỀM SỬ DỤNG
Annhyb: phiên bản 4.946 (Olivier Friard, 2012), phần mềm miễn phí giúp làm việc
và quản lý các trình tự nucleotide dưới nhiều định dạng
Clustalw2: phần mềm miễn phí (giao diện window) dùng cho việc so sánh sự tương
đồng của hai hay nhiều trình tự sinh học
Trang 35Sea View: phiên bản 4.2.12 (Manolo Gouy), phần mềm miễn phí có các tính năng
hỗ trợ cho các phân tích tương đồng, sắp gióng cột các trình tự
Chromas Lite: phiên bản 2.1.1, phần mềm miễn phí hỗ trợ cho hiệu chỉnh trình tự TreeView: phiên bản 1.6.6 (Roderic, 2001), phần mềm miễn phí dùng để xem và
hiệu chỉnh cây tiến hoá
MEGA: phiên bản 6.06 (Kumar, 2013), phần mềm miễn phí dùng để xây dựng cây
phát sinh loài theo các phương pháp Maximum Parsimony, Maximum Likelihood, Neighbor Joining
NCBI ( http://www.ncbi.nlm.nih.gov/ ): phần mềm trực tuyến dùng cho khai thác
thông tin
BLAST ( http://blast.ncbi.nlm.nih.gov/Blast.cgi ): phần mềm trực truyến với các
thông số mặc định sẵn trên NCBI nhằm đánh giá độ đặc hiệu của mồi hoặc đánh giá
độ tương đồng của trình tự
IDT analyzer ( https://sg.idtdna.com/calc/analyzer ): phần mềm trực tuyến giúp
xác định các thông số vật lý của mồi như chiều dài, %GC, nhiệt độ bắt cặp (Tm),
∆G,…
2.4 PHƯƠNG PHÁP NGHIÊN CỨU
2.4.1 Khảo sát In silico
2.4.1.1 Xây dựng cơ sở dữ liệu cục bộ
Tiến hành thu nhận trên GenBank (NCBI) 162 trình tự gen nrLSU và 142 trình tự gen Rpb1 của loài nấm ký sinh côn trùng thuộc họ Clavicipitaceae dựa trên các mã Accession tham khảo từ bài báo của Sung et al., 2007 Để đảm bảo tính đúng đắn,
các trình tự thu được phải có nguồn gốc rõ ràng (mã truy cập trên Genebank, tên loài, tên ngân hàng giống cung cấp)
Tất cả các trình tự này sẽ được sắp gióng cột bằng Clustalw2 hoặc Seaview nhằm đánh giá mức độ tương đồng của các trình tự tham vấn
Xây dựng cây phát sinh loài cục bộ dựa trên cơ sở dữ liệu cục bộ bằng phần mềm MEGA 6.06 (Kumar, 2013) bằng ba phương pháp Maximum Parsimony, Maximum Likelihood và Neighbor Joining, thiết lập bootstrap 1000 lần
Trang 36Đánh giá, nhận xét và so sánh kết quả giữa các cây dựng được và với cây phát sinh
loài đã công bố của nghiên cứu trước (Sung et al., 2007)
2.4.1.2 Đánh giá mồi
Trong đề tài này, cặp mồi CRPB1/RPB1Cr được sử dụng để khuếch đại vùng gen
Rpb1 và cặp mồi LR0R/LR5 được sử dụng để khuếch đại vùng gen nrLSU, đây là
những cặp mồi được sử dụng trong nghiên cứu phả hệ phân tử những năm gần đây
Bảng 2.1 Trình tự các mồi đánh giá trong đề tài
Tên Primer Trình tự (5‟ – 3‟) Tài liệu
Đánh giá độ đặc hiệu của mồi bằng phần mềm BLAST (NCBI)
Trình tự cặp mồi được sắp gióng cột với các trình tự của các loài trong chi
Cordyceps bằng phần mềm ClustalX hoặc Sea View nhằm kiểm tra lại tính đặc hiệu
của mồi, đồng thời xác định vị trí bắt cặp của mồi và dự đoán kích thước sản phẩm PCR
Kiểm tra lại vị trí bắt cặp và kích thước sản phẩm bằng cách phân tích cặp mồi với
trình tự của một loài cụ thể trong chi Cordyceps bằng phần mềm Annhyb
2.4.2 Thực nghiệm
Xây dựng quy trình thực nghiệm nhằm khuếch đại vùng gen nrLSU và Rpb1 của
các mẫu nấm ký sinh côn trùng
Trang 37Sơ đồ thực nghiệm:
2.4.2.1 Tách chiết DNA
Ly giải tế bào:
- Ly giải tế bào với lysis buffer:
Dùng que cấy vòng (vô trùng) lấy một phần hệ sợi nấm (khoảng 1,5g), tiến hành rửa mẫu và hòa tan mẫu trong eppendorf với 700 µl dung dịch lysis buffer (70 µl Tris-HCl pH 8 1M, 14 µl EDTA 0,5M, 140 µl SDS 10%, 140
µl NaCl 0,5M, 266 µl ddH2O, 70 µl Proteinase K 1mg/ml), đảo ống đều qua đêm ở nhiệt độ 65oC
- Ly giải tế bào với lysis buffer có bổ sung β-mercaptoethanol:
Dùng que cấy vòng (vô trùng) lấy một phần hệ sợi nấm (khoảng 1,5g), tiến hành rửa mẫu và hòa tan mẫu trong eppendorf với 700 µl dung dịch lysis buffer (70 µl Tris-HCl pH 8 1M, 14 µl EDTA 0,5M, 140 µl SDS 10%, 140
Mẫu nấm ký sinh côn trùng
Tách chiết DNA từ hệ sợi nấm
PCR khuếch đại vùng gen nrLSU và
Rpb1 với cặp mồi tương ứng
Xác định tên loài cho mẫu phân tíchPhân tích phát sinh loàiGiải trình tự sản phẩm PCR
Kết hợp với
kết quả định
danh sơ bộ
hình thái
Trang 38µl NaCl 0,5M, 7 µl β-mercaptoethanol 99,9%, 259 µl ddH2O, 70 µl Proteinase K 1mg/ml), đảo ống đều qua đêm ở nhiệt độ 65o
C
- Ly giải tế bào với lysis buffer có bổ sung β-mercaptoethanol, CTAB:
Dùng que cấy vòng (vô trùng) lấy một phần hệ sợi nấm (khoảng 1,5g), tiến hành rửa mẫu và hòa tan mẫu trong eppendorf với 700 µl dung dịch lysis buffer (70 µl Tris-HCl pH 8 1M, 392 µl NaCl 2,5 M, 140 µl CTAB 10%, 14
µl β-mercaptoethanol 99,9%, 14 µl ddH2O, 70 µl Proteinase K 1mg/ml), đảo ống đều qua đêm ở nhiệt độ 65oC
Tách chiết DNA:
Tiến hành ly tâm 13.000 vòng/phút trong 10 phút Loại bỏ phần cặn, thu dịch nổi
Bổ sung 700 µl dung dịch PCI, lắc đều và ly tâm 13.000 vòng/phút trong 10 phút, thu dịch nổi
Bổ sung 1 V chloroform, lắc đều và ly tâm 13.000 vòng/phút, thu dịch nổi
Bổ sung 1/10V dung dịch NaOAc 3 M, lắc đều Bổ sung 1 V isopropanol, lắc đều
và ủ ở nhiệt độ 4oC trong vòng 2 giờ
Ly tâm 13.000 vòng/phút trong 20 phút Loại bỏ dịch nổi, thu tủa
Bổ sung 1 ml ethanol 70o Ly tâm 13.000 vòng/phút trong 10 phút ở 4oC, loại dịch nổi
Loại bỏ ethanol và làm khô cặn tại 50oC Bổ sung 50 µl TE 1 X
Kiểm tra sản phẩm DNA đã tách chiết:
Kiểm tra nồng độ DNA bằng phương pháp đo mật độ quang ở bước sóng 260 và
280 nm Xác định độ tinh sạch thông qua tỷ số OD260/OD280
2.4.2.2 PCR và giải trình tự
Thành phần phản ứng PCR:
Mastermix 7,5 µl
Mồi xuôi 0,5 µl Mồi ngược 0,5 µl DNA 1 µl ddH2O 5,5 µl Tổng: 15 µl
Trang 39Phản ứng PCR sử dụng cặp mồi CRPB1 (mồi xuôi) / RPB1cR (mồi ngược) để
khuếch đại vùng gen Rpb1 và cặp mồi LR0R (mồi xuôi) / LR5 (mồi ngược) để khuếch đại vùng gen nrLSU
Bảng 2.2 Các thông số thiết lập cho chu kì nhiệt trong phản ứng PCR khuếch
đại vùng gen nrLSU và Rpb1
Giai đoạn Chuẩn bị
biến tính Biến tính
Mồi bắt cặp Kéo dài
Kéo dài cuối cùng Nhiệt độ (oC) 95 95 X 72 72
Thời gian 5 phút 30 giây 30 giây 2 phút 5 phút
Sử dụng phần mềm Sea View kiểm tra các sai lệch giữa hai kết quả giải trình tự từ mồi xuôi và mồi ngược Do kết quả giải trình tự được đọc theo hai chiều nên trước khi sắp gióng cột cần chuyển đổi lại kết quả mồi ngược (reverse + complement) Kết quả sắp gióng cột sẽ cho thấy các sai lệch giữa hai kết quả, cần phải kiểm tra và xác định lại base chính xác ở những vị trí sai lệch này dựa trên việc so sánh tín hiệu huỳnh quang của hai kết quả ngay tại vị trí sai lệch