BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN THAM GIA XÉT GIẢI THƯỞNG HỖ TRỢ ĐỊNH DANH CÁC LOÀI NẤM THUỘC CHI NẤM KÝ SINH CÔN TRÙNG DỰA TRÊN CƠ SỞ DỮ LIỆU PHẢ HỆ PHÂN TỬ
T ỔNG QUAN VỀ CÁC LOÀI NẤM KÝ SINH CÔN TRÙNG
Cordyceps là một chi nấm ký sinh trên côn trùng (Kobayashi, 1982; Spatafora và
Blackwell, 1993) thuộc họ Clavicipitaceae, ngành nấm túi Ascomycota Cordyceps sinensis là loài nấm đƣợc biết đến nhiều nhất trong nhóm này Ở Trung Quốc và Việt
Cordyceps sinensis, hay còn gọi là đông trùng hạ thảo, được nhận diện với hai hình thái đặc trưng theo mùa: mùa đông nấm-sâu trông như một con côn trùng, còn mùa hè nấm mọc chồi từ đầu sâu và nhô lên mặt đất trông như một loài thực vật Đây là một dược liệu quý có nhiều ứng dụng trong y dược Gần đây, nhiều nghiên cứu cho thấy không chỉ có Cordyceps sinensis mà nhiều loài khác thuộc chi Cordyceps và các họ hàng liên quan cũng mang lại tiềm năng ứng dụng cao trong y dược.
1.1: Cordyceps militaris, một loài trong nhóm nấm ký sinh côn trùng
Cordyceps nội ký sinh trên ấu trùng và cả trên cá thể trưởng thành của nhiều loài côn trùng khác nhau Quả thể nấm có dạng hình trụ, có thể phân nhánh hoặc có hình dạng phức tạp Sau khi xâm nhập vào cơ thể côn trùng, bào tử nấm nảy mầm và phát triển thành hệ sợi nấm; hệ sợi này xâm chiếm và thay thế các mô chủ và hình thành quả thể khi gặp điều kiện thích hợp Do vậy, quả thể của Cordyceps thường được tìm thấy trên xác nhộng hoặc ấu trùng của côn trùng sau một thời gian nhiễm nấm (Holiday & Clever, 2008)
Cordyceps sinh sôi nảy nở tốt trong các khu rừng ôn đới và nhiệt đới ẩm ƣớt
Nấm Cordyceps thường có nhiều thể vô tính, phân bố rộng ở châu Á, đặc biệt là Đông Á, ngoài ra còn xuất hiện ở châu Úc và một số nước ở châu Âu Về thành phần loài, đã phát hiện hơn 400 loài Cordyceps (Sung et al., 2007) Phần lớn công bố về thành phần loài của nhóm nấm này đến từ các quốc gia thuộc khu vực châu Á, nổi bật nhất là Thái Lan, Trung Quốc, Nhật Bản và Hàn Quốc Tuy nhiên, số liệu thống kê về thành phần loài của nhóm này vẫn còn nhiều mâu thuẫn.
1.1.3.1 Ứng dụng kiểm soát bệnh hại do côn trùng:
Cordyceps ký sinh trên côn trùng, cùng các chi họ hàng, trở thành thiên địch tự nhiên của nhiều loài côn trùng gây hại Vì vậy chúng được ứng dụng rộng rãi trong đấu tranh sinh học nhằm kiểm soát dịch hại và bảo vệ cây trồng Tại Việt Nam đã có một số ứng dụng đối với sâu hại lúa (Trần Văn Hai và cộng sự, 2006; Nguyễn Thị Lộc và cộng sự, 2002) Theo tổng hợp của Lê Tấn Hưng và cộng sự (2010), Cordyceps cho thấy tiềm năng lớn trong quản lý dịch hại ở nông nghiệp.
Đông trùng hạ thảo (Cordyceps sinensis) là một trong những dược liệu được biết đến sớm nhất và đã được sử dụng từ xa xưa trong y học cổ truyền ở nhiều nước châu Á, đặc biệt là Trung Quốc; tại Việt Nam cũng có lịch sử sử dụng lâu dài Dược liệu này có phạm vi ứng dụng rộng và cho tác dụng hiệu quả trên nhiều bệnh lý của con người như gan, thận, tim mạch, miễn dịch và thần kinh, đồng thời có hoạt tính kháng ung thư Các nghiên cứu cho thấy đông trùng hạ thảo có khả năng điều hòa đáp ứng miễn dịch (Kuo và các cộng sự, 1996), ức chế sự phát triển của tế bào ung thư (Bok và các cộng sự, 1999), và tăng cường chức năng gan (Manabe và các cộng sự), khẳng định tiềm năng của dược liệu này trong chăm sóc sức khỏe và hỗ trợ điều trị.
1996), thúc đẩy việc tiết ra các hormone tuyến thƣợng thận (Wang & cs 1998), giảm huyết áp và sự căng cơ (Chiou & cs 2000), điều hòa đường máu (Guo & Zhang 1995)…
Khi các nhà khoa học mở rộng nghiên cứu trên những loài nấm khác trong họ
Trong họ Clavicipitaceae, các kết quả cho thấy nhiều loài ngoài C sinensis cũng có những hoạt tính sinh học tương tự như C sinensis Điển hình là cordycepin — một chất có hoạt tính sinh học quan trọng của Cordyceps — được phân lập từ C militaris và có cấu trúc tương tự với cordycepin của C sinensis nhưng ở nồng độ cao hơn (Li & cs., 1995) Chất này còn được liên hệ với khả năng điều hòa miễn dịch, được ghi nhận ở C cicadae.
Các nghiên cứu của Weng và cộng sự (2002) và Paecilomyces japonica (Shin và cs., 2003) cho thấy khả năng kháng ung thư ở các chủng nấm khác nhau Alkali-soluble polysaccharide chiết từ C phioglossoides (Yanada, 1984) cho thấy khả năng kháng ung thư đáng kể, đồng thời hạn chế các yếu tố trung gian gây viêm bằng cách ngăn cản sự hoạt hoá NF-κB từ C pruinosa (Kim và cs., 2003) Bên cạnh đó, loài nấm này còn có tác dụng kháng Ca2+ và chống co thắt cơ tim (Furuya và cs., 1983) và có khả năng gây độc tế bào để chống tế bào ung thư của loài nấm này.
Paecilomyces tenuipes (Shim & cs, 2000; Ban & cs, 1998)
Active constituents of Cordyceps are typically nucleosides, polysaccharides, proteins, and sterols (Holliday & Cleaver, 2008) These bioactive compounds are usually isolated from either the fungal mycelium or the fruiting bodies, highlighting Cordyceps as a versatile source of extractable constituents for research and applications.
Các nucleoside đã đƣợc phân lập từ Cordyseps bao gồm adenin, adenosine, uracil, uridine, guanidine, guanosine, hypoxanthin, inosine, thymine, thymidine, deoxyuridine, đặc biệt là cordycepin (3’- deoxyadenosine) Cordycepin đƣợc nghiên
Hợp chất này được cho là có tác dụng kháng ung thư (Wang & cs., 2008), ngăn cản quá trình tổng hợp RNA của tế bào HeLa (Siev & cs., 1969), và ức chế tổng hợp protein cũng như sự bám dính tế bào (Wong & cs., 2010) Những bằng chứng này cho thấy hợp chất ảnh hưởng đến nhiều quá trình sinh học thiết yếu của tế bào ung thư và có tiềm năng làm nền tảng cho các nghiên cứu điều trị ung thư.
Cordyceps chứa các polysaccharide, hay các hợp chất đường, bao gồm d-mannitol (cordycepic acid), beta-glucan, beta-mannan và một số polysaccharide phức tạp liên kết nhiều loại đường khác nhau Những polysaccharide này được cho là có tác dụng chống ung thư một cách gián tiếp bằng cách kích hoạt các hệ thống miễn dịch của cơ thể thay vì tấn công trực tiếp tế bào ung thư (Wasser, 2002) Bên cạnh đó, chúng cũng có khả năng giảm lượng đường trong máu, hỗ trợ kiểm soát đường huyết (Kiho & cs., 2000).
Cordyceps contain several sterols, including ergosterol, delta-3-ergosterol, ergosterol peroxide, beta-sitosterol, daucosterol, and campesterol, with ergosterol present in fungal hyphae as a characteristic fungal sterol; notably, the glycosylated form of ergosterol peroxide exhibits antiproliferative activity against cancer cell lines such as K562, Jurkat, WM-1341, HL-60, and RPMI-8226 (Bok et al., 1998).
Cordyceps chứa các protein, peptide, polyamine, amino acid và một số dipeptide vòng có hoạt tính chống ung thư và tiềm năng miễn dịch Đặc biệt, cyclosporine — một loại peptide vòng được phân lập từ Tolypocladium inflatum (thể vô tính của Cordyceps subsessilis) — đã được sử dụng phổ biến như một chất ức chế miễn dịch hiệu quả cho các trường hợp cấy ghép vật liệu hoặc cơ quan.
NGHIÊN CỨU ĐỊNH DANH VÀ PHÁT SINH LOÀI
1.2.1 Đặc điểm nhận dạng và định danh:
Trước đây, việc định danh và xây dựng hệ thống học các loài nấm thuộc nhóm này chủ yếu dựa trên phân tích hình thái giải phẫu Các đặc điểm nhận biết họ Clavicipitaceae bao gồm thể túi dạng trụ, đỉnh túi dày và các bào tử túi dạng sợi có thể ngắt rời thành nhiều bào tử thứ cấp Năm 1982, Kobayashi dựa trên phân tích thông tin từ 282 loài Cordyceps, 59 loài Torrubiella và 75 loài thuộc các chi lân cận khác để xây dựng khóa định loại cho nhóm.
Khóa định loại này đến nay vẫn được xem là hữu hiệu nhất để định danh nhóm nấm Cordyceps và Torrubiella theo phương pháp cổ điển, dù còn tồn tại mâu thuẫn và một số đặc điểm chỉ dừng ở mức hạn chế Nấm tuy có cấu trúc đơn giản nhưng thành phần loài vô cùng phong phú và khả năng biến đổi cao theo điều kiện môi trường gây trở ngại trong việc định danh Những đặc điểm hình thái như màu sắc, kích thước và hình dáng quả thể của các cá thể khác nhau trong cùng một loài có thể biến đổi rất lớn, khiến nhận diện dựa trên hình thái gặp nhiều thách thức Một khó khăn khác là đặc điểm lưỡng danh của chúng Rất nhiều mẫu nấm thu được trong tự nhiên đang ở trạng thái thể vô tính (không có quả thể túi); sau khi mang về phòng thí nghiệm, chúng thường không hình thành quả thể vì các điều kiện nhân tạo không phù hợp Trong trường hợp Tolypocladium inflatum đã được biết đến từ những năm trước.
1970 nhƣng mãi đến năm 1996, Hodge và cs mới chứng minh đây là một thể vô tính của C subsessilis
Trong những năm gần đây, sinh học phân tử đã góp phần tích cực giải quyết những tồn tại về mối liên hệ giữa thể vô tính và hữu tính cũng như hệ thống phát sinh chủng loại của nhóm nấm Cordyceps Năm 2007, Sung và các cộng sự đã sắp xếp lại hệ thống phân loại nhóm nấm Cordyceps và họ Clavicipitaceae Theo tổng kết của nhóm tác giả, các loài trong họ Clavicipitaceae có thể hữu tính thuộc các chi khác nhau.
Metacordyceps, Hypocrella, Regiocrella và Torrubiella có thể chính là các loài có thể vô tính thuộc các chi Aschersonia, Metarhizium, Nomuraea, Paecilomyces, Pochonia,
Rotiferophthora and Verticillium are mentioned in relation to the Cordycipitaceae family, where the sexual (teleomorphic) forms of Cordyceps species can correspond to the asexual (anamorphic) forms of Beauveria, Engyodontium, Isaria, Lecanicillium, Mariannaea, Microhilum, and Simplicillium.
Within the family Ophiocordycipitaceae, species of Ophiocordyceps and Elaphocordyceps may represent the asexual states of several related genera, including Hirsutella, Haptocillium, Harposporium, Hymenostilbe, Paecilomyces, Paraisaria, Sorosporella, Syngliocladium, Tolypocladium, and Verticillium Because of this close relationship, research on the Cordyceps group should concurrently consider these related genera to accurately resolve their taxonomy, phylogeny, and ecological roles.
1.2.2 DNA ribosome và trình tự ITS trong định danh phân tử nấm: Định danh phân tử là một trong các phương pháp phân loại sinh vật, sử dụng dữ liệu là các trình tự DNA để phân tích Trong nghiên cứu định danh phân tử, việc lựa chọn vùng trình tự DNA để khảo sát giữa các loài là một bước quan trọng, trình tự này cần đảm bảo tính bảo tồn cao trong cùng một loài nhƣng biến động lớn giữa các loài gene mã hoá cho RNA ribosome (DNA ribosome, rDNA) đã đƣợc sử dụng phổ biến để nghiên cứu trong nhiều năm gần đây
RNA ribosome là một trong hai thành phần chính của ribosome Tiểu phần nhỏ của ribosome chứa 18S RNA, tiểu phần lớn chứa 28S, 5.85S và 5S RNA ribosome đƣợc phiên mã từ DNA ribosome DNA ribosome bao gồm nhiều đơn vị lặp lại, mỗi đơn vị lặp lại bao gồm vùng ITS (internal transcribed spacer), vùng 18S, 5.8S, 25- 28S, 5S RNA và vùng IGS (intergenic spacer) (Hình 1.2) Vùng IGS bao gồm phần ETS (external transcribed spacer) và phần không phiên mã NTS (non-transcribed spacer)
Một đơn vị lặp lại bao gồm vùng IGS2-18S (SSU)-ITS1-5.8S-28S (LSU)-IGS1- 5S-IGS2 Trong đó vùng 18S-28S là vùng phiên mã chính (Vilgalys, 2004)
Vùng ITS phân cách vùng 5.8S với hai vùng 18S và 28S có độ dài khoảng 600–700 bp Giống như ETS, ITS được phiên mã nhưng không tham gia chức năng; ITS và ETS tồn tại ở giai đoạn tiền rRNA và sẽ bị loại bỏ trong suốt quá trình trưởng thành của RNA Do ITS không tham gia vào quá trình dịch mã nên các giá trị trình tự ITS đã chưa được khám phá nhiều trước đây Để thu nhận trình tự ITS cho phân tích, vùng ITS1-5.8S-ITS2 có thể được đọc bằng một cặp mồi phổ quát (universal primer), được thiết kế dựa trên các vùng bảo tồn cao của 18S SSU và 28S LSU để áp dụng cho tất cả các loài cần khảo sát Năm 1990, White và cộng sự đã đề nghị một số cặp mồi để khuếch mồi, cho phép thu được lượng lớn các đoạn DNA cần khảo sát, tạo lợi thế cho trình tự ITS.
Trong khi các trình tự mã hóa cho rRNA có tính bảo tồn cao, phù hợp cho các nghiên cứu ở cấp họ hay xa hơn, thì trình tự ITS được sử dụng phổ biến cho các nghiên cứu ở mức loài và dưới loài (Park & cs., 2001) Vùng ITS được cho là rất biến động, sự khác biệt giữa hai loài trong một chi đủ để nhận biết Ví dụ như Aspergillus brasiliensis (Varga & cs., 2007) được tách riêng thành loài mới từ một số chủng của Aspergillus niger, do vậy sự khác biệt giữa hai loài này là rất thấp Phân tích dựa trên kiểu hình giữa các chủng A niger gặp nhiều khó khăn bởi sự kém đa dạng các đặc điểm hình thái hay sự thay đổi kiểu hình bởi điều kiện môi trường Việc phân tích dựa trên trình tự D2 LSU của rDNA không tìm được sự khác biệt Đến khi Houseknecht và cs sử dụng trình tự ITS, kết quả cho thấy có 5 vị trí khác biệt trong vùng ITS1-5.8S-ITS2 giữa hai loài này.
1.3: Sơ đồ vị trí các mồi để khuếch đại vùng trình tự 18S SSU – ITS1-5.8S-
Một số công trình nghiên cứu sử dụng trình tự ITS ở Cordyceps để khảo sát sự tiến hoá nhƣ:
Vào năm 1997, Sung và cộng sự phân tích các kiểu isozyme và RFLP để phân loại ở mức loài, tuy nhiên phương pháp này không thể dùng cho các phân tích dưới loài Đến năm 1999, Chen và cộng sự đã sử dụng kỹ thuật RAPD để nghiên cứu sự biến đổi di truyền của C sinensis ở các vùng địa lý khác nhau trên cao nguyên Thanh Hải – Tây Tạng; cùng năm đó, Sung và cộng sự tiến hành phương pháp tương tự với C militaris ở bảy vùng khác nhau của Hàn Quốc và sử dụng rDNA để phân tích các biến đổi di truyền do điều kiện địa lý khác nhau.
− Một trường hợp khác ở Cordyceps sobolifera –một loài nấm ký sinh trên ve sầu Trước năm 1975 rất nhiều tranh cãi về thể vô tính của loài nấm này Petch
Isaria siclairii (cũng được gọi với một số tên khác như Isaria cicadae - Miquel, Cordyceps sinclairii - Berk.) được cho là thể vô tính của Cordyceps sobolifera; Samson (1974) lại xếp các Isaria vào nhóm Paecilomyces, do đó tên I cicadae đã được chuyển thành P cicadae Năm 1975, Sing cho rằng một Isaria sp là thể vô tính của C sobolifera, Mains (1951) cũng cho I cicadae là một thể vô tính Việc này đã được giải quyết khi Liu và các cộng sự.
Trong nghiên cứu năm 2001, người ta khảo sát đặc điểm hình thái của thể vô tính của loài này bằng kính hiển vi điện tử quét và dựa trên phân tích trình tự ITS-rDNA từ cả mẫu quả thể tươi lẫn mẫu hệ sợi nấm Kết quả cho thấy Beauveria sobolifera chính là thể vô tính của C sobolifera, xác định mối liên hệ di truyền giữa hai dạng sinh học và cung cấp căn cứ nhận diện loài một cách rõ ràng để phục vụ các nghiên cứu về đặc điểm sinh học và phân loại nấm.
Trong thiết lập cây phát sinh loài dựa trên trình tự ITS nrDNA, nghiên cứu của Stensrud và cộng sự (2005) về chi Cordyceps cho thấy ITS mang lại nhiều thành công, mục tiêu là xác định các hướng tiến hóa chính của chi nấm dựa trên số lượng mẫu lớn trên toàn thế giới và kiểm chứng lại hệ thống phân loại cũ để đề nghị một cây phân loại mới Trong 99 mẫu nấm thu thập được, 74 mẫu được xác định và các mẫu nghi ngờ bị loại trước khi xây dựng cây phát sinh Dựa trên phân tích trình tự ITS nrDNA, ba nhánh con đã được thiết lập là nhánh II, nhánh III và nhánh IV Việc sắp xếp lại các ma trận của nhánh II, III và IV được thực hiện theo phương pháp parsimony (MP) với thuật toán heuristics; đối với nhánh II và III, thêm phương pháp branch-and-bound với 1000 lần lặp lại Giá trị bootstrap tương đối cao và ổn định, thể hiện độ tin cậy cho từng nhánh tiến hóa (hình 1.4).
1.4: Sơ đồ các nhóm phân loại cùng giá trị bootstrap trong công trình của
Vào năm 2005, Kuo và các cộng sự đã phân tích trình tự ITS1, 5,8S rDNA và ITS2 của 17 loài Cordyceps được phân lập, phát hiện sự biến động rõ ràng có thể phân biệt các chủng khác nhau Tỷ lệ tương đồng dựa trên ITS (ITS1, 5.8S rDNA và ITS2) giữa các chủng Cordyceps dao động từ 75% đến 99,8%, mức độ này được đánh giá là tối ưu cho việc xây dựng phả hệ Dựa trên kết quả này, nhóm tác giả kết hợp các thuật toán heuristic và phương pháp branch-swapping để thiết lập cây phân loại tối ưu, với các nhánh cây cho thấy bootstrap (lặp lại từ 1000 lần) rất đáng tin cậy Ngoài ra, họ còn sử dụng PCR-SSCP (single strand conformation polymorphism) để phân tích sự khác biệt giữa các loài và các isolates thông qua trình tự ITS2.
1.5: Phần trăm mức độ tương đồng vùng ITS1-5.8S-ITS2 của 17 mẫu
Cordyceps trong công trình của Kuo & cs., 2005
Theo các kết quả nghiên cứu, việc sử dụng trình tự ITS để định danh và phân tích sự phát sinh loài thuộc chi Cordyceps tại Việt Nam là một lựa chọn ban đầu hợp lý, đặc biệt khi nguồn kinh phí eo hẹp và cần tối ưu hóa nguồn lực nghiên cứu.
TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC
Ở Việt Nam, các nghiên cứu về thành phần loài của nấm ký sinh côn trùng vẫn chưa được quan tâm đúng mức, dẫn đến thiếu hụt dữ liệu về đa dạng loài và phân bố chúng trên lãnh thổ Do đó, cho đến nay chưa có một công bố đầy đủ nào về các loài nấm ký sinh côn trùng ở nước ta, gây hạn chế cho việc đánh giá tiềm năng ứng dụng nấm ký sinh côn trùng trong kiểm soát dịch hại và phát triển nông nghiệp sinh học Việc tăng cường nghiên cứu về thành phần loài của nấm ký sinh côn trùng sẽ đóng vai trò then chốt trong việc xây dựng các biện pháp quản lý sinh học hiệu quả và an ninh lương thực tại Việt Nam.
Thiếu thông tin về thành phần loài làm giảm khả năng khai thác các loài nấm trong nước phục vụ nghiên cứu và sản xuất dược liệu, tạo ra nhiều trở ngại cho các dự án ứng dụng nấm trong nước Việc thiếu dữ liệu về đa dạng loài và đặc tính sinh học của nấm khiến quá trình xác định loài, xây dựng quy trình nuôi trồng và tối ưu hóa điều kiện sản xuất gặp khó khăn Vì vậy, bổ sung thông tin về thành phần loài và đặc tính của nấm là yếu tố then chốt để nâng cao hiệu quả nghiên cứu, ứng dụng trong nước và phát triển chu trình nuôi trồng nấm cũng như sản xuất dược liệu an toàn và chất lượng.
Vào năm 2005, Phạm Thị Vượng (Viện Bảo vệ Thực vật) và Lương Văn Hà (Vườn quốc gia Cúc Phương), cùng các nhà nấm học từ trường Đại học Quốc gia Kangwon, Hàn Quốc, đã tiến hành điều tra nhóm nấm ký sinh côn trùng tại vườn quốc gia Cúc Phương Nghiên cứu áp dụng phương pháp so sánh hình thái giải phẫu để phân loại các loài Kết quả được công bố cho thấy sự hiện diện của các loài Cordyceps sp., C nutans, C pruinosa và C specocephala.
Trong các mẫu nấm được phân tích, định danh sơ bộ dựa trên hình thái theo hệ thống phân loại mới cho thấy có tổng cộng 41 loài được ghi nhận thuộc 17 chi khác nhau, bao gồm Akanthomyces, Aschersonia, cùng với các chi như Beauveria (gồm B bassiana và các Beauveria sp.), Gibellalus sp và Paecilomyces sp Những kết quả này cho thấy sự đa dạng phong phú của mẫu nấm và nhấn mạnh vai trò của nhận diện hình thái ở giai đoạn sơ khởi trước khi tiến hành xác nhận phân tử.
Beauveria, Conoideocrella, Cordyceps, Gibellula, Hirsutella, Hymenostilbe, Hypocrella, Isaria, Metarhizium, Moelleriella, Nomuraea, Ophiocordyceps, Paecilomyces, Torrubiella, and Verticillium are genera commonly discussed in studies of entomopathogenic fungi; however, among these, only one Cordyceps species and two Ophiocordyceps species have been documented, according to Le Tan Huong et al.
KỸ THUẬT GIẢI TRÌNH TỰ
Giải trình tự DNA, dù mới được nghiên cứu từ thập niên 70 của thế kỉ XX, là kỹ thuật xác định trình tự nucleic acid của phân tử DNA Với các ứng dụng rộng rãi, nó đặc biệt đóng vai trò trong dự đoán chức năng gene, nghiên cứu nhân dòng phân tử và các mối liên hệ tiến hóa, đồng thời đẩy mạnh khai thác đa dạng sinh học cho công nghệ sinh học phân tử và công nghệ sinh học nói chung.
Với sự phát triển nhanh chóng của các kỹ thuật giải trình tự, các dự án giải mã bộ gene sinh vật, đặc biệt là dự án Bộ gene người được triển khai từ năm 1990 đã được hoàn thành trước thời gian dự kiến (năm 2000, sớm hơn 5 năm) Thành tựu này không chỉ tiết kiệm thời gian và chi phí cho nghiên cứu di truyền mà còn mang lại một lượng dữ liệu trình tự gene khổng lồ về con người và nhiều sinh vật khác, mở ra nhiều cơ hội cho lĩnh vực sinh học phân tử và y học Nhờ lượng dữ liệu phong phú này, các nhà khoa học có cơ sở để phân tích chức năng của các gene, biến thể di truyền và mối liên hệ của chúng với sức khỏe và bệnh tật.
Xác định trình tự một đoạn DNA không chỉ là bước then chốt trong chiến lược giải mã toàn bộ gene mà còn có nhiều ứng dụng quan trọng trong các nghiên cứu khác, từ định danh phân tử đến phân tích phát sinh loài Trong lĩnh vực định danh phân tử và nghiên cứu phát sinh loài, chỉ cần phân tích và xác định trình tự của một vùng biến động giữa các loài, không cần xác định toàn bộ bộ gene Từ hai phương pháp giải trình tự cổ điển là phương pháp hoá học Maxam–Gilbert và phương pháp chuỗi tổng hợp kết thúc bằng dideoxynucleotide của Sanger (1977), các kỹ thuật giải trình tự đã liên tục được cải tiến cho đến ngày nay Mặc dù có nhiều khác biệt giữa các phương pháp, nguyên lý cơ bản vẫn là thực hiện các phản ứng dùng hoá chất hoặc enzyme để tạo ra tập hợp các đoạn oligonucleotide có chiều dài khác nhau, sao cho nucleotide ở đầu/cuối các đoạn có thể nhận diện được, từ đó xác định trình tự dựa trên tín hiệu huỳnh quang hoặc tín hiệu quang học Các đoạn oligonucleotide sau đó được tách riêng bằng điện di trên gel polyacrylamide hoặc điện di mao quản (capillary electrophoresis), và trình tự DNA được suy ra từ các tín hiệu thu được.
1.4.1 Phương pháp Maxam – Gilbert: Đây là phương pháp sử dụng các tác nhân hoá học nhằm biến đổi các base xác định (mỗi chất đƣợc tiến hành trong một phân đoạn riêng) và cắt phân tử DNA đã đƣợc đánh dấu phóng xạ một đầu tại những vị trí đó (Bảng 1.1) Tổ hợp các đoạn oligonucleotide có kích thước khác nhau sau khi cắt được điện di trên gel có độ phân giải cao (gel polyacrylamide), từ đó xác định vị trí của nucleotide đã đánh dấu trên phân tử DNA Trình tự DNA hoàn chỉnh thu đƣợc sau khi tổng hợp kết quả tất cả các phân đoạn Để đọc kết quả trên bản phóng xạ tự ghi, đoạn DNA cần đƣợc đánh dấu một đầu (3’ hoặc 5’) bằng phóng xạ 32 P Cả DNA mạch đôi hay mạch đơn đều có thể đƣợc giải trình tự theo phương pháp này, tuy nhiên cần đảm bảo chỉ một mạch được đánh dấu phóng xạ để đảm bảo kết quả đọc trình tự sau này
1.1: Các phản ứng và tác nhân hoá học đƣợc sử dụng để tách các base một cách chuyên biệt trong phương pháp Maxam-Gilbert
Tác nhân tách rời base đã biến đổi
Tác nhân cắt mạch DNA
Chi tiết thí nghiệm R1 G>A Dimethylsulphate Xử lý nhiệt ở pH=7
R11 G Methylene blue Piperidine Piperidine Friedman,
Bốn phản ứng đầu được sử dụng trong thí nghiệm nguyên thuỷ của Maxam, Gilber
Trong bối cảnh giải trình tự DNA, các phản ứng R5–R8 được xem là những cải tiến sau này nhằm tối ưu hóa hiệu suất và độ chính xác Phản ứng R9 đóng vai trò thay thế cho R6 để tăng cường phân tách adenine Dấu '>' thể hiện base có tác động ưu thế hơn, giúp xác định trạng thái ưu tiên trong bước giải trình tự (Theo J Hindley – DNA Sequencing). -**Support Pollinations.AI:** -🌸 **Ad** 🌸Powered by Pollinations.AI free text APIs [Support our mission](https://pollinations.ai/redirect/kofi) to keep AI accessible for everyone.
1.4.2 Phương pháp Sanger hay dideoxynucleotide:
Nguyên lý của phương pháp này là tổng hợp mạch bổ sung in vitro cho một DNA mạch đơn, do DNA polymerase không có hoạt tính sửa sai thực hiện.
Trong công bố năm 1975, Sanger và Coulson đề xuất phương pháp “plus and minus” dựa trên một cách tiếp cận hai phản ứng đồng thời: bỏ đi một loại nucleotide (minus) hoặc chỉ dùng một loại nucleotide cho quá trình kéo dài mạch (plus) Về sau, dideoxynucleotide (ddNTP) được phát minh và Sanger đã ứng dụng ddNTP vào kỹ thuật giải trình tự DNA, mở ra một phương pháp giải trình tự chuỗi dựa trên việc ngắt chuỗi tại các vị trí xác định và hình thành kỹ thuật giải trình tự nổi tiếng của Sanger trong nghiên cứu di truyền và sinh học phân tử.
Phương pháp dideoxynucleotide (ddNTP) kết hợp với dNTP thông thường làm cho quá trình tổng hợp DNA dừng lại khi ddNTP được lắp vào mạch bổ sung Bốn loại ddNTP được tiến hành độc lập ở bốn phân đoạn riêng, và trong mỗi phân đoạn sẽ có một loại dNTP được đánh dấu phóng xạ để nhận biết mạch bổ sung Kết quả là các đoạn oligonucleotide kết thúc bằng cùng một loại ddNTP Những đoạn này được điện di trên gel polyacrylamide và kết quả được đọc trên bản phóng xạ tự ghi để xác định trình tự nucleotide.
Để xác định trình tự DNA bằng phage M13, cần một mẫu DNA ở dạng chuỗi đơn làm nền; vì phương pháp này đòi hỏi một dây DNA chuỗi đơn nên trước khi tiến hành đoạn DNA cần được chuẩn bị để tạo dòng với vector mạch đơn như phage M13 (phương pháp Sanger năm 1977 từng sử dụng φX174) Về sau, vector M13 được thay thế bằng plasmid vector ở dạng chuỗi đơn hoặc bằng phagemid.
1.6: Nguyên lý của phương pháp dideoxynucleotide
Trong quá trình tổng hợp DNA cho phân tích trình tự, một trong bốn loại dNTP được đánh dấu phóng xạ và được bổ sung cùng với một loại ddNTP (ddTTP) Quá trình tổng hợp sẽ dừng lại khi ddTTP được đưa vào chuỗi vì ddNTP thiếu nhóm 3'-OH cần thiết cho sự mở rộng Bốn loại ddNTP (ddATP, ddTTP, ddCTP và ddGTP) được thực hiện ở bốn phân đoạn riêng biệt để tạo ra các đoạn ngắn có đầu cuối khác nhau, phục vụ cho phân tích trình tự thông qua kỹ thuật Sanger.
− Dideoxynucleotide: là những nucleotide mà nhóm 3’-OH đƣợc thay thế bằng
Quá trình tổng hợp DNA dừng lại khi chuỗi không còn nhóm 3'-hydroxyl để gắn nucleotide kế tiếp Trong phương pháp này, ddNTP hiện diện cùng với một lượng lớn dNTP tự nhiên khiến quá trình tổng hợp dừng ở nhiều vị trí khác nhau và tạo ra các oligonucleotide có độ dài đa dạng để có thể đọc kết quả sau này Trước khi tổng hợp dừng do ddNTP, một số dNTP đã được sử dụng trước, sinh ra tập hợp các chuỗi oligonucleotide có kích thước khác nhau, giúp quy trình đọc kết quả trở nên khả thi.
Dù DNA polymerase không phân biệt được dNTP và ddNTP, các hoạt tính exonuclease 5′-3′ và 3′-5′ vẫn có khả năng ảnh hưởng đến kết quả giải trình tự DNA Trong phương pháp giải trình tự cổ điển, người ta sử dụng Klenow fragment của DNA polymerase I, và sau đó Sequenase dần được dùng thay cho Klenow để nâng cao hiệu suất và độ tin cậy của quá trình giải trình tự.
1.4.3 Những phương pháp cải tiến của phương pháp Sanger:
Phương pháp Sanger được sử dụng phổ biến nhờ tính đơn giản và độ tin cậy khi xác định trình tự DNA Sau thời kỳ ban đầu, nhiều cải tiến từ phương pháp Sanger nguyên thủy đã được đề xuất để nâng cao hiệu quả và phạm vi ứng dụng Ngoài các cải tiến đã đề cập ở phần trước như thay đổi việc sử dụng DNA polymerase và các vector tạo dòng, các phương pháp không dùng chất phóng xạ cũng được phát triển nhằm giảm thiểu nguy cơ tác động đến sức khỏe và môi trường.
1.4.3.1 Phương pháp Promega’s Silver Sequence:
Phương pháp thay thế đánh dấu phóng xạ bằng cách sử dụng bạc (Ag) để nhuộm mẫu và chụp bằng phim Kodak EDF được trình bày như một giải pháp an toàn và tiết kiệm, nhưng hiệu quả vẫn thấp hơn so với đánh dấu phóng xạ và yêu cầu thời gian chuẩn bị kéo dài.
1.4.3.2 Phương pháp giải trình tự bằng máy tự động:
Phương pháp này đang được sử dụng phổ biến trong việc giải trình tự hiện nay
Cơ sở của các phương pháp này vẫn dựa trên ddNTP (dideoxynucleotide) Thay cho đánh dấu phóng xạ, các ddNTP hoặc mồi (primer) được gắn nhãn huỳnh quang, và kết quả thu được được đọc bằng một hệ thống máy tính để phân tích tín hiệu.
HIỆU CHỈNH TRÌNH TỰ (PROOFREADING)
Quá trình xác định trình tự được thực hiện bằng hệ thống máy tự động (ví dụ ABI), nhưng dữ liệu sau xác định chưa thể dùng ngay cho phân tích Việc đọc base tự động do các máy thực hiện (automated base-calling) có một tỷ lệ sai sót nhất định, tùy thuộc vào phương pháp và loại máy sử dụng, như được thể hiện ở Hình 1.7.
1.7: Tỷ lệ các kiểu sai sót khi giải trình tự tự động bằng phương pháp đánh dấu huỳnh quang trên mồi giữa hai cách đọc base tự động Phred (màu xám) và
ABI (màu đen) (Ewing và cs, 1998)
Sự sai sót này xảy ra bởi cường độ tín hiệu huỳnh quang thu được không phải lúc nào cũng rõ ràng Khoảng cách không đồng đều giữa các mũi tín hiệu cũng nhƣ sự chồng lắp các tín hiệu dẫn đến việc máy tính nhận và hiển thị sai kết quả Hiện tƣợng này xảy ra do nhiều nguyên nhân nhƣ bản chất của trình tự khảo sát, sự nhiễm các mẫu DNA khi thực hiện, thao tác và loại phương pháp giải trình tự sử dụng…
Mặc dù những cải tiến về mặt kỹ thuật và thuật toán nhằm cải thiện độ chính xác trong việc đọc các base của máy đang đƣợc nghiên cứu tích cực, tuy nhiên tỷ lệ sai sót vẫn có thể xảy ra và khó có thể đọc chính xác tuyệt đối bằng phương pháp tự động Khi một base bị đọc sai có thể dẫn đến nhiều sai lầm nghiêm trọng trong việc phân tích sau này Do vậy, những biện pháp hiệu chỉnh lại trình tự cần được chính con người trực tiếp thực hiện nhằm khắc phục tối đa việc xác định sai base (Ewing và cs, 1998)
NGHIÊN CỨU SỰ PHÁT SINH LOÀI
Nghiên cứu phát sinh loài là một lĩnh vực đã được tìm hiểu từ hàng thế kỷ, bởi các sự kiện tiến hóa gây phân ly loài có thể đã diễn ra từ hàng triệu năm trước nên một cây phát sinh loài đúng có thể vẫn chưa xác định được hoàn toàn Do đó, các nhà hệ thống học luôn áp dụng các phương pháp có độ tin cậy cao để mô phỏng và suy luận cây tiến hóa chính xác nhất có thể từ dữ liệu sinh học Trong những năm trước đây, thiếu tiêu chuẩn khách quan và công cụ hỗ trợ khiến việc xây dựng các mô hình này gặp nhiều khó khăn Các nghiên cứu thường tập trung xem xét các vấn đề về định nghĩa loài, sự hình thành loài mới mà ít quan tâm đến vấn đề phát sinh loài Từ những năm 1950, nỗ lực xây dựng nền tảng kiến thức, tiêu chuẩn khách quan cũng như các phương pháp phân tích đã được nghiên cứu không ngừng Ngày nay, việc nghiên cứu phát sinh chủng loài không chỉ dừng lại ở mô tả và định danh mà còn góp phần giải thích các quá trình sinh học diễn ra trong tế bào, cơ thể sống hay mối quan hệ giữa các nhóm loài với nhau (theo David W Mount, 2008).
Những thành tựu của sinh học phân tử vào thập niên 1960 và sự hỗ trợ của máy tính trong phân tích dữ liệu đã đẩy nhanh nghiên cứu phát sinh loài Các kỹ thuật mới như PCR, lai DNA-DNA, RAPD và DNA fingerprinting được ứng dụng rộng rãi, mở ra những cách tiếp cận mới để khảo sát mối quan hệ tiến hóa và biến đổi di truyền giữa các loài Bên cạnh đó, các kỹ thuật cổ điển như điện di và di truyền học tế bào vẫn tiếp tục được sử dụng làm nền tảng cho các phân tích phát sinh loài Hiện nay để xây dựng một mô hình phát sinh loài chính xác, cần kết hợp đồng bộ nhiều công cụ lại với nhau Với sự kết hợp này, các kết quả có độ tin cậy cao ngày càng gia tăng, tạo điều kiện kiểm chứng cả những giả thuyết phát sinh loài mới lẫn các giả thuyết đã có.
Một trong các mục tiêu xây dựng cây phát sinh chủng loài dựa trên trình tự phân tử là tái hiện lịch sử tiến hoá của các loài; nếu phân tích chỉ dựa trên một gene duy nhất, cây phát sinh sẽ chỉ là cây phát sinh gene và mô tả tiến hoá của gene hoặc protein đó mà không phản ánh toàn bộ sự tiến hóa của loài, vì quá trình tiến hoá diễn ra ở nhiều gene thuộc nhiều họ gene khác nhau Thêm vào đó, một vấn đề thường gặp trong nghiên cứu phát sinh loài dựa trên dữ liệu phân tử là sự mâu thuẫn với dữ liệu hình thái học, và để giải quyết mâu thuẫn này cần xem xét khi nào đặc tính hình thái hay đặc tính phân tử phù hợp với vấn đề nghiên cứu và đảm bảo dữ liệu sau khi phân tích tương thích với các dữ liệu khác có cùng quan hệ tiến hoá Để có một nghiên cứu phát sinh loài đầy đủ và tin cậy, cần thực hiện những bước cơ bản phù hợp với mục tiêu và dữ liệu, như lựa chọn dữ liệu phân tử đa nguồn, tiến hành phân tích cây phát sinh và kiểm tra tính nhất quán với dữ liệu hình thái cũng như các thông tin liên quan.
Chọn lựa dữ liệu và lấy mẫu đại diện:
Trong phân tích phát sinh loài, nếu mục tiêu là nghiên cứu trên một họ gene thì việc chọn dữ liệu tương đối dễ dàng; tuy nhiên khi quan tâm đến sự phát sinh loài của một nhóm sinh vật, việc lựa chọn dữ liệu có thể mở rộng bằng cách kết hợp nhiều gene hoặc nhiều vùng DNA khác nhau Với những loài được cho là có quan hệ gần nhau, người ta thường chọn những gene hoặc vùng DNA có mức độ biến động cao như intron hoặc ITS; ngược lại, với nhóm sinh vật có quan hệ xa hơn, người ta ưu tiên những gene hoặc vùng DNA có mức độ bảo tồn cao, ví dụ LSU rDNA hoặc các gene mã hóa protein Nếu chọn gene quá bảo tồn hoặc quá biến đổi, kết quả cuối cùng có thể bị ảnh hưởng; vì vậy khuynh hướng hiện nay là kết hợp cả hai hướng để tăng độ tin cậy của nghiên cứu.
Khi chọn mẫu sinh vật đại diện cho một họ gene để phân tích, mục tiêu là tối ưu hóa tính đa dạng sinh học được thể hiện trên mẫu đó Với phân tích họ gene, hai điều kiện bắt buộc là mẫu phải đảm bảo tính đa dạng sinh học và trong cùng một sinh vật lấy mẫu phải có đủ các gene trực giao và gene đẳng giao (orthologous và paralogous) được đọc trình tự đầy đủ.
Trong phân tích tiến hóa và phân tích phát sinh loài, số lượng taxon ảnh hưởng mạnh tới kết quả; càng có nhiều loài đại diện thì khả năng nhiễu hệ thống và các vấn đề khác có thể giảm xuống Đối với những loài nghi ngờ gây nhiễu, ta bổ sung một hoặc nhiều loài gần với taxon nghi ngờ (hoặc cùng nhóm taxa) để kiểm chứng lại kết quả Điều này đặc biệt có ý nghĩa khi phân tích sơ bộ cho thấy tốc độ tiến hóa của các taxa khác nhau có sự khác biệt quá lớn; bổ sung các taxa liên quan giúp xác nhận hay bác bỏ nhiễu Để xác định hướng tiến hóa, việc thêm nhóm đối chứng (outgroup) đóng vai trò quan trọng; thông thường outgroup được chọn là nhóm có quan hệ gần nhất với nhóm đang phân tích để tăng độ tin cậy của cây tiến hóa.
Đọc trình tự gene, hiệu chỉnh trình tự và sắp cột thẳng hàng:
Phân tích phát sinh loài dựa trên sự khác biệt quan sát được giữa các trình tự được căn chỉnh thẳng hàng, do đó lỗi trình tự có thể dẫn tới cây tiến hóa không phản ánh đúng thực tế Đặc biệt với các vùng DNA có độ bảo tồn cao và khi nhà phân tích chọn mô hình tiến hóa phức tạp, các sai lệch do lỗi trình tự có thể tạo ra kết quả lệch rất lớn Để tránh tác động của lỗi trình tự và sự chủ quan trong quá trình hiệu chỉnh, người ta buộc phải đọc trình tự của cả hai sợi và tiến hành hiệu chỉnh sau đó để đảm bảo tính khách quan và độ chính xác của phân tích phát sinh loài.
Việc sắp xếp thẳng hàng các trình tự gen có thể được thực hiện tự động bằng máy tính hoặc thủ công Tuy nhiên, đối với các gene hoặc vùng DNA có mức độ bảo tồn kém, quá trình căn chỉnh tự động dễ gây ra lỗi Vì vậy, đối với các vùng có độ biến thiên cao, việc sắp xếp thẳng hàng nên được thực hiện bằng mắt để đảm bảo độ chính xác Những vùng không thể sắp xếp thẳng hàng cần loại bỏ trước khi tiến hành phân tích.
Chọn lựa mô hình tiến hóa
Trong lĩnh vực phân tích trình tự DNA, các mô hình tiến hóa ngày càng phức tạp để phản ánh sự đa dạng và biến thiên của dữ liệu di truyền Các thông số cơ bản thường gặp gồm tần suất base (xác suất xuất hiện của từng nucleotide), ma trận tốc độ biến đổi (rate matrix) cho thấy xác suất biến đổi giữa các nucleotide theo thời gian, phân bố gamma (mô tả sự biến thiên tốc độ biến đổi giữa các vị trí), tỷ lệ vị trí hằng định (không biến thiên) và sự đồng tiến hóa Việc kết hợp đầy đủ các yếu tố này cho phép ước lượng và suy diễn tiến hóa trên trình tự DNA một cách chính xác hơn, từ đó cải thiện khả năng giải mã lịch sử biến đổi và mối liên hệ giữa các vị trí trong genome.
Trước khi chuỗi dữ liệu được tính toán và phân tích, cần trải qua bước kiểm tra dò tìm mô hình tiến hóa phù hợp Đối với các mô hình tiến hóa lồng ghép, có thể dùng phép kiểm tra tỷ lệ khả năng theo cấp bậc để đánh giá sự phù hợp giữa các mô hình và chọn mô hình tối ưu Với các mô hình tiến hóa không lồng ghép, chuẩn thông tin Akaike (AIC) được dùng để so sánh và chọn mô hình tối ưu dựa trên sự cân bằng giữa độ phù hợp và độ phức tạp của mô hình.
Dò tìm cây tiến hóa tối thích
Vài phương pháp suy luận cây phát sinh loài đã được biết rõ nhằm xác định những cây tiến hóa tối ưu Các cây tiến hóa này sau đó được đánh giá dựa trên các tiêu chuẩn tối ưu đã được xác định trước nhằm chọn ra cây phát sinh loài tốt nhất cho phân tích Quá trình này kết hợp dữ liệu di truyền và mô hình tiến hóa để xây dựng và tối ưu hóa cấu trúc quan hệ giữa các loài, nâng cao độ tin cậy của cây phát sinh loài trong nghiên cứu sinh học tiến hóa.
Về mặt lý thuyết, việc dò tìm tối ưu được xem là phải dò tìm toàn bộ để không bỏ sót dữ liệu, nhưng quá trình này tốn thời gian và đòi hỏi máy tính có cấu trúc từ mạnh đến cực mạnh Trong thực nghiệm, người ta chọn hai thuật toán dò tìm cây tiến hóa: thuật toán phân nhánh và giới hạn (branch-and-bound) và thuật toán tự tìm tòi (heuristics); ngoài ra còn có phương pháp phân rã hình ngôi sao (star decomposition method) Các phương pháp này giúp cân bằng giữa độ tối ưu và chi phí tính toán, cho phép tìm nghiệm hợp lý trong thời gian ngắn và áp dụng rộng rãi trong các bài toán tối ưu hóa và phân tích cấu trúc cây tiến hóa.
Phân tích phát sinh chủng loài - Tiêu chuẩn tối ƣu
Trong phương pháp Maximum parsimony (MP-hà tiện tối đa), giả định chủ đạo cho rằng cây tiến hóa tối ưu là cây mô tả tiến trình tiến hóa với số thay đổi ít nhất, tức là có ít đột biến nhất, do đó cây có điểm hà tiện thấp theo một tiêu chuẩn định trước Phương pháp dò tìm cây bằng các thuật toán heuristic thường được áp dụng cho phương pháp parsimony, nhằm tối ưu hóa quá trình suy luận và giảm không gian tìm kiếm để xác định cây phát sinh loài phù hợp nhất với dữ liệu quan sát.
Trong phương pháp khoảng cách, từng cặp trình tự được căn chỉnh sao cho các cột tương ứng thẳng hàng và giữa mỗi cặp tính khoảng cách di truyền Để xây dựng cây tiến hóa, phương pháp phân rã hình ngôi sao thường được sử dụng, ví dụ phương pháp neighbor-joining Vì neighbor-joining là một trong những phương pháp nhanh nhất để dò tìm cây tiến hóa, nó thường được dùng để phân tích khối dữ liệu lớn với nhiều taxon.
Phương pháp Maximum Likelihood (khả năng tối đa) là phương pháp tốn thời gian nhất nhưng cho kết quả đáng tin cậy nhất trong phân tích cây tiến hóa Với mỗi mô hình tiến hóa được chọn, phương pháp này tính xác suất tối đa mà một cây tiến hóa có thể sinh ra từ chuỗi trình tự phân tích, được biểu diễn dưới dạng -ln L Cây tiến hóa có xác suất cao nhất sẽ được chọn làm cây tiến hóa tối ưu Ngoài các phương pháp đã kể trên, còn có phương pháp Bayes.
Phân tích giá trị bootstrap
DỰ ĐOÁN CẤU TRÚC BẬC HAI rDNA
Trong phân tích phả hệ, sự sai khác chỉ vài nu trong trình tự không cho phép xác định rõ ràng ranh giới loài, trong khi những khác biệt tương tự có thể ảnh hưởng đến mức năng lượng của cấu trúc bậc hai và gián tiếp thay đổi kiểu hình của nó Trong nhiều nghiên cứu định danh nấm, đặc biệt là nấm ký sinh côn trùng, nhiều tác giả đã đề xuất xây dựng cấu trúc bậc hai như một giải pháp củng cố và làm rõ các mối quan hệ loài mà cây phả hệ truyền thống chưa giải quyết thỏa đáng Trong nghiên cứu của Kuo và cộng sự (2008), các tác giả dự đoán cấu trúc bậc hai của vùng ITS2 với hai loài Cordyceps roseostromata và Cordyceps militaris làm đại diện Kết quả cho thấy ITS2 của hai loài này có 3 sự khác biệt: C và T ở vị trí 130, C và G ở vị trí 272, và có sự chèn một nucleotide.
“gap” tại vị trí 276 của Cordyceps militaris , được trình bày ở hình bên dưới
1.8: Kết quả sắp gióng cột trình tự DNA của Cordyceps roseostromata và Cordyceps militaris trên vùng ITS2 bằng phần mềm sắp gióng cột ClustalW (Thompson et al , 1994)
Trong nghiên cứu của Kuo và cộng sự (2008), khi dự đoán cấu trúc bậc hai của mạch mang mã (sense DNA) ở hai loài Cordyceps roseostromata và Cordyceps militaris, kết quả cho thấy cấu trúc bậc hai của sense DNA giữa hai loài là hoàn toàn giống nhau Ngược lại, ở mạch không mang mã (antisense DNA), cấu trúc bậc hai lại hoàn toàn khác biệt Từ kết quả này, các tác giả kết luận rằng việc dự đoán và phân tích cấu trúc bậc hai của vùng ITS2 có thể phân biệt được một số loài có quan hệ gần với nhau trong chi Cordyceps.
1.9: Cấu trúc bậc hai của vùng ITS2 của C roseostromata và C militaris
THỜI GIAN VÀ ĐỊA ĐIỂM NGHIÊN CỨU
− Địa điểm: phòng thí nghiệm Sinh Học Phân Tử trường Đại học Mở Tp.HCM,
47 Lê Thị Trung, Tp Thủ Dầu Một, Bình Dương.
Vật liệu vá phương pháp nghiên cứu
2.2.1 Bộ mẫu nấm ký sinh côn trùng
Các mẫu nấm ký sinh trên côn trùng được thu thập từ các chuyến đi thực địa tại vùng núi Langbiang, tỉnh Lâm Đồng và được Viện Sinh học Tây Nguyên cung cấp; sau đó, chúng được tách phân lập hệ sợi và làm thuần để phục vụ nghiên cứu.
2.2.2 Dụng cụ - thiết bị - hoá chất
Trong phòng thí nghiệm sinh học phân tử, các dụng cụ thông dụng đóng vai trò thiết yếu cho quá trình xử lý mẫu và thao tác an toàn Các dụng cụ chính gồm kẹp lấy mẫu để cố định và thao tác mẫu, đèn cồn dùng để tiệt trùng nhanh và làm sạch khu vực làm việc, ống Eppendorf và ống Falcon cho lưu trữ và ly tâm mẫu ở nhiều thể tích khác nhau, pipette và đầu tip để cấp phát dung dịch một cách chính xác, ống đong và bình Erlen để đo lường và chứa dung dịch, cùng với các dụng cụ hỗ trợ khác giúp tăng hiệu quả thí nghiệm Những thiết bị này thiết lập nền tảng cho các quy trình chuẩn bị DNA/RNA, phân tích mẫu và bảo quản các hợp chất nhạy cảm trong sinh học phân tử.
Máy vortex (Vortex ZX3, Velp Ý)
Máy ly tâm lạnh (Hettich Universal 320R, Đức)
Bộ điện di DNA (BioRad)
Cân kỹ thuật (Satorious, Đức)
Tủ hút khí độc (Ascent Max)
Máy quang phổ kế (Scanning UV/VIS, Smart Spec, BioRad)
Máy luân nhiệt (My-Cycler Thermal, BioRad)
Máy chụp ảnh gel (Gel Doc XR System, BioRad)
Bộ kit tách chiết phenol:chloroform ( NA pDNA Extraction Kit VA.A92- 002A)
Bảo quản tối, nhiệt độ 2-8 0 C
2.2.3 Danh mục các phần mềm sử dụng
Chromas Pro phiên bản 1.41 của Technelysium là phần mềm miễn phí cho phép mở, chỉnh sửa và lưu các tập tin trình tự ở nhiều định dạng phổ biến như FASTA, text, EMBL và SwissProt, đặc biệt là các trình tự được giải trình tự bằng hệ thống ABI dưới dạng biểu đồ huỳnh quang Với giao diện thân thiện và khả năng xử lý linh hoạt, Chromas Pro hỗ trợ người dùng xem và phân tích dữ liệu chuỗi, xuất kết quả ở các định dạng tiêu chuẩn và dễ tích hợp vào các bước phân tích di truyền hoặc nghiên cứu sinh học phân tử.
Sea View, phiên bản 4.2.12 (Manolo Gouy), là phần mềm miễn phí hỗ trợ phân tích tương đồng và căn chỉnh trình tự theo cột trong dữ liệu sinh học; với các công cụ sắp xếp trình tự, phân tích tương đồng và trình bày kết quả trực quan, Sea View giúp người dùng xử lý dữ liệu sinh học hiệu quả, phục vụ nghiên cứu sinh học phân tử, tiến hóa và genomics mà không mất phí bản quyền.
TreeView: phiên bản 1.6.6 (Roderic, 2001), phần mềm miễn phí dùng để xem và hiệu chỉnh cây tiến hoá
Fig Tree: phiên bản 1.3.1 (Andrew Rambaut Group) Fig Tree là phần mềm miễn phí, dùng để hỗ trợ đồ hoạ nhằm xuất bản cây tiến hoá rõ ràng hơn
PAUP*: phiên bản 4.0b10 (Swofford, 2003) Phần mềm có trả phí, dùng để xây dựng cây phát sinh loài theo các phương pháp Maximum parsimony, maximum likelihood, neighbor-joining
MEGA: phiên bản 5.05 (Kumar, 1993) Phần mềm miễn phí dùng để xây dựng cây phát sinh loài theo các phương pháp Maximum parsimony, maximum likelihood, neighbor-joining
PhyML 3.0 (Guindon & Gascuel, 2009) là phần mềm miễn phí dùng để xây dựng cây phát sinh loài theo phương pháp Maximum Likelihood, giúp ước lượng cây phát sinh loài một cách nhanh chóng và tin cậy JModelTest 0.1.1 (Posada, 2008) là phần mềm miễn phí dùng để dò tìm mô hình tiến hóa tối ưu, hỗ trợ chọn mô hình phù hợp cho phân tích tiến hóa.
MrBayes: phiên bản 3.1.2 (Ronquist & Huelsenbeck, 2003) là phần mềm miễn phí, dùng để xây dựng cây phát sinh loài theo phương pháp xác suất hậu nghiệm Bayes
Mfold (Zuker, 2003) là phần mềm miễn phí dùng để dự đoán cấu trúc bậc hai của RNA Adobe Photoshop CS4 Stonehenge (Adobe, 1990) là phiên bản trả phí dùng để xử lý hình ảnh đồ họa cho cây phát sinh loài và làm nổi bật các nhóm quan tâm.
TIẾN TRÌNH NGHIÊN CỨU
Thu thập mẫu nấm ký sinh côn trùng, sơ bộ định danh hình thái
Tách chiết DNA từ tổng số các mẫu nấm ký sinh côn trùng
Khuếch đại đoạn gene ITS1-5.8S-ITS2 bằng PCR với cặp mồi phổ quát
Giải trình tự sản phẩm PCR đã khuếch đại và hiệu chỉnh trình tự
Kiểm tra độ tương đồng bằng BLAST
Dò tìm mô hình tiến hoá
Xây dựng cây phát sinh loài (bằng phương pháp MP, NJ, ML và MrBayer)
Phân tích cây phát sinh loài và so sánh kết quả định danh hình thái
Kết luận tên loài cho mẫu phân tích
2.3.1 Thu thập mẫu và sơ bộ định danh hình thái:
Dữ liệu do Viện sinh học Tây Nguyên cung cấp Hình ảnh và thông tin định danh sơ bộ dựa trên hình thái đƣợc cung cấp ở Phụ lục số 1
2.3.2 Tách chiết DNA tổng số từ hệ sợi:
− Dùng kẹp thu khoảng 0.05 - 0.1g hệ sợi nấm đã phân lập làm thuần trong ống nghiệm vào eppendorf 1.5ml
− Bổ sung nước cất cho đầy ống, vortex đều
− Ly tâm nhẹ để mẫu lắng xuống đáy, hút bỏ nước
− Nghiền mẫu thật kĩ với dung dịch TE
2.3.2.2 Tách chiết DNA theo phương pháp phenol:chloroform:
− Cho 200àl mẫu đó nghiền + 900àl dung dịch pED1 vào tube 1.5ml Vortex 30 giây Để yên 10 phút
− Thờm 200àl pEX2, trộn đều để dung dịch chuyển sang màu trắng đục
− Ly tâm 18.000 g (13.000 v/ph) trong 10 phút
− Hỳt khoảng 600 àl dịch nổi vào một tube mới, thờm 600 àl pEX3, trộn đều, để yên 10 phút Ly tâm 18.000 g (13.000 v/ph) trong 10 phút
− Đổ bổ dịch nổi, thu cặn Thờm 900 àl dung dịch EX4 Ly tõm 18.000 g (13.000 v/ph) trong 5 phút
− Đổ bỏ dịch nổi, thu cặn, để khụ Thờm 50 àl dung dịch ED5 Bảo quản sản
2.3.2.3 Tách chiết sử dụng CTAB buffer:
- Ngõm mẫu với 400 àl CTAB buffer
- Lạnh đông -20 o C, sau đó sốc nhiệt 65 o C trong 40 phút Vortex 10 phút/lần
- Thờm 600 àl chloroform:isoamylalcohol (24:1) Vortex vừa phải Ly tõm 18.000 g (13.000 v/ph) trong 10 phút Thu dịch nổi
- Tủa với isopropanol tỷ lệ 1:1 (v/v) Ủ -20 o C trong 30 phút Ly tâm 18 000 g
(13 000 v/ph) trong 30 phút Bỏ dịch nổi
- Rửa tủa với 1 ml ethanol 70 lạnh Ly tâm 18.000 g (13.000 v/ph) trong 10 phút Lặp lại 2 lần
- Để khụ, hoà tan mẫu trong 50 àl TE 1X
2.3.2.4 Kiểm tra sản phẩm DNA đã tách chiết:
- Kiểm tra nồng độ DNA bằng phương pháp đo mật độ quang ở bước sóng 260nm
- Xác định độ tinh sạch thông qua tỷ số OD260/OD 280 và OD 260 /OD 230
Sử dụng các cặp mồi phổ quát (universal primer) cho tất cả các mẫu Cordyceps: ITS1 (mồi xuôi)-ITS4 (mồi ngƣợc); ITS5 (mồi xuôi)-ITS4 (mồi ngƣợc) (White & cs,
Theo nguồn năm 1990, trình tự các cặp mồi nằm trong vùng bảo tồn cao của rDNA, cụ thể ở các đoạn 18S-SSU và 28S-LSU Khi so sánh với các trình tự có sẵn trên GenBank, các trình tự này được liệt kê trong bảng 2.1 và vị trí bắt cặp được thể hiện như hình 2.1.
2.1: Vị trí bắt cặp của các mồi sử dụng trong đề tài với vùng 18S - 5.8S –
28S rDNA 2.1: Trình tự các mồi sử dụng trong phản ứng PCR
Tên Trình tự (5’-3’) Chiều dài Tham khảo
2.3.3.2 Thành phần phản ứng PCR: dNTP Mix 2.5àl
Giai đoạn chuẩn bị biến tính ở 95 o C trong 5 phút (1 chu kì); giai đoạn chính: biến tính ở 94 o C trong 2 phút, mồi bắt cặp ở 50 o C trong 1 phút, kéo dài ở 72 o C trong
2 phút (35 chu kì); giai đoạn kéo dài cuối cùng ở 72 o C trong 10 phút (1 chu kì)
Trên gel agarose 1%, đệm TAE 1X, điện thế 80V, trong 30 phút Xem kết quả bằng máy chụp ảnh gel
2.3.4 Xác định trình tự đã khuếch đại:
Các sản phẩm khuếch đại vùng ITS1-5.8S-ITS2 đƣợc gửi đi giải trình tự ở Macrogen
Trình tự thu được sau khi giải trình tự sẽ được hiệu chỉnh qua các bước:
Để nâng cao độ tin cậy của dữ liệu trình tự khảo sát, cần loại bỏ các tín hiệu không chính xác ở hai đầu trình tự Ở đầu gần mồi, tín hiệu thường lớn và biên độ không ổn định khiến các đỉnh tín hiệu không rõ Ở đầu cuối trình tự, cường độ tín hiệu thường rất thấp và khó phân biệt các đỉnh Việc đọc base ở vùng này không đảm bảo độ tin cậy và cần loại bỏ.
Kiểm tra các sai lệch giữa hai kết quả giải trình tự:
Đoạn DNA khảo sát thường được giải trình tự hai lần bằng mồi xuôi và mồi ngược nhằm giảm thiểu lỗi đọc base và xử lý các tín hiệu không rõ trong trình tự; do được đọc ở hai chiều nên một trong hai kết quả cần được chuyển đổi sang dạng reverse-complement trước khi so sánh, và mức độ tương đồng giữa hai trình tự được đánh giá bằng công cụ Dot plot và Alignment của Sea View; khi hai trình tự đã được căn chỉnh theo cùng trục (cột), chúng phải tương đồng, còn các sai lệch cho thấy lỗi đọc bởi máy tự động và cần được kiểm tra trực tiếp lại trên biểu đồ chromatogram hiển thị bằng phần mềm Chromas Pro.
Việc so sánh tín hiệu huỳnh quang tại các vị trí lệch giữa hai kết quả giải trình tự cho phép xác định đúng loại base tại vị trí đó Trong một số trường hợp, các tín hiệu vẫn không phân biệt được giữa các nucleotide, những vị trí này sẽ được ghi nhận để xác nhận lại sau hoặc được biểu diễn bằng mã nucleotide mơ hồ theo chuẩn IUPAC (IUPAC ambiguous nucleotide code).
Khi các kết quả cho thấy sự khác biệt giữa các cột sắp xếp quá lớn và độ tương đồng xuống dưới 50%, tín hiệu huỳnh quang ở nhiều vị trí trở nên khó phân biệt Nguyên nhân thường gặp là mẫu bị nhiễm DNA khác, dẫn đến nhiều trình tự được xác định đồng thời trong một thí nghiệm Khi đó các trình tự này không thể dùng cho phân tích dữ liệu trình tự Việc hiệu chỉnh các trình tự này trở nên vô nghĩa và độ tin cậy của kết quả giảm đáng kể.
2.3.6 So sánh với cơ sở dữ liệu GenBank:
Sau khi hiệu chỉnh các sai lệch, trình tự đồng nhất (consensus) được rút ra từ hai kết quả giải trình tự đã được kiểm chứng Trình tự consensus là đại diện tương đối chính xác cho đoạn DNA được khảo sát; tuy nhiên kết quả cần xác thực thêm trên các cơ sở dữ liệu nucleotide như GenBank bằng BLASTn Mọi sai lệch giữa trình tự tham chiếu trên dữ liệu và trình tự truy vấn nên được xem xét và tín hiệu huỳnh quang tại các vị trí đó cần được kiểm tra lại để xác nhận kết quả giải trình tự Bên cạnh đó, việc thực hiện BLAST còn giúp phát hiện nhiễm mẫu và đánh giá quá trình nhận và bảo quản mẫu.
2.3.7 Xây dựng bộ dữ liệu DNA:
Ngoài các mẫu nấm được trực tiếp thu nhận trình tự, trình tự các chi nấm ký sinh trên côn trùng thuộc họ Clavicipitaceae được tham khảo trên GenBank và đưa vào phân tích phát sinh loài Những trình tự này được liệt kê chi tiết trong Phụ lục số 2.
2.3.8 Dò tìm mô hình tiến hoá:
2.3.9 Xây dựng cây phát sinh loài:
− Theo phương pháp Maximum Likelihood : đƣợc tạo bằng phần mềm PhyML
3.0 và MEGAb 5.05 (Guindon & Gascuel, 2003) sử dụng các thông số mô hình tiến hoá từ jModeltest
− Theo phương pháp khoảng cách : đƣợc thực hiện bằng MEGA 5.05 và PAUP*
4.0b10 (Swofford, 2003) với các giá trị maximum likelihood từ jModeltest Cây tiến hoá đƣợc suy ra với thuật toán neighbor-joining
− Theo phương pháp Maximum Parsimony: đƣợc thực hiện bằng MEGA 5.05 và PAUP* 4.0b10 Tất cả đƣợc chạy với giá trị bootstrap là 1000 lần
− Theo phương pháp xác suất hậu nghiệm : sử dụng phần mềm MrBayes 3.2
Theo Ronquist & Huelsenbeck (2003), các tham số cơ bản được cài đặt theo mẫu chuẩn cho phân tích Bayesian Mẫu được chạy 1.500.000 lần với 1 chuỗi lạnh và 3 chuỗi nóng, và cây được lưu sau mỗi 100 lần chạy.
2.3.10 Dự đoán cấu trúc bậc hai vùng gene ITS2
Việc dự đoán sự hình thành cấu trúc bậc hai của vùng trình tự ITS2 đƣợc thực hiện bằng phần mềm trực tuyến MFLOD 3.1 (SantaLucia, 1998; Zuker, 2003) Các thông số thiết yếu được thiết lập cho chương trình dự đoán cấu trúc bậc hai bao gồm: nồng độ ion Na + = 0.05, Mg ++ = 0.00 và nhiệt độ cho quá trình gấp cuộn DNA là 25 0 C
Cây phát sinh loài đƣợc đƣa vào phần mềm TreeView, FigTree và Adobe Photoshop để chỉnh sửa trước khi công bố.
KẾT QUẢ SƯU TẬP MẪU VÀ SƠ BỘ ĐỊNH DANH HÌNH THÁI
Hình ảnh và kết quả định danh theo hình thái giải phẫu của 27 mẫu nấm ký sinh côn trùng được Viện Sinh Học Tây Nguyên cung cấp cho đề tài này; danh sách chi tiết các mẫu nấm ký sinh được liệt kê trong Phụ Lục 1.
XÂY DỰNG QUY TRÌNH THỰC NGHIỆM NHẰM KHUẾCH ĐẠI VÙNG ITS1-5.8S-ITS2 CHO CÁC MẪU NẤM KÝ SINH CÔN TRÙNG
Quy trình tách chiết phenol:chloroform đƣợc khảo sát đầu tiên Kết quả đo mật độ quang 5 mẫu tiêu biểu đƣợc trình bày trong bảng 3.1
3.1: Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 5 mẫu nấm ký sinh côn trùng được tách chiết theo phương pháp phenol:chloroform
Mẫu OD260/280 Nồng độ (àg/ml)
Theo bảng 3.1, hiệu quả tách chiết theo quy trình phenol:chloroform chƣa thật sự tốt, một số mẫu còn lẫn protein nên tỷ số OD260/280 thấp hơn 1.8
Các sản phẩm tách chiết được tiến hành PCR trên hai cặp mồi ITS1/ITS4 và ITS5/ITS4 Kết quả điện di trên gel agarose được trình bày ở hình 3.1 Trong hình 3.1a, chỉ mẫu 5 cho kết quả khuếch đại tốt, sản phẩm khuếch đại có độ dài khoảng 700 bp, phù hợp với độ dài của vùng trình tự ITS cần khuếch đại Bốn mẫu còn lại không cho sản phẩm khuếch đại.
So sánh với kết quả đo mật độ quang, mẫu 5 cho kết quả dương tính mặc dù các tỷ lệ OD260/230 và OD260/280 thấp (0.1 và 1.5), cho thấy có thể có vấn đề về chất lượng DNA hoặc nhiễu tín hiệu Do vậy, hai khả năng chính có thể xảy ra với các mẫu âm tính là mồi cho phản ứng PCR và chất lượng DNA đã tách chiết.
Cặp mồi ITS1/ITS4 là cặp mồi phổ quát được sử dụng rộng rãi để khuếch đại vùng ITS Tuy nhiên, so sánh trình tự mồi ITS1 với dữ liệu vùng ITS của các chi nấm ký sinh trên côn trùng trên GenBank cho thấy một số khuyết điểm, như hai sai lệch giữa trình tự mồi và trình tự DNA đích và khả năng hình thành cấu trúc bậc hai có thể gây cản trở đáng kể cho quá trình khuếch đại (Hình 3.2) Vì vậy, việc kiểm tra hiệu quả khuếch đại của mồi nên được thực hiện trước để đảm bảo độ nhạy và độ đặc hiệu của phân tích.
3.1: Kết quả điện di sản phẩm PCR với hai cặp mồi a) ITS1/ITS4 và b) ITS5/ITS4, DNA được tách chiết theo phương pháp phenol:chloroform
Để khắc phục những khuyết điểm của mồi xuôi ITS1, mồi ITS5 được thay thế và áp dụng trong phản ứng PCR với cặp mồi ITS5/ITS4 trên các sản phẩm DNA đã tách chiết cũ; hình 3.1b cho thấy hiệu quả khuếch đại của mồi ITS5 tốt hơn Ngoại trừ mẫu 5, hai mẫu 2 và 3 cho thấy sản phẩm khuếch đại có độ dài tương đương mẫu 5 trong khoảng 500–700 bp, trong khi các mẫu 1 và 3 vẫn chưa được khuếch đại; do đó, qua việc so sánh hai cặp mồi ITS5/ITS4 và ITS1/ITS4 có thể kết luận rằng cặp mồi ITS5/ITS4 cho hiệu quả khuếch đại tốt hơn.
3.2: Vị trí hai mồi xuôi ITS5 và ITS1 khi so sánh với các trình tự Cordyceps trên GenBank Ở hình bên trái, hai nucleotide đƣợc đóng khung là 2 vị trí sai lệch, khi đổi vị trí
Việc ghép nối hai nucleotide với nhau sẽ cho ra trình tự đúng của vùng trình tự cần phân tích Hình ở bên phải minh họa quá trình sắp cột thẳng hàng bằng SeaView để xác định vị trí bắt cặp tương ứng của mồi Cấu trúc RNA mong muốn được tạo ra và tối ưu hóa bằng công cụ mfold Web Server (http://mfold.rna.albany.edu), giúp mô phỏng cấu trúc thứ cấp và hỗ trợ thiết kế hiệu quả.
So với kết quả đo mật độ quang cho thấy mẫu 5 dù có nồng độ và độ tinh sạch thấp (OD260/280 = 1.5; nồng độ 34.8 µg/ml) vẫn được khuếch đại Ngược lại mẫu 4 cho kết quả đo mật độ quang tốt hơn nhưng lại không cho sản phẩm khuếch đại Mẫu 2 cho sản phẩm khuếch đại khi sử dụng cặp mồi ITS5/ITS4 mặc dù độ tinh sạch thấp Nói cách khác, phản ứng PCR có thể đã bị ức chế bởi các chất nhiễm khác Để khảo sát mức độ nhiễm các chất khác, sản phẩm tách chiết được kiểm tra thêm với giá trị OD230 Ngoài tỷ lệ OD260/280 thông thường để kiểm tra sự nhiễm protein, việc xác định tỷ lệ OD260/230 nhằm kiểm tra sự nhiễm các chất khác đặc biệt là polysaccharide Bảng 3.2 trình bày kết quả xác định tỷ lệ OD260/230 của các mẫu nấm khảo sát.
3.2 Kết quả kiểm tra mật độ quang lần hai bằng tỷ số OD260/230 và OD260/280 các mẫu nấm được tách chiết theo phương pháp phenol:chloroform
Mẫu OD260/230 OD260/280 Nồng độ (àg/ml)
Theo bảng 3.2, tỷ lệ OD260/230 ở các mẫu khảo sát vẫn thấp so với chuẩn (lớn hơn 1.5), cho thấy sản phẩm tách chiết chứa các tạp chất nhiễm Nồng độ cao của các chất gây nhiễm có thể làm sai lệch kết quả đo bằng quang phổ kế Do đó, các mẫu nấm đã được điều chỉnh quy trình tách chiết DNA nhằm loại bỏ tạp chất và cải thiện độ chính xác của phân tích.
Quy trình thứ hai được thử nghiệm với sự hỗ trợ của buffer CTAB, giúp cải thiện chất lượng DNA thu được Kết quả đo mật độ quang được trình bày trong bảng 3.3; theo bảng 3.2, tỷ lệ OD260/230 ở đa số mẫu đã tăng đáng kể (từ 3–10 lần), mặc dù sự chênh lệch của OD260/230 còn phụ thuộc vào bước sóng 230 nm, đỉnh hấp thụ của nhiều chất khác nhau không chỉ polysaccharide Tỷ lệ OD260/280 nằm trong khoảng 1.7–2, cho thấy DNA thu được theo phương pháp này có độ tinh sạch cao và do vậy kết quả đo mật độ quang cũng sẽ chính xác hơn Các mẫu này được tiến hành PCR với mồi ITS5/ITS4, và kết quả điện di sản phẩm PCR được thể hiện như hình 3.3.
Toàn bộ mẫu cho hiệu quả khuếch đại PCR rất tốt Các mẫu âm tính gặp trong quá trình tách chiết bằng phenol-chloroform và trong PCR với cặp mồi ITS1/ITS4 đã được khắc phục nhờ phương pháp CTAB, từ đó cho kết quả khuếch đại ổn định và đáng tin cậy hơn.
3.3: Kết quả kiểm tra DNA bằng quang phổ kế các mẫu nấm đƣợc tách chiết theo phương pháp CTAB
Mẫu OD260/230 OD260/280 Nồng độ
3.3: Kết quả điện di sản phẩm PCR với hai mồi ITS5/ITS4, tách chiết sử dụng CTAB buffer
Nhƣ vậy, chúng tôi đã xây dựng đƣợc quy trình thực nghiệm để khuếch đại cho
20 mẫu nấm ký sinh côn trùng được xử lý DNA bằng phương pháp CTAB và khuếch đại qua cặp mồi ITS5/ITS4 Sản phẩm khuếch đại, với cặp mồi ITS1/ITS4 và ITS5/ITS4, được gửi sang Macrogen để giải trình tự nhằm phục vụ các phân tích di truyền và các phân tích kế tiếp về mối quan hệ và đặc điểm của các mẫu.
KẾT QUẢ HIỆU CHỈNH TRÌNH TỰ
3.3.1 Kết quả hiệu chỉnh trình tự với SeaView và Chromas Pro:
Kết quả giải trình tự 28 mẫu nấm được trình bày dưới dạng biểu đồ huỳnh quang; dựa trên tín hiệu huỳnh quang từ trình tự vùng ITS của các mẫu, có thể phân loại chúng thành ba nhóm trường hợp khác nhau, nhằm làm rõ sự khác biệt di truyền giữa các mẫu và phục vụ cho các bước nhận diện loài, đánh giá quan hệ phát sinh loài và xây dựng hướng phân tích tiếp theo.
3.3.1.1 Trường hợp 1: Trình tự DNA không thể hiệu chỉnh trên cả hai mạch:
Nhóm này có tín hiệu huỳnh quang không rõ ở cả hai kết quả đọc từ mồi xuôi và mồi ngược (Hình 3.4) Các đỉnh tín hiệu chồng lấp trên toàn bộ trình tự khiến khó phân biệt được các base Đồ thị Dot Plot không tạo được đường chéo phản ánh sự tương đồng giữa hai kết quả giải trình tự Với các mẫu này, việc hiệu chỉnh hoàn toàn không thể thực hiện được, do đó chúng không thể dùng cho phân tích và cần được loại bỏ.
3.4: Trường hợp trình tự DNA không thể hiệu chỉnh trên cả hai mạch ở mẫu DL0004 Tín hiệu huỳnh quang nhiễu ở cả mạch
3.3.1.2 Trường hợp 2: Chỉ một mạch có thể sử dụng để hiệu chỉnh:
Nhóm này cho thấy tín hiệu rõ trong kết quả đọc khi dùng một mồi, nhưng lại có tín hiệu xấu ở kết quả đọc với mồi còn lại (Hình 3.5) Quá trình giải trình tự được thực hiện bằng mồi ITS1 hoặc ITS5, cho thấy sự khác biệt giữa hai mồi ảnh hưởng đến chất lượng và độ tin cậy của dữ liệu giải trình tự Việc so sánh kết quả giữa ITS1 và ITS5 giúp tối ưu hóa lựa chọn mồi để cải thiện tín hiệu và độ chính xác của phép đo, đồng thời minh họa rõ ràng qua Hình 3.5.
Do không có mạch bổ sung để so sánh, việc kiểm tra tín hiệu huỳnh quang phải thực hiện cho từng tín hiệu riêng lẻ Việc cắt bỏ tín hiệu nhiễu ở hai đầu mạch đòi hỏi mức độ nghiêm ngặt cao hơn để đảm bảo độ chính xác của dữ liệu Các điểm nghi ngờ cần được kiểm tra kỹ lưỡng và ghi nhận đầy đủ để phục vụ cho phân tích sau Quá trình đánh giá nên tập trung vào phân biệt tín hiệu thật và nhiễu, đồng thời ghi lại kết quả kiểm tra cho từng điểm nghi ngờ.
3.5: Trường hợp trình tự DNA chỉ có thể hiệu chỉnh trên một mạch ở mẫu DL0014 Tín hiệu huỳnh quang nhiễu ở mạch giải bằng mồi ITS1 nhƣng ở mạch giải bằng mồi ITS4 tín hiệu rất rõ nên vẫn có thể hiệu chỉnh đƣợc
3.3.1.3 Trường hợp 3: Cả hai mạch DNA đều có thể sử dụng để hiệu chỉnh: Đây là nhóm có tín hiệu huỳnh quang rõ trên cả hai kết quả đọc bằng mồi xuôi và mồi ngƣợc và có thể hỗ trợ nhau suy ra trình tự chính xác nhất cho đoạn DNA đã khuếch đại (Hình 3.6)
3.6: Trường hợp trình tự DNA có thể hiệu chỉnh trên cả hai mạch ở mẫu DL0001 Tín hiệu huỳnh quang rõ ở cả hai kết quả với mồi xuôi và mồi ngƣợc
Trong biểu đồ huỳnh quang, các đỉnh tín hiệu được thể hiện đều đặn và phân cách rõ ràng Sau khi loại bỏ hai vùng trình tự nhiễu ở đầu và cuối, kết quả dot plot cho thấy một đường chéo gần như liên tục Bước sắp cột tiếp theo nhằm xác định vị trí tương ứng các nucleotide giữa hai mạch và tìm kiếm sai lệch Kết quả sắp cột trên SeaView cho thấy các mẫu có mức độ tương đồng rất cao và tỉ lệ sai lệch rất thấp Đối với những trường hợp xuất hiện sai lệch, tín hiệu huỳnh quang cần được kiểm tra lại để xác định lỗi đọc trình tự Ví dụ với mẫu DL0001, sau khi sắp cột thẳng hàng, có sự khác biệt về cách đọc base ở vị trí 49 của mạch ITS4 tương ứng vị trí thứ 7 của mạch ITS1 (Hình 3.7)
Ở đây mạch ITS4 có thêm một nucleotide A so với mạch ITS1, và kiểm tra trên biểu đồ huỳnh quang cho thấy tín hiệu của mạch ITS1 nằm ở phần đầu trình tự, khiến một số đỉnh tín hiệu chưa ổn định hoàn toàn; đỉnh huỳnh quang tại vị trí cần xem xét là đỉnh của adenine (A), đỉnh này khá rộng so với các đỉnh xung quanh nên có thể là tín hiệu của hai adenine liên tiếp Ngược lại, ở vị trí tương ứng trên biểu đồ của mạch ITS4 tín hiệu rất rõ ràng và kết quả đọc cho thấy đúng là hai adenine liên tiếp, vì vậy ở mạch ITS1 tại vị trí này cần thêm một A (viết thường để phân biệt) 3.7: Vị trí sai lệch của hai kết quả giải trình tự mẫu DL0001 bằng cặp mồi.
ITS1-ITS4 cho thấy hai phần: a) kết quả sắp gióng cột trên SeaView, b) biểu đồ huỳnh quang được mở bằng Chromas Pro Tín hiệu huỳnh quang xác nhận có hai adenine liên tiếp tại vị trí này.
Đối với các mẫu nhóm này, sau khi hiệu chỉnh như đã trình bày ở trên, trình tự consensus thu được từ hai mạch chính được xem là trình tự chính xác nhất Nhờ tín hiệu trong nhóm này rất rõ, kết quả hiệu chỉnh có thể được sử dụng ngay cho các phân tích ở bước tiếp theo.
Quá trình hiệu chỉnh cho ra các trình tự có độ dài khoảng 500–600 bp Một số mẫu có sai lệch khi so sánh với cơ sở dữ liệu GenBank Tuy vậy, khi kiểm tra lại biểu đồ huỳnh quang tại các vị trí này, tín hiệu ở các vị trí đó rất rõ nên việc đọc sai trình tự không thể xảy ra Do đó, kết quả hiệu chỉnh vẫn được giữ nguyên như ban đầu.
Bảng tổng hợp chi tiết kết quả hiệu chỉnh trình tự đƣợc trình bày trong bảng 3.3
3.4: Kết quả hiệu chỉnh trình tự các mẫu nấm ký sinh côn trùng STT Ký hiệu Loại tín hiệu
STT Ký hiệu Loại tín hiệu
(*) Loại tín hiệu: 1: xấu ở cả hai mạch, 2: có một mạch rõ, 3: rõ ở cả hai mạch
Trong 47 mẫu giải trình tự, 28 mẫu có thể hiệu chỉnh Nguyên nhân của tín hiệu bị nhiễu có thể do yếu tố kỹ thuật hoặc do tạp nhiễm và không thuần nhất của sản phẩm PCR Đối với những mẫu có tín hiệu nhiễu một mạch, chắc chắn là do yếu tố kỹ thuật Chúng tôi đã yêu cầu công ty Macrogen giải trình tự lại các mẫu này Thật ra cũng có thể sử dụng trình tự giải được trên một mạch để tiếp tục phân tích Tuy nhiên, đây là đề tài nghiên cứu đầu tiên; chúng tôi không chỉ mong nhận được kết quả mà còn xây dựng một phương pháp luận có cơ sở khoa học vững chắc Vì vậy, chỉ những trình tự có tín hiệu giải được và được hiệu chỉnh một cách chắc chắn mới được sử dụng cho các phân tích về sau.
Nguyên nhân chính khiến sản phẩm PCR không thuần là do mẫu chưa được phân lập và làm thuần hoàn toàn Đây là kinh nghiệm tích luỹ được trong quá trình nghiên cứu nấm ký sinh, đặc biệt là các nấm ký sinh trên côn trùng, khi phân lập và làm thuần có thể dễ phát hiện sai lệch ngay từ quan sát bằng mắt thường về hệ sợi mọc trên đĩa Hai nhóm công tác đang được triển khai song song: (1) nhóm nghiên cứu hình thái tiếp tục phân lập, tách dòng thuần; (2) nhóm nghiên cứu Sinh học Phân tử tiến hành tạo dòng, tách sản phẩm PCR và sau đó tái giải trình tự Vì vậy việc xác định loài cho các mẫu này vẫn chưa thực hiện, và bộ mẫu sau khi hiệu chỉnh sẽ được đưa vào các phân tích tiếp theo, gồm 28 mẫu.
PHÂN TÍCH THÀNH PHẨN NUCLEOTIDE Ở VÙNG ITS1-5.8S-ITS2
Kết quả phân tích thành phần nucleotide của vùng ITS1-5.8S-ITS2 đƣợc trình bày trong bảng 3.5
Ba vùng dao động ở tổng chiều dài khá lớn, từ 486 đến 660 nucleotide và tỷ lệ GC dao động từ 40.30% đến 61.95% Theo bảng 3.4, vùng ITS1 có tỷ lệ GC dao động giữa các loài nấm khảo sát từ 38.74% (DL0043) đến 60.64% (DL0003) và chiều dài từ 182 (DL0008) đến 333 nucleotide (DL0043) Vùng ITS2 có tỷ lệ GC dao động từ 41.90% (DL0043) – 63.13% (DL0006), chiều dài dao động từ 282 (DL0002) – 372 nt.
Phân tích so sánh giữa ITS1 và ITS2 cho thấy hai vùng có chiều dài tương đương, song tỷ lệ GC của ITS2 luôn cao hơn ITS1 khoảng 1–5% Đối với vùng 5.8S, biến động về chiều dài rất nhỏ và toàn bộ các mẫu khảo sát cho thấy chiều dài cố định ở 157 nucleotide, trong khi tỷ lệ GC dao động hẹp ở mức 46.5%–49%.
Qua kết quả phân tích, có thể thấy vùng ITS1 và ITS2 thể hiện mức biến động rất cao, và sự khác biệt giữa các loài tại hai vùng này là rất lớn Những đặc điểm này khiến ITS1 và ITS2 trở thành các marker mạnh cho phân loại và nhận diện loài trong các nghiên cứu di truyền.
3.5: Sự biến động về chiều dài và thành phần G+C của vùng ITS1 và ITS2
KẾT QUẢ SO SÁNH VỚI CƠ SỞ DỮ LIỆU GENBANK
Trình tự vùng ITS1-5.8S-ITS2 sau khi hiệu chỉnh có độ dài trong khoảng 486 –
Độ dài phân tích là 660 bp Đa số mẫu cho kết quả trùng khớp với trình tự trong GenBank, với độ bao phủ và độ tương đồng đạt 99–100% (xem Bảng 3.6) Một số mẫu có sai lệch so với trình tự trong cơ sở dữ liệu Khi kiểm tra lại biểu đồ huỳnh quang tại các vị trí này, tín hiệu tại đây rất rõ nên sai lệch không thể giải thích do đọc base; do đó kết quả hiệu chỉnh vẫn được giữ nguyên như trước Kết quả trình tự tương đồng khi so sánh với GenBank được trình bày trong Bảng 3.6.
Việc so sánh trình tự DNA với cơ sở dữ liệu GenBank thông qua phân tích BLAST nhằm xác định xem trình tự truy vấn có thuộc nhóm nấm ký sinh côn trùng (ví dụ Cordyceps và các chi liên quan) hay không và cung cấp tham chiếu cho nhóm loài tương đồng nhất Kết quả BLAST cho thấy các mẫu nấm được dùng phù hợp với nhóm nấm ký sinh côn trùng, không nhiễm tạp với các nấm khác, cho thấy quá trình lấy mẫu tại hiện trường khá chính xác, độ tin cậy cao và bảo quản mẫu tốt Tuy nhiên, kết quả BLAST này không thể được dùng để suy luận định danh chi/loài như nhiều báo cáo ở Việt Nam vẫn làm; nó chỉ cung cấp thông tin để lựa chọn các loài tham chiếu và phục vụ cho các phân tích phả hệ sau này Để xác định đúng tên loài, cần thực hiện thêm nhiều phân tích sau này, như so sánh với dữ liệu hình thái và xác định mối quan hệ phát sinh loài thông qua cây phát sinh loài.
3.6: Kết quả so sánh trình tự ITS đã hiệu chỉnh với các trình tự trên GenBank
Loài tương đồng nhất trên Genbank
DL0001 Cordyceps bassiana EU086423 493 100% 100% 0.0 0 Chấp nhận
DL0002 Cordyceps sinensis AF291749 486 96% 100% 0.0 0 Chấp nhận
DL0003 Ophiocordyceps neovolkiana HM856642 591 99% 100% 0.0 0 Chấp nhận
DL0006 Ophiocordyceps neovolkiana HM856642 586 100% 100% 0.0 0 Chấp nhận
DL0007 Ophiocordyceps neovolkiana HM856642 589 99% 100% 0.0 0 Chấp nhận
DL0008 Paecilomyces javanicus AB099944 486 100% 97% 0.0 0 Chấp nhận
DL0024 Isaria tenuipes EF411223 544 100% 100% 0.0 0 Chấp nhận
DL0027 Isaria javanica JN204422 553 100% 100% 0.0 0 Chấp nhận
DL0028 Isaria farinosa HQ608087 561 99% 96% 0.0 0 Chấp nhận
DL0040 Isaria tenuipes EU828664 573 100% 97% 0.0 0 Chấp nhận
DL0043 Cordyceps sp AY728273 660 100% 99% 0.0 0 Chấp nhận
DL0044 Beauveria sp DQ376247 560 99% 100% 0.0 0 Chấp nhận
DL0046 Cordyceps sp JQ868750 645 100% 100% 0.0 0 Chấp nhận
DL0049 Simplicillium sp AB378534 587 100% 99% 0.0 0 Chấp nhận
DL0077 Paecilomyces javanicus AB099944 560 100% 99% 0.0 0 Chấp nhận
DL0082 Cordyceps sp EF495097 583 96% 98% 0.0 0 Chấp nhận
Để đảm bảo độ chính xác, tiến hành tái kiểm tra lại các vị trí sai lệch trên biểu đồ tín hiệu huỳnh quang Ở bước “Chấp nhận”, ta chấp nhận các sai lệch và giữ nguyên kết quả hiệu chỉnh trình tự bởi tín hiệu huỳnh quang tại những vị trí này rất rõ và đáng tin cậy.
XÂY DỰNG BỘ CƠ SỞ DỮ LIỆU TRÌNH TỰ ITS NHÓM NẤM KÝ SINH CÔN TRÙNG
Để phân tích cây phát sinh loài, chúng tôi sử dụng tổng cộng 77 trình tự DNA, trong đó 28 trình tự được thu thập trực tiếp từ đề tài này và 49 trình tự tham khảo có sẵn trên GenBank; các trình tự này được lựa chọn và xử lý cẩn thận nhằm bảo đảm đại diện và độ tin cậy cho phân tích phylogeny Chi tiết về nguồn gốc, tiêu chí chọn lọc và quy trình xử lý dữ liệu được trình bày trong Phụ Lục.
One clear pattern is that all the sequences we reference from GenBank as standards have explicit provenance: a published article, a GenBank accession number, and, most importantly, the species name of the sample, along with the supplying culture collection For example: CBS—Centraal Bureau voor Schimmelcultures, Utrecht, The Netherlands; ARSEF—Agricultural Research Service Collection of Entomopathogenic Fungal Cultures, U.S.; ATCC—American Type Culture Collection Center; CCRC—Bioresources Collection and Research Center in Taiwan; IFO—Institute for Fermentation, Osaka, Japan; and others.
Tất cả các trình tự này đƣợc sắp cột thẳng hàng bằng SeaView và thực hiện hiệu chỉnh một số vị trí chƣa hợp lý bằng mắt Sau khi loại bỏ các vùng không bảo tồn độ dài các trình tự khảo sát là 667 nucleotide Ở một số vị trí còn tồn tại các điểm gap đƣợc xử lý nhƣ các điểm chƣa xác định (missing data).
XÁC ĐỊNH MÔ HÌNH TIẾN HOÁ
Bộ dữ liệu có 77 trình tự, dài 667 nucleotide đƣợc chuyển vào phần mềm jModelTest để xác mô hình tiến hóa tối ƣu Kết quả cho thấy cho bộ dữ liệu trên cho thấy mô hình phù hợp nhất là TIM2ef+G, với các thông số nhƣ sau: partition = 010232 -lnL = 5889.6148
KẾT QUẢ XÂY DỰNG CÂY PHÁT SINH LOÀI
To build a phylogenetic tree using PAUP*, configure the analysis with these input settings: set autoclose=yes warnreset=no increase=auto; log file=ITS1_58S_ITS2_Cordyceps_nxs.bootstrap.log; execute ITS1_58S_ITS2_Cordyceps_nxs.nxs This setup enables automatic closing, suppresses reset warnings, and allows automatic incrementing during the bootstrap run, while the bootstrap results are written to the ITS1_58S_ITS2_Cordyceps_nxs.bootstrap.log and the analysis is executed from the ITS1_58S_ITS2_Cordyceps_nxs.nxs PAUP* project file.
An ITS-based phylogenetic analysis was performed using Lset base=equal nst=6 with a rmat=(1.6233 3.1434 1.6233 1.0000 5.1094), gamma-distributed rate variation (shape=0.5270) across four rate categories (ncat=4) and pinvar=0 The workflow sets the criterion to distance and defines the distance dataset as dset distance=logdet objective=me; a neighbor-joining (NJ) search is run and the resulting NJ tree is saved as ITS1_58S_ITS2_Cordyceps_nxs_DIST.txt with brlens, followed by bootstrap (boot nreps00, sear=nj) and saving the NJ bootstrap tree as ITS1_58S_ITS2_Cordyceps_nxs_NJ_boot.tre from=1 to=1 The distance criterion is then redefined (dset distance=logdet objective=me) and NJ is repeated with bootstrap, saving ITS1_58S_ITS2_Cordyceps_nxs_LD.tre and ITS1_58S_ITS2_Cordyceps_nxs_LD_boot.tre from=1 to=1 Finally, the criterion switches to parsimony; a heuristic search with random additions (hsear addseq=rand nreps) yields ITS1_58S_ITS2_Cordyceps_nxs_PARS.tre with brlens, followed by bootstrapping (boot nreps0 sear=heur) and a maximum-likelihood search (nreps0 sear=heur) saving ITS1_58S_ITS2_Cordyceps_nxs_ML.tre with brlens, completing the set of outputs.
ITS1_58S_ITS2_Cordyceps_nxs_ML_boot.tre from=1 to2;
Các cây phát sinh loài đƣợc trình bày trong các hình từ 3.8 đến 3.11
3.8: Cây phả hệ phân tử được xây dựng bằng phương pháp Neighbor Joining (Các con số hiển thị trên cây là giá trị bootstrap của 1000 lần lặp lại)
3.9: Cây phả hệ phân tử được xây dựng bằng phương pháp Maximum
(Các con số hiển thị trên cây là giá trị bootstrap của 1000 lần lặp lại)
3.10: Cây phả hệ phân tử được xây dựng bằng phương pháp Maximum Likelihood (Các con số hiển thị trên cây là giá trị bootstrap của 1000 lần lặp lại)
3.11: Cây phả hệ phân tử được xây dựng bằng phương pháp MrBayer (Các con số hiển thị trên cây là giá trị bootstrap của 1000 lần lặp lại)
Kết quả địa hình học của cây phát sinh loài cho thấy sự tương thích với cây mà nhóm Kuo và cộng sự (2005) đã thực hiện Điều này được ủng hộ bởi việc các trình tự tham chiếu mà chúng tôi sử dụng cho phương pháp dựng cây phần lớn trùng khớp với công trình của Kuo và cộng sự (2005) Ngoài ra, topology của bốn cây phả hệ được xây dựng bằng bốn phương pháp khác nhau, bao gồm Neighbor Joining (NJ) và Maximum Parsimony, cho thấy sự nhất quán giữa các phương pháp trong kết quả phân tích.
(MP), Maximum Likelihood (ML) và MrBayer đều rất tương tự nhau Các giá trị bootstrap trên tất cả các cây phả hệ đều có ý nghĩa (lớn hơn 50)
Phân tích chi tiết cho thấy sự phân nhóm của mọi mẫu nấm trên các cây phả hệ đồng nhất ở cả bốn phương pháp dựng cây: Neighbor Joining, Maximum Parsimony, Maximum Likelihood và MrBayes Sự nhất quán này cho thấy các mối quan hệ tiến hóa của nấm được tái hiện một cách nhất quán trên các phương pháp, làm tăng độ tin cậy của kết quả phân tích phát sinh loài Điều này cho thấy các mẫu nấm có mối liên hệ di truyền và sự phân cấp tiến hóa rõ ràng bất chấp các công cụ dựng cây khác nhau.
KẾT QUẢ DỰ ĐOÁN CẤU TRÚC BẬC HAI VÙNG ITS2
Trình tự vùng ITS2 của toàn bộ mẫu, gồm tham chiếu GenBank và 28 mẫu được căn chỉnh từ nghiên cứu này, được sử dụng để dự đoán cấu trúc bậc hai trên mạch sense và antisense bằng phần mềm trực tuyến MFold 3.1 (SantaLucia, 1998; Zuker, 2003) với các tham số mặc định, chi tiết được liệt kê ở phần Vật liệu – Phương pháp (Mục 2.3.10).
Toàn bộ kết quả dự đoán đã được liệt kê ở phụ lục 3 Nói chung, mức năng lượng ΔG của các cấu trúc bậc hai được dự đoán bằng các phần mềm dao động quanh mức âm 50 kcal/mol Theo các lập luận của các chuyên gia tính toán, đặc biệt trong hầu hết các công bố của SantaLucia, mối liên hệ giữa năng lượng hình thành và độ bền của cấu trúc (ví dụ cấu trúc bậc hai của rDNA ITS2) cho thấy để phá vỡ vùng ITS2 thì năng lượng tối thiểu phải lớn hơn 50 kcal/mol Đây là một mức năng lượng khá cao, vì vậy các cấu trúc có giá trị âm này rất bền Các công bố dự đoán cấu trúc bậc hai cho rDNA vì vậy đều ghi nhận ở mức âm 50 kcal/mol và đây cũng thường là giá trị nhỏ nhất trong hầu hết các mô hình được dự đoán.
Để bảo toàn giá trị tham khảo và cho phép so sánh kết quả này với các kết quả hỗ trợ định danh khác như phả hệ phân tử và truy vấn trình tự tương đồng từ GenBank, chúng tôi chỉ sử dụng các kiểu cấu trúc có mức năng lượng âm dưới ngưỡng 50 kcal/mol Các nhận xét riêng về kết quả cấu trúc bậc hai sẽ được trình bày chung với các kết quả phân tích phả hệ.
PHÂN TÍCH CÁC KẾT QUẢ - KẾT LUẬN VỀ PHÂN LOẠI, ĐỊNH DANH
Chúng tôi kết hợp phân tích kết quả dựa trên phả hệ phân tử, phân tích cấu trúc bậc hai vùng ITS2, tra cứu trình tự tương đồng trên GenBank (NCBI) và tham khảo kết quả định danh sơ bộ dựa trên đặc điểm hình thái cho toàn bộ mẫu được phân tích; quy trình phân tích này được chi tiết hóa và điều chỉnh cho từng trường hợp mẫu hoặc cụm mẫu như sau.
Mẫu DL0001 phân nhóm với trình tự tham khảo Cordyceps basiana
EU086423 và Beauveria sp SJ-2010 từ ngân hàng giống SY, ký hiệu SY07A (AB027380), được phân tích và kết quả phân nhóm được xác lập trên bốn phương pháp phân tích phylogeny: Maximum Likelihood (ML) và Maximum Parsimony (MP); trên cây Neighbor Joining (NJ); và trên cây MrBayes (MB) Đáng chú ý, DL0001 thể hiện sự phân thành đơn nhóm (monophyletic).
Cordyceps basiana (EU086423) được xác định rõ nhất với bootstrap đạt 100% Kết quả nhận diện sơ bộ dựa trên hình thái học (Cordyceps sp) và đối chiếu với dữ liệu GenBank trên NCBI cho mẫu DL0001 cho thấy mẫu DL0001 rất gần hoặc có thể chính là Cordyceps basiana Dữ liệu cấu trúc thứ cấp ITS2 cũng ủng hộ quan điểm này (Hình 3.12), trong đó cấu trúc ở cả hai mạch sense và antisense của DL0001 hoàn toàn trùng khớp với Cordyceps basiana, củng cố sự nhất quán giữa phân tích hình thái và phân tích phân tử.
Trong nghiên cứu này, Cordyceps basiana cho thấy hai mức năng lượng tự do khác nhau giữa mạch sense và mạch antisense, với dG = -45.16 cho mạch sense và -47.37 cho mạch antisense Sự khác biệt trong cấu trúc bậc hai được thể hiện giữa đại diện SJ-2010 với DL0001 và cả Cordyceps basiana (Hình 3.12) Vì vậy có thể kết luận mẫu DL0001 thuộc chi Cordyceps sp rất gần hoặc chính là Cordyceps basiana.
3.12: So sánh cấu trúc bậc hai vùng ITS2 mẫu DL0001 với hai tham chiếu
(Với mạch sense: bên trái và antisense: bên phải)
DL0002 là mẫu hệ sợi nấm Cordyceps sinensis được nhận từ sự giúp đỡ của Tiến sĩ Yamanaka Katsuji (Viện Nấm học, Kyoto, Nhật Bản) Mẫu nấm này được dùng cho một nghiên cứu ứng dụng khác; trong thực nghiệm này, chúng tôi chỉ xác định tính thuần của hệ sợi bằng công cụ Sinh học Phân tử Trình tự ITS của DL0002 luôn phân nhóm với đại diện tham chiếu Cordyceps sinensis thuộc ngân hàng CCRC, mã số CCRC 36421 (Kuo và cộng sự, 2005), với bootstrap 99% trên cây MP/MB/ML và 100% trên cây phả hệ NJ Đồng thời, kết quả so sánh với GenBank trên NCBI cho thấy độ tương đồng cao nhất với Cordyceps sinensis (AF291749) Phân tích cấu trúc bậc hai vùng ITS2 cũng khẳng định tính đúng đắn của phương pháp luận đang được áp dụng cho nghiên cứu này trên toàn bộ mẫu phân tích.
3.13: So sánh cấu trúc bậc hai vùng ITS2 mẫu DL0002 với tham chiếu
Cordyceps sinensis (Với mạch sense: bên trái và antisense: bên phải)
Ba mẫu DL0003, DL0006 và DL0007 là các mẫu phân lập khác nhau từ cùng khu vực lấy mẫu Phân tích hình thái đã công bố cho một mẫu nấm và kết luận đây là Ophiocordyceps nevolkiana, với trình tự ITS được GenBank lưu mã HM856642 (Lê Thù Liên và cộng sự., 2010) Sự phân nhóm dựa trên trình tự tham chiếu HM856642 duy nhất có sẵn trong GenBank cho cả bốn cây phả hệ đạt bootstrap 99–100% so với 49 trình tự tham chiếu đại diện cho Cordyceps và các chi lân cận Kết quả phân tích cấu trúc ITS2 ở hai mạch sense và antisense củng cố hoàn toàn nhận định này (Hình 3.14) Do vậy, chúng tôi kết luận DL0003, DL0006 và DL0007 là các trình tự có biến dị của loài Ophiocordyceps nevolkiana, đồng thời khẳng định tính tin cậy của phương pháp luận phân tích được áp dụng và sự đồng nhất giữa phân tích hình thái với dữ liệu phân tử.
3.14: So sánh cấu trúc bậc hai vùng ITS2 mẫu DL0003, DL0006 và DL0007 với tham chiếu Ophiocordyceps nevoliana (Với mạch sense: bên trái và antisense: bên phải
Ba mẫu DL0008, DL0077 và DL0045 phân thành một nhóm nhánh duy nhất với đại diện tham chiếu Paecilomyces javanicus (AB099944), có giá trị bootstrap rất cao (trên 92%) trên cả bốn cây phả hệ Kết quả này cũng khớp với truy vấn trên GenBank/NCBI đối với mẫu DL0045 Định danh sơ bộ dựa trên hình thái quả thể thu được từ DL0008 cho phép kết luận mẫu này thuộc chi Paecilomyces Như vậy, mẫu DL0008, DL0045 và DL0077 thuộc chi Paecilomyces và có quan hệ rất gần với Paecilomyces javanicus.
Hai mẫu DL0031 và DL0049 được phân thành nhóm với nhau, thể hiện trị số bootstrap đạt 99–100% đối với đại diện thuộc chi Simplicilium sp ký hiệu KYK00030 trên bốn cây phả hệ Kết quả tra cứu GenBank trên NCBI cho thấy hai trình tự ITS của các mẫu này có mức độ tương đồng cao nhất với trình tự thuộc chi Simplicilium.
AB378534 Kết quả phân tích cấu trúc bậc hai của vùng ITS2 hoàn toàn ủng hộ quan điểm định danh đề xuất, trong đó sự bảo tồn tuyệt đối được thể hiện rõ trên cấu trúc mạch ITS (hình 3.15) Những thông tin này sẽ hỗ trợ đắc lực cho công tác phân loại dựa trên giải phẫu hình thái sau này Kết hợp toàn bộ dữ liệu từ Sinh học Phân tử đến hình thái học, chúng tôi tạm thời kết luận nhóm nấm này có nguồn gốc rất gần hoặc có thể là các biến dị khác nhau của loài nấm vô tính thuộc chi Simplicillium; trong số các mẫu, quả thể thu được từ mẫu DL0031 đã được tạm thời phân loại thuộc chi Simplicillium. -**Support Pollinations.AI:** -🌸 **Ad** 🌸Powered by Pollinations.AI free text APIs [Support our mission](https://pollinations.ai/redirect/kofi) to keep AI accessible for everyone.
3.15: So sánh cấu trúc bậc hai vùng ITS2 mẫu DL0031, DL0049 với tham chiếu Simplicillium (Với mạch sense: bên trái và antisense: bên phải)
Nhóm các mẫu DL0024, DL0040, DL0041 và DL0042 đã được sơ bộ định danh dựa trên đặc điểm hình thái, ghi nhận thuộc chi Isaria; mẫu DL0024 được khẳng định là Isaria tenuipes (dữ liệu chưa công bố) Kết quả phân nhóm cho thấy sự đồng nhất hoàn toàn trên cả ba cây phả hệ: chúng luôn tạo thành một nhóm đơn (monophyletic) cùng với hai đại diện tham chiếu Isaria tenuipes từ ngân hàng giống SCSGAF ký hiệu SCSGAF0058 (JN851008) và Isaria japonica từ ngân hàng BCC ký hiệu BCC2821 (EU828662) Mẫu DL0048 thiếu thông tin định danh hình thái cũng phân vào nhóm này, cho kết quả truy vấn trên GenBank của NCBI với mức đồng nhất tương đồng với các tham chiếu trên GenBank.
Cordyceps takaomontana (EU807995) Kết luận chúng tôi rút ra ở đây là: mẫu
DL0024 chính là Isaria tenuipes; bốn mẫu còn lại là các biến dị cùng hoặc khác loài có quan hệ họ hàng rất gần với Cordyceps takaomontana (thể hữu tính) và Isaria sp (thể vô tính), và gần nhất là với Isaria tenuipes hay Isaria japonica khi so với các đại diện này ở cả hai mạch sense và antisense, ngoại trừ trường hợp mẫu DL0040 (Hình 3.16).
3.16: So sánh cấu trúc bậc hai vùng ITS2 mẫu DL0024, DL0041, DL0042, DL0048 với các tham chiếu Isaria tenuipes , Isaria japonica , Cordyceps takaomontana (Với mạch sense: bên trái và antisense: bên phải)
Mẫu DL0025 phân nhóm duy nhất với hai đại diện Phytocordycep ninchukispora thuộc ngân hàng giống CCRC ký hiệu CCRC 31900 (Kuo và cộng sự.,
2005) và Cordyceps ninchukispora (FJ765278) Phytocordycep ninchukispora và
Cordyceps ninchukispora là hai tên gọi khác nhau của cùng một loài Kết quả truy vấn trên GenBank của NCBI cho mẫu này cũng ghi nhận kết quả tương đồng nhất ứng với các dữ liệu tham chiếu.
Mẫu nấm Cordyceps ninchukispora (FJ765278) có khả năng là một loài ở thể hữu tính rất gần hoặc chính là Cordyceps ninchukispora Phân tích cấu trúc bậc hai vùng ITS2 cũng hoàn toàn ủng hộ nhận định định danh này, đặc biệt trên mạch sense (Hình 3.17).
3.17: So sánh cấu trúc bậc hai vùng ITS2 mẫu DL0025 với các tham chiếu
Phytocordycep ninchukispora và Cordyceps ninchukispora (Với mạch sense: bên trái và antisense: bên phải)
Hai mẫu DL0027 và DL0029 được xác định sơ bộ dựa trên đặc điểm hình thái Mẫu DL0027 được xác định là Isaria javanica, trong khi mẫu DL0029 có quả thể thu nhận khá đặc thù và được sơ bộ định danh thuộc chi Isaria.