LỜI CẢM ƠN Trong quá trình học tập và thực hiện đề tài “Khảo sát in silico, xây dựng cơ sở dữ liệu phân tử các gen ITS, TEF1-α hướng tới hỗ trợ định danh các loài nấm thuộc họ Ganoderma
TỔNG QUAN 1 Tổng quan về học Ganodermataceae
Đặc điểm sinh học họ Ganodermataceae
Họ Ganodermataceae có cấu trúc bào tử đặc biệt, khác biệt hoàn toàn so với các họ nấm khác, với đa số bào tử hình trứng, bầu dục hoặc gần tròn, gồm hai lớp: lớp ngoài nhẵn và lớp trong có gai nhỏ Trụ chống của bào tử có nhiều hình dạng khác nhau, từ hình bán nguyệt đến hình trụ, khiến đặc điểm này trở thành đặc trưng duy nhất của họ Ganodermataceae Ngoài ra, cấu trúc bề mặt ngoài của chúng khá đa dạng, có thể là hình lưới, hình gai hoặc nhẵn, góp phần nhận biết và phân loại chính xác các loài trong họ.
Họ nấm này có đa dạng thành phần loài với đặc điểm đặc trưng như quả thể dày, có mũ và cuống hoặc không có cuống, phần cuống thường lệch hoặc không rõ Mũ nấm bóng láng và thường có màu sáng như đỏ, vecni, nâu, nâu đỏ hoặc xám Thịt nấm có đặc điểm dai, có nguồn gốc từ gỗ hoặc bì, màu nâu, vàng nâu hoặc tối nâu Bào tầng của nấm dạng hình ống hoặc hình đa giác, phân thành các lớp rõ ràng so với phần thịt nấm Bào tử của nấm có hai lớp màng, trong đó màng ngoài nhẵn còn màng trong có gai nhỏ, đặc điểm chỉ có ở họ Ganodermataceae — không thấy ở bất kỳ loài nấm lớn nào khác, thường có màu rỉ sắt Hầu hết các loài trong họ Ganodermataceae mọc thành cụm, có thể liên kết hoặc rời rạc trên gỗ hoặc tàn dư thực vật dưới tán rừng, một số ít nấm có thể mọc nhiều năm (nấm đa niên).
Phân loại họ Ganodermataceae
Ganoderma có đặc điểm quả thể mọc trên gỗ, có thể có hoặc không có cuống, thường có mũ bóng láng dạng thận hoặc quạt, và thịt nấm màu nâu dai, chứa các ống nấm một tầng hoặc ít khi hai tầng cùng với bào tử hình trứng nhụt một đầu, vỏ bào tử gồm hai lớp, lớp ngoài nhẵn và lớp trong nhẹ gai hoặc sần sùi, có màu vàng rỉ sắt Trong khi đó, chi Amauroderma thường có quả thể đa số có cuống đầy đủ, đính giữa hoặc bên, ít khi không có cuống, mũ không bóng hoặc bóng ít loài, mọc trên gỗ hoặc tàn dư thực vật, thịt nấm gần như trắng hoặc nâu, dai, với ống nấm một tầng ít khi nhiều tầng, và bào tử gồm hai lớp màng hình trứng hoặc gần hình bầu dục, không nhụt đầu, màu nhạt, vỏ ngoài bóng và trong sần sùi.
Giá trị dinh dưỡng của họ Ganodermataceae
Các loài thuộc họ Ganodermataceae chứa nhiều thành phần tự nhiên có hoạt tính sinh học như polysaccharide, acid ganoderic, ergosterol, protein, acid béo không bão hòa, vitamin và khoáng chất (Niu và cộng sự, 2002) Những thành phần này mang lại nhiều lợi ích cho sức khỏe, giúp tăng cường hệ miễn dịch và hỗ trợ phòng ngừa nhiều bệnh tật Chiết xuất từ các loài trong họ Ganodermataceae được sử dụng rộng rãi để nâng cao sức khỏe và duy trì cân bằng sinh lý.
Ganodermataceae có tác dụng phòng và chữa các bệnh như tim mạch, cao huyết áp, viêm gan, tiểu đường, suy nhược thần kinh, khối u và ung thư, góp phần cải thiện sức khỏe toàn diện (Weng và cộng sự, 2010) Ngoài ra, các thành phần trong nấm còn có khả năng ức chế sự phát triển của virus, giúp tăng cường hệ miễn dịch và hỗ trợ điều trị các bệnh liên quan đến hệ miễn dịch như HIV (Mekkawy và cộng sự, 1998).
Bảng 1.1 Các hợp chất có hoạt tính sinh học trong các loài nấm thuộc họ
STT Hợp chất Công dụng
GAT có khả năng giảm sự tăng sinh của một số loại tế bào ung thư, đặc biệt là tế bào ung thư phổi 95D, với độc tính tế bào cao Ngoài ra, GAT đã chứng minh khả năng ức chế thành công sự xâm lấn của tế bào ung thư trong phòng thí nghiệm và ngăn chặn quá trình di căn trong các nghiên cứu in vitro (Chen và cộng sự).
Triterpen là các hợp chất có tiềm năng chống ung thư nhờ khả năng hoạt động chống lại các khối u đang phát triển Theo Lin và cộng sự (2003), chúng gây độc tế bào trực tiếp, làm giảm sự phát triển của tế bào ung thư Nghiên cứu của Gonzalez và cộng sự (2002) xác nhận rằng triterpen có tác dụng ức chế sự tăng trưởng của các tế bào khối u, cho thấy tiềm năng ứng dụng trong điều trị ung thư.
3 polysaccharide có khả năng tăng cường phản ứng miễn dịch chống khối u bằng cách thúc đẩy hoạt động của các tế bào diệt tự nhiên và tế bào lympho T gây độc tế bào (Pan và cộng sự, 2013) Mặc dù polysaccharide thường không tác động trực tiếp gây độc tế bào ung thư, nhưng chúng có vai trò quan trọng trong việc nâng cao hoạt động miễn dịch trung gian của cơ thể để hỗ trợ chống lại ung thư (Knez và cộng sự, 2018) Do đó, polysaccharide là thành phần tiềm năng trong các chiến lược hỗ trợ điều trị ung thư dựa trên tăng cường hệ miễn dịch của cơ thể.
4 Acid lucidenic O và lucidenic lactone Ức chế gen sao chép ngược loại 1 của HIV (Ngai P.H.K,
5 Hợp chất sterol Có hoạt tính phổ kháng khuẩn rộng và tác dụng diệt khuẩn (Darija Cửr và cộng sự, 2018) Ganomycins A và
B thể hiện hoạt động chống lại nhiều vi khuẩn Gram âm và Gram dương (Mothana R A và cộng sự, 2003)
Giới thiệu chung về một số loài thuộc họ Ganodermataceae
Quả thể có màu vàng đến nâu đỏ, bóng láng, mặt trên mũ nấm có cấu trúc vòng tròn và vân thớ phóng xạ Mép mũ mỏng hoặc hơi tà, có lượn sóng và chia thùy, vỏ bóng như vecni, màu vàng rỉ sắt, nâu đỏ hoặc nâu hồng, kích thước khoảng 2–20 x 3–25 cm, dày 0,5–1,5 cm Thịt nấm cứng, khi non màu trắng, sau chuyển sang vàng nhạt rồi nâu vàng, không phân tầng Hệ sợi dimitric gồm sợi khung vách ngang và sợi bện, dài 2–7 mm, màng dày, trong suốt Hệ sợi nuôi cấy trong môi trường thạch ban đầu màu trắng, sau chuyển sang vàng nhạt Bào tầng dạng ống nhỏ, mỗi milimet có 4-5 ống, miệng ống tròn đều, sâu 0,2–0,7 cm, khi non màu trắng, già chuyển sang vàng nhạt Bào tử hình trứng nhụt một đầu, dài 5,0-6,5 x 8,5-11,5 µm, có lớp màng hai lớp màu nâu rỉ sắt, nội dung trong suốt, mỗi đỏm mang 3-4 cuống bào tử Cuống nấm ngắn, thường đính vào phần lõm của mũ, có màu giống mũ, bóng láng, hình trụ hoặc hơi dẹt, kích thước 0,5-1,5 x 3–17 cm Nấm thường mọc trên gốc cây sống hoặc đã chết của nhiều loại gỗ, đặc biệt phổ biến trên các câu họ Đậu, gây mục gỗ màu Từ lâu, con người đã biết sử dụng loại nấm này để trị bệnh, gọi là nấm “linh chi”.
& Inger Johansen, 1980; Lê Bá Dũng, 2003; Trinh Tam Kiệt, 2011)
Ganoderma lucidum, còn gọi là nấm linh chi, nổi bật với hình dáng đặc trưng như quả thể nấm có mặt trên và dưới rõ rệt Quả thể của nấm linh chi có thể được quan sát ở mặt trên, mặt dưới, cũng như ở mặt dưới khi còn tươi và khi đã khô, thể hiện sự đa dạng trong các giai đoạn phát triển Bào tử của nấm linh chi có hình trứng, là thành phần quan trọng trong quá trình sinh sản của nấm Ngoài ra, sợi nấm tham gia vào quá trình sinh sản và liên kết với các sợi khác ở cuống nấm, tạo thành hệ thống phân bố và phát triển của chủng loại này (Gurpreet Kaur và cộng sự, 2017)
Quả thể có màu nâu đất hoặc xám, không bóng láng, với mũ nấm non hình cực tròn và phát triển thành dạng quạt khi trưởng thành Mép mũ có lượn sóng, bề mặt nhiều lớp màu xám hoặc nâu nhạt, phủ lớp vỏ xù xì Kích thước quả thể khoảng 18-20 x 28-30cm, dày 0,5-2,0cm Thịt nấm cứng, màu trắng khi non, chuyển sang màu nâu đất khi già, với mô đồng nhất không phân tầng Hệ sợi dimitric gồm sợi khung vỏch ngang và sợi bện, dài 2,0-7,0mm, màng dày, nội chất trong suốt, hầu như không màu Trong nuôi cấy môi trường thạch, hệ sợi ban đầu màu trắng rồi chuyển sang vàng nhạt Bào tầng dạng ống nhỏ, phù hợp để nhận diện đặc trưng của loài nấm này.
Nấm có chiều dài khoảng 9 milimet, gồm từ 4 đến 6 ống, miệng ống hình tròn hoặc bầu dục, nằm sâu trong đất từ 0,2 đến 10cm Miệng ống khi nấm non có màu trắng, đến khi già chuyển sang màu vàng sậm hoặc nâu nhạt Bào tử hình trứng nhụt một đầu, kích thước từ 4,0-6,5 x 7,0-9,0 (-10) μm; có màng hai lớp (lớp ngoài nhẵn, lớp trong có gai nhẹ), màu nâu rỉ sắt Đảm đơn bào, hình chùy, kích thước 7-10 x 12-14 μm, màng mỏng, nội chất không trong suốt; mỗi đảm có từ 3-4 cuống mang bào tử Nấm không có cuống đính, mọc rời gốc, gây mục gỗ màu nâu Chúng thường mọc trên gốc cây đã chết của nhiều loại gỗ, đặc biệt phổ biến trên các cây họ Đậu như lim xanh, lim vàng, phượng vĩ, và có giá trị dược liệu quý Các nghiên cứu như của Hymesnomyc (1887), Teng (1934), Trịnh Tam Kiệt (2011), Pegler (1973), và Zhao cùng cộng sự (1981) đã ghi nhận về loài nấm này.
Hình 1.2 mô tả đặc điểm của nấm Ganoderma applanatum với các hình ảnh thể hiện quả thể ở mặt trên tươi, mặt dưới tươi, cạnh trước và sau khi khô, cùng với bào tử sinh sản Quả thể nấm Ganoderma applanatum có hình dạng đặc trưng, giúp nhận diện dễ dàng và có khả năng sinh sản qua các bào tử phân bố rộng Các đặc điểm này rất quan trọng trong việc nghiên cứu và phân loại loại nấm này, đồng thời cung cấp thông tin hữu ích cho các hoạt động ứng dụng y học và sinh học.
10 hình trứng f Sợi nấm sinh sản g Sợi nấm liên kết với các sợi ở cuống h Sợi nấm liên kết (Gurpreet Kaur và cộng sự, 2017)
Quả thể nấm có màu nâu đất đến nâu xám, với mũ nấm non dạng cục tròn màu trắng, phát triển thành dạng quạt, không bóng, có màu nâu đất Kích thước quả thể từ 10–80 cm, thịt nấm cứng, màu trắng khi non, chuyển sang nâu đất, không đổi màu dưới tác dụng của KOH Hệ sợi trimitric gồm sợi không vách ngăn ngang và sợi bện không màu hoặc màu vàng nhạt, nhỏ kích thước 2–3 mm, màng dày, nội chất màu vàng nhạt; hệ sợi trong nuụi cấy thuần khiết ban đầu màu trắng, sau chuyển sang vàng nhạt Bào tầng dạng ống nhỏ, bề mặt phẳng, miệng ống non màu trắng, già chuyển sang vàng, lớp bào tầng màu vàng, ống hình gần tròn hoặc bầu dục, dày 5–6 ống/millimet, có hình dạng gần tròn hoặc hình bầu dục Bào tử hình trứng nhụt một đầu, kích thước 6,0–9,0 x 10,0–12,5 micromet, màng hai lớp, lớp ngoài nhẵn, lớp trong có gai nhẹ, nội chất màu nâu rỉ sắt Đảm đơn hình chùy ngắn, kích thước 7–12 micromet, màng mỏng, nội chất trong suốt, mỗi đảm có 3-4 cuống mang bào tử Nấm không cuống, mọc rời rạc trên gốc, ký sinh hoặc hoại sinh trên gỗ mục, gây mục gỗ màu trắng (Zhao et al., 1981; Corner, 1983).
Hình 1.3 mô tả quả thể của Ganoderma australe ở các trạng thái khác nhau, bao gồm mặt trên và mặt dưới của quả thể tươi và khô, giúp nhận diện đặc điểm hình thái của nấm Các thành phần như bào tầng, bào tử sinh sản hình trứng, cùng các sợi nấm sinh sản và liên kết với nhau, đóng vai trò quan trọng trong quá trình sinh trưởng và phát triển của nấm Ganoderma australe Thông tin từ Gurpreet Kaur và cộng sự (2017) cung cấp kiến thức chuyên sâu về hình thái học của loài nấm này, hỗ trợ việc phân loại và nghiên cứu nấm dược liệu.
Các phương pháp phân loại
2.1 Phương pháp phân loại cổ điển
Từ 120 năm trước, nhà Nấm học Phần Lan Kersten đã phân lập và xây dựng chi nấm Ganoderma thành một chi độc lập với đặc điểm là bào tử có lớp vỏ kép hình trứng và bề mặt sần sùi, đánh dấu bước tiến quan trọng trong nghiên cứu và phân loại họ nấm Ganodermataceae Nghiên cứu này giúp các nhà nấm học về sau dễ dàng phân biệt và loại trừ nhóm Ganoderma khỏi các nhóm như Polyporus và Fomes, góp phần làm rõ đặc điểm và hệ thống phân loại của họ nấm này.
Tác giả Patouillard đã đóng góp quan trọng vào việc tổng quát hóa đặc điểm bào tử của Ganoderma, giúp nhận diện chính xác loại nấm này Tên chi Ganoderma thể hiện rõ hình thái quả thể bên ngoài, trong đó "derma" nghĩa là lớp vỏ, còn "gano" ám chỉ tính bóng láng của bề mặt Theo nghiên cứu của Lê Xuân Thám và cộng sự, sự xuất hiện của các vách chống mảnh xen kẽ và kết nối trong cấu trúc của Ganoderma là đặc điểm nhận dạng quan trọng giúp phân biệt loại nấm này với các loại khác.
Các tác giả như Pegler, Yuong, Trịnh Tam Kiệt, Lê Xuân Thám, và Lê Bá Dũng đã xác nhận rằng cấu trúc gai liền với trụ chống được tìm thấy cùng với các mấu lồi nhỏ dạng lỗ nẩy mầm ở đáy bào tử Những phát hiện này giúp bổ sung kiến thức về cấu trúc sinh học của loài, góp phần xác định đặc điểm phân loại chính xác.
Năm 1905, Murrill phát hiện nhóm nấm với cuống đính gần tâm, chu trình sống ngắn, rất giống các loài Ganoderma, và đề nghị thành lập một chi mới gọi là Amauroderma, với đặc điểm lớp vỏ nâu đen đồng nhất Chi này còn có cấu trúc bào tử đảm khá đồng đều, giống với chi Ganoderma, nhưng hình cầu hoặc gần cầu, với lỗ nảy mầm đã tiến hóa rõ hơn thành mấu nhỏ khó nhận biết Các tài liệu gần đây của Trịnh Tam Kiệt, Lê Bá Dũng, Lê Xuân Thám, Ngô Anh cũng xác nhận những đặc trưng này của chi Amauroderma.
Nhà nấm học Hà Lan năm 1948 đã xác định họ Ganodermataceae, tách ra từ họ Polytaraceae, và đến nay đã nhận được sự công nhận rộng rãi trong cộng đồng khoa học Quyết định này góp phần làm rõ đặc điểm và phân loại các loài nấm trong họ Ganodermataceae Trước đó, các nhà nghiên cứu đã có những đóng góp quan trọng vào việc phân loại và nghiên cứu các loại nấm này, giúp mở rộng kiến thức về đa dạng sinh học của họ Ganodermataceae.
Năm 1933, chính tác giả đã đề xuất phân họ Ganodermataceae và cho rằng chúng có thể được phân thành một họ độc lập Sau đó, một tác giả khác sử dụng công nghệ cao hơn, như kính hiển vi điện tử quét (SEM), đã khảo sát và xác định thêm hai chi mới thuộc họ Ganodermataceae là Humphreya với 4 loài và Haddowia với 2 loài Đây được xem là bước ngoặt quan trọng trong lịch sử hệ thống họ Ganodermataceae Tuy nhiên, trước đó gần như chưa có tác giả nào nghiên cứu rõ về quan hệ phát sinh và tiến hóa của họ này, đặc biệt là quá trình tiến hóa bào tử đảm Các bằng chứng của các tác giả như Steyaert (1972, 1977) đã xác lập 4 kiểu bào tử đặc trưng cho bốn chi của họ Ganodermataceae, góp phần làm rõ hơn về sự đa dạng và tiến hóa của nhóm này.
Nghiên cứu từ năm 2003 về thành phần loài của họ nấm Ganodermataceae cho thấy họ nấm này có đa dạng về cấu trúc bào tử, bào tầng và hình dạng quả thể Trong đó, cấu trúc bào tử là đặc điểm ổn định nhất, ít biến đổi so với các đặc điểm khác khi điều kiện môi trường thay đổi, điều này trở thành yếu tố quan trọng để phân loại các loài trong họ.
Dưới đây là 13 nghiên cứu quan trọng của các tác giả, cung cấp kiến thức nền tảng cho các nhà khoa học nghiên cứu về họ Ganodermataceae trong các công trình tương lai Những nghiên cứu này giúp kế thừa và mở rộng kiến thức về đặc điểm sinh học, phân loại, và tiềm năng ứng dụng của họ Ganodermataceae Việc nắm bắt các kết quả này sẽ hỗ trợ các nhà khoa học trong việc phát triển các nghiên cứu chuyên sâu, góp phần thúc đẩy lĩnh vực nghiên cứu về các loại nấm dược liệu này.
Các loài thuộc họ Ganodermataceae có các cách sống đa dạng, phản ánh quá trình tiến hóa cấu trúc bào tử của chúng Quá trình này đã dẫn đến sự hình thành các chi chính như Ganoderma, mở ra nhiều cơ hội nghiên cứu về đặc điểm sinh học và ứng dụng của các loài trong họ này Hiểu rõ về hình thái và sự tiến hóa của bào tử giúp nâng cao kiến thức về sinh thái học và tiềm năng sử dụng trong y học và công nghiệp.
Hiện nay, nhờ vào công nghệ sinh học phân tử hiện đại, việc nghiên cứu, xác định sự tiến hóa và phân loại các loài như Amauroderma, Humphreya và Haddowia trở nên dễ dàng hơn Công nghệ này đã cải thiện khả năng phân tích dữ liệu, giúp các nhà khoa học hiểu rõ hơn về đặc điểm và mối liên hệ giữa các loài nấm fungi, góp phần nâng cao đồng bộ trong công tác xác định loài và thúc đẩy nghiên cứu phát triển trong lĩnh vực sinh học phân tử.
2.2 Phương pháp phân loại dựa trên phân tử
Phương pháp khuếch đại trình tự mục tiêu (PCR – Polymerase Chain Reaction) là kỹ thuật nhanh chóng tạo ra nhiều bản sao của đoạn DNA mà không cần qua quá trình tạo dòng PCR dựa trên nguyên tắc tổng hợp DNA từ mạch khuôn, sử dụng enzyme polymerase và cặp mồi đặc hiệu để nhân số lượng bản sao của đoạn DNA mục tiêu lên hàng triệu lần Phương pháp này không dựa vào giải phẫu hình thái hay chu trình sống của loài, giúp thuận lợi trong việc nghiên cứu các giai đoạn khác nhau trong vòng đời của nấm như thể quả, nấm rễ cộng sinh (mycorrhizas) và hệ sợi nấm thuần PCR góp phần nâng cao độ chính xác trong thu thập dữ liệu sinh học đa dạng của giới Nấm, đồng thời hỗ trợ phân loại nấm trong tự nhiên theo các nghiên cứu phân tử đáng tin cậy (Hibbett và Vilgalys, 1993; Bunyard và cộng sự, 1994; Drehmel và cộng sự, 1999; Liu và cộng sự).
Các kỹ thuật phân tử ngày càng đóng vai trò quan trọng trong xác định mối quan hệ phân loại và phát sinh chủng loài của các nhóm nấm cùng loài Việc phân định giới hạn phân loài dựa trên các đặc điểm hình thái có thể được nâng cao bằng các phương pháp dựa trên DNA như RAPD, AFLP, RFLP và phân tích trình tự DNA (ITS) Các kỹ thuật này giúp các nhà nghiên cứu xác định chính xác hơn các đặc điểm di truyền của nấm, từ đó phân loại và nghiên cứu sự đa dạng sinh học trong cộng đồng nấm hiệu quả hơn.
Các phương pháp phân tử như TEF1, nrSSU, RPB1, RPB2 có thể được kết hợp với phương pháp hình thái để xác định các loài nấm với độ tin cậy cao (Khush và cộng sự, 1992; Calonje và cộng sự, 1997) Phương pháp phát sinh loài phân tử giúp thiết lập mối quan hệ tiến hóa dựa trên cây phát phả hệ phân tử, cung cấp nguồn thông tin quý giá để hiểu rõ hơn về các mối quan hệ nội loài trong nhóm nấm (Mitchell và cộng sự, 1995).
Vùng ITS là locus phổ biến nhất được sử dụng trong nghiên cứu về mức độ phân giới để xác định loài, nhờ vào khả năng biến động hiệu quả của các trình tự ITS trong việc giải quyết các câu hỏi về quan hệ phát sinh ở các taxon gần họ hàng Nhiều nghiên cứu đã thành công trong việc xây dựng lại lịch sử tiến hóa dựa trên các trình tự ITS, phản ánh tầm quan trọng của vùng này trong sinh học phân tử Vùng ITS có lẽ là vùng được giải trình tự DNA rộng nhất hiện nay trong giới Nấm, và là vùng đặc trưng thuận lợi cho hệ thống phân tử ở cấp độ loài, giúp phân loại và xác định chính xác các loài nấm một cách hiệu quả.
Các vùng ITS có độ dài từ 600 đến 700 bp, là các vùng tiến hóa nhanh dễ thay đổi về trình tự và độ dài, trong khi các vùng lân cận lại rất bảo thủ, giúp thiết kế mồi chung cho nhân bản vùng ITS Số bản sao các đoạn lặp lại của rDNA lên tới 30.000 trong một tế bào, làm cho ITS trở thành đối tượng hấp dẫn trong nghiên cứu tiến hóa, phát sinh loài và đa dạng di truyền ITS là kỹ thuật quan trọng trong phân loại phân tử các nhóm có mối liên hệ gần, vì nó giữ tính bảo thủ cao trong cùng loài nhưng lại thay đổi giữa các loài khác nhau Các nghiên cứu dựa trên nrDNA hoặc chuỗi ITS giúp hiểu rõ hơn về quá trình tiến hóa và lai tạo ở các loài thực vật khác nhau.
Hình 1.4 Hình biểu diễn hệ thống cấu trúc vùng gene ITS
Phả hệ phân tử
3.1 Phả hệ phân tử trong nghiên cứu phát sinh loài
Xây dựng cây phát sinh loài là quá trình nghiên cứu tiến hóa và mối quan hệ giữa các loài để dự đoán các mối liên hệ sự phát sinh loài (Potter, 2008) Các mối quan hệ di truyền giữa các loài có thể được biểu diễn thông qua cây phát sinh loài, giúp các nhà nghiên cứu xác định mối quan hệ tiến hóa chính xác hơn (Zhou và cộng sự, 2004) Nhờ vào các tiến bộ trong nghiên cứu bộ gen, DNA và protein, nhiều phương pháp tính toán hiện đại đã được phát triển để xây dựng cây phát sinh loài dựa trên so sánh trình tự gen của các loài khác nhau, mặc dù việc liên kết nhiều chuỗi trình tự gặp hạn chế khi độ tương đồng thấp (Potter, 2008) Thuật toán ClustalW giúp sắp xếp trình tự chính xác hơn, đặc biệt khi các trình tự có sự khác biệt lớn, từ đó hỗ trợ xây dựng cây phát sinh loài chính xác hơn (Potter, 2008) Quá trình xây dựng cây phát sinh loài gồm hai bước chính: xác định các trình tự có mức độ tương đồng cao dựa trên năng lượng liên kết, rồi xác định thứ tự liên kết các chuỗi để thiết lập các mối quan hệ di truyền giữa chúng (Potter, 2008) Cây phát sinh loài thể hiện mối quan hệ theo hệ nhị phân và có thể là cây có gốc hoặc không gốc, minh họa rõ nét các quan hệ tiến hóa giữa các loài (Potter, 2008).
17 gọi là một cạnh hoặc chi nhánh Chiều dài của các chi nhánh đại diện cho thời gian, khoảng cánh tiến hóa
3.2 Các bước để nghiên cứu phát sinh loài
Một phát sinh loài cơ bản gồm các bước sau (Lê Huyền Ái Thúy và cộng sự): + Bước 1: Thu nhận trình tự
+ Bước 3: Lựa chọn mô hình tiến hóa tương thích
+ Bước 4: Xây dựng và đánh giá cây phát sinh loài
Việc thu nhận trình tự chính là bước quan trọng trong xây dựng cây phát sinh chủng loại phân tử, giúp đảm bảo tính chính xác và đáng tin cậy của phân tích tiến hóa Nếu trình tự không được thu nhận tốt, cây phát sinh chủng loại sẽ mất giá trị để giải thích các quan hệ tiến hóa giữa các loài dựa trên trình tự gen hoặc protein Các trình tự sử dụng trong phân tích đều là các trình tự tương đồng (homologous), cho thấy chúng có chung nguồn gốc tổ tiên, qua đó phản ánh mối liên hệ tiến hóa giữa các loài Để xác định các trình tự tương đồng một cách chính xác, công cụ trực tuyến BLAST (Basic Local Alignment Search Tool) được coi là phương pháp tin cậy và phổ biến nhất trong nghiên cứu sinh học phân tử.
ClustalW là phần mềm hỗ trợ đắc lực trong quá trình sắp xếp cột cho các dữ liệu trình tự DNA, giúp chuẩn bị dữ liệu cho việc xây dựng cây phát sinh loài Sau khi sắp gióng cột bằng ClustalW, dữ liệu sẽ được sử dụng trong các chương trình xây dựng cây để phân tích mối quan hệ tiến hóa Kết quả của cây phát sinh loài phụ thuộc vào bước sắp xếp cột, vì vậy phân tích mô hình tiến hóa dựa trên dữ liệu đã sắp xếp là điều cần thiết để xác định hướng đi phù hợp trong nghiên cứu sinh học phân tử Thay đổi chiều dài của trình tự sau quá trình sắp gióng cột có thể ảnh hưởng đến kết quả phân tích, và các bộ dữ liệu để xây dựng cây phát sinh loài thường khác nhau, ngay cả khi các chuỗi trình tự được sắp xếp cùng một cách.
Các vùng trình tự biến động và indels đóng vai trò quan trọng trong việc gây ra sự sai khác về chiều dài của các trình trong bộ dữ liệu sau quá trình sắp xếp cột Đồng thời, 18 dài bằng nhau là một đặc điểm quan trọng để đảm bảo tính nhất quán của dữ liệu trình tự DNA, giúp phân tích chính xác hơn Việc hiểu rõ ảnh hưởng của các biến động này giúp cải thiện quá trình phân tích và so sánh các dữ liệu trình tự di truyền.
3.2.3 Lựa chọn mô hình tiến hóa
Việc chọn mô hình tiến hóa là yếu tố quan trọng trong quá trình sắp xếp cột và xây dựng cây phát sinh loài dựa trên dữ liệu trình tự DNA Các mô hình tiến hóa được lựa chọn dựa trên kết quả của quá trình sắp xếp cột, gồm hai loại chính: mô hình dựa trên sự thay thế giữa các trình tự và mô hình dựa trên xác suất, tần suất thay thế của các nucleotide trong các vùng khác nhau của bộ dữ liệu Mặc dù các thông số trong mô hình thể hiện mức độ quan trọng của dữ liệu, nhưng mô hình ít tham số thường tối ưu và chính xác hơn, vì mỗi tham số đều có thể gây sai số Thêm quá nhiều tham số vào mô hình có thể dẫn đến sai lệch, tốn thời gian và công sức trong quá trình tìm kiếm mô hình phù hợp Quá trình so sánh trình tự DNA sử dụng mô hình hai tham số giúp xác định sự khác biệt cơ bản của các trình tự, trong khi mô hình sáu tham số cung cấp phân loại chi tiết hơn Để xác định mô hình tiến hóa tối ưu cho trình tự DNA, tính năng "describe tree" trong phần mềm PAUP được sử dụng, dựa trên khả năng dự đoán tỷ lệ thay thế ngược lại của các tham số và phân phối gamma cùng tỷ lệ các vùng trình tự bất biến Thông thường, cây phát sinh loài như cây Neighbor-Joining phù hợp với mô hình này vì việc thiết lập các tham số chủ yếu phụ thuộc vào trình tự nucleotide hơn là cấu trúc địa hình học.
3.2.4 Xây dựng cây phát sinh loài
Phương pháp xây dựng cây phát sinh loài dựa trên hai phương pháp chính: phương pháp khoảng cách và phương pháp đặc tính Phương pháp khoảng cách tính toán khoảng cách liên kết giữa các cặp nucleotit theo tiêu chuẩn tối ưu để xây dựng cây, thường áp dụng phương pháp Neighbor-Joining Trong khi đó, phương pháp đặc tính xây dựng cây dựa trên các đặc điểm của từng trình tự, sau đó tối ưu hóa theo các mô hình tiến hóa như Maximum Parsimony và Maximum Likelihood để tìm ra cây phù hợp nhất với dữ liệu thực tế Các phương pháp này đã được chứng minh là hữu ích trong phân tích cây phát sinh loài phân tử (Saitou, 1996; Li, 1997).
Maximum likelihood (ML) là phương pháp thống kê phổ biến trong phân tích phát sinh loài dựa trên mô hình xác suất Phương pháp này tìm kiếm mô hình tiến hóa phù hợp nhất với dữ liệu quan sát bằng cách xác định khả năng tối đa, dựa trên sắp xếp cột của các vị trí base trong chuỗi trình tự ML xem xét cả giá trị trung bình và phương sai, giúp xác định khả năng tối đa phù hợp với dữ liệu di truyền của một sinh vật cụ thể Cây phát sinh loài sử dụng phương pháp ML để xây dựng các mô hình tiến hóa chính xác và tin cậy.
ML đòi hỏi lượng lớn thời gian để tính toán và không thể cùng lúc tìm kiếm mô hình tiến hóa phù hợp và tối ưu hóa các mô hình thay thế phù hợp với dữ liệu trước Phần mềm PAUP giúp giảm thiểu thời gian xử lý và cho phép lặp đi lặp lại quá trình tìm kiếm cây ML tối ưu nhất, đảm bảo hiệu quả và chính xác trong phân tích tiến hóa.
Phương pháp khả năng tối đa (Maximum Parsimony - MP) là kỹ thuật hà tiện tối đa nhằm chọn lựa cây tiến hóa có số lượng đặc tính biến đổi thấp nhất để giải thích dữ liệu quan sát MP được sử dụng rộng rãi trong phân tích quan hệ phát sinh loài dựa trên mô hình xác suất, xem xét cả giá trị trung bình và phương sai để xác định khả năng tối đa dựa trên dữ liệu di truyền Cây dựa trên phương pháp MP luôn là cây ngắn nhất với số đơn vị phân loại tối thiểu, mang lại độ tin cậy cao trong phân tích phát sinh loài Tuy nhiên, độ chính xác và tính nhất quán thống kê của phương pháp này có thể khác nhau và phụ thuộc vào các thuật toán phức tạp cũng như đặc điểm của dữ liệu MP có độ tin cậy thấp khi tỷ lệ sai khác giữa các vùng trình tự không đồng nhất, và thường sinh ra nhiều cây có cùng điểm số tiến hóa, mỗi cây đều được tối ưu dựa trên nhóm và nhánh hiện tại có độ bảo tồn cao trong dữ liệu Phương pháp này chủ yếu xây dựng cây dựa trên mức độ tương đồng của các trình tự di truyền, giúp ích trong việc xác định các mối quan hệ phát sinh loài chính xác hơn.
Thuật toán Neighor-Joining (NJ) là phương pháp phổ biến để xây dựng cây khoảng cách tiến hóa mà không phụ thuộc vào các tiêu chí tối ưu hóa cụ thể nào Quá trình bắt đầu bằng cách xây dựng các trình tự theo mô hình phân rã hình ngôi sao, trong đó hai trình tự có mức độ tương đồng cao nhất sẽ được nhóm lại với nhau thành một nhánh Sau đó, trình tự còn lại sẽ được so sánh với nhánh vừa tạo để xác định khoảng cách tiến hóa, và quy trình này lặp lại cho đến khi chỉ còn một trình tự cuối cùng, hình thành nên cây phân nhánh hoàn chỉnh.
Sau khi xây dựng thành công cây phát sinh loài, bước tiếp theo là đánh giá các đặc điểm địa hình học (topology) của cây để xác định mức độ ý nghĩa của cấu trúc Quá trình này thường được thực hiện bằng phương pháp đánh giá giá trị bootstrap, được giới thiệu bởi Efron vào năm 1979 và khẳng định bởi Felsenstein (1985) là phương pháp quan trọng để đánh giá độ tin cậy của cây phát sinh loài Phân tích bootstrap đánh giá các cấu trúc liên kết của cây dựa trên số lần lặp lại giả định của dữ liệu, với kết quả thể hiện qua các tỷ lệ bootstrap giúp xác định các đơn ngành của nhánh cây phát sinh loài Quá trình tính giá trị bootstrap gồm hai bước chính: so sánh dữ liệu mới được thiết lập bằng cách đảo chỗ ngẫu nhiên các vị trí trong chuỗi trình tự và so sánh với bộ dữ liệu ban đầu, từ đó tính toán tỷ lệ ngành cụ thể xuất hiện trong nhánh cây Giá trị bootstrap trên 70% thể hiện mức độ đáng tin cậy cao và hỗ trợ mạnh mẽ trong việc phân tích và xác định các đặc điểm của cây phát sinh loài.
502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared
Tình hình nghiên cứu
Ở Việt Nam các tác giả nghiên cứu về họ nấm Ganodermataceae Donk, phần lớn tập trung nghiên cứu ở các miền Bắc như tác giả Trịnh Tam Kiệt (1980, 1981, 1996,
2011, 2012…), Phan Huy Dục và cộng sự (2004), Đảm Nhận (1996), Nguyễn Nghĩa Thìn và Mai Văn Phô (2003), các công trình này nghiên cứu về tính đa dạng của họ nấm
502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared
Ganoderma và Amauroderma ở Nam Tây Nguyên Ở miền Nam có tác giả Lê Xuân
Thám (1996, 2005, 2009, 2011) đã nghiên cứu thành phần loài của họ nấm
Ganodermataceae ở Vườn Quốc gia Cát Tiên Nguyễn Phương Đại Nguyên (2013) đã có một số công trình nghiên cứu về nấm lớn, trong đó có chi nấm Ganoderma
Trên thế giới việc nghiên cứu về nấm lớn nói chung và họ Ganodermataceae nói riêng đã được thực hiện bởi nhiều tác giả: Iarevskii (1913), Khincova S và cộng sự
(1986) các tác giả này chỉ tập trung nghiên cứu những đặc trưng cơ bản của họ nấm
Ganodermataceae Patouillard (1928) và Steyaert (1972) đã nghiên cứu rất rộng về giới
502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared
502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared
VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 1 Vật liệu
Phương pháp nghiên cứu
Thu nhận thông tin và trình tự các loài nấm từ ngân hàng gen
Sắp gióng cột đa trình tự và xóa những trình tự không rõ ràng
Lựa chọn mô hình tiến hóa tối ưu
Xây dựng cây phát sinh loài bằng phương pháp NJ,ML,MP
Phân tích các giá trị bootstrap và so sánh cây với các bài báo trước đó
2.1 Thu nhận thông tin gen và cặp mồi
Dựa trên nghiên cứu của ông Barnes và cộng sự (2018) cùng các bài báo về gen ITS và TEF1-α, chúng tôi đã thu thập thông tin về vai trò, chức năng, vị trí nằm trên exon và mức độ bảo tồn của các gen này Các nhà nghiên cứu thường chọn gen ITS và TEF1-α để hỗ trợ xác định các loài trong họ Ganodermataceae nhờ vào đặc tính phân biệt rõ ràng và khả năng phân bố rộng rãi của chúng Bên cạnh đó, tiềm năng của cặp mồi phù hợp của các gen này cũng được khảo sát nhằm xác định tiêu chí đánh giá và kích thước sản phẩm khuếch đại khi sử dụng cặp mồi này trong quá trình phân tích DNA.
2.2 Đánh giá các thông số vật lí và kiểm tra độ đặc hiệu của mồi
Sau khi thu nhận thông tin và trình tự của cặp mồi, bước tiếp theo là kiểm tra và đánh giá các thông số của cặp mồi bằng phần mềm IDT analyzer để xác định các đặc điểm vật lý quan trọng Tiếp theo, kiểm tra vị trí bắt cặp của mồi với trình tự đích bằng phần mềm Annhyb để đảm bảo độ chính xác Để đảm bảo tính đặc hiệu của mồi, chúng tôi sử dụng phần mềm trực tuyến BLAST nhằm đánh giá độ phổ quát của đoạn mồi và xác định các loài có mức độ tương đồng trên ngân hàng dữ liệu NCBI Đồng thời, chúng tôi lấy các trình tự FASTA của gen từ ngân hàng GenBank của NCBI, sắp xếp chúng phù hợp với cặp mồi để kiểm tra xem kích thước sản phẩm dự kiến có dao động nhiều so với các kết quả đã công bố về gen đã chọn hay không.
2.3 Xây dựng bộ dữ liệu DNA
Thu nhận trình tự DNA của các loài nấm họ Ganodermataceae dựa trên các nguồn chính như bài báo của Li-Wei Zhou và cộng sự (2014), Diogo H Costa-Rezende và cộng sự (2020), cùng dữ liệu trên GenBank Bộ dữ liệu này sau đó được sử dụng để phân tích phát sinh loài, giúp xác định mối quan hệ tiến hóa giữa các loài trong họ Ganodermataceae Chương trình MEGA X được sử dụng để xây dựng cây phát sinh loài, hỗ trợ việc hiểu rõ hơn về sự phân loại và mối liên hệ giữa các loài nấm này, nâng cao hiệu quả nghiên cứu trong lĩnh vực hệ thực vật học và nấm học.
2.4 Trình tự mồi sử dụng cho đề tài
Bảng 2.1 Bảng thông tin các trình tự sử dụng trong nghiên cứu
Gen Mồi 5’ –3’ Trình tự Chiều dài Tài liệu tham khảo
AACCTGCGG 19 White và cộng sự, 1990
ATTGATATGC 20 White và cộng sự, 1990
TCAAGAACATG 21 Wendland và cộng sự, 1997
AGACGTCCTG 20 Wendland và cộng sự, 1997
2.5 Đồng bộ hóa bộ dữ liệu
Sau khi tổng hợp, bộ dữ liệu được đồng bộ lại sau khi dựng cây cục bộ (cây phát sinh loài thô), giúp đảm bảo tính nhất quán của các trình tự Quá trình này bao gồm sắp xếp lại cột, loại bỏ các trình tự sai khác trong các gen có độ tương đồng cao, nhằm tạo ra sự đồng nhất về chiều dài các trình tự Việc đồng bộ này nâng cao độ tin cậy và giá trị bootstrap của cây phát sinh loài, đảm bảo phân tích chính xác hơn trong quá trình nghiên cứu.
2.6 Dò tìm mô hình tiến hóa
Để xác định mô hình tiến hóa phù hợp nhất, sử dụng chức năng Find Best DNA/Protein Models trong phần mềm JmodelTest ver 2.1.10, nhằm chọn mô hình có điểm số AIC thấp nhất là mô hình tối ưu để dựng cây xác suất tối đa (Maximum Likelihood) Các cây Phép Xếp Hàng Liên Kết (NeighbourJoining) và cây Đơn Giản Tối đa (Maximum Parsimony) được xây dựng dựa trên mô hình tiến hóa mặc định của phần mềm MEGA X Việc chọn mô hình phù hợp đóng vai trò quan trọng trong phân tích hệ phylogenetic chính xác và tin cậy hơn.
2.7 Xây dựng cây phát sinh loài
Để phân tích các vùng gen bảo tồn, cần kiểm tra và thu nhận các trình tự tương đồng bằng công cụ BLAST Dựa trên các trình tự này, tiến hành xây dựng cây phát sinh chủng loại phân tử theo phương pháp Maximum Likelihood (ML) bằng phần mềm MEGA X, sử dụng các thông số mô hình tiến hóa từ chức năng Test Models Ngoài ra, cây tiến hóa cũng được xây dựng theo phương pháp Neighbor Joining (NJ) trong MEGA X, nhằm xác định mối quan hệ phát sinh của các loài dựa trên thuật toán này Để tăng tính chính xác, phương pháp Maximum Parsimony (MP) được thực hiện với 1000 lần bootstrap để kiểm tra độ tin cậy của cây phả hệ Kết quả phân tích, kiểm tra và đánh giá cây phả hệ phân tử giúp hiểu rõ các mối quan hệ tiến hóa của các loài trong nhóm nghiên cứu.
KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 1 Kết quả đánh giá mồi trên IDT
Kết quả kiểm tra mồi bằng BLAST và ClustalW, Annhyb của các cặp mồi
2.1 Kết quả kiểm tra mồi ITS1/ITS4 Đầu tiên, tiến hành thu nhận trình tự gen ITS (internal transcribed spacer) từ ngân hàng gen trên NCBI với mã số truy cập (Accession number) là KM375927 của loài
Ganoderma lucidum Bước tiếp theo sẽ thực hiện kiểm tra sự bắt cặp mồi lên trình tự đích bằng phần mềm Annhyb
Hình 3.1 Kết quả kiểm tra bằng phần mềm Annhyb của cặp mồi ITS1/ITS4 trên trình tự gen ITS
❖ Chú thích: Màu xanh đậm thể hiện vị trí bắt cặp của mồi ITS1, màu vàng thể hiện vị trí bắt cặp của mồi ITS4
Hình trên thể hiện kích thước và vị trí bắt cặp của cặp mồi ITS1/ITS4 trên trình tự loài Ganoderma lucidum (mã số truy cập KM375927) Kết quả cho thấy, cặp mồi ITS1/ITS4 bắt cặp khá đặc hiệu tại vùng trình tự tương đồng trên các trình tự gene ITS tham chiếu Cặp mồi ITS1 bắt cặp 100% tại vị trí 327 đến 345, còn mồi ITS4 bắt cặp 100% tại vị trí 960-941 trên trình tự của Ganoderma lucidum Sản phẩm khuếch đại sau PCR có kích thước khoảng 615 bp, phản ánh độ chính xác của quá trình phát hiện và xác định loài.
Sau đó, tiến hành kiểm tra độ đặc hiệu của cặp mồi ITS1/ITS4 bằng công cụ
BLAST (Basic Local Alignment Search Tool) trên NCBI
Hình 3.2 Kết quả BLAST cặp mồi ITS1/ITS4 khuếch đại gen ITS
Kết quả phân tích BLAST cho thấy cặp mồi PCR có khả năng bám trên các trình tự khác nhau của hai mạch DNA và tạo ra sản phẩm PCR chính xác Sử dụng cặp mồi ITS1/ITS4 giúp khảo sát và khuếch đại thành công gen ITS của các loài thuộc họ Ganodermataceae Đặc biệt, loài nấm Ganoderma lucidum (mã số truy cập KM375927) đạt độ tương đồng tuyệt đối (Max identity), xác nhận độ chính xác của phương pháp phát hiện và phân tích gen ITS trong nghiên cứu về các loài nấm dược liệu này.
100 % và giá trị mong đợi (E value) thấp có ý nghĩa Chứng tỏ cặp mồi ITS1/ITS4 có độ tương đồng cao
The results demonstrate that the ITS1/ITS4 primer pair effectively amplifies the internal transcribed spacer (ITS) region of Ganoderma lucidum Therefore, ITS1/ITS4 is a reliable primer set for accurate identification and characterization of this medicinal mushroom.
34 đặc hiệu khuếch đại được vùng ITS với các điểm số: E value = 0.003; Max score = 37.4; Total score = 72.9, Query cover = 66%; Max ident = 100%
Hình 3.3 Kết quả BLAST cặp mồi ITS1/ITS4 khuếch đại gen ITS
Trong kết quả trên ta cần đánh giá một số tiêu chí cơ bản như sau:
Trong phạm vi range 2, 19/19 (100%) nghĩa là mồi xuôi dài 19 nucleotide hoàn toàn khớp với trình tự DNA trong GenBank, đảm bảo khả năng bám dính chính xác trên mạch DNA để thực hiện phản ứng PCR Tương tự, ở range 1, 20/20 (100%) chỉ ra rằng mồi ngược khớp hoàn toàn với trình tự mẫu trong GenBank, tăng cường độ chính xác và độ tin cậy của phản ứng PCR trong phân tích gen.
Trong phạm vi 2, tỷ lệ 0/19 (0%) cho thấy khi kết hợp với DNA mẫu, mồi xuôi sẽ duỗi thẳng hoàn toàn mà không có nhấp nhô do thiếu các điểm không bắt cặp bên trong lòng mồi Tương tự, ở phạm vi 1, tỷ lệ 0/20 (0%) cho mồi ngược cũng biểu thị sự duỗi thẳng hoàn toàn, đảm bảo độ chính xác trong quá trình phân tích DNA.
Plus/Plus: trình tự mồi xuôi tương đồng (giống nhau) hoàn toàn với trình tự lưu trữ trong GenBank
Plus/Minus: trình tự mồi ngược tương đồng hoàn toàn với trình tự bổ sung với trình tự lưu trữ trong GenBank
2.2 Kết quả kiểm tra mồi EF595F/EF116OR
Tiến hành thu nhận trình tự gen TEF1-α (Translation elongation factor 1) từ ngân hàng gen trên NCBI với mã số truy cập (Accession number) là KF682405 của loài
Ganoderma lucidum Bước tiếp theo sẽ thực hiện kiểm tra sự bắt cặp mồi lên trình tự đích bằng phần mềm Annhyb
Hình 3.4 Kết quả Annhyb cặp mồi EF595F/EF116OR trên trình tự gen TEF1-α
Trong bài viết này, màu đỏ thể hiện vị trí bắt cặp của mồi EF595F, giúp người đọc dễ dàng nhận biết khu vực mồi này gắn kết với dây DNA Màu xanh lá thể hiện vị trí bắt cặp của mồi EF116OR, cung cấp thông tin rõ ràng về các điểm gắn kết trên chuỗi DNA Đồng thời, màu hồng dùng để chỉ các nucleotid (nu) không bắt cặp với mồi theo trình tự nhất định, giúp hiểu rõ các vùng không tương tác trong quá trình nghiên cứu.
Hình trên thể hiện kích thước và vị trí bắt cặp của cặp mồi EF595F/EF116OR trên trình tự gene TEF1-α của loài Ganoderma lucidum (mã số truy cập KF682405) Kết quả cho thấy, cặp mồi EF595F bắt tại vị trí 286-306 và cặp mồi EF116OR bắt tại vị trí 745-764, tạo ra sản phẩm khuếch đại có kích thước 479 bp, chứng tỏ sự đặc hiệu cao của cặp mồi này trên vùng trình tự tương đồng của gen TEF1-α.
Tiến hành kiểm tra độ đặc hiệu của cặp mồi EF595F/EF116OR bằng công cụ BLAST (Basic Local Alignment Search Tool) trên NCBI
Hình 3.5 Kết quả BLAST cặp mồi EF595F/EF116OR khuếch đại gen TEF1-α
Kết quả phân tích BLAST cho thấy cặp mồi PCR có khả năng bám trên trình tự ở hai mạch khác nhau, tạo ra sản phẩm PCR chính xác Sử dụng cặp mồi EF595F/EF116OR, đã khảo sát thành công việc khuếch đại gen TEF1-α của các loài thuộc họ Ganodermataceae, nổi bật là nấm Ganoderma lucidum với mã số truy cập KF682405 Đây là mẫu có độ tương đồng tuyệt đối (Max identity) 100% và giá trị mong đợi (E-value) thấp, chứng tỏ phép chỉnh sửa PCR chính xác và tin cậy trong xác định loài.
Kết quả trên cho thấy cặp mồi EF595F/EF116OR khuếch đại được vùng trình tự
TEF1-α (Translation elongation factor 1) của loài Ganoderma lucidum Vì vậy, EF595F/EF116OR là cặp mồi đặc hiệu khuếch đại được vùng TEF1-α với các điểm số:
E value = 0.046; Max score = 30.1; Total score = 58.5, Query cover = 67%; Max ident
= 90,48% Điều đó cho thấy cặp mồi EF595F/EF116OR có độ tương đồng cao
Hình 3.6 Kết quả BLAST cặp mồi EF595F/EF116OR khuếch đại gen TEF1-α
Trong kết quả hình trên ta cần đánh giá một số tiêu chí cơ bản như sau:
Identities: ở range 1, 19/21 (100%) nghĩa là mồi xuôi khớp với trình tự mẫu trong GenBank, nghĩa là sẽ bám được trên trình tự DNA mạch đôi này trong phản ứng PCR
Và tương tự ở range 2, 18/20 (100%) mồi ngược khớp với trình tự mẫu trong GenBank
Trong phạm vi range 2, tỷ lệ 0/20 (0%) cho thấy mồi xuôi khi bám vào DNA mẫu sẽ duỗi thẳng hoàn toàn, không có các điểm không bắt cặp bên trong lòng mồi gây nhấp nhô Tương tự, ở phạm vi range 1, tỷ lệ 0/21 (0%) chỉ ra rằng mồi ngược cũng sẽ duỗi thẳng hoàn toàn khi liên kết với DNA mẫu, đảm bảo khả năng quan sát rõ các điểm bám dính chính xác.
Plus/Plus: trình tự mồi xuôi tương đồng (giống nhau) hoàn toàn với trình tự lưu trữ trong GenBank
Plus/Minus: trình tự mồi ngược tương đồng hoàn toàn với trình tự bổ sung với trình tự lưu trữ trong GenBank
Kết quả định danh phân tử
3.1 Xây dựng bộ dữ liệu DNA
Bộ cơ sở dữ liệu bao gồm các bài báo nghiên cứu khoa học đã công bố, cung cấp nguồn dữ liệu đáng tin cậy cho nghiên cứu Trong đó, có 20 trình tự vùng gene ITS và 19 trình tự vùng TEF1-α, tập trung chủ yếu vào hai chi nấm chính là Ganoderma và các chi liên quan Các trình tự gene này đóng vai trò quan trọng trong việc phân tích phân loại và xác định chính xác các loài nấm Ganoderma, hỗ trợ công tác nghiên cứu và ứng dụng trong y học cũng như nông nghiệp Sử dụng dữ liệu từ các bài báo khoa học đã công bố giúp nâng cao độ chính xác trong xác định các loài nấm, góp phần thúc đẩy nghiên cứu về đa dạng sinh học của chi Ganoderma.
Auroderma thuộc họ Ganodermataceae là nhóm nội và 2 trình tự thuộc loài Tomophagus colossus là nhóm ngoại được tham khảo chủ yếu trong bài báo của Diogo H Costa-
Rezende và cộng sự (2020), và trên Genbank sau đó đưa bộ dữ liệu vào trong phân tích phát sinh loài
Theo tiêu chí đánh giá của nhóm tác giả I Olariaga và cộng sự (2016), các trình tự đơn loài phải được xác định dựa trên cùng một loài (mẫu) với các trình tự vùng gene khác trong cây phát sinh để đảm bảo tính tương quan về mặt hình thái và cấu trúc phân tử khi trộn nhiều gene Do đó, nhóm nghiên cứu đã sử dụng 3 bộ dữ liệu dựa trên các nhóm nghiên cứu trước để đảm bảo độ chính xác và nhất quán trong phân tích di truyền.
+ Bộ dữ liệu ITS bao gồm 20 trình tự, trong đó có 6 trình tự của Auroderma; 12 trình tự thuộc chi Ganoderma và 2 nhóm ngoại là Tomophagus colossus
+ Bộ dữ liệu TEF1-α bao gồm 19 trình tự, trong đó có 6 trình tự của Auroderma;
12 trình tự thuộc chi Ganoderma và 1 nhóm ngoại là Tomophagus colossus
+ Bộ dữ liệu ITS+ TEF1-α bao gồm 18 trình tự, trong đó có 6 trình tự của Auroderma; 11 trình tự thuộc chi Ganoderma và 1 nhóm ngoại là Tomophagus colossus
Bảng 3.2 Danh mục thông tin trình tự trên các vùng gene ITS và TEF1-α
STT Loài Mã số truy cập Chiều dài Mã số truy cập Chiều dài
3.2 Xây dựng cây phát sinh loài phân tử
Trước khi xây dựng cây phát sinh loài, dữ liệu của từng vùng gen được sắp xếp cột và đồng bộ hóa để đảm bảo tính chính xác Các cây phát sinh loài trên vùng đơn gene và đa gene được xây dựng bằng phần mềm MEGA X sử dụng ba phương pháp chính: Neighbor Joining (NJ), Maximum Parsimony (MP) và Maximum Likelihood (ML) Phân tích bằng phương pháp NJ giúp xác định cây topo và thể hiện mối quan hệ phả hệ phân tử theo dạng cây ML Kết quả xây dựng cây phát sinh loài được đánh giá dựa trên các tiêu chí phù hợp với từng phương pháp phân tích.
41 trị bootstrap của 3 cây NJ/MP/MP Kết quả chiều dài trình tự tham chiếu được thể hiện trong bảng 4
Sau khi đồng bộ hóa các trình tự, quá trình dò tìm mô hình tiến hóa tối ưu được thực hiện trước khi xây dựng cây phát sinh loài theo phương pháp Maximum Likelihood (ML) Kết quả phân tích cho thấy mô hình tiến hóa phù hợp với bộ dữ liệu, đảm bảo độ chính xác của cây phát sinh loài.
Bảng 3.3 Thông tin kết quả dò tìm mô hình tiến hóa
STT Gene Mô hình tiến hóa
The analysis utilized the ITS+TEF1-α marker combination, with model selection based on the Bayesian Information Criterion (BIC), where the model with the lowest BIC indicates the best fit for constructing the Maximum Likelihood (ML) phylogenetic tree The models tested include Tamura 3-parameter (T92), Kimura 2-parameter (K2), and Gamma distribution (G), with some parameters marked as evolutionarily invariable (I) The AICc (corrected Akaike Information Criterion) and InL (Maximum Likelihood) values further support the selection of the optimal evolutionary model, resulting in a likelihood value of 13,418.946 and a BIC score of 13,709.093, demonstrating the model's effectiveness in phylogenetic analysis.
3.3 Cây phát sinh loài đơn gen
Hình 3.7 Cây phả hệ phân tử được xây dựng bằng phương pháp NJ trên vùng gene ITS
(Mỗi phân nhánh được ủng hộ thông qua các giá trị bootstrap với nhau)
Hình 3.8 Cây phả hệ phân tử được xây dựng bằng phương pháp là ML trên vùng gene
Hình 3.9 Cây phả hệ phân tử được xây dựng bằng phương pháp MP trên vùng gene ITS
Hình 3.10 thể hiện cây phả hệ phân tử được xây dựng bằng phương pháp NJ trên vùng gene TEF1-α, giúp xác định mối quan hệ tiến hóa giữa các loài Các phân nhánh của cây phả hệ đều được ủng hộ vững chắc thông qua các giá trị bootstrap, đảm bảo tính chính xác của kết quả phân tích Phương pháp NJ kết hợp với phân tích vùng gene TEF1-α là công cụ quan trọng trong nghiên cứu phân loại và xác định mối quan hệ phân tử của các dòng gene.
Hình 3.11 Cây phả hệ phân tử được xây dựng bằng phương pháp là ML trên vùng gene
Hình 3.12 Cây phả hệ phân tử được xây dựng bằng phương pháp là MP trên vùng gene
3.4 Cây phát sinh loài đa gen
Hình 3.13 trình bày cây phả hệ phân tử xây dựng bằng phương pháp NJ dựa trên vùng gen ITS+ TEF1-α, giúp phân tích mối quan hệ di truyền giữa các mẫu Mỗi phân nhánh trong cây phả hệ được ủng hộ bằng các giá trị bootstrap cao, đảm bảo tính chính xác của kết quả phân tích Phương pháp này cung cấp cái nhìn rõ nét về sự liên kết và đặc điểm di truyền của các mẫu sinh học trong nghiên cứu.
Hình 3.14 Cây phả hệ phân tử được xây dựng bằng phương pháp được ML trên vùng gene ITS+ TEF1-α
Hình 3.15 Cây phả hệ phân tử được xây dựng bằng phương pháp được MP trên vùng gene ITS+ TEF1-α
Từ kết quả phân tích mối quan hệ phát sinh giữa các loài trên đơn gene (ITS,
Cây TEF1-α và cây đa gen (ITS+TEF1-α) đều cho thấy nhóm nội tách riêng so với nhóm ngoại là loài Tomophagus colossus, mặc dù không có giá trị bootstrap ủng hộ rõ ràng Các nhóm nội đều phân thành các tập hợp với giá trị bootstrap cao, thể hiện sự phân chia rõ ràng trong phân tích Tuy nhiên, do trình tự phân tử vùng TEF1-α còn rất ít trong ngân hàng NCBI, việc phân tích cấu trúc phát sinh loài dựa trên vùng gene này gặp hạn chế đáng kể Cụ thể, phân tích này có thể chia thành ba clade chính, như thể hiện trong Hình 3.10.
Clade A được chia thành các subclade A1, bao gồm các loài như Ganoderma enigmaticum, Ganoderma sinense và Ganoderma ecuadorense, mỗi phân nhánh đều được hỗ trợ mạnh mẽ nhờ các giá trị bootstrap cao Ngoài ra, subclade A2 bao gồm các loài như Ganoderma australe và Ganoderma lucium Phân tích phân loài này giúp làm rõ cấu trúc di truyền và mối quan hệ phát sinh giữa các loài Ganoderma trong clade A, góp phần vào nghiên cứu phân loại và bảo tồn nấm linh chi.
Ganoderma applanatum) Mỗi phân nhánh được ủng hộ thông qua các giá trị bootstrap cao với nhau Giữa subclade A1 và subclade A2 hỗ trợ nhau thông qua giá trị bootstrap
Clade B bao gồm hai loài là Auroderma subsessile và Auroderma praetervisum, với mỗi phân nhánh của từng loài được hỗ trợ bởi các giá trị bootstrap cao hơn 90, đảm bảo tính chính xác của phân loại Giữa hai loài này, mức độ hỗ trợ bootstrap đạt 99, thể hiện mối quan hệ gần gũi và phân nhánh chặt chẽ trong cây phát sinh loài.
Clade C là out group không có hỗ trợ giá trị bootstrap với 2 clade còn lại
Phân tích cây ITS của nhóm tác giả Diogo H Costa-Rezende cho kết quả tương đồng với các nghiên cứu trước đó, cho thấy cây ITS chia thành 3 clade chính Trong đó, outgroup là loài Tomophagus colossus không nhận được hỗ trợ giá trị bootstrap Hai clade còn lại thể hiện rõ mối quan hệ tiến hóa trong cây ITS, như minh họa trong hình 15.
Clade A chia thành các subclade A1 (Ganoderma lucium, Ganoderma applanatum,) mỗi phân nhánh được ủng hộ thông qua các giá trị bootstrap cao với nhau
Subclade A2 (Ganoderma australe, Ganoderma enigmaticum) Subclade A3 (Ganoderma sinense, Ganoderma ecuadorense) Mỗi phân nhánh được ủng hộ thông qua các giá trị bootstrap cao với nhau
Clade B bao gồm hai loài chính là Auroderma subsessile và Auroderma praetervisum, mỗi phân nhánh của chúng đều được hỗ trợ bởi các giá trị bootstrap cao hơn 91, cho thấy sự ổn định và độ tin cậy cao trong phân loại Mối quan hệ giữa hai loài này cũng được chứng minh rõ ràng với giá trị bootstrap đạt 80, phản ánh mối liên hệ gần gũi trong cây phát sinh chủng loài.
Clade C là loài Tomophagus colossus là nhóm ngoại không được hỗ trợ giá trị bootstrap
So sánh cây phả hệ đơn gen ITS với cây phả hệ được xây dựng bởi tác giả Diogo
H Costa-Rezende và cộng sự (2020), nhận thấy những điểm chung sau:
+ Nhóm ngoại Tomophagus colossus tách riêng được với 2 nhóm nội là
Ganoderma và Auroderma và không nhận được sự hỗ trợ giá trị bootstrap
Trong clade A, Ganoderma lucidum cùng với Ganoderma applanatum được phân nhánh hỗ trợ bởi giá trị bootstrap 42, thể hiện mối quan hệ chặt chẽ hơn so với nhóm tác giả với giá trị 65 Ngoài ra, nhóm Ganoderma enigmaticum phân nhánh cùng với Ganoderma australe, cho thấy sự liên kết rõ ràng trong phân loại và đa dạng sinh học của dòng nấm Ganoderma.
48 loài được hỗ trợ thông qua giá trị bootstrap 50 Nhóm Ganoderma sinense được phân nhánh cùng với Ganoderma ecuadoniense với giá trị bootstrap 53 (so với nhóm tác giả là 92)
Trong clade B, các chủng thuộc hai loài Amauroderma subsessile và Amauroderma praetevisum thể hiện mối liên kết vững chắc, được củng cố bởi giá trị hỗ trợ cao trên 83% và giá trị bootstrap 84%, cho thấy sự đồng thuận trong phân tích hệ phylogeny.
PHẦN IV KẾT LUẬN VÀ KIẾN NGHỊ
Thu nhận đầy đủ trình tự, đánh giá các thông số kỹ thuật và kiểm tra độ đặc hiệu của cặp mồi ITS và TEF1-α đóng vai trò then chốt trong thành công của đề tài nghiên cứu Quá trình này giúp xác định chính xác đặc điểm sinh học của loài, từ đó xây dựng quy trình nghiên cứu phát sinh loài hiệu quả Ngoài ra, việc xây dựng cây phả hệ phân tử dựa trên dữ liệu genética cung cấp thông tin quan trọng về mối quan hệ tiến hóa giữa các loài, hỗ trợ công tác xác định danh tính và đa dạng di truyền Các bước này đều quan trọng để đảm bảo độ tin cậy và tính chính xác của kết quả nghiên cứu trong lĩnh vực sinh học phân tử.
Tổng hợp thành công bộ dữ liệu phân tử gen ITS, TEF1-α cho các loài nấm thuộc họ Ganodermataceae