Chính vì lợi thế là thu nhận và phân tích được tất cả hệ gene của vi sinh vật phong phú và đa dạng, đặc biết là 99% vi sinh vật không nuôi cấy được mà Metagenomics trở thành công cụ giúp
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 2Công trình được hoàn thành tại:
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
Người hướng dẫn khoa học: 1 GS TS Trương Nam Hải
vào hồi giờ ngày tháng năm
Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Hà Nội
- Trung tâm thông tin – Thư viện, Đại học quốc gia Hà Nội
Trang 3MỞ ĐẦU
1 Tính cấp thiết của đề tài
Cellulase là nhóm enzyme được sử dụng phổ biến trong các ngành công nghiệp như chế biến thực phẩm, chế biến thức ăn, sản xuất giấy, sản xuất rượu, sản xuất bia, công nghệ dệt… Đặc biệt, cellulase đang được quan tâm nghiên cứu ứng dụng trong sản xuất nhiên liệu sinh học như cồn sinh học từ nguồn phế phẩm lignocellulose dồi dào thay thế cho nguồn nhiên liệu hóa thạch đang trên đà cạn kiệt Trong vòng 25 năm qua, sản lượng cồn sinh học đã tăng trưởng và đạt mức nhảy vọt kể từ năm 2000 Cồn sinh học có thể được dùng như nguồn nhiên liệu độc lập cho các loại xe có động cơ chuyên biệt hoặc làm phụ gia nhiên liệu cho loại xe có động cơ truyền thống với tỉ lệ lên đến 30% Ở nước ta, ước tính hàng năm, nguồn nguyên liệu lignocellulose từ phế phẩm nông nghiệp như rơm, rạ, lá mía và bã cây mía bỏ phí lên đến 50 triệu tấn Các biện pháp xử lý nguồn phế phẩm này chủ yếu là đốt đã gây ra những ảnh hưởng tiêu cực đến môi trường sống và sức khoẻ con người Việc tận dụng được nguồn nguyên vật liệu lignocellulose phế phẩm này vào sản xuất cồn sinh học sẽ đem đến nhiều lợi ích to lớn cho môi trường cũng như cho nền kinh tế của nước ta
Việc sử dụng cellulase thay thế các hoá chất truyền thống như acid, kiềm và nhiệt
độ cao vào trong quá trình sản xuất của các ngành công nghiệp đã giải quyết được nhiều vấn đề như hạn chế ô nhiễm môi trường và bảo vệ được sức khoẻ người lao động cũng như tăng hiệu quả sản xuất Tuy nhiên, vấn đề đặt ra là cần thiết phải có được nguồn cellulase hoạt động ở điều kiện pH và nhiệt độ thích hợp cho các quá trình sản xuất đó Hơn nữa, việc sản xuất cồn sinh học đang gặp một số khó khăn trong việc giảm chi phí sản xuất đặc biệt là nguồn cellulase để phân cắt cellulose thành glucose hiệu quả Do đó, vấn đề quan trọng nhất là tìm ra được nguồn cellulase mới phù hợp với điều kiện sản xuất của các ngành công nghiệp liên quan, phát triển các phức hợp cellulase hiệu quả và ổn định để khắc phục khó khăn trong quá trình sản xuất
Metagenomics là kỹ thuật cho phép thu nhận trực tiếp DNA đa hệ gene của toàn bộ các vi sinh vật trong môi trường sống nhất định Chính vì lợi thế là thu nhận và phân tích được tất cả hệ gene của vi sinh vật phong phú và đa dạng, đặc biết là 99% vi sinh vật không nuôi cấy được mà Metagenomics trở thành công cụ giúp các nhà nghiên cứu khai thác nguồn gene mới hiệu quả nhất Thực tế đã chứng minh, sau 20 năm phát triển, đặc biệt
là khoảng 5 năm gần đây, khi kỹ thuật giải mã gene thế hệ mới được áp dụng, Metagenomics đã được sử dụng rất hiệu quả để tìm hiểu sự đa dạng vi sinh vật cũng như
Trang 4khai thác các gene mới từ nhiều môi trường sống khác nhau như nước, đất, các đường tiêu hóa, phế thải, …
Mối đóng một vai trò quan trọng đối với hệ sinh thái bởi khả năng phân hủy sinh khối lignocellulose và góp phần vào chu trình carbon Khả năng phân hủy hiệu quả lignocellulose của mối là kết quả hoạt động tổng hợp của các enzyme cellulase và hemicellulase được tiết ra từ bản thân mối và từ vi sinh vật sống cộng sinh trong ruột mối Trong đó, hệ vi sinh vật cộng sinh trong ruột mối đóng vai trò quan trọng trong việc tiêu hóa hiệu quả nguồn thức ăn lignocellulose của mối Vì vậy, ruột mối là một nguồn gene cellulase phong phú cần được khai thác nhằm tìm ra các enzyme mới liên quan đến sự phân hủy cellulose
Ở Việt Nam cho đến nay đã tìm thấy hơn 100 loài mối khác nhau Tuy nhiên, hệ vi sinh vật của các loài mối ở Việt Nam vẫn chưa được nghiên cứu vì thế toàn bộ hệ enzyme thủy phân lignocellulose có nguồn gốc từ vi sinh vật cộng sinh trong ruột mối cũng chưa được điều tra và khảo sát Với đặc điểm đặc trưng của quần xã vi sinh vật sống cộng sinh trong ruột mối và vai trò của chúng giúp vật chủ phân hủy thức ăn, quần xã vi sinh vật ở mối bậc thấp được xem là nguồn khai thác gene cellulase mới lý tưởng sử dụng trong quá trình thủy phân cellusose Do đó, để nghiên cứu hệ vi sinh vật ruột mối và khai thác gene mới mã hóa cellulase từ hệ vi sinh vật tương ứng sống cộng sinh trong ruột hiệu quả,
chúng tôi đã tiến hành đề tài “Nghiên cứu sàng lọc gene mã hoá enzyme tham gia thủy
phân cellulose từ khu hệ vi sinh vật trong ruột mối bằng kỹ thuật Metagenomics”
2 Mục tiêu của đề tài
1 Đánh giá được sự đa dạng vi sinh vật ruột mối và đa dạng gene mã hoá cellulase của chúng
2 Phân lập, tách dòng và biểu hiện được một gene mã hoá cellulase từ DNA đa gene
vi sinh vật ruột mối
3 Xác định được ảnh hưởng của một số điều kiện đến hoạt động của protein do gene tách dòng được mã hoá
3 Đối tượng và phạm vi nghiên cứu
Nghiên cứu được tiến hành trên đối tượng là vi sinh vật ruột mối thợ Coptotermes
thu thập ở miền Bắc Việt Nam
4 Nội dung nghiên cứu
1 Xác định đối tượng để tách lấy DNA đa hệ gen của vi sinh vật và định danh đối tượng
Trang 52 Xây dựng phương pháp để tách chiết và tinh sạch DNA đa hệ gene
3 Giải trình tự và xử lý trình tự DNA đa hệ gene
4 Dự đoán gene theo hai khía cạnh là đa dạng vi sinh vật và đa dạng gene từ bộ
dữ liệu trình tự DNA đa hệ gene
5 Chọn một trình tự gene để thiết mồi, phân lập, tách dòng và biểu hiện
6 Xác định đặc điểm của sản phẩm biểu hiện gene phân lập được
1 Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học
1 Đã định loại được một loài mối bậc thấp Coptotermes gestroi thu thập ở sáu địa
điểm tại Hà Nội và Hưng Yên bằng phương pháp phân tử
2 Đã đánh giá được sự đa dạng vi sinh vật và đa đạng gene cellulase của vi khuẩn
sống trong ruột mối C gestroi
Ý nghĩa thực tiễn
3 Đã phân lập, tách dòng và biểu hiện được một gene mã hoá endoglucanase Đây
là enzyme được ứng dụng rộng rãi trong nhiều ngành công nghiệp
4 Đóng góp mới của đề tài
1 Đây là nghiên cứu đầu tiên về sự đa dạng vi sinh vật ruột mối bậc thấp C
gestroi cũng như đa dạng gen cellulase của chúng
2 Trình tự của gen đã phân lập, tách dòng và biểu hiện được có độ sai khác so với trình tự gene tương ứng của các cơ sở dữ liệu
5 Bố cục của luận án
Luận án gồm 151 trang bao gồm: phần mở đầu 3 trang; chương 1: tổng quan tài liệu 37 trang; chương 2: đối tượng và phương pháp nghiên cứu 22 trang; chương 3: kết quả và thảo luận 58 trang; kết luận và kiến nghị 2 trang Các công trình khoa học của tác giả 1 trang Tài liệu tham khảo 19 trang Trong luận án có 19 bảng và 62 hình
Chương 1 TỔNG QUAN TÀI LIỆU
1.1 GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE
Nêu đại cương về đặc điểm cấu trúc chung của ba thành phần chính cấu tạo nên lignocellulose là cellulose, hemicellulose và lignin
1.2 GIỚI THIỆU CHUNG VỀ CELLULASE
Nêu tổng quan về cơ chế hoạt động của cellulase và sự thủy phân cellulose Cấu trúc của cellulase
Trang 61.3 CELLULASE CỦA VI KHUẨN
Nêu tổng quan về các họ cellulase, đặc biệt các loài vi khuẩn và vi khuẩn cổ tạo ra cellulase Đồng thời đặc điểm về nhiệt độ, pH và kích thước cellulase của các vi khuẩn được đưa ra cụ thể Ngoài ra, phần này còn nêu một số ứng dụng nổi bật của cellulase 1.4 MỐI VÀ HỆ VI SINH VẬT RUỘT MỐI LIÊN QUAN ĐẾN SỰ THỦY PHÂN LIGNOCELLULOSE
Sơ lược về mối và đa dạng mối ở Việt Nam Nêu tổng quan hệ vi sinh vật trong ruột mối bậc thấp và sự tiêu hóa lignocellulose của mối Khái quát tính hình nghiên cứu gene mã hóa cellulase của sinh vật trong đường ruột mối bậc thấp
1.5 KHÁI QUÁT CHUNG VỀ METAGENOMICS
Nếu khái quát: phương pháp tiếp cận tìm gene mới bằng Metagenomics, các nghiên cứu phân lập gene từ thư viện DNA đa hệ gene và hơn phương pháp khai thác và phân lập gene từ dữ liệu trình tự DNA đa hệ gene Nêu rõ phương pháp giải trình tự của một số hệ thống máy thế hệ mới Đặc biệt, đưa ra các nghiên cứu ứng dụng của Metagenomics trong khai thác gene mới và đánh giá sự đa dạng vi sinh vật Ngoài ra tiềm năng ứng dụng của
Metagenomics cũng được đề cập
Chương 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 ĐỐI TƯỢNG, VẬT LIỆU, HÓA CHẤT VÀ THIỆT BỊ MÁY MÓC
Trong nghiên cứu này, chúng tôi đã sử dụng đối tượng là vi sinh vật ruột mối thuộc chi Coptotermes do Viện Sinh thái và Bảo vệ công trình cung cấp; các chủng vi sinh vật
dùng làm thể nhận trong thí nghiệm tách dòng gene và làm thể nhận biểu hiện gene;
plasmid sử dụng để tách dòng và biểu hiện gene; các cặp mồi PCR
Các loại hóa chất sử dụng trong nghiên cứu đều được đặt mua từ các công ty đạt
tiêu chuẩn quốc tế như Bio-Lab (Mỹ), Fermentas (Mỹ), Sigma (Mỹ), Merck (Đức) 2.2 PHƯƠNG PHÁP NGHIÊN CỨU
2.2.1 Các phương pháp vi sinh
2.2.2 Các phương pháp sinh học phân tử
2.2.2.1 Tách chiết DNA tổng số của mối
2.2.2.2 Phương pháp thu nhận vi sinh vật ruột mối và tách chiết DNA đa hệ gene của chúng 2.2.2.3 Tinh sạch DNA đa hệ gene bằng phương pháp máng đơn (troughing)
2.2.2.4 Giải trình tự DNA đa hệ gene hiệu năng cao bằng máy giải trình tự thế hệ mới HiSeq2000 của Illumina
Trang 72.2.2.5 Phương pháp biến nạp bằng sốc nhiệt DNA plasmid vào vi khuẩn E coli
2.2.2.6 Phương pháp tách chiết DNA plasmid từ tế bào vi khuẩn E coli
2.2.2.7 Phương pháp cắt và ghép nối gene
2.2.2.8 Phương pháp tinh sạch DNA từ gel agarose bằng QIAquick Gel Extraction kit 2.2.2.9 Kỹ thuật PCR
2.2.2.10 Thiết kế vector biểu hiện pET22b(+) mang gene egc
2.2.2.11 Điện di DNA trên gel agarose
2.2.2.12 Phương pháp biểu hiện gene
2.2.2.13 Điện di biến tính protein trên gel polyacrylamide-SDS
2.2.2.14 Điện di protein trên gel polyacrylamide không SDS
2.2.3 Các phương pháp hóa sinh protein
2.2.3.1 Phương pháp tinh sạch protein bằng sắc kí ái lực his-tag
2.2.3.2 Định lượng protein bằng phương pháp Bradford
2.2.3.3 Định lượng đường khử bằng phương pháp DNS
2.2.3.4 Phương pháp xác định hoạt tính endoglucanase
2.2.3.5 Phương pháp xác định hoạt tính β-glucosidase và β-xylosidase
2.2.3.6 Xác định ảnh hưởng của nhiệt độ, pH, các ion kim loại và một số hóa chất lên hoạt tính endoglucanase
2.2.3.7 Xác định độ bền của enzyme
2.2.4 Các phương pháp tin sinh học và xử lý số liệu bằng phần mềm sinh học
2.2.4.1 Phân tích trình tự DNA đa hệ gene vi sinh vật ruột mối
2.2.4.2 So sánh trình tự ORF của dữ liệu DNA đa hệ gene với CSDL của NCBI
2.2.4.3 Thiết kế mồi bằng phần mềm FastPCR
2.2.4.4 Kiểm tra vị trí của các enzyme hạn chế trên gene quan tâm bằng phần mềm trực tuyến RestrictionMapper
2.2.4.5 Chuyển mã trình tự DNA sang trình tự amino acid bằng chương trình dịch mã ExPASy
2.2.4.6 Xây dựng cây chủng loài của loài mối nghiên cứu với các loài mối khác bằng phần mềm Genedoc và MEGA5
2.2.4.7 Dự đoán cấu trúc của EGC bằng phần mềm Phyre2
2.2.4.8 Xác định độ tinh sạch của protein EGC tinh sạch được bằng phần mềm Quantity One
Chương 3 KẾT QUẢ VÀ THẢO LUẬN
3.1 THU THẬP MỐI
3.1.1 Thu thập mối
Từ tháng 4 đến tháng 6 năm 2012, sáu tổ mối được thu thập ở sáu địa điểm khác nhau Các tổ mối thu được ghi rõ địa điểm, sắp xếp vào các hộp đựng mẫu Năm địa điểm
Trang 8thu được mối tại Hà Nội là Văn Quán, Hà Đông; Tản Lĩnh, Ba Vì; Bùi Xường Trạch, Đống Đa; Thái Hà, Đống Đa; Võng Thị, Tây Hồ và một địa điểm tại tỉnh Văn Lâm, Hưng Yên Trong tổ thu được có hai đẳng cấp là mối lính và mối thợ Mối lính thực hiện chức năng bảo vệ Còn mối thợ thực hiện chức năng tìm kiếm và dự trữ thức ăn Chính vì mối thợ có vai trò then chốt trong tìm kiếm và tiêu hoá thức ăn, dó đó chúng là đối tượng quan
trọng được lựa chọn để tách lấy vi sinh vật đường ruột
Mối của sáu tổ đều ăn gỗ và có hình dạng bên ngoài giống nhau Dựa vào hình thái, rất ngẫu nhiên, cả sáu mẫu mối được các nhà nghiên cứu thuộc Viện Sinh thái và Bảo vệ
công trình đã định loại ở bậc giống đều là Coptotermes
3.1.2 Kết quả định loài mối nghiên cứu bằng phương pháp phân tử
3.1.2.1 Tách DNA tổng số của mối
Để xác định loài mối bằng phương pháp phân tử, trước hết, chúng tôi tiến hành tách chiết DNA tổng số của mối DNA tổng số mối của cả sáu mẫu thu thập ở sáu địa điểm tách chiết được đều nguyên vẹn và có kích thước lớn hơn 10 kb Mẫu DNA này sẽ được sử dụng trực tiếp làm khuôn để khuếch đại đoạn gene ARN ribosome16S (rARN 16S) ti thể
3.1.2.2 PCR khuếch đại đoạn DNA của gene ARN ribosome 16S ti thể mối
Hình 3.1 Điện di đồ hỗn hợp sản phẩm PCR khuếch đại các đoạn gene mã hóa rARN 16S ti thể mối bằng hai cặp mồi LR-J-13007, LR-N-13398 và FST-F, FST-R từ khuôn DNA tổng số của mối Coptotermes trên gel agarose 1,7% ĐC M: Thang chuẩn 100 bp (Fermentas); các ĐC TH, VT, BXT, VL, VQ và TL tương ứng là sản phẩm PCR từ khuôn là DNA hệ gene mối thu thập ở Thái
Hà, Võng Thị, Bùi Xương Trạch, Văn Lâm, Văn Quán và Tản Lĩnh
Hai cặp mồi gồm cặp thứ nhất là LR-J-13007, LR-N-13398 và cặp thứ hai là
FST-F, FST-R được sử dụng để khuếch đại hai đoạn DNA của gene mã hóa RNA ribosome ti thể mối Kết quả là ở 54oC, cặp mồi thứ nhất đã khuếch đại hiệu quả đoạn DNA duy nhất đậm nét, kích thước lớn hơn 400 bp và bé hơn 500 bp từ DNA tổng số của cả sáu mẫu mối
Trang 9Tuy nhiên, chỉ ở 57oC, cặp mồi thứ hai mới khuếch đại được một băng DNA duy nhất kích thước lớn hơn 100 bp từ hai mẫu khuôn DNA tổng số thu thập ở Văn Quán và Tản Lĩnh, còn bốn mẫu DNA còn lại không có đoạn DNA nào được khuếch đại (Hình 3.1) Tất cả các đoạn DNA khuếch đại được đều được đọc và phân tích trình tự nucleotide
3.1.2.3 Phân tích sản phẩm PCR
Phân tích trình tự nucleotide đoạn DNA được khuếch đại bằng cặp mồi thứ nhất
Trình tự nucleotide của sáu đoạn DNA khuếch đại bằng cặp mồi thứ nhất được sắp xếp và so sánh với nhau đã thể hiện rằng tất cả các trình tự đều tương đồng với nhau trong vùng 430 bp và không có sự khác nhau giữa ba mẫu mối thu thập ở Võng Thị, Văn Lâm và Bùi Xương Trạch Tuy nhiên, giữa hai mẫu mối Văn Quán và Thái Hà khác với các nhóm khác từ 0,5-0,9%; mẫu mối Tản Lĩnh khác với các mẫu mối khác từ 0,5-1,5% (Bảng 3.1) Đồng thời, mức độ tương đồng trình tự nucleotide của sáu đoạn DNA trên cũng được so sánh với các trình tự tương ứng của NCBI bằng BlastN Kết quả cho thấy có sự giống nhau
rất cao (97-99%) giữa sáu trình tự nghiên cứu với các trình tự tương ứng của C gestroi (Bảng 3.2) Để xác định rõ hơn mỗi quan hệ giữa mối Coptotermes nghiên cứu và các loài
thuộc giống này, cây phát sinh loài được thiết lập bằng phần mềm MEGA5 (Hình 3.2) dựa vào trình tự vùng 430 bp cùng với 21 trình tự (giống từ 92-99%) của gene tương ứng mã
hoá rARN 16S của các loài mối thuộc giống Coptotermes Kết quả cho thấy tất cả sáu mẫu mối thu tại sáu địa điểm nằm hoàn toàn trong nhánh tiến hóa của C gestroi
Phân tích trình tự nucelotide đoạn DNA được khuếch đại bằng cặp mồi thứ hai
Hai trình tự nghiên cứu chỉ khác nhau 1 nucleotide duy nhất Kết quả so sánh mức giống nhau của hai trình tự nghiên cứu với các trình tự tương ứng của NCBI bằng Blastn cho thấy, mức giống nhau thể hiện cao nhất (99-100%) đối với các trình tự của
Coptotermes gestroi (Bảng 3.3) Đồng thời, các trình tự tương ứng trên ngân hàng gene có
mức giống nhau từ 95-100 % so với hai trình tự nghiên cứu và xây dựng cây phát sinh loài bằng phần mềm MEGA5 thể hiện mỗi quan hệ giữa hai mẫu mối nghiên cứu và các loài
mối thuộc giống Coptotermes Giống với kết quả phân tích trình tự đoạn 430 bp, cây phát
sinh loài cũng cho thấy hai mẫu mối nghiên cứu nằm hoàn toàn trong nhánh tiến hóa của
C gestroi
Như vậy, những kết quả phân tích trên đã chứng minh đầy đủ và chắc chắn rằng, ở mức độ phân tử, sáu mẫu mối nghiên cứu thu thập ở sáu địa điểm đều thuộc loài
Coptotermes gestroi.
Trang 10Hình 3.2 Cây phát sinh loài giữa loài mối nghiên cứu và 21 loài khác được xây dựng dựa trên các trình tự có mức độ giống cao nhất với đoạn DNA kích thước 430 bp được khuếch lại bằng cặp mồi LR-J-13007 và LR-N-13398
Bảng 3.1 Tỷ lệ giống nhau và khác nhau về trình tự nucleotide giữa các vùng 430 bp gene
rARN ti thể mối Coptotermes thu thập từ 6 địa điểm
CHungYenVN CBuiXuongTrachVN CgestEF092285SG CgestDQ004478SG CgestDQ004480SG CgestDQ915942SG CThaiHaVN
CVanQuanVN CgestDQ004481MY
CgestDQ004487AU CgestEF156760US CgestAY558905AG CgestAY558906TC CcarvAY558909MY
CkalsAY683211MY
ClactAY558912AU CformAB626146JP
CformU17778US CformAB626145JP CformAY558911CN CformDQ007344US
CformGU075666CN CinteAY558904TG
68
44 43
64
62 40
Trang 11BXT : Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị
Bảng 3.2: Mức độ giống nhau vùng trình tự 430 bp gene rARN 16S của sáu mẫu mối
Coptotermes với trình tự tương ứng của cơ sở dữ liệu NCBI
(BXT : Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị).
3.2 TÁCH CHIẾT VÀ TINH SẠCH DNA ĐA HỆ GENE VI SINH VẬT SỐNG TRONG RUỘT MỐI
Toàn bộ ruột mối thợ gồm ruột trước, ruột giữa và ruột sau đều được tách lấy Sau
đó, DNA đa hệ gene của hệ vi sinh vật ruột mối được tách lấy và tinh sạch Kết quả cho thấy sản phẩm tinh chế chỉ còn một băng DNA đa hệ gene duy nhất đậm nét có kích thước lơn hơn 10 kb (Hình 3.3)
Để có đủ lượng DNA cần thiết cho việc nghiên cứu, chúng tôi đã tách chiết DNA đa
hệ gene vi sinh vật từ khoảng 1.000.000 ruột mối thợ Coptotermes gestroi của sáu mẫu
mối thu thập ở sáu địa điểm và thu được gần 11 µg DNA đa hệ gene sạch có nồng độ 114 ng/µl và OD260/280 đạt 1,83 Trong đó, 8,5 µg DNA đa hệ gene được đọc trình tự
M 1 kb
10
DNA đa hệ gen
Hình 3.3 Điện di đồ DNA đa hệ gene của hệ vi sinh vật ruột mối Coptotermes gestroi trên gel agarose 0,8% ĐC M: Thang chuẩn 1 kb (Fermentas); ĐC 1:
DNA đa hệ gene được tinh chế bằng phương pháp Máng đơn
Trang 123.3 ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GENE VI SINH VẬT RUỘT MỐI Coptotermes
3.3.1 Tập hợp trình tự và xác định gene
Trình tự DNA đa hệ gene vi sinh vật ruột mối C gestroi được đọc bằng máy giải trình tự
HiSeq 2000 của Illumina Dữ liệu gồm các read tốt có tổng kích thước là 5,4 Gb Những read tốt này được sử dụng để tập hợp thành các contig có kích thước dài hơn bằng phần mềm
SOAPdenovo Với k = 41, phần mềm đã lắp ráp tất cả các read thành các contig tối ưu nhất
gồm số lượng contig nhiều nhất 79.262 contig có tổng chiều dài dài nhất khoảng 90,1 Mb, kích thước contig dài nhất là 183.853 bp và kích thước contig ngắn nhất là 500 bp Từ 79.262 contig, phần mềm MetaGeneAnnotator đã dự đoán được 125.431 ORF
3.3.2 Đa dạng vi sinh vật ruột mối C gestroi
Trên cơ sở bộ dữ liệu trình tự DNA đa hệ gene, mức độ đa dạng vi sinh vật ruột
mối C gestroi được đánh giá dựa theo hai cách:
Thứ nhất, các read chất lượng cao được so sánh với các trình tự của CSDL Trong số
đó, 34,07% các read giống với gene vi khuẩn, 0,032% giống với gene của nấm, 3,79% giống với gene vi sinh vật đường ruột người và 0,189% giống với trình tự của RDP Tổng số read
có trình tự giống với CSDL là 206.742.13 Trong đó, tổng số read có trình tự giống với CSDL của vi khuẩn là 186.147.74 Do đó, nếu chỉ xét riêng các read có trình tự tương đồng với các CSDL thì số read của vi khuẩn chiếm 90% và chỉ một tỷ lệ nhỏ (< 1%) là của nấm
Thứ hai, tất cả các ORF được phần mềm MEGAN (MEtaGeneomic ANalyser)
phân tích dựa vào CSDL NR Kết quả cho thấy 80% ORF thuộc vi khuẩn, 0,42% thuộc vi khuẩn cổ, 0,58% thuộc eukaryote, một tỷ lệ nhỏ thuộc vi rút (0,20%) và còn lại 18,79% là các ORF không dự đoán được Từ dữ liệu, tổng số 1.460 loài vi sinh vật được xác định có
mặt trong ruột mối C gestroi, trong đó, vi khuẩn có độ đa dạng cao nhất, với 1.368 loài
(chiếm tới 93,7% tổng số loài được dự đoán) (Bảng 3.3) thuộc 628 chi, 217 họ, 97 bộ, 41 lớp và 22 ngành
Bảng 3.3 Đa dạng vi sinh vật ruột mối C gestroi được dự đoán bằng MEGAN dựa vào
CSDL NR (non-redundant database) của NCBI
Trang 13Trong số 22 ngành vi khuẩn đƣợc dự đoán có 7 ngành chiếm ƣu thế nhất gồm Firmicutes, Proteobacteria, Spirochaetes, Bacteroidetes, Synergistetes, Planctomycetes và Actinobacteria Số ORF của các loài thuộc các ngành này chiếm đến 57,72% (Bảng 3.4)
tổng số ORF vi khuẩn dự đoán đƣợc
Bảng 3.4 Đa dạng loài 7 ngành vi khuẩn chiếm ưu thể nhất sống trong ruột mối C gestroi
Hình 3.4 Bảy ngành vi khuẩn chiếm ưu thế nhất có mặt trong ruột mối C.gestroi nghiên cứu
Trong đó, Clostridiales, Actinobacteria, Bacillales, Enterobacteriales, Bacillales, Pseudomonades và Bacteroidales là những bộ có các loài phổ biến có khả năng phân huỷ
cellulose, nhƣ Ruminococcus albus (62 ORF), Ruminococcus flavefaciens (40 ORF),
Acetivibrio cellulolyticus (85 ORF), Pseudomonas fluorescens (1258 ORF)
Xét bậc phân loại chi, Treponema là chi thuộc bộ Spirochaetales chiếm ƣu thế nhất
(chiếm đến 91,2% bộ, 15% tổng số vi khuẩn xác định đƣợc) Chi chiếm ƣu thế thứ hai là
Lactococcus (thuộc bộ Lactobacillales) chiếm 7,8%, tiếp đến là Pseudomonas (thuộc bộ
Pseudomonades) chiếm 4,6% tổng số vi khuẩn có mặt trong mẫu ruột mối thu thập đƣợc
22.48 17.84 17.4
11.6
4.27 1.14 0.48 0
5 10 15 20 25