Khai thác các trình tự DNA mã hóa enzym thủy phân lignocellulose từ dữ liệu metagenome của hệ vi khuẩn ruột mối C.. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/Hình 3.13: Các
Trang 1Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT
Trang 2Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT
LUẬN VĂN THẠC SĨ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
GS TS Trương Nam Hải
HÀ NỘI – 2013
Trang 3Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
LỜI CẢM ƠN
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc tới GS TS Trương Nam Hải - Trưởng phòng Kỹ thuật Di truyền,Viện trưởng Viện Công nghệ sinh học, đã tận tình hướng dẫn và dìu dắt tôi trong suốt thời gian qua
Trong quá trình thực hiện đề tài, tôi đã nhận được sự chỉ bảo chuyên môn nhiệt tình của TS Đỗ Thị Huyền, sự hỗ trợ chuyên môn quý giá của NCS Nguyễn Thị Thảo, ThS Lê Quỳnh Giang và TS Nguyễn Cường cũng như sự động viên tinh thần của tập thể cán bộ nghiên cứu tại phòng Kỹ thuật Di truyền, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam Nhân dịp hoàn thành luận văn này, tôi xin bày tỏ lòng biết ơn sâu sắc của mình tới sự giúp đỡ quý báu đó
Cuối cùng, tôi xin gửi lời cảm ơn đến những người thân trong gia đình và bạn
bè đã động viên và giúp đỡ tôi trong suốt thời gian học tập và làm việc vừa qua
Xin chân thành cảm ơn!
Hà Nội, ngày 01 tháng 10 năm 2013
Nguyễn Thanh Ngọc
Trang 4Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
LỜI CAM ĐOAN
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này là trung thực
và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đỡ trong việc thực hiện đề tài đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được ghi rõ nguồn gốc
Ký tên
Nguyễn Thanh Ngọc
Trang 5Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
MỤC LỤC
MỤC LỤC i
DANH MỤC CÁC CHỮ VIẾT TẮT iii
DANH MỤC CÁC BẢNG iv
DANH MỤC CÁC HÌNH v
MỞ ĐẦU 1
Chương 1 – TỔNG QUAN TÀI LIỆU 3
1.1 Tổng quan về mối – “cỗ máy” sản xuất enzym thủy phân lignocellulose hiệu quả 3
1.1.1 Nguồn gốc và phân loại mối 3
1.1.2 Cấu tạo ruột mối và hệ vi sinh vật trong ruột mối 4
1.2 Lignocellulose – sinh khối phế phụ phẩm nông lâm nghiệp và hệ enzym thủy phân lignocellulose 12
1.2.1 Cấu trúc lignocellulose 12
1.2.2 Enzym thủy phân lignocellulose 15
1.3 Metagenomics – công cụ hữu hiệu để nghiên cứu đa dạng sinh vật khu hệ mini sinh thái và khai thác gen 20
1.3.1 Khái quát về phương pháp metagenomics 20
1.3.2 Các cách tiếp cận trong nghiên cứu metagenomics 21
1.3.3 Ứng dụng metagenomics trong nghiên cứu đa dạng sinh học và khai thác gen 23
Chương 2 – VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 25
2.1 Vật liệu và hóa chất nghiên cứu 25
2.1.1 Vật liệu nghiên cứu 25
2.1.2 Hóa chất 25
2.2 Phương pháp nghiên cứu 26
2.2.1 Phương pháp thu nhận ruột mối 26
Trang 6Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
2.2.3 Phương pháp tách DNA metagenome hệ vi khuẩn ruột mối 26
2.2.3 Tinh sạch DNA metagenome bằng kỹ thuật troughing 28
2.2.4 Phương pháp điện di DNA trên gel agarose 28
2.2.5 Phân tích và khai thác dữ liệu DNA metagenome bằng các công cụ tin sinh 29
Chương 3 – KẾT QUẢ VÀ THẢO LUẬN 31
3.1 Tách chiết DNA metagenome hệ vi khuẩn cộng sinh trong ruột C gestroi 31 3.1.1 Thu nhận mẫu ruột mối C gestroi 31
3.1.2 Tách chiết và tinh sạch DNA metagenome hệ vi khuẩn ruột mối 32
3.2 Phân tích dữ liệu DNA metagenome hệ vi khuẩn ruột mối C gestroi 36
3.3 Đa dạng hệ vi khuẩn cộng sinh trong ruột mối C gestroi 41
3.4 Khai thác các trình tự DNA mã hóa enzym thủy phân lignocellulose từ dữ liệu metagenome của hệ vi khuẩn ruột mối C gestroi 45
KẾT LUẬN VÀ KIẾN NGHỊ 53
TÀI LIỆU THAM KHẢO 54
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC LIÊN QUAN ĐẾN LUẬN VĂN 64
PHỤ LỤC 65
Trang 7Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
PBS Đệm phosphate buffered saline
rRNA Axít ribonucleic ribosome
Trang 8Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC BẢNG
Bảng 3.1: Chất lượng trình tự DNA metagenome hệ vi khuẩn ruột mối 36
Bảng 3.2: Kết quả lắp ráp tạo contig theo các thông số k-mer khác nhau 37
Bảng 3.3: Số liệu các trình tự đọc được dùng để lắp ráp contig khi sử dụng các tham số
k-mer khác nhau 38 Bảng 3.4: Kết quả so sánh trình tự DNA metagenome hệ vi khuẩn ruột mối C gestroi
với các ngân hàng dữ liệu genome 39
Bảng 3.5: Bảng chú giải gen từ dữ liệu metagenome hệ vi khuẩn ruột mối C gestroi 40 Bảng 3.6: Đa dạng loài các vi sinh vật (đã được định tên) cộng sinh trong C gestroi 41 Bảng 3.7: Đa dạng loài một số ngành vi khuẩn sống cộng sinh trong ruột mối C gestroi 45
Bảng 3.8: Số liệu về các ORF mã hóa enzym thủy phân lignocellulose có nguồn gốc từ
vi khuẩn cộng sinh trong ruột mối C gestroi 49
Trang 9Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC HÌNH
Hình 1.1: Sơ đồ phân loại mối 3
Hình 1.2: Cấu tạo ruột mối 4
Hình 1.3: Sơ đồ cấu trúc bậc hai của thành tế bào thực vật 12
Hình 1.4: Cấu trúc vi sợi và sợi cellulose và vị trí của chúng trong thành tế bào thực vật 13
Hình 1.5: Các đơn vị cấu trúc của chuỗi carbohydrate (cellulose, hemicellulose) và lignin 14
Hình 1.6: Quy trình sản xuất cồn sinh học từ nguyên vật liệu lignocellulose 15
Hình 1.7: Một số enzym hemicellulase tham gia vào quá trình phân hủy hemicellulose 17
Hình 1.8: Các họ enzym cellulose tham gia vào quá trình thủy phân sợi cellulose 20
Hình 3.1: Mối thợ C gestroi trong dịch PBS lạnh và thao tác mổ mối….………31
Hình 3.2: Ruột mối C gestroi sau tách được giữ trong dịch PBS 31
Hình 3.3: Ảnh điện di DNA metagenome hệ vi sinh vật ruột mối 33
Hình 3.4: Ảnh điện di DNA metagenome hệ vi sinh vật cộng sinh trong ruột mối sau tinh sạch bằng phương pháp troughing 34
Hình 3.5: Ảnh điện di lượng DNA metagenome thu được sau tinh sạch bằng phương pháp troughing và bằng kít 35
Hình 3.6: Ảnh điện di kiểm tra độ ổn định của DNA metagenome được tinh sạch bằng kít và phương pháp troughing 35
Hình 3.7: Ảnh điện di mẫu DNA metagenome hệ vi khuẩn ruột mối gửi đi giải trình tự 35
Hình 3.8: Quy trình xử lý dữ liệu giải trình tự metagenome hệ vi khuẩn ruột mối 36
Hình 3.9: Cách sắp xếp lại các đoạn trình tự ngắn để tạo thành các contig 37
Hình 3.10: Đồ thị phân bố kích thước và số lượng các contig thu được 38
Hình 3.11: Đa dạng vi sinh vật cộng sinh trong ruột mối C gestroi 41
Hình 3.12: Đa dạng các ngành vi khuẩn sống cộng sinh trong ruột mối C gestroi 43
Trang 10Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Hình 3.13: Các ORF mã hóa enzym lignocellulase của hệ vi khuẩn cộng sinh trong ruột
mối C gestroi 46
Hình 3.14: Kết quả tìm kiếm các trình tự tương đồng với các cellulase được mã hóa bởi các ORF hoàn thiện 51 Hình 3.15: Kết quả tìm kiếm các trình tự tương đồng với các hemicellulase được mã hóa bởi các ORF hoàn thiện 51
Trang 11Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
MỞ ĐẦU
Việt Nam là một nước nông nghiệp với khối lượng phế phụ phẩm nông nghiệp
như rơm, rạ, bã mía ước tính mỗi năm lên đến 80 - 100 triệu tấn Lignocellulose từ các
phế phụ phẩm này là nguồn nguyên liệu phong phú cho việc sản xuất năng lượng tái sinh Tuy nhiên, hiện nay nguồn sinh khối rất lớn này đang được nông dân xử lý
bằng cách đốt, gây lãng phí rất lớn nguồn sinh khối có sẵn và còn ảnh hưởng tiêu cực đến môi trường sống [15] Vì vậy, việc chuyển hóa chúng thành cồn hoặc các chất có giá trị khác không những có ý nghĩa lớn trong việc bảo vệ môi trường sống mà còn góp phần giải quyết nhu cầu năng lượng quốc gia, tạo nguồn thu nhập tại chỗ cho nông dân
Ưu điểm cồn sinh học thế hệ thứ hai hay thế hệ mới (được sản xuất từ nguồn lignocellulose phế phụ phẩm nông lâm nghiệp) là bền vững, không gây ảnh hưởng tới
an ninh lương thực như cồn sinh học thế hệ thứ nhất (được sản xuất từ việc lên men dịch đường và tinh bột)
Cellulase và hemicellulase là các nhóm enzym chính tham gia vào quá trình phân giải lignocellulose và thường được phân lập từ các chủng vi khuẩn nuôi cấy
được Tuy nhiên, theo ước đoán có đến 99% vi sinh vật tồn tại trong tự nhiên không thể nuôi cấy được [7] và chúng có thể là những nguồn tổng hợp các enzym phân hủy lignocellulose đầy tiềm năng Do đó, các nhà khoa học hiện đang quan tâm vào việc phân lập các enzym tham gia vào quá trình thủy phân lignocellulose từ nhóm vi khuẩn không nuôi cấy được này nhằm tìm ra các enzym mới có thể ứng dụng vào trong quá trình sản xuất công nghiệp Việc khai thác gen có nguồn gốc từ vi sinh vật không nuôi
cấy được phải cần đến công cụ nghiên cứu metagenomics Metagenomics
cho phép nghiên cứu về vi sinh vật không qua nuôi cấy trong phòng thí nghiệm cũng như nghiên cứu sự đa dạng và các đặc tính sinh lý và di truyền của các vi sinh vật trong môi trường tự nhiên Ngày nay với sự ra đời và phát triển của các máy giải trình
tự thế hệ mới, việc giải trình tự toàn bộ metagenome hệ vi sinh vật có trong mẫu thu
thập đang dần trở nên chiếm ưu thế trong nghiên cứu phân tích metagenomics Phươn
Trang 12Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
ể phân tích quần xã vi sinh vậ
Hiện nay, ở nước ta chưa có một nghiên cứu nào theo hướng sử dụng kỹ thuật metagenomics để nghiên cứu và sàng lọc các enzym tham gia thủy phân lignocellulose
từ các mẫu môi trường tiềm năng (mẫu ủ rơm rạ, ruột mối hay dạ cỏ động vật nhai lại)
Trong khi đó, ở Việt Nam mối phân bố khắp mọi nơi với hơn 140 loài [81] Mối đóng
vai trò sinh thái quan trọng trong quá trình phân giải lignocellulose từ thực vật nhờ sự
hỗ trợ tích cực của nhóm vi sinh vật cộng sinh trong ruột mối Nhóm vi sinh vật này có khả năng tiết ra các enzym thủy phân lignocellulose hiệu quả Do đó, hệ vi sinh vật ruột mối được coi là nguồn dự trữ phong phú và đa dạng các enzym tham gia vào phân hủy lignocellulose Ứng dụng phương pháp metagenomics theo hướng phân tích dữ liệu thu được từ việc giải toàn bộ trình tự metagenome hệ vi khuẩn ruột mối, chúng tôi
hi vọng có thể khai thác được các enzym thủy phân lignocellulose của hệ vi khuẩn
sống trong ruột mối Việc thực hiện đề tài “Nghiên cứu tính đa dạng hệ vi khuẩn và
khai thác các trình tự DNA mã hóa enzym thủy phân lignocellulose từ dữ liệu metagenome hệ vi khuẩn ruột mối” tại phòng Kỹ thuật di truyền, Viện Công nghệ
sinh học sẽ mở ra một hướng phân lập gen mới tại Việt Nam và có thể sẽ cho phép phân lập được các dòng enzym mới có khả năng thủy phân lignocellulose hiệu quả
Nghiên cứu được thực hiện nhờ sự hỗ trợ kinh phí từ đề tài cấp Viện Hàn lâm Khoa học và Công nghệ Việt Nam “Sàng lọc các enzym tham gia vào các quá trình phân giải cellulose, hemicellulose bằng kỹ thuật Metagenomics” và đề tài hợp tác quốc
tế về Khoa học và Công nghệ theo Nghị định thư với Nhật Bản “Phân lập hệ gen mã hóa enzyme thủy phân lignocellulose từ khu hệ vi sinh vật ruột mối Việt Nam bằng kỹ thuật metagenomics”
Trang 13Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Chương 1 – TỔNG QUAN TÀI LIỆU
quả
1.1.1 Nguồn gốc và phân loại mối
Mối được phân loại là bộ Cánh đều (danh pháp khoa học: Isoptera), thuộc lớp Côn trùng (Insecta) Dựa trên chứng cứ DNA, một số nhà khoa học cho rằng mối có
quan hệ họ hàng gần gũi nhất với các loài gián ăn gỗ (chi Cryptocercus) [87] Đến nay,
trên thế giới đã biết hơn 2700 loài mối và xếp vào 7 họ của bộ cánh đều [2], trong đó
có một họ duy nhất Termitidae là mối bậc cao; còn lại là mối bậc thấp (Hình 1.1)
Hình 1.1: Sơ đồ phân loại mối Các con số chỉ số lượng giống/loài trong từng họ mối
khác nhau [5]
Ở Việt Nam mối phân bố khắp mọi nơi Trong các loài mối Việt Nam,
Coptotermes là giống mối đáng chú ý nhất vì chúng là loài mối ăn gỗ rất phổ biến,
thường phá hoại các công trình ở Việt Nam Do có tính phổ biến và phân bố trên diện rộng, nên việc thu mẫu loài mối này có nhiều thuận lợi hơn so với các loài mối khác
Mối thợ có kích thước nhỏ và chiếm số đông (70 – 80% trong đàn mối), gánh vác mọi công việc trong vương quốc mối như kiếm và chế biến thức ăn, xây tổ, làm
Trang 14Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
đường, chuyển trứng, nuôi mối con và hút nước Vì vậy, ruột mối thợ có khả năng
chứa các enzym và các vi sinh vật sản xuất các enzym thủy phân lignocellulose 1.1.2 Cấu tạo ruột mối và hệ vi sinh vật trong ruột mối
1.1.2.1 Cấu tạo ruột mối
và tuyến nước bọt – là nơi tiết ra một số enzym endoglucanase của mối hình ống với môi trường hiếu khí, là nơi sản xuất endoglucanase có nguồn gốc từ mối ở các loài mối bậc cao và diễn ra một vài sự thủy phân lignocellulose
sau có dạ cỏ, thường là một bể lên men kỵ khí
vật Ở đây diễn ra phần lớn sự thủy phân cellulose và các quá trình lên men các sản phẩm từ sự thủy phân đó [71]
Hình 1.2: Cấu tạo ruột mối, gồm có ruột trước (foregut), ruột giữa (midgut) và ruột
sau (hindgut) [71]
1.1.2.2 Đa dạng hệ vi sinh vật ruột mối
Năm 1856, Lespes là người đầu tiên miêu tả sự tồn tại của vi sinh vật trong ruột mối Tuy nhiên, việc nghiên cứu mối quan hệ cộng sinh giữa mối và vi sinh vật chỉ được bắt đầu từ đầu thế kỷ 20 [36] Năm 1923, một thí nghiệm nổi tiếng của Cleveland
đã chứng minh được mối không thể tồn tại trên gỗ nếu không có sự hỗ trợ của vi
sinh vật [13] Chất kháng sinh làm thay đổi khu hệ mini sinh thái của vi khuẩn trong
Trang 15Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
ruột mối, phá vỡ sự tương tác cộng sinh giữa vi khuẩn và vật chủ, qua đó dẫn tới chu
kỳ sống và khả năng sinh sản của mối bị giảm [67]
Trong mỗi tổ mối, mối thợ chịu trách nhiệm tìm kiếm thức ăn, tiêu hóa và nuôi dưỡng cả đàn mối Mối thợ ăn tất cả các loại thức ăn là gỗ mà thành phần chủ yếu là lignocellulose Trong đường tiêu hóa của mối thợ, cellulose được chuyển hóa thành các chất dinh dưỡng nhờ hệ enzym của ruột mối và hệ vi sinh vật cộng sinh trong ruột mối,
động vật nguyên sinh, nấm, vi khuẩn và cổ khuẩn Dựa trên sự có mặt hay vắng mặt của động vật nguyên sinh trong ruột mối mà mối được chia làm hai nhóm mối bậc thấp và mối bậc cao [89] Khoảng 106 đến 108
tế bào nhân sơ tồn tại trong mỗi ruột mối Vi khuẩn và cổ khuẩn được tìm thấy trong cả mối bậc thấp và mối bậc cao, trong đó phần lớn là vi khuẩn (trên 90%) Hầu hết vi khuẩn ruột mối đặc trưng cho từng loài mối Thành phần quần xã vi khuẩn rất giống nhau giữa các loài mối trong cùng một chi, nhưng lại thay đổi mạnh giữa hai chi mối [42] Động vật nguyên sinh chỉ
có ở ruột mối bậc thấp, từ 103 đến 105 cá thể, 90% hoặc hơn trong số đó chủ yếu tập trung ở ruột sau của mối Đồng thời, động vật nguyên sinh còn là nơi sinh sống của rất nhiều loài vi sinh vật nhân sơ, bao gồm cả cộng sinh nội bào và cộng sinh ngoại bào [11]
loài vi khuẩn [42] Khoảng 440 loài động vật nguyên sinh không có ty thể, thuộc các bộ Trichomonadida, Hypermastigida và Oxymonadida
đã được tìm thấy trong ruột mối bậc thấp ăn gỗ [17].Có vẻ như hệ vi sinh ruột mối, bao gồm vi khuẩn và động vật nguyên sinh, là những loài cộng sinh đặc trưng cùng tiến hóa với loài mối chủ [42]
Quần xã vi sinh vật trong ruột mối có sự đa dạng rất cao Nhiều nghiên cứu về
hệ vi khuẩn trong ruột mối được thực hiện thông qua các phương pháp truyền thống dựa trên việc nuôi cấy và phân lập vi sinh vật ở trong phòng thí nghiệm Các vi khuẩn
kỵ khí, đặc biệt là Staphylococcus và Bacillus, là những vi khuẩn có mặt nhiều nhất trong cả ruột mối bậc thấp và bậc cao [41] Serratia marcescenes, Enterobacter
Trang 16Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
aerogenes, Enterobacter cloacae và Citrobacter farmeri đã được phân lập từ Coptotermes formosanus [6]; trong khi đó E aerogenes, E cloacae và Clavibacter agropyri đã được chứng minh là tồn tại trong ruột mối C curvignathus [65] Tương tự, Husseneder và cộng sự cũng đã phân lập từ C formosanus 25 chủng vi khuẩn, thuộc các họ Enterobacteriaceae, bộ Bacteroidales và Lactobacillales [35] Trùng roi là sinh vật đơn bào đặc trưng chỉ có ở ruột mối bậc thấp Trong khi Hodotermopsis japonica
có chứa tới 19 loài trùng roi khác nhau ở trong đường ruột thì chỉ có 3 loài động vật
nguyên sinh tồn tại trong ruột mối C formosanus [37] Tuy nhiên, hầu hết các vi sinh
vật trong ruột mối là không nuôi cấy được, do đó số loài vi sinh vật trong ruột mối xác định được theo phương pháp truyền thống này là không nhiều, cho nên sự đa dạng về
hệ vi sinh vật trong ruột mối chưa được đánh giá chính xác
Gần đây, các nghiên cứu không thông qua nuôi cấy đã tiết lộ nhiều hơn về sự đa dạng vi sinh vật ruột mối, đặc biệt là đa dạng vi khuẩn Bằng phân tích trình tự 16S rRNA của vi khuẩn được khuếch đại từ metagenome hệ vi sinh ruột mối, tổng số hơn
1500 phylotype (tương đương với loài, tuy nhiên không nuôi cấy và định tên được, chỉ
có thể xác định được thông qua trình tự 16S rRNA) của vi khuẩn đã được phân tích và được phân loại vào 24 nhóm ngành khác nhau Phần lớn chúng chưa bao giờ được tìm thấy ở trong các môi trường sống khác và cho thấy độ tương đồng thấp với các chủng
vi khuẩn nuôi cấy được [32] Hongoh và cộng sự (2006) đã xác định được vi khuẩn
ngành Fibrobacteres (chiếm khoảng 10%) cùng với vi khuẩn thuộc bộ Bacteroidales và Clostridiales chỉ đứng sau chi Treponema về độ đông đúc trong đường ruột của mối Microcerotermes [34] Spirochaetes, đặc biệt là chi Treponema và Fibrobacteres cũng
là hai nhóm vi khuẩn đông đảo nhất trong ruột mối bậc cao ăn gỗ Nasutitermes corniger [28] và N ephratae [88], chiếm gần 90% quần xã vi khuẩn trong ruột mối
Như vậy, nhóm vi khuẩn Fibrobacteres chiếm ưu thế thứ hai trong ruột của mối bậc
cao chỉ ăn gỗ [32] Trong khi đó, ruột mối Amitermes wheeleri, thường ăn không chỉ
gỗ, mà còn cỏ chết, cây bụi và phân động vật ăn cỏ, lại chứa tới 47% vi khuẩn từ ngành Firmicutes (đặc biệt là Clostridia) và 25% vi khuẩn nhóm Spirochaetes Synergistetes
Trang 17Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
và Deltaproteobacteria cũng được tìm thấy với số lượng tương đối, nhưng Fibrobacteres thì lại có mặt rất ít ở trong loài mối bậc cao này [28]
Trong một ruột mối bậc thấp R speratus, gần 700 phylotype khác nhau thuộc
các ngành Spirochaetes, Firmicutes, Bacteroidetes, Actinobacteria, Proteobacteria, Endomicrobia, Planctomycetes, Verrucomicrobia, Cyanobacteria, Acidobacteria và các phylum hiếm khác đã được tìm thấy Spirochaetes chiếm ưu thế ở ruột sau của mối, tiếp đến là vi khuẩn bộ Bacteroidales, Clostridiales và TG 1 (Termite Group 1) chỉ
chiếm khoảng 10% Gần 90% các phylotype là các loài chưa biết [33] Ruột mối bậc thấp R flavipes có chứa vi khuẩn của cả 6 ngành lớn, đó là Proteobacteria,
Spirochaetes, Bacteroidetes, Firmicutes, Actinobacteria và Endomicrobia [19] Dựa trên thư viện thiết lập từ sản phẩm PCR khuếch đại gen ribosome 16S, Shinzato và
cộng sự đã xác định được phần lớn (94%) các vi khuẩn trong ruột mối C formosanus
thuộc về các nhóm Bacteroidales, Spirochaetes, Clostridiales, Mycoplasmatales, Bacillales và Lactobacillales Một số ít thì thuộc nhóm Actinobacteria, Proteobacteria, Planctomycetes, Verrucomicrobia và Synergistes Vi khuẩn thuộc bộ Bacteroideales chiếm ưu thế nhất, tới 70% trong hệ vi sinh vật cộng sinh trong ruột mối [74] Cũng bằng phương pháp tiếp cận này, kết quả tương tự cũng đã được công bố trong nghiên cứu của Husseneder và cộng sự, tuy nhiên kết quả này khác hẳn so với các vi khuẩn được phân lập bằng phương pháp nuôi cấy truyền thống từ cùng một loài mối [35]
Phương pháp metatranscriptomics đã cho thấy, động vật nguyên sinh chiếm tới
78% hệ vi sinh đường ruột C formosanus Trong khi đó, vi khuẩn chỉ chiếm 12,6% số lượng vi sinh vật sống trong ruột mối C formosanus [90] Số phylotype CfPt 1-2 (Candidatus Azobacteroides Pseudotrichonymphae), thuộc bộ Bacteroidales được xác định là chiếm tới 2/3 số tế bào nhân sơ trong ruột mối C formosanus [53]
Mỗi một ruột mối đơn có thể chứa tới hàng trăm loài vi khuẩn khác nhau Tuy nhiên, phần lớn các loài vi khuẩn này lại không thể nuôi cấy được [58] Ruột mối chứa các loài vi khuẩn từ 15 ngành khác nhau Spirochaetes là nhóm vi khuẩn lớn nhất, cả
về mật độ lẫn số lượng loài, tồn tại trong ruột của phần lớn mối bậc thấp ăn gỗ, với
Trang 18Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
phần lớn vi khuẩn thuộc chi Treponema [11] Trong một số loài mối, xoắn khuẩn có
thể chiếm tới 50% số lượng vi sinh vật trong ruột sau của mối [60] Ngành vi khuẩn phong phú thứ hai trong ruột mối bậc thấp là Bacteroidetes và Firmicutes, chủ yếu tập trung trong hai bộ Bacteroidales và Clostridiales Proteobacteria và Actinobacteria đôi khi cũng xuất hiện trong ruột mối với số lượng đáng kể [11, 32] Ngược lại, nhóm vi khuẩn TG 3 và vi khuẩn thuộc ngành Fibrobacteres lại là những nhóm ưu thế thứ hai trong ruột của mối ăn gỗ bậc cao [32]
Trong khi một số loài vi khuẩn ưu thích sống trên thành ruột mối, nhiều loài khác, đặc biệt thuộc ngành Bacteroidetes, lại là sinh vật cộng sinh đặc trưng cho trùng roi sống trong ruột mối Nhóm vi khuẩn cộng sinh nội bào động vật nguyên sinh trong ruột mối được lần đầu phát hiện vào năm 1996 bởi Ohkuma và Kudo, và được xếp vào nhóm TG 1 [59] hay Endomicrobia, ngành Elusimicrobia Vi khuẩn Endomicrobia xuất hiện trong rất nhiều trùng roi và chiếm ưu thế trong ruột mối bậc thấp Trong ruột mối
C formosanus, số lượng vi khuẩn cộng sinh nội bào với trùng roi Pseudotrichonympha grassii, thuộc nhóm Bacteroidales, chiếm tới 70% tế bào vi khuẩn và nhiều hơn cả
xoắn khuẩn có mặt trong ruột mối [53] Vi khuẩn cộng sinh trong cơ thể trùng roi
Trychonympha có thể chiếm một số lượng đáng kể trong hệ vi khuẩn cộng sinh trong
ruột sau của mối [58]
Trong số các loài cổ khuẩn, cổ khuẩn sản sinh methane (methanogen) là loài hay được tìm thấy nhất ở trong ruột mối [32] Chúng sống trong ruột sau của hầu hết các loài mối, tuy nhiên chỉ chiếm 1 – 2% tổng số hệ vi sinh vật nhân sơ của ruột mối Thành phần loài cổ khuẩn trong ruột mối bậc cao rất đa dạng, gồm nhiều đại diện của
ba bộ Methanobacteriales, Methanomicrobiales, Methanosarcinales và một số nhóm cổ khuẩn không nuôi cấy được Ngược lại, ở ruột mối bậc thấp, cổ khuẩn kém phong phú
hơn, chủ yếu thuộc chi Methanobrevibacter, bộ Methanobacteriales [10] Ba chủng thuộc chi Methanobrevibacter đã được phân lập từ mối R flavipes và chúng là những
chủng duy nhất có thể phân lập được Các chủng cổ khuẩn này được tìm thấy trên biểu
mô ruột mối cũng như trong cơ thể một số động vật nguyên sinh sống cộng sinh trong
Trang 19Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
ruột mối như Dinenympha parva và Spirotrichonympha leidyi [32] Trong nhiều loài mối, nhiều cổ khuẩn thuộc chi Methanobrevibacter không thể nuôi cấy được và chúng
thường có mối quan hệ cộng sinh chặt chẽ với trùng roi trong ruột mối [11]
Những loài mối khác nhau có thể chứa các loài vi khuẩn khác nhau với cấu trúc quần xã đặc trưng cho từng loài mối đó Những quần xã vi khuẩn này thường rất bền vững trong cơ thể vật chủ, và đóng vai trò quan trọng trong quá trình chuyển hóa lignocellulose và dinh dưỡng của cơ thể chủ [11] Mặc dù một số nghiên cứu về hệ vi
sinh vật ruột mối C formosanus đã được tiến hành, hiện vẫn chưa có bất kỳ một
nghiên cứu nào đánh giá về tính đa dạng quần xã vi sinh vật, trong đó có vi khuẩn,
sống trong ruột mối C gestroi, một loài mối ăn gỗ rất phổ biến ở châu Á cũng như ở Việt Nam, có quan hệ họ hàng gần gũi với C formosanus
1.1.2.3 Enzym thủy phân lignocellulose từ hệ vi sinh vật ruột mối
Phần lớn mối bậc thấp chỉ ăn gỗ, trong khi đó mối bậc cao ngoài ăn gỗ, chúng
có thể ăn cỏ, rơm, địa y và chất mùn có trong đất [32] Hệ vi sinh vật cộng sinh trong ruột mối đóng vai trò quan trọng trong việc tiêu hóa lignocellulose trong nguồn thức ăn của mối [11] Ở mối bậc cao, phần lớn enzym thủy phân cellulose đều được tiết ra bởi
tế bào biểu mô ruột giữa và tuyến nước bọt của mối [9] Tuy nhiên, ở một số loài, enzym thủy phân cellulose (như exoglucanase, endoglucanase và β-glucosidase) và hemicellulose (như xylanase) có thể được tiết ra bởi các loài nấm thuộc chi
Termitomyces sống trong ruột mối [64] Còn ở mối bậc cao N takasagoensis, phần lớn
enzym lignocellulase ở ruột trước và ruột giữa được tiết từ tế bào ruột mối, còn ở ruột sau các enzym thủy phân cellulose, hemicellulose lại được tiết từ các vi khuẩn cộng sinh trong ruột [71, 80]
Bằng phương pháp metagenomics, 4 nhóm gen glycosyl hydrolase (GHF 5, 8,
10 và 11) đã được tìm thấy ở trong hệ vi sinh vật cộng sinh ruột mối bậc cao
Microcerotermes [52] và N cornige [28] Không có gen phân hủy lignin nào được tìm thấy trong N corniger GHF 5 (cellulase) và GHF 11 (hemicellulase) được biểu hiện nhiều nhất trong quần xã vi sinh vật của hai loài mối N corniger và A wheeleri khi
Trang 20Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
nghiên cứu metatranscriptomics của chúng [28] Từ dữ liệu metagenome hệ vi sinh
ruột mối bậc cao N epharatae, nhiều gen của vi khuẩn sống trong ruột mối đã được
chứng minh là sản xuất ra enzym có hoạt tính cellulase và xylanase từ 45 nhóm GHF khác nhau Hơn 100 đoạn gen liên quan tới sự thủy phân cellulose đã được xác định, tương ứng với các domain xúc tác (catalytic domain) của cellulase, cellobiose/cellodextrin phosphorylase, endoglucanase/ arabinofuranosidase và endoglucanase Tuy nhiên, các đoạn gen tương ứng với domain xúc tác của endoglucanase và cellobiohydrolase, hai enzym cellulase quan trọng của hệ vi khuẩn, thì lại không có trong dữ liệu metagenome này Gần 100 đoạn gen liên quan tới các domain xúc tác của enzym hemicellulase như endoxylanase, xylanase, mannanase và xylosidase/arabinanase cũng đã được xác định [88]
Trong ruột mối bậc thấp, động vật nguyên sinh lại là nguồn sản xuất enzym phân hủy cellulose chủ yếu [64] Trùng roi Parabasalia sống trong ruột mối đã được chứng minh là có khả năng sản xuất exocellulobiohydrolase và endoglucanase, cần thiết để phân hủy hiệu quả cellulose tinh thể [11] Gen cellulase được phân lập từ trùng
roi Pseudotrichonympha grassii sống trong ruột C formosanus [50] Hệ động vật nguyên sinh của C lacteus lại có khả năng sản xuất β-1,4-glucosidase, endo-β-1,4- glucanase và exo-β-1,4-glucosidase [30] Ở ruột một số loài mối như Mastotermes darwiniensis, Hodotermopsis sjoestedti, Neotermes koshunensis và R speratus, động
vật nguyên sinh có khả năng tiết các enzym GHF 5 và 7, trong khi GHF 10 và 45 thì được sản xuất bởi vi khuẩn Những enzym này gồm có cellulase (endoglucanase và cellobiohydrolase) và hemicellulase Enzym GHF 5 và 7 cũng đã được tìm thấy ở hệ vi
sinh vật cộng sinh của C formosanus [79] Trichomitopsis termopsidis sống trong ruột mối Zootermopsis có thể tiêu hóa được cả cellulose tinh thể lẫn xylan [57]
Ở mối bậc thấp như R flavipes, enzym thủy phân lignocellulose chủ yếu được
tiết ra từ động vật nguyên sinh, tuy nhiên vẫn có 18% cellulase, 31% hemicellulase, 57% chitinase và 13% alpha-carboxylhydrolase là có nguồn gốc từ vi khuẩn sống trong ruột sau của mối [76] Trong khi đó, khi nghiên cứu metagenome của hệ vi sinh vật
Trang 21Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
cộng sinh trong R speratus, rất nhiều gen cellulase thuộc GHF 3, 5, 7, 8, 10, 11, 26, 43
và 45 đã được xác định; nhưng không gen nào mã hóa cho lignase được tìm thấy [78]
Một số nghiên cứu đã phân lập được một vài gen đơn lẻ mã hóa enzym thủy phân lignocellulose từ vi khuẩn ruột mối nhưng chưa có nghiên cứu tổng thể, hệ thống
về các vi khuẩn sinh enzym thủy phân lignocellulose có trong ruột mối Gen mã hóa
cellulase kích thước 2,25 kb đã được phân lập từ Enterobaterloacase trong mối Heterotermes indicola [84], còn enzym carboxymethyl cellulase được sinh ra từ Bacillus cereus và Serratia marcescens trong mối R hesperus [77] Các vi khuẩn như Dyella sp, Chryseobacterium sp và Bacillus được phân lập từ ruột mối R speratus có
khả năng sản xuất enzym endo-beta-1,4-glucanase [12]
Năm 2011, hai loài vi khuẩn thuộc họ Bacillus sống cộng sinh trong ruột mối C formosanus được xác định là có khả năng sinh ra các enzym endocellulase [45] Năm
2012, nghiên cứu metatranscriptome trên đối tượng mRNA của quần thể vi sinh vật
sống trong ruột mối C formosanus đã cho bức tranh tổng thể hơn về các loại enzym
thủy phân lignocellulose sinh ra từ mối, vi khuẩn và động vật nguyên sinh Từ 223.477 trình tự nhận được, nhóm nghiên cứu đã khai thác được 118 trình tự mRNA mã hóa cho các enzym thuộc 18 GHF khác nhau Trong đó, 39 trình tự được cho là có nguồn gốc từ vi khuẩn, 3 trình tự từ mối, 72 trình tự từ động vật đơn bào và 4 trình tự từ nấm Như vậy, gen mã hóa enzym này có nguồn gốc từ vi khuẩn chiếm khoảng 33% [90]
Tóm lại, hiện nay chưa có nghiên cứu nào đánh giá một cách đầy đủ về hệ vi sinh vật có trong ruột mối và các enzym thủy phân lignocellulose được sản xuất bởi chúng Metagenomics là phương pháp hữu hiệu để khảo sát sự đa dạng hệ vi sinh vật cũng như các enzym lignocellulase trong ruột mối [32] Tuy nhiên, cho tới nay chưa có nghiên cứu nào về sự đa dạng vi sinh vật cũng như các enzym được sản xuất bởi hệ vi
sinh vật sống trong ruột mối C gestroi được thực hiện Vì vậy, những hiểu biết về
quần xã vi sinh vật sống cộng sinh trong ruột loài mối này còn rất hạn chế
Trang 22Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
thủy phân lignocellulose
1.2.1 Cấu trúc lignocellulose
Lignocellulose là thành phần chính có trong gỗ và phế phụ phẩm nông nghiệp
như rơm rạ, vỏ trấu, lõi ngô, cỏ kê Lignocellulose cấu tạo chủ yếu từ cellulose (38 – 50%), hemicellulose (23 – 32%), lignin (15 – 25%) và một phần nhỏ là tro và chất khoáng [22] Ba thành phần này của lignocellulose cấu thành nên cấu trúc bậc hai của
- Trong cấu trúc lignocellulose, các chuỗi
cellulose sắp xếp song song và liên kết với nhau thông qua liên kết hydro tạo nên cấu trúc vi sợi Các vi sợi liên kết lại với nhau tạo nên sợi cellulose, hay cấu trúc tinh thể
Trang 23Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
và cấu trúc tinh thể Cấu trúc tinh thể cellulose có thể chiếm tới 65% thành phần cellulose trong gỗ [68]
1.2.1.2 Hemicellulose
Hemicellulose là polysaccharide dị hợp có độ phân nhánh cao, cấu tạo chủ yếu bởi các phân tử đường 5 carbon (xylose, arabinose), đường 6 carbon (mannose,
Trang 24Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
galactose, glucose) và một số axít đường (Hình 1.5) Hemicellulose cấu tạo từ
như xylan (đơn phân là xylose), xyloglucan (đơn phân là -glucose), glucomannan (đơn phân là - -mannose), galactoglucomannan (đơn phân là D-glactose, - -
-arabinogalactan (đơn phân là - )
hemicellulose chủ yếu trong nguyên vật liệu gỗ rơm rạ; trong khi glucomannan lại chiếm chủ đạo trong nguyên vật liệu gỗ [44] Đặc biệt trong rơm, xylan chiếm 30% khối lượng tổng
1.2.1.3 Lignin
Lignin là một polymer gồm các mạch phenylpropanoid phức tạp được cấu
thành từ các đơn vị phenylpropene và có cấu trúc không đồng nhất Các đơn vị cấu trúc điển hình của lignin là: guaiacyl, trans-coniferyl alcohol; syringyl, trans-sinapyl alcohol; p-hydroxylphenyl và trans-p-courmary alcohol (Hình 1.7) Do có cấu trúc không đồng nhất gồm nhiều vòng thơm nên việc phân hủy sinh học lignin cần đòi hỏi
hệ enzym oxy hóa mạnh như ligninase và manganese peroxidase [4] Các enzym phân giải lignin có vai trò quan trọng trong chu trình vận chuyển cacbon trên trái đất
Trong tự nhiên, lignin chủ yếu đóng vai trò chất liên kết trong thành tế bào thực vật, liên kết chặt chẽ với cellulose và hemicellulose Lignin liên kết hóa trị với hemicellulose và liên kết chéo với các polysaccharide khác, tạo nên độ bền cơ học ở thành tế bào thực vật; đồng thời kết nối các tế bào thực vật với nhau tạo thành cấu trúc định hình ở thực vật [21]
Trong dinh dưỡng động vật, lignin không bị tiêu hóa bởi enzym của cơ thể vật chủ Lignin còn liên kết với nhiều polysaccharide và protein màng tế bào cản trở quá trình tiêu hóa các hợp chất trong gỗ Gỗ, cỏ khô và rơm rất giàu lignin nên tỷ lệ tiêu hóa thấp trừ khi được xử lý hóa học làm cho các liên kết giữa lignin với các carbohydrate khác bị bẻ gãy [1]
Trang 25Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
1.2.2 Enzym thủy phân lignocellulose
Trong nguyên vật liệu lignocellulose như rơm rạ, cellulose và hemicellulose chiếm khoảng 70% và là nguồn cơ chất chủ yếu cho quá trình sản xuất cồn sinh học thế
hệ thứ hai Do có cấu trúc phức tạp, quá trình sản xuất cồn sinh học từ lignocellulose đòi hỏi ít nhất bốn công đoạn là 1) tiền xử lý để phá vỡ cấu trúc lignin, giải phóng cellulose và hemicellulose; 2) thủy phân cellulose và hemicellulose bằng enzym cellulase và hemicellulase để tạo đường đơn; 3) lên men tạo sản phẩm và 4) chưng cất sản phẩm (Hình 1.6) [22]
Hình 1.6: Quy trình sản xuất cồn sinh học từ nguyên vật liệu lignocelluloses [91]
1.2.2.1 Các enzym tham gia tiền xử lý
Phân hủy lignin là bước đầu tiên trong quá trình thủy phân lignocellulose, tạo điều kiện cho các enzym cellulase và hemicellulase tiếp cận và thủy phân các chuỗi cellulose và hemicellulose thành đường đơn [71] Để phá vỡ cấu trúc của lignin, thông thường người ta sử dụng cả hai biện pháp cơ học (cắt và nghiền nhỏ, xử lý ở nhiệt độ
Trang 26Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
cao) và hóa học (xử lý với axít hoặc kiềm) Biện pháp cơ học thì cần nhiều nhiên liệu tạo nhiệt [25], còn xử lý hóa học thì tạo ra các chất ức chế enzym tham gia thủy phân ở công đoạn sau Vì vậy, sau khi xử lý, axít và kiềm cần phải được loại bỏ hoàn toàn khỏi cellulose và hemicellulose Đây là việc làm không dễ dàng và gây ô nhiễm môi trường
Gần đây, các nhà nghiên cứu tìm thấy được một số chủng vi sinh vật, chủ yếu là
nấm sợi và nấm mục có khả năng sản xuất enzym phân hủy lignin, gọi chung là
ligninase Các enzym này được chia làm hai họ 1) phenol oxidase (laccase) và 2) peroxidase, gồm có lignin peroxidase (LiP), manganese peroxidase (MnP) và
peroxidise đa năng [47] Kết quả từ một số nghiên cứu cho thấy, một số nấm mục trắng
như Coriolus versicolor, Phanerochaete chrysosporium và Trametes versicolor là những vi sinh vật phân hủy lignin hiệu quả nhất [16] Tiền xử lý lignocellulose bằng các chủng vi sinh vật có khả năng phá vỡ cấu trúc lignin (phương pháp sinh học) có nhiều ưu thế, như nhu cầu năng lượng thấp, giảm thiểu chất thải trong quá trình xử lý
và không ảnh hưởng tới môi trường P chrysosporium có khả năng tấn công không
chọn lọc vào cả lignin và carbohydrate, do đó chúng đã được sử dụng thành công trong
quá trình tiền xử lý thân cây bông [73] Ceriporiopsis subvermispora có khả năng sản
xuất ra manganase peroxide và laccase, do đó có thể loại bỏ lignin một cách chọn lọc
từ các loài cây gỗ [18]
Cellulose và hemicellulose sau khi được phân tách ra khỏi cấu trúc lignocellulose rắn chắc ban đầu trong quá trình tiền xử lý sẽ được thủy phân thành các phân tử đường đơn, là nguyên liệu cho quá trình lên men Phương pháp hữu hiệu nhất
để thủy phân các polysaccharide này là sử dụng các enzym đặc hiệu, cụ thể là cellulase
và hemicellulase
1.2.2.2 Enzym hemicellulase
Hemicellulase là enzym thủy phân hemicellulose, đóng một vai trò rất quan
trọng trong phân hủy sinh khối thực vật và chu trình carbon trong tự nhiên Hemicellulase thường được phân chia thành các nhóm như sau:
Trang 27Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
a Nhóm xylanase: thủy phân liên kết β-1,4 giữa các phân tử xylan với nhau, giải
phóng các phân tử ngắn xylooligomer, gồm có endo-xylanase, exo-xylanase,
beta-xylosidase, acetyl xylan esterase, feruloyl esterase, glucuronoyl esterase
Endo-xylanase có khả năng cắt liên kết β-1,4-xylose trong mạch xylan; exo-Endo-xylanase thủy phân liên kết β-1,4-xylose của các đầu tự do, giải phóng ra xylobiose; còn beta-xylosidase có khả năng thủy phân xylobiose thành đường đơn xylose [71, 72] (Hình 1.7)
Hình 1.7: Một số enzym hemicellulase tham gia vào quá trình phân hủy hemicellulose [66]
b Nhóm β-mannanase: enzym β-mannanase tham gia thủy phân
galacto-glucomannan và giải phóng các tiểu phần β-1,4-manno-oligomers Sau đó các tiểu
phần này có thể bị thủy phân thành các đơn phân mannose bởi enzym
β-mannosidase [31]
c Nhóm α-L-arabinofuranosidase: enzym α-L-arabinofuranosidase tham gia thủy
phân nhánh bên của phân tử xylan và giải phóng các phân tử α-1,5-L-arabinan Sau
đó α-L-arabinanase tiếp tục thủy phân α-1,5-L-arabinan thành các phân tử nhỏ hơn
[71]
Trang 28Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
d Nhóm α-D-glucuronidase: enzym α-D-glucuronidase cắt các cầu nối
α-1,2-glycosidic của phân tử 4-O-methyl-D-glucuronic ở nhánh bên của phân tử xylan [55]
e Các enzym khác: điển hình như glucanase, xyloglucan hydrolase và pectinase
cũng tham gia nhiều vào quá trình phân giải hemicellulose [75]
Do có thành phần phức tạp nên quá trình phân hủy hemicellulose đòi hỏi sự tham gia của nhiều loại enzym và phụ thuộc vào thành phần hemicellulose của cơ chất
Ví dụ, sự thủy phân xylan có mặt trong gỗ cứng cần có sự tham gia của enzym các nhóm xylanase Trong khi đó, sự thủy phân glucomannan trong thành phần gỗ mềm lại cần có sự tham gia xúc tác của các enzym nhóm β-mannanase [44]
1.2.2.3 Enzym cellulase
Trang 29Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Sự phá hủy các chuỗi hemicellulose là điều kiện cần thiết cho phép các enzym cellulase tiếp cận tối đa với cellulose, diễn ra quá trình thủy phân cellulose để tạo
đường đơn glucose Cellulase là enzym thuộc lớp glycosyl hydrolase (GHF), thủy
phân các hợp chất
polysaccharide và
nhau: 1) endoglucanase (endo- -1,4-glucanase hay endo-1,4-
-D-glucan-4-glucanohydrolase; EGs, EC 3.2.1.4), tác động vào những vùng không định hình, không
bị tinh thể hóa của sợi cellulose và cắt ngẫu nhiên các liên kết trong chuỗi cellulose tạo
thành các mạch oligosaccharide hòa tan có các đầu tự do; 2) exoglucanase hay
cellobiohydrolase (1,4- -D-glucan cellobiohydrolase; CBHs, EC 3.2.1.91), tiếp tục phân cắt các chuỗi oligosaccharide từ các đầu tự do, tạo thành các phân tử đường đôi
cellobiose; 3) -glucosidase ( -D-glucoside glucohydrolase; BGs, EC 3.2.1.21) phân
cắt các liên kết của cellobiose và oligosaccharide thành đường glucose, là nguyên liệu cho quá trình lên men (Hình 1.8) [86]
Trang 30Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Hình 1.8: Các họ enzym cellulose tham gia vào quá trình thủy phân sợi cellulose [66]
Trong tự nhiên, enzym endoglucanase phổ biến hơn exoglucanase Endoglucanase được tìm thấy ở vi khuẩn, nấm, động vật nguyên sinh, thực vật và động vật, trong khi exoglucanase chỉ xuất hiện giới hạn ở vi khuẩn, nấm và động vật nguyên sinh β-glucosidase cũng là một dạng enzym cellulase phổ biến Một số enzym đã được tìm ra có hoạt tính của cả hai loại endoglucanase và exoglucanase [69] Phần lớn các sinh vật tạo ra cellulase, thường chỉ bao gồm endoglucanase và β-glucanase, do đó chỉ
có thể thủy phân cellulose đến một mức độ nhất định và chúng được gọi là các cellulase “không hoàn thành” Tuy nhiên, chúng vẫn rất cần thiết để tạo ra một lượng đường lớn cho vật chủ Ở mối, các cellulase nội sinh cũng thuộc thể loại này Ở một số
loài nấm và vi khuẩn như nấm trắng, nấm thối nâu, Clostridium và vi khuẩn ruột dạ cỏ,
quá trình thủy phân cellulose diễn ra hiệu quả bởi enzym của chính cơ thể chủ và người
ta gọi đó là các cellulase “hoàn thành”
mini sinh thái và khai thác gen
1.3.1 Khái quát về phương pháp metagenomics
1998 [24] Metagenomics là ngành khoa học nghiên cứu về
đa bộ gen (metagenome) – nguyên liệu di truyền được thu hồi trực tiếp từ các mẫu môi trường Metagenomics hiện nay là một trong những kỹ thuật cho phép khai thác được tối đa các gen của các quần thể vô cùng phong phú đó là các vi sinh vật không nuôi cấy
Trang 31Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
được [23] Tùy theo mẫu môi trường mà lượng vi sinh vật không nuôi cấy được này dao động từ 99,0 đến 99,7% Đây được cho là nguồn nguyên liệu vô cùng phong phú cho việc khai thác gen cũng như tìm hiểu cơ chế tác động giữa các vi sinh vật để đảm bảo sự ổn định, phát triển chung của hệ sinh thái
Metagenomics đã được sử dụng rộng rãi và thành công trên thế giới hơn 20 năm qua [83] Phương pháp này
, công ngh
1.3.2 Các cách tiếp cận trong nghiên cứu metagenomics
tách chiết nucleic acid trong mẫu thu thập; 2) thiết lập thư viện metagenome/
3) sàng lọc/phân lập gen Tương tự như các nghiên cứu phân lập gen trong hệ gen (genome), các nhà nghiên cứu có thể giải trình tự toàn bộ genome, sau đó tìm kiếm, khai thác gen hay vùng gen mã hóa cho các protein và enzym quan tâm Metagenome về cơ bản cũng được khai thác tương tự như trong genome nhưng nó bao quát hơn vì ở đây nghiên cứu không dừng ở việc khai thác gen trên từng hệ gen nhỏ lẻ, của cá thể phân lập được mà là trên toàn bộ đa hệ gen của quần xã sinh vật có trong một hệ sinh thái nhất định [85] Có hai phương pháp tiếp cận chính trong nghiên cứu metagenomics đó là 1) phân lập gen dựa trên việc thiết lập thư viện metagenome hoặc 2) khai thác trình tự DNA và phân lập gen dựa trên dữ liệu giải trình tự metagenome
1.3.2.1 Phân lập gen dựa vào việc thiết lập thư viện metagenome
Tương tự như việc thiết lập thư viện genome để phân lập gen, toàn bộ DNA metagenome sẽ được phân cắt bằng enzym hạn chế thành các đoạn có kích thước nhất định, sao cho chúng chứa được trọn vẹn gen Sau đó các đoạn DNA này được gắn vào vector thích hợp và chuyển vào chủng vi sinh vật chủ Với số lượng dòng đủ lớn, thư viện có thể chứa được toàn bộ các gen củ
Trang 32Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
, enzym ) trên môi trường có cơ chất đặc hiệu Từ đó các dòng mang gen
mã hóa cho tính trạng mong muốn sẽ được lựa chọn, giải trình tự để thu được trình tự
[51]
Tuy nhiên, việc phân lập gen dựa trên việc sàng lọc thư viện metagenome trên môi trường có cơ chất thường tốn rất nhiều thời gian và công sức, do phải sàng lọc một khối lượng lớn các dòng trong thư viện Hơn nữa, cách tiếp cận này còn yêu cầu số lượng dòng thư viện phải rất lớn và chất lượng thư viện phải cao Ngoài ra, việc một gen nguyên vẹn trong thư viện có thể biểu hiện ra được hoạt tính (được phát hiện) hay không cũng lại phụ thuộc rất nhiều vào sự tương thích và vị trí của nó với promoter của vector dùng để tạo thư viện Ngày nay, với sự phát triển vượt bậc của khoa học công nghệ, việc giải trình tự toàn bộ hệ gen đã trở nên khả thi hơn (tiết kiệm thời gian và kinh phí hơn) Do đó, chúng tôi đã tiến hành khai thác trình tự DNA và phân lập gen dựa trên cơ sở dữ liệu thu được từ việc giải trình tự trực tiếp DNA metagenome vi khuẩn ruột mối
1.3.2.2 Khai thác và phân lập gen từ dữ liệu metagenome
Hiện nay, bằng thiết bị giải trình tự gen hiện đại như hệ thống giải trình tự HiSeq của Ilumina, máy có thể cho ra tới 3 tỷ trình tự với tổng khối lượng dữ liệu lên tới 300 Gbp (Giga bp, bằng 106 bp) Bằng phần mềm chuyên dụng và các công cụ tin sinh học, máy sẽ sắp xếp các trình tự ngắn đó thành các contig và từ các contig chúng
ta có thể so sánh, tìm được chức năng của gen trong metagenome Để so sánh và phân tích trình tự DNA, một loạt các công cụ và phần mềm tin sinh học có thể được sử dụng trực tuyến và khai thác miễn phí [92]
Sau khi có các contig từ metagenome, các cặp mồi sẽ được thiết kế để phân lập
vậ
Trang 33Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
[51] Tuy nhiên, chưa có một nghiên cứu nào về giải trình tự và phân tích trình tự metagenome ở nước ta Đây là đề tài đi tiên phong trong hướng metagenomics nói chung, nghiên cứu đa dạng sinh học và khai thác các gen dựa trên dữ liệu thu được
từ giải trình tự toàn bộ metagenome nói riêng ở Việt Nam
1.3.3 Ứng dụng metagenomics trong nghiên cứu đa dạng sinh học và khai thác gen
Quần xã sinh vật rất quan trọng trong quá trình thực hiện các chức năng của hệ sinh thái; tuy nhiên, 99% vi sinh vật trong tự nhiên không thể nuôi cấy được Do đó, việc nghiên cứu vai trò của các hệ vi sinh vật này trong môi trường tự nhiên còn rất hạn chế Metagenomics, thông qua việc giải trình tự toàn bộ metagenome, là một phương pháp hiệu quả cho phép nghiên cứu độ đa dạng loài cũng như khai thác các enzym với hoạt tính xúc tác sinh học mới của các vi khuẩn không nuôi cấy được từ hệ sinh thái trong các môi trường tự nhiên Ngày nay, nhờ có sự phát triển của các máy giải trình tự gen thế hệ mới với thời gian giải mã bộ gen cực ngắn kết hợp với ứng dụng các công cụ tin sinh học mà metagenomics đã trở thành một phương pháp nghiên cứu rất hữu hiệu để tìm các gen mới và đa dạng vi sinh vật mà không cần nuôi cấy Chính vì vậy, hiện số lượng các nghiên cứu đa hệ gen của khu hệ vi sinh dựa trên việc giải mã toàn bộ hệ gen bằng máy giải trình tự thế hệ mới không ngừng gia tăng Metagenome đầu tiên được giải trình tự toàn bộ và công bố là vào năm 2004, với kích thước 76 Mbp [82] Sau đó, ứng dụng phương pháp metagenomics, các nhà khoa học
đã tiến hành một loạt các nghiên cứu về đa dạng hệ vi sinh vật và khai thác các gen mới trong các mẫu môi trường khác nhau như môi trường biển [40], ruột người [8, 20],
dạ cỏ bò [14, 29] và phân động vật [48]
Bằng phương pháp metagenomics, một số nghiên cứu về hệ vi sinh vật ruột mối
đã được tiến hành và bước đầu đã cho cái nhìn bao quát hơn về sự đa dạng hệ vi sinh
vật cộng sinh trong ruột một số loài mối bậc cao, như N ephratae [88], Microcerotermes [34, 52], N corniger và A wheeleri [28] và mối bậc thấp, như R
Trang 34Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
speratus [33], R flavipes [19] và C formosanus [35, 53] Các trình tự DNA mã hóa
cho hệ enzym thủy phân lignocellulose cũng đã được khai thác và phân tích từ
metagenome hệ vi sinh vật ruột mối N ephratae [88], N corniger và A wheeleri [28]
và R speratus [78] Tuy nhiên, hiện vẫn chưa có nghiên cứu nào về đa dạng quần xã vi khuẩn cũng như khai thác các gen có nguồn gốc từ vi khuẩn trong ruột mối C gestroi
tham gia vào quá trình phân giải lignocellulose có trong nguồn thức ăn từ dữ liệu trình
tự metagenome hệ vi sinh vật đó Do đó, nội dung nghiên cứu của đề tài sẽ là:
1 Tách chiết DNA metagenome hệ vi khuẩn cộng sinh trong ruột mối C gestroi
2 Phân tích dữ liệu DNA metagenome hệ vi khuẩn ruột mối C gestroi
3 Nghiên cứu sự đa dạng hệ vi khuẩn cộng sinh trong ruột mối C gestroi
4 Khai thác các trình tự DNA mã hóa enzym tham gia thủy phân lignocellulose từ dữ
liệu metagenome của hệ vi khuẩn ruột mối C gestroi
Trang 35Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Chương 2 – VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1.1 Vật liệu nghiên cứu
- Mối thợ Coptotermes được thu từ nhiều địa điểm khác nhau trên địa bàn Hà Nội, do
viện Viện Sinh thái và Bảo vệ công trình, Chùa Bộc, Đống Đa, Hà Nội cung cấp
Họ mối Coptotermes được định loại dựa trên hình thái Các mẫu mối được phòng
Kỹ thuật di truyền, Viện Công nghệ Sinh học định loại đến tên loài C gestroi dựa
trên gen mã hóa rRNA 16S ti thể mối
- Máy móc dùng trong thí nghiệm: máy điện di DNA (Bio-Rad), máy ly tâm Eppendorf (Thermoscientific), máy soi gel tia UV (Vilber Laurmat), máy ly tâm lạnh (Sorvall)
2.1.2 Hóa chất
Các hóa chất có chất lượng tốt, đều được đặt mua từ các hãng hóa chất đạt tiêu chuẩn quốc tế như Becton Dickinson (Mỹ), Fermentas (Mỹ), Thermo Scientific (Mỹ), Biolabs (Mỹ), Invitrogen (Mỹ) và Sigma (Mỹ)
2.1.2.1 Các hóa chất dùng trong tách chiết DNA metagenome
- Enzym RNase 10 mg/ml; lysozyme 10 mg/ml; protease K 20 mg/ml;
Trang 36Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
2.1.2.2 Các hóa chất để tinh sạch và điện di DNA metagenome
- Đệm TAE 50 X (Tris-acetate-EDTA) (Tris-base 24,2%; axít axetic 5,71%; EDTA 50
mM, pH 8,0); dung dịch polyethylenglycon trọng lượng phân tử 8000 (PEG 8000) 30%; dung dịch glycogen 10 mg/ml; dung dịch natri axetat 3 M;
- Gel agarose 0,8%; đệm tra mẫu 5 X; dung dịch nhuộm ethidium bromide 0,5 g/ml
2.2.1 Phương pháp thu nhận ruột mối
Tất cả các dụng cụ thí nghiệm (kẹp thí nghiệm, đĩa petri, ống Eppendorf và đầu côn) và hóa chất dùng trong thí nghiệm tách ruột mối phải được khử trùng sạch trước khi tiến hành làm thí nghiệm
Dùng kẹp thí nghiệm gắp từng con mối trong ổ mối ra cho sang một đĩa petri mới, vô trùng đã nhỏ vài giọt PBS trước đó Một tay dùng kẹp thí nghiệm giữ nhẹ ở đầu con mối, một tay dùng kẹp thí nghiệm xác định đoạn cuối ruột mối (nằm ở đuôi con mối), cặp lấy nó và nhẹ nhàng rút ra Khi đã kéo được một đoạn ruột mối ra rồi, một tay dùng kẹp giữ ruột mối, tay còn lại di chuyển kẹp thí nghiệm cắt rời đầu mối ra khỏi thân mối Dùng kẹp thí nghiệm từ từ nhẹ nhàng rút hết ruột mối ra khỏi thân mối
2.2.3 Phương pháp tách DNA metagenome hệ vi khuẩn ruột mối
2.2.3.1 Thu tế bào vi khuẩn từ ruột mối
Cứ 300 ruột mối (trọng lượng khoảng 0,15 g) thì được chuyển lên rây và được chà nhẹ bằng thìa cân nhỏ đã khử trùng, sao cho ruột mối bung ra Tất cả dịch có chứa
vi sinh vật lọt qua rây được thu lại vào ống falcon 50 ml Ruột mối sau đó được rửa nhẹ nhàng nhiều lần trong PBS và lọc qua rây để thu được tối đa các tế bào vi khuẩn Dịch thu chứa các tế bào vi khuẩn được ly tâm với tốc độ 700 vòng/phút trong 10 phút (lặp lại 3 lần) để loại bỏ xác ruột mối (pha tủa) Các tế bào vi khuẩn nằm trong dịch nổi được thu lại
Trang 37Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Để thu tế bào vi khuẩn, dịch thu được từ bước trên được ly tâm ở tốc độ 5000 vòng/phút trong 5 phút Tế bào được rửa sạch bằng cách bổ sung thêm đệm PBS vào mỗi ống tủa tế bào thu được Làm tan tế bào rồi ly tâm với tốc độ 3000 vòng/phút trong
10 phút để thu lại vi khuẩn Tế bào vi khuẩn sau đó được làm dịch hóa trong 500 µl nước vô trùng
2.2.3.2 Tách chiết DNA metagenome hệ vi khuẩn ruột mối
DNA metagenome của hệ vi khuẩn ruột mối được tách chiết theo phương pháp của Sambrook và cộng sự [70] Nguyên lý của phương pháp này như sau: thành tế bào
vi khuẩn sau khi được phá bằng lysozyme, các protein nội bào và RNA sẽ bị cắt nhỏ bởi enzym RNase A và protease K; NaCl có tác dụng tách protein bám DNA ra khỏi hệ gen Protein và các tạp chất sẽ bị loại bằng hỗn hợp phenol : chloroform : isoamyl alcohol (25:24:1) và chloroform : isoamyl alcohol (24:1) DNA được thu lại bằng cách tủa với cồn 100%
Tế bào vi khuẩn được hòa vào 352,5 µl TE Bổ sung thêm 3 µl lysozyme 10 mg/ml và 3 µl RNase 10 mg/ml rồi ủ ở 37oC trong 10 phút Tiếp tục bổ sung 6 µl protease K 20 mg/ml, 30 µl SDS 10% và ủ ở 37oC trong 30 phút Bổ sung thêm 140 µl
TE, 180 µl NaCl 5 M, đảo đều và lắc nhẹ rồi ủ ở 80oC trong vòng 15 phút
Bổ sung vào hỗn hợp dịch trên 750 µl phenol : chloroform : isoamyl alcohol (25:24:1) và trộn đều, ly tâm với tốc độ 13000 vòng/phút trong 10 phút để thu dịch nổi trên cùng (bước này được thực hiện hai lần) Tiếp tục bổ sung 750 µl chloroform : isoamyl alcohol (24:1) rồi trộn đều, ly tâm 13000 vòng/phút trong 10 phút và thu dịch nổi trên cùng
Bổ sung hai lần thể tích cồn 100% vào dịch nổi thu được rồi ủ ở -80oC trong 30 phút Ly tâm 13000 vòng/phút trong 15 phút để thu tủa DNA Tiếp tục bổ sung 500 µl cồn 70% để rửa tủa Ly tâm 13000 vòng/phút trong 5 phút để thu tủa DNA Làm khô DNA rồi bổ sung 10 µl dH2O để hòa tan DNA DNA metagenome thu được sẽ chạy điện di trên gel agarose 0.8% để kiểm tra và cất giữ ở -20o
C cho các thí nghiệm tiếp
Trang 38Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
theo Mẫu DNA metagenome sau khi tách chiết được tinh sạch ngay bằng phương pháp troughing để loại bỏ các tạp chất và axít humic
2.2.3 Tinh sạch DNA metagenome bằng kỹ thuật troughing
DNA metagenome hệ vi sinh vật cộng sinh trong ruột mối được tinh sạch bằng phương pháp troughing của Harnpicharnchai và cộng sự [26] Trên cơ sở kỹ thuật điện
di, DNA di chuyển từ cực âm sang cực dương của bể điện di trong một điện trường có điện thế và cường độ thích hợp Trên môi trường chất giá agarose, các đoạn DNA metagenome có kích thước lớn sẽ di chuyển chậm và tách biệt với các tạp chất cần phải loại bỏ, ví dụ như axít humic Khi đó, ta tạo một giếng đổ đầy PEG 8000 ngay ở phía dưới băng DNA metagenome PEG 8000 ngăn không cho DNA di chuyển tiếp trong điện trường, do đó ta dễ dàng thu hồi DNA metagenome đã được loại bỏ khỏi các tạp chất
Mẫu DNA cần tinh sạch được cho vào giếng của bản gel agarose 0,8% có chứa 0,1 µg/ml ethidium bromide và điện di ở điện áp 50 V khoảng 30 phút Vị trí băng DNA đích được xác định dưới đèn UV, sau đó một giếng rộng khoảng 1 – 1,5 cm được tạo ra ngay sau vị trí băng DNA đích Agarose thừa trong giếng được loại bỏ cẩn thận
và giếng được làm đầy bằng đệm troughing (25 – 30% PEG 8000 trong TAE 1 X) Cả bản gel được điện di tiếp trong khoảng 15 phút để DNA đích đi vào trong giếng Hút toàn bộ đệm chứa DNA trong giếng vào một ống Eppendorf sạch Sau đó DNA được chiết lại bằng chloroform : isoamyl alcohol (24:1) và được tủa lại bằng 2 lần thể tích cồn 100% cộng với 2 µl glycogen 10 mg/ml và 50 µl natri axetat 3 M, ở -80oC trong 25 phút (hoặc 60 phút ở -20oC) DNA được thu lại bằng cách ly tâm 13000 vòng/phút trong 15 phút, rửa lại bằng cồn 70%, làm khô và hoà vào nước vô trùng và giữ ở nhiệt
độ -20o
C cho các thí nghiệm tiếp theo
2.2.4 Phương pháp điện di DNA trên gel agarose
DNA metagenome được tách chiết từ hệ vi sinh vật ruột mối được điện di kiểm tra trên gel agarose theo phương pháp của Sambrook và cộng sự [69] Nguyên tắc điện
di DNA là các phân tử DNA (tích điện âm) dưới tác dụng của điện trường sẽ di chuyển
Trang 39Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
từ cực âm sang cực dương Tốc độ di chuyển trên mạng lưới gel trong điện trường của DNA phụ thuộc vào kích thước, điện tích, mức độ cuộn xoắn và cấu trúc phân tử của DNA Đoạn DNA có kích thước lớn sẽ di chuyển chậm hơn đoạn DNA có kích thước nhỏ hơn và sẽ tách biệt nhau trong quá trình chạy
Gel agarose 0,8% được chuẩn bị như sau: hòa 0,8 g agarose vào 100 ml dung dịch đệm TAE 1 X, đun sôi dung dịch agarose cho đến khi tan hết, để nguội đến khoảng 40 – 50oC, đổ dung dịch agarose vào khay gel điện di đã cài sẵn lược để tạo các giếng nhỏ chứa mẫu Nồng độ và độ dày của gel tuỳ thuộc mục đích sử dụng Để gel đông và ổn định hoàn toàn trong 30 phút Đặt khay gel vào bể điện di, đổ đệm TAE 1
X tới khi ngập bề mặt gel từ 1 đến 2 cm, gỡ lược ra
Mẫu DNA được trộn đều với đệm tra mẫu 5 X (tỷ lệ 1:5 về thể tích) và được tra vào các giếng nhỏ trên gel, chạy điện di bằng dòng điện một chiều với hiệu điện thế
100 V, quan sát sự di chuyển của vạch màu để ngừng quá trình điện di DNA chuẩn được chạy cùng các mẫu để xác định khối lượng phân tử Bản gel chứa DNA sau khi chạy xong được nhuộm trong dung dịch hiện màu ethidium bromide 0,5 g/ml trong 10 phút và được soi bằng thiết bị đèn UV để quan sát kết quả chạy điện di
2.2.5 Phân tích và khai thác dữ liệu DNA metagenome bằng các công cụ tin sinh
Một loạt các công cụ và phần mềm tin sinh chuyên dụng (SOAPdenovo, SOAPaligner, MetaGene Annotator và BLASTall) đã được sử dụng để phân tích và
khai thác dữ liệu DNA metagenome hệ vi khuẩn ruột mối C gestroi trên một số cơ sở
dữ liệu (NCBI genome vi khuẩn, genome nấm, dữ liệu NR, KEGG và eggNOG) trong nghiên cứu này
SOAPdenovo được sử dụng để lắp ráp lại bộ gen từ các trình tự đọc ngắn thu được trong quá trình giải trình tự gen thế hệ mới, gồm có 6 module được dùng để 1)
sửa chữa các lỗi đọc trình tự; sau đó 2) xây dựng đồ thị de Bruijn để 3) lắp ghép các
contig, rồi 4) kiểm tra lại kết quả lắp ráp bằng cách so sánh các contig với các trình tự
Trang 40Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
đọc được dùng để tạo ra nó; tiếp đến 5) tối ưu độ bao phủ và chiều dài các contig để 5) thu nhỏ các vùng gen không đọc được trình tự [43]
Phần mềm MetaGene Annotator (MGA) được sử dụng để dự đoán tất cả các loại gen của sinh vật nhân sơ (gồm có thể tiền thực khuẩn, vi khuẩn và cổ khuẩn) từ tập hợp các dữ liệu trình tự genome chưa biết MGA có thể thiết lập mô hình thống kê của các gen đã biết cũng như các trình tự đưa vào để dự đoán gen Do đó, phần mềm MGA
có thể phát hiện được không chỉ những gen điển hình mà cả những gen không điển hình [54]
BLASTall (Basic Local Alignment Search Tool) là một tập hợp các chương trình tìm kiếm được thiết kế để khám phá tất cả các cơ sở dữ liệu trình tự có sẵn bất kể
đó là protein hay DNA BLAST sử dụng thuật toán tìm kiếm cục bộ heuristic và do đó
có thể phát hiện ra mối liên hệ giữa các trình tự có những sự tương đồng riêng biệt Có rất nhiều loại tìm kiếm khác nhau trên BLAST phục vụ cho những mục đích khác nhau: 1) BLASTp tìm kiếm tất cả các trình tự protein tương đồng với trình tự protein cần phân tích trong cơ sở dữ liệu protein; 2) BLASTn tìm kiếm tất cả các trình tự nucleotide tương đồng với trình tự DNA cần phân tích trong cơ sở dữ liệu DNA; 3) TBLASTn tìm trình tự protein tương đồng trong cơ sở dữ liệu DNA bằng cách dịch mỗi trình tự DNA ra tất cả 6 khung đọc mở; 4) BLASTx tìm trình tự nucleotide tương đồng trong cơ sở dữ liệu protein bằng cách dịch trình tự nucleotide cần phân tích sang tất cả 6 khung đọc mở [93] Sau khi có được các khung đọc mở cần quan tâm, chúng tôi sử dụng công cụ tìm kiếm trình tự amino axít tương đồng trong BLASTp