Dự đoán tính chất của các protein tham gia vào quá trình thủy phân cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu .... Quá trình chuyển hóa l
Trang 1viện hàn lâm khoa học và công nghệ việt nam
viện công nghệ sinh học
TRẦN THANH THỦY
NGHIÊN CứU đánh giá đa dạng vi sinh vật, SàNG LọC, THU NHậN Và XáC ĐịNH TíNH CHấT CủA CELLULASE SUốI NƯớC NóNG bình châu, VIệT NAM bằng kỹ thuật metagenomicS
luận án tiến sĩ sinh học
Trang 2viện hàn lâm khoa học và công nghệ việt nam
viện công nghệ sinh học
TRẦN THANH THỦY
NGHIÊN CứU đánh giá đa dạng vi sinh vật, SàNG LọC, THU NHậN Và XáC ĐịNH TíNH CHấT CủA CELLULASE SUốI NƯớC NóNG bình châu, VIệT NAM bằng kỹ thuật metagenomicS
Chuyên ngành : Vi sinh vật học Mã số : 9 42 01 07
luận án tiến sĩ sinh học
Người hướng dẫn khoa học: 1 TS Nguyễn Kim Thoa
Viện Cụng nghệ sinh học
2 PGS TS Trần Đỡnh Mấn
Viện Cụng nghệ sinh học
Hà nội - 2021
Trang 3LỜI CẢM ƠN
Với lòng biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành nhất đến TS Nguyễn Kim Thoa và PGS TS Trần Đình Mấn, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam – những người thầy đã tận tình chỉ bảo, hướng dẫn, động viên và tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện luận án này
Tôi xin gửi lời cảm ơn tới Ban lãnh đạo Viện Công nghệ sinh học, phòng Thí nghiệm trọng điểm Công nghệ gen, phòng Công nghệ Vật liệu sinh học, các cán bộ tại cơ sở đào tạo thuộc Viện Công nghệ sinh học, phòng Hệ gen học chức năng thuộc Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tạo điều kiện thuận lợi về cơ sở vật chất, máy móc, trang thiết bị cũng như các thủ tục cần thiết để tôi có thể hoàn thành luận án
Tôi cũng xin gửi lời cảm ơn tới các đồng nghiệp tham gia đề tài ĐTĐLCN.15/14, các chú, anh, chị, em cán bộ phòng Công nghệ Vật liệu sinh học đã giúp đỡ, động viên tôi trong suốt quá trình thực hiện luận án
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè, những người thân đã luôn ở bên cạnh chia sẻ, động viên, khích lệ, giúp đỡ, tạo điều kiện thuận lợi về mọi mặt để tôi có thể tập trung, yên tâm học tập, nghiên cứu và hoàn thành luận
án của mình
Hà Nội, ngày tháng năm 2021
Tác giả
Trần Thanh Thủy
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan:
Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác với các cộng sự khác
Các số liệu và kết quả trình bày trong luận án là trung thực, một phần đã được công bố trên các tạp chí khoa học chuyên ngành với sự đồng ý và cho phép của các đồng tác giả
Phần còn lại chưa được ai công bố trong bất kỳ công trình nào khác
Hà Nội, ngày … tháng … năm 2021
Tác giả
Trần Thanh Thủy
Trang 5MỤC LỤC
LỜI CẢM ƠN i
LỜI CAM ĐOAN ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT vii
DANH MỤC CÁC BẢNG x
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ xi
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 3
1.1 Khu hệ vi sinh vật trong suối nước nóng 3
1.2 Cellulase 6
1.2.1 Phân loại 6
1.2.2 Đặc điểm hóa sinh 9
1.2.3 Ứng dụng công nghệ sinh học của cellulase ưa nhiệt 21
1.3 Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các gen mới 21
1.3.1 Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics 22
1.3.2 Phương pháp đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA metagenome 26
1.3.3 Ứng dụng kỹ thuật Metagenomics để đánh giá đa dạng vi sinh vật và khai thác các gen mã hóa cho enzyme mới 28
1.3.4 Tình hình ứng dụng metagenomics vào nghiên cứu đa dạng vi sinh vật và khai thác các gen mã hóa cho cellulase ở Việt Nam 32
CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 35
2.1 Vật liệu 35
2.1.1 Vi sinh vật 35
Trang 62.1.2 Vector 35
2.1.3 Cặp mồi sử dụng 35
2.1.4 Gen nghiên cứu 36
2.1.5 Các hóa chất sử dụng 36
2.1.6 Môi trường nuôi cấy 36
2.2 Máy móc và thiết bị 36
2.3 Phương pháp nghiên cứu 36
2.3.1 Tách chiết DNA metagenome của mẫu suối nước nóng Bình Châu 36
2.3.2 Giải trình tự DNA metagenome suối nước nóng Bình Châu 37
2.3.3 Các phương pháp tin sinh 38
2.3.4 Khuếch đại gen endoglucanase_18736 và β-glucosidase_32768 40
2.3.5 Tạo vector biểu hiện pET-17b gắn các đoạn gen endoglucanase_18736/ β-glucosidase_32768 41
2.3.6 Biến nạp vector biểu hiện pET-17b chứa các đoạn gen endoglucanase_18736/ β-glucosidase_32768 vào E coli TOP10F’ bằng phương pháp xung điện 42
2.3.7 Chọn lọc dòng E coli mang vector pET17b-18736/ và pET17b-32768 43
2.3.8 Tạo chủng E coli tái tổ hợp mang vector pET-17b_18736 và pET-17b_32768 43
2.3.9 Biểu hiện gen denovogenes_18736 và denovogenes_32768 44
2.3.10 Xác định trọng lượng sinh khối khô 44
2.3.11 Phương pháp thu nhận enzyme thô 44
2.3.12 Phương pháp xác định hoạt tính endoglucanase 45
2.3.13 Phương pháp xác định hoạt tính -glucosidase 45
Trang 72.3.14 Ảnh hưởng của một số yếu tố lên mức độ biểu hiện endoglucanase_18736
và β-glucanase_32768 46
2.3.15 Động thái sinh trưởng và sinh endoglucanase, β-glucosidase tái tổ hợp 47
2.3.16 Tinh sạch endoglucanase và β-glucosidase tái tổ hợp 47
2.3.17 Định lượng protein tổng số 48
2.3.18 Điện di protein SDS-PAGE 48
2.3.19 Kiểm tra hoạt tính endoglucanase bằng Zymogram (Điện di protein trên gel polyacrylamide có chứa cơ chất CMC) 49
2.3.20 Kiểm tra hoạt tính β-glucosidase bằng Zymogram 50
2.3.21 Nghiên cứu một số đặc tính của enzyme tái tổ hợp 50
2.3.22 Xử lý thống kê 51
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU 52
3.1 Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và
xây dựng bộ dữ liệu gen mã hóa cho cellulase 52
3.1.1 Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng Bình Châu 52
3.1.2 Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật, xác định và tổng hợp gen mới mã hóa cho các enzyme thủy phân cellulose (enzyme chịu kiềm, chịu axit và chịu nhiệt) 54
3.2 Biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 74
3.2.1 Thiết kế vector biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 trong E coli 74
3.2.2 Lựa chọn một số điều kiện biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 trong E coli 75
Trang 83.2.3 Động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của
chủng E coli C43(DE3) tái tổ hợp 82
3.3 Tinh sạch và xác định tính chất của các cellulase tái tổ hợp 83
3.3.1 Tinh sạch enzyme tái tổ hợp 83
3.3.2 N g h i ê n c ứ u m ộ t s ố đ ặ c t í n h c ủ a e n d o g l u c a n a s e _ 1 8 7 3 6 v à β-glucosidase _32768 tái tổ hợp 85
CHƯƠNG 4 BÀN LUẬN KẾT QUẢ NGHIÊN CỨU 95
4.1 Đa dạng vi sinh vật và tiềm năng khai thác các gen mới mã hóa cho cellulase suối nước nóng Bình Châu thông qua cách tiếp cận không phụ thuộc vào nuôi cấy 95
4.1.1 Đa dạng vi sinh vật 95
4.1.2 Tiềm năng khai thác các gen mới mã hóa cho cellulase 99
4.2 Mối liên hệ giữa mô hình cấu trúc với các đặc điểm của endoglucanase_18736 và β-glucosidase_32768 104
4.2.1 P h â n t í c h c á c d o m a i n c h ứ c n ă n g c ủ a e n d o g l u c a n a s e _ 1 8 7 3 6 v à β - g l u c o s i d a s e _ 3 2 7 6 8 104
4.2.2 Mô hình cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768 tái tổ hợp 104
KẾT LUẬN VÀ KIẾN NGHỊ 111
NHỮNG CÔNG TRÌNH CỦA TÁC GIẢ ĐÃ CÔNG BỐ LIÊN QUAN ĐẾN ĐỀ TÀI 113
TÓM TẮT LUẬN ÁN BẰNG TIẾNG ANH 114
TÀI LIỆU THAM KHẢO 122
PHỤ LỤC 1
Trang 9DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Tên viết tắt Tên tiếng Anh Tên tiếng Việt
APS Ammonium persulfate Ammonium persulfate
BGI Beijing Genomics Institute Viện nghiên cứu hệ gen Bắc Kinh BLAST Basic Local Alignment
Search Tool
Công cụ tìm kiếm các trình tự tương đồng trực tuyến của NCBI
BSA Bovine serum albumin Albumin huyết thanh bò
CAZy Carbohydrate – Active
Module/Vùng liên kết với carbohydrate
CEs Carbohydrate esterases Carbohydrate esterases
CMC Carboxymethyl cellulose Carboxymethyl cellulose
DNA Deoxyribonucleic acid Axit Deoxyribonucleic
DNSA 3,5-Dinitrosalicylic acid Axit 3,5-Dinitrosalicylic
dNTP 2’ – deoxyribonucleoside
5’ – triphosphate
2’ – deoxyribonucleoside 5’ - triphosphate
(diphenylphosphino) ethylene
1,2-bis (diphenylphosphino) ethylene
EBI European Bioinformatics
Institute
Viện nghiên cứu tin sinh Châu Âu
EDTA Ethylene diamine tetra
acetic acid
Axit ethylene diamine tetra acetic
Trang 10EMBL European Molecular
Hệ thống chuyên phân tích protein
GH Glycoside hydrolase Họ enzyme thủy phân glycoside GTs Glycosyl transferases Glycosyl transferases
nucleic
KEGG Kyoto Encyclopedia of
Genes and Genomes
Cơ sở dữ liệu về gen và hệ gen Kyoto
Km Michaelis constants Hằng số Michaelis
LB Luria-Bertani Môi trường Luria-Bertani (LB)
MEGAN MEtaGenomic ANalyser Phần mềm phân tích trình tự đa hệ gen
NB Nutrient broth Môi trường Nutrient broth (NB) NCBI National Center for
Giải trình tự gen thế hệ mới
NR Non - Redundant Cơ sở dữ liệu chứa các trình tự
không dư thừa của NCBI
Trang 11PDB Protein Data Bank Ngân hàng dữ liệu protein
PEG Polyethylen glycol Polyethylen glycol
PLs Polysaccharide lyases Polysaccharide lyases
Điện di trên gel polyacrylamide
Swiss-Prot Swiss Protein Cơ sở dữ liệu protein Thụy Sĩ
TB Terrific Broth Môi trường Terrific broth (TB)
TEMED N,N,N′,N′-Tetramethyl
ethylenediamine
N,N,N′,N′-Tetramethyl ethylenediamine
Tm Temperature Melting Nhiệt độ nóng chảy
Vmax Maximum Velocity Vận tốc tối đa
Uniprot Universal Protein Resource Nguồn dữ liệu phổ biến về trình tự
và chức năng của protein
Trang 12DANH MỤC CÁC BẢNG
Bảng 1.1 Phân bố của cellulase vào các họ GH khác nhau 8
Bảng 1.2 Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật
ở suối nước nóng 14
Bảng 1.3 Đặc điểm của cellulase bền nhiệt 20
Bảng 1.4 Cellulase bền nhiệt từ metagenome của vi sinh vật ở suối nước nóng 31
Bảng 3.1 Nồng độ và độ tinh sạch của DNA metagenome mẫu nước và mẫu bùn
suối nước nóng Bình Châu 54
Bảng 3.2 Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome suối nước nóng
Bình Châu 54
Bảng 3.3 Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu 55
Bảng 3.4 Thống kê phân loại học DNA metagenome suối nước nóng Bình Châu
đã được chú giải 56
Bảng 3.5 Tỉ lệ các gen đã được phân loại thuộc các Ngành vi khuẩn ở
suối nước nóng Bình Châu 58
Bảng 3.6 Tỉ lệ các gen đã được phân loại thuộc các Lớp vi khuẩn ở suối nước nóng
Bình Châu 59
Bảng 3.7 Tóm tắt kết quả chú giải gen dựa vào các cơ sở dữ liệu mở 61
Bảng 3.8 Phân bố của các ORF mã hóa cho cellulase được dự đoán từ bộ dữ liệu
DNA metagenome suối nước nóng Bình Châu 64
Bảng 3.9 Đặc điểm của 5 ORF mã hóa cho endoglucanase và β-glucosidase
thỏa mãn các tiêu chí lựa chọn gen/protein mới 68
Bảng 3.10 Kết quả tinh sạch endoglucanase và β-glucosidase tái tổ hợp bằng cột
IMAC-Ni2+ 85
Bảng 3.11 Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp 90
Trang 13DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1 Nguyên tắc hoạt động của cellulase thủy phân cellulose 7
Hình 1.2 Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ nấm Trichoderma reesei 10
Hình 1.3 Cấu trúc cellulosome của A cellulolyticus 11
Hình 1.4 Ba dạng tâm hoạt động của các họ GH 11
Hình 1.5 Hai cơ chế xúc tác của GHsa 13
Hình 1.6 Các phương pháp chính để phát hiện gen mới bằng cách sử dụng Metagenomics 22
Hình 1.7 Các bước chính xây dựng thư viện Metagenomic 24
Hình 1.8 Các bước phân tích tin sinh điển hình cho cơ sở dữ liệu Metagenomic 26
Hình 2.1 Quy trình xử lý, phân tích dữ liệu DNA metagenome và sàng lọc gen mã hóa cho enzyme thủy phân cellulose tiềm năng 38
Hình 3.1 Các vị trí lấy mẫu nước và mẫu bùn của suối nước nóng Bình Châu 53
Hình 3.2 DNA metagenome mẫu nước và bùn suối nước nóng Bình Châu 53
Hình 3.3 Phân bố độ dài contig sau khi lắp ráp bằng phần mềm SOAPdenovo2 55
Hình 3.4 P h â n b ố đ ộ d à i c á c g e n đ ư ợ c d ự đ o á n t ừ b ộ d ữ l i ệ u D N A m e t a g e n o m e s u ố i n ư ớ c n ó n g B ì n h C h â u 56
Hình 3.5 Biểu đồ biểu thị 8 nhóm chiếm ưu thế cho từng cấp độ phân loại (Ngành, Lớp, Bộ, Họ, Chi, Loài) vi sinh vật ở suối nước nóng Bình Châu 57
Hình 3.6 Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy 62
Hình 3.7 Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu 63
Trang 14Hình 3.8 Cây phát sinh chủng loại Maximum likelihood của trình tự axit amin
mã hóa cho cellulase từ bộ dữ liệu DNA metagenome suối nước nóng
Bình Châu 66
Hình 3.9 Dự đoán tính chất của các protein tham gia vào quá trình thủy phân
cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome
suối nước nóng Bình Châu 67
Hình 3.10 Kết quả phân tích vùng bảo thủ trên trình tự axit amin của
endoglucanase_18736 71
Hình 3.11 Kết quả phân tích vùng bảo thủ trên trình tự axit amin của
β-glucosidase_32768 71
Hình 3.12 Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm
Swissmodel của ExPASy a) Cấu trúc của endoglucanase_18736
dựa theo khuôn mô hình cấu trúc của cellulase Cel6 giả định
(1up3.1.A); b) Cấu trúc khuôn cellulase Cel6 giả định (1up3.1.A) 72
Hình 3.13 Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm
Swissmodel của ExPASy a) Cấu trúc của β-glucosidase_32768 dựa
theo khuôn mô hình cấu trúc β-glucosidase (1vff.1.A); b) Cấu trúc
của β-glucosidase khuôn (1vff.1.A) 73
Hình 3.14 Điện di đồ sản phẩm cắt kiểm tra plasmid pET17b mang các đoạn gen
ngoại lai bằng hai enzyme giới hạn HindIII và NdeI 75
Hình 3.15 Hoạt tính endoglucanase_18736 (A) và β-glucosidase_32768 (B)
trong pha tan của các chủng tái tổ hợp 76
Hình 3.16 Ảnh hưởng của chủng chủ lên quá trình sinh trưởng và biểu hiện
enzyme tái tổ hợp 76
Hình 3.17 Ảnh hưởng của môi trường nuôi cấy lên sinh trưởng và sinh hoạt tính
enzyme ở chủng E coli C43(DE3) tái tổ hợp 77
Hình 3.18 Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính
endoglucanase của chủng E coli C43(DE3) tái tổ hợp 79
Hình 3.19 Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính
β-glucosidase của chủng E coli C43(DE3) tái tổ hợp 79
Trang 15Hình 3.20 Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện
endoglucanase_18736 của chủng tái tổ hợp 81
Hình 3.21 Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện β-glucosidase của chủng E coli C43(DE3) tái tổ hợp 81
Hình 3.22 Động thái sinh trưởng và sinh endoglucanase của chủng E coli C43(DE3) tái tổ hợp 82
Hình 3.23 Động thái sinh trưởng và sinh β-glucosidase của chủng E coli C43(DE3) tái tổ hợp 83
Hình 3.24 Điện di đồ SDS-PAGE (a) và Zymogram (b) của endoglucanase tái tổ hợp 84
Hình 3.25 Điện di đồ SDS-PAGE (a) và Zymogram (b) của β-glucosidase tái tổ hợp 84
Hình 3.26 Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp 86
Hình 3.27 Ảnh hưởng của pH lên hoạt tính endoglucanase tái tổ hợp 87
Hình 3.28 Ảnh hưởng của pH lên hoạt tính β-glucosidase tái tổ hợp 87
Hình 3.29 Ảnh hưởng của một số ion kim loại lên hoạt tính endoglucanase_18736 88
Hình 3.30 Ảnh hưởng của một số ion kim loại lên hoạt tính β-glucosidase_32768 88
Hình 3.31 Độ bền nhiệt của endoglucanase_18736 được khảo sát tại giá trị Topt và pHopt 91
Hình 3.32 Độ bền nhiệt của β-glucosidase_32768 được khảo sát tại giá trị Topt và pHopt 92
Hình 3.33 Khả năng thủy phân một số loại cơ chất của endoglucanase_18736 và β-glucosidase_32768 93
Hình 3.34 Động học enzyme tái tổ hợp 94
Trang 161
MỞ ĐẦU
Cellulase là nhóm enzyme thủy phân các liên kết β-1,4-glucoside trong phân tử cellulose, oligosaccharide, disaccharide và một số cơ chất tương tự khác Cellulase được tổng hợp bởi cổ khuẩn, vi khuẩn, nấm mốc, động vật nguyên sinh, thực vật và động vật Enzyme này được ứng dụng rộng rãi trong công nghiệp thực phẩm, lên men rượu, thức ăn gia súc, dệt may, giặt ủi, trong ngành công nghiệp giấy và bột giấy, Khi nguồn nguyên liệu hóa thạch dần cạn kiệt thì nhu cầu sử dụng các nguồn năng lượng thay thế, có thể tái tạo và thân thiện với môi trường ngày càng tăng Một trong những nguồn năng lượng thay thế được quan tâm nhất hiện nay là nhiên liệu sinh học
từ sinh khối lignocellulose Quá trình chuyển hóa lignocellulose thành các sản phẩm
có giá trị như nhiên liệu sinh học, nhựa sinh học, axit hữu cơ và các cụm hóa chất kiến tạo khác thường được thực hiện ở các điều kiện đặc biệt như ở nhiệt độ cao, tiền
xử lý bằng kiềm hoặc axit hoặc trong dung môi hữu cơ… Do đó đòi hỏi các nhà khoa học phải nghiên cứu tìm kiếm các cellulase mang những đặc tính mới (như bền với nhiệt độ cao, chịu được áp suất cao, chịu được pH axit/kiềm, dung môi …) để đáp ứng được các yêu cầu của quá trình chuyển hóa lignocellulose và hạ được giá thành sản xuất
Một trong những nguồn địa nhiệt có thể thu nhận cellulase bền nhiệt là nhóm vi sinh vật ưa nhiệt ở suối nước nóng Tuy nhiên, sử dụng các phương pháp phân lập, nuôi cấy vi sinh vật truyền thống không thể khai thác hết được tiềm năng của vật liệu
di truyền trong hệ sinh thái này vì có tới 99% các loài vi sinh vật sống trong môi trường là các loài không nuôi cấy được Hơn nữa, do đặc tính riêng của hệ sinh thái suối nước nóng có mật độ vi sinh vật thấp hơn rất nhiều so với các môi trường bình thường khác, vì vậy việc thu nhận được các loài vi sinh vật mới để khai thác nguồn gen của chúng bằng phương pháp nuôi cấy thông thường gặp nhiều khó khăn
Ngày nay, nhờ sự tiến bộ của công nghệ giải trình tự gen thế hệ mới, việc tách dòng các gen mới có thể được thực hiện bằng cách tiếp cận cơ sở dữ liệu metagenome kết hợp với các phần mềm tin sinh để dự đoán tính chất của protein tiềm năng trước khi biểu hiện và nghiên cứu đặc tính của enzyme tái tổ hợp Thông qua cách tiếp cận
Trang 172
này, các nhà nghiên cứu không chỉ đánh giá được mức độ đa dạng vi sinh vật ở trong một hệ sinh thái mà còn bảo tồn và khai thác được các gen mới hoặc các protein có tính chất đặc biệt từ các vi sinh vật đó
Với mong muốn có thể đánh giá đa dạng vi sinh vật, đồng thời tiếp cận và khai thác được nguồn cellulase bền nhiệt mới từ suối nước nóng Bình Châu - suối nước nóng có nhiệt độ cao thứ hai ở Việt Nam không thông qua nuôi cấy, chúng tôi đã tiến
hành nghiên cứu, thực hiện đề tài: “Nghiên cứu đánh giá đa dạng vi sinh vật, sàng lọc, thu nhận và xác định tính chất của cellulase suối nước nóng Bình Châu, Việt Nam bằng kỹ thuật Metagenomics”
MỤC TIÊU NGHIÊN CỨU
Thông qua kết quả giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu bằng hệ thống giải trình tự gen thế hệ mới, (i) Đánh giá được nguồn đa dạng vi sinh vật ưa nhiệt và xây dựng được bộ dữ liệu các gen mã hóa cho cellulase; ii) Biểu hiện được các cellulase tái tổ hợp đồng thời (iii) Tinh sạch và xác định được tính chất của các cellulase tái tổ hợp này
NỘI DUNG NGHIÊN CỨU
- Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu các gen mã hóa cho cellulase
- Biểu hiện gen mới mã hóa cho cellulase (endoglucanase và β-glucosidase) chịu nhiệt tiềm năng được lựa chọn từ bộ dữ liệu DNA metagenome
- Tinh sạch và xác định tính chất của các cellulase tái tổ hợp
NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN
- Đã xây dựng được bộ dữ liệu DNA metagenome của vi khuẩn và cổ khuẩn suối nước nóng Bình Châu với kích thước 9,4 Gb độ bao phủ trên 60% Qua phân tích đã xác định được đa dạng vi sinh vật và gen mã hóa enzyme thủy phân cellulose, lựa chọn được hai gen mới (có độ tương đồng thấp 50,35% và 53,94%) mã hóa cho hai enzyme tương ứng là endoglucanase và beta-glucosidase
- Đã biểu hiện, tinh sạch và nghiên cứu tính chất sinh học của endoglucanase và beta-glucosidase Đã xác định được Vmax và Km của hai enzyme này
Trang 183
CHƯƠNG 1 TỔNG QUAN TÀI LIỆU
1.1 Khu hệ vi sinh vật trong suối nước nóng
Suối nước nóng đã được nghiên cứu từ thế kỷ XIX Các nghiên cứu đầu tiên về suối nước nóng chỉ tập trung vào nghiên cứu tính chất hóa lý và đặc điểm địa chất, còn nghiên cứu về vi sinh vật sống trong hệ sinh thái này chỉ mới bắt đầu vào giữa thế kỷ XX (Marsh và Larsen, 1953) Nhiệt độ trong suối nước nóng thường vượt quá giới hạn phát triển của sinh vật nhân thật Do đó, vi sinh vật trong hệ sinh thái này chủ yếu là nhóm vi khuẩn, cổ khuẩn và virus (López-López và cs., 2013)
Vi sinh vật sống ở nhiệt độ cao được phân vào hai nhóm chính là vi sinh vật ưa nhiệt - thermophiles (nhiệt độ sinh trưởng tối ưu > 50ºC) và vi sinh vật siêu ưa nhiệt
- hyperthermophiles (nhiệt độ sinh trưởng tối ưu > 80ºC) Các vi sinh vật này đóng vai trò trung tâm trong chu trình phân hủy các hợp chất hữu cơ và chu trình hóa sinh địa (Merino và cs., 2019)
Vi sinh vật trong suối nước nóng thường không đa dạng và phong phú bằng các môi trường thủy vực khác Để nghiên cứu khu hệ vi sinh vật trong suối nước nóng, các nhà khoa học có thể tiếp cận bằng phương pháp nuôi cấy và/ hoặc không thông qua nuôi cấy Sử dụng phương pháp nuôi cấy, nhiều loài vi khuẩn và cổ khuẩn đã được phân lập từ các suối nước nóng khác nhau trên thế giới Từ các suối nước nóng nằm trong công viên quốc gia Yellowstone (Mỹ), các nhà khoa học đã phân lập được
nhiều loài vi khuẩn và cổ khuẩn: Achnanthes exigua, Archaeoglobus spp, Bacillus
coagulans, Clostridium thermoautotrophicum, Sulfolobus acidocaldarius, Thermoleophilum album, Thiobacillus thiooxidans (Resources, 1997) Đây là các loài
có nhiệt độ sinh trưởng cao hoặc cực cao Sử dụng phương pháp này, nhiều loài vi
khuẩn và cổ khuẩn mới cũng đã được phát hiện như Caldivirga maquilingensis gen nov., sp nov đã được phân lập từ suối nước nóng ở Phillipines (Itoh và cs., 1999);
Vulcanisaeta distribute gen nov., sp nov và Vulcanisaeta souniana sp nov đã được
tìm thấy trong suối nước nóng ở Nhật Bản (Itoh và cs., 2002); Fervidicoccus fontis
gen nov., sp nov đã được thu nhận ở suối nước nóng tại vùng Kamchatka Peninsula, Nga (Perevalova và cs., 2010)
Trang 194
Mặc dù nhiều chủng, loài vi sinh vật khác nhau từ các suối nước nóng trên Thế giới đã được phân lập và phân loại, nhưng số lượng những loài chưa thể phân lập được vẫn còn rất lớn, do đó không thể tiếp cận được các vi sinh vật bản địa, nắm bắt được vai trò của chúng trong các chu trình chuyển hóa vật chất cũng như thu nhận được các chất có hoạt tính sinh học từ hệ sinh thái này Sự ra đời của máy giải trình
tự gen thế hệ mới được đánh giá là một công nghệ tiên tiến của ngành công nghệ sinh học, khi kết hợp với các công cụ tin sinh sẽ tạo thành kỹ thuật Metagenomic (kỹ thuật phân tích hệ gen môi trường), cho phép các nhà khoa học có điều kiện tiếp cận, bảo tồn và khai thác nguồn vi sinh vật một cách đầy đủ và toàn diện hơn Hiệu quả của phương pháp này đã được chứng minh rõ rệt khi phân tích về số lượng, thành phần chủng loại của quần xã vi khuẩn trong suối nước nóng Comano Terme (Ý) so với phương pháp nuôi cấy thông thường (Pedron và cs., 2019) Kết quả đánh giá đa dạng không thông qua nuôi cấy có thể bao phủ toàn bộ số liệu về chủng loại vi khuẩn phân lập được, do vậy bức tranh về quần xã vi sinh vật trong các hệ sinh thái suối nước nóng trở lên phong phú và đa dạng hơn Trong các nghiên cứu trước đây, hầu hết các
vi khuẩn phân lập được từ suối nước nóng Ma'in và Afra ở Jordanian thuộc chi
Bacillus, Geobacillus và Anoxybacillus (Malkawi và Al-Omari, 2010; Al-Batayneh
và cs., 2011), tuy nhiên sử dụng kỹ thuật Metagenomics cho thấy vi sinh vật trong hai suối nước nóng này đa dạng hơn rất nhiều với sự có mặt của các loài thuộc ngành Proteobacteria, Bacteroidetes, Firmicutes, Deinococcus, Verrucomicrobia, Planctomycetes và Chloroflexi (Hussein và cs., 2017)
Sự phân bố và thành phần vi sinh vật trong mỗi suối nước nóng mang các đặc trưng riêng biệt, thường bị tác động bởi các yếu tố như nhiệt độ, thành phần hóa học
và pH của suối nước nóng (López-López và cs., 2013) Nhiệt độ được coi là yếu tố chính ảnh hưởng đến số lượng và thành phần của quần xã vi sinh vật ở các vị trí khác nhau trong suối nước nóng Nhiệt độ trong suối nước nóng giới hạn sự sống sót của các sinh vật nhân thật (nhiệt độ giới hạn của chúng thường < 60ºC) và các sinh vật quang hợp (70°C) Ví dụ quần thể vi sinh vật ở suối nước nóng ven biển Iceland chịu tác động mạnh mẽ của sự thay đổi nhiệt độ và độ mặn do ảnh hưởng của thủy triều cao định kỳ Nhóm vi khuẩn siêu ưa nhiệt chiếm ưu thế tại các vị trí có thời gian nóng
Trang 20chi Aquifex - tế bào có màu tím hồng, hóa tự dưỡng vô cơ Dọc theo dòng chảy, càng
ra xa miệng giếng phun, nhiệt độ càng giảm Ở nhiệt độ khoảng 45-72oC, các loài vi khuẩn lam Cyanobacteria phát triển tạo thành các đám trên mặt nước Trong số các
chi vi khuẩn lam, Synechococcus có khả năng chịu nhiệt cao nhất (~ 72oC) tạo thành
quần thể bên trên che phủ cho tầng dưới là quần thể của chi Chloroflexus - một loại
vi khuẩn lam màu xanh lá cây, quang hợp không thải khí oxy Ngoài ra, các chi vi khuẩn lam khác như Phormidium và Calothrix cũng được tìm thấy trong dòng chảy
của suối nước nóng Octopus ở các vị trí có nhiệt độ thấp hơn (Rothschild và Mancinelli, 2001) Ngoài yếu tố nhiệt độ, cấu trúc các quần xã vi sinh vật suối nước nóng có thể bị ảnh hưởng bởi các yếu tố khác như đặc điểm địa hóa, hoặc sự kết hợp giữa hai yếu tố nhiệt độ và pH Ngoài các yếu tố nhiệt độ, thành phần hóa học, pH, quần xã vi sinh vật trong suối nước nóng còn có thể chịu sự tác động của khoảng cách địa lý Một số loài vi sinh vật có thể có mặt ở tất cả các suối nước nóng Tuy nhiên, bên cạnh đó cũng có những loài được cho là đặc hữu của một khu vực suối nước nóng Vai trò của khoảng cách địa lý còn gây tranh cãi, nhưng có thể là một yếu tố quan trọng ảnh hưởng đến quần thể xạ khuẩn và vi khuẩn lam theo một số nghiên cứu nhưng không đại diện cho các quần thể vi sinh vật khác (Valverde và cs., 2012; López-López và cs., 2013)
Mỗi suối nước nóng thường đặc trưng bởi một vài nhóm vi sinh vật chiếm ưu thế Các nghiên cứu từ trước cho đến nay đều thấy Proteobacteria là ngành chiếm ưu thế trong các suối nước nóng ở Châu Phi (Tekere và cs., 2011), trong khi đó nhóm cổ khuẩn thuộc bộ Thermoplasmatales (chiếm 39%) thuộc ngành Euryarchaeota, và một nhóm cổ khuẩn khác (chiếm 33%) thuộc ngành Crenarchaeota lại là các nhóm ưu thế trong hệ sinh thái nước ngầm ở những vùng địa nhiệt ở Nga Cả hai ngành này đều là
Trang 216
những ngành có mặt trong các suối nước nóng trên toàn thế giới Tuy nhiên, nhóm vi khuẩn chiếm ưu thế trong hệ sinh thái này chủ yếu lại là vi khuẩn chuyển hóa methane, ưa axit, ưa nhiệt và vi khuẩn oxy hóa lưu huỳnh Đây là các vi khuẩn có thể
sử dụng các hợp chất vô cơ có nguồn gốc từ núi lửa để sinh trưởng (Mardanov và cs., 2011) Phân tích các đặc điểm phân loại của quần xã vi sinh vật trong suối nước nóng
có tính axit ở Colombia cho thấy chỉ một tỷ lệ nhỏ các trình tự nucleotide trong DNA metagenome có thể được phân loại đến loài dựa vào các cơ sở dữ liệu hiện có, hầu hết vi sinh vật trong suối nước nóng là các loài mới, chưa được phân lập và phân loại Những vi sinh vật được phân loại có tiềm năng tham gia vào các chu trình chuyển hóa nitơ và lưu huỳnh trong môi trường (Jimenez và cs., 2012) Nghiên cứu suối nước nóng Sungai Klah (SK) là suối nước nóng kiềm (pH 7,0 - 9,0), có nhiệt độ cao thứ hai ở Malaysia (50 - 110°C) cho thấy ngành Proteobacteria và Firmicutes là hai ngành chiếm ưu thế (Chan và cs., 2015) Kết quả này cũng phù hợp với kết quả nghiên cứu
về vi sinh vật ở suối nước nóng Kenya - suối nước nóng kiềm (pH 9,2 - 9,8), nhiệt độ 45,1 - 83,6ºC (Kambura và cs., 2016) Ngược lại, ngành Proteobacteria và Thermi chiếm ưu thế ở suối nước nóng axit nhẹ (pH 5 - 7), có nhiệt độ 45 - 90ºC (Paul và cs., 2016) Điều đó chứng tỏ, mức độ đa dạng và phân bố của vi sinh vật trong suối nước nóng cũng bị ảnh hưởng rất nhiều bởi pH hệ sinh thái
1.2 Cellulase
1.2.1 Phân loại
Dựa vào cơ chế hoạt động của các domain xúc tác và tính đặc hiệu cơ chất, cellulase được chia thành 3 dạng chính: β-1,4-endoglucanase (EC 3.2.1.4), exoglucanase [cellobiohydrolase phân giải cơ chất từ đầu không khử (EC 3.2.1.91), cellobiohydrolase phân giải cơ chất từ đầu khử (EC 3.2.1.176) và cellodextrinase (EC 3.2.1.74)] và β-glucosidase (EC 3.2.1.21) Endoglucanase phân cắt ngẫu nhiên các liên kết glycoside nội mạch của chuỗi cellulose, giải phóng ra các oligosaccharide có chiều dài khác nhau (như cellobiose và cellotriose) Cellobiohydrolase hoạt động phân cắt trên các đầu khử và không khử của cellulose, giải phóng cellobiose là chủ yếu, ngoài ra còn giải phóng ra các oligosaccharide mạch ngắn khác Cellodextrinase hoạt động trên các cellooligosaccharide hòa tan và nó cũng giải phóng ra cellobiose
Trang 227
Cuối cùng, β-glucosidases thủy phân cellodextrin và cellobiose để tạo thành glucose, kích hoạt cả endoglucanase và exoglucanase bằng cách làm giảm sự ức chế của sản phẩm cuối cùng (Hình 1.1)
Hình 1.1 Nguyên tắc hoạt động của cellulase thủy phân cellulose
Chú thích: Cellulose tinh thể (màu đỏ), cellulose vô định hình (màu đen)
(Nguồn: Juturu và Wu (2014))
Do polysaccharide rất đa dạng trong tự nhiên và thực tế cho thấy không phải lúc nào cũng dễ dàng phân loại cellulase thành endo- hoặc exoglucanase (Poidevin và cs., 2013) nên dựa trên mức độ tương đồng về trình tự axit amin và cấu trúc tinh thể, cellulase được xếp vào họ enzyme thủy phân glycoside (glycoside hydrolase - GH) Cách phân loại này không chỉ phản ánh mối quan hệ giữa cấu trúc và chức năng, cơ chế nhận biết cơ chất và phản ứng enzyme mà nó còn phản ánh mối quan hệ tiến hóa giữa các enzyme Các enzyme thuộc các họ GH khác nhau được tập hợp trong cơ sở
dữ liệu enzyme có hoạt tính carbohydrate (Carbohydrate-Active Enzymes Database) (http://www.cazy.org) Số lượng các enzyme mới liên tục được cập nhật ở cơ sở dữ liệu này, trung bình mỗi năm có thêm khoảng 5 họ GH mới (Helbert và cs., 2019) Tính đến thời điểm tháng 9 năm 2019 số lượng họ GH trong cơ sở dữ liệu CAZy là
165 họ GH, trong đó endoglucanase chủ yếu hiện diện ở 15 họ GH, bao gồm
GH5-10, GH12, GH26, GH44, GH45, GH48, GH51, GH74, GH124 và GH148;
Trang 238
cellobiohydrolase hoạt động trên các đầu không khử hiện diện ở 3 họ GH5, GH6 và GH9; cellobiohydrolase hoạt động trên các đầu khử hiện diện ở 3 họ GH7, GH9 và GH48; cellodextrinase hiện diện ở 4 họ GH1, GH3, GH5 và GH9; và cuối cùng, β-glucosidase hiện diện ở 9 họ GH1-3, GH5, GH9, GH16, GH30, GH39 và GH116 (http://www.cazy.org)
Bảng 1.1 Phân bố của cellulase vào các họ GH khác nhau
Cấu trúc 3D
Nucleophile/
Bazơ xúc tác
Chất cho proton xúc tác
- (α/α) 6 Asp Glu
12 Endo-β-1,4-Glucanase Giữ lại GH-C β-jelly roll Glu Glu
30 β-Glucosidase Giữ lại GH-A (β/α) 8 Glu Glu
44 Endo-β-1,4-Glucanase Giữ lại - (β/α) 8 Glu Glu
Trang 249
Mặc dù được phân loại vào cùng một họ GH nhưng các enzyme riêng biệt vẫn
có thể khác nhau về tính đặc hiệu cơ chất và nguồn gốc tiến hóa như trong trường hợp họ GH5 bao gồm cả cellulase, xylanase và mannase Điều này cho thấy sự tiến hóa từ tâm hoạt động của enzyme để có thể phù hợp với các cơ chất khác nhau Mặt khác, do sự tiến hóa tập trung của các kiểu cuộn gấp khác nhau trong tâm hoạt động mà các enzyme thuộc các họ GH khác nhau vẫn có thể thủy phân cùng một
cơ chất (Duan và Feng, 2010; Lopez-Mondejar và cs., 2016; Tiwari và cs., 2018).Nghiên cứu cơ sở dữ liệu CAZy cũng cho thấy một số họ như họ GH1 và GH5 là
họ cellulase của vi khuẩn, nấm mốc và cổ khuẩn; họ GH30 và GH48 là họ enzyme thủy phân của nấm mốc; họ GH8 và GH44 là họ enzyme thủy phân của vi khuẩn (Bảng 1.1) Mặt khác, một chủng vi sinh vật có thể sinh tổng hợp nhiều loại cellulase thuộc một
số họ với các kiểu cuộn gấp và cơ chế xúc tác khác nhau Do đó, có thể khẳng định rằng cellulase là một nhóm phức hợp các enzyme dường như đã phát triển từ cùng một kiểu cuộn gấp cơ bản Sự đa dạng phổ biến trong các họ cellulase phản ánh tính không đồng nhất của cơ chất, bao gồm cellulose và các polysaccharide liên quan cấu thành sinh khối thực vật và cũng là đa dạng nơi sống của vi sinh vật – nơi mà quá trình thủy phân diễn ra (Sharma và Yazdani, 2016)
1.2.2 Đặc điểm hóa sinh
Trang 25Trong enzyme, tâm hoạt động thường nằm ở vùng xúc tác CD và có cấu trúc thuộc một trong ba dạng: dạng túi (pocket), dạng đường hầm (tunnel) và dạng khe/rãnh (cleft) (Hình 1.4) Hầu hết endoglucanase có tâm hoạt động dạng khe/rãnh, exoglucanase có tâm hoạt động dạng đường hầm, còn β-glucosidase có tâm hoạt động dạng túi (Davies và Henrissat, 1995)
Hình 1.2 Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ nấm
Trichoderma reesei
Chú thích: Enzyme có mang vùng CBM (xanh nhạt) được nối với vùng xúc tác lớn bởi cầu
nối linh hoạt (màu vàng); chuỗi cellulose (màu xanh lá cây)
(Nguồn: Sanchez Hernandez (2019))
Trang 2611
Hình 1.3 Cấu trúc cellulosome của A cellulolyticus
Chú thích: Cellulosome A bao gồm ScaA, ScaB và ScaC, liên kết với nhau thông qua các
tương tác cohesin-dockerin đặc biệt ScaA chứa một cohesin dạng I cho phép enzym chứa bảy dockerin gắn vào cellulosome ScaA cũng chứa module liên kết với cellulose (CBM) và module xúc tác thuộc họ GH9 ScaB hoạt động như một cầu nối giữa ScaA và ScaC, đồng thời ScaB cho phép bốn protein ScaA liên kết với cohesin dạng II của nó Mặt khác scaffoldin dạng I, ScaC, có thể liên kết một cách chọn lọc với ba protein ScaB và gắn toàn bộ cellulosome lên bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt (SLH) của nó Cellulosome B chứa hai scaffoldin, ScaA và ScaD ScaD cũng cố định cellulosome vào bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt và có thể liên kết hai protein ScaA bằng hai cohesin dạng II của nó ScaD cũng có thể liên kết với enzyme chứa dockerin dạng
I thông qua cohesin dạng I của nó
(Nguồn: Hamberg và cs (2014))
Hình 1.4 Ba dạng tâm hoạt động của các họ GH
Chú thích: a) Dạng túi; b) dạng khe/rãnh; c) dạng đường hầm Axit amin xúc tác có màu đỏ
(Nguồn: Davies và Henrissat (1995))
Trang 2712
1.2.2.2 Cơ chế xúc tác
Cellulase xúc tác cho quá trình phân hủy mạch polysaccharide của cellulose bằng cách phá vỡ các liên kết β-1,4-glycoside Ba loại enzyme chính tham gia vào quá trình thủy phân các vi sợi cellulose trong thành tế bào thực vật gồm: endoglucanase, exoglucanase và β-glucosidase Quá trình thủy phân hoàn toàn cellulose hình thành nên một loạt các chất trung gian dưới sự xúc tác đồng thời của
cả ba loại enzyme chính này Endoglucanase thường tấn công vào các vùng vô định hình của cellulose Enzyme này thuỷ phân các liên kết lỏng lẻo nội phân tử ở vùng
vô định hình của cellulose để tạo ra các chuỗi mới Những chuỗi mới này sau đó dễ dàng bị tấn công bởi các loại enzyme khác Hoạt tính enzyme cao nhất thường đạt được trên cơ chất cellulose dạng hòa tan hoặc cellulose vô định hình đã được xử lý bằng axit Exoglucanase có chức năng thủy phân đầu khử và không khử của cellulose
để tạo ra glucose hoặc cellobiose Exoglucanase khác với endoglucanase ở chỗ có khả năng thủy phân cơ chất cellulose tinh thể như avicel hoặc cellooligosaccharide Cuối cùng, β-glucosidase có thể thủy phân cellobiose thành glucose từ các đầu không khử và β-glucosidase bị bất hoạt khi phản ứng với cellulose vô định hình hoặc cellulose tinh thể Mặc dù cơ chế chính xác vẫn chưa được hoàn thiện, tuy nhiên đã quan sát thấy sự phân mảnh của cellulose thành các sợi ngắn trước khi phát hiện thấy đường khử trong quá trình thủy phân (Jayasekara và Ratnayake, 2019)
Cellulase có hai cơ chế xúc tác: giữ lại và đảo ngược Cellulase cắt các liên kết glucoside bằng cách sử dụng nhóm xúc tác axit – bazơ Quá trình thủy phân được thực hiện bởi hai nhóm xúc tác của enzyme, trong đó một nhóm là axit (đóng vai trò
là chất cho proton) và một nhóm là nucleophile/bazơ Cơ chế xúc tác xảy ra phụ thuộc vào vị trí không gian của nhóm xúc tác Duy trì và đảo ngược cấu hình dị thường của cellulase là hai cơ chế thủy phân cellulose Trong cơ chế đảo ngược, cấu hình C dị thường của cellulase đã bị đảo ngược sau khi thủy phân dịch chuyển nucleophilic đơn (Hình 1.5A) Còn trong cơ chế giữ lại, cellulase giữ nguyên cấu hình C dị thường mang liên kết glucoside đích ngay cả khi đã có sự dịch chuyển kép của hai axit amin glycosyl hóa hoặc khử glycosyl hóa chìa khóa trong quá trình thủy phân (Hình 1.5B) (Vocadlo và Davies, 2008)
Trang 2813
Hình 1.5 Hai cơ chế xúc tác của GHsa
Chú thích: (A) Cơ chế đảo ngược; (B) Cơ chế giữ lại
(Nguồn: Payne và cs (2015))
1.2.2.3 Cơ chế gắn kết và tính đặc hiệu cơ chất
Cơ chế gắn kết và tính đặc hiệu cơ chất là một trong những đặc tính hóa sinh của enzyme Ngoài cellulose, cellulase còn có thể thủy phân xylan, lichenan và
mannan Cellulase Cel5E của Pseudomonas fluorescens có khả năng thủy phân CMC,
lichenan, avicel và cellulose trương nở bởi axit nhưng lại bị bất hoạt hoàn toàn trên
cơ chất xylan (Hall và cs., 1995) Trong khi cũng thuộc họ GH5, cellulase CelG của
Fibrobacter succinogenes S85 lại có khả năng thủy phân hoàn toàn CMC và xylan
nhưng lại bị bất hoạt hoàn toàn trên cơ chất avicel và lichenan (Iyo và Forsberg, 1996) Ngược lại, một số cellulase chỉ hoạt động trên các dẫn xuất của cellulose
Chẳng hạn, cellulase cel5B thuộc họ GH5 sinh tổng hợp bởi Thermobifida fusca, chỉ
có thể thủy phân các cơ chất chứa cellulose như CMC, avicel và MN300 (sợi cellulose
tự nhiên) nhưng lại bị bất hoạt hoàn toàn trên các cơ chất khác (Posta và cs., 2004)
Do đó, CMC được sử dụng như là cơ chất đặc hiệu chung để phát hiện cellulase Tuy
Trang 2914
nhiên, các cơ chế gắn kết và tính đặc hiệu cơ chất của cellulase trên các cơ chất khác ngoài CMC còn rất ít thông tin (Sukharnikov và cs., 2011)
1.2.2.4 Các chất ức chế và cofactors
Ảnh hưởng của các ion kim loại lên hoạt tính cellulase
Các ion kim loại có thể liên kết với protein và cũng có thể tạo thành phức chất với các phân tử khác khi liên kết với enzyme Các ion này đóng vai trò là chất cho hoặc nhận điện tử hoặc chất điều chỉnh cấu trúc Các ion kim loại có thể làm tăng hoặc ức chế hoạt tính enzyme bằng cách tương tác với các nhóm amine hoặc nhóm axit carboxylic của các axit amin Ảnh hưởng của các ion kim loại lên hoạt tính của enzyme thủy phân lignocellulose nói chung và của cellulase nói riêng đã được Pereira
và cs (2017) đề cập Ngoài ra, hoạt tính cellulase của vi sinh vật ở suối nước nóng cũng bị ảnh hưởng bởi một số ion kim loại như trong tóm tắt ở Bảng 1.2
Bảng 1.2 Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật
ở suối nước nóng
Enzyme Nguồn gốc Kim loại làm tăng hoạt
tính enzyme
Kim loại làm mất hoạt tính enzyme
Na + , Cu 2+ , Fe 3+
Zarafeta và cs (2016) Endoglucanase Bacillus sp PW1
β-Glucosidase DNA metagenome Ở nồng độ 1mM gồm:
Al 3+ , Ca 2+ , Co 2+ , Cr 3+ ,
Fe 2+ , Fe 3+ , K + , Mg 2+ ,
Rb + ; ở nồng độ 5mM gồm: Mg 2+ , Rb +
Mn 2+ , Ni 2+ , Sr 2+ Schroder và cs
(2014)
Trang 3015
Các ion kim loại hóa trị I, II và III như Na+, K+, Ca2+, Mg2+, Mn2+, Fe2+, Co2+,
Cu2+, Ni2+, Zn2+, Hg2+ và Fe3+ thường được nghiên cứu trong quá trình phân tích đặc tính của cellulase Bên cạnh đặc điểm về điện tích, kích thước bán kính ion cũng có ảnh hưởng lớn đến hoạt tính và độ bền của enzyme Một số nghiên cứu đã cho thấy những ion có bán kính lớn hơn ít ảnh hưởng đến các axit amin xúc tác, trong khi những ion có bán kính nhỏ hơn có thể hấp dẫn các axit amin tích điện mạnh hơn làm thay đổi cấu trúc tổng thể của enzyme bằng việc phá hủy vị trí xúc tác (Zeng và cs., 2014)
Tác dụng ức chế của Fe2+ và Cu2+ lên hoạt tính cellulase cũng đã được nghiên cứu Tuy nhiên, ảnh hưởng của các ion khác nhau có hóa trị II lên hoạt tính của cellulase được sinh tổng hợp bởi các vi sinh vật khác nhau là khác nhau (Bảng 1.2) Tác dụng của các ion hóa trị II lên cellulase không tuân theo quy luật rõ ràng và mức
độ ảnh hưởng khác nhau có thể do tác dụng của quá trình oxy hóa khử lên các axit amin, làm tăng hoặc giảm hoạt tính của enzyme (Tejirian và Xu, 2010)
Ion Hg2+ ức chế cellulase do tương tác với các gốc axit amin xúc tác có chứa lưu huỳnh dẫn đến quá trình oxy hóa và hình thành các liên kết disulfide bất thường (Tejirian và Xu, 2010) Ion Fe2+ có thể tạo phức với D/L-Lys và L-Met (Vassilev và cs., 2013), Cu2+ tạo phức với His và Ba2+ tạo phức với Arg, Glu, Pro, Ser và Val (Bush
Trang 31Các loại đường được giải phóng ra khi thủy phân lignocellulose bằng enzyme
có thể bị phân hủy và chuyển hóa thành các hợp chất ức chế enzyme Trong điều kiện axit, glucose, mannose và galactose có thể được chuyển hóa thành các furan aldehyde như hydroxymethylfurfurals (HMF) Ngược lại, HMF có thể được chuyển hóa thành axit levulinic và axit formic (Jönsson và cs., 2013)
Tiền xử lý lignocellulose bằng kiềm hoặc axit, hoặc bằng các cách khác trong quá trình thủy phân lignin bằng enzyme (có sự tham gia của laccase) có thể giải phóng các hợp chất phenol như vanillin, syringaldehyde, axit trans-cinnamic và axit hydroxybenzoic Các hợp chất này là chất ức chế hoạt tính endo/exoglucanase và β-glucosidase do sự hiện diện của các nhóm hydroxyl, carbonyl và methoxyl (Qin và cs., 2016)
Như đã đề cập ở trên, cellulase còn bị ức chế bởi một nhóm các chất có nguồn gốc protein Các protein ức chế xyloglucan endo-β-glucanase đặc hiệu (XEGIPs) có mặt trong thành tế bào của một số loại rau như cà chua, thuốc lá và lúa mì Đồng thời các chất ức chế này cũng ức chế endoglucanase thủy phân xyloglucan Những protein
Trang 32và cs., 2013)
Hấp phụ không đặc hiệu của cellulase lên lignin cũng có thể bị giảm bằng cách thêm các chất hoạt động bề mặt vào môi trường phản ứng, làm tăng hiệu quả xúc tác của enzyme Tween 20, 40, 60, 80 và 100, triton X-100, polyethylen glycol (PEG) cùng với các chất hoạt động bề mặt khác có xu hướng làm giảm sức căng bề mặt của các chất hòa tan trong nước, có thể làm thay đổi tính chất của các chất lỏng như chất tẩy rửa, nhũ hóa, bôi trơn và hòa tan Các chất hoạt động bề mặt có thể làm giảm sự hấp phụ không đặc hiệu của cellulase lên lignin, nó đóng vai trò là nhân tố kích hoạt các enzyme này (Hsieh và cs., 2015)
Các tác nhân tạo phức (Chelating agent) như EDTA, ethylene glycol, mercaptoethanol và DPPE (1,2-bis diphenylphosphino-ethylene) có thể làm tăng hoạt tính của một số enzyme do các hợp chất này kết hợp với các ion kim loại có mặt trong phản ứng làm cho tâm hoạt động của enzyme dễ dàng phản ứng với cơ chất Đây chính là ưu điểm của các tác nhân tạo phức đối với hoạt tính của enzyme Ngược lại, nhược điểm của các tác nhân tạo phức là làm cho enzyme bị phụ thuộc vào ion vô cơ
β-đã phân tách (Pereira và cs., 2017)
1.2.2.5 Cơ chế bền nhiệt
Các enzyme có thể (a) chịu được nhiệt độ cao, (b) cuộn xoắn ở nhiệt độ cao và/ hoặc (c) có hoạt tính tối ưu ở nhiệt độ cao hơn được gọi là enzyme bền nhiệt và/hoặc enzyme ưa nhiệt Enzyme bền nhiệt khá ổn định ở nhiệt độ cao nơi mà các enzyme ưa ấm bị biến tính làm hoạt tính tối ưu của enzyme bị mất hoặc giảm (Turner và cs., 2007)
Trang 3318
Độ bền nhiệt là một đặc tính do nhiều yếu tố tác động Đặc tính này có thể là do trình tự axit amin của protein hay do mức độ cuộn xoắn của nó quy định Rất nhiều nghiên cứu trên thế giới đã so sánh protein ưa ấm và protein bền nhiệt cho thấy các yếu tố sau có thể làm tăng tính bền nhiệt như tỷ lệ của một số loại axit amin nào đó trong trình tự enzyme (Kumar và cs., 2000), tăng tính kỵ nước (Gromiha và cs., 2013),
sự thay đổi của một axit amin đơn lẻ (Sandgren và cs., 2003), cấu trúc chặt chẽ của protein, tỷ lệ của các axit amin có điện tích dương và sự thay đổi năng lượng tự do Gibbs của quá trình hydrate hoá (Gromiha và cs., 2019) Nhìn chung, các protein ưa nhiệt thường có tỷ lệ các axit amin kỵ nước và mang điện tích lớn hơn so với protein
ưa ấm Các axit amin kỵ nước thường liên kết với nhau để tạo thành các trung tâm của protein, làm hạn chế sự tiếp xúc với các dung môi hữu cơ tối đa, tạo các tương tác van der Waals bền vững với các axit amin kỵ nước bên ngoài khác Các nhóm liên kết này thường tạo ra khoảng trống tối thiểu phía trong cấu trúc nhưng lại tạo điều kiện tiếp cận trên bề mặt một cách tối đa Theo đó, các protein ưa nhiệt thường
có tỷ lệ Val, Arg, Glu và Ile trung bình cao hơn so với các protein ưa ấm Mặt khác, các axit amin mang điện tích sẽ định dạng protein một cách phù hợp thông qua việc hình thành các cầu muối disulfide, giúp ổn định cấu trúc trong quá trình cuộn xoắn hơn so với các tương tác của các axit amin kỵ nước
Mặc dù các nghiên cứu đã cố gắng xác định nhân tố chìa khóa quyết định mức
độ bền nhiệt của các họ protein, tuy nhiên cho đến nay cũng chưa có công bố nào đưa
ra được giả thuyết cũng như bằng chứng về đặc tính này một cách có quy luật Trong các nghiên cứu trước đây về endoglucanase bền nhiệt, Panasik và cs (2000) đã phân tích các yếu tố quyết định tính bền nhiệt của protein thuộc họ GH có cấu trúc cuộn gấp (α/β)8 và chỉ ra rằng việc thiếu Gly trong các họ GH bền nhiệt (bao gồm endoglucanase) đã được xác định là nhân tố ảnh hưởng đến độ bền nhiệt của enzyme Cấu trúc endoglucanase phổ biến được chia thành 3 dạng cuộn xoắn (α/β)8, xoắn cuộn β, và (α/α)6 Việc phân tích các dữ liệu cấu trúc của enzyme cho thấy dạng cuộn xoắn protein ảnh hưởng nhiều đến độ bền nhiệt của endoglucanase (Yennamalli
và cs., 2011) Khi so sánh trình tự của các endoglucanase bền nhiệt và ưa nhiệt, kết
Trang 34Trên cơ sở những cơ chế lý giải cho khả năng bền nhiệt của enzyme và protein nói chung, cơ chế bền nhiệt của β-glucosidase cũng đã được nghiên cứu Để nâng cao khả năng bền nhiệt của UsBgl, Nam và cs (2008) đã thiết kế một số điểm đột biến trong đầu N và đầu C của UsBgl dựa trên trình tự và cấu trúc của β-glucosidase bền
nhiệt TmBglA ở vi khuẩn Thermotoga maritime Kết quả là đầu N và đầu C đã tương
tác với nhau qua liên kết hydro, từ đó làm tăng khả năng hòa tan của protein cũng như tăng hoạt tính xúc tác Đồng thời, nhờ có tương tác này mà enzyme trở nên bền hơn Khả năng bền nhiệt của enzyme cũng được cho là do sự gia tăng về số lượng của Pro, cầu liên kết tĩnh điện, các phân tử nước bên trong và sự liên kết của nhiều tiểu phần trong cấu trúc bậc bốn của enzyme khi so sánh với enzyme ưa ấm
1.2.2.6 Một số đặc điểm của cellulase bền nhiệt
Đặc điểm pH, nhiệt độ tối ưu và độ bền nhiệt là một trong những đặc tính quan trọng của enzyme nói chung và cellulase bền nhiệt nói riêng Các đặc điểm này là cơ
sở để định hướng ứng dụng enzyme vào các lĩnh vực khác nhau của cuộc sống Cellulase bền nhiệt được sinh tổng hợp chủ yếu từ vi khuẩn ưa nhiệt, cổ khuẩn, nấm sợi ưa nhiệt và ưa ấm Trong tự nhiên, các loài vi nấm có xu hướng sinh tổng hợp nhiều cellulase hơn vi khuẩn, tuy nhiên, cellulase do vi khuẩn tạo ra lại là chất xúc tác tốt hơn vì chúng ít bị ức chế ngược Hơn nữa, vi khuẩn không chỉ sinh trưởng nhanh mà nó còn có thể tạo enzyme tái tổ hợp cao hơn vi nấm Vi khuẩn có khả năng
cư trú ở nhiều loại môi trường khác nhau như nhiệt độ cao, pH kiềm và pH axit; điều
Trang 3520
đó đã giúp cho vi khuẩn tạo ra các chất xúc tác sinh học mang những đặc tính ổn định trong điều kiện khắc nghiệt được tìm thấy trong các quá trình chuyển hóa sinh học góp phần làm tăng tốc độ thủy phân và thu hồi sản phẩm một cách hiệu quả (Acharya
và Chaudhary, 2012) Bảng 1.3 mô tả đặc điểm của một số cellulase bền nhiệt
Bảng 1.3 Đặc điểm của cellulase bền nhiệt
Enzyme Họ GH Điều kiện
tối ưu
Bền ở điều kiện Nguồn TLTK
Nhiệt độ pH EglA 12 ≥ 100ºC 6 50%; 95ºC; 40h Pyrococcus
furiosus
(Bauer và cs., 1999) CelA 12 95ºC 6 KXĐ
Thermotoga neapolitana
Bok và cs (1998) CelB 12 106ºC 6-6,6 50%; 106ºC; 130 phút
50%; 110ºC; 26 phút
EG 5 109ºC 5,5 50%; 100ºC; 5 giờ
50%; 105ºC; 0,57 giờ 50%; 108ºC; 0,17 giờ
Cổ khuẩn làm giàu
sp S66-4
Huang và
cs (2010) BglW 3 50ºC 9 >75%; 40-50ºC; pH 8-
9,5; 30 phút
Aspergillus fumigatus
WL002
Cao và cs (2015)
Bgl1 1 90ºC 6.5 67%; 90ºC; 1.5 giờ
78%; 50ºC; 24 giờ 68%; 60ºC; 24 giờ
Cổ khuẩn không nuôi cấy được từ DNA metagenome suối nước nóng
Schroder và
cs (2014)
XM70-Cel9 KXĐ 70ºC 7 50%; 85ºC; 30 phút DNA
metagenome trầm tích suối nước nóng
(Zhao và cs., 2017)
Vul_Bgl1A 1 105ºC 7 50%; 75ºC; 99 phút
50%; 90ºC; 15 phút 50%; 99ºC; 11 phút 50-68%; pH 4-9; 24h 20%; pH4; 48 giờ 47%; pH7; 48 giờ
DNA metagenome mẫu lấy từ lỗ thông thủy nhiệt ở đảo Vulcano, Italy
Schröder và
cs (2019)
Chú thích: KXĐ: Không xác định
Trang 3621
1.2.3 Ứng dụng công nghệ sinh học của cellulase ưa nhiệt
Enzyme ưa nhiệt có ưu điểm hơn so với các enzyme ưa ấm bởi chúng có khả năng ứng dụng trong các ngành công nghiệp khác nhau Enzyme ưa nhiệt thường bền hơn khi hoạt động trong điều kiện ở nhiệt độ cao, pH cực đoan, có sự hiện diện của các chất gây biến tính protein Enzyme ưa nhiệt thường có tốc độ phản ứng cao hơn
so với enzyme ưa ấm (Wang và cs., 2015) Tốc độ truyền khối lớn làm tăng độ hòa tan của cơ chất, làm giảm nguy cơ tạp nhiễm (Rawat và cs., 2015) Cuối cùng, enzyme
ưa nhiệt có thể hoạt động linh hoạt trong các quy trình được thiết kế riêng để giảm chi phí vận hành Hiện nay, cellulase ưa nhiệt được ứng dụng chủ yếu trong các ngành sản xuất nhiên liệu sinh học (chuyển hóa sinh khối thực vật thành ethanol sinh học), công nghiệp thực phẩm và sản xuất bia, công nghiệp dệt may (mài mòn sinh học và đánh bóng sinh học), giặt ủi (trong công thức chất tẩy rửa), công nghiệp giấy và bột giấy (Sharma và cs., 2016; Jayasekara và Ratnayake, 2019), cũng như trong sản xuất thức ăn chăn nuôi (Wang và cs., 2015) Ngoài ra, cellulase ưa nhiệt còn được ứng dụng trong một số ngành khác như quản lý chất thải, cải thiện đất nông nghiệp (Biver
và cs., 2014) và chiết xuất các hợp chất từ thực vật như dầu ô liu, bột màu và các phân tử có hoạt tính sinh học (Sharma và cs., 2016) Quá trình chuyển hóa hoàn toàn cellulose thành glucose, sau đó chuyển hóa tiếp thành bioethanol đòi hỏi phải có sự kết hợp đồng thời của nhiều enzyme thủy phân cellulose (endo- và exoglucanase và β-glucosidase) Do đó, khi nguồn năng lượng hóa thạch bị cạn kiệt phải thay thế bằng nguồn năng lượng tái tạo thì nhiên liệu sinh học sản xuất từ sinh khối thực vật trở nên tiềm năng và cần được quan tâm phát triển (Escuder-Rodríguez và cs., 2018) Sử dụng cellulase bền nhiệt để tiền xử lý và xử lý sinh khối góp phần làm giảm giá thành sản xuất năng lượng, cải thiện khả năng hòa tan của cơ chất, giảm độ nhớt và giảm sự phụ thuộc vào việc sử dụng các hóa chất gây hại cho môi trường (Jayasekara và Ratnayake, 2019)
1.3 Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các gen mới
Metagenomics được định nghĩa là kỹ thuật nghiên cứu đa hệ gen hay DNA hệ gen tổng số trực tiếp từ mẫu môi trường Kể từ khi thuật ngữ Metagenome được sử dụng lần đầu tiên vào năm 1998 (Handelsman và cs., 1998), metagenomics đã là một trong những công cụ nghiên cứu chính để nghiên cứu sinh thái vi sinh vật và là công
Trang 3722
cụ không thể thiếu để nghiên cứu sự đa dạng cũng như tiềm năng trao đổi chất của các vi sinh vật (phần lớn là những loài không nuôi cấy được) trong môi trường Các kết quả nghiên cứu về metagenomic có thể cung cấp thông tin về các gen chức năng, cấu trúc và tổ chức bộ gen, xác định gen và chất xúc tác sinh học mới, cấu trúc quần
xã và các mối quan hệ tiến hóa trong quần xã vi sinh vật (Culligan và cs., 2014)
1.3.1 Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics
Hai phương pháp tiếp cận chính được sử dụng để tiếp cận và thu nhận các gen mới từ DNA môi trường là (i) dựa vào trình tự và (ii) dựa vào chức năng (hoặc kết hợp cả hai) (Hình 1.6)
Hình 1 6 Các phương pháp chính để phát hiện gen mới bằng cách sử dụng
Metagenomics
Chú thích: A) Mẫu môi trường quan tâm (ví dụ đất, hệ vi sinh vật đường ruột của người,
nước biển) được thu thập; B) DNA metagenomics tổng số của mẫu được phân lập trực tiếp
Trang 3823
hoặc gián tiếp bằng cách phá vỡ tế bào; C) Phân tích DNA metagenomics dựa vào trình tự, C-1) có thể tạo thư viện tách dòng bằng cách giải trình tự Sanger hoặc giải trình tự DNA metagenome trực tiếp, sử dụng hệ thống giải trình tự thế hệ mới; C-2) sử dụng cặp mồi suy biến được thiết kế từ các vùng bảo thủ của gen đích, sau đó khuếch đại gen dần từng bước cho đến khi thu được toàn bộ gen; C-3) khai thác dữ liệu từ bộ dữ liệu giải trình tự metagenomic để tìm kiếm thông tin của gen hoặc các vùng bảo thủ rồi tổng hợp gen sau khi
đã tối ưu để biểu hiện trong chủng chủ; C-4) thu giữ lại các gen mới từ các plasmid sử dụng phương pháp TRACA (transposon-aided capture) hoặc các gen liên quan tới integron bằng cách sử dụng phương pháp PCR với cặp mồi nhắm vào trình tự có vị trí tích hợp bảo thủ; D) Phân tích metagenomics dựa vào chức năng; D-1) tạo thư viện mang đoạn chèn có kích thước lớn hoặc nhỏ bằng cách sử dụng vector phù hợp (plasmid, fosmid, cosmid, or bacterial artificial chromosome [BAC]) tùy thuộc vào nhu cầu của nghiên cứu; D-2) lựa chọn chủng
chủ thích hợp để biểu hiện gen hoặc hệ gen Chủng chủ được sử dụng phổ biến nhất là E coli, ngoài ra còn có thể sử dụng các chủng Bacillus và Streptomyces Thư viện gen được
giữ trên các đĩa micro-titer 96 hoặc 384 giếng và được bảo quản ở -80C; D-3) Các dòng mang DNA metagenome có thể được sàng lọc để xác định hoạt tính đích bằng cách nhân bản toàn bộ hoặc một phần thư viện vào trong các đĩa micro-titer mới hoặc cấy gạt lên trên các đĩa thạch Các dòng dương tính được nhận biết thông qua một số đặc điểm khác biệt như khả năng kháng kháng sinh, hình thành sắc tố, sự thay đổi hình thái hoặc khả năng kháng một
số yếu tố khác; D-4) Đột biến gen nhảy có thể được tiến hành trên các dòng dương tính để xác định gen hoặc các gen quan tâm; D-5) Tách dòng và biểu hiện các gen để xác nhận lại kiểu hình; E) các gen mới được phát hiện dựa vào chức năng hoặc trình tự hoặc dựa vào sự kết hợp của
cả hai cách tiếp cận trên
(Nguồn: Culligan và cs (2014))
1.3.1.1 Khai thác gen mới dựa vào chức năng
Trước đây, sàng lọc các gen mới từ DNA metagenome chủ yếu dựa vào hoạt tính trao đổi chất của các dòng gen trong thư viện metagenome Đây là phương pháp tiếp cận duy nhất để xác định các gen mới mã hóa cho protein hoặc peptide đã biết hoặc chưa biết chức năng mà không cần biết trình tự của gen (Simon và Daniel, 2011) Phương pháp này không quá khó, ít tốn kém nhưng đòi hỏi mất nhiều công sức, tốn nhiều thời gian, số lượng các dòng sàng lọc trong thư viện phải đủ lớn và chất lượng
Trang 39bộ DNA metagenome để tạo ra các đoạn DNA có kích thước đủ lớn, có khả năng chứa toàn bộ trình tự của các gen có trong mẫu DNA môi trường; (iii) Các đoạn DNA sau khi cắt bằng enzyme giới hạn được gắn vào vector phù hợp và biến nạp vào chủng chủ (Simon và Daniel, 2017) Một trong những thách thức lớn nhất của kỹ thuật này
là số lượng các dòng gen để sàng lọc vô cùng lớn với tỷ lệ dòng dương tính là vô cùng nhỏ Đồng thời thư viện vẫn phải đảm bảo có chứa các dòng đại diện cho các loài có mật độ cực ít trong mẫu (<1%) (Riesenfeld và cs., 2004) Các dòng biểu hiện gen này sau đó được sử dụng để sàng lọc chức năng hoặc sàng lọc gen mong muốn khác (Hình 1.7)
Hình 1.7 Các bước chính xây dựng thư viện Metagenomic
(Nguồn: Dias và cs (2014))
1.3.1.2 Khai thác gen mới dựa vào trình tự DNA metagenomes
Những tiến bộ trong công nghệ giải trình tự thế hệ thứ hai và thế hệ thứ ba đã thúc đẩy những tiến bộ trong kỹ thuật metagenomics Với các công nghệ hiện nay, hàng trăm cơ sở dữ liệu đã được giải trình tự DNA với chi phí rất thấp (Watson, 2014) Đồng thời công nghệ này cũng có thể phát hiện được sự có mặt của những vi
Mẫu môi trường
Trang 4025
sinh vật với số lượng cực ít trong môi trường Công nghệ giải trình tự hiện đại kết hợp với những cải tiến liên tục trong lĩnh vực tin sinh học đã làm cho phân tích metagenome trở thành một kỹ thuật dễ tiếp cận, giá cả phải chăng và nhanh chóng được sử dụng cho hầu hết các phòng thí nghiệm (Roumpeka và cs., 2017) Thông qua phân tích metagenome từ cơ sở dữ liệu giải trình tự thế hệ mới, nhiều enzyme, chất xúc tác sinh học mới đã được phát hiện Wallace và cs (2015) đã giải trình tự mẫu ruột dạ cỏ bằng máy giải trình tự Illumina, lắp ráp dữ liệu bằng de novo và chú giải các contigs Kết quả thu được cho thấy mẫu nghiên cứu có đến hơn 1,5 triệu gen giả định với 58% là các protein chưa biết Trong một nghiên cứu khác, khi phân tích metagenomic của vi sinh vật sống trong dạ cỏ của bò và cừu đã xác định được 3.970 gen, trong số đó, gen có liên quan đến khả năng sinh khí metan và chuyển hóa hiệu quả thức ăn đã biết chỉ chiếm tương ứng là 20 và 49 gen (Roehe và cs., 2016) Nghiên cứu của Sunagawa và cs (2015) khi khảo sát lấy mẫu đại dương toàn cầu đã phát hiện 40 triệu trình tự từ hơn 35.000 loài, trong đó chỉ có 0.44% dữ liệu được so sánh với các gen đã biết Kết quả nghiên cứu này cho thấy tiềm năng của các gen chưa được khám phá ở đại dương của chúng ta Tóm lại, cùng với sự phát triển của các hệ thống máy giải trình tự gen thế hệ mới và các phần mềm tin sinh, cách tiếp cận metagenome thông qua giải trình tự đã trở thành một phương pháp khai thác nguồn gen vi sinh vật vô cùng hiệu quả và nhanh chóng Hơn nữa, có thể thấy ưu điểm nổi bật của phương pháp này ở chỗ:
• Các kết quả không bị ảnh hưởng bởi một loại gen đặc hiệu
• Không phụ thuộc vào các marker di truyền có tính phân loại
• Đánh giá mức độ đa dạng vi sinh vật sâu, bao gồm virus
• Ước lượng được sự đa dạng vi sinh vật
• Phát hiện được vi sinh vật chiếm ưu thế trong các môi trường khác nhau
• Phân tích vi sinh vật không nuôi cấy được
• Thông tin về thành phần cũng như các chức năng có thể có của một hệ sinh thái
• Nghiên cứu các gen và các cụm gen chức năng
Khai thác gen mới dựa vào trình tự DNA metagenome sử dụng cùng một quy trình phân tích tin sinh học: (a) lắp ráp các dữ liệu đã được giải trình tự (trực tiếp từ