1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu đánh giá đa dạng vi sinh vật, sàng lọc, thu nhận và xác định tính chất của cellulase suối nước nóng bình châu bằng kỹ thuật metagenomics

185 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 185
Dung lượng 8,42 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Dự đoán tính chất của các protein tham gia vào quá trình thủy phân cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu .... Quá trình chuyển hóa l

Trang 1

viện hàn lâm khoa học và công nghệ việt nam

viện công nghệ sinh học

TRẦN THANH THỦY

NGHIÊN CứU đánh giá đa dạng vi sinh vật, SàNG LọC, THU NHậN Và XáC ĐịNH TíNH CHấT CủA CELLULASE SUốI NƯớC NóNG bình châu, VIệT NAM bằng kỹ thuật metagenomicS

luận án tiến sĩ sinh học

Trang 2

viện hàn lâm khoa học và công nghệ việt nam

viện công nghệ sinh học

TRẦN THANH THỦY

NGHIÊN CứU đánh giá đa dạng vi sinh vật, SàNG LọC, THU NHậN Và XáC ĐịNH TíNH CHấT CủA CELLULASE SUốI NƯớC NóNG bình châu, VIệT NAM bằng kỹ thuật metagenomicS

Chuyên ngành : Vi sinh vật học Mã số : 9 42 01 07

luận án tiến sĩ sinh học

Người hướng dẫn khoa học: 1 TS Nguyễn Kim Thoa

Viện Cụng nghệ sinh học

2 PGS TS Trần Đỡnh Mấn

Viện Cụng nghệ sinh học

Hà nội - 2021

Trang 3

LỜI CẢM ƠN

Với lòng biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành nhất đến TS Nguyễn Kim Thoa và PGS TS Trần Đình Mấn, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam – những người thầy đã tận tình chỉ bảo, hướng dẫn, động viên và tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện luận án này

Tôi xin gửi lời cảm ơn tới Ban lãnh đạo Viện Công nghệ sinh học, phòng Thí nghiệm trọng điểm Công nghệ gen, phòng Công nghệ Vật liệu sinh học, các cán bộ tại cơ sở đào tạo thuộc Viện Công nghệ sinh học, phòng Hệ gen học chức năng thuộc Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tạo điều kiện thuận lợi về cơ sở vật chất, máy móc, trang thiết bị cũng như các thủ tục cần thiết để tôi có thể hoàn thành luận án

Tôi cũng xin gửi lời cảm ơn tới các đồng nghiệp tham gia đề tài ĐTĐLCN.15/14, các chú, anh, chị, em cán bộ phòng Công nghệ Vật liệu sinh học đã giúp đỡ, động viên tôi trong suốt quá trình thực hiện luận án

Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè, những người thân đã luôn ở bên cạnh chia sẻ, động viên, khích lệ, giúp đỡ, tạo điều kiện thuận lợi về mọi mặt để tôi có thể tập trung, yên tâm học tập, nghiên cứu và hoàn thành luận

án của mình

Hà Nội, ngày tháng năm 2021

Tác giả

Trần Thanh Thủy

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan:

Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác với các cộng sự khác

Các số liệu và kết quả trình bày trong luận án là trung thực, một phần đã được công bố trên các tạp chí khoa học chuyên ngành với sự đồng ý và cho phép của các đồng tác giả

Phần còn lại chưa được ai công bố trong bất kỳ công trình nào khác

Hà Nội, ngày … tháng … năm 2021

Tác giả

Trần Thanh Thủy

Trang 5

MỤC LỤC

LỜI CẢM ƠN i

LỜI CAM ĐOAN ii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT vii

DANH MỤC CÁC BẢNG x

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ xi

MỞ ĐẦU 1

CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 3

1.1 Khu hệ vi sinh vật trong suối nước nóng 3

1.2 Cellulase 6

1.2.1 Phân loại 6

1.2.2 Đặc điểm hóa sinh 9

1.2.3 Ứng dụng công nghệ sinh học của cellulase ưa nhiệt 21

1.3 Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các gen mới 21

1.3.1 Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics 22

1.3.2 Phương pháp đánh giá đa dạng vi sinh vật từ dữ liệu giải trình tự DNA metagenome 26

1.3.3 Ứng dụng kỹ thuật Metagenomics để đánh giá đa dạng vi sinh vật và khai thác các gen mã hóa cho enzyme mới 28

1.3.4 Tình hình ứng dụng metagenomics vào nghiên cứu đa dạng vi sinh vật và khai thác các gen mã hóa cho cellulase ở Việt Nam 32

CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 35

2.1 Vật liệu 35

2.1.1 Vi sinh vật 35

Trang 6

2.1.2 Vector 35

2.1.3 Cặp mồi sử dụng 35

2.1.4 Gen nghiên cứu 36

2.1.5 Các hóa chất sử dụng 36

2.1.6 Môi trường nuôi cấy 36

2.2 Máy móc và thiết bị 36

2.3 Phương pháp nghiên cứu 36

2.3.1 Tách chiết DNA metagenome của mẫu suối nước nóng Bình Châu 36

2.3.2 Giải trình tự DNA metagenome suối nước nóng Bình Châu 37

2.3.3 Các phương pháp tin sinh 38

2.3.4 Khuếch đại gen endoglucanase_18736 và β-glucosidase_32768 40

2.3.5 Tạo vector biểu hiện pET-17b gắn các đoạn gen endoglucanase_18736/ β-glucosidase_32768 41

2.3.6 Biến nạp vector biểu hiện pET-17b chứa các đoạn gen endoglucanase_18736/ β-glucosidase_32768 vào E coli TOP10F’ bằng phương pháp xung điện 42

2.3.7 Chọn lọc dòng E coli mang vector pET17b-18736/ và pET17b-32768 43

2.3.8 Tạo chủng E coli tái tổ hợp mang vector pET-17b_18736 và pET-17b_32768 43

2.3.9 Biểu hiện gen denovogenes_18736 và denovogenes_32768 44

2.3.10 Xác định trọng lượng sinh khối khô 44

2.3.11 Phương pháp thu nhận enzyme thô 44

2.3.12 Phương pháp xác định hoạt tính endoglucanase 45

2.3.13 Phương pháp xác định hoạt tính -glucosidase 45

Trang 7

2.3.14 Ảnh hưởng của một số yếu tố lên mức độ biểu hiện endoglucanase_18736

và β-glucanase_32768 46

2.3.15 Động thái sinh trưởng và sinh endoglucanase, β-glucosidase tái tổ hợp 47

2.3.16 Tinh sạch endoglucanase và β-glucosidase tái tổ hợp 47

2.3.17 Định lượng protein tổng số 48

2.3.18 Điện di protein SDS-PAGE 48

2.3.19 Kiểm tra hoạt tính endoglucanase bằng Zymogram (Điện di protein trên gel polyacrylamide có chứa cơ chất CMC) 49

2.3.20 Kiểm tra hoạt tính β-glucosidase bằng Zymogram 50

2.3.21 Nghiên cứu một số đặc tính của enzyme tái tổ hợp 50

2.3.22 Xử lý thống kê 51

CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU 52

3.1 Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và

xây dựng bộ dữ liệu gen mã hóa cho cellulase 52

3.1.1 Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng Bình Châu 52

3.1.2 Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật, xác định và tổng hợp gen mới mã hóa cho các enzyme thủy phân cellulose (enzyme chịu kiềm, chịu axit và chịu nhiệt) 54

3.2 Biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 74

3.2.1 Thiết kế vector biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 trong E coli 74

3.2.2 Lựa chọn một số điều kiện biểu hiện gen [denovogenes]_18736 và [denovogenes]_32768 trong E coli 75

Trang 8

3.2.3 Động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của

chủng E coli C43(DE3) tái tổ hợp 82

3.3 Tinh sạch và xác định tính chất của các cellulase tái tổ hợp 83

3.3.1 Tinh sạch enzyme tái tổ hợp 83

3.3.2 N g h i ê n c ứ u m ộ t s ố đ ặ c t í n h c ủ a e n d o g l u c a n a s e _ 1 8 7 3 6 v à β-glucosidase _32768 tái tổ hợp 85

CHƯƠNG 4 BÀN LUẬN KẾT QUẢ NGHIÊN CỨU 95

4.1 Đa dạng vi sinh vật và tiềm năng khai thác các gen mới mã hóa cho cellulase suối nước nóng Bình Châu thông qua cách tiếp cận không phụ thuộc vào nuôi cấy 95

4.1.1 Đa dạng vi sinh vật 95

4.1.2 Tiềm năng khai thác các gen mới mã hóa cho cellulase 99

4.2 Mối liên hệ giữa mô hình cấu trúc với các đặc điểm của endoglucanase_18736 và β-glucosidase_32768 104

4.2.1 P h â n t í c h c á c d o m a i n c h ứ c n ă n g c ủ a e n d o g l u c a n a s e _ 1 8 7 3 6 v à β - g l u c o s i d a s e _ 3 2 7 6 8 104

4.2.2 Mô hình cấu trúc 3D của endoglucanase_18736 và β-glucosidase_32768 tái tổ hợp 104

KẾT LUẬN VÀ KIẾN NGHỊ 111

NHỮNG CÔNG TRÌNH CỦA TÁC GIẢ ĐÃ CÔNG BỐ LIÊN QUAN ĐẾN ĐỀ TÀI 113

TÓM TẮT LUẬN ÁN BẰNG TIẾNG ANH 114

TÀI LIỆU THAM KHẢO 122

PHỤ LỤC 1

Trang 9

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Tên viết tắt Tên tiếng Anh Tên tiếng Việt

APS Ammonium persulfate Ammonium persulfate

BGI Beijing Genomics Institute Viện nghiên cứu hệ gen Bắc Kinh BLAST Basic Local Alignment

Search Tool

Công cụ tìm kiếm các trình tự tương đồng trực tuyến của NCBI

BSA Bovine serum albumin Albumin huyết thanh bò

CAZy Carbohydrate – Active

Module/Vùng liên kết với carbohydrate

CEs Carbohydrate esterases Carbohydrate esterases

CMC Carboxymethyl cellulose Carboxymethyl cellulose

DNA Deoxyribonucleic acid Axit Deoxyribonucleic

DNSA 3,5-Dinitrosalicylic acid Axit 3,5-Dinitrosalicylic

dNTP 2’ – deoxyribonucleoside

5’ – triphosphate

2’ – deoxyribonucleoside 5’ - triphosphate

(diphenylphosphino) ethylene

1,2-bis (diphenylphosphino) ethylene

EBI European Bioinformatics

Institute

Viện nghiên cứu tin sinh Châu Âu

EDTA Ethylene diamine tetra

acetic acid

Axit ethylene diamine tetra acetic

Trang 10

EMBL European Molecular

Hệ thống chuyên phân tích protein

GH Glycoside hydrolase Họ enzyme thủy phân glycoside GTs Glycosyl transferases Glycosyl transferases

nucleic

KEGG Kyoto Encyclopedia of

Genes and Genomes

Cơ sở dữ liệu về gen và hệ gen Kyoto

Km Michaelis constants Hằng số Michaelis

LB Luria-Bertani Môi trường Luria-Bertani (LB)

MEGAN MEtaGenomic ANalyser Phần mềm phân tích trình tự đa hệ gen

NB Nutrient broth Môi trường Nutrient broth (NB) NCBI National Center for

Giải trình tự gen thế hệ mới

NR Non - Redundant Cơ sở dữ liệu chứa các trình tự

không dư thừa của NCBI

Trang 11

PDB Protein Data Bank Ngân hàng dữ liệu protein

PEG Polyethylen glycol Polyethylen glycol

PLs Polysaccharide lyases Polysaccharide lyases

Điện di trên gel polyacrylamide

Swiss-Prot Swiss Protein Cơ sở dữ liệu protein Thụy Sĩ

TB Terrific Broth Môi trường Terrific broth (TB)

TEMED N,N,N′,N′-Tetramethyl

ethylenediamine

N,N,N′,N′-Tetramethyl ethylenediamine

Tm Temperature Melting Nhiệt độ nóng chảy

Vmax Maximum Velocity Vận tốc tối đa

Uniprot Universal Protein Resource Nguồn dữ liệu phổ biến về trình tự

và chức năng của protein

Trang 12

DANH MỤC CÁC BẢNG

Bảng 1.1 Phân bố của cellulase vào các họ GH khác nhau 8

Bảng 1.2 Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật

ở suối nước nóng 14

Bảng 1.3 Đặc điểm của cellulase bền nhiệt 20

Bảng 1.4 Cellulase bền nhiệt từ metagenome của vi sinh vật ở suối nước nóng 31

Bảng 3.1 Nồng độ và độ tinh sạch của DNA metagenome mẫu nước và mẫu bùn

suối nước nóng Bình Châu 54

Bảng 3.2 Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome suối nước nóng

Bình Châu 54

Bảng 3.3 Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu 55

Bảng 3.4 Thống kê phân loại học DNA metagenome suối nước nóng Bình Châu

đã được chú giải 56

Bảng 3.5 Tỉ lệ các gen đã được phân loại thuộc các Ngành vi khuẩn ở

suối nước nóng Bình Châu 58

Bảng 3.6 Tỉ lệ các gen đã được phân loại thuộc các Lớp vi khuẩn ở suối nước nóng

Bình Châu 59

Bảng 3.7 Tóm tắt kết quả chú giải gen dựa vào các cơ sở dữ liệu mở 61

Bảng 3.8 Phân bố của các ORF mã hóa cho cellulase được dự đoán từ bộ dữ liệu

DNA metagenome suối nước nóng Bình Châu 64

Bảng 3.9 Đặc điểm của 5 ORF mã hóa cho endoglucanase và β-glucosidase

thỏa mãn các tiêu chí lựa chọn gen/protein mới 68

Bảng 3.10 Kết quả tinh sạch endoglucanase và β-glucosidase tái tổ hợp bằng cột

IMAC-Ni2+ 85

Bảng 3.11 Ảnh hưởng của nồng độ ion kim loại lên hoạt tính enzyme tái tổ hợp 90

Trang 13

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1 Nguyên tắc hoạt động của cellulase thủy phân cellulose 7

Hình 1.2 Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ nấm Trichoderma reesei 10

Hình 1.3 Cấu trúc cellulosome của A cellulolyticus 11

Hình 1.4 Ba dạng tâm hoạt động của các họ GH 11

Hình 1.5 Hai cơ chế xúc tác của GHsa 13

Hình 1.6 Các phương pháp chính để phát hiện gen mới bằng cách sử dụng Metagenomics 22

Hình 1.7 Các bước chính xây dựng thư viện Metagenomic 24

Hình 1.8 Các bước phân tích tin sinh điển hình cho cơ sở dữ liệu Metagenomic 26

Hình 2.1 Quy trình xử lý, phân tích dữ liệu DNA metagenome và sàng lọc gen mã hóa cho enzyme thủy phân cellulose tiềm năng 38

Hình 3.1 Các vị trí lấy mẫu nước và mẫu bùn của suối nước nóng Bình Châu 53

Hình 3.2 DNA metagenome mẫu nước và bùn suối nước nóng Bình Châu 53

Hình 3.3 Phân bố độ dài contig sau khi lắp ráp bằng phần mềm SOAPdenovo2 55

Hình 3.4 P h â n b ố đ ộ d à i c á c g e n đ ư ợ c d ự đ o á n t ừ b ộ d ữ l i ệ u D N A m e t a g e n o m e s u ố i n ư ớ c n ó n g B ì n h C h â u 56

Hình 3.5 Biểu đồ biểu thị 8 nhóm chiếm ưu thế cho từng cấp độ phân loại (Ngành, Lớp, Bộ, Họ, Chi, Loài) vi sinh vật ở suối nước nóng Bình Châu 57

Hình 3.6 Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy 62

Hình 3.7 Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu 63

Trang 14

Hình 3.8 Cây phát sinh chủng loại Maximum likelihood của trình tự axit amin

mã hóa cho cellulase từ bộ dữ liệu DNA metagenome suối nước nóng

Bình Châu 66

Hình 3.9 Dự đoán tính chất của các protein tham gia vào quá trình thủy phân

cellulose được mã hóa bởi các gen trong bộ dữ liệu DNA metagenome

suối nước nóng Bình Châu 67

Hình 3.10 Kết quả phân tích vùng bảo thủ trên trình tự axit amin của

endoglucanase_18736 71

Hình 3.11 Kết quả phân tích vùng bảo thủ trên trình tự axit amin của

β-glucosidase_32768 71

Hình 3.12 Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm

Swissmodel của ExPASy a) Cấu trúc của endoglucanase_18736

dựa theo khuôn mô hình cấu trúc của cellulase Cel6 giả định

(1up3.1.A); b) Cấu trúc khuôn cellulase Cel6 giả định (1up3.1.A) 72

Hình 3.13 Mô hình cấu trúc protein 3D được xây dựng bằng phần mềm

Swissmodel của ExPASy a) Cấu trúc của β-glucosidase_32768 dựa

theo khuôn mô hình cấu trúc β-glucosidase (1vff.1.A); b) Cấu trúc

của β-glucosidase khuôn (1vff.1.A) 73

Hình 3.14 Điện di đồ sản phẩm cắt kiểm tra plasmid pET17b mang các đoạn gen

ngoại lai bằng hai enzyme giới hạn HindIII và NdeI 75

Hình 3.15 Hoạt tính endoglucanase_18736 (A) và β-glucosidase_32768 (B)

trong pha tan của các chủng tái tổ hợp 76

Hình 3.16 Ảnh hưởng của chủng chủ lên quá trình sinh trưởng và biểu hiện

enzyme tái tổ hợp 76

Hình 3.17 Ảnh hưởng của môi trường nuôi cấy lên sinh trưởng và sinh hoạt tính

enzyme ở chủng E coli C43(DE3) tái tổ hợp 77

Hình 3.18 Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính

endoglucanase của chủng E coli C43(DE3) tái tổ hợp 79

Hình 3.19 Ảnh hưởng độ thoáng khí lên sinh trưởng và sinh hoạt tính

β-glucosidase của chủng E coli C43(DE3) tái tổ hợp 79

Trang 15

Hình 3.20 Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện

endoglucanase_18736 của chủng tái tổ hợp 81

Hình 3.21 Ảnh hưởng nồng độ IPTG cảm ứng lên sinh trưởng và biểu hiện β-glucosidase của chủng E coli C43(DE3) tái tổ hợp 81

Hình 3.22 Động thái sinh trưởng và sinh endoglucanase của chủng E coli C43(DE3) tái tổ hợp 82

Hình 3.23 Động thái sinh trưởng và sinh β-glucosidase của chủng E coli C43(DE3) tái tổ hợp 83

Hình 3.24 Điện di đồ SDS-PAGE (a) và Zymogram (b) của endoglucanase tái tổ hợp 84

Hình 3.25 Điện di đồ SDS-PAGE (a) và Zymogram (b) của β-glucosidase tái tổ hợp 84

Hình 3.26 Ảnh hưởng của nhiệt độ lên hoạt tính enzyme tái tổ hợp 86

Hình 3.27 Ảnh hưởng của pH lên hoạt tính endoglucanase tái tổ hợp 87

Hình 3.28 Ảnh hưởng của pH lên hoạt tính β-glucosidase tái tổ hợp 87

Hình 3.29 Ảnh hưởng của một số ion kim loại lên hoạt tính endoglucanase_18736 88

Hình 3.30 Ảnh hưởng của một số ion kim loại lên hoạt tính β-glucosidase_32768 88

Hình 3.31 Độ bền nhiệt của endoglucanase_18736 được khảo sát tại giá trị Topt và pHopt 91

Hình 3.32 Độ bền nhiệt của β-glucosidase_32768 được khảo sát tại giá trị Topt và pHopt 92

Hình 3.33 Khả năng thủy phân một số loại cơ chất của endoglucanase_18736 và β-glucosidase_32768 93

Hình 3.34 Động học enzyme tái tổ hợp 94

Trang 16

1

MỞ ĐẦU

Cellulase là nhóm enzyme thủy phân các liên kết β-1,4-glucoside trong phân tử cellulose, oligosaccharide, disaccharide và một số cơ chất tương tự khác Cellulase được tổng hợp bởi cổ khuẩn, vi khuẩn, nấm mốc, động vật nguyên sinh, thực vật và động vật Enzyme này được ứng dụng rộng rãi trong công nghiệp thực phẩm, lên men rượu, thức ăn gia súc, dệt may, giặt ủi, trong ngành công nghiệp giấy và bột giấy, Khi nguồn nguyên liệu hóa thạch dần cạn kiệt thì nhu cầu sử dụng các nguồn năng lượng thay thế, có thể tái tạo và thân thiện với môi trường ngày càng tăng Một trong những nguồn năng lượng thay thế được quan tâm nhất hiện nay là nhiên liệu sinh học

từ sinh khối lignocellulose Quá trình chuyển hóa lignocellulose thành các sản phẩm

có giá trị như nhiên liệu sinh học, nhựa sinh học, axit hữu cơ và các cụm hóa chất kiến tạo khác thường được thực hiện ở các điều kiện đặc biệt như ở nhiệt độ cao, tiền

xử lý bằng kiềm hoặc axit hoặc trong dung môi hữu cơ… Do đó đòi hỏi các nhà khoa học phải nghiên cứu tìm kiếm các cellulase mang những đặc tính mới (như bền với nhiệt độ cao, chịu được áp suất cao, chịu được pH axit/kiềm, dung môi …) để đáp ứng được các yêu cầu của quá trình chuyển hóa lignocellulose và hạ được giá thành sản xuất

Một trong những nguồn địa nhiệt có thể thu nhận cellulase bền nhiệt là nhóm vi sinh vật ưa nhiệt ở suối nước nóng Tuy nhiên, sử dụng các phương pháp phân lập, nuôi cấy vi sinh vật truyền thống không thể khai thác hết được tiềm năng của vật liệu

di truyền trong hệ sinh thái này vì có tới 99% các loài vi sinh vật sống trong môi trường là các loài không nuôi cấy được Hơn nữa, do đặc tính riêng của hệ sinh thái suối nước nóng có mật độ vi sinh vật thấp hơn rất nhiều so với các môi trường bình thường khác, vì vậy việc thu nhận được các loài vi sinh vật mới để khai thác nguồn gen của chúng bằng phương pháp nuôi cấy thông thường gặp nhiều khó khăn

Ngày nay, nhờ sự tiến bộ của công nghệ giải trình tự gen thế hệ mới, việc tách dòng các gen mới có thể được thực hiện bằng cách tiếp cận cơ sở dữ liệu metagenome kết hợp với các phần mềm tin sinh để dự đoán tính chất của protein tiềm năng trước khi biểu hiện và nghiên cứu đặc tính của enzyme tái tổ hợp Thông qua cách tiếp cận

Trang 17

2

này, các nhà nghiên cứu không chỉ đánh giá được mức độ đa dạng vi sinh vật ở trong một hệ sinh thái mà còn bảo tồn và khai thác được các gen mới hoặc các protein có tính chất đặc biệt từ các vi sinh vật đó

Với mong muốn có thể đánh giá đa dạng vi sinh vật, đồng thời tiếp cận và khai thác được nguồn cellulase bền nhiệt mới từ suối nước nóng Bình Châu - suối nước nóng có nhiệt độ cao thứ hai ở Việt Nam không thông qua nuôi cấy, chúng tôi đã tiến

hành nghiên cứu, thực hiện đề tài: “Nghiên cứu đánh giá đa dạng vi sinh vật, sàng lọc, thu nhận và xác định tính chất của cellulase suối nước nóng Bình Châu, Việt Nam bằng kỹ thuật Metagenomics”

MỤC TIÊU NGHIÊN CỨU

Thông qua kết quả giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu bằng hệ thống giải trình tự gen thế hệ mới, (i) Đánh giá được nguồn đa dạng vi sinh vật ưa nhiệt và xây dựng được bộ dữ liệu các gen mã hóa cho cellulase; ii) Biểu hiện được các cellulase tái tổ hợp đồng thời (iii) Tinh sạch và xác định được tính chất của các cellulase tái tổ hợp này

NỘI DUNG NGHIÊN CỨU

- Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu các gen mã hóa cho cellulase

- Biểu hiện gen mới mã hóa cho cellulase (endoglucanase và β-glucosidase) chịu nhiệt tiềm năng được lựa chọn từ bộ dữ liệu DNA metagenome

- Tinh sạch và xác định tính chất của các cellulase tái tổ hợp

NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN

- Đã xây dựng được bộ dữ liệu DNA metagenome của vi khuẩn và cổ khuẩn suối nước nóng Bình Châu với kích thước 9,4 Gb độ bao phủ trên 60% Qua phân tích đã xác định được đa dạng vi sinh vật và gen mã hóa enzyme thủy phân cellulose, lựa chọn được hai gen mới (có độ tương đồng thấp 50,35% và 53,94%) mã hóa cho hai enzyme tương ứng là endoglucanase và beta-glucosidase

- Đã biểu hiện, tinh sạch và nghiên cứu tính chất sinh học của endoglucanase và beta-glucosidase Đã xác định được Vmax và Km của hai enzyme này

Trang 18

3

CHƯƠNG 1 TỔNG QUAN TÀI LIỆU

1.1 Khu hệ vi sinh vật trong suối nước nóng

Suối nước nóng đã được nghiên cứu từ thế kỷ XIX Các nghiên cứu đầu tiên về suối nước nóng chỉ tập trung vào nghiên cứu tính chất hóa lý và đặc điểm địa chất, còn nghiên cứu về vi sinh vật sống trong hệ sinh thái này chỉ mới bắt đầu vào giữa thế kỷ XX (Marsh và Larsen, 1953) Nhiệt độ trong suối nước nóng thường vượt quá giới hạn phát triển của sinh vật nhân thật Do đó, vi sinh vật trong hệ sinh thái này chủ yếu là nhóm vi khuẩn, cổ khuẩn và virus (López-López và cs., 2013)

Vi sinh vật sống ở nhiệt độ cao được phân vào hai nhóm chính là vi sinh vật ưa nhiệt - thermophiles (nhiệt độ sinh trưởng tối ưu > 50ºC) và vi sinh vật siêu ưa nhiệt

- hyperthermophiles (nhiệt độ sinh trưởng tối ưu > 80ºC) Các vi sinh vật này đóng vai trò trung tâm trong chu trình phân hủy các hợp chất hữu cơ và chu trình hóa sinh địa (Merino và cs., 2019)

Vi sinh vật trong suối nước nóng thường không đa dạng và phong phú bằng các môi trường thủy vực khác Để nghiên cứu khu hệ vi sinh vật trong suối nước nóng, các nhà khoa học có thể tiếp cận bằng phương pháp nuôi cấy và/ hoặc không thông qua nuôi cấy Sử dụng phương pháp nuôi cấy, nhiều loài vi khuẩn và cổ khuẩn đã được phân lập từ các suối nước nóng khác nhau trên thế giới Từ các suối nước nóng nằm trong công viên quốc gia Yellowstone (Mỹ), các nhà khoa học đã phân lập được

nhiều loài vi khuẩn và cổ khuẩn: Achnanthes exigua, Archaeoglobus spp, Bacillus

coagulans, Clostridium thermoautotrophicum, Sulfolobus acidocaldarius, Thermoleophilum album, Thiobacillus thiooxidans (Resources, 1997) Đây là các loài

có nhiệt độ sinh trưởng cao hoặc cực cao Sử dụng phương pháp này, nhiều loài vi

khuẩn và cổ khuẩn mới cũng đã được phát hiện như Caldivirga maquilingensis gen nov., sp nov đã được phân lập từ suối nước nóng ở Phillipines (Itoh và cs., 1999);

Vulcanisaeta distribute gen nov., sp nov và Vulcanisaeta souniana sp nov đã được

tìm thấy trong suối nước nóng ở Nhật Bản (Itoh và cs., 2002); Fervidicoccus fontis

gen nov., sp nov đã được thu nhận ở suối nước nóng tại vùng Kamchatka Peninsula, Nga (Perevalova và cs., 2010)

Trang 19

4

Mặc dù nhiều chủng, loài vi sinh vật khác nhau từ các suối nước nóng trên Thế giới đã được phân lập và phân loại, nhưng số lượng những loài chưa thể phân lập được vẫn còn rất lớn, do đó không thể tiếp cận được các vi sinh vật bản địa, nắm bắt được vai trò của chúng trong các chu trình chuyển hóa vật chất cũng như thu nhận được các chất có hoạt tính sinh học từ hệ sinh thái này Sự ra đời của máy giải trình

tự gen thế hệ mới được đánh giá là một công nghệ tiên tiến của ngành công nghệ sinh học, khi kết hợp với các công cụ tin sinh sẽ tạo thành kỹ thuật Metagenomic (kỹ thuật phân tích hệ gen môi trường), cho phép các nhà khoa học có điều kiện tiếp cận, bảo tồn và khai thác nguồn vi sinh vật một cách đầy đủ và toàn diện hơn Hiệu quả của phương pháp này đã được chứng minh rõ rệt khi phân tích về số lượng, thành phần chủng loại của quần xã vi khuẩn trong suối nước nóng Comano Terme (Ý) so với phương pháp nuôi cấy thông thường (Pedron và cs., 2019) Kết quả đánh giá đa dạng không thông qua nuôi cấy có thể bao phủ toàn bộ số liệu về chủng loại vi khuẩn phân lập được, do vậy bức tranh về quần xã vi sinh vật trong các hệ sinh thái suối nước nóng trở lên phong phú và đa dạng hơn Trong các nghiên cứu trước đây, hầu hết các

vi khuẩn phân lập được từ suối nước nóng Ma'in và Afra ở Jordanian thuộc chi

Bacillus, Geobacillus và Anoxybacillus (Malkawi và Al-Omari, 2010; Al-Batayneh

và cs., 2011), tuy nhiên sử dụng kỹ thuật Metagenomics cho thấy vi sinh vật trong hai suối nước nóng này đa dạng hơn rất nhiều với sự có mặt của các loài thuộc ngành Proteobacteria, Bacteroidetes, Firmicutes, Deinococcus, Verrucomicrobia, Planctomycetes và Chloroflexi (Hussein và cs., 2017)

Sự phân bố và thành phần vi sinh vật trong mỗi suối nước nóng mang các đặc trưng riêng biệt, thường bị tác động bởi các yếu tố như nhiệt độ, thành phần hóa học

và pH của suối nước nóng (López-López và cs., 2013) Nhiệt độ được coi là yếu tố chính ảnh hưởng đến số lượng và thành phần của quần xã vi sinh vật ở các vị trí khác nhau trong suối nước nóng Nhiệt độ trong suối nước nóng giới hạn sự sống sót của các sinh vật nhân thật (nhiệt độ giới hạn của chúng thường < 60ºC) và các sinh vật quang hợp (70°C) Ví dụ quần thể vi sinh vật ở suối nước nóng ven biển Iceland chịu tác động mạnh mẽ của sự thay đổi nhiệt độ và độ mặn do ảnh hưởng của thủy triều cao định kỳ Nhóm vi khuẩn siêu ưa nhiệt chiếm ưu thế tại các vị trí có thời gian nóng

Trang 20

chi Aquifex - tế bào có màu tím hồng, hóa tự dưỡng vô cơ Dọc theo dòng chảy, càng

ra xa miệng giếng phun, nhiệt độ càng giảm Ở nhiệt độ khoảng 45-72oC, các loài vi khuẩn lam Cyanobacteria phát triển tạo thành các đám trên mặt nước Trong số các

chi vi khuẩn lam, Synechococcus có khả năng chịu nhiệt cao nhất (~ 72oC) tạo thành

quần thể bên trên che phủ cho tầng dưới là quần thể của chi Chloroflexus - một loại

vi khuẩn lam màu xanh lá cây, quang hợp không thải khí oxy Ngoài ra, các chi vi khuẩn lam khác như Phormidium và Calothrix cũng được tìm thấy trong dòng chảy

của suối nước nóng Octopus ở các vị trí có nhiệt độ thấp hơn (Rothschild và Mancinelli, 2001) Ngoài yếu tố nhiệt độ, cấu trúc các quần xã vi sinh vật suối nước nóng có thể bị ảnh hưởng bởi các yếu tố khác như đặc điểm địa hóa, hoặc sự kết hợp giữa hai yếu tố nhiệt độ và pH Ngoài các yếu tố nhiệt độ, thành phần hóa học, pH, quần xã vi sinh vật trong suối nước nóng còn có thể chịu sự tác động của khoảng cách địa lý Một số loài vi sinh vật có thể có mặt ở tất cả các suối nước nóng Tuy nhiên, bên cạnh đó cũng có những loài được cho là đặc hữu của một khu vực suối nước nóng Vai trò của khoảng cách địa lý còn gây tranh cãi, nhưng có thể là một yếu tố quan trọng ảnh hưởng đến quần thể xạ khuẩn và vi khuẩn lam theo một số nghiên cứu nhưng không đại diện cho các quần thể vi sinh vật khác (Valverde và cs., 2012; López-López và cs., 2013)

Mỗi suối nước nóng thường đặc trưng bởi một vài nhóm vi sinh vật chiếm ưu thế Các nghiên cứu từ trước cho đến nay đều thấy Proteobacteria là ngành chiếm ưu thế trong các suối nước nóng ở Châu Phi (Tekere và cs., 2011), trong khi đó nhóm cổ khuẩn thuộc bộ Thermoplasmatales (chiếm 39%) thuộc ngành Euryarchaeota, và một nhóm cổ khuẩn khác (chiếm 33%) thuộc ngành Crenarchaeota lại là các nhóm ưu thế trong hệ sinh thái nước ngầm ở những vùng địa nhiệt ở Nga Cả hai ngành này đều là

Trang 21

6

những ngành có mặt trong các suối nước nóng trên toàn thế giới Tuy nhiên, nhóm vi khuẩn chiếm ưu thế trong hệ sinh thái này chủ yếu lại là vi khuẩn chuyển hóa methane, ưa axit, ưa nhiệt và vi khuẩn oxy hóa lưu huỳnh Đây là các vi khuẩn có thể

sử dụng các hợp chất vô cơ có nguồn gốc từ núi lửa để sinh trưởng (Mardanov và cs., 2011) Phân tích các đặc điểm phân loại của quần xã vi sinh vật trong suối nước nóng

có tính axit ở Colombia cho thấy chỉ một tỷ lệ nhỏ các trình tự nucleotide trong DNA metagenome có thể được phân loại đến loài dựa vào các cơ sở dữ liệu hiện có, hầu hết vi sinh vật trong suối nước nóng là các loài mới, chưa được phân lập và phân loại Những vi sinh vật được phân loại có tiềm năng tham gia vào các chu trình chuyển hóa nitơ và lưu huỳnh trong môi trường (Jimenez và cs., 2012) Nghiên cứu suối nước nóng Sungai Klah (SK) là suối nước nóng kiềm (pH 7,0 - 9,0), có nhiệt độ cao thứ hai ở Malaysia (50 - 110°C) cho thấy ngành Proteobacteria và Firmicutes là hai ngành chiếm ưu thế (Chan và cs., 2015) Kết quả này cũng phù hợp với kết quả nghiên cứu

về vi sinh vật ở suối nước nóng Kenya - suối nước nóng kiềm (pH 9,2 - 9,8), nhiệt độ 45,1 - 83,6ºC (Kambura và cs., 2016) Ngược lại, ngành Proteobacteria và Thermi chiếm ưu thế ở suối nước nóng axit nhẹ (pH 5 - 7), có nhiệt độ 45 - 90ºC (Paul và cs., 2016) Điều đó chứng tỏ, mức độ đa dạng và phân bố của vi sinh vật trong suối nước nóng cũng bị ảnh hưởng rất nhiều bởi pH hệ sinh thái

1.2 Cellulase

1.2.1 Phân loại

Dựa vào cơ chế hoạt động của các domain xúc tác và tính đặc hiệu cơ chất, cellulase được chia thành 3 dạng chính: β-1,4-endoglucanase (EC 3.2.1.4), exoglucanase [cellobiohydrolase phân giải cơ chất từ đầu không khử (EC 3.2.1.91), cellobiohydrolase phân giải cơ chất từ đầu khử (EC 3.2.1.176) và cellodextrinase (EC 3.2.1.74)] và β-glucosidase (EC 3.2.1.21) Endoglucanase phân cắt ngẫu nhiên các liên kết glycoside nội mạch của chuỗi cellulose, giải phóng ra các oligosaccharide có chiều dài khác nhau (như cellobiose và cellotriose) Cellobiohydrolase hoạt động phân cắt trên các đầu khử và không khử của cellulose, giải phóng cellobiose là chủ yếu, ngoài ra còn giải phóng ra các oligosaccharide mạch ngắn khác Cellodextrinase hoạt động trên các cellooligosaccharide hòa tan và nó cũng giải phóng ra cellobiose

Trang 22

7

Cuối cùng, β-glucosidases thủy phân cellodextrin và cellobiose để tạo thành glucose, kích hoạt cả endoglucanase và exoglucanase bằng cách làm giảm sự ức chế của sản phẩm cuối cùng (Hình 1.1)

Hình 1.1 Nguyên tắc hoạt động của cellulase thủy phân cellulose

Chú thích: Cellulose tinh thể (màu đỏ), cellulose vô định hình (màu đen)

(Nguồn: Juturu và Wu (2014))

Do polysaccharide rất đa dạng trong tự nhiên và thực tế cho thấy không phải lúc nào cũng dễ dàng phân loại cellulase thành endo- hoặc exoglucanase (Poidevin và cs., 2013) nên dựa trên mức độ tương đồng về trình tự axit amin và cấu trúc tinh thể, cellulase được xếp vào họ enzyme thủy phân glycoside (glycoside hydrolase - GH) Cách phân loại này không chỉ phản ánh mối quan hệ giữa cấu trúc và chức năng, cơ chế nhận biết cơ chất và phản ứng enzyme mà nó còn phản ánh mối quan hệ tiến hóa giữa các enzyme Các enzyme thuộc các họ GH khác nhau được tập hợp trong cơ sở

dữ liệu enzyme có hoạt tính carbohydrate (Carbohydrate-Active Enzymes Database) (http://www.cazy.org) Số lượng các enzyme mới liên tục được cập nhật ở cơ sở dữ liệu này, trung bình mỗi năm có thêm khoảng 5 họ GH mới (Helbert và cs., 2019) Tính đến thời điểm tháng 9 năm 2019 số lượng họ GH trong cơ sở dữ liệu CAZy là

165 họ GH, trong đó endoglucanase chủ yếu hiện diện ở 15 họ GH, bao gồm

GH5-10, GH12, GH26, GH44, GH45, GH48, GH51, GH74, GH124 và GH148;

Trang 23

8

cellobiohydrolase hoạt động trên các đầu không khử hiện diện ở 3 họ GH5, GH6 và GH9; cellobiohydrolase hoạt động trên các đầu khử hiện diện ở 3 họ GH7, GH9 và GH48; cellodextrinase hiện diện ở 4 họ GH1, GH3, GH5 và GH9; và cuối cùng, β-glucosidase hiện diện ở 9 họ GH1-3, GH5, GH9, GH16, GH30, GH39 và GH116 (http://www.cazy.org)

Bảng 1.1 Phân bố của cellulase vào các họ GH khác nhau

Cấu trúc 3D

Nucleophile/

Bazơ xúc tác

Chất cho proton xúc tác

- (α/α) 6 Asp Glu

12 Endo-β-1,4-Glucanase Giữ lại GH-C β-jelly roll Glu Glu

30 β-Glucosidase Giữ lại GH-A (β/α) 8 Glu Glu

44 Endo-β-1,4-Glucanase Giữ lại - (β/α) 8 Glu Glu

Trang 24

9

Mặc dù được phân loại vào cùng một họ GH nhưng các enzyme riêng biệt vẫn

có thể khác nhau về tính đặc hiệu cơ chất và nguồn gốc tiến hóa như trong trường hợp họ GH5 bao gồm cả cellulase, xylanase và mannase Điều này cho thấy sự tiến hóa từ tâm hoạt động của enzyme để có thể phù hợp với các cơ chất khác nhau Mặt khác, do sự tiến hóa tập trung của các kiểu cuộn gấp khác nhau trong tâm hoạt động mà các enzyme thuộc các họ GH khác nhau vẫn có thể thủy phân cùng một

cơ chất (Duan và Feng, 2010; Lopez-Mondejar và cs., 2016; Tiwari và cs., 2018).Nghiên cứu cơ sở dữ liệu CAZy cũng cho thấy một số họ như họ GH1 và GH5 là

họ cellulase của vi khuẩn, nấm mốc và cổ khuẩn; họ GH30 và GH48 là họ enzyme thủy phân của nấm mốc; họ GH8 và GH44 là họ enzyme thủy phân của vi khuẩn (Bảng 1.1) Mặt khác, một chủng vi sinh vật có thể sinh tổng hợp nhiều loại cellulase thuộc một

số họ với các kiểu cuộn gấp và cơ chế xúc tác khác nhau Do đó, có thể khẳng định rằng cellulase là một nhóm phức hợp các enzyme dường như đã phát triển từ cùng một kiểu cuộn gấp cơ bản Sự đa dạng phổ biến trong các họ cellulase phản ánh tính không đồng nhất của cơ chất, bao gồm cellulose và các polysaccharide liên quan cấu thành sinh khối thực vật và cũng là đa dạng nơi sống của vi sinh vật – nơi mà quá trình thủy phân diễn ra (Sharma và Yazdani, 2016)

1.2.2 Đặc điểm hóa sinh

Trang 25

Trong enzyme, tâm hoạt động thường nằm ở vùng xúc tác CD và có cấu trúc thuộc một trong ba dạng: dạng túi (pocket), dạng đường hầm (tunnel) và dạng khe/rãnh (cleft) (Hình 1.4) Hầu hết endoglucanase có tâm hoạt động dạng khe/rãnh, exoglucanase có tâm hoạt động dạng đường hầm, còn β-glucosidase có tâm hoạt động dạng túi (Davies và Henrissat, 1995)

Hình 1.2 Cấu trúc 3D của endoglucanase thuộc họ GH7 thu nhận từ nấm

Trichoderma reesei

Chú thích: Enzyme có mang vùng CBM (xanh nhạt) được nối với vùng xúc tác lớn bởi cầu

nối linh hoạt (màu vàng); chuỗi cellulose (màu xanh lá cây)

(Nguồn: Sanchez Hernandez (2019))

Trang 26

11

Hình 1.3 Cấu trúc cellulosome của A cellulolyticus

Chú thích: Cellulosome A bao gồm ScaA, ScaB và ScaC, liên kết với nhau thông qua các

tương tác cohesin-dockerin đặc biệt ScaA chứa một cohesin dạng I cho phép enzym chứa bảy dockerin gắn vào cellulosome ScaA cũng chứa module liên kết với cellulose (CBM) và module xúc tác thuộc họ GH9 ScaB hoạt động như một cầu nối giữa ScaA và ScaC, đồng thời ScaB cho phép bốn protein ScaA liên kết với cohesin dạng II của nó Mặt khác scaffoldin dạng I, ScaC, có thể liên kết một cách chọn lọc với ba protein ScaB và gắn toàn bộ cellulosome lên bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt (SLH) của nó Cellulosome B chứa hai scaffoldin, ScaA và ScaD ScaD cũng cố định cellulosome vào bề mặt tế bào thông qua các vùng tương đồng trên lớp bề mặt và có thể liên kết hai protein ScaA bằng hai cohesin dạng II của nó ScaD cũng có thể liên kết với enzyme chứa dockerin dạng

I thông qua cohesin dạng I của nó

(Nguồn: Hamberg và cs (2014))

Hình 1.4 Ba dạng tâm hoạt động của các họ GH

Chú thích: a) Dạng túi; b) dạng khe/rãnh; c) dạng đường hầm Axit amin xúc tác có màu đỏ

(Nguồn: Davies và Henrissat (1995))

Trang 27

12

1.2.2.2 Cơ chế xúc tác

Cellulase xúc tác cho quá trình phân hủy mạch polysaccharide của cellulose bằng cách phá vỡ các liên kết β-1,4-glycoside Ba loại enzyme chính tham gia vào quá trình thủy phân các vi sợi cellulose trong thành tế bào thực vật gồm: endoglucanase, exoglucanase và β-glucosidase Quá trình thủy phân hoàn toàn cellulose hình thành nên một loạt các chất trung gian dưới sự xúc tác đồng thời của

cả ba loại enzyme chính này Endoglucanase thường tấn công vào các vùng vô định hình của cellulose Enzyme này thuỷ phân các liên kết lỏng lẻo nội phân tử ở vùng

vô định hình của cellulose để tạo ra các chuỗi mới Những chuỗi mới này sau đó dễ dàng bị tấn công bởi các loại enzyme khác Hoạt tính enzyme cao nhất thường đạt được trên cơ chất cellulose dạng hòa tan hoặc cellulose vô định hình đã được xử lý bằng axit Exoglucanase có chức năng thủy phân đầu khử và không khử của cellulose

để tạo ra glucose hoặc cellobiose Exoglucanase khác với endoglucanase ở chỗ có khả năng thủy phân cơ chất cellulose tinh thể như avicel hoặc cellooligosaccharide Cuối cùng, β-glucosidase có thể thủy phân cellobiose thành glucose từ các đầu không khử và β-glucosidase bị bất hoạt khi phản ứng với cellulose vô định hình hoặc cellulose tinh thể Mặc dù cơ chế chính xác vẫn chưa được hoàn thiện, tuy nhiên đã quan sát thấy sự phân mảnh của cellulose thành các sợi ngắn trước khi phát hiện thấy đường khử trong quá trình thủy phân (Jayasekara và Ratnayake, 2019)

Cellulase có hai cơ chế xúc tác: giữ lại và đảo ngược Cellulase cắt các liên kết glucoside bằng cách sử dụng nhóm xúc tác axit – bazơ Quá trình thủy phân được thực hiện bởi hai nhóm xúc tác của enzyme, trong đó một nhóm là axit (đóng vai trò

là chất cho proton) và một nhóm là nucleophile/bazơ Cơ chế xúc tác xảy ra phụ thuộc vào vị trí không gian của nhóm xúc tác Duy trì và đảo ngược cấu hình dị thường của cellulase là hai cơ chế thủy phân cellulose Trong cơ chế đảo ngược, cấu hình C dị thường của cellulase đã bị đảo ngược sau khi thủy phân dịch chuyển nucleophilic đơn (Hình 1.5A) Còn trong cơ chế giữ lại, cellulase giữ nguyên cấu hình C dị thường mang liên kết glucoside đích ngay cả khi đã có sự dịch chuyển kép của hai axit amin glycosyl hóa hoặc khử glycosyl hóa chìa khóa trong quá trình thủy phân (Hình 1.5B) (Vocadlo và Davies, 2008)

Trang 28

13

Hình 1.5 Hai cơ chế xúc tác của GHsa

Chú thích: (A) Cơ chế đảo ngược; (B) Cơ chế giữ lại

(Nguồn: Payne và cs (2015))

1.2.2.3 Cơ chế gắn kết và tính đặc hiệu cơ chất

Cơ chế gắn kết và tính đặc hiệu cơ chất là một trong những đặc tính hóa sinh của enzyme Ngoài cellulose, cellulase còn có thể thủy phân xylan, lichenan và

mannan Cellulase Cel5E của Pseudomonas fluorescens có khả năng thủy phân CMC,

lichenan, avicel và cellulose trương nở bởi axit nhưng lại bị bất hoạt hoàn toàn trên

cơ chất xylan (Hall và cs., 1995) Trong khi cũng thuộc họ GH5, cellulase CelG của

Fibrobacter succinogenes S85 lại có khả năng thủy phân hoàn toàn CMC và xylan

nhưng lại bị bất hoạt hoàn toàn trên cơ chất avicel và lichenan (Iyo và Forsberg, 1996) Ngược lại, một số cellulase chỉ hoạt động trên các dẫn xuất của cellulose

Chẳng hạn, cellulase cel5B thuộc họ GH5 sinh tổng hợp bởi Thermobifida fusca, chỉ

có thể thủy phân các cơ chất chứa cellulose như CMC, avicel và MN300 (sợi cellulose

tự nhiên) nhưng lại bị bất hoạt hoàn toàn trên các cơ chất khác (Posta và cs., 2004)

Do đó, CMC được sử dụng như là cơ chất đặc hiệu chung để phát hiện cellulase Tuy

Trang 29

14

nhiên, các cơ chế gắn kết và tính đặc hiệu cơ chất của cellulase trên các cơ chất khác ngoài CMC còn rất ít thông tin (Sukharnikov và cs., 2011)

1.2.2.4 Các chất ức chế và cofactors

 Ảnh hưởng của các ion kim loại lên hoạt tính cellulase

Các ion kim loại có thể liên kết với protein và cũng có thể tạo thành phức chất với các phân tử khác khi liên kết với enzyme Các ion này đóng vai trò là chất cho hoặc nhận điện tử hoặc chất điều chỉnh cấu trúc Các ion kim loại có thể làm tăng hoặc ức chế hoạt tính enzyme bằng cách tương tác với các nhóm amine hoặc nhóm axit carboxylic của các axit amin Ảnh hưởng của các ion kim loại lên hoạt tính của enzyme thủy phân lignocellulose nói chung và của cellulase nói riêng đã được Pereira

và cs (2017) đề cập Ngoài ra, hoạt tính cellulase của vi sinh vật ở suối nước nóng cũng bị ảnh hưởng bởi một số ion kim loại như trong tóm tắt ở Bảng 1.2

Bảng 1.2 Ảnh hưởng của các ion kim loại lên hoạt tính cellulase của vi sinh vật

ở suối nước nóng

Enzyme Nguồn gốc Kim loại làm tăng hoạt

tính enzyme

Kim loại làm mất hoạt tính enzyme

Na + , Cu 2+ , Fe 3+

Zarafeta và cs (2016) Endoglucanase Bacillus sp PW1

β-Glucosidase DNA metagenome Ở nồng độ 1mM gồm:

Al 3+ , Ca 2+ , Co 2+ , Cr 3+ ,

Fe 2+ , Fe 3+ , K + , Mg 2+ ,

Rb + ; ở nồng độ 5mM gồm: Mg 2+ , Rb +

Mn 2+ , Ni 2+ , Sr 2+ Schroder và cs

(2014)

Trang 30

15

Các ion kim loại hóa trị I, II và III như Na+, K+, Ca2+, Mg2+, Mn2+, Fe2+, Co2+,

Cu2+, Ni2+, Zn2+, Hg2+ và Fe3+ thường được nghiên cứu trong quá trình phân tích đặc tính của cellulase Bên cạnh đặc điểm về điện tích, kích thước bán kính ion cũng có ảnh hưởng lớn đến hoạt tính và độ bền của enzyme Một số nghiên cứu đã cho thấy những ion có bán kính lớn hơn ít ảnh hưởng đến các axit amin xúc tác, trong khi những ion có bán kính nhỏ hơn có thể hấp dẫn các axit amin tích điện mạnh hơn làm thay đổi cấu trúc tổng thể của enzyme bằng việc phá hủy vị trí xúc tác (Zeng và cs., 2014)

Tác dụng ức chế của Fe2+ và Cu2+ lên hoạt tính cellulase cũng đã được nghiên cứu Tuy nhiên, ảnh hưởng của các ion khác nhau có hóa trị II lên hoạt tính của cellulase được sinh tổng hợp bởi các vi sinh vật khác nhau là khác nhau (Bảng 1.2) Tác dụng của các ion hóa trị II lên cellulase không tuân theo quy luật rõ ràng và mức

độ ảnh hưởng khác nhau có thể do tác dụng của quá trình oxy hóa khử lên các axit amin, làm tăng hoặc giảm hoạt tính của enzyme (Tejirian và Xu, 2010)

Ion Hg2+ ức chế cellulase do tương tác với các gốc axit amin xúc tác có chứa lưu huỳnh dẫn đến quá trình oxy hóa và hình thành các liên kết disulfide bất thường (Tejirian và Xu, 2010) Ion Fe2+ có thể tạo phức với D/L-Lys và L-Met (Vassilev và cs., 2013), Cu2+ tạo phức với His và Ba2+ tạo phức với Arg, Glu, Pro, Ser và Val (Bush

Trang 31

Các loại đường được giải phóng ra khi thủy phân lignocellulose bằng enzyme

có thể bị phân hủy và chuyển hóa thành các hợp chất ức chế enzyme Trong điều kiện axit, glucose, mannose và galactose có thể được chuyển hóa thành các furan aldehyde như hydroxymethylfurfurals (HMF) Ngược lại, HMF có thể được chuyển hóa thành axit levulinic và axit formic (Jönsson và cs., 2013)

Tiền xử lý lignocellulose bằng kiềm hoặc axit, hoặc bằng các cách khác trong quá trình thủy phân lignin bằng enzyme (có sự tham gia của laccase) có thể giải phóng các hợp chất phenol như vanillin, syringaldehyde, axit trans-cinnamic và axit hydroxybenzoic Các hợp chất này là chất ức chế hoạt tính endo/exoglucanase và β-glucosidase do sự hiện diện của các nhóm hydroxyl, carbonyl và methoxyl (Qin và cs., 2016)

Như đã đề cập ở trên, cellulase còn bị ức chế bởi một nhóm các chất có nguồn gốc protein Các protein ức chế xyloglucan endo-β-glucanase đặc hiệu (XEGIPs) có mặt trong thành tế bào của một số loại rau như cà chua, thuốc lá và lúa mì Đồng thời các chất ức chế này cũng ức chế endoglucanase thủy phân xyloglucan Những protein

Trang 32

và cs., 2013)

Hấp phụ không đặc hiệu của cellulase lên lignin cũng có thể bị giảm bằng cách thêm các chất hoạt động bề mặt vào môi trường phản ứng, làm tăng hiệu quả xúc tác của enzyme Tween 20, 40, 60, 80 và 100, triton X-100, polyethylen glycol (PEG) cùng với các chất hoạt động bề mặt khác có xu hướng làm giảm sức căng bề mặt của các chất hòa tan trong nước, có thể làm thay đổi tính chất của các chất lỏng như chất tẩy rửa, nhũ hóa, bôi trơn và hòa tan Các chất hoạt động bề mặt có thể làm giảm sự hấp phụ không đặc hiệu của cellulase lên lignin, nó đóng vai trò là nhân tố kích hoạt các enzyme này (Hsieh và cs., 2015)

Các tác nhân tạo phức (Chelating agent) như EDTA, ethylene glycol, mercaptoethanol và DPPE (1,2-bis diphenylphosphino-ethylene) có thể làm tăng hoạt tính của một số enzyme do các hợp chất này kết hợp với các ion kim loại có mặt trong phản ứng làm cho tâm hoạt động của enzyme dễ dàng phản ứng với cơ chất Đây chính là ưu điểm của các tác nhân tạo phức đối với hoạt tính của enzyme Ngược lại, nhược điểm của các tác nhân tạo phức là làm cho enzyme bị phụ thuộc vào ion vô cơ

β-đã phân tách (Pereira và cs., 2017)

1.2.2.5 Cơ chế bền nhiệt

Các enzyme có thể (a) chịu được nhiệt độ cao, (b) cuộn xoắn ở nhiệt độ cao và/ hoặc (c) có hoạt tính tối ưu ở nhiệt độ cao hơn được gọi là enzyme bền nhiệt và/hoặc enzyme ưa nhiệt Enzyme bền nhiệt khá ổn định ở nhiệt độ cao nơi mà các enzyme ưa ấm bị biến tính làm hoạt tính tối ưu của enzyme bị mất hoặc giảm (Turner và cs., 2007)

Trang 33

18

Độ bền nhiệt là một đặc tính do nhiều yếu tố tác động Đặc tính này có thể là do trình tự axit amin của protein hay do mức độ cuộn xoắn của nó quy định Rất nhiều nghiên cứu trên thế giới đã so sánh protein ưa ấm và protein bền nhiệt cho thấy các yếu tố sau có thể làm tăng tính bền nhiệt như tỷ lệ của một số loại axit amin nào đó trong trình tự enzyme (Kumar và cs., 2000), tăng tính kỵ nước (Gromiha và cs., 2013),

sự thay đổi của một axit amin đơn lẻ (Sandgren và cs., 2003), cấu trúc chặt chẽ của protein, tỷ lệ của các axit amin có điện tích dương và sự thay đổi năng lượng tự do Gibbs của quá trình hydrate hoá (Gromiha và cs., 2019) Nhìn chung, các protein ưa nhiệt thường có tỷ lệ các axit amin kỵ nước và mang điện tích lớn hơn so với protein

ưa ấm Các axit amin kỵ nước thường liên kết với nhau để tạo thành các trung tâm của protein, làm hạn chế sự tiếp xúc với các dung môi hữu cơ tối đa, tạo các tương tác van der Waals bền vững với các axit amin kỵ nước bên ngoài khác Các nhóm liên kết này thường tạo ra khoảng trống tối thiểu phía trong cấu trúc nhưng lại tạo điều kiện tiếp cận trên bề mặt một cách tối đa Theo đó, các protein ưa nhiệt thường

có tỷ lệ Val, Arg, Glu và Ile trung bình cao hơn so với các protein ưa ấm Mặt khác, các axit amin mang điện tích sẽ định dạng protein một cách phù hợp thông qua việc hình thành các cầu muối disulfide, giúp ổn định cấu trúc trong quá trình cuộn xoắn hơn so với các tương tác của các axit amin kỵ nước

Mặc dù các nghiên cứu đã cố gắng xác định nhân tố chìa khóa quyết định mức

độ bền nhiệt của các họ protein, tuy nhiên cho đến nay cũng chưa có công bố nào đưa

ra được giả thuyết cũng như bằng chứng về đặc tính này một cách có quy luật Trong các nghiên cứu trước đây về endoglucanase bền nhiệt, Panasik và cs (2000) đã phân tích các yếu tố quyết định tính bền nhiệt của protein thuộc họ GH có cấu trúc cuộn gấp (α/β)8 và chỉ ra rằng việc thiếu Gly trong các họ GH bền nhiệt (bao gồm endoglucanase) đã được xác định là nhân tố ảnh hưởng đến độ bền nhiệt của enzyme Cấu trúc endoglucanase phổ biến được chia thành 3 dạng cuộn xoắn (α/β)8, xoắn cuộn β, và (α/α)6 Việc phân tích các dữ liệu cấu trúc của enzyme cho thấy dạng cuộn xoắn protein ảnh hưởng nhiều đến độ bền nhiệt của endoglucanase (Yennamalli

và cs., 2011) Khi so sánh trình tự của các endoglucanase bền nhiệt và ưa nhiệt, kết

Trang 34

Trên cơ sở những cơ chế lý giải cho khả năng bền nhiệt của enzyme và protein nói chung, cơ chế bền nhiệt của β-glucosidase cũng đã được nghiên cứu Để nâng cao khả năng bền nhiệt của UsBgl, Nam và cs (2008) đã thiết kế một số điểm đột biến trong đầu N và đầu C của UsBgl dựa trên trình tự và cấu trúc của β-glucosidase bền

nhiệt TmBglA ở vi khuẩn Thermotoga maritime Kết quả là đầu N và đầu C đã tương

tác với nhau qua liên kết hydro, từ đó làm tăng khả năng hòa tan của protein cũng như tăng hoạt tính xúc tác Đồng thời, nhờ có tương tác này mà enzyme trở nên bền hơn Khả năng bền nhiệt của enzyme cũng được cho là do sự gia tăng về số lượng của Pro, cầu liên kết tĩnh điện, các phân tử nước bên trong và sự liên kết của nhiều tiểu phần trong cấu trúc bậc bốn của enzyme khi so sánh với enzyme ưa ấm

1.2.2.6 Một số đặc điểm của cellulase bền nhiệt

Đặc điểm pH, nhiệt độ tối ưu và độ bền nhiệt là một trong những đặc tính quan trọng của enzyme nói chung và cellulase bền nhiệt nói riêng Các đặc điểm này là cơ

sở để định hướng ứng dụng enzyme vào các lĩnh vực khác nhau của cuộc sống Cellulase bền nhiệt được sinh tổng hợp chủ yếu từ vi khuẩn ưa nhiệt, cổ khuẩn, nấm sợi ưa nhiệt và ưa ấm Trong tự nhiên, các loài vi nấm có xu hướng sinh tổng hợp nhiều cellulase hơn vi khuẩn, tuy nhiên, cellulase do vi khuẩn tạo ra lại là chất xúc tác tốt hơn vì chúng ít bị ức chế ngược Hơn nữa, vi khuẩn không chỉ sinh trưởng nhanh mà nó còn có thể tạo enzyme tái tổ hợp cao hơn vi nấm Vi khuẩn có khả năng

cư trú ở nhiều loại môi trường khác nhau như nhiệt độ cao, pH kiềm và pH axit; điều

Trang 35

20

đó đã giúp cho vi khuẩn tạo ra các chất xúc tác sinh học mang những đặc tính ổn định trong điều kiện khắc nghiệt được tìm thấy trong các quá trình chuyển hóa sinh học góp phần làm tăng tốc độ thủy phân và thu hồi sản phẩm một cách hiệu quả (Acharya

và Chaudhary, 2012) Bảng 1.3 mô tả đặc điểm của một số cellulase bền nhiệt

Bảng 1.3 Đặc điểm của cellulase bền nhiệt

Enzyme Họ GH Điều kiện

tối ưu

Bền ở điều kiện Nguồn TLTK

Nhiệt độ pH EglA 12 ≥ 100ºC 6 50%; 95ºC; 40h Pyrococcus

furiosus

(Bauer và cs., 1999) CelA 12 95ºC 6 KXĐ

Thermotoga neapolitana

Bok và cs (1998) CelB 12 106ºC 6-6,6 50%; 106ºC; 130 phút

50%; 110ºC; 26 phút

EG 5 109ºC 5,5 50%; 100ºC; 5 giờ

50%; 105ºC; 0,57 giờ 50%; 108ºC; 0,17 giờ

Cổ khuẩn làm giàu

sp S66-4

Huang và

cs (2010) BglW 3 50ºC 9 >75%; 40-50ºC; pH 8-

9,5; 30 phút

Aspergillus fumigatus

WL002

Cao và cs (2015)

Bgl1 1 90ºC 6.5 67%; 90ºC; 1.5 giờ

78%; 50ºC; 24 giờ 68%; 60ºC; 24 giờ

Cổ khuẩn không nuôi cấy được từ DNA metagenome suối nước nóng

Schroder và

cs (2014)

XM70-Cel9 KXĐ 70ºC 7 50%; 85ºC; 30 phút DNA

metagenome trầm tích suối nước nóng

(Zhao và cs., 2017)

Vul_Bgl1A 1 105ºC 7 50%; 75ºC; 99 phút

50%; 90ºC; 15 phút 50%; 99ºC; 11 phút 50-68%; pH 4-9; 24h 20%; pH4; 48 giờ 47%; pH7; 48 giờ

DNA metagenome mẫu lấy từ lỗ thông thủy nhiệt ở đảo Vulcano, Italy

Schröder và

cs (2019)

Chú thích: KXĐ: Không xác định

Trang 36

21

1.2.3 Ứng dụng công nghệ sinh học của cellulase ưa nhiệt

Enzyme ưa nhiệt có ưu điểm hơn so với các enzyme ưa ấm bởi chúng có khả năng ứng dụng trong các ngành công nghiệp khác nhau Enzyme ưa nhiệt thường bền hơn khi hoạt động trong điều kiện ở nhiệt độ cao, pH cực đoan, có sự hiện diện của các chất gây biến tính protein Enzyme ưa nhiệt thường có tốc độ phản ứng cao hơn

so với enzyme ưa ấm (Wang và cs., 2015) Tốc độ truyền khối lớn làm tăng độ hòa tan của cơ chất, làm giảm nguy cơ tạp nhiễm (Rawat và cs., 2015) Cuối cùng, enzyme

ưa nhiệt có thể hoạt động linh hoạt trong các quy trình được thiết kế riêng để giảm chi phí vận hành Hiện nay, cellulase ưa nhiệt được ứng dụng chủ yếu trong các ngành sản xuất nhiên liệu sinh học (chuyển hóa sinh khối thực vật thành ethanol sinh học), công nghiệp thực phẩm và sản xuất bia, công nghiệp dệt may (mài mòn sinh học và đánh bóng sinh học), giặt ủi (trong công thức chất tẩy rửa), công nghiệp giấy và bột giấy (Sharma và cs., 2016; Jayasekara và Ratnayake, 2019), cũng như trong sản xuất thức ăn chăn nuôi (Wang và cs., 2015) Ngoài ra, cellulase ưa nhiệt còn được ứng dụng trong một số ngành khác như quản lý chất thải, cải thiện đất nông nghiệp (Biver

và cs., 2014) và chiết xuất các hợp chất từ thực vật như dầu ô liu, bột màu và các phân tử có hoạt tính sinh học (Sharma và cs., 2016) Quá trình chuyển hóa hoàn toàn cellulose thành glucose, sau đó chuyển hóa tiếp thành bioethanol đòi hỏi phải có sự kết hợp đồng thời của nhiều enzyme thủy phân cellulose (endo- và exoglucanase và β-glucosidase) Do đó, khi nguồn năng lượng hóa thạch bị cạn kiệt phải thay thế bằng nguồn năng lượng tái tạo thì nhiên liệu sinh học sản xuất từ sinh khối thực vật trở nên tiềm năng và cần được quan tâm phát triển (Escuder-Rodríguez và cs., 2018) Sử dụng cellulase bền nhiệt để tiền xử lý và xử lý sinh khối góp phần làm giảm giá thành sản xuất năng lượng, cải thiện khả năng hòa tan của cơ chất, giảm độ nhớt và giảm sự phụ thuộc vào việc sử dụng các hóa chất gây hại cho môi trường (Jayasekara và Ratnayake, 2019)

1.3 Metagenomics trong nghiên cứu đa dạng vi sinh vật và khai thác các gen mới

Metagenomics được định nghĩa là kỹ thuật nghiên cứu đa hệ gen hay DNA hệ gen tổng số trực tiếp từ mẫu môi trường Kể từ khi thuật ngữ Metagenome được sử dụng lần đầu tiên vào năm 1998 (Handelsman và cs., 1998), metagenomics đã là một trong những công cụ nghiên cứu chính để nghiên cứu sinh thái vi sinh vật và là công

Trang 37

22

cụ không thể thiếu để nghiên cứu sự đa dạng cũng như tiềm năng trao đổi chất của các vi sinh vật (phần lớn là những loài không nuôi cấy được) trong môi trường Các kết quả nghiên cứu về metagenomic có thể cung cấp thông tin về các gen chức năng, cấu trúc và tổ chức bộ gen, xác định gen và chất xúc tác sinh học mới, cấu trúc quần

xã và các mối quan hệ tiến hóa trong quần xã vi sinh vật (Culligan và cs., 2014)

1.3.1 Các phương pháp khai thác gen mới bằng kỹ thuật Metagenomics

Hai phương pháp tiếp cận chính được sử dụng để tiếp cận và thu nhận các gen mới từ DNA môi trường là (i) dựa vào trình tự và (ii) dựa vào chức năng (hoặc kết hợp cả hai) (Hình 1.6)

Hình 1 6 Các phương pháp chính để phát hiện gen mới bằng cách sử dụng

Metagenomics

Chú thích: A) Mẫu môi trường quan tâm (ví dụ đất, hệ vi sinh vật đường ruột của người,

nước biển) được thu thập; B) DNA metagenomics tổng số của mẫu được phân lập trực tiếp

Trang 38

23

hoặc gián tiếp bằng cách phá vỡ tế bào; C) Phân tích DNA metagenomics dựa vào trình tự, C-1) có thể tạo thư viện tách dòng bằng cách giải trình tự Sanger hoặc giải trình tự DNA metagenome trực tiếp, sử dụng hệ thống giải trình tự thế hệ mới; C-2) sử dụng cặp mồi suy biến được thiết kế từ các vùng bảo thủ của gen đích, sau đó khuếch đại gen dần từng bước cho đến khi thu được toàn bộ gen; C-3) khai thác dữ liệu từ bộ dữ liệu giải trình tự metagenomic để tìm kiếm thông tin của gen hoặc các vùng bảo thủ rồi tổng hợp gen sau khi

đã tối ưu để biểu hiện trong chủng chủ; C-4) thu giữ lại các gen mới từ các plasmid sử dụng phương pháp TRACA (transposon-aided capture) hoặc các gen liên quan tới integron bằng cách sử dụng phương pháp PCR với cặp mồi nhắm vào trình tự có vị trí tích hợp bảo thủ; D) Phân tích metagenomics dựa vào chức năng; D-1) tạo thư viện mang đoạn chèn có kích thước lớn hoặc nhỏ bằng cách sử dụng vector phù hợp (plasmid, fosmid, cosmid, or bacterial artificial chromosome [BAC]) tùy thuộc vào nhu cầu của nghiên cứu; D-2) lựa chọn chủng

chủ thích hợp để biểu hiện gen hoặc hệ gen Chủng chủ được sử dụng phổ biến nhất là E coli, ngoài ra còn có thể sử dụng các chủng Bacillus và Streptomyces Thư viện gen được

giữ trên các đĩa micro-titer 96 hoặc 384 giếng và được bảo quản ở -80C; D-3) Các dòng mang DNA metagenome có thể được sàng lọc để xác định hoạt tính đích bằng cách nhân bản toàn bộ hoặc một phần thư viện vào trong các đĩa micro-titer mới hoặc cấy gạt lên trên các đĩa thạch Các dòng dương tính được nhận biết thông qua một số đặc điểm khác biệt như khả năng kháng kháng sinh, hình thành sắc tố, sự thay đổi hình thái hoặc khả năng kháng một

số yếu tố khác; D-4) Đột biến gen nhảy có thể được tiến hành trên các dòng dương tính để xác định gen hoặc các gen quan tâm; D-5) Tách dòng và biểu hiện các gen để xác nhận lại kiểu hình; E) các gen mới được phát hiện dựa vào chức năng hoặc trình tự hoặc dựa vào sự kết hợp của

cả hai cách tiếp cận trên

(Nguồn: Culligan và cs (2014))

1.3.1.1 Khai thác gen mới dựa vào chức năng

Trước đây, sàng lọc các gen mới từ DNA metagenome chủ yếu dựa vào hoạt tính trao đổi chất của các dòng gen trong thư viện metagenome Đây là phương pháp tiếp cận duy nhất để xác định các gen mới mã hóa cho protein hoặc peptide đã biết hoặc chưa biết chức năng mà không cần biết trình tự của gen (Simon và Daniel, 2011) Phương pháp này không quá khó, ít tốn kém nhưng đòi hỏi mất nhiều công sức, tốn nhiều thời gian, số lượng các dòng sàng lọc trong thư viện phải đủ lớn và chất lượng

Trang 39

bộ DNA metagenome để tạo ra các đoạn DNA có kích thước đủ lớn, có khả năng chứa toàn bộ trình tự của các gen có trong mẫu DNA môi trường; (iii) Các đoạn DNA sau khi cắt bằng enzyme giới hạn được gắn vào vector phù hợp và biến nạp vào chủng chủ (Simon và Daniel, 2017) Một trong những thách thức lớn nhất của kỹ thuật này

là số lượng các dòng gen để sàng lọc vô cùng lớn với tỷ lệ dòng dương tính là vô cùng nhỏ Đồng thời thư viện vẫn phải đảm bảo có chứa các dòng đại diện cho các loài có mật độ cực ít trong mẫu (<1%) (Riesenfeld và cs., 2004) Các dòng biểu hiện gen này sau đó được sử dụng để sàng lọc chức năng hoặc sàng lọc gen mong muốn khác (Hình 1.7)

Hình 1.7 Các bước chính xây dựng thư viện Metagenomic

(Nguồn: Dias và cs (2014))

1.3.1.2 Khai thác gen mới dựa vào trình tự DNA metagenomes

Những tiến bộ trong công nghệ giải trình tự thế hệ thứ hai và thế hệ thứ ba đã thúc đẩy những tiến bộ trong kỹ thuật metagenomics Với các công nghệ hiện nay, hàng trăm cơ sở dữ liệu đã được giải trình tự DNA với chi phí rất thấp (Watson, 2014) Đồng thời công nghệ này cũng có thể phát hiện được sự có mặt của những vi

Mẫu môi trường

Trang 40

25

sinh vật với số lượng cực ít trong môi trường Công nghệ giải trình tự hiện đại kết hợp với những cải tiến liên tục trong lĩnh vực tin sinh học đã làm cho phân tích metagenome trở thành một kỹ thuật dễ tiếp cận, giá cả phải chăng và nhanh chóng được sử dụng cho hầu hết các phòng thí nghiệm (Roumpeka và cs., 2017) Thông qua phân tích metagenome từ cơ sở dữ liệu giải trình tự thế hệ mới, nhiều enzyme, chất xúc tác sinh học mới đã được phát hiện Wallace và cs (2015) đã giải trình tự mẫu ruột dạ cỏ bằng máy giải trình tự Illumina, lắp ráp dữ liệu bằng de novo và chú giải các contigs Kết quả thu được cho thấy mẫu nghiên cứu có đến hơn 1,5 triệu gen giả định với 58% là các protein chưa biết Trong một nghiên cứu khác, khi phân tích metagenomic của vi sinh vật sống trong dạ cỏ của bò và cừu đã xác định được 3.970 gen, trong số đó, gen có liên quan đến khả năng sinh khí metan và chuyển hóa hiệu quả thức ăn đã biết chỉ chiếm tương ứng là 20 và 49 gen (Roehe và cs., 2016) Nghiên cứu của Sunagawa và cs (2015) khi khảo sát lấy mẫu đại dương toàn cầu đã phát hiện 40 triệu trình tự từ hơn 35.000 loài, trong đó chỉ có 0.44% dữ liệu được so sánh với các gen đã biết Kết quả nghiên cứu này cho thấy tiềm năng của các gen chưa được khám phá ở đại dương của chúng ta Tóm lại, cùng với sự phát triển của các hệ thống máy giải trình tự gen thế hệ mới và các phần mềm tin sinh, cách tiếp cận metagenome thông qua giải trình tự đã trở thành một phương pháp khai thác nguồn gen vi sinh vật vô cùng hiệu quả và nhanh chóng Hơn nữa, có thể thấy ưu điểm nổi bật của phương pháp này ở chỗ:

• Các kết quả không bị ảnh hưởng bởi một loại gen đặc hiệu

• Không phụ thuộc vào các marker di truyền có tính phân loại

• Đánh giá mức độ đa dạng vi sinh vật sâu, bao gồm virus

• Ước lượng được sự đa dạng vi sinh vật

• Phát hiện được vi sinh vật chiếm ưu thế trong các môi trường khác nhau

• Phân tích vi sinh vật không nuôi cấy được

• Thông tin về thành phần cũng như các chức năng có thể có của một hệ sinh thái

• Nghiên cứu các gen và các cụm gen chức năng

Khai thác gen mới dựa vào trình tự DNA metagenome sử dụng cùng một quy trình phân tích tin sinh học: (a) lắp ráp các dữ liệu đã được giải trình tự (trực tiếp từ

Ngày đăng: 11/05/2021, 07:25

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w