Với mong muốn có thể đánh giá đa dạng vi sinh vật, đồng thời tiếp cận vàkhai thác được nguồn cellulase bền nhiệt mới từ suối nước nóng Bình Châu -suối nước nóng có nhiệt độ cao thứ hai ở
Trang 1TRẦN THANH THỦY
NGHIÊN CỨU ĐÁNH GIÁ ĐA DẠNG VI SINH VẬT, SÀNG LỌC, THU NHẬN VÀ XÁC ĐỊNH TÍNH CHẤT CỦA CELLULASE SUỐI NƯỚC NÓNG BÌNH CHÂU, VIỆT NAM
Trang 2Người hướng dẫn khoa học: 1 TS Nguyễn Kim Thoa
2 PGS TS Trần Đình Mấn
Phản biện 1: PGS TS Trương Quốc Phong
Trường Đại học Bách Khoa Hà Nội
Phản biện 2: PGS TS Nguyễn Xuân Cảnh
Học viện Nông nghiệp Việt Nam
Phản biện 3: PGS TS Bùi Thị Việt Hà
Trường Đại học Khoa học Tự Nhiên, Đại họcQuốc gia Hà Nội
Luận án được bảo vệ tại Hội đồng đánh giá luận án tiến sĩ Viện Công nghệ sinh học, 18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội
Vào hồi …… giờ, ngày … tháng … năm 2021
Có thể tìm hiểu luận án tại:
1 Thư viện Quốc gia Việt Nam
2 Thư viện Viện Công nghệ sinh học
3. Webside: http://luanvan.moet.gov.vn
Trang 3MỞ ĐẦU
1 Đặt vấn đề
Cellulase là nhóm enzyme thủy phân các liên kết β-1,4-glucoside trongphân tử cellulose, oligosaccharide, disaccharide và một số cơ chất tương tựkhác Cellulase được tổng hợp bởi cổ khuẩn, vi khuẩn, nấm mốc, động vậtnguyên sinh, thực vật và động vật Enzyme này được ứng dụng rộng rãi trongcông nghiệp thực phẩm, lên men rượu, thức ăn gia súc, dệt may, giặt ủi, trongngành công nghiệp giấy và bột giấy, Khi nguồn nguyên liệu hóa thạch dầncạn kiệt thì nhu cầu sử dụng các nguồn năng lượng thay thế, có thể tái tạo vàthân thiện với môi trường ngày càng tăng Một trong những nguồn năng lượngthay thế được quan tâm nhất hiện nay là nhiên liệu sinh học từ sinh khốilignocellulose Quá trình chuyển hóa lignocellulose thành các sản phẩm có giátrị như nhiên liệu sinh học, nhựa sinh học, axit hữu cơ và các cụm hóa chất kiếntạo khác thường được thực hiện ở các điều kiện đặc biệt như ở nhiệt độ cao,tiền xử lý bằng kiềm hoặc axit hoặc trong dung môi hữu cơ… Do đó đòi hỏicác nhà khoa học phải nghiên cứu tìm kiếm các cellulase mang những đặc tínhmới (như bền với nhiệt độ cao, chịu được áp suất cao, chịu được pH axit/kiềm,dung môi …) để đáp ứng được các yêu cầu của quá trình chuyển hóalignocellulose và hạ được giá thành sản xuất
Một trong những nguồn địa nhiệt có thể thu nhận cellulase bền nhiệt lànhóm vi sinh vật ưa nhiệt ở suối nước nóng Tuy nhiên, sử dụng các phươngpháp phân lập, nuôi cấy vi sinh vật truyền thống không thể khai thác hết đượctiềm năng của vật liệu di truyền trong hệ sinh thái này vì có tới 99% các loài visinh vật sống trong môi trường là các loài không nuôi cấy được Hơn nữa, dođặc tính riêng của hệ sinh thái suối nước nóng có mật độ vi sinh vật thấp hơnrất nhiều so với các môi trường bình thường khác, vì vậy việc thu nhận đượccác loài vi sinh vật mới để khai thác nguồn gen của chúng bằng phương phápnuôi cấy thông thường gặp nhiều khó khăn
Ngày nay, nhờ sự tiến bộ của công nghệ giải trình tự gen thế hệ mới, việctách dòng các gen mới có thể được thực hiện bằng cách tiếp cận cơ sở dữ liệumetagenome kết hợp với các phần mềm tin sinh để dự đoán tính chất của protein
Trang 4tiềm năng trước khi biểu hiện và nghiên cứu đặc tính của enzyme tái tổ hợp.Thông qua cách tiếp cận này, các nhà nghiên cứu không chỉ đánh giá được mức
độ đa dạng vi sinh vật ở trong một hệ sinh thái mà còn bảo tồn và khai thác đượccác gen mới hoặc các protein có tính chất đặc biệt từ các vi sinh vật đó
Với mong muốn có thể đánh giá đa dạng vi sinh vật, đồng thời tiếp cận vàkhai thác được nguồn cellulase bền nhiệt mới từ suối nước nóng Bình Châu -suối nước nóng có nhiệt độ cao thứ hai ở Việt Nam không thông qua nuôi cấy,
chúng tôi đã tiến hành nghiên cứu, thực hiện đề tài: “Nghiên cứu đánh giá đa dạng vi sinh vật, sàng lọc, thu nhận và xác định tính chất của cellulase suối nước nóng Bình Châu, Việt Nam bằng kỹ thuật Metagenomics”.
2 Mục tiêu nghiên cứu
Thông qua kết quả giải trình tự DNA metagenome vi sinh vật suối nướcnóng Bình Châu bằng hệ thống giải trình tự gen thế hệ mới, (i) Đánh giá đượcnguồn đa dạng vi sinh vật ưa nhiệt và xây dựng được bộ dữ liệu các gen mã hóacho cellulase; ii) Biểu hiện được các cellulase tái tổ hợp đồng thời (iii) Tinhsạch và xác định được tính chất của các cellulase tái tổ hợp này
3 Nội dung nghiên cứu
- Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nướcnóng Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu các gen
mã hóa cellulase
- Biểu hiện gen mới mã hóa cho cellulase (endoglucanase và β-glucosidase)chịu nhiệt tiềm năng được lựa chọn từ bộ dữ liệu DNA metagenome
- Tinh sạch và xác định tính chất của các cellulase tái tổ hợp
4 Những đóng góp mới của luận án
- Đã xây dựng được bộ dữ liệu DNA metagenome của vi khuẩn và cổ khuẩnsuối nước nóng Bình Châu với kích thước 9,4 Gb độ bao phủ trên 60% Quaphân tích đã xác định được đa dạng vi sinh vật và gen mã hóa enzyme thủyphân cellulose, lựa chọn được hai gen mới (có độ tương đồng thấp 50,35% và53,94%) mã hóa cho hai enzyme tương ứng là endoglucanase và β-glucosidase
Trang 5- Đã biểu hiện, tinh sạch và nghiên cứu tính chất sinh học của endoglucanase vàβ-glucosidase Đã xác định được Vmax và Km của hai enzyme này.
Ý nghĩa khoa học và thực tiễn của đề tài
Về khoa học:
- Kết quả nghiên cứu của luận án đã làm phong phú thêm về bộ dữ liệu nhằm bảotồn nguồn vi sinh vật cũng như nguồn gen của chúng trong suối nước nóng BìnhChâu của Việt Nam
- Bổ sung thêm minh chứng về hiệu quả của kỹ thuật metagenomics để khaithác đa dạng vi sinh vật và những gen mới từ vi sinh vật ở những hệ sinh tháiđặc biệt Cụ thể xây dựng được bộ dữ liệu đa dạng vi sinh vật của suối nướcnóng Bình Châu Bổ sung hai trình tự gen mới [denovogenes]_18736 mã hóacho endoglucanase và [denovogenes]_32768 mã hóa cho β-glucosidase so vớicác gen đã được công bố trong ngân hàng dữ liệu NCBI của thế giới Hai gennày không chỉ mới về trình tự (mức độ tương đồng < 55%) mà còn mới về đặctính (bền nhiệt, bền kiềm) mà bằng các phương pháp nuôi cấy thông thườngkhó có thể thu nhận được
Về ý nghĩa thực tiễn:
- Luận án có ý nghĩa thực tiễn Hai enzyme tái tổ hợp thu nhận được là nhữngenzyme quan trọng trong cocktail enzyme thủy phân sinh khối lignocellulose Haienzyme này có mức độ tương đồng trong tính chất (cùng có nhiệt độ tối ưu ở 55ºC,hoạt động ở dải pH rộng), do đó có thể phối hợp với các enzyme khác trongcocktail để nâng cao hiệu quả chuyển hóa sinh khối lignocellulose làm nguyên liệucho sản xuất nhiên liệu sinh học cũng như các hóa chất kiến tạo khác
Bố cục của luận án
Luận án gồm 144 trang Cụ thể: Mở đầu (2 trang); Chương 1: Tổng quantài liệu (32 trang, 4 bảng, 8 hình); Chương 2: Vật liệu và phương pháp nghiêncứu (17 trang, 1 hình); Chương 3: Kết quả nghiên cứu (43 trang, 11 bảng, 34hình); Chương 4: Bàn luận kết quả nghiên cứu (16 trang); Kết luận và kiến nghị(2 trang); Danh mục các công trình công bố (1 trang); Tóm tắt luận án bằngtiếng Anh (8 trang); Tài liệu tham khảo (23 trang gồm 15 tài liệu tiếng Việt, 185tài liệu tiếng Anh và 5 trang web); Phụ lục (23 trang)
CHƯƠNG I TỔNG QUAN TÀI LIỆU
Trang 6Hiện nay, suối nước nóng đang được nhiều nhà khoa học quan tâm nghiêncứu bởi lẽ đây là nơi sống của các vi sinh vật ưa nhiệt (thermophilic) và siêu ưanhiệt (hyperthermophilic) với nhiệt độ sinh trưởng tối ưu tương ứng lần lượttrên 55°C và trên 80°C Enzyme nói chung và cellulase nói riêng của vi sinhvật sống trong suối nước nóng có tiềm năng ứng dụng rộng rãi trong một sốquy trình sản xuất công nghiệp và trong công nghệ sinh học Tuy nhiên, việcnghiên cứu khu hệ vi sinh vật sống trong suối nước nóng cũng như các enzymecủa chúng bằng các phương pháp truyền thống thông qua nuôi cấy không thểkhai thác hết tiềm năng vốn có bởi lẽ có đến 99% vi sinh vật sống trong suốinước nóng là những vi sinh vật không nuôi cấy được Vì vậy, metagenomics đãtrở thành một công cụ hữu ích để nghiên cứu vi sinh vật cũng như khám phácác cellulase mới từ DNA vi sinh vật suối nước nóng
Mặc dù một số lượng lớn dòng cellulase đã được phân lập từ các thư việnmetagenomic nhưng chỉ một số ít trong chúng được xác định đặc điểm ở mức
độ protein sở dĩ là do tỷ lệ dòng biểu hiện có hoạt tính rất thấp Bằng cách giảitrình tự metagenomic, vấn đề đưa ra ở trên đã được giải quyết Đồng thời, với
sự phát triển của các công nghệ giải trình tự thế hệ mới, giải trình tựmetagenome đã trở thành một công cụ mạnh để nghiên cứu trực tiếp các vi sinhvật không nuôi cấy được cũng như khai thác các gen cellulase mới
Ở Việt Nam, tiếp cận metagenome suối nước nóng để khám phá đa dạng
vi sinh vật và khai thác các gen mã hóa cho cellulase vẫn chưa được công bố.Với mong muốn có thể tiếp cận và đánh giá được đa dạng vi sinh vật trong suốinước nóng cũng như tìm kiếm được nguồn cellulase mới có khả năng bền nhiệt
và bền trong các điều kiện pH axit/kiềm của quá trình tiền xử lý lignocellulose,trong nghiên cứu này, suối nước nóng Bình Châu - suối nước nóng có nhiệt độcao thứ hai ở Việt Nam được chọn làm nguồn thu nhận DNA metagenome đểkhám phá đa dạng vi sinh vật và khai thác các gen cellulase mới
CHƯƠNG II VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Trang 72.1 Vật liệu nghiên cứu
- Mẫu nghiên cứu: Mẫu nước và mẫu bùn được thu thập từ suối nước nóng BìnhChâu ngày 14 tháng 5 năm 2015 Mẫu nước được lấy trực tiếp từ miệng giếngphun (10º36’03.9’’ Bắc và 107º33’30.0’’ Đông) với nhiệt độ 82°C, pH = 7,5.Bùn được thu thập ở vị trí bên ngoài miệng giếng phun, dọc theo dòng chảy(10o37’03.9” Bắc và 107o32’30.0” Đông) với nhiệt độ dao động từ 45 đến65ºC, pH 7,7 - 9
- Chủng vi khuẩn sử dụng: Escherichia coli TOP10F' (Thermo Fisher Scientific), E coli JM109 (DE3) (Promega) và E coli C43 (DE3)
(Lucigen)
- Gen [denovogenes] _18736 mã hóa cho endoglucanase và [denovogenes]_32768 mã hóa cho β-glucosidase
- Các vector và hóa chất sử dụng: Vectors pJET1.2_18736 và pJET1.2_32768
(PhuSa Biochem); Vector pET17b (Novagen); Enzyme cắt giới hạn NdeI và HindIII (NEB) và T4 DNA ligase (Thermo Fisher Scientific); Các kit tách
chiết: Kit PowerWater® DNA Isolation (MO BIO), Kit PowerMax® SoilDNA Isolation (MO BIO), kit tinh sạch PCR (GeneJet PCR purification kit -Thermo Fisher Scientific), kit tách chiết plasmid (GeneJet PlasmidMiniprep Kit - Thermo Fisher Scientific); Các hóa chất chính dùng chophân tích: Carboxymethyl cellulose (low viscosity, Sigma: C5678), DNSA,glucose, p-nitrophenyl-β-glucopyranoside (pNPG) (Sigma Aldrich), IPTG;
và các hóa chất dùng cho sinh học phân tử, hóa sinh và nuôi cấy vi sinh vật
2.2 Phương pháp nghiên cứu
2.2.1 Tách chiết DNA metagenome và giải trình tự: DNA metagenome mẫu
nước và mẫu bùn suối nước nóng Bình Châu được tách chiết bằng Kit theohướng dẫn của nhà sản xuất Sau đó hai mẫu này được trộn lại với nhau (theo tỉ
lệ 1:1) để tạo thành mẫu DNA metagenome suối nước nóng Bình Châu trướckhi gửi đi đọc trình tự tại Công ty BGI Co., Ltd (HongKong) bằng thiết bị giảitrình tự Illumina HiSeqTM platform
Trang 82.2.2 Các công cụ tin sinh sử dụng trong xử lý, phân tích dữ liệu giải trình tự DNA metagenome và sàng lọc gen mã hóa enzyme thủy phân cellulose tiềm năng.
2.2.3 Thiết kế vector biểu hiện: gen denovogenes_18736 mã hóa cho
endoglucanase và denovogenes_32768 mã hóa cho β-glucosidase đã được chọn
từ bộ dữ liệu DNA metagenome vi sinh vật suối nước nóng Bình Châu để biểuhiện Hai gen này được gắn thêm đuôi 6 His - tag ở đầu C của gen và được tổnghợp, lưu giữ trong vector tách dòng pJET1.2 tại Công ty Sinh hóa Phù Sa(PhuSa Biochem Co., Ltd) Vector pET-17b được chọn làm vector biểu hiện để
biểu hiện gen trong chủng chủ E coli Top10F’ Các plasmid mang gen được
tạo thành có tên là pET17b_18736 và pET17b_32768
2.2.4 Lựa chọn một số điều kiện biểu hiện gen: Các điều kiện: chủng chủ, môi
trường nuôi cấy, độ thoáng khí, nồng độ IPTG đã được nghiên cứu để nâng caohiệu quả biểu hiện endoglucanase được mã hóa bởi gen denovogenes_18736 vàβ-glucosidase được mã hóa bởi denovogenes_32768 Dưới các điều kiện đượclựa chọn, xác định động thái sinh trưởng và biểu hiện endoglucanase và β-glucosidase của chủng tái tổ hợp
2.2.5 Xác định hoạt tính enzyme:
- Hoạt tính endoglucanase được xác định theo phương pháp của Ghose (1987), sửdụng CMC làm cơ chất phản ứng Một đơn vị enzyme được định nghĩa là lượngenzyme cần thiết để tạo ra 1 μmol glucose trong một phút ở điều kiện phản ứng
- Hoạt tính β-glucosidase được xác định theo phương pháp của Shi và cs (2017),
sử dụng p-nitrophenyl-β-D-glucopyranoside (p-NPG) làm cơ chất phản ứng Một
đơn vị hoạt tính enzyme được định nghĩa là lượng enzyme cần thiết xúc tác phảnứng để giải phóng ra 1 mol p- nitrophenyl (p-NP) từ p-NPG trong thời gian mộtphút ở điều kiện phản ứng
2.2.6 Tinh sạch, kiểm tra kích thước protein (SDS – PAGE) và xác định hoạt tính enzyme (Zymogram): sử dụng cột IMAC – Ni2+ để tinh sạchendoglucanase_18736 và β-glucosidase_32768 tái tổ hợp Nồng độ proteinđược xác định theo phương pháp Bradford (1976) Khối lượng phân tử củaenzyme được xác định tương đối bằng SDS-PAGE theo phương pháp của
Trang 9Laemmli (1970) Zymogram của endoglucanase được tiến hành trên gelpolyacrylamide có bổ sung CMC theo phương pháp của Sharma và Guptasarma(2017) cải tiến Zymogram của β-glucosidase được tiến hành theo phương phápcủa Neddersen và Elleuche (2015) cải tiến.
2.2.7 Nghiên cứu một số đặc tính của enzyme tái tổ hợp: Một số đặc tính của
enzyme endoglucanase_18736 và β-glucosidase_32768 tái tổ hợp đã được xácđịnh: nhiệt độ, pH tối ưu cho hoạt động của enzyme; ảnh hưởng của nồng độion kim loại lên hoạt tính enzyme; độ bền nhiệt, kiềm của enzyme; tính đặchiệu cơ chất và thông số động học của enzyme
2.2.8 Xử lý thống kê: Sử dụng Microsoft excel 2016 để xử lý dữ liệu Các kết
quả được hiểu thị là giá trị trung bình ± độ lệch chuẩn của mẫu Giá trị p < 0,05được coi là có ý nghĩa thống kê trong dữ liệu
CHƯƠNG III KẾT QUẢ NGHIÊN CỨU
3.1 Khai thác bộ dữ liệu giải trình tự DNA metagenome vi sinh vật suối nước nóng Bình Châu, đánh giá đa dạng vi sinh vật và xây dựng bộ dữ liệu gen mã hóa cellulase.
3.1.1 Tách chiết và tinh sạch DNA metagenome vi sinh vật suối nước nóng Bình Châu
Mẫu nước và mẫu bùn thu thập từ suối nước nóng Bình Châu được sửdụng làm nguyên liệu tách DNA metagenome Kết quả tách chiết DNAmetagenome của mẫu nước và bùn suối nước nóng Bình Châu cho thấy DNAmetagenome của mẫu nước và mẫu bùn suối nước nóng Bình Châu có chấtlượng tốt, DNA không bị đứt gãy (Hình 3.1)
Trang 10Hình 3.1 DNA metagenome của mẫu nước và bùn suối nước nóng Bình Châu.
Chú thích: M: thang DNA chuẩn 1 kb; 1 và 3: DNA metagenome của mẫu nước thu lần
1 và 2; 2 và 4: DNA metagenome của mẫu bùn thu lần 1 và 2
Kết quả đo nồng độ DNA metagenome của các mẫu sau khi tách chiếtbằng máy quang phổ Nano Drop 1000 cho thấy cả hai mẫu DNA thu được đều
có độ tinh sạch cao, tỷ lệ A260/A280, A260/A230 đều lớn hơn 2 Lượng DNAmetagenome mẫu nước đạt 63,75 ng/µl và mẫu bùn đạt 120,9 ng/µl Mẫu DNAthu được này đảm bảo đủ điều kiện đáp ứng về số lượng và chất lượng để gửi
đi giải trình tự gen thế hệ mới DNA metagenome mẫu nước và mẫu bùn đượctrộn lại với nhau theo tỷ lệ 1:1 (v/v) để tạo thành mẫu DNA metagenome suốinước nóng Bình Châu
3.1.2 Khai thác bộ dữ liệu DNA metagenome, đánh giá đa dạng vi sinh vật, xác định và tổng hợp gen mới mã hóa cho các enzyme thủy phân cellulose (enzyme chịu kiềm, chịu axit và chịu nhiệt).
3.1.2.1 Giải trình tự và tiền xử lý dữ liệu DNA metagenome suối nước nóng Bình Châu
DNA metagenome suối nước nóng Bình Châu được gửi đi đọc trình tự tạicông ty BGI Co., Ltd (HongKong) bằng thiết bị giải trình tự thế hệ mớiIlluminaHiSeqTM platform Kết quả giải trình tự thu được 10.4 Gb dữ liệu thô
Sử dụng phần mềm Trimmomatic để tinh sạch dữ liệu (loại bỏ trình tự chấtlượng kém), kết quả được trình bày trong Bảng 3.1
Bảng 3.1 Kết quả tinh sạch dữ liệu giải trình tự DNA metagenome
suối nước nóng Bình Châu
Tỉ lệ lắp ráp (%)
Trang 11Bảng 3.2 Kết quả lắp ráp de novo metagenome suối nước nóng Bình Châu
3.1.2.4 Đánh giá đa dạng vi sinh vật
Cơ sở dữ liệu nr và MEGAN được sử dụng để chú giải và phân loại tất cả156.093 khung đọc mở, kết quả cho thấy có 106.903 gen được chú giải và49.190 gen là những gen chưa biết Các gen này được phân loại thuộc 4ngành, 57 lớp, 128 bộ, 245 họ, 825 chi và 2250 loài khác nhau Trong số106.903 gen đã được chú giải có 29.069 gen vi khuẩn, 1.416 gen cổ khuẩn, 4gen nhân thật, 3 gen virus và 76.411 gen chưa được xác định (unclassfied).Trong giới vi khuẩn, ngành Proteobacteria là ngành chiếm ưu thế nhất chiếm68,68%, tiếp theo là Firmicutes (8,22%), Cyanobacteria (4,53%), Bacteroidetes(3,52%), Planctomycetes (2,81%), Actinobacteria (2.43%) và các ngành khác (độphong phú tương đối <2%) Hơn nữa, trong ngành Proteobacteria, lớpGammaproteobacteria là lớp chiếm ưu thế nhất (24,87%), tiếp sau làAlphaproteobacteria (19.61%) và Betaproteobacteria (16.42%) Phân loại vi
khuẩn ở cấp độ loài cho thấy Marinobacter manganoxydans là loài chiếm ưu thế nhất (5,57%), tiếp theo là Roseobacter sp (4,81%), Gamma proteobacterium
Trang 12IMCC2047 (3,93%), Thiobacillus thioparus (1,11%), Bdellovibrio bacteriovorus (0,96%), Thiobacillus denitrificans (0,96%), Caldimonas manganoxidans
(0,85%) và các loài khác với tỷ lệ các gen đã được phân loại chiếm < 0,85%.Trong suối nước nóng Bình Châu, Aquificae (0,44%), Thermodesulfobacteria(0,29%) và Thermotogae (0,06%) được biết đến là các Ngành vi khuẩn ưa nhiệthoặc siêu ưa nhiệt Mặc dù sử dụng cơ sở dữ liệu nr và MEGAN đã chú giảiđược 106.903 gen nhưng đánh giá đa dạng vi sinh vật ở mức độ phân loại đếnloài còn khá hạn chế, có tới 78.487 gen chưa được phân loại chiếm 50,282%tổng số gen được dự đoán và 73,419% so với gen được chú giải
Cổ khuẩn có mặt trong suối nước nóng Bình Châu chủ yếu thuộc NgànhThaumarchaeota (51,76%), tiếp theo là Ngành Euryarchaeota (35,38%) Ở cấp
độ phân loại loài, loài cổ khuẩn Candidatus Nitrosoarchaeum limnia là loài
chiếm ưu thế nhất (22,17%) trong suối nước nóng Bình Châu
3.1.2.5 Khai thác gen mã hoá cho enzyme tham gia vào quá trình thủy phân cellulose từ DNA metagenome suối nước nóng Bình Châu
Nhằm tìm ra trình tự axit amin có mức độ tương đồng cao nhất, qua đóchú giải chức năng của các protein và sàng lọc ORF mã hóa cho enzyme thamgia vào quá trình thủy phân cellulose, toàn bộ 156.093 khung đọc mở tiềm năngthu nhận được ở trên được so sánh với các cơ sở dữ liệu bằng công cụ Blast++.Kết quả cho thấy theo cơ sở dữ liệu NR có 106.903 ORF; Swiss-Prot: 46.085ORF; CAZy: 2.849 ORF; KEGG: 67.379 ORF
Với mục tiêu tiếp cận để khai thác các gen mã hóa cho enzyme tham giavào quá trình thủy phân cellulose từ DNA metagenome vi sinh vật suối nướcnóng Bình Châu, chúng tôi so sánh các trình tự ORF trong bộ dữ liệu DNAmetagenome với cơ sở dữ liệu CAZy Kết quả được thể hiện trong Hình 3.2
Trang 13Hình 3.2 Phân bố các họ enzyme được tìm thấy trong bộ dữ liệu DNA metagenome
suối nước nóng Bình Châu khi so sánh với cơ sở dữ liệu CAZy
Chú thích: GHs : họ glycoside hydrolases; GT s : họ glycosyl transferases; PL s : họ polysaccharide lyases; CE s : họ carbohydrate esterases; CBM s : họ carbohydrate-binding modules.
Quần xã vi sinh vật suối nước nóng Bình Châu có khả năng sinh tổnghợp nhiều loại enzyme tham gia thủy phân cellulose và hemicellulose, tạothành các dạng monosaccharide Phân bố các ORF thuộc họ enzyme GH thamgia chuyển hóa lignocellulose được trình bày trong Hình 3.3
Hình 3.3 Phân bố các ORF thuộc họ enzyme GH tham gia chuyển hóa
lignocellulose trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu
Từ các ORF mã hóa cho các họ GH, nhóm enzyme cellulase gồm 82 trìnhtự: mã hóa cho endoglucanase, exoglucanase và β-glucosidase Phân bố của cácORF mã hóa cho cellulase được trình bày trong Bảng 3.3
Bảng 3.3 Phân bố của các ORF mã hóa cho cellulase được dự đoán
từ bộ dữ liệu DNA metagenome suối nước nóng Bình Châu
Enzyme
ORF
Mức độ tương đồng a (%)
glucanase
Endo- glucanase
Exo- glucosidase Tổng
Trang 14Ghi chú: a so với cơ sở dữ liệu non-redundant (nr) protein của NCBI.
Trong 47 trình tự ORF hoàn thiện có 15 ORF mã hóa cho endoglucanase,
1 ORF mã hóa cho exoglucanase và 31 ORF mã hóa cho β-glucosidase Cáctrình tự này chủ yếu là các trình tự chưa có chú giải nguồn gốc tiến hóa (NA-
No Annotation), chưa phân loại được dựa vào các cơ sở dữ liệu của NCBI.Đồng thời, cây phát sinh chủng loại của các ORF này cho thấy các trình tự mãhóa cho endoglucanase chủ yếu thuộc họ GH5, GH6 và GH8 Các trình tự mãhóa cho β-glucosidase chủ yếu thuộc họ GH1 và GH3 Đây là hai họ GH phổbiến cho enzyme thủy phân cellulose Xét về đặc điểm tiến hóa, các ORF mãhóa cho cellulase rất đa dạng về nguồn gốc tiến hóa
3.1.2.6 Phân tích một số tính chất của các enzyme được mã hóa từ các gen trong bộ dữ liệu DNA metagenome suối nước nóng Bình Châu để lựa chọn gen tiềm năng cho quá trình biểu hiện.
Với mục tiêu tiếp cận để khai thác các enzyme mới hoặc có tính chất mớinhư bền nhiệt (có chỉ số Tm cao), có khả năng chịu kiềm hoặc chịu axit, cáccông cụ tin sinh đã được sử dụng để dự đoán tính bền nhiệt và tính chịu kiềm,chịu axit của protein Kết quả được trình bày trong hình 3.4