27 3.5 Khai thác trình tự mã hóa cho enzyme xylan 1-4 beta xylosidase bằng probe từ dữ liệu DNA metagenome của vi sinh vật trong ruột mối .... 29 3.6 Khảo sát cấu trúc bậc 3 của các trìn
Trang 1KHOA CÔNG NGHỆ SINH HỌC
KHÓA LUẬN TỐT NGHIỆP
Trang 2KHOA CÔNG NGHỆ SINH HỌC
KHÓA LUẬN TỐT NGHIỆP
ĐỀ TÀI:
XÂY DỰNG PROBE ĐỂ KHAI THÁC VÀ CHỌN GEN
MÃ HÓA XYLAN 1-4 BETA XYLOSIDASE TỪ DỮ LIỆU
GIẢI TRÌNH TỰ DNA METAGENOME
Hà Nội - 2017
Giáo viên hướng dẫn Sinh viên thực hiện Lớp
:TS Nguyễn Thị Trung :Vũ Trường Đức
:13.02 - K20
Trang 3Vũ Trường Đức – 1302.K20 Khóa luận tốt nghiệp
LỜI CẢM ƠN
Em xin bày tỏ lòng biết ơn chân thành tới giảng viên hướng dẫn - TS Nguyễn Thị Trung - người đã định hướng nghiên cứu, tận tình giúp đỡ em trong quá trình thực hiện đề tài
Em xin bày tỏ lòng biết ơn chân thành tới GS.TS Trương Nam Hải, TS
Đỗ Thị Huyền - Trưởng phòng Kỹ thuật di truyền, Th.S Lê Ngọc Giang - nghiên cứu sinh phòng kĩ thuật di truyền, cùng toàn thể các cô (chú), anh (chị)
kỹ thuật viên Phòng kỹ thuật di truyền đã tận tình giúp đỡ, tạo mọi điều kiện tốt nhất để giúp em hoàn thành đề tài này
Em cũng xin gửi lời cảm ơn chân thành tới các thầy (cô) giáo khoa Công Nghệ Sinh Học, trường Viện Đại Học Mở Hà Nội đã truyền đạt cho em những kiến thức quý báu trong thơi gian học tập vừa qua
Trong quá trình nghiên cứu đề tài, do thời gian thực tập có hạn, kiến thức của em còn hạn chế nên báo cáo của em không tránh khỏi những thiếu sót nhất định Em rất mong nhận được sự đóng góp ý kiến của giảng viên hướng dẫn – TS Nguyễn Thị Trung, các thầy (cô) giáo khoa Công Nghệ Sinh Học trường Viện Đại học Mở Hà Nội và các cô chú, anh chị kỹ thuật viên phòng
kỹ thuật di truyền để bài viết của em được hoàn thiện hơn
Em xin chân thành cảm ơn !
Hà Nội, ngày 09 tháng 05 năm 2017 Sinh viên
Vũ Trường Đức
Trang 4Vũ Trường Đức – 1302.K20 Khóa luận tốt nghiệp
MỤC LỤC
DANH MỤC CÁC CHỮ VIẾT TẮT I DANH MỤC CÁC BẢNG II DANH MỤC CÁC HÌNH III
LỜI MỞ ĐẦU 1
PHẦN 1: TỔNG QUAN 3
1.1 Khái quát về xylan 1-4 beta xylosidase 3
1.1.1 Định nghĩa 3
1.1.2 Phân loại 3
1.1.3 Hoạt tính của xylan 1-4 beta xylosidase 4
1.1.4 Cấu trúc của xylan 1-4 beta xylosidase 4
1.1.4.1 Cấu trúc bậc I của xylan 1-4 beta xylosidase 4
1.1.4.2 Cấu trúc bậc II của xylan 1-4 beta xylosidase 4
1.1.4.3 Cấu trúc bậc 3 của xylan 1-4 beta xylosidase 5
1.1.4.4 Cấu trúc bậc IV của xylan 1-4 beta xylosidase 7
1.2 Khái quát về các enzyme hoạt hóa carbohydrate (CAZy) 8
1.2.1 Khái niệm các enzyme hoạt hóa carbohydrate (CAZy) 8
1.2.2 Lịch sử phát triển của các enzyme hoạt hóa carbohydrate 8
1.3 Khai thác cơ sở dữ liệu các gen 9
1.3.1 Khai thác dữ liệu từ Ngân hàng Gen quốc tế 9
1.3.1.1 Khái niệm về cơ sở dữ liệu các gen 9
1.3.1.2 Phương pháp tìm kiếm thông tin về các gen 9
Trang 5Vũ Trường Đức – 1302.K20 Khóa luận tốt nghiệp
1.3.1.3 Một số phần mềm hỗ trợ tìm kiếm thông tin về các gen 9
1.3.2 Sử dụng Probe 10
1.3.2.1 Khái niệm Probe 10
1.3.2.2 Cấu trúc của probe 11
1.3.2.3 Phương pháp xây dựng probe 11
1.4 Cơ sở dữ liệu DNA metagenome của vi sinh ruột mối 12
PHẦN II: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 13
2.1 Vật liệu nghiên cứu 13
2.1.1 Đối tượng nghiên cứu 13
2.1.2 Thiết bị nghiên cứu 13
2.2 Phương pháp nghiên cứu 13
2.2.1 Xác định các họ GH có chứa enzyme xylan 1-4 beta xylosidase theo CAZy 13
2.2.2 Tìm kiếm các trình tự axit amin của enzyme xylan 1-4 beta xylosidase đã được xác định đặc tính 14
2.2.3 Xác định mức độ tương đồng của các trình tự bằng ClustalW - PBIL 15
2.2.4 Xây dựng probe và giá trị tham chiếu 16
2.2.5 Khai thác trình tự mã hóa xylan 1-4 beta xylosidase từ dữ liệu DNA metagenome của vi sinh vật trong ruột mối 17
PHẦN III: KẾT QUẢ VÀ THẢO LUẬN 18
3.1 Các họ GH có chứa enzyme xylan 1-4 beta xylosidase theo CAZy 18
Trang 6Vũ Trường Đức – 1302.K20 Khóa luận tốt nghiệp
3.1.1 Số lượng họ GH có chứa enzyme xylan 1-4 beta xylosidase theo
CAZy 18
3.1.2 Cấu trúc đặc trưng của một số họ GH có chứa enzyme xylan 1-4 beta xylosidase theo CAZy 19
3.2 Trình tự axit amin của enzyme xylan 1-4 beta xylosidase đã được xác định đặc tính 20
3.3 Mức độ tương đồng của các trình tự axit amin 26
3.4 Xây dựng probe và giá trị tham chiếu 27
3.5 Khai thác trình tự mã hóa cho enzyme xylan 1-4 beta xylosidase bằng probe từ dữ liệu DNA metagenome của vi sinh vật trong ruột mối 29
3.6 Khảo sát cấu trúc bậc 3 của các trình tự axit amin của enzym xylan 1-4 beta xylosidase được khai thác bằng probe 32
PHẦN IV: KẾT LUẬN VÀ KIẾN NGHỊ 38
4.1 Kết luận 38
4.2 Kiến nghị 38
TÀI LIỆU THAM KHẢO 39
Trang 7Vũ Trường Đức – 1302.K20 I Khóa luận tốt nghiệp
Enzym classes Glycoside Hydrolases National Center for Biotechnology Information Ribonucleic acid
Trang 8Vũ Trường Đức – 1302.K20 II Khóa luận tốt nghiệp
Bảng 3.5.1 So sánh số lượng trình tự khai thác bằng probe với dự
Bảng 3.5.2 So sánh số lượng trình tự khai thác bằng probe với dự
Bảng 3.6 Ước đoán cấu trúc bậc ba của các trình tự bằng Swiss Prot 33
Trang 9Vũ Trường Đức – 1302.K20 III Khóa luận tốt nghiệp
DANH MỤC CÁC HÌNH
Hình 1.1 Cấu trúc bậc 2 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 có khối
Hình 1.3 Cấu trúc bậc 4 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485
8
Hình 3.3 Kết quả so sánh sự tương đồng các trình tự axit amin của
xylan 1-4 beta xylosidase thuộc họ GH43
26
Hình 3.4 Trình tự probe cho enzyme xylan 1-4 beta xylosidase thuộc
họ GH43
27
Hình 3.5 Kết quả dự đoán tương đồng đặc hiệu trình tự và các gốc
hoạt động của các trình tự được lựa chọn bằng probe GH43
32
Hình 3.6 Cấu trúc bậc ba của các xylan beta xylosidase khuôn
(template) 2exk.1.A (A), 1yrz.1.A (B), 1yi7.1.A (C), 3c7g.1.A (D) họ
GH43 tương đồng với các trình tự được khai thác bằng probe sử dụng
Swiss prot
37
Trang 10Vũ Trường Đức – 1302.K20 1 Khóa luận tốt nghiệp
LỜI MỞ ĐẦU
Mối Coptotermes gestroi thuộc mối bậc thấp trong họ Rhinotermitidae
rất phổ biến ở Việt Nam cũng như một số quốc gia trên thế giới Có ít nhất 16
họ GH của vi sinh vật cộng sinh trong ruột sau bao gồm: GH2, 3, 5, 7, 10, 11,
16, 20, 26, 30, 42, 45, 47, 53, 77, 92 Ứng dụng kỹ thuật metagenomics theo hướng phân tích dữ liệu thu được từ việc giải toàn bộ trình tự metagenome,
Do và đồng tác giả đã khai thác được 125.431 khung đọc mở (ORF) với tổng chiều dài lên tới 78.271.365 bp của hệ vi khuẩn sống tự do trong ruột mối, trong đó ước đoán gồm rất nhiều trình tự mã hóa cho enzyme xylan 1-4 beta xylosidase hay gọi tắt là enzyme beta xylosidase Phương pháp dự đoán gen
từ dữ liệu khổng lồ DNA metagenome của vi sinh vật trong ruột mối bước đầu đã sử dụng các phần mềm tin sinh học, thường dựa trên số liệu các trình
tự tương đồng với các loài đã được công bố trong ngân hàng gen
Việc lựa chọn các trình tự gen mong muốn được thực hiện bằng nhiều phần mềm dự đoán cấu trúc và chức năng của protein Đầu tiên là việc sử dụng công cụ BLASTP để xác định chức năng bằng cách so sánh độ tương đồng và mức độ bao phủ của trình tự đã ước đoán chức năng ban đầu từ DNA metagenome, với các trình tự có trên ngân hàng gen của NCBI Kết quả BLASTP giúp cho việc ước đoán rất nhiều các thông số của enzyme như vị trí các vùng bảo tồn, họ enzyme, nguồn vi sinh vật chứa enzyme, … Trước khi đưa vào thực nghiệm, các gen này tiếp tục sử dụng phần mềm dự đoán về tính chất như khả năng chịu kiềm/axit, chịu nhiệt ,… của enzyme Mặc dù dữ liệu trình tự axit amin/nucleotit của NCBI vô cùng lớn, nhưng có rất nhiều trình tự nucleotit mã hóa cho enzyme xylan 1-4 beta xylosidase chưa được nghiên cứu tính chất, mà chỉ dựa trên sự so sánh tương đồng đối với trình tự có sẵn trong NCBI Do đó số liệu dự đoán của BLAST và các phần mềm khác sử dụng những dữ liệu của NCBI chưa được nghiên cứu chi tiết sẽ trở nên kém tin cậy
Trang 11Vũ Trường Đức – 1302.K20 2 Khóa luận tốt nghiệp
khi đưa vào thực nghiệm Đây là một trong những khó khăn trong việc lựa chọn gen từ số liệu DNA metagenome của ruột mối nếu chỉ sử dụng các công
cụ trên Do đó việc tìm kiếm phương pháp để có thể khai thác, lựa chọn được gen mã hóa xylan 1-4 beta xylosidase từ dữ liệu này và có thể thực nghiệm hiệu quả là rất cần thiết
Mục tiêu nghiên cứu
Đưa ra được phương pháp để xây dựng probe cho enzyme xylan 1-4 beta xylosidase
Trang 12Vũ Trường Đức – 1302.K20 3 Khóa luận tốt nghiệp
Thủy phân (1-> 4) -beta-D-xylan, để loại bỏ dư lượng D-xylose tiếp từ-giảm không trạm cuối enzym này cũng thủy phân xylulose
1.1.2 Phân loại
Xylan 1,4-beta-xylosidase thuộc nhóm enzyme glycoside hydrolase (EC 3.2.1.x) Đây là một nhóm enzyme lớn, có khả năng thủy phân liên kết glycoside giữa cacbonhydrat và các thành phần khác Dựa trên cơ chất đặc hiệu, cơ chế phản ứng và trình tự amino axit, đến nay đã có 135 họ glycoside hydrolase được phân loại 14 bộ gồm các họ enzyme tương đồng cũng đã được thống kê
Xylan 1,4-beta-xylosidase, từ các nguồn đã được tìm thấy hiện nay, được sắp xếp vào các họ glycoside hydrolase 1, 3, 30, 39, 43, 51, 52, 54, 116
và 120 Tuy nhiên, vẫn còn nhiều loại xylosidases chưa được phân loại rõ, bởi chúng không có đặc tính rõ ràng hoặc mang đặc tính của nhiều họ
Xylan 1,4-beta-xylosidase ở các họ GH 1, 39, 52, 116, 120 đều có nguồn gốc vi khuẩn, và ở họ GH 51, 54 đều có nguồn gốc nấm Các họ còn lại chứa β-xylosidase có nguồn gốc hỗn hợp
Trang 13Vũ Trường Đức – 1302.K20 4 Khóa luận tốt nghiệp
1.1.3 Hoạt tính của xylan 1-4 beta xylosidase
Xylan 1,4-beta-xylosidase, là một enzyme có khả năng xúc tác phản ứng cắt ở đầu không khử của chuỗi polyme (reducing end exo-acting) Hoạt tính chủ yếu của chúng là loại bỏ các gốc khử D-xylose khỏi đầu không khử (non-reducing end) của (1,4)-β-D-xylan oligosaccharide, nhờ đó (1,4)-β-D-xylan oligosaccharide được thủy phân thành các tiểu phần β-D-xylanpyranose Ngoài ra, β-xylosidase còn có khả năng thủy phân xylobiose Một số hoạt tính exoglycosidase khác của enzyme này cũng đã được tìm thấy
ở gan cừu
1.1.4 Cấu trúc của xylan 1-4 beta xylosidase
Về bản chất xylan 1-4 beta xylosidase là một phân tử protein Xét về mặt cấu trúc và các dạng tồn tại trong không gian người ta phân biệt 4 loại cấu trúc:
1.1.4.1 Cấu trúc bậc I của xylan 1-4 beta xylosidase
Cấu trúc bậc I của protein là thành phần và trình tự sắp xếp của các gốc axit amin trong mạch polypeptide Hiện nay, cấu trúc bậc I của nhiều protein
đã được thiết lập Đa số các protein có số gốc axit amin giữa 100 và 500, nhưng cũng có nhiều protein có số lượng gốc axit amin lớn hơn nhiều
1.1.4.2 Cấu trúc bậc II của xylan 1-4 beta xylosidase
Cấu trúc bậc II của phân tử protein biểu thị sự xoắn của chuỗi polypeptide, là tương tác không gian giữa các gốc axit amin ở gần nhau trong mạch polypeptide Nói cách khác, cấu trúc bậc II là dạng không gian cục bộ của từng phần trong mạch polypeptide Cấu trúc này được làm bền nhờ các liên kết hydro được tạo thành giữa liên kết peptide ở kề gần nhau, cách nhau
Trang 14Vũ Trường Đức – 1302.K20 5 Khóa luận tốt nghiệp
những khoảng xác định Theo Pauling và Cori (1951) cấu trúc bậc II của protein bao gồm 2 kiểu chính là xoắn α và phiến gấp nếp β [12]
Một khung đọc mở có chứa 1.914 bp của xylC tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 mã hóa enzyme
β-xylosidase có khối lượng 73 kDa Cấu trúc bậc 2 của enzyme này được minh họa ở Hình 1.1 [16]
Hình 1.1 Cấu trúc bậc 2 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 có khối lượng 73
kDa a cấu trúc dự đoán sử dụng trình tự gốc; b cấu trúc dự đoán sử dụng
trình tự đã được biến đổi
1.1.4.3 Cấu trúc bậc 3 của xylan 1-4 beta xylosidase
Cấu trúc bậc III là tương tác không gian giữa các gốc axit amin ở xa nhau trong mạch polypeptide, là dạng cuộn lại trong không gian của toàn mạch polypeptide (hình dạng chung của chuỗi polypeptide) Trong thực tế,
Trang 15Vũ Trường Đức – 1302.K20 6 Khóa luận tốt nghiệp
nhiều protein có cấu trúc bậc III dạng hình cầu Nguyên nhân làm cho các phân tử protein có thể cuộn lại thành hình cầu là do sự tương tác của các nhóm bên (gốc R) của axit amin Do sự tương tác này mà cấu trúc bậc II đều đặn bị biến dạng, dẫn đến hình thành cấu trúc bậc III Như vậy, ở cấu trúc bậc III, chuỗi polypeptide có những vùng có cấu trúc bậc II xác định, có những vùng có cấu trúc gấp nếp β và những vùng xoắn ngẫu nhiên làm cho phân tử cuộn lại có dạng hình cầu Myoglobin là một protein có cấu trúc bậc III được Kendrew xác định bằng phương pháp chụp nhiễu xạ tia X
Đặc điểm quan trọng trong cấu trúc bậc III là sự hình thành những vùng
kỵ nước do các gốc bên không phân cực của các axit amin hợp thành Nhiều nghiên cứu đã chứng minh rằng, cấu trúc bậc III được giữ vững và ổn định chủ yếu do sự tương tác kỵ nước và liên kết hydro
Ngoài ra, người ta cũng tìm thấy liên kết disulfur (-S-S) ở một số protein có cấu trúc bậc III, song sự hình thành cầu disunfua không phải là lực chủ đạo làm cho mạch polypeptide cuộn lại, mà nó được hình thành ngẫu nhiên khi các nhóm –SH của các gốc axit amin trong chuỗi polypeptide đã cuộn lại nằm kề nhau
Cầu disunfua đóng vai trò giữ vững và ổn định cấu trúc bậc III Phần lớn các protein hình cầu có cấu trúc bậc III, có các gốc axit amin kỵ nước quay vào trong, còn các gốc axit amin ưa nước phân bố trên bề mặt
Ví dụ về cấu trúc bậc III của beta-1,4-xylanases from Chaetomium
thermophilum trình bày ở Hình 1.2 [4]
Trang 16Vũ Trường Đức – 1302.K20 7 Khóa luận tốt nghiệp
Hình 1.2 Cấu trúc bậc 3 của beta-1,4-xylanases
from Chaetomium thermophilum
1.1.4.4 Cấu trúc bậc IV của xylan 1-4 beta xylosidase
Cấu trúc bậc IV biểu thị sự kết hợp của các chuỗi có cấu trúc bậc III
trong phân tử protein Hay nói cách khác, những phân tử protein có cấu trúc
từ 2 hay nhiều chuỗi protein hình cầu, tương tác với nhau trong không gian
tạo nên cấu trúc bậc IV Mỗi một chuỗi polypeptide đó được gọi là một tiểu
đơn vị (subunit), chúng gắn với nhau nhờ các liên kết hydro, tương tác
VanderWaals giữa các nhóm phân bố trên bề mặt của các tiểu đơn vị để làm
bền cấu trúc bậc IV
Ví dụ về cấu trúc bậc 4 của phân tử enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 (Hình 1.3) [16]
Trang 17Vũ Trường Đức – 1302.K20 8 Khóa luận tốt nghiệp
Hình 1.3 Cấu trúc bậc 4 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485
1.2 Khái quát về các enzyme hoạt hóa carbohydrate (CAZy)
1.2.1 Khái niệm các enzyme hoạt hóa carbohydrate (CAZy)
Các enzyme hoạt hóa carbohydrate - CAZy (Carbohydrate-Active
enzymes) là một hệ thống phân loại chứa cơ sở dữ liệu về enzyme tham gia vào quá trình tổng hợp, trao đổi và vận chuyển carbohydrate
1.2.2 Lịch sử phát triển của các enzyme hoạt hóa carbohydrate
Các enzyme hoạt hóa carbohydrate bao gồm các enzyme kiến tạo và phân hủy phức hợp carbohydrate và phức hợp liên kết glyco Tính đến năm
2008, các enzyme hoạt hóa carbohydrate đã được tập hợp trong cở sở dữ liệu
tại trang thông tin điện tử http://www.cazy.org là 113 glycoside hydrolase, 91
glycosyltransferase, 19 polysaccharide lyase, 15 carbohydrate esterase và 52
họ liên quan đến carbohydrate Những họ enzyme này được tạo ra dựa trên các đặc tính của protein thu được từ thực nghiệm, các trình tự gen mã hóa và
Trang 18Vũ Trường Đức – 1302.K20 9 Khóa luận tốt nghiệp
trình tự protein được công bố trên mạng từ các cơ sở dữ liệu công cộng có sự tương đồng đáng kể Các thông tin sinh hóa protein liên tục được cập nhật dựa trên các tài liệu sẵn có và thông tin về cấu trúc Hơn 6400 protein đã có
mã số EC và 700 protein đã biết cấu trúc vùng bám của enzyme PDB (Protein domain binding) [1]
Dữ liệu về CAZy liên tục được cập nhật, cho đến nay đã có dữ liệu của GenBank về chuỗi thông tin của gần 340.000 enzyme [13] CAZy xác định các họ thủy phân các liên kết glycoside (Glycosyl Hydrolases: GH) có liên quan tiến hóa được giới thiệu bởi Henrissat năm 1991 và 1997 [5], [6] Đến
năm 2015, CAZy chứa 135 họ GH với các đặc điểm nhận biết khác nhau
1.3 Khai thác cơ sở dữ liệu các gen
1.3.1 Khai thác dữ liệu từ Ngân hàng Gen quốc tế
1.3.1.1 Khái niệm về cơ sở dữ liệu các gen
Cơ sở dữ liệu là một hệ thống các thông tin có cấu trúc được lưu trữ trên các thiết bị lưu trữ thông tin thứ cấp (như băng từ, đĩa từ ) để có thể thỏa mãn yêu cầu khai thác thông tin đồng thời của nhiều người sử dụng hay nhiều chương trình ứng dụng với nhiều mục đích khác nhau
1.3.1.2 Phương pháp tìm kiếm thông tin về các gen
Hai nguồn thông tin chính để tìm kiếm trình tự axit amin của enzyme này là CAZy và NCBI
1.3.1.3 Một số phần mềm hỗ trợ tìm kiếm thông tin về các gen
Cơ sở dữ liệu về CAZy lưu trữ tại http://www.cazy.org/ được sắp xếp
thành các họ enzyme thủy phân liên quan đến cấu trúc và các cấu trúc modul liên kết carbohydrate có khả năng phân hủy, biến đổi hoặc hình thành liên kết Các dữ liệu, thông tin liên quan đến enzyme liên tục được cập nhật vào cơ sở
Trang 19Vũ Trường Đức – 1302.K20 10 Khóa luận tốt nghiệp
dữ liệu
Khi phân chia thành các họ enzyme dựa trên phân tích trình tự axit amin, dữ liệu CAZy tiếp tục được khẳng định là một nguồn tài nguyên vô giá giống như một công cụ nghiên cứu Do đó ngày càng tăng số lượng thông tin
hệ gen liên quan đến trao đổi carbohydrate Không đáng ngạc nhiên khi danh pháp CAZy đã đạt được sự chấp nhận nhanh chóng của cộng đồng nghiên cứu
và đã trở thành một tiêu chuẩn khi mô tả các enzyme carbohydrate
Cơ sở dữ liệu CAZy được tổ chức thành các họ enzyme hoạt tính carbohydrate, gồm: glycoside hydrolases (GHs), glycosyltransferases (GTs), polysaccharide lyases (PLs), carbohydrate esterases (CEs), các modul liên kết carbohydrate (CBMs) Một số họ tiếp tục được phân chia thành các phân họ,
ví dụ như glycoside hydrolase họ 13 (GH13)
Clustal là một loạt chương trình ứng dụng các chương trình máy tính sử dụng trong tin sinh để so sánh nhiều trình tự [2] Clustal là phần mềm đầu tiên
để sắp xếp sự phân hóa dựa trên cây phát sinh loài [8] ClustalV viết lại trên
cơ sở Clustal bao gồm tổ chức lại cây phát sinh chủng loài trên kết quả so sánh trình tự nhận được [7] ClusstalW là giao diện theo dòng lệnh [11] ClustalX là phiên bản có tính năng đồ họa [15]
1.3.2 Sử dụng Probe
1.3.2.1 Khái niệm Probe
Probe (còn có tên gọi khác là đoạn dò) là một sợi axit nucleic (hoặc axit ribonucleic) có trình tự xác định và được đánh dấu bằng các phương pháp khác nhau dùng để nhận diện các đoạn axit nucleic khác có trình tự bổ sung với nó Quá trình này dựa trên nguyên tắc biến tính và hồi tính của phân tử DNA, được gọi là lai phân tử DNA Các phương pháp cổ điển có sử dụng probe là Northern Blot (nhận diện bản RNA phiên mã), Southern Blot (nhận diện các phiên bản của gene) Công nghệ DNA chip and cDNA micro-arrays
Trang 20Vũ Trường Đức – 1302.K20 11 Khóa luận tốt nghiệp
được thiết kế cùng trên nguyên tắc sử dụng các probe của các phương pháp lai phân tử nhưng cho phép nghiên cứu đồng loạt hàng nghìn gen khác nhau
1.3.2.2 Cấu trúc của probe
Probe là một sợi đơn oligonucleotit, thông thường có chiều dài từ 30 đến 100 nucleotit, nên có khả năng tạo liên kết hydro với những đoạn DNA
có trình tự bổ sung với probe
Tính đặc trưng của probe phụ thuộc vào trình tự nucleotit của nó, thông thường được kiểm tra bằng cách BLAST trình tự này trên ngân hàng gene Nhiệt độ biến tính (Tm) của probe phụ thuộc số lượng và thành phần purin và pyrimidine của probe từ đó quyết định nhiệt độ lai thích hợp trong các thí nghiệm lai phân tử
1.3.2.3 Phương pháp xây dựng probe
Probe có thể được thiết kế dựa trên những trình tự có sẵn tuỳ vào mục đích của từng thí nghiệm và các thông tin đã có: Dựa trên trình tự DNA hệ gen của đối tượng nghiên cứu để nhận diện các bản sao của gene hoặc sản phẩm RNA của gen; Dựa trên trình tự DNA hệ gen của các sinh vật có quan
hệ gần gũi với đối tượng nghiên cứu nhằm tìm kiếm gen chức năng được bảo tồn qua tiến hoá; Dựa trên trình tự axit amin của protein là sản phẩm của gene Từ đó tìm kiếm trình tự trọn vẹn của gene mã hoá cho protein đó trên toàn bộ hệ gee [10]
Trong quá trình thiết kế cần bảo đảm 1) tính đặc trưng của probe, 2) không có hiện tượng lai chéo các probe hoặc tạo cấu trúc không gian nội tại trong probe, 3) giá trị nhiệt biến tính (Tm) phải phù hợp khi thực hiện phép lai nhiều probe một lúc [14]
Trang 21Vũ Trường Đức – 1302.K20 12 Khóa luận tốt nghiệp
1.4 Cơ sở dữ liệu DNA metagenome của vi sinh ruột mối
Bộ cơ sở dữ liệu thu được từ nghiên cứu ứng dụng kỹ thuật metagenomics theo hướng phân tích dữ liệu thu được từ việc giải toàn bộ trình tự metagenome Do và đồng tác giả đã khai thác được 125.431 khung đọc mở (ORF) với tổng chiều dài lên tới 78.271.365 bp của hệ vi khuẩn sống
tự do trong ruột mối, trong đó ước đoán gồm rất nhiều trình tự mã hóa cho enzyme xylan 1-4 beta xylosidase hay gọi tắt là enzyme beta xylosidase [3]
Bộ cơ sở dữ liệu này được sử dụng để khai thác các trình tự mã hóa cho các enzyme mong muốn
Trang 22Vũ Trường Đức – 1302.K20 13 Khóa luận tốt nghiệp
PHẦN II: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Vật liệu nghiên cứu
2.1.1 Đối tượng nghiên cứu
Dữ liệu metgenome DNA gồm 125.431 khung đọc mở (ORF) của vi
sinh vật cộng sinh trong ruột mối C gestroi, được giải trình tự bằng hệ thống
giải trình tự HiSeq Illuminia (BGI, Hồng Kông) và được chú giải chức năng dựa trên KEGG [3]
2.1.2 Thiết bị nghiên cứu
Máy tính cá nhân hoặc máy tính để bàn có cài bộ dữ liệu metagenome DNA của vi khuẩn cộng sinh trong ruột mối được kết nối với mạng internet
2.2 Phương pháp nghiên cứu
2.2.1 Xác định các họ GH có chứa enzyme xylan 1-4 beta xylosidase theo CAZy
Nguyên tắc:
CAZy là một hệ thống phân loại chứa cơ sở dữ liệu về enzyme tham gia vào quá trình tổng hợp, trao đổi và vận chuyển carbohydrate được lưu trữ
tại trang thông tin điện tử http://www.cazy.org CAZy cung cấp số liệu trực
tuyến và cập nhật liên tục các dữ liệu của GenBank về chuỗi thông tin của gần
340.000 enzyme [1], [13] Đến năm 2015, CAZy chứa 135 họ GH với các đặc điểm nhận biết khác nhau
Cách tiến hành:
- Tìm kiếm mã số quốc tế của enzyme xylan 1-4 beta xylosidase:
+ Truy cập internet;
Trang 23Vũ Trường Đức – 1302.K20 14 Khóa luận tốt nghiệp
+ Nhập tên enzyme xylan 1-4 beta xylosidase và mã số quốc tế;
+ Bấm enter
+ Cửa sổ kết quả hiện ra chứa mã số enzyme, bắt đầu bằng EC
- Sử dụng dữ liệu phân loại của CAZy để xác định có bao nhiêu họ GH
chứa enzyme xylan 1-4 beta xylosidase:
+ Truy cập trang CAZy (http://www.cazy.org);
+ Chọn Enzym classes;
+ Chọn Glycoside Hydrolases để tìm các họ GH có chứa enzyme xylan 1-4 beta xylosidase
+ Bấm vào từng họ GH để tìm enzyme xylan 1-4 beta xylosidase
+ Thống kê kết quả vào một bảng kết quả
+ Tìm hiểu về cấu trúc không gian: Lựa chọn từng họ GH có chứa
enzyme xylan 1-4 beta xylosidase để tìm kiếm các trình tự axit amin của enzyme xylan 1-4 beta xylosidase đã được xác định đặc tính
- Tổng hợp kết quả thành bảng phân loại danh sách các họ GH chứa
enzyme này để tìm hiểu các thông tin sâu hơn
2.2.2 Tìm kiếm các trình tự axit amin của enzyme xylan 1-4 beta xylosidase đã được xác định đặc tính
Nguyên tắc:
Dựa trên các thông tin phân loại của xylan 1-4 beta xylosidase trong các họ GH từ CAZy, chúng tôi tiếp tục tiến hành tìm kiếm các nghiên cứu trên thế giới đã công bố về trình tự axit amin và các đặc tính như khả năng chịu nhiệt, chịu kiềm/axit, cấu trúc không gian, trung tâm hoạt động xylan 1-4
beta xylosidase
Trang 24Vũ Trường Đức – 1302.K20 15 Khóa luận tốt nghiệp
Cách tiến hành:
+ Truy cập trang CAZy (http://www.cazy.org);
+ Chọn protein có mã số EC 3.2.1.37
+ Cửa sổ danh sách các protein xuất hiện cùng mã số GenBank;
+ Chọn mã số GenBank tương ứng, bấm enter
+ Chọn mã bài báo trong PUBMED, bấm enter để truy cập bài báo và đọc thông tin về protein
+ Nếu protein trong bài có các thông tin hữu ích thì quay trở lại trang GenBank để copy trình tự axit amin
+ Các trình tự được ghi chú mã số, tên của chúng Các trình tự được trình bày trong file word
2.2.3 Xác định mức độ tương đồng của các trình tự bằng ClustalW - PBIL
Nguyên tắc:
ClustalW - PBIL là phần mềm cho phép so sánh nhiều trình tự nucleotit hoặc axit amin và đưa ra bức tranh tổng thể và tính toán các điểm tương đồng giữa các trình tự khác nhau Kết quả so sánh của phần mềm này sẽ cho ra một trình tự được cho là bảo tồn cao nhất (Ký hiệu Prim.cons), đồng thời cũng sử dụng màu sắc đặc trưng chỉ ra các vị trí mà axit amin giống nhau hoàn toàn hoặc một phần giữa các trình tự để người dùng dễ dàng quan sát và phân tích Sau khi nhập dữ liệu ClustalW-PBIL sẽ tính toán và trả kết quả sau vài phút tùy vào số lượng trình tự cần so sánh Tất cả trình tự axit amin thu thập được của enzyme xylan 1-4 beta xylosidase sẽ so sánh với nhau cho từng họ GH bằng ClustalW - PBIL
Trang 25Vũ Trường Đức – 1302.K20 16 Khóa luận tốt nghiệp
Cách tiến hành:
+ Đặt tên cho các trình tự;
+ Loại bỏ các chữ số, ký tự space;
+ Truy cập trang Web: http://expasy.org/proteomics
+ Chọn ClustalW - PBIL, enter
+ Copy toàn bộ các trình tự và dán vào ô cửa sổ, bấm submit
tự khác nhau quá nhiều sẽ được loại bỏ Probe này sẽ được so sánh lại với các trình tự đã nghiên cứu để xác định giá trị tham chiếu về mức độ bao phủ và tương đồng của probe với trình tự đã sử dụng bằng BLASTP Trên cơ sở giá trị tham chiếu của probe để lựa chọn các gen mã hóa cho xylan 1-4 beta xylosidase từ số liệu DNA metagenome của vi sinh vật trong ruột mối
Cách tiến hành:
- Rà soát và ưu tiên lựa chọn các các vị trí giống nhau hoặc tương đối giống nhau dựa vào kết quả so sánh các trình tự axit amin bằng ClustalW - PBIL, và kết quả của Prim.cons
- Loại bỏ các trình tự khác nhau quá nhiều
- Trình tự giống nhau hoặc tương đối giống nhau giữa các trình tự có được từ sự so sánh được gọi là probe