TÓM TẮT LUẬN ÁNNhằm mục tiêu đạt được những kiến thức sâu về sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể của vi khuẩn và nấm men, đồng thời để thiết lập được một phương
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Trang 2ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
PHAN THỊ HUYỀN
NGHIÊN CỨU SỰ SẮP XẾP CỦA CÁC DNA OLIGOMER TRÊN NHIỄM SẮC THỂ VI KHUẨN VÀ NẤM MEN
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Mã số chuyên ngành: 62428005
Phản biện độc lập 1: GS.TS Trần Linh Thước
Phản biện độc lập 2: PGS.TS Trần Liên Hà
Phản biện 1: GS.TS Nguyễn Thị Lang
Phản biện 2: PGS.TS Trần Văn Lăng
Phản biện 3: PGS.TS Lê Thị Thủy Tiên
NGƯỜI HƯỚNG DẪN KHOA HỌC
Trang 3LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bất
kỳ một nguồn nào và dưới bất kỳ hình thức nào Việc tham khảo các nguồn tài liệu (nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định
Tác giả luận án
Chữ ký
Phan Thị Huyền
Trang 4TÓM TẮT LUẬN ÁN
Nhằm mục tiêu đạt được những kiến thức sâu về sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể của vi khuẩn và nấm men, đồng thời để thiết lập được một phương pháp phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp độ dưới giống, luận án này đã thực hiện hai nội dung nghiên cứu chính sau:
Nội dung 1: Nghiên cứu sự sắp xếp của các oligomer trong phân tử DNA nhiễm sắc thể của vi khuẩn và nấm men Những tìm hiểu bước đầu về sự sắp xếp của các oligomer trong phân tử DNA nhiễm sắc thể bao gồm việc khảo sát mối quan hệ giữa kích thước oligomer và tính đối xứng của phân tử DNA nhiễm sắc thể, xem xét tính bất đối xứng monomer cục bộ của các đoạn DNA trong nhiễm sắc thể, đồng thời xác định sự có mặt của các oligomer dọc theo chiều dài một sợi đơn của phân tử DNA nhiễm sắc thể Các kết quả cho thấy rằng kích thước oligomer càng lớn thì mức độ đối xứng của phân tử DNA nhiễm sắc thể giảm, và rằng trong khi phân tử DNA nhiễm sắc thể mang tính đối xứng ở mức độ nhiễm sắc thể thì các vùng cục bộ của phân tử DNA nhiễm sắc thể biểu hiện tính bất đối xứng Ở mức độ nhiễm sắc thể, sự phân bố của các oligomer và các oligomer bổ sung đảo ngược (BSĐN) tương ứng của chúng trong các trình tự mang thông tin mã hóa protein đóng góp tương đương với sự phân bố của chúng trong các trình tự không mã hóa protein vào tính đối xứng của phân tử DNA nhiễm sắc thể Trong các trình tự mang thông tin mã hóa protein, các trimer mã hóa codon được phân bố theo qui tắc tương đương về tần suất xuất hiện của chúng trên cơ
sở vị trí của các nucleotide của codon và do đó định dạng sự sử dụng codon, góp phần tạo nên tính đối xứng của phân tử DNA nhiễm sắc thể Các kết quả khám phá sâu hơn cho thấy sự phân bố của các trimer mã hóa codon trong các trình tự sense của phân tử DNA nhiễm sắc thể có một mối quan hệ mật thiết với sự phân bố của chúng trong các trình tự antisense của phân tử Sự phân bố của các trimer mã hóa codon trong các trình
tự sense và antisense dọc theo chiều dài phân tử DNA nhiễm sắc thể vi khuẩn trên cơ
sở mối quan hệ này định hình rất rõ hai replichore Mật độ phân bố của các trimer mã hóa codon trong các trình tự sense và antisense trên hai replichore của các phân tử DNA nhiễm sắc thể vi khuẩn cho thấy các trimer mã hóa codon và các trimer BSĐN tương ứng của chúng trên cơ sở mối quan hệ này được phân bố cân đối trong các trình
Trang 5tự sense và antisense của hai replichore, do đó góp phần tạo nên tính đối xứng của phân tử DNA nhiễm sắc thể Trong các trình tự không mã hóa protein, sự phân bố của các trimer không giống như trong các trình tự mang thông tin mã hóa protein
Nội dung 2: Ứng dụng sự phân bố của các trimer trong bộ gene để phân loại các vi khuẩn có mối quan hệ tiến hóa gần Trên cơ sở tính đặc trưng loài của sự sử dụng codon định dạng bởi sự sắp xếp của các trimer trong các trình tự mang thông tin mã hóa protein ở mức độ nhiễm sắc thể, tính đặc trưng loài của mật độ phân bố của các trimer trong bộ gene được xác định và được ứng dụng để phân loại các vi khuẩn trong
các họ Enterobacteriaceae, Burkholderiaceae và Pseudomonadaceae Kết quả của nội
dung nghiên cứu này cho thấy mật độ phân bố của các trimer trong bộ gene có thể được sử dụng để phân loại các vi khuẩn ở cấp độ dưới giống
Trang 6Aims to get deep knowledge about the distribution of nucleotides in the chromosomes
of bacteria and yeast, and to establish a method for classifying the closely related bacteria below genus level, this thesis has made two main research contents, as follows:
Content 1: Study on the oligomer arrangement in the bacterial and yeast chromosomes Initial study includes the investigation on the relationship between the oligomer size
and the chromosomal strand symmetry, the consideration of the monomer asymmetry
of local sequences in the chromosome, and the determination of the presence of individual oligomers along the length of the single strand of chromosomal DNA molecules The results showed that the larger the oligomer size, the less symmetric the chromosomes were, and that while the whole chromosome was symmetric, the local sequences of the chromosomes were asymmetric At the chromosomal level, the distribution of oligomers and their respective reverse complements in the sequences that carried the information to encode proteins and that in the protein non-coding sequences contributed equivalently to the chromosomal strand symmetry In the sequences carrying information for encoding the proteins, the trimers were distributed according to a rule that exhibited the equivalence in their frequencies on the basis of the position of the nucleotides in a codon and thus shaping the codon usage, contributing to the chromosomal strand symmetry Deeper investigation results showed that the distribution of the codon encoding trimers in the sense sequences of each chromosome had a very close relationship with that in the antisense sequences The distribution of codon encoding trimers in the sense and antisense sequences along the length of the bacterial chromosomes on the basis of this relationship clearly shaped two replichores Densities of codon encoding trimers in the sense and antisense sequences on the replichores of the bacterial chromosome showed that the codon encoding trimers and their respective reverse complements on the basis of this relationship were distributed in the sense and antisense sequences to balance the two replichores, thus contributing to the bacterial chromosomal strand symmetry In the
Trang 7protein non-coding sequences, the distribution of trimers was different in comparison with that in the sequences that carried the information for encoding the proteins
Content 2: Based on the species-specificity of the codon usage shaped by the trimer arrangement in the sequences that carried the information for encoding the proteins at the chromosomal level, the species-specificity of the trimer densities in genomes was determined and was applied in the classification of closely related bacteria belonging
to the Enterobacteriaceae, Burkholderiaceae and Pseudomonadaceae families The
results of this research content showed that the trimer densities in genomes could be used to classify the bacteria below genus level
Trang 8LỜI CÁM ƠN
Lời đầu tiên, tôi xin được bày tỏ lòng biết ơn sâu sắc đến Thầy PGS.TS Nguyễn Đức Lượng đã tận tình hướng dẫn và giúp đỡ, và lời cảm ơn chân thành xin được gửi đến tập thể Bộ Môn Công Nghệ Sinh Học đã tạo điều kiện thuận lợi cho tôi được thực hiện
và hoàn thành luận án
Xin được bày tỏ lòng biết ơn đến Ban Giám Hiệu Trường Đại Học Bách Khoa TPHCM, Phòng Đào Tạo Sau Đại Học, Ban Chủ Nhiệm và Văn Phòng Khoa Kỹ Thuật Hóa Học đã giúp đỡ và tạo điều kiện cho tôi hoàn thành luận án này
Xin cảm ơn các Quí Thầy, Cô trong Hội đồng đánh giá các chuyên đề Tiến sĩ, các Quí Thầy, Cô trong Hội đồng đánh giá luận án ở cấp Bộ Môn, cấp Khoa và cấp Trường đã đóng góp những ý kiến quí báu cho tôi thực hiện và hoàn chỉnh luận án
Xin cảm ơn các Quí Thầy, Cô, anh, chị, em trong Khoa Kỹ Thuật Hóa Học đã động viên và khích lệ, cảm ơn bạn bè đã cổ vũ và động viên tôi những lúc khó khăn trong quá trình thực hiện luận án này
Cuối cùng, con xin cảm ơn Mẹ và gia đình đã luôn sát cánh bên con, cho con động lực
để cố gắng
Nghiên cứu sinh
Phan Thị Huyền
Trang 9MỤC LỤC
DANH MỤC HÌNH x
DANH MỤC BẢNG xiv
DANH MỤC HÌNH PHỤ xv
DANH MỤC BẢNG PHỤ xvii
CÁC TỪ VIẾT TẮT xviii
CHƯƠNG 1 MỞ ĐẦU 1
1.1 LÝ DO CHỌN ĐỀ TÀI 1
1.2 MỤC ĐÍCH NGHIÊN CỨU 2
1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 2
1.4 TÍNH CẤP THIẾT CỦA ĐỀ TÀI NGHIÊN CỨU 3
1.5 Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI NGHIÊN CỨU 4
1.6 Ý NGHĨA THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU 4
1.7 TÍNH MỚI CỦA ĐỀ TÀI NGHIÊN CỨU 4
CHƯƠNG 2 TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU 6
2.1 DNA 6
2.2 DNA OLIGOMER 7
2.3 CẤU TRÚC DNA NHIỄM SẮC THỂ 8
2.3.1 Nhiễm sắc thể tế bào sinh vật prokaryote 8
2.3.2 Nhiễm sắc thể tế bào sinh vật eukaryote 9
2.4 SỰ SAO CHÉP DNA NHIỄM SẮC THỂ 11
2.4.1 Sự sao chép DNA nhiễm sắc thể trong tế bào vi khuẩn 11
2.4.2 Sự sao chép DNA nhiễm sắc thể trong tế bào eukaryote 13
2.5 TÍNH BẤT ĐỐI XỨNG VÀ ĐỐI XỨNG CỦA DNA NHIỄM SẮC THỂ 14
2.5.1 Các định luật của Erwin Chargaff 14
2.5.2 Các phương pháp xác định tính bất đối xứng và đối xứng của DNA 14
2.5.3 Sự tuân thủ của DNA nhiễm sắc thể theo các định luật của Erwin Chargaff 17
2.6 TRÌNH TỰ NUCLEOTIDE TRONG PHÂN TỬ DNA NHIỄM SẮC THỂ VÀ CÁC MỐI LIÊN QUAN 21
Trang 102.6.1 Sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể và vị trí
điểm khởi đầu sao chép 21
2.6.2 Hai mạch sao chép DNA và các bộ máy sao chép 24
2.6.3 Sự thay đổi trình tự nucleotide nhiễm sắc thể bằng phương pháp tái tổ hợp sử dụng trình tự oligonucleotide sợi đơn và hiệu suất tái tổ hợp 25
2.6.4 Sự thay đổi trình tự nucleotide nhiễm sắc thể và các mối liên quan 26
2.6.5 Codon, sự sử dụng codon và mức độ biểu hiện gene 27
2.7 PHÂN LOẠI CÁC VI KHUẨN CÓ MỐI QUAN HỆ TIẾN HÓA GẦN 29
2.7.1 Phân loại nhờ các đặc điểm sinh, lý, hóa 29
2.7.2 Phân loại nhờ các trình tự 16S rDNA 30
2.7.3 Phân loại nhờ các trình tự bộ gene 33
2.7.4 Phân loại nhờ các dấu hiệu bộ gene 35
2.7.5 Phân loại nhờ tín hiệu tuần hoàn nucleotide 37
CHƯƠNG 3 MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU 39
3.1 MỤC TIÊU NGHIÊN CỨU 39
3.1.1 Mục tiêu lý thuyết 39
3.1.2 Mục tiêu ứng dụng 39
3.2 NHIỆM VỤ NGHIÊN CỨU 39
CHƯƠNG 4 NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 40
4.1 NGUYÊN VẬT LIỆU 40
4.2 PHƯƠNG PHÁP NGHIÊN CỨU 40
4.2.1 Xác định nucleotide skew 41
4.2.2 Xác định tần suất xuất hiện của các oligomer trong một trình tự nucleotide sợi đơn 41
4.2.3 Xác định tần suất xuất hiện của các trimer trong các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể theo vị trí các nucleotide của codon 42
4.2.4 Xác định sự sử dụng codon 43
4.2.5 Xác định mối quan hệ tiến hóa giữa các vi khuẩn dựa trên trình tự 16S rDNA 44
4.2.6 Xác định mật độ phân bố của các trimer trong một trình tự DNA sợi đơn
44
Trang 114.2.7 Xác định mối quan hệ tiến hóa giữa các vi khuẩn dựa trên mật độ phân bố
của các trimer trong phân tử DNA nhiễm sắc thể 45
4.2.8 So sánh mức độ bất đối xứng trimer của các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể trên cơ sở tần suất xuất hiện của các trimer mã hóa codon 45
4.2.9 Phương pháp Trimer-walk 48
CHƯƠNG 5 KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN 49
5.1 NGHIÊN CỨU SỰ SẮP XẾP CỦA CÁC OLIGOMER TRONG PHÂN TỬ DNA NHIỄM SẮC THỂ 49
5.1.1 Bước đầu tìm hiểu sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể 49
5.1.2 Nghiên cứu sự sắp xếp của các nucleotide trong các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể 67
5.1.3 Nghiên cứu sâu về sự phân bố của các trimer mã hóa codon trong các trình tự sense và antisense của phân tử DNA nhiễm sắc thể 76
5.1.4 Nghiên cứu sự phân bố của các trimer trong các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể 98
5.2 ỨNG DỤNG SỰ PHÂN BỐ CỦA CÁC TRIMER TRONG BỘ GENE ĐỂ PHÂN LOẠI CÁC VI KHUẨN CÓ MỐI QUAN HỆ TIẾN HÓA GẦN 109
5.2.1 Tính đặc trưng loài của mật độ phân bố của các trimer trong phân tử DNA nhiễm sắc thể 110
5.2.2 Ứng dụng mật độ phân bố của các trimer trong bộ gene để phân loại các vi khuẩn có mối quan hệ tiến hóa gần 111
CHƯƠNG 6 KẾT LUẬN VÀ KIẾN NGHỊ 121
6.1 KẾT LUẬN 121
6.2 KIẾN NGHỊ 121
CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 123
TÀI LIỆU THAM KHẢO 124
PHỤ LỤC 137
Trang 12DANH MỤC HÌNH
Hình 2.1 Thành phần hóa học của DNA 7
Hình 2.2 Các liên kết hydrogen giữa các nucleotide bổ sung trong phân tử DNA .7
Hình 2.3 Ảnh chụp nhiễm sắc thể của tế bào vi khuẩn E coli 9
Hình 2.4 Cấu trúc nhiễm sắc thể của tế bào sinh vật eukaryote 10
Hình 2.5 Bộ máy sao chép DNA của vi khuẩn E coli 12
Hình 2.6 Enzyme replicase của vi khuẩn E coli là một protein dimer bất đối xứng 12
Hình 2.7 Tính bất đối xứng monomer cục bộ của phân tử DNA nhiễm sắc thể của một số vi khuẩn .18
Hình 2.8 DNA-walk trên các đoạn ở hai đầu của 16 phân tử DNA nhiễm sắc thể tế bào nấm men .19
Hình 2.9 Tần suất xuất hiện của các oligomer trên hai sợi bổ sung của phân tử DNA nhiễm sắc thể người số 22 20
Hình 2.10 Các ví dụ minh họa sự phân bố không cân đối của một số oligomer ở hai phía của điểm khởi đầu sao chép của bốn bộ gene vi khuẩn 22
Hình 2.11 Xác định vị trí điểm khởi đầu sao chép nhờ tần suất xuất hiện của các oligomer trong bộ gene của hai vi khuẩn cổ 24
Hình 2.12 Minh họa một cây phát sinh loài .31
Hình 4.1 Minh họa hai sợi DNA bổ sung của một phân tử DNA nhiễm sắc thể .40
Hình 4.2 Cách xác định tần suất xuất hiện của các trimer dọc theo chiều dài một trình tự nucleotide sợi đơn 41
Hình 4.3 Minh họa vị trí của các trimer trong các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể theo vị trí của các nucleotide của codon .43
Hình 5.1 Tần suất xuất hiện của các monomer và oligomer trên hai sợi bổ sung của phân tử DNA nhiễm sắc thể .51
Hình 5.2 Minh họa sự hiện diện của một trimer và trimer BSĐN của nó trong một trình tự nucleotide sợi đơn .52
Hình 5.3 GC skew trong phân tử DNA nhiễm sắc thể B cereus ATCC 10987 .53
Hình 5.4 AT skew trong phân tử DNA nhiễm sắc thể B cereus ATCC 10987 53
Hình 5.5 GC skew trong phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 54
Hình 5.6 AT skew trong phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 54
Hình 5.7 Các đồ thị biểu diễn sự phân bố của 6 cặp dimer/dimer BSĐN dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 56
Hình 5.8 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT, AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 .57
Hình 5.9 Các đồ thị biểu diễn sự phân bố của các cặp AAAA/TTTT, AAAC/GTTT, AAAG/CTTT và AAAT/ATTT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 58
Trang 13Hình 5.10 Các đồ thị biểu diễn sự phân bố của 6 cặp dimer/dimer BSĐN dọc theo
chiều dài sợi Watson của phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 59
Hình 5.11 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT, AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S cerevisiae 60
Hình 5.12 Các đồ thị biểu diễn sự phân bố của các cặp AAAA/TTTT, AAAC/GTTT, AAAG/CTTT và AAAT/ATTT dọc theo chiều dài sợi Watson của phân tử DNA
nhiễm sắc thể số 4 của S cerevisiae 61
Hình 5.13 Tần suất xuất hiện của các dimer trong tất cả các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể 63Hình 5.14 Tần suất xuất hiện của các dimer trong tất cả các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể 63Hình 5.15 Tần suất xuất hiện của các trimer trong tất cả các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể 64Hình 5.16 Tần suất xuất hiện của các trimer trong tất cả các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể 64Hình 5.17 Tần suất xuất hiện của các tetramer trong tất cả các trình tự mang thông tin
mã hóa protein của phân tử DNA nhiễm sắc thể 65Hình 5.18 Tần suất xuất hiện của các tetramer trong tất cả các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể 66Hình 5.19 Tần suất xuất hiện của các cặp trimer mã hóa codon trong tất cả các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể 69Hình 5.20 Tần suất xuất hiện của các trimer theo vị trí của các nucleotide của codon trong tất cả các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể 70Hình 5.21 Tần suất xuất hiện của các trimer theo vị trí của các nucleotide của codon trong tất cả các trình tự sense và trong tất cả các trình tự antisense của phân tử DNA nhiễm sắc thể 72Hình 5.22 So sánh mức độ bất đối xứng của 5601 trình tự sense và antisense trong
phân tử DNA nhiễm sắc thể vi khuẩn B cereus ATCC 10987 78
Hình 5.23 So sánh mức độ bất đối xứng của 726 trình tự sense và antisense trong phân
tử DNA nhiễm sắc thể số 4 của S cerevisiae 79
Hình 5.24 So sánh các dãy giá trị bi(T/T BSĐN) trung bình của các nhóm I và II của các phân tử DNA nhiễm sắc thể của các vi khuẩn khác nhau 85Hình 5.25 So sánh các dãy giá trị bi(T/T BSĐN) trung bình của các nhóm I và II của 16
phân tử DNA nhiễm sắc thể của S cerevisiae 86
Hình 5.26 Sự phân bố của các trimer mã hóa codon trong các nhóm trình tự I và II trong Hình 5.22 87Hình 5.27 Sự phân bố của các trimer mã hóa codon trong các nhóm trình tự I và II trong Hình 5.23 88
Trang 14Hình 5.28 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
sense và antisense của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 .90
Hình 5.29 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
sense và antisense của phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 91
Hình 5.30 Hai replichore của phân tử DNA nhiễm sắc thể vi khuẩn 93Hình 5.31 Mật độ phân bố của các trimer mã hóa codon trong các trình tự sense và
antisense trên hai replichore của phân tử DNA nhiễm sắc thể B cereus ATCC 10987.
95Hình 5.32 Hệ số tương quan Pearson của các dãy giá trị bi(T/T BSĐN) của các trình tự mang thông tin mã hóa protein và không mã hóa protein với dãy giá trị bi(T/T BSĐN) của
tất cả các trình tự mRNA của B cereus ATCC 10987 100
Hình 5.33 Hệ số tương quan Pearson của các dãy giá trị bi(T/T BSĐN) của các trình tự mang thông tin mã hóa protein và không mã hóa protein với dãy giá trị bi(T/T BSĐN) của
tất cả các trình tự mRNA của nhiễm sắc thể số 4 của S cerevisiae 101
Hình 5.34 So sánh các dãy giá trị bi(T/T BSĐN) giữa các trình tự mang thông tin mã hóa
protein và giữa các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể B
cereus ATCC 10987 102
Hình 5.35 So sánh các dãy giá trị bi(T/T BSĐN) giữa các trình tự mang thông tin mã hóa protein và giữa các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể số 4
của S cerevisiae .103
Hình 5.36 Đồ thị biểu diễn sự phân bố của các trimer dọc theo các trình tự không mã
hóa protein của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 104
Hình 5.37 Đồ thị biểu diễn sự phân bố của các trimer BSĐN dọc theo các trình tự
không mã hóa protein của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 .105
Hình 5.38 Đồ thị biểu diễn sự phân bố của các trimer dọc theo các trình tự không mã
hóa protein của phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 106
Hình 5.39 Đồ thị biểu diễn sự phân bố của các trimer BSĐN dọc theo các trình tự
không mã hóa protein của phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 107
Hình 5.40 Mật độ phân bố của các trimer trong các trình tự mang thông tin mã hóa protein và không mã hóa protein của phân tử DNA nhiễm sắc thể 108Hình 5.41 Tần suất xuất hiện của các trimer trong phân tử DNA nhiễm sắc thể của các
vi khuẩn khác nhau 110Hình 5.42 Mật độ phân bố của các trimer trong các phân tử DNA nhiễm sắc thể của các vi khuẩn 111
Hình 5.43 Phân loại Enterobacteria trên cơ sở các trình tự 16S rDNA 114 Hình 5.44 Phân loại Enterobacteria trên cơ sở mật độ phân bố của các trimer trong bộ
gene 115
Hình 5.45 Phân loại Burkholderia trên cơ sở các trình tự 16S rDNA 116 Hình 5.46 Phân loại Burkholderia trên cơ sở mật độ phân bố của các trimer trong bộ
gene 117
Trang 15Hình 5.47 Phân loại Pseudomonas trên cơ sở các trình tự 16S rDNA 118 Hình 5.48 Phân loại Pseudomonas trên cơ sở mật độ phân bố của các trimer trong bộ
gene 119
Trang 16DANH MỤC BẢNG
Bảng 2.1 Sự sử dụng codon ở vi khuẩn và người .28
Bảng 4.1 Minh họa cách sắp các giá trị b(T/T BSĐN) của các cặp T/TBSĐN trong các trình tự sense hoặc antisense Sj của phân tử DNA nhiễm sắc thể 47
Bảng 5.1 Sự sử dụng codon ở B cereus ATCC 10987 74
Bảng 5.2 Sự sử dụng codon ở S cerevisiae 75
Bảng 5.3 Các giá trị bi(T/T BSĐN) trung bình của mỗi nhóm trình tự trong Hình 5.22 82
Bảng 5.4 Các giá trị bi(T/T BSĐN) trung bình của mỗi nhóm trình tự trong Hình 5.23 83
Trang 17
521000 của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 149
Hình phụ 10 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT, AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1000 đến
53000 của phân tử DNA nhiễm sắc thể B cereus ATCC 10987 150
Hình phụ 11 Các đồ thị biểu diễn sự phân bố của các cặp ACC/GGT, ACG/CGT, ACT/AGT và AGA/TCT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S cerevisiae 151
Hình phụ 12 Các đồ thị biểu diễn sự phân bố của các cặp AGC/GCT, AGG/CCT, ATA/TAT và ATC/GAT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S cerevisia 151
Trang 18Hình phụ 13 Các đồ thị biểu diễn sự phân bố của các cặp ATG/CAT, CAA/TTG, CAC/GTG và CAG/CTG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
Hình phụ 19 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT dọc theo chiều dài sợi
Watson của các phân tử DNA nhiễm sắc thể số 5, 6, 7 và 8 của S cerevisiae 156
Hình phụ 20 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT dọc theo chiều dài sợi
Watson của các phân tử DNA nhiễm sắc thể số 9, 10, 11 và 12 của S cerevisiae 157
Hình phụ 21 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT dọc theo chiều dài sợi
Watson của các phân tử DNA nhiễm sắc thể số 13, 14, 15 và 16 của S cerevisiae 157
Hình phụ 22 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT, AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1 đến
150000 của phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 158
Hình phụ 23 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT, AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1 đến
15000 của phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 159
Hình phụ 24 Tần suất xuất hiện của các trimer theo vị trí của các nucleotide của codon
trong tất cả các trình tự sense và antisense của các phân tử DNA nhiễm sắc thể B lata
383 160Hình phụ 25 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể các vi khuẩn .202Hình phụ 26 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
mang thông tin mã hóa protein của các phân tử DNA nhiễm sắc thể S cerevisiae 204
Hình phụ 27 Mật độ phân bố của các trimer mã hóa codon trong các trình tự sense và
antisense trên hai replichore của các phân tử DNA nhiễm sắc thể B lata 383 206
Hình phụ 28 Sự chồng khít lên nhau của các kết quả trong Hình 5.38 và Hình 5.39 208
Trang 19DANH MỤC BẢNG PHỤ
Bảng phụ 1 Số lượng các nucleotide trong phân tử DNA nhiễm sắc thể B cereus
ATCC 10987 137
Bảng phụ 2 16 dimer và dimer BSĐN tương ứng 138
Bảng phụ 3 64 trimer và trimer BSĐN tương ứng 138
Bảng phụ 4 256 tetramer và tetramer BSĐN tương ứng 138
Bảng phụ 5 1024 pentamer và pentamer BSĐN tương ứng 139
Bảng phụ 6 Các điểm khởi đầu sao chép đã được xác minh trong nhiễm sắc thể số 4 của S cerevisiae 155
Bảng phụ 7 4096 hexamer được sắp theo trật tự alphabet 161
Bảng phụ 8 Vị trí của 2790 trình tự sense và antisense (nhóm I) trong phân tử DNA nhiễm sắc thể B cereus ATCC 10987 168
Bảng phụ 9 Vị trí của 2811 trình tự sense và antisense (nhóm II) trong phân tử DNA nhiễm sắc thể B cereus ATCC 10987 178
Bảng phụ 10 Vị trí của 363 trình tự sense và antisense (nhóm I) trong phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 187
Bảng phụ 11 Vị trí của 363 trình tự sense và antisense (nhóm II) trong phân tử DNA nhiễm sắc thể số 4 của S cerevisiae 189
Bảng phụ 12 Kết quả phân nhóm khi so sánh các dãy giá trị bi(T/T BSĐN) của các trình tự sense và antisense trong các nhiễm sắc thể vi khuẩn 190
Bảng phụ 13 Kết quả phân nhóm khi so sánh các dãy giá trị bi(T/T BSĐN) của các trình tự sense và antisense trong các nhiễm sắc thể của S cerevisiae 191
Bảng phụ 14 Thành phần trimer mã hóa codon trong các nhóm a và b của 16 phân tử DNA nhiễm sắc thể của S cerevisiae trong nghiên cứu ở Mục 5.1.3.1 và Mục 5.1.3.2.2 .193
Bảng phụ 15 Các giá trị bi(T/T BSĐN) trung bình của các nhóm I ở Hình 5.24 194
Bảng phụ 16 Các giá trị bi(T/T BSĐN) trung bình của các nhóm II ở Hình 5.24 196
Bảng phụ 17 Các giá trị bi(T/T BSĐN) trung bình của các nhóm I ở Hình 5.25 198
Bảng phụ 18 Các giá trị bi(T/T BSĐN) trung bình của các nhóm II ở Hình 5.25 200
Bảng phụ 19 bi(T/T BSĐN) trung bình của các nhóm (I) và (II) trong Hình 5.35 .207
Trang 20BSĐN Bổ sung đảo ngược
Sợi T Sợi đơn DNA làm khuôn cho quá trình phiên mã
Sợi NT Sợi đơn DNA bổ sung với sợi làm khuôn cho quá trình phiên mã
mRNA RNA thông tin
NCBI National Center for Biotechnology Information
Trang 21CHƯƠNG 1 MỞ ĐẦU
1.1 LÝ DO CHỌN ĐỀ TÀI
Cùng với sự tiến bộ của tin học trong sinh học cũng như của các kỹ thuật thao tác trong sinh học phân tử, các trình tự hoàn chỉnh của bộ gene (genome) đã và đang trở thành nguồn thông tin quí giá hỗ trợ cho việc tìm hiểu cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào sinh vật Các mối liên hệ giữa cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào có thể được xác định thông qua việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene Tuy nhiên, các kỹ thuật cao trong sinh học phân tử chưa đủ để việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene luôn được thành công Các nghiên cứu gần đây của một số nhà khoa học trên thế giới trong việc tìm hiểu, thay đổi và tạo mới các trình tự bộ gene đã tiết lộ sự liên quan của sự sắp xếp của các nucleotide trong bộ gene đến một số các quá trình sinh học xảy
ra trong tế bào [1], [2], [3], [4], [5], [6], [7] Các kết quả nghiên cứu này cho thấy
những quá trình sinh học đó tác động lên sự thành công của các thí nghiệm tìm hiểu, thay đổi và tạo mới các trình tự bộ gene Mặc dù các sinh vật khác nhau có các bộ
gene với các trình tự nucleotide khác nhau, các nghiên cứu vào những năm 2001 [8] và
2002 [9] cho thấy các phân tử DNA nhiễm sắc thể của các bộ gene đều có chung một
đặc điểm, đó là tính đối xứng Không như tính đối xứng trên cơ sở khoảng cách của hai vật thể nào đó thường được đề cập trong hình học, tính đối xứng của phân tử DNA nhiễm sắc thể sinh vật là đặc điểm dựa trên sự phân bố của các nucleotide trong phân
tử DNA nhiễm sắc thể Rõ ràng, các phân tử DNA nhiễm sắc thể tuy không giống nhau về trình tự nucleotide nhưng lại giống nhau về đặc tính đối xứng, có nghĩa là các nucleotide phải được sắp xếp theo một qui tắc nào đó để phân tử DNA nhiễm sắc thể trở nên đối xứng Tuy nhiên, vẫn chưa có một qui tắc nào về sự sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể được công bố cho đến nay
Mặt khác, nhờ sự phát triển vượt trội của kỹ thuật xác định trình tự DNA, số lượng các
vi sinh vật với trình tự bộ gene được xác định hoàn chỉnh tăng lên đáng kể [10] Sự
góp mặt của các trình tự bộ gene hoàn chỉnh của các vi sinh vật đã mở ra một hướng
Trang 22mới cho việc nhận biết các loài, mặc dù hiện nay việc phân loại các vi sinh vật một cách nhanh chóng về cơ bản dựa trên mức độ đồng dạng của các trình tự 16S rDNA –
là các trình tự mang thông tin mã hóa cho thành phần 16S rRNA của bộ máy tổng hợp protein ribosome Tuy nhiên, các trình tự 16S rDNA gần đây được phát hiện là không
đủ đặc trưng để luôn được sử dụng với vai trò này, đặc biệt là trong phân loại các vi sinh vật ở cấp độ dưới giống (genus), khi mà các loài trong cùng một giống hoặc các chủng (strain) trong cùng một loài (species) không giống nhau về khả năng gây bệnh
cho người, thực vật và động vật và do đó cần được phân biệt [11], [12], [13], [14], [15], [16] Các trình tự nucleotide của tổng thể bộ gene có tính đặc trưng loài, nhưng
việc so sánh các trình tự này để xây dựng mối quan hệ tiến hóa của các loài là một vấn
đề không đơn giản Việc đi tìm một công cụ để phân loại các sinh vật nhờ các trình tự nucleotide hoàn chỉnh của các bộ gene đã cho ra đời các phương pháp phân loại mới dựa trên các dấu hiệu bộ gene (genomic signature) – là những dấu hiệu được phát hiện trên cơ sở tần suất xuất hiện của các oligomer trong các trình tự nucleotide nhiễm sắc thể Tuy nhiên, các phương pháp phân loại sinh vật dựa trên các dấu hiệu bộ gene cho đến nay nói chung phức tạp trong phương thức và trong thuật toán sử dụng Chúng chưa được sử dụng một cách chính thống do không thể phân biệt được một số các vi
sinh vật và không đủ đặc trưng để phân biệt một số vi khuẩn ở cấp độ dưới giống [17], [18], [19], [20], [21], [22], [23].
1.2 MỤC ĐÍCH NGHIÊN CỨU
Đề tài nghiên cứu sự sắp xếp của các oligomer trong các phân tử DNA nhiễm sắc thể của các vi sinh vật nhằm hai mục đích sau:
i) Tìm hiểu sâu hơn kiến thức hiện tại về sự phân bố của các nucleotide trong
các phân tử DNA nhiễm sắc thể của vi khuẩn và nấm men
ii) Đưa ra được một phương pháp phân loại các vi khuẩn có mối quan hệ tiến
hóa gần ở cấp độ dưới giống
1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu của đề tài là các trình tự bộ gene đã được xác định hoàn chỉnh
Trang 23Do qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể lần đầu tiên được khởi xướng và nghiên cứu bởi luận án này, phạm vi nghiên cứu của đề tài chỉ được giới hạn cho các trình tự bộ gene hoàn chỉnh của vi khuẩn và nấm men
Saccharomyces cerevisiae.
1.4 TÍNH CẤP THIẾT CỦA ĐỀ TÀI NGHIÊN CỨU
Trong công nghiệp công nghệ sinh học, việc tạo ra được những chủng, loài vi sinh vật với bộ gene cho những sản phẩm mong muốn là thực sự cần thiết Tuy nhiên, sự thành công trong việc tạo ra được những vi sinh vật này hiện tại phụ thuộc quá nhiều vào những hiểu biết của con người về các trình tự bộ gene và những quá trình sinh học liên
quan đến trật tự sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể [1], [2], [3], [4], [5], [6], [7] Như đã đề cập trong Mục 1.1, các trình tự nucleotide hoàn chỉnh
của các phân tử DNA nhiễm sắc thể của các cá thể vi sinh vật khác nhau thì không giống nhau nhưng đều có tính đối xứng Tuy vậy, các nucleotide được sắp xếp như thế nào để các phân tử DNA nhiễm sắc thể trở nên đối xứng thì chưa được biết đến Cho nên, việc xác định được qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể sẽ là cơ sở để định hướng và thực hiện hiệu quả công việc tạo ra những vi sinh vật mong muốn Vì thế, nghiên cứu sự sắp xếp của các oligomer trong các phân tử DNA nhiễm sắc thể vi khuẩn và nấm men là một đề tài quan trọng và có ý nghĩa cấp thiết trong công nghệ gene
Mặt khác, như đã được đề cập ở Mục 1.1, các trình tự 16S rDNA hiện nay đang được
sử dụng một cách rộng rãi để nhận biết nhanh các vi khuẩn, nhưng do tính đặc trưng loài không cao của các trình tự này, một số vi khuẩn, nhất là các loài trong cùng một giống hoặc các chủng trong cùng một loài có các khả năng gây bệnh khác nhau cho
người, động vật và thực vật không thể được phân biệt [13], [14], [15], [16] Khó khăn
này cho đến nay vẫn chưa được giải quyết mặc dù các giải pháp phân biệt các vi khuẩn
này đã được nỗ lực nghiên cứu bởi nhiều nhà khoa học trên thế giới [18], [19], [20], [21], [22] Vì vậy, việc xây dựng được một phương pháp phân loại có khả năng phân
biệt các vi khuẩn như thế thực sự mang tính cấp thiết
Trang 241.5 Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI NGHIÊN CỨU
Đề tài này tìm hiểu qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể vi khuẩn và nấm men, nhằm cung cấp sâu hơn kiến thức hiện tại về sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể tế bào vi sinh vật Đồng thời, đề tài này xây dựng phương pháp phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp
độ dưới giống mà trong đó có một số vi khuẩn không thể được phân loại bởi các phương pháp đã biết
1.6 Ý NGHĨA THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU
Việc khám phá ra qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể
có thể giúp con người can thiệp có định hướng vào việc thay đổi có hiệu quả các trình
tự nucleotide trên nhiễm sắc thể bằng các kỹ thuật biến đổi DNA để phục vụ lợi ích của con người
Việc xây dựng được một phương pháp phân loại các vi khuẩn ở cấp độ dưới giống giải quyết được khó khăn hiện tại trong việc phân biệt các vi khuẩn có mối quan hệ tiến hóa gần, đặc biệt là các loài trong cùng một giống hoặc các chủng trong cùng một loài nhưng khác nhau về khả năng gây bệnh cho người, động vật và thực vật
1.7 TÍNH MỚI CỦA ĐỀ TÀI NGHIÊN CỨU
Nội dung nghiên cứu của đề tài luận án có những tính mới sau đây:
i) Đây là công trình đầu tiên nghiên cứu và xác định được qui tắc sắp xếp của các trimer và trimer bổ sung đảo ngược (BSĐN) trong các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể
ii) Luận án sử dụng khái niệm mới về bất đối xứng trimer để nghiên cứu sự phân
bố của các trimer trong các trình tự DNA của nhiễm sắc thể
iii) Luận án đưa ra khái niệm mật độ phân bố của các trimer trong một trình tự DNA, cũng là một khái niệm mới Với khái niệm này, luận án chứng minh các nucleotide được sắp xếp có qui tắc trong phân tử DNA nhiễm sắc thể vi khuẩn để góp phần tạo nên tính đối xứng của phân tử DNA nhiễm sắc thể
Trang 25cũng như trình bày khả năng ứng dụng các trình tự bộ gene trong phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp độ dưới giống.
Trang 26CHƯƠNG 2 TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU
2.1 DNA
Vào năm 1919, Levene khám phá ra rằng phân tử DNA (deoxyribonucleic acid) là một phân tử chứa các nucleotide Mỗi nucleotide gồm có một nitrogen base và một đường
deoxyribose nối với nhau thông qua nhóm phosphate [24] Các nucleotide này có thể
là adenine (A), thymine (T), cytosine (C) hoặc guanine (G) Chúng khác nhau ở cấu
trúc nitrogen base (Hình 2.1) [25] Năm 1951, Erwin Chargaff phát hiện được rằng
trong DNA, số lượng A xấp xỉ bằng số lượng T cũng như số lượng C xấp xỉ bằng số
lượng G [26] Phát hiện này của Erwin Chargaff đã trở thành tiền đề cho Watson và
Crick xây dựng nên mô hình xoắn kép nucleotide của phân tử DNA vào năm 1953
[27] Theo Watson và Crick, phân tử DNA gồm có hai sợi đơn polynucleotide, mỗi sợi
được cấu tạo từ các nucleotide A, C, G và T Các nucleotide này được nối với nhau thông qua các liên kết phosphodiester, trong đó một nhóm phosphate được nối với hai nhóm đường (deoxyribose) của hai nucleotide Như thế ở một đầu của sợi đơn polynucleotide có nhóm phosphate gắn vào nguyên tử carbon số 5 và đầu kia có nhóm hydroxyl gắn vào nguyên tử carbon số 3 của đường deoxyribose Các đầu này lần lượt được gọi là đầu 5’ và đầu 3’ Hai sợi đơn polynucleotide này kết hợp đối song (tức là các sợi với chiều 5’ → 3’ theo hướng đối nhau) nhờ các liên kết hydrogen giữa các nucleotide bổ sung, tức là giữa A và T, C và G, G và C và T và A, tạo nên phân tử sợi
đôi DNA (Hình 2.2) [28] Vì vậy, một trong hai sợi này vẫn thường được gọi là sợi bổ
sung của sợi còn lại Trong một số trường hợp, hai sợi này còn được gọi là sợi Watson
và sợi Crick [9], [29].
Trang 27Hình 2.1 Thành phần hóa học của DNA Cấu trúc hóa học của chuỗi polynucleotide (a), nucleotide (b) và các nitrogen base (c) được trình bày theo thứ
tự từ trái qua phải Đường pentose không có nhóm hydroxyl ở nguyên tử carbon
số 2 nên được gọi là đường deoxyribose [25]
Hình 2.2 Các liên kết hydrogen giữa các nucleotide bổ sung trong phân tử DNA
2.2 DNA OLIGOMER
Trong các phân tử DNA nhiễm sắc thể với trình tự nucleotide đã được xác định hoàn chỉnh, các nucleotide A, C, G và T được sắp xếp theo qui tắc nào cho đến nay vẫn chưa được biết đến Nếu cho rằng A, C, G và T là những chữ cái thì các từ được tạo
Trang 28thành từ những chữ cái này được gọi là các oligonucleotide, hay còn gọi là các oligomer Monomer là từ được tạo thành từ A, C, G hoặc T Dimer, trimer, tetramer, pentamer, hexamer… là những từ được tạo ra từ 2, 3, 4, 5, 6… chữ cái trong bảng chữ cái chỉ gồm bốn chữ cái A, C, G và T Cũng như các monomer, các oligomer trong phân tử DNA nhiễm sắc thể kết hợp với nhau như thế nào vẫn đang còn là một bí ẩn
2.3 CẤU TRÚC DNA NHIỄM SẮC THỂ
Trong các tế bào sinh vật prokaryote và eukaryote, kích thước của phân tử DNA nhiễm sắc thể có thể từ khoảng vài trăm ngàn cho đến hàng triệu cặp nucleotide bổ sung (base pair, viết tắt là bp) Các nucleotide của phân tử DNA nhiễm sắc thể kết hợp với các protein khác nhau để tạo nên một nhiễm sắc thể hoàn chỉnh Phân tử DNA nhiễm sắc thể có thể có dạng vòng hoặc dạng thẳng Ở dạng thẳng, hai chuỗi polynucleotide đối song của phân tử DNA nhiễm sắc thể có nucleotide ở vị trí đầu tiên và nucleotide ở vị trí cuối cùng tách rời nhau chứ không nối với nhau như ở phân tử DNA nhiễm sắc thể dạng vòng
2.3.1 Nhiễm sắc thể tế bào sinh vật prokaryote
Các tế bào sinh vật prokaryote, gồm vi khuẩn và archaea (vi khuẩn cổ), không có nhân, thường mang các nhiễm sắc thể dạng vòng, trong đó hai sợi đơn polynucleotide
có dạng vòng và kết hợp với nhau thông qua các liên kết hydrogen Trong tế bào chất của tế bào vi khuẩn, DNA nhiễm sắc thể liên kết với các protein giống protein histone của tế bào sinh vật eukaryote (Mục 2.3.2), tạo thành những cấu trúc hạt cơ bản Các hạt này lại tiếp tục liên kết với nhau làm hình thành cấu trúc xoắn ở các cấp độ khác
nhau của cấu trúc nucleoid tùy thuộc vào điều kiện dinh dưỡng bên trong tế bào [30]
Hình 2.3cho thấy hình ảnh của một nhiễm sắc thể vi khuẩn hoàn chỉnh được phân lập
khỏi tế bào và quan sát dưới kính hiển vi [31]
Trang 29Hình 2.3 Ảnh chụp nhiễm sắc thể của tế bào vi khuẩn E coli Nhiễm sắc thể được
tách khỏi tế bào và được chụp dưới kính hiển vi điện tử với độ phóng đại 12000
lần Thanh đo: 500 nm [31].
Hầu hết các bộ gene của các tế bào sinh vật prokaryote đều chỉ gồm một phân tử DNA nhiễm sắc thể dạng vòng Rất ít loài chứa các phân tử DNA nhiễm sắc thể dạng thẳng,
chẳng hạn như loài Agrobacterium tumefaciens có một phân tử DNA nhiễm sắc thể
dạng vòng và một dạng thẳng Một số loài có nhiều hơn một phân tử DNA nhiễm sắc
thể dạng vòng, chẳng hạn như các loài của giống Burkholderia, giống Vibrio Kích
thước của các phân tử DNA nhiễm sắc thể của cùng một bộ gene không giống nhau Cũng như vậy, kích thước của các phân tử DNA nhiễm sắc thể của các loài khác nhau
cũng khác nhau [10]
2.3.2 Nhiễm sắc thể tế bào sinh vật eukaryote
Khác với của các tế bào sinh vật prokaryote, các phân tử DNA nhiễm sắc thể của các
tế bào sinh vật eukaryote có dạng thẳng (Hình 2.4)
Một nghiên cứu về cấu trúc tinh thể của nucleosome trong nhân của tế bào người cho thấy các nucleosome được tạo thành do các đoạn DNA nhiễm sắc thể với chiều dài
146 bp quấn quanh các protein histone H2A, H2B, H3 và H4 [32] Các nucleosome
này được nối với nhau nhờ các đoạn DNA nhiễm sắc thể liên kết với protein histone H1 Các cấu trúc nucleosome lại kết hợp với nhau làm hình thành các sợi xoắn vào
Trang 30nhau và tạo thành các cấp độ cấu trúc khác nhau của chromatin Trong quá trình sinh trưởng, các tế bào của sinh vật phát triển theo chu kỳ Trong mỗi chu kỳ, mỗi tế bào trải qua các giai đoạn chuẩn bị cho quá trình phân chia tế bào nhằm tạo ra tế bào mới, trong đó có giai đoạn sao chép DNA nhiễm sắc thể để tạo thành hai nhiễm sắc thể
“chị-em” giống nhau từ một nhiễm sắc thể ban đầu Vào thời kỳ sau quá trình sao chép DNA nhiễm sắc thể và trước giai đoạn phân chia tế bào, chromatin của hai nhiễm sắc thể “chị-em” ở dạng nén chặt, nối với nhau qua tâm động (centromere) tạo nên hình chữ X (Hình 2.4) Hai nhiễm sắc thể này được phân bố vào hai tế bào mới sau quá trình phân chia tế bào chất, các thành phần chứa trong tế bào chất và màng sinh chất.Tùy theo loài, bộ gene của các sinh vật eukaryote có số lượng phân tử DNA nhiễm sắc thể khác nhau Kích thước của các nhiễm sắc thể trong mỗi bộ gene cũng không giống
nhau [10]
Hình 2.4 Cấu trúc nhiễm sắc thể của tế bào sinh vật eukaryote Hai chromatid là hai nhiễm sắc thể “chị-em” gắn với nhau ở tâm động Nucleosome là cấu trúc được tạo thành do sự tương tác giữa các protein histone và DNA sợi đôi Các hình màu đen-trắng là hình ảnh của DNA nhiễm sắc thể dưới kính hiển điện tử vi
truyền suốt [25]
Trang 312.4 SỰ SAO CHÉP DNA NHIỄM SẮC THỂ
2.4.1 Sự sao chép DNA nhiễm sắc thể trong tế bào vi khuẩn
Ở hầu hết các tế bào vi khuẩn, các phân tử DNA nhiễm sắc thể ở dạng vòng, thường có một điểm khởi đầu sao chép và một điểm kết thúc sao chép, phân chia phân tử DNA
nhiễm sắc thể vi khuẩn thành hai nửa để sao chép gọi là hai replichore [33] Do đó bộ
máy sao chép DNA (DNA replicase) chuyển động theo một hướng nhất định trên phân
tử DNA nhiễm sắc thể và sao chép cùng lúc cả hai sợi polynucleotide của DNA nhưng đảm bảo được sự tổng hợp của DNA xảy ra theo hướng từ 5’ đến 3’ (5’ 3’) (Hình 2.5) Để đạt được điều này, trên mỗi replichore, bộ máy sao chép DNA đã tổng hợp một mạch DNA một cách liên tục (mạch trước, hay còn gọi là leading strand), còn sự tổng hợp mạch DNA kia thì không liên tục (mạch sau, hay còn gọi là lagging strand)
[34] Replicase của vi khuẩn Escherichia coli là enzyme DNA polymerase III (Pol III),
một dimer – được tạo thành từ 10 tiểu đơn vị protein (Hình 2.6) [35], [36], [37], [38] –
gắn vào hai sợi polynucleotide được tách ra và bắt đầu lắp các nucleotide bổ sung với các nucleotide trên các sợi đơn DNA này theo hướng từ 5’ 3’, bằng cách gắn các nucleotide vào đầu 3’OH của mỗi sợi polynucleotide DNA đang được tổng hợp Trong Hình 2.6, các tiểu đơn vị α, ε, θ tạo nên phần chính (core) của Pol III, có chức năng xúc tác phản ứng tổng hợp DNA (α có hoạt tính polymerase; ε có hoạt tính exonuclease theo chiều 3’ 5’; chức năng của θ đến nay chưa được rõ) Tiểu đơn vị β được gọi là “sliding clamp”, làm nhiệm vụ buộc core polymerase vào khuôn DNA Các tiểu đơn vị γ, δ, δ’, χ, ψ tạo thành phức hợp γ (γ complex, hay còn gọi là clamp loader) làm nhiệm vụ chuyển “sliding clamp” lên sợi khuôn DNA Sự kết hợp của β-clamp làm tăng tốc độ sao chép và khả năng sao chép (processivity, tức là số lượng nucleotide được đưa vào mạch đang sao chép trong mỗi lần bám vào khuôn của
polymerase) của Pol III [39].
Các sợi DNA mới luôn được tổng hợp theo hướng 5’ 3’ nên một nửa của Pol III chịu trách nhiệm tổng hợp mạch trước theo chiều hướng vào chẻ ba sao chép, còn nửa kia chịu trách nhiệm tổng hợp mạch sau theo chiều hướng ra xa chẻ ba sao chép (Hình 2.5)
Trang 32Hình 2.5 Bộ máy sao chép DNA của vi khuẩn E coli [34].
Hình 2.6 Enzyme replicase của vi khuẩn E coli là một protein dimer bất đối
xứng Các con số trong ngoặc đơn dưới các ký hiệu τ, β, α, ε, θ, γ, δ, δ’, χ, ψ là
khối lượng (kDa) của các tiểu đơn vị protein tương ứng Các tiểu đơn vị là dimer
có số 2 đứng phía sau các ký hiệu tương ứng “Core” nghĩa là thành phần chính
Trang 332.4.2 Sự sao chép DNA nhiễm sắc thể trong tế bào eukaryote
Các phân tử DNA nhiễm sắc thể dạng thẳng của các tế bào eukaryote có rất nhiều trình
tự khởi đầu sao chép Sự sao chép DNA của các nhiễm sắc thể này cũng được tiến hành theo hai hướng xuất phát từ mỗi trình tự khởi đầu sao chép Phần lớn các trình tự khởi đầu sao chép ở tế bào nấm men đã được nhận biết Người ta đã báo cáo rằng có khoảng 500 vị trí khởi đầu sao chép trên bộ gene với kích thước khoảng 1,4 x 107 bp
của các nấm men sinh sản kiểu nảy chồi hoặc phân đôi [40], [41], [42], [43], [44], [45].
So với ở tế bào vi khuẩn, sự sao chép DNA ở tế bào nấm men phức tạp hơn nhiều, mặc
dù có nhiều điểm giống nhau Các enzyme replicase ở tế bào nấm men gồm có
polymerase α, polymerase δ và polymerase ε [46] Polymerase α mang hoạt tính
primase, có nhiệm vụ tham gia tổng hợp RNA primer cho cả mạch trước và mạch sau, đồng thời kéo dài các RNA primer bằng cách tổng hợp các đoạn ngắn DNA khởi đầu
Theo [46], khi có khoảng 20 nucleotide, polymerase α bị thay thế bởi polymerase ε
trên mạch trước và δ trên mạch sau Các polymerase δ và ε có hoạt tính 3’ → 5’ exonuclease nhưng không có hoạt tính primase Cho đến nay, tương tác giữa DNA và các yếu tố sao chép ở tế bào eukaryote được tìm hiểu khá nhiều và chi tiết bởi nhiều
nghiên cứu khác nhau [47], [48], [49], [50], [51], [52], [53], [54] Mặc dù vậy, vẫn còn
nhiều tranh cãi về vai trò cụ thể của các polymerase δ và ε Một số nghiên cứu cho thấy polymerase ε tham gia trực tiếp vào việc sao chép DNA tại vị trí khởi đầu trong giai đoạn thiết lập chẻ ba sao chép, có liên hệ mật thiết với chẻ ba sao chép trong suốt quá trình chẻ ba sao chép di chuyển, và có vai trò độc lập so với enzyme polymerase δ
[55], [56], [57], [58], [59], [60] Mặt khác, đã có bằng chứng xác thực cho thấy polymerase ε làm nhiệm vụ tổng hợp mạch trước [61], nhưng một nghiên cứu khác lại
cho rằng polymerase δ có thể làm nhiệm vụ sao chép mạch trước trong trường hợp
polymerase ε vì một lý do nào đó mà bị mất chức năng [62] Polymerase ε được chứng minh là cần thiết cho việc sao chép hiệu quả và chính xác DNA [63], [64], tuy rằng
khả năng sao chép của hai enzyme này là tương đương [65] Ở nấm men S cerevisiae,
khả năng sao chép của polymerase δ tăng lên nhờ PCNA [66].
Trang 342.5 TÍNH BẤT ĐỐI XỨNG VÀ ĐỐI XỨNG CỦA DNA NHIỄM SẮC THỂ
2.5.1 Các định luật của Erwin Chargaff
2.5.1.1 Định luật Erwin Chargaff thứ nhất
Từ các thí nghiệm phân tích định lượng thành phần của DNA bằng sắc ký giấy, Erwin Chargaff kết luận rằng trong một sợi đôi DNA, số lượng A luôn luôn xấp xỉ với số
lượng T, còn số lượng C luôn luôn xấp xỉ với số lượng G [26] Đây là định luật
Chargaff thứ nhất Mô hình DNA xoắn kép của Wason-Crick và thực tế cũng đã chứng minh rằng trong một sợi đôi DNA, số lượng A luôn luôn bằng với số lượng T, còn số
lượng C luôn luôn bằng với số lượng G [27].
2.5.1.2 Định luật Erwin Chargaff thứ hai
Sự áp dụng của định luật Chargaff thứ nhất vào sợi đơn DNA được gọi là định luật
Chargaff thứ hai [67], [68], [69] Định luật Chargaff thứ hai đúng nếu trong một sợi
đơn DNA, số lượng A xấp xỉ bằng số lượng T và số lượng C xấp xỉ bằng số lượng G, khi đó sợi DNA được cho là đối xứng Nếu định luật Chargaff thứ hai không đúng, sợi DNA đang xét được cho là bất đối xứng
Đối với oligomer, định luật Chargaff thứ hai đúng nếu số lượng các oligomer trong một sợi đơn DNA xấp xỉ bằng số lượng các oligomer bổ sung đảo ngược (BSĐN) tương ứng của chúng trong sợi đó, tức là sợi DNA đối xứng Trái lại, nếu trong sợi này
mà số lượng các oligomer khác so với số lượng các oligomer BSĐN tương ứng của
chúng thì sợi DNA bất đối xứng [9].
2.5.2 Các phương pháp xác định tính bất đối xứng và đối xứng của DNA
2.5.2.1 Phương pháp tính nucleotide skew
Phương pháp này được sử dụng để xác định mức độ bất đối xứng DNA dựa vào sự
khác nhau về tần suất xuất hiện của các nucleotide [70], [71], [72], [73], [74] Công
thức tính như sau:
AT-skew = (nA-nT)/(nA+nT)
Trang 35Trong đó, nA, nC, nG và nT tương ứng là tần suất xuất hiện của các nucleotide A, C, G
và T trong một trình tự nucleotide sợi đơn Với một trình tự nucleotide mã hóa cho protein, có thể tính mức độ bất đối xứng của nó dựa vào tần suất xuất hiện của các nucleotide này ở các vị trí 1, 2 hay 3 của codon (xem khái niệm về codon ở Mục 2.6.5.1) Chẳng hạn, mức độ bất đối xứng tạo nên bởi các nucleotide G và C ở các vị trí thứ ba của codon sẽ được tính như sau:
G3C3-skew = (nG3-nC3)/(nG3+nC3)Trong đó, nG3 là tần suất xuất hiện của G và nC3 là tần suất xuất hiện của C ở vị trí thứ
ba của codon
Có thể quan sát sự thay đổi về tính bất đối xứng của các đoạn DNA cục bộ của một đoạn DNA dài, bằng cách lập đường cong tích lũy của mức độ bất đối xứng của các đoạn DNA cục bộ thuộc đoạn DNA dài này dọc theo chiều dài của nó Phương pháp tính nucleotide skew đơn giản, được sử dụng nhiều để xác định mức độ bất đối xứng
monomer và vị trí điểm khởi đầu sao chép của DNA nhiễm sắc thể các vi khuẩn [70], [71], [72], [73], [74], nhưng không giúp được nhiều trong việc tìm hiểu trật tự sắp xếp
của các nucleotide trong phân tử DNA nhiễm sắc thể
2.5.2.2 Phương pháp tính oligomer skew
Tương tự như với nucleotide skew, oligomer skew được định nghĩa là độ lệch giữa tần
suất xuất hiện của oligomer và của oligomer BSĐN của nó Lopez và cộng sự [75] đã
tính oligomer skew như sau:
Oligomer skew = (mN – nNt)/(mN + nNt)trong đó, m và n tương ứng là tần suất xuất hiện của oligomer (N) và oligomer BSĐN của nó (Nt) Lopez và cộng sự tìm thấy rằng việc sử dụng tetramer skew để nhận diện điểm khởi đầu sao chép chính xác hơn là sử dụng GC skew
2.5.2.3 Phương pháp DNA-walk
Cũng tương tự như phương pháp tính nucleotide skew, có thể sử dụng phương pháp AT-walk hoặc GC-walk để xác định mức độ bất đối xứng của một đoạn DNA Đồng
Trang 36lập đường cong tích lũy của AT- hoặc GC-walk Với AT-walk, giá trị của nucleotide
A mỗi lần xuất hiện là 1 và T là -1, còn giá trị của các nucleotide C và G là 0; với walk, giá trị của nucleotide G mỗi lần xuất hiện là 1 và nucleotide C là -1, còn giá trị
GC-của các nucleotide A và T là 0 [76] Giống như phương pháp tính nucleotide skew,
việc sử dụng phương pháp này cũng không cho biết nhiều hơn về trật tự sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể
2.5.2.4 Phương pháp Baisnée
Áp dụng định luật Chargaff thứ hai cho các oligomer, Baisnée và cộng sự [9] đã xác
định tần suất xuất hiện của các oligomer trong một trình tự nucleotide sợi đơn và đã tính mức độ bất đối xứng oligomer của sợi DNA này bằng công thức sau:
Trong đó, S1 có giá trị từ 0 (tức là hoàn toàn bất đối xứng) đến 1 (hoàn toàn đối xứng)
và được tính cho các oligomer i có kích thước như nhau, với i = 1, …, 4N, trong đó N
là kích thước của oligomer, tức số lượng nucleotide trong mỗi oligomer f i và f i ’ lần
lượt là tần suất xuất hiện của oligomer i và oligomer BSĐN của oligomer i trong trình
tự nucleotide sợi đơn Theo Baisnée và cộng sự, cũng có thể xác định mức độ đối xứng của trình tự nucleotide sợi đơn bằng hệ số tương quan Pearson (Pearson correlation
coefficient) S C giữa các tần suất xuất hiện của các oligomer i (dãy giá trị X) và các tần suất xuất hiện của các oligomer BSĐN tương ứng của các oligomer i (dãy giá trị Y) trong trình tự, với i = 1, …, 4N và N là kích thước của oligomer:
Trong đó, f i và f i ’ là các giá trị tần suất xuất hiện của các oligomer i trong hai dãy giá trị X và Y tương ứng; và là các giá trị trung bình của các f i và f i ’tương
ứng trong các dãy giá trị X và Y.
Trang 37Hàm số CORREL() có thể được tìm thấy trong Microsoft Excel S C biểu thị mức độ tương đồng giữa hai dãy giá trị biểu diễn tần suất xuất hiện của các oligomer và
oligomer BSĐN tương ứng của chúng trong trình tự DNA sợi đơn Tương tự S1, sợi
DNA được coi là đối xứng khi S C có giá trị xấp xỉ bằng 1
So với phương pháp tính nucleotide skew, phương pháp này ưu việt hơn hẳn vì cho thấy được cả mức độ khác nhau về số lượng giữa các oligomer và các oligomer BSĐN tương ứng của chúng trong một sợi đơn DNA
2.5.3 Sự tuân thủ của DNA nhiễm sắc thể theo các định luật của Erwin Chargaff
2.5.3.1 Tính bất đối xứng
Thành phần nucleotide trong các bộ gene của các sinh vật khác nhau được nghiên cứu mạnh kể từ khi xuất hiện các trình tự bộ gene hoàn chỉnh Tính bất đối xứng monomer được tìm thấy trong các đoạn cục bộ của phân tử DNA nhiễm sắc thể các tế bào vi
khuẩn [70], [71], [72], [73], [74], [77] Trong Hình 2.7, có thể thấy rằng các đoạn DNA ngắn có mức độ bất đối xứng monomer cao hơn các đoạn DNA dài hơn [73]
Ở tế bào nấm men, bằng cách cắt các trình tự ngắn hơn 6 kbp ở hai đầu mút của tất cả
16 phân tử DNA nhiễm sắc thể rồi nối lại với nhau, các trình tự cách xa hai đầu mút của phân tử 12 kbp cũng được cắt ra và nối tương tự, sau đó thực hiện phương pháp
DNA-walk trên các trình tự này, Gierlik và cộng sự [76] cho rằng chỉ có các trình tự ở
hai đầu mút phân tử DNA nhiễm sắc thể mới bất đối xứng, còn các trình tự cách xa hai đầu mút 12 kbp thì không (Hình 2.8)
Tính bất đối xứng monomer cũng được nghiên cứu rộng rãi trên các đối tượng
eukaryote khác [78], [79], [80], [81], [82] Các nghiên cứu này cho thấy tính bất đối
xứng monomer cục bộ có liên quan đến các quá trình sao chép và phiên mã
Trang 38Hình 2.7 Tính bất đối xứng monomer cục bộ của phân tử DNA nhiễm sắc thể của một số vi khuẩn Đường liền nét biểu diễn CG-skew của các đoạn 50 kbp, trong
khi đường đứt nét biểu diễn CG-skew của các đoạn 10 kbp [73] Trục nằm ngang
biểu diễn chiều dài phân tử DNA nhiễm sắc thể (Mb, megabase) Mũi tên chỉ vị trí khởi đầu sao chép
Trang 39Hình 2.8 DNA-walk trên các đoạn ở hai đầu của 16 phân tử DNA nhiễm sắc thể tế bào nấm men (a) Các trình tự ngắn hơn 6 kbp của các đầu mút của phân tử DNA nhiễm sắc thể sau khi đã cắt đi phần telomere (b) Các trình tự ngắn hơn 6 kbp cách các đầu mút của phân tử DNA nhiễm sắc thể 12 kbp Đường màu đen: AT-
walk, đường màu xám: GC-walk [76].
2.5.3.2 Tính đối xứng
Định luật Chargaff thứ nhất luôn luôn đúng cho mọi sợi đôi DNA, bao gồm cả các phân tử DNA nhiễm sắc thể Định luật Chargaff thứ hai cũng đúng cho cả các sợi đơn của phân tử DNA nhiễm sắc thể của các tế bào sinh vật prokaryote và eukaryote, nghĩa
là các nhiễm sắc thể đối xứng [8], [9] Hình 2.9 cho thấy tính đối xứng của phân tử DNA nhiễm sắc thể số 22 của tế bào người [9] Các tác giả của Hình 2.9 lưu ý rằng tần
suất xuất hiện của một oligomer trên sợi Watson theo chiều 5’ 3’ gần như tương đương với tần suất xuất hiện của nó trên sợi Crick theo chiều 5’ 3’
Trang 40Hình 2.9 Tần suất xuất hiện của các oligomer trên hai sợi bổ sung của phân tử DNA nhiễm sắc thể người số 22 Số lượng oligomer với kích thước N là 4N Tần suất xuất hiện của các oligomer được xác định theo cách chồng các oligomer lên nhau với sai khác một nucleotide theo hướng 5’ 3’ [9].
Mặc dù vậy, vì sao các phân tử DNA nhiễm sắc thể đối xứng cho đến nay vẫn chưa được rõ Về mặt cơ chế, có một số nghiên cứu giả thiết rằng đảo đoạn và chuyển vị
đảo ngược bên trong nhiễm sắc thể đã tạo ra tính đối xứng này [83], [84], [85] Trên
thực tế, đảo đoạn in vivo bên trong mỗi replichore của vi khuẩn có thể làm phá vỡ sự
phân bố của nucleoid trong tế bào, ảnh hưởng nghiêm trọng đến các quá trình tiến đến
sự phân bào [5], [86] Tuy nhiên, đảo đoạn xảy ra quanh vùng tiếp giáp của hai
replichore của vi khuẩn với các điểm cuối của đoạn DNA bị đảo có khoảng cách như nhau đối với điểm khởi đầu sao chép lại là một hiện tượng phổ biến trong tự nhiên
[87], [88] Trong khi đó, các nghiên cứu in vivo khác lại tiết lộ rằng tính đối xứng của
các phân tử DNA nhiễm sắc thể vi khuẩn, hay nói một cách tương đương, như đã đề cập ở Mục 1.1, là sự sắp xếp vốn có của các nucleotide trong các phân tử DNA nhiễm sắc thể vi khuẩn, có liên quan đến tốc độ sao chép và sự ổn định của phân tử DNA
nhiễm sắc thể [3], [4], [7] Như vậy, đảo đoạn có thể là cơ chế nhằm duy trì đặc tính
đối xứng vốn có của các phân tử DNA nhiễm sắc thể chứ không phải để tạo ra đặc tính