Kết quả khảo sát cho thấy rằng mật độ phân bố của một trimer bất kỳ, tức số lần xuất hiện trung bình của trimer đó trong 1 kbp, trong nhóm các trình tự sense hoặc antisense trên một rep
Trang 1ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRẦN THỊ HƯƠNG THẢO
NGHIÊN CỨU SỰ PHÂN BỐ CỦA CÁC TRIMER TRONG CÁC TRÌNH TỰ SENSE VÀ ANTISENSE CỦA CÁC
NHIỄM SẮC THỂ VI KHUẨN BURKHOLDERIA LATA
Chuyên ngành: Công nghệ Sinh học
Mã số: 60 42 02 01
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 7 năm 2018
Trang 2Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1 Chủ tịch: PGS.TS Nguyễn Thúy Hương
2 Thư ký: TS Hoàng Mỹ Dung
3 Phản biện 1: PGS.TS Nguyễn Đức Lượng
4 Phản biện 2: TS Trần Trung Hiếu
5 Ủy viên: TS Huỳnh Ngọc Oanh
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)
PGS.TS Nguyễn Thúy Hương GS.TS Phan Thanh Sơn Nam
Trang 3ii
ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Trần Thị Hương Thảo
Ngày, tháng, năm sinh: 09/12/1993
Chuyên ngành: Công nghệ Sinh học
MSHV: 1670262 Nơi sinh: Kiên Giang
Mã số : 60 42 02 01
TÊN ĐỀ TÀI: Nghiên cứu sự phân bố của các trimer trong các trình tự sense và
antisense của các nhiễm sắc thể vi khuẩn Burkholderia lata
NHIỆM VỤ VÀ NỘI DUNG: Khảo sát sự phân bố của các trimer trong các trình tự
sense và antisense của các nhiễm sắc thể khác nhau của vi khuẩn Burkholderia lata
383
NGÀY GIAO NHIỆM VỤ :(Ghi theo trong QĐ giao đề tài) 10/07/2017
NGÀY HOÀN THÀNH NHIỆM VỤ:(Ghi theo trong QĐ giao đề tài) 03/12/2017 CÁN BỘ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): TS Phan Thị Huyền
Trang 4iii
LỜI CẢM ƠN
Để hoàn thành đề tài luận văn thạc sĩ này, em xin được gửi những lời cảm ơn sâu sắc nhất tới:
Cô Phan Thị Huyền, người Cô đáng kính với những chỉ dẫn khoa học quý báu,
đã luôn theo sát và dìu dắt em hoàn thành đề tài luận văn thạc sĩ này
Thầy Phan Thanh Sơn Nam, cô Nguyễn Thúy Hương và các thầy cô Phòng Đào tạo Sau Đại học đã tạo điều kiện vật chất lẫn tinh thần tốt nhất để em hoàn thành luận văn của mình
Em xin cảm ơn tất cả Thầy, Cô trong Khoa Kỹ thuật Hóa học – Công nghệ sinh học đã truyền đạt cho em những kiến thức khoa học trong suốt hai năm em ngồi trên ghế giảng đường
Cảm ơn chị Ngân, anh Minh, chị Hân, chị Vi cùng tất cả anh chị lớp Cao học Khóa 2016 đã luôn quan tâm, giúp đỡ và cho em thật nhiều niềm vui và những kỉ niệm đáng quý trong suốt thời gian chúng ta học tập dưới mái trường Đại học Bách Khoa thành phố Hồ Chí Minh
Cảm ơn An, Đăng, Kha và Nguyên Khoa đã luôn sát cánh bên mình trong bất
cứ hoàn cảnh nào Thật may mắn khi cuộc đời này có các bạn bên cạnh mình
Và trên hết, con cảm ơn Mẹ, anh Hai và gia đình luôn tạo điều kiện tốt nhất để con được học tập, luôn bên cạnh, động viên và cổ vũ con Mọi người mãi là niềm yêu thương vô bờ bến của con
Cầu chúc cho mọi điều tốt đẹp nhất luôn đến với mọi người Hy vọng ở đoạn đường sắp tới, sẽ luôn có mọi người bên cạnh Xin chân thành cảm ơn tất cả!
Trần Thị Hương Thảo
Trang 5iv
TÓM TẮT LUẬN VĂN
Đa số vi khuẩn có một nhiễm sắc thể (NST) là sợi đôi DNA hình vòng tròn khép kín,
có một điểm khởi đầu sao chép và một điểm kết thúc sao chép, tạo thành hai replichore
có chiều dài gần bằng nhau NST vi khuẩn chứa các đoạn trình tự mang thông tin mã hóa protein, rRNA, tRNA và các trình tự không mã hóa Trong sợi đơn của các đoạn trình tự này, thành phần các nucleotide không giống nhau, tức là các đoạn trình tự này không đối xứng Tuy nhiên, trong toàn bộ sợi đơn của NST hoàn chỉnh, số lượng adenine (A) và số lượng thymine (T) là gần như nhau, đồng thời số lượng cytosine (C)
và số lượng guanine (G) cũng gần như nhau, tức là nhiễm sắc thể đối xứng Không những thế, các oligomer kích thước ngắn và các oligomer bổ sung đảo ngược (BSĐN) tương ứng, ví dụ GAT và ATC, cũng có số lượng gần như nhau Các vi khuẩn khác nhau có các NST có kích thước khác nhau và trình tự nucleotide khác nhau, tuy nhiên đều giống nhau ở đặc điểm đối xứng Đặc điểm này có liên quan mật thiết với tốc độ sao chép và sự phân bố của nucleoid trong tế bào, do đó việc can thiệp làm mất đi tính đối xứng của NST làm ảnh hưởng nghiêm trọng đến các quá trình tổng hợp DNA và phân chia tế bào Vì thế, vấn đề các nucleotide phân bố như thế nào trong các NST khác nhau sao cho các NST đều trở nên đối xứng cần được quan tâm tìm hiểu Đề tài này khảo sát sự phân bố của các trimer trong các trình tự protein sense và antisense, tức các trình tự mang thông tin mã hóa protein, của các NST khác nhau của vi khuẩn
Burkholderia lata 383 Kết quả khảo sát cho thấy rằng mật độ phân bố của một trimer
bất kỳ, tức số lần xuất hiện trung bình của trimer đó trong 1 kbp, trong nhóm các trình
tự sense (hoặc antisense) trên một replichore của NST gần bằng mật độ phân bố của trimer BSĐN tương ứng trong nhóm các trình tự antisense (hoặc sense) trên replichore còn lại Mật độ phân bố của các trimer trong các nhóm trình tự sense hoặc antisense trên hai replichore của cả 3 NST của vi khuẩn này là như nhau Tần suất xuất hiện của các khoảng cách giữa các trimer cùng loại liền kề trong các trình tự sense (hoặc antisense) trên một replichore thì tương đồng với tần suất xuất hiện của các khoảng cách giữa các trimer BSĐN tương ứng trong các trình tự antisense (hoặc sense) trên replichore còn lại Mặc dù ba NST khác nhau về kích thước và trình tự, các kiểu phân
bố của trimer/trimer BSĐN này giống nhau ở cả ba NST
Trang 6v
SUMMARY
Most bacteria have only one circular chromosome, which is a double-stranded DNA molecule, possessing an origin and a terminus of replication, forming two replichores which are nearly equal in length The bacterial chromosome contains DNA segments which carry information for encoding proteins, rRNA, tRNA and those that are non-encoding In these local single-stranded chromosomal segments, the nucleotide composition is skewed, i.e these segments are asymmetric Nevertheless, in the whole single-stranded chromosome, the numbers of adenine (A) and thymine (T) are similar,
as are those of cytosines and guanines, i.e the whole chromosome is symmetric Also, short oligomers and their respective reverse complements, such as GAT and ATC, have similar frequencies Different bacteria have their chromosomes of different sizes and different nucleotide sequences, however, they all have the same symmetric property This property has a close relationship with the replication rate and the distribution of nucleoid in the cell, thus interfering to cause this property lost from the chromosome seriously affects the processes of DNA synthesis and cell division Therefore, how the nucleotides asymmetrically distribute in different bacterial chromosomes to make these whole chromosomes symmetric needs to be uncovered This research investigates the distribution of trimers in the protein sense and antisense sequences, i.e sequences that carry information for encoding proteins, of the
Burkholderia lata 383 The investigation results show that densities of trimers, i.e the
average trimer frequencies per 1 kbp, in the sense (or antisense) sequences on the one replichore and those of their respective reverse complements in the antisense (or sense) sequences on the other replichore are almost equal The trimer densities in the sense or antisense sequences on the two replichores of all the three different chromosomes of this bacterium are similar On the distribution of the trimer and their respective reverse complements in the sense and antisense sequences on the replichores of each of the
three B lata chromosomes, we found that the frequencies of distance between the
adjacent trimers in the sense (or antisense) sequences on the one replichore were almost similar to those between the adjacent respective reverse complements in the antisense (or sense) sequences on the other replichore Although the three chromosomes were different in size and nucleotide sequence, these patterns of the
Trang 7vi distribution of the trimer/trimer reverse complement were observed to be similar in all these three chromosomes
Trang 8vii
LỜI CAM ĐOAN
Tôi tên Trần Thị Hương Thảo, học viên cao học ngành Công nghệ Sinh học, Khóa
2016 đợt 1, Khoa Kỹ thuật Hóa học, Trường đại học Bách khoa Thành phố Hồ Chí Minh, xin cam đoan công trình nghiên cứu này do chính tôi thực hiện, số liệu là kết quả nghiên cứu thực sự của tôi dưới sự hướng dẫn khoa học của TS Phan Thị Huyền Tôi xin chịu hoàn toàn trách nhiệm về kết quả nghiên cứu trong luận văn tốt nghiệp của mình
Tp Hồ Chí Minh, ngày 13 tháng 07 năm 2018
Học viên thực hiện
Trần Thị Hương Thảo
Trang 9viii
MỤC LỤC
NHIỆM VỤ LUẬN VĂN THẠC SĨ ii
CÁN BỘ HƯỚNG DẪN ii
CHỦ NHIỆM BỘ MÔN ĐÀO TẠO ii
TRƯỞNG KHOA ii
LỜI CẢM ƠN iii
TÓM TẮT LUẬN VĂN iv
SUMMARY v
DANH MỤC HÌNH x
DANH MỤC BẢNG xi
DANH MỤC HÌNH PHỤ xii
DANH MỤC BẢNG PHỤ xiii
CÁC TỪ VIẾT TẮT xiv
MỞ ĐẦU 15
CHƯƠNG 1 TỔNG QUAN LÝ THUYẾT 17
1.1 NHIỄM SẮC THỂ VI KHUẨN 17
1.2 TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC 18
1.3 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 20
1.4 LUẬN ĐIỂM MỚI CỦA ĐỀ TÀI 20
1.5 MỤC TIÊU NGHIÊN CỨU 21
1.6 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 21
1.6.1.Ý nghĩa khoa học 21
1.6.2.Ý nghĩa thực tiễn 22
CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 23
2.1 VẬT LIỆU 23
2.2 PHƯƠNG PHÁP NGHIÊN CỨU 24
2.2.1.Xác định nucleotide skew 24
2.2.2.Trích xuất các trình tự sense và antisense 24
2.2.3.Xác định số lần xuất hiện của trimer trong trình tự 24
2.2.4.Xác định mật độ phân bố của trimer trong trình tự 24
2.2.5.Khảo sát sự phân bố của các trimer trên các replichore của NST 25
Trang 10ix
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN 26
3.1 Số lượng các trimer trong các trình tự sense và antisense của NST 26
3.2 Vị trí khởi đầu và kết thúc sao chép trong NST 29
3.3. Số lượng trimer trong các nhóm trình tự sense và antisense trên các replichore 31
3.4 Mật độ phân bố trimer trong các nhóm trình tự sense và antisense trên các replichore 33
3.5 Sự phân bố của trimer và trimer BSĐN trong các trình tự sense và antisense trên các replichore 35
CHƯƠNG 4 KẾT LUẬN VÀ KIẾN NGHỊ 42
4.1 KẾT LUẬN 42
4.2 KIẾN NGHỊ 42
TÀI LIỆU THAM KHẢO 43
PHỤ LỤC 45
Trang 11trên mỗi replichore của NST 30
Hình 3.5 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhóm các
trình tự antisense trên mỗi replichore của NST 32
Hình 3.6 Sự phân bố của GCG và CGC trong các trình tự sense và antisense trên các
replichore 35
Trang 12xi
DANH MỤC BẢNG
Bảng 2.1 Kích thước và hàm lượng GC của các NST 21 Bảng 2.2 Số lượng và thành phần nucleotide của các NST 21 Bảng 2.3 Số lượng và thành phần nucleotide của các trình tự sense and antisense trong các NST 21
Bảng 3.1 Các trimer và các trimer BSĐN tương ứng 24
Bảng 3.2 9 vị trí đầu tiên và các khoảng cách tương ứng giữa các GCG trong R1_S
và giữa các CGC trong R2_AS của NST 1 33
Bảng 3.3 Khoảng cách giữa các GCG có (hoặc không có) trong R1_S nhưng không
có (hoặc có) giữa các CGC trong R2_AS của NST 1 36
Bảng 3.4 Hai mươi giá trị tần suất xuất hiện cao nhất của các khoảng cách D giữa các
GCG trong R1_S và giữa các CGC trong R2_AS của NST1 37
Trang 13xii
DANH MỤC HÌNH PHỤ
Hình phụ 1 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm các
trình tự antisense trên các replichore của các NST vi khuẩn giàu hàm lượng AT 34
Hình phụ 2 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm các
trình tự antisense trên các replichore của các NST vi khuẩn có hàm lượng GC trung bình 35
Hình phụ 3 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm các
trình tự antisense trên các replichore của các NST vi khuẩn có hàm lượng GC cao 36
Trang 14Bảng phụ 4 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 1 46
Bảng phụ 5 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 2 47
Bảng phụ 6 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 3 48
Bảng phụ 7 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhóm
các trình tự antisense trên mỗi replichore của NST 1 49
Bảng phụ 8 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhóm
các trình tự antisense trên mỗi replichore của NST 2 50
Bảng phụ 9 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhóm
các trình tự antisense trên mỗi replichore của NST 3 51
Bảng phụ 10 Các NST của các vi khuẩn có các hàm lượng GC khác nhau 52
Trang 15
kbp Kilo base pair
rRNA ribosomal RNA
mRNA RNA thông tin
tRNA RNA vận chuyển
NCBI National Center for Biotechnology Information
Trang 1615
MỞ ĐẦU
Trong công nghệ gene, việc tạo ra được những chủng, loài vi sinh vật với bộ gene cho những sản phẩm trao đổi chất mong muốn là thực sự cần thiết Tuy nhiên, sự thành công trong việc này lại phụ thuộc vào những hiểu biết của con người về các trình tự bộ gene và những quá trình sinh học liên quan đến trật tự sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể Các mối liên hệ giữa cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào có thể được xác định thông qua việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene Tuy nhiên, các kỹ thuật trong sinh học phân tử hiện nay chưa đủ để việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene luôn được thành công Trong những năm gần đây, sự phát triển của tin học trong sinh học đã cung cấp nguồn thông tin quí giá hỗ trợ cho các kỹ thuật trong sinh học phân tử, đặc biệt là việc tìm hiểu cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào sinh vật Các nghiên cứu mới đây đã tiết lộ mối liên hệ giữa sự sắp xếp của các nucleotide trong bộ gene đến các quá trình sinh học xảy ra trong tế bào Mặc dù các sinh vật khác nhau có các bộ gene với các trình tự nucleotide khác nhau nhưng các phân tử DNA nhiễm sắc thể của chúng đều có chung một đặc điểm, đó là tính đối xứng Tuy vậy, các nucleotide được sắp xếp như thế nào để các phân tử DNA nhiễm sắc thể trở nên đối xứng thì chưa được biết đến Do đó, việc xác định được qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể sẽ là cơ sở để định hướng cho việc tạo ra những vi sinh vật mong muốn
Nghiên cứu gần đây trên NST vi khuẩn Bacillus cereus ATCC 10987 cho thấy số
lần xuất hiện của các trimer và của các trimer BSĐN tương ứng trong toàn bộ các trình
tự sense và antisense trong mỗi NST là tương đương nhau Bên cạnh đó, các trimer trong các trình tự sense của một replichore và các trimer BSĐN tương ứng của chúng trong các trình tự antisense của replichore còn lại cũng được tìm thấy là phân bố với mật độ tương đương nhau Tuy nhiên, sự phân bố này có mang tính quy luật ở các vi
khuẩn khác hay không vẫn chưa được làm rõ Tế bào vi khuẩn Burkholderia lata 383
Trang 1716
có ba NST hình vòng tròn khép kín, có trình tự và kích thước hoàn toàn khác nhau
Giống như ở vi khuẩn B cereus ATCC 10987, số lần xuất hiện của các trimer và của
các trimer BSĐN tương ứng trong toàn bộ các trình tự sense và antisense của mỗi NST cũng tương đương nhau Đề tài này khảo sát sự phân bố của các trimer trong các trình
tự sense và antisense của các NST khác nhau của vi khuẩn B lata 383 nhằm tìm hiểu
xem liệu mật độ phân bố của các trimer và các trimer BSĐN tương ứng ở các NST
khác nhau của vi khuẩn này có như nhau hay không, và có giống như ở vi khuẩn B
cereus ATCC hay không Nếu sự phân bố của các trimer trong các trình tự sense và
antisense của các NST vi khuẩn mang tính qui luật, việc tạo thành công các chủng vi khuẩn cho sản phẩm trao đổi chất mong muốn là hoàn toàn có thể nhờ công đoạn thiết
kế bộ gene in silico
Trang 18số 3 của đường deoxyribose Các đầu này lần lượt được gọi là đầu 5’ và đầu 3’ Hai sợi đơn polynucleotide của nhiễm sắc thể kết hợp với nhau nhờ các liên kết hydrogen theo mô hình kết cặp nucleotide của Watson và Crick [1] Mỗi sợi đơn hoàn chỉnh của nhiễm sắc thể chứa các trình tự mang thông tin mã hóa cho protein, các RNA ribosome (rRNA), các RNA vận chuyển (tRNA) và các trình tự không mã hóa
Ở hầu hết các vi khuẩn, phân tử DNA nhiễm sắc thể chỉ có một điểm khởi đầu và một điểm kết thúc sao chép DNA Rất nhiều nghiên cứu trước đây đã sử dụng nucleotide skew để nhận biết vị trí điểm khởi đầu sao chép ở một số nhiễm sắc thể vi khuẩn, nhưng sự phân bố của các oligomer trong phân tử DNA nhiễm sắc thể thì không được công bố nhiều Khi kích thước oligomer càng lớn, nghiên cứu sẽ càng trở nên phức tạp vì số lượng oligomer tăng lên Có lẽ vì thế mà chỉ có sự phân bố của vài oligomer trong phân tử DNA nhiễm sắc thể đã được nghiên cứu mà thôi Như đã biết,
ở mỗi phía của điểm khởi đầu sao chép, hai sợi DNA bổ sung tương ứng được sử dụng làm khuôn để sao chép mạch trước (leading strand) và mạch sau (lagging trand) bởi hai cấu trúc khác nhau của bộ máy sao chép Các nucleotide cũng như một số các oligomer được tìm thấy là phân bố không cân đối ở hai phía của điểm khởi đầu sao chép của các phân tử DNA nhiễm sắc thể
Trang 1918
1.2 TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC
Ở các NST vi khuẩn, các đoạn trình tự cục bộ (tức các đoạn mang thông tin mã hóa cho protein, các rRNA, các tRNA và các trình tự không mã hóa) mang tính bất đối xứng (asymmetric), tức là thành phần các nucleotide trong sợi đơn của các đoạn này không giống nhau [2, 3, 4] Tính bất đối xứng của các đoạn này có liên quan đến quá trình sao chép và phiên mã DNA trong tế bào [5, 6] Mặt khác, các nucleotide trong các đoạn nằm rất xa nhau trong NST có mối liên hệ với nhau [7, 8, 9] Tuy nhiên, trình
tự hoàn chỉnh của NST thì đối xứng (symmetric) [10, 11], tức là số lượng A gần bằng
số lượng T, và số lượng C gần bằng số lượng G; đồng thời, số lượng mỗi oligonucleotide (hay oligomer, tức dimer, trimer, tetramer, …) trong sợi đơn nhiễm sắc thể hoàn chỉnh tính theo chiều 5’ → 3’ và trong sợi bổ sung cũng theo chiều 5’ → 3’ cũng gần bằng nhau Điều này cũng có nghĩa là số lượng mỗi oligomer, ví dụ như ATC, trong một sợi đơn hoàn chỉnh của NST theo chiều 5’ → 3’ gần bằng với số lượng của oligomer bổ sung đảo ngược (BSĐN) tương ứng của nó, chẳng hạn GAT là trimer BSĐN của ATC, trong sợi đơn hoàn chỉnh này theo chiều 5’ → 3’ Tính đối xứng này được cho là do đảo đoạn NST tạo ra [12, 13], làm hình thành nên kiểu phân
bố mang tính phổ biến của các trimer trong các nhiễm sắc thể [14] Tuy nhiên, các trimer được phân bố như thế nào để các NST trở đối xứng thì chưa được biết đến Trên thực tế, sự phân bố của các nucleotide trong nhiễm sắc thể có ý nghĩa rất quan trọng đối với ngành công nghệ biến đổi DNA Phá vỡ sự phân bố tự nhiên của các nucleotide trong NST bằng cách đảo đoạn bên trong mỗi replichore có thể làm phá vỡ
sự phân bố của nucleoid trong tế bào, làm chậm tốc độ phân chia tế bào [15, 16] Tuy nhiên, đảo đoạn xảy ra quanh vùng tiếp giáp của hai replichore của vi khuẩn với các điểm cuối của đoạn DNA bị đảo có khoảng cách như nhau đối với điểm khởi đầu sao chép lại là một hiện tượng phổ biến trong tự nhiên [17, 18] Như vậy, đảo đoạn [12] chỉ có thể là cơ chế nhằm duy trì đặc tính đối xứng vốn có của các phân tử DNA NST
chứ không phải để tạo ra đặc tính này Trong khi đó, các nghiên cứu in vivo khác lại
tiết lộ rằng sự đối xứng của DNA NST qua trục nối điểm khởi đầu và điểm kết thúc sao chép có liên quan đến tốc độ sao chép và sự ổn định của NST [19, 20, 21] Thay
Trang 2019
đổi vị trí điểm khởi đầu sao chép ở vi khuẩn bằng cách đảo đoạn vùng DNA chứa điểm này làm giảm tốc độ sao chép DNA của tế bào [19, 20] Chèn toàn bộ phân tử DNA NST của một vi khuẩn vào một điểm trên NST của một vi khuẩn khác là điều không thể Itaya và cộng sự đã thất bại khi đưa phân tử DNA NST vi khuẩn
Synechocystis sp PCC6803 vào NST vi khuẩn B subtilis bằng cách chèn toàn bộ
DNA NST của Synechocystis vào một điểm trên phân tử DNA NST của Bacillus Thí
nghiệm chỉ thành công khi phân tử DNA NST tạo thành đối xứng qua các điểm khởi
đầu và kết thúc sao chép của phân tử DNA NST vi khuẩn B subtilis [21] Mặt khác,
việc tạo NST vi khuẩn nhân tạo chỉ thành công khi vị trí tương đối của các đoạn nucleotide tổng hợp mã hóa cho các RNA thông tin (mRNA) trong NST nhân tạo được duy trì như trong NST vi khuẩn tự nhiên [22] Tốc độ sao chép và tính ổn định của NST vì thế là những yếu tố cần được duy trì sau khi trình tự DNA NST bị thay đổi
Trên NST vi khuẩn Bacillus cereus ATCC 10987, các trình tự protein sense và
antisense chiếm 83,3% [23] Trình tự sense và antisense là các trình tự nucleotide mang thông tin mã hóa cho các mRNA Trình tự sense có các nucleotide nằm theo thứ
tự y hệt như trong trình tự mRNA, còn trình tự antisense là trình tự bổ sung của trình
tự mRNA Số lần xuất hiện của các trimer và của các trimer BSĐN tương ứng trong toàn bộ các trình tự sense và antisense trong mỗi NST là tương đương nhau [23] Các trimer trong các trình tự sense của một replichore và các trimer BSĐN tương ứng của chúng trong các trình tự antisense của replichore còn lại cũng được tìm thấy là phân bố với mật độ tương đương nhau, với mật độ phân bố của một trimer bất kỳ trong các trình tự sense và antisense được định nghĩa là số lần xuất hiện trung bình của trimer đó trên mỗi kilobase pair các trình tự này [23]
Liệu sự phân bố của các trimer và các trimer BSĐN tương ứng ở vi khuẩn B
cereus có mang tính qui luật, tức cũng được tìm thấy ở các NST vi khuẩn khác? Tế
bào vi khuẩn Burkholderia lata 383 có ba NST hình vòng tròn khép kín, có trình tự và kích thước hoàn toàn khác nhau Giống như ở vi khuẩn B cereus ATCC 10987 [23],
số lần xuất hiện của các trimer và của các trimer BSĐN tương ứng trong toàn bộ các trình tự sense và antisense của mỗi NST cũng tương đương nhau [24] Đề tài này khảo
Trang 2120
sát sự phân bố của các trimer trong các trình tự sense và antisense của các NST khác
nhau của vi khuẩn B lata 383 nhằm tìm hiểu xem liệu mật độ phân bố của các trimer
và các trimer BSĐN tương ứng ở các NST khác nhau của vi khuẩn này có như nhau
hay không, và có giống như ở vi khuẩn B cereus ATCC [23] hay không
1.3 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Theo như trình bày trong Mục 1.2 thì công việc biến đổi DNA cần được định hướng và thiết kế kỹ càng trước khi được thực hiện để đạt hiệu quả biến đổi cao Cũng theo như trình bày trong Mục 1.2, nếu tất cả các NST vi khuẩn đều có chung đặc tính đối xứng [10, 11] và sự phân bố của các nucleotide trong NST có mối quan hệ mật thiết với tốc độ sao chép, sự phân bố nucleoid và tốc độ phân chia tế bào [15, 16, 19, 20] thì các trimer phân bố như thế nào trong các trình tự sense và antisense để góp phần tạo nên tính đối xứng, trong khi các trình tự NST hoàn toàn khác nhau, là một vấn đề đáng được tìm hiểu Tìm ra được qui luật phân bố của các nucleotide trong nhiễm sắc thể nhằm giúp việc thực hiện thay đổi các trình tự DNA trong NST theo hướng điều tiết các quá trình sinh học của tế bào theo ý muốn là điều có ý nghĩa thực tiễn quan trọng
Đề tài này khảo sát sự phân bố của các trimer trong các trình tự sense và
antisense của các NST vi khuẩn B lata 383, nhằm tìm hiểu xem liệu phân bố trimer
trong các trình tự sense và antisense của các NST khác nhau của vi khuẩn này có như
đã tìm thấy ở NST vi khuẩn B cereus ATCC 10987 [23] Nếu sự phân bố của các
trimer trong các trình tự sense và antisense của các NST vi khuẩn mang tính qui luật, việc tạo thành công các chủng vi khuẩn cho sản phẩm trao đổi chất mong muốn là
hoàn toàn có thể nhờ công đoạn thiết kế bộ gene in silico
1.4 LUẬN ĐIỂM MỚI CỦA ĐỀ TÀI
Sự phân bố của các trimer trong các trình tự sense và antisense chỉ mới được
nghiên cứu khá kỹ trên NST vi khuẩn B cereus ATCC 10987 [23] Sự phân bố của các trimer trong các trình tự sense và antisense của các NST B lata chỉ mới được nghiên
Trang 2221
cứu ở bước đầu [24], cho thấy cũng như ở vi khuẩn B cereus, số lần xuất hiện của các
trimer và các trimer BSĐN tương ứng trong toàn bộ các trình tự sense và antisense của mỗi NST là tương đương Đề tài này khảo sát sự phân bố của các trimer trong các trình
tự sense và antisense của các replichore của từng NST của vi khuẩn B lata 383
Kết quả của luận văn này cho kết quả mang tính so sánh về cách phân bố của các nucleotide trong ba NST khác nhau của cùng một vi khuẩn, và cũng để so sánh với sự phân bố của các nucleotide trong NST vi khuẩn đã nghiên cứu [23] Các kết quả này
góp phần cung cấp thông tin cần thiết trong việc chuẩn bị (in silico) cho các nghiên
cứu biến đổi hoặc tạo mới DNA NST
1.5 MỤC TIÊU NGHIÊN CỨU
Luận văn nhằm mục tiêu nghiên cứu sự phân bố của các trimer trong các trình tự
sense và antisense trên các replichore của ba NST khác nhau của vi khuẩn B lata 383
1.6 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI
1.6.1 Ý nghĩa khoa học
Luận văn cung cấp thông tin về cách phân bố của các nucleotide trong NST vi khuẩn trong mối quan hệ với tầm quan trọng của sự phân bố này, bởi vì phá vỡ cách phân bố này bằng cách thay đổi vị trí khởi đầu sao chép làm chậm tốc độ sao chép [19, 20], thay đổi sự sắp xếp tự nhiên của các nucleotide trong NST vi khuẩn làm ảnh hưởng nghiêm trọng đến sự phân bố của các nucleoid vào tế bào mới sau quá trình sao chép và làm chậm sự phân chia của tế bào [15, 16], hay không thể thực hiện chèn một NST vi khuẩn vào một vị trí trên một NST khác [21], hay việc tạo NST vi khuẩn nhân tạo cần các nucleotide tổng hợp có trình tự phải giống như trình tự nucleotide trong NST tự nhiên [22] Những đặc điểm tương đồng trong cách phân bố các trimer trong
ba NST khác nhau của cùng một vi khuẩn góp phần làm sáng tỏ các qui luật phân bố
tự nhiên chưa được biết đến của các nucleotide trong các NST vi khuẩn
Trang 2322
1.6.2 Ý nghĩa thực tiễn
Sự hiểu biết về sự phân bố mang tính qui luật của các nucleotide trong các NST
vi khuẩn sẽ giúp chúng ta can thiệp có định hướng vào việc thay đổi có hiệu quả các trình tự nucleotide trong NST bằng các kỹ thuật biến đổi DNA hoặc tạo ra được các NST vi khuẩn nhân tạo theo ý muốn
Trang 2423
2.1 VẬT LIỆU
Đối tượng nghiên cứu là ba trình tự NST hoàn chỉnh của vi khuẩn B lata 383,
được tải về dưới dạng các tập tin có đuôi fna từ cơ sở dữ liệu NCBI (ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/Burkholderia_383_ui
d58073) Kích thước và hàm lượng GC của các NST vi khuẩn B lata 383 được trình
bày trong Bảng 2.1; số lượng và thành phần các nucleotide của chúng được trình bày trong Bảng 2.2 Số lượng và thành phần nucleotide của các trình tự sense and antisense trong các NST được trình bày trong Bảng 2.3
Bảng 2.1 Kích thước và hàm lượng GC của các NST
NST (RefSeq*)
NST 1 NST 2 NST 3 (NC_007510.1) (NC_007511.1) (NC_007509.1) Kích thước NST (bp) 3694126 3587082 1395069
Hàm lượng GC (%) 66.2 66.7 65.3
(*) RefSeq: số hiệu trình tự NST trên cơ sở dữ liệu NCBI.
Bảng 2.2 Số lượng và thành phần nucleotide của các NST.
Trang 25Sau khi điểm khởi đầu sao chép được xác định, replichore thứ nhất ( R1) sẽ bắt đầu từ điểm khởi đầu cho tới điểm kết thúc sao chép, và replichore thứ hai (R2) sẽ bắt đầu từ điểm kết thúc cho tới điểm khởi đầu sao chép của NST
2.2.2 Trích xuất các trình tự sense và antisense
Các trình tự protein sense và antisense được trích xuất từ các trình tự NST hoàn
chỉnh nhờ chương trình extractseq của gói EMBOSS [26], trên cơ sở các vị trí đã được
xác định của chúng dọc theo chiều dài NST trong các tập tin có đuôi ptt trên cơ sở dữ liệu NCBI nói trên
2.2.3 Xác định số lần xuất hiện của trimer trong trình tự
Số lần xuất hiện của một trimer trong trình tự là số lần trimer đó xuất hiện dọc theo trình tự mà không chồng lên nhau, theo hướng từ 5' đến 3', được xác định thông qua một phần mềm đã sử dụng trong một nghiên cứu trước đây [27]
2.2.4 Xác định mật độ phân bố của trimer trong trình tự
Để xác định mật độ phân bố của một trimer trong trình tự, số lần xuất hiện của trimer đó trước hết được xác định như trên (Mục 2.2.3) Sau đó, các giá trị số lần xuất hiện của 64 trimer được chuyển vào bảng tính Excel Mật độ phân bố của một trimer được tính theo công thức sau:
Mật độ phân bố = x × 1000 / L Trong đó x là số lần xuất hiện của mỗi trimer, và L (tính bằng bp) là tổng chiều dài của tất cả các trình tự được sử dụng để xác định số lần xuất hiện của trimer Mật độ phân bố trimer trong trình tự là một bộ gồm 64 giá trị cho 64 trimer
Trang 2625
2.2.5 Khảo sát sự phân bố của các trimer trên các replichore của NST
Các trình tự sense (hoặc antisense) trên mỗi replichore được nối lại với nhau, theo thứ tự vị trí của chúng trong NST, thành một trình tự mới Vị trí của một trimer (và trimer BSĐN tương ứng) bất kỳ dọc theo trình tự mới được xác định bằng phần mềm viết theo ngôn ngữ Python, theo chiều 5’ 3’, sao cho vị trí của nucleotide thứ
ba của trimer trong trình tự là vị trí của trimer Chẳng hạn, trong trình tự ATGAACAGACGGTTCGTTTCGATCGCGTTGATCGCCGCCGGCGGGTGTTTCGCCAGCGCGAACGCTCGCGCGGAC , vị trí của trimer GCG (gạch dưới) là 27,
60, 72, v.v… (xem thêm Bảng 3.2) Khoảng cách liền kề (D) giữa các trimer (hoặc giữa các trimer BSĐN) trong trình tự mới được xác định bằng bp Số lượng các D có giá trị như nhau được gọi là tần suất xuất hiện của D trong trình tự mới Để quan sát được sự phân bố của trimer (và trimer BSĐN tương ứng) trong các trình tự sense (và antisense) trên hai replichore của NST, đồ thị biểu diễn sự phụ thuộc của tần suất xuất hiện của D vào các giá trị logarith tương ứng của D được xây dựng Hệ số quan hệ Pearson giữa hai dãy giá trị tần suất xuất hiện của cùng các khoảng cách D được xác định bằng hàm CORREL trong Microsoft Excel
Trang 2726
3.1 Số lượng các trimer trong các trình tự sense và antisense của NST
Có tất cả 64 trimer được liệt kê trong Bảng 3.1 Mỗi trimer đều có một trimer BSĐN tương ứng
Bảng 3.1 Các trimer và các trimer BSĐN tương ứng
Trimer
Trimer
BSĐN Trimer
Trimer BSĐN Trimer
Trimer BSĐN Trimer
Trimer BSĐN AAA TTT CAG CTG GAG CTC GGT ACC AAG CTT CCA TGG GAT ATC GTA TAC ACA TGT CCG CGG GCA TGC GTG CAC ACG CGT CCT AGG GCG CGC GTT AAC AGT ACT CGA TCG GCT AGC TAT ATA ATG CAT CTA TAG GGA TCC TCA TGA ATT AAT GAA TTC GGC GCC TCT AGA CAA TTG GAC GTC GGG CCC TTA TAA
Theo [24], mặc dù khác nhau về kích thước và trình tự nucleotide, trong tất cả các trình tự sense và antisense của mỗi NST, mỗi trimer đều xuất hiện với số lần tương đương với số lần xuất hiện của trimer BSĐN tương ứng Để xác minh điều này, chúng tôi kiểm tra lại bằng cách trích xuất tất cả các trình tự protein sense và antisense từ mỗi
trình tự NST hoàn chỉnh, sử dụng chương trình extractseq của gói EMBOSS [26] Sau
đó, đối với từng NST, chúng tôi tiến hành xác định số lần xuất hiện của các trimer trong tất cả các trình tự sense và antisense vừa trích xuất được Đúng như đã trình bày trong [24], mỗi trimer đều có số lượng gần bằng với số lượng các trimer BSĐN tương ứng Kết quả được trình bày trong Hình 3.1
Trang 2827
Chúng tôi tiến hành tách các trình tự sense khỏi các trình tự antisense trong mỗi NST Trong các nhóm trình tự sense hoặc antisense này, chúng tôi xác định lại số lần xuất hiện của các trimer Chúng tôi tìm thấy rằng số lần xuất hiện của mỗi trimer trong nhóm các trình tự sense gần bằng với số lần xuất hiện của trimer BSĐN tương ứng
Hình 3.1 Số lượng trimer trong tổng số các trình tự sense và antisense của NST (A)
NST 1, (B) NST 2 và (C) NST 3 Các cột màu đỏ và màu xanh lá cây thể hiện số lượng mỗi trimer (Trimer) và số lượng trimer BSĐN (Trimer BSĐN) của nó S+AS là toàn bộ các trình tự sense (S) và antisense (AS) của mỗi NST
Trang 2928
trong nhóm các trình tự antisense Đồng thời, số lần xuất hiện của mỗi trimer trong nhóm các trình tự antisense lại gần bằng với số lần xuất hiện của trimer BSĐN tương ứng trong nhóm các trình tự sense (Hình 3.2) Số liệu cho Hình 3.1 và Hình 3.2 được trình bày ở Bảng phụ 1, Bảng phụ 2 và Bảng phụ 3 (phần Phụ lục)
Hình 3.2 Số lượng trimer trong nhóm các trình tự sense và trong nhóm các trình tự antisense của NST (A) NST 1, (B) NST 2 và (C) NST 3 Các đường liền nét và đứt nét
tương ứng thể hiện số lượng các trimer và các trimer BSĐN tương ứng; S và AS tương ứng là nhóm các trình tự sense và và nhóm các trình tự antisense