óm tắt: Đề tài này khảo sát sự phân bố của các trimer trong các trình tự protein sense và antisense, tức các trình tự mang thông tin mã hóa protein, của các NST khác nhau của vi khuẩn Burkholderia lata 383. Kết quả khảo sát cho thấy rằng mật độ phân bố của một trimer bất kỳ, tức số lần xuất hiện trung bình của trimer đó trong 1 kbp, trong nhóm các trình tự sense (hoặc antisense) trên một replichore của NST gần bằng mật độ phân bố của trimer BSĐN tương ứng trong nhóm các trình tự antisense (hoặc sense) trên replichore còn lại. Mật độ phân bố của các trimer trong các nhóm trình tự sense hoặc antisense trên hai replichore của cả 3 NST của vi khuẩn này là như nhau. Tần suất xuất hiện của các khoảng cách giữa các trimer cùng loại liền kề trong các trình tự sense (hoặc antisense) trên một replichore thì tương đồng với tần suất xuất hiện của các khoảng cách giữa các trimer BSĐN tương ứng trong các trình tự antisense (hoặc sense) trên replichore còn lại. Mặc dù ba NST khác nhau về kích thước và trình tự, các kiểu phân bố của trimertrimer BSĐN này giống nhau ở cả ba NST
Trang 1ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRẦN THỊ HƯƠNG THẢO
NGHIÊN CỨU SỰ PHÂN BỐ CỦA CÁC TRIMER TRONG CÁC TRÌNH TỰ SENSE VÀ ANTISENSE CỦA CÁC
NHIỄM SẮC THỂ VI KHUẨN BURKHOLDERIA LATA
Chuyên ngành: Công nghệ Sinh học
Mã số: 60 42 02 01
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 7 năm 2018
Trang 2CÔNGTRÌNHĐƯỢCHOÀNTHÀNHTẠI
Cán bộ hướng dẫn khoa học: TS Phan Thị Huyền (Ghi rõ họ, tên, học hàm,
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1 Chủ tịch: PGS.TS Nguyễn Thúy Hương
2 Thư ký: TS Hoàng Mỹ Dung
3 Phản biện 1: PGS.TS Nguyễn Đức Lượng
4 Phản biện 2: TS Trần Trung Hiếu
5 ủy viên: TS Huỳnh Ngọc Oanh
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)
Trang 3ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Trần Thị Hương Thảo
Ngày, tháng, năm sinh: 09/12/1993
Chuyên ngành: Công nghệ Sinh học
MSHV: 1670262 Nơi sinh: Kiên Giang
Mã số: 60 42 02 01
TÊN ĐỀ TÀI: Nghiên cứu sự phân bố của các trimer trong các trình tự sense và
antisense của các nhiễm sắc thể vi khuẩn Burkholderia lata
NHIỆM VỤ VÀ NỘI DUNG: Khảo sát sự phân bố của các trimer trong các trình tự sense
và antisense của các nhiễm sắc thể khác nhau của vi khuẩn Burkholderia lata 383
NGÀY GIAO NHIỆM VỤ :(Ghi theo trong QĐ giao đề tài) 10/07/2017
NGÀY HOÀN THÀNH NHIỆM VỤ:(Ghi theo trong QĐ giao đề tài) 03/12/2017 CÁN
Bộ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): TS Phan Thị Huyền
GS.TS Phan Thanh Sơn Nam
Trang 4Em xin cảm ơn tất cả Thầy, Cô trong Khoa Kỹ thuật Hóa học - Công nghệ sinh học
đã truyền đạt cho em những kiến thức khoa học trong suốt hai nãm em ngoi trên ghế giảng đường
Cảm ơn chị Ngân, anh Minh, chị Hân, chị Vi cùng tất cả anh chị lớp Cao học Khóa
2016 đã luôn quan tâm, giúp đỡ và cho em thật nhiều niềm vui và những kỉ niệm đáng quỷ trong suốt thời gian chúng ta học tập dưới mái trường Đại học Bách Khoa thành phổ Hồ Chỉ Minh
Cảm ơn An, Đãng, Kha và Nguyên Khoa đã luôn sát cánh bên mình trong bất cứ hoàn cảnh nào Thật may man khi cuộc đời này có các bạn bên cạnh mình
Và trên hết, con cảm ơn Mẹ, anh Hai và gia đình luôn tạo điều kiện tốt nhất đế con được học tập, luôn bên cạnh, động viên và cố vũ con Mọi người mãi là niềm yêu thương
vô bờ bến của con
Cầu chúc cho mọi điều tốt đẹp nhất luôn đến với mọi người Hy vọng ở đoạn đường sap tới, sẽ luôn có mọi người bên cạnh Xin chân thành cảm ơn tất cả!
Trần Thị Hương Thảo
Trang 5TÓM TẮT LUẬN VĂN
Đa số vi khuẩn có một nhiễm sắc thể (NST) là sợi đôi DNA hình vòng tròn khép kín, có một điểm khởi đầu sao chép và một điểm kết thúc sao chép, tạo thành hai replichore có chiều dài gần bằng nhau NST vi khuẩn chứa các đoạn trình tự mang thông tin mã hóa protein, rRNA, tRNA và các trình tự không mã hóa Trong sợi đơn của các đoạn trình tự này, thành phần các nucleotide không giống nhau, tức là các đoạn trình tự này không đối xứng Tuy nhiên, trong toàn bộ sợi đơn của NST hoàn chỉnh, số luợng adenine (A) và số luợng thymine (T) là gần nhu nhau, đồng thời số luợng cytosine (C) và số luợng guanine (G) cũng gần nhu nhau, tức là nhiễm sắc thể đối xứng Không những thế, các oligomer kích thuớc ngắn và các oligomer bổ sung đảo nguợc (BSĐN) tuơng ứng, ví dụ GAT và ATC, cũng có số luợng gần nhu nhau Các vi khuẩn khác nhau có các NST có kích thuớc khác nhau và trình tự nucleotide khác nhau, tuy nhiên đều giống nhau ở đặc điểm đối xứng Đặc điểm này có liên quan mật thiết với tốc độ sao chép và sự phân bố của nucleoid trong
tế bào, do đó việc can thiệp làm mất đi tính đối xứng của NST làm ảnh huởng nghiêm trọng đến các quá trình tổng hợp DNA và phân chia tế bào Vĩ thế, vấn đề các nucleotide phân bố nhu thế nào trong các NST khác nhau sao cho các NST đều trở nên đối xứng cần đuợc quan tâm tim hiểu Đe tài này khảo sát sự phân bố của các trimer trong các trình tự protein sense và antisense, tức các trình tự mang thông tin mã hóa protein, của các NST
khác nhau của vi khuẩn Burkholderia lata 383 Ket quả khảo sát cho thấy rằng mật độ
phân bố của một trimer bất kỳ, tức số lần xuất hiện trung bĩnh của trimer đó trong 1 kbp, trong nhóm các trình tự sense (hoặc antisense) trên một replichore của NST gần bằng mật
độ phân bố của trimer BSĐN tuơng ứng trong nhóm các trình tự antisense (hoặc sense) trên replichore còn lại Mật độ phân bố của các trimer trong các nhóm trĩnh tự sense hoặc antisense trên hai replichore của cả 3 NST của vi khuấn này là nhu nhau Tần suất xuất hiện của các khoảng cách giữa các trimer cùng loại liền kề trong các trĩnh tự sense (hoặc antisense) trên một replichore thì tuơng đồng với tần suất xuất hiện của các khoảng cách giữa các trimer BSĐN tuơng ứng trong các trình tự antisense (hoặc sense) trên replichore còn lại Mặc dù ba NST khác nhau về kích thuớc và trình tự, các kiểu phân bố của trimer/trimer BSĐN này giống nhau ở cả ba NST
IV
Trang 6SUMMARY
Most bacteria have only one circular chromosome, which is a double-stranded DNA molecule, possessing an origin and a terminus of replication, forming two replichores which are nearly equal in length The bacterial chromosome contains DNA segments which carry information for encoding proteins, rRNA, tRNA and those that are non-encoding In these local single-stranded chromosomal segments, the nucleotide composition is skewed, i.e these segments are asymmetric Nevertheless, in the whole single-stranded chromosome, the numbers of adenine (A) and thymine (T) are similar, as are those of cytosines and guanines, i.e the whole chromosome is symmetric Also, short oligomers and their respective reverse complements, such as GAT and ATC, have similar frequencies Different bacteria have their chromosomes of different sizes and different nucleotide sequences, however, they all have the same symmetric property This property has a close relationship with the replication rate and the distribution of nucleoid in the cell, thus interfering to cause this property lost from the chromosome seriously affects the processes of DNA synthesis and cell division Therefore, how the nucleotides asymmetrically distribute in different bacterial chromosomes to make these whole chromosomes symmetric needs to be uncovered This research investigates the distribution
of trimers in the protein sense and antisense sequences, i.e sequences that carry
information for encoding proteins, of the Burkholderia lata 383 The investigation results
show that densities of trimers, i.e the average trimer frequencies per 1 kbp, in the sense (or antisense) sequences on the one replichore and those of their respective reverse complements in the antisense (or sense) sequences on the other replichore are almost equal The trimer densities in the sense or antisense sequences on the two replichores of all the three different chromosomes of this bacterium are similar On the distribution of the trimer and their respective reverse complements in the sense and antisense sequences on the
replichores of each of the three B lata chromosomes, we found that the frequencies of
distance between the adjacent trimers in the sense (or antisense) sequences on the one replichore were almost similar to those between the adjacent respective reverse complements in the antisense (or sense) sequences on the other replichore Although the three chromosomes were different in size and nucleotide sequence, these patterns of the
Trang 7distribution of the trimer/trimer reverse complement were observed to be similar in all these three chromosomes
VI
Trang 8LỜI CAM ĐOAN
Tôi tên Trần Thị Hương Thảo, học viên cao học ngành Công nghệ Sinh học, Khóa 2016 đợt 1, Khoa Kỹ thuật Hóa học, Trường đại học Bách khoa Thành phố Hồ Chí Minh, xin cam đoan công trình nghiên cứu này do chính tôi thực hiện, số liệu là kết quả nghiên cứu thực sự của tôi dưới sự hướng dẫn khoa học của TS Phan Thị Huyền
Tôi xin chịu hoàn toàn trách nhiệm về kết quả nghiên cứu trong luận văn tốt nghiệp của mình
Tp Hồ Chỉ Minh, ngày 13 tháng 07 năm 2018
Học viên thực hiện
Trần Thị Hương Thảo
Trang 9MỤC LỤC
NHIỆM VỤ LUẬN VĂN THẠC sĩ ii
CÁN Bộ HƯỚNG DẪN ii
CHỦ NHIỆM Bộ MÔN ĐÀO TẠO ii
TRƯỞNG KHOA ii
LỜI CẢM ON iii
TÓM TẮT LUẬN VĂN iv
SUMMARY V DANH MỤC HÌNH X DANH MỤC BẢNG xi
DANH MỤC HÌNH PHỤ xii
DANH MỤC BẢNG PHỤ xiii
CÁC TỪ VIẾT TẮT xiv
MỞ ĐẦU 15
CHƯONG 1 TÔNG QUAN LÝ THUYẾT 17
1.1 NHIỄM SẮC THÊ VI KHUẨN 17
1.2 TÌNH HÌNH NGHIÊN cứu TRONG VÀ NGOÀI NƯỚC 18
1.3 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 20
1.4 LUẬN DIÊM MỚI CỦA ĐỀ TÀI 20
1.5 MỤC TIÊU NGHIÊN CỨU 21
1.6 Ý NGHĨA KHOA HỌC VÀ THựC TIỄN CỦA ĐỀ TÀI 21
1.6.1 Ý nghĩa khoa học 21
1.6.2 Ý nghĩa thực tiễn 22
CHƯONG 2 VẬT LIỆU VÀ PHƯONG PHÁP NGHIÊN cứu 23
2.1 VẬT LIỆU 23
2.2 PHƯONG PHÁP NGHIÊN cứu 24
2.2.1 Xác định nucleotide skew 24
2.2.2 Trích xuất các trình tự sense và antisense 24
2.2.3 Xác định số lần xuất hiện của trimer trong trình tự 24
2.2.4 Xác định mật độ phân bố của trimer trong trình tự 24
2.2.5 Khảo sát sự phân bố của các trimer trên các replichore của NST 25
viii
Trang 10CHƯƠNG 3 KẾT QUẢ NGHIÊN cứu VÀ BÀN LUẬN 26
3.1 Số lượng các trimer trong các trình tự sense và antisense của NST 26
3.2 Vị trí khởi đầu và kết thúc sao chép trong NST 29
3.3 Số lượng trimer trong các nhóm trình tự sense và antisense trên các replichore .7. ! 31
3.4 Mật độ phân bố trimer trong các nhóm trình tự sense và antisense trên các replichore 33
3.5 Sự phân bố của trimer và trimer BSĐN trong các trình tự sense và antisense trên các replichore
CHƯƠNG 4 KẾT LUẬN VÀ KIẾN NGHỊ 4.1 KẾT LUẬN
4.2 KIẾN NGHỊ
TÀI LIỆU THAM KHẢO
PHỤ LỤC
35
42
42
42
42
45
Trang 11trên mỗi replichore của NST 30
Hình 3.5 Mật độ phân bố của trimer trong nhóm các trình tự sense và trong nhóm các
trình tự antisense trên mỗi replichore của NST 32
Hình 3.6 Sự phân bố của GCG và CGC trong các trình tự sense và antisense trên các
replichore 35
X
Trang 12DANH MỤC BẢNG
Bảng 2.1 Kích thước và hàm lượng GC của các NST 21 Bảng 2.2 Số lượng và thành phần nucleotide của các NST 21 Bảng 2.3 Số lượng và thành phần nucleotide của các trình tự sense and antisense
trong các NST 21
Bảng 3.1 Các trimer và các trimer BSĐN tương ứng 24 Bảng 3.2 9 vị trí đầu tiên và các khoảng cách tương ứng giữa các GCG trong Rl_s
và giữa các CGC trong R2_AS của NST 1 33
Bảng 3.3 Khoảng cách giữa các GCG có (hoặc không có) trong Rl_s nhưng không
có (hoặc có) giữa các CGC trong R2_AS của NST 1 36
Bảng 3.4 Hai mươi giá trị tần suất xuất hiện cao nhất của các khoảng cách D giữa các
GCG trong Rl_s và giữa các CGC trong R2_AS của NST1 37
Trang 13DANH MỤC HÌNH PHỤ
Hình phụ 1 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm các
trình tự antisense trên các replichore của các NST vi khuẩn giàu hàm luợng AT 34
Hình phụ 2 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm các trình
tự antisense trên các replichore của các NST vi khuẩn có hàm luợng GC trung
bình 35
Hình phụ 3 Mật độ phân bố các trimer trong nhóm các trình tự sense và nhóm các trình
tự antisense trên các replichore của các NST vi khuẩn có hàm luợng GC cao 36
xii
Trang 14Bảng phụ 4 số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 1 46
Bảng phụ 5 số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 2 47
Bảng phụ 6 số lượng trimer trong nhóm các trình tự sense và trong nhóm các
antisense trên mỗi replichore của NST 3 48
Bảng phụ 7 Mật độ phân bố của trimer trong nhóm các trĩnh tự sense và trong nhóm
các trình tự antisense trên mỗi replichore của NST 1 49
Bảng phụ 8 Mật độ phân bố của trimer trong nhóm các trĩnh tự sense và trong nhóm
các trình tự antisense trên mỗi replichore của NST 2 50
Bảng phụ 9 Mật độ phân bố của trimer trong nhóm các trĩnh tự sense và trong nhóm
các trình tự antisense trên mỗi replichore của NST 3 51
Bảng phụ 10 Các NST của các vi khuẩn có các hàm lượng GC khác nhau 52
Trang 16MỞ ĐẦU
Trong công nghệ gene, việc tạo ra được những chủng, loài vi sinh vật với bộ gene cho những sản phẩm trao đổi chất mong muốn là thực sự cần thiết Tuy nhiên, sự thành công trong việc này lại phụ thuộc vào những hiểu biết của con người về các trình tự bộ gene và những quá trình sinh học liên quan đến trật tự sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể Các mối liên hệ giữa cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào có thể được xác định thông qua việc thay đổi hoặc xóa bỏ các trình
tự nucleotide trong bộ gene Tuy nhiên, các kỹ thuật trong sinh học phân tử hiện nay chưa
đủ để việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene luôn được thành công Trong những năm gần đây, sự phát triển của tin học trong sinh học đã cung cấp nguồn thông tin quí giá hỗ trợ cho các kỹ thuật trong sinh học phân tử, đặc biệt là việc tim hiểu cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào sinh vật Các nghiên cứu mới đây đã tiết lộ mối liên hệ giữa sự sắp xếp của các nucleotide trong bộ gene đến các quá trình sinh học xảy ra trong tế bào Mặc dù các sinh vật khác nhau có các bộ gene với các trình tự nucleotide khác nhau nhưng các phân tử DNA nhiễm sắc thể của chúng đều có chung một đặc điểm, đó là tính đối xứng Tuy vậy, các nucleotide được sắp xếp như thế nào để các phân tử DNA nhiễm sắc thể trở nên đối xứng thi chưa được biết đến
Do đó, việc xác định được qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thế sẽ là cơ sở đế định hướng cho việc tạo ra những vi sinh vật mong muốn
Nghiên cứu gần đây trên NST vi khuẩn Bacillus cereus ATCC 10987 cho thấy số
lần xuất hiện của các trimer và của các trimer BSĐN tương ứng trong toàn bộ các trĩnh tự sense và antisense trong mỗi NST là tương đương nhau Bên cạnh đó, các trimer trong các trĩnh tự sense của một replichore và các trimer BSĐN tương ứng của chúng trong các trĩnh
tự antisense của replichore còn lại cũng được tìm thấy là phân bố với mật độ tương đương nhau Tuy nhiên, sự phân bố này có mang tính quy luật ở các vi khuẩn khác hay không
vẫn chưa được làm rõ Te bào vi khuẩn Burkholderia lata 383
15
Trang 17có ba NST hình vòng tròn khép kín, có trình tự và kích thước hoàn toàn khác nhau Giống
như ở vi khuẩn B cereus ATCC 10987, số lần xuất hiện của các trimer và của các trimer
BSĐN tương ứng trong toàn bộ các trình tự sense và antisense của mỗi NST cũng tương đương nhau Đe tài này khảo sát sự phân bố của các trimer trong các trình tự sense và
antisense của các NST khác nhau của vi khuẩn B ỉata 383 nhằm tìm hiểu xem liệu mật độ
phân bố của các trimer và các trimer BSĐN tương ứng ở các NST khác nhau của vi khuẩn
này có như nhau hay không, và có giống như ở vi khuẩn B cereus ATCC hay không Neu
sự phân bố của các trimer trong các trình tự sense và antisense của các NST vi khuẩn mang tính qui luật, việc tạo thành công các chủng vi khuẩn cho sản phẩm trao đổi chất mong
muốn là hoàn toàn có thể nhờ công đoạn thiết kế bộ gene in siỉico
16
Trang 18CHƯƠNG 1 TỔNG QUAN LÝ THUYẾT
1.1 NHIỄM SẮC THỂ VI KHUẨN
Nhiễm sắc thể (NST) tế bào vi khuẩn đa số là một sợi đôi DNA có hình vòng tròn, hình thành từ hai sợi đcm DNA khép kín Mỗi sợi đon DNA là một polynucleotide đuợc cấu tạo bởi các mắt xích nucleotide adenine (A), cytosine (C), thymine (T) và guanine (G) Các nucleotide này đuợc nối với nhau thông qua các liên kết phosphodiester, trong đó một nhóm phosphate đuợc nối với hai nhóm đuờng (deoxyribose) của hai nucleotide Ở một đầu của polynucleotide có nhóm phosphate gắn vào nguyên tử carbon số 5 và đầu kia có nhóm hydroxyl gắn vào nguyên tử carbon số 3 của đuờng deoxyribose Các đầu này lần luợt đuợc gọi là đầu 5’ và đầu 3’ Hai sợi đơn polynucleotide của nhiễm sắc thể kết hợp với nhau nhờ các liên kết hydrogen theo mô hình kết cặp nucleotide của Watson và Crick [1], Mỗi sợi đơn hoàn chỉnh của nhiễm sắc thể chứa các trình tự mang thông tin mã hóa cho protein, các RNA ribosome (rRNA), các RNA vận chuyển (tRNA) và các trình tự không mã hóa
Ở hầu hết các vi khuẩn, phân tử DNA nhiễm sắc thể chỉ có một điểm khởi đầu và một điểm kết thúc sao chép DNA Rất nhiều nghiên cứu truớc đây đã sử dụng nucleotide skew để nhận biết vị trí điểm khởi đầu sao chép ở một số nhiễm sắc thể vi khuẩn, nhung
sự phân bố của các oligomer trong phân tử DNA nhiễm sắc thể thi không đuợc công bố nhiều Khi kích thuớc oligomer càng lớn, nghiên cứu sẽ càng trở nên phức tạp vĩ số luợng oligomer tăng lên Có lẽ vĩ thế mà chỉ có sụ phân bố của vài oligomer trong phân tử DNA nhiễm sắc thế đã đuợc nghiên cứu mà thôi Nhu đã biết, ở mỗi phía của điểm khởi đầu sao chép, hai sợi DNA bổ sung tuơng ứng đuợc sử dụng làm khuôn đế sao chép mạch truớc (leading strand) và mạch sau (lagging trand) bởi hai cấu trúc khác nhau của bộ máy sao chép Các nucleotide cũng nhu một số các oligomer đuợc tìm thấy là phân bố không cân đối ở hai phía của điếm khởi đầu sao chép của các phân tử DNA nhiễm sắc thế
17
Trang 191.2 TÌNH HÌNH NGHIÊN cứu TRONG VÀ NGOÀI NƯỚC
Ở các NST vi khuẩn, các đoạn trình tự cục bộ (tức các đoạn mang thông tin mã hóa cho protein, các rRNA, các tRNA và các trình tự không mã hóa) mang tính bất đối xứng (asymmetric), tức là thành phần các nucleotide trong sợi đơn của các đoạn này không giống nhau [2, 3, 4] Tính bất đối xứng của các đoạn này có liên quan đến quá trình sao chép và phiên mã DNA trong tế bào [5, 6] Mặt khác, các nucleotide trong các đoạn nằm rất xa nhau trong NST có mối liên hệ với nhau [7, 8, 9] Tuy nhiên, trình tự hoàn chỉnh của NST thi đối xứng (symmetric) [10, 11], tức là số luợng A gần bằng số luợng T, và số
luợng c gần bằng số luợng G; đồng thời, số luợng mỗi oligonucleotide (hay oligomer, tức
dimer, trimer, tetramer, ) trong sợi đơn nhiễm sắc thể hoàn chỉnh tính theo chiều 5’ —> 3’ và trong sợi bổ sung cũng theo chiều 5’ —> 3 ’ cũng gần bằng nhau Điều này cũng có nghĩa là số luợng mỗi oligomer, ví dụ nhu ATC, trong một sợi đơn hoàn chỉnh của NST theo chiều 5’ —> 3’ gần bằng với số luợng của oligomer bổ sung đảo nguợc (BSĐN) tuơng ứng của nó, chẳng hạn GAT là trimer BSĐN của ATC, trong sợi đơn hoàn chỉnh này theo chiều 5’ —> 3’ Tính đối xứng này đuợc cho là do đảo đoạn NST tạo ra [12, 13], làm hĩnh thành nên kiểu phân bố mang tính phổ biến của các trimer trong các nhiễm sắc thể [14] Tuy nhiên, các trimer đuợc phân bố nhu thế nào để các NST trở đối xứng thi chua đuợc biết đến Trên thực tế, sự phân bố của các nucleotide trong nhiễm sắc thể có ý nghĩa rất quan trọng đối với ngành công nghệ biến đổi DNA Phá vỡ sự phân bố tự nhiên của các nucleotide trong NST bằng cách đảo đoạn bên trong mỗi replichore có thế làm phá vỡ
sụ phân bố của nucleoid trong tế bào, làm chậm tốc độ phân chia tế bào [15, 16] Tuy nhiên, đảo đoạn xảy ra quanh vùng tiếp giáp của hai replichore của vi khuẩn với các điếm cuối của đoạn DNA bị đảo có khoảng cách nhu nhau đối với điếm khởi đầu sao chép lại
là một hiện tuợng phố biến trong tụ nhiên [17, 18] Nhu vậy, đảo đoạn [12] chỉ có thế là
cơ chế nhằm duy trì đặc tính đối xứng vốn có của các phân tử DNA NST chứ không phải
đế tạo ra đặc tính này Trong khi đó, các nghiên cứu in vivo khác lại tiết lộ rằng sụ đối
xứng của DNA NST qua trục nối điểm khởi đầu và điểm kết thúc sao chép có liên quan đến tốc độ sao chép và sụ ổn định của NST [19, 20, 21] Thay
18
Trang 20đổi vị trí điểm khởi đầu sao chép ở vi khuẩn bằng cách đảo đoạn vùng DNA chứa điểm này làm giảm tốc độ sao chép DNA của tế bào [19, 20] Chèn toàn bộ phân tử DNA NST của một vi khuẩn vào một điểm trên NST của một vi khuẩn khác là điều không thể Itaya
và cộng sự đã thất bại khi đua phân tử DNA NST vi khuẩn Synechocystis sp PCC6803 vào NST vi khuẩn B subtỉlỉs bằng cách chèn toàn bộ DNA NST của Synechocystis vào một điểm trên phân tử DNA NST của Bacillus Thí nghiệm chỉ thành công khi phân tử
DNA NST tạo thành đối xứng qua các điểm khởi đầu và kết thúc sao chép của phân tử
DNA NST vi khuẩn B subtilis [21] Mặt khác, việc tạo NST vi khuẩn nhân tạo chỉ thành
công khi vị trí tuơng đối của các đoạn nucleotide tổng hợp mã hóa cho các RNA thông tin (mRNA) trong NST nhân tạo đuợc duy trĩ nhu trong NST vi khuẩn tự nhiên [22] Tốc độ sao chép và tính ổn định của NST vĩ thế là những yếu tố cần đuợc duy trĩ sau khi trình tự DNA NST bị thay đổi
Trên NST vi khuẩn Bacillus cereus ATCC 10987, các trình tự protein sense và
antisense chiếm 83,3% [23] Trình tự sense và antisense là các trình tự nucleotide mang thông tin mã hóa cho các mRNA Trình tự sense có các nucleotide nằm theo thứ tự y hệt nhu trong trình tự mRNA, còn trình tự antisense là trình tự bổ sung của trình tự mRNA
Số lần xuất hiện của các trimer và của các trimer BSĐN tuơng ứng trong toàn bộ các trình
tự sense và antisense trong mỗi NST là tuơng đuơng nhau [23] Các trimer trong các trình
tự sense của một replichore và các trimer BSĐN tuơng ứng của chúng trong các trình tự antisense của replichore còn lại cũng đuợc tim thấy là phân bố với mật độ tuơng đuơng nhau, với mật độ phân bố của một trimer bất kỳ trong các trình tụ sense và antisense đuợc định nghĩa là số lần xuất hiện trung bĩnh của trimer đó trên mỗi kilobase pair các trình tụ này [23]
Liệu sụ phân bố của các trimer và các trimer BSĐN tuơng ứng ở vi khuẩn B cereus
có mang tính qui luật, tức cũng đuợc tìm thấy ở các NST vi khuẩn khác? Te bào vi khuẩn
Burkholderia lata 383 có ba NST hình vòng tròn khép kín, có trình tụ và kích thuớc hoàn toàn khác nhau Giống nhu ở vi khuẩn B cereus ATCC 10987 [23], số lần xuất hiện của
các trimer và của các trimer BSĐN tuơng ứng trong toàn bộ các trình tụ sense và antisense của mỗi NST cũng tuơng đuơng nhau [24], Đe tài này khảo
19
Trang 21sát sự phân bố của các trimer trong các trình tự sense và antisense của các NST khác nhau
của vi khuẩn B ỉata 383 nhằm tìm hiểu xem liệu mật độ phân bố của các trimer và các
trimer BSĐN tưcmg ứng ở các NST khác nhau của vi khuẩn này có nhu nhau hay không,
và có giống nhu ở vi khuẩn B cereus ATCC [23] hay không
1.3 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Theo nhu trình bày trong Mục 1.2 thi công việc biến đổi DNA cần đuợc định huớng
và thiết kế kỹ càng truớc khi đuợc thực hiện để đạt hiệu quả biến đổi cao Cũng theo nhu trình bày trong Mục 1.2, nếu tất cả các NST vi khuẩn đều có chung đặc tính đối xứng [10, 11] và sự phân bố của các nucleotide trong NST có mối quan hệ mật thiết với tốc độ sao chép, sự phân bố nucleoid và tốc độ phân chia tế bào [15, 16, 19, 20] thi các trimer phân
bố nhu thế nào trong các trình tự sense và antisense để góp phần tạo nên tính đối xứng, trong khi các trình tự NST hoàn toàn khác nhau, là một vấn đề đáng đuợc tim hiểu Tim
ra đuợc qui luật phân bố của các nucleotide trong nhiễm sắc thể nhằm giúp việc thực hiện thay đổi các trình tự DNA trong NST theo huớng điều tiết các quá trình sinh học của tế bào theo ý muốn là điều có ý nghĩa thực tiễn quan trọng
Đe tài này khảo sát sự phân bố của các trimer trong các trình tự sense và antisense
của các NST vi khuẩn B ỉata 383, nhằm tim hiểu xem liệu phân bố trimer trong các trình
tự sense và antisense của các NST khác nhau của vi khuẩn này có nhu đã tìm thấy ở NST
vi khuẩn B cereus ATCC 10987 [23] Nếu sụ phân bố của các trimer trong các trình tụ
sense và antisense của các NST vi khuẩn mang tính qui luật, việc tạo thành công các chủng
vi khuẩn cho sản phấm trao đối chất mong muốn là hoàn toàn có thế nhờ công đoạn thiết
kế bộ gene in silico
1.4 LUẬN ĐIÉM MỚI CỦA ĐÈ TÀI
Sụ phân bố của các trimer trong các trình tụ sense và antisense chỉ mới đuợc nghiên
cứu khá kỹ trên NST vi khuẩn B cereus ATCC 10987 [23] Sụ phân bố của các trimer trong các trình tụ sense và antisense của các NST B lata chỉ mới đuợc nghiên
20
Trang 22cứu ở bước đầu [24], cho thấy cũng như ở vi khuẩn B cereus, số lần xuất hiện của các
trimer và các trimer BSĐN tưcmg ứng trong toàn bộ các trình tự sense và antisense của mỗi NST là tương đương Đe tài này khảo sát sự phân bố của các trimer trong các trình tự
sense và antisense của các replichore của từng NST của vi khuẩn B lata 383
Ket quả của luận văn này cho kết quả mang tính so sánh về cách phân bố của các nucleotide trong ba NST khác nhau của cùng một vi khuẩn, và cũng để so sánh với sự phân bố của các nucleotide trong NST vi khuẩn đã nghiên cứu [23] Các kết quả này góp
phần cung cấp thông tin cần thiết trong việc chuẩn bị (in sỉlỉco) cho các nghiên cứu biến
đổi hoặc tạo mới DNA NST
1.5 MỤC TIÊU NGHIÊN CỨU
Luận văn nhằm mục tiêu nghiên cứu sự phân bố của các trimer trong các trình tự
sense và antisense trên các replichore của ba NST khác nhau của vi khuẩn B lata 383
1.6 Ý NGHĨA KHOA HỌC VÀ THựC TIỄN CỦA ĐỀ TÀI
1.6.1 Ý nghĩa khoa học
Luận văn cung cấp thông tin về cách phân bố của các nucleotide trong NST vi khuẩn trong mối quan hệ vói tầm quan trọng của sự phân bố này, bởi vì phá vỡ cách phân bố này bằng cách thay đổi vị trí khởi đầu sao chép làm chậm tốc độ sao chép [19, 20], thay đổi sự sắp xếp tự nhiên của các nucleotide trong NST vi khuẩn làm ảnh hưởng nghiêm trọng đến
sự phân bố của các nucleoid vào tế bào mới sau quá trình sao chép và làm chậm sự phân chia của tế bào [15, 16], hay không thể thực hiện chèn một NST vi khuẩn vào một vị trí trên một NST khác [21], hay việc tạo NST vi khuẩn nhân tạo cần các nucleotide tổng hợp
có trình tự phải giống như trĩnh tự nucleotide trong NST tự nhiên [22], Những đặc điểm tương đồng trong cách phân bố các trimer trong ba NST khác nhau của cùng một vi khuẩn góp phần làm sáng tỏ các qui luật phân bố tự nhiên chưa được biết đến của các nucleotide trong các NST vi khuẩn
21
Trang 231.6.2 Ý nghĩa thực tiễn
Sự hiểu biết về sự phân bố mang tính qui luật của các nucleotide trong các NST vi khuẩn sẽ giúp chúng ta can thiệp có định hướng vào việc thay đổi có hiệu quả các trình tự nucleotide trong NST bằng các kỹ thuật biến đổi DNA hoặc tạo ra được các NST vi khuẩn nhân tạo theo ý muốn
22
Trang 24CHƯƠNG 2 VẶT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN cứu
2.1 VẬT LIỆU
Đối tượng nghiên cứu là ba trình tự NST hoàn chỉnh của vi khuẩn B lata 383,
được tải về dưới dạng các tập tin có đuôi fna từ cơ sở dữ liệu NCBI
d58073) Kích thước và hàm lượng GC của các NST vi khuẩn B lata 383 được trình bày
trong Bảng 2.1; số lượng và thành phần các nucleotide của chúng được trình bày trong Bảng 2.2 số lượng và thành phần nucleotide của các trình tự sense and antisense trong các NST được trình bày trong Bảng 2.3
Bảng 2.1 Kích thước và hàm lượng GC của các NST
1395069 65.3
Bảng 2.2 Số lượng và thành phần nucleotide của các NST
Nucleotide Số lượng Thành
phần(%)
Số lượng
Thành phần(%) Số lượng
Thành phần (%)
Trang 252.2 PHƯƠNG PHÁP NGHIÊN CỨU
2.2.1 Xác định nucleotide skew
Điểm khởi đầu và kết thúc sao chép trong mỗi NST được định vị bằng cách xác
định mức độ khác nhau về tần suất xuất hiện của G và c trong từng đoạn cục bộ dọc theo
trình tự DNA NST, bằng cách sử dụng phương pháp đã được xây dựng trước đây [25]
Sau khi điểm khởi đầu sao chép được xác định, replichore thứ nhất ( Rl) sẽ bắt đầu
từ điểm khởi đầu cho tới điểm kết thúc sao chép, và replichore thứ hai (R2) sẽ bắt đầu từ điểm kết thúc cho tới điểm khởi đầu sao chép của NST
2.2.2 Trích xuất các trình tự sense và antisense
Các trình tự protein sense và antisense được trích xuất từ các trình tự NST hoàn
chỉnh nhờ chương trình extractseq của gói EMBOSS [26], trên cơ sở các vị trí đã được
xác định của chúng dọc theo chiều dài NST trong các tập tin có đuôi ptt trên cơ sở dữ liệu NCBI nói trên
2.2.3 Xác định số lần xuất hiện của trimer trong trình tự
Số lần xuất hiện của một trimer trong trình tự là số lần trimer đó xuất hiện dọc theo trình tự mà không chồng lên nhau, theo hướng từ 5' đến 3', được xác định thông qua một phần mềm đã sử dụng trong một nghiên cứu trước đây [27]
2.2.4 Xác định mật độ phân bố của trimer trong trình tự
Đe xác định mật độ phân bố của một trimer trong trình tự, số lần xuất hiện của trimer
đó trước hết được xác định như trên (Mục 2.2.3) Sau đó, các giá trị số lần xuất hiện của
64 trimer được chuyến vào bảng tính Excel Mật độ phân bố của một trimer được tính theo công thức sau:
Mật độ phân bố = X X 1000 / L Trong đó X là số lần xuất hiện của mỗi trimer, và L (tính bằng bp) là tống chiều dài của tất cả các trình tự được sử dụng để xác định số lần xuất hiện của trimer Mật độ phân
bố trimer trong trình tự là một bộ gồm 64 giá trị cho 64 trimer
24
Trang 262.2.5 Khảo sát sự phân bố của các trimer trên các replichore của NST
Các trình tự sense (hoặc antisense) trên mỗi replichore được nối lại với nhau, theo thứ tự vị trí của chúng trong NST, thành một trình tự mới Vị trí của một trimer (và trimer BSĐN tương ứng) bất kỳ dọc theo trình tự mới được xác định bằng phần mềm viết theo ngôn ngữ Python, theo chiều 5’ —> 3’, sao cho vị trí của nucleotide thứ ba của trimer trong trình tự là vị trí của trimer Chẳng hạn, trong trình tự ATGAACAGACGGTTCGTTTCGATCGCGTTGATCGCCGCCGGCGGGTGTTTC GCCAGCGCGAACGCTCGCGCGGAC vị trí của trimer GCG (gạch dưới) là 27, 60,
72, v.v (xem thêm Bảng 3.2) Khoảng cách liền kề (D) giữa các trimer (hoặc giữa các trimer BSĐN) trong trình tự mới được xác định bằng bp số lượng các D có giá trị như nhau được gọi là tần suất xuất hiện của D trong trình tự mới Đe quan sát được sự phân bố của trimer (và trimer BSĐN tương ứng) trong các trình tự sense (và antisense) trên hai replichore của NST, đồ thị biểu diễn sự phụ thuộc của tần suất xuất hiện của D vào các giá trị logarith tương ứng của D được xây dựng Hệ số quan hệ Pearson giữa hai dãy giá trị tần suất xuất hiện của cùng các khoảng cách D được xác định bằng hàm CORREL trong Microsoft Excel
25
Trang 27CHƯƠNG 3 KẾT QUẢ NGHIÊN cứu VÀ BÀN LUẬN
3.1 Số lượng các trimer trong các trình tự sense và antisense của NST
Có tất cả 64 trimer được liệt kê trong Bảng 3.1 Mỗi trimer đều có một trimer BSĐN tưong ứng
Bảng 3.1 Các trimer và các trimer BSĐN tương ứng
Theo [24], mặc dù khác nhau về kích thước và trình tự nucleotide, trong tất cả các trình tự sense và antisense của mỗi NST, mỗi trimer đều xuất hiện với số lần tương đương với số lần xuất hiện của trimer BSĐN tương ứng Đe xác minh điều này, chúng tôi kiểm tra lại bằng cách trích xuất tất cả các trình tự protein sense và antisense từ mỗi trình tự
NST hoàn chỉnh, sử dụng chương trình extractseq của gói EMBOSS [26] Sau đó, đối với
từng NST, chúng tôi tiến hành xác định số lần xuất hiện của các trimer trong tất cả các trĩnh tự sense và antisense vừa trích xuất được Đúng như đã trĩnh bày trong [24], mỗi trimer đều có số lượng gần bằng với số lượng các trimer BSĐN tương ứng Ket quả được trĩnh bày trong Hĩnh 3.1
26
Trang 28NST 1, (B) NST 2 và (C) NST 3 Các cột màu đỏ và màu xanh lá cây thể hiện số lượng mỗi trimer (Trimer) và số lượng trimer BSĐN (Trimer BSĐN) của nó S+AS là toàn bộ các trình tự sense (S) và antisense (AS) của mỗi NST
Chúng tôi tiến hành tách các trình tự sense khỏi các trình tự antisense trong mỗi NST Trong các nhóm trình tự sense hoặc antisense này, chúng tôi xác định lại số lần xuất hiện của các trimer Chúng tôi tìm thấy rằng số lần xuất hiện của mỗi trimer trong nhóm các trình tự sense gần bằng với số lần xuất hiện của trimer BSĐN tuông ứng
27
Trang 29trong nhóm các trình tự antisense Đồng thời, số lần xuất hiện của mỗi trimer trong nhóm các trình tự antisense lại gần bằng với số lần xuất hiện của trimer BSĐN tuơng ứng trong nhóm các trình tự sense (Hĩnh 3.2) số liệu cho Hĩnh 3.1 và Hình 3.2 đuợc trình bày ở Bảng phụ 1, Bảng phụ 2 và Bảng phụ 3 (phần Phụ lục)
28