Phương pháp dò tìm promoter và exon đầu 5' Việc dò tìm đầu 5´ là một trong những thách thức lớn nhất trong việc dò tìm gene do rất khó xác định chính xác promoter và điểm khởi sự phiên
Trang 1Phương pháp dò tìm promoter và
exon đầu 5'
Việc dò tìm đầu 5´ là một trong những thách thức lớn nhất trong việc dò tìm gene do rất khó xác định chính xác promoter và điểm khởi sự phiên mã (transcriptional start site TSS) Hiện nay, xấp xỉ 17.000 gene người xuất hiện trên Genbank chỉ có khỏang 3000
gene là được ghi chú TSS Hầu
Trang 2hết các cDNA lấy từ mRNA đều
bị cắt ngắn đầu 5´ do quá trình phiên mã ngược không thể tạo
được đầu 5´ Gần đây, một cơ sở
dữ liệu chuyên biệt cho TSS
(Database of Transcriptional
Start Site DBTSS) đã được phát triển chứa đầu 5´ của khỏang
8000 gene người Đây thực sự là một nguồn dữ liệu cực kỳ hữu
dụng cho nghiên cứu promoter
Cũng cần nhắc lại là họat động của promoter và quá trình khởi sự
phiên mã thực sự khá phức tạp Sau khi chromatin trong khu vực chứa promoter được tái cấu trúc theo
hướng duỗi thẳng và siêu acetyl
Trang 3hóa, phức hợp tiền khởi sự sẽ gắn lên vùng promoter lõi (nằm xấp xỉ
100 bp ở hai phía TSS) Quá trình phiên mã sau đó sẽ được điều khiển chủ yếu bởi các yếu tố phiên mã
gắn lên vùng lân cận promoter
(khỏang 1 kb theo hướng thượng
nguồn của TSS) và vùng intron đầu tiên
Hiện có nhiều chương trình dùng
để chỉ định TSS và và promoter
Nhưng hầu hết đều không có độ
chính xác cao, đặc biệt là chúng
không có khả năng nhận diện các dấu hiệu dương tính giả Trong
trường hợp người ta có một vùng không gian DNA khá rộng lớn như
Trang 4genome người và việc lập bản đồ trình tự TSS chỉ cần độ phân giải thấp (khỏang xấp xỉ 2kb) đồng thời các TSS này có liên hệ với CpG thì người ta có thể kết hợp hai thuộc tính CpG và promoter
(CpG_promoter) cho quá trình dò tìm Tuy nhiên với những bản độ cần độ phân giải cao (khỏang
100bp) cho TSS thì người ta ưu
tiên chọn dấu hiệu promoter và lõi (Core_promote) để tìm kiếm gene
Chương trình Promoter-Inspector cho thấy nó có thể ước tính tỷ lệ
giữa dương tính thật và dương tính giả là 2,3 trong khi chương trình
TSSW thì tỷ lệ này là 0,6 Một
Trang 5chương trình khác, Eponine, có tính đặc hiệu và độ nhạy như Promoter Inspector , nó có khả năng chỉ định
vị trí TSS bằng cách dò tìm những thuộc tính tinh vi hơn (như là hộp TATA và những đảo CpG gần
nhau) Hơn nữa, nó còn gia tăng
tính đặc hiệu trong việc dò tìm
nhóm gene đồng điều hòa bằng
cách khai thác sự tương quan đặc hiệu giữa các điểm gắn yếu tố
phiên mã trong một module chức năng
Cũnng như hầu hết các chương
trình chỉ định gene bằng cách dò
tìm exon đầu 3´, các chương trình
dò tìm gene bằng exon đầu 5´ và
Trang 6promoter cũng có giới hạn tương
tự, tức là nó chỉ dò được thực chất cái gọi là vùng mã hóa đầu 5´
(5´CDS)
Gần đây, một thuật tóan cho phép chỉ định đúng exon đầu 5´ đã được công bố đó là FisrtEF (dựa trên
QDA- phương pháp phân tích biệt thức bậc hai không tuyến tính-
nonlinearal Quadratic Discriminant Analysis) Nó phân tách các exon đầu 5´ có CpG liên quan ra khỏi
các exon đầu 5´ không liên quan
CpG Nó có thể chỉ định cả utexon đầu 5´ và cả uexon đầu 5´ Hơn
nữa, bằng cách tích hợp nhiều
thuộc tính trình tự, nó cho phép
Trang 7tăng độ chính xác khi nhận diện TSS và promoter