Ngự ười ta đã xác đ nh đị ượ c.
Trang 1Phân tích so sánh
Vi c so sánh h gen gi a các loài đ ngệ ệ ữ ộ
v t khác nhau là c s tr c ti p đ đánhậ ơ ở ự ế ể giá s bi n đ i v c u trúc gen và trìnhự ế ổ ề ấ
t c a chúng xu t hi n trong quá trìnhự ủ ấ ệ
ti n hóa Vi c so sánh các h gen nhế ệ ệ ư
v y đ ng th i cùng giúp kh ng đ nhậ ồ ờ ẳ ị
ch c ch n h n v các vùng gen mã hóaắ ắ ơ ề protein trong m t h gen c a loài nào đó.ộ ệ ủ
Trang 2Ví d nh các exon c a các gen đ ngụ ư ủ ồ
ti n hóa có m c đ b o th cao h nế ứ ộ ả ủ ơ nhi u so v i các intron Vi c so sánh hề ớ ệ ệ gen người và chu t đã tìm th y nhi uộ ấ ề exon có tính b o th cao Vi c so sánhả ủ ệ
gi a các h gen cũng đ ng th i giúp xácữ ệ ồ ờ
đ nh các trình t exon ng n (hay tìm th yị ự ắ ấ
ph n đ u 5’ c a gen và vùng promoter
ở ầ ầ ủ
li) v n thố ường b sót khi xác đ nh b ngị ị ằ
ph n m m máy tính M t trong nh ngầ ề ộ ữ khám phá n i b t c a phép phân tích soổ ậ ủ sánh các h gen là vi c tìm ra s phệ ệ ự ổ
bi n c a tính b o th liên k t gi a cácế ủ ả ủ ế ữ gen trên cùng NST ngỞ ười và chu t,ộ
s b o th c a tính liên k t gi a các genự ả ủ ủ ế ữ trên cùng NST là r t ph bi n Trongấ ổ ế nhi u trề ường h p, tính b o th nàyợ ả ủ
được tìm th y c các loài r t xa nhauấ ở ả ấ trong quá trình ti n hóa, ví d nh loàiế ụ ư ở
cá b d t có t tiên chung v i các loàiể ẹ ổ ớ
Trang 3đ ng v t có vú t 400 tri u năm trộ ậ ừ ệ ướ c đây Hi n tệ ượng ph bi n c a s b oổ ế ủ ự ả
th trong tính liên k t c a nhi u gen choủ ế ủ ề
th y có nhi u kh năng các gen “lángấ ề ả
gi ng” cùng dùng chung các trình t đi uề ự ề hòa gen M t đi u tra dùng ph n m mộ ề ầ ề máy tính g n đây tìm th y trong m tầ ấ ộ
đo n NST có kích thạ ước 100 - 200 kb ở
ru i d m Drosophila có 10 - 20 gen liênồ ấ
k t có hình th c đi u hòa s bi u hi nế ứ ề ự ể ệ
gi ng h t nhau ru i d m có kho ngố ệ Ở ồ ấ ả
500 - 1000 đo n NST duy trì s liên k tạ ự ế
b o th này có th là do các gen liên k tả ủ ể ế cùng ph thu c vào các trình t đi u hòaụ ộ ự ề chung ở vùng NST đó
Các trình t mã hóa protein không ch làự ỉ các vùng c a h gen đủ ệ ược gi i h n vớ ạ ề
ch c năng Các trình t đi u hòa (v tríứ ự ề ị
g n c a các y u t phiên mã và các y uắ ủ ế ố ế
Trang 4t đi u hòa ho t đ ng gen, nh các y uố ề ạ ộ ư ế
t tăng cố ường enhancer) thường có tính
b o th cao Các trình t này thả ủ ự ườ ng
được xác đ nh là các trình t không mãị ự hóa protein ng n và b o th Ví d m tắ ả ủ ụ ộ
chương trình máy tính g i là VISTAọ (không ph i h đi u hành m i đây c aả ệ ề ớ ủ Microsoft) khi phân tích h gen nhi uệ ở ề loài khác nhau tìm th y s b o th tấ ự ả ủ ở ỉ
l 70% trong m t đo n trình t phân tíchệ ộ ạ ự
50 - 75 bp đ i v i m t s trình t ADNố ớ ộ ố ự
có vai trò đi u hòa Hai loài cá b d t vàề ể ẹ chu t cùng có kho ng 10.000 các đo nộ ả ạ trình t không mã hóa ng n gi ng nhau,ự ắ ố
r t có th chúng là các trình t tăngấ ể ự
cường đ c tr ng mô Tuy v y, c haiặ ư ậ ả loài này, đ c bi t chu t, dặ ệ ở ộ ường nh cóư nhi u trình t đi u hòa b b sót khi sề ự ề ị ỏ ử
d ng ph n m m máy tính đ phân tíchụ ầ ề ể trình t gen Ngự ười ta đã xác đ nh đị ượ c
Trang 5loài đ ng v t b c th p Ciona
ở ộ ậ ậ ấ
intestialis có ch a kho ng 20.000 cácứ ả trình t enhancer, và vì v y không có gìự ậ
là ng c nhiên n u ngạ ế ười và chu t s cóộ ẽ kho ng 50.000 - 100.000 các trình tả ự enhancer trong hệ gen
Các phương pháp đượ ử ục s d ng đ xácể
đ nh các trình t tăng cị ự ường d a trênự
vi c xác đ nh các v trí liên k t c a cácệ ị ị ế ủ
y u t ho t hóa ho c c ch phiên mã.ế ố ạ ặ ứ ế
Vi c xác đ nh đệ ị ược các trình t đi u hòaự ề trong phân t ADN còn là thách th c l nử ứ ớ
h n so v i vi c xác đ nh đơ ớ ệ ị ược các trình
t mã hóa protein b i các trình t đi uự ở ự ề hòa không b h n ch b i các nguyên lýị ạ ế ở
c a mã di truy n Vì v y, dủ ề ậ ường như
vi c ph i ph i h p nhi u phệ ả ố ợ ề ương pháp sinh tin h c và chọ ương trình máy tính là
c n thi t đ có th xác đ nh đầ ế ể ể ị ược các
Trang 6trình t ADN đi u hòa trong toàn b hự ề ộ ệ gen
Công c ph n m m phân tích h genụ ầ ề ệ
đượ ử ục s d ng r ng rãi nh t hi n nay làộ ấ ệ BLAST (basic local alignment tool) Có
m t s c i bi n khác nhau trong cácộ ố ả ế
chương trình BLAST, tuy v y t t c cácậ ấ ả
chương trình này đ u có các đ c đi mề ặ ể chung là tìm được nh ng vùng gi ngữ ố nhau gi a các gen mã hóa protein khácữ nhau Có nhi u cách đ tìm d li u tề ể ữ ệ ừ BLAST M t trong nh ng cách đó là sộ ữ ử
d ng công c tìm ki m h gen ho c cácụ ụ ế ệ ặ
h gen đ i v i t t c các trình t proteinệ ố ớ ấ ả ự
được d đoán trự ước g i là “querryọ sequence” Ch ng h n nh ví d sau:ẳ ạ ư ụ gen eve mã hóa trong m t protein đi uộ ề hòa phiên mã thi t y u cho s phân hóaế ế ự
t bào phôi Drosophila Protein Eve cóế ở
Trang 7376 axit amin Vùng ch c năng c aứ ủ protein này n m gi a các axit amin 71 -ằ ữ
130 Khi s d ng trình t c a 60 axitử ụ ự ủ amin này đ tìm ki m, k t qu cho th yể ế ế ả ấ
h gen Drosophila có 75 gen mã hóaệ
ch a trình t này Nh v y, chứ ự ư ậ ươ ng trình BLAST đã nhanh chóng xác đ nhị
được m t lo t các gen có ch c năngộ ạ ứ
tương t ự
M t cách khác đ khai thác c s dộ ể ơ ở ữ
li u c a BLAST là tra c u theo trình tệ ủ ứ ự nucleotit Ch ng h n nh trong thí dẳ ạ ư ụ trên, người ta có th s d ng tể ử ụ ương ngứ trình t 180 bp mã hóa cho h p đ nh lo iự ộ ị ạ gen (homeobox)
Tóm l i, vi c trình t các h gen đ y đạ ệ ự ệ ầ ủ
c a các loài khác nhau ngày càng tăng lênủ
đã cung c p m t c s d li u ngàyấ ộ ơ ở ữ ệ
Trang 8càng phong phú và đ y đ cho cácầ ủ nghiên c u h gen h c so sánh Ngàyứ ệ ọ càng có nhi u các chề ương trình máy tính
được phát tri n và hoàn thi n đ khaiể ệ ể thác v n thông tin di truy n đang ngàyố ề càng đượ ạc t o ra đ y đ h n qua cácầ ủ ơ
chương trình gi i mã ADN t đ ng.ả ự ộ