ĐH Y Dược TP TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH CHUYÊN ĐỀ HẾT MÔN INH HỌC PHÂN TỬ CƠ SỞ DƯỢC Tên chuyên đề Kỹ thuật ADN Array Học viên TH Phạm Đoàn Bảo Châu Trần Duy Cường Ph[.]
Trang 1TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH
CHUYÊN ĐỀ HẾT MÔN INH HỌC PHÂN TỬ CƠ SỞ DƯỢC
Tên chuyên đề:
Kỹ thuật ADN Array
Học viên TH: Phạm Đoàn Bảo Châu
Trần Duy Cường Phan Thị Diệp Lớp: 22MDS1A
Trang 2MỤC LỤC
II.2.1 Protein 9
II.2.2 Microarrays 10
II.2.2.1 Chất nền 10
II.2.2.2 Chế tạo 11
III.3 Phát hiện và phân tích dữ liệu 13
III.5 DNA microoarray để chuẩn đoán các rối loạn di truyền 15 III.6 Phát hiện bất thường nhiễm sắc thể 15 III.7 Phát hiện đột biến gây bệnh 16 III.8 Phát hiện các thay đổi đa hình 17
Trang 3Danh mục từ viết tắt
Chữ viết tắt Nghĩa tiếng anh Nghĩa tiếng việt
CCD Charge-coupled device Thiết bị kết nối sạc
TIFF Tagged Image File Format Định dạng tệp hình ảnh
được gắn thẻPCR Polymerase chain reaction Phản ứng chuỗi PolymeraseBRCA1 Gen ức chế khối u
BRCA2 Gen ức chế khối u
Đa hình cấu trúc sợi đơn
CE Capillary Electrophoresis Điện di mao quản
CAH Congenital Adrenal Hyperplasia Bệnh do tình trạng rối loạn
hormon vỏ thượng thận gâyra
Trang 4Tóm tắt
Trang 5Trong nghiên cứu sinh học và y học là sự kết hợp cuối cùng của các phân tử trên bềmặt trong quá trình chuyển đổi quan trọng, đang được thúc đẩy bởi hai yếu tố chính: sự giatăng lớn về lượng thông tin trình tự DNA và sự phát triển của các công nghệ để khai thácviệc sử dụng nó Do đó, chúng ta thấy mình đang ở thời điểm mà các loại thử nghiệm mớicó thể thực hiện được Các quan sát, phân tích và khám phá đang được thực hiện trên mộtquy mô chưa từng có Trong vài năm qua, hơn 30 sinh vật đã có bộ gen hoàn chỉnh, vớikhoảng 100 sinh vật khác đang được tiến hành Ít nhất một phần trình tự đã thu được đối vớihàng chục nghìn gen của chuột nhắt, chuột cống và người, và trình tự của toàn bộ hai nhiễmsắc thể người (nhiễm sắc thể 21 và 22) đã được xác định Trong vòng một năm, một phầnlớn bộ gen của con người sẽ được giải mã, bằng cả nỗ lực công và tư, và trình tự hoàn chỉnhcủa chuột cũng như các bộ gen của động vật và thực vật khác chắc chắn sẽ theo sát phía sau.Thật không may, hàng tỷ cơ sở của trình tự DNA không cho chúng ta biết tất cả các gen làm
gì, tế bào hoạt động như thế nào, tế bào hình thành sinh vật như thế nào, bệnh tật diễn ra nhưthế nào, chúng ta già đi như thế nào hoặc làm thế nào để phát triển một loại thuốc Đây lànơi bộ gen chức năng phát huy tác dụng Mục đích của bộ gen là để hiểu sinh học, không chỉđơn giản là xác định các bộ phận cấu thành, và các phương pháp thử nghiệm và tính toán tậndụng càng nhiều thông tin trình tự càng tốt Theo nghĩa này, bộ gen chức năng không phải làmột dự án hoặc chương trình cụ thể mà là một tư duy và cách tiếp cận chung đối với các vấn
đề Mục tiêu không chỉ đơn giản là cung cấp một danh mục tất cả các gen và thông tin vềchức năng của chúng, mà còn để hiểu cách thức các thành phần hoạt động cùng nhau để tạonên các tế bào và sinh vật hoạt động
Trang 6Để tận dụng tối đa khối thông tin trình tự lớn và tăng nhanh, cần phải có các côngnghệ mới Trong số các công cụ mạnh mẽ và linh hoạt nhất cho bộ gen là các mảngoligonucleotide mật độ cao hoặc DNA bổ sung Mảng acid nucleic hoạt động bằng cách laiRNA hoặc DNA được đánh dấu trong dung dịch với các phân tử DNA được gắn tại các vị trícụ thể trên bề mặt Trên thực tế, sự lai tạo của một mẫu thành một mảng là một tìm kiếmsong song cao của từng phân tử được xác định bởi các quy tắc nhận biết phân tử Mảng acidnucleic đã được sử dụng cho các thử nghiệm sinh học trong nhiều năm Theo truyền thống,các mảng bao gồm các đoạn DNA, thường có trình tự không xác định, được phát hiện trênmàng xốp (thường là nylon) Các đoạn DNA được sắp xếp theo mảng thường đến từ thưviện cDNA, DNA bộ gen hoặc plasmid và vật liệu lai thường được đánh dấu bằng một nhómphóng xạ Gần đây, việc sử dụng thủy tinh làm chất nền và phát huỳnh quang để phát hiện,cùng với sự phát triển của các công nghệ mới để tổng hợp hoặc lắng đọng acid nucleic trêncác phiến kính với mật độ rất cao, đã cho phép thu nhỏ các mảng acid nucleic đồng thời tănglên về hiệu quả thử nghiệm và nội dung thông tin Mặc dù việc tạo ra các mảng với hơn vàitrăm phần tử cho đến gần đây vẫn là một thành tựu kỹ thuật quan trọng, nhưng các mảng vớihơn 250.000 đầu dò oligonucleotide khác nhau hoặc 10.000 cDNA khác nhau trên mỗicentimet vuông hiện có thể được tạo ra với số lượng đáng kể Mặc dù có thể tổng hợp hoặcgửi các đoạn DNA có trình tự chưa biết, nhưng cách triển khai phổ biến nhất là thiết kế cácmảng dựa trên thông tin trình tự cụ thể, một quá trình đôi khi được gọi là tải bộ gen vàochip Có một số biến thể về kỹ thuật cơ bản này: phản ứng lai hóa có thể được điều khiển (vídụ, bằng điện trường); các phương pháp phát hiện khác" ngoài huỳnh quang có thể được sửdụng; và bề mặt có thể được làm bằng các vật liệu khác ngoài thủy tinh như nhựa, silicon,vàng, gel hoặc màng, hoặc thậm chí có thể bao gồm các hạt ở đầu sợi quang Tuy nhiên, cácyếu tố chính của phép lai song song với các mẫu dò acid nucleic liên kết bề mặt, cục bộ vàviệc đếm các phân tử liên kết, và các mảng acid nucleic mật độ cao trên kính (thường đượcgọi là các microarray DNA, các mảng oligonucleotide, các mảng Gene Chip, hoặc đơn giản
là chip) và công dụng sinh học của chúng sẽ là trọng tâm của đề tài
Trang 7CHƯƠNG I ĐẶT VẤN ĐỀ
Số lượng bệnh tật ngày càng tăng ở người, cả mắc phải và di truyền, đang được coi là
ít nhất một phần dựa trên sự thay đổi trong trình tự DNA Đối với hầu hết các bệnh, ditruyền và mắc phải có thể phức tạp và đa gen Những nỗ lực của Dự án bộ gen người nhằmlàm sáng tỏ nền tảng di truyền cấu trúc bằng cách xác định vị trí nhiễm sắc thể và tổ chức bộgen của khoảng 30.000 đến 35.000 gen người gần như đã hoàn tất [33]
Cho đến gần đây, các nghiên cứu về di truyền chức năng nhìn chung có phạm vi hạnchế, chỉ có thể làm sáng tỏ vai trò của một hoặc một vài gen tại một thời điểm trong một hệthống Theo truyền thống, thông tin về tính đặc hiệu và sự phong phú tương đối của các sảnphẩm biểu hiện được thu thập bằng các kỹ thuật như thử nghiệm lai tạo RNA Northern blot
và thử nghiệm bảo vệ ribonuclease Các phương pháp tinh vi hơn một chút, chẳng hạn nhưhiển thị vi phân [18] và Phân tích nối tiếp biểu hiện gen, [32] đã được sử dụng để sàng lọc
số lượng lớn hơn các dòng DNA bổ sung (cDNA) Tuy nhiên, những hạn chế về kỹ thuậtkhiến những kỹ thuật này không có lợi cho khảo sát di truyền quy mô lớn
Để đạt được mục tiêu này, một công nghệ mới mạnh mẽ đang xuất hiện, sử dụng phéplai với các mảng nucleotide, cái gọi là chip gen [19, 27] Sự giao thoa công nghệ giữa sinhhọc và máy tính này cho phép sàng lọc đồng thời một số lượng lớn gen đáng tin cậy và cóthể tuân theo quy trình tự động hóa
Sức mạnh của những con chip này nằm ở khả năng nghiên cứu biểu hiện so sánh giữa
người bệnh và người bình thường Các mẫu và ghi lại các thay đổi ở các giai đoạn khác nhau
trong quá trình tự nhiên của bệnh hoặc để đáp ứng với điều trị Nó cung cấp cho nhà nghiêncứu một kho vũ khí mới để phân tích các cơ chế bệnh lý cơ bản trên quy mô lớn và cũng đểxem xét cơ sở lý luận của các khái niệm trị liệu
Trang 8CHƯƠNG II TỔNG QUAN
II.1 DNA
DNA chứa đựng thông tin di truyền dưới dạng acid deoxyribonucleic Kích thước
và thành phần của một trình tự bộ gen xác định hình thức và chức năng của sinh vật Nóichung, độ phức tạp của bộ gen tỷ lệ thuận với độ phức tạp của sinh vật Các sinh vậttương đối đơn giản như vi khuẩn có bộ gen trong phạm vi 1-5 triệu (megabase) trong khi
bộ gen của động vật có vú bao gồm cả con người là khoảng 3000 megabase; bộ gen từ cácsinh vật có độ phức tạp trung bình như giun và côn trùng thường là 100-200 megabase
Bộ gen thường được chia thành các phân đoạn riêng biệt được gọi là nhiễm sắc thể
Vi khuẩn Escherichia coli (E coli) chứa một nhiễm sắc thể hình tròn duy nhất, trong khinấm men Saccharomyces cerevisiae chứa 16 nhiễm sắc thể tuyến tính Bộ gen của conngười bao gồm 23 nhiễm sắc thể thường và một nhiễm sắc thể giới tính sao cho 24 nhiễmsắc thể của người chứa tất cả 3000 megabase
DNA bộ gen tồn tại dưới dạng polyme sợi kép chứa bốn base DNA (A, G, C và T)được buộc vào một khung glucose-phosphate (Bảng 1) Thứ tự của các base dọc theoDNA được gọi là trình tự chính của DNA Trình tự bộ gen, còn được gọi là bộ gen cấutrúc, cung cấp thông tin trình tự cho ngành công nghiệp chip sinh học Hai chuỗi DNAđược giữ với nhau bằng liên kết hydro tương tác giữa các base bổ sung trên mỗi mạch.Cấu trúc hóa học của bazơ sao cho A tương tác với T (chứ không phải với bất kỳ base nàokhác) và G tương tác với C (chứ không phải với bất kỳ base nào khác) Cấu trúc sợi képvốn có của DNA và độ chính xác của các tương tác bắt cặp cơ sở có thể được khai tháctrong một quá trình được gọi là lai tạo Lai tạo là quá trình trong đó hai chuỗi acid nucleicđơn sợi bổ sung tạo thành một chuỗi xoắn kép ổn định Phản ứng lai hóa có thể xảy ragiữa hai phân tử bổ sung trong dung dịch hoặc giữa phân tử trong dung dịch và phân tử
bổ sung cố định trên giá đỡ vững chắc Vì các thử nghiệm chip DNA sử dụng các phảnứng lai giữa các phân tử huỳnh quang sợi đơn và trình tự sợi đơn trên bề mặt chip, nên laitạo là quá trình sinh hóa mà toàn bộ ngành công nghiệp microarray DNA dựa vào đó
Trang 9Bộ gen của một sinh vật chứa cả vùng mã hóa và mã hóa protein (Bảng 1) do đó baogồm exon và intron, vùng khởi động và điều hòa gen, nguồn gốc sao chép, telomere vàDNA liên gen không hoạt động Phân tích bộ gen có thể cung cấp một phép đo định lượng
về số lượng bản sao gen và số lượng nhiễm sắc thể hoặc thể bội, cũng như sự hiện diệncủa các khác biệt base đơn lẻ trong trình tự chính của DNA Những thay đổi cơ bản duynhất được di truyền thường được gọi là đa hình, trong khi những thay đổi có được trongvòng đời của một sinh vật thường được gọi là đột biến Theo một quan điểm nào đó, phântích bộ gen cung cấp một bức tranh chi tiết về tiềm năng di truyền của một sinh vật bằngcách phác họa trình tự nucleotide chính xác của tất cả các gen và vùng điều hòa gen Phântích bộ gen ở cấp độ DNA thì không, tuy nhiên, không cung cấp thước đo biểu hiện gen,
là quá trình tổng hợp các bản sao RNA và protein của các trình tự mã hóa Tuy nhiên,không cung cấp thước đo biểu hiện gen, là quá trình tổng hợp các bản sao RNA và proteincủa các trình tự mã hóa
Trang 10Bảng 1 Nội dung thông tin của bộ gen
Thiết kế di truyền Hoàn chỉnh Không hoàn chỉnh Không hoàn chỉnhĐại diện gen a 100% 3% 3%
Loại Mã hóa và không
mã hóa
Mã hóa Mã hóa
Dạng Sợi kép Đơn sợi Cuộn gập
Thành phần Nucleic acid Nucleic acid Amino acid
Base A,G,T,C A,G,C,U Không áp dụng
Bội thể b Có Có Có
Phiên mã b Không Có Có
Tịnh tiến Không Không Có
Biến đổi sinh hóa Methyl hóa Polyadenyl hóa Acyl hóa
Phosphoryl hóaThử nghiệm micoarray Có Có Không c
a Con người
b Loại trừ các hiệu ứng
phụ
c Đã được công bố
Trang 11II.2 ARN
Bộ gen DNA bao gồm các vùng chức năng rời rạc được gọi là gen Bộ gen của cácsinh vật đơn giản như vi khuẩn chứa 1000-3000 gen [7] Trong khi bộ gen của con ngườiđược ước tính chứa 50.000-100.000 gen [33] Các sinh vật đa bào bao gồm nấm men, ruồi
và giun chứa 5000-25000 gen [33]
Biểu hiện gen là quá trình RNA thông tin (mRNA) và cuối cùng là protein được tổnghợp từ khuôn mẫu DNA của mỗi gen mRNA là một phân tử sợi đơn bao gồm bốn cơ sởDNA được buộc vào một xương sống glucose- phosphate (Bảng 1) Phần của mỗi gen đượcbiểu diễn dưới dạng mRNA được gọi là trình tự mã hóa cho gen đó Khoảng 3% bộ gen củacon người dưới dạng trình tự mã hóa
Bởi vì mRNA là một bản sao chính xác của các vùng mã hóa DNA, phân tích mRNAcó thể được sử dụng để xác định tính đa hình trong các vùng mã hóa của DNA; quan trọnghơn, phân tích bộ gen ở cấp độ mRNA có thể được sử dụng như một thước đo biểu hiện gen.Mức độ biểu hiện của mỗi gen được quyết định về mặt sinh lý bởi sự kết hợp của các yếu tố
di truyền và môi trường Các yếu tố di truyền xác định hoạt động biểu hiện gen bao gồmtrình tự DNA chính xác của các vùng điều hòa gen như vùng khởi động, vùng tăng cường và
vị trí nối Do đó, tính đa hình trong DNA được cho là sẽ đóng góp một số khác biệt trongbiểu hiện gen giữa các cá thể cùng loài Mức độ biểu hiện cũng bị ảnh hưởng bởi một sốlượng lớn các yếu tố môi trường, bao gồm nhiệt độ, căng thẳng, ánh sáng và các tín hiệukhác, dẫn đến thay đổi mức độ hormone và các chất báo hiệu khác Vì lý do này, phân tíchRNA cung cấp thông tin không chỉ về tiềm năng di truyền của một sinh vật, mà còn vềnhững thay đổi năng động trong trạng thái chức năng
Mỗi tế bào của con người có thể được xem như một đơn vị chức năng chứa 10.0000 biến gen, mà mức độ biểu hiện của chúng quyết định trạng thái chức năng của tếbào [33] Đối với hầu hết các gen, mức mRNA ở trạng thái ổn định xấp xỉ mức protein và dođó, việc theo dõi biểu hiện định lượng ở cấp độ mRNA cung cấp manh mối quan trọng vềchức năng Giả thuyết rằng nhiều hoặc tất cả các bệnh ở người có thể đi kèm với những thayđổi cụ thể trong biểu hiện gen [24] đã tạo ra nhiều mối quan tâm trong việc theo dõi biểuhiện gen ở cấp độ toàn bộ bộ gen Việc dễ dàng thu được các mẫu dò huỳnh quang từmRNA và sự dễ dàng mà các mẫu dò này có thể được phân tích bằng các xét nghiệm dựa
Trang 1250.000-trên lai tạo [24] đã đưa việc theo dõi mRNA trở thành một hoạt động nổi bật trong bộ genchức năng.
II.2.1 Protein
Bước thứ hai trong biểu hiện gen là tổng hợp protein từ mRNA Một protein duy nhấtđược mã hóa bởi mỗi mARN sao cho cứ ba nucleotide của mARN mã hóa một acid amincủa chuỗi polypeptide Do đó, một mARN 999 nucleotide sẽ tạo thành một protein có 333axit amin, với thứ tự tuyến tính của các nucleotide được biểu diễn dưới dạng một chuỗi acidamin tuyến tính Sau khi được tổng hợp, protein này có một cấu trúc ba chiều duy nhất đượcxác định chủ yếu bởi trình tự acid amin chính Sau khi được gấp lại, protein truyền đạt cáchướng dẫn chức năng của bộ gen bằng cách thực hiện một loạt các hoạt động sinh hóa baogồm các vai trò trong điều hòa gen, chuyển hóa, tế bào cấu trúc và sao chép DNA
Các cá thể trong một quần thể dự kiến sẽ có sự khác biệt trong hoạt động của protein
do tính đa hình làm thay đổi trình tự acid amin chính của protein hoặc gây nhiễu mứcprotein ở trạng thái ổn định bằng cách thay đổi biểu hiện gen Tương tự như mức độ mRNA,mức độ protein cũng có thể thay đổi để đáp ứng với những thay đổi của môi trường Hơnnữa, mức protein cũng chịu sự kiểm soát tịnh tiến và sau dịch mã không ảnh hưởng trực tiếpđến mức độ mRNA (Bảng 1) Do đó, hiểu hoạt động của protein đòi hỏi thông tin ngoàinhững gì thu được bằng cách nghiên cứu DNA hoặc RNA (Bảng 1)
Một mức độ kiểm soát sau dịch mã quan trọng liên quan đến sự biến đổi cộng hóa trịcủa protein, theo đó các nhóm thế có trọng lượng phân tử nhỏ như phosphate, nhóm acyl vàcác nhóm tương tự được gắn bằng enzym vào chuỗi bên acid amin (Bảng 1) Biến đổi cộnghóa trị có thể làm thay đổi sinh hóa chịu sự kiểm soát tịnh tiến và sau dịch mã không ảnhhưởng trực tiếp đến mức độ mRNA (Bảng 1) Biến đổi cộng hóa trị có thể làm thay đổi hoạtđộng sinh hóa của protein và do đó làm thay đổi trạng thái chức năng của tế bào Bởi vìprotein cuối cùng truyền đạt các hướng dẫn của bộ gen, nên việc đánh giá hoạt động củaprotein là trọng tâm để hiểu chức năng của bộ gen Tuy nhiên, không giống như DNA vàRNA, hoạt động của protein không thể đo được bằng phân tích lai (Bảng 1) Thông lượngcao, phân tích protein song song với microarrays đặt ra một thách thức kỹ thuật ghê gớm màcho đến nay đã được chứng minh là khó nắm bắt