Các bước của giải mã trình tự SH Phương pháp giải trình tự toàn hệ gen trải qua 3 giai đoạn:... Giải mã trình tự bộ gen Với việc sử dụng các phần mềm khác nhau, sẽ cung cấp cho chúng t
Trang 2NỘI DUNG BÀI HỌC
1. Khái niệm giải mã bộ gen (genomic sequencing)
2. Giải mã trình tự theo phương pháp Sanger: định
nghĩa, các bước cơ bản, sản phẩm
3. Phương pháp tạo phản ứng cho việc giải mã:
Walking & Shotgun
4. Ưu & nhược điểm của giải mã trình tự
5. Các hướng khắc phục: mô hình quỹ cộng đồng &
Trang 3Why do sequencing?
Trang 4Why do sequencing?
Trang 5Khám phá mỗi gen mã hóa bởi bộ
gen của 1 loài động vật
Trang 6Tại sao cần thiết phải giải mã toàn bộ bộ gen?
về trình tự
Trang 7Tại sao cần thiết phải giải mã toàn bộ bộ gen?
Khám phá các kiểu di truyền gây ra bởi các
đột biến khác nhau
Khám phá các đột biến gây ra các bệnh di
Trang 8Giải mã trình tự (Gene Sequencing)
Có bao nhiêu phương pháp giải mã trình tự?
Phương pháp giải mã trình tự nào tối ưu hơn? Tại sao?
Trang 9Các bước của giải mã trình tự SH
Phương pháp giải trình tự toàn hệ gen trải qua 3 giai đoạn:
Trang 10Khi nào sử dụng giải trình tự?
Trang 11Phản ứng giải mã trình tự sinh học
Được phát minh bởi Fred Sanger
Sử dụng enzyme DNA polymerase
Các phản ứng chứa 1 “điểm đích” để tạm dừng quá trình tổng hợp
The Nobel Prize in Chemistry
1958 Frederick Sanger
Trang 12Giải mã trình tự Sanger
Hoạt động bằng thực hiện các phản ứng nhẹ
nhàng phá gãy 1 đoạn DNA chuẩn đã tái tạo, xúc tác bởi enzyme DNA polymerase
Trang 13Phản ứng giải mã trình tự
Trang 14Các bước cơ bản trong giải mã trình tự
Thêm đoạn mồi:
Thêm các nhóm bazơ nitric (4 nitrogenous
bases):
Thêm 4 nhóm dideoxynucleotide (ddNTPs)
Trang 15Nguyên lý của giãi mã
Phân biệt rõ PCR giải mã trình tự và PCR
khuếch đại trình tự
Trang 16Sản phẩm của các phản ứng giải mã trình tự
Phản ứng diễn ra trên 1000 lần từ sợi DNA khuôn
Mỗi vị trí có thể có đều được đánh dấu rất nhiều
lần
Trang 17Máy giải mã trình tự bộ gen
Trang 18Giải mã trình tự bộ gen
Với việc sử dụng các phần mềm khác nhau, sẽ cung
cấp cho chúng ta 1 hình ảnh gel
khác nhau về 1 đoạn chiều dài của nucleotide Màu sắc trong vạch biểu thị cho việc ddNTPs được kết hợp
trong đoạn DNA
Trang 19Giải mã trình tự bộ gen
Giải mã trình tự trên những khu vực gel để đọc kết quả giải mã
Trang 20Phản ứng giải mã trình tự đầu tiên
Trang 21Quá trình giải mã trình tự
Quá chậm cho Genomics
Tối đa khoảng 500 base/1 lần giải mã trình tự
Mỗi base phải được đọc trên film X-ray và ghi lại nhiều lần kết quả bằng cách thủ công (tay, thuê
nhân công ) Tốn công sức & hiệu quả kinh tế
kém
Trang 22Quá trình giải mã trình tự
Dự tính thời gian:
Bacteriophage chỉ có 5000bp
Các loài đơn giản nhất (Vi khuẩn) có bộ
genome khoảng 2,000,000 bp
Trang 23Quá trình giải mã trình tự
Trang 24Phương pháp tạo phản ứng trong việc giải
mã
Các mục tiêu trong việc giải mã trình tự các phân mảnh lớn của DNA
PP Walking (PP lặp và phân đoạn)
PP Shotgun (PP ngẫu nhiên)
Trang 25Phản ứng Walking
Phản ứng giải mã trình tự đầu tiên cung cấp 500 bp trình
tự thông tin
Việc giải mã 500 bp tiếp theo phụ thuộc vào trình tự
thông tin DT của đoạn mã trước đó
Quy trình phản ứng chỉ đạt tối đa 1kbase/2 ngày Việc
giải mã trình tự toàn bộ bộ genome mất 6,000,000 ngày.
Trang 26Phương pháp Shotgun
Lấy nhiều đoạn copy DNA ngẫu nhiên của bộ gen, giải
mã trình tự 500bp từ mỗi đoạn DNA đó.
Sau đó sắp xếp tất cả trình
tự thành 1 trình tự bộ gen hoàn chỉnh
Lưu ý: Phải giải mã trình tự
gen nhiều lần để chắc chắn không bị trùng lặp có thể
Trang 27 Shotgun ít hiệu quả hơn vì là giải mã trình tự
ngẫu nhiên, cần phải giải mã mỗi trình tự ít nhất
10 lần lặp lại
Nhanh hơn Walking – không cần tổng hợp và thiết
kế mồi (primer) – sử dụng 1 loại giống nhau cho
tất cả các phản ứng
Trang 28Giải trình tự ngẫu nhiên (Shotgun)
Do J Craig Venter
(1992), một nhà sinh học phân tử tìm ra khi
bỏ qua bản đồ liên kết
và bản đồ vật lý thay vào việc giải trình tự các phân đoạn DNA ngẫu nhiên
Hệ gen của
Haemophilus influenza
Trang 29Vận hành phương pháp Shotgun
Các phân mảnh được phân chia ngẫu nhiên, các trình tự của các phân mảnh phải được giải mã để đảm bảo độ bao phủ tất cả trình tự
Một số phân mảnh sẽ chứa nhiều thông tin trình tự đã hiện diện ở trình tự khác = đoạn lặp (overlaps)
Các đoạn lặp này rất cần thiết cho việc kết nối các phân đoạn DNA
Trang 30Vận hành phương pháp Shotgun
Quy tắc chung – giải mã ít
để đảm bảo độ bao phủ hoàn toàn trình tự giải mã
VD: 1 bộ genome 5kbase=5000base, máy
giải mã phải giải mã 5000*10/500 trình tự
= 100 đoạn
Để kết hợp lại, phải làm các phép so
Trang 31Các phép so sánh
Có quá nhiều phép so sánh cần phải thực hiện,
sẽ phải mất rất nhiều năm để tính toán thời gian hoàn thành
Trang 32Triển vọng của giải mã trình tự
Định nghĩa & mô tả cấu trúc hoặc
Trang 33Các khó khăn khi giải mã trình tự
Phải tiến hành phân mảnh bộ genome trước khi giải mã
Phải đạt 500 bp cho mỗi trình tự từ đoạn phân
mảnh Đạt độ chính xác cao
Sau kết thúc giải mã, các trình tự phải được đặt trở lại thành 1 bộ gen hoàn chỉnh
Mỗi đoạn phân mảnh 500 bp phải liên tục được
so sánh với 1 số đoạn trình tự phân mảnh 500
bp khác Kiểm tra độ chính xác
Trang 34Khó khăn của giải mã trình tự
Trang 35CÁC HƯỚNG KHẮC PHỤC
Giải pháp 1: Mô hình huy động quỹ cộng đồng
Giải pháp 2: Mô hình hỗ trợ cá nhân
Trang 36Giải pháp 1: Mô hình huy động quỹ
Quay lại điểm này sau khi giải mã
Ước lượng chi phí: mất 1000 người làm việc
Trang 37Mô hình phân chia và kết hợp
Trang 38Mô hình cộng đồng cho việc giải mã
(piece) trình tự với nhau
Trang 39 Khởi đầu genome phải được phân đoạn thành các
miếng/mảnh nhỏ hơn, có thể quan sát và phân tích
trình tự
Làm bất tử các phân mảnh – tạo nên các nguồn
nguyên liệu vô tận
Tạo nên 1 bản đồ vật chất để kết hợp những mảnh
nhỏ lại với nhau để xây dựng bản đồ gene.
Trang 40Ứng dụng đang thực hiện
Trang 42Sự phân đoạn
Enzyme cắt hạn chế (RE Digestion)
Phân cắt bằng enzyme cắt hạn chế (RE): mục
tiêu là cung cấp các phân mảnh 10-150 kbase,
các RE có chiều dài khác nhau:
Trang 43Sự phân đoạn
Trang 44Sự phân đoạn
Sự chia cắt vật chất ở NST thường sử dụng FACS
(máy phân đoạn các tế bào hoạt động gắn huỳnh quang – Fluorescent Active Cell Separator)
Vạch đích huỳnh quang gắn vào NST & số lượng vạch đánh dấu đích cân xứng với kích cỡ của
NST
Các giọt nhỏ giọt, mỗi loại chứa 1 NST di chuyển qua các đầu điện cực Sự di chuyển điện cực phổ biến thành các giọt nhỏ nếu đủ tiêu chí về kích cỡ
ở vạch nhuộm đích (dye)
Trang 45Bất tử các phân mảnh
Bằng việc xây dựng 1 ngân hàng genome
– Đặt mỗi phân mảnh DNA vào trong 1 sợi DNA ở
cơ thể VSV trong phòng thí nghiệm
– Một phân mảnh/1 Vi khuẩn
– Phân lập mỗi loại VSV
– Có 1 quá trình chuẩn bị thuần cho mỗi phân
mảnh
– Có thể phát triển vi khuẩn trong mỗi môi trường nuôi cấy để cung cấp 1 số lượng lớn các phân
mảnh đó
Trang 46Cloning
Trang 49Gel điện di agarose được sử dụng để chia cắt phân đoạn của DNA dựa vào kích cỡ (size) Các đoạn lặp sẽ có 1 số vạch chung trên
các giếng khác
nhau.
Trang 50Mô hình hỗ trợ cá nhân
Kế hoạch giải mã trình tự toàn bộ bộ genome bằng
PP Shotgun
Bỏ qua giai đoạn lập bản đồ vật lý & di truyền
Phân mảnh bộ genome, giải mã trình tự rất nhiều mảnh 500 bp sau đó cố gắng đặt chúng lại với
nhau
Trang 51Mô hình “Mate-Pair” và “Scaffold”
Mã hóa 1 mảnh thông tin bổ sung bằng cách đọc các khoảng cách chính xác giữa các cặp trình tự
Genome được phân mảnh thành các đoạn lặp đã biết được chiều dài như
Trang 52Mô hình Shotgun thông thường
Ngẫu nhiên phân mảnh và giải mã đoạn DNA
500 bp, và xác định các đoạn lặp
Mỗi nhóm của phân đoạn lặp sẽ được gọi là 1 đoạn tiếp giáp (contig)= 1 phân mảnh liền kề
của trình tự DNA
Trang 53Mô hình Shotgun qua Mate-Pair
Phân mảnh các sợi DNA thành các đoạn lặp giống hệt nhau về kích thước và trọng lượng (VD: 50 kbase)
Các đoạn phân mảnh giống hệt nhau về chiều dài và trọng lượng như anh em nên được gọi là
Trang 54Mô hình Shotgun
Mỗi nhóm đoạn tiếp giáp riêng lẻ có thể có các phân đoạn “bạn bè” bởi vì cả 2 đầu của mỗi
Trang 55Mô hình giàn khung (Scafffold)
Scaffold thay thế cho việc lập bản đồ vật chất – do quy trình
thực hiện nhanh hơn Về lý thuyết, chúng ta có thể kết nối thành bộ gen hoàn chỉnh từ các trình tự giải mã sử dụng mô hình giàn khung
Trình tự bộ genome cuối cùng được kết nối hướng về việc chứa các đoạn khoảng trống (gaps) đầu tiên bởi các trình tự lặp Mô hình kết hợp sẽ giúp cho việc bù đắp các đoạn gaps
Vì thế, mô hình hỗ trợ cá nhân sẽ sử dụng thông tin bản đồ vật chất được thiết kế trong mô hình gây quỹ cộng đồng để giúp cho
Trang 56Mô hình giàn khung (Scafffold)
Các đoạn tiếp giáp có thể gia nhập nhóm DNA bạn bè nên được gọi là mô hình nhóm bạn bè (Mate-pairs)
hướng theo và đặt các nhóm tiếp giáp liên quan với các nhóm khác
Khi ngày càng nhiều cặp bạn bè (mate-pair) được so sánh, 1 mô hình giàn khung (scaffold) từ từ được xây dựng
Trang 57Mất bao lâu?
Dự đoán đầu tiên: 30 năm
Với các ứng dụng KHKT hiện nay với máy giải mã trình tự
tự động ( automated sequencer ) và bỏ qua việc tìm hiểu
bản đồ vật lý cho bộ genome người hoàn chỉnh
Một robot giải mã trình tự ở phòng TN có thể giải mã
trình tự 4.96 x 10 6 bases mỗi ngày
Bộ genome người 3.3 x 10 9 bases NHƯNG cần sự
đảm bảo độ bao phủ nên phải được 3.3 x 10 10 bases
Tốn mất 6,653 ngày cho 1 phòng thí nghiệm = 18 năm
Xây dựng 20 phòng thí nghiệm có quy mô như PTN
trên
Giải mã toàn bộ bộ genome chỉ mất khoảng 330 ngày
Trang 58Các hướng giải quyết mới
Một nhà máy giải mã trình tự tự động hóa
Trang 59Tài liệu tham khảo
http://www.the-scientist.com/?articles.view/articleNo/16654/
Trang 60KẾT THÚC CHƯƠNG V