1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giải mã trình tự toàn bộ bộ gen

20 560 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 2,27 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

16 Sản phẩm của các phản ứng giải mã trình tự Phản ứng diễn ra trên 1000 lần từ sợi DNA khuôn Mỗi vị trí có thể có đều được đánh dấu rất nhiều lần 17 Máy giải mã trình tự bộ gen 18

Trang 1

Chương 5 Giải mã trình tự toàn bộ

bộ gen

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TPHCM

KHOA CNSH & KTMT

HỆ ĐẠI HỌC

ThS Nguyễn Thành Luân

Email: luannt@cntp.edu.vn

2

NỘI DUNG BÀI HỌC

1. Khái niệm giải mã bộ gen (genomic sequencing)

2. Giải mã trình tự theo phương pháp Sanger: định

nghĩa, các bước cơ bản, sản phẩm

3. Phương pháp tạo phản ứng cho việc giải mã:

Walking & Shotgun

4. Ưu & nhược điểm của giải mã trình tự

5. Các hướng khắc phục: mô hình quỹ cộng đồng &

mô hình cá nhân

6. Hướng giải quyết mới trong tương lai

Why do sequencing?

Trang 2

4

Why do sequencing?

Bản hướng dẫn cho ngành sinh học

5

Khám phá mỗi gen mã hóa bởi bộ

gen của 1 loài động vật

6

Tại sao cần thiết phải giải mã toàn bộ bộ gen?

Phân biệt các dòng giống từ sự khác biệt

về trình tự

Trang 3

7

Tại sao cần thiết phải giải mã toàn bộ bộ gen?

Khám phá các kiểu di truyền gây ra bởi các

đột biến khác nhau

Khám phá các đột biến gây ra các bệnh di

truyền

8

Giải mã trình tự (Gene Sequencing)

 Có bao nhiêu phương pháp giải mã trình tự?

 Phương pháp giải mã trình tự nào tối ưu hơn? Tại sao?

 Mục đích cuối cùng của giải mã trình tự toàn bộ bộ gen là gì?

Các bước của giải mã trình tự SH

Phương pháp giải trình tự toàn hệ gen trải qua 3 giai đoạn:

 Bắt đầu bằng một bản đồ

di truyền tế bào của mỗi NST

 Thực hiện giải mã qua các giai đoạn đạt mục đích cuối cùng là giải mã toàn

bộ từng nucleotide trên mỗi NST

Trang 4

10

Khi nào sử dụng giải trình tự?

11

Phản ứng giải mã trình tự sinh học

Được phát minh bởi Fred Sanger

Sử dụng enzyme DNA polymerase

Các phản ứng chứa 1 “điểm đích” để tạm dừng quá trình tổng hợp

The Nobel Prize in Chemistry

1958 Frederick Sanger

(1918 - 2013)

12

Giải mã trình tự Sanger

Hoạt động bằng thực hiện các phản ứng nhẹ

nhàng phá gãy 1 đoạn DNA chuẩn đã tái tạo, xúc

tác bởi enzyme DNA polymerase

Trang 5

13

Phản ứng giải mã trình tự

14

Các bước cơ bản trong giải mã trình tự

bases):

 Thêm 4 nhóm dideoxynucleotide (ddNTPs)

Nguyên lý của giãi mã

Phân biệt rõ PCR giải mã trình tự và PCR

khuếch đại trình tự

Trang 6

16

Sản phẩm của các phản ứng giải mã trình tự

Phản ứng diễn ra trên 1000 lần từ sợi DNA khuôn

Mỗi vị trí có thể có đều được đánh dấu rất nhiều

lần

17

Máy giải mã trình tự bộ gen

18

Giải mã trình tự bộ gen

Với việc sử dụng các phần mềm khác nhau, sẽ cung

cấp cho chúng ta 1 hình ảnh gel

khác nhau về 1 đoạn chiều dài của nucleotide Màu

sắc trong vạch biểu thị cho việc ddNTPs được kết hợp

trong đoạn DNA

Trang 7

19

Giải mã trình tự bộ gen

Giải mã trình tự trên những khu vực gel để đọc kết quả giải mã

20

Phản ứng giải mã trình tự đầu tiên

(primary sequencing)

Không sử dụng thuốc nhuộm (dyes) & dung dịch

đệm chạy mẫu (loading buffer)

Các ký tự đích (terminator) được đánh dấu bằng

các chất phóng xạ

Thực hiện 4 phản ứng riêng biệt, mỗi phản ứng

khác nhau với 1 ký tự đích khác nhau

Quá trình giải mã trình tự

Quá chậm cho Genomics

Tối đa khoảng 500 base/1 lần giải mã trình tự

Mỗi base phải được đọc trên film X-ray và ghi lại

nhiều lần kết quả bằng cách thủ công (tay, thuê

nhân công )  Tốn công sức & hiệu quả kinh tế

kém

Trang 8

22

Quá trình giải mã trình tự

Dự tính thời gian:

Bacteriophage chỉ có 5000bp

Mất 4 năm để hoàn thành việc giải mã

Các loài đơn giản nhất (Vi khuẩn) có bộ

genome khoảng 2,000,000 bp

Mất khoảng1,600 năm cho việc giải mã

23

Quá trình giải mã trình tự

24

Phương pháp tạo phản ứng trong việc giải mã

Các mục tiêu trong việc giải mã trình tự các

phân mảnh lớn của DNA

 PP Walking (PP lặp và phân đoạn)

 PP Shotgun (PP ngẫu nhiên)

Trang 9

25

Phản ứng Walking

 Phản ứng giải mã trình tự đầu tiên cung cấp 500 bp trình

tự thông tin

 Việc giải mã 500 bp tiếp theo phụ thuộc vào trình tự

thông tin DT của đoạn mã trước đó

 Quy trình phản ứng chỉ đạt tối đa 1kbase/2 ngày Việc

giải mã trình tự toàn bộ bộ genome mất 6,000,000 ngày

26

Phương pháp Shotgun

 Lấy nhiều đoạn copy DNA ngẫu nhiên của bộ gen, giải

mã trình tự 500bp từ mỗi đoạn DNA đó

 Sau đó sắp xếp tất cả trình

tự thành 1 trình tự bộ gen hoàn chỉnh

Lưu ý: Phải giải mã trình tự

gen nhiều lần để chắc chắn không bị trùng lặp có thể thực hiện nhiều phản ứng trình tự đồng thời cùng 1 lúc

So sánh Walking vs Shotgun

Walking hiệu quả hơn – giải mã trình tự chỉ 1 lần

duy nhất

Walking thường chậm hơn, mất đến 2-3 ngày để

thiết kế và tổng hợp các mồi (primer) mới cho

trình tự

Shotgun ít hiệu quả hơn vì là giải mã trình tự

ngẫu nhiên, cần phải giải mã mỗi trình tự ít nhất

10 lần lặp lại

Nhanh hơn Walking – không cần tổng hợp và

thiết kế mồi (primer) – sử dụng 1 loại giống nhau

cho tất cả các phản ứng

Trang 10

28

Giải trình tự ngẫu nhiên (Shotgun)

Do J Craig Venter

(1992), một nhà sinh học phân tử tìm ra khi

bỏ qua bản đồ liên kết

và bản đồ vật lý thay vào việc giải trình tự các phân đoạn DNA ngẫu nhiên

Hệ gen của

Haemophilus influenza

lần đầu tiên được công

bố bằng PP này (1995)

29

Vận hành phương pháp Shotgun

 Các phân mảnh được phân chia ngẫu nhiên, các trình tự của các

phân mảnh phải được giải mã để đảm bảo độ bao phủ tất cả trình

tự

 Một số phân mảnh sẽ chứa nhiều thông tin trình tự đã hiện diện ở

trình tự khác = đoạn lặp (overlaps)

 Các đoạn lặp này rất cần thiết cho việc kết nối các phân đoạn DNA

lại với nhau

30

Vận hành phương pháp Shotgun

Quy tắc chung – giải mã ít nhất 10 lần kích cỡ bộ gen

để đảm bảo độ bao phủ hoàn toàn trình tự giải mã

VD: 1 bộ genome 5kbase=5000base, máy giải mã phải giải mã 5000*10/500 trình tự

= 100 đoạn

Để kết hợp lại, phải làm các phép so sánh 2 đoạn phân mảnh DNA (comparisons) = C(100,2) C(100,2) = 4,950 phép so sánh

Trang 11

31

Các phép so sánh

Có quá nhiều phép so sánh cần phải thực hiện,

sẽ phải mất rất nhiều năm để tính toán thời gian

hoàn thành

32

Triển vọng của giải mã trình tự

Dự đoán đƣợc sự thay đổi di

truyền của thế hệ tiếp theo

Định nghĩa & mô tả cấu trúc hoặc trật tự di truyền của gen hay protein

Các khó khăn khi giải mã trình tự

Phải tiến hành phân mảnh bộ genome trước khi

giải mã

Phải đạt 500 bp cho mỗi trình tự từ đoạn phân

mảnh  Đạt độ chính xác cao

Sau kết thúc giải mã, các trình tự phải được đặt

trở lại thành 1 bộ gen hoàn chỉnh

Mỗi đoạn phân mảnh 500 bp phải liên tục được

so sánh với 1 số đoạn trình tự phân mảnh 500

bp khác  Kiểm tra độ chính xác

Trang 12

34

Khó khăn của giải mã trình tự

Tìm kiếm biện pháp tối ưu cho việc giải mã trình tự

vừa chính xác, vừa tiết kiệm thời gian

35

CÁC HƯỚNG KHẮC PHỤC

Giải pháp 1: Mô hình huy động quỹ cộng đồng

Giải pháp 2: Mô hình hỗ trợ cá nhân

36

Giải pháp 1: Mô hình huy động quỹ

cộng đồng

Phân chia genome thành các “khúc” (chunks) lớn

hơn theo thứ tự nhất định  PP shotgun

Những khúc đã được sắp xếp cầu thành 1 bản

đồ vật lý của bộ genome

Đặt những khúc vào thứ tự (bản đồ vật lý) sẽ tạo

nên điểm cốt yếu của thời gian

Quay lại điểm này sau khi giải mã

 Ước lượng chi phí: mất 1000 người làm việc

trong vòng 30 năm = 3 tỷ US dollars

Trang 13

37

Mô hình phân chia và kết hợp

38

Mô hình cộng đồng cho việc giải mã

trình tự Genome người

BƯỚC I: Cung cấp 1 bản đồ vật chất của

genome

BƯỚC II: Trình diễn (perform) các phản ứng

giải mã trình tự

BƯỚC III: Kết hợp các phân mảnh/miếng

(piece) trình tự với nhau

Bản đồ vật lý

Bộ genome người –3.3 gigabase (Gb) (3.3 x 109

bp)

Mỗi NST quá lớn để quan sát và phân tích trình

tự

 Khởi đầu genome phải được phân đoạn thành các

miếng/mảnh nhỏ hơn, có thể quan sát và phân tích

trình tự

 Làm bất tử các phân mảnh – tạo nên các nguồn

nguyên liệu vô tận

 Tạo nên 1 bản đồ vật chất để kết hợp những mảnh

nhỏ lại với nhau để xây dựng bản đồ gene

Trang 14

40

Ứng dụng đang thực hiện

41

Sự phân đoạn

Quyết định trong việc phát sinh ra các đoạn

DNA lặp (overlapping)

Nguyên liệu khởi đầu là hàng triệu bản sao của

mỗi NST

– Sự phân cắt bằng enzyme cắt hạn chế (RE

disgestion)

– Sự dịch chuyển cơ học (Mechanical shearing)

– Sự phân mảnh NST (Chromosomal

separation)

42

Sự phân đoạn

Enzyme cắt hạn chế (RE Digestion)

Phân cắt bằng enzyme cắt hạn chế (RE): mục

tiêu là cung cấp các phân mảnh 10-150 kbase,

các RE có chiều dài khác nhau:

–Nhóm RE 4-base cắt 1 lần khoảng 256

bases/trình tự

–Nhóm RE 6-base cắt 1 lần khoảng 4096

bases/trình tự

–Nhóm RE 8-base cắt 1 lần khoảng 65

kbases/trình tự

 Tuy nhiên, trong thực tế, các phần cắt mảnh

DNA chủ yếu chỉ dùng nhóm RE 4 base

Trang 15

43

Sự phân đoạn

44

Sự phân đoạn

Sự chia cắt vật chất ở NST thường sử dụng

huỳnh quang – Fluorescent Active Cell Separator)

Vạch đích huỳnh quang gắn vào NST & số lượng

vạch đánh dấu đích cân xứng với kích cỡ của

NST

Các giọt nhỏ giọt, mỗi loại chứa 1 NST di chuyển

qua các đầu điện cực Sự di chuyển điện cực phổ

biến thành các giọt nhỏ nếu đủ tiêu chí về kích cỡ

ở vạch nhuộm đích (dye)

Một số giọt nhỏ có thể bị lệch và chia cắt từ 1 số

NST khác

Bất tử các phân mảnh

Bằng việc xây dựng 1 ngân hàng genome

– Đặt mỗi phân mảnh DNA vào trong 1 sợi DNA ở

cơ thể VSV trong phòng thí nghiệm

– Một phân mảnh/1 Vi khuẩn

– Phân lập mỗi loại VSV

– Có 1 quá trình chuẩn bị thuần cho mỗi phân

mảnh

– Có thể phát triển vi khuẩn trong mỗi môi trường

nuôi cấy để cung cấp 1 số lượng lớn các phân

mảnh đó

Trang 16

46

Cloning

47

Cloning

Mỗi đoạn DNA có thể đƣợc phân lập bằng cách cấy đĩa

mỗi loại vi khuẩn riêng lẻ Thực tế, mỗi phân mảnh đƣợc

mã hóa (số hóa) cho việc theo dõi thuận tiện hơn

48

Tìm kiếm các đoạn lặp

Đòi hỏi một số cách tính toán trình tự của mỗi

đoạn phân mảnh

Sử dụng quá trình cắt hạn chế (Restriction

digest)

Xử lý qua điện di các phân mảnh (gel agarose)

Trang 17

49

Gel điện di agarose đƣợc sử dụng để chia cắt phân đoạn của DNA dựa vào kích cỡ (size) Các đoạn lặp sẽ có 1 số vạch chung trên các giếng khác nhau

50

Mô hình hỗ trợ cá nhân

Kế hoạch giải mã trình tự toàn bộ bộ genome bằng

PP Shotgun

Bỏ qua giai đoạn lập bản đồ vật chất & di truyền

Phân mảnh bộ genome, giải mã trình tự rất nhiều

mảnh 500 bp sau đó cố gắng đặt chúng lại với

nhau

Sử dụng 1 phát minh mới –mô hình các cặp bạn bè

(mate-pair) và mô hình khung giáo (scaffold)

Mô hình “Mate-Pair” và “Scaffold”

Mã hóa 1 mảnh thông tin bổ sung bằng cách đọc

các khoảng cách chính xác giữa các cặp trình tự

Genome được phân mảnh thành các đoạn lặp đã

biết được chiều dài như

–2 kbase

–10 kbase

–50 kbase

–150 kbase

Giải mã trình tự cả 2 đầu của các đoạn phân mảnh

DNA

Trang 18

52

Mô hình Shotgun thông thường

Ngẫu nhiên phân mảnh và giải mã đoạn DNA

500 bp, và xác định các đoạn lặp

Mỗi nhóm của phân đoạn lặp sẽ được gọi là 1

đoạn tiếp giáp (contig)= 1 phân mảnh liền kề

của trình tự DNA

53

Mô hình Shotgun qua Mate-Pair

 Phân mảnh các sợi DNA thành các đoạn lặp giống hệt nhau về kích thước và trọng lượng (VD: 50 kbase)

 Các đoạn phân mảnh giống hệt nhau về chiều dài và trọng lượng như anh em nên được gọi là

“Mate-Pair”

54

Mô hình Shotgun

Mỗi nhóm đoạn tiếp giáp riêng lẻ có thể có

các phân đoạn “bạn bè” bởi vì cả 2 đầu của mỗi

đoạn DNA 50 kb đều được giải mã trình tự

Trang 19

55

Mô hình giàn khung (Scafffold)

 Scaffold thay thế cho việc lập bản đồ vật chất – do quy trình

thực hiện nhanh hơn Về lý thuyết, chúng ta có thể kết nối thành bộ

gen hoàn chỉnh từ các trình tự giải mã sử dụng mô hình giàn khung

 Trình tự bộ genome cuối cùng được kết nối hướng về việc chứa

các đoạn khoảng trống (gaps) đầu tiên bởi các trình tự lặp Mô hình

kết hợp sẽ giúp cho việc bù đắp các đoạn gaps

 Vì thế, mô hình hỗ trợ cá nhân sẽ sử dụng thông tin bản đồ vật

chất được thiết kế trong mô hình gây quỹ cộng đồng để giúp cho

việc bù đắp các đoạn gap

56

Mô hình giàn khung (Scafffold)

Các đoạn tiếp giáp có thể gia nhập nhóm DNA bạn bè

nên được gọi là mô hình nhóm bạn bè (Mate-pairs)

hướng theo và đặt các nhóm tiếp giáp liên quan với

các nhóm khác

Khi ngày càng nhiều cặp bạn bè (mate-pair) được so

sánh, 1 mô hình giàn khung (scaffold) từ từ được xây

dựng

Mất bao lâu?

Dự đoán đầu tiên: 30 năm

 Với các ứng dụng KHKT hiện nay với máy giải mã trình

tự tự động (automated sequencer) và bỏ qua việc tìm

hiểu bản đồ vật lý cho bộ genome người hoàn chỉnh

 Một robot giải mã trình tự ở phòng TN có thể giải mã

trình tự 4.96 x 10 6 bases mỗi ngày

 Bộ genome người 3.3 x 10 9 bases NHƯNG cần sự

đảm bảo độ bao phủ nên phải được 3.3 x 10 10 bases

 Tốn mất 6,653 ngày cho 1 phòng thí nghiệm = 18 năm

 Xây dựng 20 phòng thí nghiệm có quy mô như PTN

trên

 Giải mã toàn bộ bộ genome chỉ mất khoảng 330 ngày

Trang 20

58

Các hướng giải quyết mới

Một nhà máy giải mã trình tự tự động hóa

59

Tài liệu tham khảo

http://www.youtube.com/watch?v=8n2LvJ-m0n0&feature=related

http://www.the-scientist.com/?articles.view/articleNo/16654/

60

KẾT THÚC CHƯƠNG V

THANK YOU FOR YOUR ATTENTION!

Ngày đăng: 22/11/2017, 20:06

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w