1. Trang chủ
  2. » Giáo án - Bài giảng

BÀI GIẢNG TIN SINH HỌC - PHEP PHAN TICH CAY PHAT SINH LOAI

68 24 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 2,21 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Cây phát sinh loài không rõ nguồn gốc Unrooted tree  Là dạng mạng lưới quan hệ loài Không chắc chắn thời gian, không gian khởi đầu Biểu hiện quan hệ họ hàng nhưng không phản ánh sự t

Trang 2

Các ứng dụng thực tiễn

Trang 3

Bioinformatics

Trang 5

Câu hỏi

Tại sao ngày nay vẫn còn tồn tại những động vật có cấu tạo phức tạp như động vật có xương sống bên cạnh động vật nguyên sinh có cấu

tạo rất đơn giản?

Trang 6

Tìm hiểu các quan hệ loài

Trang 7

CÂY PHÁT SINH LOÀI LÀ GÌ?

 Miêu tả lịch sử tiến hóa của một nhóm

loài với những đặc tính khác nhau

nhưng có cùng mối quan hệ họ hàng với nhau và cùng hình thành từ một tổ tiên trong quá khứ

PHYLOGENETIC TREE

Trang 8

Cây phát sinh loài

(Phylogeny)

Cây phát sinh loài ‘kể lại’các thời

điểm ‘lâu đời nhất’ trong mối quan

hệ loài từ 1 tổ tiên chung.

 Biểu hiện tổ tiên chung cho tất cả các

loài/gene trong cây phát sinh

 Các loài gần nhau, có khoảng cách từ gốc

đến ngọn sát nhau có thể là họ hàng ‘gần’

Trang 9

 Quá trình tiến hoá của các nhóm sinh vật

từ thấp đến cao, từ đơn giản đến phức tạp.

 Biết được số lượng của các nhóm sinh

vật khảo sát

Trang 10

Tác phẩm “Nguồn gốc các loài”

 Tác giả: Charles Darwin

 Xuất bản năm 1859

 Giới thiệu giả thuyết các loài tiến hóa

là kết quả của quá trình chọn lọc tự

nhiên

Trang 11

Bioinformatics 11

Charles Darwin (1809 – 1882)

HMS Beagle

Trang 12

Hành trình trên chuyến tàu

Beagle

Trang 13

Bioinformatics 13

Cây phát sinh loài đầu tiên được vẽ

Trang 14

Ý tưởng về cây phát sinh loài

Trang 15

Bioinformatics 15

Ý tưởng …

 Darwin cho rằng các

loài có chung một nguồn gốc khi ông quan sát các loài

“tương tự” trong suốt chuyến hành trình

Trang 16

Nhóm 3: 1 loài (9) sống ở đảo Cocos Nhóm 4: 1 loài (2)

Trang 17

Bioinformatics 17

Darwin’s tree of life

Trang 18

Quan điểm Darwin về tiến hóa của loài người

Trang 19

Bioinformatics 19

Darwin vs Tôn giáo

Trang 20

Xây dựng cây phát sinh loài

Trang 22

Trình tự bảo tồn

 Là những trình tự mã hóa hoặc không

mã hóa protein đóng vai trò chức

năng quan trọng đối với sinh vật

Trang 23

Bioinformatics 23

Ví dụ: promoter

 Trình tự -10: TATAAT, trong đó T cuối

có mức độ bảo tồn cao nhất Trình tự này chứa nhiều T/A để 2 mạch dễ

Trang 24

Ví dụ: vị trí bảo tồn của protein

Trang 25

Bioinformatics 25

Phương pháp nghiên cứu

 Sắp xếp các trình tự

 Phối hợp với thời gian

 Xây dựng cây phát sinh loài

Trang 26

Các phần mềm hỗ trợ

 Sắp xếp đa trình tự BLAST của NCBI

 Sắp xếp đa trình tự ClustalX, ClustalW

 Thể hiện cây phát sinh loài TreeView

hoặc MEGA

Trang 28

Các đột biến có thể xảy ra

Transition (Sự chuyển đoạn)

 Xảy ra ở các nhóm chuyển tiếp từ purine (A <-> G) hay

pyrimidine (C <->T)

Transversion (Sự đảo đoạn)

 Xảy ra ở các nhóm chuyển từ purine sang pyrimidine

hoặc ngược lại (A<->T, C<->G, A<->C, T<->G)

 Tất cả các đột biến trên đều là đột biến điểm

(point mutation) trong di truyền với các loại: mất

Trang 29

Bioinformatics

Trang 30

Các dạng khác nhau của cây

tiến hóa

Trang 31

Cây phát sinh loài không rõ nguồn gốc (Unrooted tree)

Là dạng mạng lưới quan hệ loài

Không chắc chắn thời gian, không

gian khởi đầu

Biểu hiện quan hệ họ hàng nhưng

không phản ánh sự tiến hóa

Không thể nhận rõ khi quá trình nhân bản gene diễn ra

Trang 32

Cây phát sinh loài biết rõ nguồn gốc (Rooted tree)

Cây phát sinh loài biểu hiện rõ sự

tiến hóa

 Có thể chỉ ra quá trình nhân bản gene xuất

hiện

 Có nguồn gốc - Ví dụ tổ tiên chung liên quan

đến tất cả các trình tự gene hoặc loài

Trang 33

Cây phát sinh loài biết rõ

Outgroup là một trình tự có khoảng Outgroup

cách xa/mối quan hệ xa với tất cả các nhóm trình tự nghiên cứu

Ví dụ: Nghiên cứu quan hệ Hemoglobin A, sử dụng nhóm không liên quan là Hemoglobin B

Trang 34

Các dạng của cây phát sinh loài biết rõ nguồn gốc (Rooted tree)

Trang 35

Cây phát sinh nhánh tiến hóa

Các nhánh dài hơn chỉ ra việc tiến hóa diễn ra nhanh hơn – đặc biệt hữu ích

trong việc tìm hiểu các quan hệ được sinh ra từ dữ liệu mã hóa trình tự, có thể chỉ ra sự thay đổi về chức năng, hoặc về môi trường sống…

Trang 36

Ví dụ

Cây phát sinh loài 1, 2, 3 theo thứ tự là;

(a) Dạng phân ly, nhánh tiến hóa và dendrogram (b) Không rõ nguồn gốc, nhánh tiến hóa và phân

Trang 37

Các phương pháp để xây dựng cây phát sinh loài

Các phương pháp cơ bản trong phân

Trang 38

Phương pháp Distance

Trang 39

Distance Matrix

Các trình tự giống nhau nhất = có

mối liên hệ loài gần nhất

Là 1 cơ chế phân tử nghiêm ngặt

Trang 40

Cách tính

(1) a + b = 3 (2) a + e + c = 9 (3) b + e + c = 8 _ (2)-(3) a - b = 1 (1) a+ b = 3 (2-3+1) 2a = 4

a = 2

b = 1

Trang 41

Kết quả

 Sự khác biệt giữa các nhánh có thể biểu hiện dạng

số hay độ dài của các nhánh tiến hóa

 Nhánh tiến hóa càng ngắn, loài đó được xem như

xuất hiện trước, nhánh tiến hóa dài biểu hiện loài xuất hiện sau

Trang 42

Phương pháp thống kê

không tham số ( Parsimony )

Nguồn gốc Parsimony: giả thuyết

đơn giản nhất nên là 1 giả thuyết thích hợp nhất (the preferred hypothesis)

Là 1 dạng ứng dụng xây dựng cây phát

sinh loài dựa trên trình tự, cây nào

được suy ra có ít tỷ lệ đột biến nhất sẽ được chọn là cây phát sinh loài thích

Trang 43

Ví dụ

•Xây dựng cây phát sinh loài dạng

Parsimony bằng cách vẽ ra mọi trường

hợp có thể có về cây phát sinh loài đó:

Trang 44

 Lặp lại các phân tích cho mỗi cột trình tự

 Tổng hợp các thay đổi cho mỗi loại cây phát sinh

có thể xảy ra tạo nên cây phát sinh loài:

 Ví dụ: Tree 1 = 1 (Cột 1) + 1 (Cột 2) + 1(Cột 3) +

Trang 45

Phương pháp tìm kiếm các khả

năng có thể xảy ra ( Likelihood )

 Tương tự như PP Parsimony tối đa

 Tập trung phân tích mỗi cột trong 1 chuỗi

trình tự

 Tập trung vào các cây phát sinh có thể có.

 Thay vì tính toán số lượng thay đổi riêng

biệt, tính toán các khả năng có thể xảy ra 

Đưa ra 1 mô hình tiến hóa nhất.

 Tính toán lại các nghiên cứu thực tiễn để so

sánh các khác biệt

Trang 46

Khảo sát sự tiến hóa

 Quá trình chuyển đoạn ( transition A↔G, C↔T ) xảy ra

thường xuyên hơn quá trình đảo đoạn ( transversion A↔C, A↔T, G↔C, G↔T )

Sequence 1 GCACAT

Sequence 2 GCACGT

Sequence 3 ATGCGC

Sequence 4 ACTCGC

Trang 47

Khảo sát sự tiến hóa

Trang 48

Khảo sát sự tiến hóa

 Các nguồn thông tin về các mẫu base quyết

định tỷ lệ đột biến (Base thường xuất hiện

và các tỷ lệ đột biến).

 Đưa ra các hình mẫu, sau đó tính toán các

khả năng có thể xảy ra của mỗi cây phát

sinh loài tại mỗi vị trí của trình tự sắp xếp.

 Tổng hợp các khả năng đồng thời và xác

Trang 49

Câu hỏi ôn tập

 Theo bảng cột dữ liệu trình tự dưới

đây,cây phát sinh loài nào thích hợp hơn nếu PPPP likelihood được sử dụng để phân tích dữ liệu

Trang 50

Độ tin cậy của cây phát sinh loài

 Phương pháp chuẩn cho tất cả các cây (ma

trận khoảng cách, parsimony, likelihood) là

điểm lặp lại ( bootstrap)

Sequence1 GAGCTAGGGAATCTTAATTTGAAGGTT

Sequence2 GAACTCGGGACTCTTGATCTGAGGGTT

Trang 51

Điểm lặp lại ( Bootstrap )

 Là kỹ thuật xử lý thống kê các phép đo lường

về độ chính xác với các khoảng ước lượng về mẫu nghiên cứu

 Cho phép sự ước lượng các giá trị khác biệt

trong 1 sự phân bố các mẫu nghiên cứu

(sample)

 Kiểm định giả thuyết trong thống kê bằng số

lần thử lại (resampling) với sự thay thế từ

nguồn dữ liệu gốc (original data)

Trang 52

Điểm lặp lại ( Bootstrap )

Ngẫu nhiên khảo sát các cột từ trình tự n lần

thì hoàn toàn không

liệu

phát sinh loài nhiều lần khác nhau (100 –1000 lần)

Trang 53

Re-sampling

Trang 54

Các mặt hạn chế của cây

phát sinh loài

 Không hoàn toàn mô tả chính xác lịch

sử tiến hóa của các loài

 Các vấn đề về việc dựa vào các phân

tích trên 1 loại đơn lẻ về tính trạng hoặc biểu hiện gen & protein

 Thường khác biệt với loài đầu tiên so

Trang 55

Các hạn chế của cây phát

sinh

1 phép ước lượng các biểu hiện phát sinh

loài (phylogenetic characteristic)

VD: 1 cây phát sinh loài về 1 tiểu phần gen về Haemoglobin) không phải cây phát sinh loài

về phân loại về Haemoglobin của loài từ các

đặc tính được khảo sát.

=> 1 gen không thể quyết định quan hệ 1

loài nào đó

Trang 56

Các hạn chế

loài, chúng là đại diện cho 1 nhánh cuối không liên quan vì chúng hầu như không giống 1 tổ tiên trực tiếp của 1 loài đang còn tồn tại khi chưa

được chứng minh.

tuyệt chủng được phân tích trình tự hoàn toàn

Trang 57

 Lần đầu tiên trong lịch sử một ngành nghiên cứu

tiến hóa được ứng dụng trong việc xác định các tội phạm trong xét xử.

 Xác định phụ nữ mang thai mang virus HIV+ trong các

biểu đồ tuần hoàn máu sau khi mang thai

 Chồng cô đã kiểm tra HIV âm tính

 Người phu nữ khẳng định rằng cô ta không có thói quen

“bừa bãi trong sinh hoạt”

Trang 58

Luận điểm của Louisiana vs

Schmidt

 Cô ta khẳng định rằng chỉ 1 nguồn duy

nhất có thể lây truyền là 1 chất tiêm

“Vitamin K” được đưa bởi bạn trai cũ.

 Chia tay không êm thắm Bạn trai cũ nổi

giận, chia tay với những cuộc viếng thăm

hoặc cuộc gọi không mong muốn

 Bạn trai cũ của cô là 1 nha sĩ, có 1 bệnh

nhân HIV mà anh ấy đã lấy mẫu máu

Trang 59

 Dựa vào chiều dài của thời gian từ khi

tiêm và tỷ lệ phát triển nhanh của các đột biến di truyền của virus HIV/AIDS, căn cứ theo các nguồn dữ liệu về AIDS trong người phụ nữ trở thành 1 ngành nghiên cứu về cây phân tích phát sinh loài

Trang 60

Luận điểm của Louisiana vs

Schmidt

Câu hỏi: Có phải dòng HIV từ người phụ nữ có phải có mối liên quan với dòng HIV được lấy từ máu bệnh nhân

của nha sĩ?

Trang 61

Giả thiết

2 giả thiết được đưa ra

-Người phụ nữ ngay thẳng -Người phụ nữ gian dối

Trang 62

Chứng minh giả thiết

 Chiết DNA, phóng đại DNA bằng PCR và giải mã

trình tự từ những nhóm gen riêng biệt như:

–Người phụ nữ

–Virus HIV của người nha sĩ

–Từ bệnh nhân có mang HIV+

–Các dòng AIDS từ các phân bố và phân loại loài

có liên hệ gần của Lafayette

Trang 63

Chứng minh giả thiết dựa trên cây phát sinh loài

Trang 64

Các ứng dụng khác

Trang 65

Các tài liệu tham khảo thêm

 Cây phát sinh loài không

rõ nguồn gốc biểu hiện mối quan hệ giữa trình tự aa của

F rubripes IL-6 cho toàn bộ

chiều dài phân tử với các nhóm IL-6 đã biết trong trình tự thành viên của họ IL

6

 Cây phát sinh loài được xây dựng dựa trên mối quan

hệ láng giềng joining)

Trang 66

(neighbour-Sự tiến hóa tương lai???

Trang 67

Các kiến thức cần nhớ

 Định nghĩa cây phát sinh loài

 Ý nghĩa của cấy phát sinh loài

 Các dạng đột biến trong cây phát

Trang 68

KẾT THÚC CHƯƠNG IV

Ngày đăng: 07/08/2021, 09:23

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm