Cây phát sinh loài không rõ nguồn gốc Unrooted tree Là dạng mạng lưới quan hệ loài Không chắc chắn thời gian, không gian khởi đầu Biểu hiện quan hệ họ hàng nhưng không phản ánh sự t
Trang 2Các ứng dụng thực tiễn
Trang 3Bioinformatics
Trang 5Câu hỏi
Tại sao ngày nay vẫn còn tồn tại những động vật có cấu tạo phức tạp như động vật có xương sống bên cạnh động vật nguyên sinh có cấu
tạo rất đơn giản?
Trang 6Tìm hiểu các quan hệ loài
Trang 7CÂY PHÁT SINH LOÀI LÀ GÌ?
Miêu tả lịch sử tiến hóa của một nhóm
loài với những đặc tính khác nhau
nhưng có cùng mối quan hệ họ hàng với nhau và cùng hình thành từ một tổ tiên trong quá khứ
PHYLOGENETIC TREE
Trang 8Cây phát sinh loài
(Phylogeny)
Cây phát sinh loài ‘kể lại’các thời
điểm ‘lâu đời nhất’ trong mối quan
hệ loài từ 1 tổ tiên chung.
Biểu hiện tổ tiên chung cho tất cả các
loài/gene trong cây phát sinh
Các loài gần nhau, có khoảng cách từ gốc
đến ngọn sát nhau có thể là họ hàng ‘gần’
Trang 9 Quá trình tiến hoá của các nhóm sinh vật
từ thấp đến cao, từ đơn giản đến phức tạp.
Biết được số lượng của các nhóm sinh
vật khảo sát
Trang 10Tác phẩm “Nguồn gốc các loài”
Tác giả: Charles Darwin
Xuất bản năm 1859
Giới thiệu giả thuyết các loài tiến hóa
là kết quả của quá trình chọn lọc tự
nhiên
Trang 11Bioinformatics 11
Charles Darwin (1809 – 1882)
HMS Beagle
Trang 12Hành trình trên chuyến tàu
Beagle
Trang 13Bioinformatics 13
Cây phát sinh loài đầu tiên được vẽ
Trang 14Ý tưởng về cây phát sinh loài
Trang 15Bioinformatics 15
Ý tưởng …
Darwin cho rằng các
loài có chung một nguồn gốc khi ông quan sát các loài
“tương tự” trong suốt chuyến hành trình
Trang 16Nhóm 3: 1 loài (9) sống ở đảo Cocos Nhóm 4: 1 loài (2)
Trang 17Bioinformatics 17
Darwin’s tree of life
Trang 18Quan điểm Darwin về tiến hóa của loài người
Trang 19Bioinformatics 19
Darwin vs Tôn giáo
Trang 20Xây dựng cây phát sinh loài
Trang 22Trình tự bảo tồn
Là những trình tự mã hóa hoặc không
mã hóa protein đóng vai trò chức
năng quan trọng đối với sinh vật
Trang 23Bioinformatics 23
Ví dụ: promoter
Trình tự -10: TATAAT, trong đó T cuối
có mức độ bảo tồn cao nhất Trình tự này chứa nhiều T/A để 2 mạch dễ
Trang 24Ví dụ: vị trí bảo tồn của protein
Trang 25Bioinformatics 25
Phương pháp nghiên cứu
Sắp xếp các trình tự
Phối hợp với thời gian
Xây dựng cây phát sinh loài
Trang 26Các phần mềm hỗ trợ
Sắp xếp đa trình tự BLAST của NCBI
Sắp xếp đa trình tự ClustalX, ClustalW
Thể hiện cây phát sinh loài TreeView
hoặc MEGA
Trang 28Các đột biến có thể xảy ra
Transition (Sự chuyển đoạn)
Xảy ra ở các nhóm chuyển tiếp từ purine (A <-> G) hay
pyrimidine (C <->T)
Transversion (Sự đảo đoạn)
Xảy ra ở các nhóm chuyển từ purine sang pyrimidine
hoặc ngược lại (A<->T, C<->G, A<->C, T<->G)
Tất cả các đột biến trên đều là đột biến điểm
(point mutation) trong di truyền với các loại: mất
Trang 29Bioinformatics
Trang 30Các dạng khác nhau của cây
tiến hóa
Trang 31Cây phát sinh loài không rõ nguồn gốc (Unrooted tree)
Là dạng mạng lưới quan hệ loài
Không chắc chắn thời gian, không
gian khởi đầu
Biểu hiện quan hệ họ hàng nhưng
không phản ánh sự tiến hóa
Không thể nhận rõ khi quá trình nhân bản gene diễn ra
Trang 32Cây phát sinh loài biết rõ nguồn gốc (Rooted tree)
Cây phát sinh loài biểu hiện rõ sự
tiến hóa
Có thể chỉ ra quá trình nhân bản gene xuất
hiện
Có nguồn gốc - Ví dụ tổ tiên chung liên quan
đến tất cả các trình tự gene hoặc loài
Trang 33Cây phát sinh loài biết rõ
Outgroup là một trình tự có khoảng Outgroup
cách xa/mối quan hệ xa với tất cả các nhóm trình tự nghiên cứu
Ví dụ: Nghiên cứu quan hệ Hemoglobin A, sử dụng nhóm không liên quan là Hemoglobin B
Trang 34Các dạng của cây phát sinh loài biết rõ nguồn gốc (Rooted tree)
Trang 35Cây phát sinh nhánh tiến hóa
Các nhánh dài hơn chỉ ra việc tiến hóa diễn ra nhanh hơn – đặc biệt hữu ích
trong việc tìm hiểu các quan hệ được sinh ra từ dữ liệu mã hóa trình tự, có thể chỉ ra sự thay đổi về chức năng, hoặc về môi trường sống…
Trang 36Ví dụ
Cây phát sinh loài 1, 2, 3 theo thứ tự là;
(a) Dạng phân ly, nhánh tiến hóa và dendrogram (b) Không rõ nguồn gốc, nhánh tiến hóa và phân
Trang 37Các phương pháp để xây dựng cây phát sinh loài
Các phương pháp cơ bản trong phân
Trang 38Phương pháp Distance
Trang 39Distance Matrix
Các trình tự giống nhau nhất = có
mối liên hệ loài gần nhất
Là 1 cơ chế phân tử nghiêm ngặt
Trang 40Cách tính
(1) a + b = 3 (2) a + e + c = 9 (3) b + e + c = 8 _ (2)-(3) a - b = 1 (1) a+ b = 3 (2-3+1) 2a = 4
a = 2
b = 1
Trang 41Kết quả
Sự khác biệt giữa các nhánh có thể biểu hiện dạng
số hay độ dài của các nhánh tiến hóa
Nhánh tiến hóa càng ngắn, loài đó được xem như
xuất hiện trước, nhánh tiến hóa dài biểu hiện loài xuất hiện sau
Trang 42Phương pháp thống kê
không tham số ( Parsimony )
Nguồn gốc Parsimony: giả thuyết
đơn giản nhất nên là 1 giả thuyết thích hợp nhất (the preferred hypothesis)
Là 1 dạng ứng dụng xây dựng cây phát
sinh loài dựa trên trình tự, cây nào
được suy ra có ít tỷ lệ đột biến nhất sẽ được chọn là cây phát sinh loài thích
Trang 43Ví dụ
•Xây dựng cây phát sinh loài dạng
Parsimony bằng cách vẽ ra mọi trường
hợp có thể có về cây phát sinh loài đó:
Trang 44 Lặp lại các phân tích cho mỗi cột trình tự
Tổng hợp các thay đổi cho mỗi loại cây phát sinh
có thể xảy ra tạo nên cây phát sinh loài:
Ví dụ: Tree 1 = 1 (Cột 1) + 1 (Cột 2) + 1(Cột 3) +
Trang 45Phương pháp tìm kiếm các khả
năng có thể xảy ra ( Likelihood )
Tương tự như PP Parsimony tối đa
Tập trung phân tích mỗi cột trong 1 chuỗi
trình tự
Tập trung vào các cây phát sinh có thể có.
Thay vì tính toán số lượng thay đổi riêng
biệt, tính toán các khả năng có thể xảy ra
Đưa ra 1 mô hình tiến hóa nhất.
Tính toán lại các nghiên cứu thực tiễn để so
sánh các khác biệt
Trang 46Khảo sát sự tiến hóa
Quá trình chuyển đoạn ( transition A↔G, C↔T ) xảy ra
thường xuyên hơn quá trình đảo đoạn ( transversion A↔C, A↔T, G↔C, G↔T )
Sequence 1 GCACAT
Sequence 2 GCACGT
Sequence 3 ATGCGC
Sequence 4 ACTCGC
Trang 47Khảo sát sự tiến hóa
Trang 48Khảo sát sự tiến hóa
Các nguồn thông tin về các mẫu base quyết
định tỷ lệ đột biến (Base thường xuất hiện
và các tỷ lệ đột biến).
Đưa ra các hình mẫu, sau đó tính toán các
khả năng có thể xảy ra của mỗi cây phát
sinh loài tại mỗi vị trí của trình tự sắp xếp.
Tổng hợp các khả năng đồng thời và xác
Trang 49Câu hỏi ôn tập
Theo bảng cột dữ liệu trình tự dưới
đây,cây phát sinh loài nào thích hợp hơn nếu PPPP likelihood được sử dụng để phân tích dữ liệu
Trang 50Độ tin cậy của cây phát sinh loài
Phương pháp chuẩn cho tất cả các cây (ma
trận khoảng cách, parsimony, likelihood) là
điểm lặp lại ( bootstrap)
Sequence1 GAGCTAGGGAATCTTAATTTGAAGGTT
Sequence2 GAACTCGGGACTCTTGATCTGAGGGTT
Trang 51Điểm lặp lại ( Bootstrap )
Là kỹ thuật xử lý thống kê các phép đo lường
về độ chính xác với các khoảng ước lượng về mẫu nghiên cứu
Cho phép sự ước lượng các giá trị khác biệt
trong 1 sự phân bố các mẫu nghiên cứu
(sample)
Kiểm định giả thuyết trong thống kê bằng số
lần thử lại (resampling) với sự thay thế từ
nguồn dữ liệu gốc (original data)
Trang 52Điểm lặp lại ( Bootstrap )
Ngẫu nhiên khảo sát các cột từ trình tự n lần
thì hoàn toàn không
liệu
phát sinh loài nhiều lần khác nhau (100 –1000 lần)
Trang 53Re-sampling
Trang 54Các mặt hạn chế của cây
phát sinh loài
Không hoàn toàn mô tả chính xác lịch
sử tiến hóa của các loài
Các vấn đề về việc dựa vào các phân
tích trên 1 loại đơn lẻ về tính trạng hoặc biểu hiện gen & protein
Thường khác biệt với loài đầu tiên so
Trang 55Các hạn chế của cây phát
sinh
1 phép ước lượng các biểu hiện phát sinh
loài (phylogenetic characteristic)
VD: 1 cây phát sinh loài về 1 tiểu phần gen về Haemoglobin) không phải cây phát sinh loài
về phân loại về Haemoglobin của loài từ các
đặc tính được khảo sát.
=> 1 gen không thể quyết định quan hệ 1
loài nào đó
Trang 56Các hạn chế
loài, chúng là đại diện cho 1 nhánh cuối không liên quan vì chúng hầu như không giống 1 tổ tiên trực tiếp của 1 loài đang còn tồn tại khi chưa
được chứng minh.
tuyệt chủng được phân tích trình tự hoàn toàn
Trang 57 Lần đầu tiên trong lịch sử một ngành nghiên cứu
tiến hóa được ứng dụng trong việc xác định các tội phạm trong xét xử.
Xác định phụ nữ mang thai mang virus HIV+ trong các
biểu đồ tuần hoàn máu sau khi mang thai
Chồng cô đã kiểm tra HIV âm tính
Người phu nữ khẳng định rằng cô ta không có thói quen
“bừa bãi trong sinh hoạt”
Trang 58Luận điểm của Louisiana vs
Schmidt
Cô ta khẳng định rằng chỉ 1 nguồn duy
nhất có thể lây truyền là 1 chất tiêm
“Vitamin K” được đưa bởi bạn trai cũ.
Chia tay không êm thắm Bạn trai cũ nổi
giận, chia tay với những cuộc viếng thăm
hoặc cuộc gọi không mong muốn
Bạn trai cũ của cô là 1 nha sĩ, có 1 bệnh
nhân HIV mà anh ấy đã lấy mẫu máu
Trang 59 Dựa vào chiều dài của thời gian từ khi
tiêm và tỷ lệ phát triển nhanh của các đột biến di truyền của virus HIV/AIDS, căn cứ theo các nguồn dữ liệu về AIDS trong người phụ nữ trở thành 1 ngành nghiên cứu về cây phân tích phát sinh loài
Trang 60Luận điểm của Louisiana vs
Schmidt
Câu hỏi: Có phải dòng HIV từ người phụ nữ có phải có mối liên quan với dòng HIV được lấy từ máu bệnh nhân
của nha sĩ?
Trang 61Giả thiết
2 giả thiết được đưa ra
-Người phụ nữ ngay thẳng -Người phụ nữ gian dối
Trang 62Chứng minh giả thiết
Chiết DNA, phóng đại DNA bằng PCR và giải mã
trình tự từ những nhóm gen riêng biệt như:
–Người phụ nữ
–Virus HIV của người nha sĩ
–Từ bệnh nhân có mang HIV+
–Các dòng AIDS từ các phân bố và phân loại loài
có liên hệ gần của Lafayette
Trang 63Chứng minh giả thiết dựa trên cây phát sinh loài
Trang 64Các ứng dụng khác
Trang 65Các tài liệu tham khảo thêm
Cây phát sinh loài không
rõ nguồn gốc biểu hiện mối quan hệ giữa trình tự aa của
F rubripes IL-6 cho toàn bộ
chiều dài phân tử với các nhóm IL-6 đã biết trong trình tự thành viên của họ IL
6
Cây phát sinh loài được xây dựng dựa trên mối quan
hệ láng giềng joining)
Trang 66(neighbour-Sự tiến hóa tương lai???
Trang 67Các kiến thức cần nhớ
Định nghĩa cây phát sinh loài
Ý nghĩa của cấy phát sinh loài
Các dạng đột biến trong cây phát
Trang 68KẾT THÚC CHƯƠNG IV