1. Trang chủ
  2. » Giáo Dục - Đào Tạo

SẮP xếp TRÌNH tự ỨNG DỤNG xây DỰNG cây PHÁT SINH LOÀI

13 160 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 13
Dung lượng 2,19 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

LOGO SẮP XẾP TRÌNH TỰ & ỨNG DỤNG XÂY DỰNG CÂY PHÁT SINH LOÀI MÔN TIN SINH HỌC BÀI TIỂU LUẬN NHÓM ThS.. Tìm kiếm 1 chuỗi các ký tự tương đồng hoặc xác định trong trình tự... 7 Tìm k

Trang 1

LOGO

SẮP XẾP TRÌNH TỰ & ỨNG DỤNG

XÂY DỰNG CÂY PHÁT SINH LOÀI

MÔN TIN SINH HỌC

BÀI TIỂU LUẬN NHÓM

ThS Nguyễn Thành Luân luannt@cntp.edu.vn

Homology (Tính đồng đẳng)

Homology =

Similarity

between

objects due

to a

common

ancestry

BLAST

3

Tính đồng đẳng trình tự

VLS P AV - WAKV G HA AGHG

||| || |||| | ||||

VLS E AV L WAKV E DV AGHG

Tính giống nhau giữa các trình tự

như 1 kết quả của 1 nguồn gốc tổ

tiên chung

BLAST

Gap

Match Mismatch

Trang 2

4

So sánh trình tự

nhiều trình tự Tìm kiếm 1 chuỗi

các ký tự tương đồng hoặc xác

định trong trình tự

BLAST

5

Tại sao lại phải so sánh trình tự?

Ở phòng thí nghiệm: Tìm kiếm lỗi trình tự

© 9/25/2013

6

Tìm kiếm các bệnh liên quan đột biến

So sánh các trình tự ở dạng khỏe mạnh và

nhiễm bệnh

© Eli Koren

Tại sao lại phải so sánh trình tự?

9/25/2013

Trang 3

7

Tìm kiếm các đoạn Single Nucleotide

© Eli Koren

Tại sao lại phải so sánh trình tự?

9/25/2013

8

Dự đoán cấu trúc hoặc chức năng của

gene/protein với những trình tự tương đồng trong

CSDL để dự đoán cấu trúc/chức năng protein

chưa biết

Mục tiêu: trình tự giống nhau

thường biểu hiện chức năng

giống nhau

© Eli Koren

Tại sao lại phải so sánh trình tự?

9

Tìm hiểu các khu vực bảo tồn cao trong

gene – chỉ ra sự quan trọng của chức năng

(e.g., tyrosine có nguồn gốc tiến hóa từ vùng

chứa phosphoryl hóa)

© Eli Koren

Tại sao lại phải so sánh trình tự?

Trang 4

10

Tìm hiểu và nắm bắt được mối quan hệ tiến hóa

© Eli Koren

Tại sao lại phải so sánh trình tự?

9/25/2013

Cây phát sinh loài: Cách xây dựng

Sequence A

Sequence B Sequence C

Sequence D

Sequence E

Time

• Physical position in tree is not

meaningful

• Swiveling can only be done at the nodes

• Only tree structure matters

Present

11

Cây phát sinh loài: Cách xây dựng

Sequence A

Sequence B Sequence E

Sequence D

Sequence C

Time

• Physical position in tree is not

meaningful

• Swiveling can only be done at the nodes

• Only tree structure matters

Present

Trang 5

Tree Terminology

Rooted vs unrooted trees

Root

A B C D E F

A B

C

F

E D

Has a root that denotes common ancestry

Rooted trees:

Only specifies the degree of kinship among taxa but

Unrooted trees:

not the evolutionary path

Tree Terminology

A B C D E F

Branch lengths are proportional to the number of

Scaled trees:

nucleotide/amino acid changes that occurred on that branch (usually

a scale is included).

Branch lengths are not proportional to the number

Unscaled trees:

of nucleotide/amino acid changes (usually used to illustrate

evolutionary relationships only).

Scaled vs unscaled trees

Tree Terminology

Saturnite 1

Saturnite 2

Saturnite 3

Martian 1

Martian 3

Martian 2

All taxa within the group are derived from a

Monophyletic groups:

single common ancestor and members form a natural clade.

The common ancestor is shared by other taxon

Paraphyletic groups:

in the group and members do not form a natural clade.

Jupiterian 32 Jupiterian 5 Jupiterian 67

Human 11

Jupiterian 8

Human 3

Monophyletic vs paraphyletic

Trang 6

CÁC DẠNG CÂY PHÁT SINH LOÀI

Distance

Maximum Parsimony

Maximum Likelihood

Bayesian

ĐỘ TIN CẬY CỦA CÂY PHÁT SINH LOÀI

rat human turtle fruit fly oak duckweed

?

?

?

?

Giá trị Bootstrap

• Computational method to estimate the confidence level of a certain

phylogenetic tree.

rat GAGGCTTATC

human GTGGCTTATC

turtle GTGCCCTATG

fruitfly CTCGCCTTTG

oak ATCGCTCTTG

duckweed ATCCCTCCGG

0123456789

Sample

rat

human

turtle

fruit fly

oak

duckweed

Inferred tree

Many more replicates (between 100 - 1000)

rat GGAAGGGGCTTTTTA human GGTTGGGGCTTTTTA turtle GGTTGGGCCCCTTTA fruitfly CCTTCCCGCCCTTTT oak AATTCCCGCTTCCCT duckweed AATTCCCCCTTCCCC

001122234556667

Pseudo sample 1

rat CCTTTTAAATTTTCC human CCTTTTAAATTTTCC turtle CCCCCTAAATTTTGG fruitfly CCCCCTTTTTTTTGG oak CCTTTCTTTTTTTGG duckweed CCTTTCCCCGGGGGG

445556777888899

Pseudo sample 2

Trang 7

Giá trị Bootstrap

rat human turtle fruit fly oak duckweed

100

55

65 0

• Giá trị ở giá trị %

• Thực tế thực hành: values 60-100% được biểu hiện

•Nếu giá trị bootstrap <50%, Không tin cây

TÌM KIẾM ĐOẠN TRÌNH TỰ CỦA NHÓM

Thay vì được đưa cho 1 đoạn trình tự chưa rõ

(như bài thực hành số 1), bạn sẽ được đưa 1

mã số quản lý Genbank (Genbank Accession

number của trình tự nucleotide

Sử dụng Mã quản lý Genbank để tìm kiếm

trình tự khởi đầu của bạn (theo CSDL

nucleotide)

Tìm mục liên kết ‘protein_id’ để tìm kiếm các

trình tự acid amin (aa sequences)

www.themegallery.com

Trang 10

Sử dụng đoạn trình tự của bạn

Sử dụng đoạn trình tự aa vừa tìm kiếm được

để thực hiện tìm kiếm BLAST (theo Blastp)

qua MEGA4

Xác định các trình tự cho việc phân tích với

tiêu chí:

Hỗn hợp các loài khác nhau hoặc gen khác

nhau

Chọn lựa các nhóm có điểm cao (high score)

nhưng bên cạnh đó, lựa chọ những nhóm có

điểm thấp hơn nhằm tăng việc đa dạng trong

cây phát sinh loài (tối thiểu 25 trình

tự/nhóm)

UPLOAD TRÌNH TỰ CỦA BẠN QUA MEGA

Theo ứng dụng trình tự MEGA (Molecular

Evolutionary Genetics Analysis) để thêm các

trình tự và tạo ra việc sắp xếp các trình tự

thẳng hàng

Trang 11

Nhiệm vụ của nhóm

Tất cả các trình tự nên được upload lên MEGA và lưu

lại cho các phép phân tích về sau

Tạo các trình tự sắp xếp thẳng hàng, liệt kê lập bảng

gồm 1 nhóm ngoài (outgroup)

Tiêu chí báo cáo tiểu luận nhóm (10%)

Dạng tiểu luận: Nhóm (4-5 Sinh viên)

Assessment: Báo cáo seminar (MS

Powerpoint) (10%)

Báo cáo viết (MS Word) (20%)

Seminar: 10 phút+ 5 phút trả lời câu hỏi

Độ dài báo cáo viết: <= 20 trang

Bài báo cáo seminar có thể là những nhóm

gen liên quan đến báo cáo viết hoặc các bệnh

liên quan đến nhóm aa mà nhóm đang tìm

hiểu…

Trang 12

Cấu trúc bài báo cáo tiểu luận

Cả bài báo cáo nhóm và viết được yêu cầu như

sau:

Tóm tắt các mục tiêu, phương pháp, kết quả và

kiến nghị cho báo cáo (Summary)

Tổng quan tài liệu: tìm kiếm thông tin liên quan

các ngữ cảnh/hoàn cảnh nghiên cứu về aa đó &

mục tiêu của nghiên cứu

Ngắn gọn nói về phương pháp thực hiện với các

tài liệu liên quan đến kỹ thuật tin sinh học

Sơ đồ khối

Tin sinh học đóng vai trò cốt yếu như thế nào

cho việc phân tích và phát sinh các CSDL?

Cấu trúc bài báo cáo tiểu luận

Các kết quả chính

Các nhóm khác nhau có thể sử dụng dạng tiêu

đề (sub-heading) như 1, 1.1, 1.1.1…

Liên quan đến phương pháp thực hiện

Sử dụng các sơ đồ, biểu đồ và hình ảnh để đề

cập các kết quả

Kết quả ngắn gọn, xúc tích, tránh lạc đề

4 Thảo luận và kết luận

Các kết quả chính và các hàm ý, ghi nhận của

nhóm

Liên kết với các tài liệu khoa học khác

Các tìm kiếm xa hơn/sâu hơn/kiến nghị…

Tài liệu tham khảo

>= 15 tài liệu, trong đó ít nhất 8 tài liệu

tiếng Anh & dịch tài liệu

Sử dụng hỗ trợ EndNote trong việc tạo ra

các tài liệu tham khảo

Phân biệt rõ Tài liệu tiếng Việt & tiếng Anh

làm 2 phần riêng biệt

Tài liệu tiếng Việt sắp xếp A-Z theo tên

(Nguyễn Văn A  Trần Văn B)

Tài liệu tiếng Anh sắp xếp A-Z theo họ (VD:

Smith, J  William, B  Yao, M

Trang 13

TIÊU CHÍ BÁO CÁO SEMINAR

Ngày đăng: 22/11/2017, 20:06

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w