TÌM KIẾM TRÌNH TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU... Mục tiêu của bài học Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein.. Đăng ký những trình tự
Trang 1TÌM KIẾM TRÌNH
TỰ SINH HỌC VÀ ĐĂNG KÝ
TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU
Trang 2Mục tiêu của bài học
Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein.
Đăng ký những trình tự đã nghiên cứu được lên
Cơ sở dữ liệu sinh học bằng phần mềm Sequin.
Tìm kiếm trình tự sinh học 2
Trang 3Nguyên tắc trong giải trình tự
Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA
Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC… TTT)
3Tìm kiếm trình tự sinh học
Trang 4Nhiễm sắc thể, DNA, Gene, Nucleotide
Trang 5Gửi trình tự lên Genebank của NCBI
Trình tự đã giải
Đưa vào cơ sở dữ liệu sinh học:
-NCBI
- Các cơ sở dữ liệu khác
Sequin
Trang 6Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự
1.Tìm bằng từ khóa: 2.Công cụ tìm kiếm
-Mã số truy cập
-Tên (gene hay Protein)
-GI
-Độ dài trình tự
-Trọng lượng phân tử
-Tên tác giả giải trình tự
3 Lọc trình tự
6 Tìm kiếm trình tự sinh học
Kết quả cần tìm
Kết quả cần tìm
Trang 7Tìm kiếm trình tự sinh học 7
Tìm kiếm trình tự sinh học qua NCBI
Click
Trang 8Tìm kiếm trình tự sinh học 8
Tìm kiếm trình tự DNA
Trang 9Tìm kiếm trình tự qua mã số truy cập
Trang 10TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP
Tìm kiếm trình tự sinh học 10
Trang 11Kết quả tìm trình tự DNA qua mã số truy cập
Trang 12Tìm kiếm trình tự sinh học 12
Tìm kiếm trình tự qua tên gene
Trang 13Tìm kiếm trình tự sinh học 13
Trang 14Cách lấy trình tự theo định dang FASTA
Trang 15Định dạng FASTA
FASTA là một giải thuật bắt cặp trình tự được David J
Lipman và William R Pearson miêu tả lần đầu tiên vào
năm 1985 (Rapid and sensitive protein similarity
searches).
Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene
hoặc protein theo kiểu định dạng FASTA như ví dụ minh
hoạ dưới đây:
>tên trình tự
gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgtttcct aacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagctatcaatgtc ttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgcaggacagcaggc gtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg
Trang 16Một số mã số truy cập của RefSeq database
1 mRNAs and Proteins
NC_123455 Microbial replicons, organelle
genomes, human chromosomes
4 Assemblies
NT_123456 Contig
Tìm kiếm trình tự sinh học 16
Trang 17Ví dụ 1: NM_123456Curated mRNA
Tìm kiếm trình s sinh học 17
NM_123456
Trang 18V í dụ 2: NC_12345
Trang 19Kết quả tìm kiếm bộ gene
Trang 20Thẻ giới hạn phạm vi tìm kiếm DNA
[ALL] : Tất cả các trường tìm kiếm
[ACCN]: Mã số truy cập của trình tự - Accession number
[GI] : Số gi
[AUTH] : Tên tác giả giải trình tự- author name
[PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự
được cập nhật (update) – publication date
[ORGN] : Sinh vật chứa trình tự đó - organism
[TITL] :Định nghĩa trình tự trong mẫu tin – title
[SLEN] :Chiều dài của trình tự - Sequence length
[GENE] : Tên gene
Tìm kiếm trình tự môn học 20
Trang 21BÀI TẬP
Chúng ta thực tập tìm kiếm trình tự gen có tên là ST
GENE và lấy đoạn nucleotide theo định dạng FASTA Câu hỏi 1: Kết quả có bao nhiêu mục tìm thấy ?
Trả lời 1:
Câu hỏi 2: Trình tự DNA này dài bao nhiêu ?
Nó mã hoá cho protein gì?
Công trình này được đăng tải bởi tạp chí nào? Tác giả là ai?
Trả lời 2:
Trang 22Tìm kiếm trình tự protein
Tìm kiếm trình tự sinh học 22
Trang 23Tìm kiếm trình tự qua tên sinh vật
Trang 24Định dạng trình tự dạng FASTA
Trang 25Thẻ giới hạn phạm vi tìm kiếm trình tự protein
[ALL] : Tất cả các trường tìm kiếm
[ACCN] : Mã số truy cập của trình tự - Accession number
[GI] : Số gi
[AUTH] :Tên tác giả giải trình tự- author name
[PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được
cập nhật (update) – publication date
[ORGN] : Sinh vật chứa trình tự đó - organism
[TITL] : Định nghĩa trình tự trong mẫu tin – title
[SLEN] : Chiều dài của trình tự - Sequence length
[PROT] : Tên protein – Protein name
[MOLWT] : Trọng lượng phân tử protein
Trang 26Bài tập
Chúng ta thực tập tìm kiếm trình tự protein là độc tố
bền nhiệt có tên là ST (ST toxin).
Câu hỏi: Có bao nhiêu mục bài liên quan đến trình tự protein yêu cầu được tìm thấy
Trình tự protein ST toxin chủ yếu liên quan đến loài nào ?
Đặc điểm của protein này?
Trả lời:
Cách mã hóa dùng trong trình tự amino acid
Trang 27Tìm kiếm trình tự sinh học 27
Trang 28Phần mềm Sequin
Tìm kiếm trình tự sinh học 28
Trang 29Giới thiệu môn học 29
Trang 30Các download phần mềm sequin trong NCBI
Trang 31Cách đăng ký trình tự đã được giải mã qua
phần mềm sequin
Chọn Genebank (NCBI)
Trang 32Bước 1: Điền thông tin
Trang 33Tìm kiếm trình tự sinh học 33
Trang 34Giới thiệu môn học 34
Trang 35Giới thiệu môn học 35
Trang 36Giới thiệu môn học 36
Trang 37Giới thiệu môn học 37
Trang 38Giới thiệu môn học 38
Trang 39Giới thiệu môn học 39
Trang 40Giới thiệu môn học 40
Trang 41Giới thiệu môn học 41
Trang 42Giới thiệu môn học 42
Trang 43Giới thiệu môn học 43
Trang 44Giới thiệu môn học 44
Trang 45BÀI TẬP
Tìm kiếm trình tự gene mà bạn muốn, sau đó đăng ký lên trên gene bank bằng sequin
Tìm kiếm trình tự sinh học 45
Trang 46ĐỪNG NGỦ TRONG LỚP
Trang 47
Giới thiệu môn học 47