NỘI DUNG CHÍNH CHƯƠNG TRÌNH SỬ DỤNG CÔNG CỤ TIN HỌC PHỤC VỤ CÔNG VIỆC TỔNG QUÁT TIN SINH HỌC SỬ DỤNG MỘT SỐ PHẦN MỀM ĐÁP ỨNG CHO VIỆC PHÂN TÍCH DỮ LIỆU DNA PHỤC VỤ CÁC MỤC TIÊU CỤ THỂ...
Trang 2TIN HỌC Khái niệm:
Khoa học về thông tin
Chuyên nghiên cứu quá trình tự
động hóa việc tổ chức, lưu trữ và
xử lý thông tin của một hệ thống
máy tính
Với cách hiểu hiện nay, tin học bao hàm tất cả các nghiên cứu và kỹ
thuật có liên quan đến việc mô
phỏng, biến đổi và tái tạo thông tin
Trang 3TIN HỌC
Khái niệm:
Trong nghĩa thông dụng, tin học còn có thể bao hàm cả những gì liên quan đến các thiết bị máy tính hay các ứng dụng tin học văn phòng.
Quan hệ giữa tin học với máy tính không khác gì quan hệ giữa thiên văn học với kính viễn vọng (Edsger Dijkstra)
Trang 5SINH HỌC
Khái niệm:
Sinh học hiện đại là một lĩnh vực rộng gồm nhiều lĩnh vực
và ngành khác nhau đƣợc xây dựng dựa trên những
nguyên lý riêng
Có 4 nguyên lí tạo thành nền tảng cho sinh học hiện đại:
Tế bào là đơn vị căn bản của sự sống
Trang 6SINH HỌC
Khái niệm:
Tiến hóa là động lực cho việc hình thành các loài mới và
đa dạng sinh học
Trang 7SINH HỌC
Khái niệm:
Gene là đơn vị cơ bản của di truyền
Trang 9SINH HỌC
Khái niệm:
Các hướng nghiên cứu sinh học theo Campbell: Hóa học sự sống
Trang 10SINH HỌC
Khái niệm:
Các hướng nghiên cứu sinh học theo Campbell:
Tế bào
Trang 11SINH HỌC
Khái niệm:
Các hướng nghiên cứu sinh học theo Campbell:
Di truyền học Các cơ chế tiến hóa
Trang 12SINH HỌC
Khái niệm:
Các hướng nghiên cứu sinh học theo Campbell: Lịch sử tiến hóa của đa dạng sinh học
Trang 13SINH HỌC
Khái niệm:
Các hướng nghiên cứu sinh học theo Campbell:
Hình thái và chức năng động vật Hình thái và chức năng thực vật
Trang 15Sinh lý thực vật Sinh lý động vật
Hệ thống học và tiến hóa Tài nguyên & Môi trường Tin sinh
Trang 16ỨNG DỤNG TIN HỌC TRONG SINH HỌC
Sử dụng các công cụ, phương tiện của tin học trong các lĩnh vực của sinh học Nhằm:
Vận hành công việc tốt, theo quy chuẩn và xu hướng chung Lưu trữ thông tin
Xử lý các dữ liệu thực nghiệm nhanh chóng, chính xác
Trao đổi, quảng bá thông tin
Tìm, khai thác thông tin
Trang 17Sinh lý thực vật Sinh lý động vật
Hệ thống học và tiến hóa Tài nguyên & Môi trường Tin sinh
Trang 18TIN SINH HỌC
Tin sinh học (bioinformatics) là một lĩnh vực khoa học
sử dụng các công nghệ của các ngành toán ứng
dụng, tin học, thống kê, khoa học máy tính, trí tuệ
nhân tạo, hóa học và hóa sinh (biochemistry) để giải
quyết các vấn đề sinh học
Trang 20TIN SINH HỌC
Tin sinh học đƣợc sử dụng để phân tích in silico các vấn đề sinh học thông qua các thuật toán và thống kê.
Trang 21NỘI DUNG CHÍNH CHƯƠNG TRÌNH
SỬ DỤNG CÔNG CỤ TIN HỌC PHỤC VỤ CÔNG VIỆC TỔNG QUÁT
TIN SINH HỌC
SỬ DỤNG MỘT SỐ PHẦN MỀM ĐÁP ỨNG CHO VIỆC PHÂN TÍCH DỮ LIỆU DNA PHỤC
VỤ CÁC MỤC TIÊU CỤ THỂ
Trang 22Excel: xử lý dữ liệu, chuyển đổi
Giới thiệu một số phần mềm xử lý thống kê số liệu
Trang 23Tìm kiếm thông tin
Các website cần quan tâm
Trang 24TIN SINH HỌC
Đặc điểm dữ liệu công nghệ sinh
học
Một số cơ sở dữ liệu công nghệ
sinh học lớn của thế giới
Trang 25Các cơ sở dữ liệu đặc thù
http://www.pdb.org/pdb/home/home.do http://www.dna.affrc.go.jp/database/
http://www.plantgdb.org/
http://soybeanbreederstoolbox.org/
Trang 26Làm quen với trình tự DNA và công cụ phân tích trình tự Chromas
Trang 27Tìm, đọc dữ liệu cụ thể trên NCBI
Trang 28Đăng ký trình tự với Công cụ đăng ký Sequin
Trang 29Tìm trình tự tương đồng bằng công cụ BLAST
Trang 30Giới thiệu để nâng cao
Trang 31SỬ DỤNG MỘT SỐ PHẦN MỀM ĐÁP ỨNG CHO VIỆC PHÂN TÍCH DỮ LIỆU DNA PHỤC VỤ CÁC
Trang 32PHÂN TÍCH PHYLOGENY
Sử dụng phần mềm Mega 6
Trang 33PHÂN TÍCH TƯƠNG ĐỒNG/ KHOẢNG CÁCH DI TRUYỀN
Trang 35SỬ DỤNG CÔNG CỤ TIN HỌC OFFLINE PHỤC VỤ CÔNG VIỆC TỔNG QUÁT
CÁC CHƯƠNG TRÌNH CẦN LƯU Ý
Trang 36- Luận văn tốt nghiệp
+ CHUYỂN ĐỔI SANG PDF
+ GIỮ HÌNH ẢNH
+ CHUẨN BỊ/TƯ LIỆU HÓA DỮ LIỆU CHO
CÁC CHƯƠNG TRÌNH KHÁC
Trang 37CẦN LƯU Ý
TRONG:
+ SOẠN THẢO VĂN BẢN
- Font chữ, cánh gõ văn bản (telex vs VNI)
- Chữ viết tắt
File Word Options Proofing Auto Correct Options
- Các phím tắt chức năng (tham khảo từ internet)
- Chỉnh sửa chính tả tiếng Anh
+ CHUYỂN ĐỔI SANG PDF
- Sẽ giảm dung lượng
- Không muốn ai sửa, tránh thay đổi định dạng có trước
Trang 38CẦN LƯU Ý
TRONG:
+ GIỮ HÌNH ẢNH
-Nén ảnh: ảnh được chọn và tất cả các ảnh nhằm: giảm dung lượng(áp dụng cho cả ppt)
+ CHUẨN BỊ/TƯ LIỆU HÓA DỮ LIỆU CHO CÁC CHƯƠNG TRÌNH KHÁC
+ CÁCH CHIA CHƯƠNG MỤC, ĐÁNH SỐ TRANG
+ KHỔ GIẤY, LỀ
+ HỆ ĐƠN VỊ ĐO
- Đôi khi cần thiết để thao form quy định
+ MỘT TRÌNH KHÁC YẾU HƠN NHƯNG SỬ DỤNG NHIỀU TRONG SINH HỌC LÀ NOTEPAD
Trang 39PDF Adobe
+ ĐỌC TÀI LIỆU
+ CHUẨN BỊ TÀI LIỆU
+ BÁO CÁO, TIỂU LUẬN, LUẬN VĂN, LUẬN ÁN
+ LÀM POSTER
Trang 40+ LUẬN ÁN, TIỂU LUẬN…
-Chỉ chuyển sang định dạng này khi đã được sửa chữa đầy đủ+ LÀM POSTER
-Cách thức: làm trong Word trước cho phần thiết kế, dàn dựng, sau đó chuyển sang PDF
- Có thể làm ở mọi khổ giấy nhưng khi ra tiệm in thì người ta vẫn chấp nhận in ra bản lớn từ file với định dạng khổ giấy bé+ MỘT SỐ PHIÊN BẢN WORD KHÔNG CÓ TÍNH NĂNG LƯU SANG PDF
Trang 41CÁC CHƯƠNG TRÌNH LIÊN QUAN HÌNH ẢNH
PAINT
+ Công cụ sẳn có, không
phải cài đặt
Microsoft Office picture manager + Công cụ phổ biến
Photoshop
+ Phải cài đặt
Trang 42+ Công cụ phổ biến + Có thể cắt ảnh + Lấy sáng tối, tương phản
+ Điều chỉnh tự động
Photoshop
+ Phải cài đặt + Có thể đưa thêm chữ chú thích trực tiếp
+ Chất lượng hình ảnh cao
+ Lưu được hình dưới nhiều định dạng
+ MỌI CHỈNH SỬA ANH ĐỀU CÓ THỂ NHẬN RA CHO DÙ TAY NGHỀ THỢ CAO ĐẾN ĐÂU!!!
+ NÊN QUẢN LÝ Ảnh Ở ĐỊNH DẠNG JPG HOẶC JPEG
Trang 43MICROSOFT POWERPOINT
+ CHUYÊN ĐỂ TRÌNH CHIẾU
+ PHỤC VỤ BÁO CÁO, TRÌNH BÀY
Trang 44-Dạng file trình bày này không dùng để in
+ KHÔNG SỬ DỤNG HIỆU ỨNG NẾU KHÔNG THỰC SỰ CẦN THIẾT
- Khi trình bày xong, người nghe có thể cần xem lại, sẽ rất mất công
bỏ qua các hiệu ứng
+ KHÔNG ĐỂ QUÁ NHIỀU CHỮ NẾU KHÔNG CẦN THIẾT
+ BÀI TRÌNH BÀY CÓ THỂ CHUYỂN SANG FILE PDF
+ FILE NẶNG CÓ THỂ NÉN HÌNH
Trang 45MICROSOFT EXCEL
+ CÔNG CỤ SẲN CÓ TRONG BỘ OFFICE
+ QUAN TRỌNG TRONG VIỆC XỬ LÝ SỐ LIỆU,
DỮ LIỆU VỚI NHIỀU NGÀNH, TRONG ĐÓ CÓ SINH HỌC
+ LÀM NỀN CHO VẬN HÀNH CÁC CHƯƠNG
TRÌNH SINH HỌC KHÁC NHƯ GENALEX…
+ CHO PHÉP TỰ THIẾT LẬP CHƯƠNG TRÌNH XỬ
LÝ DỮ LIỆU THÔNG QUA CÔNG THỨC
Trang 46CẦN LƯU Ý
+ LÀM NỀN CHO VẬN HÀNH CÁC CHƯƠNG
TRÌNH SINH HỌC KHÁC NHƯ GENALEX…
- Download chương trình về, chạy tích hợp (add-in)
+ CHO PHÉP TỰ THIẾT LẬP CHƯƠNG TRÌNH XỬ
LÝ DỮ LIỆU THÔNG QUA CÔNG THỨC
-Đòi hỏi phải hiểu, nhớ các hàm
- Cần vững về toán
- Lý thuyết sinh học
Trang 47THỦ THUẬT CẮT DÁN
Sao chép giá trị
- Thực hiện trong nội bộ Excel hay từ Word sang Excel
- Excel sang Word: nghiễm nhiên
Sao chép cả công thức
Sao chép thành hình ảnh
- Khi ứng dụng chọn kiểu hình ảnh sao cho thích hợp
- Xuất phát điểm: hình ảnh lồng trong bảng, bảng số liệu…Sao chép đảo hàng, cột
Trang 48CẦN LƯU Ý
+ LIÊN QUAN ĐẾN ĐA DẠNG DI TRUYỀN QUẦN THỂ: GIỚI THIỆU SAU, SANG MỘT PHẦN KHÁC+ Ở PHẦN NÀY GIỚI THIỆU: SỬ DỤNG CÔNG
CỤ EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/BÀI TOÁN SINH HỌC
Trang 49EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
CÂU HỎI 1:
Tìm giá trị trung bình cộng, lớn nhất, nhỏ nhất và số lƣợng các ô có dữ liệu
số trong tập hợp dữ liệu theo hàng, cột hay khối
CÁCH LÀM:
+ Dễ
+ Quét phần cần xác định
+ Sử dụng hàm:
- Trung bình cộng: AVERAGE (vùng quét)
- Giá trị lớn nhất: MAX (vùng quét)
- Giá trị nhỏ nhất: MIN (vùng quét)
- Số lƣợng các ô có dữ liệu số: COUNT (vùng quét)
Trang 50EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
CÂU HỎI 2:
Những hàm căn bản nào cần lưu ý khi làm về sinh học
ĐÁP ÁN:
+ Ngoài mấy hàm ở câu 1, cần lưu ý:
-LN (x): Logarit tự nhiên của x
-LOG (x, cs): Logarit cơ số cs của x
-LOG10 (x): Logarit cơ số 10 của x
Trang 51EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
BÀI TOÁN 3:
Số cá thể trong quần thể chuột tại Lâm Đồng trong 10 năm gần đây:-5 năm đầu tăng 110%
-3 năm tiếp tăng 115%
-2 năm sau tăng 125%
Mức tăng trưởng trung bình năm =?
Trang 52EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
BÀI TOÁN 4:
Chiều cao thông Đà Lạt (m)
Thống kê, nêu các đặc trƣng của bộ dữ liệu này
GIẢI PHÁP:
DÙNG CÔNG CỤ THỐNG KÊ MÔ TẢ TRONG TOOLS/DATA ANALYSIS
12 13 11 13 15 12 11 10 14 13 12 15
Trang 53EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
BÀI TOÁN 5:
Thử thuốc ngủ, tính giờ ngủ 10 người
Với mức ý nghĩa α = 0,05, kết luận gì về thuốc ngủ sử dụng
GIẢI PHÁP:
DÙNG CÔNG CỤ t-test: Paired Two Sample for Means
TRONG TOOLS/DATA ANALYSIS
Trang 54EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
BÀI TOÁN 6:
Lƣợng hoạt chất trong dƣợc liệu tại 3 vùng:
Hàm lƣợng hoạt chất có khác nhau giữa các vùng???
GIẢI PHÁP:
DÙNG CÔNG CỤ ANOVA: Single factor
TRONG TOOLS/DATA ANALYSIS
Trang 55EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
BÀI TOÁN 7:
Trồng cây với 3 chế độ tưới, 5 công thức phân, thu năng suất củ
Ảnh hưởng chế độ tưới và phân với α = 0,01
GIẢI PHÁP:
DÙNG CÔNG CỤ ANOVA: Two factor without replication
TRONG TOOLS/DATA ANALYSIS
Chế độ tưới (B) Chế độ phân (A)
Trang 56EXCEL GIẢI QUYẾT MỘT SỐ CÂU HỎI/
BÀI TOÁN SINH HỌC
DÙNG CÔNG CỤ ANOVA: Two factor with replication
TRONG TOOLS/DATA ANALYSIS
Trang 57MỘT SỐ PHẦN MỀM XỬ LÝ SỐ LIỆU SINH HỌC
Trang 59SỬ DỤNG CÔNG CỤ TIN HỌC PHỤC VỤ
CÔNG VIỆC TỔNG QUÁT ONLINE
Khái niệm internet
Sử dụng internet:
Tìm kiếm thông tin
Các website cần quan tâm
Trang 60Hệ thống gồm nhiều mạng máy tính cục bộ hay khu vực đƣợc kết nối lại thành mạng chung trên phạm vi toàn cầu (Networks of the Networks)
Nhiều triệu máy tính kết nối nhau, bình đẳng và chia sẽ thông tinTrở ngại về không gian bị vƣợt qua
Internet: Sự kết nối đa chiều của các mạng diện rộng (Widw Area Network-WAN) của quốc gia, khu vực
WAN: sự kết nối của nhiều mạng hẹp hơn (Local Area Network –LAN)
LAN: mạng kết nối các máy tính/cụm máy tính
INTERNET: CƠ SỞ DỮ LIỆU KHỔNG LỒ
Trang 61CƠ SỞ DỮ LIỆU INTERNET
THÔNG TIN CÔNG CỘNG
Mọi người từ mọi nơi, khi vào Internet đều có thể truy cập
Điển hình: WWW (World Wide Web)
Ví dụ: http://www.vnn.vn
THÔNG TIN GIỚI HẠN TRUY CẬP
Muốn truy cập phải được sự đồng ý của chủ sở hữu
Trả tiền mới truy cập
Có độ bảo mật (tên, mật khẩu truy cập)
Ví dụ: Thời khóa biểu giảng viên trường Đại học Đà Lạt
Trang 62DỊCH VỤ TRÊN INTERNET
TRUY CẬP, KHAI THÁC THÔNG TIN TỪ XA
Tên, mật khẩu truy cập
Tên truy cập Gắn liền với website com, biz, org, dlu.edu.vn…
Trang 63TRUY CẬP TÌM DỮ LIỆU THÔNG QUA
INTERNET
TÌM KIẾM THÔNG TIN
Nổi tiếng và hữu dụng nhất: www.google.com, www.yahoo.com
TÌM KIẾM THÔNG TIN, TÀI LIỆU CẦN LƯU Ý
- Nguồn thông tin: đảm bảo tính chính thống
- Sử dụng từ khóa một cách tinh tế
- Tận dụng các nguồn, mã truy cập để có tài liệu chính thống
- Chính thống: có người chịu trách nhiệm, báo thuộc hệ thống SCI, ISCI, ISI…
- Wikipedia: giáo khoa online nhưng đôi lúc không chính thống
Trang 64TRUY CẬP TÌM DỮ LIỆU THÔNG QUA INTERNET
XUNG ĐỘT THÔNG TIN
Trang 65TRUY CẬP TÌM DỮ LIỆU THÔNG QUA
INTERNET
TRÌNH DUYỆT ĐỂ TRUY CẬP
Nhiều trình duyệt
Trang 66TRUY CẬP TÌM DỮ LIỆU THÔNG QUA INTERNET
TRÌNH DUYỆT ĐỂ TRUY CẬP, LẬP ẢNH BẢN ĐỒ
Google Earth
Ghi tọa độ bằng GPS, về tìm địa điểm trên Google Earth
GPS đôi khi không chính xác, căn cứ địa hình mà điều chỉnh tọa độ
Trang 67CÁC WEBSITE CẦN QUAN TÂM
MỘT SỐ WEBSITE LIÊN QUAN ĐẾN SINH HỌC
Link từ:
http://www.onlineuniversities.com/blog/2010/01/100-best-reference-sites-for-science-students/
Trang 68CÁC WEBSITE CẦN QUAN TÂM
Trang 69TRUY CẬP TÌM DỮ LiỆU THÔNG QUA
INTERNET
KÊNH KHÔNG CHÍNH THỐNG NHƢNG…
Trang 70TIN SINH HỌC
Tin sinh học (bioinformatics) là một lĩnh vực
khoa học sử dụng các công nghệ của các ngành toán ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học và hóa sinh (biochemistry) để giải quyết các vấn
đề sinh học
Trang 71Đặc điểm dữ liệu công nghệ sinh học
Thông tin không biên giới
Xử lý thông tin cực nhanh với các thuật toán, hỗ trợ của máy tính
Dữ liệu sơ cấp: thu đƣợc từ phân
tích trực tiếp nhƣ đặc tính, cấu
trúc enzyme, đa dạng sinh học,
trao đồi chất… Dữ liệu thứ cấp: thu đƣợc
dựa trên phân tích, khái quát hóa
Trang 72Một số cơ sở dữ liệu công nghệ sinh học lớn của thế giới
NCBI – National Centre for Biotechnolgy Informatic
Mỹ, từ 1988 Lớn nhất và chính yếu nhất
Kết nối full
Trang 73Một số cơ sở dữ liệu công nghệ sinh học lớn của thế giới
NCBI – National Centre for Biotechnolgy Informatic
Trang 74NCBI – National Centre for
Trang 75Một số cơ sở dữ liệu công nghệ sinh học lớn của thế giới
EMBL– European Molecular Biology Laboratory
Liên kết các phòng thí nghiệm 17 nước, 5 trung tâm lớn
Link chặt với NCBI & DDBJ
Trang 76Một số cơ sở dữ liệu công nghệ sinh học lớn của thế giới
EMBL– European Molecular Biology Laboratory
Công cụ
Dữ liệu cấu trúc DNA (Có từ năm 1998)
Dữ liệu cấu trúc Protein (1986)
Trang 77Một số cơ sở dữ liệu công nghệ sinh học lớn của thế giới
DDBJ– DNA Data Bank of Japan thuộc Japan national Institute of Genetics
Một trong ba cơ sở dử liệu lớn, liên kết chặt với NCBI và EMBL
Trang 78Các cơ sở dữ liệu đặc thù
http://www.pdb.org/pdb/home/home.do http://www.dna.affrc.go.jp/database/
http://www.plantgdb.org/
http://soybeanbreederstoolbox.org/
Trang 79TÌM GÌ TRÊN CÁC CƠ SỞ DỮ LIỆU
SÁCH, TÀI LIỆU, BÀI BÁO, THÔNG TIN THÔNG THƯỜNG
Công trình đã công bố: http://www.ncbi.nlm.nih.gov/Pubmed/
Dữ liệu y học- dược: http://embase.com
Cơ sở dữ liệu nông nghiệp:
http://nalusda/general info/agricola/agricola.html
Cơ sở dữ liệu cổ sinh học, động vật hoang dã: http://biosis/org
Cơ sở dữ liệu bệnh học nông nghiệp: http://www.cabi.org
Cơ sở dữ liệu Phân loại: http://www.ncbi.nlm,nih.gov/taxonomy
Cơ sở dữ liệu hệ thống thông tin phân loại các giới:
http://www.itis.usda.gov/itis
Cơ sở dữ liệu của các tổ chức quốc tế cho các thông tin chung về thực vật: http://www.iopi.csu.edu.au.iopi/
Trang 80TÌM GÌ TRÊN CÁC CƠ SỞ DỮ LIỆU
DỮ LIỆU VỀ CẤU TRÚC VÀ ĐẶC TÍNH NUCLEOTIDE VÀ GENOME:
(MỘT TRONG HAI MẢNG LỚN, PHONG PHÚ CỦA CÁC
Trang 81TÌM GÌ TRÊN CÁC CƠ SỞ DỮ LIỆU
DỮ LIỆU VỀ CẤU TRÚC VÀ ĐẶC TÍNH PROTEIN:
(MỘT TRONG HAI MẢNG LỚN, PHONG PHÚ CỦA CÁC
CƠ SỞ DỮ LIỆU)
Thông tin về protein:
Resources PIR: http://www.nbrf.Georgetowwn.edu
Trang 82BÀI THỰC HÀNH TIN SINH HỌC 1
THAO TÁC ĐƠN GIẢN
LÀM QUEN VỚI TRÌNH TỰ DNA BẰNG PHẦN MÊM CHROMAS
Trang 83Làm quen với trình tự DNA và công cụ
phân tích trình tự Chromas
Các bước tiến hành – XEM NHƯ MỘT BÀI THỰC HÀNH
Download phần mềm Chromas miễn phí tại:
– http://technelysium.com.au/wp/
Bật chương trình, giao diện như sau:
Trang 84Làm quen với trình tự DNA và công cụ
phân tích trình tự Chromas
Mở 1 file trình tự DNA được tạo ra bởi một máy đọc trình tự File cótên: pGEM_(ABI) A01.ab1
File này được gửi vào: email nào tùy
Quan sát, mô tả trình tự và trả lời các câu hỏi sau :
1 Trình tự pGEM có bao nhiêu nucleotide? Trình tự đọc được có bị nhiễu hay không? Thế nào là tín hiệu nhiễu ?
2 Có bao nhiêu nucleotide không xác định được trong chuỗi trình tự? Làm thế nào để xác định được chính xác các nucleotide này? Các nucleotide bị nhiễu có xu hướng phân bố ở đâu trong chuỗi trình tự? Hãy giải thích tại sao?
3 Hãy cho biết chương trình Chromas để làm gì?
Trang 85ĐÁP ÁN
1.1345 nucleotide Trình tự đọc được bị nhiễu, nghĩa là có xuất hiện những peak chồng lắp dẫn đến không xác định được loại nucleotide nào ở tại một số vị trí.
2 59 nucleotide không xác định được trong chuỗi trình tự Muốn xác định chính xác thì tiến hành giải trình tự lại, có thể nhiều lần và giải trình tự 2 chiều Các nucleotide bị nhiễu có xu hướng phân bố ở đầu và cuối trình tự do khi điện di các sản phẩm khuếch đại trong quá trình giải trình tự thì các sản phẩm trọng lượng quá nhỏ hay quá lớn thường trượt bất thường dẫn đến tín hiệu huỳnh quang không rõ ràng.
3.Chương trình Chromas là chương trình đa chức năng : copy trình tự dạng text hay FASTA, tìm các trình tự nhiễu, đảo ngược sắc ký đồ, tìm đoạn trình tự …
Trang 86BÀI THỰC HÀNH TIN SINH HỌC 2
Làm quen với CSDL ngân hàng gene (GenBank)
Các CSDL đặc thù
Trang 87Làm quen với CSDL ngân hàng gene
Trang 89Làm quen với CSDL ngân hàng gene (GenBank)
Truy cập vào trang web http://www.ncbi.nlm.nih.gov/
Gene mã hóa cho enzyme alpha amylase ở Bacillus subtilis 168 có
gene ID là 938356, locus tag là: BSU03040, số truy cập: AL009126 Hãy sử dụng CSDL của ngân hàng gene NCBI để trả lời các câu hỏi sau:
– Thông tin tóm tắt về gene này? (bao gồm gene symbol, gene
description, locus tag, gene type, RefSeq status, organism,
lineage) Kích thước của gene (coding sequence)?
Trong phần CSDL nucleotide, hãy tìm 5 trình tự có số truy cập là:
AJ223768, AJ223771, AJ223769, AJ223772, AJ223770.
Hãy cho biết: Thông tin về trình tự tìm được, trình tự DNA này có điểm gì đặc biệt? Cho biết trong số các trình tự trên, trình tự nào có chứa các cặp nucleotide TG, AG và GA được lặp lại nhiều lần Hãy cho biết các giá trị i, j và k trong các trình tự đó [(TG)i, (AG)j và
(GA)k]?