Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 2 – cơ sở dữ liệu CSDL sinh học phân tử, • Kỹ năng: Sử dụng được một số phần mềm thông dụng trong việc: – so sánh các trìn
Trang 1TIN SINH HỌC ĐẠI CƯƠNG
(Introduction to Bioinformatics)
PGS.TS Trần Văn Lăng Email: langtv@vast.vn
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY
MỤC TIÊU MÔN HỌC
• Kiến thức: tin học ứng dụng trong công nghệ sinh học như:
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 2
– cơ sở dữ liệu (CSDL) sinh học phân tử,
• Kỹ năng: Sử dụng được một số phần mềm
thông dụng trong việc:
– so sánh các trình tự,
– phân tích trình tự,
– cây phát sinh loài,
– truy cập đến các CSDL sinh học lớn để tìm kiếm
sự tương đồng giữa các trình tự sinh học
• Định hướng nghề nghiệp: Giải quyết những vấn đề của sinh học phân tử đặt ra cho:
– công nghệ sinh học, – y học,
– dược liệu học
Trang 2Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 5
• Phương pháp gióng hàng (bắt cặp) hai và nhiều trình tự sinh học như ClustalX,
• Phương pháp BLAST trong việc tìm kiếm sự tương đồng các trình tự sinh học từ các ngân hàng trình tự nhằm dự đoán chức năng cho trình tự mục tiêu
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 6
• Cách thức sử dụng một số
phần mềm thông dụng đề thiết
kế mồi, lập bản đồ enzyme, về
cây phát sinh loài
• Một số hướng nghiên cứu mới
trong lĩnh vực Tin sinh học
đang được thế giới quan tâm
TÀI LIỆU HỌC TẬP
• Trần Linh Thước, et al,
Thực tập Bioinformatics, tài liệu lưu hành nội bộ của Khoa Sinh học, Trường ĐHKHTH, 2012
Trang 3TÀI LIỆU ĐỌC THÊM
• Trần Văn Lăng, Ứng
dụng Tin học trong việc
giải quyết một số bài
toán của Sinh học phân
tử Nxb Giáo dục,
2008, 230tr
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 9
TÀI LIỆU ĐỌC THÊM
• Nguyễn Văn Cách, Tin – Sinh học, Nxb Khoa học
Kỹ thuật, 2008, 144tr (eBook)
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 10
TÀI LIỆU THAM KHẢO
• Robert John, Introduction to Bioinformatics
Trang 4• A.D Baxevanis, B.F F Ouellette,
Bioinformatics: A practical guide to the
analysis of genes and proteins, Third
Edition, 2005, http://books.google.com.vn
• Cynthia Gibas, Per Jabeck, Developing
Bioinformatics Computer Skills O’Reilly &
Associates, Inc., USA, 2001,
Trang 5AnnHyb
• http://www.bioinformatics.org/annhyb
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 17
BioEdit http://www.mbio.ncsu.edu/BioEdit/bioedit.html
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 18
http://www.bioinformatics.org/sms2
GIỚI THIỆU VỀ TIN SINH HỌC
Chương 1:
Trang 6Who am I ?
• Assoc Prof Tran Van Lang, PhD
• Born: 18 Dec 1959, Quang Tri, Vietnam
• Residence: Saigon, Vietnam
• Nationality: Vietnam
• Fields: Computer Science
– High Performance Parallel and Distributed Computing
– Bioinformatics
– Scientific Computation Methods
• Institutions: Vietnam Academy of Science and Technology
• Alma mater:
– HCM University of Natural Science (1977)
– Dorodnitsyn Computing Center (1991)
• And: I have two daughters
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 21
NỘI DUNG
• Lịch sử
• Sự cần thiết
• Một số khái niệm cơ bản
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 22
1.1 Lịch sử
• Một trong những nền tảng cơ bản của sinh
học đó là tế bào (cell)
• DNA chứa các gen mã hóa RNA mà nó sẽ
sinh ra các protein, để từ đó điều chỉnh tất cả
các quá trình phát triển của một sinh vật
• Tất cả cơ thể sống (living thing), bao gồm con người, được tạo thành từ tế bào
• Chẳng hạn, với con người
có khoảng 100 ngàn tỷ
1014 tế bào (100 trilion cells)
Trang 7• Bên trong mỗi tế bào (ngoại trừ hồng huyết
cầu trưởng thành – mature red blood cell) có
nhân (nucleus) chứa tất cả các chỉ thị di
truyền (genetic instruction)
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 25
• Những chỉ thị này là chức
năng của tế bào, và cũng để
phân biệt cá thể này với cá
thể khác
• Mỗi tế bào người có 46 nhiễm sắc thể, được tổ chức thành 23 cặp
• Mỗi nhiễm sắc thể được cấu thành bởi một phân tử DNA dài (gọi là một trình
tự DNA)
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 26
• Trình tự DNA cấu tạo bởi các base A, C, G,
và T
• Những base này bắt cặp và xếp chồng với
nhau tạo thành một dạng thang xoắn gấp
(twisted ladder) hạy một dạng xoắn kép
• Mỗi nhiễm sắc thể có khoảng 30.000 gene
Trang 8• Trong khi đó chúng ta có một
sự hiểu biết quá cơ bản về
trình tự gene mã hóa thành
một protein cụ thể
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 29
• Chúng ta thiếu thông tin cần thiết để hiểu một cách đầy đủ về vai trò của DNA trong những căn bệnh cụ thể, hoặc để hiểu được chức năng của hàng ngàn protein được sản sinh ra
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 30
Ngoài ra,
• Sự đột biến (mutation) là sự thay đổi một hay
nhiều base trong phân tử DNA
• Điều này có thể dẫn đến sự biến đổi đặc
trưng (trait) hoặc dẫn đến bệnh di truyền
– Chẳng hạn, màu mắt
• Sự đột biến có thể được chuyển xuống các thế hệ sau từ cha mẹ
• Chẳng hạn, có đột biến ở nhiễm sắc thể số 7 trong tế bào tinh trùng
Trang 9• Nó sẽ mang nhiễm sắc thể có đột biến này
lắm ghép với nhiễm sắc thể số 7 bình thường
của tế bào trứng
• Từ đó tạo ra một tế bào mới, gọi là hợp tử
(zygote), từ đó phát triển thành phôi
(embryo), mà trong đó có đột biến ở nhiễm
sắc thể số 7
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 33
• Vì vậy, càng phong phú càng đa dạng về sự sống đang tồn tại
• Mà hiểu biết của con người lại càng ít ỏi
• Từ đó cần: các phương pháp dùng để tập hợp, lưu trữ, khôi phục, phân tích
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 34
– cách thức tiếp cận để cải thiện việc khám phá thuốc điều trị (drug discovery – no invention)
Trang 10Chức năng chính của tin sinh học
• Xây dựng các ngân hàng dữ liệu để lưu trữ
và quản lý dữ liệu sinh học phân tử
• Tìm ra các phương pháp để xác định mối
quan hệ về mặt sinh học giữa các dữ liệu
• Xây dựng các công cụ để phân tích từ đó có
những hiểu biết rõ hơn về nguồn dữ liệu sinh
học
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 37
LỊCH SỬ PHÁT TRIỂN TIN SINH HỌC
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 38
• 1869: Friedrich Meischer,
người Thụy Sĩ khám phá
ra trong nhân tế bào chất
có tính acid, Ông ta gọi
đò là Nuclein hay Nucleic
acid
• 1891: Albrecht Kossel, người Đức đã thủy phân
Trang 11• 1915: Hai cha con nghiên cứu về tinh thể học, cùng nhận giải Nobel Vật Lý 1915
• Họ có đóng góp trong việc tạo ra X-rays
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 41
(Nguồn: http://http://www.netsci.org)
• 1930: Arne Wilhelm Kaurin Tiselius (Stockholm) sử dụng kỹ thuật điện di (electrophoresis) để đưa ra giải pháp phân tách protein trong luận án tiến sĩ "The moving-boundary method of studying the electrophoresis of proteins" (published in
Nova Acta Regiae Societatis Scientiarum Upsaliensis, Ser IV, Vol 7, No 4)
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 42
• Nhận giải Nobel
về hóa học 1948
• 1951: Linus Carl Pauling và Robert Brainard Corey (US) đề nghị cấu trúc cho xoắn alpha (alpha-helix) và dãi beta (beta-sheet) trong Proc Natl Acad
Sci USA, 27: 205-211, 1951
và Proc Natl Acad Sci USA, 37: 729-740, 1951
• Từ đó có “Pauling-Corey
Trang 12Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 45
• 1952: Alexander R Todd, nhà nghiên cứu sinh hóa người Scotland, tìm ra cấu trúc của đơn vị thành phần Nucleotide của Nucleic acid
• Nhận giải Nobel Hóa học
1957
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 46
• 1953: James Dewey Watson (US) và Francis
Harry Compton Crick (UK) đề nghị mô hình
xoắn kép của DNA
• Mô hình này có được trên cơ sở hình chụp x-ray của DNA được nhận bởi Rosalind Franklin và Maurice Wilkins (Nature, 171:
737-738, 1953)
Trang 13• Watson, Crick, Wilkins nhận giải Nobel Sinh lý học năm 1962
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 49
• 1954: Perutz's group phát triển phương pháp nguyên tử nặng (heavy atom) để giải quyết vấn đề nhiều giai đoạn trong việc mô tả hình thể protein
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 50
• 1955: Frederick Sanger (UK) thông báo trình
tự protein đầu tiên được phân tích - bovine
insulin
• Nhận giải Nobel hóa học 1958, 1980
Trang 14• 1958: (Tin học) Mạch tích hợp điện tử đầu
tiên được xây dựng bởi Jack Kilby (US)
• Nhận giải Nobel Vật lý năm 2000
• Cũng năm 1958, Tổ chức Advanced
Research Projects Agency (ARPA) được
thành lập ở US
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 53 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 54
• 1965: Margaret Belle (Oakley)
Dayhoff (US) khởi động việc
xây dựng tập bản đồ (atlas) của
trình tự và cấu trúc protein
• 1968: (Tin học) Giao thức mạng chuyển mạch gói (packet-switching network protocols) được trình diễn bởi ARPA
Trang 15• 1969: Mạng ARPANET được tạo ra bằng
cách nối các máy tính của Stanford
University, UCSB, The University of Utah và
UCLA lại với nhau
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 57
• 1970: Chi tiết của thuật toán Wunsch về việc so sánh các trình tự được xuất bản
Needleman-Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 58
• 1971: Raymond Samuel Tomlinson phát
minh ra email, hiện thực đầu tiên trên mạng
ARPANET
• 1972: Phân tử DNA tái tổ hợp (recombinant DNA) đầu tiên được tạo ra bởi Paul Berg (US) và nhóm của ông ta
• Margaret Dayhoff xây dựng Protein Sequence Database (PSD)
Trang 16Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 61
• 1973: Protein Data Bank ở Brookhaven National Laboratories được công bố (Acta
Cryst B, 1973, 29: 1746)
• 1973: Stanley Cohen phát minh ra việc nhân bản DNA Nhận giải Nobel Y khoa 1986
• 1973: Robert Melancton Metcalfe (US) đưa
ra Ethernet trong luận án tiến sĩ của mình
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 62
• Stanley Cohen nhận giải Nobel Y học 1986
• 1974: Vint Cerf và Robert Kahn phát triển khái niệm kết nối mạng các máy tính thành "internet”; đồng thời phát triển giao thức TCP Transmission Control Protocol TCP)
Trang 17• 1975: Microsoft Corporation được thành lập
bởi Bill Gates và Paul Allen
• 1975: E M Southern công bố phương pháp
để phát hiện của một chuỗi DNA cụ thể trong
các mẫu DNA gọi là Southern Blot (J Mol
Biol., 98: 503-517, 1975)
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 65
• 1980: Trình tự gene đầy đủ đầu tiên của một sinh vật (Bacteriophage FX174) được công bố; nó bao gồm 5.386 cặp base trong đó có
9 mã protein
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 66
• 1981: Thuật toán Smith-Waterman về việc
bắt cặp trình tự (sequence alignment) được
công bố
• 1981: IBM giới thiệu máy tính cá nhân
(Personal Computer) ra thị trường
• 1983: Phản ứng PCR (Polymerase Chain Reaction) được mô tả bởi Kary Banks Mullis (US, nhận giải Nobel Hóa học 1993) và đồng nghiệp
Trang 18Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 69
• 1984: Hãng Apple công bố máy tính Macintosh
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 70
• 1985: Thuật toán FASTP được công bố bởi
Lipman và Pearson
• National Center for Biotechnology
Information (NCBI) được thành lập
• 1986: Thuật ngữ "Genomics" xuất hiện lần đầu tiên để mô tả các nguyên tắc khoa học của việc sắp xếp (mapping), phân tích trình
tự gen Thuật ngữ này được đặt ra bởi Thomas Roderick thông qua tên của một tạp chí
• Cơ sở dữ liệu SWISS-PROT được tạo bởi Department of Medical Biochemistry, University of Geneva và European Molecular Biology Laboratory (EMBL)
Trang 19• 1987: Perl (Practical Extraction Report
Language) được đưa ra bởi Larry Wall
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 73
• 1988: Bản đồ vật lý của E.coli được công bố
• Sáng kiến về dự án gene người được khởi động
• Thuật toán FASTA để so sánh trình tự được công bố bởi Pearson và Lipman
• Des Higgins, Paul Sharpe thông báo phát triển phần mềm CLUSTAL
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 74
• 1990: Chương trình BLAST program
(Altschul, et al.) được hiện thực
• Đặc tả HTTP 1.0 được công bố Tim
Berners-Lee công bố văn bản HTML đầu
Trang 20• 1992: Human Genome Systems được hình
thành bởi William Haseline
• The Institute for Genome Research (TIGR)
được thành lập bởi Craig Venter ở Rockville
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 77
• 1994: The PRINTS database of protein motifs được công bố bởi Attwood và Beck
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 78
• 1995: Sun Microsystems đưa ra version 1.0
của ngôn ngữ Java Sun và Netscape đưa ra
version 1.0 của JavaScript
• Haemophilus influenzea và Mycoplasma
genitalium genome được giải trình tự
• 1996: Affymetrix là chip DNA thương mại đầu tiên
Trang 21• 1997: The genome for E
coli (4.7 Mbp) được công
bố
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 81
• 1998: The Swiss Institute of Bioinformatics được thành lập như một tổ chức phi lợi nhuận
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 82
• 2001: The human
genome (3.000 Mbp)
được công bố
Trang 22Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 85
• Mỗi tế bào là một nhà máy sản xuất và xuất khẩu sản phẩm là các phân tử
• Chẳng hạn, insulin được sản xuất và xuất vào máu
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 86
• Các tín hiệu hóa học được gọi là tín hiệu dẫn
truyền thần kinh được gửi từ một tế bào thần
kinh này đến tế bào thần kinh khác
• Các phân tử này được vận chuyển xung
quanh tế bào trong các gói nhỏ được gọi là
túi Họ đã phát hiện ra các nguyên lý phân tử
quản lý cách thức vận chuyển hàng hóa đến
đúng nơi và đúng lúc trong tế bào [http://
Trang 23MỘT SỐ KẾT QUẢ GẦN ĐÂY
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 89
• Tạo ra phôi người: Tháng 3/2013
– Shoukhrat Mitalipov, một nhà nghiên cứu của Oregon Health & Science University, tại Mỹ, cùng các đồng nghiệp đã áp dụng kỹ thuật nhân bản vô tính để tạo ra phôi thai người
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 90
– Lấy các tế bào da trên cơ thể
trứng phát triển thành phôi thai
– Từ đó tế bào gốc được chiết xuất
ra
• Nhóm này đã lấy tế bào gốc trên phôi thai và kiểm tra
• Mitalipov thông báo: kết quả cho thấy những
tế bào gốc đó có thể biến thành mọi loại tế bào như tế bào thần kinh, tế bào gan và tế bào tim
Trang 24• Giới khoa học lấy tế bào gốc, hay tế bào
mầm từ phôi thai người Tuy nhiên, một bộ
phận học giả và dư luận phản đối việc khai
thác tế bào gốc từ phôi thai vì cho rằng đó là
hành động vô đạo đức
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 93
• Vì thế, trong nhiều năm qua, các nhà khoa học đã cố gắng tìm kiếm những giải pháp để tạo ra nguồn cung cấp tế bào mầm khác để thay thế phôi thai
– Kết quả của nhóm ở Đại học Y tế và Khoa học Oregon có giá trị do cách tiếp cận này
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 94
Shinya Yamanaka và John
Gurdon đoạt giải Nobel Y học 2012 khám phá sự tái
lập trình của tế bào (tái tạo) để trở thành đa năng
• Ngày 18/6/2013, TS Tak Mak, Canada cho biết nhóm nghiên cứu của ông (tại Princess Margaret Cancer Centre) phát triển thuốc CFI-400.945
Trang 25• Thuốc này có tác dụng gây ức chế PLK4,
một loại enzyme có vai trò quan trọng trong
việc phân chia tế bào, đặc biệt là các tế bào
ung thư
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 97
• 28/6/2013: Nhóm nghiên cứu tại Trung tâm Riken BioResource, TP Tsukuba, tỉnh Ibaraki, Nhật Bản dẫn đầu bởi nhà khoa học Atsuo Ogura
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 98
Đã dùng một tế bào máu trong hệ tuần hoàn của một chú chuột để tạo ra bản sao của chính nó
• Kỹ thuật: lấy máu từ đuôi một con chuột rồi
phân lập bạch huyết cầu, sau đó chuyển
nhân của bạch huyết cầu sang một tế bào
đa năng cho một phụ nữ khoảng 70 tuổi
• Đây là lần đầu tiên các tế bào gốc đa năng được đưa vào cơ thể người thông qua phẫu thuật
Trang 26• Tế bào gốc đa năng (iPS), một dạng tế bào
gốc do GS Shinya Yamanaka phát triển, có
thể sinh trưởng để thành các mô khác nhau
trên cơ thể người
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 101
VIỆT NAM
Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 102
Việt Nam
• Đầu tháng 7/2012, Bộ Khoa học và Công
nghệ sẽ tài trợ cho "Dự án khả thi giải trình tự
và phân tích bộ gen người Việt Nam" do Viện
Khoa học và Công nghệ Việt Nam (Vietnam
Academy of Science and Technology -
VAST) thực hiện
Việt Nam
• Viện Hàn lâm Khoa học và Công nghệ Việt Nam thành lập Viện Nghiên cứu hệ gen (06/8/2012), do PGS.TS Nông Văn Hải làm viện trưởng