2 Tóm tắt các kết quả nghiên cứu chính của đề tàiKết quả khoa học: Đề tài đã tìm hiểu và nghiên cứu bài toán sắp xếp cặp đôi với phép đảo chỗ hay còn gọi là bắt cặp trình tự hệ gen với
Trang 1Chủ nhiệm đề tài: 16 Lê Sỹ Vinh
ĐẠ! HỌC Q UỐC GIA HÀ NỘI TRUNS TẨM THÔNG TIN THƯ VIÊN
H à Nội, 2010
Trang 2Mục lục
1 Danh sách những người tham gia thực hiện đề tài 2
2 Tóm tắt các kết quả nghiên cứu chính của đề tài 3
3 Báo cáo’tổng kết 4
3.1 Đặt vấn đề 4
3.2 Tổng quan vấn đề nghiên cứ u 4
3.3 Mục tiêu 6
3.4 Phương pháp đề xuất .7
3.4.1 Cơ sở lý thuyết 7
3.4.2 Các phương pháp hiện tạ i 8
3.4.3 Phương pháp đề xuất 11
3.4.4 Kết quả 13
3.5 Địa điểm, thời gian 13
ị Tài liệu tham k h ảo 14
I -V HOC QUÕC GIA HA NỘI TPƯNG TÂM THÒNG TIN THU VIỆN
1 O O O Ẽ 0 0 0 0 0 o i l
I
Trang 3l.Danh sách những người tham gia thực hiện đ ề tà i
2
Trang 42 Tóm tắt các kết quả nghiên cứu chính của đề tài
Kết quả khoa học: Đề tài đã tìm hiểu và nghiên cứu bài toán sắp xếp cặp đôi với phép đảo
chỗ (hay còn gọi là bắt cặp trình tự hệ gen với phép đổi chỗ) Chúng tôi đê xuât một phương
pháp mới giải quyết bài toán ừên với độ phức tạp là o (n2) so với độ phức tạp của các thuật
toán hiện tại là o (n 4) Kết quả thực nghiệm với dữ liệu thật và dừ liệu mô phỏng cho thấy phương pháp mói cho kết quả tốt nhất cả về độ chính xác và thời gian chạy so với các phương pháp hiện tại Kết quà nghiên cứu được trình bày trong báo cáo khoa học với tiêu đê
“FS: A Fast Algorithm for Genome Rearrangements”, đã được chấp nhận đàng tại hội nghị quốc tế “International conference on Bioinformatics, Computational biology- Genomics, and Chemoinformatics” vào 12-14/7/2010 tại thành phố Florida, Hoa Kỳ 'http://www.promoteresearch.org/201 o/bcbgc/index.html)
'íết quả phục vụ thực tế: Đề tài đã xây dựng phần mềm cho phép các nhà khoa học (đặc biệt
ác nhà sinh học) phân tích toàn bộ hai hệ gen có kích thước vừa và nhỏ Đây là sàn phâm đáu
ên có chức năng như vậy ừên thế giới
et quả đào tạo: M ột khóa ỉuận tốt nghiệp với kết quả xuất sắc.
3
Trang 53 Báo cáo tổng kết
Đ ặt vấn đề
Với sự phát triển nhanh chóng của công nghệ sinh học, đặc biệt là công nghệ giải mã gen cũng như toàn bộ hệ gen, một lượng lớn hệ gen đã được giải mã và lun giữ tại cơ sờ dữ liệu gen quốc tế (http://www.ncbi.nlm.nih.gov/genbank/) Sự phát tr iể n b ù n g nổ c ù a số lượng hệ gen được giải mã đã đặt ra nhiều bài toán mới và quan trọng trong tin sinh học nhằm phân tích và so sánh các hệ gene
Sắp xếp cặp đôi với phép đổi chồ là một bài toán mới và quan trọng trong tin sinh học Giải quyết bài toán ửên là nền tảng để giải quyết một loạt các bài toán quan trọng khác như sắp xếp các bộ gene, phân tích mối quan hệ giữa các bộ gene, xây dựng cây tiến hóa dựa vào các gene Hiện nay, bài toán đã được mô hình hóa toán học bởi Vinh và đồng nghiệp [1,2, 3] Nhóm tác giả đã đề xuất một số phương pháp gần đúng để giải bài toán
trên Độ phức tạp của các thuật thuật đề xuất là 0 (n 4) với n là số lượng gen trong một hệ
gene Độ phức tạp này là lớn dẫn đến thuật toán không làm việc được với những hệ gen
có kích thước vừa và lớn
Đề tài tập trung vào nghiên cứu một phương pháp mới có độ phức tạp thấp nhưng vẫn cho kết quà với độ chính xác cao Phương pháp này sẽ cho phép chúng ta tiến hành sẳp xếp hai hệ gen một cách nhanh và hiệu quả
Tong quan vấn đề nghiên cứu
Tat cả các sinh vật đều tiến hóa từ một tổ tiên chung, Trong quá trình tiến hóa, các biếnđoi trong hệ gen đã dẫn đến sự khác biệt giữa các hệ gene Sự khác biệt giữa các hệ gen
đã tạo ra các loài sinh vật khác nhau cũng như sự khác nhau giữa các sinh vật trong cùng một loài
Các bien đoi trong hệ gen diễn ra ở hai mức độ khác nhau: mức độ điểm và mức độ gene
Trang 6Tai mức độ điểm, các biến đổi được gọi là biến đổi điểm (point mutation) bao gồm ba
loại chính là: thay thế dna, chèn dna, hay xóa dna.
Bên cạnh quá trình biến đổi ở mức độ điểm, sự khác biệt giữa các hệ gen còn do sự biến
đổi ở mức độ gen Có ba phép biến đổi phổ biến là: chèn gen, xóa gen, và dịch chuyên
gen Hmh 1 mô tả một ví dụ về sự biến đổi ở mức độ gen giữa Người và Khi
Hai quá trình biến đổi trên dẫn đến hệ gen của các sinh vật ngày nay khác nhau về kích thước, số lượng gene, thứ tự các gene, và nội dung của các gene
Người
Khỉ
Hĩnh ỉ: Các biến đổi ở mức độ gen giữa Người và Khi
Khi so sánh và bắt cặp cho hai hệ gen, chúng ta cần tính đến các biến đổi ờ cả mức độ điểm và mức độ gen Việc bắt cặp hai hệ gen như vậy cho phép xây dựng bức tranh toàn cảnh về sự tương tự và tiến hóa giữa các sinh vật, qua đó cho phép nâng cao dộ chính xác
dự đoán gene Thời gian thực hiện là một vấn đề hết sức quan trọng do kích thước rất lớn của các hệ gen
Một trong những hệ thống bắp cặp hệ gen đầu tiên ỉà BLASTZ [4], dùng để bẳt cặp hệ gen của người và chuột BLASTZ có khả năng xác định và bắt cặp nhừng vùng ADN tương đồng giữa người và chuột đồng thời cho phép các đoạn dna dịch chuyển vị trí trên
hệ gen (reaưangement) Tiếp theo BLASTZ, nhóm tác giả Darling tại đại học
W isconsin-M adison nghiên cứu xây dựng hệ thống MAUVE để sấp hàng đa hệ gen và thu được những kết quả có độ chính xác cao trên những hệ gen có độ tương đồng cao [5], Bên cạnh đó, nhóm tác giả Brudno tại đại học Standford phát triển hệ thống SLAGAN [6], Kết quả so sánh hai hệ thống MAUVE và SLAGAN cho thấy MAƯVE tốt hơn SLAGAN trên những tập dữ liệu cỏ độ tương đồng cao, còn SLAGAN cho kết quà tốt
5
Trang 7hơn MAƯVE ứ ên những tập dữ liệu tồn tại nhiều phép thay thế dna ỡ mức độ điểm và ít phép đảo chiều đoạn dna ở mức độ gene.
Mặc dù nhiều phương pháp đã được đề xuất, chúng chủ yếu tập trung vào xác định và bắt cặp cho những vùng dna có độ tương đồng cao giữa hai hệ gene Tức là, một phần lớn trorig hệ gen có thể không được bắt cặp và so sánh khi ta tiến hành với các loài sinh vật có hệ gen khác nhau nhiều
Với mục tiêu bắt cặp toàn bộ hệ gene, Vinh và đồng nghiệp đã mô hình toán học bài toán trên với tên gọi “sắp xếp cặp đôi với phép đảo chỗ” [1] Vinh và đồng nghiệp [1] đã đề xuất ba phương pháp để giải quyết bài toán trên: (1) “stepwise addition”, (2) “character moving” và (3) “simultaneous character swapping” Trong ba phương pháp trên, phương pháp “simultaneous character swapping” cho kết quả tốt nhất Độ phức tạp của
các thuật toán đề xuất là 0 ( n 4) với n là số gen trong một hệ gene.
M uc tiêu
Độ phức tạp của các thuật toán đã được đề xuất, 0 (n 4), là rất lớn và chi có thể áp dụng cho các hệ gen có kích thước nhỏ Đề tài này tập trung vào phát triển một phương pháp
mới để giải quyết bài toán trên với độ phức tạp 0 ( n ) Kết quả này sẽ giúp chúng ta phân
tích một lượng lớn dữ liệu trong thời gian cho phép
Đề tài tập trung nghiên cứu những nội dung chính sau:
- Sự tiến hóa và các phép biến đổi trên hệ gene
- Bài toán sắp xếp hai hệ gen với phép đảo chỗ
- Các phương pháp hiện tại để giải quyết bài toán trên
- Phát triển phương pháp giải quyết bài toán ưên với độ phức tạp o (n2)
- Cài đặt và thử nghiệm thuật toán
- Viết báo cáo kết quả tại hội nghị quốc tế
6
Trang 8n h ỏ n h ấ t đ ể b iế n đ ổ i X, th à n h y>j v à c ó th ể th ự c h iệ n b ằ n g th u ậ t to á n q u y h o ạ c h đ ộ n g v ớ i
độ phức tạp là o ipq) Ta gọi C(x, y 0) và C(x0 yị) là chi phí chèn/xóa kí tự X, và V) tương
ứng
Gọi R Ợ , Y r ) là hàm chi phí đảo chỗ giữa các kí tự thuộc Y và một hoán vị YR cùa Y R{Y,
Y r) có thể được tính theo khoảng cách “breakpoint” [9] hoặc tính theo khoảng cách
“inversion” [8]
Một ch u ỗ iX 1 — ÌXị’, X 2 , được gọi là một chuỗi phát triển (edited sequence) từ X khi và chỉ k h iX th u được t ừ X ’ sau khi xóa hết các ký tự Ví d ụ X ' = 1, 2, 3, 4)
ỉà một chuỗi phát triển từ X - (1,2,3,4) Một cặp A = ( X ’, Y ’) của hai chuồi X ’ = ( X ; x2
Xk’) phát ưiển và Y ’ = (yỊ y 2’, yic’) phát triển từ Y được gọi là một bắt cặp
hoàn chỉnh của X và Y M ột cách bắt cặp được xây dựng bàng cách chèn thêm ký tự ở
cả hai chuỗi (thứ tự các ký tự ừong chuồi không thay đổi)
Chi phí C(A) của một bắt cặp A là tổng chi phí thay thế và chèn/xóa của các ký tự trong
Trang 9Một chuỗi X r = ( x ị x2 \ xk’) được gọi là một chuỗi phát triển có sắp xếp lại (edited
rearrangement sequence) tù X nếu sau khi loại bỏ dấu ở XR’ ta thu được XR là một hoán vị củaX Ví dụ X R’ = 1, 4, 2, 3) là một chuỗi phát triển có sắp xếp lại từ
x = (1,2,3,4).
Một cặp A r = (XR Y r ') của hai chuỗi phát triển có sắp xếp lạ iX R' = (xì \ x 2 \ ■ ■ ■, x k ’) và
Yr ’ = (y ị ’ y 2\ y k ’) được gọi là một bắt cặp trình tự có sắp xếp lại (PAR) cùa hai
chuỗi X và Y Chi phí CrCAr) của A r là tổng các chi phí thay thế giữa các ký tự, chi phí chèn/xóa các kí tự và chi phí sắp' xếp lại giữa các ký tự Ta có công thức:
Mục đích c ủ a b à i toàn s ắ p x ế p c ặ p đ ô i v ớ i p h é p đ ổ i c h ỗ là tìm A r cóchi p h í n h ỏ nh ất.
3.4.2 Các phương pháp hiện tại
Sắp xếp cặp đôi với phép đảo chỗ được cho là bài toán NP-Hard [1] Vinh và đồng
nghiệp đã đề xuất các thuật toán tối ưu gần đúng theo chiến lược leo đồi để tìm ra cặp
PARAr*
Thuật toán “stepwise addition”
Tư tưởng của thuật toán “stepwise addition” là từng bước xây dựng nghiệm đầy đủ từ nghiệm chưa đầy đủ Cụ thể là, chúng ta khởi đầu với một PAR chưa đầy đủ là
Aft=(XR’=X, Y r ’ = 0) Sau đó ta lần lượt chèn các ký tự y} E Y ,j - 1 |K| vào Yp' để tạo thành một PAR đầy đủ Ký tự yj được thêm vào vị trí sao cho chi phí cùa Afí mới là nhỏ
nhất Thuật toán được mô tả như sau:
Stepwise addition method
Trang 10Thuật toán “character moving”
Thuật toán “character moving” sử dụng tư tường của thuật toán leo đồi để giảm chi phí
C r (A r ) c ủ a nghiệm t ìm được từ thuật toán “Stepwise a d d it io n ” Thuật toán được tiến
hành bằng cách đảo chỗ các kí tự trên YR ’ nhẳm tạo ra các A R mới với chi phí nhỏ hơn Với một Ar (AV, Yr ’) ta định nghĩa một phép biến đổi M(ỉ, j, 1 1 i < j < t-l) của chuỗi YR =
(yh y 2, yp) thu được sau khi loại bỏ ký tự *-■ từ Yp là phép dịch chuyển đoạn (y„
trong Yr đến vị trí t để thu được một chuỗi mới YR Một phép biến đổi M(ỉ, j, t) được gọi
là có thể thực hiện được {possible move) nếu nó làm giảm chi phí CR của PAR mới tạo
được Thuật toán được mô tả như sau:
Character moving method
5 foreach triple positions (i, j, t I i < j < t-1)
1 0 _ end fo r
9
Trang 1111 iteration <— iteration + 1
Thuật toan “ simultaneous character swapping”
Thuật toán “simultaneous character moving” là một cải tiến của thuật toán “character
moving” về mặt thời gian Một biến đổi s {k, t) được định nghĩa là phép đổi vị trí y, và y} của chuỗi Y r M ột phép biến đổi được gọi có thể thực hiện được nếu chi phí của A R mới
giảm đi
Xét hai phép biến đổi Si(k], tị) và s 2 {k2, t2) với k; < tì, k2 < t2i kì < k2 ta nói 2 phép biến
đ ổ i n à y đ ộ c lậ p v ớ i nhau n ế u k ỉ > t \ hoặc t2 < t j Thực n g h iệ m c h o th ấ y n ế u ta đồng th ờ i
thực hiện hai phép biến đổi độc lập S) và s2 có thể sẽ tạo ra 1 PAR tố t hơn Ngược lại nếu
Si và S2 không độc lập, chỉ thực hiện phép biến đổi cho chi phí tốt hơn Thuật toán
“simuỉaneous character sw apping’ được mô tả như sau:
Simulaneous character swapping method
Trang 1219 return A (X r , Y r )
Độ phức tạp của thuật toán “stepwise adđtion” là 0 (p g 3) Độ phức tạp của thuật toán
“character moving” là o {pq X i) với i là số vòng lặp Phương pháp “simulaneous character
sw app in g” c ó độ p h ứ c tạp là Oipq X i) v ớ i i là số v ò n g lặp.
Trong các thuật toán ừên, thuật toán “simultaneous character swapping” cho kết quả tốt nhất
về cả thời gian và chất lượng [1]
3.4.3 Phương pháp đề xuất
Như đã trình bày ờ trên, các thuật toán hiện tại có độ phức tạp thời gian tối thiếu là o ipq*)
trong mỗi vòng lặp Để sắp xếp được những hệ gen có kính thước vừa và lớn, chúng tôi đề
xuất phương pháp “fa s t swapping ", giúp giảm độ phức tạp thời gian yêu cầu trong mồi vòng lặp xuống còn o ipq).
Ta nhận thấy, chi phí CR(AR) bao gồm hai phần: (1) chi phí sắp hàng các ký tự (chèn, xóa
sừa) và (2) chi phí sắp xếp lại thứ tự các kí tự Chi phí sắp xếp lại thứ tự các kí tự R-CA', Xp) +
R(T, Yr ) lớn hơn băng 0 Chi phí săp hàng giữa các ký tự C (X \ Y ’) = ỉ= 1 có thê
được tính theo phương thức quy hoạch động với độ phức tạp là Oipq).
Xét một phép đổi chỗ yi và }>J, chi phí sắp hàng có thể được ước lượng lại với độ phức tạp là
0 (1 ) như sau:
CỌC, Y ’) - [C(*í>y'i) + C(x 'i>y'ỉ)] + [C(*Í'3Ó) + c (xj>y'i)] (4)
Trong “fa st sw apping” chúng ta áp dụng 2 phép đồi chỗ để tối ưu hóa chi phí CR(AR):
“s i n g l e s w a p ” đ ư ợ c d ù n g đ ể tố i ư u c h i p h í s ắ p h à n g , v à " c o u p l e s w a p " đ ư ợ c sư d ụ n g đ ề tối
ưu hóa chi phí sắp xếp lại kí tự
“Single sw ap” là cách đổi chỗ hai ký tự bất kì của^T’ hoặc Y ’ trong khi "couple swap ” đôi
chỗ các ký tự ở cả hai chuỗi cùng một lúc “Couple swap ” chính là thực hiện hai phép đồi
11
Trang 13chỗ "single swap ” cùng lúc ứên cả hai chuỗi Tuy nhiên tác dụng của chúng là khác nhau Trong k h i "single s w a p ” chủ y ế u là m th a y đ ổ i chi phí sừa c h ừ a g iữ a hai chuồi thì “c o u p le
swap ” thay đổi chi phí sắp xếp lại các kí tự trong chuồi
M ột phép đổi chỗ được gọi là có thể thực hiện nếu nó làm cho chi phí CR(AR) giảm xuống
Trong thuật toán dưới đây, đầu vào sẽ là một PAR xuất phát, chừng nào còn tìm được một cách đổi chỗ có thể thực hiện thì ta sẽ tiến hành đổi chỗ để tìm ra PAR mới tối ma hơn Quá trinh này dừng lại khi không có một phép đổi chỗ có thể thực hiện nào được tìm thấy
F ast sw apping m ethod
Ta nhận thấy, thời gian tính toán một phép đổi chỗ là 0 ( 1) Như vậy, dòng 4 đến dòng 7 có
độ phứ c tạp thời gian là o (pq) Dòng thứ 11 sử dụng thuật toán quy hoạch động để sắp hàng hai chuỗi Xp, YR có độ phức tạp là o ipq) Như vậy độ phức tạp thời gian cùa thuật toán
“fast swapping” là o (pq X 0 với i là số lần lặp.
12
Trang 14Để so sánh các phương pháp khác nhau, chúng tôi sử dụng bộ dữ liệu thật gồm 760 hệ gen tỉ thể thu thập từ cơ sở dữ liệu sinh học quốc tế Mỗi hệ gen chứa khoảng 16000 dna và được chia thành khoảng 37 genes [7].
Kết quà so sánh giữa thuật toán “fast swapping” và thuật toán tốt nhất hiện tại “simultaneous character swapping” cho thấy “fast swapping” tốt hem “simultaneous character swapping"
về cả mặt chất lượng lẫn thời gian (xem báo cáo tại phần phụ lục đề biết thêm chi tiết)
Bên cạnh dữ liệu thật, chúng tôi tiến hành so sánh các phương pháp sử dụng dữ liệu mô phỏng Chúng tôi cũng nhận th ấ y “fast swapping” cho kết quà tốt hom “simultaneous character swapping” về mặt chất lượng, đặc biệt “fast swapping” nhanh hơn rất nhiều
“simultaneous character swapping” (xem báo cáo tại phần phụ lục để biết thêm chi tiết).Thí nghiệm với cả dữ liệu thật và dữ liệu mô phỏng cho thấy “Fast swapping’- tốt hơn
phương pháp tốt nhất hiện tại cả về thời gian và chất lượng
Địa điểm , thời gian
Đề tài được tiến hành từ 6/2009 đến 6/2010 tại bộ môn KHMT, khoa CNTT Đề tài sử dụng máy tính và internet của bộ môn
Trang 154 Tài liệu tham khảo
1 Le Sy Vinh, Andres Varon and Ward c Wheeler (2006), Pairwise alignment with rearrangements, Genome Informatics, 17(2): 141 -151
2 Le Sy Vinh, Andres Varon, Daniel Janies and Ward c Wheeler (2007), Towards phylogenomic reconstruction, Proceeding o f The 2007 International Conference on Bioinformatics and Computajtional Biology, Las Vegas Nevada, USA, 98-104
3 Andres Varon, Le Sy Vinh, Ward Wheeler (2010), POY version 4: phylogenetic analysis using dynamic homologies, Cladistics, 26:72-85
4 Schwartz, et al Human mouse alignments with blastz Genome Research, 13:103—107,2003
5 Aaron C.E., Bob Mau, Frederick R Blattner, and Nicole T Pema, Mauve: Multiple Alignment o f Conserved Genomic Sequence With Rearrangements, Genome Res
2004 July; 14(7): 1394-1403
6 Brudno, M., M alde, s., Poliakov, A., Do, c B., Couronne, o , Dubchak, L,
Batzoglou, S Glocal alignment: finding rearrangements during alignment
9 Sankoff, D and Blanchette, M., Multiple genome rearrangement and breakpoint phylogeny, J Comput Biol., 5:555-570, 1998
14
Trang 16Project Title; A new method for pairwise genome alignment with rearrangements
Code number: QC.09.03
Coordinator: Le Sy Vinh
Implementing Institution: University o f Engineering and Technology
Duration: from June 2009 to June 2010
Genome pairwise alignment with rearrangements is a new challenge in Bioinformatics Although several methods have been developed for this problem, they are still computationally e x p e n s i v e , a n d th u s im p r a c t ic a l fo r la r g e g e n o m e s e q u e n c e s
Scientific Results: W e propose a fast and accurate algorithm (called FS) for the pairwise
genome alignment with rearrangements problem Experiments with both metazoa mitochondrial genomes and simulated genomes showed that FS resulted in better alignments than other methods tested A paper of so-called “FS: A fast algorithm for genome Rearrangement”, is published in the proceeding of “International conference on Bioinformatics, Computational biology, Genomics, and Chemoinformatics” from 12- 14/07/2010 in Florida, u s (http://www.promoteresearch.org/2010/bcbgc/index,html)
Application: A software for researchers, specially biologists, to analyze whole genomes
This is the first software for aligning entừe two genomes
Education: An excellent bachelor thesis.
15
Trang 17ĐẠI HỌC QƯÓC GIA HÀ NỘI TRƯỜN G ĐẠI HỌC CÔNG NGHẸ
Hà Tuấn Cường
KHOÁ LUẬN TÓT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
ĐAI HỌC QUÓC GIA HA NỘI TÍĨUNG TÂM THÔNG TIN THƯ VIÊN
C O O 6 O U O O O J A
-HÀ NỘI - 2010
Trang 18Lời cảm ơn
Lời đầu tiên, em xin gửi lời cảm ơn sâu sắc nhất đến thầy giáo TS Lê Sỹ Vinh người đã không quản vất vả tận tình h ư ớ n g dẫn em trong su ố t th ờ i g ia n làm k h ó a luận tot nghiệp vừa qua
Em cũng xin bày tỏ lòng biết ơn tới các thầy, cô giáo trong trường Đại học Công nghệ - Đại học Quốc gia Hà Nội Các thầy cô đã dạy bảo, chi dẫn chúng em và
lu ô n tạ o đ iề u k iệ n t ố t n h ấ t c h o c h ú n g e m h ọ c tập Trong su ô t quá trình h ọ c đại h ọ c
Em cũng xin gửi lời cảm ơn tới thây giáo PGS.TS Từ Minh Phương, người đã
ch o em những ĩờ i khuyên bổ ích trong quá trình làm khóa luận.
Tôi cũng xin cảm ơn những người bạn của mình, các bạn đã luôn ở bên tôi, giúp đỡ và cho tôi những ý kiến đóng góp quý báu trong học tập cũng như trong cuộc
sống.
C u ố i c ù n g c o n x in g ử i tớ i b ố m ẹ v à to à n th ể g ia đ ìn h lò n g b iế t ơ n và tìn h cảm
yêu thương nhất Con xin dành tặng bố mẹ kết quả mà con đã đạt được trong suốt bốn
n ă m học đại học Con cám ơn bố mẹ và chị nhiều
Khóa luận được tài trợ một phần bởi đề tài nghiên cứu QC.09.03 thuộc Đại học
Quốc Gia Hà Nội.
Hà Nội, tháng 5 nãm 2010
Hà Tuấn Cường
Trang 19’■puts-.ional Biology, G enom ic: and C h e m o in fo rrn a tic j - M ozilfa Firefox
BCBGC is an important event in the areas of bioinformatics computational biology, genomics and chemoinformatics and focuses on all areas related to the conference The conference will be hew at the same time and location where several other major international conferences wit! be taking place Click here for the details of these conferences.
BCBGC is an annual event.