HỌC VIỆN NÔNG NGHIỆP VIỆT NAM PHƯƠNG HỮU PHA THIẾT KẾ VÀ ỨNG DỤNG CÁC CHỈ THỊ ADN XÁC ĐỊNH CÁC GEN LIÊN QUAN ĐẾN TÍNH KHÁNG ĐẠO ÔN Ở MỘT SỐ GIỐNG LÚA BẢN ĐỊA CỦA VIỆT NAM Chuyên ngàn
Trang 1HỌC VIỆN NÔNG NGHIỆP VIỆT NAM
PHƯƠNG HỮU PHA
THIẾT KẾ VÀ ỨNG DỤNG CÁC CHỈ THỊ ADN XÁC ĐỊNH CÁC GEN LIÊN QUAN ĐẾN TÍNH KHÁNG
ĐẠO ÔN
Ở MỘT SỐ GIỐNG LÚA BẢN ĐỊA CỦA VIỆT NAM
Chuyên ngành: Công nghệ sinh học
Người hướng dẫn khoa học: PGS TS Trần Đăng Khánh
PGS TS Đồng Huy Giới
Trang 2NHÀ XUẤT BẢN HỌC VIỆN NÔNG NGHIỆP - 2019
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của PGS TS Trần Đăng Khánh và PGS TS Đồng Huy Giới Các kết quả nghiên cứu được trình bày trong luận văn là trung thực, khách quan và chưa từng dùng để bảo vệ lấy bất kỳ học vị nào
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn đã được cám
ơn, các thông tin trích dẫn trong luận văn này đều được chỉ rõ nguồn gốc
Hà Nội, ngày 13 tháng 05 năm 2019
Tác giả luận văn
Phương Hữu Pha
Trang 4LỜI CẢM ƠN
Trong suốt thời gian học tập, nghiên cứu và hoàn thành luận văn, tôi đã nhận được
sự hướng dẫn, chỉ bảo tận tình của các thầy cô giáo, sự giúp đỡ, động viên của bạn bè, đồng nghiệp và gia đình
Nhân dịp hoàn thành luận văn, cho phép tôi được bày tỏ lòng kính trọng và biết
ơn sâu sắc tới PGS TS Trần Đăng Khánh và PGS TS Đồng Huy Giới đã tận tình hướng dẫn, dành nhiều công sức, thời gian và tạo điều kiện cho tôi trong suốt quá trình học tập và thực hiện luận văn
Tôi xin bày tỏ lòng biết ơn chân thành tới Ban Giám đốc, Ban Quản lý đào tạo, Bộ môn Công nghệ sinh học, Khoa Công nghệ sinh học - Học viện Nông nghiệp Việt Nam
đã tận tình giúp đỡ tôi trong quá trình học tập, thực hiện đề tài và hoàn thành luận văn Tôi xin chân thành cảm ơn tập thể lãnh đạo, cán bộ viên chức bộ môn Kỹ thuật di truyền, Viện Di truyền Nông nghiệp, đặc biệt cảm ơn NCS Nguyễn Trường Khoa đã giúp
đỡ, cùng phân tích và cho phép sử dụng một số vật liệu, số liệu sử dụng trong luận văn Tôi xin chân thành cảm ơn gia đình, người thân, bạn bè, đồng nghiệp đã tạo điều
kiện thuận lợi và giúp đỡ tôi về mọi mặt để tôi hoàn thành luận văn./
Hà Nội, ngày 13 tháng 05 năm 2019
Tác giả luận văn
Phương Hữu Pha
Trang 5MỤC LỤC
Lời cam đoan I Lời cảm ơn II Mục lục III Danh mục chữ viết tắt V Danh mục bảng VI Danh mục hình VII Trích yếu luận văn VIII Thesis abstract X
Phần 1 Mở đầu 1
1.1 Tính cấp thiết của đề tài 1
1.2 Mục tiêu của đề tài 2
1.3 Phạm vi nghiên cứu 2
1.4 Ý nghĩa khoa học và thực tiễn 3
Phần 2 Tổng quan tài liệu 4
2.1 Giới thiệu về cây lúa 4
2.1.1 Tình hình sản xuất lúa gạo trên thế giới 4
2.1.2 Tình hình sản xuất lúa gạo ở Việt Nam 5
2.2 Tình hình thiệt hại gây ra bởi bệnh đạo ôn 6
2.2.1 Thiệt hại gây ra bởi bệnh đạo ôn trên thế giới .6
2.2.2 Thiệt hại gây ra bởi bệnh đạo ôn ở Việt Nam .7
2.3 Tình hình nghiên cứu hệ gen của lúa 8
2.4 Tình hình nghiên cứu các gen kháng đạo ôn trên cây lúa 10
2.5 Công nghệ giải trình tự thế hệ mới và ứng dụng tin sinh học 11
2.5.1 Hệ thống giải trình tự gen Illumina 13
2.5.2 Ứng dụng tin sinh học trong phân tích kết quả giải trình tự gen 13
2.6 Chỉ thị phân tử SNP 15
2.7 Chỉ thị ADN trong xác định gen liên quan đến kháng đạo ôn 16
2.7.1 Chỉ thị ADN 16
2.7.2 Phương pháp thiết kế chỉ thị phân tử 17
2.8 Ứng dụng chỉ thị phân tử trong chọn tạo giống lúa kháng đạo ôn 19
Trang 6Phần 3 Vật liệu và phương pháp 20
3.1 Thời gian và địa điểm nghiên cứu 20
3.2 Vật liệu nghiên cứu 20
3.2.1 Nguồn vật liệu 20
3.2.2 Hóa chất và dụng cụ thí nghiệm 20
3.3 Phương pháp nghiên cứu 22
3.3.1 Phương pháp tầm soát gen Pit và Pi21 dựa trên trình tự genome 22
3.3.2 Phương pháp thiết kế mồi gen Pit và Pi21 kiểm tra gen kháng Pit, Pi21 27
Phần 4 Kết quả và thảo luận 32
4.1 Kết quả tầm soát gen Pit kháng đạo ôn dựa trên dữ liệu trình tự genome của các giống lúa bản địa đã được giải mã 32
4.2 Kết quả thiết kế chỉ thị xác định gen Pit có khả năng kháng đạo ôn 36
4.3 Kết quả tầm soát gen Pi21 kháng đạo ôn dựa trên dữ liệu trình tự genome của các giống lúa bản địa đã được giải mã 42
4.4 Kết quả thiết kế chỉ thị xác định gen Pi21 có khả năng kháng đạo ôn 46
Phần 5 Kết luận và kiến nghị 53
5.1 Kết luận 53
5.2 Kiến nghị 53
Danh mục các công trình, công bố 54
Tài liệu tham khảo 55
Trang 7DANH MỤC CHỮ VIẾT TẮT
Chữ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt
ADN Axit Deoxyribonucleic Vật liệu di truyền
AFLP Amplified Fragment Length
dNTP Deoxynucleotide triphosphate Đơn phân của ADN đã
được triphosphoryl hóa GATK Genome Analysis Tool Kit Bộ công cụ phân tích hệ gen MABC Marker Assisted Backcrossing Chọn lọc nhờ chỉ thị phân
tử kết hợp lai trở lại MAS Marker Assisted Selection Chọn lọc nhờ chỉ thị phân tử NGS Next generation sequencing Công nghệ giải trình tự thế
hệ mới
PCR Polymerase Chain Reaction Phản ứng chuỗi trùng hợp QTL/ QTLs Quantitative Trait Loci - Locus Kiểm soát tính trạng số
lượng RAPD Random Amplification of
Polymorphic ADN
Đa hình ADN được nhân bản ngẫu nhiên
RFLP Restriction Fragment Length
Polymorphism Đa hình chiều dài mảnh phân cắt giới hạn SNP Single Nucleotide Polymorphisms Đa hình nucleotide đơn SSLP Simple Sequence Length
Polymorphism Đa hình các đoạn lặp đơn giản SSR Simple Sequence Repeat Sự lặp lại của trình tự đơn
giản
Trang 8DANH MỤC BẢNG
Bảng 2.1 Diện tích trồng và sản lượng lúa ở Việt Nam từ năm 2007 - 2017
(Tổng cục thống kê, 2018) 5 Bảng 3.1 Bảng vật liệu nghiên cứu 20
Bảng 4.1 Bảng thống kê số lượng và tỉ lệ nucleotide của các gen Pit ở các giống
lúa đã giải trình tự 33
Bảng 4.2 Bảng thống kê số lượng amino acid của các gen ứng viên Pit ở các
giống lúa đã giải trình tự 37
Bảng 4.3 Bảng thống kê số lượng và tỉ lệ nucleotide của các gen Pi21 ở các
giống lúa đã giải trình tự 44
Bảng 4.4 Bảng thống kê số lượng amino acid của các gen ứng viên Pi21 ở các
giống lúa đã giải trình tự 47
Trang 9DANH MỤC HÌNH
Hình 2.1 Mô hình SNP(ww.nutrigeneticsspecialists.com/singlepost
/2017/03/27/What-is-a-SNP) 16 Hình 3.1 Phương pháp tầm soát các gen Pit và Pi21 của 17 giống lúa đã giải
trình tự bằng phần mềm NextGENe_V2.4.2.3 và MEGA 6.0 26 Hình 3.2 Phương pháp thiết kế mồi bằng phần mềm Vetor NTI 11.0 29 Hình 3.3 Phương pháp kiểm tra tính đặc hiệu của mồi bằng phần mềm MEGA
6.0 và BLAST 31 Hình 4.1 Ảnh dóng hàng, dóng cột so sánh trình tự một đoạn gen kháng đạo
ôn Pit của một số giống lúa bản địa 34 Hình 4.2 Vị trí 3 nucleotide bị thiếu ảnh hưởng làm mất 2 amino acid sau khi
dịch mã 35 Hình 4.3 Ảnh thiết kế mồi nhân đoạn ADN có chứa vùng chèn thêm 17
nucleotide thông qua phần mềm Vetor NTI 11.0 39 Hình 4.4 Kiểm tra sự bắt cặp của cặp mồi Pit trên 17 giống lúa 40 Hình 4.5 Kết quả BLAST với mồi PitF: TCTT AACGACTGCCC AA AACT 41 Hình 4.6 Kết quả BLAST với mồi PitR: AGATTACAGAGATTGG
AAATTCTC 41 Hình 4.7 Ảnh điện di sản phẩm PCR đối với cặp mồi Pit nhận biết gen Pit ở
các giống lúa bản địa của Việt Nam (thứ tự các mẫu theo bảng 1) 42 Hình 4.8 Ảnh dóng hàng, dóng cột so sánh trình tự một đoạn gen kháng đạo ôn Pi21 của một số giống lúa bản địa 46 Hình 4.9 Ảnh thiết kế mồi nhân đoạn ADN có chứa vùng chèn thêm 17
nucleotide thông qua phần mềm Vetor NTI 11.0 49 Hình 4.10 Kiểm tra sự bắt cặp của cặp mồi Pi21 ở vùng CDS trên 17 giống lúa 50 Hình 4.11 Kết quả BLAST với mồi Pi21F: GACCCGGAGAAGCTGTGCAA
GA 51 Hình 4.12 Kết quả BLAST với mồi Pi21R: CTTTGGGCAGCACCACTGCC 51 Hình 4.13 Ảnh điện di sản phẩm PCR đối với cặp mồi Pi21 nhận biết gen Pi21
ở các giống lúa bản địa của Việt Nam (thứ tự các mẫu theo bảng 1) 52
Trang 10TRÍCH YẾU LUẬN VĂN
Tên tác giả: Phương Hữu Pha
Tên Luận văn: Thiết kế và ứng dụng các chỉ thị ADN xác định các gen liên quan đến
tính kháng đạo ôn ở một số giống lúa bản địa của Việt Nam
Phương pháp nghiên cứu
Phương pháp tầm soát gen Pit và Pi21 dựa trên trình tự genome:
- Lắp ráp và gọi SNP sử dụng phần mềm NextGENe_V2.4.2.3 (SoftGenetics LLC,
State College, PA, USA) (Biswas et al.,2015) https://softgenetics.com /NextGENe.php và phần mềm phân tích di truyền tiến hóa phân tử MEGA 6.0 cho hệ điều hành Windows để
dóng hàng và cột cho 17 giống lúa (http://www.megasoftware.net/mega.php) (Tamura et al.,2013, Huu Trung Khuat và cs., 2017)
Phương pháp thiết kế mồi gen Pit và Pi21 kiểm tra gen kháng Pit, Pi21:
- Cặp mồi đặc hiệu được thiết kế bằng phần mềm Vector NTI Advance 11.0 được công
bố vào ngày 15/12/2008 - đây là phần mềm của hãng Invirogen, Carlsbad ( Jia et al.,2002)
- Mẫu lá lúa (3 tuần tuổi) được thu thập và tách chiết ADN tổng số theo phương
pháp CTAB của (Obara et al.,1998) có cải tiến
- Phản ứng PCR được tiến hành trên máy Veriti 96 giếng Thermal cycler Tổng thể tích phản ứng là 15 µl, bao gồm: 5 µl ADN (nồng độ 10ng); 0,15 µM mồi; 0,2 mM dNTPs; 1X Buffer PCR; 2,5 mM MgCl 2 và 0,25 đơn vị Taq polymerase
- Sản phẩm PCR được điện di trên gel polyacrylamide 6,0% hoặc trên gel agarose
và được phát hiện dưới tia cực tím bằng phương pháp nhuộm ethidium bromide
Trang 11Đối với gen Pi21 đã thu nhận được 9 đoạn trình tự tương đồng có độ dài bằng và tám đoạn trình tự tương đồng của các giống còn lại có độ dài ít hơn 24 nucleotide
Đã thiết kế được trình tự mồi đặc hiệu với gen Pit (PitF: TCTTAACGAC TGCCCAAAACT/ PitR: AGATTACAGAGATTGGAAATTCTC) và Pi21 (Pi21F: GACCCGGAGAAGCTGTGCAAGA/Pi21R: CTTTGGGCAGCACC ACTGCC), cặp mồi này đã được chứng minh là có khả năng nhân lên đoạn gen từ ADN của các giống lúa bản địa của Việt Nam
Trang 12THESIS ABSTRACT
Master candidate: Phuong Huu Pha
Thesis title: Design and application of DNA markers to identify genes related to rice
blast resistant ability in some Vietnamese native rice varieties
Major: Biotechnology Code: 60 42 02 01
Educational organization: Vietnam National University of Agriculture
Research Objectives:
- Screening of Pit genes, Pi21 related to rice blast resistance in some Vietnamese
native rice varieties sequenced
- Designing DNA indicators for each Pit, Pi21 gene typical for rice blast resistance in researching and selecting of rice blast resistance
Materials and Methods:
Genetic screening method Pit and Pi21 based on genome sequencing:
- Assemble and name SNP by using software NextGENe_V2.4.2.3 (SoftGenetics LLC, State College, PA, USA) (Biswas et al., 2015) https://softgenetics.com /NextGENe.php and the genetic analysis software MEGA 6.0 for Windows operating system to align rows and columns for 17 rice varieties (http://www.megasoftware.net/mega php) (Tamura et al., 2013, Huu Trung Khuat et al., 2017)
Method of designing primers for gene Pit and Pi21 to test resistance gene Pit, Pi21:
- The specific primers designed by Vector NTI Advance software 11.0 was published
on December 15, 2008 - this is the software of Invirogen, Carlsbad (Jia et al., 2002)
- Rice leaf samples (3 weeks) were collected and total DNA extracted by CTAB method (Obara et al., 1998) with improvement
- PCR reaction was conducted on Veriti 96 well Thermal cycler The total reaction volume is 15 µl, including: 5 µl of DNA (concentration 10ng); 0.15 µM primers; 0.2
mM dNTPs; 1X Buffer PCR; 2.5 mM MgCl2 and 0.25 Taq polymerase units
- PCR products were analyzed by electrophoresis method on polyacrylamide gel 6.0% or on agarose gel and were detected under ultraviolet light by ethidium bromide staining method
Main findings and conclusions:
All 17 Vietnamese native rice varieties sequenced had homologous sequences with both Pit and Pi21 genes
Trang 13With Pit gene, nine homologous sequences with less than 3 nucleotides were recorded and 8 homologous sequences with less than 20 nucleotide lengths
With Pi21 gene, nine homologous sequences of equal length and eight homologous sequences of the remaining varieties have been obtained that are less than
24 nucleotides lengths
Having designed a specific primer sequence with the Pit (PitF: TCTTAACGACTGCCCAAAACT/ PitR: AGATTACAGAGATTGGAAATT CTC) and Pi21 (Pi21F: GACCCGGAGAAGCTGTGCAAGA/Pi21R: CTTTG GGCAGCACCACTGCC) genes, this primer has been shown to be able to replicate gene segments from DNA of Vietnam's native rice varieties
Trang 14PHẦN 1 MỞ ĐẦU
1.1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Lúa gạo (Oryza sativa L.) là một trong những loại lương thực chính của
Việt Nam và nhiều nước trên thế giới và đóng vai trò rất quan trọng trong nền sản xuất nông nghiệp Hiện nay, mức tiêu thụ lúa gạo đang tăng và nhu cầu về chất lượng gạo cũng tăng dần theo chất lượng cuộc sống Các nghiên cứu đã chỉ
ra rằng để đáp ứng nhu cầu gia tăng về lúa gạo thì sản lượng lúa gạo của toàn thế giới phải tăng thêm 40% vào năm 2030 Đây là một thách thức lớn đối với các nhà chọn giống để phát triển các giống lúa có năng suất cao, phẩm chất tốt và chống chịu sâu bệnh cũng như điều kiện bất thuận khác của môi trường (Selvaraj
et al., 2011) Mặc dù năng suất tiềm năng của cây lúa là 10 tấn/ha nhưng thực tế
người nông dân chỉ thu được trung bình 5 tấn/ha Sự khác biệt về năng suất này
là do các tác nhân bất lợi sinh học và phi sinh học, đặc biệt sâu, bệnh gây hại ở lúa Trong các tác nhân gây bệnh trên lúa thì bệnh đạo ôn ở lúa gây ra bởi nấm
Magnaporthe oryzae là những bệnh phổ biến nguy hại nhất đối với lúa Khi lúa
bị nhiễm đạo ôn cổ bông dẫn đến năng suất giảm nghiêm trọng, đe dọa an ninh
lương thực toàn cầu (Liu et al., 2014) Sử dụng các giống kháng bệnh đạo ôn là
một trong những biện pháp hiệu quả và kinh tế nhất để kiểm soát bệnh đạo ôn ở
lúa Cho đến nay các nhà khoa học đã tìm ra 102 gen kháng đạo ôn (Su et al., 2015; Zheng et al., 2016) Trong đó có 27 gen đã được nhân dòng là Pib, Pb1, Pita, Pi9, Pi2, Pizt, Pid2, Pi33, Pii, Pi36, Pi37, Pikm, Pit, Pi5, Pid3, Pid3-A4, Pi54, Pish, Pik, Pikp, Pia, PiCO39, Pi25, Pi1, Pi21, P50 và Pi65 (t) Do sự biến đổi thường xuyên trong quần thể nấm Magnaporthe oryzae, nên tính kháng bền
của các giống lúa với gen kháng có thể bị mất đi nhanh chóng, đặc biệt khi giống lúa được trồng ở vùng sinh thái khác Do đó, để có được một giống kháng bền và phổ rộng thì việc tích hợp nhiều gen kháng vào một giống lúa là một chiến lược nhân giống quan trọng và có thể được thực hiện để kiểm soát bệnh đạo ôn ở lúa
(Fukuoka et al., 2012; Xiao et al., 2017)
Việc phát triển và sử dụng các chỉ thị phân tử có vai trò quan trọng trong lai tạo và chọn giống ở thực vật, đặc biệt là việc phát hiện và phân tích các QTLs/gen (quantitative trait loci) và vị trí của chúng trên bản đồ liên kết; nhân dòng các gen cho những tính trạng nhất định dựa trên bản đồ liên kết phân tử; quy tụ gen; việc chọn lọc dựa trên chỉ thị phân tử (Marker-assisted selection
Trang 15(MAS)); việc xác định và phân tích đa dạng di truyền và phân tích cấu trúc hệ gen Khi được ứng dụng trong chương trình lai tạo và chọn giống, các chỉ thị phân tử cho phép đẩy nhanh quá trình tích hợp các gen mà chi phối tính đa hình của tính trạng và cung cấp thông tin đáng tin cậy về quan hệ họ hàng và quan hệ phát sinh chủng loại giữa các loài Việc áp dụng rộng rãi các chỉ thị trong lai tạo giống cùng với sự phát triển của khoa học kỹ thuật và công nghệ cho thấy ngày càng có nhiều chỉ thị phân tử được phát triển để phục vụ cho công tác chọn tạo giống Rất nhiều loại chỉ thị đã được phát triển như: RFLP, RAPD, AFLP, SSR, SSLP, SNP Những chỉ thị này rất khác nhau về độ phân giải, độ bao phủ hệ gen
và mức độ liên kết với tính trạng quan tâm Mặt khác, nhà chọn giống cũng quan tâm đến những đặc điểm như: mức độ đơn giản của việc thiết kế các thí nghiệm, các yêu cầu về kỹ năng đặc biệt sử dụng trong lai tạo (Ranade and Yadav, 2014) Trong những năm gần đây, với sự gia tăng về dữ liệu trình tự hệ gen, các đa hình đơn nucleotit (SNP) và sự đa dạng trong cấu trúc hệ gen đã được dùng để phát triển những chỉ thị có độ tin cậy cao Sự phát triển của những chỉ thị với mật độ dày đặc cũng như việc xác định trình tự nucleotit của cả hệ gen của nhiều cây có quan hệ họ hàng gần gũi cho phép so sánh những chỉ thị, so sánh hệ gen, và sự phân bố của những chỉ thị này trong khắp hệ gen (Ranade and Yadav, 2014)
Tiếp cận theo định hướng nghiên cứu mới này, việc Thiết kế và ứng dụng các
chỉ thị ADN xác định các gen liên quan đến tính kháng đạo ôn ở một số giống lúa bản địa của Việt Nam là rất cần thiết Kết quả thu được sẽ là cơ sở để tham
khảo và tiến hành các nghiên cứu tiếp theo nhằm phục vụ cho công tác chọn tạo giống lúa kháng đạo ôn
1.2 MỤC TIÊU CỦA ĐỀ TÀI
Tầm soát các gen Pit, Pi21 liên quan đến tính kháng đạo ôn ở một số
giống lúa bản địa của Việt Nam đã giải trình tự
Thiết kế được các chỉ thị ADN đặc trưng cho từng gen Pit, Pi21 kháng đạo ôn
phục vụ công tác nghiên cứu, chọn tạo giống lúa kháng đạo ôn
1.3 PHẠM VI NGHIÊN CỨU
Đề tài chỉ tập trung vào các nội dung tầm soát và thiết kế chỉ thị ADN
nhận dạng các gen Pit, Pi21 tính kháng đạo ôn ở 17 giống lúa của Việt Nam đã
được giải trình tự Đề tài được thực hiện tại Bộ môn Kỹ thuật di truyền của Viện
Di truyền Nông nghiệp từ tháng 5/2018 đến tháng 4/2019
Trang 161.4 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
Kết quả đề tài sẽ cung cấp cơ sở dữ liệu và vật liệu cho các nghiên cứu khoa học về tính kháng đạo ôn, đồng thời góp phần vào công tác nghiên cứu chọn tạo giống lúa có khả năng kháng đạo ôn phù hợp với điều kiện canh tác lúa
ở Việt Nam
Những thành công bước đầu trong thiết kế các chỉ thị ADN xác định các gen liên quan đến tính kháng đạo ôn sẽ mở ra khả năng ứng dụng rộng rãi trong công tác chọn tạo giống nói chung, không chỉ đối với khả năng kháng đạo ôn mà còn đối với nhiều khả năng kháng khác, đáp ứng nhu cầu lương thực của con người
Trang 17PHẦN 2 TỔNG QUAN TÀI LIỆU
2.1 GIỚI THIỆU VỀ CÂY LÚA
2.1.1 Tình hình sản xuất lúa gạo trên thế giới
Lúa gạo (Oryza sativa L.) là lương thực chính cho hơn 3,5 tỷ người tức là
khoảng một nửa dân số thế giới Và ước tính, loại lương thực này cung cấp cho con người tới 20% lượng calo hằng ngày Nhu cầu lúa gạo toàn cầu ước tính tăng
từ 723 triệu tấn trong năm 2015 lên 763 triệu tấn vào năm 2020 và lên 852 triệu tấn vào năm 2035, tăng tổng cộng 18% (129 triệu tấn) trong 20 năm tới
Bên ngoài châu Á, lượng tiêu thụ lúa gạo tiếp tục tăng đều đặn, với sự tăng trưởng nhanh nhất ở châu Phi cận Sahara Trong hai thập kỷ qua, tiêu thụ lúa gạo trên đầu người ở vùng cận Sahara châu Phi đã tăng hơn 50% Tương tự, tiêu thụ lúa gạo tiếp tục tăng trưởng đều đặn ở cả Hoa Kỳ và Liên minh châu Âu khi người tiêu dùng đa dạng hóa từ protein sang chế độ ăn nhiều chất xơ và cũng vì người nhập cư từ châu Á đang tăng lên (Mohanty, 2013)
Việc tăng năng suất lúa gạo từ diện tích đất hiện tại vẫn là chiến lược chính
để tăng sản lượng Do đó, việc cải thiện tiềm năng năng suất của lúa gạo là một chiến lược chính để tăng sản lượng lúa gạo thế giới Vì thế, một phương pháp toàn diện bao gồm cả cải thiện hệ gen và cải thiện canh tác là quan trọng để tìm
ra tiềm năng năng suất của các giống lúa Để sản xuất 129 triệu tấn lúa bổ sung vào năm 2035, tiềm năng năng suất của lúa cần tăng từ 10 đến 12,3 tấn / ha trong điều kiện tưới tiêu thuận lợi Điều này có thể là không dễ dàng, nhưng lịch sử nghiên cứu và nhân giống lúa đã cho thấy những triển vọng tươi sáng để chúng ta đạt được những con số đó trong tương lai
Sản lượng lúa thế giới tăng từ 256 triệu tấn năm 1960 lên 680 triệu tấn trong năm 2010 Điều này đạt được nhờ tăng năng suất, chủ yếu thông qua việc áp dụng các nguyên tắc di truyền học Mendel và nhân giống cây trồng thông thường Việc đạt được mục tiêu tăng thêm 129 triệu tấn trong 20 năm tới là một thách thức lớn hơn Nguyên nhân là bởi chúng ta phải đối phó với các mối đe dọa liên tục đối với lúa gạo như bệnh bạc lá do vi khuẩn, bệnh đạo ôn, tungro và bệnh cháy lá; côn trùng, chẳng hạn như rầy nâu, sâu đục thân và mật túi; và các căng thẳng phi sinh học, chẳng hạn như hạn hán, nhiễm mặn, lạnh, nóng, vv, đặc biệt là trong bối cảnh biến đổi khí hậu toàn cầu Thách thức lớn hiện nay là làm thế nào để vượt qua những hạn chế này và tăng năng suất lúa theo cách thân thiện với môi trường, sử dụng ít hóa chất hơn, ít nước hơn, ít đất hơn và ít lao động hơn (Khush, 2013)
Trang 182.1.2 Tình hình sản xuất lúa gạo ở Việt Nam
Tại Việt Nam, lúa gạo đóng vai trò quan trong bậc nhất đối với nền nông nghiệp Điều này thể hiện rõ ở việc lúa gạo góp phẩn ổn định an ninh lương thực, tạo ra việc làm trong lĩnh vực nông nghiệp, là nguồn thu nhập của cư dân nông thôn và đóng góp đáng kể vào doanh thu xuất khẩu của nước ta Theo Bộ Nông nghiệp và Phát triển nông thôn, lúa gạo được trồng hai vụ một năm bởi 80% lao động nông thôn Sản lượng lúa gạo chiếm 90% trên tổng sản lượng ngũ cốc Lúa gạo không những là thực phẩm chính trong bữa ăn hàng ngày của Việt Nam mà còn là nguyên liệu cho nhiều ngành công nghiệp chế biến như: bia, rượu, nước ngọt, bánh, mì, vv Việt Nam là nước sản xuất lúa gạo lớn thứ năm trên thế giới với sản lượng khoảng 42,8 triệu tấn vào năm 2017 Sản lượng lúa gạo cũng tăng mặc dù diện tích lúa giảm, sản lượng quốc gia năm 2007 là 35,9 triệu tấn, nhưng đến năm 2017 sản lượng đạt 42,8 triệu tấn tấn (tăng 6,9 triệu tấn) Việc tăng sản lượng lúa gạo như trên đã đảm bảo cả an ninh lương thực quốc gia và xuất khẩu lúa gạo hàng năm (Tổng cục thống kê, 2018)
Bảng 2.1 Diện tích trồng và sản lượng lúa ở Việt Nam từ năm 2007 - 2017
Năm Diện tích (Nghìn ha) Sản lượng (Nghìn tấn)
Trang 19Theo tính toán, năng suất lúa gạo bình quân cả nước là 5,55 tấn / ha năm
2017, năng suất bình quân năm 2007 là 4,99 tấn / ha (tăng 0,55 tấn / ha), điều này có thể là do chuyển đổi diện tích trồng lúa kém hiệu quả và năng suất thấp cho các cây trồng khác và ứng dụng tiến bộ khoa học kỹ thuật trong sản xuất nông nghiệp ngày càng rộng rãi hơn (Thống kê, 2018)
Theo Bộ Nông nghiệp và Phát triển nông thôn năm 2018, lúa gạo đã được trồng 50% trên đất nông nghiệp, sử dụng gần 80% lao động nông thôn Sản lượng lúa gạo chiếm 90% sản lượng ngũ cốc hàng năm ở Việt Nam
Việt Nam là nước xuất khẩu lúa gạo lớn thứ hai với lượng lúa gạo xuất khẩu trung bình hàng năm là 4,5-5,5 triệu tấn / năm, thậm chí năm 2012 là 8,0 triệu tấn Theo Tổng cục Thống kê năm 2018, kể từ năm 1995, Việt Nam xuất khẩu gần 2 triệu tấn lúa gạo, đưa lúa gạo thành mặt hàng xuất khẩu đứng thứ ba sau dầu thô và than; 5 năm sau (2000), xuất khẩu lúa gạo tăng lên 3,5 triệu tấn, chiếm vị trí đầu tiên trong xuất khẩu và 10 năm sau (2010), xuất khẩu lúa gạo đạt 6,9 triệu tấn, đứng ở vị trí thứ ba sau than và dệt với xuất khẩu giá trị đạt hơn 2,6
tỷ USD Từ năm 2007 đến năm 2017, xuất khẩu vẫn tăng ổn định, đưa lúa gạo trở thành mặt hàng mang lại nguồn thu lớn nhất cho Việt Nam
Theo số liệu thống kê của Hải quan Việt Nam, tháng 12 năm 2017, Việt Nam xuất khẩu 351,44 nghìn tấn lúa gạo, thu về 164,46 triệu USD, nâng tổng kim ngạch xuất khẩu lúa gạo của Việt Nam cả năm về lượng là 5,79 triệu tấn ứng với giá trị 2,62 tỷ USD, tăng 20,4% về lượng và 21,2% về giá trị so với cùng kỳ năm 2016 Năm 2017, Trung Quốc là thị trường nhập khẩu lớn nhất mặt hàng lúa gạo của Việt Nam, với kim ngạch nhập khẩu đạt 1,03 tỷ USD, tăng 31,35% so với cùng kỳ năm 2015, chiếm 39,25% tổng kim ngạch xuất khẩu lúa gạo của Việt Nam Philippines là thị trường nhập khẩu lớn thứ hai, với kim ngạch tăng 33,2 %, ứng với kim ngạch 222,58 triệu USD Thị trường lớn thứ 3 về nhập khẩu lúa gạo của nước ta là Malaysia, với kim ngạch 210,01 triệu USD, chiếm 8,03% thị phần (Thống kê, 2018)
2.2 TÌNH HÌNH THIỆT HẠI GÂY RA BỞI BỆNH ĐẠO ÔN
2.2.1 Thiệt hại gây ra bởi bệnh đạo ôn trên thế giới
Bệnh đạo ôn do nấm Magnaporthe oryzae gây ra, là một trong những bệnh
thường gặp và gây hại nhiều nhất cho lúa Theo WAD Jayawardana năm 2014,
có hơn 85 quốc gia trên thế giới phát hiện bệnh đạo ôn Bệnh có khả năng thích
Trang 20ứng cao với các điều kiện môi trường như khí hậu ôn hòa, độ ẩm cao ở vùng đất thấp và vùng núi nhiệt đới Bệnh có thể làm cho cây lúa bị cháy lá hoàn toàn nếu
bị nhiễm sớm ở giai đoạn cây con Nếu bệnh đạo ôn lây nhiễm ở giai đoạn ra hoa, thối gốc lóng, lở cổ rễ, gãy thân của lúa và gãy cổ làm cho hạt lép hoặc giảm trọng lượng hạt
Theo một số báo cáo, sản lượng thiệt hại do bệnh đạo ôn có thể lên đến 80% ở các vùng dịch bệnh, và ước tính 10% số bông nhiễm bệnh, tổn thất năng suất là 6% và tỷ lệ chất lượng hạt kém (hạt gạo vỡ, tỷ lệ cao cám, chưa đủ tiêu chuẩn) tăng lên 5% Với thiệt hại của nó, bệnh đạo ôn là một trong những bệnh phá hoại mạnh nhất với lúa gạo, và là mối đe dọa nghiêm trọng đối với nguồn an ninh lương thực của thế giới (khoảng 157 triệu tấn hàng năm) (Rakesh
Kaundal et al., 2006)
Với tình hình biến đổi khí hậu xảy ra trong những năm gần đây kéo theo
tình hình dịch tễ học trên lúa thay đổi phức tạp hơn, đã ảnh hưởng đáng kể đến năng suất và sản lượng lúa (Rosangela Bevitori và Raquel Ghini, 2014) Bệnh đạo ôn được ước tính sẽ gây thiệt hại đến sản xuất lúa gạo 55 triệu đô la Mỹ mỗi năm chỉ riêng ở Đông Nam Á và gần như giết chết lượng lúa gạo đủ để nuôi 60 triệu người mỗi năm (Talbot, 2007)
2.2.2 Thiệt hại gây ra bởi bệnh đạo ôn ở Việt Nam
Hiện nay, bệnh đạo ôn đã gây thiệt hại nghiêm trọng ở một số nước như Nhật Bản, Ấn Độ, Philippines và Việt Nam (Cục Bảo vệ thực vật, 2015).Ở Việt Nam, bệnh đạo ôn đã được phát hiện ở khu vực phía Nam rất sớm, từ thời thuộc địa Pháp vào năm 1921 Có 600.000 ha lúa bị nhiễm đạo ôn trong tổng số 5 triệu
ha lúa trong năm 1992 và 366.412 ha trong tổng số 7.651.400 ha lúa bị nhiễm bệnh đạo ôn trong năm 2010 (Bộ Nông nghiệp và Phát triển nông thôn, 2015) Ở Việt Nam, bệnh đạo ôn xảy ra ở cả Bắc, Trung và Nam (Cục Bảo vệ thực vật, 2015) Tuy nhiên mức độ bệnh xảy ra ở miền Bắc và miền Trung thường nặng hơn, ước tính khoảng 10% lúa bị nhiễm, tổn thất năng suất 6% và tỷ lệ hạt chất lượng kém tăng 5% Ở miền Bắc, các giống lúa dễ bị nhiễm bệnh vẫn được trồng phổ biến trên đồng ruộng, trong khi thời tiết thường có nhiều thay đổi phức tạp, tạo điều kiện phát sinh các loài gây hại cho cây trồng Các tỉnh Hải Phòng, Thái Nguyên, Ninh Bình, Bắc Giang thường bị thất thu
Ở đồng bằng sông Cửu Long, đạo ôn là bệnh nguy hiểm nhất, xảy ra quanh năm nhưng thường phát triển mạnh và gây thiệt hại nặng trong vụ đông xuân, đặc
Trang 21biệt là ở các tỉnh An Giang, Cần Thơ, Kiên Giang,… Trong vụ lúa hè thu năm
2012, ở ĐBSCL có hơn 70.000 ha lúa bị nhiễm bệnh đạo ôn Ở nhiều nơi, nông dân phải bỏ đi hàng trăm ha lúa gieo bị nhiễm bệnh nặng nề chiếm tỷ lệ 25% trên tổng diện tích gieo trồng Trong vụ đông xuân 2016 - 2017, bệnh đạo ôn có tỷ lệ nhiễm cao (> 20%) ở các cánh đồng có mật độ gieo hạt cao, phân đạm cao và dễ
bị nhiễm bệnh (Cục Bảo vệ thực vật, 2017) Theo Trung tâm Bảo vệ thực vật phía Nam, tính đến cuối tháng 1/2013, toàn bộ khu vực phía Nam Việt Nam đã
có 56.818 ha bị nhiễm bệnh đạo ôn lúa và 4.675 ha bệnh đạo ôn với tỷ lệ phổ biến từ 5 đến 15% Năm 2013, các tỉnh phát hiện xuất hiện bệnh đạo ôn là Long
An, An Giang, Kiên Giang, Bạc Liêu, Vĩnh Long, Sóc Trăng, Đồng Tháp, Đồng Nai, và riêng An Giang, bệnh đạo ôn lây lan trên 22.318 ha tăng hơn 2.000 ha
so với cùng kỳ vụ đông xuân trước đó Tại khu vực bị nhiễm Long An là 17,58
ha, với tỷ lệ nhiễm bệnh là 5-10%, chủ yếu ở giai đoạn làm đòng Ở miền Trung Việt Nam và Tây Nguyên, bệnh đạo ôn ở tỉnh Phú Yên thiệt hại do đạo ôn trong
vụ đông xuân 1992-1993 ước tính khoảng 3 triệu USD Bệnh đạo ôn với sự phân
bố lan rộng và thiệt hại nặng nề đã và đang là mối nguy hiểm lớn nhất đối với sản xuất lúa gạo và tác động đến sinh kế của người dân Việt Nam nói riêng và trên thế giới nói chung Để hiểu và ngăn ngừa bệnh đạo ôn là một trong những nhiệm
vụ quan trọng của con người để giảm tổn thất đối với sản lượng lúa gạo (Cục Bảo
vệ thực vật, 2017)
2.3 TÌNH HÌNH NGHIÊN CỨU HỆ GEN CỦA LÚA
Lý thuyết trọng tâm (central dogma) của sinh học phân tử cho thấy rằng tất
cả các quá trình sinh học của một sinh vật nên xuất phát từ thông tin được mã hóa trong ADN bộ gen của nó Vì bộ gen được coi là một bản thiết kế của các dạng sống của tế bào, kiến thức về toàn bộ trình tự bộ gen phải tương đương với việc hiểu toàn bộ cơ chế sinh học Vào những năm 1980, các nhà sinh học đã dự tính rằng giải trình tự bộ gen sẽ đẩy nhanh các nghiên cứu sinh học phân tử đến một mức độ lớn hơn nhiều so với các phân tích từng phần của một số ít gen Tuy nhiên, các công nghệ giải trình tự có sẵn tại thời điểm đó không đủ để xác định hàng tỷ nucleotide trong một thời gian ngắn Do đó, để có được trình tự toàn bộ
bộ gen của sinh vật nhân chuẩn cao hơn, một số công nghệ giải trình tự cải tiến
đã được phát triển trong thế kỷ 21
Kể từ khi hoàn thành giải trình tự bộ gen của Haemophilusenzae vào năm
1995 (Fleischmann et al., 1995), trình tự bộ gen đã đóng một vai trò quan trọng
Trang 22trong sinh học hiện nay, mặc dù thời đại genome xuất hiện muộn hơn một chút đối với thực vật, vi khuẩn và động vật Việc giải trình tự bằng phương pháp Sanger có tốc độ chậm với bộ gen lớn và nhất là trong việc xác định bộ gen sinh vật nhân chuẩn do đó thường mất nhiều thời gian Mặc dù trình tự bộ gen của
Arabidopsis thaliana, cây mô hình được nghiên cứu tốt nhất, đã được xuất bản
năm 2000 (Arabidopsis Genome Initiative 2000), dữ liệu trình tự bộ gen cho cây
trồng không có sẵn cho đến năm 2002, khi bộ gen của cây japonica và indica trồng lúa (Oryza sativa L.) đã được giải mã bằng phương pháp shotgun toàn bộ
bộ gen (Goff et al., 2002, Yu et al., 2002) Tuy nhiên, hai trình tự bộ gen này đã
bị phân mảnh với tỷ lệ lớn, phản ánh những hạn chế của phương pháp giải trình
tự này Việc tìm ra phương pháp giải trình tự bộ gen chính xác hơn sẽ đáp ứng nhu cầu cho các nghiên cứu về bộ gen tiếp theo Rất lâu trước khi công bố bộ gen thu được bằng phương pháp shotgun, những nỗ lực khác đối với việc giải trình tự
bộ gen cây lúa đã được hình thành và bắt đầu vào đầu những năm 1990 tại Nhật Bản (Sasaki, 1998); tuy nhiên, những kỹ thuật này không đủ để sắp xếp bộ gen hoàn chỉnh tại thời điểm đó Năm 1998, dự án giải trình tự bộ gen lúa quốc tế (IRGSP) được tổ chức bởi các nhà nghiên cứu tiên phong từ mười quốc gia và
khu vực, bao gồm cả Nhật Bản (Matsumoto et al., 2016) Dự án hợp tác quốc tế
này đã sử dụng trình tự bộ gen chính xác dựa trên bản đồ vật lý của nhiễm sắc thể nhân tạo có nguồn gốc PI (PAC)/ nhiễm sắc thể nhân tạo (BAC) để tạo ra trình tự
bộ gen chất lượng cao.Trên thực tế, trình tự bộ gen kết quả đã được công bố vào năm 2004 (Dự án giải trình tự bộ gen lúa quốc tế 2005), sau đó đã được cải thiện
vào năm 2013 (Kawahara et al., 2013), là chính xác và vẫn đóng vai trò là nền tảng thiết yếu của bộ gen ngũ cốc (Matsumoto et al., 2016)
Kể từ khi phát hành công khai bộ gen IRGSP, các công nghệ giải trình tự thế hệ tiếp theo (NGS) đã thay đổi đáng kể các nghiên cứu sinh học phân tử Giải trình tự bộ gen hiện nay khá dễ dàng và hiệu quả hơn so với phương pháp tiếp cận gen Ví dụ, nguyên nhân đột biến của một kiểu hình quan tâm có thể được quan sát nhanh hơn bằng cách giải trình tự so với các phương pháp di truyền phân tử thông thường khác Các nghiên cứu giải trình tự thông lượng cao như vậy rất hiệu quả trên cây lúa vì chúng ta có thể ánh xạ các lần đọc mới được giải trình tự vào bộ gen tham chiếu chất lượng cao
Để xây dựng bộ gen tham chiếu chất lượng cao, cần có một công nghệ cải tiến khác Công nghệ giải trình tự thời gian thực đơn phân tử của Pacific
Trang 23Bioscatics (PacBio) (Eid et al., 2009) hiện là một phương pháp đầy hứa hẹn cho giải trình tự bộ gen de novo và do đó được áp dụng cho các loài cây trồng (Sakai
et al., 2015; Du et al., 2017) Một nền tảng mới nổi khác là thiết bị MinlON, một
trình sắp xếp chuỗi nano đơn phân tử từ Oxford Nanopore Technologies
(Michael et al., 2017) MinlON có hiệu quả chi phí cao và thể hiện khả năng
mạnh mẽ để giải trình tự, dẫn đến việc sử dụng rộng rãi Ngoài các phương pháp này, sự kết hợp của Ulumina với Hi-C, có thể sử dụng lại dữ liệu chuỗi được tạo
trong quá khứ hứa hẹn một tiềm năng rất lớn (Dudchenko et al., 2017) Do đó, do trình tự bộ gen de novo chi phí thấp/ chất lượng cao được dự đoán trong tương lai gần, nhiều bộ gen tham chiếu của giống japonica, giống indica và các giống lúa
hoang dại sẽ được giải trình tự hỗ trợ việc nghiên cứu bộ gen của lúa sẽ được đẩy nhanh hơn nữa
2.4 TÌNH HÌNH NGHIÊN CỨU CÁC GEN KHÁNG ĐẠO ÔN TRÊN CÂY LÚA
Gen kháng đạo ôn là gen mã hóa cho một loại protein biểu hiện tính độc đối với nòi nấm gây bệnh Gen kháng đạo ôn phần lớn là đơn gen, trội Ngoài ra cũng có những gen trội không hoàn toàn hoặc gen lặn nhưng rất ít Mỗi gen kháng đạo ôn chỉ
có thể kháng với một hoặc vài loài nấm gây bệnh Thông thường mỗi giống lúa kháng chỉ mang một gen kháng Vì vậy, khả năng kháng thấp, muốn giống kháng tốt, bền vững thì giống phải quy tụ được nhiều gen kháng Gen kháng đạo ôn ở lúa chia thành: gen kháng chính và gen kháng phụ Gen kháng chính biểu hiện thông qua hiệu quả chất lượng, di truyền đơn giản và đặc thù chủng Gen kháng phụ là những gen mà hoạt động của chúng mang tính bổ trợ đóng góp vào khả năng kháng của cây chủ, nhờ những gen này mà phạm vi phát triển của bệnh được giới hạn Những gen kháng phụ ngày càng được quan tâm hơn khi những cá thể mang gen kháng chính có sự biểu hiện kém bền về tính kháng
Hiện nay đã có hơn 100 gen kháng đạo ôn được phát hiện từ các giống lúa
trồng thuộc nhóm japonica (45%), indica (51%), và 4% là các loài hoang dại có
quan hệ họ hàng với lúa trồng đã được xác nhận và công bố Gen kháng đạo ôn được phát hiện trên 12 nhiễm sắc thể của cây lúa Các gen kháng được phát hiện tập
trung nhiều trên nhiễm sắc thể số 6, 11 và 12 (Singh et al., 2015; Tanwaeer et al.,
2015 ; Liang et al., 2016)
Đa số các gen kháng bệnh đạo ôn được phát hiện là gen trội, chỉ một số ít
các gen kháng lặn được công bố (Pi21 và pi55(t)) (Tanwaeer et al., 2015) Bên
cạnh các gen kháng đơn lẻ, các nhà khoa học cũng đã phát hiện được 347 QTLs
Trang 24quy định tính kháng bệnh đạo ôn trên cây lúa (Koide et al., 2009) Trong đó, chỉ
có 27 gen đã được nhân dòng là Pib, Pb1, Pita, Pi9, Pi2, Pizt, Pid2, Pi33, Pii, Pi36, Pi37, Pikm, Pit, Pi5, Pid3, Pid3-A4, Pi54, Pish, Pik, Pikp, Pia, PiCO39, Pi25, Pi1, Pi21, P50 và Pi65 (t) (Liu et al., 2014; Su et al., 2015; Zheng et al.,
2016) Hầu hết các gen này mã hóa cho các protein chứa vùng liên kết với nucleotide (Nucleotide Binding Site - NBS) và vùng chức năng chứa trình tự lặp
lại giàu leucine (Leucine-rich repeat- LRR (Hayashi et al., 2010; Li et al., 2016; Guo et al., 2016) Đây là cấu trúc protein của nhóm gen kháng phổ biến nhất ở
thực vật Sản phẩm của các gen kháng này có khả năng phát hiện một sản phẩm
do một gen gây độc của nấm bệnh đạo ôn quy định (Avirulence gene) (Hayashi
et al., 2010; Rahim et al., 2013; Guo et al., 2016)
Gen kháng đạo ôn chính (major gene) bao gồm 63 gen được phát hiện trên
12 nhiễm sắc thể của cây lúa Các gen kháng được phát hiện chủ yếu tập trung
nhiều trên nhiễm sắc thể số 6, 11 và 12 (Ballini et al., 2008; Ashkani et al., 2013) Trên nhiễm sắc thể số 6 đã phát hiện được ít nhất 14 gen hay alen (Pi2, Piz, Piz-t, Piz-5, Pi8 (t), Pi9, Pi13, Pi13 (t), Pi25 (t), Pi26 (t), Pi27 (t) Pid2, Pigm (t), và Pi40 (t)) Các gen này nằm tập trung ở vùng giữa của nhiễm sắc thể
số 6 Trên nhiễm sắc thể số 11, có ít nhất 14 gen hay alen (Pi18 (t), Pi38 (t), Pi44 (t), PiCO39(t), Pilm-2, Pi7(t), Pi1, Pi7, Pi47(t), Pi43(t), Piks, Pikg(t), Piy(t), và Pizy(t) đã được xác định Trên nhiễm sắc thể 12, ít nhất 17 gen hay alen kháng đã được xác định bao gồm: Pita, Pita-2, Pitq6, Pi6(t), Pi12(t), Pi12(t), Pi19(t), Pi20(t), Pi21(t), Pi24(t), Pi31(t), Pi32(t), Pi39(t), Pi62(t), Pi157(t) IPi và IPi (Hayashi et al., 2006; Yohei et al., 2009; Miah et al., 2015)
Có 17 gen kháng đạo ôn phụ (minor gene) được lập bản đồ phân tử trên 9 nhiễm sắc thể trong số trong số 12 nhiễm sắc thể của cây lúa, ngoại trừ nhiễm sắc thể số 7, 9 và 10
2.5 CÔNG NGHỆ GIẢI TRÌNH TỰ THẾ HỆ MỚI VÀ ỨNG DỤNG TIN SINH HỌC
Trong thế kỷ trước, việc đọc trình tự ADN còn gặp nhiều khó khăn do máy móc có giá thành cao, mất thời gian để đọc toàn bộ hệ gen do vậy chỉ phù hợp cho kiểm tra các gen riêng lẻ và một số xét nghiệm chẩn đoán phân tử sử dụng trong các phòng thí nghiệm y học như di truyền phân tử, di truyền dược học, bệnh về máu và
vi sinh v.v Ngày nay, các công ty thương mại đã cho ra đời các thế hệ máy đọc trình tự dựa trên nhiều công nghệ mới (Next Genration Sequencing - NGS) Các kỹ
Trang 25thuật đọc trình tự gen đã trở nên đơn giản và nhanh hơn nhờ sự ứng dụng huỳnh
quang phân tích tự động (Pettersson et al., 2009) Các công nghệ đọc trình tự mới
luôn hướng tới làm tăng thông lượng (throughput), làm giảm thời gian và giá thành
(Schadt et al., 2010) Mặc dù vậy, phương pháp Sanger (dựa trên cơ sở kết hợp của
các dideoxynucleotide (ddNTP) bằng ADN polymerase trong quá trình khuếch đại
ADN in vitro) được sử dụng rộng rãi trong nhiều năm trước đây vẫn được thực hiện xen kẽ khi cần thiết (Sanger et al., 1977)
Đọc trình tự được thực hiện sau phản ứng khuếch đại ADN (như ở phương pháp Sanger) được thay thế bằng đọc trình tự thực hiện ngay trong giai đoạn tổng hợp sợi ADN bổ sung cho sợi khuôn (phương pháp pyrosequencing) (Nyren 2007) Đây là công nghệ khởi đầu cho kỹ thuật đọc trình tự bằng tổng hợp, nền tảng của kỹ thuật đọc trình tự bộ gen hay còn gọi là kỹ thuật đọc trình tự thế hệ mới sau này Với ưu thế thời gian đọc nhanh, trình tự đọc được rất chính xác, cường độ phát quang định lượng được nên dù trình tự đọc được không dài (<100 bases) nhưng pyrosequencing thể hiện rõ ưu thế hơn hẳn phương pháp Sanger và trở thành một kỹ thuật không thể thiếu trong các phòng thí nghiệm sinh học phân
tử (Poehlmann et al., 2007)
Nguyên lý đọc trình tự gen thế hệ mới: theo 2 nguyên lý chính Nguyên lý thứ nhất đọc trình tự bằng tổng hợp (sequencing by synthesis, SBS) đã được các thế hệ máy Roche 454, lon Torrent và Illumina sử dụng Nguyên lý thứ hai đó là đọc trình tự gắn nối (sequencing by ligation, SBL) được sử dụng ở máy SOLiD
do George Church phát minh SBL đã được sử dụng để xác định trình tự genome
và là nền tảng cho các thiết bị đọc trình tự thế hệ mới Hiện nay, các dòng máy của Illumina như là MiSeq, NextSeq và HiSeq được ứng dụng rộng rãi
Sự phát triển mạnh mẽ của kỹ thuật NGS là một cuộc cách mạng trong công nghệ đọc trình tự nói riêng và trong công nghệ sinh học phân tử nói chung Với các tiến bộ về thiết bị và hóa chất, hiện nay đọc trình tự bộ gen của một cơ thê sống có thể được thực hiện tại các phòng thí nghiệm được cấp kinh phí vừa phải với thiết bị đọc trình tự thế hệ mới như Illumina MiSeq, Ion-Torrent PGM trong thời gian ngắn (thậm chí chỉ trong 24 giờ) thay vì phải kéo dài hàng năm và giá thành rẻ Trình tự bộ gen vi khuẩn hay virus có thể được đọc dễ dàng với các thiết bị có công suất nhỏ khoảng 6-10 Gbases mà không cần đến hàng trăm Gbases NGS là một công cụ mạnh nhất để phát hiện được các tác nhân gây bệnh, các đột biến gen với tần suất thấp Chính vì vậy, đọc trình tự thế hệ mới là
Trang 26một công cụ không thể thiếu được trong phát hiện và định lượng các đột biến trong ung thư, trong bệnh di truyền
2.5.1 Hệ thống giải trình tự gen Illumina
Công nghệ giải trình tự bằng tổng hợp (SBS - sequencing by synthesis) của Illumina hiện nay là một nền tảng thành công nhất và được sử dụng rộng rãi trong các hệ thống máy giải trình tự thế hệ II trên thế giới Công nghệ độc quyền của Illumina được cấu thành dựa trên quyền sử dụng hai phát minh quan trọng là công nghệ nano của nhóm Oxford Nanopore Technologies và công nghệ giải trình tự trên sợi ADN trong quá trình tổng hợp của Solexa Trong đó, công nghệ nano của nhóm Oxford Nanopore Technologies cho phép Illumina gắn hàng loạt các oligonucleotide ngẫu nhiên trên diện tích rất nhỏ và đầu dò (camera) có thể thu nhận tín hiệu riêng biệt của từng oligonucleotide Điều này đã tạo nên ưu thế lớn cho Illumina so với các đối thủ cạnh tranh khác khi hệ thống có khả năng đọc
và chụp ảnh từng nucleotide trực tiếp trong quá trình sinh tổng hợp Bên cạnh đó, nhờ có công nghệ của Solexa giải trình tự sử dụng dNTP gắn huỳnh quang và khoá dừng thuận nghịch nên Illumina có ưu điểm là không bị hạn chế về số lượng cụm được giải trình tự
Tùy theo mục đích sử dụng mà chúng ta có thể lựa chọn hệ thống giải trình
tự Miseq hoặc Hiseq của Illumina Máy Miseq có công suất nhỏ hơn (15 Gbases)
so với máy Hiseq (600 Gbases) Theo đó dữ liệu giải trình tự của Miseq là 15 triệu đoạn ADN (chạy 1 chiều) hoặc 30 triệu đoạn đọc (chạy 2 chiều); của Hiseq
là 3 tỷ đoạn đọc ADN (1 chiều) hoặc 6 tỷ đoạn đọc (2 chiều) Do vậy máy Hiseq thường được sử dụng trong các dự án giải trình tự toàn bộ hệ gen hoặc phát hiện các đột biến mất đoạn lớn còn máy Miseq thường dùng trong việc phân tích đột biến điểm, đột biến mất đoạn nhỏ, định type HLA, chimerism
Có thể nói, hệ thống giải trình tự Illumina với công nghệ SBS là một bước phát triển vượt bậc trong lĩnh vực giải mã ADN Độ chính xác của thiết bị lên tới 99,9% với chất lượng dữ liệu (quanlity score) > Q30 Do vậy, khi kết hợp đúng đắn các phương pháp giải trình tự thế hệ mới với các phương pháp thế hệ cũ sẽ tạo ra một cuộc cách mạng về giá thành và hiệu quả giải trình tự
2.5.2 Ứng dụng tin sinh học trong phân tích kết quả giải trình tự gen
Cùng với sự phát triển liên tục của các máy đọc trình tự thế hệ mới NGS là
sự bùng nổ về dữ liệu hệ gen, do đó các công cụ Tin sinh học được nhiều nhóm
Trang 27phát triển để đáp ứng các nhu cầu phân tích xử lý dữ liệu của các nhà sinh học Trong đó, phân tích đột biến gen là một mảng rất quan trọng có tính ứng dụng thực tiễn cao được các nhà Tin sinh học tập trung xây dựng và phát triển với một
loạt bộ phần mềm như là: Genome Analysis Tool Kit (McKenna et al., 2010)
(GATK, http://www.broadinstitute.org/ gatk/) do viện Broad phát triển
SAMTools (Li et al., 2009) (http://samtools.sourceforge.net) bộ công cụ phân
tích của dự án 1000 hệ gen (Siva, 2008) (http://www.1000genomes.org),
Nguyên lý cơ bản của các công cụ phân tích hệ gen gồm các bước như sau:
- Giai đoạn 1: Đánh giá và tiền xử lý dữ liệu thu được từ thiết bị đọc trình
tự NGS bằng cách loại bỏ các trình tự có chất lượng thấp, các adapter, các nhiễu trong quá trình đọc trình tự
- Giai đoạn 2: Ánh xạ trình tự (reference mapping) Ở giai đoạn này, các
trình tự ngắn thu được từ thiết bị NGS được ánh xạ vào hệ gen tham chiếu Ở bước này các công cụ được sử dụng phổ biến như Bowtie2 (http.//howtip-hio.sourceforge.net/bowtie2/index.shtml)(Langmead and Salzberg 2012), BWA (http://bio-hwa.sourceforge.net) (Li and Durbin, 2009)
- Giai đoạn 3: Xác định đột biến Từ kết quả ánh xạ trình tự, các phần mềm
xác định đột biến sẽ dò tìm các vị trí mà ở đó base trên hệ gen tham chiếu khác với base từ dữ liệu trình tự Dựa vào các mô hình toán học, các phần mềm sẽ quyết định điểm nào có đột biến hay không dựa vào việc so sánh thống kê về tần suất xuất hiện các base khác biệt cũng như chất lượng của chúng Các công cụ
phổ biến hiện nay là GATK (McKenna et al., 2010) và SAMtooIs (Li et al.,
2009) và đều là phần mềm mã nguồn mở, miễn phí
- Giai đoạn 4: Chú giải vai trò của các đột biến lên chức năng của gen thông
qua hai hướng tiếp cận: đối sánh với các CSDL y sinh đã biết và phương pháp dự đoán ảnh hưởng của đột biến tới chức năng gen Ở hướng tiếp cận thứ nhất, các phần mềm sẽ truy vấn nhiều nguồn cơ sở dữ liệu y sinh khác nhau như dbSNP (https://www.ncbi.nlm.nih.gov/projects/SNP/),ClinVar(https://www.ncbi.nlm.nUi.gov/clinvar/),COSMIC(http://cancer.sanger.ac.uk/cosmic),HGMD
(http://www.hgmd.cf.ac.uk/), OMIM (https://www.omim.org/), để trích rút các chú giải có sẵn về các đột biến Ở hướng tiếp cận còn lại, các công cụ dựa các cấu trúc gen (vùng mã hóa, vùng không mã hóa) đã biết để phân loại các đột biến cũng như đưa ra các khả năng ảnh hưởng của đột biến lên chức năng của gen
Trang 28Đột biến có thể được chia thành nhiều loại như đột biến đơn điểm, đột biến INDEL (chèn/mất đoạn ngắn), đột biến thêm mất đoạn lớn (Copy Number Variant - CNV) Đột biến đơn điểm có tần suất xuất hiện lớn nhất và được phân loại theo mức độ ảnh hưởng lên quá trình phiên mã SNP không đồng nghĩa (non-synonymous) và SNP đồng nghĩa (synonymous), trong đó SNP không đồng nghĩa gồm 2 dạng là SNP sai nghĩa (missense) và SNP vô nghĩa (nonsense) SNP không đồng nghĩa làm thay đổi chuỗi protein: SNP sai nghĩa dẫn đến việc tạo thành codon mã hóa một amino acid khác so với codon ban đầu và SNP vô nghĩa dẫn đến việc tạo thành stop codon thay vì codon mã hóa Trong khi đó, synonymous SNP biến đổi codon ban đầu thành một codon khác mã hóa cùng một amino acid, vì vậy không làm ảnh hường đến chuỗi protein sản phẩm
2.6 CHỈ THỊ PHÂN TỬ SNP
Chỉ thị phân tử là một đoạn ADN liên kết với một vị trí nhất định bên trong
hệ gen (Vaseeharan et al., 2013) Theo vị trí, chỉ thị phân tử được phân chia
thành 3 loại gồm allozyme, chỉ thị ty thể và nhân SNP là hai chỉ thị phân tử thuộc chỉ thị nhân theo phân loại vị trí và là chỉ thị phân tử liên quan tới các đoạn gen chưa biết theo phân loại chức năng của gen SNP cũng như các chỉ thị khác trong nhóm phân loại chức năng như RAPD, AFLP được xem là không mã hóa
và do đó trung tính về khả năng lựa chọn (selectively neutral) Các chỉ thị như thế được sử dụng rộng rãi trong các nghiên cứu về di truyền của các quần thể có các đặc trưng về đa dạng di truyền và xu hướng biến đổi bên trong và giữa các quần thể tuân theo các định luật cân bằng Hardy-Weinberg
Đa hình các nucleotide đơn (SNPs) là các đa hình được tạo ra bởi các đột biến điểm làm xuất hiện các alen khác nhau do sự thay thế nucleotide đơn hoặc chèn/xóa nucleotide đơn ờ một vi trí nhất định bên trong một locus Những khác biệt về trình tự đó đã được mô tả từ khi ADN bắt đầu được giải trình tự vào năm
1977 Tuy nhiên, khả năng phân tích SNPs một cách nhanh chóng trong một số lượng lớn mẫu đã không thực hiện được cho đến khi có ứng dụng của công nghệ chip gen vào cuối những năm 1990 SNPs một lần nữa trờ thành tiêu điểm trong việc phát triển chỉ thị phân tử vì chúng là loại đa hình phong phú nhất trong bất
kỳ sinh vật nào, thích hợp với việc tự động hóa và chi ra được các đa hình bị ẩn
đi hoặc không phát hiện được bời các chỉ thị và các phương pháp khác (Liu and
Cordes, 2004; Vaseeharan et al., 2013)
Trang 29Hình 2.1 Mô hình SNP
Nguồn: ww.nutrigeneticsspecialists.com/singlepost /2017/03/27/What-is-a-SNP
SNP chứng minh sự đa hình dẫn đến các alen khác nhau là do đột biến điểm gây ra bởi việc thêm hay một base duy nhất tại một vị trí nucleotide cụ thể trong một locus, về mặt lý thuyết, một SNP bên trong một locus có thể tạo ra 4 alen, mỗi alen chứa một trong bốn base tại vị trí SNP: A, T, C, G Tuy nhiên trong thực tế, hầu hết các SNP thường chỉ hạn chế từ một đến hai alen (thường là hai pyrimidine C/T hoặc hai purin A/G) và được coi như là hai alen (Liu and Cordes, 2004) Các SNP nhiều nhà khoa học quan tâm trong phát triển chỉ thị phân tử vì thực tế, chúng là những dấu hiệu được xác định rất rõ ràng trong bộ gen của bất kỳ sinh vật nào (vùng mã và vùng không mã hóa) Các chỉ thị SNP có thể xác định được sự khác nhau về di truyền của các cá thể mà thường các chi thị khác không phát hiện được (Liu and
Cordes, 2004; Morin et al., 2004; Rasal et al., 2017) Trong toàn bộ hệ gen, sự xuất
hiện của SNPs rất phong phú ờ các vùng không mã hóa Trong các vùng mã hóa,
xuất hiện SNP không đồng nghĩa sự thay đổi amino acid (Sunyaev et al., 1999)
2.7 CHỈ THỊ ADN TRONG XÁC ĐỊNH GEN LIÊN QUAN ĐẾN KHÁNG ĐẠO ÔN
Trang 30phân biệt sự sai khác đó Theo lý thuyết, một chỉ thị ADN lý tưởng phải đáp ứng
đầy đủ các yêu cầu sau:
- Cho đa hình cao
thị RFLP, RADP, SSR…)
2.7.2 Phương pháp thiết kế chỉ thị phân tử
Mồi là một chuỗi oligonucleotide sợi đơn ngắn (kích thước thường từ 18 –
24 nucleotide) Có hai loại mồi được sử dụng cho chẩn đoán bệnh cây:
Mồi chung (universal/degenerate primers): được thiết kế trên các vùng bảo thủ cao, có khả năng phát hiện các đối tượng khác hẳn nhau (thường các đối tượng của một chi, một họ)
Mồi đặc hiệu (specific primers): được thiết kế trên các vùng có thể phân biệt được loài, thậm chí dưới loài như chủng/nòi/type sinh học…
Có được các mồi tốt là bước quan trọng nhất trong chẩn đoán bệnh cây Có
2 cách để có thể nhận được các mồi tốt :
- Tham khảo và lựa chọn từ các nghiên cứu đã được công bố
- Tự thiết kế mồi
Để tự thiết kế mồi dựa trên các chuỗi gen sẵn có trên Genbank, người ta cần
sử dụng một phần mềm có khả năng căn trình tự đa chuỗi (multiple sequence alignment), chẳng hạn ClustalX, Bioedit, MEGA 6.0 Ngay sau khi các chuỗi ADN đã được căn trình tự, chúng ta có thể thiết kế các mồi chung hay mồi đặc hiệu tùy theo yêu cầu
Trang 31Các chú ý khi thiết kế mồi:
- Độ dài mồi: Nên nằm trong khoảng 18-24 nucleotide Độ dài này đủ dài
để đảm bảo tính đặc hiệu và đủ ngắn để mồi gắn đễ dàng vào khuôn
- Nhiệt độ tách chuỗi (Tm = Melting Temperature): Tm là nhiệt độ mà tại đó 1/2
số sợi ADN kép tách thành sợi đơn Tm của mồi nên nằm trong khoảng 52-600C
- Nhiệt độ gắn mồi (Ta = annealing temperature): Ta được tính dựa trên Tm
Ta quá cao làm mồi khó gắn vào khuôn dẫn tới năng xuất PCR thấp Ta quá thấp làm mồi dễ gắn không đặc hiệu vào khuôn dẫn tới tạo các sản phẩm không đặc hiệu Ta của 2 mồi xuôi và ngược dòng nên tương đương Có nhiều cách tính Ta:
Ta = 0.3 x Tm(mồi) + 0.7 Tm (sản phẩm) – 14.9
- Hàm lượng GC: Số các gốc G và C nên nằm trong khoảng 40-60%
- Chuỗi GC đầu 3’: Đầu tận cùng 3’ nên là G hoặc C hoặc GC hoặc CG Đầu 3’ không nên có nhiều hơn 3 gốc liên tục G/C
- Việc lựa chọn chiều dài mồi và nhiệt độ nóng chảy của chúng dựa vào một
số lý do Nhiệt độ nóng chảy của mồi được định nghĩa là nhiệt độ thấp hơn nhiệt
độ của mồi mà sẽ anneal khuôn ADN và cao hơn nhiệt độ làm mồi rời khỏi khuôn ADN Nhiệt độ nóng chảy cần tăng lên theo độ dài của mồi Mồi quá ngắn
sẽ làm anneal một số vị trí trên khuôn ADN dài, dẫn đến các bản sao không đặc hiệu Nói cách khác, chiều dài của mồi bị giới hạn bởi nhiệt độ làm nóng chảy
nó Nhiệt độ nóng chảy quá cao, nghĩa là trên 80°C, có thể gây ra một số vấn đề
do ADN polymerase ít hoạt động ở nhiệt độ này Chiều dài tối ưu của mồi vào khoảng 30 đến 40 nucleotide với nhiệt độ nóng chảy vào khoảng 60°C đến 75°C
Có một số cách để tính nhiệt độ nóng chảy (Tm) của mồi (A, G, C và T tương ứng là số nucleotide của mồi [Na+] là nồng độ Na+ trong PCR)
Các chuỗi lặp:
Mồi không nên chứa nhiều chuỗi lặp kép (ví dụ TATATATA) hoặc chuỗi lặp đơn (ví dụ TTTT) vì có thể gây ra hiện tượng bắt cặp nhầm (misprime) Trong một mồi, chỉ nên có tối đa 4 chuỗi lặp Các chuỗi lặp cũng không nên xuất hiện nhiều lần trong 1 mồi
Độ ổn định đầu 3’:
Tận cùng đầu 3’ (khoảng 5 nucleotide) không nên chứa toàn gốc G hoặc C
vì có giá trị ΔG cao dễ dẫn tới bắt cặp không đặc hiệu vào khuôn Trái lại nếu đầu 3’ chứa quá nhiều gốc T hoặc A sẽ khó bắt cặp
Trang 32Vùng thiết kế mồi của khuôn:
Vùng thiết kế mồi của khuôn không nên chứa quá nhiều cấu trúc thứ cấp Nếu các cấu trúc thứ cấp này ổn định ở nhiệt độ gắn mồi thì mồi sẽ không thể bắt cặp được
2.8 ỨNG DỤNG CHỈ THỊ PHÂN TỬ TRONG CHỌN TẠO GIỐNG LÚA KHÁNG ĐẠO ÔN
Gần đây, hai dòng lúa Pusa1602 (PRR78 + Piz5) và Pusa1603 (PRR78 + Pi54) đã được phát triển thông qua phương pháp ứng dụng chỉ thị phân tử và lai trở lại MABC (Marker assisted backcrossing), đưa gen kháng đạo ôn Piz5 và Pi54 từ
hai dòng cho gen lần lượt là C101A51 và Tetep vào nền di truyền của PRR78 (rất mẫn cảm với bệnh đạo ôn) Hai chỉ thị phân tử AP5930 và RM206 liên kết chặt lần
lượt với gen Piz5 và Pi54 được dùng cho Foreground selection Nền di truyền của
bố mẹ (recurrent parent) được phục hồi với tỷ lệ 89.01% và 87.88% lần lượt ở hai dòng Pusa1602 và Pusa1603 Giống lúa lai giữa Pusa6A với các dòng cải tiến của PRR78 được xếp ngang hàng với giống Pusa RH10 về năng suất, chất lượng hạt và
chất lượng nấu nướng, và thêm tính kháng với bệnh đạo ôn (Singh et al., 2012)
Dòng lúa D521 kháng đạo ôn lá, dòng D524 kháng đạo ôn cổ bông, và tính
kháng bạc lá đã được phát triển thông qua việc đưa gen Pi1 (gen kháng đạo ôn lá) và gen Pi2 (gen kháng đạo ôn cổ bông) có nguồn gốc từ dòng cho gen BL122
và gen kháng bạc lá Xa23 từ CBB23 vào dòng lúa lai ưu tú, chín sớm Ronfeng B
mẫn cảm với cả bệnh bạc lá và đạo ôn bằng phương pháp MABC (Fu 2012)
Bằng các chỉ thị SSR (MRG4766, AP22, và RM206) các gen Pi1, Pi2 và Xa23
được nhận dạng, và dùng cho foreground selection, trong khi đó nền di truyền của các dòng lúa được cải tiến được kiểm tra bằng 131 chỉ thị đa hình Sau 4 thế
hệ lai hồi giao, tỷ lệ phục hồi của nền di truyền được xác định cho các dòng D521, và D524 lần lượt là 96,18% và 96,56% Mức độ kháng bệnh đạo ôn dao động trong khoảng từ 96,7% đến 100%, trong khi chiều dài vết bệnh bạc lá từ
0,77 đến 1,18 cm Một dòng bất dục đực, Rongfeng 3A với các gen Pi1, Pi2 và Xa23 được phát triển thành công qua MABC và được dùng để phát triển các
dòng bố mẹ ưu tú cho các dòng lúa lai có khả năng kháng cả bệnh bạc lá và đạo
ôn (Basavaraj et al., 2010, Basavaraj et al., 2009, Zhou et al.,, 2011)
Trang 33PHẦN 3 VẬT LIỆU VÀ PHƯƠNG PHÁP
3.1 THỜI GIAN VÀ ĐỊA ĐIỂM NGHIÊN CỨU
Nghiên cứu được tiến hành từ tháng 5/2018 đến tháng 4/2019 tại bộ môn
Kỹ thuật di truyền, Viện Di truyền Nông nghiệp
3.2 VẬT LIỆU NGHIÊN CỨU
TT Tên giống TT Tên giống
Trang 343.2.2.2 Hóa chất
a Hoá chất tách chiết ADN
Hoá chất tách chiết ADN bao gồm các loại như: Tris HCl, EDTA, SDS, NaCl, CTAB, Chloroform, isopropanol, isoamyl alcohol, Ethanol của các hãng Sigma, Merck, Prolabo, ICN và Labscan
- Đệm tách chiết ADN tổng số (đệm CTAB):
- MgCl2 của Fermentas, Invitrogen
- dNTPs (dATP, dGTP, dCT, dTTP) của Fermentas, Invitrogen
- Mồi, Marker 1 kb, Marker GeneRulerTMADN Ladder Ultra Low của hãng
Fermentas, Invitrogen
- Taq polymerase của Fermentas, Invitrogen
c Hoá chất chạy điện di
Điện di gel polyacrylamide gồm các hóa chất: acrylamide, APS, Temed, chất nhuộm Bromophenol blue, Ethidium bromide
Trang 353.3 Phương pháp nghiên cứu
3.3.1 Phương pháp tầm soát gen Pit và Pi21 dựa trên trình tự genome
Lắp ráp và gọi SNP sử dụng phần mềm NextGENe_V2.4.2.3 (SoftGenetics
LLC, State College, PA, USA) (Biswas et al., 2015) https://softgenetics.com
/NextGENe.php và phần mềm phân tích di truyền tiến hóa phân tử MEGA 6.0 cho hệ điều hành Windows để dóng hàng và cột cho 17 giống lúa
(http://www.megasoftware.net/mega.php) (Zheng, S et al., 2017; Tamura et al.,
2013; Huu Trung Khuat và cs., 2017)
Phương pháp tầm soát các gen được thực hiện theo 8 bước sau:
Bước 1: Khởi động chương trình NextGENe ver 2.4.2.3 chọn phương pháp đọc trình tự Illumila với ứng dụng SNP/Indel Discovery
Trang 36Bước 2: Đưa đữ liệu đầu vào bằng các file đọc trình tự ở dạng FastQ vào mục Sample files
Bước 3: Đưa dữ liệu tham chiếu vào mục Reference files dưới dạng Fasta
Bước 4: Lưu lại đầu ra cho file Output với thư mục khác và đuôi *pjt
Trang 37Bước 5: Sau khi đã thiết lập đủ các bước 1 đến bước 4 chúng ta tiến hành phân tích mẫu đọc trình tự đó với gene tham chiếu bằng cách bấm vào nút Run NextGENe
Trang 38Bước 6: Kết quả thu được được thể hiện thông qua NextGENe Viewer
Bước 7: Sau khi dùng chương trình NextGENe ver 2.4.2.3 chúng ta thu được các trình tự tương đồng của mẫu giống cần so sánh với gene tham chiếu Dùng lệnh Export để xuất ra file fasta giống cần so sánh, ứng dụng phần mềm