Mục đích của luận án nhằm xây dựng bộ dữ liệu kiểu hình của một số tính trạng chính liên quan đến sự phát triển bộ rễ của các mẫu giống lúa được chọn, làm cơ sở cho nghiên cứu GWAS để xác định các QTLs/gen ứng viên liên quan đến sự phát triển bộ rễ của lúa Việt Nam. Sử dụng phương pháp GWAS để lập bản đồ liên kết toàn hệ gen, từ đó xác định các QTLs và gen ứng viên liên quan đến sự phát triển bộ rễ của các giống lúa Việt Nam.
Trang 1HỌC VIỆN NÔNG NGHIỆP VIỆT NAM
PHÙNG THỊ PHƯƠNG NHUNG
XÁC ĐỊNH CÁC GEN - ALEN ĐẶC THÙ LIÊN QUAN
ĐẾN SỰ PHÁT TRIỂN BỘ RỄ CỦA CÁC GIỐNG LÚA VIỆT NAM
Chuyên ngành: Di truyền và chọn giống cây trồng
Mã số: 9.62.01.11
TÓM TẮT LUẬN ÁN TIẾN SĨ
NHÀ XUẤT BẢN HỌC VIỆN NÔNG NGHIỆP - 2019
Trang 2Công trình hoàn thành tại:
HỌC VIỆN NÔNG NGHIỆP VIỆT NAM
Người hướng dẫn: 1 GS.TS ĐỖ NĂNG VỊNH
2 GS.TS PASCAL GANTET
Phản biện 1: GS TS Ngô Xuân Bình
Bộ Khoa học và Công nghệ
Phản biện 2: TS Lê Thị Thu Hiền
Viện nghiên cứu Hệ gen
Phản biện 3: TS Lê Quỳnh Mai
Trường Đại học Khoa học tự nhiên
Luận án sẽ được bảo vệ trước Hội đồng đánh giá luận án cấp Học viện họp tại:
Học viện Nông nghiệp Việt Nam Vào hồi giờ, ngày tháng năm 2019
Có thể tìm hiểu luận án tại thư viện:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện Lương Định Của, Học viện Nông nghiệp Việt Nam
Trang 3PHẦN 1 MỞ ĐẦU 1.1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Việc tạo ra những giống lúa có kiểu hình bộ rễ phù hợp, giúp cây lúa tăng khả năng chống chịu với các stress phi sinh học nhằm đáp ứng với biến đổi khí hậu là trọng tâm của nhiều chương trình nghiên cứu cải tiến giống lúa hiện nay Hạn chế về khả năng quan sát trực tiếp bộ rễ là khó khăn lớn nhất khiến những kết quả liên quan đến chọn tạo giống lúa có bộ rễ thích nghi tốt vẫn ít được công bố Phát triển các công
cụ hỗ trợ, phục vụ cho phương pháp chọn lọc phân tử để ứng dụng vào các chương trình chọn tạo giống cải tiến bộ rễ lúa hiện nay là rất cần thiết Đặc biệt, những hiểu biết về các yếu tố di truyền có liên quan đến các đặc điểm phát triển và thích nghi của
bộ rễ lúa là chìa khóa quan trọng trong hướng nghiên cứu này
Nhiều phương pháp khác nhau đã được sử dụng để khám phá các yếu tố di truyền liên quan đến bộ rễ trong đó phương pháp xác định các QTLs là một phương pháp có tiềm năng và hiệu quả Sự xuất hiện của phương pháp GWAS (Genome–wide Association Mapping) (Nordborg and Weigel, 2008) và thành công của phương pháp
này ở thực vật (Atwell et al., 2010), đặc biệt là ở lúa (Clark et al., 2013; Courtois et al., 2013) cho thấy GWAS là một công cụ mới hữu hiệu trong nghiên cứu xác định
QTLs ở lúa và ở thực vật nói chung Độ phân giải cao của các QTLs khi áp dụng phương pháp GWAS giúp rút ngắn thời gian nghiên cứu và có thể trực tiếp xác định
được các gen ứng viên liên quan đến tính trạng quan tâm (Zhu et al., 2008) Các
nghiên cứu GWAS hiện nay mới chỉ khai thác được một phần rất nhỏ nguồn gen lúa trên thế giới và các tính trạng quan tâm
Việt Nam nằm ở trung tâm phát sinh cây lúa của vùng Đông Nam Á Cây lúa được trồng từ Bắc vào Nam với nhiều điều kiện sinh thái và chế độ thủy văn khác nhau Do dó, sự đa dạng của các giống lúa Việt Nam là nguồn tài nguyên quý để phát triển các nghiên cứu nhằm phát hiện các yếu tố di truyền kiểm soát các tính trạng phát triển bộ rễ và khả năng chống chịu với các stress phi sinh học của cây lúa Sử dụng phương pháp GWAS để xác định các QTLs/gen ứng viên liên quan đến sự phát triển
bộ rễ của các giống lúa Việt Nam là một hướng đi nhiều triển vọng và có ý nghĩa khoa học cũng như thực tiễn
1.2 MỤC TIÊU NGHIÊN CỨU CỦA ĐỀ TÀI
- Lựa chọn các mẫu giống phù hợp để phát triển bộ dữ liệu kiểu gen và dữ liệu kiểu hình phục vụ cho các nghiên cứu GWAS thông qua hhảo sát sự đa dạng về đặc điểm nông sinh học cơ bản và di truyền của một tập đoàn các mẫu giống lúa Việt Nam
- Xây dựng bộ dữ liệu kiểu gen (haplotype) của tập đoàn mẫu giống được chọn, làm cơ sở dữ liệu để phát triển các nghiên cứu GWAS với các tính trạng quan tâm
- Xây dựng bộ dữ liệu kiểu hình của một số tính trạng chính liên quan đến sự phát triển bộ rễ của các mẫu giống lúa được chọn, làm cơ sở cho nghiên cứu GWAS để xác định các QTLs/gen ứng viên liên quan đến sự phát triển bộ rễ của lúa Việt Nam
- Sử dụng phương pháp GWAS để lập bản đồ liên kết toàn hệ gen, từ đó xác định các QTLs và gen ứng viên liên quan đến sự phát triển bộ rễ của các giống lúa Việt Nam
Trang 41.3 PHẠM VI NGHIÊN CỨU
Nghiên cứu được thực hiện trên cơ sở một tập đoàn gồm 214 mẫu giống lúa được thu thập từ nhiều vùng của Việt Nam, 33 mẫu giống lúa đối chứng đại diện cho đa dạng của Oryza sativa trên thế giới do CIRAD cung cấp và 23 mẫu giống khác được cung cấp bởi Viện Di truyền Nông nghiệp Các mẫu giống đã được đánh giá về các đặc điểm nông sinh học cơ bản và đa dạng di truyền bằng chỉ thị DArT Kết quả này là
cơ sở để lựa chọn các mẫu giống cho thiết lập dữ liệu kiểu gen và kiểu hình để phục vụ phát triển các nghiên cứu GWAS
Một tập đoàn gồm 200 mẫu giống lúa được chọn đã được phân tích kiểu gen bằng 50000 chỉ thị SNPs, sử dụng phương pháp phân tích kiểu gen thông qua giải trình
tự GBS, và được đánh giá biểu hiện của 18 tính trạng chính liên quan đến sự phát triển
bộ rễ
Phân tích GWAS được tiến hành đồng thời trên 3 ma trận dữ liệu cho tất cả tập đoàn (185 mẫu giống x 21623 marker), nhóm giống indica (115 mẫu giống x 13842 marker), nhóm giống japonica (64 mẫu giống x 8821 marker)
Kết quả nghiên cứu giới hạn ở mức xác định được các QTLs/gen ứng viên liên quan đến sự phát triển bộ rễ của các mẫu giống lúa Việt Nam trong tập đoàn nghiên cứu
1.4 NHỮNG ĐÓNG GÓP MỚI CỦA ĐỀ TÀI
Đã khảo sát và đánh giá một cách có hệ thống các đặc điểm nông sinh học cơ bản của tập đoàn 270 giống lúa, trong đó có 214 giống lúa Việt Nam
Đã xác định được mức độ đa dạng di truyền và cây phân loại của một tập hợp nguồn gen lúa Việt Nam bằng một lượng lớn chỉ thị hiện đại như DArT và SNPs marker
Sử dụng phương pháp GBS xây dựng được bộ dữ liệu kiểu gen với 25971 SNPs marker, bao phủ toàn hệ gen với mật độ cao, là cơ sở để phát triển nghiên cứu GWAS với các mục tiêu khác nhau (năng suất, cấu trúc bông, khả năng chống chịu với sâu bệnh và điều kiện bất lợi) trên tập đoàn lúa nghiên cứu
Luận án đã cung cấp một bộ dữ liệu gồm các thông số, thông tin của các tính trạng chính liên quan đến sự phát triển bộ của hơn 190 mẫu giống lúa Việt Nam
Kết quả lập bản đồ liên kết toàn hệ gen (GWAS) cung cấp một danh sách gồm 88 QTLs liên kết với 18 tính trạng theo dõi, trong đó có 33 QTLs nằm trong vùng mã hóa gen chức năng, 1 vùng QTLs liên kết chặt với tính trạng số lượng rễ (NCR) ở NST số
11 và 1 vùng QTLs liên kết chặt với tính trạng độ dày rễ (THK) ở NST số 2 Xác định được 889 gen ứng viên, trong đó có 407 gen đã được xác định và phân nhóm chức năng giả định, 24 gen trong đó đã có những công bố chứng minh chức năng hóa sinh
và sinh học liên quan đến sự phát triển bộ rễ
1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI
Những đóng góp về đặc điểm nông sinh học cơ bản, đặc điểm phát triển bộ rễ, đa dạng di truyền của các giống lúa trong luận án sẽ mở rộng và nâng cao những hiểu biết
về sự đa dạng của nguồn gen lúa Việt Nam cũng như thế giới Là cơ sở để lựa chọn vật liệu cho các chương trình chọn tạo giống lúa
Bộ dữ liệu kiểu gen gồm hơn 25000 SNPs marker được đăng tải trên trang TropGenDB là nguồn dữ liệu mở, có thể được cung cấp cho các nhà khoa học khác để tiếp tục phát triển các nghiên cứu GWAS trên tập đoàn nghiên cứu với nhiều mục tiêu
Trang 5khác như: xác định các QTLs liên quan đến khả năng chống chịu, năng suất, chất lượng, cấu trúc bông,…vv
Dữ liệu thông tin về đặc điểm bộ rễ có ý nghĩa tham khảo và là cơ sở lựa chọn vật liệu cho các chương trình lai tạo giống cải tiến tính trạng bộ rễ ở lúa
Kết quả của luận án cung cấp một danh sách các QTLs/ gen ứng viên có liên quan đến sự phát triển bộ rễ ở các giống lúa Việt Nam, bổ sung thêm thông tin hữu ích
và chi tiết giúp các nhà khoa học quan tâm nghiên cứu di truyền bộ rễ lúa ở Việt Nam
và trên thế giới có hiểu biết toàn diện, chính xác và đầy đủ hơn về mạng lưới các gen liên quan Đặc biệt, những đặc điểm riêng biệt của các giống lúa Việt Nam có thể mang đến những phát hiện mới, đặc trưng, mà các nghiên cứu sử dụng các nguồn vật liệu lúa khác trên thế giới không thể tìm thấy
Nhìn chung, luận án cung cấp một mô hình áp dụng những công nghệ, kỹ thuật hiện đại trong phân tích genome để đưa vào khai thác đa dạng nguồn gen lúa Việt Nam, làm rõ mối quan hệ giữa kiểu gen và kiểu hình, nhằm khai thác các gen/alen đặc thù ẩn trong nguồn gen đó Kết quả của luận án mở ra con đường triển vọng trong khai thác genome để ứng dụng vào các chương trình chọn giống phân tử tạo ra các giống lúa có
bộ rễ thích hợp làm tăng khả năng thích ứng với các điều kiện ngoại cảnh bất lợi
PHẦN 2 TỔNG QUAN TÀI LIỆU
2.1 VAI TRÕ VÀ ĐẶC ĐIỂM BỘ RỄ Ở LÖA
- Vai trò của bộ rễ ở cây lúa;
- Đặc điểm phát triển của bộ rễ lúa
2.2 QTLs VÀ GEN LIÊN QUAN ĐẾN SỰ PHÁT TRIỂN BỘ RỄ LÖA
- Các QTLs liên quan đến sự phát triển bộ rễ lúa;
- Các gen liên quan đến sự hình thành và phát triển bộ rễ lúa
2.3 PHƯƠNG PHÁP GBS
- Phương pháp giải trình tự NGS – nền tảng của GBS;
- Nguyên lý của phương pháp GBS;
- Các ứng dụng của GBS trong chọn giống cây trồng
2.4 PHƯƠNG PHÁP GWAS
- Nguyên lý;
- Các bước xây dựng một nghiên cứu GWAS;
- Ý nghĩa và tiềm năng của GWAS trong chọn tạo giống lúa
2.5 NGUỒN GEN LÖA VÀ TÌNH HÌNH NGHIÊN CỨU RỄ LÖA Ở VIỆT NAM
- Nguồn gen lúa Việt Nam;
- Tình hình nghiên cứu đặc điểm bộ rễ lúa ở Việt Nam
PHẦN 3 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
3.1 VẬT LIỆU NGHIÊN CỨU
- Vật liệu sử dụng trong thí nghiệm đánh giá đặc điểm nông sinh học cơ bản và
đa dạng di truyền với chỉ thị DArT gồm 270 mẫu giống lúa, trong đó có 214 mẫu giống lúa Việt Nam được cung cấp bởi Trung tâm Tài nguyên thực vật (Phụ lục 1a),
33 mẫu giống lúa đại diện cho đa dạng lúa thế giới (đối chứng) được cung cấp bởi Ngân hàng gen của CIRAD – Pháp (Phụ lục 1b), 23 mẫu giống khác được cung cấp
Trang 6bởi Viện Di truyền Nông nghiệp (Phụ lục 1b)
- Vật liệu sử dụng cho phân tích di truyền với GBS và thí nghiệm đánh giá đặc điểm bộ rễ gồm 200 mẫu giống lúa Trong đó có 197 mẫu giống lúa Việt Nam, 3 mẫu giống đối chứng là IR64, Niponbare và Azucena (Phụ lục 3)
- Vật liệu sử dụng trong phân tích lập bản đồ liên kết toàn hệ gen gồm 185 mẫu giống lúa, trong đó có 182 mẫu giống lúa Việt Nam, 3 mẫu giống đối chứng là IR64, Niponbare và Azucena Ngoài ra, khi phân tích GWAS cho từng loài phụ, loài phụ
indica gồm 115 mẫu giống (114 mẫu giống Việt Nam và IR64), loài phụ japonica gồm
64 mẫu giống (62 mẫu Việt Nam cùng với Nippobare và Azucena)
3.2 NỘI DUNG NGHIÊN CỨU
- Khảo sát sự đa dạng về một số đặc điểm nông sinh học cơ bản và đa dạng di truyền (với DArT marker) của một bộ giống lúa Việt Nam, từ đó lựa chọn các mẫu giống phù hợp gia nhập tập đoàn nghiên cứu trong thí nghiệm phân tích kiểu gen GBS
và thí nghiệm đánh giá đặc điểm kiểu hình bộ rễ
- Xây dựng bộ dữ liệu đa hình kiểu gen (haplotype) của tập đoàn mẫu giống nghiên cứu sử dụng phương pháp phân tích kiểu gen thông qua giải trình tự (GBS)
- Xây dựng bộ dữ liệu kiểu hình của một số tính trạng chính liên quan đến sự phát triển bộ rễ ở lúa
- Trên cơ sở dữ liệu kiểu gen (GBS) và kiểu hình thu được, sử dụng phương pháp GWAS để lập bản đồ liên kết toàn hệ gen, từ đó xác định các QTLs và gen ứng viên liên quan đến sự phát triển bộ rễ của các giống lúa Việt Nam
3.3 PHƯƠNG PHÁP NGHIÊN CỨU
3.3.1 Phương pháp chiết tách ADN tổng số
Sử dụng phương pháp CTAB (Murray and Thompson, 1980) Vật liệu được sử dụng là lá của cây lúa được 6 tuần tuổi sau cấy
3.3.2 Phương pháp phân tích di truyền bằng chỉ thị DArT
Để phân tích đa dạng di truyền của tập đoàn giống lúa nghiên cứu chúng tôi sử dụng chỉ thị phân tử DArT (Diversity Array Technology) được phát triển theo công bố
của Killian et al (2012) Sử dụng hệ thống máy móc chuyên dụng của phòng nghiên
cứu DArT, thuộc Trung tâm Hợp tác quốc tế Nghiên cứu và Phát triển Nông nghiệp bền vững (CIRAD) – Pháp Mảng dữ liệu gồm 6144 DArT marker được xây dựng dựa
trên 25 giống chỉ thị, gồm 10 giống indica, 10 giống japonica ôn đới và 5 giống japonica nhiệt đới Phương pháp xây dựng mảng thư viện DArT đã được mô tả bởi Jaccoud et al (2001) cùng Risterucci et al (2009)
3.3.3 Phương pháp phân tích kiểu gen thông qua giải trình tự (GBS)
Chúng tôi sử dụng phương pháp GBS được xây dựng bởi công ty Diversity Arrays Technology Pty Ltd (Australia) là sự kết hợp giữa DArT và cộng nghệ giải trình tự NGS
, bằng cách sử dụng các enzyme giới hạn PstI/TaqI để làm
giảm sự phức tạp của genome, kết hợp với công nghệ đọc trình tự ngắn Illumina,
phương pháp này cũng được miêu tả trong một công bố của Courtois et al (2013)
3.3.4 Phương pháp phân tích cấu trúc quần thể
Phần mềm được sử dụng là STRUCTURE được phát triển bởi Pritchard et al (2000)
3.3.5 Phương pháp tính LD (Linkage Disequilibrium)
Để đánh giá mật độ của các marker sử dụng có đáp ứng yêu cầu của các nghiên cứu di truyền liên kết hay không, sự mất cân bằng liên kết (Linkage Disequilibrium -
Trang 7LD) trong toàn bộ tập đoàn nghiên cứu được tính toán bằng chỉ số r2
giữa các cặp SNP marker khác nhau, sự dụng phần mền Tassel 5.0 trên dữ liệu của từng nhiễm sắc thể
(Bradbury et al., 2007)
3.3.6 Phương pháp đánh giá đặc điểm nông sinh học cơ bản
Đánh giá theo phương pháp chuẩn của IRRI (2002)
3.3.7 Phương pháp đánh giá kiểu hình bộ rễ
3.3.7.1 Bố trí thí nghiệm
Sử dụng phương pháp ống rễ cải tiến, thí nghiệm được bố trí kiểu Alpha- lattice với 3 lần nhắc lại
3.3.7.2 Các chỉ tiêu theo dõi
11 tính trạng được đo trực tiếp từ mẫu và 7 tính trạng thứ cấp được tính toán dựa
MRL: Chiều dài rễ tối đa; 3) TIL: Số nhánh; 4) SDW: Khối lượng khô phần thân; 5) DEPTH: Độ ăn sâu của rễ; 6) NCR: Số lượng rễ bất định; 7) THK: Độ dày của rễ; 8) DW0020: Khối lượng khô của phần rễ từ 0 đến 20 cm tính từ gốc; 9) DW2040: Khối lượng khô của phần rễ từ 20 đến 40 cm tính từ gốc; 10) DW4060: Khối lượng khô của phần rễ từ 40 đến 60 cm tính từ gốc; 11) DWB60: Khối lượng khô của phần rễ dài hơn
60 cm tính từ gốc; 12) RDW: Khối lượng khô của toàn bộ rễ lúa; 13) DRW: Khối lượng khô của phần rễ ăn sâu hơn 40 cm tính từ gốc; 14) PDW: Khối lượng khô của cả cây lúa (cả thân và rễ); 15) SRP: Phần trăm khối lượng khô của phần rễ ăn nông; 16) DRP: Phần trăm khối lượng khô của phần rễ ăn sâu; 17) R_S: Tỷ lệ khối lượng khô giữa phần rễ và phần thân cây ; 18) NR_T: Số rễ bất định trung bình trên 1 nhánh
3.3.7.3 Phương pháp phân tích số liệu kiểu hình
Các số liệu được phân tích phương sai (ANOVA) để xem xét ảnh hưởng của đa dạng di truyền, số lần lặp và các block đến kết quả thí nghiệm, sử dụng phần mềm SAS 9.2 (SAS Institute, Cary NC, USA) Các số liệu liên quan đến đặc điểm thân và bộ rễ của mỗi giống lúa được khái quát bằng hình ảnh sử dụng phần mềm RASTA (được phát triển bởi Jeremy Lavarence – Sinh viên trường Đại học Montpellier II – Pháp)
(PCA– Q) và quan hệ họ hàng (Kinship – K) để hạn chế tỷ lệ dương tính giả có thể xảy
ra Trong quá trình phân tích sử dụng tùy chọn không nén (no compression) và đánh giá lại thành phần phương sai cho mỗi điểm đánh dấu (re-evaluation) Các QQ-plots được
vẽ bởi TASSEL là căn cứ để đánh giá số lượng các dương tính giả có thể có so với mô hình chuẩn Ngưỡng P-value được chọn để xác định sự kiện liên kết xảy ra đáng tin cậy
là P-value ≤ 1e-04 Sau đó, giá trị q tương ứng với từng giá trị P-value được tính toán để kiểm tra mức độ tin cậy của các P-value, sử dụng gói phần mềm R Q V1.0 (Gao, 2011)
Đồ thị Mannhantan Plots biểu diễn giá trị P-value của tất cả các điểm đánh dấu trên từng nhiễm sắc thể khác nhau được vẽ bằng công cụ hỗ trợ có sẵn trong TASSEL
3.3.9 Phương pháp xác định các gen ứng cử viên
Các gen ứng cử viên quan tâm là các gen nằm trong vùng tin cậy của QTLs đã
Trang 8được xác định Căn cứ vào kết quả phân tích LD, các gen nằm trong khoảng tin cậy tính từ vị trí đánh dấu (hoặc đoạn QTLs) được xác định dựa trên bộ dữ liệu giải trình
((http://orygenesdb.cirad.fr/tools.html) Các gen tìm được sẽ được đối chiếu với một danh sách gồm khoảng 200 gen trong bộ dữ liệu các gen liên quan đến sự phát triển bộ rễ
(http://gohelle.cirad.fr:8080/euroot/JSP/authentication.jsp) để so sánh với chức năng gen
đã được chứng minh, đây cũng là minh chứng cho triển vọng và hiệu quả của đề tài
PHẦN 4 KẾT QUẢ VÀ THẢO LUẬN
4.1 ĐẶC ĐIỂM CỦA BỘ SƯU TẬP GIỐNG LÖA
4.1.1 Đặc điểm thu được qua thông tin hồ sơ mẫu giống
Theo thông tin nguồn gen được lập khi thu thập mẫu giống của Trung tâm tài nguyên thực vật, 214 giống lúa được lựa chọn có nguồn gốc từ 36 tỉnh thành trong cả nước, trải dài từ Bắc vào Nam, từ Hà Giang đến Cà Mau Các giống này đã được gieo trồng ở nhiều vùng có điều kiện tự nhiên, đất đai, khí hậu khác nhau ở Việt Nam, tạm chia thành 8 vùng là: 1) vùng đồng bằng Sông Hồng, 2) Vùng đồng bằng sông Cửu Long, 3) vùng Duyên Hải Bắc Trung Bộ, 4) vùng duyên hải Nam Trung Bộ, 5) vùng Đông Nam Bộ, 6) vùng Đông Bắc Bộ, 7) vùng Tây Bắc Bộ, 8) Vùng Tây Nguyên Các điều kiện canh tác chủ yếu của các giống trong tập đoàn theo thứ tự tăng dần là: 1) điều kiện ngập mặn ven biển (5 mẫu giống), 2) canh tác chủ động tưới tiêu (44 mẫu giống), 3) canh tác bằng nước trời trên đất thấp (51 mẫu giống), 4) canh tác nương rẫy chiếm nhiều nhất (70 mẫu giống) chiếm khoảng 33%, các giống còn lại không có dữ liệu thông tin (u) (Phụ lục 1) Trong 214 giống có tới 203 giống được cho là các giống bản địa của Việt Nam (traditional – T), chỉ có 10 giống thuộc nhóm giống cải tiến (improvement –I), và 1 giống không có thông tin ghi chú về điều này (Phụ lục 1)
4.1.2 Đặc điểm nông sinh học cơ bản
4.1.2.1 Thời gian sinh trưởng
Kết quả đánh giá thời gian sinh trưởng của 270 mẫu giống lúa cho thấy: thời gian sinh trưởng của các giống lúa biến động trong khoảng từ 94 đến 186 ngày trong vụ thí nghiệm Theo thang đánh giá chuẩn của IRRI, 270 mẫu giống lúa này được chia làm 5 nhóm TGST khác nhau Kết quả được trình bày ở Bảng 4.1
Bảng 4.1 Phân nhóm mẫu giống theo thời gian sinh trưởng
Phân nhóm Tiêu chuẩn Số mẫu giống Tỷ lệ (%)
Trang 94.1.2.2 Khả năng đẻ nhánh và số nhánh hữu hiệu
Khả năng đẻ nhánh của các giống lúa đã được chúng tôi đánh giá và ghi nhận ở Bảng 4.2 theo thang đánh giá chuẩn của IRRI, trong đó trên 70% các giống nghiên cứu
có khả năng đẻ nhánh ở mức Trung bình (10-19 nhánh) và Cao (20-25 nhánh)
Bảng 4.2 Phân nhóm mẫu giống theo số nhánh hữu hiệu
Số nhánh
hữu hiệu/khóm
Đánh giá theo thang chuẩn
4.1.2.3 Chiều cao cây
Các mẫu giống nghiên cứu có phổ chiều cao cây biến động rất lớn, giống thấp nhất cho chiều cao cây chỉ là 63 cm tới giống có chiều cao cây cao nhất đạt 216 cm Chiều cao cây trung bình của cả tập đoàn là khoảng 160,7 cm, các mẫu giống có chiều cao cây trung bình từ 150 cm có tần số xuất hiện cao (0,72), đặc biệt mẫu giống có chiều cao cây trên 2,0 m (tần số 0,2)
4.1.2.4 Đặc điểm về hạt của các mẫu giống
Tiến hành thí nghiệm quan sát đặc điểm hình dạng và tính chất nội nhũ của hạt thu được từ các giống lúa Việt Nam, có thể thấy phần lớn các giống lúa được chọn là lúa tẻ, chiếm 60,28% Số lượng lúa nếp ít hơn, chỉ bằng một nửa số lúa tẻ (33,18%) Ngoài ra còn
có một số mẫu giống chưa thể xác định được tính chất nội nhũ (chiếm 6,54%)
Về hình dạng hạt, sau khi đo và tính toán tỷ lệ chiều dài hạt/ chiều rộng hạt chúng tôi thu được kết quả trình bày ở Bảng 4.3
Bảng 4.3 Đặc điểm hình dạng hạt của các mẫu giống lúa Việt Nam trong bộ sưu
tập giống nghiên cứu
Trang 104.2 KẾT QUẢ PHÂN TÍCH ĐA DẠNG DI TRUYỀN VỚI CHỈ THỊ DART 4.2.1 Kết quả phân tích đa hình và cấu trúc di truyền
Phân tích kết quả lai giữa ADN của các giống nghiên cứu với 6144 DArT marker, kết quả thu được có 619 marker cho đa hình trong tập đoàn lúa nghiên cứu, chiếm khoảng 9.6% tổng số marker sử dụng Sau khi phân tích và lựa chọn, chúng tôi thu được 241 marker có chất lượng tốt và không bị trùng lặp, hàm lượng thông tin đa hình (PIC) của các marker này dao động từ 5% đến 50%, trung bình là 40% Các DArT marker này phân bố đều trong toàn
bộ genome, số lượng marker trên mỗi nhiễm sắc thể tỷ lệ thuận với kích thước tương đối của chúng tính bằng bp (hệ số tương quan r = 0,78)
Một ma trận dữ liệu được tạo thành từ 241 DArT marker và 270 mẫu giống lúa đã được đưa vào phân tích cấu trúc di truyền sử dụng phần mềm STRUCTURE v2.3.1
(Prichard et al., 2000) Kết quả cho thấy có 168 giống lúa có nền di truyền giống với giống đối chứng indica từ 80 đến 100%, nghĩa là giống đó thuộc loài phụ indica; 88 giống có nền
di truyền giống với đối chứng japonica từ 80 đến 100%, được xếp vào nhóm loài phụ japonica; còn lại là các giống có nền di truyền trung gian Một biểu đồ đã được thiết lập dựa vào tỷ lệ phần trăm tương đồng về nền di truyền với đối chứng của 2 loài phụ indica và japonica của mỗi giống nghiên cứu, kết quả được trình bày ở Hình 4.1
Chú thích: Trục tung biểu diễn tỷ lệ nền di truyền giữa hai loài phụ indica và japonica, trục hoành biểu diễn số thứ tự của các mẫu giống lúa Màu xanh lá cây đại diện cho nền di truyền thuộc nhóm loài phụ indica; màu đỏ đại diện cho nền di truyền thuộc nhóm loài phụ japonica; các mẫu giống có chữ “m” là dạng trung gian giữa hai loài phụ này Vị trí
1 và 159 là đối chứng của IR64 (135), vị trí 2 là đối chứng của APO (132), vị trí 3 là đối chứng của Azucena (153), vị trí 148 là đối chứng của Nipponbare (168), vị trí 155 là đối chứng của DOM SOFID (150), đối chứng được sử dụng là ADN được chiết tách từ các mẫu giống lúa tương ứng nhưng được trồng và bảo quản tại Ngân hàng gen của CIRAD
Vị trí số 170 là giống GC14 thuộc Oryza glaberrima
Hình 4.1 Thành phần genome của các mẫu giống nghiên cứu
Trang 114.2.2 Xây dựng cây phân loại cho các mẫu giống lúa nghiên cứu
Sử dụng DarWin5 để phân tích kết quả đa hình thu được từ DarTsoft 7.4, (241
marker x 270 mẫu giống lúa, trong đó có giống lúa CG14 là đối chứng thuộc loài lúa
trồng Châu Phi – Oryza glaberrima) chúng tôi đã xây dựng được cây phân loại cho các
mẫu giống trong tập đoàn nghiên cứu (Neighbor Joining Tree) Kết quả được thể hiện
ở Hình 4.2
Trong hình chấm màu đen biểu diễn các giống lúa Việt Nam được cung cấp bởi Trung tâm tài nguyên thực vật
và các giống khác cung cấp bởi Viện Di truyền Chấm màu đỏ biểu diễn cho các giống đối chứng thuộc nhóm
indica Chấm màu xanh lục biểu diễn cho các giống đối chứng thuộc nhóm japonica Chấm màu xanh lá cây
biểu diễn cho các giống đối chứng thuộc nhóm Sadri/Basmati Chấm màu cam biểu diễn cho các giống đối
chứng thuộc nhóm Aus/Bro Chấm màu hồng biểu diễn vị trí của giống CG14 thuộc loài Oryza glaberrima, một
giống lúa trồng Châu Phi
Hình 4.2 Cây phân loại của 270 mẫu giống lúa với 241 DArT marker
Trang 12Hình 4.2 thể hiện một cây phân loại có cấu trúc lưỡng cực với hai nhóm chính,
nhóm chính thứ nhất có các mẫu giống chỉ thị màu đỏ là nhóm I – nhóm indica; nhóm chính thứ hai có mẫu giống chỉ thị màu xanh lục là nhóm VI – nhóm japonica theo phân loại isozyme của Glasmanz et al (1987) Giữa hai nhóm này có hai nhóm nhỏ tương ứng với nhóm II và nhóm V theo phân loại isozyme của Glasmanz et al (1987),
trong kết quả phân tích cấu trúc di truyền với chỉ thị DArT bằng phần mềm STRUCTURE đây là các mẫu giống có thành phần genome dạng trung gian (m)
Nhóm có các mẫu giống chỉ thị màu xanh lá cây là Sadri/Basmati (nhóm V) có nền di truyền gần với nhóm japonica hơn trong khi các mẫu giống thuộc nhóm nhỏ màu da cam là Aus/Boro (nhóm II) lại có khoảng cách gần hơn với các mẫu giống thuộc nhóm indica
Căn cứ vào kết quả này, chúng tôi đã loại bỏ các mẫu giống có quan hệ quá gần gũi, hoặc các mẫu giống có cùng nền di truyền nhưng khác tên Kết quả chọn được một tập đoàn gồm 200 giống lúa gồm 197 giống lúa Việt Nam và 3 giống lúa đối
chứng (Niponbare đại diện cho lúa japonica ôn đới; Azucena đại diện cho lúa japonica nhiệt đới; và IR64 đại diện cho lúa indica) Thí nghiệm đánh giá kiểu hình bộ rễ và
phân tích kiểu gen thông qua giải trình tự GBS (Genotyping By Scequencing) được thực hiện với 200 mẫu giống lúa được chọn
4.3 KẾT QUẢ PHÂN TÍCH KIỂU GEN THÔNG QUA GIẢI TRÌNH TỰ (GBS –GENOTYPING BY SEQUENCING)
4.3.1 Kết quả phân tích đa hình và cấu trúc di truyền với SNPs marker
Với tổng số 50000 chỉ thị GBS đã được sử dụng với 200 mẫu giống lúa, sau khi phân tích kết quả thô, các giống lúa xuất hiện quá nhiều điểm khuyết dữ liệu kiểu gen
sẽ bị loại bỏ Kết quả, một ma trận haplotype đã được thành lập bởi 185 giống lúa, trong đó có 182 giống lúa Việt Nam và 3 giống lúa đối chứng (IR64, Niponbare, Azucena) 25971 marker, cho chỉ số đa hình (PIC) biến động từ 1% đến 50%, chỉ số đa hình trung bình là 32,0%
Để chuẩn bị dữ liệu cho GWAS, các marker có tần số alen thấp (< 5%) sẽ bị loại
bỏ Các dữ liệu bị khuyết sẽ được quy đổi căn cứ vào các dữ liệu đối chứng Cuối cùng, một ma trận haplotype được được xây dựng bởi 185 giống lúa, trong đó có 3 giống đối chứng (IR64, Niponbare, Azucena) và 21623 SNPs marker Các maker được phân bố đều trong genome với khoảng cách trung bình là 17,1 kb Để so sánh và tìm kiếm các vùng QTLs đặc trưng cho từng nhóm giống, 2 ma trận dữ liệu haplotype
khác cũng đồng thời được xây dựng cho 115 mẫu giống lúa thuộc nhóm indica (114 mẫu giống Việt Nam và IR64) và 64 mẫu giống lúa thuộc nhóm japonica (62 mẫu
giống Việt Nam và Niponbare, Azucena) Số lượng marker trong hai ma trận này lần
lượt là 13814 và 8821 tương ứng cho nhóm giống indica và japonica
Sự đa hình alen của quần thể được hình ảnh hóa thông qua cấu trúc di truyền
Trang 13Một phân tích cấu trúc di truyền quần thể được thực hiện trên 1275 SNP marker, kết quả cho thấy tập đoàn 182 giống lúa Việt Nam chia thành hai nhóm rõ rệt gồm 114
mẫu giống thuộc loài phụ indica, 62 mẫu giống thuộc loài phụ japonica, còn lại là mẫu
giống thuộc dạng trung gian giữa hai loài phụ trên Phân nhóm của các giống trong tập đoàn nghiên cứu gần như trùng khớp với kết quả trong lần phân tích với các chỉ thị DArT ban đầu
Tiến hành phân tích mối quan hệ giữa 114 mẫu giống thuộc loài phụ indica, sử dụng
840 SNP marker đã xác định được có 6 nhóm phụ, được ký hiệu lần lượt từ I1 đến I6, kết quả này một lần nữa được xác định bằng phương pháp phân tích thành phần chính
(DACP) (Jombary et al., 2010); 6 nhóm phụ này được biểu diễn ở Hình 4.3
Chú thích: Các giống có màu giống nhau thì cùng thuộc một phân nhóm; giống không không xác định được phân
nhóm được biểu diễn bằng màu đen; IR64 (giống đối chứng đại diện cho nhóm indica) nằm trong phân nhóm
được biểu diễn bằng màu hồng (I2); Các đặc điểm đặc trưng của các phân nhóm được ghi cùng màu với phân
nhóm đó, trong đó: 1) Đặc điểm vùng khí hậu nơi giống được thu thập: MRD = Vùng đồng bằng sông Cửu
Long; SE = Vùng Đông Nam Bộ; CH = Vùng Tây Nguyên; SCC = Vùng Duyên Hải Nam Trung Bộ; NCC = Vùng Duyên Hải Bắc Trung Bộ; RRD = Vùng Đồng Bằng Sông Hồng; NW = vùng Tây Bắc Bộ; NE = Vùng
Đông Bắc Bộ 2) Sinh thái: IR = Chủ động tưới tiêu; RL = Canh tác nước trời ở vùng đất thấp; UP = canh tác nương rẫy; MX = được canh tác trong nhiều hệ sinh thái khác nhau 3) Thời gian sinh trưởng: E = Ngắn; M = Trung ngày; L = Dài ngày; VL = Rất dài ngày 4) Tỷ lệ giữa chiều dài và chiều rộng hạt thóc (L/W): A = L/W >
3,0; B = 2,5 ≤ L/W ≤ 3,0; C = L/W ≤ 2,5 5) Đặc điểm nội nhũ: G = gạo nếp; NG = gạo tẻ
Hình 4.3 Các phân nhóm trong nhóm giống thuộc loài phụ indica
Tương tự, một phân tích cấu trúc quần thể cũng được thực hiện với 62 giống lúa
japonica Việt Nam, sử dụng 780 SNPs marker Kết quả xác định được 4 nhóm phụ và
một nhóm trung gian Sơ đồ cây phân lại được vẽ bởi phần mềm DARwin và được trình bày ở Hình 4.4