Đánh giá đặc điểm hình thái nông học, chất lượng và đa dạng di truyền dựa trên kiểu hình và chỉ thị SNP của các giống lúa gạo trắng và gạo màu, phục vụ mục tiêu bảo tồn và phát triển ngu
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
HỒ THỊ THƯƠNG
ĐÁNH GIÁ MỘT SỐ ĐẶC ĐIỂM NÔNG SINH HỌC VÀ
ỨNG DỤNG KỸ THUẬT SKIM SEQUENCING PHÂN TÍCH SNP
Ở MỘT SỐ GIỐNG LÚA GẠO TRẮNG VÀ GẠO MÀU
TẠI VIỆT NAM
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – 2024
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
HỒ THỊ THƯƠNG
ĐÁNH GIÁ MỘT SỐ ĐẶC ĐIỂM NÔNG SINH HỌC VÀ
ỨNG DỤNG KỸ THUẬT SKIM SEQUENCING PHÂN TÍCH SNP
Ở MỘT SỐ GIỐNG LÚA GẠO TRẮNG VÀ GẠO MÀU
TẠI VIỆT NAM
Chuyên ngành: Công nghệ Sinh học
Mã số: 8420201
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS PHẠM HÙNG CƯƠNG
TS LÊ QUỲNH MAI
Hà Nội – 2024
Trang 3LỜI CẢM ƠN
Trong suốt quá trình học tập, nghiên cứu và hoàn thành luận văn, tôi đã nhận
được sự quan tâm, giúp đỡ từ thầy cô, đồng nghiệp, bạn bè và người thân
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy hướng dẫn TS Phạm
Hùng Cương, Trung tâm Tài nguyên Thực vật và cô TS Lê Quỳnh Mai, Bộ môn
Thực vật học, Khoa Sinh học, trường Đại học khoa học tự nhiên, ĐHQG HN đã tận
tâm hướng dẫn, dành nhiều thời gian để hỗ trợ và chỉ dẫn tôi trong suốt quá trình thực
hiện đề tài.Tôi xin chân thành cảm ơn Khoa Sinh học – Trường Đại học Khoa học Tự
nhiên, Đại học Quốc gia Hà Nội, đã tạo điều kiện thuận lợi cho tôi trong quá trình
học tập, nghiên cứu và hoàn thành luận văn này
Tôi cũng xin trân trọng cảm ơn Đề tài “Nghiên cứu tương quan trên toàn hệ
gen (GWAS) đối với tính trạng liên quan đến hàm lượng một số hợp chất chống oxy
hóa trên tập đoàn lúa màu Việt Nam” đã hỗ trợ kinh phí để tôi thực hiện nghiên cứu
này
Ngoài ra, tôi xin gửi lời cảm ơn chân thành tới Ban Giám đốc và tập thể cán
bộ viên chức Trung tâm Tài nguyên thực vật, Viện Khoa học Nông nghiệp Việt Nam
đã hỗ trợ và tạo điều kiện thuận lợi trong quá trình tôi thực hiện đề tài
Cuối cùng, tôi xin cảm ơn gia đình, người thân, bạn bè và đồng nghiệp đã luôn
động viên, chia sẻ và hỗ trợ tôi về mọi mặt, giúp tôi hoàn thành tốt nhất luận văn này
Xin chân thành cảm ơn!
Hà Nội, ngày tháng năm 2024
Tác giả luận văn
Hồ Thị Thương
Trang 4MỤC LỤC
LỜI CẢM ƠN I
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 3
1.1 Giới thiệu chung về cây lúa 3
1.1.1 Nguồn gốc phát sinh 3
1.1.2 Phân loại 4
1.1.3 Phân bố 6
1.1.4 Vai trò của lúa gạo trong đời sống xã hội 8
1.1.5 Sản xuất và tiêu thụ lúa gạo trên thế giới và tại Việt Nam 11
1.3 Nghiên cứu di truyền phân tử ở lúa gạo trên thế giới và trong nước 15
1.3.1 Giải trình tự bộ gen và nghiên cứu đa dạng di truyền cây lúa trên thế giới 15 1.3.2 Giải trình tự bộ gen và nghiên cứu đa dạng di truyền cây lúa ở trong nước. 18 1.4 Một số phương pháp đánh giá đa dạng di truyền 22
1.4.1 Phương pháp nghiên cứu đa dạng di truyền dựa trên kiểu hình 23
1.4.2 Phương pháp nghiên cứu đa dạng di truyền dựa trên chỉ thị phân tử 24
1.4.3 Giải trình tự độ phủ thấp (skim sequencing) 26
1.4.4 Ý nghĩa và vai trò của đánh giá kiểu hình và ứng dụng skim- sequencing trong nghiên cứu đa dạng tập đoàn lúa 29
CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 31
2.1 Vật liệu nghiên cứu 31
2.2 Địa điểm và thời gian nghiên cứu 31
2.3.1 Phương pháp đánh giá các đặc điểm nông sinh học 32
2.3.2 Phương pháp phân tích các chỉ tiêu liên quan đến chất lượng gạo 34
2.3.3 Phương pháp phát hiện và đánh giá đa dạng di truyền 35
CHƯƠNG 3 KẾT QUẢ VÀ THẢO LUẬN 39
Trang 53.1 Kết quả đánh giá đặc điểm nông sinh học 39
3.1.1 Đặc điểm hình thái của tập đoàn lúa 39
3.1.3 Năng suất và yếu tố cấu thành năng suất 57
3.2 Đánh giá chất lượng của mẫu giống lúa 59
3.2.1 Phân loại nếp, tẻ 60
3.2.2 Hương thơm 61
3.3.3 Nhiệt độ hoá hồ 61
3.3.4 Đánh giá loài phụ Indica/Japonica 62
3.3 Đánh giá đa dạng di truyền các mẫu giống lúa dựa vào kiểu hình và đặc điểm chất lượng 62
3.4 Phân Tích SNP và đánh giá đa dạng di truyền trong tập đoàn lúa sử dụng chỉ thị phân tử SNP 65
3.4.2 Đánh giá chất lượng các SNP 66
3.4.3 Phân tích thành phần chính PCA 68
3.4.4 Phân nhóm và đánh giá đa dạng di truyền của bộ giống lúa dựa trên chỉ thị SNP 70
3.5 Giới thiệu nguồn gen triển vọng cho nghiên cứu và chọn tạo giống lúa 73
CHƯƠNG 4 KẾT LUẬN VÀ ĐỀ NGHỊ 76
4.1 Kết luận 76
4.2 Đề nghị 77
TÀI LIỆU THAM KHẢO 78 PHỤ LỤC A
Trang 6DANH MỤC BẢNG
Bảng 1 1 Phân bố và phân loại bộ gen của các loài lúa trên khắp thế giới 5
Bảng 2 1 Các chỉ tiêu theo dõi 32
Bảng 3 1 Đặc điểm thân của các mẫu giống lúa nghiên cứu 40
Bảng 3 2 Đặc điểm hình thái lá của các mẫu giống lúa 45
Bảng 3 3 Đặc điểm hình thái hoa và bông của các mẫu giống lúa 49
Bảng 3 4 Đặc điểm hình thái hạt thóc của các mẫu giống lúa 51
Bảng 3 5 Thống kê đặc điểm về kích thước hạt thóc của tập đoàn lúa 54
Bảng 3 6 Thời gian sinh trưởng của các mẫu giống lúa 56
Bảng 3 7 Phân bố giống lúa theo khối lượng 1000 hạt 58
Bảng 3 8 Khối lượng 1000 hạt và năng suất thực thu của các mẫu giống lúa 59
Bảng 3 9 Kết quả phân tích một số chỉ tiêu liên quan đến chất lượng gạo của các mẫu giống lúa 60
Bảng 3 10 Các chỉ tiêu đánh giá chất lượng dữ liệu SNP 66
Trang 7DANH MỤC HÌNH
Hình 1 1 Bản đồ phân bố lúa gạo trên thế giới 7
Hình 1 2 Sản lượng, diện tích thu hoạch và năng suất lúa Việt Nam từ năm 2001 đến năm 2019 13
Hình 3 1 Chiều cao cây, đường kính ống rạ của các mẫu giống lúa 41
Hình 3 2 Phân bố màu sắc phiến lá trong tập đoàn lúa nghiên cứu 43
Hình 3 3 Phân bố các đặc tính hình thái của lá lúa 47
Hình 3 4 Các dạng thìa lìa của tập đoàn giống lúa nghiên cứu 47
Hình 3 5 Phân bố một số tính trạng bông của tập đoàn lúa 48
Hình 3 6 Hình dạng hạt thóc và màu sắc vỏ gạo của một số mẫu giống lúa 53
Hình 3 7 Chiều dài, chiều rộng và hình dạng hạt thóc của các mẫu giống lúa 55
Hình 3 8 Biểu đồ phân bố thời gian sinh trưởng của các mẫu giống lúa 57
Hình 3 9 Cây phân loại dựa trên chỉ thị hình thái của tập đoàn lúa 64
Hình 3 10 (A) Chất lượng một trình tự cơ sở, (B) Phân bố GC trong trình tự, (C) Adapter bị loại bỏ ở cả hai đầu của trình tự 65
Hình 3 11 Phân bố của các vị trí đa hình (SNP) trên các nhiễm sắc thể 67
Hình 3 12 Giá trị riêng và phương sai của các thành phần chính PC 68
Hình 3 13 Biểu đồ phân bố 2 chiều dựa trên hai thành phần chính PC1 và PC3 69
Hình 3 14 Cây phân nhóm di truyền của tập đoàn lúa dựa trên chỉ thị SNP 72
Trang 8DANH MỤC TỪ VIẾT TẮT
Từ viết
AFLP Amplified Fragment Length
GATK Genome Analysis Toolkit Bộ công cụ phân tích bộ gen
IRRI International Rice Research Insitute Viện Lúa Quốc tế
IPGRI International plant genetic resources
institute
Viện Tài nguyên Di truyền thực vật Quốc tế
ISSR Inter-Simple Sequence Repeat Đoạn lặp lại xen kẽ đơn giản
NGS Next generation sequencing Giải trình tự gen thế hệ mới
OECD Organisation for Economic
Co-operation Development
Tổ chức Phát triển Hợp tác Kinh tế
PCR Polymerase chain reaction Phản ứng chuỗi trùng hợp
QTL Quantitative Trait Loci Vị trí tính trạng số lượng
SSCP Single-Strand Conformation
SNP Single Nucleotide Polymorphism Đa hình đơn nucleotide
Trang 9MỞ ĐẦU
Lúa gạo là một trong những nguồn lương thực chủ đạo, đảm bảo an ninh lương thực cho hơn một nửa dân số thế giới Với hàm lượng calo cao cùng nhiều loại vitamin
và khoáng chất thiết yếu, gạo vượt trội so với các cây lương thực khác như ngô, lúa
mì và khoai tây về giá trị dinh dưỡng Các thành phần dinh dưỡng của gạo bao gồm vitamin E, B5, thiamine, canxi, folate, và sắt, cùng nhiều hợp chất phenolic như axit phytic, flavonoid, anthocyanin, tocopherol, và oryzanol Những hợp chất này không chỉ góp phần vào tính chất kháng oxy hóa mạnh mẽ mà còn được chứng minh có tác dụng hỗ trợ phòng ngừa các bệnh tim mạch và tiểu đường
Xu hướng tiêu dùng hiện đại đang chuyển hướng sang các sản phẩm nông nghiệp an toàn và có lợi cho sức khỏe Trong đó, nhu cầu về các loại gạo màu, đặc biệt ở Mỹ và châu Âu, đang gia tăng nhanh chóng nhờ vào giá trị dinh dưỡng cao và đặc tính tự nhiên của màu thực phẩm hữu cơ Theo nghiên cứu của Ichikawa et al (2001), gạo đen sở hữu khả năng chống oxy hóa vượt trội, cao gấp hai lần so với quả việt quất (blueberry) Loại gạo này đã trở thành tâm điểm chú ý nhờ hàm lượng anthocyanin cao, đứng đầu trong nhóm các loại gạo màu đen, tím, đỏ và nâu
Tại Việt Nam, lúa gạo là cây trồng lương thực quan trọng nhất, với diện tích canh tác đạt khoảng 7,1 triệu ha, tập trung chủ yếu ở đồng bằng sông Cửu Long và đồng bằng sông Hồng Việt Nam không chỉ nổi tiếng là quốc gia xuất khẩu gạo hàng đầu mà còn từng bước xây dựng thương hiệu gạo quốc gia, tập trung vào ba nhóm chính: gạo thơm, gạo chất lượng cao, và gạo đặc sản Trong đó, gạo màu được xem
là một nhóm đặc sản tiềm năng, phù hợp để phát triển thành sản phẩm mang thương hiệu quốc gia khi được đầu tư nghiên cứu và phát triển bài bản
Nguồn gen gạo màu ở Việt Nam rất phong phú, với sự đa dạng về màu sắc vỏ trấu và nội nhũ như nâu, đỏ, tím, đen, vàng, xanh Trung tâm Tài nguyên Thực vật hiện đang bảo tồn trên 400 mẫu giống gạo màu từ các vùng sinh thái khác nhau trên
cả nước Tuy nhiên, việc phát triển sản xuất gạo màu còn gặp khó khăn do các giống địa phương thường dài ngày, phụ thuộc vào quang chu kỳ, dẫn đến năng suất và chất lượng chưa ổn định Đồng thời, nghiên cứu về di truyền và mối tương tác giữa giống với môi trường vẫn còn hạn chế
Trang 10Do đó, việc đánh giá đặc điểm nông sinh học, chất lượng và đa dạng di truyền của các giống lúa, đặc biệt là lúa gạo màu, là cần thiết để góp phần bảo tồn và phát triển bền vững nguồn gen lúa tại Việt Nam Xuất phát từ thực tiễn trên, nghiên cứu
với đề tài “Đánh giá một số đặc điểm nông sinh học và ứng dụng kỹ thuật Skim Sequencing phân tích SNP ở một số giống lúa gạo trắng và gạo màu tại Việt Nam”
được thực hiện nhằm đạt các mục tiêu sau:
1 Đánh giá đặc điểm hình thái nông học, chất lượng và đa dạng di truyền dựa trên kiểu hình và chỉ thị SNP của các giống lúa gạo trắng và gạo màu, phục
vụ mục tiêu bảo tồn và phát triển nguồn gen lúa gạo tại Việt Nam
2 Thông qua mô tả và phân tích các đặc điểm nông sinh học, năng suất và chất lượng, tiến hành phân nhóm, lựa chọn các nguồn gen triển vọng, góp phần vào bảo tồn và phát triển các giống lúa tại Việt Nam
Trang 11CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 1.1 Giới thiệu chung về cây lúa
1.1.1 Nguồn gốc phát sinh
Lúa (Oryza sativa L.) là một nguồn lương thực chủ yếu, cung cấp năng lượng
cho gần một nửa dân số thế giới, và là một trong những loại cây ngũ cốc quan trọng nhất trên toàn cầu [49] Lúa được trồng ở hơn 100 quốc gia từ vĩ độ 45° Nam đến 53° Bắc , có vai trò chủ đạo trong bữa ăn hàng ngày, không chỉ trực tiếp làm thực phẩm
mà còn gián tiếp qua thức ăn chăn nuôi [80] Đây là lương thực chính ở ít nhất 15 quốc gia thuộc khu vực châu Á - Thái Bình Dương, 10 quốc gia tại Mỹ Latinh và Caribe, cùng với các quốc gia ở châu Phi và Bắc Phi Hơn 95% sản lượng gạo toàn cầu được sản xuất tại châu Á [66] Trong một số ngôn ngữ châu Á, từ “thực phẩm”
và “gạo” còn được dùng thay thế cho nhau
Về mặt dinh dưỡng, gạo chiếm hơn 1/5 tổng lượng calo tiêu thụ toàn cầu, với trên 2 tỷ người ở châu Á nhận được 60-70% nhu cầu calo hàng ngày từ gạo [43] Là nguồn thực phẩm chính cho khoảng 3 tỷ người trên toàn cầu đồng thời gạo đóng vai trò then chốt trong đời sống và văn hóa của nhiều quốc gia Đông Nam và Nam Á Trên thế giới có hơn 40.000 giống lúa khác nhau, nhưng chỉ một số ít được sử dụng phổ biến Dù đa dạng về màu sắc, tất cả các loại lúa đều thuộc họ Hòa thảo
(Gramineae), với nguồn gốc từ các vùng nhiệt đới và cận nhiệt đới Oryza sativa là loại lúa phổ biến nhất, trong đó các giống Indica và Japonica được tiêu thụ nhiều nhất Bên cạnh đó, Oryza glaberrima, một loại lúa đặc trưng của châu Phi, cũng được
Theo Chaudhary (2003), “lúa màu” (colored rice) là khái niệm để chỉ các giống gạo có màu đỏ, tím hoặc đen Màu sắc này chủ yếu là do sự hiện diện của anthocyanin
Trang 12ở lớp cám, vỏ trấu và nội nhũ Các giống lúa màu đã được trồng từ lâu đời ở châu Á, trong đó lúa đỏ phổ biến ở phía tây Nam và phía Đông Trung Quốc, chủ yếu thuộc
nhóm Indica, còn lúa đen có cả hai dạng Indica và Japonica [70]
Trong lịch sử Ấn Độ, lúa màu đã được ghi nhận từ thời kỳ của các nhà sáng lập Ayurveda như Susruta (400 TCN), Charaka (700 TCN) và Vagbhata (700 SCN), với
những giá trị y học quan trọng của loại lúa này [3] Lúa đỏ Japonica đã được trồng ở
Nhật Bản từ thời kỳ tiền Nara (710 SCN), và giống lúa đỏ dài của Ấn Độ được du nhập vào Nhật Bản trong khoảng thế kỷ 11-14 [83]
1.1.2 Phân loại
Cây lúa trồng thuộc họ Poaceae, trước đây gọi là họ Hoà thảo (Gramineae),
họ phụ Pryzoideae, tộc Oryzae, chi Oryza, loài Oryza sativa và Oryza glaberrima Loài Oryza sativa là lúa trồng ở Châu Á và Oryza glaberrima là lúa trồng ở Châu Phi Năm 1753, Lineaeus là người đầu tiên đã mô tả và xếp loài lúa sativa thuộc chi
Oryza Dựa vào mày hạt và dạng hạt tác giả đã phân chi Oryza thành bốn nhóm là sativa, granulata, coarctala, rhynchoryza và chi Oryza gồm tất cả 19 loài [36]
Chi Oryza, với khoảng 20 loài khác nhau, là nguồn gốc của hầu hết các giống
lúa trồng trên thế giới Trong đó, Oryza sativa và Oryza glaberrima là hai loài chủ lực, lần lượt được trồng phổ biến ở châu Á và châu Phi O sativa tiếp tục phân hóa thành ba giống địa lý chính: Japonica, Indica và Javanica Mỗi giống, với những đặc
trưng riêng về hình thái hạt, thành phần hóa học và hương vị, đã thích nghi với điều kiện sinh thái và khẩu vị ẩm thực của từng vùng miền
Giống Japonica thường có hạt ngắn, tròn, trong khi Indica có hạt dài, thon Về hương vị, indica thường thơm hơn Japonica Những đặc điểm này không chỉ ảnh
hưởng đến chất lượng gạo mà còn liên quan đến các đặc điểm di truyền khác nhau của từng giống [69]
Cây lúa trồng Oryza sativa có bộ gen lưỡng bội (2n = 24) tương đối nhỏ so
với các cây lương thực khác, với chỉ khoảng 430 triệu cặp base và khoảng 50% bộ gen bao gồm các trình tự lặp lại [80] Điều này đã tạo điều kiện thuận lợi cho việc nghiên cứu và ứng dụng công nghệ gen trong cải tiến giống lúa
Trang 13Hầu hết các loài thuộc chi Oryza đều có bộ gen lưỡng bội, tuy nhiên, một số loài là tứ bội (4n = 48) Các loài trong chi Oryza có thể được phân thành chín nhóm (với một loài chưa được phân loại) dựa trên khả năng tương thích bộ gen trong quá trình phân bào giảm phân ở thế hệ F1 (thế hệ đầu tiên) của các giống lai Các nhóm này cùng với vị trí địa lý của mỗi loài được trình bày trong Bảng 1.1[36]
Bảng 1 1 Phân bố và phân loại bộ gen của các loài lúa trên khắp thế giới
gen
Châu Phi
Trung và Nam Mỹ
Châu
Á
Châu Đại Dương
Trang 14Loài Oryza Loại bộ
gen
Châu Phi
Trung và Nam Mỹ
Châu
Á
Châu Đại Dương
Nguồn: The Biology and Ecology of Rice (Oryza sativa L.) in Australia (2005)
Bảng trên cho thấy sự phân bố địa lý của các loài lúa thuộc chi Oryza và phân loại bộ gen của chúng Các loại bộ gen khác nhau được ký hiệu bằng các cặp chữ cái như AA, BB, CC, v.v., thể hiện sự đa dạng gen trong các loài lúa trên toàn cầu
Trong quá trình tiến hoá của cây lúa, ngoài hai loài phụ Indica và Japonica còn có nhiều loại hình trung gian như Javanica v.v [3]
1.1.3 Phân bố
Lúa gạo hiện nay được trồng trên khắp thế giới, với hơn 100 quốc gia tham gia vào hoạt động sản xuất lúa và sản lượng toàn cầu đạt khoảng 715 triệu tấn lúa hàng năm, tương đương với 480 triệu tấn gạo xay xát Mặc dù có nhiều quốc gia tham gia sản xuất, nhưng chỉ 15 quốc gia chiếm tới 90% sản lượng lúa của thế giới, trong
đó nổi bật là Trung Quốc và Ấn Độ Hai quốc gia này đóng góp đến 50% sản lượng toàn cầu, là những nhà sản xuất lúa gạo lớn nhất thế giới [41] (Hình 1.1)
Châu Á là trung tâm sản xuất lúa gạo lớn nhất thế giới, chiếm tới 90% tổng sản lượng toàn cầu Các nước có sản lượng lớn bao gồm Trung Quốc, Ấn Độ, Indonesia, Bangladesh, Việt Nam, Myanmar, Thái Lan, Philippines, Nhật Bản, Pakistan, Campuchia, Hàn Quốc, Nepal và Sri Lanka Những quốc gia này không chỉ đáp ứng nhu cầu nội địa mà còn đóng vai trò quan trọng trong việc cung cấp gạo cho thị trường toàn cầu Tại châu Á, cây lúa đóng vai trò không chỉ về mặt kinh tế mà còn
là một phần của đời sống văn hóa và lối sống của người dân [76]
Trang 15Nguồn FAOSTAT, 2013
Hình 1 1 Bản đồ phân bố lúa gạo trên thế giới
Ngoài châu Á, một số quốc gia khác cũng có đóng góp đáng kể vào sản lượng lúa thế giới Brazil, Hoa Kỳ, Ai Cập, Madagascar và Nigeria là các nước ngoài khu vực châu Á sản xuất lúa gạo với tỷ lệ khoảng 5% tổng sản lượng toàn cầu Trong đó, Brazil và Hoa Kỳ là những nước sản xuất lúa gạo chủ lực ở châu Mỹ, còn Ai Cập nổi bật ở khu vực Trung Đông và Bắc Phi nhờ điều kiện canh tác phù hợp và kỹ thuật nông nghiệp tiên tiến Madagascar và Nigeria đại diện cho sản xuất lúa gạo tại châu Phi, một châu lục mà lúa đang dần trở thành cây lương thực chính và có tốc độ tăng trưởng nhanh nhất [41]
Tại châu Phi, nhu cầu tiêu thụ lúa gạo tăng mạnh trong những thập kỷ qua do
sự phát triển của dân số và mức độ đô thị hóa Tổng sản lượng ngũ cốc của châu lục này đã tăng từ 9,3% vào năm 1961 lên 15,2% vào năm 2007 [47] Tuy nhiên, khả năng tự cung tự cấp gạo của châu Phi còn nhiều hạn chế, chỉ đạt khoảng 54% nhu cầu tiêu thụ nội địa Theo báo cáo thông kê của FAO năm 2022, Châu Phi có đến 34 quốc gia có diện tích thu hoạch lúa trên 5.000 ha, tuy nhiên, diện tích và sản lượng lúa tại khu vực này chưa cao so với châu Á [39] Điều này khiến châu Phi phụ thuộc nhiều vào nguồn nhập khẩu gạo để đáp ứng nhu cầu lương thực, mặc dù các nước sản xuất lớn trong khu vực như Nigeria và Madagascar đang nỗ lực tăng cường năng lực sản xuất để giảm bớt sự phụ thuộc vào nhập khẩu
Utary và cộng sự (2021) cho biết ở vùng phía Bắc Sumatera, Indonesia lúa màu ít được quan tâm gieo trồng vì đây là vùng có nhiều đầm lầy, trũng Để có thể
Trang 16mở rộng diện tích gieo cấy lúa màu, các tác giả đã tiến hành lai lúa màu với giống
lúa có gen chịu ngập Sub1 (Inpara 5) Kết quả chọn được 2 dòng IP.6 và IT.1 có
năng suất cao, chịu ngập, gạo có màu đen [84]
Các giống lúa gạo màu đỏ, tím hay đen được trồng trọt từ rất lâu đời ở Châu
Á Lúa đỏ phân bố ở rất nhiều quốc gia châu Á, tuy nhiên phổ biến nhất là ở phía tây
Nam và phía Đông của Trung Quốc, lúa đỏ đa số thuộc nhóm Indica Lúa đen được phát hiện ở cả hai dạng Indica và Japonica [40]
Tại Việt Nam, hiện nay Ngân hàng gen cây trồng Quốc gia của Trung tâm Tài nguyên thực vật, Viện Khoa học Nông nghiệp Việt Nam đang lưu giữ 1.935 nguồn gen lúa gạo màu được thu thập trên toàn quốc Trong số này, vùng Tây Bắc thu thập nhiều nhất (497 mẫu giống) ít nhất là vùng Đông Nam Bộ (24 mẫu giống), tỉnh Sơn
La là tỉnh thu được nhiều nguồn gen lúa gạo màu nhất (195 mẫu giống) [2]
Như vậy, sự phân bố sản xuất lúa gạo trên toàn cầu tập trung chủ yếu tại các quốc gia châu Á, nơi có điều kiện tự nhiên và xã hội thuận lợi cho cây lúa phát triển Một số quốc gia ở châu Mỹ, châu Phi và Trung Đông cũng đóng góp vào nguồn cung gạo thế giới, mặc dù với sản lượng nhỏ hơn Với vai trò là cây lương thực chính của hàng tỷ người, cây lúa vẫn giữ vị trí quan trọng trong nền nông nghiệp toàn cầu, đặc biệt trong bối cảnh dân số thế giới ngày càng tăng và nhu cầu lương thực ngày càng cao
1.1.4 Vai trò của lúa gạo trong đời sống xã hội
1.1.4.1 Vai trò của lúa gạo trên thế giới
Gạo là một trong những loại thực phẩm quan trọng nhất trên thế giới, cung cấp tới một nửa lượng calo hàng ngày cho dân số thế giới Vai trò quan trọng của gạo không chỉ nằm ở việc làm thực phẩm trực tiếp cho con người mà còn là nguồn thức
ăn cho chăn nuôi, khiến nó trở thành một trong những loại cây lương thực thiết yếu
và giàu dinh dưỡng nhất trên thế giới [33]
Gạo là nguồn cung cấp carbohydrate dồi dào, chủ yếu dưới dạng tinh bột gồm amylose và amylopectin Hạt gạo chứa khoảng 12% nước, 75–80% tinh bột, và 7% protein với đầy đủ các axit amin cần thiết Protein trong gạo có giá trị sinh học cao,
Trang 17nhiều loại ngũ cốc khác Gạo cũng cung cấp các vitamin nhóm B như thiamine, niacin, riboflavin cùng các khoáng chất thiết yếu như canxi, magie, phốt pho, sắt, kẽm và mangan [33]
Ngoài các thành phần dinh dưỡng cơ bản, gạo còn chứa các hợp chất sinh học hoạt tính (bioactive compounds) tập trung nhiều ở lớp cám, chẳng hạn như γ-oryzanol, tocopherol, tocotrienol và polyphenol Những hợp chất này có lợi cho sức khỏe, giúp ngăn ngừa các bệnh mãn tính và cải thiện hệ miễn dịch [18] Các chất xơ như cellulose, hemicellulose, và β-glucan cũng góp phần tạo nên giá trị dinh dưỡng đáng kể
Theo Pornngarm và cộng sự (2019), ngoài gạo trắng, các loại gạo màu (như gạo đen, đỏ, tím) đang ngày càng thu hút sự chú ý nhờ chứa nhiều anthocyanin, một chất chống oxy hóa mạnh có khả năng giảm nguy cơ các bệnh liên quan đến stress oxy hóa [58]
Kết quả nghiên cứu của Mackon và cộng sự (2021) chỉ ra rằng anthocyanins
là các hợp chất chống oxy hóa có khả năng tạo màu tự nhiên và mang lại lợi ích cho sức khỏe con người Các hợp chất này đóng vai trò quan trọng trong việc giải độc và chống lại các phản ứng oxy hóa, đồng thời giúp duy trì sự tăng trưởng và phát triển của thực vật dưới các điều kiện môi trường khắc nghiệt Anthocyanins thuộc nhóm hợp chất phenol, có mặt rộng rãi trong tự nhiên, tạo ra nhiều màu sắc hấp dẫn ở các
bộ phận khác nhau của cây trồng như hoa, lá, thân, chồi và cả trong hạt ngũ cốc [37]
Gạo màu đen là món ăn ưa thích của hoàng gia Trung Quốc, trong khi đó các loại gạo đỏ được người dân ở nhiều nơi như Ấn Độ, Sri Lanka và Bhutan ưa chuộng hơn [83]
Người Nhật Bản sử dụng gạo đỏ để nấu rượu Sa-kê, mỳ tôm màu hay làm bánh trong dịp lễ hội đặc biệt hay làm thuốc Đối với nước Sri Lanka, gạo màu được sử dụng ưa thích tạo màu thực phẩm và đôi khi được dùng làm thuốc [66]
Gạo có giá trị dinh dưỡng cao, protein dễ tiêu hóa, và chứa nhiều hợp chất có hoạt tính sinh học Điều này giúp gạo không chỉ cung cấp nguồn năng lượng chính
mà còn hỗ trợ phòng ngừa bệnh tật, đặc biệt trong bối cảnh nhu cầu về thực phẩm
Trang 18lành mạnh ngày càng tăng Với những đặc điểm trên, gạo được coi là "nữ hoàng của các loại ngũ cốc" [34]
1.1.4.2 Vai trò của lúa gạo trong đời sống người Việt Nam
Lúa gạo giữ vai trò thiết yếu trong đời sống và nền kinh tế Việt Nam, không chỉ là nguồn lương thực chính mà còn là cây trồng chiến lược về kinh tế Được mệnh danh là "vàng trắng," lúa gạo chiếm khoảng 50% diện tích đất nông nghiệp và đóng góp 30% tổng giá trị sản xuất nông nghiệp toàn quốc, phản ánh tầm quan trọng của ngành này trong nền kinh tế nông nghiệp Việt Nam [56]
Gạo không chỉ là nguồn lương thực chủ yếu mà còn cung cấp giá trị dinh dưỡng quan trọng cho người dân Việt Nam và nhiều quốc gia trên thế giới Các loại gạo nguyên cám (gạo lứt) và gạo màu (như gạo đỏ và tím) giàu dinh dưỡng hơn gạo trắng do vẫn giữ được lớp cám và mầm gạo Chúng chứa nhiều chất xơ, khoáng chất (như magiê, phốt pho và sắt) và các hợp chất chống oxy hóa, đặc biệt là polyphenol
và anthocyanin trong gạo tím Chất xơ trong gạo lứt hỗ trợ hệ tiêu hóa, giảm nguy cơ bệnh tim mạch và ổn định đường huyết, trong khi các hợp chất chống oxy hóa có vai trò quan trọng trong việc giảm viêm và bảo vệ cơ thể khỏi các tổn thương do gốc tự
do
Gạo màu là do số lượng lớn của nhiễm sắc chất anthocyanin tích tụ trong những lớp khác nhau của vỏ, bì mô và lớp aleurone của hạt gạo Lúa gạo đỏ có chứa chất sắt và kẽm cao, trong khi gạo tím có rất nhiều vi lượng đồng, magnesium, calcium, molybdeneum và vitamin C, B1, B6 và B12 Lúa gạo đỏ được tìm thấy nhiều
ở đồng bằng sông Cửu Long, ở những vùng có đất phèn Đồng Tháp Mười, tỉnh Long
An, có gạo đỏ gọi là gạo “Huyết rồng” ăn rất ngon và bổ dưỡng, có thể sản xuất nhiều
để xuất khẩu Cơm Huyết rồng có mùi thơm, càng nhai càng có vị ngọt, béo bùi [1]
Ở Việt Nam, gạo tím hay đen được dùng làm thuốc và cho tín ngưỡng, chỉ được trồng ở các vùng núi, dưới dạng gạo tẻ hoặc nếp “Nếp đen, còn có tên là nếp than, sắc tím, nước cốt đen, dùng nhuộm màu hồng, khi ăn không cần giã, lấy chõ xôi hấp cho chín, khi còn nóng rưới mỡ heo, lá hành và muối trắng, trộn cho đều, mùi vị rất ngọt và giòn” (trong Gia Định Thành Thông Chí của Trịnh Hoài Đức) Gạo đen
Trang 19Ngoài các giá trị của gạo màu tốt đối với sức khỏe con người, gạo màu còn có giá trị phi vật thể trong tôn giáo và văn hóa Người Nhật quan niệm màu đỏ và màu trắng là màu may mắn, vào ngày sinh nhật đầu tiên trong đời, em bé được ăn bánh làm từ gạo đỏ và gạo trắng [83] Ở Việt Nam, cụ thể là người dân tộc Thái, gạo cẩm
và các sản phẩm kèm theo như rượu cẩm, bánh chưng nếp cẩm là những món ăn không thể thiếu nhân dịp tết cổ truyền hay ngày lễ hội của dân tộc
Về mặt kinh tế, xuất khẩu gạo tại Việt Nam giữ vị trí thứ ba thế giới vào năm
2019, với sản lượng 5,45 triệu tấn gạo, đạt giá trị 2,43 tỷ USD (FAOSTAT, 2019) Đồng thời, Việt Nam là quốc gia sản xuất gạo lớn thứ năm toàn cầu Không chỉ đảm bảo an ninh lương thực khu vực và thế giới, sản xuất lúa gạo còn là trụ cột kinh tế xã hội của đất nước, với khoảng 2/3 lao động nông thôn tham gia trồng lúa Đặc biệt, vùng Đồng bằng sông Cửu Long đóng vai trò trung tâm, chiếm tới 90% lượng gạo xuất khẩu [27]
Lúa gạo không chỉ là nguồn thực phẩm chính mà còn là nguồn sinh kế của phần lớn nông dân Việt Nam Việc nâng cao năng suất và chất lượng lúa gạo, đồng thời giảm thiểu tác động môi trường từ thâm canh nông nghiệp, sẽ góp phần đảm bảo phát triển bền vững ngành lúa gạo trong tương lai
1.1.5 Sản xuất và tiêu thụ lúa gạo trên thế giới và tại Việt Nam
1.1.5.1 Tình hình sản xuất và tiêu thụ lúa gạo trên thế gới
Lúa là cây trồng chính ở châu Á, nơi chiếm hơn 80% sản lượng gạo toàn cầu Từ 1961–2019, diện tích trồng lúa toàn cầu tăng hơn 40%, sản lượng tăng gấp
ba lần lên 755 triệu tấn, với châu Phi ghi nhận mức tăng trưởng nổi bật Năng suất lúa toàn cầu tăng từ dưới 2 tấn/ha trước cách mạng xanh lên 4,66 tấn/ha vào năm
2019 Dự báo đến năm 2030, sản lượng gạo toàn cầu sẽ tăng 11,4%, chủ yếu nhờ cải thiện năng suất tại các quốc gia châu Á như Ấn Độ, Trung Quốc, Việt Nam và
Thái Lan [63]
Tiêu thụ gạo bình quân đầu người tại châu Á cao nhất thế giới (trên 77 kg/năm), trong khi các khu vực khác như Mỹ Latinh, châu Phi, châu Âu, và Bắc Mỹ duy trì mức thấp hơn (6–28 kg/năm) (Hình 1.3) Đến năm 2030, tiêu thụ gạo ở châu
Trang 20Phi dự kiến tăng nhanh, đặc biệt tại Tây Á và vùng cận Sahara, nhờ tăng trưởng dân
số, đô thị hóa, thu nhập cải thiện, và thay đổi thói quen ăn uống [63]
Tại châu Á, tiêu thụ gạo có sự khác biệt theo nhóm thu nhập Ở các nước thu nhập trung bình và cao như Nhật Bản, Hàn Quốc và Thái Lan, tiêu thụ gạo bình quân đầu người giảm dần, ví dụ, Hàn Quốc giảm từ 106 kg (1975–1977) xuống 60 kg (2020) và dự báo 53 kg (2030) Ngược lại, ở các nước thu nhập thấp như Indonesia, Philippines, Bangladesh và Việt Nam, tiêu thụ gạo tăng, như Philippines tăng từ 85
kg (1975–1977) lên 122 kg (2020) và dự kiến 129 kg (2030).[23]
Lúa là cây ngũ cốc chính ở các nước đang phát triển, là nguồn lương thực nuôi sống trên hơn ½ dân số thế giới Mặc dù lúa gạo được tiêu thụ chính là gạo trắng nhưng vẫn có rất nhiều giống lúa gạo màu như màu đen, đỏ, màu nâu được tiêu thụ trên thị trường [70]
Theo tác giả Chaudhary (2003) diện tích trồng lúa màu ở Trung Quốc vào khoảng 0,4 triệu ha, chiếm 1,26% tổng diện tích trồng lúa của nước này Gạo màu thường được sử dụng trong những dịp lễ quan trọng và trong công nghiệp chế biến; các sản phẩm phổ biến từ gạo màu là bánh, cháo, bánh bao, bánh qui, mỳ tôm, rượu.v.v [69]
Chandra & Shil (2020) cho rằng phần lớn các giống lúa trồng phổ biến ở
Ấn Độ có gạo trắng nhưng cũng có một số giống lúa màu (nâu, đỏ và đen) Trong lúa màu có chứa 2 chất chính là proanthocyanidin và anthocyanin có lợi
cho sức khoẻ con người Chính vì vậy các tác giả đã tiến hành lai lúa trồng (O
sativa) với lúa dại (O rufipogon) để chuyển được gen này và chọn tạo giống lúa
đen có mùi thơm [77]
Hàn Quốc là một trong những quốc gia quan tâm nhiều đến gạo màu Người Hàn Quốc có sở thích trộn gạo đen với gạo trắng trong khi nấu cơm, do đó trong những năm gần đây sản lượng gạo màu và các công bố liên quan đến gạo màu đã và đang tăng dần lên Trong nghiên cứu của mình nhóm tác giả Jin - Cheol và đồng nghiệp cũng chỉ ra một sản phẩm bánh gạo nổi tiếng của Hàn Quốc mà nguyên liệu chính của bánh này làm từ gạo màu nâu Nhu cầu về gạo chất lượng, trong đó có màu
Trang 21gia phát triển như Mỹ và EU quan tâm đến giá trị của chúng đối với sức khỏe và thực phẩm hữu cơ [44]
1.1.5.2 Tình hình sản xuất và tiêu thụ lúa gạo ở Việt Nam
Việt Nam, một quốc gia có nền kinh tế chủ yếu dựa vào nông nghiệp, được xem là một trong những trung tâm đa dạng di truyền lúa gạo với nguồn gen phong phú Hoạt động lai tạo giống lúa đã diễn ra từ lâu trong lịch sử, nhưng chỉ sau cuộc cách mạng xanh, với sự ra mắt của các giống lúa cải tiến mang gen bán lùn từ Viện Nghiên cứu Lúa gạo Quốc tế (IRRI), hoạt động này mới thật sự được khuyến khích Trước đây, Việt Nam đã phải đối mặt với tình trạng thiếu lương thực và nạn đói, nhưng nhờ vào việc nâng cao năng suất lúa gạo hơn gấp ba lần, quốc gia này đã đảm bảo an ninh lương thực và trở thành một trong những nước xuất khẩu gạo hàng đầu thế giới [81]
Lúa được trồng rộng rãi trên khắp cả nước, đặc biệt là ở hai vùng trọng điểm
là đồng bằng sông Hồng và đồng bằng sông Cửu Long Tuy nhiên, khoảng hai phần
ba trong tổng số 96 triệu người dân Việt Nam tham gia vào nông nghiệp, nhưng diện tích canh tác lúa chỉ đạt gần 4 triệu ha [5] Hầu hết các nông hộ trồng lúa ở quy mô nhỏ, thường gặp khó khăn trong việc đảm bảo thu nhập để trang trải cuộc sống hàng ngày Bên cạnh đó, nhiều giống lúa hiện đang trồng nhạy cảm với các yếu tố căng thẳng sinh học và phi sinh học, dẫn đến tình trạng giảm năng suất hoặc mất mùa
Nguồn: Tổng cục Thống kê 2021
Hình 1 2 Sản lượng, diện tích thu hoạch và năng suất lúa Việt Nam từ năm
2001 đến năm 2019
Năm 2017, năng suất lúa trung bình tại Việt Nam đạt 55,5 tạ/ha, tăng 50,4%
so với năm 1995, nâng tổng sản lượng từ 24,9 triệu tấn lên 42,8 triệu tấn Các giống lúa cải tiến như Khang Dân 18, Bắc Thơm 7 và Khang Dân Dotbien đóng vai trò quan
Trang 22trọng trong nâng cao năng suất và chất lượng, nhờ khả năng kháng bệnh và chịu mặn [6, 30]
Công nghệ sinh học và giải trình tự bộ gen toàn bộ (WGS) giúp khám phá đa dạng di truyền và xác định các QTL mới liên quan đến khả năng chịu stress, hỗ trợ phát triển giống lúa chất lượng cao Dự án 3000 bộ gen lúa đã đẩy nhanh tiến độ nghiên cứu và lai tạo giống [81]
Tuy nhiên, Việt Nam đối mặt với thách thức giảm diện tích trồng lúa do công nghiệp hóa và biến đổi khí hậu, dự báo năng suất có thể giảm 2,2–5,6% vào năm
2030 Việc phát triển giống lúa thích nghi với điều kiện bất lợi là cấp thiết để đảm bảo năng suất và an ninh lương thực [24]
Vì vậy, việc chọn tạo giống lúa trở thành một nhiệm vụ cấp thiết tại Việt Nam, với nhiều nghiên cứu hiện đang được triển khai nhằm phát triển khả năng chịu hạn
và kháng bệnh thông qua các chương trình chọn tạo giống lúa quốc gia
1.2 Tình hình nghiên cứu tính trạng nông học ở lúa
Tính trạng nông học, hay đặc điểm nông học, là những đặc điểm của cây trồng có tác động trực tiếp đến năng suất, chất lượng, cũng như khả năng chống chịu với các yếu tố gây stress sinh học và phi sinh học Những tính trạng này bao gồm các đặc điểm liên quan đến cấu trúc và chức năng của thân, lá, rễ, hoa, quả, và hạt Một số tính trạng nông học quan trọng có thể kể đến như chiều cao cây, khả năng đẻ nhánh, chiều dài và khối lượng của hệ rễ, kích thước và trọng lượng hạt, cùng với khả năng kháng sâu bệnh và chịu đựng các điều kiện môi trường bất lợi
Các nghiên cứu về tính trạng nông học thường không độc lập mà thường kết hợp với các nghiên cứu về sinh học phân tử hoặc các tính trạng quan trọng khác, chẳng hạn như năng suất Trong đó, các nghiên cứu về tính trạng nông học trên lúa màu ngày càng mở rộng phạm vi và hướng nghiên cứu, do các giống lúa này ngoài việc chia sẻ các đặc điểm chung với lúa trắng còn có các đặc điểm đặc trưng về màu sắc, được quyết định bởi các hợp chất sinh học đặc biệt, và chứa hàm lượng dinh dưỡng cao hơn [82]
Qua nghiên cứu đánh giá 12 mẫu giống lúa màu tại thị trấn Đà Bắc, huyện Đà
Trang 23sự (2022), đã tuyển chọn được 2 mẫu giống lúa màu là TĐ1 và ĐH6 sinh trưởng tốt, thời gian sinh trưởng ngắn, năng suất khá (TĐ1 đạt gần 40 tạ/ha; Nếp cẩm ĐH6 đạt gần 35,6 tạ/ha), chống chịu khá với sâu bệnh chính, chất lượng cơm gạo lứt khá, hình dạng hạt trung bình, cơm mềm, ăn ngon, tỷ lệ gạo lật đạt trên 80%, hàm lượng protein
>9%, hàm lượng amylose <8%, hàm lượng anthocyanin đạt từ 330 – 360 mg/100gam gạo [14]
Kết quả khảo nghiệm của Viện nghiên cứu và Phát triển cây trồng thuộc Học viện Nông nghiệp Việt Nam cho thấy giống ĐH8 có thời gian sinh trưởng ngắn, 130 – 135 ngày trong vụ Xuân, 105 - 115 ngày trong vụ Mùa, năng suất đạt từ 5,5 - 6,0 tạ/ha trong vụ Xuân và từ 5,0 – 5,5 tấn/ha trong vụ Mùa hoặc Hè Thu [13]
Đặc biệt, các nghiên cứu gần đây tập trung vào lúa đen và lúa màu, không chỉ hướng tới việc cải thiện năng suất mà còn chú trọng đến các tính trạng liên quan đến chất lượng Ví dụ, nhiều nghiên cứu đã phân tích hàm lượng anthocyanin trong lúa màu, đánh giá chất lượng gạo trước và sau các điều kiện xử lý nhân tạo nhằm cải thiện chất lượng cũng như nghiên cứu tính chất chống oxy hóa của lúa màu Ngoài
ra, việc chọn giống dựa trên các yếu tố cấu thành chất lượng của gạo màu cũng thu hút sự chú ý [86]
Từ đó có thể thấy, các nghiên cứu về tính trạng nông học của lúa, đặc biệt là lúa màu, đã và đang nhận được sự quan tâm lớn từ cộng đồng khoa học Với những
ưu điểm vượt trội về chất lượng dinh dưỡng, khả năng chống oxy hóa, cùng với tiềm năng cải thiện năng suất, các giống lúa màu đang trở thành đối tượng nghiên cứu đầy triển vọng, mở ra hướng đi mới trong việc phát triển các giống lúa đáp ứng yêu cầu ngày càng cao của sản xuất nông nghiệp và thị trường
1.3 Nghiên cứu di truyền phân tử ở lúa gạo trên thế giới và trong nước
1.3.1 Giải trình tự bộ gen và nghiên cứu đa dạng di truyền cây lúa trên thế giới
1.3.1.1 Giải trình tự bộ gen cây lúa trên thế giới
Nghiên cứu của Huang và cộng sự (2009) về phát hiện SNP trên cây lúa bằng
kỹ thuật skim sequencing Nghiên cứu này đã sử dụng kỹ thuật giải trình tự lướt (skim sequencing) để xác định các biến thể di truyền (SNPs) trên cây lúa Giải trình tự một phần bộ gen của các dòng lúa thuần chủng RIL được tạo ra từ việc lai giữa hai giống
Trang 24lúa Indica và Japonica Kết quả phát hiện một lượng lớn SNP, trung bình cứ 3.15
kilobase (kb) trên bộ gen lúa thì có một SNP xuất hiện Tổng cộng, họ đã tìm thấy 123.302 SNPs Mặc dù chỉ giải trình tự một phần bộ gen, nhưng với độ phủ trung bình là 0.323x, các nhà nghiên cứu vẫn có thể phát hiện đủ số lượng SNPs để phục
vụ cho các nghiên cứu liên quan [87]
Những tiến bộ trong công nghệ giải trình tự thế hệ tiếp theo đã mở ra khả năng phát hiện hàng triệu biến dị DNA trên toàn bộ hệ gen, bao gồm các đa hình nucleotide đơn (SNP) và chèn/xóa (InDel), tạo nên nguồn tài nguyên quý giá hỗ trợ cho chương trình lai tạo dựa trên dấu hiệu phân tử Kết quả nghiên cứu giải trình tự toàn bộ hệ gen của sáu dòng lúa indica cận huyết ưu tú, bao gồm ba dòng bất dục đực tế bào chất
và ba dòng phục hồi của Gopala K Subbaiyan và cộng sự (2012), đã tạo ra 338 triệu đoạn đọc ghép đôi 75 bp, cung cấp phạm vi bao phủ 85,4% hệ gen Nipponbare Tổng cộng, 2.819.086 biến dị DNA không trùng lặp đã được phát hiện, bao gồm 2.495.052 SNP, 160.478 chèn và 163.556 xóa, với mật độ trung bình 6,8 SNP/kb trên toàn bộ
hệ gen Sự phân bố của các SNP và InDel trong nhiễm sắc thể không mang tính ngẫu nhiên, với các vùng giàu và nghèo SNP được phân bố rõ ràng trên hệ gen Đặc biệt, một vùng 4,3 Mb liền kề trên nhiễm sắc thể 5 đã được xác định có mật độ SNP cực thấp Trong số các biến dị, 83.262 SNP không đồng nghĩa được xác định trải dài trên 16.379 gen, cùng với 3.620 InDel không đồng nghĩa được phát hiện trong 2.625 gen Những kết quả này cung cấp cái nhìn sâu sắc về cơ sở di truyền ảnh hưởng đến hiệu suất của các dòng lúa cận huyết và các giống lai từ chúng Các SNP và InDel phát hiện từ tập hợp các dòng lúa indica cận huyết đa dạng này không chỉ mở rộng nguồn SNP hữu ích cho lai tạo phân tử, mà còn tạo điều kiện cho việc nghiên cứu sâu hơn
về các biến thể di truyền trên toàn bộ hệ gen liên quan đến hiệu suất của các tổ hợp lai.[42]
Bộ sưu tập lúa gạo cốt lõi thế giới (WRC), gồm 69 mẫu giống với mức độ đa dạng di truyền cao, đã được giải trình tự lại toàn bộ hệ gen, phát hiện 2.805.329 SNP
và 357.639 InDel Tanaka và cộng sự (2020) đã phân tích cấu trúc quần thể và thành phần chính (PCA), phân loại WRC thành ba nhóm di truyền chính Công cụ TASUKE
Trang 25ngày trổ bông, qua đó cung cấp một nền tảng mạnh mẽ cho nghiên cứu di truyền ngược.Đánh giá tính hiệu quả của WRC trong nghiên cứu liên kết toàn bộ hệ gen (GWAS) cho thấy quần thể này phù hợp để phát hiện các QTL có tác động mạnh, đặc biệt với các đặc điểm hạt liên quan đến các gen đã biết Nghiên cứu này không chỉ làm sáng tỏ sự đa dạng di truyền trong ngân hàng gen lúa với hơn 37.000 mẫu giống
mà còn hỗ trợ xác định các gen liên quan đến các kiểu hình, góp phần cải tiến giống lúa hiệu quả hơn [62]
Basmati, nhóm giống lúa độc đáo với hương thơm và chất lượng hạt vượt trội,
đã được giải trình tự toàn bộ bộ gen với độ phủ >25X và so sánh với các bộ gen tham chiếu của Nipponbare (japonica), Kasalath (aus), và Zhenshan 97 (indica) Kết quả nghiên cứu của Kishor và cộng sự (2020), cho thấy các giống Basmati có biến thể trình tự đặc trưng, với các SNP liên quan đến chức năng trao đổi chất tạo hợp chất thơm, đặc trưng quan trọng của nhóm này.Phân tích 30 giống Basmati truyền thống chia chúng thành ba nhóm: thơm (22 giống), aus (4 giống), và indica (4 giống), với alen thơm Badh2 được tìm thấy ở tất cả các giống thuộc nhóm thơm Một số đặc điểm nông học như tỷ lệ chiều dài/chiều rộng hạt, chiều dài bông lúa, và hàm lượng amylose cho thấy sự khác biệt đáng kể giữa nhóm thơm và các nhóm khác.Dữ liệu từ nghiên cứu khẳng định bộ gen Basmati có nguồn gốc chủ yếu từ nhóm aus và japonica, cung cấp nền tảng quan trọng cho lai tạo phân tử và nghiên cứu di truyền các giống lúa Basmati [35]
1.3.1.2 Nghiên cứu đa dạng di truyền cây lúa trên thế giới
Như đã đề cập ở trên, phương pháp đánh giá đa dạng di truyền sử dụng chỉ thị ADN có thể sử dụng nhiều loại chỉ thị khác nhau, trong số các chỉ thị phân tử, chỉ thị SSR (simple sequence repeate) được sử dụng rộng rãi và hiệu quả trong nghiên cứu
đa dạng di truyền ở lúa bởi vì đây là chỉ thị đồng trội cho đa hình cao và ổn định
Fongfon và cộng sự (2021) sử dụng chỉ thị phân tử SSR để đánh giá đa dạng
di truyền của 37 mẫu giống lúa cẩm địa phương cho thấy hầu hết các mẫu giống thuộc nhóm lúa cạn ở cả vĩ độ thấp và cao là loài phụ japonica Mức độ sai khác di truyền thấy rõ ở giữa các mẫu giống lúa cạn và lúa nước nhưng không có sự sai khác giữa các vĩ độ khác nhau.[78]
Trang 26Theo Siddhi và cộng sự, (2014) về phân tích đa dạng di truyền của 19 giống lúa có màu và màu trắng sử dụng 14 chỉ thị SSR và 21 chỉ thị INDEL (Insertion Deletion) Với 14 chỉ thị SSR kết quả thu được giá trị PIC dao động từ 0,36 (RM484) đến 0,78 (RM 167) Hệ số đa dạng di truyền dao động từ 0,36 (RM484) tới 0,78 (RM 167) và 0,50 (R9M20) tới 0,81 (R9M10) đối với chỉ thị SSR và tương ứng đối với chỉ thị INDEL [73]
Faiz Ahmad và cộng sự tại Đại học Putra Malaysia năm 2015 đã công bố nghiên cứu về tính khác biệt di truyền và đặc tính di truyền của 42 mẫu giống lúa cạn màu sử dụng bộ 25 chỉ thị phân tử SSR và chỉ thị hình thái (15 tính trạng) Kết quả 21/25 chỉ thị cho thấy tính khác biệt đa hình, các tính trạng cũng chỉ ra sự sai khác có
ý nghĩa ở mức (p ≤ 0,05) và (p ≤ 0,01) Nghiên cứu này đã chọn lọc, giới thiệu được các mẫu giống triển vọng C, Chirikata 2, Ble Chu Cau, and IR 9669 - PP 836 – 1 để tiếp tục đánh giá sâu hơn và sử dụng trong chương trình chọn tạo cải tiến giống theo hướng giá trị dinh dưỡng và năng suất cao [40]
Trong một nghiên cứu công bố năm 2015, tác giả Keshavulu và cộng sự, đã đánh giá đa dạng di truyền của 24 dòng lúa phổ biến có nguồn gốc Ấn Độ (trong đó
có giống lúa màu) sử dụng 24 chỉ thị hình thái và 86 chỉ thị phân tử SSR Nghiên cứu chỉ ra rằng có mối tương quan giữa đa dạng hình thái và phân tử và kết quả này rất
có ý nghĩa trong việc phân loại lúa.[55]
Trong nghiên cứu về mối tương quan giữa kích thước alen của chỉ thị phân tử microsattelite với đặc điểm nông học và các các chất vi lượng (sắt, kẽm) của tác giả Brara và cộng sự, (2015) dựa trên 48 chỉ thị phân tử trong 14 giống gạo (Basmati,
Japonica và Indica) Kết quả nghiên cứu cho thấy đa hình ở tất cả 48 locus cho 258
alen, số lượng các alen dao động từ 2 - 9, trung bình đạt 5,14 alen trên mỗi locus Kích thước của sản phẩm PCR dao động từ 73 – 585 bp, hệ số PIC dao động từ 0,245 (RM256) đến 0,862 (RM21) với trung bình 0,701 mỗi locus
1.3.2 Giải trình tự bộ gen và nghiên cứu đa dạng di truyền cây lúa ở trong nước
1.3.2.1 Nghiên cứu ứng dụng công nghệ giải trình tự gen lúa tại Việt Nam
Nhờ sự phát triển của di truyền học lúa và các công nghệ sinh học tiên tiến,
Trang 27bộ gen (WGS) của lúa đã giúp đẩy nhanh tiến độ trong các chương trình lai tạo Dự
án 3000 bộ gen lúa, bắt đầu từ năm 2014, đã cung cấp thông tin quan trọng về các biến thể gen và thiết lập các hệ thống tạo gen hiệu quả, góp phần tăng tốc quá trình lai tạo [62]
Tại Việt Nam, hàng trăm mẫu giống lúa bản địa đã được giải trình tự nhằm khám phá sự đa dạng di truyền và các mối liên hệ giữa kiểu gen và kiểu hình Nhiều QTL mới liên quan đến khả năng chịu stress sinh học và phi sinh học đã được xác định, tạo nền tảng cho việc phát triển giống lúa chất lượng cao hơn Thông tin từ các nghiên cứu này không chỉ hỗ trợ trong việc nâng cao năng suất mà còn giúp đảm bảo
an ninh lương thực quốc gia
Phạm Hùng Cương và cộng sự (2024) đã giải trình tự 94 mẫu giống lúa gạo đen có nguồn gốc địa phương sử dụng Infinium 7k rice SNP chip cải tiến Dữ liệu kiểu hình và kiểu gen được tích hợp trong một nghiên cứu trên toàn hệ gen đã xác định được 32 SNP có liên quan đáng kể với hàm lượng anthocyanin và 16 SNP liên quan đến hàm lượng flavonoid lần lượt nằm trên Nhiễm sắc thể số 1, 2, 3, 6, 7, 8, 11
và 12 và 1, 3, 4, 6, 7, 8, 10, 11 và 12 Tổng cộng có 72 gen ứng cử viên có cùng vị trí với các SNP quan trọng, trong đó 44 gen được dự đoán là có liên quan đến con đường sinh tổng hợp anthocyanin và flavonoid Hai mươi gen ứng cử viên lần đầu tiên được báo cáo trong nghiên cứu này bao gồm các gen cấu trúc LOC_Os03g62300.1 mã hóa cho chalcone isomerase và LOC_Os06g41800.1 mã hóa cho dihydroflavonol reductase, gen điều hòa LOC_Os06g43090.1 mã hóa cho yếu tố phiên mã MYB, có liên quan chặt chẽ với quá trình tổng hợp anthocyanin Những gen ứng cử viên và SNP quan trọng này có thể được sử dụng để phân tích chức năng của gen và các yếu
tố liên quan đến quá trình tổng hợp anthocyanin và cải thiện sắc tố lúa gạo nhờ chọn tạo giống hỗ trợ bởi chỉ thị phân tử [25]
Huỳnh Kỳ và công sự (2022) đã phân tích toàn bộ dữ liệu giải trình tự bộ gen
từ giống lúa Nàng thơm chợ Đào bằng quy trình tin sinh học Tổng cộng có 21 triệu lượt đọc với 6,6 GB dữ liệu đã được phân tích Các SNP và Indel từ bộ gen Nàng thơm chợ Đào được phát hiện là thay đổi khi so sánh với bộ gen lúa tham chiếu Nipponbare Kết quả cho thấy Indel mới của gen BADH2 trong bộ gen Nang Thom
Trang 28Cho Dao Nghiên cứu sẽ đóng góp thông tin có giá trị cho việc phát triển các dấu hiệu
di truyền cho các chiến lược lai tạo lúa sử dụng các giống lúa Nàng thơm chợ Đào [45]
Janet Higgins, Trần Đăng Khánh và cộng sự (2021) đã nghiên cứu 672 giống lúa Việt Nam, trong đó có 616 giống mới được phân tích toàn bộ bộ gen Những giống lúa này được thu thập từ nhiều vùng sinh thái khác nhau ở Việt Nam Kết quả cho thấy, lúa Việt Nam có thể chia thành hai nhóm chính là Japonica và Indica, mỗi nhóm lại chia thành nhiều nhóm nhỏ hơn (gọi là phân quần thể) Các phân nhóm này
có khả năng thích nghi với điều kiện môi trường của từng vùng Đặc biệt, nhóm tác giả đã tìm thấy một phân nhóm Indica rất đặc biệt, gọi là Indica-5 (I5) Phân nhóm này có cấu trúc di truyền khác biệt hoàn toàn so với các phân nhóm khác và chưa từng được nghiên cứu kỹ trước đây Kết quả đánh gái các đặc điểm hình thái của các giống lúa này như kích thước hạt, chiều dài bông, ngày trổ cho thấy, có rất nhiều gen liên quan đến các đặc điểm này Trong đó, các gen liên quan đến kích thước hạt có ảnh hưởng mạnh nhất.[50]
Trong nghiên cứu của Kỳ Huỳnh và cộng sự (2021), ba giống Oryza sativa L
bản địa ở Việt Nam đã được giải trình tự với độ sâu hệ gen lên đến mười lần và độ phủ ít nhất bốn lần (~83%) bằng hệ thống Illumina HiSeq2000™, với trung bình 6,5
GB dữ liệu sạch trên mỗi mẫu, được tạo ra sau khi lọc dữ liệu chất lượng thấp Dữ liệu đã được ánh xạ xấp xỉ tới 95% vào bộ gen tham chiếu IRGSP 1.0 Các kết quả thu được từ nghiên cứu này sẽ đóng góp vào nhiều thông tin có giá trị để tiếp tục nghiên cứu về nguồn gen này.[46]
Dự án "Phát triển các giống cây trồng cho khu vực trung du và miền núi Bắc Việt Nam" do Atsushi Yoshimura và cộng sự thực hiện từ năm 2011 đến 2015, đã phát triển các dòng lúa triển vọng phù hợp với điều kiện tự nhiên và xã hội của miền Bắc Việt Nam Nghiên cứu dựa trên các nguồn gen quý và thông tin chỉ thị DNA do các tổ chức Nhật Bản cung cấp, giúp đẩy nhanh quá trình phát triển các giống lúa mang các đặc tính nông học quan trọng như thời gian sinh trưởng ngắn, năng suất cao, và khả năng chống chịu sâu bệnh Kết quả chính của dự án bao gồm việc tạo ra
Trang 29các dòng lúa thích nghi tốt, góp phần cải thiện năng suất và tính bền vững cho sản xuất lúa tại Việt Nam.[22]
1.3.2.2 Nghiên cứu đa dạng di truyền cây lúa ở Việt Nam
Đánh giá đa dạng di truyền các nguồn vật liệu mẫu giống lúa địa phương, nhập nội và giống cải tiến, thiết lập mối quan hệ giữa chúng dựa vào kiểu hình, kiểu gen hay phối hợp giữa kiểu hình và kiểu gen là mục tiêu nghiên cứu được tập trung nhiều nhằm phục vụ cho công tác chọn tạo giống lúa thuần có năng suất và chất lượng [12]
Hiện nay, ở nước ta việc đánh giá đa dạng di truyền cây lúa nói chung đã được tiến hành từ khá lâu Lúa là cây trồng được nghiên cứu đánh giá di truyền nhiều nhất
cả trên hai khía cạnh chiều rộng và chiều sâu; hầu hết các tính trạng của lúa như: năng suất, chất lượng, khả năng chống chịu.v.v đều được nghiên cứu ở mức độ rất sâu như đánh giá đa dạng di truyền, lập bản đồ phân tử.v.v
Lê Thị Thu Trang và cộng sự (2012) đã đánh giá chất lượng và đa dạng di truyền của một số giống lúa địa phương Việt Nam Kết quả phân tích 32 chỉ thị SSR với 55 giống lúa có tiềm năng chất lượng cho thấy sự đa dạng di truyền cao với tổng
số alen phát hiện tại 32 locut là 188 alen (trung bình đạt 5,88 alen/locut), xuất hiện
23 alen hiếm và 4 alen đặc trưng ở 4 locut Hệ số đa hình di truyền (PIC) dao động
từ 0,28 (RM60) đến 0,85 (RM215) với giá trị trung bình là 0,67 Hệ số tương đồng
di truyền giữa các giống dao động trong khoảng từ 0,45 đến 0,94 Ở hệ số tương đồng
di truyền 0,50; 55 giống lúa có tiềm năng chất lượng được chia thành hai nhóm lớn.[4]
Theo Ngô Thị Hồng Tươi và cộng sự (2014), phân tích đa dạng di truyền của
46 dòng/giống lúa cẩm gồm cả lúa nếp và tẻ được thu thập từ các địa phương dựa vào
sự có mặt và mức độ đa hình của chỉ thị phân tử SSR Thí nghiệm sử dụng 35 chỉ thị phân tử SSR, trong đó có 9 chỉ thị đơn hình và 26 chỉ thị đa hình với tổng số 68 alen
đa hình chiếm tỷ lệ trung bình 2,62 alen trên một locus Hệ số đa dạng di truyền (PIC), dao động từ 0,08 đến 0,74 với giá trị trung bình là 0,46 Kết quả phân tích đã chia nguồn vật liệu nghiên cứu thành 2 nhóm chính Ngoài ra thí nghiệm đánh giá hàm lượng anthocyanin của các mẫu lúa nghiên cứu, có 6 giống cho hàm lượng anthocyanin cao nhất là N14, N16, N18, N4, N22 và N20 Qua đánh giá một số chỉ tiêu nông sinh học cũng cho hai nhóm giống cây di truyền.[9]
Trang 30Sử dụng chỉ thị SSR, nghiên cứu của Nguyễn Thị Tuyết và cộng sự (2022) đã đánh giá đa dạng di truyền của 94 mẫu giống lúa màu và 2 mẫu đối chứng Kết quả cho thấy, hệ số tương đồng di truyền giữa các mẫu cao dao động từ 0,54 - 1 và có 3 cặp giống lúa thể hiện mối quan hệ họ hàng rất gần gũi, với hệ số tương đồng gần đạt 100%.[15]
Nguyễn Quốc Trung và cộng sự đã sử dụng 50 chỉ thị SSR nằm trên cả 12 NST của lúa để phân tích đa dạng di truyền của 23 mẫu giống lúa ngắn ngày và một giống dài ngày (VN10) [7]
Như vậy, ở trên thế giới và Việt Nam, trên đối tượng cây lúa màu, đã có một
số nghiên cứu về đa dạng di truyền dựa vào chỉ thị hình thái, nhiều nghiên cứu phân tích đa dạng di truyền sử dụng chỉ thị phân tử, trong đó phổ biến nhất là chỉ thị SSR
và nhiều nghiên cứu tập trung sử dụng kết hợp cả chỉ thị hình thái và phân tử để đánh giá đa dạng di truyền cây lúa màu cung cấp vật liệu và thông tin cho công tác lai tạo chọn giống lúa màu góp phần bảo tồn, sử dụng và phát triển lúa bền vững ở Việt Nam
1.4 Một số phương pháp đánh giá đa dạng di truyền
Đa dạng di truyền là cơ sở cho việc tuyển chọn lai tạo những giống, loài mới;
đa dạng về loài thường là đối tượng khai thác phục vụ mục đích kinh tế; đa dạng về
hệ sinh thái có chức năng bảo vệ môi trường sống; đồng thời các hệ sinh thái được duy trì và bảo vệ chính là nhờ sự tồn tại của các quần thể loài sống trong đó Phần đa dạng sinh học do con người khai thác sử dụng gọi là đa dạng sinh học nông nghiệp [10]
Nghiên cứu đa dạng di truyền được tiến hành thông qua nhiều phương pháp khác nhau, mỗi phương pháp cung cấp cho người sử dụng thông tin khác nhau, việc lựa chọn phương pháp đánh giá phụ thuộc vào mục đích của nghiên cứu Có hai phương pháp được sử dụng rộng rãi để nghiên cứu đa dạng di truyền đó là thông qua các chỉ thị hình thái (kiểu hình, phenotyping) và thông qua chỉ thị phân tử (kiểu gen, genotyping)
Trang 311.4.1 Phương pháp nghiên cứu đa dạng di truyền dựa trên kiểu hình
Nghiên cứu đa dạng di truyền thông qua các tính trạng hình thái là phương pháp cổ điển, hiện nay vẫn được sử dụng phổ biến Phương pháp này giúp các nhà nghiên cứu nhận biết và phân biệt các giống khác nhau bằng mắt thường trên thực địa một cách nhanh chóng Các đặc điểm chính về hình thái như dạng thân cây, dạng
lá, hình dạng, màu sắc, kích thước, dạng hoa, hạt v.v được xem như là các tính trạng
cơ bản để nhận biết giữa các giống với nhau Những tính trạng chất lượng thường là những cặp tính trạng tương phản được di truyền đơn gen, mỗi tính trạng có hai hay nhiều các dạng tương phản xen kẽ [8]
Phương pháp đánh giá kiểu hình là một công cụ quan trọng trong nghiên cứu nông học và đa dạng di truyền, đặc biệt với các nguồn gen cây trồng như lúa Đây là cách tiếp cận dựa trên việc quan sát và ghi nhận các đặc điểm bề ngoài của cây trồng, chẳng hạn như hình dạng thân, lá, hoa, hạt, và các tính trạng nông học khác như chiều cao cây, số hạt trên bông, hay khối lượng hạt Những tính trạng này thường có thể đo đạc trực tiếp tại thực địa hoặc trong điều kiện phòng thí nghiệm, giúp cung cấp thông tin cơ bản về sự khác biệt giữa các giống lúa
Trong nghiên cứu lúa màu, một số dặc điểm như màu sắc và kích thước hạt là yếu tố quan trọng thường được sử dụng để nhận diện và phân loại sơ bộ các giống Màu sắc hạt gạo là một đặc điểm dễ quan sát, thường dao động từ trắng, nâu, đỏ đến tím, phản ánh sự đa dạng di truyền cũng như ảnh hưởng của các sắc tố tự nhiên như anthocyanin hoặc polyphenol Kích thước hạt, bao gồm chiều dài, chiều rộng và tỷ lệ dài/rộng, cũng là chỉ số quan trọng liên quan đến chất lượng gạo và sở thích của người tiêu dùng Việc sử dụng các đặc điểm này giúp xây dựng những nhóm giống có tính tương đồng về mặt hình thái, tạo cơ sở để thực hiện các phân tích sâu hơn về di truyền
Tuy nhiên, phương pháp này có một số hạn chế Các tính trạng kiểu hình thường chịu ảnh hưởng lớn từ yếu tố môi trường và điều kiện canh tác Chẳng hạn, màu sắc hạt gạo có thể bị thay đổi bởi ánh sáng, nhiệt độ, hoặc chế độ dinh dưỡng; trong khi kích thước hạt phụ thuộc vào chế độ phân bón, nước tưới và sự phát triển sinh lý của cây lúa Điều này dẫn đến khó khăn trong việc tách biệt ảnh hưởng di
Trang 32truyền thuần túy với tác động từ môi trường, làm giảm độ chính xác của việc phân loại dựa trên kiểu hình
Trong nhiều năm qua, Viện Tài nguyên di truyền thực vật Quốc tế (IPGRI) và Viện Nghiên cứu Lúa Quốc tế (IRRI) đã xuất bản các biểu mẫu mô tả (descriptors)
để thống nhất chung form mẫu mô tả trên toàn thế giới để phân biệt đánh giá giữa các giống với nhau trong phạm vi loài [48]
Hiện nay, mặc dù chỉ thị DNA được sử dụng phổ biến nhưng chỉ thị hình thái vẫn được áp dụng khá hiệu quả trong đánh giá đa dạng di truyền và trong nghiên cứu lập bản đồ liên kết, nhất là khi kết hợp với các phương pháp hiện đại như phân tích
di truyền dựa trên chỉ thị SNP Kết quả từ phương pháp kiểu hình sẽ được đối chiếu
và bổ sung bằng dữ liệu di truyền, nhằm làm rõ mối quan hệ giữa kiểu hình và kiểu gen Điều này giúp nâng cao độ chính xác và hiệu quả của nghiên cứu, hỗ trợ công tác chọn tạo giống lúa màu có năng suất và chất lượng cao, phù hợp với mục tiêu bảo tồn và phát triển bền vững nguồn gen lúa
1.4.2 Phương pháp nghiên cứu đa dạng di truyền dựa trên chỉ thị phân tử
Nghiên cứu đa dạng di truyền thông qua các chỉ thị phân tử là nghiên cứu, đánh giá ở mức độ phân tử Các phân tử được sử dụng chủ yếu trong nghiên cứu là các phân tử protein và ADN Các chỉ thị phân tử được sử dụng phổ biến trong đánh giá đa dạng di truyền ở lúa là chỉ thị đẳng men và chỉ thị ADN
Ngày nay, nhờ sự phát triển của các chỉ thị ADN, việc đánh giá đa dạng di truyền ở lúa đã trở nên dễ dàng và hiệu quả hơn rất nhiều Tuy nhiên, các kỹ thuật liên quan đến chỉ thị ADN thường yêu cầu nguồn đầu tư lớn và chi phí cao Hiện có nhiều loại chỉ thị ADN được sử dụng rộng rãi và liên tục được cải tiến, bao gồm: AFLP (Amplified Fragment Length Polymorphism), RAPD (Random Amplified Polymorphic DNA), SSR (Simple Sequence Repeats), ISSR (Inter-Simple Sequence Repeat), và SNP (Single Nucleotide Polymorphism)
Trong nghiên cứu về cây lúa, SSR là một trong những chỉ thị phổ biến nhất Theo báo cáo của McCouch và cộng sự (2002), đã có 2.740 chỉ thị SSR được công
bố trên toàn cầu, tương ứng trung bình mỗi 157 kb ADN có một chỉ thị SSR Sự phổ
Trang 33biến của SSR trong nghiên cứu cây lúa đã chứng minh tính ứng dụng cao của nó trong phân tích di truyền và cải tiến giống
Trong khi đó, SNP (đa hình nucleotide đơn) được định nghĩa là sự khác biệt ở một nucleotide duy nhất trong trình tự ADN giữa các cá thể trong cùng quần thể Những vị trí chứa SNP trong genome là nơi mà trình tự ADN chỉ khác nhau bởi một bazơ duy nhất khi so sánh giữa hai hoặc nhiều cá thể
Sự thay đổi nucleotide này có thể dẫn đến những khác biệt về tính trạng hoặc kiểu hình đặc trưng, hoặc đôi khi chỉ là những thay đổi trung tính, không ảnh hưởng đến tính trạng nhưng vẫn hữu ích trong nghiên cứu tiến hóa và đánh giá đa dạng di truyền SNP hiện được coi là dạng biến đổi phổ biến nhất trong genome Ví dụ, ở ngô, trung bình cứ 60-100 bp lại có một SNP [16] Trong hệ genome của người, 90%
sự khác biệt trong trình tự ADN là do thay đổi nucleotide đơn, với tần suất trung bình
cứ 1.000 bp lại có một SNP [68]
Trong nghiên cứu di truyền và chọn giống ở thực vật, SNP (Single Nucleotide Polymorphism) ngày càng được ưa chuộng hơn SSR (Simple Sequence Repeat) nhờ vào những ưu điểm vượt trội SNP có số lượng lớn, tính ổn định cao, hiệu quả trong phân tích, và phù hợp cho quá trình tự động hóa Ngoài ra, chi phí liên quan đến việc
sử dụng SNP cũng đang giảm dần, khiến chúng trở nên ngày càng phổ biến và kinh
tế hơn trong các nghiên cứu di truyền [28, 31] Điểm đặc biệt của SNP là chúng xuất hiện cả ở các vùng mã hóa và không mã hóa trong DNA của nhân cũng như lục lạp Điều này mang lại lợi thế lớn trong việc nghiên cứu các khía cạnh khác nhau của hệ gen thực vật Hiện tại, nhiều nguồn dữ liệu về SNP đã được xây dựng và cung cấp rộng rãi để hỗ trợ các ứng dụng trong nghiên cứu lúa Nhờ những tiến bộ này, SNP
đã trở thành công cụ mạnh mẽ và linh hoạt, đóng vai trò quan trọng trong nghiên cứu
đa dạng di truyền và cải tiến giống cây trồng, đặc biệt là ở lúa
SNP (Single Nucleotide Polymorphism) là một công cụ mạnh mẽ trong nghiên cứu di truyền nhờ tính phổ biến và khả năng cung cấp thông tin di truyền chính xác Tuy nhiên, dù có nhiều ưu điểm so với các kỹ thuật khác, việc phát hiện SNP vẫn đối mặt với một số thách thức, đặc biệt khi áp dụng cho các loài không phải sinh vật mô hình Các khó khăn này bao gồm chi phí cao và yêu cầu kỹ thuật phức tạp
Trang 34trong việc sử dụng các công nghệ hiện đại để xác định SNP Có nhiều phương pháp phát hiện SNP đã được phát triển, bao gồm: (1) Phương pháp lai phân tử, chẳng hạn như lai allele đặc hiệu và SNP microarray.(2) Phương pháp dựa trên enzyme, như RFLP (Restriction Fragment Length Polymorphism), PCR, kéo dài mồi, hoặc kỹ thuật sử dụng 5’-nuclease.(3) Phương pháp dựa trên tính chất vật lý của DNA, bao gồm SSCP (Single-Strand Conformation Polymorphism), điện di gradient nhiệt độ,
và sắc ký lỏng cao áp biến tính.(4) Phương pháp giải trình tự, đặc biệt là giải trình tự toàn bộ hệ gen hoặc các vùng đại diện.[90] Công nghệ giải trình tự thế hệ mới (Next-Generation Sequencing, NGS) đã mở ra khả năng phân tích trực tiếp và toàn diện sự khác biệt trình tự giữa nhiều cá thể trên quy mô lớn Một phương pháp tiêu biểu là tái giải trình tự toàn bộ hệ gen (Whole-Genome Resequencing), sử dụng công nghệ đọc ngắn (short-read sequencing) Quá trình này bao gồm việc sắp xếp hàng triệu đoạn đọc ngắn từ các mẫu nghiên cứu lên một chuỗi tham chiếu genome, giúp xác định các biến dị nucleotide giữa mẫu và đối chứng[85] Nhờ sự phát triển của công nghệ, đặc biệt là NGS, SNP không chỉ giúp khám phá và đánh giá đa dạng di truyền mà còn hỗ trợ mạnh mẽ trong nghiên cứu chức năng gen và chọn tạo giống hiệu quả [79, 89]
1.4.3 Giải trình tự độ phủ thấp (skim sequencing)
Giải trình tự lại (resequencing) là phương pháp phổ biến trong nghiên cứu di truyền, đặc biệt được áp dụng rộng rãi trên các loài cây trồng mô hình đã có dữ liệu
bộ gen tham chiếu chất lượng cao, chẳng hạn như Arabidopsis thaliana hoặc lúa (Oryza sativa) Thay vì xây dựng bộ gen mới, mục tiêu chính của re-sequencing là phát hiện và sàng lọc các biến thể di truyền (như SNPs, InDels) bằng cách lập bản đồ các trình tự mới thu được lên bộ gen tham chiếu hiện có [88]
Một chiến lược bổ trợ thường được sử dụng là skim sequencing, giải trình tự với độ phủ thấp Chiến lược này giúp tối ưu hóa chi phí mà vẫn cung cấp đủ dữ liệu
để xác định các biến thể cần thiết cho phân tích di truyền Với sự hỗ trợ của bộ gen tham chiếu, skim sequencing vẫn có thể tái tạo chính xác các vùng gen quan trọng, đảm bảo tính hiệu quả mà không làm giảm độ tin cậy của kết quả [17] Điều này khiến skim sequencing trở thành lựa chọn lý tưởng trong các nghiên cứu tập trung vào đánh
Trang 35giá đa dạng di truyền và xây dựng bản đồ gen trong các loài cây trồng có giá trị kinh
tế
Quy trình skim sequencing bắt đầu bằng tách chiết DNA từ các nguồn mẫu (thực vật, động vật, hoặc khác) Với thực vật, các bộ kit như Qiagen DNeasy Plant Mini Kit hoặc phương pháp CTAB được sử dụng để thu nhận DNA chất lượng cao Với động vật, bộ kit Qiagen DNeasy Blood and Tissue Kit hoặc Quick-DNA Plus Extraction Kit thường được áp dụng Sau đó, DNA được chuẩn bị thành thư viện bằng các bộ kit như Illumina TruSeq hoặc NEBNext Ultra II, tùy thuộc vào đặc tính mẫu
và mục tiêu nghiên cứu Thư viện có thể được tạo với hoặc không cần PCR Giải trình
tự DNA được thực hiện trên các nền tảng phù hợp như Illumina HiSeq hoặc MiSeq (đọc ngắn) và Oxford Nanopore MinION (đọc dài) [67]
Dữ liệu thu được sẽ được lắp ráp thành bộ gen bằng các công cụ như Plast hoặc NOVOPlasty Lắp ráp tham chiếu được sử dụng nếu đã có bộ gen tham chiếu, trong khi lắp ráp de novo phù hợp với mẫu chưa có tham chiếu
Fast-Ưu điểm nổi bật của Giải trình tự độ phủ thấp là chi phí thấp, hiệu quả cao và khả năng ứng dụng trên các quần thể lớn Phương pháp này đã được ứng dụng rộng rãi trong nghiên cứu di truyền học của nhiều loài cây trồng, chẳng hạn như lúa, ngô, đậu tương, Bằng cách xác định hàng triệu SNPs, Giải trình tự độ phủ thấp giúp các nhà khoa học hiểu rõ hơn về cơ chế di truyền của các tính trạng quan trọng như năng suất, chất lượng, khả năng kháng bệnh, Từ đó, các nhà khoa học có thể sử dụng thông tin này để phát triển các giống cây trồng mới có năng suất cao, chất lượng tốt
và khả năng thích ứng với biến đổi khí hậu [67, 87]
Các phương pháp GBS dựa trên giải trình tự RAD, như đã được mô tả bởi He
và cộng sự (2014), đã trở nên phổ biến nhờ khả năng phát hiện một lượng lớn SNPs trong các quần thể lớn Tuy nhiên, chi phí và độ phức tạp của việc chuẩn bị thư viện vẫn là một hạn chế Ngược lại, giải trình tự skim sequencing cung cấp một giải pháp hiệu quả hơn về chi phí bằng cách giảm thiểu các bước tiền xử lý Phương pháp này
sử dụng giải trình tự toàn bộ bộ gen với độ phủ thấp, giúp giảm đáng kể chi phí so với các phương pháp GBS truyền thống [54]
Trang 36Một lợi thế đáng kể của skim sequencing là khả năng phát hiện một lượng lớn SNPs, thậm chí trong các bộ gen đa bội phức tạp như lúa mì Tuy nhiên, độ chính xác của việc gọi kiểu gen phụ thuộc rất lớn vào chất lượng của bộ gen tham chiếu Trong trường hợp không có bộ gen tham chiếu chất lượng cao, việc xây dựng bộ gen tham chiếu de novo là cần thiết nhưng cũng đồng nghĩa với chi phí và thời gian tính toán lớn [20]
Phân tích dữ liệu giải trình tự độ phủ thấp bao gồm một số bước chính Đầu tiên, các đoạn đọc ngắn thu được từ quá trình giải trình tự được căn chỉnh với bộ gen tham chiếu bằng các phần mềm chuyên dụng như BWA hoặc Bowtie Sau đó, các biến thể di truyền, chủ yếu là SNPs, được gọi bằng cách so sánh các đoạn đọc đã căn chỉnh với bộ gen tham chiếu Để đảm bảo chất lượng của các biến thể gọi được, các tiêu chí lọc nghiêm ngặt được áp dụng, bao gồm độ sâu đọc, chất lượng base và tần
số allele [32]
Để đơn giản hơn quá trình phân tích, nhiều pipeline đã được phát triển, chẳng hạn như Stacks, Tassel GBS Các pipeline này cung cấp một loạt các công cụ để thực hiện các bước từ căn chỉnh, gọi biến thể đến đánh giá chất lượng dữ liệu Tuy nhiên, việc lựa chọn pipeline phù hợp phụ thuộc vào loại dữ liệu, mục tiêu nghiên cứu và nguồn lực tính toán [53]
Sau khi căn chỉnh các đoạn đọc với bộ gen tham khảo, bước tiếp theo là gọi biến thể Đây là quá trình xác định các vị trí trong genome mà trình tự của cá thể khác với trình tự tham chiếu Các phần mềm như SAMtools, GATK, và Freebayes được
sử dụng phổ biến để thực hiện bước này Tuy nhiên, do độ sâu đọc thấp trong giải trình tự sơ bộ, việc phân biệt giữa biến thể thật và lỗi giải trình tự là một thách thức lớn Các yếu tố như chất lượng đọc, độ sâu đọc, và tần số allele được sử dụng để đánh giá độ tin cậy của các biến thể gọi được.[75]
Tiếp theo, các kiểu gen của từng cá thể tại mỗi vị trí biến thể được xác định Các kiểu gen này thường được biểu diễn dưới dạng các allele (ví dụ, A/A, A/T, T/T)
Để đảm bảo chất lượng của dữ liệu kiểu gen, các biến thể có chất lượng thấp hoặc tần
số allele quá thấp sẽ bị loại bỏ [67]
Trang 37Một trong những thách thức lớn trong phân tích dữ liệu giải trình tự sơ bộ là
xử lý dữ liệu có độ lặp lại cao, đặc biệt là trong các bộ gen đa bội Ngoài ra, việc xác định các biến thể hiếm cũng đòi hỏi các thuật toán phức tạp và độ sâu đọc cao
Skim sequencing đã trở thành một công cụ không thể thiếu trong lĩnh vực cải thiện giống cây trồng Với khả năng phát hiện hàng triệu biến thể di truyền (SNPs) trên toàn bộ bộ gen với chi phí tương đối thấp, skim sequencing đã mở ra nhiều ứng dụng quan trọng Nghiên cứu đã chỉ ra rằng skim sequencing có thể được sử dụng để phát hiện các marker phân tử, xác định các vùng genome chứa các gen quy định các tính trạng quan trọng (QTLs), thực hiện các nghiên cứu liên kết toàn bộ genome (GWAS), và hỗ trợ các phương pháp chọn giống tiên tiến như chọn giống dựa trên marker và QTL-seq.[21]
1.4.4 Ý nghĩa và vai trò của đánh giá kiểu hình và ứng dụng skim- sequencing trong nghiên cứu đa dạng tập đoàn lúa
Nghiên cứu đa dạng di truyền ở lúa là một lĩnh vực quan trọng, không chỉ góp phần bảo tồn nguồn gen mà còn tạo nền tảng cho việc lai tạo các giống lúa mới, đáp ứng nhu cầu sản xuất bền vững Trong quá trình này, việc đánh giá, mô tả các đặc điểm nông sinh học và phân tích SNP dựa trên kỹ thuật Skim Sequencing đã thể hiện vai trò quan trọng, bổ trợ lẫn nhau, mang lại cách tiếp cận toàn diện và hiệu quả
Trước hết, các đặc điểm nông sinh học là những tính trạng dễ quan sát và được
sử dụng phổ biến trong đánh giá đa dạng di truyền Chúng bao gồm các yếu tố như hình dạng, màu sắc hạt, chiều cao cây, năng suất, chất lượng, cũng như các đặc điểm liên quan đến sinh trưởng và phát triển Những đặc điểm này không chỉ dễ tiếp cận
mà còn cung cấp thông tin trực tiếp về giá trị kinh tế và khả năng thích nghi của giống lúa Đặc biệt, trong các nghiên cứu về lúa màu, những tính trạng nổi bật như màu sắc
và kích thước hạt trở thành công cụ quan trọng giúp phân loại và nhận diện giống lúa Tuy nhiên, phương pháp này có hạn chế bởi các tính trạng nông sinh học thường chịu tác động mạnh mẽ từ môi trường, dẫn đến giảm độ chính xác trong việc đánh giá mối quan hệ di truyền [4]
Để khắc phục những hạn chế đó, Skim Sequencing, hay giải trình tự gen độ phủ thấp, đã được ứng dụng như một công cụ hiện đại trong phân tích di truyền Kỹ
Trang 38thuật này cho phép thu thập một lượng lớn dữ liệu về các biến thể di truyền trên toàn
bộ genome với chi phí thấp và tốc độ xử lý nhanh Thông qua dữ liệu SNPs (đa hình nucleotide đơn) thu được, Skim Sequencing cung cấp thông tin chi tiết về mức độ đa dạng di truyền, giúp xây dựng bản đồ di truyền chính xác và khoa học hơn Các bản
đồ này không chỉ làm rõ mối quan hệ họ hàng giữa các giống lúa mà còn giúp xác định các vùng genome liên quan đến những tính trạng quan trọng như năng suất, khả năng kháng bệnh, chịu hạn, hay khả năng thích nghi với điều kiện bất thuận
Ngoài ra, Skim Sequencing còn đóng vai trò quan trọng trong việc tăng hiệu quả chọn giống Bằng cách sử dụng các marker di truyền phát hiện từ kỹ thuật này, các nhà chọn giống có thể nhanh chóng xác định các cá thể mang kiểu gen mong muốn, rút ngắn thời gian và chi phí trong chương trình lai tạo Đồng thời, Skim Sequencing còn là công cụ đắc lực trong bảo tồn nguồn gen, giúp nhận diện và bảo
vệ các giống lúa quý hiếm hoặc có đặc điểm độc đáo, đảm bảo tính đa dạng di truyền
và sự bền vững của sản xuất lúa gạo [65]
Đáng chú ý, sự kết hợp giữa các đặc điểm nông sinh học và dữ liệu từ Skim Sequencing đã mở ra hướng nghiên cứu mới, mang lại hiệu quả cao hơn trong đánh giá và ứng dụng nguồn gen lúa Nếu như các đặc điểm nông sinh học cung cấp thông tin trực quan về sự biểu hiện của các tính trạng, thì Skim Sequencing bổ sung cơ sở
dữ liệu di truyền chi tiết, giúp phân tích sâu hơn mối quan hệ kiểu gen và kiểu hình
Sự phối hợp này không chỉ giúp tăng độ chính xác trong đánh giá mà còn hỗ trợ xác định các gen hoặc locus chịu trách nhiệm cho sự biểu hiện các tính trạng mong muốn Kết quả là, các chương trình chọn giống có thể tối ưu hóa việc lai tạo các giống lúa mới với năng suất cao, chất lượng tốt và khả năng thích nghi vượt trội
Tóm lại, các đặc điểm hình thái và dữa liệu SNP từ Skim Sequencing đều có
ý nghĩa quan trọng trong nghiên cứu đa dạng tập đoàn lúa Khi kết hợp các dữ liệu kiểu gen và kiểu hình, tạo nên một cách tiếp cận toàn diện và hiệu quả, vừa tận dụng được những ưu điểm truyền thống vừa khai thác tối đa tiềm năng của công nghệ hiện đại, đóng góp tích cực vào việc bảo tồn nguồn gen, phát triển các giống lúa mới, và đáp ứng nhu cầu sản xuất lúa gạo bền vững trong bối cảnh biến đổi khí hậu ngày càng
Trang 39CHƯƠNG 2 VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Vật liệu nghiên cứu
Vật liệu nghiên cứu của đề tài bao gồm 85 mẫu giống lúa, trong đó có 83 giống lúa địa phương và 2 giống nhập nội (Black và Okuno murasaki), đang được lưu giữ tại Ngân hàng gen cây trồng Quốc gia Các mẫu giống phân bố chủ yếu ở vùng Trung
du và miền núi phía Bắc với số lượng là 41 mẫu Tiếp theo là vùng Đồng bằng sông Hồng với 15 giống, và 27 giống còn lại thuộc các vùng sinh thái khác trên cả nước
Sự đa dạng về nguồn gốc và đặc điểm sinh thái của các giống lúa này mang lại nền tảng quan trọng cho việc phân tích và phát triển các giống lúa phù hợp với từng khu vực (Phụ lục 1)
Các chỉ thị phân tử sử dụng trong nghiên cứu: nghiên cứu sử dụng bộ dữ liệu resequencing để xác định các SNP phân bố trên 12 nhiễm sắc thể của cây lúa để phân nhóm và đánh giá đa dạng di truyền của tập đoàn 85 mẫu giống lúa
2.2 Địa điểm và thời gian nghiên cứu
Địa điểm nghiên cứu: Các mẫu giống lúa được trồng và đánh giá đặc điểm
nông sinh học tại Trung tâm Tài nguyên Thực vật Từ 85 mẫu giống lúa, DNA đã được tách chiết tại trung tâm Tài nguyên thực vật và gửi đi phân tích genotyping bằng công nghệ Skim-sequencing tại Texas A&M University (TAMU)
Thời gian thực hiện: Nghiên cứu bắt đầu từ tháng 10 năm 2022 và kết thúc vào
tháng 8 năm 2024 Trong thời gian này, sẽ thực hiện các hoạt động gieo trồng, theo dõi sự phát triển của giống lúa, và phân tích dữ liệu genotyping để phân tích SNP và
đánh giá đa dạng di truyền của tập đoàn lúa
2.3 Phương pháp nghiên cứu
Trang 402.3.1 Phương pháp đánh giá các đặc điểm nông sinh học
Thí nghiệm được bố trí theo phương pháp đánh giá tập đoàn phương pháp của K.A Gomez và A.A Gomez (1984): 85 mẫu giống lúa được bố trí tuần tự không nhắc lại, diện tích ô thí nghiệm 10 m2/mẫu giống, mật độ cấy: 40 khóm/m2, cấy 1 dảnh/khóm [57]
Thời gian: Vụ mùa 2022
Địa điểm tiến hành thí nghiệm: tại Trung tâm Tài nguyên Thực vật, An Khánh, Hoài Đức, Hà Nội
- Lượng phân bón cho 1 ha: 1 tấn phân hữu cơ vi sinh + 80 kg N + 90 kg P2O5 + 90 kg K2O/ha
- Các chỉ tiêu theo dõi và phương pháp đánh giá
Các chỉ tiêu theo dõi trong thí nghiệm được thực hiện theo hướng dẫn chi tiết của “Biểu mẫu mô tả và đánh giá ban đầu nguồn gen lúa”, do Trung tâm Tài nguyên Thực vật xây dựng dựa trên tài liệu của Viện Nghiên cứu Lúa Quốc tế (IRRI) và Viện Nghiên cứu Tài nguyên Thực vật Quốc tế (IPGRI) [48] Biểu mẫu mô tả này bao gồm các chỉ tiêu chính về đặc điểm hình thái, sinh trưởng của các giống lúa Các chỉ tiêu được đánh giá trong suốt quá trình sinh trưởng của cây lúa, từ giai đoạn nảy mầm, sinh trưởng thân lá, đến giai đoạn trổ bông và thu hoạch, nhằm đưa ra nhận định chính xác về đặc điểm nông học của các mẫu giống
Bảng 2 1 Các chỉ tiêu theo dõi
1 Độ phủ lông của lá (điểm) Giai đoạn làm đòng và trỗ bông
4 Góc lá đòng (điểm) Giai đoạn vươn lóng, làm đòng
6 Màu sắc thìa lìa (điểm) Giai đoạn vươn lóng, làm đòng
7 Dạng thìa lìa (điểm) Giai đoạn đẻ nhánh, vươn lóng