Mục tiêu của đề tài là áp dụng kỹ thuật giải trình tự thế hệ mới để phát hiện các chỉ thị phân tử SNPs, ứng dụng trong nghiên cứu cấu trúc quần thể cá phèn vàng ở ĐBSCL.. Đề tài thu mẫu
Trang 1BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC NHA TRANG
LÊ THỊ NHÀN
NGHIÊN CỨU DI TRUYỀN QUẦN THỂ LOÀI CÁ PHÈN VÀNG
(Polynemus melanochir Valenciennes, 1831) TẠI ĐỒNG BẰNG
SÔNG CỬU LONG
LUẬN VĂN THẠC SĨ
KHÁNH HÒA - 2017
Trang 2BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC NHA TRANG
LÊ THỊ NHÀN
NGHIÊN CỨU DI TRUYỀN QUẦN THỂ LOÀI CÁ PHÈN VÀNG
(Polynemus melanochir Valenciennes, 1831) TẠI ĐỒNG BẰNG
SÔNG CỬU LONG
LUẬN VĂN THẠC SĨ
Người hướng dẫn khoa học:
TS ĐẶNG THÚY BÌNH Chủ tịch Hội Đồng:
PGS - TS NGÔ ĐĂNG NGHĨA
Khoa sau đại học:
KHÁNH HÒA - 2017
Trang 3LỜI CAM ĐOAN Tôi xin cam đoan luận văn: “Nghiên cứu di truyền quần thể loài cá phèn vàng
(Polynemus melanochir Valenciennes, 1831) tại Đồng bằng Sông Cửu Long”
Là công trình nghiên cứu và thực hiện của cá nhân tôi dưới sự hướng dẫn của TS.Đặng Thúy Bình trên cơ sở các lý thuyết đã học và tìm hiểu thực tế tại địa phương Các số liệu và kết quả nghiên cứu trong luận văn là trung thực và chính xác Chưa công bố trong các công trình nghiên cứu nào khác
Luận văn tham khảo tư liệu và sử dụng thông tin được đăng tải trong danh mục tài liệu tham khảo
Nha Trang, ngày 8 tháng 8 năm 2017
Tác giả luận văn
Lê Thị Nhàn
Trang 4LỜI CẢM ƠN
Để hoàn thành luận văn tốt nghiệp, tôi xin gửi lời cảm ơn đến Viện Công nghệ sinh học và Môi trường, Trường Đại học Nha Trang, Viện Nghiên cứu Nuôi trồng Thủy sản III, đã tạo điều kiện thuận lợi về cơ sở vật chất cũng như thời gian cho tôi trong suốt quá trình thực hiện luận văn
Đặc biệt tôi xin được bày tỏ lòng biết ơn chân thành và sâu sắc tới TS Đặng Thúy Bình -người đã tận tình giúp đỡ và hướng dẫn tôi trong quá trình học tập, nghiên cứu và hoàn thiện luận văn này
Tôi xin chân thành cảm ơn các thầy cô giáo trong Bộ môn Công nghệ sinh học đã giảng dạy, cung cấp kiến thức cho tôi trong suốt quá trình học tập
Cảm ơn dự án PEER 2-7 (USAID và NSF tài trợ) đã cung cấp kinh phí và hỗ trợ thực hiện nghiên cứu này
Tôi xin bày tỏ lòng biết ơn tới gia đình, bạn bè, người thân đã quan tâm, hỗ trợ
và động viên để tôi hoàn thành tốt luận văn
Trong quá trình thực hiện không thể tránh khỏi những thiếu sót, kính mong nhận được sự những ý kiến đóng góp của hội đồng để luận văn được hoàn thiện hơn
Tôi xin chân thành cảm ơn!
Nha Trang, ngày 8 tháng 8 năm 2017
Tác giả luận văn
Lê Thị Nhàn
Trang 5MỤC LỤC
LỜI CAM ĐOAN iii
LỜI CẢM ƠN iv
MỤC LỤC v
DANH MỤC CHỮ VIẾT TẮT vii
DANH MỤC BẢNG viii
DANH MỤC HÌNH ix
TRÍCH YẾU LUẬN VĂN xi
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN 3
1.1 Tổng quan về địa điểm nghiên cứu 3
1.2 Tổng quan về đối tượng nghiên cứu 5
1.2.1 Một số đặc điểm sinh học họ cá nhụ Polynemidae 5
1.2.2 Một số đặc điểm sinh học loài Cá phèn vàng (Polynemus melanochir Valenciennes, 1831) 6
1.3 Tổng quan về phương pháp nghiên cứu 9
1.3.1 Các phương pháp nghiên cứu đa dạng di truyền quần thể 9
1.3.2 Một số phương pháp giải trình tự 15
1.3.3 Tổng quan về phương pháp giải trình tự RAD (Restriction-site Associated DNA) 25
1.4 Một số các kết quả nghiên cứu liên quan đến nội dung của đề tài 29
1.4.1 Nghiên cứu ngoài nước 29
1.4.2 Nghiên cứu trong nước 32
CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 34
2.1 Đối tượng, địa điểm nghiên cứu và phương pháp thu mẫu 34
2.1.1 Đối tượng, địa điểm nghiên cứu 34
2.1.2 Phương pháp thu mẫu 35
Trang 62.2 Phương pháp nghiên cứu 35
2.2.1 Phân loại dựa vào đặc điểm hình thái 35
2.2.2 Phương pháp nghiên cứu di truyền quần thể cá phèn vàng (Polynemus melanochir Valenciennes, 1831) ứng dụng công nghệ giải trình tự thế hệ mới 37
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 46
3.1 Đặc điểm hình thái phân loại của cá phèn vàng (Polynemus melanochir Valenciennes, 1831) 46
3.2 Nghiên cứu di truyền cá phèn vàng (Polynemus melanochir Valenciennes, 1831) 46
3.2.1 Tách DNA tổng số 46
3.2.2 Tạo thư viện gen 47
3.2.3 Xác định chỉ thị phân tử SNP ở các quần thể cá phèn vàng (Polynemus melanochir Valenciennes, 1831) 48
3.2.4 Xây dựng cấu trúc quần thể cá phèn vàng P melanochir tại Việt Nam 52
KẾT LUẬN VÀ KIẾN NGHỊ 60
TÀI LIỆU THAM KHẢO 61 PHỤ LỤC
Trang 7quốc tế (iNGO) hoạt động trong lĩnh vực bảo tồn đa dạng sinh học
Trang 8DANH MỤC BẢNG
Bảng 2.1 Số lượng mẫu cá phèn vàng (Polynemus melanochir) được thu tại các địa điểm 34
Bảng 2.2 Thành phần phản ứng của enzyme cắt giới hạn 39
Bảng 2.3 Thành phần phản ứng của PCR để khuếch đại thư viện gen EzRAD 41
Bảng 2.4 Bộ ký tự ASCII mã hóa giá trị Q – score 0 – 40 42
Bảng 2.5 Các giá trị của thang đo Phred 43
Bảng 3.1 Số lượng thư viện mẫu giải trình tự 48
Bảng 3.2 Các giá trị độ bao phủ Coverage (cutoff1) và Cutoff2 sử dụng xây dựng hệ gen tham chiếu 50
Bảng 3.3 Các thông số đa dạng di truyền của các quần thể cá phèn vàng dựa trên chỉ thị SNP 52
Bảng 3.4 Khoảng cách di truyền giữa các quần thể cá phèn tại ĐBSCL 53
Bảng 3.5 Kết quả phân nhóm quần thể cá phèn (k=3) tại ĐBSCL dựa trên phần mềm Structure 53
Trang 9DANH MỤC HÌNH
Hình 1.1 Tình hình xâm nhập mặn tại Đồng Bằng Sông Cửu Long năm 2016 4
Hình 1.2 Phân loại họ Polynemidae 6
Hình 1.3 Hình cá phèn vàng (Polynemus melanochir Valenciennes, 1831) 7
Hình 1.4 Phân bố của cá phèn vàng (Polynemus melanochir) 8
Hình 1.5 Nguyên lý kỹ thuật AFLP 10
Hình 1.6 Nguyên lý kỹ thuật RAPD 12
Hình 1.7 Kỹ thuật SSR 13
Hình 1.8 SNPs (Single Nucleotide Polymorphism) 14
Hình 1.9 Cấu tạo của dideoxynucleotides triphosphate (ddNTP) 15
Hình 1.10 Kết quả điện di trên gel polyacrylamide 16
Hình 1.11 Hai giai đoạn của giải trình tự Sanger 16
Hình 1.12 Nguyên tắc của kỹ thuật pyrosequencing 18
Hình 1.13 Các bước thực hiện giải trình tự cơ bản 18
Hình 1.14 Ba giai đoạn của giải trình tự thế hệ mới (Illumina) 19
Hình 1.15 So sánh phương pháp Sanger và giải trình tự thế hệ mới 20
Hình 1.16 Các bước chuẩn bị thư viện và giải trình tự của hệ thống 454 21
Hình 1.17 Các bước PCR nhũ tương 22
Hình 1.18 Các bước giải trình tự Illumina 23
Hình 1.19 Sơ đồ biểu diễn các bước SOLID 25
Hình 1.20 Nguyên tắc tạo thư viện của RAD 26
Hình 1.21 Phương pháp tạo thư viện gen của phương pháp mbRAD 27
Hình 1.22 Hình thức cắt của enzyme cắt giới hạn trong phương pháp ddRAD 27
Hình 1.23 Các bước giải trình tự và tạo thư viện gen của phương pháp 2bRAD .28
Hình 1.24 Quá trình tạo thư viện gen từ phương pháp EzRAD .29
Hình 2.1 Bản đồ thu mẫu tại ĐBSCL 34
Trang 10Hình 2.2 Một số bộ phận của bộ cá xương 35
Hình 2.3 Các chỉ số đếm trong phân loại cá 36
Hình 2.4 Sơ đồ nghiên cứu di truyền quần thể cá phèn vàng (Polynemus melanochir) 37
Hình 2.5 Quá trình Dam methyl hoá 38
Hình 2.6 Dam methyl hoá của Enzyme giới hạn MboI và Sau3AI 38
Hình 2.7 Quá trình cắt enzyme tạo đầu đính 39
Hình 2.8 Cấu trúc của Adapter 40
Hình 2.9 Quy trình dDocent 41
Hình 2.10 Dữ liệu di truyền sau khi giải trình tự định đạng bằng file FASTQ 42
Hình 2.11 Quy trình tạo hệ gen tham chiếu cá phèn vàng 44
Hình 3.1 Hình thái cá phèn vàng (Polynemus melanochir Valenciennes, 1831) 46
Hình 3.2 Kết quả điện di DNA tổng số của cá phèn vàng tại Bến Tre 47
Hình 3.3 Kết quả điện di sản phẩm PCR trên 1.5% gel agarose 48
Hình 3.4 Hình ảnh (phần mềm Seaview) của hệ gen tham chiếu dựa trên giá trị cutoff=3 Mũi tên chỉ đoạn trùng lắp (block) Các đoạn này được hạn chế khi lựa chọn hệ gen tham chiếu chuẩn 51
Hình 3.5 Phân tích cấu trúc di truyền quần thể cá phèn vàng theo phần mềm Structure 54
Hình 3.6 Mô hình 3D phân tích PCoA dựa trên chỉ thị SNPs của quần thể cá phèn vàng P melanochir ở ĐBSCL Vòng tròn thể hiện phân nhóm quần thể 55
Trang 11TRÍCH YẾU LUẬN VĂN
Đồng bằng sông Cửu Long (ĐBSCL) nằm ở hạ nguồn sông Mê Công, với diện tích
tự nhiên khoảng 39,747 km2, chiếm 12% diện tích cả nước với 750 km bờ biển và có 7/13 tỉnh, thành giáp biển Dựa trên thông tin về sự thay đổi của ĐBSCL, đặc biệt sự
xâm nhập mặn hiện nay có thể tác động đến loài cá phèn vàng (Polynemus melanochir
Valenciennes, 1831) là loài di cư giữa các thủy vực nước lợ, mặn và nước ngọt, nghiên cứu di truyền quần thể có thể cho thấy đáp ứng của sinh vật đối với những thay đổi môi trường Mục tiêu của đề tài là áp dụng kỹ thuật giải trình tự thế hệ mới để phát hiện các chỉ thị phân tử SNPs, ứng dụng trong nghiên cứu cấu trúc quần thể cá phèn vàng ở ĐBSCL Trên cơ sở đó có thể khảo sát sự phân tách và kết nối của các quần thể
cá phèn phân bố ở vùng nước ngọt và lợ
Đề tài thu mẫu cá phèn vàng tại tỉnh An Giang, Đồng Tháp, Trà Vinh, Bến Tre của ĐBSCL và áp dụng kỹ thuật giải trình tự thế hệ mới để phát hiện các chỉ thị phân tử SNPs ứng dụng trong nghiên cứu di truyền quần thể cá phèn vàng Trên cơ sở đó, có thể khảo sát cấu trúc và kết nối của các quần thể cá phèn vàng phân bố ở vùng nước ngọt và nước lợ đại diện là vùng thượng nguồn và vùng cửa sông
Kết quả nghiên cứu thu được 113 thư viện gen (library) của 4 quần thể cá phèn vàng tại các khu vực nghiên cứu Sau khi xây dựng hệ gen tham chiếu và so sánh, nghiên cứu phát hiện 427,474 SNPs thô Sau các bước lọc, 530 SNPs trên 112 cá thể cuối cùng được sử dụng để phân tích di truyền quần thể So sánh các quần thể gồm thượng nguồn (An Giang, Đồng Tháp), và cửa sông (Bến Tre, Trà Vinh) cho thấy quần thể khu vực cửa sông thể hiện sự đa dạng di truyền cao hơn Khảo sát khoảng cách di truyền giữa các quần thể cho thấy sự phân tách di truyền có ý nghĩa thống kê các quần thể Đồng Tháp với các quần thể còn lại (Bến Tre, Trà Vinh) Tuy nhiên, quần thể An Giang lại không thể hiện cấu trúc với các quần thể còn lại (P>0,05) Kết quả phân tích nhóm (Structure) và phân tích tọa độ (PCoA) đều cho thấy sự phân tách quần thể của
cá phèn vàng theo các khu vực địa lý ở vùng thượng nguồn và cửa sông Tuy nhiên, do
cá phèn vàng là loài di cư tự nhiên giữa các thủy vực nước ngọt lợ và mặn trong quá trình sinh sản và tìm kiếm thức ăn, vì vậy các quần thể vẫn chia sẻ những thông tin di truyền đặc trưng cho quần thể Xét về phương diện khoảng cách địa lý (<300 km) dọc
Trang 12theo sông Tiền và sông Hậu và sự kết nối giữa 2 nhánh sông (thông qua sông Vàm Nao), và trên qui mô lớn là sự kết nối giữa ĐBSCL và các lưu vực của sông Mê Công, chúng ta có thể nhận thấy sự biến dị/khác biệt di truyền giữa các quần thể ở qui mô nhỏ thể hiện sự đáp ứng đối với môi trường đang thay đổi, đặc biệt là khu vực dễ bị tác động như ĐBSCL, Việt Nam
Từ khóa: Di truyền quần thể, SNPs, Polynemus melanochir, EzRAD
Trang 13MỞ ĐẦU
Đồng bằng sông Cửu Long nằm ở hạ nguồn sông Mê Công, với diện tích tự nhiên khoảng 39,747 km2, chiếm 12% diện tích cả nước với 750 km bờ biển và có 7/13 tỉnh, thành giáp biển (Nguyễn Trung Vẹn, 2013) Với sự gia tăng dân số mạnh mẽ làm cho nhu cầu sử dụng tài nguyên tăng cao, đặc biệt là đất nông nghiệp và nuôi trồng thủy sản, dẫn đến sự sụt giảm đáng kể mức độ sinh cảnh tự nhiên và bán tự nhiên
ở vùng đồng bằng (Cambell, 2012) Thêm vào đó, các chương trình dự án phát triển trên dòng chính ở thượng nguồn đã và đang tác động mạnh đến lưu vực sông Mê Công trong việc giảm thiểu nguồn lợi và biến động đa dạng sinh học (Cambell, 2012) Ngoài
ra, biến đổi khí hậu đã làm cho mực nước biển dâng cao từ 1,7 tới 1,8 mm hàng năm trong suốt thế kỉ vừa qua và tăng với tốc độ 3 mm/năm trong suốt thập kỉ trước (ADB, 2008) Mức gia tăng mực nước biển ở đồng bằng châu thổ sông Mê Công là khá lớn, khoảng 6 mm/năm và lên đến khoảng 150 mm/năm ở đồng bằng châu thổ Chao Phraya (Syvitski và cs, 2009) Sụt đất do khai thác nước ngầm và do trầm tích bị các đập thủy điện giữ lại đã và đang làm vùng đồng bằng châu thổ sông Mê Công chìm dần và mực nước biển dâng đang làm cho vấn đề trở nên trầm trọng hơn (Syvitski và cs, 2009)
Các vùng châu thổ ĐBSCL có tính đa dạng sinh học cao nhưng rất nhạy cảm với sự thay đổi của các yếu tố thời tiết cực đoan và biến đổi khí hậu Vùng ĐBSCL được xác nhận là nơi chịu tác động mạnh mẽ của biến đổi khí hậu và nước biển dâng (Adger et al., 2007) Biến đổi khí hậu sẽ làm thay đổi các hệ sinh thái thủy sinh, và làm thay đổi sự phân bố của các loài và ngành sản xuất thủy sản Sự di cư, các bãi đẻ
và khu vực kiếm mồi của cá cũng sẽ bị thay đổi và ảnh hưởng không nhỏ đến hoạt động của các cộng động dân cư làm nghề thủy sản Các hoạt động khai thác thủy sản nội địa rất dễ bị tác động bởi các thay đổi trong chế độ thủy văn và các thành phần hóa học của nước (Hoegh-Guldberg & Bruno, 2010)
Để quản lý tài nguyên và xây dựng chiến lược bảo tồn đa dạng sinh học, nghiên cứu di truyền quần thể và thông tin về sự kết nối quần thể, mức độ khác biệt di truyền giữa các quần thể địa phương sẽ cung cấp bằng chứng quan trọng, phản ánh quy mô phát tán của các loài sinh vật và có ý nghĩa quan trọng trong công tác bảo tồn và quản
lý nguồn lợi
- Tính cấp thiết của đề tài
Dựa trên thông tin về sự thay đổi của Đồng bằng sông Cửu Long, đặc biệt sự xâm nhập mặn hiện nay có thể tác động đến loài cá phèn vàng là loài di cư giữa các thủy
Trang 14vực nước lợ, mặn và nước ngọt, nghiên cứu di truyền quần thể có thể cho thấy đáp ứng của sinh vật đối với những thay đổi môi trường Do đó, chúng tôi tiến hành thực hiện
đề tài “Nghiên cứu di truyền quần thể loài cá phèn vàng (Polynemus melanochir Valenciennes, 1831) tại Đồng bằng sông Cửu Long” Nghiên cứu này nằm trong
khuôn khổ của dự án PEER 2-7 - “Conservation genetics for improved biodiversity and resource management in a changing Mekong Delta” do TS Đặng Thúy Bình thuộc Viện Công nghệ Sinh học và Môi trường, Trường Đại học Nha Trang chủ trì
- Mục tiêu của đề tài
Mục tiêu của đề tài là áp dụng kỹ thuật giải trình tự thế hệ mới để phát hiện các chỉ thị phân tử SNPs, ứng dụng trong nghiên cứu cấu trúc quần thể cá phèn vàng ở ĐBSCL Trên cơ sở đó có thể khảo sát sự phân tách và kết nối của các quần thể cá phèn phân bố ở vùng nước ngọt và lợ
- Nội dung nghiên cứu
+ Thu mẫu cá phèn (Polynemus melanochir Valenciennes, 1831) tại tỉnh An
Giang, Đồng Tháp, Trà Vinh, Bến Tre của ĐBSCL
+ Phát hiện các chỉ thị phân tử SNPs ứng dụng trong nghiên cứu cấu trúc quần
thể cá phèn (Polynemus melanochir Valenciennes, 1831)
+ Khảo sát cấu trúc và sự kết nối quần thể của cá phèn vàng ở khu hệ nước ngọt
(An Giang, Đồng Tháp) và vùng cửa sông có sự xâm nhập mặn (Bến Tre, Trà Vinh)
- Ý nghĩa của đề tài
Nghiên cứu này cung cấp dữ liệu đầu vào về cấu trúc và sự kết nối quần thể cá phèn vàng làm cơ sở cho việc xây dựng chiến lược bảo tồn và quản lý nguồn lợi
Trang 15CHƯƠNG 1 TỔNG QUAN
1.1 Tổng quan về địa điểm nghiên cứu
Hệ thống sông Mê Công là một trong những hệ thống sông lớn nhất trên thế giới, lưu vực sông Mê Công có tính đa dạng sinh học rất cao, có hơn 1200 loài cá với sản lượng 3 triệu tấn/năm (Hortle & Bush, 2003) Đồng bằng sông Cửu Long là vùng
hạ lưu cuối cùng của sông Mê Công trước khi đổ ra Biển Đông và vịnh Thái Lan Hiện nay ĐBSCL ghi nhận có 322 loài cá, trong đó có 186 loài cá nước ngọt (Trần Đắc Định và cs, 2013) Tuy nhiên, sự đa dạng sinh học ở ĐBSCL đang phải đối mặt với những thách thức từ sự tăng dân số dẫn đến áp lực việc khai thác thủy sản quá mức (Kỷ Quang Vinh, 2012; Campbell, 2012), xây dựng đập ảnh hưởng đến sự di cư của cá (MRC, 2010) và biến đổi khí hậu (WWF, 2009) Nguồn lợi cá sông Mê Công bị suy giảm ước tính từ 26% đến 42%, hơn 100 loài sẽ có nguy cơ tuyệt chủng (MRC, 2010) Theo thống kê năm 2012 của Tổng cục thống kê Việt Nam, dân số ĐBSCL hơn 18,6 triệu người, mật độ dân số bình quân hơn 400 người trên cây số vuông, gần gấp đôi mật độ dân số cả nước Dân số tăng cao làm cho nhu cầu sử dụng tài nguyên vật chất tăng cao, đặc biệt số người nghèo còn cao rất dễ tác động tiêu cực đến các chính sách bảo vệ tài nguyên môi trường của nhà nước Với sự gia tăng dân số (ước tính mức tăng 2,3%) (Kỷ Quang Vinh, 2012) tạo nên một áp lực lên hệ sinh thái nhiệt đới và tài nguyên khu vực Suốt 2 thập niên vừa qua, nhiều khu rừng ngập mặn đã bị tàn phá để dành chỗ cho việc nuôi trồng thủy sản, chủ yếu là nuôi tôm, các loài cá và nghêu sò
Do đó, đa dạng sinh học ở các vùng đất ngập nước quan trọng đang bị đe dọa do khai thác thiếu tái tạo và quản lý yếu kém
Thêm vào đó, các chương trình, dự án phát triển trên dòng chính ở phía thượng nguồn đã và đang tác động mạnh đến lưu vực sông Mê Công trong việc giảm thiểu nguồn lợi và biến động đa dạng sinh học do các tác động kép của việc giảm lưu lượng nước trong các dòng chảy từ việc xây đập và đồng thời sự xâm nhập của nước biển do biến đổi khí hậu gia tăng (Campbell, 2012) Dự kiến sẽ có thêm 88 đập thủy điện mới cho đến năm 2030 dọc theo con sông này (Stone, 2011)
Sự biến đổi khí hậu đặc biệt là xâm nhập mặn gây ra những hậu quả hết sức nặng nề, ảnh hưởng đến đời sống sinh hoạt, sản xuất của cả vùng ĐBSCL Đặc biệt, cuối năm 2015 và những tháng đầu năm 2016, diễn biến xâm nhập mặn tại ĐBSCL
Trang 16được đánh giá nặng nề nhất trong 100 năm qua Ngay từ tháng 2, độ mặn đã duy trì ở mức cao và nghiêm trọng Trên sông Tiền và sông Hậu, độ mặn là trên 45 ‰, xâm nhập sâu tới 70 km tính từ cửa sông, thậm chí có nơi lên đến 85 km (trong khi theo Trung tâm phòng tránh và giảm nhẹ thiên tai thì độ mặn bằng 4 ‰ đã được coi là bị xâm nhập mặn)
(http://www.tongcucthuyloi.gov.vn/Tin-tuc-Su-kien/Tin-tuc-su-kien-tong-hop/catid/12/item/2670/xam- giai-phap-khac-phuc)
nhap-man-vung-dong-bang-song-cuu-long 2015 -2016 -han-han-o-mien-trung tay-nguyen-va-Theo kết quả khảo sát của Viện Khoa học Thủy lợi Miền Nam, toàn bộ vùng Nam Măng Thít (Vĩnh Long) có trên 8,000 ha đất canh tác bị xâm mặn nặng, biên độ mặn lên tới 0,4 g/l độ mặn được xem là gây ảnh hưởng lớn đến năng suất cây trồng Ở vùng phía Nam tỉnh Vĩnh Long, các tuyến sông, kênh rạch ven biển như: sông Tân Dinh, Rạch Chiếc - Bào Môn, Rạch Mương Điều, Bang Chang, Rạch Tra chưa được xây cống ngăn mặn, vì vậy độ mặn có thể tiếp tục tăng cao hơn về phía thượng lưu sông Tiền, sông Hậu Việc cấp nước tưới và nước cho sinh hoạt ở huyện Vũng Liêm
và Trà Ôn sẽ gặp khó khăn hơn vào những ngày độ mặn lên cao
Hình 1.1 Tình hình xâm nhập mặn tại Đồng Bằng Sông Cửu Long năm 2016
(Nguồn Viện khoa học thủy lợi Miền nam)
Trang 17ĐBSCL có hai hệ sinh thái thủy vực đặc trưng gồm: nước ngọt và nước lợ, mặn Sự tương tác của thủy triều biển và hệ thống sông Cửu Long tạo ra vùng nước lợ, vào thời điểm tương tác của thủy triều mạnh hơn sông làm cho độ mặn tăng cao Từ cửa Tiểu (Tiền Giang) đến Hà Tiên (Kiên Giang) có nhiều sông, kênh, rạch đổ ra biển, trong đó 17 sông và 3 kênh lớn đổ ra biển Đông và biển Tây, có tác động mạnh đến vùng ven bờ Hệ sinh thái thủy vực mặn, lợ ở ĐBSCL có vai trò quan trọng cũng không kém so với hệ sinh thái thủy vực nước ngọt ở ĐBSCL Hệ sinh thái thủy vực nước lợ là hệ sinh thái chuyển tiếp, tạo nên sự phong phú và đa dạng, là vùng chuyển tiếp các quần thể và tạo cơ hội cho các loài sống rộng sinh thái, các loài di cư kiếm ăn, sinh sản Hệ sinh thái vùng cửa sông ven biển ở ĐBSCL là một phần của vùng hạ lưu
hệ thống sông Mê Công, chịu ảnh hưởng mạnh của thủy triều biển Đông và biển Tây,
sự tương tác, giao thoa mạnh giữa sông và biển
Cá phèn vàng (Polynemus melanochir) sống ở vùng nước sâu khoảng 30 mét,
hiếm khi bắt gặp ở vùng nước lợ, phân bố ở Thái Lan, Malay Peninsula, Sumatra, Campuchia và ĐBSCL Việt Nam Cá có khả năng sinh sản và phát triển nhanh, thích nghi tốt với điều kiện môi trường, chúng sử dụng những cái tua dài để cảm nhận môi trường xung quanh Thích sống ở đáy, nơi có nhiều bùn hoặc cát pha bùn Mùa đánh bắt thường là nguyên năm Cá phèn là loài cá đẻ trứng ngoài biển cả; nghĩa là chúng sẽ
đẻ nhiều trứng nhỏ trôi nổi trên mặt nước và các trứng này sẽ trôi theo dòng nước cho đến khi nở (www.fishbase.org)
1.2 Tổng quan về đối tượng nghiên cứu
1.2.1 Một số đặc điểm sinh học họ cá nhụ Polynemidae
1.2.1.1 Phân loại
Trên thế giới, họ Polynemidae có 8 giống với 41 loài (Motomura, 2004) Theo
Rainboth (1996) họ Polynemidae có 2 giống cá nước ngọt là Eleuthronema (2 loài) và
polynemus (4 loài) Ở Việt Nam, họ cá nhụ Polynemidae thuộc bộ cá vược
Perciformes, giống Polynemus có 7 loài Theo tài liệu phân loại cá tại ĐBSCL của Mai Đình Yên và cs (1993), ở Nam Bộ giống Polynemus có 2 loài là cá phèn vàng (Polynemus
melanochir) và cá phèn trắng (Polynemus dubius)
1.2.1.2 Phân bố
Họ cá nhụ phân bố khá rộng, chúng chủ yếu ở vùng nhiệt đới và cận nhiệt đới (Nelson, 1994) Chúng có thể sống trong môi trường với sự dao động lớn về độ mặn, đặc điểm này cho phép chúng có thể sống được ở vùng cửa sông Có thể bắt gặp họ
Trang 18Polynemidae ở những thủy vực tự nhiên của sông Mê Công từ Tonle Sap đến vùng cửa sông (Mai Đình Yên và cs, 1992; Rainboth, 1996)
1.2.1.3 Đặc điểm sinh học họ Polynemidae
Họ cá nhụ Polynemidae có 3 - 16 tia vây ngực rất dài và mịn, tách biệt, mõm nhô ra trước hàm, miệng rộng, hàm kéo dài đến sau mắt (Trần Đắc Định, 2013)
Hình 1.2: Phân loại họ Polynemidae (Motomura, 2004)
1.2.2 Một số đặc điểm sinh học loài Cá phèn vàng (Polynemus melanochir
Giống: Cá phèn (Polynemus) Loài: Cá phèn vàng (Polynemus melanochir Valenciennes, 1831)
Trang 19Tên địa phương: Cá phèn vàng
Tên tiếng anh: Paradise threadfin
Cá phèn vàng (Polynemus melanochir) thuộc họ cá nhụ (Polynemidae), bộ cá vược
(Perciformes) là một trong những loài cá kinh tế của Việt Nam (Bộ Thủy sản, 1996)
Hình 1.3 Hình cá phèn vàng (Polynemus melanochir Valenciennes, 1831)
1.2.2.2 Đặc điểm hình thái
Đặc điểm phân loại: Cá phèn vàng (Polynemus melanochir Valenciennes, 1831)
có 7 tia vây ngực dài, vây ngực đen, bụng vàng nhạt, thân dài đến 20cm Phân bố lưu vực sông Mê Công và Chao praya (Trần Đắc Định, 2013)
Thân cá phèn vàng thon dài, dẹp bên, mõm ngắn, hơi tù Răng hàm nhỏ mịn, mắt cá nhỏ, có màng da che phủ Vây lưng thứ nhất có 7 gai cứng, vây lưng thứ hai có
1 gai cứng và 14 – 15 tia mềm, vây hậu môn có 2 gai cứng và 12 tia mềm Vây ngực
có 15 - 18 tia mềm Vây đuôi chẻ hai, đường bên kéo dài từ mép trên lỗ mang đến điểm giữa gốc của các tia vây đuôi Mặt lưng màu xám đen, màu vàng ở mặt bụng
1.2.2.3 Đặc điểm phân bố
Trên thế giới cá phèn vàng phân bố từ phía đông Ấn Độ đến phía tây Thái Bình Dương Ở Đông Nam Á, cá phèn vàng phân bố ở Miến Điện, Ấn Độ, Thái Lan, Mã Lai, Cam Pu Chia và Đồng bằng sông Cửu Long của Việt Nam Hầu hết các loài cá
thuộc họ Polynemidae là cá biển nhưng các loài thuộc giống Polynemus chủ yếu là
cá nước ngọt (Motomura, 2004; Fishbase, 2012)
Trang 20Hình 1.4 Phân bố của cá phèn vàng (Polynemus melanochir) (www.fishwise.co.za)
Cá phèn vàng sống chủ yếu ở nước lợ và mặn, tuy nhiên cũng có thể gặp
ở vùng nước ngọt (Motomura, 2004) Cá phèn vàng thường di cư vào vùng nước ngọt
để sinh sản Cá phèn vàng là loài sống đáy, chủ yếu là nền đáy cát Một số loài cá
thuộc giống Polynemus như P dubius, P aquilonaris có tập tính sống giống như cá phèn vàng chúng phân bố ở cả vùng nước ngọt và nước lợ Tuy nhiên hai loài P
hornadayi và P multifilis chỉ phân bố ở vùng nước ngọt (Motomura, 2004)
Tại ĐBSCL còn có thể còn bắt gặp cá phèn trắng Polynemus dubius Bleeker,
1853 (Tống Xuân Tám, 2012) hoặc cá phèn chấm Polydactylus sextarius (Bloch
&Schneider, 1801)
1.2.2.4 Đặc điểm dinh dưỡng
Cá phèn vàng cùng một số loài trong họ Polynemidae như: Polynemus aquilonaris,
Polynemus dubius và Polynemus multifilis được ghi nhận là những loài ăn tạp thiên về
động vật với các loại thức ăn chủ yếu là giáp xác (chủ yếu là tôm), cá nhỏ và sinh vật
đáy (Motomura, 2004, Fishbase, 2012)
1.2.2.5 Đặc điểm sinh sản
Cá phèn vàng có buồng trứng dạng ống dài, màu trắng hồng đến vàng nhạt tùy theo theo các giai đoạn phát triển của buồng trứng Tinh sào cá phèn vàng là hai dãy dẹp có màu trắng đục, nằm bên dưới xương sống, thuộc dạng buồng tinh không phân thuỳ Cá phèn vàng cái thành thục sinh dục khi cơ thể đạt kích cỡ 16 g và cá phèn vàng đực
có kích thước thành thục là 14,4 g/con Tỉ lệ đực: cái trong quần đàn là vào khoảng 1:2,1
Trang 21Sức sinh sản của cá phèn vàng tương đối cao, sức sinh sản tuyệt đối khoảng 23,765
± 10,545 (trứng/cá thể) và sức sinh sản tương đối là 218,239 ± 75,926 (trứng/kg cá) Đường kính trứng trung bình ở giai đoạn IV là 0,69 ± 0,05mm Mùa vụ sinh sản của cá phèn vàng trên tuyến sông Hậu tập trung vào khoảng từ tháng 3 đến tháng 6 và tháng
11 đến tháng 12 (Bùi Sĩ Văn, 2013)
1.3 Tổng quan về phương pháp nghiên cứu
1.3.1 Các phương pháp nghiên cứu đa dạng di truyền quần thể
1.3.1.1 Chỉ thị phân tử DNA
Các chỉ thị phân tử DNA là những chỉ thị dựa trên bản chất đa hình DNA Chúng được sử dụng để xác định mối quan hệ giữa các cá thể trong cùng một loài hoặc giữa các loài, phát hiện loài mới và mối quan hệ tiến hoá giữa loài, dùng để lựa chọn
tổ hợp lai
Chỉ thị phân tử DNA có thể là một gen hoặc những đoạn ADN đặc hiệu Chỉ thị phân tử có tính ổn định cao và có thể xác định trong tất cả các loại mô với độ chính xác cao mà không bị ảnh hưởng bởi điều kiện của môi trường Chỉ thị phân tử được chia làm hai nhóm chính:
Chỉ thị dựa trên cơ sở nguyên lý lai DNA: chỉ thị RFLP
Chỉ thị dựa trên cơ sở nhân bản DNA bằng kỹ thuật PCR: RAPD, AFLP, SSR)
RFLP (Restriction Fragment Length Polymorphism - Đa hình chiều dài đoạn
phân cắt giới hạn)
Kỹ thuật RFLP là kỹ thuật nghiên cứu tính đa hình chiều dài của các phân đoạn DNA dựa trên điểm cắt các enzyme giới hạn (Restriction Enzyme, RE) Khi ủ DNA với enzyme giới hạn ở dung dịch đệm thích hợp sẽ tạo ra những phân đoạn DNA với kích thước khác nhau, từ đó lập nên các bản đồ gen Kỹ thuật này được sử dụng phổ biến từ thập niên 80 đến nay
Nguyên lý:
Nguyên lý của kỹ thuật này dựa trên sự khác biệt tự nhiên của các chuỗi nucleotide trong phân tử DNA và khi phân tử DNA bị cắt thành nhiều đoạn nhỏ bởi enzyme cắt giới hạn thì các đoạn DNA có thể khác nhau về kích thước hay chiều dài
Ưu điểm: RFLP là chỉ thị đồng trội cho phép phân biệt được cá thể đồng hợp
và dị hợp RFLP là công nghệ nghiên cứu đa hình DNA đầu tiên đủ rẻ để có thể được ứng dụng một cách rộng rãi Do kích thước DNA khảo sát trong RFLP lớn vì vậy số lượng marker tạo ra nhiều đủ đáp ứng nhu cầu nghiên cứu
Trang 22Nhược điểm: Quy trình thực hiện với chỉ thị RELP phức tạp, đòi hỏi chất
lượng DNA phải cao là hạn chế của việc sử dụng kỹ thuật này
Chỉ thị AFLP (Amplified Fragment Lenghth Polymorphism)
AFLP là kỹ thuật sinh học phân tử hiện đại do Zebeau và Vos (1995) phát minh Sau đó được Vos và cs (1995), Vos và Kuiper (1997) tiếp tục phát triển AFLP được định nghĩa là sự đa hình các đoạn cắt khuếch đại, AFLP sử dụng enzyme cắt giới hạn cắt DNA bộ gen, sử dụng những phân đoạn DNA làm khuôn cho phản ứng khuếch đại PCR
Nguyên lý:
Nguyên tắc của phương pháp AFLP cũng giống như RFLP, điểm khác biệt cơ bản là AFLP không cần tiến hành lai phân tử (lai Southern blot), do vậy thực hiện nhanh hơn
Enzyme cắt giới sử dụng trong AFLP là một cặp enzyme
Cặp enzyme thường được dùng nhất là EcoRI – MseI
Sau khi cắt bằng cặp enzyme này, một trình tự nối mạch đôi (adaptor) sẽ được gắn vào hai đầu đoạn DNA cắt bằng enzyme ligase
Đoạn adaptor gồm 2 phần: phần trình tự lõi và phần trình tự đặc hiệu cho vị trí cắt enzyme Mồi của phản ứng PCR được thiết kế dựa trên trình tự adaptor và chứa một trình tự chọn lọc khoảng vài nucleotide
Chỉ những phân đoạn DNA nào chứa cả trình tự adaptor và trình tự nucleotide chọn lọc mới được khuếch đại
Hình 1.5 Nguyên lý kỹ thuật AFLP
Trang 23Ưu điểm: AFLP là một kỹ thuật có độ nhạy cao dễ phát hiện đa hình trong toàn
bộ hệ gen AFLP cho phép phân tích nhanh, ổn định, đáng tin cậy, có khả năng ứng dụng trong lập bản đồ hệ gen và chọn giống (Vos và cs, 1995) AFLP cho đa hình cao,
vì vậy kỹ thuật AFLP hứa hẹn cho phép xem xét kỹ sự đa hình ở một số lượng lớn locus trong một thời gian rất ngắn và đòi hỏi một lượng rất nhỏ DNA Điều này tạo cho AFLP trở thành một hệ thống chỉ thị lý tưởng cho hàng loạt nghiên cứu di truyền
Nhược điểm: AFLP là chỉ thị di truyền trội do đó không có khả năng phân biệt
được cá thể đồng hợp tử và cá thể dị hợp tử Phương pháp phức tạp, giá thành cho nghiên cứu là tương đối cao (Vos và cs, 1995)
Chỉ thị RAPD (Random Amplified Polymorphism DNA)
Kỹ thuật RAPD cho phép phát hiện đa hình các đoạn DNA được nhân bản ngẫu nhiên bằng việc sử dụng các đoạn mồi đơn chứa trật tự nucleotide ngẫu nhiên dài từ 9
- 12 nucleotide, tối thiểu là 4 nucleotide Kết quả là sau khi điện di sản phẩm RAPD sẽ phát hiện được tính đa hình dựa trên các phân đoạn DNA được nhân bản (Lê Duy Thành và cs, 1995)
Chỉ thị RAPD thường ứng dụng trong nghiên cứu sự đa đạng sinh học và nguồn gốc di truyền của các loài động vật, thực vật và vi sinh vật, chỉ thị RAPD cũng được
sử dụng cho những mục đích sau:
+ Lập bản đồ liên kết, xác định những gen liên kết với một tính trạng nào đó như tính trạng chất lượng sợi ở cây bông, tính trạng kháng virus ở cá
+ Phân tích cấu trúc di truyền của quần thể
+ Phát hiện sự khác biệt trong các dòng soma (Somaclonal variation)
Nguyên lý:
Về cơ bản kỹ thuật RAPD được thực hiện theo ba bước: (1) Tách chiết DNA tổng
số, nhân DNA bằng máy PCR; (2) Điện di trên gel agarose hoặc gel polyacrylamid; (3) Xác định tính đa dạng di truyền bằng các phần mềm thông dụng
Trang 24Hình 1.6 Nguyên lý kỹ thuật RAPD wssp/studentscholars/project/achives/onions/rapdl.gif
1, 2, 3, 4, 5, 6: các đoạn mồi
(A) sản phẩm khuếch đại đoạn DNA được giới hạn giữa 2 mồi 2 và 5
(B) sản phẩm khuếch đại đoạn DNA được giới hạn giữa 2 mồi 3 và 6
Ưu điểm: Tiến hành nhanh, dễ, khá rẻ và các bộ mồi cho RAPD đã được thương
Chỉ thị Microsatellite (SSR – Simple Sequence Repeats - sự lặp lại của một trật
để thiết kế mồi, PCR với các mồi được thiết kế, đánh giá và phân tích mẫu băng, đánh giá đa hình của sản phẩm PCR
Trang 25Hình 1.7 Kỹ thuật SSR
Nguyên lý:
Dựa vào hai đầu (vùng sườn) của các đoạn lặp lại có trình tự rất đặc biệt và thống nhất chung cho cùng một đoạn DNA trên gen, không phân biệt cá thể trong cùng một loài, nhưng giữa các cá thể trong cùng một loài số lần lặp lại của đơn vị lặp lại là khác nhau Từ đó, thiết kế các cặp mồi đặc hiệu để nhân bản các cặp DNA trên gen chứa các trình tự lặp lại Điện di sản phẩm PCR cho phép phân biệt được sự giống và khác nhau giữa các cá thể trong cùng loài
Ưu điểm:
Nhóm chỉ thị này rất đặc hiệu, có độ chính xác cao Tương đối đơn giản,
dễ thực hiện
Cho nhiều allen trong một locus
Phân bố đều trong bộ gen
SSR cho thông tin cụ thể hơn so với di truyền ty thể theo đường mẹ (vì
có mức đột biến cao) và di truyền theo cả bố và mẹ
Chiều Điện di
Trang 26Nhược điểm:
Điểm hạn chế quan trọng của kỹ thuật chỉ thị SSR là cần phải đọc trình tự bộ gen để dựa vào đó có thể thiết kế các cặp mồi đặc thù và tối ưu hóa điều kiện các mồi cho từng loài trước khi sử dụng
Chỉ thị SNPs (Single Nucleotide Polymorphism)
Những thay đổi một nucleotide trong trình tự bộ gen của các cá thể trong quần
thể được gọi là đa hình nucleotide đơn (SNPs) (Hình 1.8)
Hình 1.8 SNPs (Single Nucleotide Polymorphism)
Hiện nay với số lượng lớn trình tự gen đã thu được cho phép ta có thể phát hiện một số lượng lớn các đa hình nucleotid đơn (SNP) và đây là loại chỉ thị có số lượng lớn và đa dạng nhất cho từng cá thể của cùng một loài
Theo phân tích chi tiết chuỗi trình tự trong bộ gen, ADN từ hai cá thể khác nhau phần lớn đều giống nhau với số cặp base khác biệt nhau nằm ở trong khoảng cho phép 500 - 1000 bp Hiện nay, người ta đã công bố 3 triệu SNP trong bộ gen người, nhiều hơn bất cứ chỉ thị phân tử nào đã được công bố trước đó Chỉ thị SNP được áp dụng vào đầu những năm 2000, từ bộ gen người cho đến bộ gen các sinh vật khác
Sự khác nhau về nucleotide này có thể dẫn đến thay đổi tính trạng đặc biệt hay kiểu hình, hoặc có thể là sự thay đổi trung tính có thể được sử dụng để đánh giá sự đa dạng trong tiến hóa SNP là dạng thay đổi trình tự trong bộ gen phổ biến nhất cho tới nay Cứ khoảng 225 bp là tìm thấy 1 SNP trên bộ gen gà và khoảng 1.250 bp là sàng lọc được 1 SNP cho bộ gen người (Liu, 2007) SNP có thể xuất hiện ở vùng gen mã hoá, tác động trực tiếp đến tính trạng quan tâm, rất hiệu quả trong việc xác định mối tương quan giữa SNP và tính trạng nào đó (Beuzen và ctv, 2000) Mặc dù ứng dụng SNP trong các chương trình chọn giống còn mới mẻ, gần đây SNP đã được sử dụng để sàng lọc các gen tiềm năng liên quan đến tính trạng tăng trưởng của một số đối tượng
Trang 27thuỷ sản, bao gồm cá hồi Salvelinus alpinus (Tao và Boulding, 2003), cá chẽm (Xu và ctv, 2006), tôm thẻ chân trắng Penaeus (Litopenaeus) vannamei và tôm sú P monodon
(Glenn và ctv, 2005) Ngoài ra, chúng ta có thể so sánh đa dạng di truyền của các loài khác nhau, thậm chí với các phạm vi phân loại rộng, có thể khảo sát quá trình tiến hóa cũng như xác định mối quan hệ phân loại giữa các loài
dideoxynucleotide (ddNTP), ddNTP (Hình 1.9) có cấu trúc giống như dNTP nhưng bị
mất nguyên tử oxy ở carbon thứ 3 khiến dNTP tiếp theo không thể gắn vào làm quá trình tổng hợp bị dừng lại
Hình 1.9 Cấu tạo của dideoxynucleotides triphosphate (ddNTP)
Trang 28Hình 1.10: Kết quả điện di trên gel polyacrylamide
Sau khi điện di trên gel polyacrylamide phát hiện các vạch điện di bằng kỹ thuật phóng xạ tự ghi Từ các vạch này có thể xác định được trình tự DNA (Phạm Hùng Vân, 2012)
Kỹ thuật giải trình tự của Sanger gồm hai giai đoạn:
Hình 1.11 Hai giai đoạn của giải trình tự Sanger
(Phạm Hùng Vân & Nguyễn Đỗ Phúc, 2012)
(1) Giai đoạn đầu gọi là giai đoạn phản ứng giải trình tự dùng enzyme polymerase
để nhân bản đoạn DNA muốn giải trình tự thành các đoạn cách biệt nhau chỉ có một nucleotide ở đầu 3’ và nucleotide này có thể nhận diện được nhờ kỹ thuật đánh dấu huỳnh quang trên chính nucleotide đó hay đánh dấu huỳnh quang trên mồi;
(2) Giai đoạn tiếp gọi là giai đoạn điện di giải trình tự dùng điện di độ phân giải cao (điện di bản gel polyacrylamide hay điện di mao quản) để sắp xếp các đoạn trình
tự dài ngắn khác nhau theo kích thước (ngắn trước, dài sau dù chỉ cách nhau có một nucleotide) và chính nhờ thứ tự này mà biết được thứ tự sắp xếp các nucleotide của
trình tự đoạn DNA được giải trình tự này (Hình 1.11)
Trang 29Ưu điểm: Các bước tiến hành đơn giản, có độ chính xác cao
Nhược điểm: Chỉ đọc được một đoạn trình tự ngắn
Ứng dụng:
Biết được trình tự sắp xếp các nucleotide của một đoạn ADN có thể suy
ra trình tự các axit amin tương ứng trên mạch polypeptide
Xác định đột biến, sự sai khác về trình tự nucleotidetrong cùng một sản phẩm gen, có ý nghĩa trong nghiên cứu tiến hóa và ứng dụng thực tiễn
1.3.2.2 Phương pháp Pyrosequencing
Pyrosequencing khác với giải trình tự Sanger là kỹ thuật giải trình tự phải có hai giai đoạn và giai đoạn giải trình tự được thực hiện sau phản ứng giải trình tự; Trong pyrosequencing, giải trình tự được thực hiện ngay trong giai đoạn tổng hợp sợi DNA bổ sung cho sợi khuôn được giải trình tự, nghĩa là tổng hợp sợi DNA bổ sung đến đâu thì giải trình tự đến đó mà không phải chờ sau khi tổng hợp sợi bổ sung rồi mới đem điện di để giải trình tự Pyrosequencing được Nyrén và Ronaghi tại Viện Kỹ Thuật Hoàng Gia Thụy Điển phát minh năm 1996 (Ronaghi et al., 1996; Ronaghi et al., 1998; Nyrén, 2007) Nguyên tắc của kỹ thuật giải trình tự trong pyrorequencing dựa trên việc nhận biết các pyrophosphate (PPi) được giải phóng trong quá trình gắn nucleotide, tạo ra một tín hiệu ánh sáng, hiệu quả hơn kỹ thuật kết thúc chuỗi bằng dideoxynucleotide.Quá trình giải trình tự diễn ra như sau: đầu tiên deoxynucleotide triphosphates (dNTP) được bắt cặp bổ sung vào sợi khuôn (một sản phẩm PCR sợi đơn) nhờ DNA polymerase sẽ giải phóng một PPi PPi được biến đổi thành ATP nhờ enzyme ATP sulfyrelase cùng với sự tham gia của adenosine 5’ phosphosulfate (APS), sau đó một phản ứng được xúc tác bởi licuferase sẽ biến đổi luciferin thành oxyluciferin, tạo ra ánh sánh nhìn thấy, có độ sáng tương ứng với lượng ATP tạo thành Ánh sáng này được nhận biết bởi một camera và phân tích bởi một chương trình phần mềm
ATP và các nucleotide tự do còn thừa sau mỗi lần bổ sung nucleotide bị hủy nhờ apyrase được cho vào giếng sau khi tín hiệu phát quang được ghi nhận Quá trình này được tiếp tục, các sợi DNA bổ sung được tổng hợp và trình tự các nucleotide được xác định từ các tín hiệu ghi nhận
Trang 30Hình 1.12 Nguyên tắc của kỹ thuật pyrosequencing (Ronaghi et al., 1996)
Ưu điểm:
Với ưu thế thời gian giải trình tự nhanh, trình tự giải được rất chính xác, cường
độ phát quang định lượng được nên dù trình tự giải được không dài (không quá 100 bases) nhưng pyrosequencing cũng có nhiều ứng dụng có ưu thế hơn kỹ thuật giải trình tự Sanger, đặc biệt là trong phát hiện và định lượng các đột biến (Baysal et al.,
Hình 1.13 Các bước thực hiện giải trình tự cơ bản
(Wang et al Nature Reviews Genetics 2009)
Trang 31Về nguyên tắc hoạt động, kỹ thuật giải trình tự thế hệ mới là giải trình tự bằng
tổng hợp (SBS) bao gồm các giai đoạn chính sau đây (Hình 1.14) (Phạm Hùng Vân &
Nguyễn Đỗ Phúc, 2012)
(Nguồn: Phạm Hùng Vân & Nguyễn Đỗ Phúc, 2012)
Hình 1.14 Ba giai đoạn của giải trình tự thế hệ mới (Illumina)
(1) Kỹ thuật tách rời và tóm bắt các mảnh DNA được giải trình tự lên các giá bám; (2) Dùng PCR với mồi đặc hiệu adapter để khuếch đại các mảnh DNA trên giá bám thành từng clone; (3)Thực hiện giải trình tự bằng tổng hợp
(1) Kỹ thuật tách rời và tóm bắt các đoạn DNA được giải trình tự lên các giá bám: Trước hết dùng máy phá mẫu siêu âm cắt DNA bộ gen thành các đoạn DNA ngắn, sau đó các đoạn DNA ngắn này được gắn vào hai đầu các đoạn trình tự ngắn gọi
là adapter (có hai loại: một có trình tự nhận biết bởi các đoạn dò được gắn trên các giá bám, một được nhận biết bởi trình tự mồi PCR) Các đoạn DNA này sẽ được tóm bắt trên các giá bám (vi bản) nhờ các đoạn dò đặc hiệu adapter đã gắn sẵn trên các giá bám này
Trang 32(2) Dùng PCR với mồi đặc hiệu adapter để khuếch đại các đoạn DNA trên giá bám thành từng clone: Nếu giá bám là vi bản thì thuốc thử PCR được bơm lên vi bản
và khi thực hiện PCR sẽ có từng clone sản phẩm khuếch đại được tóm bắt trên các vị trí tách rời nhau trên vi bản; nếu giá bám là các vi hạt thì phải nhũ hoá thuốc thử PCR
để đa số các giọt nhũ là chỉ chứa một vi hạt nhờ vậy mà khi thực hiện PCR mỗi vi hạt
sẽ chỉ có một clone sản phẩm khuếch đại bám lên Sau khi giải bỏ dạng nhũ dịch, các
vi hạt sẽ được bơm vào một bản chíp có chứa hàng chục ngàn đến hàng trăm ngàn giếng kích thước nano gọi là nano - well
(3) Thực hiện giải trình tự bằng tổng hợp: Tín hiệu tổng hợp được ghi nhận sau mỗi lần thổi thuốc thử vào có thể là tín hiệu phát quang dựa trên hệ thống luciferin- luciferase (454 của Roche) (Margulies et al., 2005, Schuster et al, 2008), tín hiệu điện
do thay đổi pH (Ion-Tolent hay Ion-Proton của ABI) (Rusk, 2011), tín hiệu huỳnh quang được đánh dấu trên các nucleotide A,T, C, G (Solexa của Illumina) (Mardis, 2008), hay cũng có thể là tín hiệu huỳnh quang được gắn lên probe (Valouev, 2008)
So sánh phương pháp Sanger và phương pháp giải trình tự thế hệ mới
Hình 1.15 So sánh phương pháp Sanger và giải trình tự thế hệ mới
1.3.2.4 Một số hệ thống giải trình tự thế hệ mới
Giải trình tự thế hệ mới thật sự là một cuộc cách mạng trong công nghệ giải trình
tự nói riêng và trong công nghệ sinh học phân tử nói chung
Với các tiến bộ về thiết bị và thuốc thử, hiện nay giải trình tự bộ gen của một cá thể không còn là nghiên cứu chỉ thực hiện được tại các trung tâm giải trình tự lớn trên
Trang 33thế giới mà có thể được thực hiện tại các phòng thí nghiệm trung bình có thiết bị giải trình tự thế hệ mới như Solid (Applied Biosystem), Illumia (solexa), 454 (Roche)và thời gian để có kết quả không phải kéo dài đến hàng năm mà chỉ trong vài ngày, thậm chí chỉ trong 24 giờ với giá thành không phải đến hàng triệu đô la mà chỉ cần vài ngàn
đô la Đối với giải trình tự bộ gen vi khuẩn hay virus thì giải trình tự thế hệ mới có thể thực hiện được một cách dễ dàng với các thiết bị có công suất nhỏ khoảng 6 GB đến
10 GB chứ không cần đến hàng trăm GB Giải trình tự thế hệ mới là một công cụ để phát hiện được các tác nhân nhiễm trùng vì với khả năng giải được hàng trăm ngàn đoạn DNA có trong mẫu thử thì công nghệ này dễ dàng thực hiện bất cứ một trình tự nucleic acid của bất cứ tác nhân gì có mặt trong mẫu thử lấy từ vật chủ hay bệnh nhân Giải trình tự thế hệ mới cũng là công cụ rất nhạy để có thể phát hiện các đột biến cho
dù tỷ lệ đột biến hiện diện trong mẫu thử là rất thấp, chỉ vài đột biến trong cả một quần thể không đột biến, chính vì vậy giải trình tự thế hệ mới là một công cụ không thể thiếu trong phát hiện và định lượng các đột biến trong ung thư, trong bệnh di truyền
Trang 34bead được giữ trong các giếng picotiter trên một cơ chất dạng sợi và tiến hành giải trình tự
Vào năm 2015, 454 life Sciences cho ra đời máy giải trình tự 454 ứng dụng phương pháp Pyrosequencing và được mua bởi Roche Ban đầu hệ thống Rose 454 giải trình tự được chiều dài đoạn đọc 100 – 150 bp, với hơn 200,000 đoạn đọc và dữ liệu đầu ra là 20 Mb/lần chạy (Mardis, 2008) Năm 2008, hệ thống 454 GS FXL Titanium được nâng cấp với chiều dài đoạn đọc 700 bp độ chính xác 99,9% sau khi lọc và dữ liệu đầu ra là 0,7 GB/lần chạy trong vòng 24 giờ Năm 2009, Rose kết hợp với GS Junior vào hệ thống 454 giúp cho quá trình chuẩn bị thư viện DNA và các dữ liệu đơn giản hơn, đồng thời đầu ra đạt 14 GB/lần chạy (Huse et al., 2007)
Hình 1.17 Các bước PCR nhũ tương (Huse et al., 2007)
Hệ thống giải trình tự Illumina (Solexa)
Đây là phương pháp giải trình tự dựa trên nguyên tắc tổng hợp (Sequencing by Synthesis-SBS) Đầu tiên bộ gen được cắt ngẫu nhiên thành những phân đoạn và được
gắn adapter vào cả hai đầu (Hình 1.18a1) Các đoạn DNA sẽ được tóm tắt trên bề mặt (flow cell) nhờ các đoạn dò đặc hiệu (barcode) đã gắn sẵn trên adapter (Hình 1.18a2)
Chuỗi đơn uốn cong, kết hợp với adapter trên bề mặt tạo thành cầu nối và là sợi khuôn
cho quá trình tổng hợp sợi bổ sung (Hình 1.18a3) Chuỗi đôi DNA được biến tính thành hai chuỗi đơn và quá trình tạo cầu nối được lặp lại (Hình 1.18a4) Kết thúc quá trình khuếch đại, hàng ngàn cụm DNA (cluster) được tạo thành trên bề mặt (Hình
1.18a5) Các nucleotide A, T, G, và C được đánh dấu huỳnh quang bằng 4 màu sắc
Trang 35khác nhau, do đó khi một dNTP được gắn vào chuỗi acid nucleic, tín hiệu phát quang được ghi nhận bởi một thiết bị camera tích điện kép (change – coupled device (CCD) Tuy nhiên, phản ứng chuỗi ở hệ thống này được tiến hành theo từng bước một chứ không liên tục, ở mỗi bước, enzyme polymerase chỉ gắn thêm được 1 nucleotide duy nhất vì nhóm OH ở vị trí 3' của nucleotide vừa được gắn thêm bị khóa Do phản ứng chuỗi dừng lại, nên người ta có thể chụp ảnh để xác định được nucleotide nào vừa được gắn vào Sau mỗi bước, màu gắn vào nucleotide sẽ được loại bỏ để không ảnh hưởng đến quá trình chụp ảnh của các bước tiếp theo, đồng thời nhóm OH ở đầu 3' cũng được
mở khóa để enzyme polymerase có thể gắn thêm nucleotide tiếp theo (Hình 1.18a6),
(Hình 1.18b) Như vậy, mỗi bước sẽ đọc được một nucleotide và quá trình này được lặp
đi lặp lại cho đến hết chiều dài của đoạn DNA cần đọc trình tự (Morozova et al., 2008)
a
b
Hình 1.18 Các bước giải trình tự Illumina (Solexa)
(Morozova, 2008)
Hệ thống giải trình tự SOLiD (Sequencing by oligo ligation detection)
Hệ thống SOLiD được mua lại bởi Applied Biosystems vào năm 2006.Công nghệ giải trình tự SOLiD được thiết kế dựa trên nguyên lý ghép nối, toàn bộ bộ gen được cắt thành các đoạn DNA ngắn, sau đó từng đoạn được gắn với các adapter rồi cố
Trang 36định vào các hạt từ Quá trình giải trình tự được thực hiện thông qua các oligonucleotide được đánh dấu huỳnh quang Đầu tiên các primer được ghép cặp thông qua liên kết bổ sung với các đoạn adapter, quá trình tổng hợp được thực hiện như sau: 4 loại oligonucleotide (mỗi đoạn gồm 8 base) có đánh dấu huỳnh quang được gắn vào các vị trí tiếp theo bắt đầu
từ vị trí 5’P của mồi Sau mỗi một lượt gắn của các đoạn oligonucleotide thì một tín hiệu huỳnh quang được ghi nhận, tiếp đến nhờ hoạt tính của enzyme, các nucleotide bắt đầu
từ số 6 bị loại ra, kèm theo đó nhãn huỳnh quang được loại bỏ để lộ ra vị trí 5’P, quá trình gắn được tiếp tục thực hiện cho tới hết chiều dài của đoạn DNA Kết thúc quá trình thứ nhất, một primer mới tiếp tục được gắn với sợi khuôn ở vị trí tịnh tiến 1 nucleotide
về phía trước so với vị trí gắn của primer đầu tiên và tiếp tục quá trình thu nhận tín hiệu thông qua các phản ứng ghép nối Quá trình được lặp lại 5 lần, mỗi lần sử dụng một mồi mới và tịnh tiến 1 nucleotide về phía trước so với vị trí gắn mồi trước đó
Dữ liệu xuất ra của hệ thống có thể lên tới 60 GB với khoảng hơn 1 tỷ đoạn được đọc sau mỗi lượt chạy Kích thước và độ tin cậy của mỗi đoạn DNA được đánh giá là tương đương so với hệ thống của Illumina, trong khi đó chi phí thiết bị của công nghệ SOLiD thấp hơn đáng kể so với các hệ thống khác cùng thế hệ
trinh-tu-the-he-moi-tong-quan-ve-cac-xu-huong-va-ung-dung.html)
(http://khoahocvacongnghevietnam.com.vn/khcn-trung-uong/15425-cong-nghe-giai-Hệ thống SOLiD đầu tiên ra mắt năm 2007, cho phép giải trình tự được 35 bp độ dài đoạn đọc và dữ liệu đầu ra 3 GB mỗi lần chạy Sau năm lần nâng cấp, hệ thống giải trình tự 5500 XL đã được công bố năm 2010 và độ dài đoạn đọc 85 bp, dữ liệu đầu ra
30 GB mỗi lần chạy trong 7 ngày
Ưu điểm:
Độ dài đoạn đọc lên tới 85 bp, nâng cao độ chính xác lên 99.99% và tạo ra 30
GB mỗi lần chạy trong 7 ngày
Nhược điểm:
Chiều dài đoạn đọc 85 bp của máy SOLiD là phần thiếu sót đáng kể và trong chừng mực giới hạn, nó được sử dụng trong các thử nghiệm để đọc các đoạn ít quan trọng như giải trình tự lại và phân tích phiên mã và gần đây là thí nghiệm ChIP-PCR
và methyl hóa Thời gian chuẩn bị mẫu DNA cho hệ thống SOLiD sẽ nhanh hơn nếu
có thư viện trình tự tự động như hệ thống Tecan
Trang 37Hình 1.19 Sơ đồ biểu diễn các bước SOLID (Mardis et al., 2008)
a Quá trình giải trình tự theo hệ thống SOLiD
b Bảng mã các cặp baze trong hệ thống SOLiD
1.3.3 Tổng quan về phương pháp giải trình tự RAD (Restriction-site Associated DNA)
RADseq (Restriction-site Associated DNA sequencing) là giải trình tự những phân đoạn DNA của bộ gen, được thiết kế để truy vấn 0,1 - 10% bộ gen Bằng cách sử dụng enzyme cắt giới hạn để phân cắt DNA bộ gen thành những phân đoạn ngắn và được gắn các adapter vào 2 đầu thì số lượng lớn các biến thể di truyền như Single Nucleotide Polymorphism (SNP) có thể được xác định (Baird et al., 2008)
Hiện nay phương pháp RAD đang được sử dụng rộng rãi trong các phòng thí nghiệm để giải trình tự và thu thập thư viện gen với nhiều kỹ thuật như mbRAD (Miller and Cribb, 2007; Baird et al., 2008), genotype by sequencing (GBS) (Elshire et al., 2011), 2 - enzyme BGS (Poland et al., 2012), 2b-RAD ( Wang et al., 2012), double
Trang 38digest RAD (ddRAD) (Peterson et al., 2012) và EzRAD (Toonen et al., 2013) Mỗi phương pháp có những ưu nhược điểm khác nhau nên tùy theo yêu cầu thí nghiệm lựa chọn phương pháp thích hợp
Hình 1.20 Nguyên tắc tạo thư viện của RAD (Baird et al., 2008)
(A) Genomic DNA được cắt bới các ezyme giới hạn và gắn P1 adapter vào các đoạn gen P1 adapter chứa các vị trí khuếch đại của mồi xuôi (Forward amplification primer site), trình tự mồi để giải trình tự của hãng Illumina (Illumina sequencing primer sites) và barcode khoảng
4 – 5 bp (các khối màu biểu hiện adapters P1 với các barcode khác nhau)
(B) Đoạn DNA đã được gắn adaptor (Adapter-ligated Frangment) được kết hợp với nhau và lựa chọn kích thước, (C) tiếp tục gắn kết với adapter (P2, khối màu trắng) P2 adapter được phân rã bởi “Y” adapter, chứa đựng trình tự bổ sung của đoạn mồi ngược P2, nhằm ngăn chặn quá trình khuếch đại đoạn gen chưa được gắn adapterP1 (D) RAD tags là đoạn gen đã được gắn adapter P1 và sẽ được khuếch đại
Trang 391.3.3.1 Khác biệt giữa các phương pháp RAD
a Phương pháp RAD cơ bản (mbRAD)
Phương pháp RAD cơ bản được mô tả bởi Miller and Baird (2008) Đầu tiên DNA bộ gen được cắt thành những đoạn ngắn có đầu dính hoặc đầu bằng bởi một enzyme cắt giới hạn Để tiến hành giải trình tự bằng hệ thống Illumina, các phân đoạn này phải được gắn với adapter có liên kết với (flow cell) của Illumina Do đó, những phân đoạn DNA được gắn adapter P1 có cấu trúc gồm trình tự đoạn mồi xuôi và 4 hoặc 5 nucleotide trình tự barcode để nhận dạng mẫu Sau đó, các phân đoạn DNA sau khi gắn adapter được cắt ngẫu nhiên bằng máy phá mẫu siêu âm và chọn phân đoạn có kích thước trên gel tùy mục đích thí nghiệm Adapter P2 được sử dụng làm đoạn mồi cho quá trình khuếch đại khi quá trình kéo dài sử dụng adapter P1 bị thiếu Cuối cùng PCR được sử dụng để khuếch đại những phân đoạn RAD chuẩn bị cho quá trình giải
trình tự (Miller et al., 2007 and Baird et al., 2008) (Hình 1.21)
Hình 1.21: Phương pháp tạo thư viện gen của phương pháp mbRAD
(Miller et al., 2007 and Baird et al., 2008)
b Double Digest RaDseq (ddRAD)
Hình 1.22 Hình thức cắt của enzyme cắt giới hạn trong phương pháp ddRAD (Peterson
et al., 2012)
DNA bộ gen Phân cắt bằng
enzyme cắt Gắn adapter thước trên gel Chọn kích
P2 Phân cắt bằng bộ
phá mẫu siêu âm
Trang 40Phương pháp ddRAD được xây dựng bởi Peterson et al (2012) Đối với phương pháp mbRAD sử dụng một enzyme duy nhất để phân cắt bộ gen DNA ngẫu nhiên thành những phân đoạn và lựa chọn kích thước trong khoảng rộng để tạo nên thư viện gen gồm cả vùng liền kề của vị trí cắt giới hạn, trong khi đó phương pháp ddRAD
sử dụng cả hai enzyme cắt giới hạn, sau đó vùng kích thước được chọn không bao gồm những vùng nằm rất gần (a) hoặc quá xa (b) điểm nhận biết của enzyme cắt giới hạn
Do đó thư viện gen chỉ bao gồm những phân đoạn gần với kích thước mong muốn
c Phương pháp 2b - RAD (2b-Restriction-site Associated DNA)
Hình 1.23 Các bước giải trình tự và tạo thư viện gen của phương pháp 2bRAD (Wang
et al., 2012)
Phương pháp này sử dụng enzyme cắt giới hạn loại IIb để phân cắt DNA bộ gen, do đó được gọi tên là 2b - RAD (Wang et al., 2012) Những enzyme này có vùng nhận biết thường bị ngắt quãng, khoảng 5 - 7 bp và chúng tạo ra được những phân đoạn DNA có kích thước 21-33 bp (Tengs et al., 2004) Quá trình tạo thư viện gen từ
phương pháp 2b - RAD được thể hiện ở (Hình 1.24), enzyme cắt giới hạn được sử
dụng là BsaXI, vùng nhận biết là (9/12)ACNNNNNCTCC (10/7) Về phía trước vùng nhận biết, vị trí cắt của enzyme này cách vùng nhận biết 9 bp ở mạch gốc và 12 bp ở mạch bổ sung, tương tự, về phía sau vùng nhận biết, vị trí cắt cách 10 bp ở mạch gốc
và 7 bp ở mạch bổ sung