Các dehydrin được xếp vào nhóm II của họ LEA. Chúng đóng vai trò quan trọng trong việc bảo vệ tế bào. Trong công trình này, nhờ sử dụng các phương pháp nghiên cứu in silico, chúng tôi đã xác định được một gen DHN của cây sồi Nhật Bản từ tập hợp các EST của loài này.
Trang 1XÁC ĐỊNH GEN Dehydrin KIỂU SKn
BẰNG PHƯƠNG PHÁP IN SILICO
Cao Phi Bằng
Trường Đại học Hùng Vương
Tóm TắT
Các dehydrin được xếp vào nhóm II của họ LEA Chúng đóng vai trò quan trọng trong việc bảo vệ
tế bào Trong công trình này, nhờ sử dụng các phương pháp nghiên cứu in silico, chúng tôi đã xác định được một gen DHN của cây sồi Nhật Bản từ tập hợp các EST của loài này Kết quả phân tích các motif bảo thủ cũng như phân tích cây phả hệ đã chỉ ra rằng gen này thuộc về nhóm SKn FcDHN có tính axit
và có độ ưa nước cao Nghiên cứu xây dựng mô hình 3D cho thấy protein FcDHN có cấu trúc xoắn a lưỡng cực, cấu trúc có vai trò rất quan trọng đối với cơ chế bảo vệ tế bào của các dehydrin.
Từ khóa: Dehydrin (DHN), Fagus cretana, đặc điểm của gen, xác định gen, in silico, cây phả hệ.
1 mỞ ĐẦU
Cây sồi Nhật Bản (Fagus crenata) là loài cây ưu thế đồng thời cũng thường là loài tạo nên phần lớn sinh khối trong các khu rừng cây lá rụng thuộc vùng khí hậu ôn đới của Nhật Bản (Takahashi
et al., 2.000; Masaki et al., 2008) Hơn nữa, các khu rừng sồi Nhật Bản giúp bảo vệ đất rừng cũng
như duy trì đa dạng sinh học (Watanabe et al., 2012).
Dehydrin (DHN) mã hóa các protein thuộc nhóm II của họ Late Embryogenesis Abundant
protein (LEA) (Close, 1996) DHN đóng vai trò rất quan trọng trong sự trả lời thích nghi của thực vật với các điều kiện bất lợi của môi trường, đặc biệt là vai trò bảo vệ tế bào trong quá trình mất
nước (Rorat, 2006; Hanin et al., 2011) Các protein DHN được cho là có vai trò quan trọng đối với các chồi ngủ và quá trình luyện lạnh của cây gỗ (Rorat, 2006; Rinne et al., 2010).
Các DHN có khối lượng phân tử biến đổi trong một phạm vi rộng trong khoảng 9-200kD, chúng được đặc trưng bởi sự có mặt của ít nhất một trình tự bảo thủ giàu lysine gồm có 15 amino axit,
EKKGIM (E/D)KIKEKLPG, có tên là phân mảnh K (Rorat, 2006; Hanin et al., 2011) Các DHN
cũng có thể có các motif đặc trưng khác là phân mảnh Y giàu tyrosine ( (V/T)D (E/Q)YGNP) và phân mảnh S giàu serine (được hình thành từ tập hợp 4-10 serine) Dựa vào cấu trúc, các DHN có
thể được chia thành năm phân nhóm cấu trúc: Kn, SKn, KnS, YnKn và YnSKn (Allagulova et
al., 2003; Rorat, 2006) Gần đây, phân nhóm SKS lần đầu tiên được báo cáo ở cây sồi (Liu et al.,
2012)
Nhiều nghiên cứu đã được thực hiện để khám phá cấu trúc và chức năng của các DHN ở các
thực vật thân cỏ kiểu mẫu như Arabidopsis (Hundertmark & Hincha, 2008) và gần đây ở một số cây thân gỗ như nho (Yang et al., 2012), sồi (Liu et al., 2012).
Với vai trò đặc biệt quan trọng trong việc bảo vệ tế bào và sự cảm ứng mạnh bởi các điều kiện bất lợi vô sinh cũng như hữu sinh, các DHN được coi là chỉ thị phân tử của tính chống chịu với các
Trang 2điều kiện bất lợi của môi trường ở thực vật (Hanin et al., 2011) Trong nghiên cứu này, chúng tôi
hướng tới xác định trình tự của một DHN của cây sồi Nhật Bản Các đặc trưng vật lý và hóa học của các protein, kết quả phân tích cây phả hệ cũng như sự biểu hiện của các gen sẽ được giới thiệu trong công trình này
2 PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Cơ sở dữ liệu
Tập hợp các EST (Expressed Sequence Tags) của loài cây này được tải về từ trang web NCBI (http://www.ncbi.nlm.nih.gov/nucest/?term= txid28930 [Organism:exp]) Các trình tự DHN của
cây Arabidopsis được lấy từ Hundertmark và Hincha (2008).
2.2 Xác định các gen DHN ở cây sồi Nhật Bản
Các protein DHN của cây Arabidopsis (Hundertmark & Hincha, 2008) được dùng làm khuôn
dò, chương trình TBLASTN được sử dụng để tìm kiếm các gen tương đồng trên dữ liệu EST của
cây sồi Nhật Bản trên NCBI (Fagus crenata (taxid:28929)) với giá trị e-value ở mức e-5 để tránh
sai sót Chương trình CAP3 Sequence Assembly Program được dùng để lắp ráp các dữ liệu EST của cây sồi Nhật Bản được lựa chọn (http://doua.prabi.fr/software/cap3) (Huang & Madan, 1999)
Pfam (cơ sở dữ liệu các họ protein, (Bateman et al., 2004)) được sử dụng để xác nhận sự hiện diện
của các vùng bảo thủ trong cấu trúc protein của các ứng viên DHN
2.3 Xác định các motif bảo thủ
Các protein DHN của cây sồi Nhật Bản và của cây Arabidopsis được sắp dãy bằng cách sử dụng
phần mềm MEME (Multiple Expectation Maximization for motif Elicitation) phiên bản trực tuyến
(Version 4.9.1) (Bailey et al., 2006).
2.4 Tạo cây phả hệ
Các trình tự protein DHN nghiên cứu được sắp dãy bằng cách dùng phần mềm MAFFT, phiên bản trực tuyến (version 7) với các cài đặt mặc định (Katoh & Standley, 2013) Cây phả hệ được xây dựng từ các trình tự protein DHN đã sắp dãy nhờ phần mềm MEGA5 nhờ sử dụng phương pháp Maximum Likelihood và tuân theo các tham biến: mẫu Jones-Taylor-Thornton (JTT), dữ liệu
được xử lý là tất cả các vị trí và phương pháp Bootstrap với 1.000 lần lặp lại (Tamura et al., 2011).
2.5 Các đặc điểm hóa - lý và cấu trúc không gian
Các đặc điểm vật lý, hóa học của protein nghiên cứu được khảo sát nhờ các phần mềm của
ExPASy (Expert Protein Analysis System; (Gasteiger et al., 2005)).
Cấu trúc không gian của phân tử protein được xây dựng nhờ sử dụng phần mềm Phyre2 (Kelley
& Sternberg, 2009)
3 KẾT QUẢ VÀ THẢO LUẬN
3.1 Xác định gen DHN ở cây Sồi Nhật Bản
Bảng 1 Dehydrin của cây sồi Nhật Bản và đặc điểm của chúng
Trang 3Tập hợp các EST của cây sồi Nhật Bản được tìm kiếm với các protein DHN khuôn dò của cây
Arabidopsis nhờ sử dụng chương trình TBLASTN Bước đầu chúng tôi xác định được một gen
có thể mã hóa cho các DHN (Bảng 1) Kết quả phân tích vùng bảo thủ nhờ sử dụng Pfam chỉ ra FcDHN có chứa vùng bảo thủ Dehydrin (PF00257) Protein này được dùng làm khuôn để tìm các protein tương đồng ở các loài khác (paralogs) có trong cơ sở dữ liệu của NCBI, kết quả được trình bày ở bảng 2 Phép kiểm tra này khẳng định FcDHN tìm được thuộc họ dehydrin
Bảng 2 Các paralogs gần nhất với các FsDHN có trong cơ sở dữ liệu của NCBI Các protein này được tìm thấy nhờ sử dụng chương trình BLASTP trong cơ sở dữ liệu ‘non-redundant protein sequences (nr)’ ở tất cả sinh vật màu lục (Viridiplantae (taxid:33090))
miêu tả trên NCBI cực đại Chỉ số Chỉ số tổng mức độ so sánh E-value Giá trị tương đồng mức độ Genbank Kí hiệu
Dehydrin protein [Manihot
Dehydrin [Citrus sinensis]
>gb|AAP56259.1| dehydrin
PREDICTED:
phosphoprotein ECPP44
Hypothetical protein
CICLE_v10002349mg
[Citrus clementina]
> gb|ESR48553.1|
hypothetical protein
CICLE_v10002349mg
[Citrus clementina]
Dehydrin [Camellia
Dehydrin [Populus
Dehydrin [Populus
Dehydrin 8 [Malus
3.2 Đặc điểm của dehydrin của cây sồi Nhật Bản
Các DHN của cây sồi Nhật Bản có có độ dài 188 amino axit, tương ứng với khối lượng phân
tử 22,1 kD FcDHN có điểm đẳng điện (pI) bằng 5,39; đồng thời, FcDHN có tính ưa nước cao với giá trị GRAVY bằng -1,691 (bảng 1) Các kết quả này cũng phù hợp với báo cáo về các DHN của
nhiều loài khác (Rorat, 2006; Hanin et al., 2011; Liu et al., 2012).
Trang 43.3 Xác định các motif bảo thủ, phân tích cây phả hệ và phân loại các FsDHN
Kết quả phân tích motif bảo thủ bằng phần mềm MEME cho thấy, chỉ hai vùng bảo thủ của các dehydrin là phân mảnh K (trình tự KKG[IF]MEKIK[ED]KLPG[HG], hình 1A) và phân mảnh
S (LHRS[GDN]SSSSSSS[ED][ED][ED], hình 1B) có mặt ở FcDHN Ngược lại, FcDHN không
chứa phân mảnh Y vốn hiện diện ở nhiều DHN đã được biết (Hanin et al., 2011) Từ đó, có thể
đặt giả thuyết rằng ở cây sồi Nhật Bản có thể còn có các DHN khác và cần có những nghiên cứu
bổ sung để tìm ra chúng
Hình 1: Biểu tượng trình tự axit amin của phân mảnh K (A) và phân mảnh S (B)
Cây phả hệ được thiết lập từ các protein DHN của cây sồi Nhật Bản và cây Arabidopsis được
thể hiện ở hình 2 FcDHN nằm cùng nhánh với ba protein khác của cây Arabidopsis là At1G76180, At1G20440, At1G20450 và At4G38410 trong cây phả hệ Đây là những dehydrin thuộc phân
nhóm KnS của cây Arabidopsis Kết hợp phân tích cây phả hệ và phân tích motif bảo thủ chúng ta
có thể xếp FcDHN này thuộc nhóm SKn, nhóm chỉ có các phân mảnh bảo thủ thuộc S và K, trong
đó phân mảnh K nằm ở đầu tận cùng Carboxyl của phân tử protein
Hình 2: Cây phả hệ được xây dựng từ các dehydrin của cây sồi Nhật Bản và cây Arabidopsis
Trang 53.4 Cấu trúc không gian của các dehydrin của cây sồi Nhật Bản
Hình 3 Mô hình 3D cấu trúc bậc hai của các dehydrin
của cây sồi châu Âu
Cấu trúc không gian của các protein FcDHN được xây dựng nhờ chương trình Phyr2 (hình 3) Kết quả chỉ ra phân tử này có 5 cấu trúc xoắn a lưỡng cực Cấu trúc xoắn a lưỡng cực này rất phổ biến ở các DHN của các loài khác, đảm bảo cho các DHN có khả năng tương tác với các phân tử protein khác hay các màng sinh học Nhờ cấu trúc này mà các phân tử dehydrin thể hiện được chức
năng bảo vệ tế bào (Rorat, 2006; Hanin et al., 2011).
4 KẾT LUẬN
Trong công trình này chúng tôi đã xác định được một gen DHN của cây sồi Nhật Bản dựa trên ngân hàng EST của loài cây này Kết quả phân tích cây phả hệ cũng như các motif bảo thủ chỉ ra FcDHN thuộc nhóm SKn Protein này có kích thước 188 amino axit và khối lượng 22,1kD, có tính axit, ái lực nước cao FcDHN có 5 cấu trúc xoắn a lưỡng cực đặc trưng của các DHN Đây là những kết quả bước đầu có ý nghĩa quan trọng, đặc biệt khi hệ gen của cây sồi Nhật Bản chưa được giải trình tự, mở đường cho việc nghiên cứu chức năng của các DHN ở loài cây này
Tài liệu tham khảo
1 Allagulova CR, Gimalov FR, Shakirova FM, Vakhitov VA (2003) The plant dehydrins:
Structure and putative functions Biochemistry-Moscow 68 (9): 945-951.
2 Bailey TL, Williams N, Misleh C, Li WW (2006) MEME: discovering and analyzing DNA
and protein sequence motifs Nucleic acids research 34 (suppl 2): W369-W373.
3 Bateman A, Coin L, Durbin R, Finn RD (2004) The Pfam protein families database Nucleic
Acids Res 32: D138-D141
4 Close TJ (1996) Dehydrins: Emergence of a biochemical role of a family of plant dehydration
proteins Physiologia Plantarum 97 (4): 795-803.
5 Gasteiger E, Hoogland C, Gattiker A, Wilkins MR, Appel RD, Bairoch A (2005) Protein
identification and analysis tools on the ExPASy server The proteomics protocols handbook:
Springer, 571-607
6 Hanin M, Brini F, Ebel C, Toda Y, Takeda S, Masmoudi K (2011) Plant dehydrins and
stress tolerance: versatile proteins for complex mechanisms Plant Signaling & Behavior 6 (10):
1503-1509
Trang 67 Huang X, Madan A 1999 CAP3: A DNA sequence assembly program Genome Res 9 (9):
868-877
8 Hundertmark M, Hincha DK (2008) LEA (late embryogenesis abundant) proteins and their
encoding genes in Arabidopsis thaliana BMC genomics 9 (1): 118.
9 Katoh K, Standley DM (2013) MAFFT multiple sequence alignment software version 7:
improvements in performance and usability Mol Biol Evol 30 (4): 772-780.
10 Kelley LA, Sternberg MJ (2009) Protein structure prediction on the Web: a case study
using the Phyre server Nat Protoc 4: 363-371.
11 Liu CC, Li CM, Liu BG, Ge SJ, Dong XM, Li W, Zhu HY, Wang BC, Yang CP (2012)
Genome-wide Identification and Characterization of a Dehydrin Gene Family in Poplar (Populus trichocarpa) Plant Molecular Biology Reporter 30 (4): 848-859.
12 Masaki T, Oka T, Osumi K, Suzuki W (2008) Geographical variation in climatic cues for
mast seeding of Fagus crenata Population Ecology 50 (4): 357-366.
13 Rinne PLH, Welling A, van der Schoot C (2010) Perennial life style of Populus: dormancy
cycling and overwintering Genetics and Genomics of Populus: Springer, 171-200.
14 Rorat T (2006) Plant dehydrins - Tissue location, structure and function Cellular &
Molecular Biology Letters 11 (4): 536-556
15 Takahashi M, Mukouda M, Koono K (2.000) Differences in genetic structure between two
Japanese beech (Fagus crenata Blume) stands Heredity 84 (1): 103-115.
16 Tamura K, Peterson D, Peterson N, Stecher G, Nei M, Kumar S (2011) MEGA5: molecular
evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods Mol Biol Evol 28 (10): 2731-2739.
17 Watanabe M, Yamaguchi M, Matsumura H, Kohno Y, Izuta T (2012) Risk assessment
of ozone impact on Fagus crenata in Japan: consideration of atmospheric nitrogen deposition
European Journal of Forest Research 131 (2): 475-484
18 Yang Y, He M, Zhu Z, Li S, Xu Y, Zhang C, Singer SD, Wang Y (2012) Identification of
the dehydrin gene family from grapevine species and analysis of their responsiveness to various forms of abiotic and biotic stress BMC Plant Biol 12: 140.
SUMMARY
IDENTIFICATION OF SKn-type Dehydrin GENE FROm JAPANESE BEACH (Fagus crenata Blume) By in silico mETHOD
Cao Phi Bang
Hung Vuong University
Dehydrins belong to groupe II of LEA family They play an important role in the cell protection
In this work, we utilized in silico approach to identify and analyze a dehydrin gene from japanese beach from EST collection Based on the phylogenetic tree and the conserved motifs, this dehydrin
is classified into the SKn groupe FcDHN is acidic and high hydrophilic Its predicted 3D modeling structure presents 5 amphipathic a-helices that play an impotant role in cell protection.
Keywords: Dehydrin (DHN), Fagus cretana, gene characters, gene identification, in silico,
phylogenetic tree.