Đồ án công nghệ ( Khoa Hóa) ĐHBK Đà Nẵng ..........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
Trang 1kiếm các thay đổi này trong protein của virus covid-19.
Mục lục
DANH SÁCH CÁC BẢNG, HÌNH VẼ 1
MỞ ĐẦU 2
Chương 1: TỔNG QUAN TÀI LIỆU 3
1.1 Covid-19 3
1.1.1 Nguồn gốc, sự phát hiện 3
1.1.2 Đặc điểm cấu tạo 3
1.1.3 Đặc điểm dịch tể 4
1.1.4 Thống kê số liệu về Covid-19 4
1.2 Sự thay đổi sau dịch mã 6
1.2.1 Định nghĩa dịch mã 6
1.2.3 Vai trò của protein 7
1.2.4 Điều khiển sau dịch mã 8
1.2.5 Các cách nghiên cứu về sự thay đổi sau dịch mã 11
1.2.6 Các công cụ tin sinh học trong nghiên cứu thay đổi sau dịch mã 11
1.2.7 Ý nghĩa của việc nghiên cứu thay đổi sau dịch mã 12
CHƯƠNG 2: ỨNG DỤNG TIN SINH HỌC TÌM KIẾM THAY ĐỔI SAU DỊCH MÃ 13
2.1 Vật liệu 13
2.1.1 Trình tự protein 13
2.1.2 Công cụ 13
2.2 Phương pháp tìm kiếm 13
2.2.1 Phương pháp tìm kiếm Fatty Acylation 13
2.2.2 Phương pháp tìm kiếm Phosphorylation 21
2.2.2 Phương pháp tìm kiếm Glycosylation 26
KẾT LUẬN 27
TÀI LIỆU THAM KHẢO 28
Trang 2kiếm các thay đổi này trong protein của virus covid-19.
DANH SÁCH CÁC BẢNG, HÌNH VẼ
Hình 1.1 Các triệu chứng của 2019 – nCoV
Hình 1.2 Biểu đồ thể hiện tổng số ca nhiễm, số ca khỏi bệnh và đang điều trị
Hình 1.3 10 quốc gia và vùng lãnh thổ ghi nhận nhiều trường hợp nhiễm bệnh nhấthiện nay
Trang 3kiếm các thay đổi này trong protein của virus covid-19.
MỞ ĐẦU
Protein là thành phần thiết yếu của cơ thể sinh vật, tham giavào mọi quá trinh bên trong tế bào Tuy nhiên vai trò của proteinchưa thực sự thể hiện sau quá trinh dịch mã Các thay đổi sau dịch
mã của protein đóng vai trò quan trọng trong việc xác định chứcnăng cụ thể cho từng loại protein khác nhau Nghiên cứu sau dịch
mã hiện nay chủ yếu tập trung bằng các công cụ tin sinh học Tinsinh học cung cấp các công cụ cho phép phân tích, tìm kiểm cácthay đổi sau dịch mã của protein một cách hiệu quả, nhanh chóng,đặc biệt với các protein mới và khó tiếp cận như các protein củacovid 19 Hiện nay chúng ta đang phải hết minh nổ lực chống lại đại
dịch toàn cầu do virus Covid-19 gây ra Vì vậy, việc xác định thay đổi protein sau dịch mã của virus Covid-19 đóng vai trò quan trọng
nghiên cứu cách thức hoạt động và điều trị các bệnh do virus nàygây ra
Trong tập đồ án này, tôi sẽ trình bày tổng quan về tình hìnhdịch bệnh do covid gây, ra, các vần đề lí thuyết về biến đổi sau dich
mã Đồng thời, kết quả tìm kiếm các thay đổi sau dich mã củaprotein từ covid bằng công cụ tin sinh học cũng được thể hiện
Trang 4kiếm các thay đổi này trong protein của virus covid-19.
Chương 1: TỔNG QUAN TÀI LIỆU
1.1 Covid-19.
1.1.1 Nguồn gốc, sự phát hiện.
Dịch bệnh do virus Covid-19 gây ra bắt đầu xuất hiện từ cuối tháng 12 năm
2019, được ghi nhận đầu tiên ở thành phố Vũ Hán, thuộc tỉnh Hồ Bắc, miền namTrung Quốc Nguyên nhân ban đầu được cho là do giết hại các loài đông vật hoang dã,
mà cụ thể là dơ tại chợ hải sản Hoa Nam Tuy nhiên, đến hiện nay nguồn gốc của loạivirus này vẫn đang gây tranh cãi
Virus Covid-19 là chủng thứ bảy trong họ Coronavirus, được biết đến chủ yếu
gây ra các bệnh ở động vật, nhưng đã tiến hóa và lây nhiễm sang người [1]
1.1.2 Đặc điểm cấu tạo.
Coronavirus là một nhóm gồm các loại virus thuộc phân họ Coronavirinae
trong họ Coronaviridae, theo bộ Nidovirales Coronavirus gây bệnh ở các loài động
vật có vú, bao gồm cả con người và chim
Phân họ Coronavirus được phân loại thành bốn chi: Alpha, Beta, Gamma và Delta Coronavirus Nhìn chung, Alphacoronaviruses và Betacoronaviruses có thể lây nhiễm cho động vật có vú trong khi đó Gammacoronaviruses và Deltacoronaviruses
lây nhiễm cho chim, nhưng một số trong chúng cũng có thể lây nhiễm ở động vật cóvú
Các Coronavirus là các RNA virus có kích thước trung binh, có tên bắt nguồn
từ hình dạng giống như vương miện đặc trưng của chúng (Corona trong tiếng La tinhnghĩa là vương miện) Những virus này có bộ gen lớn nhất được biết đến trong họRNA virus, với chiều dài từ 27 đến 32kb Bộ gen cấu trúc gồm 4 hoặc 5 loại proteincấu trúc: S, M, N, HE, E
- Protein spike (S) tạo thành các gai đặc trưng trong “vương miện”
coronavirus Nó bị glycosyl hóa mạnh, có thể tạo thành một homotrimer, và là
receptor giúp gắn và hợp nhất với màng tế bào vật chủ Các thành phần của protein S
là kháng nguyên chính kích thích kháng thể trung hòa, cũng như là mục tiêu quan
trọng của tế bào lympho gây độc tế bào.
- Protein M đóng vai trò quan trọng trong sự lắp ráp virus
- Protein nucleocapsid (N) liên kết với bộ gen RNA để tạo thànhnucleocapsid Nó có thể tham gia vào quá trình điều hòa tổng hợp RNA của virus và
có thể tương tác với protein M trong quá trình nảy chồi của virus
Trang 5kiếm các thay đổi này trong protein của virus covid-19.
- Protein nucleocapsid (N) liên kết với bộ gen RNA để tạo thànhnucleocapsid Nó có thể tham gia vào quá trình điều hòa tổng hợp RNA của virus và
có thể tương tác với protein M trong quá trình nảy chồi của virus
- Protein E: Chức năng của nó không được biết đến, mặc dù, trong CoV, protein E cùng với M và N là cần thiết để lắp ráp và giải phóng virus
SARS-1.1.3 Đặc điểm dịch tể.
Người bị nhiễm bệnh do virus Covid-19 gây ra thường có các biểu hiện: sốt,
mệt mỏi, ho khan, khó thở, suy hô hấp và có thể dẫn đến tử vong Trong thời giannhiễm bệnh, lượng bạch cầu trong máu giảm Thời gian ủ bệnh có thể kéo dài từ 2 đến
14 ngày trước khi biểu hiện ra các triệu chứng cụ thể thông qua tiếp xúc trực tiếp vớigiọt bắn ra từ đường hô hấp người bị nhiễm bệnh hoặc gián tiếp qua tiếp xúc với cácchất tiết của người bệnh qua đồ vật, môi trường xung quanh Miễn dịch phát triển ngaysau khi bị nhiễm trùng nhưng dần dần mất đi theo thời gian Tái nhiễm là phổ biến, có
lẽ là do sự tạo thành đáp ứng miễn dịch yếu, cũng có thể là do biến đổi kháng nguyêntrong loài
Những đánh giá ban đầu của tạp chí Bloomberg NY ngày22/1/2020 cho thấy đa số các bệnh nhân nhiễm SARS-CoV-2 tử vong
là nam giới và tuổi trung bình của nhóm bệnh nhân tử vong là 72tuổi, trong số này có đến 83% bệnh nhân tử vong là trên 65 tuổi.Trong số những bệnh nhân tử vong có tới 50% bệnh nhân mắc cácbệnh mạn tính kèm theo Như vậy, dựa vào các thống kê có được,chúng ta có thể nói là những người lớn tuổi, có bệnh mạn tính, hệmiễn dịch yếu là những người có nguy cơ tử vong cao nhất vì bệnh
Covid-19 [2]
Hình 1.1 Các triệu chứng của 2019 n-CoV
Trang 6kiếm các thay đổi này trong protein của virus covid-19.
1.1.4 Thống kê số liệu về Covid-19.
Ca nhiễm Covid-19 đầu tiên ở Việt Nam được ghi nhận vào ngày 23 tháng 1
năm 2020 Tính đến thời điểm hiện tại, ngày 20 tháng 4 năm 2020 Việt Nam đã ghinhận 268 ca nhiễm, trong đó đã điều trị khỏi bệnh 214 người, và chưa ghi nhận trường
hợp tử vong nào [1] Trong đó 29 tỉnh thành ở Việt Nam đã có ca nhiễm.
Hình 1.2 Biểu đồ thể hiện tổng số ca nhiễm, số ca khỏi bệnh và đang điều trị
Từ ca nhiễm đầu tiên ở thành phố Vũ Hán, tỉnh Hồ Nam, Trung Quốc, số ca
nhiễm Covid-19 tăng không kiểm soát, tinh đến nay đã ghi nhận 2.402.076 ca nhiễm
bệnh, trong đó có 623.911 ca đã điều trị thành công, tuy nhiên có đến 165.106 người
tử vong trong đại dịch này Có 228 quốc gia và vùng lãnh thổ đã xác nhận có ca nhiễmbệnh
Trang 7kiếm các thay đổi này trong protein của virus covid-19.
Trang 8kiếm các thay đổi này trong protein của virus covid-19.
Hình 1.3 10 quốc gia và vùng lãnh thổ ghi nhận nhiều trường hợp nhiễm bệnh nhấthiện nay
Địa điểm Xác nhận Tử vong HồiphụcTổng quốc
gia và vùng lãnh thổ
2.402.0 76
165.1 06
623.9 11 Hoa Kỳ 764.177 40.591 70.172 Tây Ban Nha 198.674 21.238 77.357
vương quốc Anh 120.067 16.060 0 Pháp 112.606 19.718 36.578 Thổ Nhĩ Kỳ 86.306 2.107 11.976 Trung Quốc đại
1.2 Sự thay đổi sau dịch mã.
1.2.1 Định nghĩa dịch mã.
Thông tin di truyền được dịch thành các trinh tự các amino acid có bản chất hóahọc và kiểu liên kết khác nhau
Các sản phẩm phiên mã được dịch mã ở các mức độ khác nhau
Sản phẩm dịch mã có cấu trúc và chức năng đa dạng
Protein không bên vững và bị phá hủy sau một thời gian nhất định
Trang 9kiếm các thay đổi này trong protein của virus covid-19.
Hệ thống thông tin sử dụng rất nhiều protein post-translational modification đểchuyển thông tin trong suốt lộ trình tín hiệu Cơ chế cơ bản là khi chất kích thích hoạthóa thành phần A, thành phần A này sau đó sẽ hoạt động trên thành phần B để tạo ra
sự biến đổi cấu trúc trong suốt sự điều chỉnh Sự điều chỉnh này thực hiện chức năngtruyền tin của nó và thông thường rất chuyên biệt do vậy nó trực tiếp thay đổi cấu trúccác tiểu phân amino acid trên protein bằng các cách sau đây:
1.2.2 Cấu trúc không gian protein
Chuỗi polypeptide sau khi dịch mã tiếp tục biến đổi theo nhiều con đường đểhình thành nên hình dạng 3D và ở kết quả của giai đoạn cuộn gập protein (proteinfolding) thành những cấu trúc 3 chiều xác định lên chức năng của nó Cấu trúc proteinđược phân chia thành 4 cấp:
- Cấu trúc sơ cấp hay cấu trúc bậc 1: Là trình tự sắp xếp các gốc axit aminotrong chuỗi polypeptide Cấu trúc này được giữ vững nhờ liên kết peptide (liên kếtcộng hóa trị) Một protein là polyamide (poliamit)
- Cấu trúc bậc 2: Là tương tác không gian giữa các gốc axit amino ở gần nhautrong chuỗi polypeptide Cấu trúc được bền vững chủ yếu nhờ liên kết hiđrô hìnhthành giữa các liên kết peptide ở kề gần nhau, cách nhau những khoảng xác định Cấutrúc bậc 2 của phân tử protein là xoắn α (α-helix), phiến gấp nếp β (β-sheet) và cácvùng chuyển hướng Bởi vì cấu trúc bậc 2 mang tính cục bộ, nhiều vùng với các cấutrúc bậc 2 khác nhau có thể tồn tại trong cùng một phân tử protein
- Cấu trúc bậc 3: hình dạng tổng thể của một phân tử protein đơn nhất; hay mốiquan hệ không gian giữa các cấu trúc bậc 2 với nhau Nói chung cấu trúc bậc 3 đượcgiữ ổn định bởi các tương tác phi cục bộ, phần lớn bởi sự hình thành một lõi kị nước(hydrophobic core), và ngoài ra giữ bởi các cầu muối (salt bridge), liên kết hiđrô, liênkết disulfide, và thậm chí là các chỉnh sửa sau dịch mã (post-translationalmodification) Thuật ngữ "cấu trúc bậc 3" thường được sử dụng mang nội dung đồngnghĩa với thuật ngữ uốn gấp Cấu trúc bậc 3 kiểm soát chức năng cơ bản của protein
- Cấu trúc bậc 4: cấu trúc hình thành bởi một số phân tử protein liên kết vớinhau (chuỗi polypeptide), mà hay gặp thuật ngữ tiểu đơn vị protein trong trường hợpnày, mà chức năng của cấu trúc bậc 4 hoạt động như một phức hợp protein
1.2.3 Vai trò của protein.
- Protein là thành phần thiết yếu của cơ thể sinh vật và tham gia vào mọi quátrình bên trong tế bào Nhiều protein là những enzyme làm chất xúc tác cho các phảnứng hóa sinh và cần thiết cho trao đổi chất
- Protein cũng có chức năng làm cấu trúc hoặc vận động, như actin và myosin ở
cơ và protein trong bộ khung tế bào, tạo nên hệ thống các khung đỡ giúp duy trì hìnhdáng nhất định của tế bào
- Các protein khác tham gia vào tín hiệu tế bào, đáp ứng miễn dịch, kết dính tếbào, và chu kỳ tế bào, điều hòa các hoat động sinh lý Hormone insulin và glucagon do
Trang 10kiếm các thay đổi này trong protein của virus covid-19.
tế bào đảo tụy (beta cell) thuộc tuyến tụy tiết ra có tác dụng điều hòa hàm lượng đườngglucose trong máu động vật có xương sống
- Ngoài ra còn tham gia vào quá trinh vận chuyển các chất Ví dụ như huyết sắc
tố hemoglobin có chứa trong hồng cầu động vật có xương sống có vai trò vận chuyểnoxy từ phổi đi theo máu nuôi các tế bào
- Bảo vệ cơ thể chống bệnh tật
- Dự trữ chất dinh dưỡng
- Ở động vật, protein cần thiết phải có trong bữa ăn để cung cấp các axit aminthiết yếu mà không thể tổng hợp Quá trình tiêu hóa làm gãy các protein để sử dụngtrong trao đổi chất
1.2.4 Điều khiển sau dịch mã.
Chuỗi peptide được giải phóng bởi ribosome không phải là phân tử protein cóchức năng sinh học, cần phải qua quá trình xử lý mới mang hoạt tính sinh học Sửachữa chuỗi peptide bao gồm hình thành cấu trúc cao cấp, kết hợp với các tiểu đơn vị,sửa đổi giá trị chung
Protein sau quá trình sinh tổng hợp có nhiều dạng, trong đó dạng chính là dạngcắt và sửa chữa hóa học Yếu tố ảnh hưởng đến dịch mã protein tạo thành một khâutrong biểu hiện gen
1, Sửa đổi hóa học dư lượng axit amin trong chuỗi peptide
Hệ thống thông tin sử dụng rất nhiều protein post-translational modification để chuyển thông tin trong suốt lộ trình tín hiệu Cơ chế cơ bản là khi chất kích thích hoạt hóa thành phần A, thành phần A này sau đó sẽ hoạt động trên thành phần B để tạo ra
sự biến đổi cấu trúc trong suốt sự điều chỉnh Sự điều chỉnh này thực hiện chức năng truyền tin của nó và thông thường rất chuyên biệt do vậy nó trực tiếp thay đổi cấu trúc các tiểu phân amino acid trên protein bằng các cách sau đây:
- Phosphoryl hóa protein:
Protein kinase và phosphatase biến đổi hoạt tính của protein bằng cách gắn
hoặc loại bỏ góc phosphate Tế bào biểu hiện một lượng khổng lồ các protein kinase đáp ứng cho các thành phần tín hiệu như là một cơ chế truyền tin chính Trong một vàitrường hợp, các kinase có thể phosphoryl hóa lẫn nhau để tạo ra một dòng thác tín
hiệu Ví dụ kinh điển cho trường hợp này là lộ trình tín hiệu MAPK Các kinase được chia thành hai nhóm chính phụ thuộc vào tiểu phân amino acid nó phosphoryl hóa gồmcó: Tyrosine kinase và serine/threonine kinase Những kinase này có nhiều hình dạng khác nhau và đều là một thành phần chức năng không thể thiếu của các thụ thể trên màng tế bào Ngoài ra, các kinase không phụ thuộc thụ thể cũng có tác dụng trong
nhiều vùng khác nhau của tế bào
Các kinase này có thể trở thành yếu tố khởi phát cho một lộ trình tín hiệu của các thụ thể tyrosine kinase và serine/threonine kinase
Trang 11kiếm các thay đổi này trong protein của virus covid-19.
Phần lớn các kinase không liên quan đến thụ thể nhưng hoạt động trong tế bào như một phần của dòng thác tín hiệu nội bào Họ Src, Lck, Lyn, Fyn và Syk là những kinase không liên quan đến thụ thể là thành phần quan trọng trong các lộ trình tín hiệu của tế bào T và dưỡng bào Họ Tec tyrosine kinase cũng đóng vai trò quan trọng trong
sự truyền tin sớm của lymphocyte
Hầu hết các lộ trình tín hiệu sử dụng non-receptor serine/threonine protein
kinase như một vài chặn trong suốt quá trình truyền tin
- Acetyl hóa:
Chủ yếu diễn ra ở amino ß của lysine α trêm đầu cuối N
Quá trình này đóng một vai trò quan trọng trong hiện tượng tái cấu trúcchromatin và liên quan đến sự hoạt hóa quá trình phiên mã Histone acetyltransferase(HATs) có chức năng acetyl hóa histone để tháo xoắn chromatin, làm cho nó dễ dàngtiếp cận với nhiều yếu tố phiên mã và do vậy hoạt hóa quá trình này Hoạt động củamyocyte enhancer factor-2 (MEF2) là một ví dụ điển hình cho quá trình acetyl hóa vàphản ứng khử acetyl hóa được thực hiện bởi histone deacetylase (HDACs) và sirtuins
- Methyl hóa:
Diễn ra ở guanidino amino α, amino ß và arginine, cacboxyl α của đoạn cuối C
và cacboxyl của chuỗi Side
Chức năng của protein có thể thay đổi bởi sự methyl hóa arginine hay lysine bởienzyme protein arginine methyltransferase (PRMTs) và Smyd-2 Các phản ứng methylhóa này sẽ bị đảo ngược bởi các enzyme demethylase như histone lysine-specificdemethylase (LSD1) có chức năng loại nhóm methyl khỏi p53
– Ubiquitination: diễn ra ở amino α và amino ß
– Chuyển nhóm amino: chủ yếu diễn ra ở amino α ở đoạn cuối N
– Poly ADP glycosyl: chủ yếu diễn ra guanidino của arginine
– Glycosyl hóa: Sự glycosyl hóa protein ở vị trí N là quá trình biến đổi sau dịch
mã được bảo tồn ở nấm men và các eukaryote khác Sự glycosyl hóa ở vị trí O là việctạo liên kết cộng hóa trị giữa một monosaccharide với axit amin Ser hay Thr Quá trìnhsửa đổi giá trị chung ở mỗi loài có thể sử dụng men khác nhau Sửa đổi giá trị chungcủa mỗi loài đều có chức năng sinh lý quan trọng.[3]
2, Loại bỏ Met hoặc fMet ở đầu N chuỗi peptide
Trong sinh vật nhân sơ, axit amin thứ nhất của quá trình sinh tổng hợp protein
là formylmethionine, sinh vật nhân thực là methionine Đầu N của protein trưởngthành phần lớn là methionine, cần phải loại bỏ 1 hoặc nhiều hơn số axit amin ở đầu N.Formyl trong axit amin này có thể được loại bỏ bằng men enzyme Trong nhiều trườnghợp, sau khi đầu N của chuỗi peptide di chuyển ra ngoài ribosome, lập tức tiến hànhenzyme hóa Loại bỏ methionine của đầu N cũng có thể xảy ra trong quá trình khởiđầu sinh tổng hợp, nhưng quá trình này lại bị ảnh hưởng bởi nếp gấp của chuỗi peptide
Trang 12kiếm các thay đổi này trong protein của virus covid-19.
3, Loại bỏ peptide tín hiệu
Protein ngoài tác dụng di chuyển tự do trong tế bào chất ra, một phần còn tiết rabên ngoài tế bào và định vị tại hệ thống màng Tế bào sinh vật nhân thực khá phức tạp,protein không chỉ quyết định chủng loại của màng tế bào
Trong protein màng tế bào của phần lớn các loại vi khuẩn, đầu N đều có peptidetín hiệu dài khoảng 15-30 axitamin Nửa trên của peptide tín hiệu chứa nhiều arginine
và lysine, có điện tích dương; nửa dưới chủ yếu là axit amin kỵ nước, có khoảng 15-20axit amin Đoạn axit amin này có thể hình thành cấu trúc xoắn anpha,trình tự củapeptide tín hiệu khẩn cấp cũng có thể hình thành cấu trúc xoắn anpha Hai đầu xoắnanpha hình thành cấu trúc hình kẹp dạng song song ngược chiều, có thể đi vào tầnglipid kép một cách dễ dàng Chuỗi peptide tổng hợp có thể xuyên qua màng Nếu làprotein màng trong, sẽ có 1 hoặc nhiều đoạn kết hợp với nhau tại nội mạc Khi phầngiữa hai đầu anpha có kết cấu kẹp đến được bề mặt ngoài của nội mạc, peptidase tínhiệu nằm tại bề mặt ngoài nội mạc sẽ tách khỏi peptide tín hiệu
Protein được tổng hợp trong tế bào sinh vật nhân thực làm thế nào để đến đượccác vị trí được quyết định bởi tín hiệu vận chuyển của protein Nếu không có tín hiệuvận chuyển, protein sẽ được giữ lại tế bào Định vị tế bào khác nhau cần tín hiệu vậnchuyển khác nhau Protein bề mặt tế bào, protein bài tiết, protein hòa tan có peptide tínhiệu giống như sinh vật nhân sơ, nằm ở đầu N, dài khoảng 15-30 axit amin, phần lớn
là axit amin kỵ nước giáp đầu N có vài arginine và lysine mang điện tích dương.Peptide tín hiệu của sinh vật nhân thực cũng có thể hình thành cấu trúc kẹp xoắnanpha Hạt nhận biết peptide tín hiệu (SRP) có thể kết hợp với protein trên lưới nộichất thô, đưa chuỗi peptide mới tổng hợp vào lưới nội chất thô, cuối cùng bài tiết vàomàng protein Protein tổng hợp sau đó sẽ đi vào golgi và tiến hành sửa đổi tại đây, cốđịnh tại màng hoặc hình thành các túi bài tiết bài tiết ra ngoài tế bào
4, Gập chuỗi peptide
Gập chuỗi peptide bắt đầu khi tổng hợp chuỗi peptide chưa kết thúc Ribosome
có thể chứa chuỗi peptide dài 30-40 axit amin, ngay sau khi chuỗi peptide xuất hiện tạiribosome, quá trình gập chuỗi peptide bắt đầu sự hình thành cấu trúc tam cấp gần nhưkết thúc cùng với quá trình tổng hợp chuỗi peptide, gập protein bắt đầu tại đầu N
5, Loại bỏ đoạn peptide không cần thiết trong phân tử tiền chất.
Trong phân tử tiền chất của protein, có một số không cần thiết, không tồn tạitrong phân tử trưởng thành Việc loại bỏ chuỗi peptide hoàn thành dưới tác dụng củamen thủy phân protein đặc tính Nhiều hormon peptide và tiền chất men đều phải quaquá trình này
6, Sự hình thành liên kết disulfide
Trong phân tử mRNA không có mã cystine, có không ít phân tử protein có chứaliên kết disulfide cystine, thậm chí có nhiều liên kết Liên kết disulfide là gen chứcnăng của protein, được hình thành thông qua axit sulfuric, có những liên kết được hìnhthành trước khi đoạn peptide bị loại bỏ
Trang 13kiếm các thay đổi này trong protein của virus covid-19.
7, Sửa đổi đầu N và đầu C của chuỗi polypeptide
Ở một số trường hợp, một đầu hoặc hai đầu polypeptide tổng hợp tiến hành sữachữa lại axit amin Còn phát hiện có thể di chuyển dư lượng axit amin đến đầu N củaprotein trưởng thành bằng tRNA hoạt hóa
Ở sinh vật nhân thực, đầu N của phần lớn protein trong tế bào bị acetyl hóa Acetylhóa dưới tác dụng của acetyl biến thành chất xúc tác, men này có tính lựa chọn đối vớiaxit amin đầu N Đầu C của phần lớn polypeptide bị amin hoá, đặc biệt là kích thích tốpolypeptide Amin hoá có thể bảo vệ polypeptide không bị thủy phân exonuclease.Ngoài ra, đầu N còn có sự sửa đổi của Glucosamine và nhóm lipid [4]
1.2.5 Các cách nghiên cứu về sự thay đổi sau dịch mã
Các phương pháp thường gặp để nghiên cứu cấu trúc và chức năng của proteinbao gồm kỹ thuật hóa mô miễn dịch (immunohistochemistry), gây đột biến định hướngđiểm (site-directed mutagenesis), tinh thể học tia X, cộng hưởng từ hạt nhân và khốiphổ kế
1, Tinh thể học tia X:
Cách thông thường để xác định hình dáng một vật là trực tiếp nhìn vào nó Vớicác vật rất nhỏ như các phân tử, để xác định cấu trúc liên kết giữa các nguyên tử tạonên phân tử đó, ta cần dùng kinh hiển vi để phóng đại chúng lên hàng ngàn tỉ lần Vớikhả năng hiện có, kinh hiển vi điện tử (electron microscopes) cũng chỉ có thể phóngđại lên vài tỉ lần Lí do là do giới hạn nhiễu xạ (diffraction limit): để có thể nhìn thấymột vật hoặc phân biệt được 2 vật điểm thì kích thước tối thiểu của vật hoặc khoảngcách tối thiểu giữa hai vật điểm lớn hơn ½ lần bước sóng đang sử dụng
Bước sóng của ánh sáng chỉ vào khoảng vài trăm nanometers còn các nguyên tửthì có khoảng cách chỉ ở đơn vị hay bước sóng cần thiết để nhìn thấy các nguyên tử làbước sóng của tia X Nhưng ta không thể tạo kinh hiển vi tia X Vì vậy đòi hỏi ta phảidùng các kĩ thuật mang tính gián tiếp khác Khi tia X chiếu vào tinh thể sẽ tương tácvới các electron hóa trị của các nguyên tử thành phần được phân bố trong không gian.Các electron này sẽ tán xạ tia X ra các hướng, tùy vào sự sắp xếp trong không gian củacác nguyên tử Một màn hình phía sau sẽ lưu lại vị trí tán xạ và cường độ tán xạ của tia
X Sau khi có dữ liệu này rồi người ta sẽ dùng các công thức tính toán phức tạp để xácđịnh vị trí các electron bao quanh các nguyên tử và từ đó suy ra vị trí các nguyên tử.Các mẫu nhiễu xạ thu được sẽ có mối quan hệ với vật phát tán các sóng chiếu tới nóthông qua một phép toán biến đổi Fourier Nếu mật độ các electron bao quanh mỗinguyên tử là một hàm toán học, thì mẫu nhiễu xạ tia X thu được tương ứng là biến đốiFourier của hàm đó Với tính chất có thể biến đổi ngược của phép biến đổi Fourier, ta
có thể dùng máy tính để xây dựng lại hình ảnh mật độ electron dựa vào ảnh mẫu nhiễu
xạ PDB (Protein Data Bank) lưu trữ cấu trúc protein và các phân tử sinh học khácmiễn phí sử dụng Để hiển thị cấu trúc 3D của chúng, ta dùng phần mềm RasMol hayPymol Tuy nhiên khi sử dụng phương pháp này thì dễ phá hỏng mẫu phân tử sinhhọc, kết quả thu được cần xem xét kĩ [5]
Trang 14kiếm các thay đổi này trong protein của virus covid-19.
1.2.7 Ý nghĩa của việc nghiên cứu thay đổi sau dịch mã.
Nghiên cứu chức năng và cấu trúc của protein Xác định chức năng sinh họccủa protein trong tế bào sống, sự phát triển binh thường của các tế bào trong cơ thểsinh vật
Giải thích được nguyên nhân, cơ chế của các tính trạng binh thường hoặc bệnh
lý để có những chẩn đoán, điều trị chinh xác và hiệu quả hơn
Trang 15kiếm các thay đổi này trong protein của virus covid-19.
CHƯƠNG 2: ỨNG DỤNG TIN SINH HỌC TÌM KIẾM THAY ĐỔI
Trang 16kiếm các thay đổi này trong protein của virus covid-19.
2.2.1 Phương pháp tìm kiếm Fatty Acylation
Sử dụng phần mềm LipoP 1.0 (Center for Biological Sequence Analysis
Technical University of Denmark)
2.2.1.1 Các bước thực hiện
i Bước 1: Truy cập phần mềm LipoP 1.0
ii Bước 2: Tải trình tự các nucleotide từ NCBI thành các đoạn ngắn 5000nucleotide
iii Bước 3: Tải trình tự trên vào phần mềm LipoP 1.0 để dự đoán các thay đổi
Trang 17kiếm các thay đổi này trong protein của virus covid-19.
SpII: peptide tín hiệu lipoprotein (tín hiệu peptidase II)
TMH: chuỗi xoắn xuyên màng n-terminal Đây thường không phải là một dựđoán rất đáng tin cậy và nên được kiểm tra Phần này của mô hình chủ yếu ở đó
để tránh các vòng xoắn tranmembrane bị dự đoán sai là peptide tín hiệu
CYT: tế bào chất Nó thực sự chỉ có nghĩa là tất cả phần còn lại Điểm số choCYT luôn giống nhau
CleavI: Các vị trí phân tách cho (tín hiệu peptidase I)
CleavII: Các vị trí phân cắt cho (tín hiệu peptidase II)
4 Vị trí trong chuỗi Đối với các dòng có dự đoán lớp, nó luôn luôn là 1 Đối với các
vị trí phân cắt, nó là axit amin cuối cùng của peptide tín hiệu so với vị trí phân táchđược dự đoán
5 Vị trí như trên cho thấy rằng đối với các vị trí phân cắt, nó là axit amin đầu tiên sau