Hình 4.1 Cấu hình trạng thái có năng lượng thấp nhất của của haichuỗi HP bao gồm các amino acid kỵ nước H và phân cực P vớichiều dài N = 48 thu được từ mô phỏng trong mô hình ống HP, bao
Trang 1Lời cảm ơn i
1.1 Các đặc trưng cấu trúc của protein 8
1.2 Hiện tượng cuốn protein 10
1.3 Nghịch lý Levinthal 11
1.4 Phễu cuốn 12
1.5 Nguyên lý thất vọng tối thiểu 13
1.6 Mô hình hai trạng thái cho cơ chế cuốn protein 14
1.7 Tính hợp tác của quá trình cuốn 16
1.8 Tương tác kỵ nước 18
1.9 Mô hình HP mạng 19
1.10Mô hình Go 21
1.11Mô hình ống 22
1.12Kết luận 25
2 Sự hình thành amyloid 27 2.1 Cấu trúc sợi amyloid 28
2.2 Cơ chế hình thành sợi amyloid 30
2.3 Kết luận 35
3 Các mô hình và phương pháp mô phỏng 37 3.1 Mô hình ống HP 37
3.1.1 Tính chất tự tránh dạng ống 38
3.1.2 Thế năng bẻ cong 39
3.1.3 Hệ tọa độ Frenet 39
Trang 23.1.4 Liên kết hydro 40
3.1.5 Tương tác kỵ nước 42
3.2 Mô hình ống Go 43
3.3 Mô hình ống với tính định hướng của các chuỗi bên 43
3.4 Các thông số cấu trúc protein 45
3.5 Phương pháp mô phỏng Monte Carlo 45
3.5.1 Thuật toán Metropolis 46
3.5.2 Các phép dịch chuyển Monte Carlo cho protein 48
3.6 Phương pháp điều nhiệt song song 49
3.7 Phương pháp phân tích đa biểu đồ có trọng số 51
3.8 Kết luận 54
4 Vai trò của trình tự amino acid kỵ nước và phân cực đối với cơ chế cuốn của protein 55 4.1 Nhiệt động lực học cuốn protein trong mô hình ống HP 55
4.2 Nhiệt động lực học cuốn protein trong mô hình ống Go 61
4.3 Chuyển pha cuốn trong mô hình ống HP và mô hình ống Go 62
4.4 Ảnh hưởng cường độ tương tác kỵ nước lên tính chất cuốn 70
4.5 Kết luận 74
5 Vai trò của trình tự amino acid kỵ nước và phân cực đối với sự kết tụ của peptide 75 5.1 Sự phụ thuộc của các cấu trúc kết tụ vào trình tự HP 76
5.2 Nhiệt động lực học của quá trình kết tụ 79
5.3 Động học của quá trình hình thành sợi 82
5.4 Sự kết tụ của hệ peptide hỗn hợp 87
5.5 Thảo luận 89
5.6 Kết luận 92
Trang 3a.a Amino acid
ADN Deoxyribonucleic acid
AFM Hiển vi lực nguyên tử (Atomic Force Microscopy)
AD Bệnh Alzheimer (Alzheimer Disease)
HP Kỵ nước và phân cực (hydrophobic and polar)
NMR Cộng hưởng từ hạt nhân (Nuclear Magnetic Resonance
PDB Ngân hàng dữ liệu protein (Protein Data Bank)
rmsd Độ dịch chuyển căn quân phương (root mean square deviation)
Trang 4Bảng 5.1 Trình tự amino acid kỵ nước (H) và phân cực (P) của cácpeptide được xét trong nghiên cứu về sự kết tụ Các trình tự trongbảng được ký hiệu từ S1 tới S12 Tham số s ký hiệu khoảng cáchgần nhất giữa hai amino acid H liên tiếp nhau trong chuỗi 76
Trang 5Hình 1.1 Hình vẽ minh họa a) cấu trúc hóa học của amino acid (trừproline), b) cấu trúc hóa học của proline (Pro) và c) chuỗi polypep-tide với các amino acid liên kết với nhau bởi các liên kết peptide.Mỗi amino acid gồm một nguyên tử carbon trung tâm Cα liên kếtvới một nhóm amine (-NH2), một nhóm carboxyl (-COOH), mộtnguyên tử H và một chuỗi bên R Trong amino acid proline, chuỗibên R liên kết hóa trị với nguyên tử C trong nhóm carboxyl Cácamino acid trong protein khác nhau bởi chuỗi bên R 9Hình 1.2 Cấu trúc trạng thái cuốn của vùng B1 của protein G (a–c) vàcủa protein A (d–f) Các cấu trúc protein được biểu diễn ở dạng gồmtất cả các nguyên tử (all-atom) (a,d), dạng dải (ribbon) (b,e) vàdạng mạch xương sống (backbone) (c,f).[Pleaseinsertintopreamble]Trong biểu diễn dạng dải, các xoắn α được tô màu đỏ và các phiến
β được tô màu vàng Trong biểu diễn mạch xương sống, các aminoacid khác nhau được phân biệt bằng các màu khác nhau Các dữliệu cấu trúc được lấy từ ngân hàng dữ liệu protein (PDB) với mãPDB 1pga cho vùng B1 của protein G và 2spz cho protein A 10Hình 1.3 Địa hình năng lượng dạng sân gôn ứng với quá trình cuốntrong nghịch lý Levithal 12Hình 1.4 Phễu cuốn 13Hình 1.5 Sơ đồ năng lượng tự do trong mô hình hai trạng thái D và
N lần lượt là trạng thái duỗi và trạng thái cuốn Trạng thái chuyểntiếp (TS) là trạng thái có năng lượng tự do cao nhất giữa trạngthái duỗi và trạng thái cuốn ∆FN và ∆FD lần lượt là độ cao củacác bờ thế xuất phát từ các trạng thái duỗi và cuốn 15Hình 1.6 Nhiệt động lực học của protein hai trạng thái (a) Sự phụ thuộccủa enthalpy trung bình vào nhiệt độ có dạng chữ S (sigmoidal) (b)
Sự phụ thuộc của nhiệt dung riêng vào nhiệt độ có đỉnh tại vùngchuyển pha (c) Phân bố enthalpy tại nhiệt độ T1 < Tf và T2 > Tf.(d) Phân bố enthalpy tại nhiệt độ T = Tf Nhiệt độ chuyển phacuốn duỗi Tf được xác định là nhiệt độ mà nhiệt dung riêng đạtcực đại Độ lớn của sự thay đổi enthalpy nhiệt, ∆Hcal, và enthalpyvan’t Hoff, ∆HvH, được thể hiện một cách gần đúng trên hình vẽ 17
Trang 6Hình 1.7 Mô hình mạng HP trên không gian hai chiều, các amino acid
kỵ nước và phân cực tương ứng có màu xanh và màu đỏ Cấu hìnhgói chặt có năng lượng thấp nhất của chuỗi peptide gồm 14 aminoacid (a); hai cấu hình gói chặt khác có năng lượng cao hơn ứng với
5 cặp tương tác HH (b,c); Histogram số trạng thái phụ thuộc vàonăng lượng chỉ ra chỉ có một trạng thái duy nhất có năng lượng cựctiểu (d) 20Hình 1.8 (a) Giản đồ pha trạng thái cơ bản của polymer đồng nhất dài
24 hạt trong mô hình ống eR và eW là các tham số năng lượng bẻcong và năng lượng tương tác kỵ nước trong mô hình Pha cận bóchặt bao gồm các vùng được tô màu có trạng thái cơ bản là các cấutrúc tương tự cấu trúc protein (b) Các cấu trúc trạng thái cơ bản
và một số cực tiểu năng lượng trong pha cận bó chặt (Hình vẽ từbài báo [21] được sự đồng ý của tác giả cho sử dụng lại) 23Hình 1.9 Hình ảnh đơn giản hóa trong hai chiều của một địa hình nănglượng (a) Địa hình năng lượng của một polymer đồng nhất trong
mô hình polymer thông thường với một thế năng hút thúc đẩy sự bóchặt Có rất nhiều trạng thái cơ bản gói chặt tối đa với năng lượngxấp xỉ như nhau, phân cách nhau bởi các hàng rào năng lượng lớn.(b) Địa hình năng lượng được tạc hình (presculpted) bởi các yếu
tố hình học và đối xứng trong mô hình ống của một chuỗi polymerđồng nhất trong pha cận bó chặt Số lượng cực tiểu sẽ giảm đáng
kể và chiều rộng của các hố thế tăng lên (c) Địa hình năng lượngdạng phễu của một protein được lựa chọn bởi trình tự amino acid.(Hình vẽ từ bài báo [53] được sự đồng ý của tác giả cho sử dụng lại) 24
Hình 2.1 Hình ảnh mô tả cấu trúc nhiễu xạ thu được từ nhiễu xạ tia
X đối với sợi amyloid Các cực đại nhiễu xạ thu được tại các vị tríứng với khoảng cách 4.7 ˚A theo phương thẳng đứng và 8–10 ˚A theophương ngang Các khoảng cách này phù hợp với cấu trúc phiến βchéo mô tả ở hình bên phải, trong đó các dải β có phương vuônggóc với trục của sợi Một sợi amyloid có thể gồm nhiều protofibrilghép lại với nhau 29Hình 2.2 Mô hình cấu trúc của các sợi amyloid của bệnh Alzheimer tạobởi các peptide Abeta (1-42) có mã PDB là 2BEG thu được bằngphương pháp NMR [68]: (a) nhìn theo hướng trục sợi, (b) nhìn theohướng vuông góc trục sợi 29
Trang 7Hình 2.3 Sơ đồ mô tả quá trình protein cuốn sai và hình thành các cấutrúc kết tụ 30Hình 2.4 Động học của quá trình hình thành amyloid 31Hình 2.5 Sự phụ thuộc năng lượng tự do vào số đơn phân của cấu trúckết tụ 32
Hình 3.1 Minh họa những thế năng được sử dụng trong mô hình ốngtinh chỉnh của protein r, y là các bán kính cong địa phương, khôngđịa phương; z là khoảng cách giữa hai đơn phân a.a; eR và eW tươngứng là năng lượng phạt, năng lượng tương tác kỵ nước (hydophobic)của một liên kết 38Hình 3.2 Minh họa sự tạo thành một liên kết hydro giữa đơn phân i
và j trong mô hình ống cho protein Mỗi amino acid được xem xétbởi vị trí nguyên tử Cα Hệ tọa độ Frenet được hình thành bởi bavector đơn vị: tiếp tuyến t, pháp tuyến n và phó pháp tuyến b.Liên kết hydro được hình thành khi các ràng buộc hình học đốivới vector nối cij và các vector binormal bi và bj được thỏa mãn.Trong một liên kết hydro lý tưởng được mô tả trên hình vẽ, nhữngvector này nằm song song với nhau 41Hình 3.3 (a và b) Mô hình mô tả tương tác tiếp xúc giữa hai aminoacid với sự định hướng các chuỗi bên Các chuỗi bên được coi là
có hướng ngược lại với hướng của các vector pháp tuyến ni và nj
từ các nguyên tử Cα Hai amino acid được coi là có tương tác nếuchuỗi bên của chúng có hướng không quá xa nhau (a) hoặc khôngtương tác nếu chuỗi bên hướng xa nhau (b) (c) Phân bố xác suấtcủa tích vô hướng ni·cij cho các tiếp xúc giữa các chuỗi bên được từ
500 cấu trúc protein trong cơ sở dữ liệu top500 Hai đỉnh của phân
bố ứng với các cấu trúc xoắn α và phiến β Các chuỗi bên được coi
là có tiếp xúc nếu giữa chúng tồn tại 2 nguyên tử có khoảng cáchnhỏ hơn 1.5 lần tổng bán kính Van der Waals của 2 nguyên tử đó 44Hình 3.4 Hai phép dịch chuyển trạng thái cho polymer: a) phép quaytrục (crank-shaft move), b) phép quay điểm (pivot move) 49Hình 3.5 (a) Hoán đổi replica cho phép xuyên qua rào thế (b) Sự giaonhau của các biểu đồ trạng thái theo năng lượng tại các nhiệt độkhác nhau 49
Trang 8Hình 4.1 Cấu hình trạng thái có năng lượng thấp nhất của của haichuỗi HP bao gồm các amino acid kỵ nước (H) và phân cực (P) vớichiều dài N = 48 thu được từ mô phỏng trong mô hình ống HP, baogồm cấu trúc bó ba xoắn α (ký hiệu là 3HB) (a) và cấu trúc tương
tự vùng B1 của protein G (ký hiệu là GB1) (b) Các amino acid kỵnước (H) trong hình vẽ có màu xanh và các amino acid phân cực(P) có màu vàng 56Hình 4.2 Sự phụ thuộc của năng lượng trung bình hEi, bán kính hồichuyển trung bình hRgi, và nhiệt dung riêng C vào nhiệt độ củacác protein 3HB (a–c) và GB1 (d–f) trong mô hình ống HP Cácmũi tên chỉ một cách gần đúng vào các nhiệt độ chuyển pha cuốn(folding) và chuyển pha sụp đổ (collapse) 57Hình 4.3 Các ví dụ về cấu hình protein tìm thấy ở các nhiệt độ khácnhau ở các pha duỗi (a,d), pha sụp đổ (b,e) và pha cuốn (c,f) choprotein 3HB (a–c) và GB1 (d–f) Các amino acid kỵ nước được tômàu xanh đậm, các amino acid phân cực màu xanh nhạt Đơn vịcủa nhiệt độ là /kB 59Hình 4.4 Sự phụ thuộc của năng lượng E trung bình, bán kính hồichuyển Rg trung bình, và nhiệt dung riêng C vào nhiệt độ của cácprotein 3HB (a–c) và GB1 (d–f) trong mô hình ống Go 60Hình 4.5 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tạinhiệt đô chuyển pha Tf = 0.296 /kB của protein 3HB trong môhình ống HP Các đồ thị trên hình bao gồm năng lượng (a), độ dịchchuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đãchuẩn hóa của chúng (d–f) 63Hình 4.6 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tạinhiệt đô chuyển pha Tf = 0.243 /kB của protein GB1 trong môhình ống HP Các đồ thị trên hình bao gồm năng lượng (a), độ dịchchuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đãchuẩn hóa của chúng (d–f) 64
Trang 9Hình 4.7 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tạinhiệt đô chuyển pha Tf = 0.345 /kB của protein 3HB trong môhình ống Go Các đồ thị trên hình bao gồm năng lượng (a), độ dịchchuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đãchuẩn hóa của chúng (d–f) 65Hình 4.8 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tạinhiệt đô chuyển pha Tf = 0.291 /kB của protein GB1 trong môhình ống Go Các đồ thị trên hình bao gồm năng lượng (a), độ dịchchuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đãchuẩn hóa của chúng (d–f) 66Hình 4.9 Bề mặt hai chiều của năng lượng tự do hiệu dụng phụ thuộcvào năng lượng E và độ dịch chuyển căn quân phương rmsd tại cácnhiệt độ chuyển pha Tf = 0.296 /kB và Tf = 0.345 /kB lần lượtđối với protein 3HB trong mô hình ống HP (a) và mô hình ống Go(b); và Tf = 0.243 /kB và Tf = 0.291 /kB đối với protein GB1trong mô hình ống HP (c) và mô hình ống Go (d) Giá trị của nănglượng tự do được thể hiện theo bảng màu bên phải với đơn vị là kBT 69Hình 4.10Các cấu trúc có năng lượng thấp nhất thu được từ mô phỏngprotein 3HB với các cường độ tương tác kỵ nước khác nhau Tronghình các amino acid H (kỵ nước) có màu xanh đậm, các aminoacid P (phân cực) có màu xanh nhạt Các cấu trúc hiển thị ứngvới eHH = −0.2 (a), eHH = −0.21 (b), eHH = −0.3 (c), eHH =
−0.5 (d), eHH = −0.7 (e) 71Hình 4.11Sự phụ thuộc của nhiệt dung riêng vào nhiệt độ của protein3HB tại các giá trị cường độ tương tác kỵ nước khác nhau eHH =
−0.2 , −0.3 , −0.5 và −0.7 71Hình 4.12Sự phụ thuộc của năng lượng trung bình hEi (a) và bán kínhhồi chuyển trung bình hRgi (b) vào nhiệt độ của protein 3HB tạicác giá trị cường độ tương tác kỵ nước khác nhau eHH = −0.19 ,
−0.2 , −0.21 , −0.3 , −0.5 , −0.7 73
Hình 5.1 Cấu hình trạng thái có năng lượng thấp nhất thu được từ môphỏng của các hệ có N = 10 chuỗi peptide giống nhau với các trình
tự HP từ S1 tới S12 như được nêu trong Bảng 5.1 Các amino acid
H và P trong các peptide tương ứng có màu xanh đậm và xanh nhạt 77
Trang 10Hình 5.2 Sự phụ thuộc của nhiệt dung riêng vào nhiệt độ cho các hệpeptide với trình tự S2 và với số peptide M lần lượt là 1, 2, 3,
4, 5, 6, 8 và 10 như được chỉ ra trên hình vẽ Kích thước hộp môphỏng L được lựa chọn phụ thuộc vào số peptide M sao cho nồng
độ peptide được giữ không đổi ở 1 mM Các cấu hình peptide trênhình vẽ tương ứng với các trạng thái có năng lượng thấp nhất thuđược từ mô phỏng cho các hệ peptide được xét Mũi tên đánh dấu
vị trí của nhiệt độ sinh lý giả định T∗ 78Hình 5.3 Tương tự như Hình 5.2 nhưng cho các hệ peptide với trình tựS4 Để có thể quan sát rõ, số lượng hệ với M khác nhau được hiểnthị ít hơn so với trình tự S2 79Hình 5.4 Sự phụ thuộc của giá trị đỉnh nhiệt dung riêng trên một phân
tử Cpeak/M (a) và nhiệt độ tương ứng của nó Tpeak (b) vào trình tựcủa chuỗi đối với hệ M = 10 chuỗi peptide (đường liền nét), M = 6(đường nét đứt) và M = 1 (đường chấm) peptide Các trình tựchuỗi được đánh số thứ tự theo Bảng 5.1 Đường nằm ngang trong(b) tương ứng với nhiệt độ sinh lý giả định T∗ trong mô hình 81Hình 5.5 Sự phụ thuộc của năng lượng của hệ vào số bước Monte Carlotrong một mô phỏng tại nhiệt độ T = 0.2 /kB Cấu hình peptidetrong hình là trạng thái cân bằng không bền với ba peptide tạothành một phiến β tiếp xúc với một xoắn α mất trật tự tạo bởipeptide thứ tư 82Hình 5.6 Sự phụ thuộc của năng lượng tự do, F , vào kích thước củacấu trúc kết tụ lớn nhất, m, của hệ peptide có trình tự S2 với sốchuỗi peptide là M = 10 tại ba nhiệt độ khác nhau, T = 0.2, 0.21
và 0.22 /kB như được chú thích trên hình Năng lượng tự do củatrạng thái không kết tụ, ứng với m = 1, được sử dụng như một giátrị tham chiếu Các đồ thị trên hình vẽ cho thấy một hàng rào nănglượng tự do với cực đại tại vị trí m = 3 83
Trang 11Hình 5.7 Động học của quá trình kết tụ đối với hệ peptide có trình tựS2 với kích thước hệ M = 20 peptide tại nồng độ 1 mM và nhiệt
độ T = 0.2 /kB (a) Sự phụ thuộc của năng lượng, E, vào thờigian, t, được đo bằng số bước MC cho ba quỹ đạo khác nhau (b)
Sự phụ thuộc của kích thước của kết cụm lớn nhất m cho ba quỹđạo được chỉ ra trong hình (a) Các mũi tên trong mỗi quỹ đạo chỉ
ra thời điểm tạo nhân (c) Biểu đồ kích thước kết cụm thu được
từ số peptide thu được sau thời gian mô phỏng dài t = 1.5 × 109bước MC (d) Hình ảnh của một cấu hình peptide tại thời điểmtạo nhân (e) Cấu hình của cụm tạo nhân được hình thành bởi bapeptide từ cấu hình chỉ ra trong hình (d) (f) Cấu hình cấu trúc sợi
có dạng kéo dài tạo thành bởi 20 peptide thu được từ mô phỏng 86Hình 5.8 Sự phụ thuộc của số peptide trung bình tham gia phiến β,
hnβi, vào thời gian cho quá trình kết tụ của hệ M = 20 peptidevới trình tự S2 Hệ được khảo sát tại các nhiệt độ T = 0.2 /kB(a,b) và 0.21 /kB (c,d) tại vài nồng độ khác nhau: c = 1 mM (cácđiểm hình vuông), 0.5 mM (các điểm hình tròn) và 0.25 mM (cácđiểm hình tam giác) như chú thích trên hình Đối với mỗi nồng
độ nβ được lấy trung bình từ 100 quỹ đạo mô phỏng độc lập Cáchình bên phải (b và d) tương ứng được vẽ với cùng số liệu nhưcác hình bên trái (a và c) nhưng trong thang log-log Các điểm dữliệu được khớp với hàm hồi phục M (1 − e−t/t0) (đường liền nét) với
t0 = 570 × 106 cho c = 1 mM trong hình (a) và t0 = 1850 × 106 cho
c = 0, 5 mM trong hình (a), và t0 = 109 cho c = 1 mM trong hình(c) Các đồ thị trong thang tọa độ log-log chỉ ra rằng sự phát triểncủa nβ trong thời gian ngắn ban đầu tuân theo quy luật hàm lũythừa, hnβi ∝ tα, với α = 1 trong hình (b) và α = 1.25 trong hình(d) cho cả hai nồng độ 1 mM và 0.5 mM 87
Trang 12Hình 5.9 (a) Hình ảnh cấu hình peptide thu được từ mô phỏng đối với
hệ hỗn hợp 10 chuỗi peptide có trình tự S2 và 10 chuỗi có trình tựS4 tại nồng độ c = 1 mM và nhiệt độ T = 0.2 /kB Các đơn phân
H có màu xanh đậm Các đơn phân P có màu xanh nhạt và màuhồng tương ứng với các chuỗi có trình tự S2 và S4 (b) Hình ảnhnhìn từ trên xuống đã được phóng to đối với cấu trúc kết tụ tronghình a Chú ý rằng sáu chuỗi S4 có mặt trong kết cụm và 5 trong
số chúng tồn tại ở cấu hình phiến β (c) Sự phụ thuộc số peptidetrung bình trong cấu hình phiến β, hnβi, vào thời gian thu được từ
100 mô phỏng độc lập cho các peptide ở cả hai trình tự (các điểmhình vuông) và chỉ với trình tự S4 (các điểm hình tròn) Dữ liệuđược khớp với hàm hồi phục dạng mũ đã được nêu ở Hình 5.8 chotrường hợp cả hai trình tự với t0 = 832 × 106 (đường liền nét) 88
Trang 13Trong khoảng 20 năm trở lại đây, nghiên cứu cơ bản trong lĩnh vực lý sinhphân tử đã trở thành một hướng nghiên cứu phát triển mạnh trên thế giới Đốitượng nghiên cứu của lý sinh phân tử là các hệ sinh học với kích thước từ vàitới vài chục nanomét như các protein, ADN, ARN, màng lipid và các phức hệbên trong tế bào Các hệ phân tử sinh học này hiện nay có thể được nghiên cứubằng nhiều phương pháp thực nghiệm tiên tiến như cộng hưởng từ hạt nhân(NMR), tán xạ tia X, kính hiển vi lực nguyên tử (AFM), đánh dấu phân tử vàhuỳnh quang phổ v.v., cho phép thu được các thông tin về cấu trúc và các tínhchất động lực học của chúng Bên cạnh đó, các phương pháp lý thuyết, tínhtoán và mô phỏng máy tính là các công cụ rất quan trọng giúp tìm hiểu rõ hơncác nguyên lý và các cơ chế vi mô liên quan tới các phân tử sinh học Ngoài ra,
mô phỏng máy tính có thể đưa ra các tiên đoán cho thực nghiệm, giúp tiết kiệmthời gian và chi phí nghiên cứu
Trong các vấn đề của sinh học phân tử, vấn đề cuốn của protein luôn cóđược sự quan tâm hàng đầu Điều này trước tiên bởi vì protein đóng vai trò vôcùng quan trọng đối với sự sống [1] Protein tham gia vào tất cả các hoạt độngcủa cơ thể sống Chúng thực hiện các chức năng như là thành phần cấu trúccủa tế bào, xúc tác các phản ứng hóa học (các enzyme), điều hòa và kiểm soátcác quá trình sinh hóa (các hormon protid, các protein hoạt hóa, ức chế), vậnchuyển oxy và các vi chất (hemoglobin, myoglobin, myosin), co cơ và vận động(titin), bảo vệ (các kháng thể, bổ thể, yếu tố đông máu) v.v Hầu hết các proteinchỉ thể hiện hoạt tính sinh học khi chúng nằm ở trạng thái cuốn với cấu trúc
3 chiều bó chặt và duy nhất cho mỗi protein, gọi là trạng thái tự nhiên (nativestate) hoặc trạng thái cuốn (folded state) của protein Khi protein bị duỗi hoặccuốn nhầm, chúng không chỉ mất đi các hoạt tính sinh học vốn có mà còn cóthể kết tụ thành các cấu trúc dạng sợi không hòa tan gọi là amyloid [2], đượcbiết là liên quan tới nhiều loại bệnh thoái hóa với tiến triển nghiêm trọng nhưAlzheimer, Parkinson, tiểu đường tuýp 2, các loại bệnh xốp não, bệnh bò điênv.v Hầu hết các loại dược phẩm hiện nay được thiết kế nhằm tương tác với mộtloại protein cụ thể nằm ở trạng thái cuốn Do vậy, việc xác định cấu trúc cuốn
và làm rõ cơ chế cuốn của protein có vai trò to lớn đối với hiểu biết của chúng
ta về cơ thể sống cũng như đối với sức khỏe con người
Về mặt hóa học, protein là một chuỗi polymer tuyến tính với các đơn phân
Trang 14(monomer) là các amino acid Protein trong tự nhiên được tạo thành từ 20 loạiamino acid khác nhau Mỗi phân tử protein được xác định bởi một chuỗi cácamino acid với một trình tự xác định Hiện tượng cuốn của protein được biếtđến lần đầu vào những năm 50 của thế kỷ trước từ các thí nghiệm của Anfinsen[3] Trong các điều kiện sinh lý bình thường như trong một dung môi với nhiệt
độ 20-40◦ C, áp suất gần với áp suất khí quyển và pH ở vùng trung tính, proteinnằm ổn định ở trạng thái tự nhiên Khi điều kiện của dung môi thay đổi, protein
có thể bị duỗi ra Tuy nhiên, hầu hết các protein cuốn gần như ngay lập tức,trong khoảng thời gian từ vài phần nghìn giây cho tới vài giây, về trạng thái tựnhiên ban đầu khi các điều kiện sinh lý được hồi phục Tính thuận nghịch củacác quá trình duỗi và cuốn protein đã đưa Anfinsen đến giả thiết rằng cấu trúc
3 chiều của trạng thái tự nhiên được quyết định hoàn toàn bởi trình tự aminoacid trong chuỗi protein Giả thiết này cũng được biết đến với tên gọi là giảthiết nhiệt động học (thermodynamic hypothesis) vì để trạng thái tự nhiên là
ổn định và duy nhất, nó phải là trạng thái cực tiểu năng lượng tự do của hệtrong các điều kiện sinh lý bình thường Với phát hiện của mình, Anfinsen đãđược trao giải Nobel hóa học vào năm 1972
Vấn đề cuốn protein về cơ bản được coi là việc dự đoán cấu trúc 3 chiều củaphân tử protein khi biết trình tự amino acid của nó Việc dự đoán này ngầmđịnh phải được thực hiện trên máy tính với các thuật toán xác định Vấn đềngược của vấn đề cuốn protein là thiết kế protein: với một cấu trúc 3 chiều chotrước, hãy tìm các trình tự amino acid có thể cuốn về cấu trúc này Việc thiết
kế protein nhằm tạo ra các loại protein mới với các chức năng mong muốn, cóthể ứng dụng trong y sinh học Trải qua hơn 4 thập kỷ, mặc dù các nhà nghiêncứu đã có những thành công nhất định trong việc dự đoán cấu trúc cũng nhưthiết kế protein [4], cho đến nay vấn đề cuốn protein về cơ bản vẫn chưa đượcgiải quyết Điều này là do sự phức tạp của phân tử protein và của các tươngtác trong phân tử và tương tác của protein với dung môi Mặc dù protein là hệmesoscopic với chiều dài khoảng từ vài chục tới vài nghìn amino acid, số lượngcác cấu hình khác nhau mà protein có thể có cũng như số lượng các trình tựamino acid khác nhau là các con số vô cùng lớn Việc dự đoán cấu trúc bằng
mô phỏng máy tính luôn gặp hạn chế bởi tốc độ máy tính, đặc biệt trong các
mô phỏng với tất cả các nguyên tử
Song song với việc dự đoán cấu trúc protein từ trình tự amino acid, người
ta cũng đặt câu hỏi tại sao protein lại có thể cuốn nhanh chóng về trạng thái tựnhiên như vậy Lập luận của Levinthal vào cuối những năm 1960 cho thấy nếuquá trình cuốn protein là một quá trình tìm kiếm mù lòa (blind search) trong
Trang 15không gian các cấu hình thì thời gian cuốn sẽ dài hơn tuổi của vũ trụ (nghịch
lý Levinthal) [5] Do vậy, Levinthal cho rằng protein phải cuốn theo những lộtrình cuốn (folding pathway) xác định nhằm giảm số cấu hình trung gian phảitrải qua Vào thập niên 1990, Wolynes, Onuchic và Thirumalai đưa ra khái niệmphễu cuốn [6], mô tả cấu trúc không gian cấu hình trong đó số cấu hình (hayentropy) của hệ giảm khi năng lượng giảm Protein được cho là có địa hình nănglượng dạng phễu Quá trình cuốn được coi là quá trình ngẫu nhiên có tính chấthồi phục về trạng thái có năng lượng thấp nhất, trong đó việc giảm năng lượngxảy ra đồng thời với việc giảm entropy Với phễu cuốn, protein không nhất thiếtcuốn theo các lộ trình cuốn xác định, nhưng vẫn giảm được phần lớn số cấuhình trung gian phải trải qua Hầu hết các nghiên cứu hiện nay đều cho các kếtquả phù hợp với cách giải thích hiện tượng cuốn protein bằng phễu cuốn, mặc
dù vấn đề có tồn tại hay không các lộ trình cuốn xác định vẫn được đặt ra.Hầu hết các protein nhỏ dạng cầu được biết cuốn theo cơ chế hai trạng tháitrong các thí nghiệm, với các đặc trưng về động học và cân bằng giống như cácphản ứng hóa học đơn giản Quá trình cuốn của protein giống như một dạngchuyển pha loại một với sự giải phóng ẩn nhiệt (latent heat) Protein được biết
có tính hợp tác cuốn (folding cooperativity) [7] cao, thể hiện ở đỉnh nhiệt dungriêng sắc nét tại nhiệt độ chuyển pha cuốn Nghiên cứu của Kaya và Chan [8]cho thấy mức độ hợp tác cuốn của protein trong thực tế thu được từ các kếtquả thực nghiệm cao hơn đáng kể so với các mô hình thường sử dụng trong môphỏng Trong các nghiên cứu về cơ chế cuốn của protein, việc tìm hiểu về trạngthái chuyển tiếp (transition state) rất được quan tâm, do đây là trạng thái trunggian quan trọng nhất quyết định tốc độ cuốn của protein Các nghiên cứu thựcnghiệm của Fersht [9] cho thấy protein có thể có nhiều trạng thái chuyển tiếpkhác nhau, hay nói cách khác là tồn tại một tập hợp các trạng thái chuyển tiếp.Điều này ủng hộ lý thuyết phễu cuốn vì cho thấy protein có thể có rất nhiều lộtrình cuốn khác nhau
Hiện tượng kết tụ protein và sự hình thành amyloid cũng được nghiên cứumạnh trong những năm gần đây Người ta thấy rằng rất nhiều protein, kể các
cả các protein không liên quan tới các bệnh tật, và các đoạn protein (peptide),trong các điều kiện thích hợp (thông thường khi protein bị làm duỗi và ở mật
độ cao) đều có thể kết tụ thành amyloid Ngoài ra, các kết tụ amyloid có cácđặc trưng cấu trúc rất giống nhau (dạng sợi dài, giàu phiến β) mặc dù trình tựamino acid của các protein hoặc peptide tạo thành chúng là rất khác nhau Điềunày dẫn đến giả thuyết cho rằng amyloid là trạng thái chung của mọi protein,
và là trạng thái cơ bản của hệ khi các protein có thể hình thành các tương tác
Trang 16liên phân tử Như vậy, xu hướng kết tụ và hình thành amyloid luôn tồn tại chomọi protein, và là một xu hướng cạnh tranh với quá trình cuốn protein Tuyvậy, các thí nghiệm cũng cho thấy rằng khả năng kết tụ và tốc độ kết tụ phụthuộc vào các điều kiện dung môi và vào trình tự amino acid của các protein.Một số nghiên cứu cho thấy trong chuỗi protein có thể tồn tại các đoạn trình
tự amino acid nhỏ có ảnh hưởng lớn tới khả năng kết tụ của cả protein Do vậy,việc nghiên cứu để tìm ra mối liên hệ giữa trình tự amino acid và khả năng kết
tụ là rất cần thiết, có ý nghĩa cơ bản trong việc tìm hiểu các bệnh liên quan tớiamyloid cũng như tìm ra phương hướng để chữa trị các loại bệnh này
Mặc dù các mô phỏng với mô hình đầy đủ các nguyên tử (all-atom tions) hiện nay được sử dụng khá phổ biến trong các nghiên cứu về các hệ sinhhọc phân tử, việc áp dụng các phương pháp này trong nghiên cứu cuốn protein
simula-là không khả thi do giới hạn của tốc độ máy tính Máy tính hiện nay chỉ chophép mô phỏng hệ đầy đủ các nguyên tử tới thời gian dưới 1 micro giây, trongkhi thời gian cuốn ở mức mili giây hoặc cao hơn Một cách tiếp cận phù hợpđối với vấn đề cuốn protein đó là dùng các mô hình lý thuyết đơn giản Mặc dùcác mô hình này có thể không trực tiếp dự đoán được cấu trúc protein, chúngmang lại nhiều hiểu biết cơ bản về hiện tượng cuốn protein, và có thể giúp tìm
ra phương hướng giải quyết vấn đề cuốn protein Hạn chế chung của các môhình đơn giản đó là nhiều chi tiết về cấu trúc bị lược bỏ, do vậy các kết quả thuđược cần sự biện luận hoặc cần được kết hợp với các mô phỏng đầy đủ nguyên
tử (trong cách tiếp cận đa tỷ lệ) để có thể đưa ra các kết quả mang tính địnhlượng cho các protein cụ thể Có khá nhiều mô hình với các ý tưởng và mức độđơn giản hóa khác nhau, tuy nhiên đáng kể nhất là các mô hình sau đây Môhình Go [10, 11], được đề xuất bởi G¯o và Abe vào năm 1981 và được áp dụngtrên trên mạng 2 chiều, trong đó các tương tác giữa các hạt (mỗi amino acidđược coi là một hạt) được lựa chọn sao cho chỉ các tiếp xúc trong trạng thái tựnhiên có năng lượng âm, còn năng lượng của các tiếp xúc khác đều bằng không
Mô hình Go luôn đảm bảo trạng thái tự nhiên có năng lượng thấp nhất và duynhất Tuy nhiên, nó không xét tới trình tự amino acid của protein Các mô hình
Go ngoài mạng, còn gọi là các mô hình tương tự Go, được xây dựng dựa trêncác cấu trúc thực của protein cho cơ chế cuốn khá phù hợp với các kết quả thựcnghiệm [12] Cho tới nay, mô hình Go và các mô hình tương tự Go được sử dụngkhá rộng rãi trong các nghiên cứu về protein, ví dụ trong nghiên cứu về sự phụthuộc của các tính chất cuốn và chiều dài của protein [13], trạng thái chuyểntiếp trong cuốn protein [14], các lộ trình cuốn [15, 16], kéo duỗi protein [17, 18]v.v Mô hình protein đơn giản thứ hai là mô hình HP trên mạng được nghiên
Trang 17cứu lần đầu tiên bởi Dill và các cộng sự vào năm 1989 [7, 19] Mô hình này giảthiết các amino acid được chia thành 2 loại, kỵ nước (H – hydrophobic) và phâncực (P – polar), và tương tác hút chỉ tồn tại giữa các amino acid kỵ nước Môhình HP cho phép tìm hiểu trên phương diện lý thuyết về mối liên hệ giữa trình
tự amino acid đối với cấu trúc của trạng thái cuốn ở mức độ đơn giản nhất, cũngnhư các vấn đề liên quan tới cơ chế cuốn và địa hình năng lượng của protein.Tuy vậy, mô hình HP khó có thể phát triển ra ngoài mạng do gặp vấn đề về sựsuy biến của trạng thái cơ bản (nhiều cấu hình có cùng năng lượng thấp nhất)
Do vậy, nó không áp dụng được cho các cấu trúc protein thực hoặc gần với cấutrúc protein thực
Vào năm 2000, nghiên cứu của Maritan và các cộng sự đăng trên tạp chíNature [20] cho thấy polymer dạng ống có cấu trúc đóng gói chặt nhất có dạngxoắn (helix) với các thông số cấu trúc gần với các thông số cấu trúc của xoắn αtrong protein Các nghiên cứu tiếp theo về polymer dạng ống với các thế nănghai hạt và ba hạt cho thấy tại các miền tham số thích hợp trạng thái cơ bảncủa hệ là các cấu trúc xoắn và cả cấu trúc phẳng, tương tự như phiến β trongprotein Trong khi đó, các polymer thông thường, được mô hình hóa là chuỗi cáchạt hình cầu, chỉ có thể hình thành các cấu trúc bó chặt ngẫu nhiên và thiếucác đặc trưng của cấu trúc protein Điều này gợi ý rằng tính chất đối xứng dạngống là đặc trưng cơ bản của phân tử protein, giúp hình thành nên các cấu trúcbậc hai của protein (xoắn α và phiến β) Trên cơ sở của ý tưởng này, mô hìnhống cho protein được phát triển bởi Hoàng cùng nhóm nghiên cứu của Maritan,
và được đề xuất vào năm 2004 [21] Trong mô hình ống, ngoài tính chất lấpđầy không gian của polymer dạng ống trong không gian liên tục, các tương tácđược xét bao gồm thế năng bẻ cong, thế năng tương tác kỵ nước và các liên kếthydro có tính định hướng cao Mô hình ống cho thấy trong một miền nhất địnhcủa các tham số năng lượng bẻ cong và năng lượng tương tác kỵ nước, trạngthái cơ bản và các cực tiểu năng lượng thấp của hệ có cấu trúc giống như cấutrúc bậc ba của protein, ngay cả trong trường hợp hệ được xét là polymer đồngnhất (homopolymer) Điều này dẫn đến giả thuyết cho rằng không phải trình tựamino acid, mà tính chất đối xứng và các ràng buộc về hình học do các tươngtác trong phân tử protein dẫn tới việc hình thành các cấu trúc tương tự nhưcấu trúc protein [21] Hay nói cách khác, địa hình năng lượng tự do của protein
đã được tạo hình (presculpted) bởi tính đối xứng dạng ống và các ràng buộc vềhình học Trình tự amino acid vẫn đóng vai trò quan trọng trong việc lựa chọnmột cấu trúc duy nhất trong không gian các cấu trúc tương tự như các cấu trúcprotein Nghiên cứu sử dụng mô hình ống với 2 loại amino acid, kỵ nước và ưa
Trang 18nước, giống như trong mô hình HP, cho thấy có thể dễ dàng thiết kế các trình
tự HP có thể cuốn về các cấu trúc bậc ba giống protein được lựa chọn trước[22]
Mô phỏng sử dụng mô hình ống cũng cho thấy các hệ với nhiều chuỗi proteinhoặc peptide có xu hướng hình thành các cấu trúc kết tụ giàu phiến β giốngnhư amyloid [23] Điều này giúp củng cố quan điểm cho rằng xu hướng kết tụthành amyloid là tính chất chung của mọi protein [24] Mô hình ống là mô hình
lý thuyết đầu tiên có thể giải thích một cách thống nhất hiện tượng cuốn protein
và sự hình thành amyloid [23] Auer và các cộng sự [25, 26] đã sử dụng mô hìnhống để mô phỏng sự hình thành amyloid cho các hệ nhiều chuỗi peptide đồngnhất (homopeptide) Các mô phỏng này cho thấy khi nồng độ peptide đủ lớn,quá trình hình thành amyloid thường xảy ra theo hai bước: đầu tiên các peptidetrong dung dịch kết tụ thành các oligomer có cấu trúc mất trật tự, tiếp theo làquá trình trật tự hóa (ordering) các oligomer này thành cấu trúc dạng phiến β.Quá trình tạo nhân (nucleation) xảy ra ở bước thứ hai Ngoài ra, Auer và cáccộng sự cũng tính toán được giản đồ pha mô tả khả năng hòa tan (solubility)của các cấu trúc kết tụ với số lớp phiến β khác nhau phụ thuộc vào nhiệt độ vànồng độ peptide trong dung dịch [27] Các kết quả của mô hình ống cho thấy đây
là một mô hình đơn giản nhưng mô tả tốt nhiều đặc trưng cơ bản của protein
Mô hình ống cũng là mô hình duy nhất hiện nay có thể đồng thời sử dụng chonghiên cứu cả quá trình cuốn và quá trình kết tụ
Trong luận án này, chúng tôi sử dụng mô hình ống để nghiên cứu ảnh hưởngcủa trình tự amino acid lên cơ chế cuốn của protein và sự kết tụ của peptide.Tính chất lấp đầy không gian của polymer dạng ống và các liên kết hydro trong
mô hình đóng vai trò các tương tác nền, không phụ thuộc vào trình tự aminoacid Trình tự amino acid sẽ được chúng tôi xem xét trong mô hình đơn giảnhóa chỉ gồm 2 loại amino acid, kỵ nước (H) và phân cực (P) Để nghiên cứu ảnhhưởng của trình tự HP lên quá trình cuốn, chúng tôi sẽ so sánh tính chất cuốncủa mô hình ống sử dụng tương tác kỵ nước với trình tự HP (mô hình ống HP)với mô hình ống sử dụng các tương tác cặp giống như trong mô hình Go (môhình ống Go) Việc so sánh này giúp làm rõ hơn vai trò của các tương tác cặp
kỵ nước không xuất hiện trong trạng thái tự nhiên (non-native interactions)
Để nghiên cứu vai trò của trình tự HP lên sự kết tụ của protein, chúng tôi sẽ sosánh khả năng kết tụ của các chuỗi peptide với các trình tự HP khác nhau, baogồm việc xem xét tới hình dạng của các cấu trúc kết tụ và tính chất của quátrình chuyển pha kết tụ Trong nghiên cứu về sự kết tụ của protein chúng tôi
đề xuất một mô hình cải tiến cho tương tác kỵ nước trong mô hình ống, có xét
Trang 19tới tính định hướng của các chuỗi bên của các amino acid kỵ nước Nghiên cứucủa chúng tôi cho thấy mô hình cải tiến này cho phép thu được các cấu trúc kết
tụ có trật tự cao và có dạng sợi dài giống như sợi amyloid Ngoài ra, chúng tôicũng tìm hiểu đối với một hệ trộn 2 loại peptide với các trình tự HP khác nhauthì quá trình kết tụ sẽ xảy ra như thế nào
Các protein và peptide được nghiên cứu trong luận án là các chuỗi ngắn vớichiều dài 48 amino acid cho protein và 8 amino acid cho peptide Các proteinđược nghiên cứu như các hệ đơn phân tử, trong khi các peptide được xét trongcác hệ đa phân tử với các nồng độ khác nhau trong dung dịch Các tính chấtcuốn và kết tụ được nghiên cứu thông qua việc khảo sát các cấu trúc cân bằngthu được từ mô phỏng; các đặc trưng nhiệt động lực học như nhiệt dung riêng,năng lượng tự do; quá trình tạo nhân và tiến diễn của sự hình thành các cấu trúctheo thời gian Phương pháp nghiên cứu được sử dụng là mô phỏng Monte Carlotrong tập hợp chính tắc (NVT) Ngoài ra chúng tôi áp dụng một số phương pháp
mô phỏng và tính toán nâng cao bao gồm phương pháp điều nhiệt song song(parallel tempering) và phương pháp phân tích đa biểu đồ có trọng số, nhằmlấy mẫu hiệu quả và tính toán được chính xác các tính chất cân bằng của hệ.Luận án được chia làm 5 chương không kể các phần mở đầu, kết luận và tàiliệu tham khảo Chương 1 giới thiệu tổng quan về vấn đề cuốn protein Chương
2 giới thiệu tổng quan về hiện tượng kết tụ protein và sự hình thành amyloid.Chương 3 đề cập đến các mô hình, phương pháp mô phỏng và phương pháp xử
lý số liệu Chương 4 trình bày kết quả nghiên cứu về vai trò của trình tự HPđối với cơ chế cuốn protein Chương 5 trình bày kết quả nghiên cứu vai trò củatrình tự HP đối với sự kết tụ của peptide
Trang 20Sự cuốn của protein
Trong chương này, chúng tôi sẽ giới thiệu tổng quan về sự cuốn của proteinbao gồm một số kiến thức cơ sở về cấu trúc protein và hiện tượng cuốn protein,các quan điểm lý thuyết về cuốn protein, mô hình lý thuyết cho cơ chế cuốnprotein, và một số kết quả thu được từ các mô hình đơn giản hóa sử dụng trongnghiên cứu cuốn protein
Protein là các đại phân tử được tổng hợp bởi tế bào và chịu trách nhiệmcho hầu hết các hoạt động sinh học của tế bào Chúng là những hợp chất hữu
cơ cao phân tử (polymer) được tạo thành từ các đơn phân (monomer) gồm 20loại amino acid khác nhau Các amino acid trong protein chỉ khác nhau ở chuỗibên (side chain) của chúng và liên kết với nhau thông qua các liên kết peptidetạo thành một chuỗi tuyến tính theo một trình tự cụ thể (Hình 1.1a) Trình tựamino acid trong protein quyết định cấu trúc và chức năng của protein, và đượcgọi là cấu trúc bậc một của protein Do chứa các liên kết peptide, chuỗi aminoacid trong protein còn được gọi là chuỗi polypeptide, và các đoạn protein ngắnđược gọi là các peptide
Ở các điều kiện bình thường của cơ thể sống, cụ thể là trong một dung môi
có pH trong vùng trung tính với nhiệt độ khoảng 20–40◦C và dưới áp suất khíquyển, phần lớn các protein nằm ở một trạng thái có cấu trúc ba chiều gói chặt
và duy nhất cho mỗi protein, được gọi là trạng thái tự nhiên (native state) hoặctrạng thái cuốn (folded state) của protein Hoạt tính sinh học của protein chỉđược thể hiện khi nó nằm ở trạng thái cuốn Hiện nay có khoảng hơn 130.000cấu trúc protein và các phức hệ protein đã được xác định bởi thực nghiệm sửdụng các phương pháp như tinh thể học tia X (X-ray crystallography) và cộnghưởng từ hạt nhân (Nuclear Magnetic Resonance – NMR), được lưu giữ trongngân hàng dữ liệu protein PDB (Protein Data Bank)
Các cấu trúc protein có một điểm chung đó là được đặc trưng bởi các dạngcấu trúc địa phương là xoắn α, phiến β và khúc ngoặt (turn), gọi là các cấu trúcbậc hai [1] Hình 1.2(a–c) cho ta thấy hình ảnh cấu trúc 3 chiều của vùng B1
Trang 21R liên kết hóa trị với nguyên tử C trong nhóm carboxyl Các amino acid trong protein khác nhau bởi chuỗi bên R.
của protein G, gồm một xoắn α và một phiến β tạo bởi 4 dải β Hình 1.2(d–f)cho thấy một ví dụ khác với cấu trúc cuốn của protein A có dạng bó xoắn tạobởi 3 xoắn α Có thể thấy rằng các cấu trúc bậc hai chiếm tỷ lệ lớn trong chuỗipolypeptide Cấu trúc trạng thái cuốn của toàn bộ protein, thường là của mộtchuỗi polypeptide, được gọi là cấu trúc bậc ba Các cấu trúc bậc ba của proteinrất đa dạng, tuy nhiên khá nhiều protein có cấu trúc giống nhau hoặc gần giốngnhau Do đó người ta phân loại cấu trúc protein thành các họ (family) với sốlượng họ cấu trúc khoảng vài nghìn [28] Các protein lớn có thể có nhiều vùngcấu trúc khác nhau Một số protein có thể gồm vài chuỗi polypeptide với cáccấu trúc bậc ba riêng biệt Khi đó sự sắp xếp không gian của các cấu trúc bậc
ba trong protein được gọi là cấu trúc bậc bốn Một dạng cấu trúc bậc bốn phổbiến là dimer được lắp ghép bởi hai cấu trúc bậc ba của hai chuỗi polypeptidegiống nhau
Các cấu trúc bậc hai xoắn α và phiến β lần đầu tiên được phát hiện bởi LinusPauling vào năm 1951 dựa trên sự tối ưu hóa số liên kết hydro giữa các nhómamine và carboxyl trong mạch xương sống của protein [29, 30] Ramachandrankhảo sát các góc nhị diện của mạch xương sống của chuỗi polypeptide được chophép bởi sự chiếm giữ không gian của các nguyên tử và tìm thấy 2 vùng trênbản đồ góc nhị diện (gọi là bản đồ Ramachandran) tương ứng với các cấu trúcxoắn α và phiến β [31] Dựa trên các phân tích thống kê, người ta phát hiện racác amino acid Proline (Pro) và Glycine (Gly) ít tham gia các cấu trúc bậc hai,
Trang 22đỏ và các phiến β được tô màu vàng Trong biểu diễn mạch xương sống, các amino acid khác nhau được phân biệt bằng các màu khác nhau Các dữ liệu cấu trúc được lấy từ ngân hàng dữ liệu protein (PDB) với mã PDB 1pga cho vùng B1 của protein G và 2spz cho protein A.
trong khi một vài các amino acid khác có xu hướng xuất hiện nhiều hơn tại mộtloại cấu trúc cụ thể Ví dụ, Alanine (Ala) xuất hiện nhiều trong các xoắn α vàđược gọi amino acid tạo xoắn Tuy vậy, hầu hết các amino acid đều có thể thamgia các cấu trúc bậc hai
Cấu trúc protein được ổn định bởi tương tác giữa các amino acid, bao gồmliên kết hydro, tương tác van der Waals, tương tác kỵ nước Các liên kết hydrogiúp ổn định các cấu trúc bậc hai trong khi tương tác kỵ nước và van der Waals
có vai trò chủ yếu trong việc ổn định cấu trúc bậc ba Trong một số protein cóthể tồn tại các cầu muối (salt bridge) là liên kết ion giữa các nhóm nguyên tửmang điện tích trái dấu, và cầu lưu hình kép (disulfide bridge) là tương tác hóatrị giữa 2 nguyên tử lưu huỳnh của hai amino acid Cysteine (Cys)
Khi các điều kiện của môi trường như nhiệt độ, áp suất, độ pH bị thay đổi,hoặc khi các chất làm duỗi được cho thêm vào dung dịch, protein có thể bị duỗi
ra thành dạng cuộn ngẫu nhiên, không giữ được cấu trúc bậc hai, bậc ba và mất
Trang 23đi hoạt tính sinh học vốn có Hiện tượng duỗi protein được phát hiện lần đầubởi Christian Anfinsen vào năm 1957 Trong thí nghiệm của mình Anfinsen đãlàm thay đổi cấu trúc và làm mất hoạt tính sinh học của ribonuclease A bằngcách thêm urea vào dung dịch chứa protein Khi các điều kiện dung môi trở lạinhư ban đầu, Anfinsen phát hiện ra rằng protein bị duỗi gần như ngay lập tứcquay trở lại trạng thái cuốn [3] Quá trình hồi phục này được gọi là quá trìnhcuốn protein (protein folding) và nó diễn ra nhanh chóng, trong khoảng thờigian từ vài phần nghìn giây đến vài giây, với hầu hết protein.
Các thí nghiệm của Anfinsen dẫn đến kết luận cho rằng cấu trúc 3 chiềucủa protein được xác định hoàn toàn bởi trình tự amino acid [3] Kết luận nàycũng được biết đến với các tên gọi mã di truyền bậc hai và giả thuyết nhiệt độnglực học Theo giả thuyết nhiệt động lực học, trạng thái cuốn của protein phải
là trạng thái có năng lượng thấp nhất để protein có thể duỗi ra và cuốn lại vàtrạng thái ban đầu một cách thuận nghịch
Cấu trúc ba chiều chính xác là điều kiện cần để hầu hết các protein thựchiện chức năng sinh học của chúng Những protein thất bại khi cuốn về cấu trúc
tự nhiên trong một số trường hợp có thể dẫn tới những hệ quả độc hại Một sốloại bệnh như Alzeihmer, Parkinson, tiểu đường tuýp 2 được cho là kết quả của
sự tích tụ của các protein cuốn sai thành các sợi amyloid [2] Trong tế bào cũngtồn tại một số loại protein chức năng luôn ở trạng thái không cuốn hoặc có mộtphần không cuốn, được gọi là các protein có bản chất mất trật tự (intrinsicallydisordered proteins) [32]
Dựa trên số lượng bậc tự do của chuỗi polypeptide, Levinthal đã ước lượng
số cấu hình khả dĩ của phân tử protein và cho thấy nó là con số rất lớn Mộtchuỗi polypeptide có 100 đơn phân sẽ có 99 liên kết peptide và bởi vậy có 198góc nhị diện φ và ψ khác nhau (φ và ψ là các góc quay xung quanh các liên kếtN–Cα và Cα–C’ trong mạch xương sống của chuỗi polypeptide) Mỗi góc liên kết
đó có thể ở một trong ba cấu hình ổn định thì số cấu hình của phân tử protein là
3198 Nếu quá trình cuốn là một sự tìm kiếm mù lòa (blind search) trong khônggian cấu hình, protein buộc phải kiểm tra tất cả các cấu hình để tìm ra trạngthái native Do số cấu hình rất lớn, nếu protein chỉ cần ở mỗi cấu hình trong
10−15s thì thời gian cuốn đã dài hơn cả tuổi vũ trụ Trong khi đó chúng ta biếtrằng protein trong tự nhiên cuốn trong thời gian từ vài mini giây tới vài giây.Nghịch lý này dẫn đến giả thuyết cho rằng quá trình cuốn phải diễn ra theo một
Trang 24vài đường dẫn cuốn (folding pathway) xác định [5] Các đường dẫn cuốn nàychỉ bao gồm một phần rất nhỏ các cấu hình trong không gian cấu hình, do vậyprotein tránh được nghịch lý Levinthal Giả thuyết về sự tồn tại của các đườngdẫn cuốn này được coi là quan điểm cũ (old view) về cuốn protein [33].
Theo giả thuyết nhiệt động lực học [3], trạng thái cuốn của protein là trạngthái có năng lượng thấp nhất Quá trình cuốn do vậy là có thể coi là quá trìnhtiến về trạng thái năng lượng thấp nhất đó trên một địa hình năng lượng (energylandcape) xác định bởi năng lượng của tất cả các trạng thái trong không giancấu hình Có thể hình dung địa hình năng lượng là bề mặt năng lượng trongkhông gian nhiều chiều của tất cả các bậc tự do của protein
Quá trình cuốn trong nghịch lý Levinthal ứng với một địa hình năng lượngdạng sân gôn, trong đó tất cả các cấu hình có năng lượng bằng nhau ngoại trừtrạng thái cuốn có năng lượng thấp hơn (Hình 1.3) Địa hình năng lượng nhưvậy không dẫn dắt quá trình cuốn và thời gian cuốn là vô cùng lớn
Vào năm 1995, Wolynes, Onuchic và Thirumalai đưa ra ý tưởng về phễucuốn (folding funnel) [6] như được mô tả trên Hình 1.4 Bề mặt phễu mô tả sựphụ thuộc của năng lượng vào cấu hình của protein với trạng thái cuốn nằm ởđáy phễu có năng lượng thấp nhất Trên bề mặt năng lượng có thể tồn tại cáccực tiểu năng lượng địa phương ứng với các trạng thái giả bền vững và các ràothế protein phải vượt qua để thoát ra khỏi các cực tiểu này Độ rộng của phễu
mô tả sự phụ thuộc của entropy vào năng lượng Có thể thấy là trong phễu cuốnkhi năng lượng giảm thì entropy cũng giảm
Trang 25N
folding
entropy g
có thể tạo ra các bẫy động học, làm chậm quá trình cuốn Trên địa hình nănglượng dạng phễu, protein có thể cuốn theo các đường dẫn cuốn bất kỳ được dẫndắt bởi sự giảm năng lượng và có thể có vô số các đường dẫn cuốn khác nhau.Nhiều nghiên cứu lý thuyết và thực nghiệm gần đây ủng hộ ý tưởng phễu cuốn
và đây cũng được coi là quan điểm mới (new view) về cuốn protein [34]
Sự tồn tại của các cực tiểu năng lượng địa phương cùng các rào thế trongđịa hình năng lượng của protein có thể giải thích là do xung đột giữa các tươngtác trong protein Theo ngôn ngữ của vật lý các hệ phức hợp thì sự xung độtnày được gọi là sự thất vọng (frustration) của hệ Hệ bị thất vọng sẽ khó đạtđược trạng thái có năng lượng thấp nhất trong các quá trình động lực học tiến
về cân bằng do sự cạnh tranh của các trạng thái giả bền vững Các hệ thất vọngnhất là các hệ thủy tinh, là các hệ không bao giờ đạt được trạng thái cân bằng(thời gian hồi phục vô cùng lớn) Protein là một hệ phức hợp với 20 loại aminoacid và nhiều loại tương tác khác nhau Do vậy, với một trình tự amino acidngẫu nhiên thì sự xung đột giữa các tương tác là rất lớn và chuỗi polypeptidekhông thể cuốn nhanh chóng về trạng thái có năng lượng thấp nhất
Vào năm 1989, Bryngelson và Wolynes [35] đưa ra giả thuyết cho rằng
Trang 26protein trong tự nhiên tuân theo nguyên lý thất vọng tối thiểu (principle ofminimum frustration) Theo nguyên lý này, trình tự amino acid của các proteintrong tự nhiên đã được tối ưu hóa thông qua quá trình chọn lọc tự nhiên sao cho
sự thất vọng của hệ là nhỏ nhất Việc giảm thiểu sự thất vọng giúp cho địa hìnhnăng lượng của protein giảm được tối đa được số lượng các cực tiểu năng lượngđịa phương cũng như độ cao của các rào chắn năng lượng Một trình tự aminoacid lý tưởng ứng với bề mặt năng lượng lý tưởng có dạng phễu trơn mượt giúpprotein cuốn nhanh chóng về trạng thái cuốn
Nguyên lý thất vọng tối thiểu có nội dung tương tự như nguyên lý nhấtquán tối đa (principle of maximum consistency) được đề xuất bởi Go vào năm
1981 [10] Go cho rằng có sự nhất quán giữa cấu trúc trạng thái cuốn và cáctương tác của protein sao cho các tương tác có thể ổn định các cấu trúc khôngcuốn là không đáng kể Đáng chú ý, mô hình Go được đề xuất dựa trên nguyên
lý này cho cơ chế cuốn phù hợp khá tốt với thực nghiệm [12]
Các quan sát từ thực nghiệm cho thấy hầu hết các protein nhỏ hình cầucuốn theo cơ chế hai trạng thái [36, 37] Nếu gọi trạng thái duỗi, không cuốncủa protein là D (denatured state) và trạng thái cuốn hay trạng thái tự nhiên là
N (native state) thì trong quá trình cuốn từ D về N theo cơ chế hai trạng thái,protein không dừng lại lâu ở bất kỳ trạng thái nào Hình 1.5 minh họa giản đồnăng lượng tự do của quá trình cuốn 2 trạng thái (Hình 1.5a) Trên giản đồ cáctrạng thái D và N xuất hiện dưới dạng các cực tiểu năng lượng tự do Trạngthái chuyển tiếp TS (transition state) được xác định là trạng thái đỉnh cao nhấtcủa bờ năng lượng tự do
Mô hình hai trạng thái là một mô hình cơ bản được áp dụng nhiều tronghóa học và vật lý Các kết quả thực nghiệm cho thấy mô hình này phù hợp rấttốt cho quá trình cuốn của các protein nhỏ, đơn miền với giả định rằng proteinchỉ có thể nằm ở một trong hai trạng thái cuốn (N) hoặc duỗi (D) [36] Trong
mô hình hai trạng thái, động học của quá trình cuốn duỗi tuân theo phươngtrình chủ [38]
Trang 27Hình 1.5: Sơ đồ năng lượng tự do trong mô hình hai trạng thái D và N lần lượt là trạng thái duỗi và trạng thái cuốn Trạng thái chuyển tiếp (TS) là trạng thái có năng lượng tự do cao nhất giữa trạng thái duỗi và trạng thái cuốn ∆F N và ∆F D lần lượt là độ cao của các bờ thế xuất phát từ các trạng thái duỗi và cuốn.
biên cho phương trình (1.1): (i) điều kiện ban đầu PN(0) = PN0 và (ii) điều kiệntồn tại cân bằng nhiệt động: ∂PN/∂t|t=∞ = 0 Điều kiện (ii) dẫn đến kf và kuphải thỏa mãn điều kiện cân bằng chi tiết
trong đó PDeq = PD(∞) và PNeq = PN(∞) là các giá trị của xác suất khi hệ đạtcân bằng nhiệt động Sử dụng các điều kiện biên trên ta thu được nghiệm củaphương trình (1.1) có dạng
Trang 28trong khi đối với các phân tử nhỏ ν0 ≈ kT /h ≈ (0.2 ps)−1 [40] Các yếu tố nhưnhiệt độ, áp suất, nồng độ chất làm duỗi có thể ảnh hưởng đến ∆F Trong cácthí nghiệm về cuốn protein người ta thường thay đổi điều kiện dung môi cáchnhanh chóng để protein chuyển từ trạng thái cuốn sang không cuốn và ngượclại Trong một giới hạn nhất định có thể coi ∆FN,D phụ thuộc tuyến tính vàonồng độ chất làm duỗi Khi đó, từ phương trình (1.5) có thể dễ dàng thấy rằnglog(kf) và log(ku) cũng phụ thuộc tuyến tính vào nồng độ chất làm duỗi.Bằng cách gây đột biến ở những vị trí xác định trong trình tự amino acidngười ta có thể làm thay đổi tốc độ cuốn của protein, qua đó thu được nhữngthông tin về trạng thái chuyển tiếp [41] Tốc độ cuốn của protein cũng như cáctính chất của trạng thái chuyển tiếp phụ thuộc mạnh vào dạng hình học củacấu trúc protein [42].
Tính hợp tác (cooperativity) là hiện tượng được mô tả bởi hệ bao gồm cácyếu tố giống nhau hoặc gần giống nhau mà hoạt động phụ thuộc lẫn nhau Ví
dụ các enzyme hoặc các thụ thể có nhiều vị trí liên kết và ái lực của các vị trínày có thể được tăng lên (hợp tác dương) hoặc giảm đi (hợp tác âm) do kết hợpvới nhiều phối tử Chẳng hạn đối với hemoglobin, khi một nguyên tử oxy liênkết với một trong bốn vị trí liên kết của nó thì ái lực với oxy của ba vị trí cònlại tăng lên Điều đó có nghĩa oxy sẽ dễ dàng gắn vào phân tử hemoglobin cógắn một oxy hơn là phân tử hemoglobin chưa gắn nguyên tử oxy nào Đó là haitrong nhiều ví dụ về gắn hợp tác (cooperative binding) Tính hợp tác cũng xuấthiện ở phân tử lớn có nhiều tiểu đơn vị giống nhau hoặc gần giống nhau nhưDNA, protein trong các quá trình chuyển pha nóng chảy, duỗi, cuốn Quá trìnhcuốn của protein là quá trình có tính hợp tác cao Trong cuốn protein, tính hợptác được xét đối với quá trình cuốn hai trạng thái và được biểu hiện thông qua
độ sắc nét của quá trình chuyển pha cuốn duỗi Để nhận biết tính hợp tác người
ta có thể dựa vào hai dấu hiệu (i) sự phụ thuộc của xác suất xuất hiện trạngthái N hoặc D vào nhiệt độ hoặc nồng độ chất làm duỗi có dạng đường conghình chữ S (sigmoidal curve) và (ii) hàm nhiệt dung riêng theo nhiệt độ có đỉnhcực đại Đỉnh cực đại của nhiệt dung thể hiện rằng năng lượng (hay enthalpy)của hệ phụ thuộc vào nhiệt độ theo đường cong hình chữ S (Hình 1.6a,b), tức
là quá trình chuyển pha có tính hợp tác về năng lượng
Trong thực nghiệm, tính hợp tác được xác định thông qua một thông số đo
Trang 29bởi tỉ số giữa sự thay đổi enthapy van’t Hoff và sự thay đổi enthalpy nhiệt [43]
Giá trị các thông số này được xác định từ thực nghiệm qua các phép đo hằng sốcân bằng phản ứng và nhiệt dung riêng Trong trường hợp các protein có cơ chếcuốn hai trạng thái, thông số này có giá trị xấp xỉ đơn vị Theo cơ học thống kê,nhiệt dung đẳng áp xác định bởi biểu thức CP = (∂ hHi /∂T )P trong đó hHi làtrung bình nhiệt động của enthapy H Enthalpy nhiệt ∆Hcal của toàn bộ quátrình chuyển pha cuốn/duỗi được định nghĩa là tích phân
CP = (∂ hHi /∂T )P vào phương trình (1.6) ta thu được
∆Hcal = hH (T2)i − hH (T1)i = hHiD− hHiN (1.8)
Trong công thức trên các giá trị trung bình nhiệt động của enthalpy ở trạng tháiduỗi và cuốn tương ứng là hHiD và hHiN
Trang 30Sự thay đổi enthalpy van’t Hoff là sự thay đổi enthalpy liên quan tới chuyểnpha được xác định từ phương trình van’t Hoff [8]
với [N ] là nồng độ protein ở trạng thái cuốn trong dung dịch Người ta cũng
có thể xác định sự thay đổi enthalpy van’t Hoff tại điểm chuyển pha từ dữ liệuthực nghiệm đo nhiệt lượng thông qua hệ thức [44]
∆HvH/∆Hcal có giá trị nhỏ hơn rất nhiều so với 1 Vậy tính hợp tác cao đồngnghĩa với việc hệ thỏa mãn tốt tiêu chuẩn hai trạng thái và κ2 càng gần 1 thìtính hợp tác càng cao và ngược lại
Nước đóng vai trò rất quan trọng đối với các phân tử sinh học trong đó
có protein Phân tử nước có momen lưỡng cực, nên nó tương tác mạnh với cácnhóm tích điện hoặc phân cực Các nhóm nguyên tử mang điện hoặc phân cực
Trang 31sẽ có xu hướng tiếp xúc tối đa với môi trường nước Ngược lại nhóm nguyên tửkhông bị phân cực sẽ tránh tiếp xúc với nước Hiện tượng co cụm và tránh tiếpxúc với nước của các phân tử không bị phân cực (như dầu, mỡ) được biết đến
từ lâu với tên gọi là hiệu ứng kỵ nước (hydrophobic effect)
Cơ chế của hiệu ứng kỵ nước khá phức tạp, và được cho là có đóng góp chủyếu bởi sự thay đổi entropy liên quan tới cấu trúc mạng liên kết hydro giữa cácphân tử nước hình thành xung quanh các nhóm không phân cực Đây khôngphải lực liên kết đúng nghĩa mà là khuynh hướng loại trừ các nhóm không phâncực ra khỏi mạng nước
Kết quả tương tác kỵ nước là sự liên kết giữa các phần tử kỵ nước Dựavào tính kỵ nước người ta phân các amino acid theo hai nhóm Nhóm kỵ nước(hydrophobic group) bao gồm 8 amino acid là Ala, Iso, Leu, Met, Phe, Pro, Trp,Val và nhóm phân cực (polar group hay hydrophilic group) gồm 12 amino acidcòn lại Đối với các a.a kỵ nước thì nước là một dung môi kém, do đó chuỗi bêncủa các a.a này thường bị vùi vào bên trong cấu trúc protein để tránh tiếp xúcvới nước Trong khi đó các a.a phân cực có xu hướng xuất hiện trên bề mặtcủa protein để tiếp xúc với nước Tương tác kỵ nước được cho là lực dẫn dắt(driving force) cho sự cuốn của protein [45]
Mô hình protein với các hạt kỵ nước và phân cực trên mạng, được gọi là
mô hình HP mạng, là một trong những mô hình lý thuyết đơn giản nhất đểnghiên cứu vấn đề cuốn protein Mô hình này được đề xuất và nghiên cứu bởiLau và Dill vào năm 1989 [19] và sau đó được tiếp tục nghiên cứu bởi nhiều một
số nhóm nghiên cứu khác [46, 47, 48] Trong mô hình này các amino acid đượcphân chia thành một trong hai loại: kỵ nước (H – hydrophobic) và phân cực (P– polar) Cấu hình protein được mô tả bởi các hạt có vị trí tại các nút mạngtrong mạng 2D hoặc 3D Tương tác kỵ nước được đưa vào mô hình này bằngcách gán một năng lượng âm, HH = −1, cho các tiếp xúc giữa các hạt kỵ nướckhông liền kề nhau trong chuỗi Năng lượng tương tác của các tiếp xúc giữa cáchạt phân cực, P P = 0, trong khi năng lượng của các tiếp xúc HP có giá trị
−1 < HP < 0 Trạng thái cuốn trong mô hình là trạng thái có năng lượng thấpnhất hay trạng thái cơ bản của hệ
Một trong những yêu cầu của mô hình protein đó là cấu hình trạng tháicuốn phải là duy nhất Sử dụng mô hình HP trên mạng hai chiều, bằng cách
Trang 32(a) (b) (c)
0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000
liệt kê tất cả các cấu hình có thể có cho chuỗi có độ dài 14 a.a, Dill và các cộng
sự đã tìm ra các trình tự amino acid có cấu hình trạng thái cơ bản là duy nhất.Các cấu hình này có tính chất bó chặt tương tự như các cấu trúc protein Bằngphương pháp mô phỏng, Dill và các cộng sự cũng chỉ ra rằng có thể thiết kế cáctrình tự HP có thể cuốn về các cấu trúc gói chặt cho các chuỗi có chiều dài 24a.a trên mạng 2 chiều và 27 a.a trên mạng 3 chiều
Không phải với tất cả các cấu trúc bó chặt đều tồn tại các trình tự a.a saocho năng lượng hệ ở cấu trúc đó là nhỏ nhất và duy nhất Khả năng thiết kế(designability) của một cấu trúc được định nghĩa là số trình tự a.a chấp nhậncấu trúc đó là trạng thái cơ bản duy nhất Li và các cộng sự [46] nghiên cứu khảnăng thiết kế của các cấu trúc bó chặt trong mô hình HP mạng trong 2 chiều và
3 chiều và tìm thấy rằng chỉ có một số ít các cấu cấu trúc có khả năng thiết kếlớn (highly designable), trong khi hầu hết các cấu trúc khác có khả năng thiết
kế rất thấp hoặc bằng 0 (undesignable) Một điểm thú vị đó là các cấu trúc cókhả năng thiết kế lớn có các đặc trưng về hình học có tính lặp lại tương tự nhưcác cấu trúc bậc hai của protein [46] Ngoài ra, khả năng thiết kế lớn cũng đồngnghĩa với việc là các cấu trúc này có độ ổn định cao đối với các đột biến trong
Trang 33trình tự amino acid.
Mô hình HP mạng cũng được sử dụng để nghiên cứu tính hợp tác của quátrình cuốn protein Nghiên cứu của Chan và các cộng sự [49] chỉ ra rằng đồ thịxác suất xuất hiện trạng thái cuốn phụ thuộc vào nhiệt độ của một số trình tự
HP chọn lọc có dạng hình chữ S (sigmoidal) đồng thời sự phụ thuộc của nhiệtdung riêng vào nhiệt độ có một đỉnh cực đại liên quan đến chuyển pha cuốn–duỗi Đó là những dấu hiệu cho thấy chuyển pha của các chuỗi này có tính hợptác Trong nghiên cứu này, các tác giả cũng đã chỉ ra rằng chuyển pha của cácchuỗi có thể là 2 trạng thái hoặc 1 trạng thái tùy thuộc vào trình tự HP thôngqua việc xem xét biểu đồ năng lượng tại nhiệt độ chuyển pha Kết quả cho thấyquá trình co cụm (collapse) và sự hình thành lõi kỵ nước của một số chuỗi HPthỏa mãn tính hợp tác hai trạng thái giống như các kết quả thực nghiệm đối vớiprotein cầu Ngoài ra, mô hình HP mạng cũng cho phép nghiên cứu một cáchchi tiết địa hình năng lượng của các protein mô hình với sự tồn tại của phễucuốn và các bẫy động học [7]
Trong nghiên cứu về cơ chế cuốn của protein thì mô hình Go và các mô hìnhtương tự Go (Go-like model) là các mô hình được sử dụng nhiều do sự phù hợptốt với kết quả thực nghiệm Mô hình Go bỏ qua sự chuyên biệt của các trình
tự amino acid trong chuỗi protein và xây dựng thế năng tương tác dựa trên cấutrúc của trạng thái cuốn Mô hình Go áp đặt thế năng hút cho các cặp hạt lâncận trong trạng thái cuốn, trong khi coi các cặp hạt khác là không tương táchoặc đẩy nhau ở khoảng cách gần Trong mô hình Go trạng thái cuốn luôn cónăng lượng cực tiểu Cơ sở của mô hình Go chính là nguyên lý nhất quán tối
đa giữa các tương tác của protein ở trạng thái cuốn được trình bày trong mục1.3.4 Mô hình này cũng cho sự thất vọng nhỏ nhất, tương tự như mô hình Isingtrong nghiên cứu sắt từ Mô hình Go đầu tiên được đưa ra bởi Nibuhiro Go năm
1981 [10, 50] và được xét trên mạng vuông hai chiều Mặc dù được đề xuất lầnđầu tiên năm 1981 nhưng phải đến hơn 10 năm sau mô hình Go mới nhận đượcnhiều sự quan tâm Các mô hình tương tự Go sau này được phát triển trongkhông gian liên tực ba chiều và ngoài thế năng góc cho các cấu trúc cuốn địaphương, với vài phiên bản khác nhau [14, 15, 51] Một lợi thế cho mô hình Go
là nó có thể áp dụng cho một protein bất kỳ với cấu trúc cuốn đã được xác định
từ thực nghiệm
Các kết quả nghiên cứu cho thấy mô hình Go cho cơ chế cuốn phù hợp khá
Trang 34tốt với thực nghiệm [12, 15], đặc biệt là trong việc xác định đóng góp của các
vị trí amino acid trong chuỗi polypeptide vào trạng thái chuyển tiếp trong quátrình cuốn protein [14] Do là mô hình được xây dựng dựa trên cấu trúc trạngthái native, mô hình Go không thể phỏng đoán cấu trúc protein từ trình tựamino acid mà chỉ được dùng để nghiên cứu quá trình cuốn về một cấu trúc đãbiết
Trong cách tiếp cận vật lý, người ta thấy rằng protein có những tính chấttổng quát mà không cần chú ý nhiều đến chi tiết nguyên tử Cụ thể là, cácprotein dạng cầu (globular protein) có nhiều tính chất chung cho dù trình tựamino acid của chúng rất khác nhau Trạng thái cuốn của các protein đều giàucác cấu trúc bậc hai ở dạng xoắn α và phiến β Thực nghiệm cũng cho thấynhiều protein có chung một dạng cấu trúc cuốn, và tổng số tổng dạng cấu trúccuốn chỉ cỡ vài nghìn [28] Như vậy, nhiều trình tự amino acid có thể cùng chia
sẻ một cấu trúc trạng thái gốc và thông thường đột biến một amino acid thànhamino acid khác không dẫn đến những thay đổi căn bản trong trong dạng topocủa cấu trúc trạng thái cuốn
Kết quả thực nghiệm cho thấy tốc độ cuốn của protein thay đổi rất ít ngay
cả khi chúng có những thay đổi lớn trong trình tự amino, miễn là dạng topo củacấu trúc trạng thái cuốn là như nhau [42] Các nghiên cứu đột biến acid amin
đã chỉ ra rằng, trong các trường hợp đơn giản nhất các protein chia sẻ cùng mộtdạng topo của cấu trúc gốc có cùng cơ chế cuốn [52] Các tính chất chung củacác protein hình cầu cho thấy trình tự chuỗi mình nó không định hình cấu trúc
và thay vào đó những tính chất được chia sẻ bởi tất cả các protein sẽ quyết địnhtập hợp các cấu trúc cuốn
Có nhiều ví dụ trong vật lý cho thấy hình dạng và đối xứng phân tử quyếtđịnh trật tự và tính chất pha của hệ Cấu trúc face-centered cubic (f.c.c.) quansát thấy trong nhiều loại tinh thể được biết là cấu trúc đóng gói chặt nhất củacác vật thể hình cầu Các pha smetic và nematic của tinh thể lỏng được hìnhthành chủ yếu do hình dạng que của các phân tử tạo thành tinh thể lỏng Vàonăm 2000, Maritan và các cộng sự công bố trên tạp chí Nature kết quả chothấy cấu trúc đóng gói chặt nhất của một ống linh động là cấu trúc xoắn tối ưu(optimal helix) [20] Thú vị là cấu trúc xoắn tối ưu của ống có thông số tỷ lệgiữa bước sóng và bán kính (pitch to radius ratio) tương tự như xoắn α trongprotein Điều này dẫn đến giả thuyết cho rằng tính đối xứng dạng ống có vai
Trang 35(a) (b) Hình 1.8: (a) Giản đồ pha trạng thái cơ bản của polymer đồng nhất dài 24 hạt trong mô hình ống.
e R và e W là các tham số năng lượng bẻ cong và năng lượng tương tác kỵ nước trong mô hình Pha cận bó chặt bao gồm các vùng được tô màu có trạng thái cơ bản là các cấu trúc tương tự cấu trúc protein (b) Các cấu trúc trạng thái cơ bản và một số cực tiểu năng lượng trong pha cận bó chặt (Hình vẽ từ bài báo [21] được sự đồng ý của tác giả cho sử dụng lại).
trò quyết định đối với sự hình thành cấu trúc protein
Các nghiên cứu về polymer dạng ống với tương tác hút đồng nhất giữa cáchạt cho thấy tại miền trung gian của độ dài tương tác (interaction range) tồn tạipha cận bó chặt (marginally compact phase), nằm giữa pha bó chặt (compactphase) và pha duỗi (swollen phase), với các cấu trúc xoắn và phẳng giống nhưxoắn α và phiến β trong protein Tuy vậy các cấu trúc này chỉ tồn tại cho cácchuỗi polymer rất ngắn (dưới 20 hạt) cũng như thiếu sự ổn định cần thiết đốivới các tác động nhiệt Điều này cho thấy sự cần thiết có các tương tác giúp mởrộng ảnh hưởng và tăng cường sự ổn định của các cấu trúc trong pha cận bóchặt
Mô hình ống cho protein đã được phát triển bởi Hoàng cùng nhóm nghiêncứu của Maritan [21] Ngoài tính lấp đầy không gian của polymer dạng ống, môhình này còn chứa các tương tác khác bao gồm thế năng bẻ cong, các liên kếthydro và tương tác kỵ nước Các liên kết hydro trong mô hình ống có các ràngbuộc về hình học được trích xuất từ các cấu trúc protein thực Các chi tiết của
mô hình ống được giới thiệu chi tiết ở chương 3 Giản đồ pha trạng thái cơ bảncủa polymer đồng nhất trong mô hình ống cho thấy pha cận bó chặt bao gồmcác cấu trúc bậc hai và bậc ba tương tự như cấu trúc protein Ngoài ra bề mặtnăng lượng tự do của chuỗi bao gồm các cực tiểu có cấu trúc giống với cấu trúcprotein Điều này củng cố giả thuyết cho rằng cấu trúc protein được hình thành
Trang 36by geometry and symmetry
Homopolymer (marginally compact)
bó chặt Số lượng cực tiểu sẽ giảm đáng kể và chiều rộng của các hố thế tăng lên (c) Địa hình năng lượng dạng phễu của một protein được lựa chọn bởi trình tự amino acid (Hình vẽ từ bài báo [53] được sự đồng ý của tác giả cho sử dụng lại).
do các tính chất chung của tất cả các protein chứ không phải do các trình tựamino acid chuyên biệt Mô hình ống cho thấy tính chất đối xứng dạng ống củachuỗi polymer và các ràng buộc hình học của liên kết hydro đã tạc hình trước(presculpt) bề mặt năng lượng tự do của protein [21], khiến cho nó có các cựctiểu có cấu trúc giống với cấu trúc protein
Ngoài việc giải thích được sự hình thành các cấu trúc bậc hai và bậc bacủa protein, mô hình ống còn cho một số kết quả quan trọng khác Trước tiên,giản đồ pha trạng thái cơ bản của protein trong mô hình ống cho thấy pha cận
bó chặt chỉ bao gồm một số ít các trạng thái cơ bản và cực tiểu địa phương cónăng lượng thấp Điều này giải thích tại sao số lượng các cấu trúc protein quansát được trong tự nhiên là hữu hạn và rất ít (khoảng vài nghìn [28]) so với sốlượng khổng lồ các trạng thái trong các pha bó chặt và pha duỗi của polymer.Thứ hai, vai trò của trình tự amino acid không phải là góp phần hình thànhnên cấu trúc protein mà là chọn ra một cấu trúc trong một danh mục hữu hạncác cấu trúc cuốn đã được xác định trước (pre-determined menu of folds) [23].Nghiên cứu mô hình ống với các trình tự HP cho thấy có thể dễ dàng thiết kếcác trình tự amino acid có thể cuốn về các cấu trúc được chọn lựa trước [22].Các cấu trúc được thiết kế cũng có độ ổn định cao trước các đột biến trong trình
tự amino acid, phù hợp với các quan sát thực nghiệm Thứ ba, các mô phỏng
Trang 37sử dụng mô hình ống cho thấy các hệ nhiều chuỗi peptide có xu hướng kết tụthành các cấu trúc giàu phiến β tương tự như cấu trúc amyloid [23] Điều nàyphù hợp với các quan sát thực nghiệm và ủng hộ giả thuyết cho rằng khả nănghình thành amyloid là tính chất chung của mọi protein [2].
Có một quan điểm chung trong lĩnh vực nghiên cứu protein đó là protein
có một địa hình năng lượng dạng phễu [6] Mỗi protein có một địa hình nănglượng riêng của nó, và trình tự amino acid có vai trò quan trọng nhất đối vớiviệc định hình bề mặt năng lượng Mô hình ống chỉ ra rằng địa hình năng lượngcủa protein đã được định hình trước bởi các yếu tố hình học và đối xứng, vớicác cực tiểu ứng với các cấu trúc protein Các cực tiểu đều có các hố thế rộngdạng phễu Vai trò của trình tự amino acid là chọn ra một trong hàng ngàn cựctiểu làm trạng thái cuốn với phễu cuốn đã được định hình sẵn bằng cách làmbất ổn các cực tiểu khác (Hình 1.9) [53] Như vậy nhiệm vụ của trình tự aminoacid trở nên dễ dàng hơn nhiều trong địa hình năng lượng đã được tạc hình
Sự tồn tại của pha cận bó chặt với các cấu trúc tương tự cấu trúc protein vàđịa hình năng lượng được tạc hình trước giúp hiểu sâu sắc hơn vấn đề tiến hóaprotein Trong cuốn sách “Neutral theory of molecular evolution” [54], Kimuraviết rằng đại đa số các đột biến di truyền trong tiến hóa phân tử là các đột biếntrung hòa, là các đột biến không gây ra bất kỳ ảnh hưởng nào tới hình dạng
và chức năng của sinh vật Điều này phù hợp với sự bảo toàn của các cấu trúcprotein và tính ổn định của chúng đối với các đột biến trong trình tự aminoacid Cơ chế chọn lọc tự nhiên trong thuyết tiến hóa Darwin vẫn hoạt động đốivới các đột biến sinh ra các ưu thế về chức năng, hoặc làm tăng tính đa thùhình (polymorphism) của protein, mặc dù các đột biến này có tỷ lệ rất thấp.Một danh mục các cấu trúc cuốn xác định trước sẽ cung cấp một cơ sở cố địnhcho sự tiến hóa của trình tự a.a và chức năng [55] Nhiệm vụ của chọn lọc tựnhiên là thiết kế các trình tự amino acid tối ưu, không chỉ cuốn tới cấu trúcmong muốn mà còn phù hợp với môi trường của các protein khác và các tế bàoxung quanh tạo ra [56] Mô hình ống cho thấy sự tiến hóa trung hòa và sự tiếnhóa chức năng trong sự hạn chế của các cấu trúc cuốn được xác định bởi cácquy luật vật lý
1 Cấu trúc cuốn của protein có các đặc trưng hình học nổi bật là các cấu trúcbậc hai bao gồm xoắn α và phiến β Cấu trúc cuốn của protein được xácđịnh bởi trình tự amino acid trong protein
Trang 382 Quá trình cuốn của protein được coi là quá trình tiến về trạng thái cuốn cónăng lượng thấp nhất trên một địa hình năng lượng tạo bởi tất cả các trạngthái trong không qian cấu hình Bề mặt địa hình năng lượng của proteinđược cho là có dạng phễu trên đó trong quá trình cuốn protein làm giảmđồng thời năng lượng và entropy của hệ Do cạnh tranh giữa các tương tácnên địa hình năng lượng của protein là một bề mặt gồ ghề với khả năng tồntại các bẫy động học, làm chậm tốc độ cuốn của protein Để đảm bảo choquá trình cuốn được nhanh chóng, protein được cho là được tự nhiên chọnlọc theo nguyên lý thất vọng tối thiểu làm giảm xung đột giữa các tươngtác.
3 Mô hình hai trạng thái thường sử dụng cho các phản ứng hóa học có thể
mô tả tốt quá trình cuốn của các protein nhỏ, đơn miền dạng cầu Các đặctrưng của mô hình hai trạng thái đó là sự hồi phục theo hàm mũ của thờigian, và sự phụ thuộc tuyến tính của tốc độ cuốn/duỗi vào nhiệt độ hoặcnồng độ chất làm duỗi Cơ chế cuốn hai trạng thái của protein giống như cơchế của chuyển pha loại I với tính hợp tác cao Tính hợp tác cuốn theo cơchế hai trạng thái có thể định lượng thông qua việc xác định tỷ số giữa sựthay đổi entropy nhiệt và entropy van’t Hoff tại điểm chuyển pha từ phép
đo nhiệt dung riêng
4 Các mô hình đơn giản giúp mang lại những hiểu biết cơ bản về cuốn protein
Mô hình HP mạng giúp tìm hiểu về khả năng thiết kế trạng thái cuốn củaprotein trong không gian mạng với các trình tự amino acid đơn giản nhất
Mô hình Go không xét tới trình tự amino acid và cho phép nghiên cứu quátrình cuốn của các protein trong không gian liên tục với cấu trúc trạng tháicuốn đã biết Mô hình ống cho phép giải thích nguồn gốc sự hình thành cáccấu trúc bậc hai và bậc ba của protein dựa trên các yếu tố đối xứng và hìnhhọc của chuỗi polypeptide, và gợi ý rằng địa hình năng lượng của protein
đã được tạo hình bởi các yếu tố đối xứng và hình học với các cực tiểu ứngvới các cấu trúc tương tự như cấu trúc protein
Trang 39Sự hình thành amyloid
Thuật ngữ “amyloid” đã được nhà thực vật học người Đức Matthias den (1804-1881) nhắc đến đầu tiên trong thực vật học Tiếp theo đó, nhà nghiêncứu y học và giải phẫu học Đức Rudolf Virchow (1804-1881) là người áp dụng
Schlei-nó trong y văn lần đầu tiên vào năm 1854 Virchow đã mô tả các chấm nhỏtrong hệ thống thần kinh có phản ứng đổi từ màu nâu sang xanh khi tác dụngvới thuốc thử iod như tinh bột và đặt tên cấu trúc này là “corpora amylacea”dựa theo tên Latinh của tinh bột là “amylum” [57]
Bằng phương pháp chụp cộng hưởng từ và chụp cắt lớp người ta quansát được các mảng amyloid (amyloid plaque) và các đám rối sợi thần kinh(neurofibrillary tangle) ở não bệnh nhân bị bệnh Alzheimer (AD) [58] Cácmảng này xuất hiện ở dạng khối gồm rất nhiều sợi dài, là dạng tích tụ khôngtan được của các peptide amyloid beta (Aβ) và vật chất trong tế bào nằm bênngoài và bao quanh các neuron Các peptide Aβ có chiều dài 40 hoặc 42 aminoacid được tạo ra do sự thủy phân protein tiền chất amyloid (amyloid precursorprotein, APP) Còn các đám rối là sự tích tụ của các protein Tau thành cấu trúcdạng vi ống (microtubule) đọng lại trong các tế bào Mặc dù đối với nhiều ngườigià, các mảng và đám rối có thể hình thành do quá trình lão hóa nhưng nãocủa bệnh nhân AD thường có số lượng các mảng và đám rối nhiều hơn ở nhữngvùng não nhất định, ví dụ như thùy thái dương [59] Do vậy amyloid được cho
là nguyên nhân gây ra bệnh AD
Hiện nay, ngoài AD ra, có tới hơn 20 loại bệnh được xác định liên quan tới
sự hình thành amyloid của nhiều loại protein khác nhau trong cơ thể [60] Ví
dụ, hội chứng xốp não (spongiform encephalopathies) bao gồm các bệnh CJD(Creutzfeldt-Jakob disease) và bệnh bò điên (mad-cow disease) là do sự kết
tụ của protein prion trong não [61] Bệnh Parkinson được cho là liên quan tớiprotein α-synuclein Tiểu đường tuýp 2 được cho là gây ra bởi sự kết tụ của isletamyloid peptide trong các tế bào beta của tuyến tụy [62]
Ban đầu, người ta cho rằng sự hình thành amyloid là do yếu tố di truyền
và chỉ liên quan tới vài loại protein Tuy nhiên, các nghiên cứu cho thấy nhiềuloại protein khác, gồm những loại không liên quan gì tới các bệnh tật, và cácloại peptide được tổng hợp trong phòng thí nghiệm cũng có khả năng kết tụ và
Trang 40hình thành amyloid [63] Việc phân tích trình tự amino acid của các protein vàpeptide này cho thấy chúng hoàn toàn không có mối tương quan gì Thậm chí,các polypeptide đồng nhất được tạo bởi một loại amino acid trong các điều kiệnthích hợp cũng có khả năng hình thành amyloid [64] Điều này đã dẫn tới quanđiểm cho rằng khả năng kết tụ và hình thành amyloid là tính chất chung củamọi protein [2].
Các kết tụ amyloid đều có dạng sợi dài (amyloid fibrils) và có cấu trúc chủyếu là phiến β Các phiến β trong sợi amyloid có các dải β vuông góc với trụccủa sợi và được gọi là cấu trúc phiến β chéo (cross-β-sheet) Dạng cấu trúc nàyđược chứng minh bằng phương pháp phân tích nhiễu xạ tia X, lần đầu tiên bởiEanes và Glenner vào năm 1968 [65] Hình 2.1 mô tả hình ảnh nhiễu xạ củaamyloid thu được bằng phương pháp nhiễu xạ tia X Vị trí các cực đại tronghình ảnh nhiễu xạ phù hợp với cấu trúc phiến β chéo gồm nhiều phiến β xếpsong song [66] Phương pháp thực nghiệm sử dụng kính hiển vi điện tử (EM)cũng chỉ ra rằng amyloid có dạng sợi dài, không phân nhánh có đường kínhkhoảng 100 ˚A và có chiều dài không xác định Các sợi amyloid đều có chung cấutrúc phiến β chéo ở vùng lõi gồm hai tới bốn phiến β xếp song song với nhau[67] Các phiến β này bị xoắn (twisted) dọc theo trục sợi, nhưng với độ xoắn íthơn nhiều so với các phiến β trong cấu trúc native của protein [63]
Do các sợi amyloid không thể ghép thành dạng tinh thể nên rất khó xácđịnh cấu trúc của chúng ở độ phân giải cao bằng nhiễu xạ tia X Hiện nay, người
ta mới có thể xác định được cấu trúc ở độ phân giải nguyên tử của một số ít cácsợi amyloid tạo thành từ một vài protein hoặc đoạn protein bao gồm insulin,amyloid β peptide, yeast prion sup35p, HET-s prion và α-synucleain bằng cáchkết hợp các phương pháp thực nghiệm tiên tiến và mô hình hóa trên máy tính,bao gồm hiển vi điện tử siêu lạnh (cryo-electron microscopy) và cộng hưởng từhạt nhân trạng thái rắn (solid-state NMR) Các kết quả cho thấy phiến β chéotrong sợi amyloid có trật tự cao và được hình thành bởi các dải β từ các đoạnpolypeptide xác định được lặp đi lặp lại của các phân tử protein Giữa các phiến
β lân cận là sự lấp đầy không gian của các chuỗi bên của các amino acid tạonên một lõi kỵ nước chạy dọc theo chiều dài của sợi Các cấu trúc chi tiết cũngcho thấy sợi amyloid có tính đa thù hình (polymorphism), tức là cùng một loạiprotein hoặc peptide có thể tạo thành các sợi amyloid với sự bố trí không giankhác nhau [69]