Mục tiêu của đềtài 9 Phân tích, xây dựng ngân hàng dữliệu hệprotein huyết thanh người Việt Nam bình thường và một sốtrạng thái bệnh lý (đái tháo đường type 2, leukemia,...) bằng các kỹthuật proteomics và bioinformatics; 9 Nhận dạng và xác định các ứng viên chỉthịprotein có biến đổi vềcấu trúc và chức năng liên quan đến sựphát sinh và phát triển của bệnh đái tháo đường type 2 và leukemia ởViệt Nam; 9 Nghiên cứu khảnăng ứng dụng các chỉthịprotein trong phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia. Nội dung chính của đềtài 9 Phân tích, xây dựng ngân hàng dữliệu hệprotein huyết thanh người Việt Nam bình thường và một sốtrạng thái bệnh lý (đái tháo đường type 2 và leukemia…) bằng các kỹthuật proteomics và bioinformatics 9 Phân tích, nhận dạng và xác định các ứng viên chỉthịprotein (protein markers candidates) đối với bệnh đái tháo đường type 2 và leukemia 9 Thửnghiệm ứng dụng các ứng viên chỉthịprotein trong chẩn đoán
Trang 1VIỆN CÔNG NGHỆ SINH HỌC
BÁO CÁO TỔNG KẾT ĐỀ TÀI
XÂY DỰNG NGÂN HÀNG DỮ LIỆU HỆ PROTEIN
HUYẾT THANH NGƯỜI VIỆT NAM ĐỂ ĐỐI PHÓ CHẨN ĐOÁN
BỆNH ĐÁI THÁO ĐƯỜNG TYPE 2 VÀ UNG THƯ
CNĐT: PHAN VĂN CHI
8315
HÀ NỘI – 2011
Trang 2BÁO CÁO TỔNG KẾT ĐỀ TÀI
MỞ ĐẦU
Hiện nay, các nghiên cứu về y sinh học hiện đại, triển khai các kỹ thuật proteomics trong tìm kiếm các biomarker có khả năng ứng dụng trong việc phát hiện, chẩn đoán và điều trị các bệnh nan y đang là mối quan tâm của các nhà khoa học trên thế giới và Việt Nam Biomarker không đòi hỏi các bước nghiên cứu nhiều thử thách như trong truy tìm gen liên quan đến bệnh lý, hay như việc tạo những sản phẩm protein trị liệu, vaccine thường đòi hỏi
kỹ thuật cao, công phu và tốn kém Trang bị chính của nghiên cứu biomarker là các thiết bị phân tách, làm sạch và nhận dạng, xác định các protein/proteome (hệ máy khối phổ phân giải cao cộng với khả năng sử dụng những chương trình điện toán về proteomics) hiện đã được thiết lập ở một số cơ sở nghiên cứu Hơn nữa, chúng ta có những lợi điểm không chỉ
về số lượng mẫu phẩm dồi dào của các loại bệnh, mà còn dồi dào các dữ kiện lâm sàng trong việc đánh giá khả năng ứng dụng các biomarker trong trị liệu Đây là những yếu tố cần thiết cho thống kê để thu đựơc những biomarker có độ chính xác cao qua việc xác định cũng như loại trừ các protein trong nhóm biomarker Điểm đặc biệt nữa là giá trị đặc thù của biomarker có thể có liên quan đến “dấu ấn” sinh học của chủng tộc Các dấu ấn này cũng sẽ
là chủ đề quan trọng cho những nghiên cứu y học từ nguyên nhân bệnh lý cho đến tác động môi trường, cũng như dược học trong việc tìm kiếm hay thẩm định tính trị liệu của các dược phẩm ở Việt Nam Với những kỹ thuật và các kết quả bước đầu thu nhận được trong thời gian vừa qua của các cán bộ Viện Công nghệ sinh học, Viện Khoa học và Công nghệ Việt Nam trong nghiên cứu hệ protein huyết thanh người Việt Nam bằng các kĩ thuật proteomics
có thể được coi là tiền đề cho các nghiên cứu tiếp theo về mối quan hệ giữa các marker protein liên kết với một số bệnh lý trong chẩn đoán lâm sàng Đó cũng chính là mục đích của các nghiên cứu về hệ protein người nói chung và hệ protein huyết thanh người nói riêng,
là tìm hiểu bức tranh tổng thể của các protein được biểu hiện, có thêm hiểu biết về các biến đổi của hệ protein trong các trạng thái bệnh lý và khả năng khai thác, sử dụng những thay đổi này như các công cụ chẩn đoán hoặc điều trị các bệnh cho con người Trên cơ sở những trang thiết bị khá đồng bộ và hiện đại về proteomics được đầu tư theo Dự án “Phòng thí nghiệm Trọng điểm Công nghệ Gen” tại Viện Công nghệ Sinh học, Viện KH&CN Việt Nam và những kết quả nghiên cứu bước đầu về xác lập các phương pháp phân tích protein/proteome, tìm kiếm các chỉ thị protein trong huyết thanh người trong thời gian qua,
chúng tôi đã được phê duyệt đề tài “Xây dựng ngân hàng dữ liệu hệ protein huyết thanh
người Việt Nam để phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia” giai
đoạn 2008-2010 với mục đích nghiên cứu có hệ thống hệ protein huyết thanh người Việt Nam ở trạng thái bình thường và các trạng thái bệnh ĐTĐT2, leukemia, tìm những protein
có biến đổi đặc trưng cho các trạng thái bệnh có thể phát triển thành các chỉ thị chẩn đoán bệnh
Trang 3Mục tiêu của đề tài
9 Phân tích, xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam bình thường và một số trạng thái bệnh lý (đái tháo đường type 2, leukemia, ) bằng các
kỹ thuật proteomics và bioinformatics;
9 Nhận dạng và xác định các ứng viên chỉ thị protein có biến đổi về cấu trúc và chức năng liên quan đến sự phát sinh và phát triển của bệnh đái tháo đường type 2 và leukemia ở Việt Nam;
9 Nghiên cứu khả năng ứng dụng các chỉ thị protein trong phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia
Nội dung chính của đề tài
9 Phân tích, xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam bình thường và một số trạng thái bệnh lý (đái tháo đường type 2 và leukemia…) bằng các
kỹ thuật proteomics và bioinformatics
9 Phân tích, nhận dạng và xác định các ứng viên chỉ thị protein (protein markers candidates) đối với bệnh đái tháo đường type 2 và leukemia
9 Thử nghiệm ứng dụng các ứng viên chỉ thị protein trong chẩn đoán
Trang 4PHẦN I TỔNG QUAN TÀI LIỆU Tại sao phải nghiên cứu hệ protein (proteome)?
Thách thức chính hiện nay đối với những nhà sinh vật học là sử dụng sự phong phú về thông tin di truyền sẵn có từ chương trình xác định trình tự gen không phải chỉ để giải mã trình tự các acid amin của những protein được mã hóa mà còn là xác định những chức năng của chúng Có rất nhiều nhân tố có ảnh hưởng đến gen, sự biểu hiện của protein và cả trực tiếp đến protein Vì thông tin giữa gen và protein là hai chiều, kiểu hình (phenotype) của tế bào bị ảnh hưởng bởi những tương tác giữa các quá trình chuyển hoá được điều chỉnh một cách thống nhất bên trong tế bào Protein là đầu ra về chức năng của tế bào và do đó có thể cho biết những thông tin thích đáng nhất, đặc biệt khi giải thích về sự biểu hiện của chúng
có tính đến động học trong ngữ cảnh của các quá trình hóa sinh đặc biệt Sự biểu hiện hoặc chức năng của protein được điều hoà ở tại nhiều thời điểm, từ phiên mã đến dịch mã và sau dịch mã Các quá trình này, nói chung đều không thể dự đoán được từ kết quả phân tích trình tự gen Sau dịch mã, đa phần các phân tử protein lại bị biến đổi hoá học bởi các tương tác protein-protein hay các phản ứng với các nhóm carbohydrate, phosphate Chính những biến đổi này (post-translational modifications, PTMs) đóng vai trò chủ yếu trong kích hoạt chức năng của nhiều protein chứ không phải được mã hoá trực tiếp từ gen Kết quả là từ một gen ban đầu ta có thể tìm thấy sự đa dạng về biểu hiện, cấu trúc và chức năng của rất nhiều loại protein khác nhau Ở các cơ thể khác nhau, mức độ đa dạng này cũng khác nhau Những nghiên cứu sơ bộ cho thấy, từ một gen có thể phát sinh từ một tới hai protein trong
vi khuẩn, ba trong nấm men, và tới hơn sáu ở người (Wilkins MR et al, 1996; Banks RE et
al, 2000; Tyers M and Mann M, 2003) Trên cơ sở số gen đã phát hiện và các khả năng biến
đổi sau dịch mã, người ta cũng đã ước tính trong cơ thể người có tới một triệu protein cần
được nghiên cứu (Banks RE et al, 2000; Jensen ON, 2004) Từ sự phân tích trên ta có thể
thấy, mặc dù proteome là bổ trợ của genome, đây vẫn là hai khái niệm khác nhau cả về không gian và thời gian Khi trình tự của gen không thể cho biết các thông tin về các biến đổi sau phiên mã có ảnh hưởng và quyết định đến chức năng và hoạt tính của protein thì mức độ biểu hiện gen không thể phản ánh đúng về số lượng protein có hoạt tính trong tế bào Thực ra cũng chỉ có khoảng 2% số bệnh tật đã biết được xác định là do có các sai lệch
về trình tự gen, hay còn được coi là monogenic (Strohman R, 1994); 98 % số bệnh còn lại cần được làm sáng tỏ ở mức tương tác giữa các protein, hay còn gọi là mạng protein
(protein network) (Ideker T et al, 2008 ) Bài toán đặc biệt quan trọng này của proteomics sẽ
bao gồm cả việc xác định các PTMs và vai trò của chúng trong các quá trình điều hoà và ương tác protein-protein Nghiên cứu về proteome chính là nghiên cứu trực tiếp về chức năng của genome, và do đó có thể trả lời được các câu hỏi sau: (i) phần nào của genome đư-
t-ợc biểu hiện; (ii) ở đâu, khi nào và có bao nhiêu sản phẩm đưt-ợc biểu hiện; (iii) các sản phẩm protein bị biến đổi như thế nào và (iv) các sản phẩm có những tương tác gì và kết quả của những tương tác này là gì Bộ gen là tập hợp các thông tin mã hoá và chỉ dẫn cho quá trình tạo ra các protein, còn proteome thì phức tạp hơn nhiều Dựa trên sự phân loại các vùng (domain) có liên quan đến các chức năng của các protein, Venter và các cộng sự
Trang 5(Venter JC et al, 2001) đã tiến hành dự đoán và phân chia tỷ lệ của các sản phẩm protein có thể có từ hệ gen người (Nanni L et al, 2010)
Cho đến nay chưa có thể xác định chính xác liệu có bao nhiêu loại protein có thể có trong mỗi tế bào người Những công bố gần đây nhất cho thấy, đã có thể xác định và chú giải cho
21 037 trình tự protein từ bộ gen người (Imanishi T et al, 2004) Cùng với sự phát triển của
các kỹ thuật proteomics, ngày càng có thêm nhiều các loại protein được nhận dạng và xác định, bổ trợ cho các trình tự đã công bố của bộ gen Ví dụ, trong huyết thanh người, nếu như
năm 2002 chỉ mới phát hiện được 490 loại protein khác nhau (Adkins JN et al, 2002) thì những công bố năm 2004 cho thấy con số này đã là 1.444 (Chan KH et al, 2004) và gần đây
nhất, năm 2005, theo kết quả xác định và so sánh của 35 phòng thí nghiệm trong dự án
proteome huyết tương người của HUPO, con số này đã có thể là 3.020 (Omenn GS et al,
2005)
Lượng thông tin phong phú do các nghiên cứu về proteome đem lại hoàn toàn bổ trợ cho những thông tin di truyền từ những nghiên cứu về genome Proteomics sẽ là cơ sở cho sự phát triển của genomics chức năng Sự phối hợp giữa genomics, proteomics và bioinformatics sẽ đóng vai trò chủ đạo trong những nghiên cứu về sinh-y học, là nền tảng cho sự phát triển các sản phẩm chẩn đoán và chữa bệnh trong tương lai Chỉ ngoại trừ một
số bệnh di truyền, mà gen đóng vai trò quan trọng trong chẩn đoán, phần lớn các bệnh mãn tính như ung thư, tim mạch, đái tháo đường đều liên quan đến mức độ biểu hiện, hoạt
động và tương tác giữa các protein (Kristine AP et al, 2009) Như vậy, dấu ấn sinh học
(biomarker) hay còn được gọi là “chữ ký” (signature) trong các trường hợp này chính là những chỉ thị protein, những phân tử không chỉ mang bí ẩn về các quá trình bệnh lý, mà còn
có thể mang tính đặc thù, liên quan tới nhiều yếu tố, bao gồm cả vấn đề chủng tộc và sinh thái Việc truy tìm các chữ ký sinh học này sẽ giúp đạt được những kết quả có tầm ứng dụng hữu hiệu và lớn lao trong y học Nghiên cứu biomarkers sẽ giúp tạo được những mô hình phân tử về bệnh lý có khả năng khảo sát được bằng những thí nghiệm cụ thể, qua đó có thể xác định được vai trò của gen và sản phẩm của nó cho chẩn đoán và trị liệu Theo xu hướng phát triển của các bộ môn Genomics, Proteomics và Bioinformatics, hiện đã có một mạng lưới liên kết các phòng thí nghiệm nhằm tiến đến tạo dựng một kho dữ liệu (consortium) các biomarker cho các bệnh lý và các đề tài sinh học khác (http://www.innovation.org/index.cfm/NewsCenter/Briefings/The_Biomarkers_Consortium)
Trên cơ sở đánh giá tình hình nghiên cứu, phân tích những công trình nghiên cứu có liên quan có thể thấy, proteomics thật sự đã làm thay đổi rất nhiều trong sinh học và các ngành liên quan Nhờ có các khái niệm mới về proteomics, sự sống của các phiên bản genome tĩnh lặng đã thật sự trở thành những proteome năng động Việc nghiên cứu proteome-tập hợp các protein được biểu hiện bổ trợ của hệ gen và cũng là của một mô hay một kiểu tế bào, sẽ giúp thu được những thông tin bổ sung hữu ích cho những kiến thức mới hỗ trợ cho những nghiên cứu chẩn đoán và lâm sàng Đây cũng chính là cách tiếp cận để tìm kiếm các biomarkers, “chữ ký” hay còn được coi là một nhóm gene hay protein của một hiện tượng/dữ kiện sinh học Biomarker đã là một trong những nghiên cứu trọng yếu của sinh
Trang 6học hiện đại trong những năm qua, và đã có những kết quả cho thấy tầm quan trọng và tương quan lớn lao của biomarker trong rất nhiều ngành của bộ môn Sinh-Y- Dược học Từ các công trình nghiên cứu biomarker ở nhiều trung tâm nghiên cứu, đã có những thành quả hứa hẹn những ứng dụng rất tốt đẹp của biomarker cho việc chẩn đoán bệnh và trị liệụ Việc ứng dụng biomarker để hoàn chỉnh hoặc thay thế các thử nghiệm thường quy sẽ chỉ còn là vấn đề thời gian Những biomarker này nhằm giúp tiên đoán sớm và chính xác các trường hợp bệnh lý từ ung thư đến tim mạch, đái tháo đường…; biomarker còn có giá trị tiên đoán hiệu ứng của thuốc để giúp các chuyên gia y tế lấy quyết định đúng đắn nhất cho việc điều trị bệnh nhân Đi xa hơn nữa, biomarker có tiềm năng trong ứng dụng liệu pháp trị liệu cá nhân (personalized medicine)
Như đã nêu trên, nền tảng của nghiên cứu biomarker dựa trên các protein, vì thế vai trò của nghiên cứu proteomics là thiết yếu Tuy nhiên, số lượng lớn lao (dự đoán khoảng có từ 300.000 đến 500.000 protein), và đặc biệt là bản chất phức tạp của protein là một trở ngại lớn cho các nghiên cứu biomarker Theo các tài liệu nghiên cứu, hiện đã có khoảng gần
1500 ứng viên proteins được coi là có liên quan đến ung thư và đương nhiên là việc tiêu chuẩn hóa các protein này là cần thiết để chọn lọc những protein thực sự có gía trị ứng dụng Hơn nữa, thực tế đòi hỏi phải có những thử nghiệm lâm sàng chi tiết và cũng có thể dài hạn, trước khi triển khai các biomarker thành sản phẩm có giá trị trong cộng đồng xã hội (Polanski M, Anderson NL, 2006; Austin MJF, Babiss L, 2006)
Huyết thanh là một hệ protein đặc biệt trong chẩn đoán bệnh, cách tiếp cận
Sự hấp dẫn của huyết thanh đối với việc chẩn đoán bệnh được quyết định bởi hai đặc trưng: (i) mẫu có thể lấy dễ dàng và an toàn, (ii) mẫu không chỉ phản ánh toàn diện phenotype người, mà còn cho biết trạng thái của cơ thể ở tại một thời điểm đặc biệt nào Có
thể phân các protein trong huyết thanh thành các nhóm: (1) Các protein được tiết ra từ các
mô Đó là các protein phần lớn được tiết ra từ gan, ruột và có khối lượng phân tử lớn hơn 45
kDa, lớn hơn kích thước các phân tử có thể lọc qua thận Chính vì vậy, chúng có thể kéo dài
thời gian lưu hành trong huyết thanh; (2) Các globulin miễn dịch Đó là các kháng thể hoạt
động chủ yếu trong huyết tương, đại diện cho một lớp protein phức tạp nhất Đã có những ước tính cho rằng phải có tới hàng triệu trình tự của các kháng thể khác nhau lưu hành trong
hệ tuần hoàn của một người trưởng thành (Anderson NL, & Anderson NG, 2002); (3) Liên kết thụ cảm “khoảng cách xa” Trong nhóm protein này gồm các peptide ”cổ điển” và những protein hormone (ví dụ như insulin, erythropoietin ; (4) Liên kết thụ cảm “địa phư- ơng” Loại này bao gồm các cytokine và những tác nhân điều hòa ở khoảng cách ngắn Đây
thường là các peptide có trọng lượng phân tử nhỏ, dễ dàng bị lọc qua thận Bởi vậy, chúng chỉ lưu hành trong thời gian ngắn ở huyết tương và có vẻ như được thiết kế để làm trung
gian cho tương tác giữa các tế bào, sau đó được hoà loãng vào trong huyết tương; (5) Các
“hành khách” tạm thời Đó là những protein không phải hormone, tạm thời lưu thông trong
huyết tương trên đường chuyển động tới vị trí hoạt động của chúng Ví dụ, các protein từ lysosome được tiết ra và sau đó qua một hệ thụ cảm (receptor) được tập hợp trong những
thể tiêu bào; (6) Các sản phẩm phát sinh từ các mô Đó là những protein hoạt động bình
Trang 7thường ở các tế bào/mô, nhưng có thể được giải phóng vào huyết tương sau khi các tế bào bị chết hoặc bị tổn thương Các protein này bao gồm nhiều loại marker quan trọng như troponin, creatine kinase, hoặc myoglobin (đang được sử dụng trong chẩn đoán bệnh nhồi
máu cơ tim); (7) Các protein tiết ra do bị lỗi Những protein này được giải phóng từ những
khối u hoặc mô bị bệnh Đó có thể là những marker ung thư mà cũng có thể là những protein bình thường, được các tế bào khối u biểu hiện, tiết ra, hoặc được giải phóng vào
trong huyết tương; (8) Các protein ngoại lai Đó là những protein của những cơ thể lây
nhiễm (vi sinh vật) hoặc các ký sinh được giải phóng và lưu hành trong hệ tuần hoàn Sự hiện diện của những lớp protein kể trên cho thấy sự đa dạng rất đáng ngạc nhiên của hệ proteome huyết thanh Câu hỏi là: có bao nhiêu protein có mặt trong huyết thanh? Nếu tính rằng mỗi loại protein huyết thanh lại có chừng 10 đến 20 dạng glycosyl hoá với khoảng 5 kích thước khác nhau, thì tổng số sẽ phải có ít nhất khoảng 50 000 dạng phân tử protein khác nhau Ngoài ra, phải kể đến một nhóm khá lớn các protein được hình thành và tiết từ các mô trên cơ sở số gen đã được xác định trong bộ gen người (25 000 – 30 000) và số sản phẩm protein có thể được phát sinh từ mỗi gen (khoảng 10 protein/gen) Như vậy, về mặt nguyên lý, huyết thanh là một proteome khá toàn diện và cũng là phiên bản lớn nhất Sử dụng huyết thanh trong chẩn đoán bệnh là một cách tiếp cận hiển nhiên, được tiến hành
thành công trong mấy thập niên qua (Burtis CA & Ashwood ER, 1999; Lembo AJ et al, 2009; Magni F et al, 2010) Tuy nhiên, tiềm năng của cách tiếp cận ”trực tiếp” này không
phải lúc nào cũng dễ được xác định Thách thức lớn nhất trong nghiên cứu proteome huyết thanh người không chỉ ở số lượng quá lớn các protein (>10 000 loại) có mặt trong đó, mà còn là tỷ lệ về hàm lượng quá chênh lệch của chúng (1012) Chỉ một nhóm nhỏ các protein như albumin, alpha2-macroglobulin, transferin và immunoglobulin đã chiếm tới hơn 80 % lượng protein tổng số của huyết thanh gây trở ngại cho việc ứng dụng kỹ thuật 2-DE truyền
thống (Tirumalai RS et al., 2003; Zhang R et al, 2004, Sarker M, Hanumanthu G & Pandey
A, 2007) Để có thể tiến hành những phân tích hữu hiệu, thông thường những protein có nồng độ quá cao thường phải được loại bỏ, nhưng khi thực hiện kỹ thuật này hàng loạt các protein quan trọng có nồng độ thấp (ví dụ, cytokine) cũng có thể bị loại mất theo Những công bố gần đây đã cho thấy, số lượng các protein phân tích được bằng phương pháp khối phổ cũng phụ thuộc rất nhiều vào các kỹ thuật xử lý và tách chiết ban đầu đối với các mẫu
huyết thanh (Anderson NL & Anderson NG, 2002; Adkins JN et al, 2002; Celis JE et al, 2004; Tirumalai RS et al, 2003; Diamandis EP, 2007) Cũng vì các lý do kể trên, việc chọn
và kết hợp sử dụng hợp lý các phương pháp, đặc biệt là các phương pháp có độ nhạy và chính xác cao như sắc ký lỏng đa chiều (MDLC) và điện di trên gel kết hợp với các hệ khối phổ liên tiếp (MALDI và ESI-MS/MS) có độ nhạy và phân giải cao, có thể tự động phân tách, nhận diện và xác định tổng thể, bao gồm cả những protein/peptide ở nồng độ thấp (fmol) dựa trên các Ngân hàng dữ liệu Gen và Protein NCBInr và MSDB là hết sức quan trọng trong phân tích và tìm kiếm các marker chẩn đoán trong huyết thanh Một điểm đáng chú ý là khi nghiên cứu hệ protein huyết thanh bằng hệ LC-MS/MS cho thấy khả năng phân tích và nhận diện khá toàn diện không chỉ về thành phần, mà còn những biến đổi có thể về cấu trúc và tương tác của nhiều loại protein Cũng chính vì vậy, những nghiên cứu với các cách tiếp cận tương tự có thể giúp tìm kiếm những protein marker đích thực cho việc giải
Trang 8thích các cơ chế bệnh sinh, chẩn đoán và đánh giá tác động của thuốc Sử dụng cách tiếp cận và các phương pháp như mô tả trên sẽ cho phép thấy được bức tranh về tương tác của cả tập hợp các chỉ thị protein có nguồn gốc từ các các mô khác nhau, có liên quan đến quá trình phát sinh và phát triển của bệnh lý, đề xuất phương pháp chẩn đoán đúng, loại trừ những sai sót do chỉ dựa trên những chỉ thị đơn lẻ (Diamandis EP, 2004; Hortin
GL et al, 2006; Horin GL, 2007) Đây cũng là một trong những nội dung và mục đích
nghiên cứu chính của Dự án Proteome Huyết tương Người (Human Plasma Proteome Project) hiện được coi là một trong những dự án quan trọng nhất của Tổ chức Nghiên cứu Proteome Người (Human Proteome Organization, HUPO, http://www.hupo.org; và Asia and Oceania Human Proteome Organization, AOHUPO, http://www.aohupo.org) với sự tham gia của hàng chục phòng thí nghiệm proteomics hàng đầu trên thế giới Cũng cần phải nói thêm, mặc dù HUPO mới chỉ hoạt đông từ 2001, nhưng đã đạt được nhiều thành tựu trong phối hợp giữa các thành phần nhà nước và tư nhân, đã nỗ lực tạo dựng sự hợp tác có hiệu quả của một thế hệ mới các nhà khoa học nghiên cứu proteomics, xây dựng nền tảng vững chắc về proteomics, mang lại trật tự mới trong nghiên cứu hệ protein trong tế bào, thúc đẩy những nghiên cứu và sự phát triển của liên ngành Sinh-Y-Dược học Nếu các hội nghị quốc tế HUPO thường niên lần 1-3 (Versailles 2002, Montreal 2003, Bejing 2004) chỉ chủ yếu giới thiệu các kết quả về giải mã hệ gen, thì hội nghị HUPO lần 4 (Munich 2005) đã tập trung chủ yếu vào chức năng của hệ gen (From Defining the Proteome to Understanding Function), còn tiêu đề của hội nghị HUPO lần 5 (California 2006) đã là áp dụng những nghiên cứu từ phòng thí nghiệm phục vụ người bệnh (Translating Proteomics from Bench to Bedside), và từ hội nghị HUPO lần 6 (Seoul 2007) là phát triển công nghệ và ứng dụng các biomarkers (Proteomics: from Technology Development to Biomarkers Applications)
Nghiên cứu proteomics đối với đái tháo đường type 2
Mặc dù, cơ chế phân tử của sự phát triển bệnh đái tháo đường (ĐTĐ) và các biến chứng của chúng đã được nghiên cứu nhiều, những hiểu biết để phát hiện giai đoạn sớm của ĐTĐ còn hạn chế Việc triển khai các kỹ thuật sinh học phân tử đã mở ra một hướng mới để tìm hiểu quá trình phát triển bệnh cũng như chẩn đoán bệnh ở giai đoạn sớm Bằng cách sử dụng các
kỹ thuật genomic các nhà khoa học đã tìm ra một số gen được coi lá có liên quan đến bệnh ĐTĐ type 2 như: PPARγ (Peroxisome Proliferator Activated Receptorγ) (Yael R et al,
2010), IRS-1 (insulin receptor substrate 1) (Bishop JR et al, 2010), KCJN11 (potassium
inward rectifier 6.2) (Winkler M et al, 2009), SLC2A1 (glucose transporter 1), PPARGC-1 (PPARγ -coactivator-1) (Joly E et al, 2009) và CAPN10 (calpain 10), TCFL2 (transcription
factor 7-like 2) (Chauhan G et al, 2010; Dennis T et al, 2010) Năm 2005, một tổ chức
nghiên cứu ĐTĐ ở Madras khi nghiên cứu đa hình gen k121Q nhận thấy chúng có vai trò quan trọng với sự phát triển của bệnh ĐTĐ type 2 ở các tộc người châu Âu và Á (Abate N
et al, 2005) Mohan và cộng sự khi nghiên cứu trên nhóm người Ấn Độ và Châu Âu cũng đã
tìm thấy sự liên quan của đa hình alen A Thr394Thr (G-A) ở gen PCG-1 với ĐTĐ type 2
(Vimaleswaran KS et al, 2005) Ngoài ra, khi nghiên cứu mức độ biểu hiện của các gen ở
các bệnh nhân ĐTĐ type 2, Rao cùng cộng sự đã chỉ ra gen PBCs biểu hiện tăng trong máu của các bệnh nhân này, đồng thời ông cũng cho thấy mức độ biểu hiện gen lipoprotein
Trang 9lipase (LPL) và Apolipoprotein C – III (APOC III) có sự khác nhau ở những người bị ĐTĐ
type 2 và hội chứng tăng lipid (Rao PV et al, 2005) Những nghiên cứu này mở ra triển
vọng cho các nhà khoa học trong việc kiểm tra cơ chế gây bệnh và khả năng chỉ thị của các gen này trong việc chẩn đoán bệnh ĐTĐ type 2
Với sự phát triển của các kỹ thuật proteomic, những biểu hiện của ĐTĐ type 2 cũng được
nghiên cứu ở mức độ protein (Hongfang L et al, 2010) Ngay từ năm 1996, Rema cùng cộng
sự cho thấy mức độ biểu hiện của haptoglobulin huyết thanh tăng lên ở các bệnh nhân ĐTĐ type 2 so với mẫu đối chứng (Rema M, Mohan V, Snehalatha C, 1996) Năm 2004, Zhang
và cộng sự bằng cách sử dụng 2DE kết hợp khối phổ đã chỉ ra mức độ biểu hiện của các protein như haptoglobulin, complement component 3, complement component 4, alpha2-HS glycoprotein, Alpha-1B-glycoprotein, Alpha-1-antichymotrypsin, Apolipoprotein-AI, Apolipoprotein B100, Factor H, Pro-platelet basic protein, Serine (hoặc cysteine) proteinase Inhibitor clade A, Serine (hoặc cysteine) proteinase Inhibitor clade C, Vitronectin precursor, Fibronectin, C1 inhibitor, Alpha-2 macroglobulin có sự thay đổi ở bệnh nhân ĐTĐ type 2
(Zhang R et al, 2004) Khi nghiên cứu hệ protein của nước tiểu bằng cách sử dụng các
phương pháp proteomic, Jain và cs đã tìm thấy sự biểu hiện đặc biệt của 4 protein, chỉ thị của ĐTĐ type 2: zinc alpha-2 glycoprotein, alpha-1 acid glycoprotein, alpha-1
microglobulin và IgG (Jain S et al, 2005) và năm 2009, Jiang H cùng cộng sự đã chứng
minh rằng protein E-cadherin trong nước tiểu cũng được coi là chỉ thị cho ĐTĐT2 (Jiang H
et al, 2009) Nghiên cứu gần đây nhất của một nhóm các nhà khoa học người Ấn Độ trên hệ
proteome nước tiểu cho thấy khi so sánh mức độ biểu hiện của protein nước tiểu ở các bệnh nhân ĐTĐ bệnh thận so với ĐTĐ không mắc bênh thận bằng 2 DE đã chỉ ra 7 protein có
mức độ biểu hiện tăng lên hơn 1,5 lần ở: 1B-Glycoprotein tăng 7 lần, zinc- 2-glycoprotein (5.9 lần), 2-HS-glycoprotein (4.7 lần), vitamin D–binding protein (VDBP) (4.8 lần),calgranulin B (3.9 lần), 1-antitrypsin (A1AT) (2.9 lần), và hemopexin (2.4 lần ) Đặc biệt
so sánh với các mẫu đối chứng người ta còn nhận thấy VDBP tăng 11.1 lần, zinc- glycoprotein (6.0 lần), 2-HS-glycoprotein precursor (2.3 lần), và A1AT(2.2 lần) Và 4 protein có mức độ biểu hiện giảm dưới 1.5 lần ở các bệnh nhân ĐTĐ bệnh thận so với ĐTĐ không mắc bệnh thận là Transthyretin giảm 4.3 lần, apolipoprotein (apo) A-I(3.2 lần), 1-microglobulin/bikunin precursor (AMBP) (1.61 lần),và plasma retinol-binding protein (1.52 lần) So sánh với các mẫu đối chứng thì mức độ giảm của các protein này càng rõ rệt hơn: AMBP giảm 5.06 lần, retinol-bindingprotein (2.56 lần) và apoA-I (2.53 lần) (Rao PV et al,
2-2007).Xinghai Li cùng cộng sự cũng đã chỉ ra rằng Atk có chức năng như một phần của con đường tín hiệu insulin ức chế trực tiếp PGC-1γ (peroxisome proliferator activated receptor-coactivator) trong các tế bào gan Con đường này có thể điều khiển sự tiết lipid ở ĐTĐ type
2 như ức chế PGC-1γ gây ra Akt dẫn đến hạn chế sự oxi hóa axit béo ở gan Đẩy mạnh tác động của PGC-1γ trong các tế bào gan kháng insulin có thể chống lại sự không cân bằng lipid quan sát thấy ở ĐTĐ type 2 (Xinghai Li, 2007) Bên cạnh đó, khi nghiên cứu các tế bào thần kinh Huang CJ cùng cộng sự đã khẳng định rằng protein Calcium-activated
calpain-2 có liên quan đến sự phá hủy tế bào beta của bệnh nhân ĐTĐ2 (Huang CJ et al,
2010) Như vậy, việc sử dụng các kỹ thuật proteomic trong nghiên cứu hệ protein nói chung
Trang 10của các bệnh nhân ĐTĐ type 2 mở ra cơ hội mới trong việc tìm kiếm các biomarker phục vụ chẩn đoán sớm bệnh
Ở Việt Nam, do tỷ lệ ngày một gia tăng cũng như các nguyên nhân và biến tính phức tạp của bệnh ĐTĐ type 2, nhiều nghiên cứu về dịch tễ, các phương pháp điều trị và dự phòng đã được tiến hành và tổng kết (Tạ Văn Bình và cs, 2006) Về mặt chẩn đoán, chủ yếu tập trung vào các xét nghiệm đường huyết thanh nhanh, xét nghiệm dung nạp đường qua đường miệng, xét nghiệm đường huyết thanh ngẫu nhiên, xét nghiệm đường máu lúc đói hoặc tầm soát máu bằng chích đầu ngón tay Như vậy, bệnh thường chỉ được phát hiện khi nồng độ
đường trong máu đã tăng cao (Nguyễn Khoa Diệu Vân và cs, 2005; Tạ Văn Bình, 2006)
Cũng đã có một số nghiên cứu về quan hệ giữa nồng độ của CPR (C reactive protein) – một protein miễn dịch với BMI (body mass index) một chỉ số ở các bệnh nhân ĐTĐ type 2 (Hoàng Đăng Mịch, 2006), hay giá trị của HBA1C huyết thanh trong chẩn đoán ĐTĐ (Nguyễn Thị Phương Mai và cs, 2006)
Nghiên cứu proteomics đối với leukemia
Leukemia là một dạng ung thư của cơ quan tạo ra các huyết cầu như tủy xương và hệ thống bạch huyết (lymph system) Trong leukemia các bạch cầu được sản xuất một cách nhanh chóng rối loạn tạo ra các bạch cầu bất thường không hoạt động được và các bạch cầu ung thư này dần dần xâm lấn đến các hồng cầu và tiểu cầu, ngăn chặn sản xuất và phá hủy các tế bào này Nói chung, leukemia chia làm 2 dạng cấp tính và mãn tính Leukemia cấp tính có triệu chứng sớm, tiến triển nhanh, nếu không chẩn đoán và điều trị sớm sẽ đưa đến tử vong nhanh và có nhiều subtyp khác nhau Leukemia loại mãn tính có tiến triển chậm, thường không có hay có ít triệu chứng trong nhiều năm Những nghiên cứu proteomics đối với leukemia không chỉ làm sáng tỏ về phân loại leukemia, mà còn góp phần xác định các
kháng nguyên ung thư, chẩn đoán sớm và đánh giá quá trình điều trị bệnh (Cui JW et al, 2004; Cui JW et al, 2005)
Trong năm năm gần đây, cùng với sự hoàn thiện việc đọc trình tự hệ gen (genome) người là
sự phát triển mạnh mẽ các phương pháp, kỹ thuật nhằm xác định chức năng của các gen và mối liên quan giữa chúng Đã có những nghiên cứu chỉ ra sự chuyển đoạn của các nhiễm sắc thể, các kiểu gen đặc biệt, các đột biến liên quan mật thiết với bệnh ung thư bạch cầu Kết quả của những thay đổi trên được phát hiện thấy cả ở mức độ biểu hiện mRNA, mức độ biểu hiện protein nhờ các phương pháp chính như RT-PCR, DNA microarray, các kỹ thuật/cách tiếp cận nghiên cứu proteomics như điện di 2 chiều, điện di 2 chiều nhuộm huỳnh quang (2D-DIGE), khối phổ (MALDI/SELDI-MS/MS), sắc ký lỏng khối phổ (LC-MS/MS) Các gen mã hóa cho CREB (cAMP response element binding protein), PRAME (preferentially expressed antigen in melanoma), FLT3 (Fetal Liver Tyrosine Kinase 3), p14ARF và p16INK4a, MTHFR là một vài trong số rất nhiều gen đã được phát hiện có mức độ biểu hiện mRNA bất thường liên quan tới bệnh bạch cầu Mặt khác, chúng cũng được xem như đích đến của các loại thuốc dùng điều trị bệnh Mã hóa cho protein bám nhân tố đáp ứng cAMP, CREB điều khiển các gen chịu trách nhiệm cho các quá trình tăng số lượng/trưởng, biệt hóa và sự sống sót của tế bào (Sakamoto KM, Frank DA, 2009) CREB
Trang 11được phát hiện biểu hiện thừa cả ở mức độ phiên mã mRNA và protein trong tủy xương ở hầu hết những bệnh nhân bị ung thư bạch cầu cấp tính và được xem là có vai trò rõ ràng như
một chỉ thị theo dõi diễn biến bệnh ung thư bạch huyết (AML) (Cheng JC et al, 2007)
PRAME (preferentially expressed antigen in melanoma) một loại kháng nguyên được nhận thấy có sự biểu hiện hiện quá mức (overexpression) ở 52.9% bệnh nhi tuổi bị mắc bệnh ung
thư bạch cầu/máu ác tính (Spanaki AC et al, 2007; Nicolas T et al, 2008) Tysosine kinase 3
kiểu FMS/một tysosine kinase xuyên màng (FLT3) được biểu hiện ở hầu hết các trẻ bị leukemia ác tính và được xem như một đích tiêu biểu trong điều trị bệnh leukemia ác tính
(Kappelmayer JM, Udvardy et al, 2007; Stubbs MC and Amstrong SA, 2007) MTHFR
(Methylenetetrahydrofolate reductase) là một enzyme liên quan trong sự trao đổi chất folate
và methyl hóa DNA (DNA methylation) Người ta đã chứng minh rằng biến thể đồng hợp tử MTHFR 1298CC liên quan chặt chẽ tới việc làm tăng nguy cơ mắc bệnh CML, và kiểu gen MTHFR 677CC và 1298CC có ảnh hưởng tới nguy cơ mắc bệnh CML và AML (Moon,
Kim et al 2007) Sự biểu hiện các gen ức chế bệnh ung thư p14ARF và p16INK4a đã được nghiên cứu ở 109 bệnh nhân nhiễm bệnh CML Kết quả cho thấy, mức độ biểu hiện mRNA của chúng rất thấp ở các bệnh nhân trong giai đoạn mạn tính và mức độ mRNA này đã tăng
cao rõ rệt ở các bệnh nhân CML được điều trị với interferon-alpha (IFN-α) (Cividin MO et
al, 2006)
Mức độ biểu hiện quá mức của một số protein lai (kết quả của sự chuyển đoạn nhiễm sắc thể) cũng như một số protein của tế bào tiền thân đã được công bố là ảnh hưởng rõ rệt tới sự biểu hiện của toàn bộ protein trong tế bào đó Sự chuyển đoạn nhiễm sắc thể t(15;17) tạo nên một protein lai (fusion protein) PML-RARα (Promyelocytic leukemia - retinoic acid
receptor-α) (Grignani FV et al, 1999; Choughule A et al, 2009) Protein này là dấu hiệu
phân tử của bệnh ung thư bạch cầu bạch huyết (Acute promyelocytic leukemia) đồng thời đóng vai trò quan trọng trong quá trình phát sinh bệnh ung thư bạch cầu do làm hỏng chức
năng bình thường của cả hai con đường (pathways) PML và RARα (Kakizuka AW et al 1991; Melnick A et al, 1999) Những nghiên cứu in vivo ở chuột chuyển gen và in vitro ở
các tế bào máu chứng minh ảnh hưởng của protein lai PML-RARα tới kiểu hình bệnh bạch cầu do ức chế sự biệt hóa và kích thích sự sống sót của các tế bào tiền thân tạo máu (Wang
ZG et al, 1998; Zhong SP et al, 2000) Ảnh hưởng trực tiếp của sự biểu hiện protein lai
PML-RARα lên toàn bộ mức độ biểu hiện các protein của dòng tế bào ung thư bạch huyết U937/ PML-RARα đã được Zada và cs phân tích dựa trên các phương pháp điện di hai
chiều và khối phổ (MALDI TOF TOF) (Zada AAP et al, 2006) Kết quả cho thấy, trong số
224 protein được nhận diện nhờ khối phổ có tới 47 protein bị thay đổi mức độ biểu hiện do ảnh hưởng của protein lai PML-RARα Một trong số 47 protein đó là oncoprotein 18 (OP18) Bằng phương pháp điện di hai chiều, các tác giả đã nhận thấy một isoform của OP18 đã biểu hiện tăng lên trong khi isoform còn lại biểu hiện giảm xuống dưới tác động của protein lai PML-RARα Bên cạnh đó, mức độ biểu hiện cao hơn của protein OP18 trong các tế bào biểu hiện PML-RARα được phát hiện là có liên quan tới mức độ biểu hiện mRNA cao hơn ở các tế bào từ những bệnh nhân ung thư bạch cầu huyết (APL) Nhóm nghiên cứu cũng chứng minh sự giảm mức phosphoryl hóa tại gốc amino acid Ser63 của
Trang 12protein OP18 dưới ảnh hưởng của protein lai PML-RARα ảnh hưởng tới chu kỳ tế bào ở các
tế bào của người ung thư bạch cầu APL: làm kết thúc quá trình phân bào của các tế bào blast (loại tế bào non không biệt hóa hoặc rất ít biệt hóa)
Ở một nghiên cứu khác trên các tế bào ung thư bạch cầu cấp tính AML và ALL có sự
chuyển đoạn nhiễm sắc thể t(4;11), Yocom và cs đã nhận thấy sự biểu hiện tăng lên của 11
protein khi so sánh với dòng tế bào đối chứng CD34+ và sự biểu hiện quá mức của các protein PGK1 (Phosphoglycerate kinase 1), HSP90 (heat shock protein 90 alpha) và nm23
(nucleoside diphosphate kinase) cũng đã được nhận diện (Yocum AK et al, 2006) Đã có
661 protein được nhận diện nhờ phương pháp đánh dấu đồng vị các amino acid (L-leucine - 98% của 13C6, 98% của 15N2 và L-Lysine: 2HCl – 98% 13C6, 98% 15N2) trong nuôi cấy tế bào động vật, kết hợp với phương pháp khối phổ lặp lại (MS/MS) nối trực tiếp với sắc ký lỏng hai chiều (2DLC- MS/MS) 518 protein trong số ấy được phát hiện có sự thay đổi về mức độ biểu hiện Trong số này có 6 protein có vai trò trong quá trình apoptosis và 2 protein
có vai trò trong sự biệt hóa tế bào đã tăng về lượng ở những tế bào được xử lý với thuốc AAG (17-Allylamino-17-Demthoxygeldanamycin) so sánh với nhóm đối chứng (cơ chế tác động của 17-AAG là cạnh tranh với ATP trong cấu trúc 3 chiều chỉ được nhận thấy trong tế bào ung thư, qua đó làm giảm sự bảo vệ của các protein “khách” gây ung thư) Nghiên cứu cũng gợi ý rằng HSP90 như là đích tiêu biểu được ức chế bởi các thuốc, còn nm23 như là một chỉ thị sinh học cho quá trình đánh giá hiệu quả điều trị Một nghiên cứu khác sử dụng phương pháp điện di hai chiều kết hợp với kỹ thuật khối phổ MALDI-TOF MS cũng thông báo rằng sự biểu hiện quá mức của PLCβ1 (inositide-specific phospholipase C, đồng dạng chính định vị trong nhân) đã dẫn tới hiện tượng điều chỉnh xuống mức độ biểu hiện của protein SRp20 (một protein định vị trong nhân tế bào, là thành viên của một họ các protein
17-điều chỉnh việc gắn nối mRNA (splicing) giàu acid amine serine-arginine) (Bavelloni A et
al, 2006)
Bên cạnh việc nghiên cứu sự biểu hiện toàn bộ các protein trong các tế bào ung thư bạch cầu dưới ảnh hưởng của sự biểu hiện quá mức một protein nào đó hoặc bởi sự xuất hiện một protein lai mới, nhiều nghiên cứu đã tập trung khai thác mức độ biểu hiện của các protein trong huyết thanh/huyết tương (plasma/serum) của những người mắc bệnh ung thư bạch
cầu Protein FLT3 và sự phosphoryl hóa của nó trong các mẫu plasma thu thập từ 85 bệnh
nhân mắc bệnh ung thư bạch cầu AML và 5 bệnh nhân mang bệnh ALL đã được đánh giá Không có sự khác biệt đáng kể nào về mức độ của các protein FLT3 có mặt trong huyết thanh những người bị bệnh bạch cầu khác nhau (AML và ALL) Tuy nhiên các bệnh nhân AML có tỉ lệ FLT3 phosphoryl hóa/FLT3 cao hơn mội cách có ý nghĩa với độ tin cậy lên tới 98% Protein FLT3 phosphoryl hóa được phát hiện thấy cao hơn một cách đáng kể trong plasma của những người bệnh mang các đột biến của FLT3 với mức độ tin cậy là 99.98% Nhìn chung không có mối liên quan giữa sự sống của bệnh nhân và mức độ protein FLT3 hoặc dạng phosphoryl hóa của nó trong huyết thanh Tuy nhiên, trong số các bệnh nhân không có các đột biến của FLT3, những bệnh nhân nào có mức độ phosphoryl hóa của FLT3 cao hơn thì có thời gian thuyên giảm bệnh ngắn hơn đáng kể (với độ tin cậy 96%)
(Ravandi F et al, 2007)
Trang 13Trong một nghiên cứu khác, 38 mẫu huyết thanh của các bệnh nhân mắc bệnh ung thư bạch cầu ác tính (34 ALL và 4 AML) đã được thu thập để theo dõi đánh giá mức độ biểu hiện của protein thymidine kinase (TK) trong thời gian mới chẩn đoán và trong quá trình điều trị bệnh Protein TK tham gia trong quá trình tổng hợp acid nucleic và do vậy nó được xem như một chỉ thị tăng trưởng ung thư quan trọng Kết quả thu được cho thấy, mức độ TK trong serum tại thời điểm chẩn đoán khá cao (78-5826U/I, giá trị trung bình 403 U/I, mức bình thường nhỏ hơn 8 U/I), và trong quá trình điều trị, bệnh thuyên giảm thì mức độ TK trong huyết thanh trở nên thấp hơn nhiều (5-80 U/I, giá trị trung bình 31 U/l) Nghiên cứu cũng công bố mức độ TK huyết thanh tăng lên ở các trường hợp tái phát bệnh ung thư bạch cầu ác tính (10-800 U/l) Những kết quả của nghiên cứu này gợi ý rằng mức độ TK huyết thanh trong quá trình điều trị bệnh ung thư bạch cầu có thể là chỉ thị hữu dụng để nhận diện giai đoạn sớm của việc tái phát bệnh (Votava T, 2007)
Bệnh leukemia đã được chú ý nghiên cứu từ nhiều năm nay ở Việt Nam và được coi là bệnh
lý ác tính của tổ chức tạo máu phát triển theo xu hướng không kiểm soát được của từng dòng tế bào bạch cầu Bệnh được đặc trưng bởi sự có mặt của các tế bào blast bất thường chủ yếu trong tủy xương và sự sản sinh các dòng tế bào máu bình thường bị hư hại Triệu chứng lâm sàng của thể điển hình có 5 hội chứng: thiếu máu, xuất huyết, nhiễm khuẩn, u, loét và hoại tử (Nguyễn Anh Trí, 1995; Đỗ Trung Phấn, 2003) Hiện nay việc chẩn đoán bệnh chủ yếu dựa vào lâm sàng và xét nghiệm Các xét nghiệm hiện nay đang được dùng bao gồm: huyết đồ, tủy đồ, hình thái và hóa tế bào, xác định các marker miễn dịch đặc hiệu (immunophenotyping), di truyền học (bao gồm xét nghiệm nhiễm sắc thể và xét nghiệm gen) (Thái Quí, 1997) Dòng tế bào ác tính thuộc loại tế bào dòng tuỷ hay dòng tế bào lympho, leukemia được chia thành leukemia cấp dòng tủy (Acute Myeloid Leukemia - AML) và leukemia cấp dòng lympho (Acute Lymphoblastic Leukemia - ALL) chủ yếu theo
phân loại của nhóm FAB (French-American-British Group, Bennett JM et al, 1976) và gần đây là của WHO (Bennett JM, 2000) Tùy theo đặc điểm hình thái và hóa tế bào, việc phân loại leukemia cấp dòng tủy và leukemia cấp dòng lympho dựa trên xét nghiệm các marker
miễn dịch trên bề mặt tế bào bằng kỹ thuật flowcytometry (Szczepanski T et al 2003;
Ottensmeier C, 2001) cũng đã được các tác giả tiến hành nghiên cứu (Đỗ Trung Phấn, 2003; Nguyễn Triệu Vân và cs, 2004)
Cơ sở thực hiện đề tài
Ở Việt Nam, những nghiên cứu proteomics mới chỉ bắt đầu được triển khai từ khi các Phòng Thí nghiệm Trọng điểm về Sinh học Phân tử, Công nghệ Gene và Protein, được thiết lập trong giai đoạn 2001-2005 Trong số các Phòng thí nghiệm trên phải kể đến: (i) Phòng Thí nghiệm Trọng điểm Công nghệ Gen tại Viện Công nghệ Sinh học thuộc Viện Khoa học
và Công nghệ Việt Nam; (ii) Phòng Thí nghiệm Trọng điểm về Protein và Enzyme thuộc Trường Đại học Quốc gia Hà Nội; (iii) Trung tâm Nghiên cứu Ứng dụng Y-Dược học, Học Viện Quân Y, Bộ Quốc phòng; (iv) các Phòng Thí nghiệm về Hoá sinh và Sinh học phân tử
có liên quan khác tại các Trường Đại học, Viện Nghiên cứu, Bệnh viện Trung ương thuộc
Bộ Y tế, Bộ Giáo dục và Đào tạo, Bộ Quốc phòng… Các nghiên cứu chủ yếu dựa trên các
kỹ thuật tinh chế hoặc phân tách các protein bằng điện di một hoặc hai chiều (1-DE/2-DE)
Trang 14sau đó xác định các protein/enzyme bằng các kỹ thuật hoá sinh hoặc miễn dịch, thông qua các đặc tính sinh học (hoạt tính, đặc tính kháng nguyên/kháng thể ) và gần đây là MALDI-TOF MS và MS/MS Tại Viện Công nghệ Sinh học thuộc Viện KHCNVN, ngoài các kỹ thuật phân tách protein truyền thống như sắc ký, điện di một (1-DE), hai chiều (2-DE) (bao gồm cả điện di đẳng điện điều chế, preparative electrofocusing), một hệ thống proteomic workflow mới bao gồm hệ sắc kí lỏng nano đa chiều (nanoLC Packing, Dionex, Netherland) kết nối trực tuyến với hệ thống khối phổ QSTAR® XL MS/MS sử dụng nguồn ion hóa NanoSpray™ (MDS SCIEX/Applied Biosystems) đã được thiết lập cho phép tự động phân tích và nhận dạng không chỉ những protein riêng lẻ, mà còn cả các hệ protein (proteome) phức tạp Với hệ thống được thiết lập như trên có thể tiến hành: (i) nhận dạng và xác định nhanh, chính xác các protein/peptide qua phổ TOF MS hoặc TOF MS/MS; (ii) nghiên cứu
hệ protein (proteome) phức tạp từ virus, vi khuẩn đến các mẫu tế bào động/thực vật, người (huyết thanh, dịch não tủy ) nhằm tìm kiếm, xác định các protein marker có khả năng liên quan đến các dạng ung thư, bệnh tim mạch, chuyển hóa, thần kinh và lây nhiễm phục vụ cho các công tác kiểm định, chẩn đoán và theo dõi diễn biến của bệnh lý (Phan Văn Chi và cs, 2005; Phan Văn Chi, 2006) Bằng kết hợp các phương pháp phân tách protein theo điểm đẳng điện (electrofocusing), điện di hai chiều, sắc ký ái lực trên cơ sở con A, và đặc biệt là sắc ký lỏng nano đa chiều kết nối trực tuyến với hệ khối phổ liên tiếp (nanoLC-MS/MS), đã
có thể nhận dạng và xác định được đến hàng ngàn loại protein khác nhau từ hệ protein của huyết thanh người, góp phần đánh giá mức biểu hiện của hệ protein nói chung và tìm kiếm các protein marker cho các trạng thái bệnh lý Trong số các protein huyết thanh đã được xác định, các tác giả đã phát hiện được protein MLL-AF4, một bằng chứng phân tử của sự chuyển vị nhiễm sắc thể giữa tổ hợp gen leukemia (MLL) trên nhiễm sắc thể số 11 (vị trí
11q23) và gen AF4(FEL) trên nhiễm sắc thể số 4 (vị trí 4q21) (Vu MT et al, 2004) Một số
protein bệnh và các protein đột biến như apolipoprotein AI (peptide đột biến), protein bệnh chuỗi nặng Ig MU (BOT), mạch 2 H của Ig gamma, peptide đột biến (BUR), protein bệnh chuỗi nặng (HDC), AIM/CD69 (Activation Inducing Molecular), neurofibromatosis-2, kinase phụ thuộc cyclin, các loại protein Bence-Jones… cũng đã được phát hiện có liên quan đến các loại bệnh về máu, các tổn thương hệ thống miễn dịch và các bệnh thần kinh,
đái tháo đường type 2 (Nguyen NL et al, 2004; Vu MT et al, 2005; Phan VC et al, 2005; Vũ Minh Thiết và cs, 2006; Đặng Thành Nam & Phan Văn Chi, 2006; Trần Thế Thành et al, 2007; Nguyễn Thị Minh Phương et al, 2007; ) Tuy nhiên trên đây cũng mới chỉ là những
kỹ thuật được xác lập với những dẫn liệu khảo sát ban đầu theo hướng nghiên cứu hệ protein (proteome) huyết thanh người Việt Nam của nhóm nghiên cứu Proteomics, Phòng Thí nghiệm Trọng điểm Công nghệ Gen (PTNTĐCNG) Các kết quả trên chủ yếu được thực hiện trong khuôn khổ Dự án xây dựng PTNTĐCNG (Viện CNSH chủ trì) và hỗ trợ một phần của các đề tài: (i) Thiết lập và ứng dụng kỹ thuật kết nối sắc ký lỏng nano đa chiều với
hệ khối phổ liên tục nhằm nhận dạng và xác định các protein và proteome, chủ nhiệm Phan Văn Chi (Đại học Công nghệ, ĐHQG Hà Nội, 2006); (ii) Xác định các biomarker trong huyết thanh người bằng kỹ thuật proteomics, chủ nhiệm Phan Văn Chi (Quỹ nghiên cứu Việt Nam-Thụy điển, 2006-2007); (iii) Nghiên cứu hệ protein huyết thanh người bằng các
kỹ thuật proteomics, chủ nhiệm Phan Văn Chi (Đề tài NCCB 2006-2008) Để có thể có
Trang 15những ứng dụng thật sự của các kỹ thuật proteomics, đặc biệt trong chẩn đoán sớm cần thiết phải có những nghiên cứu sâu rộng hơn trên nền hệ protein tổng thể không chỉ của người bình thường, mà còn của người bệnh, nhằm tìm ra sự khác biệt về mức độ biểu hiện, mối liên quan giữa sự biến đổi về cấu trúc về chức năng, không chỉ một vài protein riêng biệt,
mà trong mối tương tác chung, từ đó xác định các protein markers cũng như các kỹ thuật áp dụng chúng
Trên cơ sở những trang thiết bị khá đồng bộ và hiện đại về proteomics được đầu tư theo Dự
án “Phòng thí nghiệm Trọng điểm Công nghệ Gen” tại Viện Công nghệ Sinh học, Viện KH&CN Việt Nam và những kết quả nghiên cứu bước đầu về xác lập các phương pháp phân tích protein/proteome, tìm kiếm các chỉ thị protein trong huyết thanh người trong thời
gian qua, đề tài “Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam
để phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia” giai đoạn 2008-2010
đã được phê duyệt Mục đích của đề tài là nghiên cứu một cách có hệ thống hệ protein huyết thanh người Việt Nam ở trạng thái bình thường và các trạng thái bệnh ĐTĐT2 và leukemia, tìm kiếm những protein có biến đổi đặc trưng cho các trạng thái bệnh có khả năng phát triển thành các chỉ thị chẩn đoán
Trang 16PHẦN II VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1 Thu thập, lựa chọn mẫu máu người bình thường và máu người bệnh từnhững người tình nguyện tại Bệnh Viện Nội tiết Trung ương, Bệnh viện K, Bệnh viện Bạch Mai (Bộ
Y tế), Học viện Quân Y (Bộ Quốc phòng) Các mẫu được lựa chọn theo các tiêu chuẩn chặt chẽ về lâm sàng và có hồ sơ bệnh án rõ ràng Tất cả các mẫu huyết thanh đều được chuẩn bị theo cùng một phương pháp Các mẫu huyết thanh được chia nhỏ và bảo quản
ở -20°C và -80°C trong Ngân hàng các mẫu máu/Huyết thanh của đề tài
2 Xử lý mẫu huyết thanh người:
2.1 Dịch huyết thanh được loại bớt albumin (HSA) và γ-Immuglobulin (IgG) bằng
Aurum serum protein mini KIT (Bio-Rad, USA) Loại Kit này gồm có cột MicroSpin
là hỗn hợp của Affi-Gel Blue và Affi-Gel protein A Hai thành phần này được gắn lên chất giá resin cho phép loại đồng thời HSA và IgG trong huyết thanh 60 µl huyết thanh được pha loãng trong 180 µl đệm gắn của Kit Aurum Dung dịch được đưa lên cột MicroSpin sau khi đã cố định chất giá, hỗn hợp protein huyết thanh không bám cột được thu lại bằng ly tâm và thu hồi HSA và IgG bám trên cột bằng đệm thôi Laemmli Sau đó kiểm tra trên SDS-PAGE 12.6%
2.2 Thu nhận các protein bền nhiệt từ protein huyết thanh
Các protein bền nhiệt từ hệ protein huyết thanh được thu nhận theo phương pháp của Goufman và cộng sự, 2006
Một thể tích (1V) huyết thanh tổng số được trộn đều với 1V đệm ETP (20 mM EDTA
pH 8.1, 0.2 M Tris-HCl pH 8.9, 7% (w/v) PEG 6000) Hỗn hợp được ủ 10 phút ở 98oC,
10 phút tiếp theo ở nhiệt độ phòng, sau đó được ly tâm tách pha ở điều kiện 12000 vòng/phút trong 15 phút Phần dịch nổi chứa các protein huyết thanh bền nhiệt được thu nhận và sử dụng cho các thí nghiệm tiếp theo
Kết tủa protein bằng acetone lạnh
Protein bền nhiệt thu nhận được theo phương pháp trình bày ở phần trên được hòa tan trong đệm ETP có nồng độ Tris khá cao (~ 200mM), điều này có thể làm ảnh hưởng đến việc nghiên cứu hệ protein này Để loại bỏ Tris, chúng tôi sử dụng phương pháp kết tủa protein trong đệm chứa Tris bằng dung môi acetone lạnh (-20oC) với nồng độ 80% Hỗn hợp protein và acetone được tủa qua đêm ở -200C, sau đó ly tâm lạnh (40C) thu tủa với tốc độ 12000 vòng/phút trong 30 phút Đổ phần dịch phía trên và làm khô protein ở nhiệt độ phòng và hòa lại trong đệm mẫu SDS theo Laemmli
2.2.Phân tách glycoprotein sử dụng cột ái lực đa lectin: Mẫu huyết thanh được pha loãng bằng dung dịch đệm cân bằng cột và đưa vào cột ái lực đa lectin ConA Sau khi rửa hết các protein không bám vào cột, các protein đã được gắn vào cột được thôi ra bằng dung
Trang 17dịch thôi tương ứng với mỗi loại lectin đặc hiệu Các mẫu được giữ ở -70°C cho đến khi
ConA được hòa vào trong đệm cân bằng (Tris-HCl 20mM NaCl 0.5M, pH 7.4) và nhồi lên cột có đường kính 1cm, thể tích gel nhồi trên cột được tính toán phù hợp theo hướng dẫn của nhà sản xuất Rửa cột với 10 lần thể tích đệm cân bằng trước khi đưa mẫu huyết thanh lên cột
300 µl huyết thanh nguyên (tương đương khoảng 20 mg protein) thanh được hòa trong
10 lần thể tích đệm cân bằng lectin conA và được đưa lên cột sắc ký với tốc độ dòng
chảy ra cột là 0,1ml/phút Sau 15 phút, phần không bám cột được rửa bằng 8ml đệm cân bằng và được thu lại thành các phân đoạn 1,5ml Các glycoprotein bám trên cột sắc ký conA được thôi ra bằng 8 ml dung dịch đường (0.5 mM methyl-α-D-glucopyranosyl) Nồng độ glycoprotein bám cột được xác định bằng phương pháp Bradford Sau đó, các dung dịch thôi ra được cô đặc, loại đường và muối bằng phương pháp tủa với acetone lạnh theo tỷ lệ protein:acetone là 1:4 về thể tích và được giữ ở -250C
3 Xác định hàm lượng protein: Hàm lượng protein của mỗi mẫu được xác định theo
phương pháp Bradford với thuốc nhuộm protein của hãng Bio-Rad (Bio-Rad Laboratories, Hercules, USA) sử dụng albumin huyết thanh bò (BSA – Bovine Serum Albumin) làm protein chuẩn
4 Điện di hai chiều 2-DE: các protein được phân tách theo điểm đẳng điện và trọng lượng
phân tử được tiến hành bằng việc sử dụng các strip IPG trong buồng điện di PROTEAN IEF SDS-PAGE và các hóa chất, thuốc nhuộm được mua từ hãng Bio-Rad (Bio-Rad Laboratories, Hercules, USA) hoặc Amersham Bioscience (Amersham Bioscience Ltd, USA)
Phân tách protein theo điểm đẳng điện pI – điện di chiều một
Protein được hòa trong 125 µl đệm (chứa 8M ure, 2% CHAPS, 50 mM DTT, 0,2% (w/v)
Bio-Lyte 3/10 ampholyte và 0.001% Bromophenol Blue) Hỗn hợp mẫu được để thấm
vào thanh gel dài 7cm, hoặc 11cm, chứa dải pH từ 4 đến 7 (do hãng Bio-Rad, Mỹ cung cấp) trong thời gian từ 12 giờ đến 16 giờ Sau đó, các protein trên thanh gel được phân tách theo điểm đẳng điện trên hệ PROTEAN IEF (Bio-Rad) theo chương trình được trình bày trong Bảng 1
Trang 18Bảng 1 Chương trình chạy điện di chiều thư nhất trên hệ PROTEAN IEF (Bio-Rad)
Loại thanh gel Hiệu điện thế đầu
(V)
Hiệu điện thế cuối (V)
Volt-HOUR
Cân bằng gel
Sau quá trình điện di đẳng điện, protein trên gel được khử bằng dung dịch chứa 6 M urea, 20% glycerol 2% SDS, 37,5 mM Tris-HCl pH 8.8, 2% DTT w/v và alkyl hóa bằng dung dịch chứa 6 M urea, 2% SDS 37.5 mM Tris-HCl pH 8.8, glycerol 20% and 40 mM IAA
Phân tách protein theo trọng lượng phân tử - điện di chiều hai
Các protein trong thanh gel sau khi được phân tách theo điểm đẳng điện và được cân bằng theo các dung dịch trên sẽ tiếp tục được phân tách trên gel polyarcrylamid 12.6% theo kích thước phân tử của chúng với hiệu điện thế không đổi 200 V Bản gel 2DE được nhuộm bằng thuốc nhuộm Coomassie Brilliant Blue R-250
5 Thủy phân trypsin: (1) Các mẫu huyết thanh đã được xử lí loại albumin, globulin hoặc
các phân đoạn protein thu được từ cột sắc kí được làm khô bởi li tâm chân không, tiếp
đó được hòa vào 50mM NH4HCO3 Các mẫu được khử bằng 10 mM Dithiothreitol (DTT), alkyl hóa bằng 5 mM Iodoacetamide (IAA), sau đó thủy phân bằng trypsin (loại
sử dụng cho đọc trình tự, Sigma-Aldrich) trong 12 giờ ở 37°C Phản ứng thủy phân được dừng lại bởi acid formic với nồng độ cuối cùng là 0.1%; (2) Các vệt protein được cắt ra từ bản gel polyacrylamide sau khi nhuộm bằng Coomassie hoặc bạc được rửa, làm khô và hòa lại bằng đệm để thủy phân bằng trypsin Sau khi thủy phân, các peptide được chiết ra khỏi gel và phân tích trên hệ thống khối phổ
6 Sắc kí lỏng nano đa chiều(MDNanoLC): Dung dịch sau khi thủy phân được hoà vào 0.1% acid formic và phân tích trên hệ NanoLC để phân tách theo chiều thứ nhất trên cột sắc kí (LC Parking, Dionex) bằng các chất trao đổi cation mạnh (SCX) Sắc kí chiều thứ hai được thực hiện trên cột ngược pha C18 (GraceVydac, Hesperia, CA) với pha động chứa 0.1% acid formic trong nước (A) và 0.1% acid formic trong 85% acetonitrile (B) Các peptide được thôi ra với gradient tuyến tính từ 5% đến 100% dung dịch B với tốc độ dòng là 0.2 µl/phút
Đối với hỗn hợp peptide tạo ra do thủy phân các điểm protein trên gel 2DE hệ nanoLC 1 chiều (qua cột ngược pha RP C18) được sử dụng vì hỗn hợp peptide đơn giản, do đó quá trình chạy chỉ gồm một phân đoạn (không có các phân đoạn muối) trong 90 phút Các thông số của hệ thống sắc ký lỏng 1D nanoLC được tổng kết trong Bảng 2
Đối với hỗn hợp peptide phức tạp tạo ra do thủy phân protein trong dung dịch cho phân tích tổng thể, chúng tôi tiến hành chạy qua 2 chiều (qua cột trao đổi ion SCX và cột
Trang 19ngược pha RP C18) với 16 phân đoạn, 90 phút/mỗi phân đoạn Các thông số của hệ thống sắc ký lỏng 2D nanoLC được tổng kết trong Bảng 3
Bảng 2 Các thông số của hệ thống 1D NanoLC
Sắc ký lỏng nano UltiMate™ / FAMOS/ Switchos™
(LC Packings/Dionex) Cột ngược pha 300µl x 5 mm C18 PepMap100, LC Parking, Nertherland)
Cột C18 75µl ID x 15 cm, Grace Vydac, Hesperia, CA, USA
Thời gian 90 phút, phút 10 bắt đầu tạo gradient với nồng độ đệm B tăng từ 0-100% trong 65 phút
Bảng 3 Các thông số của hệ thống 2D NanoLC
Các bộ phận chính UltiMate/ FAMOS/ Switchos (LC Packings/Dionex)
Cột trao đổi ion SCX BioX-SCX 5 µm, 500 m ID x 15 mm, LC Packing
Cột ngược pha RP C18 C18 PepMap100, 5 m, 100 ALan) o, 300 m x 15 mm, LC Parking, Hà
Các bước thôi mẫu
(Cho phân tích 2 chiều)
Muối Amoniaxetat : 5mM, 10 mM, 20 mM, 30 mM, 40mM, 50mM, 75mM, 100 mM, 150mM, 200 mM, 300mM, 400 mM, 500mM, 750mM, 1M, H2O
Các loại đệm (pha linh
động)
A: 0,1% FA B: 85% ACN trong 0,1% FA
Trang 20Thời gian mỗi phân
Hệ thống sắc ký sử dụng trong phương pháp sắc ký lỏng hai chiều kết hợp khối phổ là
hệ thống nanoLC (Dionex, Netherland) gồm 3 thiết bị trung tâm là thiết bị đưa mẫu tự động Famos, điều khiển hệ thống van Swichos và hệ thống bơm tạo gradient UltiMate Các thiết bị này được kết nối với nhau qua các hệ thống ống (Hình 17), đồng thời được điều khiểu bằng phần mềm Chromeleon v6.5 (Dionex)
Hình 1 Sơ đồ cấu trúc của hệ thống sắc ký lỏng hai chiều nanoLC(Dionex)
Hỗn hợp peptide thu được sau khi thuỷ phân bằng trypsin sẽ được chạy qua sắc ký lỏng nano LC hai chiều Đầu tiên hỗn hợp peptide được phân tích chiều một trên cột sắc ký trao đổi cation mạnh, các peptide trong hỗn hợp sẽ được phân tách thành 16 phân đoạn nhờ vào lực ion muối tăng dần dần từ 0-2M, mỗi phân đoạn thu được lại tiếp tục được phân tách chiều hai trên cột sắc ký ngược pha (RP) C18(75 µm id.x15 cm) Trước khi đi vào cột cột RP-C18 các phân đoạn peptide phải được cô đặc và loại muối trên cột TRAP Trên cột RP-C18 các phân đoạn peptide này được phân tích bằng pha linh động A (0.1% formic acid) và B (85% acetonitrile và 0.1% formic acid) Mẫu đi ra khỏi cột được đưa trực tiếp vào nguồn nanoESI bằng kim phun (Fused Sillica picoTip) với tốc độ dòng thấp
Trang 21(100-200nl/phút) gắn ở cuối cột ngược pha C18 và đi vào bộ phận phân tích khối Trong nguồn nanoESI dưới tác dụng một điện áp cao khoảng 2300V dòng dung môi và peptide được phun thành những giọt nhỏ tích điện (charge droplet), cùng với sự hỗ trợ của màn khí nitrogen (curtain gas) các ion peptide sẽ tách khỏi các phân tử dung môi và đi vào bộ phận phân tích khối của máy khối phổ QSTAR®XL sau đó sẽ được phân tích và nhận dạng bằng phần mềm Mascot v1.8 Chiến lược phân tích protein huyết thanh bằng 2DLC-MS/MS được thực hiện như sau: Đầu tiên nhờ thiết bị đưa mẫu tự động Famos hỗn hợp peptide được đưa qua cột trao đổi ion mạnh SCX, peptide trong hỗn hợp sẽ bị hấp phụ lên cột qua liên kết ion Các peptide không hấp phụ sẽ được bơm trên Switchos đẩy qua cột RP để loại muối, sau đó sẽ được phân tách trên cột C18 trên UltiMate trước khi đi vào phân tích khối phổ trên hệ thống QSTAR® XL Ngay khi đi ra khỏi cột các peptide được đưa trực tiếp vào nguồn ion hóa ESI nhờ đầu đưa mẫu Fused Sillica Tip gắn ở cuối cột Trong nguồn ESI dịch peptide cùng dung môi được phun thành các giọt nhỏ tích điện (charge doplet), với sự hỗ trợ của màn khí nitrogen các ion peptide tách khỏi thành phần dung môi và đi vào bộ phận phân tích khối của máy khối phổ QSTAR®XL Máy sẽ thu tín hiệu khi hệ thống sắc ký bắt đầu đẩy mẫu vào cột SCX Phần mềm BioAnalyst QS v1.4 ghi phổ ion tổng (TIC) theo thời gian, quét phổ TOF MS đồng thời nhận biết ba ion phân tử tích điện +2, +3 hoặc +4 có mật độ cao nhất (lớn hơn 15) và tự động chuyển sang chế độ phân mảnh đồng thời ghi phổ MS/MS của ba ion này, sau đó lại chuyển về trạng thái quét phổ TOF MS
Quá trình này sẽ được lặp đi lặp lại cho đến khi chương trình sắc ký kết thúc và bằng phương pháp này qua mỗi lần phân tích chúng ta có thể nhận dạng được hàng trăm đến hàng ngàn peptide khác nhau Các peptide hấp phụ trên cột SCX sẽ được thôi ra bằng 16 phân đoạn muối CH3COONH4, mỗi một phân đoạn lại tiếp tục được loại muối trên cột
RP và phân tách trên cột C18 và đi vào phân tích khối phổ như các bước thực hiện ở trên Do vậy chúng ta sẽ thu được phổ TOF MS và MS/MS của tất cả các peptide trong hỗn hợp.Hình 18 là phổ khối LC-MS/MS thu được ở phân đoạn muối 0mM và hình B là kết quả quét phổ TOF MS tại phút 36.77 Tại thời điểm này phần mềm BioAnalyst QS v1.4 nhận biết và xác định được ba ion đa điện tính (tích điện +2, +3 hoặc +4) có mật độ
cao nhất có m/z là 515.9, 400.2 và 773.3amu Ngay sau đó phần mềm này sẽ điều khiểu
hệ thống QSTAR XL chuyển sang chế độ MS/MS để phân mảnh lần lượt ba ion này với thời gian được cài đặt là 3 giây với mỗi ion Phổ MS/MS của mỗi mỗi mảnh thu được tương ứng với hình C, D và E Vì quá trình ghi phổ ion tổng số gần như đồng thời với quá trình sắc ký nên phổ ion tổng số cũng cho biết kết quả phân tách của các peptide qua
hệ thống nanoLC, từ các phổ ion tổng số thu được cho thấy các peptide đã được phân tách rất tốt điều này cho thấy việc chọn hệ dung môi cũng như chương trình chạy sắc ký
là hợp lý, đồng thời cũng cho thấy các peptide bắt đầu được thôi ra từ phút thứ 32 và kết thúc ở phút thứ 65 khi nồng độ ACN đạt khoảng 60%
8 Tin sinh học (Phân tích dữ liệu): Phổ khối CID thu được từ nanoLC-MS/MS được
phân tích bằng phần mềm Mascot v1.8 Đây là phần mềm có khả năng phân tích dữ liệu
Trang 22phổ MS/MS để nhận dạng protein dựa trên thuật toán Mowse (Boutilier et al., 2004)
được phát triển bởi Matrix Science (London, UK) Ngân hàng dữ liệu được dùng để tìm kiếm trong Mascot là NCBInr, một ngân hàng dữ liệu các protein không đồng nhất và toàn diện với khoảng trên 7 triệu trình tự khác nhau được cài đặt trên một máy tính HP Proliant Server (s/n:2UA5100LXZ) Các thông số tìm kiếm bằng Mascot như sau: enzyme thủy phân trypsin, sai số khối lượng peptide là ± 0,5 Da, sai số khối của các mảnh ion trong phổ MS/MS là ± 0,3 Da Sửa đổi cố định là carbamidomethyl (C) Trạng thái điện tích của ion phân tử được chọn là +2 (double charge) và +3 (triple charge) Mức độ chính xác được đặt mặc định là 99,5% Với các thông số như trên thì kết quả sẽ cho các protein có tổng điểm số trên 31 Việc phân tích dữ liệu phổ giới hạn trong Ngân
hàng Dữ liệu Protein của Homo sapiens của toàn bộ Ngân hàng Dữ liệu NCBInr
9 Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người: sử dụng hệ quản trị ngân
hàng dữ liệu Microsoft Access và các phầm mềm chuyên dụng có liên quan Các protein được tìm kiếm theo các thông tin (vị trí, chức năng, khả năng liên quan đến bệnh, các biến đổi sau dịch mã) từ cơ sở dữ liệu UniProt (http://www.uniprot.org/) và sử dụng các
công cụ tin sinh chuyên dụng (ID Mapping, http://www.uniprot.org/mapping/; NetNGlyc 1.0 Server, http://www.cbs.dtu.dk/services/NetNGlyc/) cũng như các phần mềm xử lý, phân tích số liệu thống kê (Microsoft Excel)
Trang 23PHẦN III KẾT QUẢ NGHIÊN CỨU
Theo Thuyết minh/Hợp đồng thì đề tài cần thực hiện 3 nội dung chính sau:
(1) Nội dung 1: Phân tích, xây dựng CSDL hệ protein huyết thanh người Việt Nam bình thường và một số trạng thái bệnh lý (ĐTĐT2 và leukemia) bằng các kỹ thuật proteomics (2) Nội dung 2: Nhận dạng và xác định các ứng viên chỉ thị protein (protein markers); (3) Nội dung 3: Thử nghiệm ứng dụng các chỉ thị protein;
Trong báo cáo này chúng tôi sẽ trình bày các kết quả nghiên cứu theo thứ tự nội dung đã đăng kí
1 NỘI DUNG 1 - Phân tích, xây dựng cơ sở dữ liệu hệ protein huyết thanh người Việt Nam bình thường và một số trạng thái bệnh lý (đái tháo đường type 2 và leukemia) bằng các kỹ thuật proteomics
Trong phần Nội dung 1 gồm 4 phần chính sau:
(1) Lựa chọn đối tượng nghiên cứu: gồm các mẫu người bình thường, các mẫu bệnh ĐTĐT2
và các mẫu leukemia
(2) Tối ưu hóa các phương pháp xử lí, phân tách và phân tích mẫu bao gồm: (i) Xử lí các mẫu huyết thanh; (ii) Phân tích các protein huyết thanh bằng điện di 2DE; (iii) Nhận diện
protein bằng hệ thống sắc ký lỏng nano đa chiều kết nối khối phổ
(3) Phân tích các protein có biểu hiện thay đổi (tăng, giảm hoặc biến mất) giữa mẫu protein bền nhiệt, glycoprotein người bình thường và các trạng thái bệnh lý (ĐTĐT2, leukemia) ở các thể/giai đoạn bệnh trên hình ảnh điện di 2DE kết hợp nhận dạng các protein có biến đổi bằng phương pháp khối phổ
(4) Xây dựng cơ sở dữ liệu các hệ protein trong huyết thanh người bình thường và bệnh lý (ĐTĐT2, leukemia)
Minh họa quy trình thí nghiệm trong quá trình thực hiện đề tài được trình bày trong sơ đồ Hình 2
Trang 24Hình 2 Sơ đồ quy trình thí nghiệm thực hiện đề tài
1.1 Lựa chọn đối tượng nghiên cứu
Phần tuyển chọn và thu thập đối tượng nghiên cứu bao gồm: (1) Mẫu máu/huyết thanh người bình thường (100 mẫu); (2) Mẫu máu/huyết thanh người bệnh ĐTĐT2 (100 mẫu) và (3) Mẫu máu/huyết thanh người bệnh leukemia (100 mẫu) Sau đây là những kết quả thu thập các mẫu nghiên cứu
1.1.1 Thu thập các mẫu máu người bình thường
Để có thể tìm hiểu những biến đổi về các peptide/ protein trong huyết thanh người bệnh ĐTĐT2 và leukemia thì các mẫu người bình thường là một phần không thể thiếu Chúng được xem như các mẫu đối chứng để đối chiếu với những mẫu bệnh Các số liệu nhận được
là cơ sở để xây dựng dữ liệu về hệ protein huyết thanh người Việt Nam bình thường, góp phần nghiên cứu những thông số của người Việt Nam bình thường và nguồn để tra cứu các
Trang 25biến đổi về protein huyết thanh trong các trạng thái bệnh lí Mẫu người bình thường cần phải đáp ứng đầy đủ các điều kiện được xây dựng phù hợp với yêu cầu nghiên cứu của đề tài với số lượng là 100 mẫu Đây là nội dung rất quan trọng quyết định đến các kết quả nhận được của đề tài Do đó việc lấy mẫu máu/huyết thanh người bình thường phải rất thận trọng trong vấn đề lựa chọn đối tượng cung cấp mẫu và bảo quản mẫu phục vụ nghiên cứu
Đối tượng lấy mẫu: là những người bình thường, có độ tuổi từ 16 đến 50, là những cán bộ,
thanh niên, học sinh đang làm việc, học tập tại Viện Công nghệ sinh học và Trường PTTH Dân tộc Nội trú tỉnh Quảng Ninh Các đối tượng được lựa chọn thông qua phỏng vấn và xét nghiệm các chỉ số hóa sinh huyết học cơ bản cũng như về chiều cao, cân nặng, huyết áp ) Mẫu người bình thường phục vụ cho đề tài phải đảm bảo một số yêu cầu sau:
(i) Là người khỏe mạnh, các chỉ số sinh hóa máu đều ở mức bình thường (đường
huyết, các chỉ số về cholesterol, HDLC và LDLC, triglyceride );
(ii) Gia đình người đó có tiền sử ba đời (cả bên nội và bên ngoại bao gồm ông bà,
cha mẹ, anh chị em ruột của đối tượng cung cấp mẫu) không mắc các bệnh ung thư, đái tháo đường type 2 và các bệnh di truyền khác);
(iii) Tự nguyện cung cấp mẫu máu/huyết thanh cho đề tài phục vụ nghiên cứu
Từ những yêu cầu đó, Phiếu khai lấy mẫu đã được xây dựng cho yêu cầu lấy mẫu máu người bình thường (Phụ lục 1) Mỗi đối tượng cung cấp mẫu đều có một phiếu khai Mẫu được đánh số thứ tự từ 1-100 Các phiếu khai lấy mẫu được lưu giữ trong hồ sơ gốc của đề tài
Phương pháp lấy mẫu
Người cung cấp mẫu nhịn ăn từ sau bữa tối hôm trước cho đến sáng hôm sau (khoảng 14-16 giờ) để lấy mẫu Máu được lấy từ ven bằng siranh vô trùng, mỗi người được lấy khoảng 5
ml máu rồi chia vào các eppendorf 1.5 ml Mẫu được để yên tĩnh tại nhiệt độ phòng trong khoảng từ 2-3 giờ rồi tiến hành li tâm tách huyết thanh ở 5000 vòng/15 phút Huyết thanh (không lẫn hồng cầu) được tách ra và cho vào các eppendorf vô trùng, chia nhỏ để đủ dùng cho các thí nghiệm và bảo quản ở -80°C cho đến khi sử dụng và đưa xét nghiệm các chỉ tiêu sinh hóa máu
Kết quả lấy mẫu
Danh sách 100 mẫu người bình thường được để trong Phụ lục 2 30 mẫu được lựa chọn (Bảng 4) để tiến hành phân tích (gồm 16 nữ và 14 nam) hệ protein huyết thanh
Bảng 4 Danh sách mẫu thường được lựa chọn nghiên cứu (n=30)
Trang 2730 BT98 Lỷ Quang B Nam
Các mẫu máu/huyết thanh được đánh số, ghi nhãn và sắp xếp trong những hộp đựng mẫu riêng, bảo quản ở tủ lạnh sâu trong Ngân hàng máu/huyết thanh của đề tài
1.1.2.Thu thập các mẫu máu người bệnh đái tháo đường type 2
Để có thể sử dụng các chỉ thị sinh học phục vụ cho việc chẩn đoán sớm bệnh ĐTĐT2 thì việc quan trọng là phải có sự phối hợp với các bệnh viện trong việc tuyển chọn các mẫu có nguy cơ hoặc đã chắc chắn được chẩn đoán là mắc bệnh này Với mục đích như vậy, chúng tôi đã tiến hành phối hợp với Bệnh viện Nội tiết Trung ương thu thập, tuyển chọn 100 mẫu bệnh ĐTĐT2 ở các giai đoạn khác nhau (danh sách xem trong phần phụ lục) Trong quá trình thực hiện đề tài, chúng tôi đã đề ra các tiêu chí lựa chọn mẫu theo 3 giai đoạn của bệnh như sau:
(1) Thời kỳ sớm (tiền lâm sàng): hàm lượng glucose máu bình thường (Glucose từ 6-7
mmol/l) nhưng có biểu hiện biểu hiện lâm sàng về các chỉ tiêu khác (huyết áp, BMI, nồng
độ các chỉ tiêu lipid máu tăng…): 20 mẫu
Lúc này bệnh nhân có nồng độ máu chưa tăng nhưng có rối loạn dung nạp glucose, yếu tố đi kèm là lười vận động, có nguy cơ mắc bệnh ĐTĐT2 và có các biểu hiện về rối loạn các chỉ
số lipid máu, BMI tăng trên mức bình thường
(2) Bệnh ĐTĐT2 ở giai đoạn nhẹ: Thời kì này ở bệnh nhân đường máu đã tăng trên mức
bình thường nhưng chưa xuất hiện các biến chứng bệnh: (60 mẫu)
Nồng độ đường máu lúc đói (sau ăn ít nhất 8 giờ) > 7,0 mmol/l
Nồng độ đường máu lúc no (sau ăn 2 giờ) > 11,1 mmol/l
(3) Bệnh ĐTĐT2 giai đoạn bệnh toàn phát (giai đoạn nặng): Thời kỳ bệnh nhân có nồng
độ đường máu cao (nồng độ đường máu lúc đói > 14, lúc no > 20 mmol/l) và đã xuất hiện các biến chứng của bệnh (ở mắt, tay chân, tim mạch…): (20 mẫu)
Chúng tôi đã lập các phiếu khai lấy mẫu (Phụ lục 3) của những bệnh nhân (tình nguyện)
trong đó có các thông số: (1) Thông tin chung về bệnh nhân gồm kí hiệu mẫu, địa điểm lấy
mẫu, họ và tên bệnh nhân, ngày tháng năm sinh, giới tính, dân tộc, địa chỉ hiện tại, nghề nghiệp, tiền sử gia đình (ông bà, bố mẹ, anh chị em… có ai đã mắc bệnh ĐTĐT2)…; (2)
Các yếu tố liên quan đến lối sống của bệnh nhân (hay uống rượu bia, ăn thịt mỡ, luyện tập thường xuyên); (3) Các chỉ số lâm sàng (huyết áp, vòng eo, chiều cao, cân nặng, BMI); (4) Các chỉ số sinh hóa máu (nồng độ glucose huyết tương lúc đói, lúc no sau ăn 2 giờ, Hb1ac, cholesterol, HDL-C, LDL-C, triglyceride, C-peptide, insulin); (5) Tình trạng bệnh (ngày
vào Viện, số bệnh án, chẩn đoán bệnh, phương pháp dùng để chẩn đoán và phân loại bệnh,
đã điều trị bằng thuốc gì, tình trạng sức khỏe) Ưu tiên lựa chọn các mẫu bệnh nhân chưa
điều trị bằng bất cứ loại thuốc nào Cuối cùng có chữ kí xác nhận của bệnh nhân tình
Trang 28nguyện cung cấp mẫu phục vụ cho nghiên cứu khoa học và chữ kí của bác sĩ khám và chỉ định lấy mẫu
Trên cơ sở các tiêu chí đã đề ra đó chúng tôi đã thu thập được 100 mẫu bệnh nhân ĐTĐT 2 (Danh sách xem trong Phụ lục 4) và lựa chọn 30 mẫu để nghiên cứu bao gồm 15 mẫu nam
và 15 mẫu nữ, trong đó có 9 mẫu giai đoạn sớm, 16 mẫu giai đoạn nhẹ và 5 mẫu giai đoạn nặng (Bảng 5)
Bảng 5 Danh sách mẫu bệnh nhân ĐTĐT2 được lựa chọn nghiên cứu (n=30)
STT Tên
mẫu
Trang 2921 66 Trương Văn M Nam 1975 Nhẹ
1.1.3 Thu thập các mẫu máu/huyết thanh người bệnh leukemia
Việc lựa chọn mẫu bệnh nhân leukemia được phối hợp với Khoa Huyết học và Truyền máu, Bệnh viện Bạch Mai, Hà Nội Đối tượng: là các bệnh nhân leukemia được khám và điều trị tại Khoa Huyết học Truyền máu, Bệnh viện Bạch Mai Số lượng: 100 bệnh nhân gồm 80 bệnh nhân leukemia dạng cấp và 20 bệnh nhân leukemia dạng mãn.Độ tuổi: từ 8-55 Giới: Bao gồm cả nam và nữ
Các yếu tố lâm sàng được quan tâm: mức độ thiếu máu; mức độ xuất huyết ở da, niêm
mạc ; dấu hiệu nhiễm trùng: có sốt, viêm phổi, viêm đường hô hấp trên hay không; dấu hiệu xâm lấn của tế bào ung thư: gan, lách, hạch có to hay không, đau xương, u phì đại lợi ; thể trạng bệnh nhân: tỉnh táo, mệt mỏi, gầy sút;
Yếu tố tiền sử: gia đình và bản thân có mắc bệnh gì hay không;
Bệnh nhân được làm xét nghiệm công thức máu, huyết đồ, tủy đồ để xác định thể bệnh Các xét nghiệm này được tiến hành trước, sau và trong quá trình điều trị để đánh giá hiệu quả điều trị và có tiên lượng phù hợp với bệnh nhân;
Bệnh nhân được làm xét nghiệm tủy đồ và lấy dịch tủy nhuộm các phương pháp hóa tế bào
để xác định thể bệnh
Các phương pháp xét nghiệm hóa tế bào được tiến hành tại Khoa Huyết học Truyền máu,
Bệnh viện Bạch Mai để xác định thể bệnh cho bệnh nhân gồm: Soudan đen (Sou); Peroxydase (Pe); Periodic Acid Shiff (PAS); Esterase (Es); Esterase ức chế bằng NaF (Es-NaF); PAL Sau khi nhuộm hóa tế bào bệnh nhân được xác định mức độ dương tính dựa trên phương pháp tính điểm (mang tính chất định tính)
Trang 30Bệnh nhân được hút dịch tủy từ gai chậu sau trên cho vào môi trường nuôi cấy và thu hoạch
sau 72 giờ Các tiêu bản thu hoạch được nhuộm Giêmsa và nhuộm bằng R để xác định các
bất thường về số lượng và cấu trúc nhiễm sắc thể
Bệnh leukemia cấp dòng tủy gồm các thể bệnh như M1, M2, M3, M4, M5, M6 và M7, trong
đó: thể M1-3 là các giai đoạn khác nhau bị tác động để trở thành tế bào ung thư của dòng
bạch cầu hạt trung tính; M4-5 là các thể khác nhau của bệnh leukemia dòng mono; M6 là
thể bệnh leukemia cấp dòng hồng cầu; M7 là thể leukemia cấp dòng mẫu tiểu cầu Tuy
nhiên trong quá trình thu thập mẫu, chúng tôi chưa thu/gặp được bệnh nhân leukemia dạng
cấp thể M6 và M7 nên trong các mẫu lựa chọn chỉ có các dạng cấp M1-M5
Bệnh leukemia mãn cung được chia thành leukemia mãn dòng tủy và dòng lympho tương tự
như sự phân chia leukemia cấp
Chúng tôi đã chuẩn bị sẵn các phiếu khai lấy mẫu bệnh nhân leukemia (Phụ lục 5)
Trên cơ sở 100 mẫu huyết thanh bệnh nhân leukemia thu được, chúng tôi đã lựa chọn 30
mẫu để phân tích thành phần protein gồm: 8 mẫu leukemia dạng mãn (CML, ký hiệu K1,
K3, K4, K5, K6, K7, K8, K9); và 22 mẫu leukemia dạng cấp, trong đó có 1 mẫu ALL1 (kí
hiệu L1.1); 4 mẫu ALL2 (ký hiệu L2.1; L2.2, L2.4, L2.6); 1 mẫu AML1 (kí hiệu M1.1), 4
mẫu AML2 (kí hiệu M2.1, M2.2, M2.5 và M2.6); 4 mẫu AML3 (M3.2, M3.3, M3.4, M3.5);
6 mẫu AML4 (M4.1, M4.2, M4.6, M4.7), M4.8) và 3 mẫu AML5 (M5.1, M5.2 và M5.6)
(Bảng 6)
Bảng 6 Danh sách mẫu bệnh nhân leukemia lựa chọn nghiên cứu
STT Họ, tên bệnh nhân Giới tính Tuổi bệnh Thể hiệu Ký
mẫu
Điều trị (Đã/Chưa) HHTB Cấy NST Ghi chú
1 Lương Văn H Nam 24 CML K1 Chưa PAL
2 Trần Duy K Nam 22 CML K3 Chưa PAL
3 Bùi Thị H Nữ 25 CML K4 Chưa PAL Ph1
4 Nguyễn Đức T Nam 30 CML K5 Chưa PAL Ph1
5 Phạm Thị L Nữ 47 CML K6 Chưa PAL
6 Nguyễn Thị H Nữ 34 CML K7 Chưa PAL Ph1
7 Nguyễn Đình Đ Nam 48 CML K8 Chưa PAL Ph1
8 Nguyễn Thị L Nữ 49 CML K9 Chưa PAL
9 Trịnh T Vân N Nữ 50 ALL1 L1.1 Đã 46,XY 15/1/2009 Chết
10 Vũ Hoài N Nữ 22 ALL2 L2.1 Đã 46,XY
11 Hồ Thị T Nữ 20 ALL2 L2.2 Chưa Không mitose Chết 1/3/ 2009
Trang 3112 Lại Thị L Nữ 49 ALL2 (5?) L2.4 Chưa Sou, Pe, Es 46,XY
13 Hoàng Thị H Nữ 25 ALL2 L2.6 Đã 46,XY; 47XX
14 Hà Thu M Nữ 48 AML1 M1.1 Chưa Sou, Pe, Es 45,-C
15 Nguyễn Văn P Nam 26 AML2 M2.1 Chưa Sou, Pe, Es 46,XY
16 Nguyễn Thị T Nữ 38 AML2 M2.2 Chưa Sou, Pe, Es 46,XX
17 Lê Văn R Nam 50 AML2 M2.5 Chưa 46,XY; t(5,6);
Ph1
18 Nguyễn Thị N Nữ 46 AML2 M2.6 Chưa Sou, Pe, Es
19 Nguyễn T Thanh T Nữ 38 AML3 M3.2 Chưa Sou, Pe, Es t(15;1)
20 Phùng Thị H Nữ 26 AML3 M3.3 Chưa Sou, Pe, Es 46,XX; t (15;17)
21 Trương Văn T Nam AML3 M3.4
22 Nguyễn Thị N Nữ AML3 M3.5
23 Thân Quang D Nam 18 AML4 M4.1 Chưa Sou, Pe, Es +D, +E 47,-C,
24 Trịnh Thị N Nữ 41 AML4 M4.2 Chưa Sou, Pe, Es 46,XX
25 Nguyễn Lý H Nam 38 AML4 M4.6 Chưa Sou, Pe, Es
26 Phạm Quang T Nam 45 AML4 M4.7 Đã
27 Hoàng Thị H Nữ AML4 M4.8 46,XX
28 Hà Thị T Nữ 18 AML5 M5.1 Chưa Sou, Pe, Es 46,XX
29 Nguyễn Thị H Nữ 32 AML5 M5.2 Chưa Sou, Pe, Es Ph1
30 Đỗ Thị H Nữ 50 AML5 M5.6 Chưa Sou, Pe, Es
Chú thích: Chronic myelogenous leukemia (CML): Leukemia mãn dòng tủy; Acute myelogenous
leukemia (AML): Leukemia cấp dòng tủy; Acute lymphocytic leukemia (ALL): Leukemia cấp dòng
lympho; Chronic lymphocytic leukemia (CLL): Leukemia mãn dòng lympho
1.2 Tối ưu hóa các phương pháp xử lý và phân tích mẫu
Giai đoạn đầu trong quá trình thực hiện đề tài là phần tối ưu các phương pháp xử lí, phân
tích mẫu huyết thanh người bình thường và người bệnh bao gồm:
Trang 32(1) Xử lí các mẫu huyết thanh;
(2) Phân tích các protein huyết thanh bằng điện di 2DE;
(3) Nhận diện protein bằng hệ thống sắc ký lỏng nano đa chiều kết nối khối phổ
1.2.1 Xử lí các mẫu huyết thanh
Mỗi mẫu huyết thanh nghiên cứu đều được xử lí theo 3 phương pháp sau để thu nhận các phân đoạn protein khác nhau:
(1) Thu nhận hệ protein tổng thể trong huyết thanh bằng phương pháp loại bớt albumin,
globulin là những protein có hàm lượng lớn cản trở đến việc phân tách các protein
có nồng độ thấp trong huyết thanh sử dụng AurumTM serum protein Mini KIT;
(2) Thu nhận hệ protein bền nhiệt bằng phương pháp phân đoạn nhiệt (ở nhiệt độ 98ºC
trong 10 phút rồi li tâm tách pha)
(3) Thu nhận hệ glycoprotein bằng cột sắc kí ái lực conA sepharose
1.2.1.1 Loại bớt các protein có nồng độ cao (albumin, Ig ) từ mẫu huyết thanh người bình thường và bệnh lý (bệnh nhân ĐTĐT2, leukemia dạng cấp và mãn) bằng Aurum TM serum protein mini Kit
Huyết thanh sau khi xử lý qua cột Aurum (phương pháp tiến hành được mô tả trong phần vật liệu và phương pháp nghiên cứu) được kiểm tra bằng điện di biến tính SDS-PAGE (Hình 3, Hình 4)
Hình 3 Kết quả loại bớt Albumin và IgG bằng Aurum protein mini Kit Đường chạy số 1:
thang protein chuẩn, đường chạy số 4 và 7: huyết thanh nguyên, đường chạy số 2 và 5: hỗn hợp protein sau khi lọc qua cột Aurum, đường chạy số 3 và 6 là hỗn hộp Albumin và IgG bám trên cột Aurum
Trang 33Hình 4 Kết quả điện di loại bớt Albumin và IgG bằng Aurum protein mini Kit M: Thang
protein chuẩn; A: Đường chạy số 4 và 7: huyết thanh nguyên, đường chạy số 1, 5 và 8: hỗn hợp protein sau khi lọc qua cột Aurum, đường chạy số 2, 3, 6 và 9 là hỗn hộp Albumin và IgG bám trên cột Aurum; B: Đường chạy 1, 3, 5, 7: hỗn hợp protein sau khi lọc qua cột Aurum, đường chạy 2, 4,
6, 8: hỗn hợp Albumin và IgG bám trên cột Aurum
Kết quả trên cho thấy hỗn hợp protein sau khi qua cột Aurum serum protein mini Kit đã loại được phần lớn Albumin và IgG, kết quả xử lý này cho phép chúng tôi có thể thực hiện các phân tích tiếp theo
1.2.1.2 Phân tách và thu nhận các protein bền nhiệt trong huyết thanh người bình thường và bệnh lý
Sử dụng phương pháp biến tính nhiệt như đã mô tả trong phần vật liệu và phương pháp nghiên cứu, chúng tôi đã thu nhận được các protein bền nhiệt Kết quả như sau
Đối với mẫu người bình thường:
Hình 5 Ảnh điện di SDS – PAGE protein bền nhiệt mẫu người bình thường. M: Marker;
Đường chạy 1: Huyết thanh đã pha loãng 40 lần; Đường chạy 2: Protein bền nhiệt
Trang 34Trên Hình 5, ở đường chạy số 1, xuất hiện một băng lớn có kích thước khoảng 66.2 kDa, tương đương kích thước của albumin trong huyết thanh, sự có mặt của albumin sẽ cản trở việc nghiên cứu trên các protein khác Trong khi đó ở đường chạy số 2 không còn thấy xuất hiện băng lớn của albumin chứng tỏ bằng phương pháp biến tính nhiệt, chúng tôi đã loại bỏ được hầu hết protein này Nhờ đó sự phân tách của các protein khác rõ ràng hơn, xuất hiện nhiều băng có kích thước nhỏ hơn
Kết quả trên cho thấy, bằng phương pháp xử lý biến tính nhiệt, chúng tôi đã thu được các protein bền nhiệt, đồng thời làm đơn giản thành phần protein trong huyết thanh, tạo thuận lợi cho các phân tích tiếp theo Ngoài ra, nếu so sánh với các phương pháp làm đơn giản mẫu protein huyết thanh khác như Aurum serum protein Mini Kit, cột sắc ký đa ái lực (Multiple Affinity Removal LC Column - Agilent), IgY-microbeads kit (Seppro®),Cut off,
… thì phương pháp biến tính nhiệt rõ ràng là đơn giản, dễ làm và đỡ tốn kém hơn
Đối với các mẫu bệnh
Các kết quả thu được (Hình 6, Hình 7) cho thấy, chúng tôi đã thu nhận được hệ protein bền nhiệt trong huyết thanh, làm đơn giản hóa các thành phần protein trong mẫu Ngoài ra, kết quả ảnh điện di cũng phần nào cho thấy có những khác biệt nhất định trong thành phần các protein bền nhiệt ở mẫu thường và mẫu bệnh
Hình 6 Ảnh điện di SDS – PAGE protein bền nhiệt một số mẫu huyết thanh bệnh nhân
leukemia Đường chạy M: Thang protein Marker chuẩn; Đường chạy 1: Protein huyết thanh nguyên pha loãng 40 lần; Đường chạy 2 đến 6: Protein bền nhiệt thu được từ một số mẫu Leukemia; Đường
chạy 7: Protein bền nhiệt thu được từ huyết thanh người bình thường (đối chứng)
Trang 35Hình 7 Ảnh điện di SDS – PAGE protein bền nhiệt một số mẫu bệnh ĐTĐT2 Đường chạy M: Thang protein Marker chuẩn; Đường chạy 1: Protein huyết thanh nguyên pha loãng 40 lần; Đường
chạy 2: Protein bền nhiệt thu được từ huyết thanh người bình thường (đối chứng); Đường chạy 3 đến
6: Protein bền nhiệt thu được từ một số mẫu bệnh ĐTĐT2
1.2.1.3 Phân tách và thu nhận các glycoprotein trong huyết thanh người bình thường
và bệnh lý
Để thu nhận các glycoprotein, mẫu huyết thanh được phân tách qua cột sắc kí ái lực ConA (cách tiến hành được mô tả trong phần vật liệu và phương pháp nghiên cứu) Các glycoprotein tiếp đó được phân tích điện di SDS- PAGE (Hình 8)
Hình 8 Điện di đồ SDS-PAGE kết quả thu glycoprotein bằng sắc ký ái lực với ConA của mẫu bình thường và mẫu bệnh ĐTĐT2 Đường chạy số 1, 9: huyết thanh tổng số; đường chạy 2, 6:
dung dịch rửa cột trước khi thôi protein; đường chạy số 3, 7: phân đoạn protein bám cột; đường
Trang 36chạy số 4, 8: phân đoạn protein bám cột
Quan sát kết quả phân tách trên điện di đồ trên Hình 8 chúng tôi nhận thấy:
- Ở đường chạy số 2, 6 (dung dịch rửa cột) không thấy xuất hiện băng protein nào điều này chứng tỏ các protein không bám cột sắc ký đã được rửa sạch bằng đệm cân bằng trước khi thôi dung dịch glycoprotein
- So sánh các băng protein ở đường chạy số 4, 8 (dung dịch protein bám cột)
và đường chạy số 1, 9 (dung dịch protein tổng số) đã chỉ ra hàm lượng protein bám trên cột ít hơn hàm lượng protein không bám cột, đồng thời đã loại được hầu hết albumin khỏi mẫu glycoprotein Điều này sẽ được làm sáng tỏ trong các nghiên cứu tiếp theo
- So sánh các băng protein ở đường chạy số 1, 9 (mẫu huyết thanh nguyên) so với các băng protein ở đường chạy số 3, 7 và 4, 8 cho thấy tổng hàm lượng protein bám cột và không bám cột tương đương với hàm lượng protein trong mẫu huyết thanh nguyên
Tương tự chúng tôi tiến hành thu nhận các glycoprotein của mẫu bệnh leukemia bằng phương pháp sắc ký ái lực với chất giá ConA (Hình 9)
Hình 9 Điện di đồ SDS-PAGE kết quả thu nhận glycoprotein của mẫu bệnh leukemia Đường
chạy M: Thang marker chuẩn; đường chạy số 1, 2, 3, 4: phân đoạn glycoprotein của mẫu bệnh, S: huyết thanh tổng số
Kết quả điện di trên Hình 9 cho thấy đã thu nhận được khá nhiều glycoprotein trong huyết thanh mẫu bệnh leukemia tạo điều kiện cho các nghiên cứu tiếp theo
Trang 371.2.2 Tối ưu hóa các điều kiện điện di 2DE các mẫu huyết thanh
Các mẫu huyết thanh sau khi được xử lí để thu nhận các protein tổng thể, protein bền nhiệt
và các glycoprotein được tiến hành điện di 2 chiều gồm 2 quá trình: (1) Phân tách protein theo điểm đẳng điện pI (điện di chiều một) và (2) Phân tách protein theo trọng lượng phân
tử (điện di chiều hai) Nồng độ protein được đo bằng phương pháp Bradford trước khi điện
di
Tối ưu hóa điều kiện phân tách protein bền nhiệt
Hệ protein bền nhiệt thu nhận được từ người thường và bệnh nhân leukemia theo phương pháp được mô tả trong phần phương pháp và được xác định nồng độ theo phương pháp Bradford
Các protein sau đó được để thấm vào thanh gel IPG có chiều dài 7 cm với khối lượng 150ug Ở điện di chiều 2, nồng độ acrylamide trong gel polyacrylamide là 12.5% (Hình 10) Kết quả trên Hình 10 cho thấy, các protein bền nhiệt được phân tách khá rõ nét Nhiều điểm protein đơn được quan sát thấy trên bản gel Các protein thu được tập trung chủ yếu tại vùng trọng lượng phân tử dao động từ 14 tới 50kDa Hầu như không quan sát thấy các protein có trọng lượng thấp dưới 12kDa
Điều đặc biệt, gần như không quan sát thấy các khác biệt rõ ràng giữa hệ protein bền nhiệt
có nguồn gốc từ bệnh nhân leukemia và hệ protein bền nhiệt có nguồn gốc từ người thường Cùng với một số các nghiên cứu đi trước, các kết quả trên đây đưa tới một số các nhận xét rằng, có thể sử dụng dải pH4-7 để phân tách các protein trong hệ protein bền nhiệt theo điểm đẳng điện, đồng thời, có thể sử dụng gel polyacrylamide với nồng độ acrylamide 12.6% để phân tách các điểm protein theo trọng lượng phân tử
Trang 38Hình 10 Hình ảnh hệ protein bền nhiệt ở người bệnh leukemia và người thường Control:
hình ảnh protein bền nhiệt từ người khỏe mạnh M4.2, M4.3 và M4.4 là hình ảnh các protein bền
nhiệt có nguồn gốc từ bệnh nhân leukemia cấp dạng M4 Các protein được phân tách theo chiều
1 (IEF) với thanh gel IPG có chiều dài 7cm, pH4-7 Các hình tam giác nâu nằm cùng một hàng ngang thể hiện các isoform của cùng một protein Vùng số 1 được nhận diện là alpha-1-acid glycoprotein 1 Vùng số 3 được nhận diện là haptoglobin Vùng số 4 được nhận diện là transthyretin
Tuy nhiên, chiều dài thanh IPG chỉ với 7cm có thể hạn chế sự phát hiện các isoform của cùng một protein tại các điểm pI khác nhau, bên cạnh đó hạn chế về chiều dài bản gel (phân tách protein theo trọng lượng phân tử, điện di chiều hai) có thể ngăn cản sự phát hiện các protein với trọng lượng phân tử thấp cũng như protein tồn tại với hàm lượng nhỏ trong huyết thanh
Với những nhận xét như trên, việc phân tách protein bền nhiệt được lặp lại bằng kỹ thuật điện di hai chiều, với chiều dài thanh IPG tăng lên 11 cm, lượng mẫu đưa lên thanh IPG strip tăng từ 150ug lên tới 200ug Kết quả thí nghiệm được trình bày trong Hình 11
Trên Hình 11, nhiều protein với trọng lượng phân tử thấp (dưới 14kDa) đã được quan sát thấy Điều đặc biệt hơn hầu hết các sự khác biệt giữa hệ protein bền nhiệt có nguồn gốc từ người bệnh và người thường được quan sát thấy tại vùng protein này
Trang 39Hình 11 Hình ảnh hệ protein bền nhiệt ở người bệnh leukemia và người thường. Control:
hình ảnh protein bền nhiệt từ người khỏe mạnh Disease là hình ảnh các protein bền nhiệt có nguồn
gốc từ bệnh nhân leukemia cấp Các protein được phân tách theo chiều 1 (IEF) với thanh gel IPG
có chiều dài 11cm, pH4-7 Các hình tam giác nâu nằm cùng một hàng ngang thể hiện các isoform của cùng một protein Vùng số 1 được nhận diện là alpha-1-acid glycoprotein 1 Vùng số 2 chỉ ra các apolipoprotein Vùng số 3 & 5 được nhận diện là haptoglobin Vùng số 4 được nhận diện là transthyretin Vùng 6 chỉ ra protein huyết thanh amyloid A
Tối ưu hóa điều kiện phân tách glycoprotein
Hệ glycoprotein thu nhận được từ người thường và bệnh nhân leukemia theo phương pháp được mô tả trong phần phương pháp và được xác định nồng độ theo phương pháp Bradford Các protein sau đó được để thấm vào thanh gel IPG có chiều dài 11cm với khối lượng 200ug Ở điện di chiều 2, nồng độ acrylamide trong gel polyacrylamide là 12.5% với mục đích thu nhận được cả các protein có trọng lượng thấp và nồng độ thấp trong huyết thanh (Hình 12)
Trang 40Hình 12 Hình ảnh hệ glycoprotein ở người bệnh leukemia cấp dòng M4 HW: vùng protein có
trọng lượng phân tử cao LW: vùng protein có trọng lượng phân tử thấp Protein được phân tách theo điểm đẳng điện với dải pH4-7, chiều dài thanh IPG: 11cm Phân tách chiều hai theo trọng lượng phân tử trên gel polyacrylamid có nồng độ acrylamide 15%
Kết quả trong Hình 12 cho thấy, hầu hết các glycoprotein tập trung tại vùng có trọng lượng phân tử cao Gần như không quan sát thấy các glycoprotein tại vùng có trọng lượng phân tử thấp, điều này trái ngược với hình ảnh các protein bền nhiệt của huyết thanh
Các protein tách thành các điểm đơn tương đối rõ ràng với dải pH4-7 và nồng độ acrylamide 12.5% Tuy nhiên, các protein tại vùng trọng lượng phân tử cao có độ tách biệt chưa tốt
Với những kết quả như trên, chúng tôi đi tới quyết định rằng, điều kiện thích hợp để phân tách hệ glycoprotein huyết thanh người bệnh leukemia là: (i) điện di chiều 1: chiều dài của thanh gel IPG là từ 7 đến 11cm, dải pH sử dụng rộng nhất là pH4-7, có thể sử dụng thêm dải
pH hẹp hơn như pH4.7-5.9; (ii) điện di chiều hai: vì glycoprotein chủ yếu tập trung tại vùng
có trọng lượng phân tử cao, nồng độ acrylamide là 12.6%
Sau khi có hình ảnh điện di 2DE, các vệt/điểm protein/peptide trên bản gel tiếp tục được xử
lí cho phân tích khối phổ để nhận dạng/xác định các protein
1.2.3 Tối ưu hóa các điều kiện xử lí protein cho phân tích khối phổ
1.2.3.1 Thủy phân protein bằng enzyme trypsin
Trypsin là một loại endoprotease tương đối đặc hiệu, chỉ cắt ở đầu C của các liên kết peptide giữa K-X và R-X, trong đó X là một amino acid bất kỳ khác proline (P)
Protein được thuỷ phân bằng trypsin ở 2 dạng trong gel và trong dung dịch