Xác định và phân tích dữ liệu thu nhận được

Một phần của tài liệu Ứng dụng công nghệ chăm sóc sức khỏe con người (Trang 106 - 109)

PHÂN TÍCH CHỨC NĂNG BỘ GENE

2. Lịch sử DNA microarray

5.3. Xác định và phân tích dữ liệu thu nhận được

Sau khi lai, tiến hành rửa để loại bỏ đích không bắt cặp hoặc bắt cặp không đặc hiệu với mẫu dò. Tiếp đó dùng thiết bị hiện ảnh xác định tín hiệu lai do chất đánh dấu trên đích phát ra. Cường độ tín hiệu cho phép đánh giá tương đối hiệu quả bắt cặp giữa đích và mẫu dò. Điều đáng nói ở đây là lượng dữ liệu cần phân tích trong thí nghiệm microarray rất lớn

do trên một mảng có thể đặt hàng chục ngàn mẫu dò, tương ứng với nó là hàng chục ngàn tín hiệu, trong đó lại có những tín hiệu nhiễu vì nhiều nguyên nhân. Do đó cần có các phần mềm máy tính để chuẩn hoá dữ liệu, đơn giản hoá quá trình phân tích nhằm đưa ra các kết luận nhanh và chính xác. Các bước chung khi tiến hành kỹ thuật microarray là như vậy, nhưng vì có hai loại mảng ứng với mẫu dò là cDNA và oligonucleotide nên có đôi chút khác nhau khi sử dụng chúng.

Thông thường có hai phương thức được dùng để thu nhận các dữ liệu trong kỹ thuật microarray. Trong trường hợp two-color array, hai mẫu RNA được tiến hành đánh dấu bằng các thuộc nhuộm khác nhau và tiến hành lai đồng thời trên cùng một bản array.

Mẫu được quan tâm hay mẫu đang nghi vấn (ví dụ như là một mẫu bệnh phẩm ung thư vú) được tiến hành nhuộm bằng một thuốc nhuộm và mẫu đối chứng được tiến hành nhuộm bằng một thuốc nhuộm khác. Hai mẫu được trộn với tỉ lệ ứng với 1:1 với nhau trên cơ cở đồng nhất các thuốc nhuộm. Sau đó tiến hành so sánh các mẫu với nhau, sự biểu hiện của các mẫu tuân theo hàm logarit giữa tỷ lệ các RNA trong mẫu nghi vấn đối với mẫu đối chứng. Trong trường hợp là single-color array, như Genechip (Affymetrix), mỗi mẫu sẽ được tiến hành nhuộm riêng biệt và tiến hành trên thực hiện trên một phiến array. Sau đó tiến hành lai và rửa mẫu, sự biểu hiện của từng gen được thể hiện thông qua sự biểu hiện cường độ phát huỳnh quang, từ đó có thể đánh giá mức độ biểu hiện của gen.

Hình 4.18. Hình ảnh cho thấy tỷ lệ lai khác nhau sẽ cho tín hiệu màu khác nhau.

Hình 4.19. Hình ảnh phép phân tích “Two-color” và “Single-color” của microarray

Hình 4.20. Xử lý tính hiệu bằng phần mềm xử lý hình ảnh

Trong phép phân tích “two-color” (hình A), mẫu RNA được thu nhận từ bệnh nhân và mẫu đối chứng được tiến hành nhuộm riêng biệt khác nhau và tiến hành lai với duy nhất 1 DNA chứa mẫu dò chuyên biệt với gen. Quan hệ về mức độ biểu hiện của gen trong hai mẫu được đánh giá dựa trên việc so sánh mức độ phát huỳnh quang của mỗi mẫu; một vector biểu hiện mẫu được dùng để kết luận mức độ biểu hiện của từng gen trong mẫu thu nhận từ bệnh nhân (tiến hành so sánh với mẫu đối chứng). Phép phân tích “single-color”

(Hình B), được thực hiện với Genechip (Affymetrix), tiến hành lai các RNA được đánh dấu từ mỗi mẫu sinh phẩm trên từng array tiến hành lai với các mẫu dò chuyên biệt. Mức độ biểu hiện gen được đánh giá bằng cách so sánh cường độ lai của một loạt các mẫu dò đã bắt cặp hoàn hảo, backgrou sẽ được tiến hành đánh giá thông qua các mẫu dò không bắt cặp. Mức độ biểu hiện của gen của mỗi mẫu thu nhận từ bệnh nhân được báo cáo với như một vector biểu hiện mẫu mà kết luận dựa trên sự khác biệt giữa tín hiệu và background của từng gen.

Sau khi tiến hành thu nhận mẫu, các dữ liệu thường phải được tiêu chuẩn hóa để dễ dàng so sánh, tìm hiểu những điểm khác nhau giữa các thí nghiệm lai. Hiện nay, có rất nhiều phương pháp được sử dụng cho việc tiêu chuẩn hóa các dữ kiện, tuy nhiên sử dụng phương pháp nào phù hợp cho việc phân tích hoàn toàn phụ thuộc vào mục đích thí nghiệm, kết luận về các dự kiện. Thông thường các dữ kiện cũng phải được tiến hành chọn lọc dựa trên các tiêu chuẩn nhất định (ví dụ như là các gen có sự khác biệt nhau nhỏ sẽ bị loại) hay là tiến hành phân tích thông kê để lựa chọn các gen có sự biểu hiện với một mức độ cao mà chúng có liên quan đến các nhóm của mẫu xét nghiệm. Việc tiêu chuẩn hóa và chọn lọc phải được ứng dụng một cách thật cẩn trọng, tại vì nó có thể mang đến một số hiệu quả không mong muốn trong kết quả. Sự khác biệt trong các phương pháp phân tích thống kê sẽ cung cấp các kết quả khác nhau trong các gen chuyên biệt (thường là kết quả các gen sẽ gối đầu nhau).

Những lưu ý này sẽ được thực hiện, chú trọng trong suốt quá trình tiến hành phân tích so sánh dữ liệu, các thông tin với nhau ở các phòng thí nghiệm khác nhau. Có thể dẫn

pháp so sánh, phân tích và thống kê các dữ liệu. Những so sánh này chuyển toàn bộ dữ liệu phân tích vào trong một kho dữ liệu, từ những thông tin đó, có thể tìm kiếm sự giống nhau giữa các dạng của microarray. Để tiến hành so sánh các dữ liệu một cách dễ dàng người ta phát triển một tiêu chuẩn chung cho phép phân tích các dữ liệu là “minimal information about a microarray experiment” (MIAME). Các database của DNA được phát triển và lưu giữ trong ngân hàng DNA để sử dụng cho việc nghiên cứu sự biểu hiện gen. Đây được xem là nguồn dữ liệu quan trọng và có giá trị trong ứng dụng trong việc nghiên cứu biểu hiện gen: các nghiên cứu về cùng một bệnh được tiến hành độc lập với nhau sẽ cung cấp các dữ liệu khách quan và được tiến hành so sánh, đánh giá các kết quả thu nhận được. Khi nghiên cứu một lượng lớn cỡ mẫu có thể cung cấp các dữ liệu quan trọng cho việc nghiên cứu các mẫu bệnh chung, và nghiên cứu việc biểu hiện gen có liên quan đến bệnh hay hậu quả của bệnh.

Sau khi thu thập được các dữ liệu, các dữ liệu đã được tiến hành chọn lọc và tiêu chuẩn hóa, chúng được biểu hiện một cách điển hình trong một ma trận mà mỗi dòng biểu hiện cho một gen chuyên biệt và mỗi cột biểu hiện cho một mẫu sinh học đặc trưng. Mỗi dòng biểu thị cho một vector biệu hiện gen – các ô thể hiện các mức độ biểu hiện gen chuyên biệt trong tất cả các mẫu bệnh phẩm nghiên cứu. Mỗi cột biểu thị cho một vector biểu hiện mẫu, ghi nhận sự biểu hiện tất cả các gen trong mẫu. Để hiểu một cách dễ dàng các kết quả thu nhận được từ phương pháp lai kết hợp, các yếu tố của dữ liệu trong ma trận thường được biểu hiện với màu đỏ ứng với mức độ biểu hiện gen trong từng mẫu và các vùng quan sát được trên ma trận biểu hiện cho các mẫu đang phân tích. Trong hầu hết các phương pháp, màu sử dụng cho các gen được dựa trên tỷ lệ logarit đối với từng mẫu khi được tiến hành so sánh với mẫu đối chứng; giá trị tỷ lệ log gần như bằng không sẽ được biểu hiện bằng màu đen, giá trị lớn hơn không được biểu hiện bằng màu đỏ (ứng với các điều hòa thượng nguồn), và các giá trị âm tính được biểu hiện bằng màu xanh (ứng với các gen điều hòa hạ nguồn), ngoài ra có thể có nhiều màu khác nhau được phép sử dụng cho trường hợp đối với những người bị mù màu đỏ - xanh. Cường độ biểu hiện của các nhân tố được tiến hành so sánh sự biểu hiện các gen có quan hệ với nhau, các nhân tố có màu sáng biểu hiện cho sự biểu hiện với một mức độ cao. Chương trình được thực hiện theo các nhóm hàng ngang, hàng dọc hoặc là cả hai, từ đó, có thể xác định được mức độ biểu hiện của các gen khác nhau trong các mẫu bệnh phẩm khác nhau.

Một phần của tài liệu Ứng dụng công nghệ chăm sóc sức khỏe con người (Trang 106 - 109)

Tải bản đầy đủ (PDF)

(184 trang)