Giới thiệu kỹ thuật giải trình tự gen và Real - Time PCR Lê Văn Phủng* Trường Đại học Y Hà Nội 1.. Kỹ thuật giải trình tự gen Giải trình tự gen là tìm ra trình tự sắp xếp của các nu
Trang 1Giới thiệu kỹ thuật giải trình tự gen
và Real - Time PCR
Lê Văn Phủng*
Trường Đại học Y Hà Nội
1 Kỹ thuật giải trình tự gen
Giải trình tự gen là tìm ra trình tự sắp xếp của
các nucleotides trên đoạn gen được quan tâm
nhằm phát hiện sự đột biến gen hoặc để thiết kế
gen mồi (primer) và các vector tách dòng
(cloning) nhằm tạo ra các protein tái tổ hợp có giá
trị cao trong Y học (vaccine, thuốc chữa bệnh,
các sinh phẩm phục vụ chẩn đoán bệnh hoặc
nghiên cứu khoa học…)
Kỹ thuật giải trình tự gen được công bố năm
1975 bởi Sanger (nguyên lý enzym) và Maxam -
Gilbert năm 1977 (nguyên lý phân giải hoá học)
Hiện nay, các kỹ thuật này đã được cải tiến rất
nhiều nhờ những tiến bộ mới về khoa học và công
nghệ (Hoá học, Vật lý, Điện tử và Công nghệ
thông tin), làm cho hiệu suất của việc giải trình tự
gen ngày một cao; người ta có thể giải một trình
tự dài hàng nghìn cặp base chỉ trong vòng vài
tiếng đồng hồ, điều mà trước đây phải làm hàng
tuần
Có nhiều kỹ thuật giải trình tự gen, sau đây
xin giới thiệu một kỹ thuật hiện nay đang được áp
dụng phổ biến thông qua một ví dụ cụ thể, giải
mã gen FliC
Gen FliC là gen mã hoá cho kháng nguyên
lông (protein) pha I của vi khuẩn Salmonella Các
Salmonella có lông thì đều có kháng nguyên này,
nhưng tính đặc hiệu thì khác nhau ở mỗi loài Sự
khác nhau này là do mã hoá khác nhau (trình tự
các nucleotides khác nhau) ở gen FliC quy định
Chính vì vậy, giải được trình tự gen FliC sẽ cho
phép thiết kế được các gen mồi đặc hiệu cho từng
loài Salmonella nhằm phát triển các kỹ thuật sinh
học phân tử (chẳng hạn PCR) để chẩn đoán đặc
hiệu cho từng loài hoặc phục vụ cho các nghiên
cứu tìm kiếm vaccine có độ đặc hiệu và công hiệu
cao
Để giải trình tự được gen FliC, bước đầu tiên
là phải thiết kế cặp mồi đặc hiệu Cặp mồi này đã
được thiết kế tại Labo trung tâm Y Sinh học, được
đặt tên là FliC_b_seqF (aag cgg cta ttt cgc cgc c
= 19 nucleotides) và FliC_b_SeqR (cgt gtc ggt
gaa tca atc gc = 20 nucleotides) Các trình tự này
đã được gửi đi tổng hợp thành các olignucleotide tại Công ty Invitrogen (Hồng Kông) Để thiết kế
được các cặp mồi này, các thông tin về gen FliC
phải được thu thập trước trên các ngân hàng dữ liệu gen (GenBank hoặc EMBL chẳng hạn)
Bước thứ hai là tách chiết ADN từ các chủng Salmonella, các ADN này sẽ dùng làm khuôn
trong phản ứng PCR ở bước tiếp theo Quá trình tách chiết này không khó, các Labo sinh học phân tử đều có thường quy này
Bước thứ ba là chạy PCR lần 1 với cặp mồi và
ADN khuôn nói trên Điều kiện tối ưu cho phản ứng PCR này phải dò tìm, nếu máy PCR có chương trình Gradient thì việc tìm kiếm các điều kiện nhiệt độ tối ưu sẽ thuận lợi hơn nhiều
Bước thứ tư là tinh sạch sản phẩm của phản
ứng PCR nói trên Có thể dùng phương pháp tách băng ADN đặc hiệu ngay trên thạch điện di (rẻ tiền) hoặc dùng KIT thương mại (đắt hơn)
Bước thứ năm là chạy PCR lần hai Khác với
PCR lần 1, lần này trong hỗn hợp phản ứng, người ta cho thêm dideoxynucleoside triphosphate (hai vị trí, trong đó có vị trí 3’, không có nhóm OH - ) có gắn chất màu huúnh quang Hiện nay, kỹ thuật đã cho phép gắn các chất màu huúnh quang khác nhau trên 4 loại nucleotide này, vì vậy, chỉ cần làm một phản ứng PCR trong một ống duy nhất chung cho cả 4 loại nucleotide (A, C, G và T); so với trước đây phải làm 4 phản ứng riêng rẽ ở 4 ống
* PGS TS Trưởng Labo trung tâm, Phó chủ nhiệm Bộ môn Vi sinh vật - Trường Đại học Y Hà Nội
Trang 2Bước thứ sáu là làm tinh sạch sản phẩm
(ADN) của phản ứng PCR 2 và làm biến tính
chúng để tạo ra ADN sợi đơn duỗi thẳng
Bước thứ bảy là đưa ADN đã được xử lý vào
máy giải trình tự gen để đọc tự động trình tự các
nucleotide trên FliC Có thể chỉ đọc một sợi hoặc
đọc đồng thời cả hai sợi để tăng độ chính xác của
các trình tự được đọc ra
Kết quả của quá trình giải trình tự gen FliC
được lưu trong máy dưới hai dạng (hình ảnh và chữ) Kết quả này đã được so sánh với các dữ liệu cùng loại có trong ngân hàng gen (GenBank, www ncbi nlm nih gov) và đã được đăng ký và công bố chính thức với số truy cập là AY657000
và AY657001 Sau đây xin giới thiệu gen FliC
của Salmonella paratyphi B (Hình 1).
Hình 1 Gen FliC - b của Salmonella paratyphi B trên GenBank (http: //www ncbi nlm nih gov)
Trang 3Các gen FliC của 5 Salmonella khác nhau đã đ−ợc giải trình tự và so sánh với nhau để tìm ra vùng đặc tr−ng cho mỗi loài, trong đó FliC - a là gen FliC của Salmonella paratyphi A, FliC - b là của Salmonella paratyphi B,
FliC - c là của Salmonella paratyphi C, FliC - d là của Salmonella typhi và FliC - i là của Salmonella
typhimurium; dấu “*” là biểu diễn các vị trí giống nhau và dấu “.” là biểu hiện các vị trí khác nhau
FliC - a 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60 FliC - b 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60 FliC - c 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60 FliC - d 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60 FliC - i 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
************************************************************
FliC - a 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - b 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCTGGTCTGCGTATCAACAGC 120
FliC - c 61: TCCCAGTCTGCTCTGGGTACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - d 61: TCCCAGTCCGCACTGGGCACTGCTATCGAGCGTTTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - i 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
********.**.*****.**.************.*******.******************
FliC - a 121: GCGAAAGACGATGCGGCAGGTCAGGCAATTGCTAACCGTTTCACCGCGAACATCAAAGGT 180 FliC - b 121: GCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGT 180 FliC - c 121: GCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTCACCGCGAACATCAAAGGT 180 FliC - d 121: GCGAAAGACGATGCGGCAGGACAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGT 180 FliC - i 121: GCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGT 180
********************.*****.**************.******************
FliC - a 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240 FliC - b 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240 FliC - c 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATTTCTATTGCGCAGACCACTGAAGGC 240 FliC - d 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240 FliC - i 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240
***********************************.**.*********************
FliC - a 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300 FliC - b 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300 FliC - c 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300 FliC - d 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCG 300 FliC - i 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300
***********************************************************
FliC - a 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360 FliC - b 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360 FliC - c 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGTCTG 360 FliC - d 301: AATGGTACTAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360 FliC - i 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
** *.**.***********************************************.***
Trang 4FliC - a 361: AACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420 FliC - b 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420 FliC - c 361: AACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420 FliC - d 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420 FliC - i 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
***********************.************************************
FliC - a 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACCATTGATATCGATCTG 480 FliC - b 421: GACAACACCCTGACCATCCAGGTTGGCGCGAACGACGGTGAAACTATCGATATCGATCTG 480 FliC - c 421: GACAACACTCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTG 480 FliC - d 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATTGATTTA 480 FliC - i 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTG 480
********.*****************.**.**************.**.*****.***.*
FliC - a 481: AAACAGATCAACTCTCAGACCCTGGGTCTGGATACGCTGAATGTGCAGAAAAAATATGAT 540 FliC - b 481: AAGCAGATCAACTCTCAGACCCTGGGTCTGGATACTTTAAGTGTACAGGATGCCTATACG 540 FliC - c 481: AAGCAGATCAACTCTCAGACCCTGGGCCTAGATACGCTGAATGTGCAGAAAAAATATGAT 540 FliC - d 481: AAAGAAATCAGCTCTAAAACACTGGGACTTGATAAGCTTAATGTCCAAGATGCCTACACC 540 FliC - i 481: AAGCAGATCAACTCTCAGACCCTGGGTCTGGATACGCTGAATGTGCAACAAAAATATAAG 540
** *.****.****.*.**.*****.**.**** *.*.***.** * **
FliC - a 541: GTGAAGAGCGAAGCGGTCACGCCTTC - GGCTA - - CATTAAGCACTACTGCACTTGATGGT 597 FliC - b 541: CCAAAAGGTACCGCTGTTACCAGAGA - TGTTA - - CCACCTATAAAAATGGTGGTACTACT 597 FliC - c 541: GTGAGCGATACTGCTGTAGCTGCTTC - - - CTATTCCGACTCGAAACAGAATATTGCTGTT 597 FliC - d 541: CCGAAAGAAACTGCTGTAACCGTTGA - TAAAA - - CTACCTATAAAAATGGTACAGATCCT 597 FliC - i 541: GTCAGCGATACGGCTGCAACTGTTACAGGATATGCCGATACTACGATTGCTTTAGACAAT 600
.* **.* * * * * *
FliC - a 598: GCTGGCCTCAAAACCGGAACCGGTTCTACAACTGATACTGGTTCAATTAAGGATGGTAAG 657 FliC - b 598: CTTACAGCACCTAACGCAGCAGCAATTGATACCGCTTTAGGTACGACTGGTGCGGCGGGT 657 FliC - c 598: CCTGA - - - TAAAACAGCTATTACTGCAAAAATTGGTGCAGCAACCAGTGGTGGTGCTGGT 654 FliC - d 598: ATTACAGCCCAGAGCAATACTGATATCCAAACTGCAATTGGCGGTGGTGCAACGGGGGTT 657 FliC - i 601: AGTACTTTTAAAGCCTCGGCTACTGGTCTTGGTGGTACTGACCAGAAAATTGATGGCGAT 660
* .* * *
FliC - a 658: GTTTACTATAACAGCACCTCTAAA - - - AATTATTATGTTGAAGTAGAATTTACCGAT 711 FliC - b 658: ACTGCGGCTG - - - TGAAATTTAAAGACGGTAACTACTTCGTTGAGGTGACCGGTACAACT 714 FliC - c 655: ATAAAAGCAGATATTAGCTTTAAAGATGGCAAGTATTACGCGACTGTCAGTGGATACGAT 714 FliC - d 658: ACTGGGGCTGATATCAAATTTAAAGATGGTCAATACTATTTAGATGTTAAAGGCGGTGCT 717 FliC - i 661: TTAAAATTTGATGATACGACTGGA - - - AAATATTACGCCAAAGTTACCGTTACGGGG 714
* * * * **.* **
Trang 5FliC - a 712: GCGACCGATC - - - AAACCAACGAAGGCGGATTCTATAAAGTTAATGTTGCTGATGATGGT 768 FliC - b 715: AAAGATGGTCTGTATGAAGCGACAGTTGATGCAGCTG - - - - GCGCGGTGACAATGA - - CC 768 FliC - c 715: GATGCCGCAG - - - ATACAGATAAAAATGGAACCTATGAAGTCACTGTTGCCGCAGA - - - T 768 FliC - d 718: TCTGCTGGTGTTTATAAAGCCACTTATGATGAAACTACAAAGAAAGTTAATATTGATACG 777 FliC - i 715: GGAACTGGTA - - - AAGATGGCTATTATGAAGTTTCCGTTGATAAGACGAACGGTGA - GGT 770
* * * **
FliC - a 769: GCAGTCACAATGAC - - T - GCGGCTACCAC - CAAAGAGGCT - ACAAC - TCCTACAGGTATT 822 FliC - b 769: GCAAATAAAGCAACAGT - - - AACTGGGGCTAGT - - - ACAGTT 804
FliC - c 769: ACAGGAGCAGTTACTTTTGCGACTACACC - AACAGTGGTTGACTTA - - CCAACTGATGCA 825 FliC - d 778: ACTGATAAAACTCCGTTGGCAACTGCGGAAGCTACAGCTATTCGGGGAACGGCCACTATA 837 FliC - i 771: G - ACTCTTGCTGGCGGT - GCGACTTCCCCGCTTACAGGTGGACTACCTGCGACAGCAACT 828
.* * **
FliC - a 823: ACTGAAGTTACTCAAGTCCAAA - - - AACCTGTGGCTGCTC - - - CAGCTGCTAT - - - - CCA 872 FliC - b 805: ACTGAAAACCAAATTGTAGACGCTGTTACACCGACGCCAGTTGATACAGTCGCAGCAGCT 864 FliC - c 826: AAAGCAGTTTCAAAAGTTCAAC - - - AGAATGATACTGAAATAGCAGCAACAAATGCGAAA 882 FliC - d 838: ACCCACAACCAAATTGCTGAAG - - - TAACAAAAGAGGGTGTTGATACGACCACAGTTGCG 894 FliC - i 829: GAGGATGTGAAAAATGTACAAG - - - TTGCAAATGCTGATTTGACAGAGGCTAA - - - A 879
.* *
FliC - a 873: GGCTCAGTTGACTGCTGCCCATGTGACCGGCGCTGATACTG - - - CTGAAATGGTTAA 926 FliC - b 865: ACTGCA - TTGACCAATGCAGGTGTGACAGGTGC - GACAGGTA - - ATACCAGCTTGGTTAA 920 FliC - c 883: GCTGCA - TTAAAAGCTGCAGGAGTTGCAGATGCAGAAGCTGATACAGCTACTTTAGTGAA 941 FliC - d 895: GCTCAA - CTTGCTGCAGCAGGGGTTACTGGCGCCGATAAGGACAATACTAGCCTTGTAAA 953 FliC - i 880: GCCGCA - TTGACAGCAGCAGGTGTTACCGGCACAGCATCTG - - - TTG - - - TTAA 926
.*.* ** ** * * * * *.**
FliC - a 927: GATGTCTTATACGGATAAAAACGGTAAGACTATTGATGGCGGTTTCGGTGTTAAAGTTGG 986 FliC - b 921: AATGTCATTTGAAGATAAAAATGGCAAAGTTACTGATGCGGGTTACGCGCTTAAAGTTGG 980 FliC - c 942: AATGTCTTATACAGATAATAATGGCAAAGTTATTGATGGTGGGTTCGCATTTAAGACCTC 1001 FliC - d 954: ACTATCGTTTGAGGATAAAAACGGTAAGGTTATTGATGGTGGCTATGCAGTGAAAATGGG 1013 FliC - i 927: GATGTCTTATACTGATAATAACGGTAAAACTATTGATGGTGGTTTAGCAGTTAAGGTAGG 986
*.**.*.* *****.**.**.** **.***** **.* * *.**
FliC - a 987: GGCTGATATTTATGCTGCAACAAAAAAT - - - AAAGATGGATCGTTCAGCATTAACACCAC 1043 FliC - b 981: AAATGATTATTATGCCGCTGATTACGATGAAAAAACTGGTGAGATAAAAGCTAAAACTGT 1040 FliC - c 1002: CGGTGGTTATTATGCAGCATCTGTTGAT - - - AAATCTGGCGCAGCTAGCTTGAAAGTTAC 1058 FliC - d 1014: CGACGATTTCTATGCCGCTACATATGATGAGAAAACAGGTGCAATTACTGCTAAAACCAC 1073 FliC - i 987: CGATGATTACTATTCTGCAACTCAAAAT - - - AAAGATGGTTCCATAAGTATTAATACTAC 1043
*.* ***.* ** ** *** ** * **
Trang 6FliC - a 1044: TGAATATACCGATA - - AAGAC - GGCAACACTAAAACTGCACTAAACCAACTGGGTGGCGC 1100 FliC - b 1041: AAATTATACTGACG - - - CTACTGGTGCGACAAAAACCGGTGCTGTGAAATTTGGCGGTGC 1097 FliC - c 1059: TAGCTACGTTGACGCTACCACTGGTACCGAAAAAACTGCTGCGAATAAATTAGGTGGCGC 1118 FliC - d 1074: TACTTATACAGATG - - - GTACTGGCGTTGCTCAAACTGGAGCTGTGAAATTTGGTGGCGC 1130 FliC - i 1044: GAAATACACTGCAG - - ATGAC - GGTACATCCAAAACTGCACTAAACAAACTGGGTGGCGC 1100
** * **.** ****.* **.* **.**.**
FliC - a 1101: AGACGGTAAAACTGAAGTTGTTTCTA - - - TCGACGGTAAAACCTACAATGCCAGCAAAGC 1157 FliC - b 1098: GAATGGTAAAACTGAAGTTGTGACCACCGTTGATGGTAATACTTATCAGGCTAGTGATGT 1157 FliC - c 1119: AGACGGTAAAACCGAAGTTGTTACTA - - - TCGACGGTAAAACCTACAATGCCAGCAAAGC 1175 FliC - d 1131: AAATGGTAAATCTGAAGTTGTTACTGCTACCGATGGTAAGACTTACTTAGCAAGCGACCT 1190 FliC - i 1101: AGACGGCAAAACCGAAGTTGTTTCTA - - - TTGGTGGTAAAACTTACGCTGCAAGTAAAGC 1157
*.**.***.*.******** * * *****.**.** ** ** *
FliC - a 1158: CGCTGGTCACAACTTTAAAGCACAGCCAGAGCTGGCTGAAGCGGCTGCTGCAACCACCGA 1217 FliC - b 1158: AAAAGGGCATAATTTCCAGAGTGGTGGCGCTTTAAGCGAGGCTGTAACCACTAAAACTGA 1217 FliC - c 1176: CGCTGGGCACAACTTCAAAGCACAGCCAGAGCTGGCGGAAGCGGCTGCTACAACCACTGA 1235 FliC - d 1191: TGACAAACATAACTTCAGAACAGGCGGTGAGCTTAAAGAGGTTAATACAGATAAGACTGA 1250 FliC - i 1158: CGAAGGTCACAACTTTAAAGCACAGCCTGATCTGGCGGAAGCGGCTGCTACAACCACCGA 1217
**.**.** * * **.* * * **.**
FliC - a 1218: AAACCCGCTGGCTAAAATTGATGCCGCGCTGGCGCAGGTTGATGCGCTGCGTTCTGACTT 1277 FliC - b 1218: AAACCCGCTGGCTAAAATTGATGCCGCGCTGGCGCAAGTTGATGCGCTGCGTTCTGACTT 1277 FliC - c 1236: AAACCCGCTGCAGAAAATTGATGCTGCTTTGGCGCAGGTGGATGCGCTGCGTTCTGACCT 1295 FliC - d 1251: AAACCCACTGCAGAAAATTGATGCTGCCTTGGCACAGGTTGATACACTTCGTTCTGACCT 1310 FliC - i 1218: AAACCCGCTGCAGAAAATTGATGCTGCTTTGGCACAGGTTGACACGTTACGTTCTGACCT 1277
******.*** ***********.**.****.**.**.** * *.*********.*
FliC - a 1278: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1337 FliC - b 1278: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAA 1337 FliC - c 1296: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1355 FliC - d 1311: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1370 FliC - i 1278: GGGTGCGGTACAGAACCGTTTCAACTCCGCTATTACCAACCTGGGCAACACCGTAAACAA 1337
*********.***********************.**************.********.**
FliC - a 1338: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1397 FliC - b 1338: CCTGTCTGAAGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTCTCCAACAT 1397 FliC - c 1356: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1415 FliC - d 1371: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCAACCGAAGTCTCCAACAT 1430 FliC - i 1338: CCTGACTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1397
****.** ********************************.********.********
Trang 7FliC - a 1398: GTCTCGCGCGCAGATCCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457 FliC - b 1398: GTCCCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457 FliC - c 1416: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGG - 1474 FliC - d 1431: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1490 FliC - i 1398: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
***.***********.*******************************************
FliC - a 1458: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1488
FliC - b 1458: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1488
FliC - c 1474: - - - 1474
FliC - d 1491: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1521
FliC - i 1458: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1488
2 Kỹ thuật Real - Time PCR
Trong nhiều trường hợp, người ta cần biết số lượng acid nucleic trong mẫu nghiên cứu để phục vụ cho
điều trị hoặc tìm hiểu cơ chế của một quá trình nào đó Ví dụ như, để áp dụng phương pháp điều trị viêm gan B thích hợp, người ta cần biết số lượng các hạt virus (copy numbers) trong 1 ml máu bệnh nhân Các nhu cầu loại này được giải quyết nhờ kỹ thuật Real - Time PCR hay còn gọi là là kỹ thuật PCR định lượng
Real - Time PCR được thực hiện dựa trên khái niệm “giá trị Ct” (Ct value) Ct là số chu kỳ nhỏ nhất trong phản ứng PCR mà ở đó có sự nhân lên của ADN khuôn (Hình 2)
Hình 2: Sơ đồ biểu diễn giá trị Ct
(ở đây, Ct = 17,5)
Trang 8Để có thể định lượng được, phải lập đường chuẩn với các giá trị đã biết của các nồng độ ADN khác
nhau (Hình 3):
5
4
2
3
1
Hình 3 Đường chuẩn với 5 nồng độ ADN khác nhau
Căn cứ vào giá trị Ct, người ta sẽ tính được số lượng ADN mẫu (copy numbers) đã đưa vào phản ứng
Bảng 1 là một ví dụ kết quả Real - Time PCR của một số mẫu trong số 110 mẫu huyết thanh bệnh nhân
đã được xét nghiệm chẩn đoán HBV, trong đó 75% số mẫu dương tính với số lượng copies virus HBV
khác nhau Giá trị Ct càng bé thì số copies number càng lớn và ngược lại:
Bảng 1: Kết quả xét nghiệm HBV (*, E = exponent value; ví dụ E+11 = 1011)
Ký hiệu mẫu Giá trị Ct Copies/ml
Trang 9Summary
Introduction of sequencing and Real - Time PCR techniques
DNA sequencing was first introduced in 1975 by Sanger The sequencing technique was started with the related information on the interested gene in internet The following steps consisted of:
- Design specific primers
- Extract and purify DNA templates
- Conduct first PCR (PCR - 1) with the specific primers and template
- Purify the DNA product from PCR - 1
- Conduct second PCR (PCR - 2) with the addition of dideoxynucleosides triphosphate and only one primer (not pair of the primers)
- Purify the PCR - 2 product and denature the DNA to get single - stranded DNA
- Read sequences with ABI 3100 avant sequencer
- Processing the collected data and publish
Real - Time PCR was a quantitative PCR The principle of the PCR was based on the threshold value (Ct) The Ct value was minimum number of the cycles of a PCR at which the double - stranded DNA was first synthetized Thus, the smaller Ct value we got, the greater DNA template present at the beginning of the reaction and vise versa
The basic differentiation in Real - Time PCR compared to the normal one was known standards (the DNA template with the defined concentration) The standards were run paralell with the samples The results of Real - Time PCR will then show exactly the copy numbers of templates in the original samples