Trước đây dù đã xác nhận được sự tồn tại của gen trên nhiễm sắc thể - hợp thành từ protein và DNA, tuy nhiên người ta vẫn chưa biết đến cái gì trong hai chất đó đóng vai trò trong sự di truyền. Năm1928, Frederick Griffith tìm ra hiện tượng biến nạp: những vi khuẩn đã chết có thể chuyển vật liệu di truyền của chúng để làm biến đổi những vi khuẩn còn sống khác. Năm 1944, Oswald Theodore Avery, Colin McLeod và Maclyn McCarty trực tiếp xác định DNA là phân tử đảm nhận biến nạp.
Tuy nhiên, đến tận năm 1952, thí nghiệm của Hershey-Chase mới cho thấy DNA (chứ không phải protein) là vật liệu di truyền của virus xâm nhiễm vi khuẩn, cung cấp thêm bằng chứng chứng tỏ DNA là phân tử đảm nhận chức năng di truyền.
Những đại phân tử DNA này chứa những thông tin quyết định trình tự amino acid, cấu trúc và chức năng của tất cả những protein trong một tế bào, hay nói cách khác chúng chứa thông tin cần thiết để xây dựng nên tế bào và mô của một sinh vật.
Sự sao chép lại những thông tin này một cách chính xác ở tất cả các loài đảm bảo tính kế tục di truyền từ đời này sang đời khác và đóng vai trò then chốt cho sự phát triển bình thường của một cá thể.
4.2.Sự sao chép DNA – cơ sở phân tử của di truyền
James D. Watson và Francis Crick cho ra đời mô hình cấu trúc DNA năm 1953, sử dụng công trình tinh thể học tia X của Rosalind Franklin, chứng tỏ rằng DNA có cấu trúc xoắn kép[30][31]. Sự bắt cặp các base bên trong mô hình xoắn kép DNA của Watson và Crick gợi ý rằng mạch DNA mới được tổng hợp bằng cách sử dụng mạch sẵn có (mạch mẹ) làm khuôn để hình thành nên mạch con mới bổ sung với mạch mẹ. Như vậy có hai cơ chế được suy ra từ mô hình này: cơ chế bảo tồn và bán bảo tồn. Trong cơ chế bảo tồn, hai mạch con tạo ra một phân tử DNA mạch đôi mới với mạch đôi mẹ vẫn nguyên vẹn. Trong cơ chế bán bảo tồn, mạch mẹ được tách ra và mỗi cái tạo ra một phân tử mạch đôi với mạch con bắt cặp base với mạch mẹ. M. Meselson và W. F. Stahl đã tìm ra bằng chứng cho thấy mạch đôi DNA được sao chép theo cơ chế bán bảo tồn.
Như vậy, việc sao chép một mạch khuôn DNA tạo thành mạch bổ sung là một đặc điểm chung của sự sao chép DNA và phiên mã từ DNA ra RNA. Ở cả hai trường hợp, thông tin trên mạch được bảo toàn. Ở một vài virus, những phân tử RNA mạch đơn đóng vai trò là mạch khuôn cho sự tổng hợp mạch RNA bổ sung hoặc mạch DNA.
4.2.1. Đoạn mồi
Giống như RNA, DNA được tổng hợp từ những đơn phân deoxynucleoside 5- triphosphate (dNTP). Và cũng giống như sự tổng hợp RNA, sự tổng hợp DNA luôn diễn ra theo chiều từ 5' 3' vì mạch được phát triển từ sự hình thành một liên kết phosphoester giữa 3' oxygen của mạch đang dài ra và α phosphate của một dNTP.
Như đã đề cập ở phần trên, RNA polymerase có thể tìm kiếm vị trí bắt đầu phiên mã thích hợp trên mạch đôi DNA và khởi sự tổng hợp một phân tử RNA bổ sung với mạch DNA. Ngược lại, DNA polymerse không thể khởi sự tổng hợp chuỗi ngay từ đầu mà thay vào đó, chúng cần có một mạch RNA hoặc DNA ngắn, gọi là đoạn mồi primer, để bắt đầu sự phát triển của chuỗi. Với một mồi bắt cặp với mạc khuôn, DNA polymerase gắn các deoxynucleotide vào nhóm hydroxyl tự đo ở đầu 3' của đoạn mồi theo sự chỉ định bởi trình tự trên mạch khuôn.
Khi đoạn mồi là RNA, mạch con được tạo thành là RNA ở đầu 5' và là DNA ở đầu 3'.
4.2.2. Sự tháo gỡ mạch đôi và chĩa ba sao chép
Để mạch đôi DNA có chức năng như là mạch khuôn trong suốt sự sao chép, hai mạch xoắn quấn vào nhau phải được tháo gỡ để các base có thể bắt cặp được với các base của dNTP. Sự tháo gỡ này của mạch DNA mẹ được tiến hành nhờ enzyme helicase, bắt đầu tại những đoạn đặc biệt trên DNA gọi là điểm bắt đầu sao chép (replication origin). Trình tự của những điểm này khác nhau rất lớn ở những sinh vật khác nhau mặc dù chúng thường chứa A, T. Khi các enzyme helicase đã tháo gỡ mạch DNA ở điểm bắt đầu, một loại RNA polymerase đặc biệt gọi primase đến để tạo nên đoạn mồi RNA ngắn bổ sung với mạch khuôn đã tháo gỡ. Đoạn mồi trong lúc vẫn bắt cặp với mạch DNA, nó được kéo dài bởi một DNA polymerase, từ đó tạo nên mạch con mới.
Hình 17: Sơ đồ tổng hợp DNA ở mạch tới và mạch chậm tại chĩa ba sao chép Các nucleotide được thêm vào bởi DNA polymerase ở mỗi mạch con theo chiều từ 5'
3'. Mạch tới được tổng hợp liên tục từ một đoạn mồi RNA (màu đỏ) ở đầu 5'. Mạch chậm được tổng hợp không liên tục từ nhiều đoạn mồi RNA được tạo ra một cách gián đoạn mỗi khi một vùng mới của mạch đôi được tách ra. Sự kéo dài những đoạn mồi ban đầu tạo ra những đoạn Okazaki. Khi mỗi đoạn này được kéo dài gần đến đoạn trước nó, đoạn mồi sẽ bị tháo gỡ và những đoạn này được nối lại với nhau. Quá trình này lặp đi lặp lại cho đến khi tổng hợp được toàn bộ mạch chậm.
Vùng DNA mà tại đó tất cả những protein tập hợp lại để tiến hành sao chép tổng hợp mạch con được gọi là chĩa ba sao chép. Khi sự sao chép diễn ra, chĩa ba sao chép và những protein liên quan rời khỏi điểm bắt đầu. Như đã biết, việc tách mạch mạch đôi DNA tạo nên một áp lực xoắn lên những đoạn xoắn kép lân cận. Áp lực này được giải phóng bởi enzyme topoisomerase I. Để cho DNA polymerase có thể chạy dọc theo và sao chép DNA, helicase phải liên tục tách mạch và topoisomerse phải tháo bỏ siêu xoắn được tạo thành từ đó. Một vấn đề phức tạp trong hoạt động của chĩa ba sao chép DNA nảy sinh từ hai tính chất: hai mạch của DNA mẹ là đối song song, và DNA polymerase (cũng giống như RNA polymerase) có thể gắn các nucleotidr vào mạch mới chỉ theo chiều 5'3'. Sự tổng hợp của một mạch con gọi là mạch tới, có thể tiến hành một cách liên tục từ một đoạn mồi RNA theo hướng 5'3', cùng hướng di chuyển của chĩa ba sao chép. Vấn đề đến từ việc tổng hợp mạch con khác, gọi là mạch chậm.
Bởi vì sự phát triển của mạch chậm cần phải xảy ra theo hướng 5' 3' nên việc sao chép mạch khuôn của nó cần phải xảy ra theo hướng ngược lại với chiều di chuyển của chĩa ba sao chép. Một tế bào hoàn thành việc này bằng cách tổng hợp một đoạn mồi mới dài khoảng vài trăm base trên mạch mẹ thứ hai. Mỗi đoạn primer này bắt cặp vào mạch khuôn của chúng và được kéo dài theo hướng 5'3', tạo nên những đoạn không liên tục gọi là đoạn Okazaki (đặt tên theo người phát hiện ra
thế bằng sự phát triển của những đoạn Okazaki kế bên; cuối cùng một enzyme gọi là DNA ligase gắn những đoạn gần nhau cho ra một mạch con hoàn chỉnh.
4.2.3. Helicase, primase, DNA polymerase và các protein tham gia vào sao chép Những nghiên cứu trên DNA virus, đặc biệt là DNA SV40, bộ gen vòng của một virus gây nhiễm ở khỉ đã giúp các nhà khoa học hiểu chi tiết hơn về những protein ở eukaryote tham gia vào sự sao chép DNA. Hình dưới đây minh họa nhiều loại protein phối hợp vào việc sao chép SV40 DNA tại chĩa ba sao chép. Những phức hợp nhiều thành phần khác nhau này cho phép tế bào thực hiện một chuỗi các sự kiện để hoàn thành được chức năng cần thiết của tế bào. Trong bộ máy phân tử sao chép SV40 DNA, một hexamer của một protein virus gọi là T-antigen có nhiệm vụ tách mạch đôi tại chĩa ba. Tất cả những protein khác liên quan đến sự sao chép SV40 DNA được cung cấp bởi tế bào chủ. Những đoạn mồi cho mạch con DNA ở mạch tới và mạch sau được tổng hợp bởi một phức hợp primase, và DNA polymerase α (Pol α), cái mà có nhiệm vụ kéo dài đoạn mồi RNA với deoxynucleotide, tạo nên đoạn mồi hỗn hợp RNA-DNA.
Đoạn mồi được kéo dài thành mạch con DNA bởi DNA polymerase (Pol). Pol ít có khả năng sai sót hơn so với Pol α, nó tạo một phức hợp với Rfc (nhân tố sao chép C) và PCNA (kháng nguyên nhân tăng sinh tế bào), cái mà thay thế phức hợp primase-Pol α sau sự tổng hợp mồi.
Sau khi DNA mẹ được tách thành những mạch khuôn đơn tại chĩa bao sao chép, nó được gắn bởi nhiều bản sao của RPA (protein sao chép A). Việc gắn vào của RPA duy trì mạch khuôn ở một hình dạng không thay đổi tối ưu cho sự sao chép bởi DNA polymerase. Những protein RPA gắn vào sẽ bị đẩy ra khỏi mạch mẹ bởi Pol α và Pol khi chúng tổng hợp những mạch bắt cặp bổ sung với những mạch mẹ.
Ngoài ra ở eukaryote còn có những protein khác tham gia vào sao chép DNA.
Enzyme topoisomerase kết hợp với mạch DNA mẹ ở phía trước helicase để giải bớt áp lực xoắn gây ra bởi sự tách mạch ở mạch mẹ. Ribonuclease H và FEN I tháo gỡ ribonucleotide tại đầu 5' của những đoạn Okazaki; những ribonucleotide này sẽ được thay thế bằng deoxynucleotide được thêm vào bởi DNA pol khi nó kéo dài đoạn Okazaki ở phía thượng nguồn. Những đoạn Okazaki liên tiếp được gắn vào nhau bởi DNA ligase qua những liên kết 5'3' thông thường.
Hình 18: Mô hình chĩa ba sao chép SV40 DNA và những protein liên quan Hexamer của T-antigen lớn (1) là một protein của virus có chức năng như một helicase giúp tách mạch DNA. Những vùng mạch đợn của mạch khuôn được tách ra bởi T- antigen này được gắn bởi những bản sao của protein RPA (2). Mạch tới được tổng hợp bởi phức hợp DNA polymerase δ (Pol δ), PCNA và Rfc (3). Những đoạn mồi cho sự tổng hợp mạch chậm (màu đỏ, RNA; màu xanh, DNA) thì được tổng hợp bởi một phức hợp gồm DNA polymerase α (Pol α) và primase (4). Đầu 3' của mỗi đoạn mồi được tổng hợp bởi Pol α-primase sau đó sẽ được gắn bởi phức hợp PCNA-Rfc-Pol. Phức hợp này tiếp tục tổng hợp kéo dài đoạn mồi (5). [Sơ đồ được sửa lại từ S. J. Flint và cs, 2000, Virology:
Molecular Biology, Pathogenesis, and Control, ASM Press.]
4.2.4. Sự sao chép hai chiều
Theo lý thuyết, sự sao chép DNA từ một điểm bắt đầu có thể cho ra một chĩa ba sao chép di chuyển theo một chiều. Nhưng thật ra sự sao chép DNA thường xảy ra theo hai chiều: có thể có hai chĩa ba sao chép ở cùng một điểm bắt đầu và chúng di chuyển theo hai thướng ngược nhau. Việc sao chép hai chiều này đã được chứng minh bởi một vài thí nghiệm. Tế bào prokaryote và eukaryote đều sử dụng cơ chế sao chép hai chiều này. Trong trường hợp SV40 DNA, sự sao chép được khởi sự bằng việc gắn hai helicase T-antigen vào một điểm khởi đầu duy nhất và việc tập hợp những protein khác tạo nên hai chĩa ba sao chép. Hai chĩa ba này sau đó di chuyển theo hai hướng ngược nhau từ điểm khởi đầu với sự tổng hợp mạch tới lẫn mạch chậm xảy ra ở cả hai chĩa ba.
Không giống như SV40 DNA, những phân tử DNA nhiễm sắc thể ở eukaryote chứa nhiều điểm bắt đầu khác nhau cách nhau khoảng vài chục cho đến vài trăm
ORC gán vào mỗi điểm và liên kết với những protein khác cần cho việc lắp những helicase gồm 6 protein MCM. Hai helicase MCM ngược nhau tách hai mạch mẹ ở điểm khởi đầu với những protein RPA gắn vào mạch đơn DNA đã tách ra. Sự tổng hợp các đoạn mồi và những bước tiếp theo trong sao chép DNA được cho là giống với sự sao chép của SV40 DNA.
Hình 19: Hình hiển vi điện tử thể hiện sự sao chép hai chiều ở SV40 DNA
[Xem G. C. Fareedvà cs, 1972, J. Virol. 10:484; photographs courtesy of N. P. Salzman.]
Sự sao chép DNA tế bào và những sự kiện khác dẫn đến sự tăng sinh của tế bào được điều hóa rất chặt chẽ để chỉ sản xuất ra đúng số lượng tế bào thích hợp cấu thành nên mỗi mô trong suốt quá trình phát triển và sinh sống của một sinh vật.
Cũng như sự phiên mã của hầu hết các gene, việc điều khiển ở bước khởi sự cũng là cơ chế chủ yếu trong việc điều hòa sao chép DNA. Sự hoạt hóa helicase MCM cần cho việc khởi sự sao chép được điều hòa bởi những protein kinase đặc biệt gọi là kinase phase S phụ thuộc cyclin (S-phase cyclin-dependent kinase). Những kinase phụ thuộc cyclin khác điều hòa những quá trình khác của sự tăng sinh tế bào, bao gồm quá trình nguyên phân phức tạp mà nhờ đó một tế bào eukaryote phân chia thành hai tế bào con có bộ nhiễm sắc thể giống hệt tế bào mẹ.