Cần lưu ý rằng, khi ở dạng tự do các nguyên tử carbon trong phân tử được đánh số từ 1 đến 5, nhưng khi trở thành một bộ phận của phân tử nucleotide, chúng phải được đánh số từ 1' đến 5'
Trang 1CHƯƠNG 6 NUCLEOTIDE VÀ ACID NUCLEIC
Cùng với protein, acid nucleic đóng vai trò cực kỳ quan trọng trong việc bảo tồn sự sống Tuy nhóm hợp chất này đã được phát hiện hơn 100 năm về trước, cấu tạo, tính chất và chức năng của chúng chỉ mới được hiểu biết một cách sâu sắc từ những năm 50 của thế kỷ 20 nhờ ứng dụng những phương pháp nghiên cứu vật lý và hóa học chính xác
Trên cơ sở sự khác biệt về thành phần hóa học, acid nucleic được chia thành hai
nhóm lớn Đó là acid ribonucleic (ARN) và acid deoxyribonucleic (ADN) ADN có
trọng lượng phân tử từ vài triệu đến vài trăm triệu, là thành phần không thể thiếu được của nhiễm sắc thể trong nhân tế bào Ngoài ra, ADN còn có mặt trong ti thể và lục lạp ARN có nhiều loại: ARN vận chuyển (tARN) có trọng lượng phân tử tương đối nhỏ (25.000 – 35.000); ARN ribosome (rARN), nói chung, có trọng lượng phân tử khá lớn (từ 1,7 đến 1,2 triệu), trừ một vài loại chỉ lớn hơn tARN một ít; ARN thông tin (mARN) có trọng lượng phân tử từ 300.000 đến 4 triệu; ARN virus có trọng lượng phân tử từ 1 đến 2 triệu Ngoài ra, còn có một số ARN khác, chủ yếu là ARN phân tử nhỏ mà cấu trúc và chức năng của chúng chưa được hiểu biết nhiều
Đại bộ phận acid nucleic (cả ADN và ARN) là những biopolymer dạng sợi hình thành từ các đơn vị cấu tạo (monomer) có tên chung là (mono)nucleotide Mỗi nucleotide được cấu tạo từ ba thành phần: monosaccharide, base nitơ và acid phosphoric
I NUCLEOTIDE
Phần lớn nucleotide, hay còn gọi là mononucleotide, là đơn vị cấu tạo của acid
nucleic Chúng đưọc cấu tạo từ base nitơ, đường pentose và acid phosphoric
Tất cả các nucleotide tham gia cấu tạo nên acid nucleic đều chứa một trong hai loại monosaccharide: β-D-ribose hoặc 2-β-D-deoxyribose
Cả hai loại pentose này đều có dạng cấu trúc vòng furanose Cần lưu ý rằng, khi ở dạng tự do các nguyên tử carbon trong phân tử được đánh số từ 1 đến 5, nhưng khi trở thành một bộ phận của phân tử nucleotide, chúng phải được đánh số từ 1' đến 5' (để phân biệt với các nguyên tử carbon trong base nitơ)
Ngoài ribose và deoxyribose, ribitol - sản phẩm khử của ribose - cũng có thể tham gia trong thành phần cấu tạo của một số nucleotide đặc biệt
Trong hai loại acid nucleic - acid ribonucleic và acid deoxyribonucleic - có 5 loại base nitơ thường gặp, 3 loại chung cho cả ADN và ARN (adenine, guanine và
Trang 2cytosine), loại thứ tư (uracil) đặc trưng cho ARN, còn loại thứ 5 (thymine) hầu như chỉ có mặt trong ADN
Hình IV.1 Công thức cấu tạo của các base nitơ chủ yếu
Adenine và guanine là dẫn xuất của purine và do đó được xếp vào nhóm base purine; 3 base còn lại là dẫn xuất của pyrimidine và do đó được xếp vào nhóm base pyrimidine
Thymine cũng được xem là một base thứ yếu trong thành phần cấu tạo cảa ARN; ngược lại, uracil là base thứ yếu trong ADN Cấu trúc của các base chủ yếu được trình bày trong hình IV.1 Cách đánh số các nguyên tử carbon và nitơ trong mỗi phân tử base được giới thiệu qua các đại diện là purine và pyrimidine Từ công thức cấu tạo của các base chủ yếu ta có thể dễ dàng viết công thức
Hình IV.2 Hiện tượng hỗ biến ở các base chứa oxy
Trang 3cấu tạo của các base thứ yếu trên cơ sở tên gọi của chúng
Đặc điểm quan trọng của các dẫn xuất chứa oxy của purine và pyrimidine là khả năng hỗ biến, tức chuyển hóa tương hỗ giữa các dạng enol (lactim) và cetone (lactam) (hình IV.2):
Ngoài các base chủ yếu nói trên, trong một số loại acid nucleic, đặc biệt là trong ARN vận chuyển (tARN) và ARN ribosom (rARN), còn hay gặp một số base khác với hàm lượng không lớn Chúng được gọi là các base thứ yếu, phần lớn là các dẫn xuất hydrogen hóa, methyl hóa, oxymethyl hóa của các base chủ yếu, ví dụ dihydrouracil (UH2),2-methyladenine (A-CH3), 5-oxymethyl-cytosine (C-OCH3) v.v Tất cả các base nitơ đều hấp thụ ánh sáng mạnh nhất trong vùng phổ cực tím Tính chất này được ứng dụng để xác định hàm lượng acid nucleic và các sản phẩm thủy phân của chúng
Khi một base nitơ liên kết với một pentose bằng liên kết N-glycoside sẽ tạo ra
các sản phẩm có tên chung là nucleoside Tùy thuộc ở chỗ loại pentose nào và loại
base nào tham gia cấu tạo nên nucleoside mà mỗi loại có tên gọi riêng của mình Trên
cơ sở thành phần pentose người ta phân biệt hai loại nucleoside là ribonucleoside (pentose là ribose) và deoxyribonucleoside (pentose là deoxyribose) Ở cách nhìn khác, các nucleoside lại được phân biệt là purine nucleoside hay pyrimidine nucleoside
tùy thuộc ở chỗ base purine hay base pyrimidine tham gia trong thành phần cấu tạo của chúng Cần lưu ý rằng trong các purine-nucleoside liên kết glycoside hình thành giữa C-1' với N-9, trong khi đó các pyrimidine nucleoside - giữa C-1' với N-1 Công thức cấu tạo của một số nucleoside điển hình được giới thiệu trong hình VI.3 Thông qua các công thức cấu tạo này ta có thể hình dung công thức cấu tạo của các nucleoside khác
Nucleoside được gọi tên theo base nitơ theo nguyên tắc:
- Nếu base là dẫn xuất của purine thì đuôi "- ine" được đổi thành "-osine", ví dụ:
adenosine, guanosine;
- Nếu base là dẫn xuất của pyrimidine thì đuôi "-acil" hoặc "-ine" được đổi thành
"-idine", ví dụ: cytidine, uridine, thymidine
Pseudouridine (ψ) trong hình IV.3 là một trường hợp đặc biệt, hầu như chỉ gặp trong tARN với tỉ lệ rất thấp
Trang 4Từ các công thức cấu tạo trong hình VI.3 ta có thể hình dung công thức cấu taọ của các nucleotide khác với sự tham gia của guanine, cytidine, uracil, thymin v.v
Hình IV.3 Cấu tạo của một số nucleoside điển hình
Khi một nucleoside kết hợp với một gốc phosphate bằng liên kết ester thông qua một trong các nhóm -
OH còn lại của gốc pentose sẽ tạo ra một nucleotide tương ứng Điều đó có nghĩa là mỗi ribonucleoside có thể tạo ra ba loại nucleotide, trong đó gốc phosphate có thể gắn tại C-2', C-3' hoặc C-5'; trong khi đó mỗi deoxyribonucleoside chỉ tạo ra hai loại nucleotide tương ứng vì tại C-2' không có nhóm -OH để tương tác với phosphate Tùy thuộc vào vị trí gắn gốc phosphate mà sản phẩm được gọi là 2'-, 3'- hay 5'-nucleotide Chúng cũng còn được gọi tương ứng là2'-, 3'- hay 5'-nucleoside monophosphate, viết tắt là 2'-NMP, 3'-NMP và 5'-NMP Trong tế bào chủ yếu tồn tại các loại 3'- và 5'-
Hình IV.4 Cấu tạo của các loại
5'-, 3'-và 2'-nucleotide
Trang 5nucleotide Cấu tạo của các loại nucleotid này được giới thiệu trong hình IV.4 với base nitơ là adenine
Trong bảng IV.1 giới thiệu tên gọi và cách viết tắt của một số ribonucleoside và
ribonucleotide phổ biến Trong trường hợp gốc mono-saccharide là deoxyribose, tên
gọi của các nucleoside và nucleotide được thêm tiếp đầu ngữ "deoxy-", và trước các
ký hiệu viết tắt thêm chữ "d", ví dụ deoxyadenosine, acid deoxyadenylic,
deoxyadenosine monophosphate, dAMP, dA
Bảng IV.1 Tên gọi và cách viết tắt của một số nucleotide
Nucleotide Viết tắt
Adenosine monophosphate AMP, A Guanine Guanosine Acid guanilic
Guanosine monophosphate GMP, G Cytosine Cytidine Acid cytidilic
Cytidine monophosphate CMP, C
Uridine monophosphate UMP, U Thymine Thymidine Acid thymidilic
(Deoxy)Thymidine momophosphate dTMP, T
Ngoài các nucleotide giới thiệu trên đây có chức năng chủ yếu là tham gia cấu
tạo nên các đại phân tử acid nucleic, còn có một số nucleotide khác có các vai trò
quan trọng khác trong đời sống của tế bào (hình IV.5)
Trước hết, đó là các nucleotide vòng Những nucleotide loại này hình
thành khi gốc phosphate liên kết ester đồng thời với hai nhóm -OH của gốc
ribose Ví dụ điển hình là hai loại AMP vòng (cAMP) Đó là 2'-cAMP và
3'-5'-AMP 3'-5'-cAMP đóng vai trò quan trọng trong một số quá trình điều hòa
trao đổi chất, còn 2'-3'-cAMP là sản phẩm trung gian của quá trình phân
giải ARN dưới tác dụng của một số enzyme ribonuclease
Nhóm nucleotide đặc biệt thứ hai là các nucleoside polyphosphate, bao gồm
nucleoside diphosphate (NDP), ví dụ ADP, và nucleoside triphosphate (NTP), ví dụ
ATP Tính chất đặc biệt của các NDP và NTP là ở chỗ một hoặc hai gốc phosphate
nữa được gắn vào phân tử nucleoside monophosphate bằng các liên kết giàu năng
lượng (liên kết cao năng) mà người ta thường ký hiệu bằng dấu ~, như mô tả trong
hình IV.5 Nhờ sự tồn tại của các liên kết cao năng này nên các NDP và đặc biệt là
Trang 6các NTP đóng vai trò quan trọng trong trao đổi năng lượng của tế bào và tham gia hoạt hóa nhiều hợp chất trung gian của các quá trình trao đổi chất
Nhóm nucleotide đặc biệt thứ ba bao gồm những hợp chất mà thành phần base nitơ và monosacchride của chúng thường không giống như đã mô tả ở trên Ví dụ điển hình cho nhóm nucleotide đặc biệt này là nicotinamide mononucleotide (NMN), flavine mononucleotide (FMN) và coenzyme A (CoA-SH) mà công thức cấu tạo của chúng được giới thiệu trong hình IV 5 Do có khả năng oxy hóa-khử thuận nghịch, nên NMN và FAD tham gia trong hàng loạt các enzyme oxyhóa-khử với tư cách là coenzyme Trong khi đó CoA-SH đóng vai trò rất quan trọng trong trao đổi lipid và một số quá trình trao đổi chất khác NMN và FMN còn là thành phần cấu tạo của các coenzyme oxyhóa-khử phức tạp hơn Đó là các dinucleotide NAD+, NADP+ và FAD (hình IV.6)
Trang 7Hình IV.5 Cấu tạo của một số nucleotide có chức năng đặc biệt
Hình IV.6 Cấu tạo của NAD + , NADP + và FAD
II POLYNUCLEOTIDE
Cơ sở cấu trúc của acid nucleic là các chuỗi polynucleotide cấu tạo từ nhiều đơn
vị (mono)nucleotide Trong những chuỗi này các mononucleotide nối với nhau bằng
các liên kết 3'-5'-phosphodiester như mô tả trong hình 4.7 Các chuỗi polynucleotide
thường chứa từ hàng chục đến hàng trăm gốc mononucleotide Tuy nhiên, cũng có những chuỗi polynucleotide ngắn, chứa không quá 10 gốc nucleotide và chúng được
gọi chung là oligonucleotide (bao gồm di-, tri-, tetra-, penta-,hexanucleotide v.v )
Trang 8Người ta phân biệt hai loại polynucleotide là polyribonucleotide - cơ sở cấu trúc của ARN, và polydeoxy-ribonucleotide - cơ sở cấu trúc của ADN Trong hình IV.7A giới thiệu một đoạn polynucleotide để ta có thể hình dung sự hình thành liên kết 3'-5'-phosphodiester Để mô tả thành phần và trật tự sắp xếp của các gốc nucleotide trong những chuỗi polynucleotide ngắn, người ta thường dùng kiểu mô hình đơn giản như trình bày trong hình IV.7B Kiểu mô tả này cho phép phân biệt hai thành phần trong liên kết phosphodiester, tức liên kết a nối gốc phosphate với C-3' và liên kết b nối gốc phosphate với C-5', qua đó tạo ra cầu nối 3'-5'-phosphodiester giữa hai nucleotide kế cận Việc phân biệt liên kết a với liên kết b có ý nghĩa rất quan trọng do hai kiểu liên kết này mang tính đặc hiệu khác nhau đối với các enzyme thủy phân acid nucleic Đối với các chuỗi poly-nucleotide dài, không thể sử dụng kiểu mô tả này vì sẽ rất cồng kềnh, và người ta thường dùng kiểu mô tả bằng dãy chữ cái A, G, C, U hoặc
T, tức chữ cái đầu tiên của tên tiếng Anh các base nitơ như trình bày qua ví dụ trong hình IV.7C Trong trường hợp đối với ADN trước dãy chữ cái này, tức ở đầu tận cùng 5’ của chuỗi polypeptide, viết thêm chữ d (deoxy-), ví dụ dpApGpTp
Hình IV.7 Cấu tạo của polynucleotide
III ADN, NHIỄM SẮC THỂ VÀ MẬT MÃ DI TRUYỀN
Các chuỗi polydeoxyribonucleotide của ADN được cấu tạo từ 4 loại nucleotide là dAMP, dGMP, dCMP và dTMP Ngoài ra, đôi khi người ta còn tìm thấy một lượng nhỏ các dẫn xuất methyl-hóa của các nucleotide này, ví dụ 6-methytladenine, 5-
Trang 9methylcyto-sine v.v được tìm thấy trong nhiều loại ADN của vi khuẩn, động vật và thực vật Thành phần và trật tự sắp xếp của nucleotide trong các chuỗi polydeoxyribonucleotide, tức cấu trúc bậc 1 của ADN vô cùng đa dạng Sự đa dạng này chính là cơ sở của tính đa dạng của thế giới sinh vật, bởi vì, như ta sẽ thấy sau này, nó là cơ sở của quá trình tiến hóa và liên quan mật thiết với tính di truyền
Để hiểu rõ chức năng sinh học của ADN, bên cạnh nhu cầu xác định cấu trúc bậc 1 còn cần phải hiểu rõ cấu trúc không gian của chúng Mô hình cấu trúc không gian của phân tử ADN được xây dựng trên cơ sở hàng loạt nghiên cứu trong lĩnh vực sinh học phân tử, trong đó quan trọng nhất là các công trình của Chargaff và của Franklin và Wilkins
Sau nhiều năm nghiên cứu (1949-1953), Chargaff và những người cộng tác của ông đã nêu lên những kết luận quan trọng về đặc điểm hóa học của ADN trong tế bào
Những kết luận này ngày nay được mọi người công nhận và gọi là các quy luật Chargaff Đó là:
1/ Các chế phẩm ADN tách từ các mô khác nhau của cùng một cơ thể có thành phần nucleotide như nhau;
2/ Thành phần nucleotide của ADN trong cơ thể thuộc các loài khác nhau là không giống nhau;
3/ Thành phần nucleotide của ADN trong cơ thể thuộc một loài nào đó không phụ thuộc vào tuổi, điều kiện dinh dưỡng và điều kiện môi trường;
4/ Hầu như trong tất cả các chế phẩm ADN đã nghiên cứu số gốc adenine bằng số gốc thymine (A = T), còn số gốc guanine bằng số gốc cytosine (G = C) Điều đó dẫn đến số gốc purine bằng số gốc pyrimidine (A+G = C+T);
5/ ADN của các loài vốn có quan hệ về mặt hệ thống học càng gần nhau thì có thành phần nucleotide càng giống nhau; còn các loài cách xa nhau trong quá trình tiến hóa thì khác nhau khá rõ về thành phần nucleotide Có nghĩa là thành phần nucleotide của ADN có thể được sử dụng như một trong những cơ sở của phân loại học
Các nhà khoa học này cũng phát hiện được rằng ở động vật và thực vật, tức những cơ thể bậc cao chỉ có ADN thuộc kiểu AT, tức A+T > G+C, trong khi đó ADN ở
vi khuẩn gồm cả hai kiểu AT và GC
Hàm lượng như nhau (tính theo mol) của một số base trong ADN cho phép giả định rằng nét cấu trúc đặc trưng của ADN là sự tồn tại những mối quan hệ hoàn toàn xác định giữa số lượng các base khác nhau
Song song với phát hiện của Chargaff, kết quả phân tích cấu trúc bằng tia ghen do Franklin và Wilkins thực hiện trong những năm 1950-1953 với những chế
Trang 10Rơn-phẩm ADN tinh khiết cho thấy ADN có thể tồn tại ở hai dạng A và B với mức độ hydrat hóa khác nhau
Trên cơ sở các kết quả nghiên cứu của Chargaff cũng như của Franklin và Wilkins năm 1953 Watson và Crick đã đề xuất một mô hình cấu trúc không gian của phân tử ADN Theo mô hình này dạng cấu trúc B của phân tử ADN được cấu tạo bởi hai chuỗi polydeoxy-ribonucleotide xoắn phải, song song và ngược chiều nhau, nằm sóng đôi xung quanh một trục chung, tạo thành một sợi xoắn kép Các nguyên tử phosphore nằm cách trục 1,0nm Trên mỗi chuỗi các base mằm cách nhau 0,34nm Theo tính toán ban đầu một vòng xoắn trọn vẹn chứa 10 cặp base và có chiều dài chiếu lên trục bằng 3,4nm Tuy
nhiên các phép đo sau đó cho thấy một vòng xoắn hoàn chỉnh chứa 10,5 cặp base và
do đó có chiều dài chiếu lên trục bằng 3,6nm (hình IV.8) Dạng B được xem là dạng ổn định nhất trong điều kiện sinh lý Nó đặc trưng cho trạng thái có mức độ hydrate hóa cao
Nếu giảm mức độ hydrate hóa hoặc nằm trong các môi trường tương đối có tính
kỵ nước, ADN sẽ chuyển sang dạng cấu trúc A, trong đó các base cách nhau 0,23nm và mỗi vòng xoắn chứa 11 cặp base Trục trung tâm của phân tử ADN xoắn kép không còn thẳng góc với các mặt phẳng của các cặp base mà tạo ra với chúng một góc ≈ 20o, đồng thời cũng không xuyên qua các mặt phẳng này mà mà nằm lệch sang phía này hoặc phía khác Đặc điểm cấu trúc này làm cho dạng A ngắn hơn và có đường kính lớn hơn dạng B
Các hóa chất dùng để kết tinh ADN thường làm cho nó bị dehydrate hóa, làm cho ADN có xu hướng kết tinh ở dạng cấu trúc A
Phân tử ADN xoắn kép thậm chí có thể tồn tại ở dạng quay trái (dạng Z)
Ở dạng này các cặp base cách nhau 0,38nm và 12 cặp base tạo nên một vòng xoắn hoàn chỉnh Bộ khung của phân tử có dạng zig-zak Một số trật tự nucleotide dễ tạo ra dạng cấu trúc Z hơn là những trật tự khác Người ta chưa biết rõ vai trò sinh học của dạng cấu trúc này, chỉ biết rằng cấu trúc Z được hình thành khi các base cytosine được methyl hóa Methyl hóa là hiện tượng sinh học rất phổ biến đối với ADN, Đối với eukaryote nó có vai trò quan trọng trong việc điều hòa hoạt tính của gen Trong tế bào eukaryote có thể đây là một cơ chế kiểm tra hoạt động của gene hoặc tham gia trong quá trình cải biến gene (genetic recombination)
Trang 11Hình IV.8 Sơ đồ mô tả sự khác nhau giữa các dạng cấu trúc A, B và Z của phân tử ADN xoắn kép
HÌNH IV.9 LIÊN KẾT HYDRO GIỮA CÁC CẶP BASE BỔ
SUNG A T VÀ G C
Chuỗi xoắn kép được hình thành nhờ tính chất bổ sung giữa các base A với T và
G với C Trong toàn bộ phân tử mỗi base nitơ của chỗi này nôùi với base bổ sung ở
chuỗi kia thông qua các liên kết hydro (hình IV-9)