Trong một vài năm trở lại đây, ngành hóa tin học ngày càng thu hút được sự chú ý với nhiều nhà hóa học bởi đây là một hướng đi mới và có tiềm năng phát triển lớn. Có nhà khoa học đã nói rằng: “Trong tương lai, các nhà hóa học sẽ vào phòng máy tính trước khi đi vào phòng thí nghiệm”. Câu nói đó khẳng định tầm quan trọng và dự đoán một sự phát triển mới mạnh mẽ của ngành hóa tin học.Trong hóa tin học, lĩnh vực thiết kế phân tử với sự trợ giúp của máy tính là sự kết hợp các hiểu biết về của Hóa lượng tử, Cơ học phân tử, và Động học phân tử để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới nhằm dự đoán các tính chất hóa lý hay hoạt tính sinh học mong muốn. Nhiều hợp chất có tác dụng sinh học đã được dự đoán bằng mô hình mối tương quan định lượng cấu trúc – tác dụng (QSAR) và đã được tổng hợp thành công trong thực tế tuy nhiên việc nghiên cứu mối tương quan định lượng cấu trúc – tác dụng và mối tương quan định lượng cấu trúc – tính chất đòi hỏi phải có cả kiến thức, kinh nghiệm chuyên môn và cả kiến thức về tin học.Để phục vụ cho sự mô tả mối quan hệ định lượng giữa cấu trúc – tính chất và cấu trúc hoạt tính của các hợp chất hữu cơ, người ta dựa vào các tham số cấu trúc như các thông số cấu tạo, thông số hình học, thông số tĩnh điện, thông số liên quan đến MO, thông số hóa lượng tử, thông số nhiệt động học… Và do vậy, tập hợp số thông số đưa ra này là rất lớn. Các thông số này hoặc có liên quan đến sự sắp xếp tương hỗ giữa các nguyên tử trong phân tử hoặc liên quan đến các yếu tố electron hay không gian, hoặc các tính chất nhiệt động học của phân tử hợp chất hữu cơ.Ví dụ: với thông số momen lưỡng cực cho thông tin quan trọng về bản chất và đặc điểm của dạng tương tác hóa học khác thường như liên kết hidro và đặc tính phân cực hoặc không phân cực của phân tử.
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA HOÁ HỌC
BÀI TIỂU LUẬN THIẾT KẾ PHÂN TỬ
Giảng viên hướng dẫn : PGS.TS NGUYỄN ĐÌNH THÀNH
Học viên : Trần Thanh Hà Lớp : Cao học Hóa Hữu cơ K21
Hà Nội-08/2012 MỤC LỤC
Trang 2MỞ ĐẦU 2
I CƠ SỞ LÝ THUYẾT 4
II THIẾT KẾ PHÂN TỬ VÀ TÍNH TOÁN HỒI QUY 5
2.1 Thiết kế phân tử: 5
2.2 Tính toán theo mô hình Hansch 7
III BIỆN LUẬN 12
MỞ ĐẦU
Trang 3Trong một vài năm trở lại đây, ngành hóa tin học ngày càng thu hút được sự chú ý với nhiều nhà hóa học bởi đây là một hướng đi mới và có tiềm năng
phát triển lớn Có nhà khoa học đã nói rằng: “ Trong tương lai, các nhà hóa học
sẽ vào phòng máy tính trước khi đi vào phòng thí nghiệm ” Câu nói đó khẳng
định tầm quan trọng và dự đoán một sự phát triển mới mạnh mẽ của ngành hóa tin học
Trong hóa tin học, lĩnh vực thiết kế phân tử với sự trợ giúp của máy tính là sự kết hợp các hiểu biết về của Hóa lượng tử, Cơ học phân tử, và Động học phân tử để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới nhằm dự đoán các tính chất hóa lý hay hoạt tính sinh học mong muốn Nhiều hợp chất có tác dụng sinh học đã được dự đoán bằng mô hình mối tương quan định lượng cấu trúc – tác dụng (QSAR) và đã được tổng hợp thành công trong thực tế tuy nhiên việc nghiên cứu mối tương quan định lượng cấu trúc – tác dụng và mối tương quan định lượng cấu trúc – tính chất đòi hỏi phải có cả kiến thức, kinh nghiệm chuyên môn và cả kiến thức về tin học
Để phục vụ cho sự mô tả mối quan hệ định lượng giữa cấu trúc – tính chất và cấu trúc hoạt tính của các hợp chất hữu cơ, người ta dựa vào các tham số cấu trúc như các thông số cấu tạo, thông số hình học, thông số tĩnh điện, thông số liên quan đến MO, thông số hóa lượng tử, thông số nhiệt động học… Và do vậy, tập hợp số thông số đưa ra này là rất lớn Các thông số này hoặc có liên quan đến sự sắp xếp tương hỗ giữa các nguyên tử trong phân tử hoặc liên quan đến các yếu tố electron hay không gian, hoặc các tính chất nhiệt động học của phân tử hợp chất hữu cơ
Ví dụ: với thông số momen lưỡng cực cho thông tin quan trọng về bản chất và đặc điểm của dạng tương tác hóa học khác thường như liên kết hidro và đặc tính phân cực hoặc không phân cực của phân tử
Với thông số năng lượng obitan HUMO và LUMO HUMO là năng lượng
obitan phân tử bị chiếm cao nhất (Highest Occupied Molecular Orbital Energy)
nhận được từ tính toán obitan phân tử và có liên quan đến thế ion hóa của phân tử và khả năng phản ứng của nó như là một nucleophin LUMO là năng lượng
Trang 4obitan phân tử trống thấp nhất (Lowest Unoccupied Molecular Orbital Energy)
nhận được từ các tính toán obitan phân tử và biểu thị ái lực electron của phân tử hay khả năng phản ứng của nó như là một electrophin…
Vào những năm 1950, Hansh đã đưa ra thông số kị nước và sử dụng phép phân tích hồi quy để đưa ra tương quan hoạt tính sinh học với các tính chất của phân tử Từ đó phương pháp Hansh được các nhà khoa học phát triển với các phương pháp thống kê tinh vi hơn nhằm phát triển mối tương quan giữa một tính chất hay dạng hoạt tính nào đó của một tập hợp phân tử về tính chất của các nhóm thế riêng biệt
Trong bài tập này đã sử dụng chương trình hyperchem và chương trình tính toán thống kê trên excel để xử lý mối quan hệ giữa các thông số không gian và thông số hóa lý với nồng độ cần thiết gây nên tốc độ của sự đáp ứng sinh học Và dựa vào các giá trị như phương sai, hệ số tương quan… để đánh giá và đưa ra phương trình Hansh mô tả tốt nhất và phù hợp với các giá trị thực nghiệm Để từ đó ta có thể giải thích các số liệu thực nghiệm
I CƠ SỞ LÝ THUYẾT
Trang 5Để đưa ra công thức liên hệ log(1/C) với các thông số hoá-lý Nhà nghiên cứu Hansch đã dựa vào giả thiết như sau: nếu phản ứng sinh học đang khảo sát
BR của cơ thể hay hệ mô phỏng đến một chất nào đó là hệ quả của các quá trình hoá lý liên tiếp xảy ra với sự tham gia của chất theo thời gian t, bắt đầu từ thời điểm tác dụng của chất và kết quả cuối cùng của nó, thì ta có thể liên hệ được với sự tham gia của tốc độ kiểm soát được của quá trình Khi chất với nồng độ ban đầu gây nên phản ứng sinh học chuẩn C0 được đưa vào hệ sinh học, thì tồn tại xác suất N nào đó sao cho ở lượng CN thì chất đi đến được vị trí mà ở đó xảy
ra phản ứng qua thời gian ∆t dẫn tới [BR] (ở đây [BR] là số đo định lượng hiệu quả sinh học được biểu diễn theo đơn vị tương ứng) Trong trường hợp này, tốc độ của quá trình có thể được biểu diễn ở dạng sau :
d[BR]/dt = A*C*Kx.
Trong đó: A là hệ số tỷ lệ, liên quan với phản ứng sinh học với tốc độ giai đoạn kiểm soát được
Kx : hằng số tốc độ hay cân bằng của giai đoạn này
Sử dụng mô hình Hansch để khảo sát và phần mềm hoá học Hyperchem, Ecxel xác định được các thông số như, LUMO, HOMO, δ, α, logP, qx, V, S Qua các thông số này chúng ta xây dựng được phương trình liên quan giữa các yếu tố đến khả năng tạo gây độc tính của hợp chất Phenol thế
Trang 6II THIẾT KẾ PHÂN TỬ VÀ TÍNH TOÁN HỒI QUY.
2.1 Thiết kế phân tử:
Phân tử được khảo sát là phenol thế và độc tính của các phenol thế đối với nấm
Candida Albicans như sau:
NH CH 2
OH
CH3
R
1
2
3
4
Sử dụng chương trình Hyperchem để xây dựng 8 phân tử trên Đồng thời để có được các thông số hóa lý cũng như các thông số không gian nhận được từ chương trình này thì tiến hành tối ưu hóa các phân tử trên bằng phương pháp AM1 để nhận được các giá trị dùng cho tính toán
Trong đó:
Log P: Hệ số phân bố
π: Thông số ưa dầu
б : hằng số thế Hammett
μ (D): momen lưỡng cực của phân tử.): momen lưỡng cực của phân tử
V(A03), S(A02): tương ứng là thể tích và diện tích của phân tử
α: là độ khả phân cực của phân tử
qN :là điện tích trên nguyên tử N
qC-NH: điện tích của C trong vòng benzen liên kết với nhóm NH
qC(thế R-2) :điện tích của nguyên tử C-2 của vòng benzen chứa nhóm thế R
qC(thế R-3) :điện tích của nguyên tử C-3 của vòng benzen chứa nhóm thế R
qC(thế R-4) :điện tích của nguyên tử C-4 của vòng benzen chứa nhóm thế R
q O : điện tích trên nguyên tử Oxi
Trang 7qC(thế OH): điện tích trên nguyên tử C của vòng benzen liên kết với nhóm OH
qC(thế CH3): điện tích trên nguyên tử C của vòng benzen liên kết với nhóm CH3
qC(thế CH2): điện tích trên nguyên tử C của vòng benzen liên kết với nhóm CH2
q CH3: điện tích trên nguyên tử C của nhóm CH3
q CH2: điện tích trên nguyên tử C của nhóm CH2
EH: là năng lượng hydrat
EHUMO: năng lượng obital phân tử bị chiếm cao nhất
ELUMO : năng lượng obital phân tử không bị chiếm thấp nhất
Các thông số nhận được từ việc tối ưu hóa các phân tử trong chương trình Hyperchem được đưa ra ở bảng sau:
Bảng 1: Các thông số hóa lý và các thông số không gian.
R H 4-Me
2,4-Me2
4-Cl 4-OH
2,3-C4H4
3-Cl 2,4-Cl2
Log P 0.43 0.58 0.74 0.21 -0.60 0.31 0.21 -0.02
μ (D): momen lưỡng cực của phân tử.) 2.588 2.535 2.424 3.536 2.726 3.149 3.470 3.643
qC(thế R-2) -0.169 -0.161 -0.116 -0.178 -0.148 -0.200 -0.181 -0.112
qC(thế R-3) -0.103 -0.105 -0.104 -0.096 -0.175 -0.097 -0.034 -0.092
qC(thế R-4) -0.165 -0.104 -0.102 -0.096 0.032 -0.098 -0.158 -0.092
qC(thế OH) 0.060 0.060 0.059 0.061 0.060 0.055 0.061 0.061
qO(trong OH) -0.254 -0.254 -0.254 -0.254 -0.253 -0.257 -0.254 -0.254
qC(thế CH3) -0.093 -0.093 -0.093 -0.092 -0.093 -0.098 -0.092 -0.091
qC(thế CH2) -0.124 -0.124 -0.124 -0.126 -0.125 -0.105 -0.126 -0.128
Trang 8EHUMO -8.574 -8.289 -8.230 -8.498 -8.265 -7.977 -8.819 -8.778
lg(1/C) 3.370 3.390 3.420 3.950 2.920 3.970 3.950 4.480
2.2 Tính toán theo mô hình Hansch
Đầu tiên ta tìm phương trình hồi quy đa biến biểu diễn sự phụ thuộc của các điện tích vào log(1\C) dùng phần mềm Excel để loại bỏ các ảnh hưởng và đưa ra phương trình hồi quy phù hợp Tất cả được đưa ra trong bảng sau:
Bảng 2: Mối liên hệ giữa nồng độ và điện tích.
log(1/C) = 3.2864 + 7.9165 q C-NH 0.5749 0.3305 0.4349
log(1/C) = 3.3523 + 5.5156 qC(thế OH) 0.0223 0.0005 0.5314 log(1/C) = 3.6526 -0.1806 qC(thế R-2) 0.0114 0.0001 0.5315
log(1/C) = 4.5437 + 8.5608 q C(thế R-3) 0.6612 0.4373 0.3987
log(1/C) = 3.3452 - 3.4333 qC(thế R-4) 0.4176 0.1743 0.4829 log(1/C) = 5.7661 + 22.3886 qC(thế CH3) 0.0955 0.0091 0.5291
log(1/C) = 4.0615 + 43.4641 q CH2 0.5777 0.3337 0.4338
log(1/C) = 4.3311+ 5.2945 qC(thế CH2) 0.0785 0.0061 0.5299
Thông qua bảng trên ta thấy điện tích của C tại nhóm methylen (CH2), C của vòng benzen liên kết với -NH và của C thế ở vị trí 3 vòng benzen là có ảnh
Trang 9hưởng đến hoạt tính sinh học nhất vì phương trình Hansch đưa ra có hệ số tương quan là cao nhất và phương sai là nhỏ nhất Như vậy ta đã loại bỏ các điện tích không ảnh hưởng đến log(1/C) và do đó sẽ sử dụng hai giá trị này để tính toán các bước tiếp theo
Mặt khác tất cả các giá trị còn lại cũng được tính toán tương tự như trên và được đưa ra trong bảng sau:
Bảng 3: Mối tương quan giữa các thông số điện tích trên nguyên tử C, thông
số hóa lý; thông số không gian và nồng độ.
Phương trình Hansch r r2 S
log(1/C) = 3.5649 + 0.6245 б 0.6406 0.4104 0.4081 log(1/C) = 1.1686+ 0.8350 μ 0.8450 0.7141 0.2842
log(1/C) = -0.3416 + 0.1423 α 0.5739 0.3294 0.4352 log(1/C) = 4.4855+ 0.0924 E H 0.5316 0.2826 0.4502 log(1/C) = 4.2970 - 1.7760 E LUMO 0.5882 0.3460 0.4298
Thông qua bảng 3 ta thấy giá trị μ, б có ảnh hưởng lớn đến log(1/C) vì các giá trị về hệ số hồi quy lớn và phương sai của chúng nhỏ; các giá trị α, E H, E LUMO
Trang 10ảnh hưởng ít hơn Như vậy: μ, б, α, E H, E LUMO, điện tích của C tại nhóm
methylen (q CH2 ), C của vòng benzen liên kết với -NH (q C-NH ) và của C thế ở vị trí 3 vòng benzen (q C(thế R-3) ) có ảnh hưởng lớn đến log(1/C) trong các thông số
được đưa ra ở Bảng 1 Vậy từ các thông số này ta lập ma trận hệ số tương quan của chúng( sử dụng chương trình excel để tính toán) Ma trận được đưa ra trong bảng sau:
Bảng 4: Ma trận hệ số tương quan:
μ б α q CH2 q C-NH q C(thế R-3) E LUMO E H
qC (thế R-3) 0.4922 0.4585 0.2418 0.3145 0.3985 1
Thông qua bảng 4 ta thấy phương sai có nghĩa tồn tại giữa б và q CH2; б và
q C-NH ; б và E LUMO ; q CH2 và q C-NH ; q CH2 và E LUMO ; q C-NH và E LUMO
D): momen lưỡng cực của phân tử.ựa vào ma trận các hệ số tương quan ta xây dựng mối quan hệ giữa chúng Các phương trình hồi quy đa biến được xây dựng giữa các thông số đã chỉ ra Điều đó được tóm tắt trong bảng sau:
Bảng 5: Mối quan hệ đa biến giữa các thông số với hoạt tính
Trang 11log(1/C) = 3.3754 +0.7677 б +0.4695 ELUMO 0.6427 0.4131 0.4461 log(1/C) = 3.8000 + 28.9484 q CH2+ 2.6965 qC-NH 0.5786 0.3348 0.4748 log(1/C) = 4.2431 - 11.6087 q CH2 - 1.3274 E LUMO 0.5897 0.0868 0.4702
l log(1/C) = 1.1162+ 2.2502 б + 5.9245 q C-NH + 1.7367 E LUMO
- 125.4722 q CH2
0.9955 0.9910 0.0712
log (1/C) = 1.4474 + 0.1804 π + 2.1107 б + 5.9212 q C-NH +
0.3435 E LUMO -149.8933 q CH2
0.9992 0.9984 0.0360
Như vậy thông qua bảng 5 ta thấy phương trình được lựa chọn là:
log (1/C) = 1.4474 + 0.1804 π + 2.1107 б + 5.9212 q C-NH + 0.3435 E LUMO -149.8933 q CH2
Như vậy qua các bảng đã đưa ra từ bảng 1 đến bảng 5 và tổng kết lại thì hoạt tính sinh học được mô tả tốt bởi phương trình :
log (1/C) = 1.4474 + 0.1804 π + 2.1107 б + 5.9212 q C-NH + 0.3435 E LUMO -149.8933 q CH2
Trang 12III.BIỆN LUẬN
Trong phương trình:
log(1/C) = 1.1162+ 2.2502 б + 5.9245 q C-NH + 1.7367 E LUMO - 125.4722 q CH2 (1)
ta thấy tất cả các thông số q C-NH ; E LUMO ; б làm tăng hoạt tính của chất khảo sát
Trong đó điện tích trên nguyên tử cacbon của nhóm methylen q CH2 làm giảm hoạt tính của chất khảo sát tức là có ảnh hưởng âm đến hoạt tính ức chế sự phát triển của nấm Candida Albicans
Tuy nhiên trong bảng 5 lại khảo sát thêm mối quan hệ giữa thông số ưa
dầu π và các thông số trong phương trình (1) và ta lại thấy phương trình đưa ra
có hệ số tương quan cao hơn và phương sai nhỏ hơn D): momen lưỡng cực của phân tử.o đó, hoạt tính sinh học được mô tả tốt nhất bởi phương trình:
log (1/C) = 1.4474 + 0.1804 π + 2.1107 б + 5.9212 q C-NH + 0.3435 E LUMO
-149.8933 q CH2 (2)
Phương trình (1) và (2) là hoàn toàn thống nhất với nhau vì hằng số б có liên quan chặt chẽ đến sự thay thế các nhóm thế trong vòng benzene để làm tăng điện tích của các nguyên tố, mặt khác từ phương trình (2) ta thấy hằng số б
Hammett, thông số ưa dầu π làm tăng hoạt tính sinh học điều đó cho ta thấy rằng
những nhóm thế có kích thước lớn và có hiệu ứng hút electron mạnh thì làm tăng hoạt tính sinh học của chất khảo sát Sự phù hợp này cũng được chứng minh bởi các thông số thực nghiệm bởi các nhóm thế R có hiệu ứng làm giảm mật độ electron (các nhóm hút electron Cl, 2,3- C4H4, ) lại làm tăng hoạt tính kháng nấm của chất khảo sát Ngược lại ( các nhóm đẩy electron OH, Me, ) đều làm giảm hoạt tính kháng nấm này
Như vậy hoạt tính kháng nấm của các chất khảo sát được mô tả tốt nhất bằng phương trình Hansch dạng
Trang 13log (1/C) = 1.4474 + 0.1804 π + 2.1107 б + 5.9212 q C-NH + 0.3435 E LUMO -149.8933 q CH2