Trong những năm gần đây, với sự phát triển vượt bậc của ngành tin học, với tốc độ xử lý của bộ xử lý trung tâm ngày càng tăng. Sự xâm nhập của tin học vào các ngành khoa học nói chung và ngành hóa học nói riêng này càng sâu sắc và đa dạng và đặc biệt là trong hóa học ứng dụng. Các ngành khoa học trong hóa học với sự trợ giúp của máy tính trong đó đặc biệt là ngành hóa lý thuyết phát triển mạnh mẽ. Hóa tin học có thể nói là một ngành mới; sự xuất hiện và tính phổ biến của nó song song với sự tiến bộ về năng lực tính toán trong mấy thập kỉ qua. Cũng như các ngành khác trong hóa học, hóa tin sử dụng các công cụ riêng của mình để hiểu các phản ứng và các quá trình hóa học . Các nhà hóa học sử dụng các phần mềm máy tính để hiểu rõ các quá trình hóa học này và mối quan tâm đầu tiên là để mở mang các hiểu biết về hóa học. Thiết kế phân tử với sự trợ giúp của máy tính nói chung và thiết kế thuốc với sự trợ giúp của máy tính nói riêng là sự kết hợp các hiểu biết về các hướng trên của hóa tin học và các công cụ toán học cần thiết khác để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới có các tính chất hóa lý hay hoạt tính sinh học mong muốn có thể dự đoán trước. Cả hai đều dựa trên cùng một cơ sở là mô hình mối tương quan định lượng giữa cấu trúc tác dụng và cấu trúc – tính chất được xác định dưới hình thức các mô hình toán học của thống kê toán nhờ sự trợ giúp của máy tính.
Trang 1MỞ ĐẦU
Trong những năm gần đây, với sự phát triển vượt bậc của ngành tin học, với tốc
độ xử lý của bộ xử lý trung tâm ngày càng tăng Sự xâm nhập của tin học vào các ngành khoa học nói chung và ngành hóa học nói riêng này càng sâu sắc và đa dạng và đặc biệt
là trong hóa học ứng dụng Các ngành khoa học trong hóa học với sự trợ giúp của máy tính trong đó đặc biệt là ngành hóa lý thuyết phát triển mạnh mẽ Hóa tin học có thể nói
là một ngành mới; sự xuất hiện và tính phổ biến của nó song song với sự tiến bộ về năng lực tính toán trong mấy thập kỉ qua Cũng như các ngành khác trong hóa học, hóa tin sử dụng các công cụ riêng của mình để hiểu các phản ứng và các quá trình hóa học Các nhà hóa học sử dụng các phần mềm máy tính để hiểu rõ các quá trình hóa học này và mối quan tâm đầu tiên là để mở mang các hiểu biết về hóa học
Thiết kế phân tử với sự trợ giúp của máy tính nói chung và thiết kế thuốc với sự trợ giúp của máy tính nói riêng là sự kết hợp các hiểu biết về các hướng trên của hóa tin học và các công cụ toán học cần thiết khác để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới có các tính chất hóa lý hay hoạt tính sinh học mong muốn có thể dự đoán trước Cả hai đều dựa trên cùng một cơ sở là mô hình mối tương quan định lượng giữa cấu trúc- tác dụng và cấu trúc – tính chất được xác định dưới hình thức các mô hình toán học của thống kê toán nhờ sự trợ giúp của máy tính
Trong bài tập này tôi sử dụng chương trình hyperchem và chương trình tính toán thống kê statgraphics để xử lý mối quan hệ giữa các thông số không gian và thông số hóa lý với nồng độ cần thiết gây nên tốc độ của sự đáp ứng sinh học Và dựa vào các giá trị như phương sai, hệ số tương quan… để đánh giá và đưa ra phương trình Hansh mô tả tốt nhất và phù hợp với các giá trị thực nghiệm Để từ đó ta có thể giải thích các số liệu thực nghiệm
Trang 2Phần một: Thiết kể phân tử:
Phân tử được khảo sát có khung phân tử như sau:
p-R─C6H4 ─COOCH2CH2N(C2H5)2
Trong đó R là các nhóm sau: OC2H5, N(CH3)2, OCH3, NH2, Cl, OH, NHCOCH3,
NO2
Sử dụng chương trinh Hyperchem để xây dựng 8 phân tử trên Đồng thời để có được các thông số hóa lý cũng như các thông số không gian nhận được từ chương trình này thì tiến hành tối ưu các phân tử trên theo hai bước như sau:
- Bước 1: Tối ưu hóa toàn phân tử bằng phương pháp MM+
- Bước 2 : Tối ưu hóa lại bằng phương pháp AM1 để nhận được các giá trị dùng cho tính toán
Trong đó:
: thông số kị nước( với các nhóm thế khác nhau thì thông số này khác nhau)
б : hằng số thế Hammett
μ (D): momen lưỡng cực của phân tử.): momen lưỡng cực của phân tử
V(A03), S(A02): tương ứng là thể tích và diện tích của phân tử
α: là độ khả phân cực của phân tử
qN :là điện tích trên nguyên tử N
qC=O: điện tích của C ở nhóm cacbonyl
qC(thế R) :điện tích của nguyên tử C của vòng benzen tại vị trí thế nhóm R
qC(thế COO): điện tích của nguyên tử C của vòng benzen tại vị trí thế nhóm COOCH2CH2 N(C2H5)2
EH: lần lượt là năng lượng hydrat
EHUMO: năng lượng obital phân tử bị chiếm cao nhất
ELUMO : năng lượng obital phân tử không bị chiếm thấp nhất
Các thông số nhận được từ việc tối ưu hóa các phân tử trong chương trình Hyperchem được đưa ra ở bảng sau:
Trang 3Bảng 1: Các thông số hóa lý và các thông số không gian.
0.540 -0.080 0.110 -1.520 0.800 -0.270 -0.980 0.040
б -0.250 -0.600 -0.270 -0.660 0.230 -0.360 -0.020 0.780
μ (D): momen lưỡng cực của phân tử.) 2.667 4.400 2.389 3.975 2.347 1.911 2.158 4.575 V(A03) 898.7 895.8 840.0 798.7 138.1 785.0 903.2 822.4 S(A02) 552.9 541.4 520.3 494.7 451.0 489.5 549.7 505.6
α -0.250 -0.600 -0.270 -0.660 0.230 -0.360 -0.020 0.780
qN -0.281 -0.280 -0.281 -0.280 -0.281 -0.281 -0.281 -0.282
qC=O 0.355 0.358 0.355 0.357 0.349 0.354 0.353 0.343
qC(thế R 0.199 0.127 0.113 0.111 -0.032 0.113 0.111 -0.102
qC(thế COO) -0.155 -0.169 -0.153 -0.169 -0.115 -0.153 -0.141 -0.072
EH -1.200 0.610 -2.160 -5.900 -2.550 -7.390 -2.770 -5.400
EHOMO -9.118 -8.562 -9.128 -8.847 -9.207 -9.149 -9.210 -9.365
ELUMO -0.272 -0.110 -0.303 -0.166 -0.669 -0.377 -0.676 -1.625 lg(1/C) 1.920 1.720 1.220 1.130 1.050 0.900 0.280 0.130 Sau khi xây dựng và tối ưu hóa các công thức phân tử thì ta có các số liệu cần thiết và tiến hành phần tiếp theo
Trang 4Phần hai: Tính toán theo mô hình Hansch
Đầu tiên ta tìm phương trình hồi quy đa biến biểu diễn sự phụ thuộc của các điện tích vào log(1\C) dung phần mềm Statgraphics để loại bỏ các ảnh hưởng và đưa ra phương trình hồi quy phù hợp Tất cả được đưa ra trong bảng sau:
http://bidoupnuiba.gov.vn/index.php/vi/nghien-cuu-khoa-hoc-left/343-ung-dung-phan-mem-statgraphics-vao-viec-giai-quyet-ham-da-bien-trong-lam-nghiep.html
Bảng 2: Mối liên hệ giữa nồng độ và điện tích.
log(1/C) = 144.16 + 509.903.qN 0.383 0.147 0.615
log(1/C) = -32.78 + 95.056 q C=O 0.741 0.549 0.456
log(1/C) = 0.659 + 4.251 qC(thế R) 0.670 0.449 0.494
log(1/C) = -1.063 – 14.228 q C(thế COO) 0.736 0.541 0.463
Thông qua bảng trên ta thấy điện tích của C tại nhóm cacbonyl và của C thế tại vòng benzen là có ảnh hưởng đến hoạt tính sinh học nhất vì phương trình Hansch đưa ra
có hệ số tương quan là cao nhất và phương sai là nhỏ nhất Như vậy ta đã loại bỏ các điện tích không ảnh hưởng đến log(1/C) và do đó sẽ sử dụng hai giá trị này để tính toán các bước tiếp theo
Mặt khác tất cả các giá trị còn lại cũng được tính toán tương tự như trên và được đưa ra trong bảng sau:
Trang 5Bảng 3: Mối tương quan giữa các thông số hóa lý; thông số không gian và nồng độ.
Phương trình Hansch r r2 S
log(1/C) = 0.7980 – 0.9812 б 0.7348 0.5336 0.4673
log(1/C) = 0.9645 + 0.00006 V 0.0240 0.0006 0.6656
log(1/C) = -0.9367 + 0.00383 S 0.2169 0.0471 0.6516
log(1/C) = - 1.5717 + 0.0923 α 0.2590 0.0671 0.6450
log(1/C) = 1.4983 + 0.1336 EH 0.5711 0.3262 0.5529
log(1/C) = 1.5158 + 1.2625 E LUMO 0.8856 0.7842 0.3514
log(1/C) = 15.159 + 1.5604 EHUMO 0.6383 0.4074 0.5127
Thông qua bảng 3 ta thấy hai giá trị б và ELUMO có ảnh hưởng lớn đến log(1/C) vì các giá trị về hệ số hồi quy lớn và phương sai của chúng nhỏ Như vậy: qC(thế COO); qC=O,
б và ELUMO có ảnh hưởng lớn đến log(1/C) trong 14 thông số được đưa ra ở Bảng 1 Ta tiến hành xây dựng phương trình hồi quy bậc 2 đối với mỗi thông số trên và được tóm tắt trong Bảng 4
Bảng 4: Mối quan hệ giữa các thông số và nồng độ.
log(1/C) = 252.118 – 1523.84.qC=O + 2301.55 (qC=O)2 0.703 0.495 0.523 log(1/C) = -0.2119 – 2.668 qC(thế COO) + 42.335 (qC(thế COO))2 0.684 0.468 0.536
log(1/C) = 0.982 – 0.855 б – 0.284 б2 0.677 0.458 0.541
log(1/C) = 1.887 + 2.301.E LUMO + 0.748 (E LUMO ) 2 0.823 0.678 0.417
Qua bảng 4 ta có được phương trình hồi quy là :
log(1/C) = 1.887 + 2.301.E LUMO + 0.748 (E LUMO ) 2
Phương trình này được chọn vì có hệ số tương quan lớn và phương sai nhỏ
Mặt khác, cùng với các thông số điện tích đã được xác định ở trên thì các thông số được chọn tiếp theo là: б, ELUMO Như vậy ta có 4 thông số trong 14 thông số có ảnh hưởng đến các hoạt tính sinh học Vậy sẽ có 15 cách tổ hợp từ các biến này để đưa ra phương trình Hansch phù hợp đối với chúng Tuy nhiên để chắc chắn các biến không
Trang 6bao phủ đại lượng mà chúng mô tả; điều đó có nghĩa là chúng trực giao và có phương sai nhỏ nhất Vậy từ 4 thông số này (qC(thế COO); qC=O, б và ELUMO), ta lập ma trận hệ số tương quan của chúng( sử dụng chương trình Statgraphic để tính toán) Ma trận được đưa ra trong bảng sau:
Bảng 5: Ma trận hệ số tương quan:
qC=O 1 0.9911 0.9610 0.9338
qC(thế COO) 1 0.9688 0.9440
Thông qua bảng 5 ta thấy phương sai có nghĩa tồn tại giữa qC(thế COO) và qC=O; б và
qC(thế COO)); ELUMO và б , qC(thế COO), п,qC=O
D): momen lưỡng cực của phân tử.ựa vào ma trận các hệ số tương quan ta xây dựng mối quan hệ giữa chúng Các phương trình hồi quy đa biến được xây dựng giữa các thông số đã chỉ ra Điều đó được tóm tắt trong bảng sau:
Trang 7Bảng 6: Mối quan hệ đa biến giữa các thông với hoạt tính
Phương trình Hansch r r2 S log(1/C) = -99.433 + 297.043.qC=O + 31.089.qC(thế COO) 0.7156 0.5121 0.5136 log(1/C) = -47.747 + 0.519.б + 138.428 qC=O 0.7031 0.4943 0.5228 log(1/C) = - 0.838 + 0.032.б -13.391.qC(thế COO) 0.6811 0.4639 0.5383 log(1/C) = -99.68 + 0.072.б + 297.369.qC=O + 30.108.qC(thế
COO)
0.7157 0.5122 0.5741
log(1/C) = 2.298 + 1.177.б + 2.068.ELUMO 0.8245 0.6799 0.4160 log(1/C) = 40.492 + 2.030.ELUMO – 108.736.qC=O 0.8117 0.6589 0.4294 log(1/C) = 6.198 +2.704 ELUMO + 26.524.qC(thế COO) 0.8486 0.7200 0.3890 log(1/C) = -102.167 +0.026.б +2.758.ELUMO +
326.561.qC=O +75.347.qC(thế COO)
0.8821 0.7781 0.4471
log(1/C) =11.228 + 1.006.б +2.153.ELUMO – 25.242.qC=O 0.8252 0.6810 0.4642 log(1/C) =6.232 – 0.018.б + 2.704.ELUMO + 26.778.qC(thế
COO)
0.8486 0.7200 0.4349
log(1/C) = -99.676 + 0.073.б + 297.370.qC=O +
30.108.qC(thế COO)
0.7157 0.5122 0.5741
log(1/C) = -102.081 + 2.758.E LUMO + 326.447 .q C=O +
75.702.q C(thế COO)
0.8821 0.7781 0.3872 log(1/C) = 0.9607 + 0.5794 п -1.263 б 0.9326 0.8698 0.2652
Như vậy thông qua bảng 6 ta thấy phương trình được lựa chọn là:
log(1/C) = 0.9607 + 0.5794 п -1.263 б.
Như vậy qua các bảng đã đưa ra từ bảng 1 đến bảng 6 và tổng kết lại thì hoạt tính sinh học được mô tả tốt bởi phương trình :
log(1/C) = 0.9607 + 0.5794 п -1.263 б
Trang 8Biện luận :
Trong phương trình:
log(1/C) = -102.081 + 2.758.ELUMO + 326.447 qC=O + 75.702.qC(thế COO)
(**)
ta thấy tất cả các thông số có liên quan đều làm tăng hoạt tính của chất khảo sát Trong
đó điện tích trên nguyên tử cacbon của nhóm cacbonyl có ảnh hưởng đến hoạt tính gây
tê cục bộ của các chất trên cơ thể sinh vật mà chúng ta khảo sát Như vậy tất cả các nhóm thế R có hiệu ứng làm tăng mật độ electron ( các nhóm đẩy electron OH NH2, N(CH3)2 ) đều làm tăng hoạt tính gây tê cục bộ của các chất đối với sinh vật mà ta khảo
sát Tuy nhiên trong bảng 6 lại khảo sát thêm mối quan hệ giữa thông số ưa dầu п và
hằng số б và ta lại thấy phương trình đưa ra có hệ số tương quan cao và phương sai nhỏ D): momen lưỡng cực của phân tử.o đó, hoạt tính sinh học được mô tả tốt nhất bởi phương trình:
log(1/C) = 0.9607 + 0.5794 п -1.263 б (*)
Điều này hoàn toàn phù hợp vì hằng số б có liên quan chặt chẽ đến sự thay thế các nhóm thế trong vòng benzene để làm tăng điện tích của các nguyên tố Trong phương trình (*) ta thấy thông số ưa dầu làm tăng hoạt tính sinh học của chất khảo sát Như vậy, những nhóm thế có kích thước lớn và đẩy e mạnh ( độ tan trong nước kém) thì hoạt tính sinh học tăng Vậy từ khung cơ bản để làm tăng hoạt tính của chất khảo sát ta
có thể thay thế các nhóm R có hiệu ứng cho e và có thể tich không gian lớn Mặc khác từ phương trình (*) ta thấy hằng số б Hammett làm giảm hoạt tính sinh học điều đó cho ta tháy rằng những nhóm thế có hiệu ứng hút electron thì hằng số б Hammett sẽ dương và điều đó làm giảm hoạt tính sinh học của chất khảo sát Như vậy chỉ những nhóm thế cho electron thì б < 0 thì lúc này mới ảnh hưởng làm tăng hoạt tính sinh học của chất khảo sát Điều này hoàn toàn phù hợp với sự giải thích cho phương trình (**) Đưa thêm phương trình hồi quy(*) để tổng quát hóa các giá trị từ phương trình(**) Như vậy hoạt tính sinh học gây tê cục bộ của các chất khảo sát được mô tả tốt nhất bằng phương trình Hansch dạng : log(1/C) = 0.9607 + 0.5794 п -1.263 б