Đặc biệt, nếu trong hỗn hợp có thành phần nền phức tạp hoặc có các cấu tử tương tác với nhau làm mất tính chất cộng tính tín hiệu đo thì mô hình hồi quy đa biến phi tuyến tính sử dụng mạ
Trang 1Lời cảm ơn
Với lòng biết ơn sâu sắc, tôi xin chân thành cảm ơn PGS.TS Tạ Thị Thảo, đã giao đề tài, tận tình hướng dẫn, tạo điều kiện cho tôi hoàn thành luận văn này
Tôi cũng xin bày tỏ lòng biết ơn các thầy cô trong bộ môn Hoá phân tích đã tạo điều kiện cho tôi trong quá trình học tập và nghiên cứu
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè, các anh chị học viên k18 chuyên ngành Hoá phân tích, các em sinh viên đã động viên, giúp đỡ tôi rất nhiều trong suốt thời gian qua
Hà Nội, ngày 24 tháng 1 năm 2010 Học viên
Vũ Quỳnh Thu
Trang 2MỤC LỤC
MỤC LỤC 2
BẢNG KÍ HIỆU NHỮNG CHỮ VIẾT TẮT 4
MỞ ĐẦU 5
Chương I: TỔNG QUAN 7
1.1 Tổng quan về các nguyên tố Cu, Pb, Cd, Co, Ni [13] 7
1.1.1 Trạng thái hợp chất ứng dụng trong phân tích trắc quang 7
1.1.2 Các phương pháp phân tích quang học xác định riêng rẽ Co, Cd, Ni, Cu, Pb 8
1.1.2.1 Phương pháp phổ hấp thụ nguyên tử (AAS) 8
1.1.2.2 Phương pháp trắc quang 9
1.1.3 Giới thiệu chung về thuốc thử PAR 10
1.2 Phương pháp trắc quang kết hợp với chemometrics xác định đồng thời các nguyên tố Co, Cd, Ni, Cu, Pb 13
1.2.1 Phương pháp trắc quang kết hợp với hồi qui đa biến tuyến tính 13
1.2.2 Phương pháp hồi qui đa biến phi tuyến tính xác định đồng thời các chất 14
1.2.2.1 Phương pháp mạng noron nhân tạo (ANN) 14
1.2.2.2 Phương pháp phân tích thành phần chính (PCA) 25
1.2.2.3 Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính xác định đồng thời các chất 27
1.3 Phần mềm Matlab( Matrix in laboratory) 29
Chương II: THỰC NGHIỆM 31
2.1 Nội dung và phương pháp nghiên cứu 31
2.1.1 Phương pháp nghiên cứu 31
2.1.2 Nội dung nghiên cứu 32
2.2 Hóa chất, dụng cụ, thí nghiệm 32
2.2.1 Hóa chất 32
2.2.2 Dụng cụ và thiết bị 33
2.3 Cách tiến hành thực nghiệm 34
Chương III: KẾT QUẢ VÀ THẢO LUẬN 35
3.1 Khảo sát các điều kiện tối ưu tạo phức màu của 5 cấu tử với thuốc thử PAR 35
3.1.1 Sự phụ thuộc độ hấp thụ quang vào bước sóng 35
3.1.2 Ảnh hưởng của pH 36
3.1.3 Độ bền phức màu theo thời gian 38
3.1.4 Ảnh hưởng của lượng thuốc thử dư đến khả năng tạo phức màu 38
3.1.5 Khảo sát sự phụ thuộc của độ hấp thụ quang của từng phức màu vào nồng độ ion kim loại 40
Trang 33.2 Nghiên cứu phương pháp mạng nơron nhân tạo ANN xác định đồng thời
các cấu tử trong dung dịch 44
3.2.1 Xây dựng ma trận nồng độ và ma trận độ hấp thụ quang của dung dịch chuẩn và dung dịch kiểm tra 44
3.2.2 Xây dựng mô hình ANN tối ưu xác định đồng thời 5 ion kim loại 45
3.2.2 Xây dựng thuật toán loại trừ giá trị đo bất thường (outlier) 51
3.3 Phương pháp mạng noron nhân tạo kết hợp với hồi quy thành phần chính (PCR-ANN) xác định đồng thời 5 cấu tử trong dung dịch 54
3.3.1 Khảo sát xây dựng mô hình PCA tối ưu 55
3.3.2 Xây dựng mô hình PCR- ANN 57
3.3.3 Đánh giá tính hiệu quả của phương pháp PCR-ANN 64
KẾT LUẬN 69
TÀI LIỆU THAM KHẢO 71
Trang 4BẢNG KÍ HIỆU NHỮNG CHỮ VIẾT TẮT
4-(2-pyriđinazo)-rezocxin 4-(2-pyridylazo)-rezorcinol PAR Mạng nơron nhân tạo Artificial Neural Networks ANN
Mạng nơron nhân tạo kết hợp hồi
quy thành phần chính
Principal component regression- Artificial Neural Networks
ANN
Bình phương tối thiểu thông thường Classical least square CLS Bình phương tối thiểu nghịch đảo Inverse least square ILS
Bình phương tối thiểu riêng phần Partial least square PLS Hồi quy cấu tử chính Principalcomponent regression PCR
Độ sai chuẩn tương đối Relative Standard Error RSE
Trang 5Một trong những hướng nghiên cứu mới để xác định đồng thời nhiều cấu tử trong cùng hỗn hợp là kết hợp với kĩ thuật tính toán, thống kê và đồ thị (chemometrics) nhằm tăng độ chính xác của kết quả phân tích Rất nhiều công trình nghiên cứu đã áp dụng các phương pháp sai phân, phương pháp phổ đạo hàm, phương pháp bình phương tối thiểu, phương pháp lọc Kalmal, các phương pháp phân tích hồi quy đa biến tuyến tính, phương pháp hồi quy đa biến phi tuyến tính…để xác định đồng thời các chất trong cùng hỗn hợp Ưu điểm của các phương pháp này là quy trình phân tích đơn giản, phân tích nhanh, tốn ít thuốc thử và hoá chất, tăng độ chính xác Đặc biệt, nếu trong hỗn hợp có thành phần nền phức tạp hoặc có các cấu tử tương tác với nhau làm mất tính chất cộng tính tín hiệu đo thì mô hình hồi quy đa biến phi tuyến tính sử dụng mạng nơron nhân tạo sẽ làm tăng tính chính xác của kết quả phân tích lên rất nhiều Điều đặc biệt, càng nhiều dữ liệu phân tích thì mô hình sẽ cho kết quả phân tích càng chính xác, tuy nhiên, nếu kích thước tập dữ liệu phân tích quá lớn sẽ dẫn đến việc mất nhiều thời gian xử lí đôi khi chương trình tính toán bị dừng lại vì không xử lí được lượng số liệu khổng lồ đó Trong trường hợp này, phương pháp phân tích thành phần chính (PCA) được sử dụng trước tiên để làm giảm kích thước tập số liệu mà không làm mất đi lượng thông tin chứa trong tập dữ liệu ban đầu Đây được xem là thuật toán hiệu quả nhất xác định đồng thời nhiều chất mà tín hiệu đo không có tính cộng tính hoặc bị ảnh hưởng bởi lượng thuốc thử dư
Ở Việt Nam, đã có một số công trình xác định đồng thời các chất áp dụng thuật toán hồi quy đa biến phi tuyến tính sử dụng mạng nơron nhân tạo nhưng dùng
Trang 6trên ngôn ngữ Visual Basic hoặc C+ Phần mềm Pascal hoặc các phần mềm khác đòi hỏi người sử dụng phải rất am hiểu về toán học mới có thể lập trình, còn nếu mua rất đắt, đồng thời mất rất nhiều thời gian để sử dụng Gần đây, phần mềm MATLAB- một phần mềm rất mạnh về các phép tính ma trận đang được sử dụng trong tất cả các ngành khoa học nghiên cứu về xã hội, tự nhiên để giải quyết các vấn
đề thực tế phức tạp một cách hiệu quả Vài năm gần đây, một số học viên cao học của bộ môn phân tích đã bảo vệ thành công luận án Thạc sĩ trên cơ sở hoàn thiện các thuật toán hồi qui đa biến tuyến tính bằng phần mềm MATLAB Tuy nhiên, chưa có công trình nào áp dụng phương pháp phân tích thành phần chính kết hợp mạng nơron nhân tạo sử dụng phần mềm MATLAB trong hoá phân tích ở Việt Nam hiện nay
Với mục đích đóng góp vào việc ứng dụng phần mềm MATLAB trong nghiên cứu và giảng dạy hoá phân tích ở Việt Nam, chúng tôi đã sử dụng phần mềm này để lập trình phương pháp phân tích thành phần chính (PCA) kết hợp với mạng nơron nhân tạo để xác định đồng thời các cấu tử trong cùng hỗn hợp Phương pháp này đã được áp dụng thành công để xác định đồng thời Co, Cd, Ni, Cu, Pb trong mẫu tự tạo Việc sử dụng phần mềm MATLAB kết hợp với các kĩ thuật Chemometrics mở ra khả năng phân tích nhanh, đồng thời rất nhiều chất trong cùng hỗn hợp bằng phương pháp trắc quang với độ chính xác cao
Trang 7Chương I: TỔNG QUAN
1.1 Tổng quan về các nguyên tố Cu, Pb, Cd, Co, Ni [13]
1.1.1 Trạng thái hợp chất ứng dụng trong phân tích trắc quang
*Dạng muối
Muối coban(II), niken(II) ở dạng khan có màu khác với muối ở dạng tinh thể hidrat, ví dụ CoBr2 màu lục, CoBr2.6H2O có màu đỏ Muối của axit mạnh như clorua, nitrat, sunfat tan dễ trong nước còn muối của axit yếu như sunfua, cacbonat, oxatat khó tan Khi tan trong nước, các muối đều cho ion bát diện [E(H2O)6]2+ màu lục
Các muối halogenua (trừ Florua), nitrat, sunfat, peclorat và axetat của Cd(II) đều
dễ tan trong nước còn các muối sunfua, cacbonat, hay orthophotphat và muối bazơ đều ít tan
Trong dung dịch nước các muối Cd 2+ bị thuỷ phân:
* Dạng phức chất
Các ion Co2+; Ni2+ tạo nên nhiều phức chất, độ bền của những phức chất đó tăng lên theo chiều giảm của bán kính ion Co2+ (0,72A0); Ni2+(0,69A0) Co2+; Ni2+thường tạo phức chất bát diện với số phối trí 6
Ngoài ra, Ni2+ Co2+, còn có khả năng tạo phức màu với nhiều thuốc thử hữu
cơ như: PAN, PAR, 2 – pyridyl hydrazone, 2 – benzoylpyricdine
Trang 8Muối Cu(II) có khả năng phản ứng với feroxianat Fe(CN)2 tạo thành kết tủa
đỏ nâu Cu2 Fe(CN)6 Trong dung dịch amoniac, Cu(II) phản ứng mãnh liệt với các phân tử NH3 tạo thành ion phức Cu(NH3)42+ có màu xanh lam Nó cũng tạo phức với một số tác nhân hữu cơ như 1-(2-pyridylazo)-2-naphtol, α-benzoin oxim (C6H5CH(OH)C(NOH)C6H5), 8-hiđroxylquinolin, natriđietyldithiocacbamat, đithizon,… Những phức này cho phép xác định đồng bằng phương pháp khối lượng, thể tích hay trắc quang
Ion Pb(II) có thể tạo nhiều phức với hợp chất hữu cơ, điển hình là với dithizon ở pH = 5-6 tạo phức mầu đỏ gạch Phản ứng này được dùng để chuẩn độ xác định Chì với giới hạn xác định đến 0,05 ppm hoặc dùng để chiết Chì trong nhiều phương pháp phân tích định lượng khác nhau Ngoài ra, các halogenua Chì có thể kết hợp với các ion halogenua tạo nên phức chất kiểu Me[PbX3] hay Me2[PbX4]
PbI2 + 2KI K2[PbI4] PbCl2 + 2HCl H2[PbCl4] Các muối của Pb(II) như Pb(NO3)2, PbCl2…đều bền và độc với con người
và động vật
1.1.2 Các phương pháp phân tích quang học xác định riêng rẽ Co, Cd, Ni, Cu,
Pb
1.1.2.1 Phương pháp phổ hấp thụ nguyên tử (AAS) [6]
Nguyên tắc của phương pháp này là dựa vào khả năng hấp thụ bức xạ đặc trưng của các nguyên tử ở trạng thái hơi tự do Đây là phương pháp có độ nhạy và
độ chọn lọc rất cao, được dùng rất rộng rãi để xác định lượng vết các kim loại
Bằng phương pháp F-AAS, các tác giả Sibel Saracoglu, Umit Divrikli, Mustafa Soylak và Latif Elci đã xây dựng một quy trình hoàn chỉnh để xác định các kim loại Cu, Fe, Pb, Cd, Co, Ni trong các mẫu sữa và soda với hiệu suất hơn 95% Ngoài ra các tác giả Serife Tokalioglu, Senol Kartal và Latif Elci xác định lượng vết ion kim loại trong nước sau khi làm giàu với độ lệch chuẩn trong vùng 0,8-2,9% và giới hạn phát hiện 0,006-0,277ppm
Các tác giả cũng đã ứng dụng phương pháp này để xác định đồng thời coban, sắt và niken trong dung dịch chất điện ly của mangan Bước sóng hấp thụ của coban, sắt và niken tương ứng là 240,7; 248,3; và 232,0 nm Ảnh hưởng của nền Mn2+ và lượng thích hợp MnSO4 và (NH4)2SO4 Sai số tương đối khi xác định coban là 3,1%, hiệu suất thu hồi đạt 97,6%
Trang 9Đồng rất dễ phát hiện bằng phương pháp phổ hấp thụ nguyên tử Đã có nhiều công trình nghiên cứu xác định Cu trong các đối tượng khác nhau:
Người ta sử dụng phương pháp hấp thụ nguyên tử để xác định đồng trong nước sau khi đã làm giàu đồng bằng cách chiết hoặc dùng nhựa trao đổi ion Có thể chiết đồng bằng 5 – cloxalixyl – aldoxim Xác định đồng trong ngọn lửa không khí - axetilen
Người ta xác định đồng trong nước sông, nước hồ bằng cách làm giàu Cu2+ một cách nhanh chóng và chọn lọc trên chất hấp thụ rắn (TXA) tạo phức dạng vòng càng Lượng đồng được giữ lại trên cột nhồi 0,4g TXA ở pH = 5,5 – 7,5 với vận tốc
v = 25 – 200ml Sau khi làm giàu, lượng TXA hoà tan vào trong 10ml hỗn hợp butylamin – DMPA (5:100), đồng được xác định bằng phương pháp hấp thụ nguyên
n-tử trong ngọn lửa không khí – C2H2 ở 324,7nm Đường chuẩn thẳng trong khoảng nồng độ từ 2 - 80μg Cu/10ml Độ nhạy 0,093 μg/ml (đối với sự hấp thụ 1%) Sai số tương đối khi xác định 10μg Cu (n = 10) là 0,01 Ảnh hưởng của Fe3+ có thể được loại trừ bằng NH4F, che Al và Bi bằng natriactrat [16]
Phương pháp AAS kết hợp với phương pháp chiết có thể xác định vi lượng Cu
và Zn trong dầu và mỡ ăn Vết kim loại trong dầu, mỡ với nồng độ thấp cũng có thể làm hỏng hương vị và màu sắc Công trình nghiên cứu thu hồi được tiến hành với dầu đậu nành có hàm lượng kim loại thấp Mẫu xử lý với dịch chiết (HCl 18% và EDTA 0,01%) axit HNO3 đậm đặc Qua các bước xử lý có thể thu hồi tới 96% Cu Xác định các kim loại nặng trong các mẫu thịt cá bằng phép đo AAS, Dr Phạm Luận và cộng sự đã thu được một số kết quả sau: Giới hạn phát hiện đối với Cu và
Pb là 0,05 và 0,1ppm, giới hạn trên của vùng tuyến tính là 3,5 và 8ppm, sai số mắc phải trong vùng nồng độ 0,5-2ppm nhỏ hơn 15%
1.1.2.2 Phương pháp trắc quang [6,7,50]
Phân tích trắc quang là phương pháp được sử dụng phổ biến nhất trong các phương pháp phân tích hoá lý Bằng phương pháp này có thể định lượng nhanh chóng với độ nhạy và độ chính xác khá cao, đồng thời đây là phương pháp đơn giản, đáng tin cậy
Có thể xác định Cu2+ bằng thuốc thử 2,9 – dimity - 4,7 – diphenyl - 1,10 - phenantronlin disufonat, hiện nay được coi là một trong các phương pháp tiêu
Trang 10chuẩn để xác định đồng trong nước Phức của đồng với thuốc thử này có màu da cam, tan trong nước Phản ứng tạo phức vòng càng ở pH = 3,5 đến 11, tốt nhất là ở
pH = 4 - 5 Để đưa pH về 4,3 có thể dùng HCl và đệm citrate Độ hấp thụ quang của phức tại λ = 484nm Xyanua, thiocyanat, pesunfat và EDTA là những ion có thể gây ảnh hưởng đến phương pháp xác định Phương pháp này cho phép phát hiện nồng độ đồng tới 20 μg/l [50]
Ngoài ra, các tác giả SHIGEYA SATO, TOSHIE SATO and SUMIO UCHIKAOA đã tổng hợp 2-(3,5 diclo-2 pyridylazo)-5-dimetylaminophenol (3,5-diCl-DMPAP) để xác định coban Thuốc thử 3,5-diCl-DMPAP phản ứng với coban trong môi trường pH= 2,2 → 6,0, ở nhiệt độ phòng tạo thành phức ML2 tan trong nước, độ hấp thụ quang đạt cực đại ở bước sóng λmax = 590 nm, hệ số hấp thụ phân
tử gam của phức ε = 8,4.104 (l/mol.cm) Ảnh hưởng của các ion kim loại chuyển tiếp khác được loại trừ bằng phương pháp chiết với dung môi 8- hidroxylquinolin Phương pháp này được ứng dụng thành công xác định coban trong các mẫu thép [45]
Coban và niken còn được xác định đồng thời bằng phương pháp quang phổ hấp thụ phân tử và màng điện trung hoà nhân tạo, dựa trên phản ứng tạo phức chất của Co(II) và Ni(II) với pyrolidine và CS2 Phức chất được chiết bằng p-xylen Giới hạn phát hiện của Co2+ và Ni2+ tương ứng là 5ppm và 6ppm Phương pháp này cho phép xác định đồng thời các ion kim loại trong hợp kim và vật liệu tổng hợp [29] Xác định Cd và Pb bằng cách chuyển nó về dạng Cadmi-dithizonat và Chì-
dithizonat trong môi trường pH 5-6:
Cd2+ + 2H2Dz (xanh) Cd(HDz)2 (đỏ) + 2H+
Pb2+ + 2H2Dz (xanh) Pb(HDz)2 (đỏ) + 2H+ Sau đó, chiết phức này vào dung môi hữu cơ CCl4 hoặc CHCl3 rồi đem đo mật
độ quang của nó tại = 515nm đối phức của Cd và 510nm đối phức của Pb Giới hạn của phương pháp này đối với Pb là 0,05 ppm, với Cd là 0,01ppm
1.1.3 Giới thiệu chung về thuốc thử PAR [30,22]
Thuốc thử PAR có tên đầy đủ là 4-(2- pyridylazo)-resorcinol, thường tồn tại dưới dạng muối Na ngậm 1 hoặc 2 phân tử H2O, là chất rắn màu đỏ da cam PAR có thể được kết tinh lại bằng etanol 50%
Tùy từng môi trường, PAR tồn tại ở 6 dạng khác nhau trong dung dịch:
H5L3+ ↔ H4L2+ ↔ H3L+ ↔ H2L ↔ HL- ↔ L2- 90% H2SO4 50% H2SO4 pH < 2 pH 2,1– 4,2 pH 4,2- 7 pH > 10,5
Trang 11Bốn dạng sau cùng là 4 dạng phổ biến nhất của PAR tương ứng với 3 hằng số bền của phân tử là:
H3L+ ↔ H2L + H+ K1 = 10-3,1
H2L ↔ HL- + H+ K2 = 10-5,6
HL- ↔ L2- + H+ K3 = 10-11,9
Bước sóng hấp thụ cực đại của 6 dạng ion từ H5L3+ đến L2- lần lượt là: 433,
390, 395, 385, 413 và 490nm Trong dung dịch axit yếu hoặc bazơ yếu, PAR đều có màu da cam
Cấu trúc các phức vòng càng của PAR tương tự như PAN, nguyên tử H của nhóm OH ở vị trí octo được thay thế bằng nguyên tử kim loại bằng cách liên kết kim loại đó với gốc piridin N và azo N (2 vòng 5 cạnh) Các phức dạng ion hoặc dạng phân tử tạo thành có thể chuyển hóa lẫn nhau phụ thuộc vào pH trong dung dịch Tốc độ phản ứng của kim loại với PAR có thể xác định được tuy nhiên thành phần của sản phẩm thì không xác định được Thí dụ Ni2+ phản ứng với PAR trong cả môi trường axit và bazơ đều tạp phức có tỉ lệ 1:2 tuy nhiên vẫn tồn tại các dạng phức khác Trong dung dịch axit yếu, (pH = 3,3) tồn tại phức Ni(HL)2 có màu đỏ (Є520 = 37200), trong môi trường bazo phức có màu da cam (Є496 = 79400, pH =8) đó là màu của NiL22- Các phức Co(HL)2 trong môi trường axit và Co(HL)L- trong môi trường bazo đều có màu đỏ Phức của Mn trong môi trường axit hay bazo đều có dạng MnL22- Trong dung dịch kiềm, Zn tồn tại dưới dạng phức ZnL22- Tỉ lệ tạo phức của kim loại M và PAR phụ thuộc vào pH được trình bày ở bảng sau:
Bảng 1: Các tính chất của một số phức kim loại – PAR
Kim loại Thành phần phức(M:PAR) max (nm) .10-3
Trang 12In 1:1 500 – 510 32.8
Nb
1:1 (0.1 – 0.2 N H2SO4) 530 18 1:1 (pH – 6) 555 38.7 , 31.2
Hầu hết các phức của PAR đều có màu đỏ hoặc màu đỏ tím Với Pd, phức có màu xanh trong môi trường axit và màu đỏ trong môi trường trung tính và bazơ Phương pháp quang xác định cường độ màu thường được tiến hành đo trong dung môi axit Đôi khi người ta tiến hành chiết với các dung môi (etyl axetat để chiết Pd
và iso amyl để chiết phức Hf), trừ khi các tác nhân cation là muối amoni được sử dụng để tạo thành một ion cộng kết với một ion âm của phức kim loại và PAR, có thể chiết trong CHCl3 nhóm p-OH được coi như là có tác dụng làm tăng độ tan của các phức không mang điện (và tác nhân) trong dung môi nước, giải thích khả năng tan của PAR tốt hơn là của PAN Mặc dù rất nhạy, phản ứng của PAR trong môi trường axit yếu và bazo yếu có sự hạn chế do độ chọn lọc kém hơn
Do thuốc thử PAR là một thuốc thử có khả năng tạo phức với nhiều kim loại
có độ nhạy cao, nên việc sử dụng PAR vào mục đích phân tích các nguyên tố ngày
Trang 13càng rộng rãi nếu người ta tìm được điều kiện tối ưu Có thể nói, việc sử dụng thuốc thử PAR nghiên cứu xác định các nguyên tố rất phong phú Ngoài việc sử dụng PAR để nghiên cứu việc xác định các nguyên tố bằng phương pháp trắc quang [], ngày nay các nhà khoa học cũng đã sử dụng một số phương pháp khác có thuốc thử PAR để xác định các nguyên tố như: sắc kí lỏng, sắc kí ion, phương pháp động học,
kĩ thuật FIA, phổ hấp thụ nguyên tử và một số phương pháp khác
Phương pháp trắc quang đơn giản, tiện lợi, độ nhạy tương đối cao nên được sử dụng phổ biến để xác định các kim loại lượng nhỏ Tuy nhiên, nhược điểm của phương pháp này là không chọn lọc, một thuốc thử có thể tạo phức với nhiều ion gây sai số phép phân tích Do đó, để phân tích trắc quang các cation kim loại chuyển tiếp cần phải che hoặc tách loại trước khi phân tích nên khó xác định nhiều kim loại trong cùng hỗn hợp Vì vậy, phương pháp ứng dụng chemometrics với trắc quang được xem là giải pháp tối ưu để xác định đồng thời các chất trong cùng hỗn hợp
1.2 Phương pháp trắc quang kết hợp với chemometrics xác định đồng thời các nguyên tố Co, Cd, Ni, Cu, Pb
1.2.1 Phương pháp trắc quang kết hợp với hồi qui đa biến tuyến tính
Việc xác định đồng thời nhiều cấu tử trong hỗn hợp đã được các nhà khoa học nghiên cứu và ứng dụng rất nhiều do những ưu điểm vì rút ngắn được thời gian phân tích và tăng độ nhạy của phép phân tích Việc nghiên cứu xác định đồng thời nhiều cấu tử mà phổ hấp thụ của chúng xen phủ nhau đã được nhiều tác giả quan tâm nghiên cứu
Trên thế giới, phần lớn các công trình nghiên cứu xác định đồng thời các chất trong cùng hỗn hợp đều sử dụng thuật toán hồi quy đa biến ứng dụng phần mềm Matlab để tính toán kết quả và xử lý số liệu
Jahanbakhsh và các cộng sự [53] đã tiến hành xác định đồng thời cả ba nguyên tố coban, đồng và niken trong các mẫu hợp kim bằng thuốc thử nitrosol-R- salt kết hợp với phương pháp bình phương tối thiểu riêng phần, một công cụ toán học ứng dụng trong phân tích hồi quy đa biến Các thí nghiệm được tiến hành trên
ma trận thực nghiệm cho hệ ba cấu tử Khoảng tuyến tính xác định Co, Cu, Ni tương ứng là 0,4-2,6 ppm; 0,6-3,4 ppm và 0,5-5,5 ppm
Ảnh hưởng của pH đến độ nhạy, độ chọn lọc của phép phân tích đã được nghiên cứu Khảo sát ảnh hưởng của rất nhiều các cation, anion đến phương pháp
Áp dụng phương pháp này xác định đồng thời coban, đồng, niken trong các mẫu
Trang 14hợp kim Cunico (chứa coban, đồng, niken) và hợp kim Conife (chứa coban, niken, sắt) thu được kết quả tốt
Tác giả [32] đã xác định Ni, Cu, Co sử dụng 1-(2-thiazolylazo)-2-naphthol bằng phương pháp chuẩn đa biến là hồi quy bình phương tối thiểu riêng phần để xác định đồng thời Co, Cu và Ni trong khoảng nồng độ lần lượt là 0,05 -1,05; 0,05 – 1,30 và 0,05 – 0,80µg/ml với sai số tương đối tương ứng với việc xử lý tín hiệu trực giao và không xử lý tín hiệu trực giao lần lượt cho Co, Cu và Ni là: 0,007; 0,008; 0,011 và 0,031; 0,037; 0,032 µg/ml
Bằng phương pháp trắc quang, các tác giả Trần Thúc Bình, Trần Tứ Hiếu, Phạm Luận đã xác định Cu, Ni, Mn, Zn trong cùng một hỗn hợp theo Phương pháp Vierod cải tiến bằng Pyridin-azo-naphtol(PAN) với sai số < 4% ở những bước sóng khác nhau.[1]
Bằng phương pháp trắc quang sử dụng mạng nơron nhân tạo, các nhà khoa học đã xác định đồng thời phenobarbiton và phenytoinnatri trong các mẫu thuốc
và dược phẩm, xác định đồng thời Zn(II), Cd(II), Hg(II) trong nước với độ lệch chuẩn 0,29 với Cd, 0,38 với Hg và 0,35 với Zn[35] Xác định đồng thời Co(II) và Ni(II) trên cơ sở phức của chúng với pyrolidin và cacbon disulfua với giới hạn là 0,0005 và 0,006
Tác giả [15] đã xác định đồng thời Ni, Co, Pd trong bản mạch điện tử bằng phương pháp trắc quang với thuốc thử PAN sử dụng thuật toán hồi quy đa biến, nồng độ tối ưu PAN là 0,01%, nồng độ Tween 80 là 0,3% Đường chuẩn Ni2+ tuyến tính trong khoảng 0,01 – 0,80 ppm, Co2+: 0,08 – 2,40 ppm, Pd2+: 0,2 - 8,0 ppm Lập
ma trận tính các hệ số hồi qui từ 36 dung dịch chuẩn, dựa trên kết quả phân tích 16 mẫu giả tìm được mô hình PLS, CLS, ILS và PCR thích hợp với sai số tương đối khi phân tích mẫu tự tạo nhỏ hơn 15% thoả mãn sai số cho phép
1.2.2 Phương pháp hồi qui đa biến phi tuyến tính xác định đồng thời các chất
1.2.2.1 Phương pháp mạng noron nhân tạo (ANN)
1.2.2.1.1 Cấu trúc và mô hình của một nơron [3, 33, 28]
Mô hình của một nơron trong não người có thể biểu diễn như hình 1, trong đó
“soma” là thân của nơron, các dendrites là các dây mảnh, dài, gắn liền với thân, chúng truyền dữ liệu (dưới dạng xung điện thế) đến cho thân nơron xử lý Bên trong thân nơron các dữ liệu đó được tổng hợp lại Có thể xem gần đúng sự tổng hợp ấy như là một phép lấy tổng tất cả các dữ liệu mà nơron nhận được
Trang 15
Hình 1 : Mô hình một nơron của con người
Một loại dây dẫn tín hiệu khác cũng gắn với “soma” là các axon Khác với dendrites, axon có khả năng phát các xung điện thế, chúng là các dây dẫn tín hiệu từ nơron đi các nơi khác Chỉ khi nào điện thế trong soma vượt quá một giá trị ngưỡng nào đó (threshold) thì axon mới phát một xung điện thế, còn nếu không thì nó ở trạng thái nghỉ
Axon nối với các dendrites của các nơron khác thông qua những mối nối đặc biệt gọi là synapse Khi điện thế của synapse tăng lên do các xung phát ra từ axon thì synapse sẽ nhả ra một số chất hoá học (neurotransmitters); các chất này mở
"cửa" trên dendrites để cho các ions truyền qua Chính dòng ions này làm thay đổi điện thế trên dendrites, tạo ra các xung dữ liệu lan truyền tới các nơron khác
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất Qua các nhánh axon liên kết tế bào nơron này với các nơron khác, sự thay đổi trạng thái của một nơron cũng sẽ kéo theo sự thay đổi trạng thái của những nơron khác và do đó là sự thay đổi của toàn bộ mạng nơron có thể thực hiện qua quá trình “dạy” hoặc do khả năng học tự nhiên [3 ]
1.2.2.1.2 Khái niệm mạng nơron nhân tạo (ANN)
Mạng nơron nhân tạo là một mô phỏng xử lý thông tin, được nghiên cứu từ
hệ thống thần kinh của sinh vật, trong đó một mô hình toán học được tạo ra giống như bộ não để xử lý thông tin ANN giống như con người, được học bởi kinh nghiệm, lưu những kinh nghiệm hiểu biết và sử dụng trong những tình huống phù hợp (hình 2)
Trang 16Hình 2 : Mô hình của một nơron nhân tạo
Nơron này sẽ hoạt động như sau: giả sử có N dữ liệu đầu vào (inputs), nơron
sẽ có N trọng số (weights) tương ứng với N đường truyền đầu vào Nơron sẽ lấy giá trị đầu vào thứ nhất, nhân với trọng số trên đường vào thứ nhất, lấy giá trị đầu vào thứ hai nhân với trọng số của đường vào thứ hai v.v , rồi lấy tổng của tất cả các kết quả thu được Đường truyền nào có trọng số càng lớn thì tín hiệu truyền qua đó càng lớn, như vậy có thể xem trọng số là đại lượng tương đương với synapse trong nơron sinh học, hàm y tương đương với axon Nếu tổng này lớn hơn một ngưỡng giá trị nào đó thì đầu ra của nơron sẽ ở mức tích cực
ANN là một khái niệm tương đối mới trong quá trình xử lý số liệu, giải quyết các bài toán khó mà con người nhiều khi không giải toán được.
Trang 17Hình 3: Đồ thị các hàm thường dùng
Với mỗi mô hình tính toán, ta phải xác định các thuật toán học để tự động xác định các giá trị tham số tối ưu cho mô hình trên cơ sở bộ số liệu cho trước (các con số này người xây dựng chương trình không phải quan tâm)
* Hằng số tốc độ học
Hằng số tốc độ học là một yếu tố quan trọng ảnh hưởng đến hiệu quả và
độ hội tụ của thuật giải lan truyền ngược sai số Không có hằng số tốc độ phù hợp cho tất cả các bài toán khác nhau Hằng số tốc độ học thường được chọn bằng thực nghiệm cho mỗi bài toán ứng dụng cụ thể Nếu giá trị của hằng số tốc độ học quá nhỏ, tốc độ hội tụ của giải thuật sẽ rất chậm và không có lợi vì thủ tục học sẽ kết thúc tại một cực tiểu cục bộ địa phương gần nhất
1.2.2.1.4 Các mô hình mạng nơron nhân tạo
Liên kết các đầu vào và ra của nhiều nơron với nhau ta được một mạng nơron Việc ghép nối các nơron trong mạng với nhau có thể theo một nguyên tắc bất kì nào đó Từ đó có thể phân biệt các nơron khác nhau như các loại nơron mà các đầu vào nhận thông tin từ môi trường bên ngoài với các loại nơron mà các đầu vào được nối với các nơron khác trong mạng Các nơron mà đầu vào giữ chức năng nhân thông tin từ môi trường bên ngoài gọi là “đầu vào” của mạng Cũng tương tự như vậy, một nơron có một đầu ra, đầu ra của nơron này cũng có thể là đầu vào của nhiều nơron khác hoặc có thể đưa ra từ môi trường bên ngoài Những nơron có đầu ra đưa tín hiệu vào môi trường bên ngoài được gọi là đầu ra của mạng Một mạng nơron bao gồm nhiều lớp, mỗi lớp bao gồm nhiều nơron có cùng một chức năng trong mạng
- Mạng nơron truyền thẳng một lớp (perceptron)
Trang 18Đây là cấu trúc mạng nơron đơn giản nhất Mạng nơron này chỉ gồm 1 lớp xuất, không có lớp ẩn
+ Khả năng của perceptron:
- Phương trình v.w=0 chính là một siêu phẳng trong không gian d-chiều Do
đó perceptron có khả năng phân lớp tuyến tính nên có thể dùng để giải bài toán hồi quy tuyến tính
- Hạn chế của perceptron: không thể phân lớp phi tuyến
- Mạng lan truyền nhiều lớp (multi layer perceptron-MLP)
* Cấu trúc mạng MLP 1 lớp ẩn :
Mạng này có 3 lớp: lớp đầu vào gồm các tín hiệu đầu vào; lớp ẩn ở giữa chứa các nơron ẩn; một lớp đầu ra gồm tín hiệu đầu ra Một mạng như vậy được xác định bởi 3 thông số tương ứng với 3 lớp là N, M, K Trong đó, N là số đầu vào, M là số nơron lớp ẩn, K là số đầu ra (bằng số nơron lớp đầu ra)
neuron neuron neuron
u 1 v 1
g 1
[W] [V]
Trang 19- Mạng lan truyền ngược (RBF)
Mạng lan truyền ngược hay còn gọi là mạng phản hồi là mạng mà đầu
ra của một nơron có thể là đầu vào của nơron trên cùng một lớp hoặc của lớp trước đó Mạng RBF thưòng sử dụng hàm Kernel là hàm gaussian để tính vì sự không tuyến tính Hàm Gaussian được đặc trưng bởi hai thông số giá trị trung tâm(C) và độ rộng
* Mô hình của mạng RBF :
Hình 4 :Mô hình mạng RBF
Trong đó hàm f được lựa chọn là hàm
2 2
1.2.2.1.5 Giải thuật lan truyền ngược
Thuật toán này được tạo ra bằng cách tổng quát hoá qui luật phổ biến Widrow-Hoff với mạng đa lớp và hàm chuyển vi phân không tuyến tính, vectơ
Trang 20nhập và vectơ mục tiêu tương ứng được dùng để tạo mạng cho đến khi nó có thể xấp xỉ hoá một hàm liên quan tới vectơ nhập và vectơ xuất
Nếu có n biến đầu vào ta sẽ có tín hiệu vào đồng thời ở các nút nhập và được lan truyền thẳng qua các nơron rồi xuất hiện tại điểm ra cuối cùng của mạng như tín hiệu ra Tổng tín hiệu vào tại một nơron được tính là hàm của các tín hiệu vào và liên quan đến synaptic weight để ứng dụng cho một nơron nào đó Nơron này sẽ chuyển tổng tín hiệu nhập thành tín hiệu ra (outgoing) sử dụng hàm chuyển đổi (transfering function) và phát đi đến các nơron khác Trong khi đó một tín hiệu sai số xuất phát tại một nơron ra của mạng và truyền ngược lại theo từng lớp đến các nút mạng phía trước Mỗi quá trình truyền đi của tín hiệu và truyền ngược lại của sai số được gọi là một bước lặp (epoch) Tín hiệu sai số và gradient sai số tại mỗi nơron được tính cho một trọng số đã chọn (weight optimizato) sao cho sai
t (xi, w): giá trị của tập mẫu
y (xi): giá trị đầu ra của mạng
Trước tiên , ta xét trên 1 nơron, mỗi nơron đều có giá trị vào và ra, mỗi giá trị đều có một trọng số để đánh giá mức độ ảnh hưởng của giá trị vào đó Thuật toán Back – Propagation sẽ điều chỉnh các trọng số đó để giá trị ej = Tj – yj là nhỏ nhất
Trước hết ta phải xác định vị trí của mỗi nơron Nơron nào là của lớp ẩn và nơron nào là của lớp xuất Ta cần biết các ký hiệu:
wij: vector trọng số của nơron j số đầu vào i
uj: vector giá trị đầu ra của nơron trong lớp j
Trang 21Hình 6: Mô hình tính toán một nơron
- Giá trị sai số của nơron j tại vòng lặp thứ n
fj (.)
Trang 22Như vậy tuỳ theo hàm hoạt động ta có thể tính dễ dàng tính toán các giá trị điều chỉnh trọng số cho từng trọng số tương ứng theo thuật toán lan truyền ngược Back – Propagation
1.2.2.1.6 Ưu, nhược điểm của mạng nơron nhân tạo
* Ưu điểm
- Phương pháp cho phép xác định đồng thời nhiều cấu tử khi phổ của chúng trùng lấn nhau ngay cả khi các đại lượng vật lý đo được không có tính cộng tính Trong khi đó các phương pháp khác như trắc quang đạo hàm, Vierordt đòi hỏi các đại lượng đó phải có tính cộng tính
- Mạng ANN cho phép xác định đồng thời nhiều cấu tử mà trong hệ có nhiều quá trình xảy ra còn chưa biết hay còn gọi là hệ mờ, nhờ vậy mà ANN có thể xác định bằng phương pháp trắc quang ngay cả khi trong dung dịch có sự tạo phức cạnh tranh, thuốc thử tạo phức màu không đủ dư và khi nồng độ các cấu tử cần xác định không nằm trong khoảng tuyến tính
- ANN cho phép xác định đồng thời nhiều cấu tử mà phổ của chúng trùng lấn nhau bằng các kỹ thuật khác nhau như: điện hoá, trắc quang động học, huỳnh quang tia X
* Nhược điểm
- Thời gian luyện mạng thường khá lâu
- Chưa có phần mềm tiện ích để sử dụng ngay, đòi hỏi người thực hiện phải nắm rõ thuật toán để viết chương trình trên các phần mềm khác (Pascal, Matlab, C+, ) mới sử dụng được
- ANN có rất nhiều thuật toán khác nhau, do đó khi xây dựng một mô hình phân tích chất, đòi hỏi người sử dụng phải thử nhiều mô hình để tìm được cấu trúc
mạng tối ưu
1.2.2.1.7 Ứng dụng của mạng nơron nhân tạo
Đặc trưng của ANN là khả năng học và xử lý song song Nó cho phép học được dáng điệu và lưu lại mối quan hệ giữa các yếu tố đầu vào và đầu ra của các quá trình cần nghiên cứu dựa trên việc học một tập dữ liệu đủ lớn mô tả quá trình
đó Sau khi học xong, ANN có thể tính toán kết quả đầu ra tương ứng với bộ số liệu đầu vào mới
ANN có rất nhiều ứng dụng trong nhiều ngành và lĩnh vực khác nhau:
Trang 23- Giải các bài toán phân lớp: bài toán này đòi hỏi giải quyết vấn đề phân loại các đối tượng thành các nhóm dựa trên những đặc điểm của các nhóm đối tượng Trên cơ sở này người ta sử dụng ANN trong nhận dạng chữ viết, tiếng nói, phân loại gen, phân loại chất lượng sản phẩm [23]
- Bài toán dự báo: mạng ANN đã được ứng dụng trong việc xây dựng
mô hình dự báo sử dụng tập dữ liệu trong quá khứ để dự đoán số liệu cho tương lai (dự báo thời tiết)
- Bài toán điều khiển và tối ưu hoá: ANN được sử dụng trong hệ điều khiển tự động cũng như trong việc giải quyết rất nhiều bài toán tối ưu trong thực tế.[21]
Nhìn chung, ANN là công cụ cho phép tiếp cận có hiệu quả để giải quyết các bài toán có tính phi tuyến tính, biến động, dữ liệu có nhiễu và đặc biệt là trong trường hợp các mối quan hệ mà bản chất vật lý của các quá trình cần nghiên cứu không dễ dàng nhận biết và thể hiện chúng hay còn gọi là các tập mờ.[9]
* Ứng dụng trong hoá học phân tích [32]
Việc nghiên cứu xác định đồng thời nhiều cấu tử mà phổ của các đại lượng vật lý đo được của chúng xen phủ nhau đã được nhiều tác giả quan tâm nghiên cứu Để xác định đồng thời nhiều cấu tử có nhiều phương pháp: phương pháp trắc quang đạo hàm, phương pháp chuẩn đa biến sử dụng bình phương tối thiểu (CLS, ILS, PLS) nhưng phương pháp đạo hàm sẽ làm giảm độ nhạy của phép phân tích còn trong nhiều trường hợp các phương pháp bình phương tối thiểu không thích hợp vì tín hiệu đo không có tính cộng tính
Hiện nay nhiều công trình nghiên cứu sử dụng ANN được triển khai thực hiện ở rất nhiều phòng thí nghiêm trên thế giới ANN cho phép mô hình hoá các mối quan hệ phi tính phức tạp Nó cho phép giải quyết mối quan hệ mà trong đó
có những quá trình xảy ra chưa được biết hoặc những thông tin về hệ còn chưa đầy đủ hay hệ mờ
- Bằng ANN người ta đã nghiên cứu xác định các axit hiđroxylat benzoic
và axit cianmic bằng phương pháp chuẩn độ điện thế cho kết quả chính xác với sai
số 4,18% [40]
- Phương pháp điện hoá sử dụng mạng ANN đã được nghiên cứu xác định đồng thời Ag(I), Hg(II), Cu(II) bằng đo thế sử dụng điện cực cacbon nhão không
Trang 24biến tính Xác định Mo, Cu bằng phổ xung vi phân hoà tan hấp phụ catot, etanol, fructoza và glucoza bằng phương pháp volampe xung bậc thang (DPSV)…
- ANN được sử dụng trong nghiên cứu xác định đồng thời anilin và cyclohexylamin cho kết quả có độ lệch chuẩn tương đối (RMSD) từ 0,9-1,17 [32]
- Bằng phương pháp trắc quang sử dụng mạng ANN đã xác định đồng thời phenobarbiton và phenytoinnatri trong các mẫu thuốc và dược phẩm xác định đồng thời Zn(II), Cd(II), Hg(II) trong nước với độ lêch chuẩn 0,29-Cd, 0,38
và 0,35 với Hg và Zn(II) [35]
Bên cạnh đó, nhóm tác giả [39] đã nghiên cứu mạng nơron nhân tạo gồm 3 lớp với thuật toán lan truyền ngược để thiết lập mối quan hệ phi tuyến giữa nồng độ của anthranilic acid (HA), nicotinic acid (HN), picolinic acid (HP) and sulfanilic acid (HS) trong hỗn hợp và pH của các dung dịch ở các thể tích khác nhau của dung dịch thêm vào khi chuẩn độ Các cấu tử chính của ma trận pH được sử dụng làm đầu vào trong ANN Mô hình mạng tối ưu đã xác định được nồng độ của axit trong các mẫu tự tạo Kết quả chỉ ra rằng, ANN phân tích dữ liệu chuẩn độ với sai số tương đối thấp (< 4%)
Bằng phương pháp trắc quang động học sử dụng mạng ANN đã nghiên cứu xác định glucoza, fructoza, lactoza với kaliferi xianua (K3Fe(CN)6 Xác định đồng thời Co(II), V(IV) trên cơ sở tốc độ phản ứng của chúng với Fe(II) khi có mặt thuốc thử 1,10-phenanthrolin [39]
Ở Việt Nam, đã có một số công trình xác định đồng thời các chất bằng mạng nơron nhân tạo nhờ phần mềm WinNN (mua của Mỹ) như: xác định đồng thời Uran
và Thori[2], xác định đồng thời Ni(II), Cu(II), Zn(II) bằng phương pháp chuẩn đa biến sử dụng mạng nơron nhân tạo bằng phần mềm WinNN với sai số lớn nhất của Ni(II) là 8%, Cu(II) là 5% và Zn(II) là 10,2%; phương pháp xác định được nồng độ các mẫu cả trong và ngoài khoảng tuyến tính.[22]
Tuy nhiên, chưa có công trình nghiên cứu nào tiến hành phân tích đồng thời các chất sử dụng phương pháp mạng nơron nhân tạo và phân tích thành phần chính kết hợp với mạng nơron nhân tạo viết trên phần mềm MATLAB
Trang 251.2.2.2 Phương pháp phân tích thành phần chính (PCA).[24,15]
* Khái niệm
Phân tích thành phần (cấu tử) chính là công cụ hữu hiệu cho phép giảm
số biến trong tập số liệu từ tập số liệu đa chiều bằng cách tìm ra giá trị phương sai lớn nhất với số cấu tử chính (PC) hay các biến ảo ít nhất
PCA là thuật toán đa biến dựa trên việc quay các trục số liệu chứa các biến tối ưu Khi đó, một tập hợp các biến liên quan với nhau được chuyển thành tập hợp các biến không liên quan và được sắp xếp theo thứ tự giảm độ biến thiên hay phương sai Những biến không liên quan này là sự kết hợp tuyến tính các biến ban đầu Dựa trên phương sai do mỗi biến mới gây ra có thể loại bỏ bớt các biến phía cuối dãy mà chỉ mất ít nhất thông tin về các số liệu thực ban đầu Bằng cách này sẽ giảm được kích thước của tập số liệu trong khi vẫn có thể giữ nguyên thông tin
*Thuật toán PCA
Phương pháp này sẽ thiết lập 1 tập biến mới, được gọi là các cấu tử chính Mỗi cấu tử chính là 1 sự kết hợp tuyến tính của các biến chung Tất cả các cấu tử chính đều trực giao với nhau và không làm giảm đi lượng thông tin có trong tập dữ liệu Các cấu tử chính đó coi như 1 dạng trực giao cơ sở của không gian dữ liệu
- Cấu tử chính thứ nhất là 1 trục tọa độ trong không gian, sao cho chứa nhiều thông tin của các biến nhất
Hình 7: Đồ thị biểu diễn sự dịch chuyển các biến sang trục đầu tiên
Khi chiếu mỗi biến cũ lên hệ tọa độ đó trước tiên sẽ hình thành 1 biến mới (PC1) hay trục thứ nhất, đó là giá trị riêng lớn nhất của các biến ảo (các PC) Cấu
tử thứ 2 hay một 1 trục tọa độ khác trong không gian (PC2), vuông góc với cấu tử thứ nhất Quá trình chiếu các biến lên trục tọa độ này sẽ tạo ra các giá trị mới
PC thứ nhất
Trang 26Hình 8: Đồ thị biểu diễn sự dịch chuyển các biến sang trục thứ 2
- Nếu tập dữ liệu có k biến thì hệ tọa độ mới cũng có k chiều (k PC) Tập dữ liệu đầy đủ của các cấu tử này cũng chứa lượng thông tin giống như các giá trị của tập dữ liệu cũ, nhưng 80% thông tin tập trung vào các PC đầu tiên Kích thước của tập dữ liệu được giảm bằng cách kiểm tra các yếu tố ảnh hưởng chính tới tập dữ liệu ban đầu Thông thường, chỉ có 3, 4PC đầu là chứa nhiều thông tin ảnh hưởng đến kết quả của tập dữ liệu ban đầu
Khi phân tích cấu tử chính (là quá trình chiếu các biến ban đầu lên 1 hệ trục tọa độ mới phù hợp), các giá trị mới thu được là:
PCALoading: là hệ số góc của hệ trục tọa độ cũ so với hệ trục tọa độ mới PCAScore: là các giá trị của dữ liệu ban đầu chiếu lên hệ trục tọa độ mới Đây là các giá trị mang thông tin của tập dữ liệu, được sử dụng để làm dữ liệu đầu vào trong các phép phân tích tiếp theo
PCAVar: là phương sai tích lũy của các biến mới so với các biến ban đầu Dựa vào PCAVar để đánh giá lượng thông tin chứa trong mỗi PC
PCAVar
Hình 9: Giá trị PCALoading, PCAScore, PCAVar thu được khi chiếu lên các trục
Trang 27*Ứng dụng của PCA
- Giảm kích thước tập số liệu, từ biểu diễn n chiều trong không gian thành biểu diễn hai hoặc 3 chiều với số biến có ảnh hưởng chính đến tập số liệu
- Loại bỏ sự đa cộng tính giữa các biến trong việc xây dựng phương trình hồi qui biểu diễn sự phụ thuộc của tín hiệu phân tích vào các biến là nồng độ các cấu tử trong hệ Phương pháp này có tên gọi là hồi qui cấu tử chính
- Từ tập số liệu với n biến ban đầu có liên quan mật thiết với nhau, sau khi giảm thành p biến không liên quan thì trị riêng của chúng có thể sử dụng làm số liệu đầu vào của phương pháp hồi qui kết hợp với mạng noron nhân tạo giải bài toán phân tích đồng thời các cấu tử trong hệ có tương tác không cộng tính
Tuy nhiên PCA đơn thuần là phương pháp toán học nên các kết quả thu được bị ảnh hưởng rất lớn bởi tập số liệu ban đầu vì vậy cần kết hợp với những kiến thức chuyên ngành khác nếu không sẽ dẫn đến những giải nghĩa sai lệch
1.2.2.3 Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính xác định đồng thời các chất
Khi phân tích hồi quy đa biến bằng phương pháp mạng nơron nhân tạo, ma trận số liệu đầu vào càng lớn, tức là tập số liệu đầu vào chứa càng nhiều thông tin thì kết quả thu được ở đầu ra càng gần với giá trị thực Tuy nhiên, khi số liệu quá lớn làm cho thời gian luyện mạng lớn hơn, có thể làm quá trình luyện mạng lặp lại nhiều lần và gây nên sai số lớn Phương pháp phân tích cấu tử chính thường được
sử dụng trước để giảm kích thước của tập số liệu mà không làm mất đi lượng thông tin chứa trong tập số liệu đó
Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính thường gồm các bước như sau:
- Bước 1: Xác định tập dữ liệu cần phân tích Đối với phương pháp trắc quang thì tập dữ liệu phân tích sẽ là ma trận độ hấp thụ quang (p dung dịch chuẩn x
n bước sóng) và ma trận nồng độ mẫu phân tích (p mẫu phân tích, m cấu tử, )
- Bước 2: Dùng phương pháp phân tích thành phần chính (PCA) để giảm
Trang 28số PC chính, thì giá trị PCAScore là tập dữ liệu ảo (k x n) trong đó k < m được sử dụng để làm dữ liệu của lớp nhập
- Bước 3: Sử dụng ma trân dữ liệu ảo (k x n) làm dữ liệu đầu vào của mô hình mạng nơron nhân tạo và ma trận nồng độ (m x p) làm dữ liệu đầu ra của mô hình mạng nơron nhân tạo
* Ứng dụng PCR- ANN trong hóa phân tích
Nhóm tác giả [26 ] đã phân tích đồng thời thioxianat và sunfua bằng phương pháp phân tích động học trắc quang sử dụng dãy các trị riêng (eigenvalue)
và sắp xếp các hệ số tương quan (correlation ranking) trong phân tích thành phần chính và mạng nơron nhân tạo Phương pháp xác định ion thioxianat trong khoảng nồng độ 60 – 700 ng.ml-1 và ion sunfua trong khoảng nồng độ 20 -400 ng.ml-1 và dùng để phân tích các mẫu nước máy, nước ngầm và nước sông Phương pháp phân tích thành phần chính với thuật toán SVD được sử dụng để giảm kích thước của tập số liệu, từ 301 giá trị ban đầu thuật toán giảm xuống chỉ còn 5 cấu tử (PC),
đó cũng là số cấu tử của nút nhập trong mạng nơron nhân tạo Hai phương pháp được lựa chọn để tìm số cấu tử thích hợp là sắp xếp các cấu tử theo eigenvalue hoặc theo sự tương quan Các PC được thay đổi từ 1 -8 để dùng trong nút nhập của mạng ANN, cùng các thông số khác để thiết lập mô hình PC – WNN tối ưu
Mô hình CR-PC-WNN đạt sai số tương đối là 5,6% và EV-PC-WNN đạt sai số là 6,8%
Tác giả [25] đã sử dụng phương pháp PC-ANN để phân tích đồng thời lượng vết Zr(IV) và Hf(IV) trong các mẫu nước sông và nước thải nhà máy Mô hình được thiết lập bằng cách xây dựng ma trận nồng độ trong khoảng 0,03 – 3,4 µg.ml-1Zr(IV), và 0,2 – 7,0 µg.ml-1 Hf(IV) với 23 mẫu học và 20 mẫu kiểm tra Ma trận score và ma trận loading được tính toán bằng thuật toán SVD, đó là 1 trong các phương pháp phân tích thành phần chính
Phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính còn được sử dụng để xác định đồng thời 4 dạng phenol ( phenol, 2-Clo phenol, 3-Clo phenol và 4-Clo phenol) dựa trên sự oxi hóa với N,N-đietyl-p-phenyl điamin trong sự có mặt của Fe(CN)63+ trong khoảng nồng độ từ 0,1-7,0 μg/ml Tác giả [36] đã sử dụng phương pháp phân tích thành phần chính để giảm kích thước tập
dữ liệu động học trắc quang đo ở 680nm và sử dụng mạng nơron 3 lớp với giải thuật lan truyền ngược để luyện mạng Mô hình PC-ANN tối ưu thu được cho phép phân tích định lượng 4 hợp chất trên với sai số tương đối nhỏ hơn 5%
Trang 29Phương pháp PC-ANN còn được áp dụng để phân tích đồng thời antipyriien và caffeine citrate trong thuốc [48] với 43 mẫu học, 20 mẫu luyện mạng và 10 mẫu kiểm tra Phép phân tích được tiến hành trong vùng hồng ngoại gần với bước sóng 1100nm đến 2500nm Các mẫu kiểm tra cho giá trị sai số tương đối chuẩn từ 1,489 đến 2,611%
1.3 Phần mềm Matlab( Matrix in laboratory) [4]
Matlab là chương trình phần mềm hỗ trợ đắc lực cho tính toán với ma trận và hiển thị Nó có thể chạy trên hầu hết các hệ máy tính, từ máy tính cá nhân đến các
hệ super computer Matlab được điều khiển bằng tập các lệnh, tác động qua bàn phím trên cửa sổ điều khiển Nó cũng cung cấp khả năng lập trình với cú pháp dịch lệnh còn gọi là scrip file
Các lệnh của Matlab rất hiệu quả, nó cho phép giải các loại bài toán khác nhau
và đặc biệt hữu dụng cho các hệ phương trình tuyến tính hoặc tính toán với hàm toán học phức tạp
Ngoài ra, Matlab còn có thể xử lý dữ liệu, biểu diễn đồ hoạ một cách linh hoạt, đơn giản và chính xác trong không gian 2 chiều cũng như 3 chiều, kể cả khả năng tạo hoạt cảnh, bởi những công cụ như các tệp lệnh ngày càng được mở rộng với 25 thư viện trợ giúp (Toolboxs) và bản thân các hàm ứng dụng được tạo lập bởi người
sử dụng Không cần nhiều đến kiến thức về máy tính cũng như các kĩ thuật lập trình phức tạp, mà chỉ cần đến những hiểu biết cơ bản về lý thuyết số, toán ứng dụng, phương pháp tính và khả năng lập trình thông dụng, người sử dụng có thể dùng Matlab như công cụ hữu hiệu cho lĩnh vực chuyên ngành của mình
Đối với hoá học phân tích, việc ứng dụng tiện ích của hàm M- file giúp tính toán dễ dàng và thuận tiện, do chỉ cần nhập đúng hàm và Matlab sẽ cho ra kết quả của hàm
* Các quy luật và thuộc tính của hàm M- file:
-Tên hàm và tên file phải là một ví dụ hàm flipud, file lưu là flipud.m
-Lần đầu tiên Matlab thực hiện hàm M- file nó sẽ mở file văn bản tương ứng
và dịch lệnh của file đó ra một dạng mã lưu trong bộ nhớ nhằm mục đích tăng tốc
độ thực hiện các lời gọi
-Việc thi hành hàm M- file sẽ kết thúc khi gặp dòng cuối cùng của file đó hoặc gặp dòng lệnh return Lệnh return giúp ta kết thúc một hàm mà không cần phải thi hành hết các lệnh của hàm đó
Trang 30-Hàm Error của Matlab sẽ hiển thị một chuỗi lên cửa sổ lệnh và dừng thực hiện hàm, trả điều khiển về cho cửa sổ lệnh và bàn phím
-Một M- file có thể chứa nhiều hàm Hàm chính trong M- file này phải đặt trùng với tên của M- file như đề cập đến ở trên Các hàm khác được khai báo thông qua câu lệnh function được viết sau hàm đầu tiên
-Các dòng ghi lời chú thích cho tới dòng đầu tiên không phải là chú thích trong hàm M- file là những dòng văn bản nó sẽ hiện ra khi sử dụng lệnh help
-Mỗi hàm có một không gian làm việc riêng tách biệt so với môi trường MATLAB, mối quan hệ giữa biến và hàm với môi trường MATLAB là các biến vào và ra của hàm đó Nếu trong thân hàm giá trị bị thay đổi thì sự thay đổi này chỉ tác động bên trong của hàm đó mà không làm ảnh hưởng đến các biến của môi trường MATLAB Các biến được tạo ra bên trong hàm thì chỉ nằm trong không gian làm việc của hàm đó và được giải phóng khi hàm kết thúc Vì vậy, không thể
sử dụng thông tin của lần trước gọi cho lần sau
- Số các tham số vào và ra khi một hàm được gọi thì chỉ có tác dụng bên trong hàm đó, biến nargin chứa tham số đa vào, biến narout chứa các tham số đưa ra Thường dùng biến narin hơn biến narout
-Các hàm có thể dùng chung các biến với các hàm khác với môi trường Matlab là có thể đệ quy nếu như các biến được khai báo là toàn cục
Đặc biệt, phần mềm này có cả một Toolbox với các hàm toán học dành riêng
để thiết lập các mô hình mạng nơron nhân tạo, người sử dụng có thể tạo ra vô số các
mô hình sao cho phù hợp với mục đích sử dụng
Với những ưu điểm nổi trội như vậy, Matlab có thể giải quyết mọi vấn đề tính toán phức tạp trong hoá phân tích
Trang 31Chương II: THỰC NGHIỆM
2.1 Nội dung và phương pháp nghiên cứu
2.1.1 Phương pháp nghiên cứu
Cơ sở của phương pháp là dựa các phản ứng tạo phức màu của Ni(II), Co(II), Cu(II), Pb(II) và Cd(II) với thuốc thử PAR ở pH= 10, đo độ hấp thụ quang của các phức màu trên dải bước sóng 450-600 nm để xác định đồng thời 5 kim loại trên trong cùng một hỗn hợp bằng phương pháp mạng nơron nhân tạo kết hợp phương pháp phân tích thành phần chính để giảm kích thước tập số liệu
PAR có công thức hóa học như sau:
PAR là thuốc thử có khả năng tạo phức đa dạng với hầu hết các ion kim loại chuyển tiếp, vì vậy có thể sử dụng để phân tích đồng thời các ion kim loại bằng phương pháp mạng nơron nhân tạo mà không cần phải tách loại các ion có trong hỗn hợp Tuy nhiên, khi số cấu tử cần phân tích là lớn thì lượng mẫu phân tích cũng phải đủ lớn để xây dựng được mô hình ANN tối ưu thích hợp làm cho kích thước của tập dữ liệu là rất lớn Do đó, chúng tôi đã nghiên cứu phương pháp mạng nơron nhân tạo kết hợp với phân tích thành phần chính để giảm kích thước tập số liệu mà vẫn cho được kết quả phân tích chính xác
Các ion kim loại Co(II), Ni(II), Cu(II), Pb(II), Cd(II) tạo phức với PAR trong môi trường kiềm cho phổ hấp thụ xen phủ nhau gần như hoàn toàn với nên để xác định đồng thời các chất phải dùng phương pháp hồi quy đa biến Tuy nhiên, bản thân thuốc thử PAR có màu nên ảnh hưởng rất lớn đến phép xác định do lượng thuốc thử dư, khi đó các phương pháp đa biến như bình phương tối thiểu thông thường (CLS), nghịch đảo (ILS) không tính đến độ hấp thụ quang của mẫu trắng sẽ cho sai số lớn Vì vậy, phương pháp hồi quy đa biến phi tuyến, độ hấp thụ quang của các cấu tử khảo sát có phục được nhược điểm này
Khi kích thước mẫu lớn thì phương pháp phân tích thành phần chính kết hợp với mạng nơron nhân tạo để tính toán cho phép tăng độ chính xác khi xác định đồng thời các kim loại
Phương pháp PCR- ANN dựa trên việc xây dựng ma trận nồng độ dung dịch chuẩn và ma trận độ hấp thụ quang của các dung dịch phức màu của hỗn hợp các
Trang 32ion kim loại với thuốc thử PAR được dùng để thiết lập một mô hình toán học thông qua việc áp dụng PCA để tìm trị riêng và cấu tử chính làm đầu vào của mô hình ANN Đầu ra của mô hình là nồng độ của các cấu tử trong dung dịch cần phân tích
Để đánh giá mô hình cần xây dựng một ma trận nồng độ và độ hấp thụ quang của các mẫu kiểm tra, thông qua việc tính toán sai số tương đối và tổng bình phương sai số để đánh giá độ chính xác của phương pháp từ đó áp dụng phân tích mẫu thựu tế
2.1.2 Nội dung nghiên cứu
Để xây dựng qui trình phân tích xác định đồng thời Cd2+, Co2+, Cu2+, Ni2+ ,
Pb2+ bằng phương pháp trắc quang sử dụng mạng nơron nhân tạo kết hợp với phân tích thành phần chính (PCR-ANN), trong luận văn này chúng tôi tập trung nghiên cứu các vấn đề sau:
- Nghiên cứu các điều kiện tối ưu của phản ứng tạo phức màu giữa các ion Cd2+,
Co2+, Cu2+, Ni2+ , Pb2+ với thuốc thử PAR (pH, độ bền phức mầu, lượng thuốc thử dư…)
- Khảo sát khoảng tuyến tính xác định nồng độ của từng cấu tử trên với thuốc thử PAR từ đó xây dựng ma trận nồng độ có mặt 5 cấu tử
- Nghiên cứu các phương pháp mạng nơron nhân tạo kết hợp phân tích thành phần chính để xác định nồng độ của các chất phân tích dựa vào phổ hấp thụ của hỗn hợp thu được Cụ thể là:
+ Dùng phương pháp phân tích thành phần chính (PCA) tính toán tổng phương sai tích lũy, tìm ra số cấu tử chính phù hợp, giảm kích thước tập số liệu Chuyển tập số liệu ban đầu thành tập số liệu mới có kích thước nhỏ hơn Dùng tập
số liệu mới này để làm dữ liệu đầu vào của mạng nơron nhân tạo
+ Thiết lập và khảo sát mô hình ANN tối ưu để tính toán, xác định nồng độ các cấu tử dựa vào phổ hấp thụ của hỗn hợp
- Đánh giá độ chính xác của mô hình, so sánh với phương pháp tính của mô hình khác
Trang 33- Dung dịch chuẩn gốc Ni2+ 1000 ppm: Cân 1,0130 g NiCl2 6H2O cho vào bình định mức 250 ml, thêm 50 ml dung dịch HCl 10%, lắc đều, thêm nước cất lắc cho tan hết, sau đó thêm nước cất đến vạch định mức
- Dung dịch Cu2+1000ppm: Cân 0,9765 g CuSO4.5H2O, hòa tan trong nước cất 2 lần, chuyển vào bình định mức cỡ 250ml, lắc cho tan hết, định mức bằng nước cất đến vạch
- Dung dịch chuẩn gốc Cd2+ 1000ppm: Hoà tan 0,4079 g CdCl2 (P.A) trong
2 ml HCl đặc sau đó thêm nước cất đến vạch định mức 250ml thu được dung dịch
Cd2+ 1000 ppm
- Dung dịch chuẩn gốc Pb2+ 1000ppm: Hoà tan 0,3357g PbCl2 (P.A) trong
2 ml HCl đặc sau đó thêm nước cất đến vạch định mức 250ml thu được dung dịch
Nồng độ của dung dịch Cu2+ được kiểm tra lại bằng phương pháp chuẩn độ phức chất như sau: Lấy 10,0ml dung dịch Cu2+ vào bình nón 250ml, thêm dung dịch đệm axetat pH=5 và 3 giọt chỉ thị PAN Đun sôi và chuẩn độ bằng đung dịch EDTA Ở điểm tương đương dung dịch chuyển từ màu tím đậm sang màu vàng lục
- Dung dịch đệm borac pH = 10: Trộn 3,092g H 3 BO 3 và 3,728g KCl sau đó chuyển vào bình định mức 1 lít, thêm nước cất và lắc đều , cuối cùng định mức đến vạch bằng nước cất Điều chỉnh lại pH bằng máy đo pH
- Dung dịch thuốc thử PAR (C11H8N3O2Na.H2O , M = 255) 7,5x10-4M : cân 0,0404g PAR pha trong bình 250ml Bảo quản thuốc thử trong ngăn mát tủ lạnh và
Trang 34- Máy trắc quang UV - VIS 1601 PC - Shimazu (Nhật Bản), dải bước sóng đo 200nm - 900nm, cuvet thuỷ tinh có chiều dày l = 1cm
- Máy đo pH HANNA Instrument 211( microprocessor pH merter)
- Cân phân tích Scientech SA 210 độ chính xác 0,0001g
- Nhập số liệu ma trận nồng độ (bao gồm nồng độ của 5 cấu tử và nồng độ thuốc thử) và ma trận tín hiệu đo vào phần mềm Matlab, sử dụng các chương trình
đã lập sẵn để tính toán nồng độ các chất trong hỗn hợp trên phần mềm và tìm nồng
độ các cấu tử trong mẫu ( theo các lệnh ở phần 3.2, 3.3)
Trang 35Chương III: KẾT QUẢ VÀ THẢO LUẬN
3.1 Khảo sát các điều kiện tối ưu tạo phức màu của 5 cấu tử với thuốc thử PAR
3.1.1 Sự phụ thuộc độ hấp thụ quang vào bước sóng
Tiến hành khảo sát sự phụ thuộc của độ hấp thụ quang các phức màu theo bước sóng hấp thụ (phổ hấp thụ) để kiểm tra sơ bộ tính cộng tính của hỗn hợp phức màu, tìm khoảng bước sóng thích hợp cần quét phổ và bước sóng cực đại hấp thụ của 5 cấu tử cho các khảo sát tiếp theo
Tiến hành thí nghiệm: Lấy 6 bình định mức 25ml:
Thêm vào mỗi bình 10ml dung dịch đệm borat có pH = 10, sau đó thêm 5ml thuốc thử PAR 7,5.10-4M
Hình 10 chỉ ra các đặc trưng của phổ hấp thụ của các phức màu: Co- PAR; Cu- PAR; Cd- PAR; Ni- PAR; Pb- PAR
Hình 10:Phổ hấp thụ của các phức Co- PAR; Cu- PAR; Cd- PAR; Ni- PAR; Pb-
Trang 36Kết quả cho thấy các phức màu Co- PAR; Cu- PAR; Cd- PAR; Ni- PAR; Pb- PAR có độ hấp thụ quang đạt cực đại ở các bước sóng tương ứng là λmax = 496
nm, 499 nm, 512 nm, 495nm và 524 nm Dựa vào phổ hấp thụ của các phức màu chúng tôi nhận thấy có sự xen phủ rất lớn giữa phổ của các phức màu của các ion kim loại Vì vậy, không thể xác định riêng rẽ từng ion kim loại khi có mặt của các ion khác Sự xen phủ phổ của các nguyên tố này có thể giải quyết bằng cách sử dụng phương pháp mạng nơron nhân tạo để xác định đồng thời 5 ion trên Vì vậy, chúng tôi chọn dải bước sóng từ 450 – 600 nm cho các nghiên cứu tiếp theo
3.1.2 Ảnh hưởng của pH
5 ion kim loại nghiên cứu phản ứng với thuốc thử PAR cho phức màu có hệ
số hấp thụ phân tử phụ thuộc nhiều vào môi trường Tài liệu [30] cho thấy, phức của PAR với Cu2+, Ni2+ và Co2+ có thể tồn tại trong môi trường axit mạnh, tuy nhiên không xác định được tỉ lệ tạo phức rõ ràng và độ bền của phức kém Còn trong môi trường bazơ mạnh, các hằng số bền của phức nhỏ hơn hằng số bền của các hidroxit dẫn đến các ion kim loại bị kết tủa, làm ảnh hưởng tới kết quả khảo sát Do đó, chúng tôi tiến hành nghiên cứu các phản ứng xảy ra trong môi trường có pH khoảng
5 – 11 và dùng đệm borat thay đệm amoni để tránh tạo phức các kim loại với NH3
Khảo sát ảnh hưởng của pH tới sự tạo phức của từng cấu tử với thuốc thử PAR bằng cách khảo sát tại mỗi giá trị pH, chuẩn bị 7 dung dịch trong đó
Đo độ hấp thụ quang của các phức tại dải bước sóng từ 450 -600nm với dung dịch so sánh là các mẫu trắng tương ứng Mối quan hệ giữa cực đại hấp thụ với pH trong khoảng bước sóng từ 450 – 600nm được biểu diễn trên hình 11
Trang 37Hình 11: Sự phụ thuộc của độ hấp thụ quang các phức Co- PAR; Cu- PAR; Cd- PAR; Ni- PAR; Pb- PAR
Trang 38Kết quả khảo sát trên cho thấy, trong toàn dải phổ, giá trị pH càng cao thì độ hấp thụ quang càng lớn Tuy nhiên, nếu pH cao quá thì dẫn tới hiện tượng kết tủa hidroxit và độ hấp thụ quang của phức Pb2+ , Co2+ giảm Vì vậy, trong trường hợp này, chúng tôi chọn giá trị pH = 10 với đệm borat làm dung dịch đệm cho các thí nghiệm sau
3.1.3 Độ bền phức màu theo thời gian
Ở pH = 10, tốc độ hình thành phức Co – PAR; Ni – PAR; Cd – PAR; Pb – PAR; Cu – PAR tương đối chậm và ở nhiệt độ phòng, màu của các phức này đạt cực đại sau 10 – 30 phút tương ứng với phức Co – PAR; Ni – PAR; Cd – PAR; Pb – PAR; Cu – PAR Kết quả khảo sát thời gian hình thành các phức màu thu được ở hình 12:
Hình 12 : Sự phụ thuộc của độ hấp thụ quang của các phức Co- PAR; Cu-
PAR; Cd- PAR; Ni- PAR; Pb- PAR theo thời gian
Nhìn vào hình 12 , chúng tôi nhận thấy trong khoảng thời gian khảo sát 60 phút, độ hấp thụ quang của các phức màu rất ổn định (phức bền) Vì vậy chúng tôi chọn thời gian đo độ hấp thụ quang của các phức là 20 phút sau khi pha dung dịch 3.1.4 Ảnh hưởng của lượng thuốc thử dư đến khả năng tạo phức màu
Thuốc thử PAR là loại thuốc thử hữu cơ được sử dụng phổ biến trong phân tích trắc quang để xác định nồng độ các ion kim loại Thành phần phức của kim loại
Co, Cu, Cd, Ni, Pb và thuốc thử theo tài liệu tham khảo [30] là 1:2