DANH MỤC CÁC TỪ VIẾT TẮT Ultrasound/ Ultrasonography Siêu âm Ultrasound tomography Siêu âm cắt lớp Least squared error Lỗi bình phương nhỏ nhất Least Square Problem LSP Bài toán bình p
Trang 3LỜI CẢM ƠN
Trước tiên, tôi xin chân thành cảm ơn ThS Trần Quang Huy, người đã
hướng dẫn tận tình, giúp tôi hoàn thành khóa luận
Tôi xin chân thành cảm ơn các thầy giáo, cô giáo trong khoa Vật Lý trường Đại học Sư Phạm Hà Nội 2 đã giúp đỡ tôi trong suốt quá trình học tập
và làm khóa luận
Đặc biệt, tôi xin gửi lời cảm ơn sâu sắc tới PGS TS Trần Đức Tân,
Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Thầy đã giới thiệu thầy hướng dẫn tôi đến lĩnh vực siêu âm cắt lớp (một lĩnh vực còn rất mới và mang tính thời sự ở Việt Nam), và đã đóng góp nhiều ý kiến quí báu trong quá trình tôi hoàn thiện khóa luận
Đây là đề tài tôi dày công nghiên cứu cùng với thầy hướng dẫn, vì vậy, tôi hy vọng rằng, nó sẽ là tài liệu bổ ích cho những người quan tâm về lĩnh vực này, mọi chi tiết cần điều chỉnh, bổ xung xin liên hệ tới Trần Thị Duyên, tranduyensp2@gmail.com; 01649635884
Tôi xin cảm ơn bạn bè, người thân luôn cổ vũ, động viên, giúp đỡ tôi hoàn thành khóa luận
Hà Nội, tháng 5 năm 2015
Sinh viên
Trần Thị Duyên
Trang 4LỜI CAM ĐOAN Qua quá trình nghiên cứu khóa luận về đề tài: “Nghiên cứu các phương pháp toán học tiên tiến trong việc nâng cao chất lượng khôi phục ảnh y sinh” tôi đã tiếp cận được một trong những lĩnh vực đang được phát triển
mạnh mẽ, đó là Kĩ thuật Y Sinh Qua đây cũng giúp tôi bước đầu làm quen
với công việc nghiên cứu khoa học
Tôi xin cam đoan khóa luận này được hoàn thành do sự cố gắng tìm hiểu nghiên cứu của bản thân cùng với sự hướng dẫn chỉ bảo tận tình và hiệu quả
của ThS Trần Quang Huy cũng như các thầy cô giáo trong Khoa Vật lý,
Trường Đại học Sư phạm Hà Nội 2 Đây là đề tài không trùng với các đề tài
khác và kết quả đạt được không trùng với kết quả của các tác giả khác
Hà Nội, tháng 5 năm 2015
Sinh viên
Trần Thị Duyên
Trang 5DANH MỤC CÁC TỪ VIẾT TẮT
Ultrasound/ Ultrasonography Siêu âm
Ultrasound tomography Siêu âm cắt lớp
Least squared error Lỗi bình phương nhỏ nhất
Least Square Problem (LSP) Bài toán bình phương nhỏ nhất
Overdetermined System Hệ có số phương trình nhiều hơn số ẩn Underdetermined System Hệ có số phương trình ít hơn số ẩn Ill-posed problems Bài toán giả định sai
Well-posed problems Bài toán giả định đúng
Ill-conditioned matrix Ma trận điều kiện xấu
Born Iterative Method - BIM Phương pháp lặp Born
Distorted Born Iterative Method -
Forward problems Bài toán thuận
Inverse problems Bài toán ngược
Singular Value Decomposition
Trang 6DANH MỤC HÌNH VẼ
Hình 1.1: Đồ thị phương trình bậc nhất và các mẫu 11
Hình 2.1: Đồ thị mô tả 3 phương trình của hệ …24
Hình 3.1: Cấu hình hệ đo 35
Hình 3.2: Hàm mục tiêu lí tưởng 39
Trang 7MỤC LỤC
Trang
MỞ ĐẦU 1
Chương 1 Một số kiến thức toán cơ bản ứng dụng trong kĩ thuật siêu âm cắt lớp 4
1.1 Chuẩn ma trận, vectơ 4
1.1.1 Ma trận 4
1.1.2 Định thức của ma trận 5
1.1.2.1 Định nghĩa 5
1.1.2.2 Phương pháp tính định thức 6
1.1.3 Ma trận nghịch đảo 6
1.1.4 Chuẩn ma trận, vecto 7
1.1.4.1 Chuẩn của vecto 7
1.1.4.2 Chuẩn của ma trận 9
1.2 Phương pháp bình phương nhỏ nhất 11
1.3 Argument của một hàm 12
1.4 Bài toán giả định đúng và Bài toán giả định sai 12
1.5 Bài toán ngược 14
1.5.1 Giới thiệu chung 14
1.5.2 Khái niệm 14
1.5.3 Bài toán ngược 15
1.5.4 Bài toán ngược tuyến tính 15
1.5.5 Ví dụ (Trường hấp dẫn của trái đất) 16
Trang 81.6 Chuẩn tắc (Regularization) 19
1.7 Hiện tượng Overfitting 20
1.8 Hiện tượng Phase wrapping 20
Chương 2 Các phương pháp toán học nâng cao chất lượng khôi phục ảnh y sinh 21
2.1 Phương pháp Moo-PenPenrose Psedoinverse 21
2.2 Phương pháp Tikhonov regulazation 24
2.2.1 Khái niệm 24
2.2.2 Chuẩn tắc Tikhonov tổng quát 25
2.2.3 Liên quan đến phân tích giá trị đơn (SVD) và bộ lọc Wiener 26
2.2.4 Xác định hệ số Tikhonov 27
2.3 Phương pháp L1 regularation 28
2.3.1 -Regularized Least squares 28
2.3.2 -Regularized Least Squares 29
Chương 3: Mô phỏng và kết quả 34
3.1 Mô hình phương pháp lặp vi phân Born (DBIM) 34
3.2 Chi tiết tính toán phương pháp lặp vi phân Born (DBIM) 34
3.3 Các phương pháp toán học khôi phục ảnh và chương trình mô phỏng ……….37
3.4 Chương trình code của các thuật toán 37
3.4.1 Chương trình code của phương pháp Moo-PenPenrose Psedoinverse 37 3.4.2 Chương trình code của phương pháp Tikhonov regularization 38
3.4.3 Chương trình code của phương pháp L1 regularization 38
3.5 Kết quả mô phỏng 39
Trang 93.5.1 Mô phỏng sử dụng phương pháp Tikhonov 39
3.5.2 Mô phỏng sử dụng phương pháp L1 N2 = 484 40 3.5.3 Đánh giá kết quả sử dụng phương pháp Tikhonov và phương pháp L1……….41
3.6 Kết quả mô phỏng sử dụng phương pháp Tikhonov regularization.42 3.7 Kết quả mô phỏng sử dụng phương pháp L1 regularization 47 KẾT LUẬN 54 TÀI LIỆU THAM KHẢO 55
Trang 10MỞ ĐẦU
1 Lý do chọn đề tài
Kỹ thuật y sinh là một bộ môn khoa học ứng dụng dựa trên các nguyên
lý cơ bản trong kỹ thuật và các ý tưởng về thiết kế để đưa ra giải pháp trong y học, y sinh Kỹ thuật y sinh đã lấp đầy khoảng trống còn thiếu giữa các kỹ thuật máy móc và y dược học, nó là sự kết hợp của các thiết kế giúp giải quyết các vấn đề còn vướng mắc về phương pháp và kỹ thuật mà trước đây y học và sinh học chưa thể chạm đến, sự kết hợp này đã nâng cao khả năng chăm sóc sức khỏe, bao gồm công tác chẩn đoán, theo dõi, và điều trị Kỹ thuật y sinh là một lĩnh vực tương đối mới mẻ, đa phần các thành tựu đạt được chỉ mới dừng ở mức độ nghiên cứu, bao phủ nhiều lĩnh vực khác nhau: tin sinh học, chẩn đoán hình ảnh, xử lý hình ảnh, xử lý tín hiệu sinh lý học, cơ sinh học, vật liệu sinh học với kỹ thuật sinh học, phân tích hệ
thống, mô hình hóa 3 chiều …
Toán học được sử dụng trên khắp thế giới như một công cụ thiết yếu trong nhiều lĩnh vực, bao gồm khoa học, kỹ thuật, y học, và tài chính
Trong y học, chẩn đoán hình ảnh là một phương pháp chẩn đoán cho phép người bác sĩ có thể quan sát bằng hình ảnh các bộ phận của cơ thể một cách trực quan nhất Từ đó đưa ra các chẩn đoán chính xác của bệnh lý để có biện pháp điều trị hiệu quả Khoa học hỗ trợ cho kĩ thuật chẩn đoán hình ảnh chính là xử lý ảnh Chẳng hạn như trong các phương pháp: chụp X_quang, chụp cắt lớp CT, MRI, siêu âm,… Ảnh sau khi được tái tạo chưa thể rõ nét được, ảnh hưởng đến chất lượng, gây khó khăn cho việc chuẩn đoán bệnh Do vậy, mặc dù các thiết bị chụp y tế với công nghệ ngày càng nâng cao để hỗ trợ cho việc phân tích và xử lý thông tin từ ảnh nhưng vấn đề đặt ra cần phải giải quyết song song là việc nâng cao chất lượng ảnh – đây là một khâu quan trọng được coi là bước tiền xử lý cho bước tiếp theo là phân đoạn ảnh y học
Trang 11Hiện nay, tạo ảnh siêu âm là một công cụ an toàn, không bị iôn hoá để chẩn đoán lâm sàng So với phương pháp X-ray, MRI, … thì phương pháp siêu âm cắt lớp cho phép tạo ảnh có lợi thế hơn nhiều Hoạt động của nó dựa trên sự tán xạ ngược và có khả năng giải quyết những cấu trúc nhỏ hơn bước sóng của sóng tới, nó trái ngược với phương pháp tạo ảnh truyền thống sử dụng phương pháp phản hồi Một số tính chất vật liệu, như độ tương phản âm, mật độ, độ suy hao, được ứng dụng để tìm ra các đối tượng có kích thước nhỏ Hai phương pháp lặp Born (Born Iterative Method - BIM) và lặp vi phân Born (Distorted Born Iterative Method - DBIM) là hai phương pháp được cho
là tốt nhất hiện nay để tạo ảnh tán xạ
Vì vậy, sau một thời gian học tập và nghiên cứu, chúng tôi đã lựa chọn
và nghiên cứu đề tài:
“Nghiên cứu các phương pháp toán học tiên tiến trong việc nâng cao chất lượng khôi phục ảnh y sinh”
2 Mục đích nghiên cứu
Tìm hiểu các phương pháp toán học tiên tiến nhằm nâng cao chất lượng khôi phục ảnh y sinh, cụ thể là ảnh siêu âm cắt lớp
3 Giả thuyết khoa học
Nếu nắm được các phương pháp toán học tiên tiến thì đã bước đầu tiếp cận được việc nâng cao chất lượng khôi phục ảnh y sinh
3 Đối tượng và phạm vi nghiên cứu
- Đối tượng: Các phương pháp toán học tiên tiến ứng dụng trong y sinh
- Phạm vi nghiên cứu: Xử lí tín hiệu y sinh
4 Nhiệm vụ nghiên cứu
- Nghiên cứu một số kiến thức toán cơ bản ứng dụng trong khôi phục ảnh y sinh
Trang 12- Nghiên cứu các phương pháp toán học nâng cao chất lượng khôi phục ảnh y sinh
5 Phương pháp nghiên cứu
Sử dụng các phương pháp nghiên cứu lí thuyết kết hợp với mô phỏng
6 Cấu trúc luận văn
Chương 1: Một số kiến thức toán cơ bản ứng dụng trong kĩ thuật siêu âm cắt lớp
Chương 2: Các phương pháp toán học nâng cao chất lượng khôi phục ảnh y sinh
Chương 3: Mô phỏng và kết quả
Trang 13Chương 1: Một số kiến thức toán cơ bản ứng dụng trong kĩ thuật siêu âm
cắt lớp 1.1 Chuẩn ma trận, vectơ
1.1.1 Ma trận
Trong phần này, chúng tôi giới thiệu các khái niệm cơ bản về ma trận:
Ma trận vuông, ma trận đường chéo, ma trận đơn vị, ma trận tam giác trên,
ma trận tam giác dưới, ma trận chuyển vị
Ma trận vuông cấp n mà mọi phần tử nằm ngoài đường chéo chính bằng
0, tức là với được gọi là ma trận đường chéo Nếu ma trận
đường chéo có thì ta gọi A là ma trận đơn vị và ta thường ký hiệu là E
Trang 14Cho là một hoán vị của tập {1,2, ,n}.Ta xét tất cả các cặp trong đó Nếu thì ta gọi cặp là cặp ngƣợc, tức là các giá trị đƣợc sắp xếp ngƣợc với k, h Nếu trong số cặp ngƣợc là chẵn thì ta gọi là hoán vị chẵn, ngƣợc lại thì ta gọi là hoán vị lẻ
Với mỗi ma trận vuông A cấp n:
Định thức của ma trận còn đƣợc ký hiệu là:
Trang 15Với mỗi ma trận chữ nhật A cấp mxn bất kỳ ta có thể tính định thức của tất cả các ma trận con vuông cấp k, với Nếu tồn tại một
số r sao cho có một ma trận con cấp r có định thức khác 0, còn mọi ma trận
con vuông cấp lớn hơn r đều bằng 0 thì ta nói rằng r là hạng của ma trận A
Các phép biến đổi sơ cấp sau đây không làm biến đổi hạng của ma trận:
- Đổi chỗ 2 hàng hoặc 2 cột bất kỳ
- Nhân một hàng hay một cột bất kỳ với một số khác không
- Cộng các thành phần tương ứng của 2 hàng hoặc 2 cột bất kỳ Các phép biến đổi sơ cấp sẽ được sử dụng để tính định thức của ma trận và tìm nghiệm của hệ phương trình tuyến tính
Ma trận E được gọi là ma trận đơn vị cấp n nếu E là ma trận vuông cấp n và E có dạng:
[
]
1.1.2.2 Phương pháp tính định thức
Tính định thức bằng cách chuyển ma trận về dạng tam giác trên
Ta sẽ biến đổi để đưa ma trận A về dạng ma trận tam giác trên:
Trang 16Trong đó: E là ma trận đơn vị Có thể chứng minh rằng để thỏa mãn điều kiện trên thì bắt buộc phải là ma trận vuông, và ma trận đảo nếu tồn tại là duy nhất
Điều kiện tồn tại của ma trận nghịch đảo: Ma trận vuông A cấp n có ma
trận nghịch đảo khi và chỉ khi
1.1.4 Chuẩn ma trận, vecto
1.1.4.1 Chuẩn của vecto
Cho vecto , chuẩn của kí hiệu là ‖ ‖ đƣợc định nghĩa là một số không âm thỏa mãn các tính chất sau:
Trang 17‖ ‖ (∑‖ ‖
)
Với ta được các dạng chuẩn Manhattan, Euclide và
chuẩn cực đại, tương ứng theo thứ tự đó
Với , hàm khoảng cách này không thỏa bất đẳng thức tam giác nên nó không phải là một chuẩn
Trang 18Tương tự ở trên, lưu ý rằng , đều không phải là chuẩn
Chuẩn khác
Kết hợp các dạng chuẩn trên, ta có thể có nhiều dạng chuẩn mới Chẳng hạn:
‖ ‖ | | √ | | | | | | cũng là một dạng chuẩn
Trường hợp đặc biệt:
Với thì chuẩn toán tử trở thành chuẩn cực đại theo cột:
‖ ‖ ∑ | |
Trang 19
để tìm chuẩn này, ta cộng giá trị tuyệt đối của các phần tử trong cùng một cột, sau đó lấy kết quả lớn nhất
Với , chuẩn toán tử trở thành chuẩn cực đại theo dòng:
Áp dụng một cách trực tiếp chuẩn-p của vecto đối với từng phần
tử của ma trận, ta được loại chuẩn tương đối trực quan này
‖ ‖ (∑ ∑| |
√ √∑
với A* là ma trận conjugate transpose của A, là tổng các phần tử trên đường chéo chính của và là các singular value của A
Để ý sự tương tự giữa √ và công thức chuẩn Euclide của vecto √
Trang 20Chuẩn Schatten
Để đơn giản, chúng ta xét một ví dụ cụ thể sau: Cho n mẫu , tìm phương trình đường thẳng (có dạng của phương trình bậc nhất) thỏa mãn các mẫu cho trước đó
Giả sử phương trình thỏa mãn các mẫu cho trước có dạng y = ax + b Trong đó, x là đại lượng mà ta muốn ước tính, y là các phép đo sử dụng các sensors (chính là các mẫu), b là nhiễu hay lỗi của phép đo (giá trị của b thường rất nhỏ) Đồ thị phương trình bậc nhất và các mẫu được thể hiện trên hình vẽ:
Hình 1.1: Đồ thị phương trình bậc nhất và các mẫu
Lỗi bình phương nhỏ nhất E được định nghĩa như sau:
Trang 21Arg min, được viết tắt từ argument of the minimum, và được kí hiệu:
1.4 Bài toán giả định đúng và bài toán giả định sai
Bài toán giả định đúng được đề xướng bởi Jacques Hadamard Ông cho rằng, mô hình toán học của hiện tượng vật lí có các tính chất sau:
+ Tồn tại một giải pháp
Trang 22+ Giải pháp là duy nhất
+ Hoạt động của giải pháp thay đổi liên tục theo điều kiện ban đầu Các ví dụ về bài toán giả định đúng bao gồm bài toán Dirichlet cho phương trình Laplace, phương trình nhiệt với điều kiện ban đầu xác định Đây
có thể được xem như các bài toán „tự nhiên‟ mà các quá trình vật lí được mô hình bởi bài toán này
Các bài toán không phải là bài toán giả định đúng theo đúng ý nghĩa của Hadamard được định nghĩa bài toán giả định sai Bài toán ngược (Inverse problem) thường là bài toán giả định sai Ví dụ, phương trình nhiệt nghịch đảo, có thể suy luận được sự phân bố nhiệt độ trước đó từ dữ liệu cuối cùng, không phải là bài toán giả định đúng vì giải pháp này có sự nhạy cao với sự thay đổi ở dữ liệu cuối cùng
Thông thường, mô hình liên tục phải được rời rạc hóa để có thể tính toán bằng phương pháp số (numerical solution) Trong khi các giải pháp có thể liên tục tương ứng với điều kiện ban đầu, chúng có thể gặp phải tính không ổn định số khi được giải quyết với độ chính xác có hạn, hoặc với lỗi trong dữ liệu Ngay cả với bài toán giả định đúng, nó vẫn có thể xảy ra điều kiện yếu (ill-conditioned), nghĩa là khi có lỗi nhỏ trong dữ liệu ban đầu có thể gây ra lỗi lớn hơn nhiều trong dữ liệu thu được Bài toán điều kiện xấu được biểu thị bởi số điều kiện lớn
Nếu bài toán là giả định đúng, thì giải pháp có thể thực hiện tốt trên máy tính sử dụng giải thuật ổn định (stable algorithm) Nếu bài toán là giả định sai, chúng ta cần tính toán lại để điều trị số (numerical treatment) Đặc biệt, vấn đề này bao gồm các giả định bổ sung, chẳng hạn như độ mượt của giải pháp (smoothness of solution) Quá trình này được biết như là Chuẩn tắc (regularization) Chuẩn tắc Tikhonov là một trong những giải pháp được sử dụng rộng rãi nhất cho bài toán giả định sai tuyến tính
Trang 231.5 Bài toán ngược
1.5.1 Giới thiệu chung
Bài toán ngược được sử dụng để biến đổi phép đo quan sát thành thông tin về đối tượng hoặc hệ thống vật lí Ví dụ, nếu chúng ta có phép đo về trường hấp dẫn của trái đất, thì chúng ta có thể đặt câu hỏi rằng: “nếu chúng
ta có dữ liệu, chúng ta có thể nói gì về sự phân bố mật độ của trái đất ở khu vực đó?” Giải pháp đối với vấn đề này (tức là, phân bố mật độ phù hợp với
dữ liệu nhất) là rất cần thiết bởi vì nó chỉ cho chúng ta biết về tham số vật lí
mà chúng ta không thể quan sát trực tiếp Vì vậy, bài toán ngược là một trong những bài toán được nghiên cứu sâu và quan trọng nhất trong khoa học và toán học Bài toán ngược phát triển trong nhiều ngành, bao gồm, thị lực máy tính, xử lí ngôn ngữ tự nhiên, học máy, thống kê, luận thống kê, địa lí, tạo ảnh
y sinh (chẳng hạn như chụp cắt lớp điện toán, EEG/ERP), viễn thám, siêu âm cắt lớp đại dương, kiểm tra không phá hủy, thiên văn học, vật lí và nhiều lĩnh vực khác
1.5.2 Khái niệm
Bài toán ngược có thể được xây dựng như sau
Dữ liệu → Tham số mô hình
Bài toán ngược được xem xét là “ngược” đối với bài toán thuận, nó liên quan tham số mô hình đối với dữ liệu mà chúng ta quan sát:
Tham số mô hình → Dữ liệu
Sự biến đổi từ dữ liệu đến tham số mô hình (hoặc ngược lại) là kết quả của sự tương tác của hệ thống vật lí với đối tượng mà chúng ta quan tâm đến tính chất của nó
Bảng dưới đây chỉ ra một số ví dụ hệ thống vật lí, phương trình chi phối, đại lượng vật lí mà chúng ta quan tâm và những gì chúng ta thực sự quan sát
Trang 24Hệ thống vật lí Phương trình chi
phối
Đại lượng vật lí
Dữ liệu quan sát
Trường hấp dẫn của
trái đất
Định luật vạn vật hấp dẫn của Niutơn Mật độ Trường hấp dẫn
Từ trường của trái đất
(ở bề mặt)
Phương trình Maxwell Độ cảm từ Từ trường
Sóng địa chấn (do
động đất) Phương trình sóng
Tốc độ sóng (mật độ)
là toán tử thuận, toán tử quan sát hay hàm quan sát Trong bối cảnh chung nhất, G đại diện cho phương trình chi phối mà nó liên quan đến tham số mô hình đối với dữ liệu quan sát
1.5.4 Bài toán ngược tuyến tính
Trong trường hợp bài toán ngược tuyến tính rời rạc, mà nó mô tả hệ thống tuyến tính, d (dữ liệu) và m (mô hình tốt nhất) là vectơ, và bài toán có thể được biểu diễn như sau:
Trong đó: G là ma trận (toán tử), thường được gọi là ma trận quan sát
Trang 251.5.5 Ví dụ (Trường hấp dẫn của trái đất)
Chỉ có một số ít hệ thống vật lí thực sự là tuyến tính với tham số mô hình Một hệ thống như vậy thuộc lĩnh vực địa vật lí là trường hấp dẫn trái đất Trường hấp dẫn trái đất được xác định bởi sự phân bố mật độ của trái đất
ở bên dưới bề mặt Vì khối thạch của trái đất thay đổi khá đáng kể, chúng ta
có thể quan sát sự khác biệt theo phút của trường hấp dẫn trái đất trên bề mặt trái đất Từ sự hiểu biết về lực hấp dẫn (tức là, định luật vạn vật hấp dẫn của Niutơn), biểu diễn toán học của lực hấp dẫn là
Trong đó a là phép đo của gia tốc trọng trường địa phương, K là hằng
số hấp dẫn, M là khối lượng địa phương (nó liên quan đến mật độ) của khối
đá ở bên dưới bề mặt và r là khoảng cách từ khối lượng đến điểm quan sát
Bằng việc rời rạc phương trình trên, chúng ta có thể tìm được mối liên
hệ giữa quan sát dữ liệu rời rạc trên bề mặt trái đất với tham số mô hình rời rạc (mật độ) ở bên dưới bề mặt mà chúng ta quan tâm Ví dụ, xem xét trường hợp chúng ta có 5 phép đo ở bề mặt trái đất Trong trường hợp này, véctơ dữ liệu của chúng ta d, nó là một véctơ cột có kích thước 5x1 Chúng ta cũng biết rằng, có 5 khối lượng chưa biết ở bên dưới bề mặt (nó không thực tế nhưng được dùng để chứng minh khái niệm) Vì vậy, ta có thể xây dựng hệ thống tuyến tính, liên quan đến 5 khối lượng chưa biết, đối với 5 điểm dữ liệu như sau:
Trang 26
[ ]
[ ]
Tuy nhiên, không phải tất cả các ma trận vuông có thể đảo được (G hầu như không bao giờ có thể đảo được) Bởi vì chúng ta không được đảm bảo là
có đủ thông tin để xác định một giải pháp duy nhất đối với các phương trình
đã cho trừ khi chúng ta có các phép đo độc lập (tức là mỗi phép đo cho biết thông tin duy nhất về hệ thống) Quan trọng là, trong hầu hết các hệ thống vật
lí, chúng ta chưa từng có đủ thông tin để hạn chế một giải pháp duy nhất, bởi
vì ma trận quan sát không chứa các phương trình duy nhất Từ quan điểm của đại số tuyến tính, ma trận G bị khuyết hạng (tức là có giá trị riêng bằng 0), nghĩa là nó không thể đảo được Hơn nữa, nếu chúng ta bổ sung thêm các quan sát vào ma trận (tức là thêm số phương trình), thì ma trận G không còn vuông nữa Thậm chí khi đó, chúng ta không được đảm bảo có ma trận quan sát hạng đầy đủ Do đó, hầu hết các bài toán ngược được xem là underdeterminded, tức là ta không có giải pháp duy nhất cho bài toán ngược Nếu ta có hệ thống hạng đầy đủ, thì giải pháp có thể là duy nhất Hệ thống overdetermined (số phương trình nhiều hơn số biến) lại là một vấn đề khác
Trang 27Vì chúng ta không thể đảo trực tiếp ma trận quan sát, nên ta sử dụng các phương pháp của lí thuyết tối ưu để giải bài toán ngược Để làm vậy, ta xác định một mục tiêu, hay còn được gọi là hàm mục tiêu cho bài toán ngược Mục tiêu là một hàm đo mức độ phù hợp (tương đồng, sát) của dữ liệu dự kiến từ mô hình khôi phục với dữ liệu quan sát Trong trường hợp, chúng ta
có dữ liệu hoàn hảo (tức là không có nhiễu) và hiểu biết về vật lí hoàn hảo (tức là chúng ta biết về vật lí), thì dữ liệu khôi phục phù hợp với dữ liệu quan sát một cách hoàn hảo Hàm mục tiêu chuẩn, , thông thường có dạng:
‖ ‖Biểu thức trên biểu diễn chuẩn L2 của sự không phù hợp (misfit) giữa
dữ liệu quan sát và dữ liệu dự kiến từ mô hình Chúng ta sử dụng chuẩn L2 ở đây như là một phép đo tổng quát về khoảng cách giữa dữ liệu quan sát và dữ liệu dự kiến, tuy nhiên, các chuẩn khác cũng có thể sử dụng Mục đích của hàm mục tiêu là tối thiểu sự sai khác giữa dữ liệu dự kiến và dữ liệu quan sát
Để tối ưu hàm mục tiêu (tức là giải bài toán ngược), ta tính toán gradient của hàm mục tiêu, sử dụng lí do tương tự như khi ta muốn tối thiểu hàm chỉ có một biến Gradient của hàm mục tiêu được tính bởi:
Trong đó GT là ma trận chuyển vị của G Dạng đơn giản của phương trình này là:
Sau khi biến đổi, ta thu được:
Phương trình trên được biết là phương trình thông thường và cho chúng
ta một giải pháp đối với bài toán ngược Nó tương ứng với bài toán bình phương nhỏ nhất
̂
Trang 28Ngoài ra, chúng ta luôn biết rằng dữ liệu của chúng ta có những biến động ngẫu nhiên, được gây bởi nhiễu ngẫu nhiên, hoặc tồi tệ hơn là nhiễu kết hợp (coherent noise) Trong bất kì trường hợp nào, sai số ở dữ liệu quan sát sẽ tạo ra sai số ở tham số mô hình khôi phục, mà chúng ta thu được bằng cách giải bài toán ngược Để tránh các sai số này, chúng ta muốn hạn chế các giải pháp có thể để nhấn mạnh các đặc điểm có thể nhất định trong mô hình của chúng ta Loại hạn chế này được gọi là chuẩn tắc (Regularization)
1.6 Chuẩn tắc (Regularization)
Chuẩn tắc, trong toán học, thống kê và đặc biệt trong lĩnh vực học máy (machine learning) và bài toán ngược, đề cập đến quá trình giới thiệu thông tin bổ sung để giải quyết bài toán giả định sai và tránh hiện tượng overfitting Thông thường, thông tin này ở dạng penalty của độ phức tạp, chẳng hạn như các hạn chế của độ mượt (smoothness) hoặc đường bao trong chuẩn không gian vector
Việc chứng minh lí thuyết của chuẩn tắc là, nó cố gắng sử dụng
Occam’s razor vào giải pháp Từ quan điểm Bayesian, nhiều kĩ thuật chuẩn
tắc tương ứng việc vận dụng phân bố ưu tiên xác định vào các tham số mô hình
Ý tưởng tương tự cũng được phát triển trong nhiều lĩnh vực khoa học
Ví dụ, phương pháp bình phương nhỏ nhất có thể được xem như là một dạng rất đơn giản của chuẩn tắc Một dạng đơn giản của chuẩn tắc được ứng dụng đối với phương trình tích phân, gọi là chuẩn tắc Tikhonov, về bản chất là sự thỏa hiệp giữa phù hợp dữ liệu và giảm mức chuẩn của giải pháp Gần đây,
các phương pháp chuẩn tắc không tuyến tính, cụ thể là Total variation
regularization đã trở nên phổ biến
Trang 291.7 Hiện tượng Overfitting
Trong lĩnh vực thống kê và học máy, hiện tượng overfitting xảy ra khi
mô hình thống kê mô tả sai số ngẫu nhiên hoặc nhiễu thay vì mối quan hệ cơ bản Thông thường, overfitting xảy ra khi mô hình quá phức tạp, chẳng hạn như có quá nhiều tham số liên quan đến số quan sát (number of observations)
Mô hình có hiện tượng overfitting thường có hiệu suất kém, vì nó có thể
phóng đại sự dao động nhỏ trong dữ liệu
1.8 Hiện tượng Phase wrapping
Pha tức thời và tần số tức thời là hai khái niệm quan trọng trong lĩnh vực xử lí tín hiệu, nó xảy ra khi biểu diễn và phân tích các hàm thay đổi theo thời gian Pha tức thời của hàm giá trị phức s(t) là hàm giá trị thực
[ ] Đối với hàm giá trị thực s(t), nó được xác định
[ ] Khi φ(t) bị hạn chế trong khoảng (-π, π] khoảng [0, 2π), nó được gọi là hiệu ứng wrapped phase Ngược lại, gọi là hiệu ứng unwrapped phase, nó là hàm liên tục của t
Trang 30Chương 2: Các phương pháp toán học nâng cao chất lượng khôi phục
ảnh y sinh 2.1 Phương pháp Moo-PenPenrose Psedoinverse
Giả sử chúng ta cần giải một hệ phương trình tuyến tính, với số phương trình nhiều hơn ẩn số
Phương trình tổng quát của hệ thống có dạng:
⃗ ⃗ chúng ta cần tìm ⃗⃗⃗ nếu biết A và ⃗
Trong đó: ⃗ là một vector; ⃗⃗⃗⃗ là một vector; A là một ma trận
Phương trình tổng quát của hệ thống còn được viết dưới dạng:
Trang 31Vì vậy, ta tiến hành giải nhƣ sau:
⃗ ⃗ ⃗ ⃗ ⃗ ⃗ ⃗ ⃗ trong đó, đƣợc tính là:
Trang 32Viết lại hệ phương trình dưới dạng ma trận, ta có:
[
]
⏟ ⃗ ⃗ Tìm pseudoinversecủa ma trận A
[ ] Kiểm tra
[
] [
] [ ]
Sử dụng phương pháp Pseudoinverse, tính gần đúng phương trình:
⃗ ⃗⃗⃗⃗
⃗ ⃗ ⃗ ⃗
[ ] [
] [
]
[ ] [
] kiểm tra kết quả và thu được
Vậy kết quả của hệ phương trình đã cho là:
Trang 33[ ] [
]
Ta chú ý rằng, phương pháp Moore-Penrose Pseudoinverse giải quyết các bài toán về mặt lỗi bình phương tối thiểu (Least Squared Error) Nói chung, không có giải pháp chính xác cho các bài toán có số phương trình nhiều hơn
ẩn số “overdetermined system”
Dưới đây là đồ thị mô tả 3 phương trình của hệ và giải pháp PenrosePseudoinverse
Moore-Hình 2.1: Đồ thị mô tả 3 phương trình của hệ
2.2 Phương pháp Tikhonov regulazation
2.2.1 Khái niệm
Chuẩn tắc Tikhonov, được đặt tên bởi Andrey Tikhonov, là phương pháp được sử dụng phổ biến nhất của chuẩn tắc cho bài toán giả định sai
Trong thống kê, phương pháp này được gọi là ridge regression Chúng ta xem
xét bài toán giả định sai, có dạng như sau:
,