1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phát triển một số giải thuật xử lý mù tín hiệu và ứng dụng

125 26 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 125
Dung lượng 2,11 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CÁC T Ừ VIẾT TẮT AP Assignment Problem Bài toán phân công việc BSP Blind Signal Processing Xử lý mù tín hiệu BSS Blind Source Separation Phân tách mù nguồn tin BASS Blind Audio Source Se

Trang 1

=============

VƯƠNG HOÀNG NAM

Hà Nội -2012

Trang 2

B Ộ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

=============

LUẬN ÁN TIẾN SỸ KỸ THUẬT VIỄN THÔNG

Người hướng dẫn khoa học:

Hà N ội -2012

Trang 3

L ời cam đoan

Tác giả xin cam đoan đây là công trình nghiên cứu riêng của tác giả, không sao chép của bất kỳ người nào Các số liệu kết quả nêu trong luận án là hoàn toàn trung thực và chưa từng được công bố bởi bất kỳ ai

Tác giả

Trang 4

L ời cảm ơn

Tôi xin chân thành cảm ơn PGS.TS Nguyễn Quốc Trung và PGS.TSKH

Trần Hoài Linh những người đã nhiệt tình hướng dẫn và giúp đỡ tôi rất nhiều trong quá trình nghiên cứu và hoàn thành Luận án

Cũng xin chân thành cảm ơn Viện Sau Đại học, Viện Điện tử -Viễn thông, Trường Đại học Bách Khoa Hà nội đã tạo điều kiện thuận lợi để tôi hoàn thành nhiệm vụ nghiên cứu của mình

Tôi cũng bày tỏ lòng biết ơn đến Ba mẹ, các anh chị em, đồng nghiệp và bạn

bè những người đã ủng hộ và động viên giúp đỡ tôi trong thời gian làm Luận án

Trang 5

M ỤC LỤC

DANH MỤC CÁC HÌNH VẼ

DANH MỤC CÁC BẢNG

KÝ HI ỆU TOÁN HỌC

CÁC T Ừ VIẾT TẮT

MỞ ĐẦU 1

1 Mục đích nghiên cứu 1

2 Những giới hạn trong các nghiên cứu của luận án 2

3 Phương pháp nghiên cứu 3

4 Cấu trúc luận án 3

5 Ý nghĩa khoa học và thực tiễn 4

CH ƯƠNG 1 CƠ SỞ LÝ THUYẾT BÀI TOÁN XỬ LÝ MÙ 5

1.1 Bài toán phân tách mù nguồn tin 5

1.2 Mô hình BSS tuyến tính 9

1.2.1 Giới thiệu 9

1.2.2 Phương pháp Phân tích thành phần độc lập 10

 Phương pháp ICA sử dụng tính phi Gauss 12

 Phương pháp ICA sử dụng thông tin hỗ tương 18

 Phương pháp ICA sử dụng tính phi tương quan phi tuyến 19

 Phương pháp ICA sử dụng thống kê bậc cao 20

1.2.3 Thuật toán FastICA 20

 Quá trình tiền xử lý 20

 Xấp xỉ hóa negentropy 22

 Thuật toán FastICA 23

1.3 Mô hình BSS trộn chập 26

1.3.1 Giới thiệu 26

1.3.2 Phương pháp TD-ICA 27

1.3.3 Phương pháp FD-ICA 28

1.3.4 Thuật toán Fast-ICA phức 32

1.4 Phương pháp đánh giá chất lượng phân tách 33

1.4.1 Đánh giá chất lượng phân tách mô hình BSS tuyến tính 33

Trang 6

1.4.2 Đánh giá chất lượng phân tách mô hình BSS trộn chập 34

1.5 Kết luận 37

CH ƯƠNG 2 ỨNG DỤNG THUẬT TOÁN FAST-ICA TRONG BSS TUYẾN TÍNH 38

2.1 Minh họa thuật toán FastICA 38

2.2 Ứng dụng FastICA để loại bỏ nhiễu trong tín hiệu điện tim ECG 41

2.4 Thuật toán IP-FastICA 46

2.5 Kết luận 53

CH ƯƠNG 3 PHÂN TÁCH MÙ ÂM THANH TRONG MIỀN THỜI GIAN 54

3.1 Giới thiệu 54

3.2 Quá trình sai số dự báo chuỗi tốt nhất 54

3.3 Thuật toán đề xuất 57

3.3.1 Quá trình xác định các IP 57

3.3.2 Quá trình khôi phục tín hiệu 58

3.3.3 Thuật toán đề xuất 61

3.4 Các kết quả mô phỏng 62

3.5 Kết luận 65

CHƯƠNG 4 PHÂN TÁCH MÙ ÂM THANH TRONG MIỀN TẦN SỐ 65 4.1 Giới thiệu 66

4.2 Phương pháp sử dụng hướng góc tới DOA 68

4.2.1 Một số khái niệm cơ bản 68

4.2.2 Giải quyết bài toán bất định vị trí bằng phương pháp DOA 72

4.2.3 Ưu, nhược điểm của phương pháp DOA 77

4.3 Ph ương pháp sử dụng tính chất tương quan chéo 77

4.4 Phương pháp sử dụng bài toán phân công việc 78

4.4.1 Giới thiệu phương pháp 78

4.4.2 Thủ tục kiểm tra 81

Trang 7

4.4.3 Thuật toán Hungarian 82

4.5 Thuật toán đề xuất kết hợp DOA và AP 84

4.6 Thuật toán ICA 86

4.7 Các kết quả mô phỏng 87

4.7.1 Kết quả mô phỏng thuật toán AP 87

4.7.2 Kết quả mô phỏng thuật toán DOAP 94

4.8 Kết luận 97

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI 98

TÀI LIỆU THAM KHẢO 101

CÁC CÔNG TRÌNH KHOA HỌC 110

Trang 8

DANH SÁCH CÁC HÌNH V Ẽ

Hình 1-1 Mô hình bài toán BSS tổng quát

Hình 1-2 Mô hình giải quyết bài toán BSS

Hình 1-3 Minh họa xử lý mù bài toán cocktail

Hình 1-4 Mô hình đánh giá BSS tuyến tính

Hình 1-5 Hàm mật độ xác suất của phân bố Gauss

Hình 1-6 Hàm mật độ của phân bố Laplace

Hình 1-7 Phân bố đều

Hình 1-8 Minh họa định lý giới hạn trung tâm

Hình 1-9 Sự phân bố chung của các thành phần độc lập s và 1 s 2

Hình 1-10 Mật độ của một thành phần độc lập phân bố đều

Hình 1-11 Sự phân bố chung của x và 1 x 2

Hình 1-12 Mật độ phân bố của các tín hiệu trộn

Hình 1-13 Minh họa thu âm thanh trong thực tế

Hình 1-14 Minh họa TD-ICA với N = 2

Hình 1-15 Sự phụ thuộc chất lượng của FD-ICA và độ rộng hàm cửa sổ

Hình 1-16 Minh họa phương pháp FD-ICA

Hình 1-17 Minh họa phương pháp đánh giá bằng so sánh ảnh phổ

Hình 2-1 Lưu đồ thuật toán FastICA

Hình 2-2 Tín hiệu nguồn ban đầu

Hình 2-3 Tín hiệu trộn

Hình 2-4 Những tín hiệu được ước lượng theo phương pháp ICA

Hình 2-5 Ảnh viễn thám ở băng 4

Hình 2-6 Ba thành phần độc lập (IC1, IC2 và IC3)

Hình 2-7 (a)-ECG, (b)-nhiễu gián đoạn, (c)-nhiễu liên tục

Hình 2-8 Tín hiệu ECG có nhiễu (SNR=5dB)

Trang 9

Hình 2-9 Tín hiệu ECG đã loại bỏ nhiễu (trên) và tín hiệu nhiễu (dưới)

Hình 2-10 Mối liên hệ giữa ρ và M khi d = 1

Hình 2-11 Kết quả mô phỏng 1

Hình 2-12 Ma trận đặc tính P của kết quả mô phỏng 1

Hình 2-13 Ảnh gốc trong mô phỏng 2

Hình 2-14 Ảnh trộn trong mô phỏng 2

Hình 2-15 Ảnh được khôi phục trong mô phỏng 2

Hình 3-1 Quá trình xây dựng các tín hiệu thu từ các IP

Hình 3-2 Minh họa bộ lọc Wiener

Hình 3-3 Kết quả thực nghiệm với hàm G 3

Hình 3-4 Mô phỏng thuật toán với CSDL của Dr.Te Won Lee

Hình 3-5 Mô phỏng thuật toán với CSDL của tác giả Shiro Ikeda

Hình 4-1 Vị trí tọa độ giữa micro và nguồn âm

Hình 4-2 Minh họa về khoảng hở

Hình 4-3 Minh họa mảng microphone ULA

Hình 4-4 Minh họa vị trí giữa micro và nguồn

Hình 4-5 Minh họa giản đồ phương hướng

Hình 4-6 Minh họa giản đồ phương hướng tại các bin tần số f và 1 f 2

Hình 4-7 Minh họa khoảng cách KL giữa các bin tần số liền kề

Hình 4-8 Minh họa ứng dụng AP trong bài toán bất định vị trí với N =2

Hình 4-9 Minh họa tiêu chuẩn đánh giá độ tin cậy của phương pháp DOA

Hình 4-10 Mô phỏng tách CSDL của Dr.Te Won Lee bằng thuật toán AP

Hình 4-11 Cấu hình phòng thu âm dùng để mô phỏng

Hình 4-12 Các hàm đáp ứng xung của phòng thu không độ vang

Hình 4-13 Các tín hiệu nguồn ban đầu trong môi trường thu không độ vang Hình 4-14 Các tín hiệu thu trong môi trường thu không độ vang

Hình 4-15 Các tín hiệu phân tách bằng phương pháp sử dụng JADE-FastICA

Trang 10

Hình 4-16 Giá trị RT60 của phòng thu có độ vang

Hình 4-17 Hàm đáp ứng xung của phòng thu có độ vang

Hình 4-18 Các tín hiệu thu trong phòng thu có độ vang

Hình 4-19 Kết quả phân tách tín hiệu bằng phương pháp AP

Hình 4-20 Kết quả phân tách tín hiệu bằng phương pháp DOAP

Hình 4-21 So sánh kết quả phân tách tín hiệu giữa DOAP và DOA+CC

Hình 4-22 Cấu hình phòng thu trong thực nghiệm của Dr.Sawada

Hình 4-23 Các tín hiệu nguồn và tín hiệu thu được tại các microphone

Hình 4-24 Kết quả phân tách sử dụng phương pháp DOAP

Hình 4-25 Kết quả phân tách sử dụng thuật toán của Dr.Prasad

Bảng 4-1.Quan hệ giữa chất lượng phân tách và độ rộng cửa sổ

Bảng 4-2 So sánh thời gian tính toán giữa hai thuật toán

Bảng 4-3 So sánh giá trị SIR trung bình giữa hai thuật toán

Trang 12

CÁC T Ừ VIẾT TẮT

AP Assignment Problem Bài toán phân công việc BSP Blind Signal Processing Xử lý mù tín hiệu

BSS Blind Source Separation Phân tách mù nguồn tin BASS Blind Audio Source Separation Phân tách mù nguồn âm thanh

DOA Direction of Arrival Hướng góc tới

DP Directional Pattern Giản đồ phương hướng ECG Electrocardiagram Tín hiệu điện tâm đồ

FD-ICA Frequency Domain ICA Phương pháp ICA trong miền

tần số FFT Fast Fourier Transform Biến đổi Fourier

HA Hungarian Algorithm Thuật toán Hungary

HRTF Head Related Transfer Function Hàm truyền đạt thính

giác người ICA Independent Component

Trang 13

PI Performance Index Chỉ số chất lượng

PSNR Peak Signal to Noise Ratio Tỷ số Tín hiệu đỉnh trên

Tạp âm

RT Reverberation Time Thời gian phản hồi độ vang RT60 Reverberation Time 60 dB Thời gian phản hồi độ vang 60

dB SIR Signal to Interference Ratio Tỷ số Tín hiệu - Tạp âm STFT Short Time Fourier Transform Biến đổi Fourier thời gian ngắn TD-ICA Time Domain ICA Phương pháp ICA trong miền

thời gian ULA Uniform Linear Array Mảng (microphone) tuyến tính

đồng nhất

Trang 15

MỞ ĐẦU

1 Mục đích nghiên cứu

Tổng quan các nghiên cứu trong và ngoài nước như sau

Ngoài nước:

Trong khoảng 20 năm trở lại đây, xử lý mù tín hiệu Blind Signal Processing

(BSP) là một lĩnh vực khá mới mẻ thu hút được rất nhiều sự quan tâm nghiên cứu của các nhà khoa học và đã đạt được một số thành tựu nhất định, mở ra hướng phát triển trong tương lai Vấn đề xử lý mù tín hiệu mà điển hình là bài toán phân tách

mù nguồn tin Blind Source Separation (BSS) là bài toán tìm nguồn tín hiệu ban đầu

thông qua việc phân tích đánh giá các tín hiệu ở cảm biến đầu ra, trong khi không biết hoặc biết rất ít thông tin về quá trình truyền đạt (quá trình trộn) Dựa trên đặc tính kênh truyền, bài toán BSS có thể được chia thành hai mô hình xử lý: mô hình

trộn tuyến tính và mô hình trộn chập

Kể từ khi khái niệm BSS được giới thiệu vào năm 1988 bởi J.Herault và C.Jutten [17] đến nay bài toán BSS đã được ứng dụng đa dạng trong các lĩnh vực của đời sống cũng như trong các phân tích khoa học Trên thực tế, chủ yếu các ứng dụng

của mô hình bài toán tuyến tính được dùng trong y sinh học hay xử lý ảnh…, còn đại đa số các trường hợp là mô hình bài toán trộn chập như của âm thanh, của sóng điện từ trong viễn thông hay các phân tích trong quân sự, địa trắc học Đặc biệt bài toán BSS ngày nay còn được ứng dụng rất nhiều trong công nghiệp trong việc phán đoán các sự cố của máy móc mà không cần tác động

Các thuật toán BSS trộn chập có thể được phân chia theo hai nhóm phương pháp: phương pháp miền tần số và phương pháp miền thời gian Phương pháp miền thời gian sẽ đạt kết quả tốt nếu thuật toán hội tụ tuy nhiên nhược điểm chính của phương pháp này là khối lượng tính toán rất lớn do việc xử lý liên quan đến toán tử tích chập Để giải quyết trở ngại này, hướng tiếp cận miền tần số được đưa ra do khi chuyển tín hiệu từ miền thời gian sang miền tần số, chúng ta sẽ không gặp toán tử tích chập Điều đó dẫn tới so với phương pháp miền thời gian, phương pháp miền

tần số sẽ giảm được khối lượng tính toán và cho chất lượng tốt trong trường hợp các

bộ lọc trộn dài hơn Tuy nhiên các phương pháp miền tần số có nhược điểm là phải

giải quyết bài toán bất định vị trí trong miền tần số [14, 18, 36-38, 41, 42, 57, 66,

67, 70, 74] Có rất nhiều thuật toán được đưa ra nhằm giải quyết vấn đề này, chẳng

hạn các thuật toán sử dụng đánh giá hướng góc tới hoặc sử dụng sự tương quan giữa các bin tần số (frequency bin) liền nhau Tuy nhiên các thuật toán này thường không

thực sự bền vững Đối với ứng dụng trong tách mù âm thanh BASS (Blind Audio

Source Separation), các thuật toán miền tần số thường bị giới hạn kết quả phân tách

Trang 16

do giả thiết độc lập tương hỗ giữa các tín hiệu thường bị hạn chế trong các tín hiệu băng hẹp Trong khi các thuật toán miền thời gian thường khó hội tụ trong điều kiện thu âm thực có độ vang Do đó các thuật toán BASS thường chỉ cho kết quả tốt trong một số điều kiện nhất định và bị hạn chế trong các điều kiện khác Chính vì vậy đây vẫn được xem là vấn đề mở đang được tiếp tục nghiên cứu trong BASS

Trong nước:

Không nằm ngoài xu hướng phát triển công nghệ của thế giới, hiện nay trong nước cũng có một số giới hạn các nhóm nghiên cứu triển khai các đề tài và công trình nghiên cứu khoa học có liên quan đến lĩnh vực xử lý tín hiệu mù ứng dụng trong lĩnh vực y sinh học và xử lý ảnh [4, 52] Tuy nhiên trên thực tế số lượng các công trình nghiên cứu trong nước về lĩnh vực này, đặc biệt là xử lý mù âm thanh, được công bố là rất ít và đây vẫn được xem là một hướng nghiên cứu còn khá mới

mẻ

Mục tiêu nghiên cứu của luận án

Mục tiêu là nghiên cứu và phát triển một số giải thuật phân tách mù nguồn tín

hiệu và ứng dụng Mục tiêu của luận án này là nghiên cứu và phát triển một số giải thuật phân tách mù cho cả mô hình tuyến tính (ứng dụng trong xử lý tín hiệu y sinh

học) và mô hình trộn chập (ứng dụng trong xử lý âm thanh)

Các vấn đề cần giải quyết của luận án

Luận án tập trung nghiên cứu và phát triển một số giải thuật phân tách mù nguồn tín hiệu nhằm nâng cao chất lượng phân tách Đối với mô hình BSS tuyến tính là sự nghiên cứu, tìm tòi để áp dụng mô hình này vào các ứng dụng trong thực tiễn Đối

với mô hình BSS trộn chập, luận án tập trung vào ứng dụng BASS trong đó chủ yếu các thuật toán trong miền tần số FD-ICA Phương pháp FD-ICA là một trong những phương pháp tiêu biểu để giải quyết bài toán BASS Một ưu điểm nổi trội của FD-ICA là cách tiếp cận đơn giản hơn TD-ICA Thay vì giải quyết mô hình bài toán tách chập mù phức tạp, phương pháp này đưa ra cách thức giải quyết đơn giản hơn trên nhiều bài toán con (tại các bin tần số) mô hình tuyến tính Tuy nhiên phương pháp này cũng tồn tại một số mặt hạn chế cần giải quyết:

• Bài toán bất định về vị trí và năng lượng tại từng bin tần số

• Sự giới hạn của chất lượng phân tách

• Sự phụ thuộc vào giá trị khởi tạo của thuật toán ICA

• Chất lượng phân tách không đồng đều tại các bin tần số

Những hạn chế trên được xem là vấn đề mở đang được tiếp tục nghiên cứu trong phương pháp miền tần số

2 Những giới hạn trong các nghiên cứu của luận án

Trang 17

Trong luận án, mô hình BSS với giả thiết số nguồn tín hiệu bằng số sensor và về

mặt lý thuyết, mô hình được xây dựng không bị giới hạn số nguồn tín hiệu Đối với

mô hình xử lý âm thanh, phần mô phỏng được thực hiện với trường hợp số nguồn

âm thanh (số microphone) bằng 2 Ngoài ra, trong mô hình này các tín hiệu nhiễu là không đáng kể (mô hình không có nhiễu) vì trong thực tế, chúng ta có thể sử dụng các bước hậu xử lý lọc nhiễu để loại bỏ các tín hiệu không mong muốn (nhiễu, can nhiễu từ các nguồn âm khác) trong tín hiệu đã được phân tách

3 Phương pháp nghiên cứu

- Phương pháp mô hình hóa và tính toán được áp dụng để phân tích và giải quyết các vấn đề hạn chế còn tồn tại trong BSS

- Phương pháp mô phỏng cũng được sử dụng để tìm ra các quy luật và giá trị tối

ưu nhằm nâng cao, cải thiện chất lượng phân tách tín hiệu

4 Cấu trúc luận án

Luận án được chia thành 4 chương có nội dung như sau

Chương 1: Trình bày tổng quan cơ sở lý thuyết của BSS và ICA, trong đó phương

pháp ICA (cụ thể là thuật toán FastICA và FastICA phức) là công cụ chính được áp

dụng để phát triển các thuật toán BSS trong các phần tiếp theo Ngoài ra, chương này cũng giới thiệu ngắn gọn về hai phương pháp chủ yếu để giải quyết bài toán phân tách

mù âm thanh là TD-ICA và FD-ICA cũng như một số tham số dùng để đánh giá chất lượng phân tách

Chương 2: Chương này cũng đưa ra một số ứng dụng của thuật toán FastICA trong

BSS tuyến tính gồm một phương pháp loại bỏ nhiễu cho tín hiệu ECG và một thuật toán có tên gọi IP-FastICA được sử dụng hiệu quả trong trường hợp các tín hiệu gốc ban đầu có sự tương quan thời gian

Chương 3: Chương này nghiên cứu về phương pháp phân tách mù nguồn âm thanh

trong miền thời gian bằng thuật toán FastICA dựa trên khái niệm sai số dự báo chuỗi tốt nhất

Chương 4: Nghiên cứu về phân tách mù nguồn âm thanh trong miền tần số sử dụng

thuật toán FastICA phức Các thuật toán trong miền tần số khác nhau chủ yếu ở cách giải quyết bài toán bất định vị trí tại các bin tần số Chương 4 trình bày các phương pháp sử dụng hướng góc tới của nguồn âm (DOA), sử dụng sự tương quan chéo (CC) và bài toán phân công việc (AP) để giải quyết sự bất định vị trí tại các bin tần số Bên cạnh đó một thuật toán hiệu quả sử dụng kết hợp cả hai phương pháp DOA và AP (thuật toán DOAP) được đề xuất

Trang 18

5 Ý nghĩa khoa học và thực tiễn

Bài toán BSS nói chung được ứng dụng đa dạng trong các lĩnh vực của đời sống cũng như trong các phân tích khoa học Trên thực tế, chủ yếu các ứng dụng của mô hình bài toán tuyến tính được dùng trong y sinh học hay xử lý ảnh…, còn đại đa số các trường hợp là mô hình bài toán trộn chập như của âm thanh, của sóng điện từ trong viễn thông hay các phân tích trong quân sự, địa trắc học Đặc biệt bài toán BASS được đi sâu nghiên cứu trong khuôn khổ luận án có nhiều ứng dụng cụ thể:

Lo ại bỏ nhiễu cho điện thoại di động/máy trợ thính

Chúng ta có thể ứng dụng BASS để loại bỏ các tín hiệu nhiễu không mong muốn trong một môi trường thu âm thực đa đường, và do đó BASS được ứng dụng loại nhiễu trong điện thoại di động, máy trợ thính, hệ thống nhận dạng tiếng nói hay các ứng dụng ghi âm khác

Mã hóa âm nh ạc

Mỗi nhạc cụ có âm sắc, chu kỳ và đặc trưng thời gian khác nhau cũng như đòi hởi băng thông truyền dẫn khác nhau Việc phân tích một tín hiệu âm nhạc thành các đối tượng âm (nhạc cụ) khác nhau sẽ cho các mức độ mã hóa và nén khác nhau đối

với từng nhạc cụ phụ thuộc vào các đặc tính của chúng Điều đó cho phép xây dựng

một bộ mã hóa/giải mã hóa âm thanh hiệu quả và chất lượng cao

xử lý mù để xử lý âm thanh thu tại các microphone cho phép chúng ta phân tách được thông tin tiếng nói của từng đối tượng thu được để phân tích và xử lý

Mã hóa: Các tín hiệu cần mã hóa được trộn với nhiều tín hiệu làm nhiễu trước khi được mã hóa Bộ mã hóa sẽ phân tách mù để thu nhận tín hiệu mong muốn

Trang 19

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT BÀI TOÁN XỬ LÝ

Vấn đề xử lý mù tín hiệu mà điển hình là bài toán phân tách mù nguồn tin Blind

Source Separation (BSS) được phát triển trong khoảng 20 năm gần đây Trong các phương pháp giải quyết bài toán BSS thì phương pháp phân tích thành phần độc lập

Independent Component Analysis (ICA) là phương pháp được sử dụng phổ biến nhất do những ưu điểm của nó Trong chương này, chúng ta sẽ xem xét mối liên hệ giữa BSS và ICA, đồng thời nghiên cứu sự phát triển phương pháp ICA cho các mô hình bài toán khác nhau

1.1 Bài toán phân tách mù ngu ồn tin

Phân tách mù nguồn tín hiệu (BSS) là một phương pháp được sử dụng phổ biến cho mục đích đánh giá các nguồn tín hiệu ban đầu chỉ thông qua các tín hiệu thu được ở tại các bộ cảm biến đầu ra, mà không cần biết đến đặc tính hàm truyền đạt của kênh truyền Mô hình toán học đơn giản của bài toán BSS tuyến tính như sau:

Nếu gọi s=(s s1, 2, ,s N)Tlà một vectơ ngẫu nhiên, trong đó mỗi thành phần được xem là một nguồn tín hiệu gốc ban đầu, và x=(x x1, 2, ,x M)Tlà vectơ tín hiệu thu tại các bộ cảm biến được xác định bởi phương trình

x= As (1.1)

Hình 1- 1 Mô hình bài toán BSS tổng quát

trong đóA là một ma trận trộn đặc trưng cho đặc tính truyền đạt của kênh truyền

Khi đó nhiệm vụ của bài toán BSS là phải xác định một ma trận W , được gọi là

ma trận tách, khi đó y Wx = là các tín hiệu nguồn được khôi phục

Trang 20

Hình 1- 2 Mô hình giải quyết bài toán BSS

Để minh họa cho bài toán BSS, ta xây dựng bài toán xử lý mù nguồn âm thanh (bài toán tiệc Cocktail) như sau:

Hình 1- 3 Minh họa xử lý mù bài toán cocktail

Giả sử trong một phòng tiệc Cocktail có N nguồn âm thanh ( tiếng nói, tiếng nhạc

cụ,…) được thu bởi M microphone Trong trường hợp này, ta không biết cụ thể các nguồn âm thanh cũng như đặc tính truyền đạt của phòng (độ trễ, kết cấu phòng, hiệu ứng tiếng vọng …), khi đó bài toán BSS được áp dụng như sau: khôi phục lại các nguồn âm thanh ban đầu chỉ dựa vào các tín hiệu đã thu được từ các microphone

Trang 21

Trong BSS tín hiệu không nhất thiết phải là âm thanh mà có thể là hình ảnh hay bất

kỳ loại tín hiệu nào khác, và quá trình trộn có thể là tức thời, chập, tuyến tính hay phi tuyến Bài toán BSS được ứng dụng trên đa dạng các lĩnh vực của đời sống cũng như trong các phân tích khoa học Một số ứng dụng chủ yếu của mô hình bài toán tuyến tính được dùng trong xử lý tín hiệu y sinh học (ảnh cộng hưởng từ, tín hiệu điện não đồ, điện tâm đồ) hay trong xử lý ảnh… còn đại đa số các trường hợp là

mô hình bài toán trộn chập như của âm thanh, của sóng điện từ trong viễn thông hay các phân tích trong quân sự, địa trắc học…[6]

Dựa trên đặc tính kênh truyền và mối tương quan giữa số lượng microphone và số lượng nguồn âm thanh, bài toán BSS có thể được chia thành nhiều mô hình riêng Dưới đây là một số mô hình đặc trưng với nhiều mức độ phức tạp khác nhau nhưng đều rất có ý nghĩa cả trong lý thuyết và thực tế:

• Mô hình tuyến tính (mô hình tức thời) nghĩa là tín hiệu thu được tại microphone sẽ là tổ hợp tuyến tính của các tín hiệu nguồn ngay tại thời điểm đó:

• Mô hình trộn chập: tín hiệu thu được tại microphone bao gồm tín hiệu tức

thời của các nguồn phát và các tín hiệu thu được qua phản xạ, tán xạ (hiện tượng trễ, đa đường và tiếng vọng)

• Trường hợp M <N (underdetermined case): với số nguồn nhiều hơn số cảm

biến Đây là trường hợp bài toán khó

Trang 22

• Trường hợp M >N (overdetemined case): với số nguồn ít hơn số cảm biến

Hầu hết các công trình nghiên cứu ban đầu trong lĩnh vực phân tách nguồn mù dựa trên mô hình tuyến tính và sau này mở rộng cho mô hình trộn chập với giả thiết

số lượng nguồn tín hiệu không ít hơn số lượng các sensor Trong thực tế, mặc dù các ứng dụng của BSS chủ yếu là mô hình trộn chập tuy nhiên vai trò của mô hình BSS tuyến tính cũng rất quan trọng vì đó là những tiền đề để phát triển cho mô hình

Trong những năm gần đây, một trong những ứng dụng của BSS trộn chập được nghiên cứu và phát triển mạnh mẽ là bài toán phân tách mù âm thanh [14, 18, 36-

38, 41-42, 48-50, 57-61, 65-67] Giới hạn nghiên cứu trong luận án với các giả thiết được đưa ra trong bài toán phân tách mù âm thanh như sau:

 Hàm đáp ứng phòng thu là bất biến, tương đương với nguồn âm thanh và microphone cố định

 Không có nhiễu (hoặc nhiễu không đáng kể)

 Các tín hiệu nguồn là độc lập và mỗi tín hiệu nguồn được sinh ra từ một quá trình ngẫu nhiên phân bố đồng nhất và độc lập (i.i.d - independent and

Trang 23

cùng phức tạp Các thuật toán BSS trộn chập có thể được phân chia theo hai nhóm phương pháp dựa trên ICA: phương pháp miền tần số FD-ICA và phương pháp

miền thời gian TD-ICA

Phương pháp miền thời gian sẽ đạt kết quả tốt nếu thuật toán hội tụ tuy nhiên nhược điểm chính của phương pháp này là khối lượng tính toán rất lớn do việc xử

lý liên quan đến toán tử tích chập do đó thường khó hội tụ trong điều kiện thu âm

thực có độ vang

Để giải quyết trở ngại này, hướng tiếp cận miền tần số được đưa ra do khi chuyển tín hiệu từ miền thời gian sang miền tần số, chúng ta sẽ không gặp toán tử tích chập Điều đó dẫn tới so với phương pháp miền thời gian, phương pháp miền tần số sẽ

giảm được khối lượng tính toán và cho chất lượng tốt trong trường hợp các bộ lọc

trộn dài hơn Tuy nhiên các phương pháp miền tần số có nhược điểm là phải giải quyết bài toán bất định vị trí trong miền tần số Có rất nhiều thuật toán được đưa ra nhằm giải quyết vấn đề này, chẳng hạn các thuật toán sử dụng đánh giá hướng góc tới (DOA) hoặc sử dụng sự tương quan giữa các bin tần số liền nhau (CC) Tuy nhiên các thuật toán này thường không thực sự bền vững, chẳng hạn phương pháp DOA thường gặp khó khăn khi các nguồn âm có hướng tới gần nhau Do đó các thuật toán phân tách mù âm thanh thường chỉ cho kết quả tốt trong một số điều kiện nhất định và bị hạn chế trong các điều kiện khác Chính vì vậy đây vẫn được xem là vấn đề mở đang được tiếp tục nghiên cứu nhằm nâng cao chất lượng phân tách

1.2 Mô hình BSS tuy ến tính

1.2.1 Giới thiệu

Việc đánh mô hình dữ liệu trong BSS tuyến tính thường được thực hiện bằng cách xây dựng một hàm mục tiêu rồi thực hiện cực đại (cực tiểu) hóa hàm này Các phương pháp BSS khác nhau thường được phân biệt bởi cách xây dựng hàm mục tiêu cũng như thuật toán tối ưu được sử dụng [6,10,12,15,17,43-45,73,75,76,80] Điều đó có thể diễn đạt điều này qua công thức (1.6):

Phương pháp BSS = Hàm mục tiêu + Thuật toán tối ưu (1.6)

Các thuộc tính của phương pháp BSS phụ thuộc vào cả hai thành phần vế phải của (1.6) như sau:

• Các thuộc tính thống kê, đặc trưng của phương pháp BSS phụ thuộc vào cách

chọn lựa hàm mục tiêu

• Các thuộc tính giải thuật (tốc độ hội tụ, khối lượng tính toán, bộ nhớ đòi

hỏi…) phụ thuộc vào thuật toán tối ưu

Hai lớp thuộc tính này là độc lập Điều đó có nghĩa các thuật toán tối ưu khác nhau có thể được sử dụng cho chỉ một hàm mục tiêu, hoặc một thuật toán tối ưu

Trang 24

có thể được dùng cho các hàm mục tiêu khác nhau Để đưa ra được hàm mục tiêu ta phải sử dụng các đặc trưng nào đó của các tín hiệu nguồn Trong luận án này chủ yếu sử dụng tính độc lập hỗ tương giữa các nguồn tín hiệu với giả thiết tín hiệu từ các nguồn khác nhau được xem là độc lập thống kê với nhau Đây được xem là phương pháp phổ biến và thành công nhất trong lĩnh vực BSS [6,73] và sẽ được trình bày trong phần tiếp theo

Hình 1- 4 Mô hình đánh giá BSS tuyến tính

1.2.2 Phương pháp Phân tích thành phần độc lập

Trước khi trình bày phương pháp ICA , chúng ta đưa ra một số định nghĩa cơ bản

Ký hiệu s s1, 2, ,s là m m ột số biến ngẫu nhiên với hàm phân bố mật độ xác suất chung f s s( 1 , 2 , ,s m) Để đơn giản hóa, các biến này được giả thiết có trị trung bình

bằng 0 Các biến s i được xem là độc lập thống kê với nhau nếu hàm mật độ xác suất thỏa mãn:

f s s( 1 , 2 , ,s m)= f1( ) ( )s1 f2 s2 f m( )s m (1.7) trong đó f i( )s i là ký hiệu mật độ phân bố lề của s Chú ý r i ằng khái niệm độc lập cần được phân biệt với khái niệm bất tương quan Hai biến s s i, j

được định nghĩa là bất tương quan nếu thỏa mãn điều kiện sau:

E s s{ }i jE s E s{ }i { }j =0 ∀ ≠ (1.8) i j

Hai biến ngẫu nhiên s s i, j

được xem là độc lập thì cần phải thỏa mãn:

Tín hiệu tách

Điều chỉnh

W

Hàm tối ưu [J=f(W,y)]

Trang 25

E g s g{ 1( )i 2( )s j }−E g s{ 1( )i }E g{ 2( )s j }=0 ∀ ≠ (1.9) i j

với g và 1 g là nh2 ững hàm biến đổi phi tuyến xác định được Do đó theo định nghĩa trên, khái niệm bất tương quan chỉ là một trường hợp riêng của khái niệm độc lập Độc lập nhìn chung là một thủ tục mạnh hơn so với bất tương quan, độc lập đưa đến bất tương quan, nhưng bất tương quan không thể đưa đến độc lập

Tiếp theo chúng ta đưa ra định nghĩa về ICA Ở đây chỉ xét đến trường hợp tuyến tính cho dù các dạng phi tuyến của ICA cũng tồn tại và được nghiên cứu Ký hiệu

Định nghĩa trên được xem là định nghĩa tổng quát nhất không cần có các điều kiện ràng buộc về dữ liệu

M ột số bất định trong mô hình ICA tuyến tính

• Không thể xác định lại được chính xác năng lượng ban đầu của của các nguồn tín hiệu ban đầu do cả sA đều không biết:

A thì mô hình ICA tuyến tính không thay đổi

Phương pháp ICA có một số cách tiếp cận phổ biến: phương pháp sử dụng tính Gauss [6-8], sử dụng thông tin hỗ tương (mutual information) [15], sử dụng tính phi tương quan phi tuyến (nonlinear decorrelation) [17], thống kê bậc cao (higher order

phi-statistics) [45]

Trang 26

Phương pháp ICA sử dụng tính phi Gauss

Đây là cơ sở của thuật toán FastICA được sử dụng trong luận án Phương pháp này

sử dụng các khái niệm phân bố xác suất Gauss và phi Gauss được định nghĩa như sau:

Phân bố Gauss: (hay còn gọi là phân bố chuẩn) là một phân bố xác suất cực kỳ quan

trọng trong nhiều lĩnh vực Đây là họ phân bố hình chuông có hình dạng xác định bởi tham số kỳ vọng µ và phương sai σ2 Một biến ngẫu nhiên X có kỳ vọng µ và phương sai σ2được xem là có phân bố Gauss nếu có hàm mật độ xác suất được xác định bởi:

Hàm mật độ xác suất của phân bố Gauss có dạng chuông như hình 1-5, trong đó hàm

có trung bình µ = 0 và phương sai 2

1

σ = là hàm phân bố Gauss chuẩn

Hình 1-5 Hàm mật độ xác suất của phân bố Gauss

Các loại phân bố xác suất không phải Gauss được gọi là phân bố xác suất phi Gauss Các phân bố phi Gauss được chia thành super-Gauss và sub-Gauss

Trang 27

Phân bố super-Gauss: Hàm phân bố dạng super-Gauss là hàm phân bố mật độ xác

suất có độ nhọn hơn phân bố Gauss, điều đó có nghĩa là giá trị các mẫu tập trung nhiều hơn xung quanh giá trị trung bình Một ví dụ điển hình của super-Gauss là phân bố Laplace công thức như sau

Phân bố sub-Gauss: Hàm phân bố dạng sub-Gauss có phân bố xác suất tù (dẹt) hơn

phân bố Gauss Điều đó có nghĩa hàm phân bố này có sự phân bố đồng đều hơn tại mọi giá trị biến Một ví dụ minh họa cho phân bố sub-Gauss là phân bố đều:

Trang 28

Hình 1-7 Phân b ố đều

Nguyên lý thực hiện phương pháp ICA sử dụng tính phi-Gauss dựa trên định lý giới hạn trung tâm: “ Hàm phân bố của tổng nhiều biến ngẫu nhiên độc lập luôn có xu

hướng hội tụ tới phân bố Gauss ”

Tín hi ệu quan sát được = a1.IC1 + a2.IC2 + … + an.ICn

Tiến tới Gauss phi Gauss phi Gauss phi Gauss

Hình 1-8 Minh h ọa định lý giới hạn trung tâm

Định lý chỉ ra rằng nếu x i i, = 1,N, là tổ hợp tuyến tính của các tín hiệu nguồn , 1,

j

s j= N, thì các tín hiệu thu x s i ẽ có tính Gauss hơn bản thân các nguồn tín hiệu gốc

j

s , và ngược lại s j sẽ có tính phi Gauss hơn x i

Để minh họa cho định lý giới hạn trung tâm, chúng ta xét ví dụ sau đây:

Giả sử có 2 tín hiệu x t1( ) và x t2( ) là 2 tín hiệu trộn tuyến tính thu được từ 2 tín hiệu nguồn độc lập hỗ tương s t1( ) và s t2( )có phân bố đều:

Trang 29

Hình 1-9 S ự phân bố chung của các thành phần độc lập s1 và s2

Trong trường hợp này s t1( ) và s t2( )được xem là hai tín hiệu độc lập với nhau Điều này thể hiện ở chỗ với một điểm xác định s=(s s1, 2) từ giá trị của s ta không th1 ể đoán được giá trị của s 2 và ngược lại Hay nói cách khác các giá trị s t1( ) và s t2( ) độc

lập với nhau Hình 1-10 thể hiện phân bố của s t1( ) và s t2( ) có tính phi Gauss Gauss) gần với phân bố đơn vị Hình 1-11 cho thấy phân bố x t1( ) và x t2( )là tổ hợp tuyến tính của hai nguồn s t1( ) và s t2( ) Từ hình minh họa, ta thấy các tín hiệu trộn ( )

trộn có sự tương quan với nhau hơn các tín hiệu gốc

s2 (t)

s1 (t)

Trang 30

Hình 1-10.M ật độ của một thành phần độc lập phân bố đều

(đường nét đứt biểu diễn phân bố Gauss)

Hình 1-11 S ự phân bố chung của x1 và x2

Trên hình 1-12, x và 1 x có phân b2 ố rất gần với phân bố Gauss (được thể hiện bằng nét đứt) Điều đó thể hiện tín hiệu sau trộn sẽ có tính Gauss hơn so với tín hiệu ban đầu

và minh chứng cho định lý giới hạn trung tâm được nêu ở trên

Hình 1-12 M ật độ phân bố của các tín hiệu trộn

Khi đó mục tiêu của phương pháp ICA sử dụng tính phi Gauss sẽ là tìm một ma trận tách 11 12

Trang 31

có tính phi Gauss cực đại, khi đó tín hiệu tách y=(y y1, 2)Tsẽ là các đánh giá của các tín hiệu nguồn ban đầu Vấn đề còn lại là ta phải xây dựng một hàm đo được tính phi Gauss của tín hiệu để thực hiện việc tối ưu Các hàm sử dụng đo tính phi Gauss gồm có

kurtosis và negentropy được định nghĩa trong phần tiếp theo

Kurtosis: là tên gọi của mômen bậc 4 của một biến ngẫu nhiêny trị thực,

bố sub-Gauss Điều này có nghĩa là nếu thực hiện cực đại hóa trị tuyệt đối kurtosis của các tín hiệu tách chúng ta sẽ thu được các thành phần độc lập

Negentropy:

Trở ngại lớn nhất của phương pháp sử dụng kurtosis là phương pháp này chịu ảnh hưởng của các outlier Theo định nghĩa trong thống kê, outlier là các mẫu có giá trị cực (lớn) so với các mẫu khác còn lại trong biến quan sát Do kurtosis được tính toán dựa trên giá trị các mẫu nên khi trong biến quan sát xuất hiện các outlier sẽ làm thay đổi giá

trị kurtosis dẫn đến việc không phản ánh đúng bản chất tín hiệu Do đó một phép đo khác tin cậy hơn được sử dụng để đo tính phi Gauss của tín hiệu là hàm negentropy Negentropy của một tín hiệu được xác định như sau:

Đầu tiên khái niệm entropy của một tín hiệu được định nghĩa Entropy là khái niệm

cơ bản của lý thuyết thông tin Entropy của một biến ngẫu nhiên được liên hệ tới lượng thông tin mà tín hiệu đó đưa ra Tín hiệu càng “ngẫu nhiên”, ví dụ các giá trị không dự đoán được và không cấu trúc được, thì entropy càng lớn Entropy H của biến ngẫu nhiên y với mật độ phân bố p y( ) được xác định như sau:

H y( )= −∫p y( )logp y dy( ) (1.18)

Lý thuyết xác suất đã chứng minh đối với một tín hiệu có trị trung bình bằng 0 và phương sai đơn vị thì phân bố xác suất Gauss luôn có tính ngẫu nhiên nhất (tương ứng

Trang 32

entropy lớn nhất) so với các loại phân bố xác suất khác Điều đó dẫn đến việc có thể sử

dụng entropy như là một phép đo tính Gauss (hoặc phi Gauss) của một biến ngẫu nhiên

bất kỳ Định nghĩa negentropy J y( ) của một biến y ngẫu nhiên như sau:

J y( )=H y( gauss)−H y( ) (1.19) trong đó H là hàm entropy, y gauss là một biến ngẫu nhiên phân bố xác suất Gauss có cùng ma trận hiệp phương sai với biếny

Negentropy nhận giá trị bằng 0 khi và chỉ khi biếnycó phân bố xác suất Gauss và luôn nhận giá trị dương khi y có phân bố xác suất khác

Phương pháp ICA sử dụng thông tin hỗ tương

Khái niệm thông tin hỗ tương được xem là một phép đo tốt về về sự phụ thuộc thống

kê [15] Nếu s=(s s1, 2, ,s m)Tthì thông tin hỗ tương giữa các biến thành phần được định nghĩa như sau:

Trang 33

Giả thiết các tín hiệu tách là độc lập thống kê và không tương quan Đồng thời các

tín hiệu này có phương sai đơn vị, ta sẽ có:

{ }T

E yy = ⇒ I

WE xx{ }T W T = ⇒I det( )W det(E xx{ }T )det( )W T =1 (1.24)

Điều đó có nghĩa det W( ) phải là hằng số do det(E xx{ }T ) không phải là một hàm

của W Từ đó thuật toán có quy tắc tối ưu như sau:

( ) 1 { ( ) }

W WE φ Wx x

∆ ∝ + (1.25) trong đó φ( ). là một hàm phi tuyến thích hợp [15]

Qua đó, có thể thấy tương tự như phương pháp sử dụng tính phi Gauss chúng ta có

thể sử dụng các đại lượng đo tính độc lập khác nhau (thông tin hỗ tương, khoảng cách

Kullback-Leibler, ước lượng hợp lý cực đại…) để thực hiện ICA

Phương pháp ICA sử dụng tính phi tương quan phi tuyến

Nếu giả sử có hai biến ngẫu nhiên y y và hai hàm 1, 2 f y( ) ( )1 ,g y2 trong đó tối thiểu

một hàm là phi tuyến tính Khi đó y y s1, 2 ẽ phi tương quan phi tuyến với nhau nếu:

E f u{ ( ) ( )1 g u2 }=0 (1.26)

Khái niệm phi tương quan phi tuyến được xem là một tiêu chuẩn đo tính độc lập

thống kê Hai biến y y 1, 2 được coi là độc lập thống kê nếu:

E f u{ ( ) ( )1 g u2 }=E f u{ ( )1 }E g u{ ( )2 }=0 (1.27)

Để đáp ứng tiêu chuẩn này, các hàm f g, được chọn là hàm lẻ và y y ph1, 2 ải có hàm

mật độ xác suất đối xứng Mục tiêu của phương pháp gồm hai bước: i) cách chọn f g,

để đáp ứng (1.27) và ii) cách phi tương quan phi tuyến hai biến Phần tiếp theo, chúng

ta sẽ minh họa phương pháp này thông qua thuật toán Hérault-Jutten [17]:

Đối với trường hợp BSS 2x2, Hérault-Jutten đưa ra một mạng hồi tiếp để tách tín

hiệu như sau:

Trang 34

Hérault và Jutten hiệu chỉnh m12,m 21

để giảm sự tương quan phi tuyến

m12 =ηf y g y( ) ( )1 2 (1.30) ∆m21=ηf y( ) ( )2 g y1 (1.31) Trong đó các hàm phi tuyến được chọn là ( ) 3 ( ) 1( )

f y =y g y = − y

Phương pháp ICA sử dụng thống kê bậc cao

Tác giả J.F Cardoso et al.[45] sử dụng thông tin thống kê bậc cao thông qua

cummulant bậc 4 để thực hiện ICA (thuật toán JADE) Giả thiết x=(x1, ,x N)T là một vector ngẫu nhiên có trị trung bình bằng 0, khi đó cummulant bậc 4 được xác định:

Thuật toán này được đề xuất bởi A.Hyvarinen trong [6-8] sử dụng tính chất phi Gauss

của các nguồn tín hiệu ban đầu Điểm chính của thuật toán này là tốc độ hội tụ rất nhanh so với các thuật toán ICA khác (vì vậy có tên là FastICA), với chất lượng phân tách được xem như tương đương [6] Thuật toán này được ứng dụng cho mô hình BSS tuyến tính (dữ liệu giá trị thực) gồm 3 bước: tiền xử lý dữ liệu, xấp xỉ hoá negentropy

và tối ưu hoá hàm xấp xỉ negentropy

 Quá trình ti ền xử lý

Quy tâm

Để không làm mất tính tổng quát, có thể giả thiết rằng cả các biến trộn và các thành

phần độc lập đều có trị trung bình bằng 0 Giả thiết này làm đơn giản hóa cả lý thuyết

và thuật toán rất nhiều Nếu các tín hiệu xử lý có trị trung bình khác 0, ta sẽ thể thực hiện quá trình tiền xử lý, gọi là phép quy tâm tức trừ giá trị các biến được khảo sát cho trị trung bình của chúng:

x new= −x E x{ } (1.34)

Tr ắng hóa

Trang 35

Với các biến ngẫu nhiên, ta có thể đơn giản biến đổi tuyến tính chúng thành các biến

bất tương quan bằng phương pháp phân tích thành phần chính PCA (Pricipal

Component Analysis) [6], quá trình này được gọi là “trắng hóa” dữ liệu Như vậy PCA được xem là một quá trình tiền xử lý tín hiệu trước khi ta thực hiện phương pháp ICA Quá trình trắng hoá thực chất là một phép biến đổi tuyến tính z=Vx Trong đó x

dữ liệu cần làm trắng hóa, V là ma trận trắng hoá, z là dữ liệu đã trắng hoá Quá trình được thực hiện như sau:

Giả thiết x = As có trị trung bình bằng 0 và { }T

E ss = Gọi I DE là các ma trận trị riêng và vector riêng của ma trận hiệp phương sai của x thông qua sự phân ly trị riêng, ta có:

{ }T T

xx

R = E xx = EDE (1.35) Khi đó 1/2 1/2 T

Mặc dù vậy, quá trình trắng hóa có tác dụng như một bước tiền xử lý trong phương pháp ICA Lợi ích của quá trình này trong thực tế đó là ma trận trộn mới B=VA là trực giao do:

{ }T { }T T T T

E zz = =I BE ss B =BIB =BB (1.39)

Có nghĩa là chúng ta có thể giới hạn việc tìm kiếm ma trận trộn trong không gian ma trận trực giao Thay vì phải ước lượng thông số của ma trận trộn ban đầu A, ta chỉ cần ước lượng một ma trận trực giao B Trong không gian nhiều chiều, một ma trận trực giao chỉ bao gồm một nửa thông số của một ma trận bất kỳ Như vậy có thể nói rằng

Trang 36

quá trình trắng hóa đã giải quyết được một nửa vấn đề của ICA Vì trắng hóa là một qui trình chuẩn và rất đơn giản, đơn giản hơn nhiều so với bất kỳ thuật toán ICA nào, đó là

một giải pháp rất tốt để giảm bớt sự phức tạp của bài toán

Vai trò của quá trình trắng hoá

Với một tín hiệu đã trắng hóa z, nhiệm vụ còn lại của ICA là tìm ra một vector w sao

( ) { ( ) } { ( ) } 2

J y ≈E G yE G γ  (1.41) trong đó γ là một biến ngẫu nhiên có phân bố Gaussian chuẩn (có trung bình bằng 0 và phương sai đơn vị), G{}. là một hàm phi tuyến tính được chọn trong 3 hàm sau:

( ) { ( ) } { ( ) } 2

J w z ≈   E G w zE G γ  

  (1.43) đạt cực đại, với điều kiện ràng buộc 2

1

Trang 37

 Thu ật toán FastICA

Đây là một thuật toán tiêu biểu của phương pháp ICA bằng cực đại hoá tính phi Gauss Ta nhận thấy hàm negentropy của w z T đạt cực đại khi giá trị của hàm

( )

{ T }

E G w z tối ưu Theo phương pháp Lagrangian, hàm { ( )T }

E G w z tối ưu với điều kiện ràng buộc 2

Do các đặc trưng của bài toán ICA, nên ta có thể tính nghịch đảo của ma trận Hessian một cách dễ dàng

F E zz g w z{ T '( )T } I

∂ (1.48) với g ' là đạo hàm cấp 2 của hàm G Vì dữ liệu đã trắng hoá nên:

Trang 38

E zg w z w w

E g w z

β β

E g w z

β β

Để khắc phục, các vector , 1,2, ,w i i = N được trực giao hoá bằng phương pháp trực giao hoá Gram-Schmidt Thuật toán FastICA đối với dữ liệu đã trắng hoá được thực hiện theo các bước sau:

1 Chọn m là số nguồn tín hiệu cần đánh giá, gán p ← 1

2 Khởi tạo ngẫu nhiên giá trị vector đơn vị w p thoả mãn: 2

Trang 39

w + w − ≤ε Nếu thuật toán chưa hội tụ, trở lại bước 3

7 Gán pp+ 1 nếu p<m trở lại bước 2

Dưới đây lưu đồ thuật toán cho quá trình mô phỏng thuật toán FastICA

In kết quả Tính toán thành phần độc lập

End Yes

No

No Yes

Trang 40

Hình 1-13 Lưu đồ thuật toán FastICA

hữu hạn FIR Khi đó quan hệ giữa tín hiệu thu được tại microphone thứ i và các nguồn

âm thanh trong miền thời gian như sau:

j,h ij( )k là hàm truyền đạt giữa nguồn âm thứ j và microphone thứ i Giả thiết trong

mô hình nghiên cứu, tín hiệu nhiễu n i được xem không đáng kể

Trong lĩnh vực ICA, có hai phương pháp chính để giải quyết mô hình trộn chập: Phương pháp ICA trong miền thời gian (TD-ICA) và ICA trong miền tần số (FD-ICA) Phương pháp TD-ICA, bài toán ICA được đánh giá dựa trực tiếp vào các tín hiệu thu

tại các microphone Ta có thể tách các tín hiệu bằng một tập các bộ lọc tách FIR như sau:

Ngày đăng: 18/01/2021, 13:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Nguyễn Quốc Trung, Xử lý tín hiệu và lọc số, tập 1, NXB Khoa học kỹ thuật 2004 Sách, tạp chí
Tiêu đề: Xử lý tín hiệu và lọc số
Nhà XB: NXB Khoa học kỹ thuật 2004
[2]. “M ột phương pháp phân tách mù nguồn tin sử dụng sai số dự báo tốt nhất trong thu ật toán FastICA,” Tạp chí Khoa học &amp; Công nghệ các Trường Đại học Kỹ thuật, trang 1-6, Số 81, tháng 3/2011 Sách, tạp chí
Tiêu đề: Một phương pháp phân tách mù nguồn tin sử dụng sai số dự báo tốt nhất trong thuật toán FastICA,” "Tạp chí Khoa học & Công nghệ các Trường Đại học Kỹ thuật
[3]. “Loại bỏ nhiễu trong tín hiệu điện tim ECG bằng phương pháp phân tích thành ph ần độc lập,” H ội nghị toàn quốc về điều khiển và tự động hóa VCCA 2011, pp.813-817, ngày 25-26/ 11, 2011 Sách, tạp chí
Tiêu đề: Loại bỏ nhiễu trong tín hiệu điện tim ECG bằng phương pháp phân tích thành phần độc lập,” "Hội nghị toàn quốc về điều khiển và tự động hóa VCCA 2011
[4]. Võ Minh Sơn, Nguyễn Hữu Phương “Tách ảnh dùng biến đổi wavelet và Phân tích thành phần độc lập,” Tạp chí Phát triển KH&amp;CN, số 11, 9/2008 Sách, tạp chí
Tiêu đề: Tách ảnh dùng biến đổi wavelet và Phân tích thành phần độc lập,” "Tạp chí Phát triển KH&CN
[5]. Nghiên cứu và ứng dụng xử lý tín hiệu mù vào phân tích ảnh viễn thám thu từ vệ tinh, Báo cáo tổng kết đề tài cấp Bộ mã số B2010-01-372, 7/2011.TI ẾNG ANH Sách, tạp chí
Tiêu đề: Nghiên cứu và ứng dụng xử lý tín hiệu mù vào phân tích ảnh viễn thám thu từ vệ tinh
[6]. Aapo Hyvarinen, Juha Karhunen and Erkkl Oja, Independent Component Analysis, John Wiley and Sons Ltd, 2001 Sách, tạp chí
Tiêu đề: Independent Component Analysis
[7]. A.Hyvarien, “Fast and robust fixed-point algorithms for independent component analysis,” IEEE Trans. On Neural Networks, 10(3): 626-634, 1999 Sách, tạp chí
Tiêu đề: Fast and robust fixed-point algorithms for independent component analysis,” "IEEE Trans. On Neural Networks
[8]. Aapo Hyvarinen et al, “ Independent component analysis: Algorithms and Applications,” Neural Networks, 13(4-5):411-430, 2000 Sách, tạp chí
Tiêu đề: Independent component analysis: Algorithms and Applications,” "Neural Networks
[9]. Aapo Hyvarinen, “Independent component analysis for time dependent stochastic processes,” Proc.Int.Conf. on Artificial Neural Networks ICANN’98 Sách, tạp chí
Tiêu đề: Independent component analysis for time dependent stochastic processes,”
[10]. A. Cichocki, “Blind Signal Separation and Extraction: Recent Trends, Future Perspectives, and Applications”, Lecture Notes in Computer Science, Artificial intelligence and Soft Computing 3070, 30-37 (2004) Sách, tạp chí
Tiêu đề: Blind Signal Separation and Extraction: Recent Trends, Future Perspectives, and Applications”, "Lecture Notes in Computer Science, Artificial intelligence and Soft Computing 3070
[11]. A.Cichocki et al, "A blind extraction of temporally correlated but statistically dependent acoustic signals,” Neural Network for Signal Processing, X, 2000, Proceedings of the 2000 IEEE Signal Processing Society Workshop, vol.1, pp 455-464 Sách, tạp chí
Tiêu đề: A blind extraction of temporally correlated but statistically dependent acoustic signals
[12]. A.Belouchrani et al, “A blind source separation technique based on second order statistics,” IEEE Trans.on Signal Processing, 45(2): 434-444, 1997 Sách, tạp chí
Tiêu đề: A blind source separation technique based on second order statistics,” "IEEE Trans.on Signal Processing
[13]. A.Kizilaya et al, “Estimation of the ARMA model parameters based on the equivalent MA approach,” The second IEE-EURASIP Int.Symp.on Communications, Control and Signal processing, ISCCSP’06 Marrakech,Marocco, 2006 Sách, tạp chí
Tiêu đề: Estimation of the ARMA model parameters based on the equivalent MA approach,” "The second IEE-EURASIP Int.Symp.on Communications, Control and Signal processing, ISCCSP’06
[14]. A.Ciaramella and R.Tagliaferri, “Separation of Convolved Mixtures in Frequency Domain ICA,” International Mathematical Forum no.16, pp.769- 795, 2006 Sách, tạp chí
Tiêu đề: Separation of Convolved Mixtures in Frequency Domain ICA,” "International Mathematical Forum no.16
[15]. A.J.Bell and T.J. Sejnowski, “ An information-maximization approach to blind separation and blind deconvolution,” Neural Computation (7):1129- 1159,1995 Sách, tạp chí
Tiêu đề: An information-maximization approach to blind separation and blind deconvolution,” "Neural Computation
[17]. C.Jutten and J.Herault, “Independent component analysis versus principal component analysis,” Signal Processing, vol.IV, pp 643-646, Elsevier, Amsterdam, 1988 Sách, tạp chí
Tiêu đề: Independent component analysis versus principal component analysis,” "Signal Processing
[18]. Ch.Servière and D.-T. Pham, “ Permutation correction in the frequency- domain in blind separation of speech mixtures,” EURASIP Journal on Apllied Signal Processing , 2006 Sách, tạp chí
Tiêu đề: Permutation correction in the frequency-domain in blind separation of speech mixtures,” "EURASIP Journal on Apllied Signal Processing
[19]. C.Simon et al,” Blind source separation of convolutive mixtures by maximization of fourth order cumulants: the non-iid case,” Proceedings of The Thirty-Second Asilomar Conference on Signals, Systems &amp; Computers, November 1998, vol.2 , pp.1584-1588 Sách, tạp chí
Tiêu đề: Proceedings of The Thirty-Second Asilomar Conference on Signals, Systems & Computers
[20]. D.Bertsekas, “The Auction Algorithm for Assignment and Other Network Flow Problems,” Interfaces 20 (1990), pp. 133-149 Sách, tạp chí
Tiêu đề: The Auction Algorithm for Assignment and Other Network Flow Problems,” "Interfaces 20 (1990)
Tác giả: D.Bertsekas, “The Auction Algorithm for Assignment and Other Network Flow Problems,” Interfaces 20
Năm: 1990
[21]. Dinh-Tuan Pham and Jean-Franỗois Cardoso, “Blind separation of instantaneous mixtures of non stationary sources,” IEEE Trans. Signal Processing, pp 1837-1848, vol 49, no 9, 2001 Sách, tạp chí
Tiêu đề: Blind separation of instantaneous mixtures of non stationary sources,” "IEEE Trans. Signal Processing

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm