Bài giảng Lý thuyết nhận dạng – Chương 3: Nhắc lại kiến thức xác suất thông tin đến các bạn về xác suất tiên nghiệm, xác suất có điều kiện, luật tổng xác suất, định lý Bayes, dạng tổng quát của luật Bayes, sự kiện độc lập, biến ngẫu nhiên (Cont)...
Trang 1LÝ THUYẾT NHẬN DẠNG
NHẮC LẠI KIẾN THỨC XÁC SUẤT
Biên soạn: TS Ngô Hữu Phúc
Bộ môn: Khoa học máy tính Học viện kỹ thuật quân sự Email: ngohuuphuc76@gmail.com
Trang 2Thông tin chung
Thông tin về nhóm môn học:
Thời gian, địa điểm làm việc: Bộ môn Khoa học máy tính Tầng 2, nhà A1.
Địa chỉ liên hệ: Bộ môn Khoa học máy tính, khoa Công nghệ thông tin.
Điện thoại, email: 069-515-329, ngohuuphuc76.mta@gmail.com
TT Họ tên giáo viên Học hàm Học vị Đơn vị công tác (Bộ môn)
1 Ngô Hữu Phúc GVC TS BM Khoa học máy tính
2 Trần Nguyên Ngọc GVC TS BM Khoa học máy tính
3 Nguyễn Việt Hùng GV TS BM Khoa học máy tính
Trang 3Cấu trúc môn học
Chương 0: Giới thiệu về môn học
Chương 1: Giới thiệu về nhận dạng mẫu.
Chương 2: Nhận dạng mẫu dựa trên thống kê học.
Chương 3: Ước lượng hàm mật độ xác suất.
Chương 4: Sự phân lớp dựa trên láng giềng gần nhất.
Chương 5: Phân loại tuyến tính.
Chương 6: Phân loại phi tuyến.
Chương 7: Mạng Neuron nhân tạo.
Thực hành: Giới thiệu một số ứng dụng trong thực tế
Trang 4Bài 3: Nhận dạng mẫu dựa trên thống kê học
Chương 3
Tiết: 1-3; Tuần thứ: 3
Mục đích, yêu cầu:
1 Nắm được kiến thức xác suất.
2 Xây dựng các module về tính toán dựa xác suất.
Hình thức tổ chức dạy học: Lý thuyết.
Thời gian: 3 tiết.
Địa điểm: Giảng đường do Phòng Đào tạo phân công Nội dung chính: (Slides)
Trang 5TỔNG QUAN
Sự tính toán không chắc chắn là một thành phầnquan trọng trong việc ra quyết định (ví dụ, phânlớp của lý thuyết nhận dạng)
Lý thuyết xác suất là cơ chế thích hợp phục vụ cho
sự tính toán không chắc chắn
Ví dụ:
khả năng nó là cá hồi hơn so với cá mú (see-bass).
Trang 6ĐỊNH NGHĨA
Phép thử ngẫu nhiên:
Một phép thử cho kết quả không biết trước
Kết quả:
Đầu ra của phép thử ngẫu nhiên
Không gian mẫu:
Tập tất cả các kết quả có thể (vd: {1,2,3,4,5,6})
Sự kiện:
Tập con của không gian mẫu (vd: tập số lẻ trongkhông gian mẫu trên: {1,3,5})
Trang 7 Theo định nghĩa Laplacian: giả sử tất cả kết quảđều nằm trong không gian mẫu và có khả năngnhư nhau.
Trang 8TIÊN ĐỀ CỦA XÁC SUẤT
1. 0 ≤ P(A) ≤ 1
2. P S = 1 S là không gian mẫu
3. Nếu A1, A2, … , An là các sự kiện loại trừ lẫn nhau
Trang 9XÁC SUẤT TIÊN NGHIỆM
Xác suất tiên nghiệm là xác suất của một sự kiệnkhông có rằng buộc nào trước đó
Ví dụ:
P(thi đỗ)=0.1 có nghĩa: trong trường hợp không
có thêm thông tin nào khác thì chỉ có 10% là thi đỗ
Trang 10XÁC SUẤT CÓ ĐIỀU KIỆN
Xác suất có điều kiện là xác suất của một sự kiệnnào đó khi có thêm thông tin rằng buộc
Ví dụ:
P(thi đỗ | học sinh giỏi) = 0.8 có nghĩa: xác
suất để học sinh thi đỗ khi biết đó là học sinh giỏi là80%
Trang 11XÁC SUẤT CÓ ĐIỀU KIỆN (CONT)
Xác suất có điều kiện có thể được định nghĩa quaxác suất không điều kiện:
𝑃 𝐴|𝐵 = 𝑃(𝐴, 𝐵)
𝑃(𝐵) , 𝑃 𝐵|𝐴 =
𝑃(𝐴, 𝐵)𝑃(𝐴)
Hay ta có: 𝑃(𝐴, 𝐵) = 𝑃(𝐴|𝐵)𝑃(𝐵) = 𝑃(𝐵|𝐴)𝑃(𝐴)
Trang 12LUẬT TỔNG XÁC SUẤT
Nếu 𝐴1, 𝐴2, … , 𝐴𝑛 là các phần ứng với các sự kiện loạitrừ lẫn nhau và B là một sự kiện nào đó, ta có:
Trong trường hợp đặc biệt:
Sử dụng quy tắc biến đổi, ta có:
Trang 13VÍ DỤ VỀ LUẬT TỔNG XÁC SUẤT
My mood can take one of two values: Happy, Sad
The weather can take one of three values: Rainy,Sunny, Cloudy
We can compute P(Happy) and P(Sad) as follows:
𝑃(𝐻𝑎𝑝𝑝𝑦) = 𝑃(𝐻𝑎𝑝𝑝𝑦|𝑅𝑎𝑖𝑛𝑦) + 𝑃(𝐻𝑎𝑝𝑝𝑦|𝑆𝑢𝑛𝑛𝑦) +
𝑃(𝐻𝑎𝑝𝑝𝑦|𝐶𝑙𝑜𝑢𝑑𝑦)𝑃(𝑆𝑎𝑑) = 𝑃(𝑆𝑎𝑑|𝑅𝑎𝑖𝑛𝑦) + 𝑃(𝑆𝑎𝑑|𝑆𝑢𝑛𝑛𝑦) + 𝑃(𝑆𝑎𝑑|𝐶𝑙𝑜𝑢𝑑𝑦)
Trang 14ĐỊNH LÝ BAYES
Theo luật Bayes, ta có:
trong đó,
( / ) ( ) ( / )
Trang 16DẠNG TỔNG QUÁT CỦA LUẬT BAYES
Nếu 𝐴1, 𝐴2, … , 𝐴𝑛 là các phần ứng với các sự kiện loạitrừ lẫn nhau và B là một sự kiện nào đó, ta có:
trong đó:
( / ) ( ) ( / )
( )
i i i
Trang 18BIẾN NGẪU NHIÊN
Trong nhiều thử nghiệm, đôi khi quan tâm tới biếntổng hơn là dạng xác suất ban đầu
Ví dụ: trong một lần thăm dò dư luận, chúng ta
tiến hành hỏi 50 người đồng ý hay không về một
dự luật nào đó
Ký hiệu “1” ứng với đồng ý, “0” ứng với không đồng ý.
Như vậy, không gian mẫu có 2 50 phần tử.
Giả sử, ta chỉ quan tâm tới số người đồng ý.
Như vậy, có thể định nghĩa biến X = số số “1”, có giá trị từ
0 đến 50.
Điều này có nghĩa, không gian mẫu nhỏ hơn, có 51 phần tử.
Trang 19BIẾN NGẪU NHIÊN (CONT)
Biến ngẫu nhiên là giá trị ta gán cho kết quả củamột thử nghiệm ngẫu nhiên (hàm cho phép gánmột số thực ứng với mỗi sự kiện)
Trang 20BIẾN NGẪU NHIÊN (CONT)
Như vậy, làm thế nào để có hàm xác suất theo biếnngẫu nhiên từ hàm xác suất trên không gian mẫuban đầu?
Giả sử ta có không gian mẫu là 𝑆 = 𝑠1, 𝑠2, … , 𝑠𝑛 .
Giả sử phạm vi của biến ngẫu nhiên X nằm trong
𝑥1, 𝑥2, … , 𝑥𝑚 .
Ta quan sát thấy 𝑋 = 𝑥𝑗 khi và chỉ khi kết quả của thử
nghiệm ngẫu nhiên là 𝑠𝑗 ∈ 𝑆, hay 𝑋 𝑠𝑗 = 𝑥𝑗
𝐏(𝐗 = 𝒙𝒋) = 𝐏(𝐬𝐣 ∈ 𝐒 ∶ 𝐗(𝒔𝒋) = 𝒙𝒋)
Ví dụ: trong ví dụ trên thì P(X=2)=?
Trang 21BIẾN NGẪU NHIÊN LIÊN TỤC / RỜI RẠC
Biến ngẫu nhiên rời rạc là biến mà giá trị của nó là đếm được.
Ví dụ: quan sát việc tung 2 con xúc xắc.
Gọi X là tổng các mặt của 2 con xúc xắc.
X=5 tương ứng với không gian có thể 𝐴5 = { 1,4 , 4,1 , 2,3 , (3,2)}.
Vậy ta có:
𝑃 𝑋 = 𝑥 = 𝑃 𝐴𝑥 =
𝑠:𝑋 𝑠 =𝑥
𝑃 𝑠 Hay:
𝑃 𝑋 = 5 = 𝑃 1,4 + 𝑃 4,1 + 𝑃 2,3 + 𝑃 3,2 = 4
36 =
1 9
Biến ngẫu nhiên liên tục là biến mà giá trị của nó thuộc nhóm không đếm được.
Trang 22HÀM TỔNG XÁC SUẤT – HÀM MẬT ĐỘ XÁC SUẤT
Hàm tổng xác suất - Probability mass function: làhàm cho biết xác suất của một biến ngẫu nhiên rờirạc X nào đó với giá trị 𝑥𝑖 trong miền giá trị Kýhiệu pmf
Hàm mật độ xác suất - Probability density function:
là hàm một hàm bất kỳ f(x) mô tả mật độ xác suất theo biến đầu vào x Ký hiệu pdf
Trang 23HÀM KHỐI XÁC SUẤT – HÀM MẬT ĐỘ XÁC SUẤT (CONT)
𝑝 𝑡 𝑑𝑡 ; ℎà𝑚 𝑝𝑑𝑓
Trang 24 (2) F(x) là hàm không giảm theo biến x.
Nếu X rời rạc, hàm phân bố xác suất được tính:
𝑝 𝑘
Trang 25HÀM PHÂN BỐ XÁC SUẤT – PDF (CONT)
Ví dụ minh họa:
Trang 26HÀM PHÂN BỐ XÁC SUẤT – PDF (CONT)
Nếu X là biến liên tục, PDF có thể tính:
Trang 27HÀM PHÂN BỐ XÁC SUẤT – PDF (CONT)
Ví dụ về pdf và PDF của Gaussian
Trang 28HÀM PMF NHIỀU BIẾN (BIẾN RỜI RẠC)
Với hàm n biến ngẫu nhiên, khi đó ta có pmf nhiềubiến được viết:
Trang 29HÀM PDF NHIỀU BIẾN (BIẾN LIÊN TỤC)
Với n biến ngẫu nhiên liên tục, hàm pdf nhiều biếnđược tính:
Trang 32HÀM PHÂN BỐ CHUẨN (GAUSSIAN)
Hàm phân bố chuẩn Gaussian được định nghĩa:
𝑝 𝑥 = 1
𝜎 2𝜋 𝑒𝑥𝑝 −
𝑥 − 𝜇 22𝜎2
trong đó: 𝜇: giá trị kỳ vọng; 𝜎: độ lệch chuẩn
Với x là một véc tơ, ta có:
𝑝 𝑥 = 1
2𝜋 𝑑/2 Σ 1/2 𝑒𝑥𝑝 − 𝑥 − 𝜇 𝑡Σ−1 𝑥 − 𝜇trong đó: d: số chiều; 𝜇: kỳ vọng; Σ: ma trận hiệp
phương sai
Trang 33HÀM PHÂN BỐ CHUẨN (GAUSSIAN) - CONT
Ví dụ về phân bố chuẩn có 2 biến:
Trang 34HÀM PHÂN BỐ CHUẨN (GAUSSIAN) - CONT
1
2 2
i i i
i i
Trang 35𝑖=1 𝑛
𝑥𝑖
Trang 38PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN
Phương sai Var(X) của biến ngẫu nhiên X:
Var X = E X − μ 2 , với μ = E(X)
Phương sai theo mẫu dữ liệu:
Trang 39HIỆP PHƯƠNG SAI
Hiệp phương sai của 2 biến X và Y:
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
Trang 40MA TRẬN HIỆP PHƯƠNG SAI
Với 2 biến X, Y, ma trận hiệp phương sai:
CXY = Cov(X, X) Cov(X, Y)Cov(Y, X Cov(Y, Y)với Cov X, X = Var X ; Cov Y, Y = Var Y
Với trường hợp nhiều biến:
Trang 41LÝ THUYẾT NHẬN DẠNG
CHƯƠNG 3:
NHẬN DẠNG MẪU DỰA TRÊN THỐNG KÊ
Biên soạn: TS Ngô Hữu Phúc
Bộ môn: Khoa học máy tính Học viện kỹ thuật quân sự Email: ngohuuphuc76@gmail.com
Trang 42Thông tin chung
Thông tin về nhóm môn học:
Thời gian, địa điểm làm việc: Bộ môn Khoa học máy tính Tầng 2, nhà A1.
Địa chỉ liên hệ: Bộ môn Khoa học máy tính, khoa Công nghệ thông tin.
Điện thoại, email: 069-515-329, ngohuuphuc76.mta@gmail.com
TT Họ tên giáo viên Học hàm Học vị Đơn vị công tác (Bộ môn)
1 Ngô Hữu Phúc GVC TS BM Khoa học máy tính
2 Trần Nguyên Ngọc GVC TS BM Khoa học máy tính
3 Nguyễn Việt Hùng GV TS BM Khoa học máy tính
Trang 43Cấu trúc môn học
Chương 0: Giới thiệu về môn học
Chương 1: Giới thiệu về nhận dạng mẫu.
Chương 2: Nhận dạng mẫu dựa trên thống kê học.
Chương 3: Ước lượng hàm mật độ xác suất.
Chương 4: Sự phân lớp dựa trên láng giềng gần nhất.
Chương 5: Phân loại tuyến tính.
Chương 6: Phân loại phi tuyến.
Chương 7: Mạng Neuron nhân tạo.
Thực hành: Giới thiệu một số ứng dụng trong thực tế
Trang 44Bài 3: Nhận dạng mẫu dựa trên thống kê học
Chương 2
Tiết: 1-3; Tuần thứ: 4
Mục đích, yêu cầu:
1 Nắm được Lý thuyết quyết định Bayes.
2 Nắm được Hàm phân biệt và mặt quyết định.
3 Nắm được Phân bố chuẩn.
4 Ngoài ra, người học cần nắm được khái niệm về Lỗi biên và đo
sự phân biệt.
Hình thức tổ chức dạy học: Lý thuyết.
Thời gian: 3 tiết.
Địa điểm: Giảng đường do Phòng Đào tạo phân công
Trang 45TỔNG QUAN
Đặc trưng là biến ngẫu nhiên 𝐱 ∈ 𝕽𝐧
Sự phân loại dựa trên lớp tốt nhất có thể 𝐰𝐢.
Sự phân loại này sử dụng:
xác suất tiên nghiệm của biến cố w i là P(w i ) và
xác suất có điều kiện 𝐩 𝐱|𝐰𝐢 .
Câu hỏi đặt ra:
Lớp tốt nhất có thể có nghĩa là gì? →
maximum xác suất hậu nghiệm P(w i |x).
Xác suất cho biến cố là gì?
Xác suất có điều kiện là gì?
Nếu xác suất trên không biết, việc ước lượng phải sử dụng dữ liệu huấn luyện.
Nếu việc phân loại có kèm cả rủi ro, cần cực tiểu rủi ro.
Trang 463.1 LÝ THUYẾT QUYẾT ĐỊNH BAYES
3.1.1 Sự phân loại dựa trên cực tiểu sai số
Đòi hỏi sự phân loại tối ưu.
Với trường hợp có 2 lớp, quy tắc phân loại:
Trang 473.1 LÝ THUYẾT QUYẾT ĐỊNH BAYES (CONT)
Trang 483.1 LÝ THUYẾT QUYẾT ĐỊNH BAYES (CONT)
Trong trường hợp có nhiều lớp, quy tắc phân loại dạng:
quyết định wi nếu P wi|x > P wj|x với ∀j ≠ i
tương ứng với với miền R i
Trang 493.1 LÝ THUYẾT QUYẾT ĐỊNH BAYES (CONT)
Quyết định khác nhau (đúng hoặc sai) có thể cho kết quảkhác nhau
Chi phí λ ki của lựa chọn x thuộc R i, đúng lớp w i, được lưutrong ma trận L.
Như vậy, rủi ro ứng với lớp w k, với M là số lớp:
k
i
dx w
x p
r
1
|
Trang 503.1.2 CỰC TIỂU HÓA RỦI RO PHÂN LOẠI (CONT)
Nhiệm vụ: Cực tiểu hóa rủi ro trung bình
→ vậy mỗi tích phân trên cần cực tiểu hóa.
Gọi l i là hàm mất mát ứng với lựa chọn i:
ki M
P w
x p w
P r
l l
if R
Trang 513.1.2 CỰC TIỂU HÓA RỦI RO PHÂN LOẠI (CONT)
Xét trường hợp có 2 lớp:
Rủi ro có điều kiện:
Quyết định w 1 nếu l 1 < l 2, hay
Thông thường (λ21 − λ22) và (λ12 − λ11) dương, nên
→ chọn w 1 nếu
1 1 22 2 2
12 2
2 2
21 1
1 11
P w x p l
w P w x p w
P w x p
w P w
x p
w x
p
Trang 52 Đặc trưng x: chiều cao của xe.
Theo luật xác suất Bayes, ta có thể tính xác suất hậunghiệm:
P Ci|x = p x|Ci P Ci
p x
Như vậy, cần tính p x|C p x|C P C P C
Trang 54VÍ DỤ (CONT)
Dạng biểu đồ, ta có:
Trang 55VÍ DỤ (CONT)
Có thể tính xác suất hậu nghiệm:
1 1 1
Trang 563.2 HÀM PHÂN BIỆT VÀ MẶT QUYẾT ĐỊNH
Chúng ta có không gian đặc trưng được chia thành M miền R i.
Câu hỏi đặt ra: ranh giới giữa các miền là gì?
Ranh giới quyết định giữa lớp w i và w j sao cho cực tiểu hóa sai số phân lớp được định nghĩa:
Nếu hiệu trên dương, sẽ quyết định thuộc lớp wi,
ngược lại thuộc lớp wj.
w | x P w | x 0
Trang 573.2 HÀM PHÂN BIỆT VÀ MẶT QUYẾT ĐỊNH (T)
Trong nhiều trường hợp, để thuận tiện có thể sử dụng hàm tương đương 𝐠𝐢(𝐱) = 𝐟(𝐏(𝐰𝐢|𝐱), trong đó, hàm f(.) đơn điệu tăng.
Hàm g i (x) được gọi là hàm phân biệt.
Khi đó, việc quyết định được xác định:
Và ranh giới quyết định được định nghĩa:
x g x j i g
if w
x g x 0
Trang 583.3 PHÂN BỐ CHUẨN (1/4)
Mô hình đầy đủ của phân bố chuẩn nhiều biến được dùng trong nhiều ứng dụng.
Phân bố chuẩn cho hàm 1 biến:
trong đó, μ : giá trị kỳ vọng (trung bình) và σ 2 : phương sai (σ: độ lệch
2
1 exp
2
1 )
(
~ ,
Trang 593.3 PHÂN BỐ CHUẨN (2/4)
Phân bố chuẩn Gaussian cho hàm nhiều biến:
trong đó, μ=E[x]=ʃxp(x)dx là vector trung bình, Σ là ma trận lxl hiệp
phương sai được định nghĩa:
giá trị kỳ vọng của vector hay ma trận được xác định riêng từng phần:
gọi 𝜇𝑘 là thành phần thứ k của 𝜇 , và 𝛿𝑘𝑚 là thành phần thứ km của Σ
2 / 1 2
1 exp
2
1 )
(
~ ,
Trang 603.3 PHÂN BỐ CHUẨN (3/4)
Trong công thức trên, Σ đối xứng và xác định dương.
Thành phần trên đường chéo chính δ kk phương sai của x k.
Các thành phần khác δ km là hiệp phương sai của x k và x m . Nếu x k và
x m độc lập thì σ km =0.
Từ các khái niệm của phân bố chuẩn có thể xây dựng bộ phân lớp Bayesian!!!
Trang 61i i
i
w P
l x
x
w P w
x p
w P w x p x
g
ln
ln2
12
ln22
1
ln
|ln
|ln
Trang 623.3.1 HIỆP PHƯƠNG SAI BẰNG NHAU (1/3)
Giả sử, tất cả các thành phần của ma trận hiệp phương sai bằng nhau:
T i
i i
i
T i i
w P w
w
w x
w x
g
ln 2
Trang 633.3.1 HIỆP PHƯƠNG SAI BẰNG NHAU (2/3)
Xem xét một số dạng đặc biệt:
Σ = σ 2 I:
Hàm phân biệt:
Mặt quyết định:
Như vậy, mặt này đi qua x0 và vuông góc với μi-μj .
Với trường hợp xác suất tiên nghiệm như nhau, bộ phân lớp có khoảng cách min được xác định:
i
T i
1
j i
j i
j
i j
i
j i
T ij
w P
w
P x
w
x x w x
Trang 64VÍ DỤ VỚI TRƯỜNG HỢP Σ = Σ 2I
Trang 653.3.1 HIỆP PHƯƠNG SAI BẰNG NHAU (3/3)
Trường hợp Σ không có dạng đường chéo.
Mặt quyết định:
trong đó: là dạng chuẩn Mahalanobis của x.
Như vậy, mặt này đi qua x0 và vuông góc với 𝚺 − 𝟏(𝛍𝐢 − 𝛍𝐣) Và khoảng cách được sử dụng là:
j i
j
i j
i
j i
T ij
w P
w
P x
w
x x
w x
d
Trang 66VÍ DỤ VỀ TRƯỜNG HỢP NON-DIAGONAL Σ
Trang 673.4 LỖI BIÊN VÀ ĐO SỰ PHÂN BIỆT
Đo sự phân biệt là việc đo sự phân tách giữa 2 lớp
Có thể được sử dụng để chọn tập đặc trưng
Có thể sử dụng nhiều cách đo khác nhau như Leibler, Chernoff – Bhattacharyya,…
Trang 68Kullback-3.4.1 KHOẢNG CÁCH KULLBACK-LEIBLER
Gọi p1(x) và p2(x) là 2 phân bố Khoảng cách K-L được xácđịnh:
KL trên đo khoảng cách giữa các phân bố
x
p x
p x
p x
p
2
1 1
Trang 69K HOẢNG CÁCH K ULLBACK -L EIBLER ( CONT )
Với phân bố Gaussian N(μi,Σi) và N(μj,Σj)
Trong trường hợp 1 chiều:
j i
i j
j i
1 1
21
}2
{2
2
2
2 2
2
11
21
22
1
j i
j i
j
i i
j ij
Trang 703.4.2 BIÊN CHERNOFF VÀ BHATTACHARYYA
Cực tiểu hóa sai số của bộ phân lớp Bayesian cho 2 lớpđược xác định:
Tích phân trên rất khó tính Để xác định biên có thể sửdụng bất đằng thức sau:
Như vậy, biên Chernoff được xác định:
1 0
; 0 ,
} ,
s b
a for b
a b
error P w P w p x w p x w dx
Trang 713.4.2 BIÊN CHERNOFF VÀ BHATTACHARYYA (CONT)
Với phân bố Gaussian, ta có:
P error
s j
s i
j i
i j
j i
T i j
s s
s
s s
s s
s k
( ln
2 1
) 1
(
1 )
Trang 723.4.2 BIÊN CHERNOFF VÀ BHATTACHARYYA (T)
Nếu s=1/2, ta có biên Bhattacharyya
với
1 / 2
) (
)
P error
j i
j i
i j
j i
T i j
21
28
1)
2/1(