báo cáo mô hình markov
Trang 2Phân công việc
Thành viên Slides & Báo cáo Cá nhân Thảo luận nhóm
Trần Quang Huy 9.1,9.2
Markov Models Hidden Markov Models
Mỗi cá nhận tự đọc toàn
bộ nội dung của chương 9
về mô hình markov
Thống nhất cách hiểu các vấn đề sau:
- Mô hình Markov
- Mô hình Markov ẩn
- Ba vấn để của HMMs + Tính xác suất sinh ra chuỗi quan sát O của mô hình µ: P(O|µ)
+ Xác định dãy chuyển trạng thái X cho xác suất sinh chuỗi quan sát O lớn nhất (optimal path) + Tìm mô hình khớp với dãy quan sát nhất (Tìm tham số cho mô hình)
- Một số vấn đề khác liên quán đến HMMs
Trần Phước Tuấn
Huỳnh Diệp Tân
9.3 Three Fundamental Questions for HMMs
Phan Tấn Toàn 9.4, 9.5
Implementation, Properties, and Variants
Further Reading Phan Thị Hằng
Trang 3Nội dung
Giới thiệu
Mô hình Markov
Mô hình Markov ẩn (HMMs)
Ba bài toán cơ bản của HMMs
Implementation, Properties, and Variants, Further
Reading
Trang 4Giới thiệu
markov ẩn có nền tản của mô hình thống kê được
sử dụng trong hệ thống nhận dạng dọng nói hiện đại.
Các biến thể của HMMs được sử dụng rộng rãi và
thường được coi là thành công nhất.
Trang 5– …
Giới thiệu
Trang 6Giới thiệu
Chương HMMs được đặt ở phần đầu của phần
“Grammar” của sách vì nó làm việc trên thứ tự của các
từ trong câu là một khởi đầu để hiểu về cú pháp củacâu
Trong chương này tác giả trình bày
Nền tản lý thuyết của HMMs,
Liên hệ với những ứng dụng của chúng
Tổng kết một vài gợi ý mở rộng HMMs và các kỹ thuật triển khai thực tế.
Trang 7Mô hình Markov
Giả sử ta cần dự đoán ngày mai số sách trong thư viện
là bao nhiêu, như vậy ta chỉ quan tâm đến số sách hiệntại chứ không quan tâm đến số sách có trong ngày hômqua hay tuần trước, năm trước, …
Trong bài toán trên ta thấy: ta cần dự đoán trạng thái
tương lai dựa vào thông tin ở trạng thái hiện tại màkhông cần đến thông tin của quá khứ
Trang 8Mô hình Markov
Định nghĩa: Cho µ=(S, A, Π) gọi X = (X1, X2, …, XT) là
một dãy các biến ngẫu nhiên với giá trị nằm trong tậpS={s1, s2, s3, …, sN} - tập không gian trạng thái, thỏa cáctính chất sau:
1 P(Xt+1=sk | X1, X2, …, Xt) = P(Xt+1=sk | Xt)
2 Xác xuất chuyển trạng thái độc lập với thời gian
3 Xác suất chuyển trạng thái (lưu vào ma trận A)
Trang 10Mô hình Markov ẩn (HMMs)
Crayzy machine
Trang 11Mô hình Markov ẩn (HMMs)
Khi cho tiền vào thì máy sẽ chuyển trạng thái
Nếu (Trạng thái =CP) Coca
Nếu (Trạng thái = IP) Iced Tea
Ta có mô hình Markov rõ
(Visible Markov Model)
Nhưng thực tế nó chỉ có xu hướng làm điều này, như
vậy ta cần có xác suất sinh ra sản phẩm
P(Ot = k | Xt = si, Xt+1 = sj) = bijk
(Xác suất sinh ra sản phẩm k khi chuyển từ si sj)
Với k là giá trị quan sát được tại thời điểm t.
Trang 12Mô hình Markov ẩn (HMMs)
Với ví dụ trên này thì giá trị quan sát được độc lập hoàn
toàn so với sj và được mô tả trong bảng sau:
Trang 14Mô hình Markov ẩn (HMMs)
Trang 15Cấu trúc của một HMMs
Trang 16Thủ tục của tiến trình Markov
Trang 17Ba bài toán cơ bản của HMMs
Bài toán 1: (Evaluation problem)
Cho dãy quan sát O=o1o2 oT và HMM - µ hãy xác định xác suất sinh dãy từ mô hình – P(O| µ).
Trang 18Ba bài toán cơ bản của HMMs
Bài toán 2: (Decoding problem)
Cho dãy quan sát O=o1o2 oT và HMM - µ hãy xác định dãy chuyển trạng X=(X1X2 XT) sao cho xác suất sinh ra O lớn nhất(optimal path).
Trang 19Ba bài toán cơ bản của HMMs
Bài toán 3: (Learning problem)
Hiệu chỉnh HMM - µ để cực đại hoá xác suất sinh O – P(O|µ) (tìm mô hình “khớp” dãy quan sát nhất).
Trang 20Giải pháp cho 3 bài toán toán của HMMs
Trang 21 Cho dãy sản phẩm O = (o 1 ,…,o T ) và mô hình
Tính P(O|) là xác suất dãy O được sinh bởi
Quá trình tính toán này còn được gọi là giải mã.
1 Tìm xác suất của dãy sản phẩm
Trang 231 Tìm xác suất của dãy sản phẩm
Trang 241 Tìm xác suất của dãy sản phẩm
Trang 26Thủ tục tiến (Forward Procedure)
2N2T
phép nhân
Trang 27Thủ tục lùi (Backward Procedure)
Trang 28Kết hợp thủ tục tiến và lùi
Trang 29Cho dãy sản phẩm O = (o 1 ,…,o T ) và mô hình
Tìm dãy trạng thái X = (X 1 ,…,X T+1 ) tốt nhất sinh ra O Đó
là dãy làm cho giá trị P(X|O,) đạt cực đại.
Có một cách là tìm từng trạng thái X t với 1 t T+1
sao cho P(X t |O,) đạt cực đại.
2 Tìm dãy trạng thái tốt nhất
Trang 302 Tìm dãy trạng thái tốt nhất
Trang 31Thuật giải Viterbi
Trang 32Thuật giải Viterbi
Trang 333 Ước lượng các tham số
Trang 34 Không có công thức nào để chọn để cực đại hóa
leo đồi lặp
Vì không biết trước là mô hình nào nên có thể sử dụng vài mô hình (có thể chọn ngẫu nhiên) Quan sát kết quả tính toán, chúng ta có thể nhìn thấy những quá trình chuyển trạng thái nào và những phát sinh sản phẩm
nào được dùng nhiều nhất thì tăng xác suất của chúng
Tiến trình cực đại hóa thường được gọi là xoắn (twin)
mô hình và được thực hiện trên dữ liệu huấn luyện
(training data).
3 Ước lượng các tham số
Trang 353 Ước lượng các tham số
Trang 363 Ước lượng các tham số
Trang 37 Bắt đầu với vào mô hình (được chọn trước hoặc ngẫu nhiên).
Cho dãy O lần lượt chạy qua các mô hình để ước lượng
các tham số cho mỗi mô hình
Cập nhật các mô hình để cực đại hóa các giá trị của các dãy trạng thái được sử dụng nhiều
Lặp lại tiến trình này và hy vọng chúng sẽ hội tụ tại các giá trị tối ưu cho các tham số mô hình
3 Ước lượng các tham số
Trang 383 Ước lượng các tham số
Trang 40Implementation HMM “floating-point underflow”.
Viterbi algorithm:
logarithms (log)
Trang 42Initialization of parameter values
Khi không đủ các giá trị dữ liệu để thiết lập HMM ?
Giả định các giá trị trong A là như nhau.
Gán một số giá trị = 0
Giá trị B là quan trọng nên có những phương án khởi tạo tốt (tránh ngẫu nhiên)
Trang 43Variants of HMMs
Trang 44Applications of HMM
Trong sinh học: phân tích gen trong chuỗi ADN
Trong xử lý ngôn ngữ: gán các từ loại trong văn bản
An HMM for unspliced genes.
x : non-coding DNA
c : coding state