1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo mô hình markov

46 238 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 46
Dung lượng 3,86 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

báo cáo mô hình markov

Trang 2

Phân công việc

Thành viên Slides & Báo cáo Cá nhân Thảo luận nhóm

Trần Quang Huy 9.1,9.2

Markov Models Hidden Markov Models

Mỗi cá nhận tự đọc toàn

bộ nội dung của chương 9

về mô hình markov

Thống nhất cách hiểu các vấn đề sau:

- Mô hình Markov

- Mô hình Markov ẩn

- Ba vấn để của HMMs + Tính xác suất sinh ra chuỗi quan sát O của mô hình µ: P(O|µ)

+ Xác định dãy chuyển trạng thái X cho xác suất sinh chuỗi quan sát O lớn nhất (optimal path) + Tìm mô hình khớp với dãy quan sát nhất (Tìm tham số cho mô hình)

- Một số vấn đề khác liên quán đến HMMs

Trần Phước Tuấn

Huỳnh Diệp Tân

9.3 Three Fundamental Questions for HMMs

Phan Tấn Toàn 9.4, 9.5

Implementation, Properties, and Variants

Further Reading Phan Thị Hằng

Trang 3

Nội dung

 Giới thiệu

 Mô hình Markov

 Mô hình Markov ẩn (HMMs)

 Ba bài toán cơ bản của HMMs

 Implementation, Properties, and Variants, Further

Reading

Trang 4

Giới thiệu

markov ẩn có nền tản của mô hình thống kê được

sử dụng trong hệ thống nhận dạng dọng nói hiện đại.

 Các biến thể của HMMs được sử dụng rộng rãi và

thường được coi là thành công nhất.

Trang 5

– …

Giới thiệu

Trang 6

Giới thiệu

 Chương HMMs được đặt ở phần đầu của phần

“Grammar” của sách vì nó làm việc trên thứ tự của các

từ trong câu là một khởi đầu để hiểu về cú pháp củacâu

 Trong chương này tác giả trình bày

 Nền tản lý thuyết của HMMs,

 Liên hệ với những ứng dụng của chúng

 Tổng kết một vài gợi ý mở rộng HMMs và các kỹ thuật triển khai thực tế.

Trang 7

Mô hình Markov

 Giả sử ta cần dự đoán ngày mai số sách trong thư viện

là bao nhiêu, như vậy ta chỉ quan tâm đến số sách hiệntại chứ không quan tâm đến số sách có trong ngày hômqua hay tuần trước, năm trước, …

 Trong bài toán trên ta thấy: ta cần dự đoán trạng thái

tương lai dựa vào thông tin ở trạng thái hiện tại màkhông cần đến thông tin của quá khứ

Trang 8

Mô hình Markov

Định nghĩa: Cho µ=(S, A, Π) gọi X = (X1, X2, …, XT) là

một dãy các biến ngẫu nhiên với giá trị nằm trong tậpS={s1, s2, s3, …, sN} - tập không gian trạng thái, thỏa cáctính chất sau:

1 P(Xt+1=sk | X1, X2, …, Xt) = P(Xt+1=sk | Xt)

2 Xác xuất chuyển trạng thái độc lập với thời gian

3 Xác suất chuyển trạng thái (lưu vào ma trận A)

Trang 10

Mô hình Markov ẩn (HMMs)

Crayzy machine

Trang 11

Mô hình Markov ẩn (HMMs)

 Khi cho tiền vào thì máy sẽ chuyển trạng thái

 Nếu (Trạng thái =CP)  Coca

 Nếu (Trạng thái = IP)  Iced Tea

 Ta có mô hình Markov rõ

(Visible Markov Model)

 Nhưng thực tế nó chỉ có xu hướng làm điều này, như

vậy ta cần có xác suất sinh ra sản phẩm

P(Ot = k | Xt = si, Xt+1 = sj) = bijk

(Xác suất sinh ra sản phẩm k khi chuyển từ si  sj)

Với k là giá trị quan sát được tại thời điểm t.

Trang 12

Mô hình Markov ẩn (HMMs)

 Với ví dụ trên này thì giá trị quan sát được độc lập hoàn

toàn so với sj và được mô tả trong bảng sau:

Trang 14

Mô hình Markov ẩn (HMMs)

Trang 15

Cấu trúc của một HMMs

Trang 16

Thủ tục của tiến trình Markov

Trang 17

Ba bài toán cơ bản của HMMs

Bài toán 1: (Evaluation problem)

Cho dãy quan sát O=o1o2 oT và HMM - µ hãy xác định xác suất sinh dãy từ mô hình – P(O| µ).

Trang 18

Ba bài toán cơ bản của HMMs

Bài toán 2: (Decoding problem)

Cho dãy quan sát O=o1o2 oT và HMM - µ hãy xác định dãy chuyển trạng X=(X1X2 XT) sao cho xác suất sinh ra O lớn nhất(optimal path).

Trang 19

Ba bài toán cơ bản của HMMs

Bài toán 3: (Learning problem)

Hiệu chỉnh HMM - µ để cực đại hoá xác suất sinh O – P(O|µ) (tìm mô hình “khớp” dãy quan sát nhất).

Trang 20

Giải pháp cho 3 bài toán toán của HMMs

Trang 21

Cho dãy sản phẩm O = (o 1 ,…,o T ) và mô hình

Tính P(O|) là xác suất dãy O được sinh bởi

Quá trình tính toán này còn được gọi là giải mã.

1 Tìm xác suất của dãy sản phẩm

Trang 23

1 Tìm xác suất của dãy sản phẩm

Trang 24

1 Tìm xác suất của dãy sản phẩm

Trang 26

Thủ tục tiến (Forward Procedure)

2N2T

phép nhân

Trang 27

Thủ tục lùi (Backward Procedure)

Trang 28

Kết hợp thủ tục tiến và lùi

Trang 29

Cho dãy sản phẩm O = (o 1 ,…,o T ) và mô hình

Tìm dãy trạng thái X = (X 1 ,…,X T+1 ) tốt nhất sinh ra O Đó

là dãy làm cho giá trị P(X|O,) đạt cực đại.

Có một cách là tìm từng trạng thái X t với 1 t T+1

sao cho P(X t |O,) đạt cực đại.

2 Tìm dãy trạng thái tốt nhất

Trang 30

2 Tìm dãy trạng thái tốt nhất

Trang 31

Thuật giải Viterbi

Trang 32

Thuật giải Viterbi

Trang 33

3 Ước lượng các tham số

Trang 34

 Không có công thức nào để chọn  để cực đại hóa

leo đồi lặp

 Vì không biết trước là mô hình nào nên có thể sử dụng vài mô hình (có thể chọn ngẫu nhiên) Quan sát kết quả tính toán, chúng ta có thể nhìn thấy những quá trình chuyển trạng thái nào và những phát sinh sản phẩm

nào được dùng nhiều nhất thì tăng xác suất của chúng

Tiến trình cực đại hóa thường được gọi là xoắn (twin)

mô hình và được thực hiện trên dữ liệu huấn luyện

(training data).

3 Ước lượng các tham số

Trang 35

3 Ước lượng các tham số

Trang 36

3 Ước lượng các tham số

Trang 37

 Bắt đầu với vào mô hình  (được chọn trước hoặc ngẫu nhiên).

Cho dãy O lần lượt chạy qua các mô hình để ước lượng

các tham số cho mỗi mô hình

 Cập nhật các mô hình để cực đại hóa các giá trị của các dãy trạng thái được sử dụng nhiều

 Lặp lại tiến trình này và hy vọng chúng sẽ hội tụ tại các giá trị tối ưu cho các tham số mô hình 

3 Ước lượng các tham số

Trang 38

3 Ước lượng các tham số

Trang 40

Implementation HMM “floating-point underflow”.

 Viterbi algorithm:

 logarithms (log)

Trang 42

Initialization of parameter values

 Khi không đủ các giá trị dữ liệu để thiết lập HMM ?

 Giả định các giá trị trong A là như nhau.

 Gán một số giá trị = 0

 Giá trị B là quan trọng nên có những phương án khởi tạo tốt (tránh ngẫu nhiên)

Trang 43

Variants of HMMs

Trang 44

Applications of HMM

 Trong sinh học: phân tích gen trong chuỗi ADN

 Trong xử lý ngôn ngữ: gán các từ loại trong văn bản

An HMM for unspliced genes.

x : non-coding DNA

c : coding state

Ngày đăng: 28/02/2016, 00:16

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w