Đề xuất cải tiến thuật toán tìm kiếm trong cơ sở dữ liệu mờ

Cho đến nay, vấn đề tìm kiếm thông tin theo điều kiện tìm kiếm mờ trong cơ sở dữ liệu vẫn được các chuyên gia nghiên cứu, trong việc truy tìm thông tin phù hợp với yêu cầu của một truy v

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGUYỄN THANH TÂN

ĐỀ XUẤT CẢI TIẾN THUẬT TOÁNTÌM KIẾM

TRONG CƠ SỞ DỮ LIỆU MỜ

LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2016

Trang 2

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGUYỄN THANH TÂN

ĐỀ XUẤT CẢI TIẾN THUẬT TOÁNTÌM KIẾM

TRONG CƠ SỞ DỮ LIỆU MỜ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC PGS TS NGUYỄN THIỆN LUẬN

Thái Nguyên - 2016

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan những nội dung trong luận văn “Đề xuất cải tiến thuật toán tìm kiếm trong cơ sở dữ liệu mờ” là do tôi thực hiện dưới sự hướng dẫn

trực tiếp của thầy giáo PGS TS Nguyễn Thiện Luận

Mọitham khảo dùngtrongluận văn đều đượctrích dẫnrõràngtêntác giả,tên công trình, thời gian, địa điểm công bố

Mọi sao chép không hợplệ, vi phạm quy chế đàotạo, hay giantrá, tôi xin chịu trách nhiệm hoàn toàn

Thái Nguyên, ngày 12 tháng 5 năm 2016

Học viên

Nguyễn Thanh Tân

Trang 4

LỜI CẢM ƠN

Em xin bày tỏ lòng biết ơn sâu sắc tới PGS TS Nguyễn Thiện Luận

người thầy kính mến đã hướng dẫn, chỉ dạy tận tình để em hoàn thành luận văn này Em xin chân thành cảm ơn các thầy, cô giáo trường Đại học Công nghệ thông tin và Truyền thông Thái Nguyên, Khoa đào tạo sau đại học - Đại học Thái Nguyên, Viện Công nghệ thông tin Việt Nam đã đón nhận và truyền thụ kiến thức cho em trong suốt quá trình học tập vừa qua

Tôi cũng xin cảm ơn cơ quan, bạn bè đồng nghiệp, gia đình và những người thân đã cùng chia sẻ, giúp đỡ, động viên và tạo mọi điều kiện thuận lợi

để tôi hoàn thành nhiệm vụ học tập và bản luận văn này

Thái Nguyên, ngày 12 tháng 5 năm 2016

Học viên

Nguyễn Thanh Tân

Trang 5

DANH MỤC TỪ TIẾNG ANH VÀ VIẾT TẮT

Codd E F Edgar Frank "Ted" Codd

Damerau - Levenshtein distance Khoảng cách Damerau - Levenshtein

Full text search Tìm kiếm toàn văn

Fuzzy Natural joint Phép kết nối tự nhiên mờ

Information Retrieval Hệ thống tìm kiếm thông tin hỗ trợ

Keypoint localization Định vị điểm đặc trưng

Keypoint descriptor Mô tả các điểm đặc trưng

Levenshtein distance Khoảng cách Levenshtein

Orientation assignment Xác định hướng

Trang 6

Spell - checker method Phương pháp kiểm tra chính tả

Trang 7

DANH MỤC BẢNG VÀ HÌNH VẼ

Hình 1.1:Biểu diễn các miền của một tập mờ 6

Hình 1.2: Biểu diễn các hàm liên thuộc của phép lấy phần bù 8

Hình 1.3: Các tập mờ hình tam giác 9

Hình 1.4: Tập mờ Singleton 9

Hình 1.5: Tập mờ L (phải) 9

Hình 1.6: Tập mờ Gamma tuyến tính 10

Hình 1.7: Tập mờ hình thang 10

Hình 2.1: Biểu diễn số mờ tam giác 24

Hình 2.2: Minh họa các bước chính trong giải thuật SIFT 26

Hình 2.3: Quá trình tính không gian đo (L) và hàm sai khác D 28

Hình 2.4: Quá trình tìm điểm cực trị trong các hàm sai khác DoG 29

Hình 2.5: Mô phỏng công thức mở rộng của Taylor cho hàm DoG 30

Hình 2.6:Minh họa các bước của quá trình lựa chọn các điểm keypoints 32

Hình 2.7: Tính độ lớn và hướng của Gradient 34

Hình 2.8: Tạo bộ mô tả cục bộ 35

Hình 2.9: Mô hình dữ liệu video 37

Hình 2.10: Sơ đồ khối thuật toán phát hiện chuyển cảnh 39

Hình 3.1: Mô hình bài toán tìm kiếm video trong CSDL 46

Hình 3.2: Quy trình tìm kiếm video bằng hình ảnh trong CSDL 47

Hình 3.3: Mô phỏng các điểm keypoint cần lưu trữ 48

Hình 3.4: Biểu diễn các tình huống trong trường hợp thông thường 50

Hình 3.5: Biểu diễn các tình huống trong trường hợp xấu 51

Hình 3.6: Sơ đồkhối đối sánh 2 số mờ tam giác 55

Hình 3.7: Giao diện chương trình phân đoạn và mờ hóa video 56

Hình 3.8: Giao diện chương trình Smart Cutter for DV and DVB 57

Hình 3.9: Mô hình lập trình socket TCP giữa 2 tiến trình client và server 59

Hình 3.10: Giao diện chương trình tìm kiếm video 61

Bảng dữ liệu thông tin Video 53

Bảng dữ liệu Video shot 54

Bảng kết quả đánh giá hiệu năng tìm kiếm 62

Trang 8

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

DANH MỤC TỪ TIẾNG ANH VÀ VIẾT TẮT iii

DANH MỤC BẢNG VÀ HÌNH VẼ v

MỤC LỤC vi

MỞ ĐẦU 1

1 Đặt vấn đề 1

2 Đối tượng và phạm vi nghiên cứu 2

3 Hướng nghiên cứu của đề tài 2

4 Những nội dung nghiên cứu chính 3

5 Phương pháp nghiên cứu 3

6 Ý nghĩa khoa học của đề tài 4

CHƯƠNG 1: TỔNG QUAN VỀ LÝ THUYẾT MỜ CSDL MỜ VÀ ỨNG DỤNG 5

1.1 Tổng quan về lý thuyết mờ 5

1.1.1 Khái niệm tập mờ 5

1.1.2 Một số khái niệm của tập mờ 5

1.1.3 Các phép toán trên tập mờ 6

1.1.4 Các kiểu hàm thuộc 9

1.1.5 Các loại số mờ 11

1.2 Cở sở dữ liệu mờ, phương thức biểu diễn và ứng dụng 12

1.2.1 Định nghĩa 12

1.2.2 Biểu diễn thuộc tính trong quan hệ mờ 13

1.2.3 So sánh các giá trị thuộc tính mờ 13

1.2.4 Các phép toán tập hợp trên quan hệ mờ 15

1.2.5 Các phép toán quan hệ mờ 15

1.2.6 Phụ thuộc hàm mờ 16

1.2.7 Các mô hình cơ sở dữ liệu mờ 17

a Mô hình tập con mờ 17

Trang 9

b Mô hình dựa trên quan hệ tương tự 17

c Mô hình dựa trên phân bố khả năng 18

d Mô hình dựa trên phân bố khả năng mở rộng 18

e Mô hình CSDL mờ dựa trên tổ hợp các mô hình trên 18

f Mô hình theo cách tiếp cận đại số gia tử 19

1.3 Tổng quan về phương pháp tìm kiếm mờ 19

1.3.1 Khoảng cách Levenshtein 20

1.3.2 Khoảng cách Damerau - Levenshtein 20

1.3.3 Thuật toán Bitap với những thay đổi của Wu và Manber 21

1.3.4 Phương pháp kiểm tra chính tả 22

1.3.5 Phương pháp N-gram 22

1.3.6 Cây - BK (BK - trees) 22

1.4 Kết luận chương 23

CHƯƠNG 2: THUẬT TOÁN TÌM KIẾM TRONG CSDL MỜ 23

2.1 Số mờ tam giác 24

2.1.1 Các phép toán trên số mờ tam giác 24

2.1.2 Quan hệ so sánh trên số mờ tam giác 25

2.2 Tổ chức dữ liệu cho thuật toán tìm kiếm dữ liệu mờ 26

2.2.1 Đối sánh ảnh dựa trên đặc trưng SIFT 26

a Phát hiện các điểm cực trị 27

b Định vị các điểm đặc trưng 31

c Xác định hướng cho các điểm đặc trưng 34

d Mô tả các điểm đặc trưng 35

e Đối sánh đặc trưng SIFT 37

2.2.2 Phân đoạn dữ liệu video 38

a Mô hình dữ liệu video 38

b Một số kỹ thuật phân đoạn video 39

c Kỹ thuật phân đoạn video bằng đối sánh đặc trưng SIFT 40

d Tóm tắt video 41

Trang 10

2.3 Cải tiến thuật toán tìm kiếm dữ liệu mờ 42

2.3.1 Thuật toán tìm kiếm 42

2.3.2 Thuật toán tìm kiếm dữ liệu mờ 44

2.3.3 Đánh giá thuật toán tìm kiếm 44

CHƯƠNG 3: CÀI ĐẶT THUẬT TOÁN TÌM KIẾM 46

3.1 Phân tích một số nhu cầu tìm kiếm video trong CSDL 46

3.2 Thiết kế mô hình bài toán tìm kiếm trong CSDL 47

3.2.1 Mô hình bài toán tìm kiếm video 47

3.2.2 Quy trình tìm kiếm video theo hình ảnh 48

3.2.3 Quy trình sử dụng logic mờ 49

3.2.4 Mở rộng csdl quan hệ thành csdl mờ dựa trên phân bố khả năng 50

a Bộ có trọng sốtrong quan hệ mờ 50

b Biểu diễn dữ liệu mờ bằng phân bố khả năng 51

c Mối quan hệ với dạng chuẩn 1NF 54

d Độ đo khả năng và độ đo cần thiết 54

3.3 Cài đặt thuật toán tìm kiếm mờ và một số giao diện chính 55

3.3.1 Lựa chọn công cụ 55

3.3.2 Thiết kế cơ sở dữ liệu 55

3.3.3 Cài đặt thuật toán tìm kiếm và một số giao diện chính 56

a Kỹ thuật đối sánh hai số mờ tam giác 56

b Cài đặt thuật toán phân đoạn video 57

c Cài đặt thuật toán trích chọn frame đại diện và mờ hóa video 59

d Kỹ thuật khởi tạo các tiến trình và trao đổi dữ liệu 60

e Cài đặt thuật toán tìm kiếm dữ liệu mờ 62

3.3.4 Thử nghiệm và đánh giá 64

KẾT LUẬN 65

TÀI LIỆU THAM KHẢO 67

Trang 11

MỞ ĐẦU

1 Đặt vấn đề

Ngày nay, cùng với sự phát triển nhanh chóng của Công nghệ tin học thì khối lượng dữ liệu rất lớn với sự phong phú, đa dạng và phức tạp của nhiều loại hình thông tin như: văn bản, hình ảnh, âm thanh, video được thu thập và lưu trữ dưới dạng số ngày càng nhiều Tương ứng với khối lượng dữ liệu khổng lồ đó, người ta quan tâm nhiều đến cơ sở dữ liệu mờ (Fuzzy Databases)trong khoa học công nghệ và trong thực tiễn Với hệ thống cơ sở

dữ liệu mờ, bao gồm các trường dữ liệu truyền thống và phi truyền thống dưới dạng hình ảnh, video, audio và văn bảnđang có xu thế thâm nhập vào rất nhiều lĩnh vực và đang dần trở thành hệ cơ sở dữ liệu được quan tâm từ người

sử dụng và các chuyên gia trong vấn đề lưu trữ, xử lý và ứng dụng Với khối lượng dữ liệu lớn này dẫn tới việc tìm kiếm dữ liệu trở nên khó khăn vì vậy cần có các hệ thống tìm kiếm thông tin (Information Retrieval) hỗ trợ người dùng tìm kiếm một cách chính xác và nhanh chóng các thông tin mà họ cần trên kho tư liệu khổng lồ này

Cho đến nay, vấn đề tìm kiếm thông tin theo điều kiện tìm kiếm mờ trong cơ sở dữ liệu vẫn được các chuyên gia nghiên cứu, trong việc truy tìm thông tin phù hợp với yêu cầu của một truy vấn đưa ra từ người sử dụng.Người sử dụng có xu hướng tìm kiếm chủ yếu trong cơ sở dữ liệu, ví dụ như tìm kiếm một loạt hình ảnh cổ vật liên quan đến nền văn hoá cổ Việt Nam, tìm kiếm dữ liệu âm thanh có bản text kèm theo, tìm kiếm video bài giảng cho học sinh ôn thi đại học

Bài toán tìm kiếm thông tin trong cơ sở dữ liệu đóng vai trò quan trọng

là bài toán so mẫu, với mẫu có thể ở bất kỳ kiểu dữ liệu nào, từ văn bản đến các loại dữ liệu đa phương tiện khác (hình ảnh, video, âm thanh, .) Trong

Trang 12

các bài toán tìm kiếm, để tìm kiếm nhanh đáp ứng được nhu cầu và không chỉ tìm kiếm cứng nhắc với từ khoá đưa ra Người dùng mong muốn có thể tìm được cả những thông tin liên quan gợi ý cho người dùng Vậy bài toán tìm kiếm trong cơ sở dữ liệu mờ theo điều kiện tìm kiếm mờ là rất cần thiết Do

đó cần phải xây dựng các thuật toán mềm dẻo cho phép phát huy được sức mạnh của tìm kiếm với điều kiện tìm kiếm mờ và đặc biệt cho phép sử dụng được nguồn tri thức giàu tính chuyên gia trong những tính huống tìm kiếm phức tạp

Để tìm kiếm những thông tin với điều kiện tìm kiếm mờ trong mô hình

cơ sở dữ liệu có cấu trúc gồm các trường dữ liệu truyền thống và phi truyền thống, có nhiều hướng tiếp cận khác nhau như cách tiếp cận theo lý thuyết tập

mờ, theo phân bố khả năng, theo quan hệ tương tự, Tất cả các cách tiếp cận này nhằm mục đích nắm bắt và xử lý một cách thỏa đáng các thông tin không đầy đủ (incomplete), thông tin không chính xác (unexact), hay những thông tin không chắc chắn (uncertainty)

Vì vậy, luận văn tập trung nghiên cứu về “Cải tiến thuật toán tìm kiếm trong cơ sở dữ liệu mờ”.

2 Đối tượng và phạm vi nghiên cứu

Đối tượng và phạm vi nghiên cứu của luận văn tập trung vào các phương pháp và giải pháp để tìm kiếm thông tin theo điều kiện tìm kiếm mờ (chứa đựng các thông tin không chắc chắn) trong cơ sở dữ liệu có cấu trúc gồm các trường dữ liệu truyền thống và phi truyền thống như: file text, file ảnh, video

3 Hướng nghiên cứu của đề tài

- Tìm hiểu về lý thuyết mờ và ứng dụng

- Tìm hiểu về cơ sở dữ liệu mờ và ứng dụng

Trang 13

- Tìm hiểu các kỹ thuật và quy trình tìm kiếm thông tin trong cơ sở

dữ liệu mờ với các yêu cầu tìm kiếm chứa đựng thông tin không rõ ràng không chính xác

- Cải tiến thuật toán tìm kiếm trong cơ sơ dữ liệu mờ

4 Những nội dung nghiên cứu chính

Luận văn được trình bày trong 3 chương, có phần mở đầu, phần kết luận, phần mục lục, phần tài liệu tham khảo và phần danh mục bảng và hình vẽ

Các nội dung cơ bản của luận văn được trình bày theo cấu trúc như sau:

Chương 1: Tổng quan về lý thuyết mờ, cơ sở dữ liệu mờ và ứng dụng

1.1 Tổng quan về lý thuyết mờ

1.2 Cở sở dữ liệu mờ, phương thức biểu diễn và ứng dụng

1.3 Tổng quan về phương pháp tìm kiếm mờ

1.4 Kết luận chương

Chương 2: Thuật toán tìm kiếm trong cơ sở dữ liệu mờ

2.1 Số mờ tam giác

2.2 Tổ chức dữ liệu cho thuật toán tìm kiếm dữ liệu mờ

2.3 Cải tiến thuật toán tìm kiếm dữ liệu mờ

Chương 3:Cài đặt thuật toán tìm kiếm trong cơ sở dữ liệu quản lý các

chương trình truyền hình Đài PT-TH tỉnh Hòa Bình

3.1 Phân tích một số nhu cầu tìm kiếm video trong CSDL quản lý các chương trình truyền hình

3.2 Thiết kế mô hình bài toán tìm kiếm trong CSDL mờ quản lý các chương trình truyền hình

3.3 Cài đặt thuật toán tìm kiếm mờ và một số giao diện chính

5 Phương pháp nghiên cứu

Trang 14

Sử dụng các phương pháp nghiên cứu chính sau:

- Phương pháp nghiên cứu lý thuyết: Phân tích, liệt kê, đối sánh, nghiên cứu tài liệu, tổng hợp các kết quả của các nhà nghiên cứu liên quan đến lĩnh vực nghiên cứu

- Phương pháp trao đổi khoa học, lấy ý kiến chuyên gia

- Phương pháp thực nghiệm: Cài đặt thử nghiệm thuật toán cho bài toán tìm kiếm với điều kiện tìm kiếm mờ trong cơ sở dữ liệu mờ quản lý các

chương trình truyền hình

6 Ý nghĩa khoa học của đề tài

- Giúp tìm hiểu, đánh giá khái quát về hệ cơ sở dữ liệu mờ, các thuật toán tìm kiếm với điều kiện tìm kiếm mờ

- Vận dụng tốt thuật toán tìm kiếm với điều kiện tìm kiếm mờ, giúp chúng ta có thể dễ dàng tìm kiếm những nội dung trong cơ sở dữ liệu

- Xây dựng cơ sở khoa học cho các bài toán tìm kiếm trong cơ sở dữ liệu

Trang 15

CHƯƠNG 1: TỔNG QUAN VỀ LÝ THUYẾT MỜCƠ SỞ DỮ LIỆU MỜ VÀ ỨNG DỤNG

1.1 Tổng quan về lý thuyết mờ[5]

L.A Zadeh là người sáng lập ra lý thuyết tập mờ với hàng loạt bài báo

mở đường cho sự phát triển và ứng dụng của lý thuyết này, khởi đầu là bài báo “Fuzzy Sets” trên Tạp chí Information and Control, 8, 1965 Ý tưởng nổi bật của khái niệm tập mờ của Zadeh là từ những khái niệm trừu tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ, nhanh, caothấp, xinh đẹp , ông đã tìm ra cách biểu diễn nó bằng một khái niệm toán học, được gọi là tập

mờ, như là một sự khái quát trực tiếp của khái niệm tập hợp kinh điển

1.1.2 Một số khái niệm của tập mờ

Định nghĩa 1.1.1.Độ cao của một tập mờ A trên không gian nền Xlà giá

Trang 16

S = suppµ A (x) = {x ∈ X / µ A (x) > 0}

Định nghĩa 1.1.3 Miền tin cậy của tập mờ tập mờ A trên không gian nền

X được ký hiệu bởiT là tập con của X thoả mãn: T = {x ∈X / µ A (x) = 1}

Định nghĩa 1.1.4 Miền biên của tập mờ tập mờ A trên không gian nền X được ký hiệu bởiU là tập con của Xthoả mãn: U = {x ∈X / 0< µ A (x) < 1}

Hình 1.1: Biểu diễn các miền của một tập mờ Định nghĩa 1.1.5 Tập cắt α (α ∈ [0,1]) của tập mờ A trên không gian nền

X được ký hiệu bởiA α là tập con của Xthỏa mãnA α = {x / µ A (x)≥ α} và được gọi là tập cắt mạnh α và ký hiệu là A α+ nếu A α+ = {x / µ A (x)>α}

Định nghĩa 1.1.6 Tập mức α, hay là tập nhát cắt - α của tập mờ tập mờ

A trên không gian nền Xký hiệu bởi Λ(A) là tập các tập con của Xthỏa mãn:

Λ(A) = {x / µ A (x) = α} vớiα ∈[0,1]

Định nghĩa 1.1.7 Tập mờ A trên không gian nền X tuyến tính được gọi

là tập mờ lồi nếu A α là tập lồi ∀ ∈ [0,1]

Định nghĩa 1.1.8 Lực lượng của tập mờ A trên không gian nền X được

biểu diễn như sau:

1.1.3 Các phép toán trên tập mờ

a) Phép hợp hai tập mờ:

( , ( )) = ( )

Trang 17

Định nghĩa 1.1.8: Hợp của hai tập mờ A B là một tập mờ được xác định trong không gian nền X và có hàm liên thuộcµ A B (x) thỏa mãn các tiên

Định nghĩa 1.1.9: Giao của hai tập mờ A và B là một tập mờ A ÇBxác định trong không gian nền Xcó hàm liên thuộcµ A ÇB (x) thỏa mãn các tiên đề: + Chỉ phụ thuộc vào µ A (x) và µ B (x)

Định nghĩa 1.1.10:Tập bù của tập mờA trên nền X là một tập mờ ( ,

µ )xác định trên không gian nền Xvới hàm liên thuộc thỏamãn các điều kiện: +µ (x) chỉ phụ thuộc vào µ A (x)

+ Nếu µ A (x) = 0 thì µ (x) = 1

+ Nếu µ A (x) = 1 thì µ (x) = 0

+ Nếu AB thì có µ (x) ≥ µ (x)

Trang 18

Định nghĩa 1.1.11: Tập bù của tập mờ A trên nền X là một tập mờ ( ,

µ )xác địnhtrên không gian nền Xvới hàm liên thuộcµ(µ A): [0,1] → [0,1] thỏa mãn các điều kiện sau:

Hình 1.2: Biểu diễn hàm liên thuộc của phép lấy phần bù

d Phép hiệu đối xứng: Mở rộng công thức cho phép hiệu đối xứng cáctập kinh điển: A ∇B = (A B) \ (A ÇB) = (A Ç ) ( ÇB)có thể xây dựng

phép hiệu đối xứng cho các tập mờ Từ công thức xác định hàm liên thuộc đối với phép hiệu đối xứng của các tập kinh điển Có thể áp dụng trực tiếp để xây

dựng hàm liên thuộc hiệu đối xứng của các tập mờ (A, µ A (x)) và (B, µ B (x))

µ A ∇ B (x) = µ A (x) + µ B (x) – 2µ A (x) ´µ B (x)

e Tích Đề các: Cho n tập mờ (x i , µ Ai (x i )), i=1,2, n trên các không gian nền Xi Tích Đề các của n tập mờ là một tập mờ:

{(x1, x2, xn), µ X1´X2´ ´Xn (x1, x2, xn)}

Trang 19

trên không gian nề

a Tam giác (Triangular):Định nghĩa bởi các cận dưới a, c

b Chúng ta gọi giá trị b-m là biên (margin) n

0 nếu ≤ hoặc ≥

nếu < <

1 nếu =

p mờ hình tam giác: a)Tổng quát và b) Đ

Có giá trị 0 tại tất cả các điểm trong tập vũ trụ

1, dùng để biểu diễn các giá trị rõ

ng quát và b) Đối xứng

ụ, ngoại trừ tại

và b theo cách:

Trang 21

ố thực với hàm liên thuộc:

( ) =

( )khi ≤ ≤ ( )khi ≤ ≤ +

0 khi ( < ) Λ ( > +

ng tam giác:Là một tập mờ có dạng [ a-α, a, a

ực với hàm liên thuộc:

+ 1 khi ≤ ≤ + 1 khi ≤ ≤ +

0 khi < và >

ng hình thang: Là một tập mờ có dạng [ a-α, a,

ố thực với hàm liên thuộc:

(x)) trong không gian nền số

a+β] trong đó

+ )

a+β ] trong đó

+

, b, b+β ] trong

Trang 22

( , , )( ) =

1 khi ≤ ≤ + 1 khi ≤ ≤

+ 1 khi ≤ ≤ +

0 khi( < )hoặc ( > + )

e Số mờ dạng khoảng: Là tập mờ có dạng (a, ε) trong đó ε ≥ 0 là các số

thực với hàm liên thuộc:

( , )( ) =

+ 1 khi ≤ ≤ + 1 khi ≤ ≤ +

0 khi hoặc > +

1.2 Cở sở dữ liệu mờ, phương thức biểu diễn và ứng dụng[5]

Mô hình quan hệ do Codd E F đề xuất năm 1970 đã đáp ứng được nhu cầu lưu trữ và xử lý dữ liệu của con người trong một thời gian dài Tuy nhiên,

mô hình này vẫn tồn tại nhiều hạn chế chưa giải quyết được Trên thực tế, đôi khi chúng ta có thể thu nhận được dữ liệu với thông tin không đầy đủ, hoặc có những thông tin không chính xác, không chắc chắn gọi chung là các dữ liệu

mờ Nếu giới hạn trong mô hình cơ sở dữ liệu kinh điển thì phải đợi đầy đủ thông tin về đối tượng mới cập nhật vào cơ sở dữ liệu, hoặc nếu cứ cập nhật thì sẽ gây khó khăn, mất ngữ nghĩa và không nhất quán trong xử lý dữ liệu

Do đó để đáp ứng nhu cầu thực tế, mô hình cơ sở dữ liệu đã được mở rộng để biểu diễn và xử lý những dữ liệu mờ gọi là cơ sở dữ liệu mờ (Fuzzy Databases)

1.2.1 Định nghĩa

Cho W=(, A1, A2, A n) là tập hữu hạn các thuộc tính, các miền giá trị

tương ứng D(A 1 ), D(A 2 ), D(A n ), D() =[0,1] Trong đó, D(A i ) (i=1 n) có thể nhận giá trị rõ hoặc giá trị mờ Một quan hệ mờ fr trên lược đồ quan hệ mờ là tập con của tích Descartes D(A1) ´D(A2) ´ ´D(A n ) ´D()

Trang 23

Một bộ dữ liệu tfr có dạng: (t, fr (t)) Do đó quan hệ fr có thể biểu diễn

lại như sau:

fr = {(t, fr (t) | fr (t)[0,1] và tr} VớirD(A1) ´D(A2) ´ ´D(A n)

1.2.2 Biểu diễn thuộc tính trong quan hệ mờ

Xét lược đồ quan hệ R=(, A1, A n)

Đối với thuộc tính A i là rõ thì D(A i )=U(A i)

Đối với thuộc tính A i là thuộc tính mờ thì:

D(A i )=U(A i ) T(A i ) F(A i ) I(A i)

Ở đâyU(A i ): Là miền giá trị cơ sở, T(A i): Tập các giá trị ngôn ngữ của

biến ngôn ngữ A i , F(A i): Tập các tập mờ biểu diễn dưới dạng số mờ hình

thang, I(A i): Tập các tập mờ biểu diễn dưới dạng số mờ dạng khoảng Rõ ràng

là trong nhiều trường hợp các tập giá trị có thể là tập rỗng

Trong cơ sở dữ liệu quan hệ truyền thống, các phép toán quan hệ được thực hiện dựa trên cơ sở việc đánh giá dữ liệu chỉ thể hiện ở hai trang thái là

"đúng" hoặc "sai" Đối với cơ sở dữ liệu quan hệ mờ, với miền trị của thuộc tính mờ được mở rộng như trên, thì rõ ràng cách đánh giá dữ liệu truyền thống là không phù hợp, mà phải đánh giá trên cơ sở hàm thuộc của tập mờ, trong đó trạng thái "đúng" tương ứng với 1, trạng thái "sai" tương ứng với 0 Còn những giá trị  (0,1) là phản ánh mức độ đúng sai của việc đánh giá: càng gần 1 càng đúng, càng gần 0 càng sai Bởi vậy trong mỗi quan hệ mờ sẽ

có một thuộc tính đặc biệt gọi là thuộc tính độ thỏa, ký hiệu là  với Dom()

= [0,1], dùng để chỉ mức độ là thành viên của mỗi bộ trong quan hệ

1.2.3 So sánh các giá trị thuộc tính mờ

Trong mô hình quan hệ kinh điển các thao tác và các phép toán so sánh giá trị:  Để đánh giá được phép so sánh trên thì trước hết phải chuyển đổi dữ liệu ở cả hai vế của phép so sánh về cùng một dạng và điều đó

Trang 24

chỉ có thể làm được khi chuyển về dạng tập mờ, sau đó các phép so sánh sẽ dựa trên các tham số này

Dưới đây sẽ trình bày phương pháp xây dựng hàm đánh giá các phép so sánh giữa hai tập mờ 1, 2 ký hiệu là (1 2), trong đó  là một trong các phép so sánh  và:

1 = (a1, b1, c1, d1), thoả mãn a1b1c1d1

2 = (a2, b2, c2, d2), thoả mãn a2b2c2d2

Hàm đánh giá sẽ được xây dựng trên cơ sở hàm thuộc của tập mờ hình

thang và các tham số a1, b1, c1, d1; a2, b2, c2, d2, của hai tập mờ

Gọi S f1 ,S f2 là biểu diễn số mờ hình thang tương ứng của 2 tập mờ f1 và f2

Nếu  là phép "="cần xây dựng sao cho khi f1 và f2 gần nhau thì

(f1f2) 1, khi f1 và f2 xa nhau thì (f1f2) 0

Trường hợp 1: Nếu S f1 ÇS f2= Æ thì (f1 f2) = 0

Trường hợp 2: Nếu S f1 S f2 hoặcS f2 S f1 thì (f1 f2) = 1

Trường hợp 3: Nếu f1P(A) và f2U(A) hoặc f1U(A) và f2P(A), khi

đó giá trị hàm (f1 f2) chính là giao điểm I của S f1 và S f2

Trường hợp 4: Nếu f1P(A) và f2P(A) nhưng S f1 ÇS f2 Æ và f1 f2 và f2

f1, khi đó hàm  được xây dựng như sau:

Trang 25

Nếu  là phép so sánh "" Ta có (f1 f2) (f2 f1) Vì vậy chỉ cần hoán đổi 2 tập mờ f1 và f2

Nếu  là phép so sánh "<" Ta có (f1 <f2) = 1-(f1 f2)

Nếu  là phép so sánh ">"Ta có (f1 >f2) (f2 <f1) Vì vậy chỉ cần hoán

đổi 2 tập mờ f1 và f2

1.2.4 Các phép toán tập hợp trên quan hệ mờ

* Phép hợp: Hợp của 2 quan hệ fr1 và fr2 khả hợp (tập các thuộc tính

như nhau) là một quan hệ trên R1 ký hiệu fr1 fr2 và được xác định như sau:

fr1fr2 = (t, fr1 (t) fr2 (t))  (t, fr1 (t) fr1 hoặc (t, fr2 (t)) fr2

* Phép giao: Giao của 2 quan hệ mờ fr1 và fr2 là một quan hệ mờ trên R,

ký hiệu fr1Çfr2 và được xác định như sau:

fr1Çfr2 = (t, fr1 (t) fr2 (t))  (t, fr1 (t) fr1 và (t, fr2 (t)) fr2

* Phép tích đề các: Cho fr1 xác định trên R1, fr2 xác định trên R2 Tích

Đề các fr1 và fr2 ký hiệu:

fr1´fr2 = (t ,t2),(fr1 (t1) fr2 (t2))  (t1, fr1 (t1) fr1 , (t2, fr2 (t)) fr2

* Phép trừ: Cho fr1 và fr2 là 2 quan hệ mờ trên R = A1, A2, , An, 

Hiệu của fr1 và fr2 là 1 quan hệ mờ trên R, Ký hiệu fr1–fr2 và xác định:

Cho R = A1, A2, , A n, , fr là quan hệ mờ trên R

AR, cD(A) Phép chọn Fs được định nghĩa như sau:

Trang 26

Fs Ac (fr) = (t, fr (t)) (t[A]c)  ( t, fr (t) fr và fr (t) (t[A]c) ) Trong đó  : là ngưỡng được chọn và  (0, 1], , , ,  =, , 

* Phép chiếu mờ (Fuzzy projection)

Cho quan hệ mờ fr = (t, fr (t)) trên lược đồ quan hệ R, X R

Với mỗi bộ (t, fr (t)) fr, ký hiệu t x là tập các bộ (t1, fr (t1)) fr mà

t1[X] = t[X] có nghĩa tx = t1 (t1, fr (t1)) fr và t1[X] = t[X]) = 1

Phép chiếu mờ của fr trên X là một quan hệ trên X được định nghĩa:

Fp x (fr) = 

∈ fr (t1), t[X]

* Phép kết nối tự nhiên mờ (Fuzzy Natural joint)

Cho fr 1 = (t1, fr1 (t1)) và fr2 = (t2, fr2 (t2)) là 2 quan hệ mờ trên R1, R2, AR1, BR2, R1ÇR2 = R3, R1R2 = R

Nếu R3Æ ta định nghĩaphép nối tự nhiên mờ như sau:

F NJ fr1 fr2 = (t, fr1 (t 1) (t1[C]=t2[C]))  /  (t1, fr1 (t1) r1 và (t2,

fr2 (t2) fr2 mà t[A] = t1[A] và t[B] = t2[B] và t[C] = t1[C] = t2[C]

Trong đó fr1 xác định trên AC và fr2 xác định trên CB và AÇBÇC = Æ

* Phép kết nối mờ ( Fuzzy join)

Trong trường hợp  là những phép toán: , , , ,  thì phét kết nối

tự nhiên sẽ thành phép kết nối mờ  Phép kết nối mờ  của 2 quan hệ fr1 và

fr2 trên 2 thuộc tính A và B được định nghĩa như sau:

Trang 27

chúng xấp xỉ bằng nhau trên X thì cũng xấp xỉ bằng nhau trên Y Có nghĩa là X~>Y (t1, t2fr) ((t1[X]=t2[X]) ) (t1[Y]=t2[Y])  ( (0,1])

1.2.7 Các mô hình cơ sở dữ liệu mờ

a Mô hình tập con mờ

Mô hình này được Baldwin và Zhou đưa ra năm 1984, Zvieli đưa ra năm

1986 Cách tiếp cận này không mở rộng miền trị của thuộc tính mà mở rộng ngữ nghĩa của dữ liệu rõ, xem mỗi quan hệ như một tập con mờ của tích Đềcác của các miền trị thuộc tính Mỗi bộ trong quan hệ với các dữ liệu rõ, được gán với một số thuộc miền [0, 1], chỉ độ thuộc của bộ đó vào quan hệ Như vậy, mỗi bộ của một quan hệ trong mô hình này có dạng:

t = <a1, a2, …, a i , …, an, >

với ai là giá trị các thuộc tính Ai, tức là aiDom(Ai),  [0, 1], là độ thuộc của mỗi bộ vào quan hệ

b Mô hình dựa trên quan hệ tương tự

Cách tiếp cận quan hệ tương tự đã được Buckles và Petry đề xuất năm

1982 Trong mô hình này, giá trị tại mỗi thuộc tính của đối tượng có thể là đơn trị hoặc đa trị nhưng có một ràng buộc là các giá trị đòi hỏi phải “đủ tương tự nhau”, hay nói cách khác là độ tương tự của hai giá trị bất kỳ trong miền trị không nhỏ hơn ngưỡng cho trước

Định nghĩa: Một quan hệ tương tựtrên tập U là một ánh xạ:

U´U[0, 1], có các tính chất sau:

(1) ∀x U, Sim (x, x) = 1 - tính phản xạ

(2) ∀x, y U, Sim (x, y) = Sim (y, x) - tính đối xứng

(3) ∀x, y, z U, Sim (x, z)  maxy(min(Sim(x, y), Sim(y, z))) - tính bắc

cầu max - min

Như vậy, mỗi bộ của một quan hệ trong mô hình này có dạng:

t = <p1, p2, …, pi, …, pn>

Trang 28

với piDi, trong đó Di là miền trị của thuộc tính Ai, trên mỗi Di có xác

định một quan hệ tương tự giữa mọi cặp giá trị bất kỳ thuộc miền trị

c Mô hình dựa trên phân bố khả năng

Mô hình này được đề xuất bởi Prade và Testermale vào năm 1983 bằng cách mở rộng miền trị thuộc tính, sử dụng phân bố khả năng để biểu diễn giá trị một bộ của một thuộc tính Việc dùng phân bố khả năng để biểu diễn dữ liệu mờ cho phép biểu diễn được nhiều dạng dữ liệu thường gặp trong thực tế như dữ liệu rõ, dữ liệu chưa biết, dữ liệu thiếu thông tin, dữ liệu không chắc chắn…

Như vậy, mỗi bộ của một quan hệ trong mô hình này có dạng:

t = <π A1 ,π A2 , …, π Ai , …, π An>

với π Ai là phân bố khả năng của thuộc tính A i trên miền trị D i của nó, (π Ailà một

tập con mờ trên D i và π Ai (x), xD i , là khả năng x là giá trị thực sự của t[A i])

d Mô hình dựa trên phân bố khả năng mở rộng

Mô hình này là cách tiếp cận mở rộng của lý thuyết phân bố khả năng đã trình bày ở trên, tuy nhiên trong mô hình này cho phép các quan hệ giống nhau được liên kết với các miền giá trị

Như vậy, mỗi bộ của một quan hệ mờ trong mô hình dựa trên phân bố khả năng mở rộng cũng có dạng như trong mô hình dựa trên phân bố khả năng, tuy nhiên, khi xem xét mối liên quan giữa các bộ (liên quan dư thừa bộ, liên quan về phụ thuộc dữ liệu…), thì người ta có tính đến các quan hệ giống nhau được liên kết với miền trị của các thuộc tính

e Mô hình CSDL mờ dựa trên tổ hợp các mô hình trên

Theo cách tiếp cận này, tính mờ có liên quan đến độ thuộc của các bộ vào CSDL, tính mờ thể hiện trong các giá trị thuộc tính và quan hệ giữa các phẩn tử của miền trị của thuộc tính.Như vậy, cách tiếp cận này là tổ hợp của

Trang 29

cách tiếp cận theo phân bố khả năng, theo quan hệ tương tự và theo mô hình tập con mờ Mỗi bộ của một quan hệ trong mô hình này có dạng:

t = {π A1 , π A2 , …, π Ai , …, π An,t}

Trong đó các giá trị thuộc tính là các phân bố khả năng, trong đó π Ai π Ui,

ngoài ra, mỗi bộ t còn được gán giá trị t (0 ≤ t ≤ 1) biểu diễn khả năng để một bộthuộc quan hệ

f Mô hình theo cách tiếp cận đại số gia tử

Theo cách tiếp cận này giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểu diễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phép tìm kiếm, đánh giá ngữ nghĩa của thông tin không

chắc chắn chỉ bằng các thao tác dữ liệu kinh điển thường dùng

Vì tất cả các thuộc tính có miền trị chứa giá trị số trong CSDL đều tuyến tính, nên một cách tự nhiên ta giả thiết ĐSGT được sử dụng là ĐSGT tuyến

tính, do đó tập H+ và H là tập sắp thứ tự tuyến tính

Như vậy, cho X = (X, G, H, ≤ ) với G = {0, c-, W, c + , 1}, H = H H+ với

giả thiết H = {h1,h2, , h p }, H+ = {h -1 , , h -q }, h1>h2> >h p vàh -1 < <h -q là dãy các gia tử

1.3 Tổng quan về phương pháp tìm kiếm mờ

Tìm kiếm "mờ" hay còn được gọi là tìm kiếm "tương tự" là khái niệm để chỉ kỹ thuật tìm kiếm thông tin với điều kiện tìm kiếm không chính xác Tìm kiếm mờ được thực hiện bằng phương tiện của một chương trình kết hợp mờ,

mà trả về một danh sách các kết quả dựa trên sự liên quan có khả năng mặc

dù những điều kiện tìm kiếm có thể không phù hợp chính xác

Tìm kiếm mờ là một tính năng rất hữu ích của bất kỳ công cụ tìm kiếm Tuy nhiên, để thực hiện có hiệu quả kỹ thuật tìm kiếm này là phức tạp hơn nhiều so với việc thực hiện một tìm kiếm đơn giản cho một kết quả chính xác

Trang 30

Sau đây là các thuật toán tìm ki

tương tự)

1.3.1 Khoảng cách Levenshtein

Khoảng cách Levenshtein (Levenshtein distance) là thu

theo tên của nhà khoa h

năm 1965 Khoảng cách Levenshtein, còn

cách", tư tưởng của thu

thông qua 3 phép biến đ

ng cách Levenshtein (Levenshtein distance) là thuật toán đư

a nhà khoa học người Nga, người đã nghiên cứu và phát tri

ng cách Levenshtein, còn được gọi là "chỉnh s

a thuật toán là số bước ít nhất biến một xâu A thành xâu B

n đổi: Thêm một ký tự, Bớt một ký tự, Thay đ

ậy, khoảng cách Levenshtein giữa 2 xâu thang và tung

ng cách Damerau-Levenshtein

ng cách Damerau-Levenshtein (Damerau-Levenshtein distance)

c Frederick J Damerau đề xuất, Khoảng cách Damerauảng cách Levenshtein bằng cách chuyển v

t thước đo khoảng cách khác nhau, được gLevenshtein

Trang 31

Di,j = min(X i + 1, X

=

1.3.3 Thuật toán Bitap v

Thuật toán Bitap và các đi

dụng để tìm kiếm mờ

Ricardo Baeza-Yates

Manber đề xuất sửa đổ

Để thực hiện tìm ki

bit R sang chiều thứ hai.

dài của văn bản, bây gi

đại diện của các tiền tố

tại với lỗi ít hơn Trong b

t toán Bitap với những thay đổi của Wu và Manber

t toán Bitap và các điều chỉnh khác nhau của nó thư

mà không lập chỉ mục Thuật toán đượ

Yates và GastonGonnet, sau đó được Sun Wu

ổi thuật toán để tính khoảng cách Levenshtein

n tìm kiếm mờ bằng thuật toán Bitap, mhai Thay vì có một mảng R duy nhất mà thay đ

n, bây giờ chúng ta có k mảng riêng biệt R 1 k Mả

ố của mô hình phù hợp với bất kỳ hậu tố cTrong bối cảnh này, một "lỗi" có thể là chèn, xóa, ho

là chèn, xóa, hoặc thay

)

Trang 32

= ∨ ∨

1.3.4 Phương pháp kiểm tra chính tả

Phương pháp kiểm tra chính tả (Spell-checker method),Thuật toán thường được sử dụng trong các hệ thống sửa lỗi chính tả, khi kích thước của

từ điển là nhỏ, hoặc khi tốc độ không phải là tiêu chí chính Thuật toán dựa vào việc giảm các vấn đề của tìm kiếm mờ cho vấn đề tìm kiếm chính xác Một tập hợp các từ "tìm kiếm" được xây dựng từ truy vấn ban đầu Sau đó,

mỗi “từ” từ bộ này là tìm kiếm trong từ điển để đưa ra kết quả chính xác

1.3.5 Phương pháp N-gram

Phương pháp nàyđược phát minhtừ lâu, vàđược dùng rộng rãivìthực hiệncủa nó làtương đối đơn giảnvà nó cung cấpmột hiệu suấtkhá tốt.Thuật toán này đượcdựatrên nguyên tắc: "Nếu từ Aphù hợpvới từBxem xét một vàisai sót, sau đó sẽrất có thể cóít nhất mộtchuỗi conchungdàiN" Nhữngchuỗi concó chiều dài Nđượcđặt tên là"N-gram" Tạibướclập chỉ mục, từ này được phân chia thànhN-gram, và sau đó làtừ đượcthêm vào danh sáchtương ứng vớimỗi một trong cácN-gram Tại bướctìm kiếm,truy vấn cũng sẽđượcphân chia thànhN-gram, và cho mỗichúngdanh sáchtương ứngđược quétbằng cách

sử dụngcác số liệu

1.3.6 Cây-BK (BK-trees)

Cây-BK (Burkhard-Keller) là cây thước đo, các thuật toán để xây dựng

cây như vậy dựa vào khả năng của các số liệu để đáp ứng các bất đẳng thức tam giác:

p(x,y) ≤p(x,z) + p(z,y) với x,y,z ∈X

Thuộc tính này cho phép các số liệu để tạo thành các không gian kích

thước tùy ý Những không gian này là không nhất thiết phải Euclide, ví dụ, các Levenshtein và Damerau-Levenshtein số liệu tạo thành một phi-Euclide

Trang 33

không gian Dựa trên tính chất, có thể xây dựng một cấu trúc dữ liệu cây Barkhard-Keller để tìm kiếm trong một không gian

1.4 Kết luận chương

Chương 1 luận văn trình bày các nền tảng lý thuyết cơ bản phục vụ thực hiện cho các chương sau cụ thể là:

Tổng quan về lý thuyết mờ

Tổng quan về cơ sở dữ liệu mờ

Tổng quan một số phương pháp tìm kiếm mờ

CHƯƠNG 2: THUẬT TOÁN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU MỜ

Việc truy vấn video sẽ tìm ra các video tương tự về nội dung với hình ảnh cần truy vấn Vấn đề đặt ra là cần xây dựng một hệ thống tìm kiếm các hình ảnh tương tự trong video nhưng vẫn đảm bảo về tốc độ và không gian truy vấn Để giải quyết bài toán tìm kiếm video tương tự này, luận văn chia trình tự video thành các video cơ sở (lia, shot) sau đó sẽ trích xuất đặc trưng

Trang 34

cục bộ trên mỗi hình ảnh đại diện của video cơ sở này dựa trên phương pháp Scale Invariant Feature Transform (SIFT), đồng thời xây dựng tập số mờ tam giác để thực hiện tìm kiếm video.

2.1.1 Các phép toán trên số mờ tam giác

Ký hiệu Θ là một trong các phép toán {+, –, *, /}

Ký hiệu: – (a, α, β) = (–a, β, α); = (0,0,0); = (1,0,0)

( )( ) =

1 khi ≤ ≤ ( ) khi ∞ ≤ ≤ ( )khi ≤ ≤ +∞

Trang 35

(-2.1: Biểu diễn số mờ tam giác – (a, α, β)

: Hai số mờ tam giác = (a, α, β) tương

, λ, γ) ứng với tập mờ (B, µ B (x)) khi đó các phép toán

ư sau:

δ với ∀δ∈ (0,1]

(b, λ, γ) = (A Θ B) = ∈[ , ]( Θ )

n có thêm điều kiện 0 ∈ Bδ với ∀δ∈ (0,1]

: Phép nhân số mờ tam giác với 1 số:

Trang 36

Định nghĩa 2.1.6: Hàm ƒ:TFN´TFN → R được gọi là hàm xác định

quan hệ so sánh trên TFN nếu thỏa mãn các điều kiện:

ƒ( , ) ≥ 0 ; ∀ ∈TFN

Nếu ƒ( , ) ≥ 0 và ƒ( , ) ≥ 0 thì = ;

Nếu ƒ( , ) ≥ 0 và ƒ( , ) ≥ 0 thì ƒ( , ) ≥ 0;

Định nghĩa 2.1.7: Hàm xác định quan hệ so sánh trên TFN được gọi là

hàm xác định quan hệ so sánh toàn phần nếu thỏa mãn điều kiện:

∀ , ∈TFN ta có hoặc ƒ( , ) ≥ 0 hoặc ƒ( , ) ≥ 0

Định nghĩa 2.1.8: Hàm xác định quan hệ so sánh toàn phần trên TFN

được gọi là hàm xác định quan hệ so sánh chặt nếu thỏa mãn điều kiện:

Nếu ƒ( , ) ≥ 0 và ƒ( , ) ≥ 0 thì ƒ( + , + ) ≥ 0;

Nếu ƒ( , ) ≥ 0 và k ≥ 0thì ƒ( , ) ≥ 0;

2.2 Tổ chức dữ liệu cho thuật toán tìm kiếm dữ liệu mờ

2.2.1 Đối sánh ảnh dựa trên đặc trưng SIFT[15]

Phương pháp tra cứu này có tên là Scale-Invariant Feature Transform (SIFT) và đặc trưng trích rút đựợc gọi là đặc trưng SIFT Phương pháp này trích rút các đặc trưng cục bộ bất biến của ảnh Các đặc trưng này bất biến với việc thay đổi tỉ lệ ảnh, quay ảnh, đôi khi là thay đổi điểm nhìn và thêm nhiễu ảnh hay thay đổi cường độ chiếu sáng của ảnh Các đặc trưng này được trích rút ra từ các điểm đặc trưng cục bộ Điểm đặc trưng: Là vị trí (điểm ảnh) “đặc trưng” trên ảnh “Đặc trưng” ở đây có nghĩa là điểm đó có thể có các đặc trưng bất biến với việc quay ảnh, co giãn ảnh hay thay đổi cường độ chiếu sáng của ảnh

Một thuật toán tiêu biểu và có hiệu quả khá cao là dựa theo các đặc trưng cục bộ bất biến trong ảnh: SIFT (Scale-Invariant Feature Transform) do David Lowe đưa ra từ năm 2004 và đến nay đã có nhiều cải tiến trong thuật toán Đặc trưng được trích chọn trong SIFT là các keypoint Keypoint là một

Trang 37

điểm hoặc một vùng trong ảnh chứa rất nhiều thông tin cục bộ và không bị thay đổi bởi các hoạt động nhiễu toàn cục hay địa phương như là: biến đổi hình học Affine, tỉ lệ, quay, độ chiếu sáng…

Phươngpháp trích rút các đặc trưng bất biến SIFT được tiếp cận theo phương pháp lọc kim tự tháp, theo đó phương pháp được thực hiện lần lượt theo các bước sau:

Hình 2.2: Minh họa các bước chính trong giải thuật SIFT

a Phát hiện các điểm cực trị (Scale-Space extrema detection)

Bước đầu tiên này tiến hành tìm kiếm các keypoint trên tất cả các tỉ lệ và

vị trí của ảnh áp dụng đạo hàm của hàm Gaussian (DoG - Deffirence of Gaussisan) để xác định tất cả các keypoint tiềm năng mà bất biến với quy mô

và hướng của ảnh Trong bước này, cần dò tìm các vị trí và các độ đo mà chúng bất biến trong các khung nhìn khác nhau của cùng một đối tượng Các

vị trí đó bất biến về độ đo có thể được dò tìm bằng cách tìm kiếm các đặc trưng ổn định trên toàn bộ các độ đo có thể, sử dụng một hàm liên tục về số

đo vốn rất nổi tiếng có tên là hàm độ đo không gian (Witkin 1983)

Trang 38

Theo các công bố của Koenderink (1984) và Lindeberg(1994) thì hàm Gaussian là hàm tốt nhất để biễu diễn độ đo không gian của ảnh 2 chiều Độ

đo không gian của một ảnh sẽ được định nghĩa như là một làm L(x, y, σ) được tạo ra bằng cách nhân chập ảnh gốc I(x, y) với môt hàm Gaussian G(x, y, σ) có tham số về độ đo σ thay đổi.

L(x,y,σ) = G(x,y, σ) * I(x,y)

Với:

L(x, y, σ): Hàm không gian tỷ lệ của ảnh I

G (x, y, σ): biến tỉ lệ Gaussian (variable scale Gaussian)

I (x, y): Ảnh đầu vào

* là phép nhân chập giữa x và y

Để tìm những điểm đặc trưng có tính bất biến cao, thuật toán được sử dụng là tìm cực trị cục bộ của đạo hàm của hàm Gaussian viết tắt là DoG

(Difference-of Gaussian), kí hiệu là D(x,y,σ) Hàm này được tính toán từ sự

sai khác giữa 2 độ đo không gian cạnh nhau của một ảnh với tham số đo lệch

nhau một hằng số k

D(x,y,σ) = L(x,y,kσ) –L(x,y,σ) = (G(x,y,kσ) – G(x,y,σ)) * I(x,y)

Các lý do lựa chọn hàm Gaussian là vì nó là kỹ thuật rất hiệu quả để tính

toán L (cũng như làm tăng độ mịn của ảnh), mà L thì luôn phải được tính rất nhiều để mô tả đặc trưng trong không gian đo, và sau đóD sẽ được tính một

cách đơn giản chỉ với phép trừ ma trận điểm ảnh với chi phí thực hiện thấp

Trang 39

Hình 2.3: Quá trình tính không gian đo (L) và hàm sai khác D

Hơn nữa, hàm sai khác DoG có thể được sử dụng để tạo ra một sự xấp xỉ gầnvới đạo hàm bậc hai Laplace có kích thước chuẩn của hàm Gaussian

(σ2∇2

G) do tác giả Lindeberg đề xuất năm 1994 Ông đã chỉ ra rằng việc chuẩn hóa đạo hàm bậc hai với hệ số σ2 là cần thiết cho bất biến đo trở nên

đúng Cụ thể, ông đã công bố rằng các giá trị cực đại và cực tiểu của σ2∇2G

chính là những giá trị có tính ổn định nhất (bất biến cao) so với một loạt các hàm đánh giá khác như: gradient, Hessian hay Harris

Mối quan hệ giữa D và σ2∇2

G được biễu diễn như sau:

= ∇Như vậy, ∇2G có thể được tính thông qua việc xấp xỉ đạo hàm riêng tại các tham số đo gần nhau kσ và σ:

Do đó: G(x,y,kσ) = G(x,y,kσ) –G(x,y,σ)≈(k - 1)σ2∇2

G

Định dạng
Số trang	79
Dung lượng	1,38 MB