Cho đến nay, vấn đề tìm kiếm thông tin theo điều kiện tìm kiếm mờ trong cơ sở dữ liệu vẫn được các chuyên gia nghiên cứu, trong việc truy tìm thông tin phù hợp với yêu cầu của một truy v
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN THANH TÂN
ĐỀ XUẤT CẢI TIẾN THUẬT TOÁNTÌM KIẾM
TRONG CƠ SỞ DỮ LIỆU MỜ
LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH
Thái Nguyên - 2016
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN THANH TÂN
ĐỀ XUẤT CẢI TIẾN THUẬT TOÁNTÌM KIẾM
TRONG CƠ SỞ DỮ LIỆU MỜ
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC PGS TS NGUYỄN THIỆN LUẬN
Thái Nguyên - 2016
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan những nội dung trong luận văn “Đề xuất cải tiến thuật toán tìm kiếm trong cơ sở dữ liệu mờ” là do tôi thực hiện dưới sự hướng dẫn
trực tiếp của thầy giáo PGS TS Nguyễn Thiện Luận
Mọitham khảo dùngtrongluận văn đều đượctrích dẫnrõràngtêntác giả,tên công trình, thời gian, địa điểm công bố
Mọi sao chép không hợplệ, vi phạm quy chế đàotạo, hay giantrá, tôi xin chịu trách nhiệm hoàn toàn
Thái Nguyên, ngày 12 tháng 5 năm 2016
Học viên
Nguyễn Thanh Tân
Trang 4LỜI CẢM ƠN
Em xin bày tỏ lòng biết ơn sâu sắc tới PGS TS Nguyễn Thiện Luận
người thầy kính mến đã hướng dẫn, chỉ dạy tận tình để em hoàn thành luận văn này Em xin chân thành cảm ơn các thầy, cô giáo trường Đại học Công nghệ thông tin và Truyền thông Thái Nguyên, Khoa đào tạo sau đại học - Đại học Thái Nguyên, Viện Công nghệ thông tin Việt Nam đã đón nhận và truyền thụ kiến thức cho em trong suốt quá trình học tập vừa qua
Tôi cũng xin cảm ơn cơ quan, bạn bè đồng nghiệp, gia đình và những người thân đã cùng chia sẻ, giúp đỡ, động viên và tạo mọi điều kiện thuận lợi
để tôi hoàn thành nhiệm vụ học tập và bản luận văn này
Thái Nguyên, ngày 12 tháng 5 năm 2016
Học viên
Nguyễn Thanh Tân
Trang 5DANH MỤC TỪ TIẾNG ANH VÀ VIẾT TẮT
Codd E F Edgar Frank "Ted" Codd
Damerau - Levenshtein distance Khoảng cách Damerau - Levenshtein
Full text search Tìm kiếm toàn văn
Fuzzy Natural joint Phép kết nối tự nhiên mờ
Information Retrieval Hệ thống tìm kiếm thông tin hỗ trợ
Keypoint localization Định vị điểm đặc trưng
Keypoint descriptor Mô tả các điểm đặc trưng
Levenshtein distance Khoảng cách Levenshtein
Orientation assignment Xác định hướng
Trang 6Spell - checker method Phương pháp kiểm tra chính tả
Trang 7DANH MỤC BẢNG VÀ HÌNH VẼ
Hình 1.1:Biểu diễn các miền của một tập mờ 6
Hình 1.2: Biểu diễn các hàm liên thuộc của phép lấy phần bù 8
Hình 1.3: Các tập mờ hình tam giác 9
Hình 1.4: Tập mờ Singleton 9
Hình 1.5: Tập mờ L (phải) 9
Hình 1.6: Tập mờ Gamma tuyến tính 10
Hình 1.7: Tập mờ hình thang 10
Hình 2.1: Biểu diễn số mờ tam giác 24
Hình 2.2: Minh họa các bước chính trong giải thuật SIFT 26
Hình 2.3: Quá trình tính không gian đo (L) và hàm sai khác D 28
Hình 2.4: Quá trình tìm điểm cực trị trong các hàm sai khác DoG 29
Hình 2.5: Mô phỏng công thức mở rộng của Taylor cho hàm DoG 30
Hình 2.6:Minh họa các bước của quá trình lựa chọn các điểm keypoints 32
Hình 2.7: Tính độ lớn và hướng của Gradient 34
Hình 2.8: Tạo bộ mô tả cục bộ 35
Hình 2.9: Mô hình dữ liệu video 37
Hình 2.10: Sơ đồ khối thuật toán phát hiện chuyển cảnh 39
Hình 3.1: Mô hình bài toán tìm kiếm video trong CSDL 46
Hình 3.2: Quy trình tìm kiếm video bằng hình ảnh trong CSDL 47
Hình 3.3: Mô phỏng các điểm keypoint cần lưu trữ 48
Hình 3.4: Biểu diễn các tình huống trong trường hợp thông thường 50
Hình 3.5: Biểu diễn các tình huống trong trường hợp xấu 51
Hình 3.6: Sơ đồkhối đối sánh 2 số mờ tam giác 55
Hình 3.7: Giao diện chương trình phân đoạn và mờ hóa video 56
Hình 3.8: Giao diện chương trình Smart Cutter for DV and DVB 57
Hình 3.9: Mô hình lập trình socket TCP giữa 2 tiến trình client và server 59
Hình 3.10: Giao diện chương trình tìm kiếm video 61
Bảng dữ liệu thông tin Video 53
Bảng dữ liệu Video shot 54
Bảng kết quả đánh giá hiệu năng tìm kiếm 62
Trang 8MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
DANH MỤC TỪ TIẾNG ANH VÀ VIẾT TẮT iii
DANH MỤC BẢNG VÀ HÌNH VẼ v
MỤC LỤC vi
MỞ ĐẦU 1
1 Đặt vấn đề 1
2 Đối tượng và phạm vi nghiên cứu 2
3 Hướng nghiên cứu của đề tài 2
4 Những nội dung nghiên cứu chính 3
5 Phương pháp nghiên cứu 3
6 Ý nghĩa khoa học của đề tài 4
CHƯƠNG 1: TỔNG QUAN VỀ LÝ THUYẾT MỜ CSDL MỜ VÀ ỨNG DỤNG 5
1.1 Tổng quan về lý thuyết mờ 5
1.1.1 Khái niệm tập mờ 5
1.1.2 Một số khái niệm của tập mờ 5
1.1.3 Các phép toán trên tập mờ 6
1.1.4 Các kiểu hàm thuộc 9
1.1.5 Các loại số mờ 11
1.2 Cở sở dữ liệu mờ, phương thức biểu diễn và ứng dụng 12
1.2.1 Định nghĩa 12
1.2.2 Biểu diễn thuộc tính trong quan hệ mờ 13
1.2.3 So sánh các giá trị thuộc tính mờ 13
1.2.4 Các phép toán tập hợp trên quan hệ mờ 15
1.2.5 Các phép toán quan hệ mờ 15
1.2.6 Phụ thuộc hàm mờ 16
1.2.7 Các mô hình cơ sở dữ liệu mờ 17
a Mô hình tập con mờ 17
Trang 9b Mô hình dựa trên quan hệ tương tự 17
c Mô hình dựa trên phân bố khả năng 18
d Mô hình dựa trên phân bố khả năng mở rộng 18
e Mô hình CSDL mờ dựa trên tổ hợp các mô hình trên 18
f Mô hình theo cách tiếp cận đại số gia tử 19
1.3 Tổng quan về phương pháp tìm kiếm mờ 19
1.3.1 Khoảng cách Levenshtein 20
1.3.2 Khoảng cách Damerau - Levenshtein 20
1.3.3 Thuật toán Bitap với những thay đổi của Wu và Manber 21
1.3.4 Phương pháp kiểm tra chính tả 22
1.3.5 Phương pháp N-gram 22
1.3.6 Cây - BK (BK - trees) 22
1.4 Kết luận chương 23
CHƯƠNG 2: THUẬT TOÁN TÌM KIẾM TRONG CSDL MỜ 23
2.1 Số mờ tam giác 24
2.1.1 Các phép toán trên số mờ tam giác 24
2.1.2 Quan hệ so sánh trên số mờ tam giác 25
2.2 Tổ chức dữ liệu cho thuật toán tìm kiếm dữ liệu mờ 26
2.2.1 Đối sánh ảnh dựa trên đặc trưng SIFT 26
a Phát hiện các điểm cực trị 27
b Định vị các điểm đặc trưng 31
c Xác định hướng cho các điểm đặc trưng 34
d Mô tả các điểm đặc trưng 35
e Đối sánh đặc trưng SIFT 37
2.2.2 Phân đoạn dữ liệu video 38
a Mô hình dữ liệu video 38
b Một số kỹ thuật phân đoạn video 39
c Kỹ thuật phân đoạn video bằng đối sánh đặc trưng SIFT 40
d Tóm tắt video 41
Trang 102.3 Cải tiến thuật toán tìm kiếm dữ liệu mờ 42
2.3.1 Thuật toán tìm kiếm 42
2.3.2 Thuật toán tìm kiếm dữ liệu mờ 44
2.3.3 Đánh giá thuật toán tìm kiếm 44
2.4 Kết luận chương 45
CHƯƠNG 3: CÀI ĐẶT THUẬT TOÁN TÌM KIẾM 46
3.1 Phân tích một số nhu cầu tìm kiếm video trong CSDL 46
3.2 Thiết kế mô hình bài toán tìm kiếm trong CSDL 47
3.2.1 Mô hình bài toán tìm kiếm video 47
3.2.2 Quy trình tìm kiếm video theo hình ảnh 48
3.2.3 Quy trình sử dụng logic mờ 49
3.2.4 Mở rộng csdl quan hệ thành csdl mờ dựa trên phân bố khả năng 50
a Bộ có trọng sốtrong quan hệ mờ 50
b Biểu diễn dữ liệu mờ bằng phân bố khả năng 51
c Mối quan hệ với dạng chuẩn 1NF 54
d Độ đo khả năng và độ đo cần thiết 54
3.3 Cài đặt thuật toán tìm kiếm mờ và một số giao diện chính 55
3.3.1 Lựa chọn công cụ 55
3.3.2 Thiết kế cơ sở dữ liệu 55
3.3.3 Cài đặt thuật toán tìm kiếm và một số giao diện chính 56
a Kỹ thuật đối sánh hai số mờ tam giác 56
b Cài đặt thuật toán phân đoạn video 57
c Cài đặt thuật toán trích chọn frame đại diện và mờ hóa video 59
d Kỹ thuật khởi tạo các tiến trình và trao đổi dữ liệu 60
e Cài đặt thuật toán tìm kiếm dữ liệu mờ 62
3.3.4 Thử nghiệm và đánh giá 64
3.4 Kết luận chương 64
KẾT LUẬN 65
TÀI LIỆU THAM KHẢO 67
Trang 11MỞ ĐẦU
1 Đặt vấn đề
Ngày nay, cùng với sự phát triển nhanh chóng của Công nghệ tin học thì khối lượng dữ liệu rất lớn với sự phong phú, đa dạng và phức tạp của nhiều loại hình thông tin như: văn bản, hình ảnh, âm thanh, video được thu thập và lưu trữ dưới dạng số ngày càng nhiều Tương ứng với khối lượng dữ liệu khổng lồ đó, người ta quan tâm nhiều đến cơ sở dữ liệu mờ (Fuzzy Databases)trong khoa học công nghệ và trong thực tiễn Với hệ thống cơ sở
dữ liệu mờ, bao gồm các trường dữ liệu truyền thống và phi truyền thống dưới dạng hình ảnh, video, audio và văn bảnđang có xu thế thâm nhập vào rất nhiều lĩnh vực và đang dần trở thành hệ cơ sở dữ liệu được quan tâm từ người
sử dụng và các chuyên gia trong vấn đề lưu trữ, xử lý và ứng dụng Với khối lượng dữ liệu lớn này dẫn tới việc tìm kiếm dữ liệu trở nên khó khăn vì vậy cần có các hệ thống tìm kiếm thông tin (Information Retrieval) hỗ trợ người dùng tìm kiếm một cách chính xác và nhanh chóng các thông tin mà họ cần trên kho tư liệu khổng lồ này
Cho đến nay, vấn đề tìm kiếm thông tin theo điều kiện tìm kiếm mờ trong cơ sở dữ liệu vẫn được các chuyên gia nghiên cứu, trong việc truy tìm thông tin phù hợp với yêu cầu của một truy vấn đưa ra từ người sử dụng.Người sử dụng có xu hướng tìm kiếm chủ yếu trong cơ sở dữ liệu, ví dụ như tìm kiếm một loạt hình ảnh cổ vật liên quan đến nền văn hoá cổ Việt Nam, tìm kiếm dữ liệu âm thanh có bản text kèm theo, tìm kiếm video bài giảng cho học sinh ôn thi đại học
Bài toán tìm kiếm thông tin trong cơ sở dữ liệu đóng vai trò quan trọng
là bài toán so mẫu, với mẫu có thể ở bất kỳ kiểu dữ liệu nào, từ văn bản đến các loại dữ liệu đa phương tiện khác (hình ảnh, video, âm thanh, .) Trong
Trang 12các bài toán tìm kiếm, để tìm kiếm nhanh đáp ứng được nhu cầu và không chỉ tìm kiếm cứng nhắc với từ khoá đưa ra Người dùng mong muốn có thể tìm được cả những thông tin liên quan gợi ý cho người dùng Vậy bài toán tìm kiếm trong cơ sở dữ liệu mờ theo điều kiện tìm kiếm mờ là rất cần thiết Do
đó cần phải xây dựng các thuật toán mềm dẻo cho phép phát huy được sức mạnh của tìm kiếm với điều kiện tìm kiếm mờ và đặc biệt cho phép sử dụng được nguồn tri thức giàu tính chuyên gia trong những tính huống tìm kiếm phức tạp
Để tìm kiếm những thông tin với điều kiện tìm kiếm mờ trong mô hình
cơ sở dữ liệu có cấu trúc gồm các trường dữ liệu truyền thống và phi truyền thống, có nhiều hướng tiếp cận khác nhau như cách tiếp cận theo lý thuyết tập
mờ, theo phân bố khả năng, theo quan hệ tương tự, Tất cả các cách tiếp cận này nhằm mục đích nắm bắt và xử lý một cách thỏa đáng các thông tin không đầy đủ (incomplete), thông tin không chính xác (unexact), hay những thông tin không chắc chắn (uncertainty)
Vì vậy, luận văn tập trung nghiên cứu về “Cải tiến thuật toán tìm kiếm trong cơ sở dữ liệu mờ”.
2 Đối tượng và phạm vi nghiên cứu
Đối tượng và phạm vi nghiên cứu của luận văn tập trung vào các phương pháp và giải pháp để tìm kiếm thông tin theo điều kiện tìm kiếm mờ (chứa đựng các thông tin không chắc chắn) trong cơ sở dữ liệu có cấu trúc gồm các trường dữ liệu truyền thống và phi truyền thống như: file text, file ảnh, video
3 Hướng nghiên cứu của đề tài
- Tìm hiểu về lý thuyết mờ và ứng dụng
- Tìm hiểu về cơ sở dữ liệu mờ và ứng dụng
Trang 13- Tìm hiểu các kỹ thuật và quy trình tìm kiếm thông tin trong cơ sở
dữ liệu mờ với các yêu cầu tìm kiếm chứa đựng thông tin không rõ ràng không chính xác
- Cải tiến thuật toán tìm kiếm trong cơ sơ dữ liệu mờ
4 Những nội dung nghiên cứu chính
Luận văn được trình bày trong 3 chương, có phần mở đầu, phần kết luận, phần mục lục, phần tài liệu tham khảo và phần danh mục bảng và hình vẽ
Các nội dung cơ bản của luận văn được trình bày theo cấu trúc như sau:
Chương 1: Tổng quan về lý thuyết mờ, cơ sở dữ liệu mờ và ứng dụng
1.1 Tổng quan về lý thuyết mờ
1.2 Cở sở dữ liệu mờ, phương thức biểu diễn và ứng dụng
1.3 Tổng quan về phương pháp tìm kiếm mờ
1.4 Kết luận chương
Chương 2: Thuật toán tìm kiếm trong cơ sở dữ liệu mờ
2.1 Số mờ tam giác
2.2 Tổ chức dữ liệu cho thuật toán tìm kiếm dữ liệu mờ
2.3 Cải tiến thuật toán tìm kiếm dữ liệu mờ
2.4 Kết luận chương
Chương 3:Cài đặt thuật toán tìm kiếm trong cơ sở dữ liệu quản lý các
chương trình truyền hình Đài PT-TH tỉnh Hòa Bình
3.1 Phân tích một số nhu cầu tìm kiếm video trong CSDL quản lý các chương trình truyền hình
3.2 Thiết kế mô hình bài toán tìm kiếm trong CSDL mờ quản lý các chương trình truyền hình
3.3 Cài đặt thuật toán tìm kiếm mờ và một số giao diện chính
3.4 Kết luận chương
5 Phương pháp nghiên cứu
Trang 14Sử dụng các phương pháp nghiên cứu chính sau:
- Phương pháp nghiên cứu lý thuyết: Phân tích, liệt kê, đối sánh, nghiên cứu tài liệu, tổng hợp các kết quả của các nhà nghiên cứu liên quan đến lĩnh vực nghiên cứu
- Phương pháp trao đổi khoa học, lấy ý kiến chuyên gia
- Phương pháp thực nghiệm: Cài đặt thử nghiệm thuật toán cho bài toán tìm kiếm với điều kiện tìm kiếm mờ trong cơ sở dữ liệu mờ quản lý các
chương trình truyền hình
6 Ý nghĩa khoa học của đề tài
- Giúp tìm hiểu, đánh giá khái quát về hệ cơ sở dữ liệu mờ, các thuật toán tìm kiếm với điều kiện tìm kiếm mờ
- Vận dụng tốt thuật toán tìm kiếm với điều kiện tìm kiếm mờ, giúp chúng ta có thể dễ dàng tìm kiếm những nội dung trong cơ sở dữ liệu
- Xây dựng cơ sở khoa học cho các bài toán tìm kiếm trong cơ sở dữ liệu
Trang 15CHƯƠNG 1: TỔNG QUAN VỀ LÝ THUYẾT MỜCƠ SỞ DỮ LIỆU MỜ VÀ ỨNG DỤNG
1.1 Tổng quan về lý thuyết mờ[5]
L.A Zadeh là người sáng lập ra lý thuyết tập mờ với hàng loạt bài báo
mở đường cho sự phát triển và ứng dụng của lý thuyết này, khởi đầu là bài báo “Fuzzy Sets” trên Tạp chí Information and Control, 8, 1965 Ý tưởng nổi bật của khái niệm tập mờ của Zadeh là từ những khái niệm trừu tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ, nhanh, caothấp, xinh đẹp , ông đã tìm ra cách biểu diễn nó bằng một khái niệm toán học, được gọi là tập
mờ, như là một sự khái quát trực tiếp của khái niệm tập hợp kinh điển
1.1.2 Một số khái niệm của tập mờ
Định nghĩa 1.1.1.Độ cao của một tập mờ A trên không gian nền Xlà giá
Trang 16S = suppµ A (x) = {x ∈ X / µ A (x) > 0}
Định nghĩa 1.1.3 Miền tin cậy của tập mờ tập mờ A trên không gian nền
X được ký hiệu bởiT là tập con của X thoả mãn: T = {x ∈X / µ A (x) = 1}
Định nghĩa 1.1.4 Miền biên của tập mờ tập mờ A trên không gian nền X được ký hiệu bởiU là tập con của Xthoả mãn: U = {x ∈X / 0< µ A (x) < 1}
Hình 1.1: Biểu diễn các miền của một tập mờ Định nghĩa 1.1.5 Tập cắt α (α ∈ [0,1]) của tập mờ A trên không gian nền
X được ký hiệu bởiA α là tập con của Xthỏa mãnA α = {x / µ A (x)≥ α} và được gọi là tập cắt mạnh α và ký hiệu là A α+ nếu A α+ = {x / µ A (x)>α}
Định nghĩa 1.1.6 Tập mức α, hay là tập nhát cắt - α của tập mờ tập mờ
A trên không gian nền Xký hiệu bởi Λ(A) là tập các tập con của Xthỏa mãn:
Λ(A) = {x / µ A (x) = α} vớiα ∈[0,1]
Định nghĩa 1.1.7 Tập mờ A trên không gian nền X tuyến tính được gọi
là tập mờ lồi nếu A α là tập lồi ∀ ∈ [0,1]
Định nghĩa 1.1.8 Lực lượng của tập mờ A trên không gian nền X được
biểu diễn như sau:
1.1.3 Các phép toán trên tập mờ
a) Phép hợp hai tập mờ:
( , ( )) = ( )
Trang 17Định nghĩa 1.1.8: Hợp của hai tập mờ A B là một tập mờ được xác định trong không gian nền X và có hàm liên thuộcµ A B (x) thỏa mãn các tiên
Định nghĩa 1.1.9: Giao của hai tập mờ A và B là một tập mờ A ÇBxác định trong không gian nền Xcó hàm liên thuộcµ A ÇB (x) thỏa mãn các tiên đề: + Chỉ phụ thuộc vào µ A (x) và µ B (x)
Định nghĩa 1.1.10:Tập bù của tập mờA trên nền X là một tập mờ ( ,
µ )xác định trên không gian nền Xvới hàm liên thuộc thỏamãn các điều kiện: +µ (x) chỉ phụ thuộc vào µ A (x)
+ Nếu µ A (x) = 0 thì µ (x) = 1
+ Nếu µ A (x) = 1 thì µ (x) = 0
+ Nếu AB thì có µ (x) ≥ µ (x)
Trang 18Định nghĩa 1.1.11: Tập bù của tập mờ A trên nền X là một tập mờ ( ,
µ )xác địnhtrên không gian nền Xvới hàm liên thuộcµ(µ A): [0,1] → [0,1] thỏa mãn các điều kiện sau:
Hình 1.2: Biểu diễn hàm liên thuộc của phép lấy phần bù
d Phép hiệu đối xứng: Mở rộng công thức cho phép hiệu đối xứng cáctập kinh điển: A ∇B = (A B) \ (A ÇB) = (A Ç ) ( ÇB)có thể xây dựng
phép hiệu đối xứng cho các tập mờ Từ công thức xác định hàm liên thuộc đối với phép hiệu đối xứng của các tập kinh điển Có thể áp dụng trực tiếp để xây
dựng hàm liên thuộc hiệu đối xứng của các tập mờ (A, µ A (x)) và (B, µ B (x))
µ A ∇ B (x) = µ A (x) + µ B (x) – 2µ A (x) ´µ B (x)
e Tích Đề các: Cho n tập mờ (x i , µ Ai (x i )), i=1,2, n trên các không gian nền Xi Tích Đề các của n tập mờ là một tập mờ:
{(x1, x2, xn), µ X1´X2´ ´Xn (x1, x2, xn)}
Trang 19trên không gian nề
a Tam giác (Triangular):Định nghĩa bởi các cận dưới a, c
b Chúng ta gọi giá trị b-m là biên (margin) n
0 nếu ≤ hoặc ≥
nếu < <
nếu < <
1 nếu =
p mờ hình tam giác: a)Tổng quát và b) Đ
Có giá trị 0 tại tất cả các điểm trong tập vũ trụ
1, dùng để biểu diễn các giá trị rõ
ng quát và b) Đối xứng
ụ, ngoại trừ tại
và b theo cách:
Trang 21
ố thực với hàm liên thuộc:
( ) =
( )khi ≤ ≤ ( )khi ≤ ≤ +
0 khi ( < ) Λ ( > +
ng tam giác:Là một tập mờ có dạng [ a-α, a, a
ực với hàm liên thuộc:
+ 1 khi ≤ ≤ + 1 khi ≤ ≤ +
0 khi < và >
ng hình thang: Là một tập mờ có dạng [ a-α, a,
ố thực với hàm liên thuộc:
(x)) trong không gian nền số
a+β] trong đó
+ )
a+β ] trong đó
+
, b, b+β ] trong
Trang 22( , , )( ) =
1 khi ≤ ≤ + 1 khi ≤ ≤
+ 1 khi ≤ ≤ +
0 khi( < )hoặc ( > + )
e Số mờ dạng khoảng: Là tập mờ có dạng (a, ε) trong đó ε ≥ 0 là các số
thực với hàm liên thuộc:
( , )( ) =
+ 1 khi ≤ ≤ + 1 khi ≤ ≤ +
0 khi hoặc > +
1.2 Cở sở dữ liệu mờ, phương thức biểu diễn và ứng dụng[5]
Mô hình quan hệ do Codd E F đề xuất năm 1970 đã đáp ứng được nhu cầu lưu trữ và xử lý dữ liệu của con người trong một thời gian dài Tuy nhiên,
mô hình này vẫn tồn tại nhiều hạn chế chưa giải quyết được Trên thực tế, đôi khi chúng ta có thể thu nhận được dữ liệu với thông tin không đầy đủ, hoặc có những thông tin không chính xác, không chắc chắn gọi chung là các dữ liệu
mờ Nếu giới hạn trong mô hình cơ sở dữ liệu kinh điển thì phải đợi đầy đủ thông tin về đối tượng mới cập nhật vào cơ sở dữ liệu, hoặc nếu cứ cập nhật thì sẽ gây khó khăn, mất ngữ nghĩa và không nhất quán trong xử lý dữ liệu
Do đó để đáp ứng nhu cầu thực tế, mô hình cơ sở dữ liệu đã được mở rộng để biểu diễn và xử lý những dữ liệu mờ gọi là cơ sở dữ liệu mờ (Fuzzy Databases)
1.2.1 Định nghĩa
Cho W=(, A1, A2, A n) là tập hữu hạn các thuộc tính, các miền giá trị
tương ứng D(A 1 ), D(A 2 ), D(A n ), D() =[0,1] Trong đó, D(A i ) (i=1 n) có thể nhận giá trị rõ hoặc giá trị mờ Một quan hệ mờ fr trên lược đồ quan hệ mờ là tập con của tích Descartes D(A1) ´D(A2) ´ ´D(A n ) ´D()
Trang 23Một bộ dữ liệu tfr có dạng: (t, fr (t)) Do đó quan hệ fr có thể biểu diễn
lại như sau:
fr = {(t, fr (t) | fr (t)[0,1] và tr} VớirD(A1) ´D(A2) ´ ´D(A n)
1.2.2 Biểu diễn thuộc tính trong quan hệ mờ
Xét lược đồ quan hệ R=(, A1, A n)
Đối với thuộc tính A i là rõ thì D(A i )=U(A i)
Đối với thuộc tính A i là thuộc tính mờ thì:
D(A i )=U(A i ) T(A i ) F(A i ) I(A i)
Ở đâyU(A i ): Là miền giá trị cơ sở, T(A i): Tập các giá trị ngôn ngữ của
biến ngôn ngữ A i , F(A i): Tập các tập mờ biểu diễn dưới dạng số mờ hình
thang, I(A i): Tập các tập mờ biểu diễn dưới dạng số mờ dạng khoảng Rõ ràng
là trong nhiều trường hợp các tập giá trị có thể là tập rỗng
Trong cơ sở dữ liệu quan hệ truyền thống, các phép toán quan hệ được thực hiện dựa trên cơ sở việc đánh giá dữ liệu chỉ thể hiện ở hai trang thái là
"đúng" hoặc "sai" Đối với cơ sở dữ liệu quan hệ mờ, với miền trị của thuộc tính mờ được mở rộng như trên, thì rõ ràng cách đánh giá dữ liệu truyền thống là không phù hợp, mà phải đánh giá trên cơ sở hàm thuộc của tập mờ, trong đó trạng thái "đúng" tương ứng với 1, trạng thái "sai" tương ứng với 0 Còn những giá trị (0,1) là phản ánh mức độ đúng sai của việc đánh giá: càng gần 1 càng đúng, càng gần 0 càng sai Bởi vậy trong mỗi quan hệ mờ sẽ
có một thuộc tính đặc biệt gọi là thuộc tính độ thỏa, ký hiệu là với Dom()
= [0,1], dùng để chỉ mức độ là thành viên của mỗi bộ trong quan hệ
1.2.3 So sánh các giá trị thuộc tính mờ
Trong mô hình quan hệ kinh điển các thao tác và các phép toán so sánh giá trị: Để đánh giá được phép so sánh trên thì trước hết phải chuyển đổi dữ liệu ở cả hai vế của phép so sánh về cùng một dạng và điều đó
Trang 24chỉ có thể làm được khi chuyển về dạng tập mờ, sau đó các phép so sánh sẽ dựa trên các tham số này
Dưới đây sẽ trình bày phương pháp xây dựng hàm đánh giá các phép so sánh giữa hai tập mờ 1, 2 ký hiệu là (1 2), trong đó là một trong các phép so sánh và:
1 = (a1, b1, c1, d1), thoả mãn a1b1c1d1
2 = (a2, b2, c2, d2), thoả mãn a2b2c2d2
Hàm đánh giá sẽ được xây dựng trên cơ sở hàm thuộc của tập mờ hình
thang và các tham số a1, b1, c1, d1; a2, b2, c2, d2, của hai tập mờ
Gọi S f1 ,S f2 là biểu diễn số mờ hình thang tương ứng của 2 tập mờ f1 và f2
Nếu là phép "="cần xây dựng sao cho khi f1 và f2 gần nhau thì
(f1f2) 1, khi f1 và f2 xa nhau thì (f1f2) 0
Trường hợp 1: Nếu S f1 ÇS f2= Æ thì (f1 f2) = 0
Trường hợp 2: Nếu S f1 S f2 hoặcS f2 S f1 thì (f1 f2) = 1
Trường hợp 3: Nếu f1P(A) và f2U(A) hoặc f1U(A) và f2P(A), khi
đó giá trị hàm (f1 f2) chính là giao điểm I của S f1 và S f2
Trường hợp 4: Nếu f1P(A) và f2P(A) nhưng S f1 ÇS f2 Æ và f1 f2 và f2
f1, khi đó hàm được xây dựng như sau:
Trang 25Nếu là phép so sánh "" Ta có (f1 f2) (f2 f1) Vì vậy chỉ cần hoán đổi 2 tập mờ f1 và f2
Nếu là phép so sánh "<" Ta có (f1 <f2) = 1-(f1 f2)
Nếu là phép so sánh ">"Ta có (f1 >f2) (f2 <f1) Vì vậy chỉ cần hoán
đổi 2 tập mờ f1 và f2
1.2.4 Các phép toán tập hợp trên quan hệ mờ
* Phép hợp: Hợp của 2 quan hệ fr1 và fr2 khả hợp (tập các thuộc tính
như nhau) là một quan hệ trên R1 ký hiệu fr1 fr2 và được xác định như sau:
fr1fr2 = (t, fr1 (t) fr2 (t)) (t, fr1 (t) fr1 hoặc (t, fr2 (t)) fr2
* Phép giao: Giao của 2 quan hệ mờ fr1 và fr2 là một quan hệ mờ trên R,
ký hiệu fr1Çfr2 và được xác định như sau:
fr1Çfr2 = (t, fr1 (t) fr2 (t)) (t, fr1 (t) fr1 và (t, fr2 (t)) fr2
* Phép tích đề các: Cho fr1 xác định trên R1, fr2 xác định trên R2 Tích
Đề các fr1 và fr2 ký hiệu:
fr1´fr2 = (t ,t2),(fr1 (t1) fr2 (t2)) (t1, fr1 (t1) fr1 , (t2, fr2 (t)) fr2
* Phép trừ: Cho fr1 và fr2 là 2 quan hệ mờ trên R = A1, A2, , An,
Hiệu của fr1 và fr2 là 1 quan hệ mờ trên R, Ký hiệu fr1–fr2 và xác định:
Cho R = A1, A2, , A n, , fr là quan hệ mờ trên R
AR, cD(A) Phép chọn Fs được định nghĩa như sau:
Trang 26Fs Ac (fr) = (t, fr (t)) (t[A]c) ( t, fr (t) fr và fr (t) (t[A]c) ) Trong đó : là ngưỡng được chọn và (0, 1], , , , =, ,
* Phép chiếu mờ (Fuzzy projection)
Cho quan hệ mờ fr = (t, fr (t)) trên lược đồ quan hệ R, X R
Với mỗi bộ (t, fr (t)) fr, ký hiệu t x là tập các bộ (t1, fr (t1)) fr mà
t1[X] = t[X] có nghĩa tx = t1 (t1, fr (t1)) fr và t1[X] = t[X]) = 1
Phép chiếu mờ của fr trên X là một quan hệ trên X được định nghĩa:
Fp x (fr) =
∈ fr (t1), t[X]
* Phép kết nối tự nhiên mờ (Fuzzy Natural joint)
Cho fr 1 = (t1, fr1 (t1)) và fr2 = (t2, fr2 (t2)) là 2 quan hệ mờ trên R1, R2, AR1, BR2, R1ÇR2 = R3, R1R2 = R
Nếu R3Æ ta định nghĩaphép nối tự nhiên mờ như sau:
F NJ fr1 fr2 = (t, fr1 (t 1) (t1[C]=t2[C])) / (t1, fr1 (t1) r1 và (t2,
fr2 (t2) fr2 mà t[A] = t1[A] và t[B] = t2[B] và t[C] = t1[C] = t2[C]
Trong đó fr1 xác định trên AC và fr2 xác định trên CB và AÇBÇC = Æ
* Phép kết nối mờ ( Fuzzy join)
Trong trường hợp là những phép toán: , , , , thì phét kết nối
tự nhiên sẽ thành phép kết nối mờ Phép kết nối mờ của 2 quan hệ fr1 và
fr2 trên 2 thuộc tính A và B được định nghĩa như sau:
Trang 27chúng xấp xỉ bằng nhau trên X thì cũng xấp xỉ bằng nhau trên Y Có nghĩa là X~>Y (t1, t2fr) ((t1[X]=t2[X]) ) (t1[Y]=t2[Y]) ( (0,1])
1.2.7 Các mô hình cơ sở dữ liệu mờ
a Mô hình tập con mờ
Mô hình này được Baldwin và Zhou đưa ra năm 1984, Zvieli đưa ra năm
1986 Cách tiếp cận này không mở rộng miền trị của thuộc tính mà mở rộng ngữ nghĩa của dữ liệu rõ, xem mỗi quan hệ như một tập con mờ của tích Đềcác của các miền trị thuộc tính Mỗi bộ trong quan hệ với các dữ liệu rõ, được gán với một số thuộc miền [0, 1], chỉ độ thuộc của bộ đó vào quan hệ Như vậy, mỗi bộ của một quan hệ trong mô hình này có dạng:
t = <a1, a2, …, a i , …, an, >
với ai là giá trị các thuộc tính Ai, tức là aiDom(Ai), [0, 1], là độ thuộc của mỗi bộ vào quan hệ
b Mô hình dựa trên quan hệ tương tự
Cách tiếp cận quan hệ tương tự đã được Buckles và Petry đề xuất năm
1982 Trong mô hình này, giá trị tại mỗi thuộc tính của đối tượng có thể là đơn trị hoặc đa trị nhưng có một ràng buộc là các giá trị đòi hỏi phải “đủ tương tự nhau”, hay nói cách khác là độ tương tự của hai giá trị bất kỳ trong miền trị không nhỏ hơn ngưỡng cho trước
Định nghĩa: Một quan hệ tương tựtrên tập U là một ánh xạ:
U´U[0, 1], có các tính chất sau:
(1) ∀x U, Sim (x, x) = 1 - tính phản xạ
(2) ∀x, y U, Sim (x, y) = Sim (y, x) - tính đối xứng
(3) ∀x, y, z U, Sim (x, z) maxy(min(Sim(x, y), Sim(y, z))) - tính bắc
cầu max - min
Như vậy, mỗi bộ của một quan hệ trong mô hình này có dạng:
t = <p1, p2, …, pi, …, pn>
Trang 28với piDi, trong đó Di là miền trị của thuộc tính Ai, trên mỗi Di có xác
định một quan hệ tương tự giữa mọi cặp giá trị bất kỳ thuộc miền trị
c Mô hình dựa trên phân bố khả năng
Mô hình này được đề xuất bởi Prade và Testermale vào năm 1983 bằng cách mở rộng miền trị thuộc tính, sử dụng phân bố khả năng để biểu diễn giá trị một bộ của một thuộc tính Việc dùng phân bố khả năng để biểu diễn dữ liệu mờ cho phép biểu diễn được nhiều dạng dữ liệu thường gặp trong thực tế như dữ liệu rõ, dữ liệu chưa biết, dữ liệu thiếu thông tin, dữ liệu không chắc chắn…
Như vậy, mỗi bộ của một quan hệ trong mô hình này có dạng:
t = <π A1 ,π A2 , …, π Ai , …, π An>
với π Ai là phân bố khả năng của thuộc tính A i trên miền trị D i của nó, (π Ailà một
tập con mờ trên D i và π Ai (x), xD i , là khả năng x là giá trị thực sự của t[A i])
d Mô hình dựa trên phân bố khả năng mở rộng
Mô hình này là cách tiếp cận mở rộng của lý thuyết phân bố khả năng đã trình bày ở trên, tuy nhiên trong mô hình này cho phép các quan hệ giống nhau được liên kết với các miền giá trị
Như vậy, mỗi bộ của một quan hệ mờ trong mô hình dựa trên phân bố khả năng mở rộng cũng có dạng như trong mô hình dựa trên phân bố khả năng, tuy nhiên, khi xem xét mối liên quan giữa các bộ (liên quan dư thừa bộ, liên quan về phụ thuộc dữ liệu…), thì người ta có tính đến các quan hệ giống nhau được liên kết với miền trị của các thuộc tính
e Mô hình CSDL mờ dựa trên tổ hợp các mô hình trên
Theo cách tiếp cận này, tính mờ có liên quan đến độ thuộc của các bộ vào CSDL, tính mờ thể hiện trong các giá trị thuộc tính và quan hệ giữa các phẩn tử của miền trị của thuộc tính.Như vậy, cách tiếp cận này là tổ hợp của
Trang 29cách tiếp cận theo phân bố khả năng, theo quan hệ tương tự và theo mô hình tập con mờ Mỗi bộ của một quan hệ trong mô hình này có dạng:
t = {π A1 , π A2 , …, π Ai , …, π An,t}
Trong đó các giá trị thuộc tính là các phân bố khả năng, trong đó π Ai π Ui,
ngoài ra, mỗi bộ t còn được gán giá trị t (0 ≤ t ≤ 1) biểu diễn khả năng để một bộthuộc quan hệ
f Mô hình theo cách tiếp cận đại số gia tử
Theo cách tiếp cận này giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểu diễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phép tìm kiếm, đánh giá ngữ nghĩa của thông tin không
chắc chắn chỉ bằng các thao tác dữ liệu kinh điển thường dùng
Vì tất cả các thuộc tính có miền trị chứa giá trị số trong CSDL đều tuyến tính, nên một cách tự nhiên ta giả thiết ĐSGT được sử dụng là ĐSGT tuyến
tính, do đó tập H+ và H là tập sắp thứ tự tuyến tính
Như vậy, cho X = (X, G, H, ≤ ) với G = {0, c-, W, c + , 1}, H = H H+ với
giả thiết H = {h1,h2, , h p }, H+ = {h -1 , , h -q }, h1>h2> >h p vàh -1 < <h -q là dãy các gia tử
1.3 Tổng quan về phương pháp tìm kiếm mờ
Tìm kiếm "mờ" hay còn được gọi là tìm kiếm "tương tự" là khái niệm để chỉ kỹ thuật tìm kiếm thông tin với điều kiện tìm kiếm không chính xác Tìm kiếm mờ được thực hiện bằng phương tiện của một chương trình kết hợp mờ,
mà trả về một danh sách các kết quả dựa trên sự liên quan có khả năng mặc
dù những điều kiện tìm kiếm có thể không phù hợp chính xác
Tìm kiếm mờ là một tính năng rất hữu ích của bất kỳ công cụ tìm kiếm Tuy nhiên, để thực hiện có hiệu quả kỹ thuật tìm kiếm này là phức tạp hơn nhiều so với việc thực hiện một tìm kiếm đơn giản cho một kết quả chính xác
Trang 30Sau đây là các thuật toán tìm ki
tương tự)
1.3.1 Khoảng cách Levenshtein
Khoảng cách Levenshtein (Levenshtein distance) là thu
theo tên của nhà khoa h
năm 1965 Khoảng cách Levenshtein, còn
cách", tư tưởng của thu
thông qua 3 phép biến đ
ng cách Levenshtein (Levenshtein distance) là thuật toán đư
a nhà khoa học người Nga, người đã nghiên cứu và phát tri
ng cách Levenshtein, còn được gọi là "chỉnh s
a thuật toán là số bước ít nhất biến một xâu A thành xâu B
n đổi: Thêm một ký tự, Bớt một ký tự, Thay đ
ậy, khoảng cách Levenshtein giữa 2 xâu thang và tung
ng cách Damerau-Levenshtein
ng cách Damerau-Levenshtein (Damerau-Levenshtein distance)
c Frederick J Damerau đề xuất, Khoảng cách Damerauảng cách Levenshtein bằng cách chuyển v
t thước đo khoảng cách khác nhau, được gLevenshtein
Trang 31Di,j = min(X i + 1, X
=
1.3.3 Thuật toán Bitap v
Thuật toán Bitap và các đi
dụng để tìm kiếm mờ
Ricardo Baeza-Yates
Manber đề xuất sửa đổ
Để thực hiện tìm ki
bit R sang chiều thứ hai.
dài của văn bản, bây gi
đại diện của các tiền tố
tại với lỗi ít hơn Trong b
t toán Bitap với những thay đổi của Wu và Manber
t toán Bitap và các điều chỉnh khác nhau của nó thư
mà không lập chỉ mục Thuật toán đượ
Yates và GastonGonnet, sau đó được Sun Wu
ổi thuật toán để tính khoảng cách Levenshtein
n tìm kiếm mờ bằng thuật toán Bitap, mhai Thay vì có một mảng R duy nhất mà thay đ
n, bây giờ chúng ta có k mảng riêng biệt R 1 k Mả
ố của mô hình phù hợp với bất kỳ hậu tố cTrong bối cảnh này, một "lỗi" có thể là chèn, xóa, ho
là chèn, xóa, hoặc thay
)
Trang 32= ∨ ∨
1.3.4 Phương pháp kiểm tra chính tả
Phương pháp kiểm tra chính tả (Spell-checker method),Thuật toán thường được sử dụng trong các hệ thống sửa lỗi chính tả, khi kích thước của
từ điển là nhỏ, hoặc khi tốc độ không phải là tiêu chí chính Thuật toán dựa vào việc giảm các vấn đề của tìm kiếm mờ cho vấn đề tìm kiếm chính xác Một tập hợp các từ "tìm kiếm" được xây dựng từ truy vấn ban đầu Sau đó,
mỗi “từ” từ bộ này là tìm kiếm trong từ điển để đưa ra kết quả chính xác
1.3.5 Phương pháp N-gram
Phương pháp nàyđược phát minhtừ lâu, vàđược dùng rộng rãivìthực hiệncủa nó làtương đối đơn giảnvà nó cung cấpmột hiệu suấtkhá tốt.Thuật toán này đượcdựatrên nguyên tắc: "Nếu từ Aphù hợpvới từBxem xét một vàisai sót, sau đó sẽrất có thể cóít nhất mộtchuỗi conchungdàiN" Nhữngchuỗi concó chiều dài Nđượcđặt tên là"N-gram" Tạibướclập chỉ mục, từ này được phân chia thànhN-gram, và sau đó làtừ đượcthêm vào danh sáchtương ứng vớimỗi một trong cácN-gram Tại bướctìm kiếm,truy vấn cũng sẽđượcphân chia thànhN-gram, và cho mỗichúngdanh sáchtương ứngđược quétbằng cách
sử dụngcác số liệu
1.3.6 Cây-BK (BK-trees)
Cây-BK (Burkhard-Keller) là cây thước đo, các thuật toán để xây dựng
cây như vậy dựa vào khả năng của các số liệu để đáp ứng các bất đẳng thức tam giác:
p(x,y) ≤p(x,z) + p(z,y) với x,y,z ∈X
Thuộc tính này cho phép các số liệu để tạo thành các không gian kích
thước tùy ý Những không gian này là không nhất thiết phải Euclide, ví dụ, các Levenshtein và Damerau-Levenshtein số liệu tạo thành một phi-Euclide
Trang 33không gian Dựa trên tính chất, có thể xây dựng một cấu trúc dữ liệu cây Barkhard-Keller để tìm kiếm trong một không gian
1.4 Kết luận chương
Chương 1 luận văn trình bày các nền tảng lý thuyết cơ bản phục vụ thực hiện cho các chương sau cụ thể là:
Tổng quan về lý thuyết mờ
Tổng quan về cơ sở dữ liệu mờ
Tổng quan một số phương pháp tìm kiếm mờ
CHƯƠNG 2: THUẬT TOÁN TÌM KIẾM TRONG CƠ SỞ DỮ LIỆU MỜ
Việc truy vấn video sẽ tìm ra các video tương tự về nội dung với hình ảnh cần truy vấn Vấn đề đặt ra là cần xây dựng một hệ thống tìm kiếm các hình ảnh tương tự trong video nhưng vẫn đảm bảo về tốc độ và không gian truy vấn Để giải quyết bài toán tìm kiếm video tương tự này, luận văn chia trình tự video thành các video cơ sở (lia, shot) sau đó sẽ trích xuất đặc trưng
Trang 34cục bộ trên mỗi hình ảnh đại diện của video cơ sở này dựa trên phương pháp Scale Invariant Feature Transform (SIFT), đồng thời xây dựng tập số mờ tam giác để thực hiện tìm kiếm video.
2.1.1 Các phép toán trên số mờ tam giác
Ký hiệu Θ là một trong các phép toán {+, –, *, /}
Ký hiệu: – (a, α, β) = (–a, β, α); = (0,0,0); = (1,0,0)
( )( ) =
1 khi ≤ ≤ ( ) khi ∞ ≤ ≤ ( )khi ≤ ≤ +∞
Trang 35(-2.1: Biểu diễn số mờ tam giác – (a, α, β)
: Hai số mờ tam giác = (a, α, β) tương
, λ, γ) ứng với tập mờ (B, µ B (x)) khi đó các phép toán
ư sau:
δ với ∀δ∈ (0,1]
(b, λ, γ) = (A Θ B) = ∈[ , ]( Θ )
n có thêm điều kiện 0 ∈ Bδ với ∀δ∈ (0,1]
: Phép nhân số mờ tam giác với 1 số:
Trang 36Định nghĩa 2.1.6: Hàm ƒ:TFN´TFN → R được gọi là hàm xác định
quan hệ so sánh trên TFN nếu thỏa mãn các điều kiện:
ƒ( , ) ≥ 0 ; ∀ ∈TFN
Nếu ƒ( , ) ≥ 0 và ƒ( , ) ≥ 0 thì = ;
Nếu ƒ( , ) ≥ 0 và ƒ( , ) ≥ 0 thì ƒ( , ) ≥ 0;
Định nghĩa 2.1.7: Hàm xác định quan hệ so sánh trên TFN được gọi là
hàm xác định quan hệ so sánh toàn phần nếu thỏa mãn điều kiện:
∀ , ∈TFN ta có hoặc ƒ( , ) ≥ 0 hoặc ƒ( , ) ≥ 0
Định nghĩa 2.1.8: Hàm xác định quan hệ so sánh toàn phần trên TFN
được gọi là hàm xác định quan hệ so sánh chặt nếu thỏa mãn điều kiện:
Nếu ƒ( , ) ≥ 0 và ƒ( , ) ≥ 0 thì ƒ( + , + ) ≥ 0;
Nếu ƒ( , ) ≥ 0 và k ≥ 0thì ƒ( , ) ≥ 0;
2.2 Tổ chức dữ liệu cho thuật toán tìm kiếm dữ liệu mờ
2.2.1 Đối sánh ảnh dựa trên đặc trưng SIFT[15]
Phương pháp tra cứu này có tên là Scale-Invariant Feature Transform (SIFT) và đặc trưng trích rút đựợc gọi là đặc trưng SIFT Phương pháp này trích rút các đặc trưng cục bộ bất biến của ảnh Các đặc trưng này bất biến với việc thay đổi tỉ lệ ảnh, quay ảnh, đôi khi là thay đổi điểm nhìn và thêm nhiễu ảnh hay thay đổi cường độ chiếu sáng của ảnh Các đặc trưng này được trích rút ra từ các điểm đặc trưng cục bộ Điểm đặc trưng: Là vị trí (điểm ảnh) “đặc trưng” trên ảnh “Đặc trưng” ở đây có nghĩa là điểm đó có thể có các đặc trưng bất biến với việc quay ảnh, co giãn ảnh hay thay đổi cường độ chiếu sáng của ảnh
Một thuật toán tiêu biểu và có hiệu quả khá cao là dựa theo các đặc trưng cục bộ bất biến trong ảnh: SIFT (Scale-Invariant Feature Transform) do David Lowe đưa ra từ năm 2004 và đến nay đã có nhiều cải tiến trong thuật toán Đặc trưng được trích chọn trong SIFT là các keypoint Keypoint là một
Trang 37điểm hoặc một vùng trong ảnh chứa rất nhiều thông tin cục bộ và không bị thay đổi bởi các hoạt động nhiễu toàn cục hay địa phương như là: biến đổi hình học Affine, tỉ lệ, quay, độ chiếu sáng…
Phươngpháp trích rút các đặc trưng bất biến SIFT được tiếp cận theo phương pháp lọc kim tự tháp, theo đó phương pháp được thực hiện lần lượt theo các bước sau:
Hình 2.2: Minh họa các bước chính trong giải thuật SIFT
a Phát hiện các điểm cực trị (Scale-Space extrema detection)
Bước đầu tiên này tiến hành tìm kiếm các keypoint trên tất cả các tỉ lệ và
vị trí của ảnh áp dụng đạo hàm của hàm Gaussian (DoG - Deffirence of Gaussisan) để xác định tất cả các keypoint tiềm năng mà bất biến với quy mô
và hướng của ảnh Trong bước này, cần dò tìm các vị trí và các độ đo mà chúng bất biến trong các khung nhìn khác nhau của cùng một đối tượng Các
vị trí đó bất biến về độ đo có thể được dò tìm bằng cách tìm kiếm các đặc trưng ổn định trên toàn bộ các độ đo có thể, sử dụng một hàm liên tục về số
đo vốn rất nổi tiếng có tên là hàm độ đo không gian (Witkin 1983)
Trang 38Theo các công bố của Koenderink (1984) và Lindeberg(1994) thì hàm Gaussian là hàm tốt nhất để biễu diễn độ đo không gian của ảnh 2 chiều Độ
đo không gian của một ảnh sẽ được định nghĩa như là một làm L(x, y, σ) được tạo ra bằng cách nhân chập ảnh gốc I(x, y) với môt hàm Gaussian G(x, y, σ) có tham số về độ đo σ thay đổi.
L(x,y,σ) = G(x,y, σ) * I(x,y)
Với:
L(x, y, σ): Hàm không gian tỷ lệ của ảnh I
G (x, y, σ): biến tỉ lệ Gaussian (variable scale Gaussian)
I (x, y): Ảnh đầu vào
* là phép nhân chập giữa x và y
Để tìm những điểm đặc trưng có tính bất biến cao, thuật toán được sử dụng là tìm cực trị cục bộ của đạo hàm của hàm Gaussian viết tắt là DoG
(Difference-of Gaussian), kí hiệu là D(x,y,σ) Hàm này được tính toán từ sự
sai khác giữa 2 độ đo không gian cạnh nhau của một ảnh với tham số đo lệch
nhau một hằng số k
D(x,y,σ) = L(x,y,kσ) –L(x,y,σ) = (G(x,y,kσ) – G(x,y,σ)) * I(x,y)
Các lý do lựa chọn hàm Gaussian là vì nó là kỹ thuật rất hiệu quả để tính
toán L (cũng như làm tăng độ mịn của ảnh), mà L thì luôn phải được tính rất nhiều để mô tả đặc trưng trong không gian đo, và sau đóD sẽ được tính một
cách đơn giản chỉ với phép trừ ma trận điểm ảnh với chi phí thực hiện thấp
Trang 39Hình 2.3: Quá trình tính không gian đo (L) và hàm sai khác D
Hơn nữa, hàm sai khác DoG có thể được sử dụng để tạo ra một sự xấp xỉ gầnvới đạo hàm bậc hai Laplace có kích thước chuẩn của hàm Gaussian
(σ2∇2
G) do tác giả Lindeberg đề xuất năm 1994 Ông đã chỉ ra rằng việc chuẩn hóa đạo hàm bậc hai với hệ số σ2 là cần thiết cho bất biến đo trở nên
đúng Cụ thể, ông đã công bố rằng các giá trị cực đại và cực tiểu của σ2∇2G
chính là những giá trị có tính ổn định nhất (bất biến cao) so với một loạt các hàm đánh giá khác như: gradient, Hessian hay Harris
Mối quan hệ giữa D và σ2∇2
G được biễu diễn như sau:
= ∇Như vậy, ∇2G có thể được tính thông qua việc xấp xỉ đạo hàm riêng tại các tham số đo gần nhau kσ và σ:
Do đó: G(x,y,kσ) = G(x,y,kσ) –G(x,y,σ)≈(k - 1)σ2∇2
G