1. Trang chủ
  2. » Công Nghệ Thông Tin

Kỷ yếu hội thảo quốc gia Hưng Yên: Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông

179 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông
Người hướng dẫn Đỗ Năng Toàn, Viện CNTT - Viện KH&CN Việt Nam, Phạm Minh Chuẩn, Đại học Sư phạm Kỹ thuật Hưng Yên, Trần Trung, Đại học Sư phạm Kỹ thuật Hưng Yên, Ngọc Tuấn, Đại học Sư phạm Kỹ thuật Hưng Yên, Vũ Đức Thi, Viện Công nghệ thông tin, Đặng Quang Á, Viện Công nghệ thông tin
Trường học Đại học Sư phạm Kỹ thuật Hưng Yên
Chuyên ngành Công nghệ thông tin và truyền thông
Thể loại Kỷ yếu hội thảo
Năm xuất bản 2010
Thành phố Hưng Yên
Định dạng
Số trang 179
Dung lượng 6,92 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Kỷ yếu hội thảo quốc gia Hưng Yên Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông giới thiệu đến các bạn những nội dung về cơ sở toán học của tin học, tin học quản lý, công nghệ đa phương tiện, mô phỏng, công nghệ điện tử và viễn thông, công nghệ tri thức và tính toán mềm,... Hy vọng đây là tài liệu tham khảo hữu ích cho các bạn.

Trang 1

KỶ YÉU HỘI THẢO QUÓC GIA HƯNG YÊN, 19-20 THÁNG 8 NĂM 2010

MỘT SỐ VẤN ĐỀ CHỌN LỌC CỦA CÔNG NGHỆ THÔNG TIN VÀ

NHÀ XUẤT BẢN KHOA HỌC KỸ THUẬT

HÀ NỘI-2011

Trang 2

H Ộ I THẢO QUỐC GIA LẦN T H Ứ XIII

M Ộ T SỐ VẤN ĐÈ CH Ọ N LỌC CỦA

C Ô N G NGHỆ THÔNG TIN VÀ TR U Y È N TH ÔNG

C hủ đề: Các công n g h ệ tỉnh toán h iện đại

H ư n g Yen, 19-20/08/2010

T H Ô N G B Á O

Hội thảo Quốc gia lần thứ XIII "Một số vấn đề chọn lọc của Công nghệ thông tin

và Truyền thông" do Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam

và Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Khoái Châu, Hưng Yên từ ngày 19 đến ngày 20 tháng 8 năm 2010 Hội thảo là diễn đàn để các nhà khoa học và quản lý trong

cả nước chia sẻ kinh nghiệm nghiên cứu, triển khai trong lĩnh vực Công nghệ thông tin và truyền thông Đặc biệt Hội thảo cũng là môi trường để những người làm công tác nghiên cứu khoa học trẻ; những nghiên cứu sinh, học viên cao học có điều kiện để trao đổi, tìm kiếm sự tài trợ hợp tác

Các chủ đề chính (không hạn chế) của Hội thảo

• Tin học quản lý

• Mã nguồn mở

• Công nghệ đa phương tiện, mô phỏng

• Giáo dục điện tử, đào tạo từ xa

• Công nghệ điện tử và viễn thông

• Đại học Sư phạm Kỹ thuật Hưng Yên

Viện CNTT - Viện KH&CN Việt Nam

Các hệ thống tích hợpCác hệ thống tính toán di độngThực tại ảo

Công nghệ phần mềm

Xử lý ảnh và kỹ thuật VideoCNTT trong Kinh tế- Kỹ thuật

Cơ sở toán học của tin học

Trang 3

Liên hệ đăng ký tham dự

• Đỗ Năng Toàn Viện CNTT - Viện KH&CN Việt Nam

Thòi hạn đăng ký báo cáo

Toàn văn báo cảo: 30/06/20ỉ 0

Chấp nhận báo cáo: 15/07/2010

Đăng ký đại biểu

Hội nghị phỉ: 100 OOOđồng (miễn p hỉ đối với sinh viên tham gia báo cáo)

• Ban Tổ chức sẽ giúp liên hệ chỗ ăn, ở cho các đại biểu về dự Hội thảo

Quy cách chuẩn bị báo cáo xem chi tiết lại Website: http://www.utehv.edu.vn

Trang 4

Nguyễn Hoàng Hòa

Nguyễn Quang Hưng

Ngô Hùng Mạnh

Nguyễn Hữu Quỳnh

Nguyễn Minh Quý

Nguyễn Văn Tám

Huỳnh Quyết Thẳng

Nguyễn Thị Lê Thu

VNPT Hưng Yên Khoa CNTT - ĐH Thái Nguyên Đại học Công nghiệp Hà Nội Đại học Công nghệ- Đại học QGHN Đại học Sư phạm Kỹ thuật Hưng Yên

Sở TT &Truyền thông Hưng Yên

Bộ Thông tin & Truyền thông

Sờ Khoa học- Công nghệ Hưng Yên Đại học Điện lực

Đại học Sư phạm Kỹ thuật Hưng Yên

Sở GD&ĐT Hưng Yên Đại học Bách khoa Hà Nội Viện Công nghệ thông tin

Ngô Văn Quyết

Ngô Quốc Tạo

Nguyễn Mậu Hân

Viện Công nghệ thông tin

Viện Công nghệ thông tinĐại học Sư phạm Kỹ thuật Hưng YênViện Công nghệ thông tin

Viện Công nghệ thông tin Đại học KHTN Tp Hồ Chí Minh Đại học Công nghệ -ĐHQGHN Đại học Công nghệ -ĐHQGHN Viện Toán học

Đại học Công nghệ -ĐHQGHN Viện Công nghệ ứiông tin Đại học Hàng hải

Đại học Khoa học tự nhiên Viện Công nghệ ứiông tin Đại học Lạc Hồng

Đại học Bách khoa Hà Nội Đại học Huế

Trang 5

Vũ Đình Hòa Đại học Sư phạm 1 Hà Nội

Trang 6

C Á C Đ Ơ N VỊ T À I T R Ọ H Ộ I T H Ả O C N T T 2010

V iện K h o a học v à C ông nghệ V iệt N am

V iện C ô n g n g h ệ T hông tin- V iện K hoa học v à C ông nghệ V iệt N am

T rư ờ n g Đ ại học Sư phạm K ỹ thuật H ư ng Y ên

K hoa C ô n g ng h ệ thông tin - T rường Đại học C ông nghệ - Đại học Quốc

G ia H à NỘI

T rư ờ n g Đ ại học B á ch K hoa H à Nội

T rư ờ n g Đ ại học K h o a học H uế

T rư ờ n g Đ ại học L ạc H ồng

T rư ờ n g Đ ại h ọ c N ha T rang

T rư ờ n g Đ ại học Sư phạm K ỹ thuật N am Đ ịnh

Trưòrng C ao đ ẳn g Sư P hạm T rung ư ơ n g

K h o a C ô n g n g h ệ th ô n g tin- T rường Đ ại học C ông N ghiệp H à N ội

K h o a C ô n g n g h ệ th ô n g tin- T rường Đại học Đ iện L ực

K h o a C ô n g n ghệ th ô n g tin- T rườ ng Đại học Thái N guyên

K lioa C ô n g n g h ệ th ô n g tin- T rường Đại học K hoa học tự nhiên Tp Hồ

C hí M in h

K lìoa C ô n g n g h ệ th ô n g tin- T rường Đ ại học Sư phạm H à N ội 2

K h o a C ô n g n g h ệ th ô n g tin- T rường Đại học T hủ D ầu M ột

K h o a C ô n g n g h ệ th ô n g tin- T rường Đại học Sư phạm K ỹ T huật Vinh

K h o a C ô n g n g h ệ th ô n g tin - H ọc V iện K ỹ th u ật Q uân sự

K h o a C ô n g n g h ệ th ô n g tin- H ọc viện C ông nghệ B ư u chính V iễn thông

T ru n g tâm T in h ọ c- B ư u điện Hải P hòng

T ru n g tâ m C ô n g n g h ệ th ô n g tin - V ăn phò n g T W Đ ảng

T ập đ o àn V iễn th ô n g qu ân đ ội V iettel - C h i n h án h H ư ng Y ên

C ông ty V iễn th ô n g H ư n g Y ên và V inaphone H ư n g Y ên

C ông ty C ổ p h ầ n tru y ền th ô n g tru y ền h ìn h qu ố c g ia H à N ộ i (H T M )

C ông ty C ổ p h ần đ iện tử tin học FSC H à N ội

C ông ty C ổ p hần tư vấn x ây dựng v à th ư ơ n g m ại T hái D ương

C ông ty C ổ p h ần v à th ư ơ n g m ại N B T H ưng Y ên

Trang 8

M ột số vẩn đề chọn lọc cùa C ông nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 nâm 2 0 Ĩ0

LỜI NÓ I Đ ẦU

Hội thảo Quốc gia "Một sổ vấn đề chọn lọc của Công nghệ thông tin ” được khởi

xướng theo sáng kiến của Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ Việt nam, đến nay đã qua hơn 10 lần tổ chức

Hội thảo Quốc gia "Một sổ vấn đề chọn ỉọc pủa Công nghệ thông tin ” lần thứ I được

tổ chức từ ngày 5 đến 7 tháng 8 năm 1997 tại Đại học Sư phạm Hà Nội II, Đại Lải, Vĩnh

Phúc Hội thảo được tổ chức dưới sự phối hợp của: Viện Công nghệ thông tin, Đại học

Quốc gia Hà Nội, Đại học Sư phạm Hà Nội II.

Kể từ đó đến nay, hàng năm cứ mỗi độ thu sang Viện Công nghệ thông tin- Viện Khoa học và Công nghệ Việt Nam lại phối hợp với một trong các trường Đại học trong nước để

tổ chức Hội thảo Quốc gia "Một số vẩn đề chọn lọc của Công nghệ thông tin

Với các chủ để khác nhau, hội thảo Quốc Gìa."Một số vấn đề chọn lọc của Công nghệ

thông tin ” đã thực sự trở thành diễn đàn nhằm trao đổi các kết quả nghiên cứu và triển khai

ứng dụng công nghệ thông tin của các nhà khoa học, đặc biệt là các nhà khoa học trẻ trên mọi miền đất nước

Hội thảo lần thứ XIII với chủ đề “Cóc công nghệ tính toán hiện đạĩ' được Viện Công

nghệ thông tin phối họp với Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Hưng Yên từ ngày 19-20 tháng 8 năm 2010

Hcm 500 đại biểu và khách mòd từ mọi miền của đất nước đã tham dự Hội thảo lần thứ mười ba này Các đại biểu đã nghe và thảo luận gần 150 báo cáo khoa học theo các nội dung:

Các hệ tíiống thông minh

Trang 9

Một sổ vấn đề chọn ¡ọc cùa Công nghệ thông lin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Với sự tham gia đông đảo của các nhà khoa học trong và ngoài nước cùng với số lượng lớn báo cáo khoa học gửi tới Hội thảo đã khẳng định ý nghĩa thiết thực và tầm vóc

quốc gia của Hội thảo "Một sổ vấn đề chọn lọc của Công nghệ thông tin

Các đại biểu đánh giá cao sự nhiệt tình của các đơn vị tham gia tổ chức Hội thảo, đặc biệt là cơ sở đăng cai; Đại học Sư Phạm Kỹ thuật Hưng Yên và đơn vị chủ quản và điều hành chương trình - Viện Công nghệ thông tin

Trong phiên bế mạc Hội thảo lần thứ XIII, Ban Tổ Chức đã trao cờ cho Đại học cần Thơ, là đơn vị đăng cai tổ chức Hội thào lần thứ XIV tại Thành phố cần Thơ

Các công trình được in trong tập kỷ yếu này đã được báo cáo, thảo luận tại Hội thảo và sau đó đã được phản biện nghiêm túc

Ban tổ chức Hội thảo xin chân thành cảm on các đcm vi sau đây đã tài trợ kinh phí cho hoạt động của Hội thảo:

Trường Đại học Sư phạm Kỹ thuật Hưng Yên

Viện Công nghệ Thông tin- Viện Khoa học và Công nghệ Việt Nam

Khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc Gia

Hà Nội

Trường Đại học Bách Khoa Hà Nội

Trưòmg Đại học Khoa học Huế

Trường Đại học Lạc Hồng

Trưòng Đại học Nha Trang

Trường Đại học Sư phạm Kỹ thuật Nam Định

Trường Cao đẳng Sư Phạm Trung ư ơ ng

Khoa Công nghệ thông tin- Trường Đại học Công Nghiệp Hà Nội

Khoa Công nghệ thông tin- Trường Đại học Điện Lực

Khoa Công nghệ thông tin- Trưòng Đại học Thái Nguyên

Khoa Công nghệ thông tin- Trường Đại học Khoa học tự nhiên Tp Hồ chí MinhKhoa Công nghệ thông tin- TrưÒTig Đại học Sư phạm Hà Nội 2

Klioa Công nghệ thông tin- Trường Đại học Thủ Dầu Một

Khoa Công nghệ thông tin- Trường Đại học Sư phạm Kỹ Thuật Vinh

Khoa Công nghệ thông tin - Học Viện Kỹ thuật Quân sự

Khoa Công nghệ thông tin- Học viện Công nghệ Bưu chính Viễn thông

Trang 10

Một s ổ vấn đề chọn lọc của C ông nghệ thông lin và truyền thông, Hưng Yên, ¡9-20 tháng 08 năm 2010

• Tập đoàn Viễn thông quân đội Viettel - Chi nhánh Hưng Yên

• Công ty Viễn thông Hưng Yên và Vinaphone Hưng Yên

Ban Biên tập

II

Trang 11

D A N H S Á C H C Á C P H Ả N B IỆ N

giáo Trung ương

học Quốc gia Hà Nội

học Quốc gia Hà Nội

chính Viễn thông

Trang 12

25 Hoàng Chí Thành PGS.TS Đại học Công nghệ- Đại

học Quốc gia Hà Nội

học Quốc gia Hà Nội

học Quốc gia Hà Nội

13

Trang 14

M ột s ố vẩn đề chọw ỉọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 0 8 năm 20ỈỒ

MỤC LỤC

A COMPARATIVE ANALYSIS OF TECHNIQUES FOR PREDICTING ACADEMIC PERFORMANCE

ĐẢNG CÂU VÂN TIN TRÊN CÁC QUAN HỆ VÀ x ừ LÝ CÂU VÂN TIN TRÊN BẢNG

BẢO VỆ BẢN QUYỀN CÔNG KHAI CHO CÁC cơ sở DỬ LIỆU QUAN HỆ

Như, Nguyễn Xuân Huy

BIẺU DIÊN C ơ SỜ CÙA HỆ SINH ÁNH XẠ ĐÓNG

D ự BẢO NẺ RÂY THEO THỜI GIAN

GIẢI BÀI TOÁN LẬP LỊCH JOB SHOP BẰNG THUẬT TOÁN DI TRUYỀN

HỆ THỐNG GỢI Ý TIN TỨC NEWSARD

Nguyễn Thụy Mai Trâm, Tạ Thúc Nhu

LẬP CHÌ MỤC THEO NHÓM ĐÊ NÂNG CAO HIỆU QUẢ KHAI THÁC cơ sờ D Ữ LIỆU VIRUS CÚM

MÔ HÌNH PHÂN TÍCH ĐỊNH TUYẾN LỆCH HƯỚNG KÉT HỢP VỚI CHUYÊN ĐÔI Bước SÓNG

NHẰM GIẢI QUYÉT TÁC NGHẼN TRÊN MẠNG CHUYẺN MẠCH CHÙM QUANG OBS

15

Trang 15

Một s ố vấn đề chọn lọ c cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

MÔ PHÓNG MỘT SÓ TINII HUỐNG GIAO THÔNG ĐÔ THỊ D ự A TRÊN MÔ HÌNH ĐA TÁC TỪ

MÔI QUAN HỆ GIỮA N G Ừ NGHĨA CÚA CHƯƠNG TRÌNH LOGIC DIỄN GIẢI VÀ CHƯƠNG TRÌNH

LOGIC DẠNG TUYÊN

MỘT CÁCH TIÉP CẬN TRONG HỎ TRỢ THU THẬP DỪ LIỆU T ự ĐỘNG

Nguyễn Duy Linh

MỘT GIẢI PHÁP CẢI TIÉN THUẬT TOÁN BEEMAN TRONG MÔ PHÓNG ĐỘNG L ự c PHÂN TỬ

MỘT PHƯƠNG PHÁP MÓI TIÈN x ử LÝ GIÁ TRỊ THIẾU

MỘT PHƯƠNG PHÁP TRÍCH RÚT CÂU TRONG VĂN BÀN TIẺNG VIỆT s ử DỤNG LUẬT KẾT HỢP

MỘT PHƯƠNG PHÁP x ừ LÝ KÉT QUẢ TÌM KIÊM TRÊN WEB

MỘT SỔ CÀI TIÊN NÂNG CAO Tốc Đ ộ x ừ LÝ CÚA PHƯƠNG PHÁP MÃ HÓA s ố HỌC

MỘT SỐ CÀI TIÉN THUẬT TOÁN PHÂN CỤM SONG SONG D Ữ LIỆU LỚN, NHIÊU CHIÊU

DỰA TRÊN LƯỚI THÍCH NGHI PMAFIA

MƯỢN KÊNH ĐỘNG TRÊN c ơ s ờ B ộ ĐIÊU KHIÊN MÒ SỪ DỤNG SUBSETHOOD

Trang 16

Một số vấn để chọn lọc cùa Công nghệ thông tin và truyền thông, Hung Yên, 19-20 tháng 08 năm 2 0 Ỉ0

NGHIÊN c ú u BA CHÉ Đ ộ ĐIÊU KHIÊN ON/OFF, PID, FUZZY VÀ ỨNG DỤNG TRONG ĐIÈU

KHIÊN MÔ HÌNH LÒ NHIỆT

NGHIÊN CỬU MÔ HÌNH GIÁM SÁT TR ựC TUYÉN HỆ THỐNG MẠNG PHÂN TÁN QUY MÔ LỚN

PHÁT HIỆN CHÁY S ừ DỤNG CAMERA THÔNG THƯỜNG TRONG ĐIÊU KIỆN ÁNH SÁNG

MÔI TRƯỜNG YÉU

PHÁT HIỆN LUẬT KẾT HỢP SPORADIC TUYỆT ĐỐI HAI NGƯỠNG MỜ

PHÉP DỊCH CHUYÊN L ư ợ c Đ ồ KHỐI VÀ VẤN ĐÊ BIÊU DIỄN BAO ĐÓNG, KIIOÁ TRONG

MÔ HÌNH D ử LIỆU DẠNG KHỐI

REGULARIZATION FOR A COMMON SOLUTION OF A SYSTEM OF NONLINEAR ILL-POSED

EQUATIONS WITH PERTURBATIVE DATA

SO SÁNH CẨU TRÚC PROTEIN SỪ DỤNG MÔ HÌNH TỐNG QUÁT

SO SÁNH VÀ ĐÁNH GIÁ MỘT s ố GIAO THỨC ĐỊNH TUYÉN ĐIỀU KHIÊN THEO YÊU CẢU TRÊN

MẠNG MANET

TIÊP CẬN CHIA MIỀN TỚI CÁC BÀI TOÁN VỀ MẶT PHÂN CÁCH

rÍNH TOÁN Đ ộ TRẺ GlÀl MÃ CỦA NGÔN NGỮ BÂNG OTOMAT

17

Trang 17

Một s ố vấn đề chọn lọc của Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Nguyễn Thị Hoàng Lan

XÂY DỤNG GIẢI PHÁP BẢO MẬT BIOPKI VÀ ÚÌMG DỤNG ĐẺ BẢO M ẬT HỆ NHẬN

VÈ PHÉP BIÉN ĐỔI HỆ SINH ÁNH XẠ ĐÓNG

VÊ PHƯƠNG PHÁP PHÂN NGƯỠNG ẢNH THÍCH NGHI S Ừ DỤNG TẬP MỜ LOẠI 2

TMUẬT TOÁN HIỆU QUẢ KHAI PHÁ TẬP MỤC LỢl ÍCH CAO TRÊN DÒNG DỮ LIỆU

MÔ HÌNH HOÁ VÀ ĐIÊU KHIÊN TÔI ư u T ư THẾ VỆ TINH NHÒ DÙNG B A THANH TỪ Lực

Trang 18

M ật sổ vắn đề chọn Ịọc của C ông nghệ thông tin và truyền thông, Hưng Yên, ỉ 9-20 thảng 08 năm 2 0 ỉ 0

A METHOD FOR DATA MINING

IN INCOMPLETE INFORMATION SYSTEMS

Hoang Thi Lan Giao’, Nguyen Thi Lan Anh^

(1) Department o f IT, College o f Sciences, H ue University, Vietnam

(2) Department o f Informatics, College o f Pedagogy, H ue University, Vietnam

To deal with missing attribute values in incomplete information systems,

G.Busse used the characteristic relation instead o f the indiscernibility relation.

Based on this relation and the information theory, in this paper, we propose an

algorithm to fin d a reduct o f an incomplete decision table and the other-

HLEM algorithm- to induce rules from it.

Keywords; missing attribute value, characteristic relation, rough entropy, reduct, rule induction

1 Introduction

In a data set, there are usually some redundant attributes, which are not essential for knowledge discovering Hence, eliminating these attributes to simplify and hasten the data mining process is an important request In other words, following rough set approach, we need to find a reduct of an information system or decision table

However, in real life, data sets may have missing attribute values Missing attribute values are the attribute values o f corresponding case which cannot be specified So, information systems (or decision tables) containing missing attribute values are incomplete information systems (or decision tables, respectively) There are two types of missing attribute values: lost values and do not care conditions [1,2,3,4] Lost values are the attribute values were originally known but currently they are not specified because of many reasons Do not care conditions are ineffective attribute values in the classification of the case they belong to

To solve the missing attribute value problem, G Busse initiated the method: extending the indiscernibility relation to characteristic relation In this paper, we will use this relation to construct one algorithm finding decision rules in incomplete decision table Besides, using concept o f entropy in information theory, we will also propose an heuristic algorithm to compute a reduct of incomplete decision table before inducing rules And we will also assume that decision tables are consistent

19

Trang 19

2 Data preprocessing in Incom plete Decision Tables

2.1 Characteristic relations and set approximations

In the incomplete decision table DT = (U, CuD ), with an attribute a e c and ve Va

is an value of a for some cases, let t = (a, v) be an attribute-value pair and then block o f t,

denoted by [t], is a set o f all cases from Ư that for attribute a has v alue V o r *.

Incomplete decision tables are described by characteristic relations instead of indiscemibility relations [3],[4],[5],[6], so equivalence classes are replaced by

If DT is a complete decision table, R(B) is clearly indiscernibility relation IND(B),

so it is an extension of IND(B) in incomplete information system R(B) is reflexive but- in general- is not symmetric or transitive

Let U/R(B) denote the family set {Kb(x), xeU } Characteristic sets in U/R(B)

a Singleton approximation: lower and upper approximations are sets o f singletons

from Ư sastisfying some properties

A singleton B-lower approximation of X is defined as:

b Subset approximations', are unions o f characteristic sets o f any X from Ư:

Một số vấn đề chọn ỉọc của Công nghệ thông tin và truvển thông, Hưng Yên, ỉ 9-20 thảng 08 năm 2 0 ỉ 0

Trang 20

of subset approximations by a concept X.

A concept B-lower approximation o f X is:

of subset B-upper approximation and it is the smallest set which includes X

Among the three approximations, the concept B-lower approximations are the most suitable for inducing rules [1,2]

In case of complete decision table, three approximations are the same But this property is not true for incomplete decision table

DT’ = (U, PuD ) is independent and U/R(P) = U/R(PuD)

Example 2.1

= {Temp, Headache, Nausea, Ache} and D = {Flu}:

M ột số vấn đề chọn lọc của Câng nghệ thông tin và truyền thông, Hung Yên, ¡9-20 tháng 08 năm 2 0 Ỉ0

21

Trang 21

Một sổ vấn đề chọn lọc của Công nghệ thẬng tin và truyền thông, Hưng Yên, ĩ 9-20 thảng 08 nãm 2 0 ỉ 0

From (*) and (**) we can conclude that P ={Temp, Headache, Ache} is a reduct of C

2.3 Rough Entropy and significance of attributes

denotes the probability o f one o f the values in characteristicset KB(xi) within U,

set KB(xi)

Some properties of the rough entropy: cardinality, monotocity, equivalence,

Trang 22

M ột số vấn đ ề chọn lục cùa C ông n g h ệ thông.Hn và truyền thông, H ưng Yên, I9-2Ỡ thảng 0 8 năm 2 0 1 0

Theorem 2.1

DT iff p is the smallest set which satisfies E(P) = E(PuD)

Proof:

o (U, P uD ) is independent and U/R(P) = U/R(PuD)

o Vc e p, U/R(P\{c}) ^ U/R(P\{c}uD) and U/R(P) = U/R(PwD)

p is minimum and E(P) = E(PuD) (equivalence property)

Using rough entropy of knowledge, we can define the significance o f an attribute

Definition 2.4

C o r e (C ) = { : e c | i 7 g c \ H ( c ) > o } ,

Definition 2.5

Let DT = (U, C uD ) be an incomplete decision table, P cC , ceC\P The significance

of c about p, denoted sigP(c), as:

sig,{c) = E [p u D )- E { P u {c}u D)

2.4 Algorithm based on rough entropy for computing reduct

Let DT = (U, C uD ) be an incomplete decision table We will find a rcduct of c by

attribute in C\Core(C) to add to this Core until we have E(Corc(C)) = E(Core(C) uD )

23

Trang 23

and n is the cardinality of Ư.

Example 2.2

Let consider the incomplete decision table which is shown in Table 1 We will find

Trang 24

M ột sổ vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên ỉ 9-20 tháng 08 năm 2 0 Ỉ0

- sigp(a3) = E(PuD)- E(Pu{a3}uD) = E(PuD)- E(ai,a2,,a3}uD)

=i> E(P) = ^ = E(PuD )

The decision t3ble sfter reducing - DT’ = (U, P uD ) - is shown by Tsb 2

Table 2- The incomplete decision system after reducing of Table 1

3 Rule induction in incom plete decision tables

algorithm, we will find a minimal complex T for a whole characteristic set of x\ by

possible However, we won’t expand T like NewLEM2 [5], we will eliminate the

25

Trang 25

redundant attribute-value pairs in the former T to get a suitable minimum complex The some below concepts are defined to describe the HLEM algorithm.

Let DT= (U, C uD ) be an incomplete decision table, V be a nonempty lower or upper approximation of a concept whose decision value is w

Let T be a set of attribute-value pairs, T = {t = (a, v)}, denote [T’]= p |[/]

leT

Then, V depends on T iff 0 [r] c F

T is a minimal complex of V if V depends on T and there is not proper subset T ’ of

T such that V depends on T’

A minimal complex T of V is a predecessor of a decision rule matching with some cases in [T],

covering of V iff T satisfies the below conditions:

Each member T of T is a minimal complex of V

Hence, T is the smallest set of minimal complexes totally covering the approximation V of someconcept X; in other words, T is a set of predecessors (conditions)

of the decision rule set covering V

The HLEM algorithm which is presented below can be used to find T

M ột số vẩn đề chọn lọc cùa Cõng nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Trang 26

M ột số vấn đề chọn lọc của Công nghệ thông tỉrĩ và truyền thông, Hưng Yên, Ĩ9-20 tháng 08 năm 2010

{(Temp,Very-high), (Headache,Yes), (Nausea,Yes)}, T =TV(2) Among these three

(Nausea,Yes)} With t = (Headache,Yes), the block of [ r \ {/}]= {2,4,5,6}cX V and with t

minimal complex of V

Because G = {4}^^0, let continue to compute another minimal complcx of V

{(Temp, High), (Nausea,Yes)}} Clearly, we cannot drop any o f minimal complexes from

• (Headache,Yes)->(Flu,Yes)

Let n be the cardinality of V, m be the cardinality o f C The time complexity of WHILE loop (line 4-16) is 0(n).The computational complexities for selecting x (line 6), computing TV(x) (line 7) are 0(n) and 0 (m ) respectively Because the complexity for both selecting (line 10) and eliminating t (line 11) are 0(m ) so the REPEAT iteration (line 9-13)

is performed at most m^ times On the other hand, the FOR loop (line 17-18) is executed at most n^ times So the time complexity o f HLEM is O(n^), assuming that n » m

27

Trang 27

M ột số vắn đề chọn ỉọc của Công nghệ thông tin và truyền thõng, Hưng Yên, ỉ 9-20 tháng 08 nầm 20 ĩ 0

[2]

4 C onclusions

In this paper, the algorithm which is used to find one reduct of an incomplete decision table was presented By this way, we can simplify the data set, i.e eliminate some redundant attributes Then, applying HLEM, we will have a rule set o f incomplete decision table Using two algorithms help us reduce the time complexity o f rule inducing process and in some cases, the quality of the rule set is better than using LEM2

References

[1] Grzymala-Busse J., “Rough Set Strategies to Data with Missing Attribute Values”, Proceedings of the Workshop on Foundations and New Directions in Data Mining, associated with the third IEEE International Conference on Data Mining, November 19-22, Melbourne, FL, USA, 2003, pages 56-63

Grzymala-Busse J., “Data with Missing Attribute Values: Generalization of Indiscemibility Relation and Rule Induction”, Transactions on Rough Sets, Lecture Notes in Computer Science Journal Subline, Springer-Verlag, vol.l,

Hoàng Thị Lan Giao, Nguyễn Thị Lan Anh, “ For Inducing Rules in Incomplete Decision Table” (in Vietnamese), Research, Development and Application on Information & Communication Technology, No 21, 2009, pages 69-75

Liang, J and Xu, z., “The Algorithm on Knowledge Reduction in Incomplete Information Systems”, International Journal o f Uncertainty, Fuzziness and Knowledge-Based Systems, Vol 10, No 1, 2002, pages 95-103

Skowron, A and Zhong, N., “Rough Sets in KDD”, Tutorial Notes, 2000

Skowron, A., “Rough Sets and Boolean Reasoning”, Granular computing: an emerging paradigm, 2001, pages 95 - 124

Trang 28

BẢNG CÂU VẤN TIN TRÊN CÁC QUAN HỆi

.

VÀ XỬ LÝ CÂU VÁN TIN TRÊN BẢNG

Lê Huy Thập

Viện Công nghệ thông tín, Viện Khoa học và Công nghệ Việt Nam

Câu vấn tin đại số quan hệ được thể hiện bằng một bảng gọi là bảng truy vẩn.

Các tiêu đề hàng và cột sẽ là tên các quan hệ cơ sở, các quan hệ trung gian

hoặc kết qủa thực hiên câu vấn tin Các cell sẽ là các toán tử để thực hiện các

phép toán đại sổ quan hệ nhằm sinh ra các quan hệ trung gian Cùng với tiêu

đề hàng, cột ta sẽ gắn một trọng sổ để chi chi phi xử lý phép toán trên quan hệ đó; các cell (i, j) cũng được gán trọng sổ để chỉ chi phí chuyển sổ liệu từ toán

tử ì đến toán tử j Minh họa xử lý câu vẩn tin bằng bảng trũy vẩn sẽ được thực hiện cho việc lập lịch truy vẩn trên cây toán tử đường ổng, tức là phân chia các toán tử cho các bộ xử lý để thời gian trả lời truy vẩn nhỏ nhất.

Khi đã có bảng thể hiện câu vẩn tin, chúng ta d ễ dàng dùng các thuật toán xử

lý mảng để xử lý câu vẩn tin.

1 Định nghĩa và cách thể hiện câu vấn tin bằng bảng

Để thể hiện câu vấn tin SQL bằng bảng trước hết chúng ta chuyển nó sang câu vấn tin đại số quan hệ, sau đó thể hiện câu vấn tin này trên bảng

PROJ(PNO , PNAME, BUDGET, LOC) và ASG(ENO, PNO , RESP , DUR)

Để đơn giản về mặt ký hiệu chúng ta thay: E = EMP, A = ASG, p = PROJ

Cho câu hỏi: “Hãy cho biết danh sách tên các nhân viên, trừ J.Doe đã làm cho dự

án “CAD/CAM” trong thời gian 12 tháng hoặc hai mươi bốn tháng?”

Câu tmy vấn SQL là: “SELECT ENAME FROM A, E, PWHERE A.ENO = E.ENO AND A.PNO = P.PNO AND ENAME “J.Doe” AND P.PNAME = “CAD/CAM ” AND (DƯR=12 OR DUR=24)”

M ộ t s ố vấn đ ề chọn lọc của C ông nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2 0 Ỉ0

29

Trang 29

Một số vắn đề chọn lọc của Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Với ký hiệu K là phép chiếu, ơ phép chọn và © phép nối thì một trong những câu

”J.Doe” (P©PN o(E 0 en O A)))))”

1.1 Bảng truy vấn dạng đại số quan hệ

Bảng truy vấn dạng đại số quan hệ là bảng được dùng để thể hiện câu vấn tin dạng đại số quan hệ

1.2 Thể hiện bảng vấn tin đại sổ quan hệ

Bảng vấn tin dạng đại số quan hệ của câu vấn tin được xây dựng hư sau:

1 Nhóm các hàng-cột đầu tiên là được gọi là nhóm cơ sở, tiêu đề của mỗi hàng - cột biểu thị cho một quan hệ được lưu trong cơ sờ dữ liệu

2 Nhóm thứ hai gồm các hàng - cột trung gian biểu thị một quan hệ trung gian được sinh ra bởi phép toán quan hệ sau WHERE

3 Nhóm cuối cùng gồm các hàng - cột kết quả sau SELECT

4 Các phép toán để sinh ra quan hệ trung gian là tiêu đề cột nằm trong các cell của cột tương ứng:

Với phép toán đơn ngôi, nó chỉ có mặt một lần trong hang, còn hai ngôi, nó có mặt hai lần trong hàng

vấn tin đại số ở ví dụ 1-1 theo định nghĩa sẽ được biểu diễn ờ bảng 1-1

Trang 30

Để đơn giản chúng ta sẽ đánh số hàng - cột bời số thứ tự theo thứ tự xuất hiện của chúng.

Ví dụ 2-1. Cột 6, 7, 8 (bảng 1-2) là các phép toán đơn ngôi trên cùng quan hệ (E 0 E N U

A) 0PNO p ở hàng 5 nên các hàng này có thể gộp lại vào cột 6, và khi đó toán tử tại cột 6 sẽ là: ơ(D U R=12 V DUR=24) A (PNAME = "CAD/CAM” ) A ( ƠENAME * "j.D oc”), đánh sổ lại ta được bảng 2-1

2.2 Thay đổi các phép toán trong cell

Các phép toán trong cell nếu có thể thì thay bởi phép toán để dễ và giảm chi phí

l à k ể t quả chọn Ơ E N A M E * ”J.Doe” A PNAME = ’’CAD/CAM" A DUR=I2 V DUR=24, và cuối cùng cột 7 l à k ế t

quả chiểu TĨPNAME của cột 6 Cuối cùng ta được bảng 2-2.

31

Trang 31

M ột sổ vần đề chọn ĩọc của Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 ĩháng 08 năm 2010

Nhận xét Do các hàng trong bảng có thể giao hoán để được các bảng truy vấn khác nhau Như vậy chúng ta sẽ có nhiều bảng truy vấn khác nhau từ đó có thể tìm ra bảng truy vấn tốt nhất theo một tiêu chuẩn nào đó [3], [4], [5]

Định nghĩa 2.3-2 Giả sử có p bộ xử lý, một phân hoạch Ipw thành p lớp F i , F p ,

là chia các hàng - cột Ipw thành p lớp F i , F p , với lớp Fk do bộ xử lý thứ k thực thi

Tải trên Ipw được xác định bởi

Tỷ lệ tải tại toán tử i trên bộ xử lý k là:

(2.3-3)

Trang 32

M ột số vấn đề chọn lọc cùa Cóng nghệ thông tin và truyền thông, Hưng Yên 19-20 thảng 08 năm 2010

Ví dụ 2.3-1 Liệt kê danh sách tên các nhân viên, với chức vụ là “Manager” đang tham gia một dự án nào đó Câu lệnh SQLsẽ là:

SELECT ENAME FROM E, A WHERE E.ENO = A.ENO AND A.RSP = “Manager”

Giả sử: Xử lý tại E (hàng 1) hết 3 đơn vị và chuyển dữ liệu đến thực hiên phép toán

E 0 e n o A là 4 đơn vị Xử lý tại A (hàng 2) hết 2 đơn vị và chuyển dữ liệu đến thực hiên

phép toán E Q e n o A hết 1 đơn vị Xử lý phép toán E © E N o A (hàng 3) hết 3 đơn vị và thời

ơ R csp = "Manager” hết 5 đơn vị và chuyển dữ liệu đến thực hiên phép toán Ơ Rcsp = ’’Manager” hết 1

Bảng 2.4- Các ti và cellij của Ipw

còng thức (2.3-1), , (2.3-3) ta có:

33

Trang 33

luỊ = (Í2 + C23) + (t4 + ceíUs+celUs) = (2 + l)+(5 + 1 + 1) = 10 là tải trên F2

L 3 = ts + C 5 4 = 7 + 1 = 8 là tải trên F 3

2.3.2 Các phép gộp và tách hàng - cột

Tìm một phân hoạch (F¡, Fp) của Ipw, gom các toán tử (các hàng) vào các lớp

(Fklk=i p sao cho L ở công thức (2.3-2) là nhỏ nhất.

Định nghĩa 2.3-3 Ta nói hàng ì có liên kết với hàngý nếu cellụỶ 0 hoặc tìm được một dãy cellij! Ỷ 0, cellj!y7 0, , celljm; ^ 0

Định nghĩa 2.3-4 phép Gop(i,j)

Gộp hàng i với hàngỹ được sử dụng để gộp hai hàng - cột / và j trong tập F*tạo ra hàng

ii Nếu / và j đã liên kết với những hàng nào thì m sẽ liên kết với những hàng đó.

Định nghĩa 2.3-5 Phép Tach(ỉ,j) Tách liên kết hàng i với hàngỹ được sử dụng để bỏ liên

kết của hàng / và hàngỹ trong tập F*như sau: Nếu hàng i và hàngy thuộc tập Fk, đưa hàngỹ

2.3.3 Loại bỏ cell có trọng số lớn

Định nghĩa 2.3-6 Cellij của Ipw toán tử được gọi là có trọng số lớn nếu

cell.j > t + ỵ^cell,, hoặc cellJ > tj + Ỵ^cell,j (2.3-4 )

Nghĩa ià chi phí truyền giữa hai toán tử / và j lớn hơn chi phí xử lý tại một trong hai

toán tử Giải pháp tốt trong trường hợp này là gộp cả hai toán tử này cho một bộ xử lý sẽ giảm được chi phí truyền [4], [5]

Định nghĩa 2.3-7 Một Ipw được gọi là không giảm riếu X và F là các tập các hàng có liên

Thuật toán TienXuLy dưới đây sẽ loại bỏ các cell có trọng số lớn trong Ipw

Thuật toán TìenXuLy

Input: Ipw(n,n)

Output: Ipw(n \n ') không giảm

M ột số vấn đề chọn lọc cùa Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Trang 34

M ột số vấn đề chọn lọc của Công nghệ thông tin và truvển thông, Hưng Yên, 19-20 tháng 08 năm 2010

Định nghĩa 2.3-9 Một ĩpw được gọi là Ipw(B, p) nếu nó là một Ipw liên kết chặt, sử dụng

Định nghĩa 2.3-10 Cho ỉpw, một hàng của ỉpw được gọi là hàng cơ sở nếu nó được sử

dụng biểu diễn một quan hệ cơ sờ trong câu vấn tin SQL

là các hàng cơ sở và có thể có một hàng không là hàng cơ sở

Nhận x é t 2 Nếu gọi Rị = t ị + 'Y_jCeỉỉị., thì thời gian trả lời lịch truy vấn của Ipw đã qua

Bổ đề 2,3-1 Nếu ^ là một Ipw(B, p) có hàng dẫn xuất cấp một m và hàng cơ sở rj đặt trong

35

Trang 35

thì Ipw S ’ được tạo từ s bằng cách đổi chỗ rj và r¡ cũng là Ipw(B, p) [4], [5'.

B ổ đề 2.3-2 Nếu tồn tại một Ipw (B, p) thì cũng tồn tại một Ipw (B, p) khác sao cho:

i/ Nếu hai hàng m, Kj bị gộp thì hai hàng m, rj.j cũng bị gộp

iị/ Neu cạnh (m, rj) bị cắt thì cạnh (m, rj+i) cũng bị cắt.

Gọi s là số lớn nhất các hàng cơ sở có thể được gộp với hàng dẫn xuất cấp một m

While (tồn tại một hàng dẫn xuất cấp một m) và (số-nhát- cắt <p - 1)

Return phân hoạch liên kết chặt ( F ¡ , Fp);

Chúng ta sẽ tìm một Ipw truy vấn liên kết chặt tối mi bằng cách thực hiện thuật toán

Bp_Schedule nhiều lần, bắt đầu tìr giá trị B được đặt bằng cận dưới của thời gian trà lời

Sau đó mỗi bước tăng dần B cho đến khi thuật toán Bp_Schedule cho ra lời giải hợp lý Nghĩa là thời gian trả lời của Ipw tìm được phải bé hơn B IChi đó giá trị B cũng là giá trị

bé nhất

M ột sồ vấn đ ề chọn lọc của Công nghệ thông tin và truyền thông, H ưng Yên, 19-20 tháng 08 năm 2010

Trang 36

M ật số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

thiết trọng số celỉij=0 với V// nên từ nhận xét 2 chúng ta có:

Fị là một hàng có trọng số nhỏ nhất trệng tất cả các hàng không thuộc Fi nhưng lại nối tới

một hàng trong Fị Gọi Bị = Tai(Fị) + tki' Mỗi lần lặp thành công thuật toán thì nhóm chứa

Sử dụng các bổ đề 2.3-1 và 2.3-2 ta có bổ đề sau:

B ổ đề 2.3-3 B* = mini <i<pBi là một cận dưới của thời gian trả lời tối ưu Từ đây ta có

thuật toán để tìm phân hoạch liên kết chặt có maxiđ^(Tai(Fị)) nhỏ nhất.

Thuật toán 2.3-2 Thuật toán BalancedCuís

Input: Ịpw ỉdiông giảm có celỉụ = 0 Vij,p là số bộ xử lý.

Output: Phân hoạch liên kết chặt (Fi, ,Fp) sao cho mỵx.\<i<pTai(Fi) nhỏ nhất.

IfTai(rp) <B then return phân hoạch (Fi, , Fp);

Bi Tai(Fi) + tki; /* tki là trọng số của hàng liền kề của Fi */

End while

End.

tạp cùa bài toán tìm Ipw liên kết chặt tối ưu ià O(n^p).

2.3.4 Một số thuật toán giải H EU RISTIC

Thuật toán phân chia công việc.

bất kỳ với thời gian tj Giả sử có p bộ xừ lý

Thuật toán: "Giao công việc có thời gian thực hiện lớn nhất trong các công việc chưa được phân công cho bộ xử lý hiện thời có tải ít nhất" Nội dung thuật toán được trình bày trong [3], [5]

37

Trang 37

M ột số vấn đ ề chọn ¡ọc của C ông nghệ thông tin và truvển thông, H ưng Yên, ¡9 -2 0 tháng 08 năm 2 0 1 0

Thuật toán Dividing-BalancedCuts

Ipw toán tử không giảm, số bộ xử lý là p Thuật toán được thể hiện như sau:

Thuật toán LocalCuts

Input: Ipw toán tử đã qua tiền xử lý, tham sọ ớf>l.

Output: Phân hoạch liên kêt chặt (Fi, Fk).

Do While <Còn hàng thứ cap m có hàng con j>

Iftj > aCj„ Then

Nhận xé t 3 Thuật toán có độ phức tạp 0(n) Kết quả thuật toán là một phân hoạch

liên kết chặt không thể đoán trước được nên thông thường thuật toán này sẽ cùng đi đôi với một thuật toán khác (Cân bằng tải chẳng hạn) để phân phối các phân hoạch liên kết chặt

Trang 38

M ột sổ vấn đề chọn lọc của Công nghệ thông tin và truvên thong, Hung Yên, 19-20 tháng 08 năm 2010

Thuật toán LocalCiits chỉ xem xét sử dụng toán tử gộp hay tách một hàng cơ sở vào

{6,11.12,12} tải \ 1, F4=^{ 15 } tải ì ì , F5 = { 14 16 } tải 11, Fö = { 3,7,8 } tải 26, Fj = {1,2 } tải 25 Như vậy thời gian trả lời truy vấn Ipw với 7 bộ xử lý là L = 26.

39

Trang 39

K ết luận

Việc thể hiện các câu vấn tin bằng bảng tạo ra khả năng xử lý nó tốt hơn Khi đã có bảng thể hiện câu vấn tin, chúng dễ dàng dùng các thuật toán xử lý mảng để xử lý câu vấn tin Duyệt bảng vẩn tin được thực hiện trên các trọng số hàng và nội dung các cell là cách làm quen thuộc và dễ dàng cho các lập trình viên Các thuật giải Heuristic để ỉập lịch tối

ưu, cân bằng tải tối ưu, cũng hoàn toàn được xử lý trên mảng câu truy vấn

Tài liêu tham khảo

[1] Barry Wlkingson, Michael Allen, “Parallel Programming, Technique and Applications Using Netwworked Workstations and Parallel Computers”, Prentice Hall New Jersey, 1999

’2] Seyed H Roo, “Parallel processing and Parallel Algorithms, Theory and Coputation”, Springer 1999

‘3] Đoàn Văn Ban, Nguyễn Mậu Hân, “Xử lý song song và phân tán”, NXB Khoa học và kỹ thuật, Hà Nội 2006

[4] Lê Huy Thập, “Cơ sở lý thuyết song song”, NXB THÔNG TIN VÀ TRUYỀN THÔNG, 2010, 300 p

[5] Japan Information Processing Development Corporation, Central Academy of Information Technology, “Internal Design And Programming”, 1978

[6] ĐỒ Xuân Lôi, “Cấu trúc dữ liệu và giải thuật”, NXB Khoa học và Kỹ thuật, 1996

M ột số vẩn đề chọn lọc của Cóng nghệ thông tin và tntvền thõng, Hưng Yên, 19-20 thảng 08 năm 2010

Trang 40

BẢO VỆ BẢN QUYỀN CỒNG KHAI CHO CÁC C ơ SỞ DỮ LIỆU QUAN HỆ

Lưu Thị Bích Hương ‘ , Bùi Thế Hồng ^

(1) Khoa Công nghệ thông tin, Đại học S ư phạm Hà Nội 2 (2) Viện Công nghệ Thông tin, Viện Khoa học và Công nghệ Việt Nam

Cho đến nay, các ỉược đồ thủy vãn dừng để bảo vệ bản quyền cho các cơ sở dữ liệu quan hệ đều phải dựa vào một khóa bí mật nào đỏ khi chứng minh quyền

sở hihi đối với các cơ sở dữ liệu đã thủy vần Nhưng từ đỏ trở đi, khóa bí mật này coi như đã bị lộ và vì vậy thủy vân đã nhúng sẽ dê dàng bị phả hủy bởi những kẻ tò mò Hơn nữa, hầu hết các kỳ thuật thủy vân hiện có đều làm sai ỉệch dữ ỉiệii trong qui trình nhúng thủy vãn và vì vậy sẽ làm giảm giá trị sử dụng của cơ sở dữ liệu, vẩn đề này đã được Y Li và R H Deng đề xuất trong bài báo [IJ Các tác giả này đã đưa ra một ỉược đô thủy vân mới và với ỉược

đồ này bất cứ ai cũng có thể chứng minh một cách công khai bản quyền của cơ

sở dữ liệu đã thủy vân Dựa vào ỷ tưởng và các thuật toán của [I], chủng tôi

đã đưa ra một cải tiến nhằm đơn giản hóa cách chọn các bit MSBs nhưng vẫn

chứng minh một cách công khai bản quyền dữ liệu bao nhiêu lần tùy ỷ Lược

đồ của chúng tôi bền vững trước các tân công điên hình bao gom thêm hoặc xóa các bộ hoặc các thuộc tính, thay đoi giá trị một cách ngẫu nhiên hoặc có lựa chọn.

L Gió*i thiêu

Trong vài năm gần đây, các nhà nghiên cứu đã phát triển một số kỹ thuật thủy vân đ(ể bảo vệ bản qíiyền các cơ sở dữ liệu quan hệ [4, 2, 3, 5, 7, 6] Có một điểm chung của céác kỹ thuật này là chúng đều dựa vào một khóa bí mật trong thuật toán nhúng thủy vân và plhát hiện thủy vân Nhờ vào khóa này, người chủ của sản phẩm sẽ có thể chứng minh chủ qiuyền của minh đối với sản phẩm

Một đ i ể m chung nữa là quá trình thủy vân có làm dữ liệu bị sai lệch Trong đó, có miột số kỹ thuật thay đổi các giá trị thuộc tính [4, 2, 7] và một số kỹ thuật khác lại hoán vị

cíảc giá trị phân loại [3, 5] Những sai lệch này thường chỉ được thực hiện trong giới hạn

saao cho giá trị sử dụng của dữ liệu đối với các úng dụng nhất định không bị ảnh hưởng và thiủy vân vẫn có thể tìm lại được ngay cả khi có những tấn công làm thay đổi giá trị thuộc tímh hay thêm hoặc xóa một số bộ

Mặột so vấn để chọn lọc của Công nghệ thông tin và truvểrì thông, Hung Yên, 19-20 tháng 08 năm 2 0 Ỉ0

41

Ngày đăng: 20/05/2021, 01:55

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] R.J.A. Little, D.B. Rubin, Statistical analysis with missing data, Wiley Series in Probability and Mathematical Statistics, Wiley, New York, 1987 Sách, tạp chí
Tiêu đề: Wiley Series in Probability and Mathematical Statistics
[2] U.M. Fayyad, G. Piatetsky-Shapiro, p. Smyth, From data mining to knowledge discovery: an overview, Advances in Knowledge Discovery and Data Mining, MIT Press, Cambridge, MA, 1996 pp. 1-36 Sách, tạp chí
Tiêu đề: Advances in Knowledge Discovery and Data Mining
3] R. Agrawal, H. Mannila, R. Srikant, H. Toivonen, A.I. Verkamo, Fast discovery o f association rules, Advances in Knowledge Discovery and Data Mining, MIT Press, Cambridge, MA, 1996 pp. 307-328 Sách, tạp chí
Tiêu đề: Advances in Knowledge Discovery and Data Mining
[4] R. Agrawal, T. Imielinski, A. Swami, Mining association rules between sets of items in large databases, in; Proceedings o f the ACM SIGMOD Conference on Management o f Data, Washington, DC, USA, 1993, pp. 207-216 Sách, tạp chí
Tiêu đề: Proceedings o f the ACM SIGMOD Conference on Management o f Data
[5] A. Ragel, B. Crémilleux, Treatment o f missing values for association rules, Proceedings o f The Second Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD-98), Melbourne, Australia, Lecture Notes in Artificial Intelligence 1394, Springer, Berlin, 1998 pp. 258-270 Sách, tạp chí
Tiêu đề: Proceedings o f The Second Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD-98)
[6] A. Ragel, B. Crémilleux, MVC - A Preprocessing method to deal with missing values. Knowledge-based Systems, 12(5-6), 1999, pp. 285-291 Sách, tạp chí
Tiêu đề: Knowledge-based Systems
[8] H. Toivonen, Sampling large databases for association rules, in: Proceedings o f the 22nd International Conference on Very Large Databases (VLDB’96), Morgan Kaufmann, India, 1996 pp. 134-145.[ available on the web from http://www.informatik.uni-trier.de/lev/db/conf/vldb/Toivonen96.htmn Sách, tạp chí
Tiêu đề: Proceedings o fthe 22nd International Conference on Very Large Databases (VLDB’96)
[9] w.z. Liu, A.P.White, S.G. Thompson, M.A. Bramer, Techniques for dealing with missing values in classification, in: Second International Symposium on Intelligent Data Analysis, London, UK, 1997 Sách, tạp chí
Tiêu đề: Second International Symposium on Intelligent Data Analysis
[10] G. Batista and M. Monard, “K-Nearest Neighbour as Imputation Method: Experimental Results”, Tech. Report 186 ICMC-USP, 2002 Sách, tạp chí
Tiêu đề: K-Nearest Neighbour as Imputation Method: Experimental Results”, "Tech. Report
11] J. w. Grzymala-Busse and M. Hu, A comparison of several approaches to missing attribute values in data mining. Proceedings o f the Second International Conference on Rough Sets and Current Trends in Computing RSCTC2000, October 16-19,2000, Banff, Canada, 340-347 Sách, tạp chí
Tiêu đề: Proceedings o f the Second International Conference on Rough Sets and Current Trends in Computing
[7] K. Lakshminarayan, s. A. Harp, R. Goldman, T. Samad, Imputation o f missing data using machine learning techniques, Proceedings o f the Second International Conference on Knowledge Discovery and Data Mining (KDD- Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm