Yêu cầu: Sinh viên cần có kiến thức cơ bản về logic toán Giai đoạn làm đề cương: - Tìm hiểu lý thuyết về software verification - Tìm hiểu một số phương pháp mô tả hiện có - Tìm hiểu các
Trang 1Đề tài Luận văn Cao học CNTT năm học 2007-2008 tại ĐHBK TP HCM
GVHD: TS Nguyễn Hứa Phùng
Đề 1:
Software Verification là kỹ thuật xác định xem một phần mềm thỏa mãn các yêu cầu thiết kế Kỹ thuật
này đòi hỏi xác định một phương pháp mô tả các yêu cầu thiết kế và một cơ chế suy diễn để thực hiện
quá trình chứng minh
Yêu cầu: Sinh viên cần có kiến thức cơ bản về logic toán
Giai đoạn làm đề cương:
- Tìm hiểu lý thuyết về software verification
- Tìm hiểu một số phương pháp mô tả hiện có
- Tìm hiểu các cơ chế suy diễn hiện có
- Xác định phạm vi nghiên cứu Giai đoạn làm luận văn:
- Phát triển một mô hình thích hợp
- Hiện thực chương trình
- Thử nghiệm
Đề 2:
Plagiarism Detection là kỹ thuật phát hiện sao cắp phần mềm Kỹ thuật đánh giá khả năng trùng khớp
của hai phần mềm từ đó dự đoán khả năng sao cắp
Giai đoạn làm đề cương:
- Tìm hiểu về các kỹ thuật Plagiarism Detection hiện có
- Tìm hiểu một số phần mềm hiện có
- Xác định phạm vi nghiên cứu Giai đoạn làm luận văn:
- Phát triển một mô hình thích hợp
- Hiện thực chương trình
- Thử nghiệm
Đề 3:
Tìm hiểu mô hình vi xử lý họ ARM và phát triển trình biên dịch cho ARM dựa trên gcc
Giai đoạn làm đề cương:
- Tìm hiểu về đặc tính của vi xử lý họ ARM
- Tìm hiểu cơ chế sinh trình biên dịch của gcc
- Tìm hiểu các đặc tả hiện có của ARM trên gcc
- Xác định phạm vi nghiên cứu Giai đoạn làm luận văn:
- Đề xuất một giải pháp thích hợp
- Hiện thực chương trình
- Thử nghiệm
LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com
Trang 2GVHD: TS Quản Thành Thơ
Đề 1: Xây dựng một chương trình dạy học lái xe thông minh dựa trên luật
Sinh viên đăng ký: Lê Anh Vũ
Đề 2: Xây dựng một kiến trúc cập nhật động nội dung trang Web theo hướng tiếp cận sử dụng các dịch
vụ Web có ngữ nghĩa thông qua các mô tả bằng ngôn ngữ tự nhiên
Sinh viên đăng ký: Nguyễn Bảo Toàn
Đề 3: Xây dựng chương trình phát hiện các mẫu quảng cáo được lặp lại nhiều lần trong các chương
trình MP3 podcasting
Đồng hướng dẫn: Tiến sĩ Nguyễn Minh Nhựt (Đại học Công nghệ Nanyang, Singapore)
Sinh viên đăng ký: Phan Thanh Cao
Trang 3GVHD: PGS TS Cao Hoàng Trụ
Hướng nghiên cứu: Web ngữ nghĩa
1 Gom cụm mờ tài liệu theo thực thể có tên và từ khoá
Tham khảo:
Cao, T.H & Do, H.T & Hong, D.T & Quan, T.T (2008), Fuzzy Named Entity-Based Document Clustering In Proc of the 17th IEEE International Conference on Fuzzy Systems
2 Nhận diện quan hệ giữa các thực thể có tên trên văn bản
Tham khảo:
Cao Duy Trường (2008) Dịch câu truy vấn tiếng Anh sang đồ thị khái niệm: cách tiếp cận ít phụ thuộc
cú pháp Luận văn Cao học, Khoa KH&KT Máy tính, ĐHBK TP.HCM
3 Dịch câu truy vấn tiếng Anh có liên từ luận lý, tính từ, và lượng từ sang đồ thị khái niệm
Tham khảo:
Cao Duy Trường (2008) Dịch câu truy vấn tiếng Anh sang đồ thị khái niệm: cách tiếp cận ít phụ thuộc
cú pháp Luận văn Cao học, Khoa KH&KT Máy tính, ĐHBK TP.HCM
LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com
Trang 4GVHD: TS Đặng Trần Khánh
Đề tài 1: Đặng Trần Trí
Bảo mật dựa trên trực quan hóa cho các ứng dụng chia sẻ tài nguyên ngang hàng
(Security Visualization for Peer-to-Peer Resource Sharing Applications)
Yêu cầu: Trực quan hóa các vấn đề bảo mật trong hệ thống là một hướng nghiên cứu mới và đang thu
hút được sự quan tâm rất lớn của cộng đồng các nhà/nhóm nghiên cứu về bảo mật trên thế giới Trong
đề tài này, học viên phải nghiên cứu về security visualization và ứng dụng vào việc xây dựng một
framework hỗ trợ bảo mật dựa trên security visualization cho các ứng dụng chia sẻ tài nguyên ngang
hàng (peer-to-peer) Sau đó cần áp dụng các kết quả nghiên cứu vào một bài toán và môi trường cụ thể
(vd resource sharing for a group of peer-to-peer users using Windows Vista, …)
Đề tài 2: Đàm Khánh Quốc Minh
Bảo vệ tính riêng tư trong các dịch vụ dựa trên vị trí với thiết bị di động
(Privacy-Preserving in Location Based Services)
Yêu cầu: Nghiên cứu về LBS và bài toán bảo vệ tính riêng tư trong các ứng dụng LBS Áp dụng các kết
quả nghiên cứu để đề xuất/cải tiến một giải pháp hiệu quả nhằm bảo vệ tính riêng tư cho một ứng dụng
LBS cụ thể (vd LBS for mobile banking, LBS for mobile marketing, LBS for tourist information systems,
…)
Đề tài 3: Hà Hồng Sơn
Tìm kiếm lỗ hổng bảo mật trong các hệ cơ sở dữ liệu
(Detecting Security Breaches in Database Systems)
Yêu cầu: Nghiên cứu các phương pháp tìm kiếm lỗ hổng bảo mật trong các hệ cơ sở dữ liệu Áp dụng
các kết quả nghiên cứu để đề xuất/cải tiến một giải pháp hiệu quả cho việc tìm kiếm lỗ hổng bảo mật
trong một DBMS cụ thể (vd Oracle 11g hoặc SQL Server 2008)
Trang 5GVHD: TS Phạm Trần Vũ
Đề 1 Nghien cuu phat trien co che bien soan tu dong Workflow to Web Services
Sv thuc hien: Bui Dung Anh Tuan
Đề 2 Nghien cuu phat trien co che single sign-on tu moi truong Web cho VN-Grid
Sv Thai Thi Thu Thuy
LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com
Trang 6GVHD: TS Nguyễn Văn Minh Mẫn
Key Theme: Algebraic Methods for Pattern Recognition & Industrial Statistics
PROJECT 1 MULTIPLE REGRESSION FOR SELECTING MEANINGFUL PREDICTOR
VARIABLES: A CASE STUDY WITH BRIDGE MONITORING DATA
Graduate: Tran Vinh Tan (CSE2007)
A/ Introduction The Lab of Applied Mechanics (LAM) of The University of Technology – VNU-HCM (HCMUT) has
recently obtained a huge amount real data from continuously monitoring bridges in HCMC One of the very beginning task
of statistically data mining this data is finding efficient methods to delete out useless sensors, select only meaningful
sensors, the ones could provide damage-sensitive features
This task contributes the first step of the Data Normalization phase of Damage Prognosis (DP) DP can be defined as the
estimate of remaining useful life of a system (e.g engineered structure, civil-mechanical system or service one )
B/ Description Few general questions in DP problems are: a) what are the loading conditions that cause the concerning
damage? b) What techniques/technologies should be used to assess the damage? c) Are statistical methods useful for DP
and how?
In civil-mechanical systems such as bridges, detection of the relationship between concerning factors and possibly recorded
damages mathematically requires reading rightly available sources of information, finding best regression models to be used
in further analysis A key demand then arise: select only meaningful sensors for fitting best regression models
C/ The project aim and scope:
• conducting this first step of Data Normalization (from bridge data monitored): study logistic regression and
relevant techniques of Statistical Pattern Recognition to choose the meaningful sensors
• designing and implementing a pilot software: combine R, a statistical software with Java; then validate with
practical data provided by LAM
• Extra request: if time allows, investigate parameter estimation of channel identification in the MISO case (multi-input single-output) by Algebraic Geometry method
PROJECT 2 CONSTRUCTIONS OF HADAMARD MATRICES AND DESIGNS
Graduate:
A/ Introduction Hadamard matrices are specific matrices with all (-1,1)-entries such that the rows and columns are
mutually pairwise orthogonal That is the inner product of any pair of rows (or any pair of columns) equals to 0
B/ Description Hadamard matrices have been found importantly useful in commodity manufacturing as well as in signal
processing, not mention in theoretic studies We investigate the constructions of Hadamard matrices and their corresponding
balanced designs by using tools of numeric theory, combinatorics, algebra and computing
C/ The project aim and scope:
• studying specific constructions of Hadamard matrices,
• making a web-service providing Hadamard designs;
• and if time allows, learning how to extend the work to computing balanced ternary designs using discrete mathematics such as finite geometries, numeric theory, as well as algeraic combinatorics and computing
Scope of our investigation Restrict to specific mathematical constructions to all Hadamard matrices and designs with run
size at most 664 Furthermore, the research is aimed at studying some specific mathematical techniques for computing
ternary designs with run size at most 100, if time allows These binary and ternary designs are used intensively in (Offline)
Industrial Manufacturing, in Pharmaceutics, Agriculture, and in Software Testing
WORKING AND REPORTING ARRANGEMENTS
Graduates are expected to inform their progress to the advisor(s) by oral presentation and written report,
about once for each 2 months at the SAM seminar (www.cse.hcmut.edu.vn/~mnguyen/G-seminars.html).
Trang 7GVHD: PGS TS Dương Tuấn Anh
Đề 1: (SV Huỳnh Thị Thu Thủy)
Phát hiện những mẫu bất thường (unusual pattern) trên dữ liệu chuỗi thời gian
Đề 2: (SV Võ Lê Quy Nhơn)
Gom cụm dữ liệu chuỗi thời gian (time series clustering) dựa vào phép biến đổi wavelet
Đề 3: (SV Phạm Đăng Ninh)
Tìm kiếm tương tự (similarity search) trên dữ liệu chuỗi thời gian dựa vào phép biến đổi wavelet,
với hai độ đo tương tự: Euclid và xoắn thời gian động (dynamic time warping)
Đề 4: (SV Phạm Hồng Thái)
Nâng cao hiệu quả tìm kiếm tương tự trên dữ liệu chuỗi thời gian với độ đo tương tự xoắn thời gian
động (dynamic time warping)
Đề 5: (SV Nguyễn Công Thương)
Phân lớp dữ liệu chuỗi thời gian (Time series classification)
LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com
Trang 8GVHD: TS Võ Thị Ngọc Châu
Đề 1 – Phát triển hệ CSDL quan hệ đối tượng phụ thuộc thời gian kép (Bi-temporal object relational
database system development)
Abstract:
As realized up to now, the temporal aspects of facts are ubiquitous in the modeled world Nowadays,
temporal data support is of increasing interest in commercial DBMS products However, their existing
built-in support for (bi-)temporal data is limited and still unavailable widely to database users This fact
leads to the motivation for bitemporal object relational database system development As expected, the
achieved bi-temporal object relational database system will allow bi-temporal database application
development to be supported in such a manner that non-temporal database application development is
conventionally supported on a non-temporal database system
Tóm tắt:
Như được nhận thức cho đến bây giờ, các khía cạnh thời gian của các fact ở khắp nơi trong thế giới
thực tiễn Ngày nay, việc hỗ trợ dữ liệu phụ thuộc thời gian đang được đưa dần vào các sản phẩm hệ
quản trị CSDL thương mại Tuy nhiên, phần hỗ trợ cố hữu hiện có cho dữ liệu phụ thuộc thời gian
(kép) vẫn còn hạn chế và chưa phổ dụng cho người sử dụng CSDL Điều này dẫn đến nhu cầu phát
triển một hệ CSDL quan hệ đối tượng phụ thuộc thời gian kép Kết quả sẽ là hệ CSDL quan hệ đối
tượng phụ thuộc thời gian kép cho phép việc phát triển các ứng dụng CSDL phụ thuộc thời gian kép
được hỗ trợ theo cách mà việc phát triển các ứng dụng CSDL không phụ thuộc thời gian được hỗ trợ
trên hệ CSDL không phụ thuộc thời gian
Đề 2 – Phát triển một workbench cho siêu dữ liệu phụ thuộc thời gian của nhiều kiểu dữ liệu
(Developing a unified temporal metadata workbench)
Abstract:
As generally bewared, metadata is data about data It plays a very important role in handling other data
from unstructured data to structured data Thus, an effective management of metadata is necessary for
application domains where metadata is required Based on this fact, a unified temporal metadata
workbench is developed in consideration on several popular metadata standards such as Dublin Core
and MPEG-7 The temporal aspect and other domain-specific aspects of many various kinds of data are
examined for metadata at both conceptual and logical levels With the resulting metadata workbench, it
is believed that metadata-related application development is greatly supported at the database instead of
application level In particular, such a metadata workbench can be utilized in developing temporal
information-rich systems such as temporal multimedia data warehouses, temporal 3D medical data
management systems, and information-rich virtual environments
Tóm tắt:
Theo một cách tổng quát, siêu dữ liệu có thể được định nghĩa là dữ liệu về dữ liệu Siêu dữ liệu đóng
một vai trò rất quan trọng trong việc xử lý dữ liệu khác từ không có cấu trúc đến có cấu trúc Do đó,
quản lý siêu dữ liệu hiệu quả thì cần thiết cho các miền ứng dụng có yêu cầu về siêu dữ liệu Điều này
dẫn đến việc phát triển một workbench cho siêu dữ liệu phụ thuộc thời gian dựa trên một vài chuẩn siêu
dữ liệu phổ biến chẳng hạn như Dublin Core và MPEG-7 Khía cạnh thời gian cũng như các khía cạnh
cụ thể khác của các kiểu dữ liệu khác nhau trong một miền ứng dụng cụ thể sẽ được kiểm tra cho siêu
dữ liệu ở mức ý niệm lẫn mức luận lý Với kết quả là một workbench cho siêu dữ liệu, việc phát triển
các ứng dụng phần nào có liên quan đến siêu dữ liệu sẽ được hỗ trợ nhiều ở mức CSDL thay vì ở mức
ứng dụng Cụ thể hơn, một workbench như thế cho siêu dữ liệu có thể được tận dụng trong việc phát
triển các hệ thống giàu thông tin phụ thuộc thời gian chẳng hạn như các kho dữ liệu đa phương tiện phụ
thuộc thời gian, các hệ thống quản lý dữ liệu y học 3 chiều phụ thuộc thời gian, và các môi trường ảo
giàu thông tin
Trang 9Đề 3 – Thiết kế ngôn ngữ CSDL phụ thuộc thời gian: khảo sát, đánh giá, và các hướng mới (Temporal
database language design: a survey, evaluations, and new trends)
Abstract:
Within the long history of temporal database research, the investigation into temporal database
languages is very much It is illustrated by several temporal extensions to relational algebra/calculus,
nested relational algebra/calculus, QUEL, SQL, and OQL Each temporal extension focuses on a
specific set of different aspects of a temporal database language to deal with temporal data Thus, a
survey and evaluations on the design of the existing temporal database languages are helpful to
examine how much the requirements for the invention of a temporal database language are satisfied
Also, it will result in what should be researched next for a new temporal database language that can
handle data with regard to time as much as possible
Tóm tắt:
Trong lịch sử lâu dài của lĩnh vực nghiên cứu CSDL phụ thuộc thời gian, các ngôn ngữ CSDL phụ
thuộc thời gian được đầu tư phát triển rất nhiều Điều này được minh họa bởi nhiều mở rộng về thời
gian của đại số/số học quan hệ, đại số/số học quan hệ lồng, QUEL, SQL, và OQL Mỗi phần mở rộng
tập trung vào một tập các khía cạnh cụ thể của một ngôn ngữ CSDL phụ thuộc thời gian cho việc xử lí
dữ liệu phụ thuộc thời gian Do đó, việc khảo sát và đánh giá thiết kế của các ngôn ngữ CSDL phụ
thuộc thời gian hiện có thì rất có ích cho việc kiểm tra các yêu cầu về sự phát minh ra một ngôn ngữ
CSDL phụ thuộc thời gian mới được đáp ứng nhiều như thế nào Hơn thế nữa, việc khảo sát và đánh
giá đó sẽ là tiền đề cho các hướng nghiên cứu tiếp một ngôn ngữ CSDL phụ thuộc thời gian mới có thể
xử lý dữ liệu theo khía cạnh thời gian nhiều như có thể
LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com
Trang 10GVHD: TS Thoại Nam
Đề 1: (1 sinh viên) Nguyễn Hữu Tường Vinh
Nghiên cứu và phát triển giải thuật truyền dữ liệu nhóm trên mạng Internet
Mạng Internet phát triển kéo theo các ứng dụng trên nó phát triển Hiện tại một số ứng dụng như TV-online, Video conference đòi hỏi kỹ thuật truyền đa điểm (theo nhóm) Tuy nhiên do đặc thù phức tạp, không đồng nhất trên mạng Internet nên các giải pháp truyền theo nhóm cấp mạng đều không/khó triển khai Đề tài tập trung tìm lời giải truyền theo nhóm ở cấp ứng dụng
Yêu cầu trong phần “chuyên đề“:
− Tìm hiểu về truyền theo nhóm cấp ứng dụng
− Tham khảo giải thuật N-tree
− Tham khảo nghi thức XCAST
− Đề xuất hướng giải quyết
Đề 2: (1 sinh viên)
Định thời hướng tiết kiệm năng lượng
Một vấn đề nan giải cho các hệ thống máy tính cụm là việc sử dụng năng lượng điện hợp lý Do hệ thống máy tính cụm có hàng trăm/ngàn nút và không phải lúc nào cũng cần đến tất cả các nút đều hoạt động Một giải thuật định thời/lập lịch thông minh sẽ giúp sắp xếp công việc tập trung vào một số lượng nút tối thiểu nhưng vẫn đảm bảo các ràng buộc của ứng dụng và như vậy giúp giảm thiểu việc tiêu thụ điện năng do các nút không tải được tắt
Yêu cầu trong phần “chuyên đề“:
− Tìm hiểu về định thời
− Tham khảo các giải thuật định thời liên quan
− Đề xuất giải pháp
Đề 3: (1 sinh viên)
Nghiên cứu và xây dựng giải thuật định thời trên lưới VN-Grid
VN-Grid là một lưới tính toán đang được nghiên cứu và triển khai trên mạng liên kết một số đại học tại TP.HCM Đề tài tập trung nghiên cứu giải thuật định thời phù hợp cho đặc thù của VN-Grid
Nhiệm vụ trong chuyên đề là:
− Tìm hiểu lưới tính toán
− Tìm hiểu về VN-Grid
− Đề xuất hướng giải thuật