Hệ thống bắt đầu bằng việc nhận thông tin từ phía học viên và lưu trữ chúng vào trong cơ sở dữ liệu học viên trong thành phần thứ 1, những nhu cầu của học viên có liên quan đến tài nguyê[r]
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG
Họ và tên tác giả:
TRẦN NAM THÀNH
Tên đề tài:
HỆ THỐNG TƯ VẤN TÀI NGUYÊN HỌC TẬP
Chuyên ngành: Khoa học máy tính
Mã số:……
ĐỀ CƯƠNG NGHIÊN CỨU LUẬN VĂN THẠC SĨ:
Ngành Khoa học máy tính
Đà Nẵng , tháng 5 năm 2009
Trang 21 Tóm tắt mục tiêu & nội dung thực hiện
Dạy học điện tử (E – Learning) ở nước ta trong những năm gần đây có những bước phát triển đáng kể Mô hình này đã và đang được áp dụng khá thành công
ở một số đơn vị
Tuy khác với phương pháp dạy truyền thống, dạy điện tử với khả năng tương tác cao dựa trên multimedia, tạo điều kiện cho người học trao đổi thông tin dễ dàng hơn cũng như đưa ra nội dung học tập phù hợp với khả năng và sở thích từng người [10]
Với các phương pháp dạy học truyền thống, hay qua tương tác thì giữa chúng cũng có những mặt thuận lợi và hạn chế của riêng nó Cụ thể trong quá trình học, giáo viên và học viên sẽ gặp nhiều khó khăn trong việc chọn lựa tài nguyên học tập
Cho nên cần có một qui trình tự động trao đổi thông tin về tài nguyên học tập giữa giáo viên và học viên Hệ thống tư vấn đó sẽ làm tăng thêm hoạt động dạy học điện tử tăng nhanh về số lượng cũng như chất lượng [1]
Mục tiêu đề tài đặt ra:
Đề xuất mô hình hệ thống tư vấn tài nguyên học tập, đó sẽ là công cụ hỗ trợ tốt học viên trong việc tìm ra được những tài liệu cần thiết phục vụ cho việc học Hai kỹ thuật được sử dụng kèm theo mô hình này là: phương pháp dùng để ước lượng đa tiêu chuẩn cho những yêu cầu học viên, phương pháp tìm kiếm sử dụng logic mờ để tìm ra tài liệu học tốt theo yêu cầu học viên
Phỏng theo mô hình trên phát triển hệ thống có thể hỗ trợ những lớp học trực tuyến với số lượng học viên đông học tập có hiệu quả hơn
2 Cơ sở lý thuyết
1.1 Các kỹ thuật thiết kế hệ thống tư vấn
Những nghiên cứu về các hệ thống tư vấn có thể được chia làm 3 loại: nghiên cứu phát triển kỹ thuật cho hệ thống, nghiên cứu về hoạt động của người dùng
và những vấn đề riêng tư [1] Một dãy các kỹ thuật tư vấn chẳng hạn như data mining, agents và suy luận, được phát triển và tích hợp vào trong hệ thống [3], [4], [5], [6]
Ngoài ra, các hệ thống tư vấn được sử dụng ở nhiều trang Web mang tính thương mại, trong đó bao gồm Amazon.com, CDNow.com Nói chung, những
hệ thống tư vấn có thể được phân loại thành 2 loại content – based (nội dung)
và collaborative (cộng tác) [8]
Trang 3Hệ thống tư vấn content – based cung cấp những lời tư vấn cho khách hàng một cách tự động dựa trên việc đối sánh những sở thích phù hợp với nội dung sản phẩm
Trong hệ thống content – based, các sản phẩm được mô tả bằng một tập các thuộc tính thông dụng các sở thích của khách hàng được dùng để tiên đoán bằng phân tích mối quan hệ giữa các đánh giá sản phẩm và phụ thuộc nhiều vào các thuộc tính sản phẩm Một vấn đề trọng tâm trong content – based cần thiết phát nhận diện được một tập các thuộc tính phải đủ lớn Trong trường hợp tập này quá nhỏ, ngược lại sẽ làm cho thông tin không đủ để biết được thông tin của khách hàng Chính vì vậy, content – based không thể được sử dụng cho những khách hàng mới chỉ mua một lần, những khách hàng tiềm năng những người ghé thăm web site nhưng chưa tạo một giao dịch mua bán này và khác hàng người muốn mua không được thường xuyên
Hệ thống collaborative đánh giá những sở thích khách hàng cho sản phẩm dựa trên sự chồng chéo của nhiều sở thích trên sản phẩm đó nhưng của nhiều người khác nhau [8][11][12]
Điểm khác biệt chính giữa hệ thống collaborative và content – based là collaborative lần vết theo những hoạt động trong quá khứ của một nhóm khách hàng đã có những đề nghị cho một thành viên trong nhóm Sử dụng cách tiếp cận này, khách hàng có thể nhận được lời tư vấn về sản phẩm thường không giống về nội dung [11][12]
Collaborative cũng phải đối đầu với những thử thách mà một trong những vấn
đề đó là dữ liệu thưa, khó khăn cho collaborative phải tính toán một cách chính xác những neighborhood và nhận ra những sản phẩm được tư vấn, một vấn đề nữa là khi sản phẩm mới được thêm vào hệ thống thì liệu rằng những đánh giá của khách hàng về nó hoàn toàn chưa có
Học viên cần lưu trữ lại những gì đã học bằng các kỹ thuật hỗ trợ và những lời
đề nghị Chất lượng lời tư vấn phải được đảm bảo như trong hệ thống tư vấn về thương mại điện tử (e – commerce), vì một lời tư vấn tồi sẽ dẫn đến tình trạng:
false negative: tài nguyên học tập không được giới thiệu mặc dù học
viên rất cần đến
false positive: tài nguyên học tập vẫn được giới thiệu mặc dù học viên
không cần đến
Trang 41.2 Mô hình hệ thống
1.3 Mô tả mô hình
Có 4 thành phần chính:
1 – getting student information: nhận thông tin học viên
2 – identifying student requirement: nhận biết nhu cầu học viên
3 – learning material matching analysis: tìm tài nguyên học
4 – generaing reccommendation: phát sinh ra lời tư vấn
4 thành phần trên được kết nối với giao diện người dùng, một cơ sở dữ liệu học viên, một cơ sở dữ liệu cây tài nguyên học Hệ thống bắt đầu bằng việc nhận thông tin từ phía học viên và lưu trữ chúng vào trong cơ sở dữ liệu học viên trong thành phần thứ 1, những nhu cầu của học viên có liên quan đến tài nguyên học được phân tích ở thành phần 2 Bộ phân tích nhu cầu của học viên được dùng để trong phân tích để nhận ra được nhu cầu của học viên Trong thành phần 3, đối sánh tập luật được sử dụng để khám phá ra sự liên kết, kết hợp giữa nhu cầu của học viên và cây tài nguyên học Trong thành phần 4, một danh sách các tài nguyên đã được xuất ra phù hợp với nhu cầu của học viên
Định nghĩa
Trong trường hợp này, học viên được biểu diễn như là một vector X = (x1, x2,
…, xn) Đa tiêu chuẩn là tiêu chí cho việc đánh giá những yêu cầu của học viên được biểu diễn như là một biến độc lập, được viết như là một vector tiêu chuẩn
C = (c1, c2, … cm)
Student Interface
1: Getting
student
information
2: student require identification
3: Learning material analysis
4: Learning recommendation generation
Student
database
Matching Rules
Multi-criteria student require analysis model Learning
material tree
Learning material management Intensional information
Extensional information
Trang 5Một yêu cầu của một sinh viên xi cho tài nguyên học được biểu diễn dưới dạng một vector Ri1 = (n1, f1, …, fp) Trong đó:
1<= i <= n
ri1 chính là yêu cầu về nội dung học
f1, , fp: là những đặc điểm của yêu cầu trong tài nguyên học tập
Những lời tư vấn cho sinh viên xi được tìm thấy là một danh sách tài nguyên học tập Li = (li1, li2, …, lik) từ kết quả phân loại tài nguyên học
Tập tài nguyên học Li đối sánh với yêu cầu của học viên Ri (i = 1, 2, 3, …n) với một luật đối sánh mờ FM m {(R m,L mj, (R m,L mj))},m 1 , ,k
Trong phép đối sánh mờ này,
FMm, Rm thuộc R
lmj thuộc L
là thành viên của lmj cho rm, rm có thể là một phân cấp tiêu chuẩn phân loại tài nguyên học m = 1, … k
1.4 Phân tích các thành phần
(1) Nhận thông tin học viên
Thành phần này mục tiêu dùng để lấy thông tin đối với học viên mới và nhận ra học viên nếu học viên đã được đăng kí vào cơ sở dữ liệu
Thông tin lấy được có thể lấy từ nhiều nguồn thông tin khác nhau
Intensional information: những thông tin của học viên quan tâm chính để
tài nguyên học tập chẳng hạn như một chủ đề hoặc từ khóa mà học viên quan tâm
Extensional Information: thông tin lấy từ những họat động khác của học
viên, chẳng hạn như từ những tài nguyên học truy cập trước đó, thông tin về những lớp học hiện tại mà học viên đang học hoặc đang quan tâm …
Trên cơ sở thông tin được lấy từ nguồn trực tiếp hoặc gián tiếp, tất cả cũng nhằm mục đích chuyển giao những thông tin nhận được cho thành phần kế tiếp
để giúp nhận ra được yêu cầu của học viên
(2) Nhận biết yêu cầu học viên
Những thông tin về yêu cầu của học viên được lấy từ nhiều nguồn dữ liệu khác nhau Những yêu cầu của học viên thường quá phức tạp nhưng nếu chỉ sử dụng một tiêu chuẩn đơn lẻ thì sẽ gặp nhiều khó khăn Những yêu cầu của học viên trong khá nhiều trường hợp khó để chỉ ra được chính xác Chính vì lí do đó,
Trang 6phương pháp phân tích đa tiêu chuẩn cung cấp cho chúng ta một mô hình phân tích yêu cầu của học viên
Thành phần này sẽ tìm ra được thông tin từ nhiều nguồn thông tin khác nhau và cung cấpmột mô hình phân tích đa tiêu chuẩn yêu cầu học viên Cơ sở dữ liệu học viên có nhiều mẩu tin liên quan đến cách học, cách truy cập đến những tài nguyên học và lưu trữ những nhóm học viên khác nhau (chẳng hạn như nhóm học viên về kinh tế, học viên về tư nhiên hoặc xã hội nhân văn …) Những mẩu tin này được sử dụng nhằm giúp hệ thống nhận ra được những sở thích riêng của học viên và những học viên lân cận trong nhóm
Dùng cách tiếp cận này, học viên sẽ nhận những lời tư vấn về tài nguyên học tập mà hầu như những người bạn cùng khóa học cũng thích Ngoài ra, thành phần này tìm kiếm dựa theo những mối quan hệ có ý nghĩa, giữa những dữ liệu của các yêu cầu sinh viên liên quan đến những tài nguyên học trong lớp
Mô hình phân tích yêu cầu học viên đa tiêu chuẩn được đề ra bằng việc sử dụng khái niệm về các mô hình quyết định đa tiêu chuẩn và được xây dựng nhằm phục vụ cho tất cả các học viên Nhưng mỗi học viên có thể có những trong số khác nhau về những tiêu chuẩn mà chúng ta có thể thấy được qua những đặc điểm riêng hoặc trong quá trình học tập
Có nhiều phương pháp khác nhau để giải quyết vấn đề đa tiêu chuẩn này Cách tiếp cận nghiêm ngặt này được đề nghị dùng kiểm tra những điều kiện khác nhau và phát triển một hàm định trị đa tiêu chuẩn Trong một tình huống thực
tế, những giá trị tiêu chuẩn này thường không chắc chắn và nó được biểu diễn bởi từ cụm từ như “important”, “more important”, “strong background”, “weak background”
Chính vì vậy, tập mờ được sử dụng để nhằm đưa ra một giải pháp cho việc lưu trữ các vấn đề về đa tiêu chuẩn
(3) Tìm kiếm tài nguyên học
Thành phần này sử dụng tập luật đối sánh mờ để tìm những tài nguyên học phù hợp với yêu cầu học viên cung cấp Trong hầu hết những trang Web e – learning, phân loại tài nguyên học có sẵn phân loại tài nguyên học được trình bày trong phần thực hành như là một cây có khả năng phân lớp với một tập các tài nguyên học từ thấp đến cao
Nút lá của cây dùng để mô tả những thể hiện của tài nguyên học và những nút không phải là nút lá dùng để biểu diễn những phân lớp của tài nguyên học bằng cách kết hợp những nút cấp thấp vào một nút cha
Cây quyết định dùng để nhận được những phân lớp không bền vững Tập mờ có thể mô tả những mối quan hệ phức tạp và không chắc chắn, ngoài ra có thể điều
Trang 7khiển những phân lớp không chắc chắn như là phân lớp về tài nguyên học mô tả trong một cây để làm nhiệm vụ phân tích dữ liệu đế hiệu quả được nâng cao Tập mờ dựa trên cơ sở độ đo khoảng cách mờ [16] có thể giới thiệu một hướng phát triển trong việc đối sánh những yêu cầu học viên đến tài nguyên học vì chúng phụ thuộc nhiều vào tính co giãn của tập mờ
Trong thành phần này, cung cấp một tập các yêu cầu Ri của một sinh viên xi, và một luật kết hợp rút ngắn từ mẫu Ri Li (tìm được Li dựa trên Ri) trong đó Li
là tập tài nguyên học của chủ đề dựa trên tiêu chuẩn đánh giá Nhiệm vụ của thành phần là tìm ra cho được tập tài nguyên học Li = (li1, li2, …, lik) cho một học viên xi, lim có thể là một hoặc một phân lớp tài nguyên học có cùng cấp
(4) Phát sinh tư vấn tài nguyên học
Bằng việc sử dụng tập luật tìm kiếm để khám phá ra sự kết hợp giữa yêu cầu học viên và danh sách các tài nguyên học (N) Ngoài ra, thành phần này còn nhắm đến những việc như làm như thế nào để quyết định N cho top – N giới thiệu tài nguyên học và định dạng riêng của tư vấn Những tư vấn ấy sẽ được xử
lí như là những mẩu tin được lưu trữ vào trong cơ sở dữ liệu của học viên
3 Phạm vi ứng dụng
Mô hình được đề xuất để mục tiêu phục vụ rộng rãi trong lĩnh vực giáo dục, tập trung vào mô hình E – Learning, phát triển mô hình như là một dịch vụ hỗ trợ các trường học hoặc trung tâm có tổ chức những lớp học trực tuyến trên mạng
4 Dự kiến kết quả đạt được
Kết quả dự kiến tập trung việc phát triển ứng dụng từ mô hình đã đề xuất, thử nghiệm mô hình ở Trung Tâm Phát Triển CNTT ĐHQG TP HCM vì đây là một đơn vị đã có kinh nghiệm và sự thành công trong lĩnh vực áp dụng mô hình E-learning vào việc đào tạo qua mạng máy tính viễn thông
Một số minh họa ý tưởng phác thảo các bảng dữ liệu cho hệ thống
SID Name Background Style Type …
Bảng 1: một ví dụ về thông tin của một học viên
SID Material Date
102 L-221 05/05/05
Trang 8102 L-234 07/06/05
104 L-133 03/04/05
Bảng 2: Ví dụ về bảng lưu trữ lại tài nguyên đã được học viên truy cập
SID Access possibility List
Bảng 3: Ví dụ về đề xuất
Cây tài nguyên học
5 Hướng phát triển
Mặc dù 2 kỹ thuật thiết kế cho hệ thống tư vấn: content – based và collaborative filtering cho một số hạn chế khi sử dụng (đã nêu), tuy nhiên nếu hướng đến mục
Database subject
Introduction
ER- Modeling
Normalization
SQL
Transaction
Businness Rules
Draw ER Model
ER-Tranformation
L-221,3,.
L-222.
L-223,3,.
L-224,2,.
L-231,1,.
L-232,2,.
…
…
L-533,1,.
Level 1 Level 2 Level 3 Level 4
Trang 9tiêu kết hợp những kỹ thuật trên vào hệ thống để hệ thống có thể hoàn chỉnh hơn, giảm độ sai sót về 2 lỗi mà một hệ thống tư vấn thường gặp phải là false positive và false negative
6 Tài liệu tham khảo
[1] Jei Lu, A Personalized E – Learning Material Recommender System, Proceedings of the 2nd International Conference on Information Technology for Application (ICITA 2004)
[2] S.W Changchien, and T Lu, “Mining association rules procedure to support on-line recommendation by customers and products fragmentation” Expert Systems with Applications Vol 20 (2001), pp 325–335
[3] K.W Cheung, J.T Kwok, M.H Law and K.C Tsui, “Mining customer product ratings for personalized marketing” Decision Support Systems Vol 35 (2003), pp 231-243 Research Vol 34 (1988), pp 152-159
[4] T.H Cho, J K Kin and S H Kim, “A personalized recommender system based on web usage mining and decision tree induction” Expert Systems with Applications 23 (2002), pp 329-342
[5] O.B Kwon, “I know what you need to buy” context –aware multimedia-based recommendation system” In Expert Systems with Applications, 2002, (Article in Press)
[6] R.D Lawrence, G.S Almasi, V Kotlyar, M.S Viveros and S Duri,
“Personalization of supermarket product recommendations” Data Mining and Knowledge Discovery Vol 5 (2001), pp 11–32
[7] T.H Roh, K.J Oh and I Han, “The collaborative filtering recommendation based on SOM cluster-indexing CBR” Expert Systems with Applications, 2003, (Article in Press)
[8] Loren Terveen and Will Hill, Beyond Recommender Systems: Helping People Help Each Other, AT&T Labs - Research
[9] Võ Tâm Vân, Luận văn thạc sỹ: Ứng dụng tính toán lưới cho dạy học điện
tử, CH K12, ĐHKHTN ĐHQG TP Hồ Chí Minh, hướng dẫn khoa học TS Lê Hoài Bắc
[10] Web site http://el.edu.net.vn/ về E – Learning của Trung Tâm Tin Học, Bộ Giáo Dục & Đào Tạo
[11] Nguyễn Văn Năm, Seminar So sánh các kỹ thuật của hệ thống tư vấn, CH K13 trường ĐHKHTN ĐHQG TP Hồ Chí Minh, GVHD: PGS TS Đồng Thị Bích Thủy
Trang 10[12] Nguyễn Công Phú, Using Trust In Reccomender System: An experimental Analysis, CH K13 trường ĐHKHTN ĐHQG TP Hồ Chí Minh, GVHD: PGS
TS Đồng Thị Bích Thủy
[13] L A Zadeh, “Fuzzy sets” Inform & Control Vol 8(1965), pp 338-353 [14] O.R Zaiane “Web usage mining for better web-based learning environment” In Prof of Conference on Advanced Technology for Education,
pp 60-64, Banff, AB, June 2001
[15] R.R Yager, “Fuzzy logic methods in recommender systems” Fuzzy Sets and Systems Vol 136 (2003), pp 133-149
[16] G.QZhang “On fuzzy number-valued fuzzy measures defined by fuzzy number-valued fuzzy integrals I” Fuzzy Sets and Systems Vol 45 (1992), pp 227-237
(ký và ghi rõ họ tên) (ký và ghi rõ họ tên)