Việc chấm điểm bài làm của học sinh như hiện tại đạt độ chính xác chưa cao, vì thực chất điểm mà học sinh đạt được trong mỗi bài kiểm tra có tính chất "mờ".. Ví dụ trong số những học sin
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
NGUYỄN VĂN THÔNG
XÂY DỰNG MỘT HỆ THỐNG THÔNG TIN
HỖ TRỢ ĐÁNH GIÁ HỌC SINH DÙNG LÝ THUYẾT TẬP MỜ
Chuyên ngành: Bảo đảm toán học cho máy tính
và hệ thống tính toán
Mã số: 60 46 35
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TSKH Bùi Công Cường
Hà Nội – Năm 2011
Trang 2MỤC LỤC
MỞ ĐẦU 3
Chương 1 KIẾN THỨC CƠ SỞ VỀ LÝ THUYẾT TẬP MỜ VÀ SỐ MỜ 4
1.1 Tập mờ 4
1.1.1 Định nghĩa 1.1 4
1.1.2 Ví dụ 4
1.2 Số mờ 5
1.2.1 Định nghĩa 1.2 5
1.2.2 Ví dụ 5
1.3 Luật mờ 7
1.3.1 Định nghĩa 1.3 7
1.3.2 Ví dụ 7
Chương 2 PHƯƠNG PHÁP MỚI ĐỂ ĐÁNH GIÁ BÀI LÀM CỦA HỌC SINH SỬ DỤNG TẬP MỜ 8
2.1 Phương pháp của Biswas để đánh giá bài làm của học sinh 8
2.1.1 Thuật toán đánh giá bài làm của học sinh theo trang điểm mờ 9
2.1.2 Ví dụ 2.1 10
2.2 Phương pháp mới để đánh giá bài làm của học sinh 12
2.2.1 Thuật toán mới đánh giá bài làm của học sinh 14
2.2.2 Ví dụ 2.3 15
2.2.3 Chương trình máy tính 17
2.3 Một phương pháp đánh giá tổng quát 18
Chương 3 ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH BẰNG CÁCH SỬ DỤNG HÀM THUỘC VÀ LUẬT MỜ 21
3.1 Đặt vấn đề 21
3.2 Thuật toán 21
3.3 Ví dụ 35
3.4 Chương trình máy tính 40
KẾT LUẬN 49
TÀI LIỆU THAM KHẢO 50
Trang 3MỞ ĐẦU
Từ khi lí thuyết tập mờ được Zadeh đề xuất năm 1965, lí thuyết tập mờ và logic
mờ phát triển rất nhanh và đa dạng Công nghệ mờ và công nghệ mạng nơ-ron phát triển mạnh, áp dụng vào các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường Những năm gần đây, một số nghiên cứu ứng dụng lý thuyết tập mờ vào giáo dục đào tạo đã được tiến hành và có những kết quả cụ thể như đánh giá học sinh, xếp hạng hệ thống giáo dục
Việc chấm điểm bài làm của học sinh như hiện tại đạt độ chính xác chưa cao, vì thực chất điểm mà học sinh đạt được trong mỗi bài kiểm tra có tính chất "mờ" Ví dụ trong số những học sinh được điểm 8 thì có những học sinh đạt “cỡ 8 điểm”, tức là có thể thấp hơn hay cao hơn 8 điểm một chút…
Trên cơ sở đã tìm hiểu những kiến thức cơ bản về logic mờ, là người trực tiếp làm nhiệm vụ quản lý giáo dục, tôi chọn đề tài "Xây dựng một hệ thống thông tin hỗ trợ đánh giá học sinh dùng lý thuyết tập mờ" cho luận văn của mình, nhằm nghiên cứu một cách mới để đánh giá học sinh chính xác hơn, khách quan hơn, công bằng hơn Tôi dùng phần mềm Matlab để cài đặt chương trình tính và đưa ra những kết quả đánh giá cụ thể
Luận văn gồm 3 chương:
Chương 1: Kiến thức cơ sở về lý thuyết tập mờ và số mờ
Chương 2: Phương pháp mới để đánh giá bài làm của học sinh sử dụng tập mờ Chương 3: Đánh giá kết quả học tập của học sinh bằng cách sử dụng hàm thuộc
và luật mờ
Do thời gian có hạn và khả năng còn hạn chế nên luận văn khó tránh khỏi những thiếu sót, tôi rất mong nhận được sự đóng góp ý kiến từ các thầy cô giáo, các bạn học viên để hoàn thiện hơn bản luận văn của mình
Trang 4Chương 1 KIẾN THỨC CƠ SỞ VỀ LÝ THUYẾT TẬP MỜ
VÀ SỐ MỜ
1.1 Tập mờ
1.1.1 Định nghĩa 1.1[3]:
Cho tập X , ta sẽ gọi X là không gian nền
A là tập mờ trên không gian nền X nếu A được xác định bởi hàm:
là độ thuộc của x vào tập mờ A
Tập A được gọi là tập rỗng nếu nó không có phần tử nào Kí hiệu là: A
1.1.2 Ví dụ [3]:
- Ví dụ 1.1:
Cho không gian nền X = [0, 150] là tập chỉ tốc độ của người đi xe máy (km/h)
Tập mờ A = ”Đi nhanh” xác định bởi hàm thuộc A:X [0,1] như đồ thị sau:
Như vậy:
- Với x ≥ 50 (tốc độ từ 50km/h trở lên) thì A(x) = 1 (đi nhanh);
- Với x = 45 (km/h) thì A(x) = 0.8 (đi khá nhanh);
45
Trang 5Để cho gọn, ta kí hiệu độ thuộc là A(x) thay cho A( )x
b) Ứng với mỗi R1, tập mức { x: M( )x } là đoạn đóng trên R1
( ) / ( )0
M
z a b a z
nếu z ≤ a nếu a ≤ z ≤ b nếu z = b nếu b ≤ z ≤ c nếu c ≤ z
Trang 7Hình 1.3 Số mờ ’Bờ vai’
1.3 Luật mờ
Xét Ui ≠ là tập nền của biến ngôn ngữ vào xi, i=1,2, ,n
V≠ là tập nền của biến ngôn ngữ ra y
x1 là biến ngôn ngữ thời gian trả lời câu hỏi;
tập U1=[1,45] là không gian nền của biến ngôn ngữ x1(phút);
A1=’ngắn’ là một tập mờ trên không gian nền U1;
x2 là biến ngôn ngữ độ chính xác trong câu trả lời;
tập U2=[0,1] là không gian nền của biến ngôn ngữ x2;
A2=’cao’ là một tập mờ trên không gian nền U2;
y là biến ngôn ngữ độ khó của câu trả hỏi;
tập V=[0,1] là không gian nền của biến ngôn ngữ y;
B=’thấp’ là một tập mờ trên không gian nền V,
Một luật mờ suy ra độ khó của câu hỏi là:
IF (x1 is A1) (x2 is A2) THEN (y is B) (nếu thời gian trả lời ngắn và độ chính xác cao thì độ khó của câu hỏi là thấp (câu hỏi dễ)
Trang 8Chương 2: PHƯƠNG PHÁP MỚI ĐỂ ĐÁNH GIÁ BÀI LÀM
CỦA HỌC SINH SỬ DỤNG TẬP MỜ
2.1 Phương pháp của Biswas để đánh giá bài làm của học sinh: [7]
- Cho 2 tập mờ A, B trên không gian nền X
Đạt yêu cầu, ký hiệu S = {0.4/0; 0.4/20; 0.9/40; 0.6/60; 0.2/80; 0/100} (Satisfactory)
Không đạt yêu cầu, ký hiệu U ={1/0; 1/20; 0.4/40; 0.2/60; 0/80; 0/100} (Unsatisfactory)
Để cho gọn ta dùng các véc tơ E, V , G, S, U để biểu thị các tập E, V, G, S,
U một cách tương ứng:
E = {0, 0, 0.8, 0.9, 1, 1}, V = {0, 0, 0.8, 0.9, 0.9, 0.8}
G = {0, 0.1, 0.8, 0.9, 0.4, 0.2}, S = {0.4, 0.4, 0.9, 0.6, 0.2, 0},
U = {1, 1, 0.4, 0.2, 0, 0}
Trang 9- Gọi A, B, C, D, E là các chữ chỉ các mức giá trị của 5 điểm mờ nêu trên theo thứ tự tương ứng với E, V, G, S, U với ý nghĩa như sau: 0≤E<30, 30≤D<50, 50≤C<70, 70≤B<90; 90≤A≤100
Ký hiệu: P(E) là trung điểm của khoảng E, theo ý nghĩa đó ta có:
n là số lượng câu hỏi của bài kiểm tra
Cột 1: Các câu hỏi của bài kiểm tra theo thứ tự từ trên xuống
Từ cột thứ hai đến cột thứ bảy ghi “điểm mờ” mà giáo viên đánh giá câu trả lời của học sinh cho câu hỏi tương ứng
Cột 8: Ghi mức đánh giá dành cho mỗi câu hỏi
Dòng cuối cùng là tổng số điểm dành cho bài làm của học sinh
Ví dụ điểm cho câu hỏi 1 là F1={0/0; 0.1/20; 0.2/40; 0.4/60; 0.6/80; 0.4/100} (trên không gian nền X = {0, 20, 40, 60, 80, 100} ) thì ghi vào bảng trên dòng 1, các cột từ thứ 2 đến thứ 7 lần lượt là 0, 0.1, 0.2, 0.4, 0.6, 0.4
2.1.1 Thuật toán đánh giá bài làm của học sinh theo trang điểm mờ
Trang 10Trong đó: T(Qi) là điểm của câu hỏi thứ i
Các công việc trên có thể thực hiện bằng chương trình máy tính
Trang 11Nhận xét: Phương pháp chấm điểm đã trình bày ở trên vẫn còn 2 hạn chế:
- Thứ nhất: Việc sử dụng hàm S để tính độ tương tự giữa các tập mờ chuẩn và tập mờ là điểm của mỗi câu hỏi cần khá nhiều thời gian, nhất là với số lượng câu hỏi lớn;
- Thứ hai: Trong thuật toán trên để tính gi chúng ta đã tìm max {S(E,F i), S(V,F i), S(G,F i), S(S,F i ), S(U,F i )} Tuy nhiên có khả năng xảy ra là Fi ≠ Fj
Trang 12nhưng max{(Y, Fi)} = max{(Y, Fj)}, Y{E,V ,G,S,U}, tức là gi=gj, điều này dẫn đến việc đánh giá là không công bằng
Để khắc phục các nhược điểm trên ta có phương pháp mới để đánh giá bài làm của học sinh như sau
2.2 Phương pháp mới để đánh giá bài làm của học sinh [7]
- Giả sử có 11 cấp để đánh giá độ thỏa mãn với mỗi câu trả lời của học sinh như bảng sau:
EG (Extremely good - Tuyệt vời) 100%
VVG (Very very good - Rất rất tốt) 91% - 99%
VB (Very bad - Rất yếu) 10% - 24%
VVB (Very very bad - Kém) 1% - 9%
Trang 13Trang chấm điểm mờ mở rộng (Extended fuzzy grade sheet):
Thứ
tự
thỏa mãn
Cột 1 ghi các câu hỏi từ 1 đến n;
Trên mỗi dòng, từ cột thứ 2 đến cột 12 ghi điểm mờ ứng với câu đã ghi ở cột 1 (điểm mờ đƣợc biểu thị bởi tập mờ trên không gian nền X = {EG, VVG, VG, G, MG,
F, MB, B, VB, VVB, EB}); cột cuối cùng ghi độ thỏa mãn của câu hỏi đó;
Ô ở dòng cuối cùng là tổng điểm của bài kiểm tra
Trang 14Trong bảng 2.4, ta thấy cấp thỏa mãn của câu hỏi 1 của học sinh đƣợc biểu thị bởi tập mờ F(Q1) trên không gian nền X (X = {EG, VVG, VG, G, MG, F, MB, B, VB, VVB, EB}), và F(Q1) = {0/EG, 0.9/VVG, 0.8/VG, 0.5/G, 0/MG, 0/F, 0/MB, 0/B, 0/VB, 0/VVB, 0/EB}, tức là cấp độ thỏa mãn của bài làm của học sinh ở câu hỏi 1 là 90% rất rất tốt, 80% rất tốt và 30% tốt
2.2.1 Thuật toán mới đánh giá bài làm của học sinh:
D(Qi) [0,1], D(Qi) lớn thể hiện độ thỏa mãn cao
Xét ví dụ 2.2, điểm cho câu hỏi 1 của học sinh đƣợc ghi trong bảng 2.5 Từ công thức (1) ta có T(VVG)=0.99, T(VG)=0.90 và T(G)=0.80 Áp dụng công thức (2)
ta tính đƣợc độ thỏa mãn D(Q1) của câu trả lời của học sinh với câu hỏi 1 là:
D(Q1) = 0.9 x0.99 0.8x0.90 0.5x0.80
0.9 0.8 0.5
Trang 15= 0.9141 Bước 2:
Giả sử bài kiểm tra có n câu hỏi, tổng số điểm là 100
Gọi Si là điểm dành cho câu hỏi thứ i (Qi), với 0≤ Si ≤ 100 (1≤ i ≤ n) và
Câu hỏi 1: 20 điểm
Câu hỏi 2: 30 điểm
Câu hỏi 3: 25 điểm
Câu hỏi 4: 25 điểm
và điểm của một học sinh được cho như trong bảng dưới đây:
Thứ
tự
thỏa mãn
hỏi 3 0 0 0.7 0.8 0.5 0 0 0 0 0 0 Câu
hỏi 4 0 0 0 0 0 0 0 0.5 0.9 0.2 0
Tổng số điểm =
Trang 16Áp dụng công thức (3), tổng số điểm của học sinh này là:
20 x D(Q1) + 30 x D(Q2) + 25 x D(Q3) + 25 x D(Q4)
= 20 x 0.9424 + 30 x 0.705 + 25 x 0.815 + 25 x 0.27125
= 67.154
= 67
Trang 17hỏi 2 0 0 0 0.6 0.9 0.5 0 0 0 0 0 0.705 Câu
hỏi 3 0 0 0.8 0.7 0.5 0 0 0 0 0 0 0.815 Câu
hỏi 4 0 0 0 0 0 0 0 0.5 0.9 0.2 0 0.27125
Tổng số điểm = 67 2.2.3 Chương trình máy tính
Tệp dữ liệu vào: dlvao_C2.m
m=4; %So cau hoi
n=11; %11 cap danh gia
%Do thoa man cao nhat cua moi cap
Trang 18- Việc tính độ thỏa mãn của mỗi câu hỏi theo công thức (2) chính xác hơn, đảm bảo công bằng hơn trong đánh giá;
- Ta có thể mở rộng trang chấm điểm mờ để đánh giá bài làm của học sinh chi tiết hơn, chính xác hơn bằng cách thêm các tiêu chí cho mỗi câu hỏi, cụ thể như phần trình bày dưới đây:
2.3 Một phương pháp đánh giá tổng quát: [7]
Bước 1:
Giả sử bài kiểm tra có n câu hỏi với thang điểm 100:
Câu hỏi 1: S1 điểm;
Câu hỏi 2: S2 điểm;
Câu hỏi n: Sn điểm
Với mỗi câu hỏi, ta sẽ đánh giá theo 4 tiêu chuẩn:
C1: Độ chính xác;
Trang 19Độ thỏa mãn của câu hỏi
Bảng 2.7: Trang chấm điểm mờ mở rộng tổng quát
Độ thỏa mãn của câu hỏi i về các tiêu chuẩn C1, C2, C3 và C4 ký hiệu lần lƣợt là D(Ci1), D(Ci2), D(Ci3) và D(Ci4), đƣợc tính theo công thức (2) của phần 2.2, 0≤D(Ci1)≤1, 0≤D(Ci2)≤1, 0≤D(Ci3)≤1, 0≤D(Ci4)≤1 với 1 ≤ i ≤ n
Trang 20Bước 2: Độ thoản mãn P(Qi) của câu hỏi i được tính theo công thức:
- Về cấu trúc của trang không thay đổi
- Dòng 1: Đánh giá về kết quả học tập (tiêu chuẩn 1: C1)
- Dòng 2: Đánh giá về ý thức chuyên cần trong học tập (tiêu chuẩn 2: C2)
- Dòng 3: Đánh giá về động cơ thái độ học tập (tiêu chuẩn 3: C3)
…
Tùy theo đối tượng học sinh (học sinh chuyên, học sinh phổ thông, học sinh bổ túc, học sinh dân tộc nội trú ) và mục tiêu giáo dục mà quyết định trọng số cho các tiêu chuẩn, ví dụ với các trường trung học phổ thông có thể sử dụng trọng số sau:
- Tiêu chuẩn C1 có trọng số W1 = 0.5
- Tiêu chuẩn C2 có trọng số W2 = 0.2
- Tiêu chuẩn C3 có trọng số W3 = 0.3
Kết quả đánh giá quy về thang điểm 10, sau đó xếp hạng như sau:
- Từ 9.5 điểm trở lên xếp loại xuất sắc;
- Điểm từ 8.0 đến dưới 9.5 xếp loại giỏi;
- Từ 6.5 đến cận dưới 8.0 xếp loại khá;
- Từ 5.0 đến dưới 6.5 xếp loại trung bình;
- Từ 3.0 đến dưới 5.0 xếp loại yếu;
- Từ 0 đến dưới 3.0 xếp loại kém
Việc nhập và tính tổng số điểm, đánh giá học sinh có thể làm trong bảng tính (như MS Excel)
Trang 21Chương 3 ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH
BẰNG CÁCH SỬ DỤNG HÀM THUỘC VÀ LUẬT MỜ
3.1 Đặt vấn đề:
Ở chương 2 chúng ta đã có một phương pháp mới để chấm điểm bài kiểm tra của học sinh, đánh giá kết quả học tập của học sinh bằng trang chấm điểm mờ mở rộng Phương pháp này đảm bảo chính xác hơn, công bằng hơn trong đánh giá Trong chương này chúng ta xét một phương pháp nữa, dùng hàm thuộc và luật mờ để đánh giá kết quả học tập của học sinh, một cách hữu ích để phân biệt thứ tự xếp hạng những học sinh có điểm số như nhau Phương pháp này xét đến cả độ khó, độ phức tạp của câu hỏi nên đảm bảo tính chính xác, công bằng trong đánh giá học sinh
a
a a A
t
t t T
Ở đây aij biểuthị độ chính xác trong câu trả lời của học sinh Sj đối với câu hỏi
Qi, aij[0,1]; tij là thời gian trả lời của học sinh Sj đối với câu hỏi Qi, tij[0,1], 1≤i≤m
Trang 22với gi là điểm của câu hỏi Qi, gi[1,100], 1≤i≤m
Đặt IM là ma trận xác định độ quan trọng, C là ma trận về độ phức tạp của các câu hỏi:
11 12 13 14 15
22 23 24 25 21
và 1≤j≤5; CS1, CS2, CS3, CS4 và CS5 thể hiện các cấp độ phức tạp: CS1 = "thấp", CS2
= "khá thấp", CS3 = "trung bình", CS4 = "khá cao" và CS5 = "cao"; cij là độ thuộc của
độ phức tạp của câu hỏi Qi vào cấp độ phức tạp CSj, cij[0,1], 1≤i≤m và 1≤j≤5
Theo ma trận về độ chính xác A và ma trận điểm G, chúng ta có thể tính tổng điểm TSj của học sinh thứ j nhƣ sau:
ij 1
Qm ImS1 ImS2 ImS3 ImS4 ImS5
Q1
Q2
Qm
CS1 CS2 CS3 CS4 CS5
Trang 23Dựa vào ma trận về độ chính xác A và ma trận thời gian trả lời T, tính độ chính xác trung bình AvgAi và thời gian trả lời trung bình AvgTi cho câu hỏi Qi:
ij 1
n
j i
a AvgA
n
j i
t AvgT
Hình 3.1: Hàm thuộc của các tập mờ "thấp", "khá thấp", "trung bình",
Trang 24
11 12 13 14 15
22 23 24 25 21
ftij là giá trị thuộc của thời gian trả lời trung bình của câu hỏi Qi vào tập FTSj,
ftij[0,1], 1≤i≤m và 1≤j≤5
Bước 2:
Để đánh giá độ khó của mỗi câu hỏi ta sử dụng những luật mờ trên bảng 3.2 Ta
có thể cho độ chính xác và thời gian trả lời những trọng số khác nhau, trong luận văn này tôi chọn trọng số của độ chính xác là 0.6 và trọng số của thời gian trả lời là 0.4 Thời gian
trả lời
Độ chính xác Thấp Khá thấp Trung bình Khá cao Cao Ngắn Trung bình Khá thấp Khá thấp Thấp Thấp
Dựa vào ma trận mờ FA và FT, những luật mờ trong bảng 3.2 và trọng số của
độ chính xác và thời gian trả lời, ta tiến hành suy luận mờ để suy ra mức khó của câu hỏi Qi thể hiện bằng một vectơ
Trang 25
Theo bảng 3.2, ta tìm đƣợc những luật mờ suy ra mức khó của câu hỏi Qi là "thấp" nhƣ sau:
Nếu độ chính xác là "khá cao" và thời gian trả lời là "ngắn" thì mức khó là
Nếu độ chính xác là "khá thấp" và thời gian trả lời là "ngắn" thì mức khó là
Trang 27Nếu độ chính xác là "trung bình" và thời gian trả lời là "khá dài" thì mức khó là
Trang 28
Để đánh giá tổn phí của mỗi câu hỏi ta sử dụng những luật mờ ghi trên bảng 3.3 Ta có thể cho độ khó và độ phức tạp những trọng số khác, trong luận văn này tôi chọn trọng số của độ khó là 0.7 và trọng số của độ phức tạp là 0.3
Độ phức
tạp
Độ khó Thấp Khá thấp Trung bình Khá cao Cao
bình Khá thấp Thấp Khá thấp Khá thấp Trung bình Khá cao
Trung bình Khá thấp Khá thấp Trung bình Khá cao Khá cao
Khá cao Khá thấp Trung bình Khá cao Khá cao Cao
Cao Trung bình Khá cao Khá cao Cao Cao
Bảng 3.3: Ma trận luật mờ suy ra tổn phí
Dựa vào ma trận lớp mờ D và C, những luật mờ trong bảng 3.3 và trọng số của
độ khó và độ phức tạp, ta tiến hành suy luận mờ để suy ra tổn phí của câu hỏi Qi thể hiện bằng một vectơ
với 1≤i≤m, đƣợc tính nhƣ sau:
Theo bảng 3.3, ta tìm đƣợc những luật mờ suy ra tổn phí của câu hỏi Qi là "thấp" nhƣ sau: