Việc chấm điểm bài làm của học sinh như hiện tại đạt độ chính xác chưa cao, vìthực chất điểm mà học sinh đạt được trong mỗi bài kiểm tra có tính chất "mờ".. Ví dụtrong số những học sinh
Trang 1LỜI CẢM ƠN
Em xin chân thành cảm ơn các thầy cô giáo Bộ môn Tin học, Phòng Sau đạihọc - Trường Đại học Khoa học Tự nhiên; các thầy cô giáo Đại học Quốc gia Hà Nội,Viện Tin học, Viện Toán học đã nhiệt tình giảng dạy, hướng dẫn chúng em trong thờigian học tập tại trường;
Xin chân thành cảm ơn Ban Giám đốc Sở Giáo dục - Đào tạo Nam Định; cán
bộ, chuyên viên phòng Giáo dục Chuyên nghiệp và Giáo dục Thường xuyên - Sở Giáodục - Đào tạo Nam Định đã tạo mọi điều kiện, nhiệt tình giúp đỡ, động viên tôi trongsuốt thời gian tôi đi học;
Đặc biệt em xin chân thành cảm ơn PGS.TSKH Bùi Công Cường đã tận tìnhhướng dẫn em hoàn thành luận văn này
Trang 2MỤC LỤC
LỜI CẢM ƠN 1
MỞ ĐẦU 3
Chương 1 KIẾN THỨC CƠ SỞ VỀ LÝ THUYẾT TẬP MỜ 4
VÀ SỐ MỜ 4
1.1 Tập mờ 4
1.2 Số mờ 5
1.3 Luật mờ 7
Trang 3MỞ ĐẦU
Từ khi lí thuyết tập mờ được Zadeh đề xuất năm 1965, lí thuyết tập mờ và logic
mờ phát triển rất nhanh và đa dạng Công nghệ mờ và công nghệ mạng nơ-ron pháttriển mạnh, áp dụng vào các ngành công nghiệp làm ra nhiều sản phẩm thông minh,đáp ứng nhu cầu thị trường Những năm gần đây, một số nghiên cứu ứng dụng lýthuyết tập mờ vào giáo dục đào tạo đã được tiến hành và có những kết quả cụ thể nhưđánh giá học sinh, xếp hạng hệ thống giáo dục
Việc chấm điểm bài làm của học sinh như hiện tại đạt độ chính xác chưa cao, vìthực chất điểm mà học sinh đạt được trong mỗi bài kiểm tra có tính chất "mờ" Ví dụtrong số những học sinh được điểm 8 thì có những học sinh đạt “cỡ 8 điểm”, tức là cóthể thấp hơn hay cao hơn 8 điểm một chút…
Trên cơ sở đã tìm hiểu những kiến thức cơ bản về logic mờ, là người trực tiếp
làm nhiệm vụ quản lý giáo dục, tôi chọn đề tài "Xây dựng một hệ thống thông tin hỗ
trợ đánh giá học sinh dùng lý thuyết tập mờ" cho luận văn của mình, nhằm nghiên
cứu một cách mới để đánh giá học sinh chính xác hơn, khách quan hơn, công bằnghơn Tôi dùng phần mềm Matlab để cài đặt chương trình tính và đưa ra những kết quảđánh giá cụ thể
Luận văn gồm 3 chương:
Chương 1: Kiến thức cơ sở về lý thuyết tập mờ và số mờ
Chương 2: Phương pháp mới để đánh giá bài làm của học sinh sử dụng tập mờ.Chương 3: Đánh giá kết quả học tập của học sinh bằng cách sử dụng hàm thuộc
và luật mờ
Do thời gian có hạn và khả năng còn hạn chế nên luận văn khó tránh khỏinhững thiếu sót, tôi rất mong nhận được sự đóng góp ý kiến từ các thầy cô giáo, cácbạn học viên để hoàn thiện hơn bản luận văn của mình
Trang 4Chương 1 KIẾN THỨC CƠ SỞ VỀ LÝ THUYẾT TẬP MỜ
gian nền X nếu A được xác định bởi hàm: (
gọi là hàm thuộc (membership function);
là độ thuộc của x vào tập mờ A
Tập A được gọi là tập rỗng nếu nó không có phần tử nào Kí hiệu là:
1.1.2 Ví dụ [3]:
- Ví dụ 1.1:
Cho không gian nền X = [0, 150] là tập chỉ tốc độ của người đi xe máy (km/h)
Tập mờ A = ”Đi nhanh” xácđịnh bởi hàm thuộc như đồ thị sau:
Như vậy:
- Với x ≥ 50 (tốc độ từ 50km/h trở lên) thì (x) = 1 (đi nhanh);
- Với x = 45 (km/h) thì (x) = 0.8 (đi khá nhanh);
45
Trang 5Để cho gọn, ta kí hiệu độ thuộc là A(x) thay cho
Tập M trên đường thẳng số thực R1 là một số mờ nếu :
a) M chuẩn hóa, tức là có điểm x’ sao cho =1;
b) Ứng với mỗi α ∈ R1, tập mức { x: } là đoạn đóng trên R1;
( ) / ( )0
nếu z ≤ anếu a ≤ z ≤ bnếu z = bnếu b ≤ z ≤ cnếu c ≤ z
( )
M z
µ
1
Trang 6( ) / ( )0
( )
M z
µ
Z d
Trang 71.3 Luật mờ
Xét Ui ≠∅ là tập nền của biến ngôn ngữ vào xi, i=1,2, ,n
V≠∅ là tập nền của biến ngôn ngữ ra y
x1 là biến ngôn ngữ thời gian trả lời câu hỏi;
tập U1=[1,45] là không gian nền của biến ngôn ngữ x1(phút);
A1=’ngắn’ là một tập mờ trên không gian nền U1;
x2 là biến ngôn ngữ độ chính xác trong câu trả lời;
tập U2=[0,1] là không gian nền của biến ngôn ngữ x2;
A2=’cao’ là một tập mờ trên không gian nền U2;
y là biến ngôn ngữ độ khó của câu trả hỏi;
tập V=[0,1] là không gian nền của biến ngôn ngữ y;
B=’thấp’ là một tập mờ trên không gian nền V,
Một luật mờ suy ra độ khó của câu hỏi là:
IF (x1 is A1) ∧ (x2 is A2) THEN (y is B) (nếu thời gian trả lời ngắn và độ chínhxác cao thì độ khó của câu hỏi là thấp (câu hỏi dễ)
Trang 8Chương 2: PHƯƠNG PHÁP MỚI ĐỂ ĐÁNH GIÁ BÀI LÀM
CỦA HỌC SINH SỬ DỤNG TẬP MỜ
2.1 Phương pháp của Biswas để đánh giá bài làm của học sinh: [7]
- Cho 2 tập mờ A, B trên không gian nền X
- Tập không gian nền:
X = {0, 20, 40, 60, 80, 100} là tập không gian nền nhằm phân định mức độ
hoàn thành công việc của học sinh tương ứng với: 0%, 20%, 40%, 60%, 80%, 100%
- Tập mờ chuẩn:
Tuyệt vời, ký hiệu E = {0/0; 0/20; 0.8/40; 0.9/60; 1/80; 1/100} (Excellent)
Rất tốt, ký hiệu V = {0/0; 0/20; 0.8/40; 0.9/60; 0.9/80;0.8/100} (Very good)
.( , )
E
G S U
Trang 9- Gọi A, B, C, D, E là các chữ chỉ các mức giá trị của 5 điểm mờ nêu trên theo thứ tựtương ứng với E, V, G, S, U với ý nghĩa như sau: 0≤E<30, 30≤D<50, 50≤C<70,70≤B<90; 90≤A≤100.
Ký hiệu: P(E) là trung điểm của khoảng E, theo ý nghĩa đó ta có:
n là số lượng câu hỏi của bài kiểm tra
Cột 1: Các câu hỏi của bài kiểm tra theo thứ tự từ trên xuống
Từ cột thứ hai đến cột thứ bảy ghi “điểm mờ” mà giáo viên đánh giá câu trả lờicủa học sinh cho câu hỏi tương ứng
Cột 8: Ghi mức đánh giá dành cho mỗi câu hỏi
Dòng cuối cùng là tổng số điểm dành cho bài làm của học sinh
Ví dụ điểm cho câu hỏi 1 là F1={0/0; 0.1/20; 0.2/40; 0.4/60; 0.6/80; 0.4/100}(trên không gian nền X = {0, 20, 40, 60, 80, 100} ) thì ghi vào bảng trên dòng 1, cáccột từ thứ 2 đến thứ 7 lần lượt là 0, 0.1, 0.2, 0.4, 0.6, 0.4
2.1.1 Thuật toán đánh giá bài làm của học sinh theo trang điểm mờ
G i
FS i F
U FE i
V G S U
Trang 10Trong đó: T(Qi) là điểm của câu hỏi thứ i
Các công việc trên có thể thực hiện bằng chương trình máy tính
G i
FS i F
m
2.253.45
V1F
1.972.9
G1F
0.971.89
S1F
0.461.89
U1F
0.12.2
E1
F1F
G1
FS1F
U F F11
E2F
1.633.45
V2F
1.582.9
G2F
1.361.66
S2F
1.121.53
U2F
0.642.2
E2
F2
F G2
FS2F
U2
F G2F
E3F
1.373.45
V3F
1.322.9
G3F
1.081.66
S3F
0.831.53
U3F
0.362.2
Trang 11Nhận xét: Phương pháp chấm điểm đã trình bày ở trên vẫn còn 2 hạn chế:
- Thứ nhất: Việc sử dụng hàm S để tính độ tương tự giữa các tập mờ chuẩn vàtập mờ là điểm của mỗi câu hỏi cần khá nhiều thời gian, nhất là với số lượng câu hỏilớn;
- Thứ hai: Trong thuật toán trên để tính gi chúng ta đã tìm max {S(,), S(,),S(,), S(,), S(,)} Tuy nhiên có khả năng xảy ra là Fi ≠ Fj nhưng max{(Y, Fi)} =max{(Y, Fj)}, Y∈{,,,,}, tức là gi=gj, điều này dẫn đến việc đánh giá là không côngbằng
Để khắc phục các nhược điểm trên ta có phương pháp mới để đánh giá bài làmcủa học sinh như sau
2.2 Phương pháp mới để đánh giá bài làm của học sinh [7]
- Giả sử có 11 cấp để đánh giá độ thỏa mãn với mỗi câu trả lời của học sinh như bảngsau:
VVG (Very very good - Rất rất tốt) 91% - 99%
U3
F G3F
1(2 x 80 3 x 60 5 x 60)
E i
F i F
G i
FS i F
U FE i
V G S U
Trang 12VVB (Very very bad - Kém) 1% - 9%
Trang 13Trang chấm điểm mờ mở rộng (Extended fuzzy grade sheet):
Thứ
tự
thỏamãn
Cột 1 ghi các câu hỏi từ 1 đến n;
Trên mỗi dòng, từ cột thứ 2 đến cột 12 ghi điểm mờ ứng với câu đã ghi ở cột 1(điểm mờ được biểu thị bởi tập mờ trên không gian nền X = {EG, VVG, VG, G, MG,
F, MB, B, VB, VVB, EB}); cột cuối cùng ghi độ thỏa mãn của câu hỏi đó;
Ô ở dòng cuối cùng là tổng điểm của bài kiểm tra
Trang 140/VB, 0/VVB, 0/EB}, tức là cấp độ thỏa mãn của bài làm của học sinh ở câu hỏi 1 là90% rất rất tốt, 80% rất tốt và 30% tốt.
2.2.1 Thuật toán mới đánh giá bài làm của học sinh:
0
Độ thỏa mãn D(Qi) của câu hỏi i được tính bằng công thức:
D(Qi) = (2)
D(Qi) ∈[0,1], D(Qi) lớn thể hiện độ thỏa mãn cao
Xét ví dụ 2.2, điểm cho câu hỏi 1 của học sinh được ghi trong bảng 2.5 Từcông thức (1) ta có T(VVG)=0.99, T(VG)=0.90 và T(G)=0.80 Áp dụng công thức (2)
ta tính được độ thỏa mãn D(Q1) của câu trả lời của học sinh với câu hỏi 1 là:
D(Q1) =
= 0.9141Bước 2:
Giả sử bài kiểm tra có n câu hỏi, tổng số điểm là 100
Gọi Si là điểm dành cho câu hỏi thứ i (Qi), với 0≤ Si ≤ 100 (1≤ i ≤ n) và
S
=
∑
Trang 15điểm đánh giá toàn bài của học sinh được tính theo công thức:
Tổng số điểm =
(3)Sau đây là ví dụ minh họa cho quá trình đánh giá này
2.2.2 Ví dụ 2.3:
Xét một bài kiểm tra có tổng số điểm là 100, gồm 4 câu hỏi, điểm của mỗi câu
hỏi là:
Câu hỏi 1: 20 điểm
Câu hỏi 2: 30 điểm
Câu hỏi 3: 25 điểm
Câu hỏi 4: 25 điểm
và điểm của một học sinh được cho như trong bảng dưới đây:
Thứ
tự
thỏamãn
Theo công thức (1) và áp dụng công thức (2) ta có:
D(Q1) =
=
= 0.9424D(Q2) =
++
Trang 16Áp dụng công thức (3), tổng số điểm của học sinh này là:
Trang 17Tệp dữ liệu vào: dlvao_C2.m
m=4; %So cau hoi
n=11; %11 cap danh gia
%Do thoa man cao nhat cua moi cap
Trang 18- Việc tính độ thỏa mãn của mỗi câu hỏi theo công thức (2) chính xác hơn, đảmbảo công bằng hơn trong đánh giá;
- Ta có thể mở rộng trang chấm điểm mờ để đánh giá bài làm của học sinh chitiết hơn, chính xác hơn bằng cách thêm các tiêu chí cho mỗi câu hỏi, cụ thể như phầntrình bày dưới đây:
2.3 Một phương pháp đánh giá tổng quát: [7]
Bước 1:
Giả sử bài kiểm tra có n câu hỏi với thang điểm 100:
Câu hỏi 1: S1 điểm;
Câu hỏi 2: S2 điểm;
Câu hỏi n: Sn điểm
Với mỗi câu hỏi, ta sẽ đánh giá theo 4 tiêu chuẩn:
C1: Độ chính xác;
C2: Đầy đủ;
C3: Ngắn gọn, súc tích;
C4: Rõ ràng, mạch lạc
Trang 19và quy định trọng số của các tiêu chuẩn là:
Độthỏamãncủacâuhỏi
Bảng 2.7: Trang chấm điểm mờ mở rộng tổng quát
Độ thỏa mãn của câu hỏi i về các tiêu chuẩn C1, C2, C3 và C4 ký hiệu lần lượt là D(Ci1),D(Ci2), D(Ci3) và D(Ci4), được tính theo công thức (2) của phần 2.2, 0≤D(Ci1)≤1,0≤D(Ci2)≤1, 0≤D(Ci3)≤1, 0≤D(Ci4)≤1 với 1 ≤ i ≤ n
Bước 2: Độ thoản mãn P(Qi) của câu hỏi i được tính theo công thức:
Trang 20chấm điểm mờ mở rộng tổng quát sẽ đánh giá chi tiết hơn, chính xác hơn Ta cũng cóthể áp dụng trang chấm điểm mờ mở rộng tổng quát (bảng 2.7) để đánh giá toàn diệnhọc sinh, cụ thể như sau:
- Về cấu trúc của trang không thay đổi
- Dòng 1: Đánh giá về kết quả học tập (tiêu chuẩn 1: C1)
- Dòng 2: Đánh giá về ý thức chuyên cần trong học tập (tiêu chuẩn 2: C2)
- Dòng 3: Đánh giá về động cơ thái độ học tập (tiêu chuẩn 3: C3)
…
Tùy theo đối tượng học sinh (học sinh chuyên, học sinh phổ thông, học sinh bổtúc, học sinh dân tộc nội trú ) và mục tiêu giáo dục mà quyết định trọng số cho cáctiêu chuẩn, ví dụ với các trường trung học phổ thông có thể sử dụng trọng số sau:
- Tiêu chuẩn C1 có trọng số W1 = 0.5
- Tiêu chuẩn C2 có trọng số W2 = 0.2
- Tiêu chuẩn C3 có trọng số W3 = 0.3
Kết quả đánh giá quy về thang điểm 10, sau đó xếp hạng như sau:
- Từ 9.5 điểm trở lên xếp loại xuất sắc;
- Điểm từ 8.0 đến dưới 9.5 xếp loại giỏi;
- Từ 6.5 đến cận dưới 8.0 xếp loại khá;
- Từ 5.0 đến dưới 6.5 xếp loại trung bình;
- Từ 3.0 đến dưới 5.0 xếp loại yếu;
- Từ 0 đến dưới 3.0 xếp loại kém
Việc nhập và tính tổng số điểm, đánh giá học sinh có thể làm trong bảng tính(như MS Excel)
Trang 21Chương 3 ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH
BẰNG CÁCH SỬ DỤNG HÀM THUỘC VÀ LUẬT MỜ
3.1 Đặt vấn đề:
Ở chương 2 chúng ta đã có một phương pháp mới để chấm điểm bài kiểm tracủa học sinh, đánh giá kết quả học tập của học sinh bằng trang chấm điểm mờ mởrộng Phương pháp này đảm bảo chính xác hơn, công bằng hơn trong đánh giá Trongchương này chúng ta xét một phương pháp nữa, dùng hàm thuộc và luật mờ để đánhgiá kết quả học tập của học sinh, một cách hữu ích để phân biệt thứ tự xếp hạng nhữnghọc sinh có điểm số như nhau Phương pháp này xét đến cả độ khó, độ phức tạp củacâu hỏi nên đảm bảo tính chính xác, công bằng trong đánh giá học sinh
Đặt G là ma trận điểm của các câu hỏi của bài kiểm tra:
với gi là điểm của câu hỏi Qi,
n n
n n
1 2
m
g g G
Trang 22Đặt IM là ma trận xác định độ quan trọng, C là ma trận về độ phức tạp của các câu hỏi:
với ImS1, ImS2, ImS3,ImS4 và ImS5 là các cấp độquan trọng: ImS1 = "thấp", ImS2 ="khá thấp", ImS3 = "trung bình", ImS4 = "khá cao" và
ImS5 = "cao" imij là độ thuộc của độ quan trọng của câu hỏi Qi vào cấp độ quan trọng
ImSj, imij∈[0,1], 1≤i≤m và 1≤j≤5; CS1, CS2, CS3, CS4 và CS5 thể hiện các cấp độ phức
đây có thể xếp hạng chúng, cụ thể như sau:
Bước 1:
Dựa vào ma trận về độ chính xác A và ma trận thời gian trả lời T, tính độ chính
xác trung bình AvgAi và thời gian trả lời trung bình AvgTi cho câu hỏi Qi:
; với 1≤i≤m
(2)
Sau đó làm mờ chúng dựa
vào 5 tập mờ "thấp", "khá thấp", "trung bình", "khá cao" và "cao" như trên hình 3.1 và
tính độ thuộc của chúng vào mỗi tập mờ một cách tương ứng
11 12 13 14 15
22 23 24 25 21
1 2 3 4 5
n
j i
a AvgA
n
=
=∑ ij 1
n
j i
t AvgT
Qm
ImS1 ImS2 ImS3 ImS4 ImS5
Q1
Q2
Qm
CS1 CS2 CS3 CS4 CS5
Trang 23Hình 3.1: Hàm thuộc của các tập mờ "thấp", "khá thấp", "trung bình",
Bước 2:
11 12 13 14 15
22 23 24 25 21
1 2 3 4 5
1 2 3 4 5
QmFAS1 FAS2 FAS3 FAS4 FAS5
Q
1
Q2
Qm FTS1 FTS2 FTS3 FTS4 FTS5
Trang 24Để đánh giá độ khó của mỗi câu hỏi ta sử dụng những luật mờ trên bảng 3.2 Ta
có thể cho độ chính xác và thời gian trả lời những trọng số khác nhau, trong luận văn
này tôi chọn trọng số của độ chính xác là 0.6 và trọng số của thời gian trả lời là 0.4
Bảng 3.2: Ma trận luật mờ suy ra mức khó
Dựa vào ma trận mờ FA và FT, những luật mờ trong bảng 3.2 và trọng số của
độ chính xác và thời gian trả lời, ta tiến hành suy luận mờ để suy ra mức khó của câu
hỏi Qi thể hiện bằng một vectơ
với 1 ≤ i ≤ m,được tính như sau:
Theo bảng 3.2, ta tìm được những luật mờ suy ra mức khó của câu hỏi Qi là "thấp" như
sau:
Nếu độ chính xác là "khá cao" và thời gian trả lời là "ngắn" thì mức khó là
"thấp",
Nếu độ chính xác là "cao" và thời gian trả lời là "ngắn" thì mức khó là "thấp",
Nếu độ chính xác là "cao" và thời gian trả lời là "khá ngắn" thì mức khó là
"thấp",
Từ đó ta tính di1 theo công thức:
di1=max{(0.6 x fai4 + 0.4 x fti1), (0.6 x fai5 + 0.4 x fti1),
di1 là độ thuộc của độ khó của câu hỏi Qi vào tập mờ "thấp", di1∈[0,1], 1≤i≤m
Theo bảng 3.2, ta tìm được những luật mờ suy ra mức khó của câu hỏi Qi là "khá thấp"
Trang 25Nếu độ chính xác là "trung bình" và thời gian trả lời là "ngắn" thì mức khó là
Trang 27Nếu độ chính xác là "thấp" và thời gian trả lời là "khá dài" thì mức khó là
"cao",
Nếu độ chính xác là "thấp" và thời gian trả lời là "dài" thì mức khó là "cao",
Nếu độ chính xác là "khá thấp" và thời gian trả lời là "dài" thì mức khó là
Để đánh giá tổn phí của mỗi câu hỏi ta sử dụng những luật mờ ghi trên bảng
3.3 Ta có thể cho độ khó và độ phức tạp những trọng số khác, trong luận văn này tôi
Bảng 3.3: Ma trận luật mờ suy ra tổn phí
Dựa vào ma trận lớp mờ D và C, những luật mờ trong bảng 3.3 và trọng số của
độ khó và độ phức tạp, ta tiến hành suy luận mờ để suy ra tổn phí của câu hỏi Qi thể
hiện bằng một vectơ
11 12 13 14 15
22 23 24 25 21
1 2 3 4 5
DS1 DS2 DS3 DS4 DS5
thấp khá thấp trung bình khá cao cao
Trang 28với 1≤i≤m, được tính như sau:
Theo bảng 3.3, ta tìm được những luật mờ suy ra tổn phí của câu hỏi Qi là "thấp" nhưsau:
Nếu độ khó là "trung bình" và độ phức tạp là "thấp" thì tổn phí là "khá thấp",Nếu độ khó là "trung bình" và độ phức tạp là "khá thấp" thì tổn phí là "kháthấp",
Nếu độ khó là "khá cao" và độ phức tạp là "thấp" thì tổn phí là "khá thấp",
Từ đó ta tính aci2 theo công thức:
aci2=max{(0.7 x di1 + 0.3 x ci3), (0.7 x di1 + 0.3 x ci4),
(0.7 x di2 + 0.3 x ci2), (0.7 x di2 + 0.3 x ci3), (9)(0.7 x di3 + 0.3 x ci1), (0.7 x di3 + 0.3 x ci2),
0.7 x di4 + 0.3 x ci1)}
aci2 là độ thuộc của tổn phí của câu hỏi Qi vào tập mờ "khá thấp", aci2∈[0,1],1≤i≤m