xây dựng một hệ thống thông tin hỗ trợ đánh giá học sinh dùng lý thuyết tập mờ

Việc chấm điểm bài làm của học sinh như hiện tại đạt độ chính xác chưa cao, vì thực chất điểm mà học sinh đạt được trong mỗi bài kiểm tra có tính chất "mờ".. Ví dụ trong số những học sin

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-

NGUYỄN VĂN THÔNG

XÂY DỰNG MỘT HỆ THỐNG THÔNG TIN

HỖ TRỢ ĐÁNH GIÁ HỌC SINH DÙNG LÝ THUYẾT TẬP MỜ

Chuyên ngành: Bảo đảm toán học cho máy tính

và hệ thống tính toán

Mã số: 60 46 35

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TSKH Bùi Công Cường

Hà Nội – Năm 2011

Trang 2

MỤC LỤC

MỞ ĐẦU 3

Chương 1 KIẾN THỨC CƠ SỞ VỀ LÝ THUYẾT TẬP MỜ VÀ SỐ MỜ 4

1.1 Tập mờ 4

1.1.1 Định nghĩa 1.1 4

1.1.2 Ví dụ 4

1.2 Số mờ 5

1.2.2 Ví dụ 5

1.3 Luật mờ 7

1.3.2 Ví dụ 7

Chương 2 PHƯƠNG PHÁP MỚI ĐỂ ĐÁNH GIÁ BÀI LÀM CỦA HỌC SINH SỬ DỤNG TẬP MỜ 8

2.1 Phương pháp của Biswas để đánh giá bài làm của học sinh 8

2.1.1 Thuật toán đánh giá bài làm của học sinh theo trang điểm mờ 9

2.1.2 Ví dụ 2.1 10

2.2 Phương pháp mới để đánh giá bài làm của học sinh 12

2.2.1 Thuật toán mới đánh giá bài làm của học sinh 14

2.2.2 Ví dụ 2.3 15

2.2.3 Chương trình máy tính 17

2.3 Một phương pháp đánh giá tổng quát 18

Chương 3 ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH BẰNG CÁCH SỬ DỤNG HÀM THUỘC VÀ LUẬT MỜ 21

3.1 Đặt vấn đề 21

3.2 Thuật toán 21

3.3 Ví dụ 35

3.4 Chương trình máy tính 40

KẾT LUẬN 49

TÀI LIỆU THAM KHẢO 50

Trang 3

MỞ ĐẦU

Từ khi lí thuyết tập mờ được Zadeh đề xuất năm 1965, lí thuyết tập mờ và logic

mờ phát triển rất nhanh và đa dạng Công nghệ mờ và công nghệ mạng nơ-ron phát triển mạnh, áp dụng vào các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường Những năm gần đây, một số nghiên cứu ứng dụng lý thuyết tập mờ vào giáo dục đào tạo đã được tiến hành và có những kết quả cụ thể như đánh giá học sinh, xếp hạng hệ thống giáo dục

Việc chấm điểm bài làm của học sinh như hiện tại đạt độ chính xác chưa cao, vì thực chất điểm mà học sinh đạt được trong mỗi bài kiểm tra có tính chất "mờ" Ví dụ trong số những học sinh được điểm 8 thì có những học sinh đạt “cỡ 8 điểm”, tức là có thể thấp hơn hay cao hơn 8 điểm một chút…

Trên cơ sở đã tìm hiểu những kiến thức cơ bản về logic mờ, là người trực tiếp làm nhiệm vụ quản lý giáo dục, tôi chọn đề tài "Xây dựng một hệ thống thông tin hỗ trợ đánh giá học sinh dùng lý thuyết tập mờ" cho luận văn của mình, nhằm nghiên cứu một cách mới để đánh giá học sinh chính xác hơn, khách quan hơn, công bằng hơn Tôi dùng phần mềm Matlab để cài đặt chương trình tính và đưa ra những kết quả đánh giá cụ thể

Luận văn gồm 3 chương:

Chương 1: Kiến thức cơ sở về lý thuyết tập mờ và số mờ

Chương 2: Phương pháp mới để đánh giá bài làm của học sinh sử dụng tập mờ Chương 3: Đánh giá kết quả học tập của học sinh bằng cách sử dụng hàm thuộc

và luật mờ

Do thời gian có hạn và khả năng còn hạn chế nên luận văn khó tránh khỏi những thiếu sót, tôi rất mong nhận được sự đóng góp ý kiến từ các thầy cô giáo, các bạn học viên để hoàn thiện hơn bản luận văn của mình

Trang 4

Chương 1 KIẾN THỨC CƠ SỞ VỀ LÝ THUYẾT TẬP MỜ

VÀ SỐ MỜ

1.1 Tập mờ

1.1.1 Định nghĩa 1.1[3]:

Cho tập X , ta sẽ gọi X là không gian nền

A là tập mờ trên không gian nền X nếu A được xác định bởi hàm:

 là độ thuộc của x vào tập mờ A

Tập A được gọi là tập rỗng nếu nó không có phần tử nào Kí hiệu là: A

1.1.2 Ví dụ [3]:

- Ví dụ 1.1:

Cho không gian nền X = [0, 150] là tập chỉ tốc độ của người đi xe máy (km/h)

Tập mờ A = ”Đi nhanh” xác định bởi hàm thuộc A:X [0,1] như đồ thị sau:

Như vậy:

- Với x ≥ 50 (tốc độ từ 50km/h trở lên) thì A(x) = 1 (đi nhanh);

- Với x = 45 (km/h) thì A(x) = 0.8 (đi khá nhanh);

45

Trang 5

Để cho gọn, ta kí hiệu độ thuộc là A(x) thay cho A( )x

b) Ứng với mỗi  R1, tập mức { x: M( )x } là đoạn đóng trên R1

( ) / ( )0

M

z a b a z

nếu z ≤ a nếu a ≤ z ≤ b nếu z = b nếu b ≤ z ≤ c nếu c ≤ z

Trang 7

Hình 1.3 Số mờ ’Bờ vai’

1.3 Luật mờ

Xét Ui ≠ là tập nền của biến ngôn ngữ vào xi, i=1,2, ,n

V≠ là tập nền của biến ngôn ngữ ra y

x1 là biến ngôn ngữ thời gian trả lời câu hỏi;

tập U1=[1,45] là không gian nền của biến ngôn ngữ x1(phút);

A1=’ngắn’ là một tập mờ trên không gian nền U1;

x2 là biến ngôn ngữ độ chính xác trong câu trả lời;

tập U2=[0,1] là không gian nền của biến ngôn ngữ x2;

A2=’cao’ là một tập mờ trên không gian nền U2;

y là biến ngôn ngữ độ khó của câu trả hỏi;

tập V=[0,1] là không gian nền của biến ngôn ngữ y;

B=’thấp’ là một tập mờ trên không gian nền V,

Một luật mờ suy ra độ khó của câu hỏi là:

IF (x1 is A1)  (x2 is A2) THEN (y is B) (nếu thời gian trả lời ngắn và độ chính xác cao thì độ khó của câu hỏi là thấp (câu hỏi dễ)

Trang 8

Chương 2: PHƯƠNG PHÁP MỚI ĐỂ ĐÁNH GIÁ BÀI LÀM

CỦA HỌC SINH SỬ DỤNG TẬP MỜ

2.1 Phương pháp của Biswas để đánh giá bài làm của học sinh: [7]

- Cho 2 tập mờ A, B trên không gian nền X

Đạt yêu cầu, ký hiệu S = {0.4/0; 0.4/20; 0.9/40; 0.6/60; 0.2/80; 0/100} (Satisfactory)

Không đạt yêu cầu, ký hiệu U ={1/0; 1/20; 0.4/40; 0.2/60; 0/80; 0/100} (Unsatisfactory)

Để cho gọn ta dùng các véc tơ E, V , G, S, U để biểu thị các tập E, V, G, S,

U một cách tương ứng:

E = {0, 0, 0.8, 0.9, 1, 1}, V = {0, 0, 0.8, 0.9, 0.9, 0.8}

G = {0, 0.1, 0.8, 0.9, 0.4, 0.2}, S = {0.4, 0.4, 0.9, 0.6, 0.2, 0},

U = {1, 1, 0.4, 0.2, 0, 0}

Trang 9

- Gọi A, B, C, D, E là các chữ chỉ các mức giá trị của 5 điểm mờ nêu trên theo thứ tự tương ứng với E, V, G, S, U với ý nghĩa như sau: 0≤E<30, 30≤D<50, 50≤C<70, 70≤B<90; 90≤A≤100

Ký hiệu: P(E) là trung điểm của khoảng E, theo ý nghĩa đó ta có:

n là số lượng câu hỏi của bài kiểm tra

Cột 1: Các câu hỏi của bài kiểm tra theo thứ tự từ trên xuống

Từ cột thứ hai đến cột thứ bảy ghi “điểm mờ” mà giáo viên đánh giá câu trả lời của học sinh cho câu hỏi tương ứng

Cột 8: Ghi mức đánh giá dành cho mỗi câu hỏi

Dòng cuối cùng là tổng số điểm dành cho bài làm của học sinh

Ví dụ điểm cho câu hỏi 1 là F1={0/0; 0.1/20; 0.2/40; 0.4/60; 0.6/80; 0.4/100} (trên không gian nền X = {0, 20, 40, 60, 80, 100} ) thì ghi vào bảng trên dòng 1, các cột từ thứ 2 đến thứ 7 lần lượt là 0, 0.1, 0.2, 0.4, 0.6, 0.4

2.1.1 Thuật toán đánh giá bài làm của học sinh theo trang điểm mờ

Trang 10

Trong đó: T(Qi) là điểm của câu hỏi thứ i

Các công việc trên có thể thực hiện bằng chương trình máy tính

Trang 11

Nhận xét: Phương pháp chấm điểm đã trình bày ở trên vẫn còn 2 hạn chế:

- Thứ nhất: Việc sử dụng hàm S để tính độ tương tự giữa các tập mờ chuẩn và tập mờ là điểm của mỗi câu hỏi cần khá nhiều thời gian, nhất là với số lượng câu hỏi lớn;

- Thứ hai: Trong thuật toán trên để tính gi chúng ta đã tìm max {S(E,F i), S(V,F i), S(G,F i), S(S,F i ), S(U,F i )} Tuy nhiên có khả năng xảy ra là Fi ≠ Fj

Trang 12

nhưng max{(Y, Fi)} = max{(Y, Fj)}, Y{E,V ,G,S,U}, tức là gi=gj, điều này dẫn đến việc đánh giá là không công bằng

Để khắc phục các nhược điểm trên ta có phương pháp mới để đánh giá bài làm của học sinh như sau

2.2 Phương pháp mới để đánh giá bài làm của học sinh [7]

- Giả sử có 11 cấp để đánh giá độ thỏa mãn với mỗi câu trả lời của học sinh như bảng sau:

EG (Extremely good - Tuyệt vời) 100%

VVG (Very very good - Rất rất tốt) 91% - 99%

VB (Very bad - Rất yếu) 10% - 24%

VVB (Very very bad - Kém) 1% - 9%

Trang 13

Trang chấm điểm mờ mở rộng (Extended fuzzy grade sheet):

Thứ

tự

thỏa mãn

Cột 1 ghi các câu hỏi từ 1 đến n;

Trên mỗi dòng, từ cột thứ 2 đến cột 12 ghi điểm mờ ứng với câu đã ghi ở cột 1 (điểm mờ đƣợc biểu thị bởi tập mờ trên không gian nền X = {EG, VVG, VG, G, MG,

F, MB, B, VB, VVB, EB}); cột cuối cùng ghi độ thỏa mãn của câu hỏi đó;

Ô ở dòng cuối cùng là tổng điểm của bài kiểm tra

Trang 14

Trong bảng 2.4, ta thấy cấp thỏa mãn của câu hỏi 1 của học sinh đƣợc biểu thị bởi tập mờ F(Q1) trên không gian nền X (X = {EG, VVG, VG, G, MG, F, MB, B, VB, VVB, EB}), và F(Q1) = {0/EG, 0.9/VVG, 0.8/VG, 0.5/G, 0/MG, 0/F, 0/MB, 0/B, 0/VB, 0/VVB, 0/EB}, tức là cấp độ thỏa mãn của bài làm của học sinh ở câu hỏi 1 là 90% rất rất tốt, 80% rất tốt và 30% tốt

2.2.1 Thuật toán mới đánh giá bài làm của học sinh:

D(Qi) [0,1], D(Qi) lớn thể hiện độ thỏa mãn cao

Xét ví dụ 2.2, điểm cho câu hỏi 1 của học sinh đƣợc ghi trong bảng 2.5 Từ công thức (1) ta có T(VVG)=0.99, T(VG)=0.90 và T(G)=0.80 Áp dụng công thức (2)

ta tính đƣợc độ thỏa mãn D(Q1) của câu trả lời của học sinh với câu hỏi 1 là:

D(Q1) = 0.9 x0.99 0.8x0.90 0.5x0.80

0.9 0.8 0.5

Trang 15

= 0.9141 Bước 2:

Giả sử bài kiểm tra có n câu hỏi, tổng số điểm là 100

Gọi Si là điểm dành cho câu hỏi thứ i (Qi), với 0≤ Si ≤ 100 (1≤ i ≤ n) và

Câu hỏi 1: 20 điểm

và điểm của một học sinh được cho như trong bảng dưới đây:

Thứ

tự

thỏa mãn

hỏi 3 0 0 0.7 0.8 0.5 0 0 0 0 0 0 Câu

hỏi 4 0 0 0 0 0 0 0 0.5 0.9 0.2 0

Tổng số điểm =

Trang 16

Áp dụng công thức (3), tổng số điểm của học sinh này là:

20 x D(Q1) + 30 x D(Q2) + 25 x D(Q3) + 25 x D(Q4)

= 20 x 0.9424 + 30 x 0.705 + 25 x 0.815 + 25 x 0.27125

= 67.154

= 67

Trang 17

hỏi 2 0 0 0 0.6 0.9 0.5 0 0 0 0 0 0.705 Câu

hỏi 3 0 0 0.8 0.7 0.5 0 0 0 0 0 0 0.815 Câu

hỏi 4 0 0 0 0 0 0 0 0.5 0.9 0.2 0 0.27125

Tổng số điểm = 67 2.2.3 Chương trình máy tính

Tệp dữ liệu vào: dlvao_C2.m

m=4; %So cau hoi

n=11; %11 cap danh gia

%Do thoa man cao nhat cua moi cap

Trang 18

- Việc tính độ thỏa mãn của mỗi câu hỏi theo công thức (2) chính xác hơn, đảm bảo công bằng hơn trong đánh giá;

- Ta có thể mở rộng trang chấm điểm mờ để đánh giá bài làm của học sinh chi tiết hơn, chính xác hơn bằng cách thêm các tiêu chí cho mỗi câu hỏi, cụ thể như phần trình bày dưới đây:

2.3 Một phương pháp đánh giá tổng quát: [7]

Bước 1:

Giả sử bài kiểm tra có n câu hỏi với thang điểm 100:

Câu hỏi 1: S1 điểm;

Câu hỏi 2: S2 điểm;

Câu hỏi n: Sn điểm

Với mỗi câu hỏi, ta sẽ đánh giá theo 4 tiêu chuẩn:

C1: Độ chính xác;

Trang 19

Độ thỏa mãn của câu hỏi

Bảng 2.7: Trang chấm điểm mờ mở rộng tổng quát

Độ thỏa mãn của câu hỏi i về các tiêu chuẩn C1, C2, C3 và C4 ký hiệu lần lƣợt là D(Ci1), D(Ci2), D(Ci3) và D(Ci4), đƣợc tính theo công thức (2) của phần 2.2, 0≤D(Ci1)≤1, 0≤D(Ci2)≤1, 0≤D(Ci3)≤1, 0≤D(Ci4)≤1 với 1 ≤ i ≤ n

Trang 20

Bước 2: Độ thoản mãn P(Qi) của câu hỏi i được tính theo công thức:

- Về cấu trúc của trang không thay đổi

- Dòng 1: Đánh giá về kết quả học tập (tiêu chuẩn 1: C1)

- Dòng 2: Đánh giá về ý thức chuyên cần trong học tập (tiêu chuẩn 2: C2)

- Dòng 3: Đánh giá về động cơ thái độ học tập (tiêu chuẩn 3: C3)

…

Tùy theo đối tượng học sinh (học sinh chuyên, học sinh phổ thông, học sinh bổ túc, học sinh dân tộc nội trú ) và mục tiêu giáo dục mà quyết định trọng số cho các tiêu chuẩn, ví dụ với các trường trung học phổ thông có thể sử dụng trọng số sau:

- Tiêu chuẩn C1 có trọng số W1 = 0.5

Kết quả đánh giá quy về thang điểm 10, sau đó xếp hạng như sau:

- Từ 9.5 điểm trở lên xếp loại xuất sắc;

- Điểm từ 8.0 đến dưới 9.5 xếp loại giỏi;

- Từ 6.5 đến cận dưới 8.0 xếp loại khá;

- Từ 5.0 đến dưới 6.5 xếp loại trung bình;

- Từ 3.0 đến dưới 5.0 xếp loại yếu;

- Từ 0 đến dưới 3.0 xếp loại kém

Việc nhập và tính tổng số điểm, đánh giá học sinh có thể làm trong bảng tính (như MS Excel)

Trang 21

Chương 3 ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH

BẰNG CÁCH SỬ DỤNG HÀM THUỘC VÀ LUẬT MỜ

3.1 Đặt vấn đề:

Ở chương 2 chúng ta đã có một phương pháp mới để chấm điểm bài kiểm tra của học sinh, đánh giá kết quả học tập của học sinh bằng trang chấm điểm mờ mở rộng Phương pháp này đảm bảo chính xác hơn, công bằng hơn trong đánh giá Trong chương này chúng ta xét một phương pháp nữa, dùng hàm thuộc và luật mờ để đánh giá kết quả học tập của học sinh, một cách hữu ích để phân biệt thứ tự xếp hạng những học sinh có điểm số như nhau Phương pháp này xét đến cả độ khó, độ phức tạp của câu hỏi nên đảm bảo tính chính xác, công bằng trong đánh giá học sinh

a

a a A

t

t t T

Ở đây aij biểuthị độ chính xác trong câu trả lời của học sinh Sj đối với câu hỏi

Qi, aij[0,1]; tij là thời gian trả lời của học sinh Sj đối với câu hỏi Qi, tij[0,1], 1≤i≤m

Trang 22

với gi là điểm của câu hỏi Qi, gi[1,100], 1≤i≤m

Đặt IM là ma trận xác định độ quan trọng, C là ma trận về độ phức tạp của các câu hỏi:

11 12 13 14 15

22 23 24 25 21

và 1≤j≤5; CS1, CS2, CS3, CS4 và CS5 thể hiện các cấp độ phức tạp: CS1 = "thấp", CS2

= "khá thấp", CS3 = "trung bình", CS4 = "khá cao" và CS5 = "cao"; cij là độ thuộc của

độ phức tạp của câu hỏi Qi vào cấp độ phức tạp CSj, cij[0,1], 1≤i≤m và 1≤j≤5

Theo ma trận về độ chính xác A và ma trận điểm G, chúng ta có thể tính tổng điểm TSj của học sinh thứ j nhƣ sau:

ij 1

Qm ImS1 ImS2 ImS3 ImS4 ImS5

Q1

Q2

Qm

CS1 CS2 CS3 CS4 CS5

Trang 23

Dựa vào ma trận về độ chính xác A và ma trận thời gian trả lời T, tính độ chính xác trung bình AvgAi và thời gian trả lời trung bình AvgTi cho câu hỏi Qi:

ij 1

n

j i

a AvgA

n

j i

t AvgT

Hình 3.1: Hàm thuộc của các tập mờ "thấp", "khá thấp", "trung bình",

Trang 24

11 12 13 14 15

22 23 24 25 21

ftij là giá trị thuộc của thời gian trả lời trung bình của câu hỏi Qi vào tập FTSj,

ftij[0,1], 1≤i≤m và 1≤j≤5

Bước 2:

Để đánh giá độ khó của mỗi câu hỏi ta sử dụng những luật mờ trên bảng 3.2 Ta

có thể cho độ chính xác và thời gian trả lời những trọng số khác nhau, trong luận văn này tôi chọn trọng số của độ chính xác là 0.6 và trọng số của thời gian trả lời là 0.4 Thời gian

trả lời

Độ chính xác Thấp Khá thấp Trung bình Khá cao Cao Ngắn Trung bình Khá thấp Khá thấp Thấp Thấp

Dựa vào ma trận mờ FA và FT, những luật mờ trong bảng 3.2 và trọng số của

độ chính xác và thời gian trả lời, ta tiến hành suy luận mờ để suy ra mức khó của câu hỏi Qi thể hiện bằng một vectơ

Trang 25

Theo bảng 3.2, ta tìm đƣợc những luật mờ suy ra mức khó của câu hỏi Qi là "thấp" nhƣ sau:

Nếu độ chính xác là "khá cao" và thời gian trả lời là "ngắn" thì mức khó là

Nếu độ chính xác là "khá thấp" và thời gian trả lời là "ngắn" thì mức khó là

Trang 27

Nếu độ chính xác là "trung bình" và thời gian trả lời là "khá dài" thì mức khó là

Trang 28

Để đánh giá tổn phí của mỗi câu hỏi ta sử dụng những luật mờ ghi trên bảng 3.3 Ta có thể cho độ khó và độ phức tạp những trọng số khác, trong luận văn này tôi chọn trọng số của độ khó là 0.7 và trọng số của độ phức tạp là 0.3

Độ phức

tạp

Độ khó Thấp Khá thấp Trung bình Khá cao Cao

bình Khá thấp Thấp Khá thấp Khá thấp Trung bình Khá cao

Trung bình Khá thấp Khá thấp Trung bình Khá cao Khá cao

Khá cao Khá thấp Trung bình Khá cao Khá cao Cao

Cao Trung bình Khá cao Khá cao Cao Cao

Bảng 3.3: Ma trận luật mờ suy ra tổn phí

Dựa vào ma trận lớp mờ D và C, những luật mờ trong bảng 3.3 và trọng số của

độ khó và độ phức tạp, ta tiến hành suy luận mờ để suy ra tổn phí của câu hỏi Qi thể hiện bằng một vectơ

với 1≤i≤m, đƣợc tính nhƣ sau:

Theo bảng 3.3, ta tìm đƣợc những luật mờ suy ra tổn phí của câu hỏi Qi là "thấp" nhƣ sau:

Định dạng
Số trang	50
Dung lượng	0,93 MB