Hệ thống trắc nghiệm thích nghi TNTN đã được nghiên cứu hiện thực hóa và ứng dụng rộng rải nhờ tính chính xác và khách quan trong quá trình đánh giá năng lực kiến thức của thí sinh Tuy nhiên những mô hình và hệ thống TNTN đã tồn tại vẫn còn một số nhược điểm nhất định Nghiên cứu này được đề xuất nhằm khắc phục mở rộng tính toán cho hệ thống TNTN có câu hỏi chứa nhiều tham số chọn lựa câu hỏi phù hợp với mức độ kiến thức hiện tại của thí sinh Luận văn đã khái quát về TNTN giới thiệu các hệ thống TNTN đã tồn tại Từ lý thuyết mạng Bayes lý thuyết đáp ứng câu hỏi tác giả đã thiết kế và xây dựng hệ thống TNTN Các phân tích đánh giá hệ thống cũng được giới thiệu trong luận văn Tác giả đã tóm tắt các kết quả đạt được và đưa ra hướng phát triển tiếp theo
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA
Trang 2LUẬN VĂN THẠC SĨ KỸ THUẬT
Người hướng dẫn khoa học: TS ĐẶNG HOÀI PHƯƠNG
Đà Nẵng - Năm 2017
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đề tài “Ứng dụng mạng Bayes xây dựng hệ thống trắc nghiệm
thích nghi” này là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của TS
Đặng Hoài Phương
Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực
Tác giả
Trần Thị Tố Loan
Trang 4TÓM TẮT LUẬN VĂN
ỨNG DỤNG MẠNG BAYES XÂY DỰNG HỆ THỐNG TRẮC NGHIỆM
THÍCH NGHI Trần Thị Tố Loan, học viên cao học khóa 31, chuyên ngành Khoa học máy tính, mã
số: 60.48.01, trường Đại học Bách Khoa - Đại học Đà Nẵng
Tóm tắt - Hệ thống trắc nghiệm thích nghi (TNTN) đã được nghiên cứu, hiện thực hóa
và ứng dụng rộng rải nhờ tính chính xác và khách quan trong quá trình đánh giá năng lực, kiến thức của thí sinh Tuy nhiên, những mô hình và hệ thống TNTN đã tồn tại vẫn còn một số nhược điểm nhất định Nghiên cứu này được đề xuất nhằm khắc phục, mở rộng tính toán cho hệ thống TNTN có câu hỏi chứa nhiều tham số, chọn lựa câu hỏi phù hợp với mức độ kiến thức hiện tại của thí sinh Luận văn đã khái quát về TNTN, giới thiệu các hệ thống TNTN đã tồn tại Từ lý thuyết mạng Bayes, lý thuyết đáp ứng câu hỏi tác giả đã thiết kế và xây dựng hệ thống TNTN Các phân tích đánh giá hệ thống cũng được giới thiệu trong luận văn Tác giả đã tóm tắt các kết quả đạt được và đưa ra hướng phát triển tiếp theo
Từ khóa – Trắc nghiệm thích nghi; mạng Bayes; lý thuyết đáp ứng câu hỏi; thuật toán
ước lượng năng lực
BAYESIAN NETWORK APPLICATIONS FOR BUILDING COMPUTERIZED
ADAPTIVE TESTING SYSTEMS Abstract - Computerized Adaptive Testing (CAT) has been research, actualize and
wide apply because of their accuracy and objective in process of testing ability and knowledge of the candidate However existing CAT system model still have some limitation This research was proposed inorder to resolve; expand the calculation ability of CAT sytem which have many parameters; select the suitable question depend
on candidate’s current knowledge level The thesis is generaly describle about CAT; introduce about existing CAT model From Bayesian Network theory; Item Response Theory adapt to question which designes and created the CAT system Among these, the fuzzy controller to optimized the calculation for the ability estimatation agrorithm
of student The review and analysis for te system also mention in the Thesis The author was summarize the successful result and given the improvement direction next step
Key words - Computerized Adaptive Testing; Bayesian Network; Item Response
Theory; the ability estimatation agrorithm of student
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
TÓM TẮT LUẬN VĂN ii
MỤC LỤC iii
DANH MỤC CÁC CHỮ VIẾT TẮT v
DANH MỤC CÁC KÝ HIỆU vi
DANH MỤC CÁC BẢNG vii
DANH MỤC CÁC HÌNH viii
DANH MỤC CÁC BIỂU ĐỒ ix
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích và ý nghĩa đề tài 1
3 Mục tiêu và nhiệm vụ 2
4 Đối tượng và phạm vi nghiên cứu 2
5 Phương pháp nghiên cứu 2
6 Kết quả dự kiến 3
CHƯƠNG 1 CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN 4
1.1 Tổng quan về trắc nghiệm thích nghi 4
1.1.1 Khái niệm trắc nghiệm thích nghi 4
1.1.2 Lịch sử TNTN 4
1.2 Các thành phần của mô hình TNTN 5
1.2.1 Ngân hàng câu hỏi 5
1.2.2 Thuật toán lựa chọn câu hỏi 5
1.2.3 Đánh giá năng lực của thí sinh 5
1.2.4 Điều kiện dừng 6
1.3 Hoạt động của mô hình TNTN 6
1.4 Phân tích các mô hình TNTN 7
CHƯƠNG 2 XÂY DỰNG MÔ HÌNH TRẮC NGHIỆM THÍCH NGHI 9
2.1 Lý thuyết mạng Bayes 9
2.1.1 Giới thiệu 9
2.1.2 Định nghĩa mạng Bayes 9
2.1.3 Mạng Bayes nhân quả 10
2.1.4 Học cấu trúc 10
2.1.5 Học tham số 10
2.1.6 Suy luận trong mạng Bayes 11
2.1.7 Ứng dụng 11
Trang 62.2 Lý thuyết đáp ứng câu hỏi 12
2.2.1 Giới thiệu 12
2.2.2 Mô hình IRT 2 tham số 12
2.3 Xây dựng mô hình TNTN dựa trên mạng Bayes kết hợp IRT 2 tham số 14
2.3.1 Mô hình TNTN 14
2.3.2 Ngân hàng câu hỏi 15
2.3.3 Thuật toán TNTN 16
2.3.4 Thuật toán lựa chọn câu hỏi 17
2.3.5 Ước lượng năng lực thí sinh 17
2.3.6 Thuật toán dừng 25
CHƯƠNG 3 XÂY DỰNG VÀ TRIỂN KHAI HỆ THỐNG 26
3.1 Phân tích chức năng của hệ thống TNTN 26
3.1.1 Biểu đồ đặc tả chức năng của thí sinh 26
3.1.2 Biểu đồ đặc tả chức năng của giáo viên 27
3.1.3 Biểu đồ đặc tả chức năng của hệ thống 28
3.2 Biểu đồ use case của hệ thống TNTN 28
3.2.1 Các tác nhân của hệ thống 28
3.2.2 Use case thí sinh 28
3.2.3 Use case giáo viên 29
3.3 Biểu đồ trạng thái của hệ thống TNTN 29
3.3.1 Biểu đồ trạng thái của giáo viên 29
3.3.2 Biểu đồ trạng thái của thí sinh 30
3.3.3 Biểu đồ trạng thái của hệ thống 31
3.4 Biểu đồ tuần tự của hệ thống TNTN 32
3.5 Biểu đồ hoạt động của hệ thống TNTN 33
3.5.1 Biểu đồ hoạt động của thí sinh 33
3.5.2 Biểu đồ hoạt động của giáo viên 34
3.5.3 Biểu đồ hoạt động của hệ thống 35
3.6 Thiết kế cơ sở dữ liệu 36
3.7 Triển khai hệ thống TNTN 36
3.8 Đánh giá hệ thống TNTN 37
TÀI LIỆU THAM KHẢO 42 PHỤ LỤC
QUYẾT ĐỊNH GIAO ĐỀ TÀI
BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN
Trang 7DANH MỤC CÁC CHỮ VIẾT TẮT
TNTN Trắc nghiệm thích nghi TNKQ Trắc nghiệm khách quan CSDL Cơ sở dữ liệu
NHCH Ngân hàng câu hỏi
Trang 8DANH MỤC CÁC KÝ HIỆU
a Độ phân biệt câu hỏi
b Độ khó câu hỏi P(i) Xác suất trả lời đúng câu hỏi thứ i
θ Năng lực thí sinh
Trang 93.1 Bộ câu hỏi ước lượng tham số theo IRT 2 tham số 37 3.2 Kết quả đánh giá năng lực của thí sinh 40
Trang 10DANH MỤC CÁC HÌNH
Trang 11DANH MỤC CÁC BIỂU ĐỒ
Số hiệu
Biểu đồ 3.1 Biểu đồ biểu diễn lựa chọn câu hỏi cho thí sinh có θ=
Biểu đồ 3.2 Biểu đồ biểu diễn lựa chọn câu hỏi cho thí sinh có θ=
Trang 12MỞ ĐẦU
1 Lý do chọn đề tài
Đánh giá kết quả học tập là một khâu quan trọng trong quá trình đào tạo, là một trong những yếu tố quyết định chất lượng giáo dục Các phương pháp đánh giá truyền thống như: vấn đáp, tự luận, … thường mất nhiều thời gian, khó chính xác và không khách quan Để khắc phục những hạn chế trên thì kiểm tra bằng hình thức trắc nghiệm
đã được đề xuất Nhờ vào đặc điểm luôn có sự rõ ràng của đáp án, tính khách quan trong đánh giá kết quả học tập của người học mà hình thức đánh giá này đã được áp dụng ở hầu khắp hệ thống giáo dục trên thế giới
Một trong những hệ thống trắc nghiệm đang được sử dụng phổ biến là trắc nghiệm khách quan (Objective test) [4] Tuy nhiên mô hình trắc nghiệm này vẫn chưa thực sự đưa ra kết quả đúng đắn hoặc công bằng do một số nguyên nhân: bộ câu hỏi trong một bài kiểm tra được lựa chọn một cách ngẫu nhiên nên sẽ có bài kiểm tra quá khó hoặc quá dễ, điều này dẫn đến gây nhàm chán cho thí sinh khi làm toàn câu hỏi dễ hoặc gây ức chế nếu gặp phải câu hỏi quá khó Để quá trình đánh giá mức năng lực của thí sinh được chính xác và khách quan hơn, một mô hình trắc nghiệm đã và đang được nghiên cứu hiện nay là trắc nghiệm thích nghi (TNTN) đặc biệt là mô hình thích nghi trên máy tính (Computerized Adaptive Testing - CAT) [14] Mô hình này cho phép lựa chọn câu hỏi tiếp theo phù hợp với mức kiến thức và năng lực hiện tại của thí sinh Hệ thống TNTN trên máy tính cho phép tự động đánh giá mỗi thí sinh với tập hợp câu hỏi trắc nghiệm là khác nhau về số lượng và nội dung câu hỏi Năng lực thí sinh được cập nhật thường xuyên trong quá trình đánh giá, và quá trình đánh giá sẽ kết thúc khi đưa ra được chính xác mức kiến thức và năng lực thực sự của thí sinh
Ngày nay, với sự phát triển vượt bậc của khoa học máy tính nên vấn đề triển khai các hệ thống TNTN dựa trên cơ sở các mô hình toán học là hoàn toàn khả thi Một số
mô hình TNTN đã được nghiên cứu và hiện thực hóa như: mô hình TNTN trên cơ sở
lý thuyết đáp ứng câu hỏi [19], mô hình TNTN trên cơ sở [15], … Tuy nhiên các mô hình TNTN kể trên vẫn còn tồn tại một số nhược điểm
2 Mục đích và ý nghĩa đề tài
a Mục đích
Xây dựng mô hình TNTN trên cơ sở mạng Bayes
Xây dựng hệ thống TNTN dựa trên mô hình đề xuất và triển khai ứng dụng cho việc đánh giá kiến thức và kỹ năng của sinh viên ở Trường ĐH Sư phạm Kỹ thuật Vĩnh Long đối với học phần Lập trình Web
b Ý nghĩa khoa học
Xây dựng mô hình TNTN ứng dụng mạng Bayes
Trang 13Xây dựng mô hình TNTN trên cơ sở mạng Bayes;
Hiện thực hóa hệ thống Website đánh giá dựa trên mô hình đề xuất
b Nhiệm vụ
Đưa ra vấn đề và phân tích vấn đề;
Phát biểu, phân tích và xây dựng mô hình TNTN để giải quyết bài toán đặt ra; Triển khai thực tế và đánh giá kết quả đạt được của hệ thống
4 Đối tượng và phạm vi nghiên cứu
a Đối tượng nghiên cứu
Các mô hình và thuật toán TNTN;
Xây dựng Website TNTN trên cơ sở mô hình đề xuất;
Triển khai và đánh giá hệ thống
Trang 146 Kết quả dự kiến
a Kết quả của đề tài
Xây dựng mô hình TNTN trên cơ sở mạng Bayes và Lý thuyết đáp ứng câu hỏi; Hiện thực hóa hệ thống TNTN trên cơ sở mô hình đề xuất và triển khai thực tế đối với học phần Lập trình Web tại Trường Đại học Sư phạm Kỹ thuật Vĩnh Long
b Hướng phát triển của đề tài
Tối ưu hóa mô hình TNTN đề xuất;
Hoàn thiện hệ thống TNTN
Trang 15CHƯƠNG 1 CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN
Chương này giới thiệu tổng quan về TNTN, các thành phần cơ bản, hoạt động chung của một mô hình TNTN; Phân tích các mô hình TNTN đã tồn tại, từ đó đưa ra lý
do để xây dựng TNTN trên cơ sở mạng Bayes
1.1 Tổng quan về trắc nghiệm thích nghi
1.1.1 Khái niệm trắc nghiệm thích nghi
Trắc nghiệm thích nghi (TNTN), tiếng Anh gọi là “Adaptive Test” là thuật ngữ để chỉ một phương pháp đánh giá thí sinh bằng hình thức kiểm tra trắc nghiệm nhưng đánh giá theo hướng năng lực của thí sinh bằng bộ câu hỏi tương ứng với mức năng lực
đó
Hệ thống trắc nghiệm thích nghi trên máy tính (CAT-Computerized Adaptive Testing) là phần mềm quản lý tự động với những câu hỏi có độ khó phù hợp với thí sinh dựa trên năng lực hiện thời của thí sinh Trái ngược với trắc nghiệm khách quan trên máy tính - hệ thống đưa ra bộ các câu hỏi theo trình tự đã được xác định trước hoặc ngẫu nhiên, hệ thống CAT đưa ra câu hỏi thích ứng với thí sinh Nếu thí sinh trả lời chính xác một câu hỏi thì câu hỏi trắc nghiệm tiếp theo khó hơn câu hỏi hiện thời
Do đó, nếu thí sinh trả lời sai câu hỏi hiện thời thì câu hỏi tiếp theo sẽ dễ hơn Vì vậy, những sinh viên khác nhau sẽ nhận được các tập các câu hỏi trắc nghiệm khác nhau dựa trên câu trả lời của họ về các câu hỏi
Quy trình đánh giá với khả năng thích nghi có các ưu điểm sau:
- Quy trình đánh giá trở nên động và riêng rẽ, vì nó được thích ứng với mỗi sự thực hiện của thí sinh
- Tránh được việc thí sinh phải làm bài thi trên những câu hỏi không phù hợp với năng lực của mình
- Số lượng các câu hỏi đã yêu cầu để ước lượng mức hiểu biết của thí sinh là giảm đi đáng kể, kết quả dẫn tới quy trình đánh giá bớt nhàm chán
1.1.2 Lịch sử TNTN
TNTN đã xuất hiện từ rất lâu và được ứng dụng nhiều trong thực tế cuộc sống như trắc nghiệm thông minh, trắc nghiệm tâm lý, Elearing, … Ý tưởng ban đầu của TNTN là của nhà Tâm lý học người Pháp Alfred Binet (1859- 1911) Năm 1905, ông
đã phát triển một thử nghiệm tư duy trên trẻ em Các thử nghiệm đối với nhiều độ tuổi khác nhau với những bộ câu hỏi phù hợp cho từng lứa tuổi Từ những thông tin của mỗi đợt kiểm tra, ông đưa đưa ra kết luận năng lực cho từng ứng viên Phương pháp của Binet là đơn giản và có thể thực hiện bằng máy vi tính
Năm 1980, Lord đưa ra phương pháp đánh giá có tên là Flexilevel Sau đó có một
số biến thể của phương pháp này như phương pháp Step của Henning (1987), phương
Trang 16pháp Testle của Lewis và Sheehan (1990) Những phương pháp này là sự sàng lọc từ phương pháp của Binet Các câu hỏi được phân loại theo cấp độ độ khó khác nhau, mỗi cấp độ gồm nhiều câu hỏi Việc đánh giá sau đó sẽ được tiến hành với một bộ các câu hỏi thuộc một cấp nào đó tùy thuộc vào tỷ lệ thành công của mỗi cấp độ mà quyết định
di chuyển lên hay xuống một cấp Sau khi thực hiện một số tập con, có thể ước lượng được khả năng thực sự của một số thí sinh Với tốc độ phát triển chóng mặt của máy tính điện tử thì ngày nay các hệ thống TNTN đã trở nên phổ biến và giúp cho việc đánh giá năng lực (kiến thức) thí sinh ngày càng trở nên chính xác và hiệu quả hơn Một số thử nghiệm đã được công nhận như: Graduate Record Test, Graduate Management Admission Test, Scholastic Aptitude Test, …
1.2 Các thành phần của mô hình TNTN
Về cơ bản, mô hình TNTN có các thành phần: ngân hàng câu hỏi (Calibrated item bank), thuật toán lựa chọn câu hỏi (Item selection algorithm), thuật toán đánh giá (Scoring algorithm) và điều kiện dừng (Termination criterion) [7], [13], [14] Tuy nhiên, các thành phần này có những điểm khác so với trắc nghiệm khách quan
1.2.1 Ngân hàng câu hỏi
Là tập hợp câu hỏi đã được ước lượng các tham số đặc trưng như độ khó, độ phân biệt Ngân hàng câu hỏi được sử dụng để làm cơ sở đánh giá năng lực thí sinh Do đó, ngân hàng câu hỏi tốt đòi hỏi phải có số lượng tương đối lớn và phong phú
1.2.2 Thuật toán lựa chọn câu hỏi
Việc đánh giá năng lực của thí sinh trong TNTN phụ thuộc rất lớn vào thuật toán lựa chọn câu hỏi Nếu câu hỏi được chọn quá dễ so với năng lực hiện tại của thí sinh thì thí sinh có thể dễ dàng trả lời và ngược lại Điều này dễ dẫn tới việc đánh giá năng lực thí sinh không chính xác Thuật toán này được sử dụng để lựa chọn câu hỏi tốt nhất từ ngân hàng câu hỏi để đưa vào bài kiểm tra Câu hỏi được cho là tốt nhất là câu phù hợp nhất với năng lực hiện tại của thí sinh, nghĩa là câu hỏi hỏi này có các tham số câu hỏi tương ứng với tham số năng lực hiện tại của thí sinh
Thuật toán lựa chọn câu hỏi gồm các bước sau:
- Dựa trên tham số năng lực hiện tại, tính toán giá trị của hàm thông tin cho các câu hỏi chưa đưa ra cho thí sinh trả lời;
- Tìm và chọn câu hỏi phù hợp nhất với năng lực hiện tại của thí sinh (câu hỏi có hàm thông tin lớn nhất)
1.2.3 Đánh giá năng lực của thí sinh
Sau khi nhận kết quả trả lời câu hỏi của thí sinh, hệ thống sẽ tính toán lại mức năng lực của thí sinh Việc tính toán này sẽ đưa ra giá trị mới cho tham số năng lực Thông thường giá trị này không thay đổi nhiều so với lần đánh giá trước đó và sẽ tiến dần đến mức năng lực thực sự của thí sinh
Trang 171.2.4 Điều kiện dừng
Vì mô hình TNTN hoạt động theo thuật toán lặp các thao tác lựa chọn câu hỏi, thí sinh trả lời, đánh giá năng lực nên cần có điều kiện dừng để làm căn cứ kết thúc quá trình trắc nghiệm Điều kiện dừng có thể là một hoặc một số tiêu chí như: độ sai lệch năng lực thấp, thời gian làm bài vượt quá thời gian quy định, số lượng câu hỏi vượt quá mức quy định, …
1.3 Hoạt động của mô hình TNTN
Hình 1.1 Mô hình hoạt động của hệ thống TNTN
Hoạt động chung của mô hình TNTN là một thuật toán lặp gồm các bước sau:
- Bước 1: Khởi tạo giá trị mức năng lực ban đầu của thí sinh
- Bước 2: Dựa vào mức năng lực hiện tại của thí sinh, lựa chọn câu hỏi phù hợp nhất từ các câu hỏi chưa được chọn
- Bước 3: Tính toán lại mức năng lực mới dựa vào kết quả trả lời câu hỏi của thí sinh
- Bước 4: Quay lại bước 2 nếu điều kiện dừng chưa thỏa mãn
Bắt đầu
Khởi tạo mức năng lực
Lựa chọn câu hỏi phù hợp
Đánh giá lại mức năng lực
Điều kiện dừng
Sai Đúng
Báo cáo kết quả mức năng lực
Kết thúc
Trang 18Trong mô hình TNTN, thuật toán lựa chọn câu hỏi tiếp theo phù hợp với năng lực hiện tại của thí sinh là khó khăn vì phải được tính toán một cách phức tạp Ngày nay với sự phát triển của khoa học máy tính thì vấn đề trên đã được giải quyết một cách tốt hơn, giúp hệ thống đánh giá năng lực của thí sinh một cách chính xác, nhanh chóng và giảm bớt thời gian cũng như chi phí của quá trình đánh giá
Thuật toán lựa chọn câu hỏi theo tiêu chuẩn thông tin tối đa (MI) [12] là thuật
toán phổ biến được sử dụng trong các mô hình TNTN Câu hỏi thứ n+1 được
lựa chọn cho thí sinh là câu hỏi cung cấp thông tin tối đa cho phép ước lượng khả năng của thí sinh ( n) dựa trên n câu hỏi trước đó mà thí sinh đã trả lời Thuật toán lựa chọn câu hỏi theo thông tin toàn cục (KL) là thuật toán lựa chọn câu hỏi dựa trên phương pháp thông tin tổng thể được đề xuất bởi Chang and Ying (1996) [11] Thuật toán này sử dụng độ đo Kullback-Leibler
để tính toán ước lượng trong việc lựa chọn câu hỏi
Thuật toán lựa chọn câu hỏi dựa trên sự phân tích tiên đoán theo tiêu chí tối
đa thông tin (MEI) là thuật toán lựa chọn câu hỏi dựa trên việc phân tích tiên đoán các tiêu chí tối đa thông tin dự kiến được đề xuất bởi van der Linden (1998) [19]
Thuật toán MI, KL và MEI sẽ dừng khi tiêu chuẩn lỗi (SE) đủ nhỏ Khi đó có thể nói đã xác định được mức năng lực của thí sinh
Bảng 1.1 Bảng đánh giá các thuật toán lựa chọn MI, KL và MEI (+: có, -: không)
Thuật toán lựa
chọn câu hỏi
Đánh giá thông số câu hỏi
Khả năng thích ứng liên tục với tham số năng lực
Số câu hỏi để xác định tiêu chuẩn lỗi (SE)
Thời gian tính toán hàm thông tin
Phân tích các mô hình TNTN sử dụng các thuật toán lựa chọn câu hỏi kể trên không tính toán đến thông số của câu hỏi sẽ ảnh hưởng như thế nào đến việc lựa chọn
Trang 19(ví dụ như độ khó của câu hỏi), không có khả năng thích ứng liên tục với tham số năng lực của thí sinh Ngoài ra, khi tiêu chuẩn lỗi được đặt cố định ở mức thấp đòi hỏi phải cần nhiều câu hỏi cho bài kiểm tra và thời gian tính toán hàm thông tin phụ thuộc nhiều vào ngân hàng câu hỏi Từ phân tích trên thì các mô hình và hệ thống TNTN hiện có còn tồn tại nhiều hạn chế, vì vậy nên định hướng và nghiên cứu đề tài: “Ứng dụng mạng Bayes xây dựng mô hình trắc nghiệm thích nghi” là cần thiết để khắc phục các tồn tại nêu trên
Trang 20CHƯƠNG 2 XÂY DỰNG MÔ HÌNH TRẮC NGHIỆM
đồ thị của mạng Cấu trúc đồ thị của một mạng Bayes dẫn tới các mô hình dễ giải thích
và tới các thuật toán học và suy luận hiệu quả Các nút có thể đại diện cho đủ loại biến, một tham số đo được, một biến ẩn (latent variable) hay một giả thuyết chứ không nhất thiết phải đại diện cho các biến ngẫu nhiên
2.1.2 Định nghĩa mạng Bayes
Một mạng Bayes là một đồ thị có hướng phi chu trình mà trong đó:
Các nút biểu diễn các biến;
Các cung biểu diễn các quan hệ phụ thuộc thống kê giữa các biến và phân phối xác suất địa phương cho mỗi giá trị nếu cho trước giá trị của các cha của
nó
Nếu có một cung từ nút A tới nút B, thì biến B phụ thuộc trực tiếp vào biến A, và
A được gọi là cha của B Nếu với mỗi biến trong mạng là Xi, i ∈{1, ,N} và Pa(Xi) là tập hợp các biến cha của nút Xi thì phân phối xác suất có điều kiện phụ thuộc của các biến là tích của các phân phối xác suất địa phương
Với mỗi biến, sự phân phối có điều kiện {P(X i | Pa(X i )), i=1, …, n} Nếu X i
không có cha, ta nói rằng phân phối xác suất địa phương của nó là không có
Trang 21điều kiện, ngược lại, nó là có điều kiện Nếu biến được biểu diễn bởi một nút được quan sát, thì ta nói rằng nút đó là một nút hiển nhiên (evidence node) Các câu hỏi về sự phụ thuộc không tương đẳng giữa các biến có thể được trả lời bằng cách nghiên cứu đồ thị Có thể chứng minh rằng trong đồ thị, tính độc lập có điều kiện được biểu diễn bởi tính chất đồ thị: cho trước một số nút hiển nhiên cụ thể, các nút
X và Y là d-separated (d-tách rời) trong đồ thị khi và chỉ khi các biến và Y là độc lập, biết trước các biến hiển nhiên tương ứng Tập hợp gồm tất cả các nút khác mà X có thể phụ thuộc trực tiếp được cho bởi Markov blanket của X
Một ưu điểm của mạng Bayes là về mặt trực quan, con người có thể hiểu các quan
hệ phụ thuộc trực tiếp và các phân phối địa phương dễ dàng hơn là phân phối có điều
kiện phụ thuộc hoàn chỉnh
2.1.3 Mạng Bayes nhân quả
Một mạng Bayes nhân quả là một mạng Bayes mà trong đó các cung có hướng của đồ thị được hiểu là các quan hệ nhân quả trong một miền xác định có thực nào đó Các cung có hướng không nhất thiết phải được hiểu là các quan hệ nhân quả; Tuy nhiên, trong thực tiễn, tri thức về các quan hệ nhân quả rất hay được dùng để hướng dẫn vẽ các đồ thị mạng Bayes, kết quả là có được các mạng Bayes nhân quả
2.1.4 Học cấu trúc
Trong trường hợp đơn giản nhất, một mạng Bayes được xây dựng bởi một chuyên gia và rồi được dùng để thực hiện việc suy luận Trong các ứng dụng khác, công việc xây dựng mạng quá phức tạp đối với con người Trong trường hợp này, cấu trúc và các tham số mạng của các phân bố địa phương phải được học từ dữ liệu
Học cấu trúc của một mạng Bayes (nghĩa là học đồ thị) là một phần rất quan trọng của ngành học máy Giả thiết rằng dữ liệu được sinh từ một mạng Bayes và tất cả các biến là thấy được trong mọi lần lặp, việc tối ưu hóa dựa trên phương pháp tìm kiếm có thể được dùng để tìm cấu trúc mạng Việc này đòi hỏi một hàm tính điểm (scoring function) và một chiến lược tìm kiếm Một hàm tính điểm thông dụng là xác suất hậu nghiệm (posterior probability) của cấu trúc khi cho trước dữ liệu huấn luyện Quá trình tìm kiếm duyệt toàn bộ để trả về một cấu trúc có số điểm tối ưu đòi hỏi thời gian cấp siêu lũy thừa (superexponential) theo số lượng biến Một chiến lược tìm kiếm địa phương thực hiện các thay đổi tăng dần hướng tới việc nâng cao điểm số của cấu trúc Một thuật toán tìm kiếm toàn cục như Phương pháp Monte Carlo xích Markov (Markov chain Monte Carlo) có thể tránh việc bị bẫy trong một cực tiểu địa phương
2.1.5 Học tham số
Để cụ thể hóa mạng Bayes và biểu diễn đầy đủ các phân bố xác suất phụ thuộc có điều kiện, đối với mỗi biến X, cần phải chỉ ra phân bố xác suất X theo các cha của X Phân bố của X theo các cha của nó có thể có hình thức bất kỳ Người ta thường dùng
Trang 22các phân bố rời rạc hay phân bố Gauss, do các phân bố này làm đơn giản việc tính toán Đôi khi chỉ biết được các ràng buộc của các phân số người ta có thể dùng nguyên
lý entropy cực đại để xác định một phân bố đơn, phân bố với entropy cực đại thỏa mãn các ràng buộc đó Tương tự, trong ngữ cảnh cụ thể của một mạng Bayes động, người ta thường lấy phân bố có điều kiện cho sự phát triển theo thời gian của trạng thái ẩn để cực đại hóa hệ số entropy (entropy rate) của quá trình ngẫu nhiên được nói đến
Thông thường, các phân bố có điều kiện này bao gồm các tham số chưa biết và phải được ước lượng từ dữ liệu, đôi khi bằng cách tiếp cận khả năng cực đại (maximum likelihood) Việc cực đại hóa trực tiếp khả năng (hay xác suất hậu nghiệm) thường phức tạp khi có các biến không được quan sát Một cách tiếp cận truyền thống đối với vấn đề này là thuật toán cực đại hóa kỳ vọng (expectation-maximization algorithm), thuật toán này luân phiên giữa việc tính toán các giá trị mong đợi của các biến không được quan sát theo dữ liệu quan sát được, với việc cực đại hóa khả năng (hay hậu nghiệm) hoàn chỉnh với giả thuyết rằng các giá trị mong đợi đã tính được là đúng đắn Dưới các điều kiện chính quy và vừa phải, quá trình này hội tụ về các giá trị khả năng cực đại (hay hậu nghiệm cực đại) cho các tham số Một cách tiếp cận Bayes đầy đủ hơn đối với việc học tham số là coi các tham số như là các biến không quan sát được khác
và tính một phân bố hậu nghiệm đầy đủ trên toàn bộ các nút theo dữ liệu quan sát được, sau đó tách các tham số ra Cách tiếp cận này có thể có chi phí cao và dẫn đến các mô hình có số chiều
2.1.6 Suy luận trong mạng Bayes
Do mạng Bayes là một mô hình hoàn chỉnh cho các biến và các quan hệ giữa chúng, có thể dùng mạng Bayes để trả lời các truy vấn xác suất về các biến này Ví dụ, mạng Bayes có thể được dùng để tìm tri thức mới nhất về trạng thái của một tập con gồm các biến khi các biến khác (các biến hiển nhiên) được quan sát Quá trình tính phân bố hậu nghiệm này của các biến khi cho trước các biến hiển nhiên được gọi là suy luận xác suất Quá trình hậu nghiệm cho ra một thống kê đủ phổ quát (universal sufficient statistic) cho các ứng dụng phát hiện, khi người ta muốn chọn các giá trị cho một tập con các biến nhằm mục đích cực tiểu hóa một hàm phí tổn nào đó, chẳng hạn xác suất của lỗi quyết định Do đó, có thể coi mạng Bayes là một cơ chế cho việc xây dựng tự động các mở rộng của định lý Bayes cho các bài toán phức tạp hơn
Trang 232.2 Lý thuyết đáp ứng câu hỏi
2.2.1 Giới thiệu
Lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT) là một lý thuyết của khoa học về đo lường trong giáo dục Được Lord phát minh vào đầu những năm 1950
và phát triển mạnh mẽ cho đến ngày nay
Trước đó, Lý thuyết trắc nghiệm cổ điển (Clasical Test Theory – CTT) ra đời từ khoảng cuối thế kỷ 19 và hoàn thiện vào khoảng thập niên 1970, đã có nhiều đóng góp quan trọng cho hoạt động đánh giá trong giáo dục, nhưng cũng thể hiện một số hạn chế
Các nhà tâm trắc học đã xây dựng một lý thuyết hiện đại dựa trên mô hình toán học, đòi hỏi nhiều tính toán, nhưng nhờ sự tiến bộ vượt bậc của công nghệ tính toán bằng máy tính điện tử vào cuối thế kỷ 20 – đầu thế 20 kỷ 21 nên nó đã phát triển nhanh chóng và đạt được những thành tựu quan trọng trong quá trình đáng giá và kiểm định năng lực
Để đánh giá đối tượng nào đó, lý thuyết trắc nghiệm cổ điển tiếp cận ở cấp độ một đề kiểm tra còn lý thuyết trắc nghiệm hiện đại tiếp cận ở cấp độ từng câu hỏi, do
đó lý thuyết này thường được gọi là “Lý thuyết ứng đáp câu hỏi”
IRT xây dựng mô hình tính toán để xử lý dữ liệu dựa trên việc nghiên cứu mọi cặp tương tác giữa “Thí sinh” và “Câu hỏi” khi triển khai một bài thi trắc nghiệm Mỗi thí sinh đứng trước một câu hỏi sẽ trả lời như thế nào, điều đó phụ thuộc vào năng lực của thí sinh và một số đặc trưng của câu hỏi Thông thường có 3 tham số đặc trưng cho một câu hỏi đó là: độ khó, độ phân biệt và độ dự đoán Trong đó, độ khó là tham số quan trọng nhất thể hiện độ lệch của câu hỏi so với trình độ của thí sinh, tham số độ phân biệt nhằm mục đích phân biệt sự đáp ứng như thế nào giữa các thí sinh có trình độ khác nhau với câu hỏi và độ dự đoán là tham số chỉ định tỷ lệ dự đoán của thí sinh khi đứng trước một câu hỏi
Hiện nay có 3 mô hình tính toán phổ biến trong IRT, các mô hình này được phân loại theo số tham số đặc trưng mà nó sử dụng Mô hình 1 tham số (Rasch) chỉ xét đến
độ khó của câu hỏi, mô hình 2 tham số (Birnbaum) xét thêm độ phân biệt của câu hỏi
và mô hình 3 tham số xét thêm mức dự đoán của thí sinh khi trả lời câu hỏi
2.2.2 Mô hình IRT 2 tham số
Trong mô hình IRT 2 tham số được sử dụng các tham số độ khó (b) và độ phân
biệt (a) Khi đó xác suất trả lời đúng câu hỏi thứ i của thí sinh j được tính theo công
Trang 24u i= 0 trong trường hợp ngược lại);
a i , b i là tập hợp các tham số của câu hỏi i: độ phân biệt, độ khó của câu hỏi i;
θ j là mức năng lực hiện tại của thí sinh j
Lựa chọn câu hỏi phù hợp với mức năng lực hiện tại của thí sinh là rất quan trọng Nếu câu hỏi đưa ra là quá khó hay quá dễ đối với thí sinh thì sẽ mang lại ít thông tin về mức năng lực thí sinh Để đánh giá được chính xác mức năng lực thí sinh cần thiết phải đưa ra câu hỏi với bộ tham số mang lại thông tin tối đa trong việc đánh giá mức năng lực thí sinh
Theo Birnbaum, mỗi câu hỏi trắc nghiệm cung cấp một lượng thông tin nào đó về
mức năng lực của thí sinh Birnbaum đề xuất hàm thông tin I i (θ) của câu hỏi i được
tính toán phụ thuộc vào năng lực θcủa thí sinh theo công thức sau:
𝐼𝑖(𝜃) = (𝑝𝑖′(𝑢𝑘=1|𝜃,𝑎𝑖,𝑏𝑖))
2
𝑝𝑖(𝑢𝑘=1|𝜃,𝑎𝑖,𝑏𝑖)(1−𝑝𝑖(𝑢𝑘=1|𝜃,𝑎𝑖,𝑏𝑖)) (1.2)
Trong đó:
p i (u k = 1|θ, a i , b i ) là xác suất trả lời đúng câu hỏi i với tập hợp tham số a i , b i ;
p i ’ (u k = 1|θ, a i , b i ) là đạo hàm bậc nhất của xác suất trả lời đúng câu hỏi i
theo mức năng lực
Như vậy, giá trị hàm thông tin I i (θ) được tính cho tập hợp các câu hỏi chưa đưa ra
cho thí sinh Phương pháp phổ biến nhất trong việc lựa chọn câu hỏi tiếp theo phù hợp với mức năng lực hiện tại của thí sinh là sử dụng hàm thông tin lớn nhất
Sau khi trả lời mỗi câu hỏi thì vấn đề đặt ra là làm sao đánh giá lại mức năng lực của thí sinh vì giá trị mức năng lực mới này sẽ được sử dụng để lựa chọn câu hỏi tiếp theo phù hợp với thí sinh Sử dụng phương pháp Maximum likelihood [17] để đánh giá mức năng lực của thí sinh sau mỗi câu trả lời, tức là tìm một giá trị mức năng lực mà hàm sau đây là tối đa:
u 1 , u 2 , …, u n là tập hợp câu trả lời của thí sinh đối với các câu hỏi đã đưa ra;
p i (u, θ) là xác suất trả lời đúng câu hỏi i của thí sinh có mức năng lực θ, được
tính theo công thức (1.1)
Trắc nghiệm được bắt đầu với mức năng lực của thí sinh là θ s, từ công thức (1.3)
có thể tiến hành đánh giá lại mức năng lực thí sinh là θ s+1 sau khi trả lời một câu hỏi theo công thức sau:
Trang 25𝜃𝑠+1= 𝜃𝑠+∑𝑖𝜖𝑛𝑆𝑖 (𝜃 𝑠 )
Trong đó:
n là tập hợp bộ câu hỏi thí sinh đã trả lời;
S i (θ s ) được tính theo công thức:
𝑆𝑖(𝜃𝑠) =(𝑢𝑖 −𝑝𝑖(𝑢𝑖=1|𝜃𝑠,𝑎𝑖,𝑏𝑖)).𝑝𝑖′ (𝑢𝑖=1|𝜃𝑠,𝑎𝑖,𝑏𝑖)
𝑝𝑖(𝑢𝑖=1|𝜃 𝑠 ,𝑎𝑖,𝑏𝑖)(1−𝑝𝑖(𝑢𝑖=1|𝜃 𝑠 ,𝑎𝑖,𝑏𝑖)) (1.5)
Với p i (u i = 1|θ s , a i , b i ) và p i ’ (u i = 1|θ s , a i , b i ) là xác suất trả lời đúng câu hỏi i
và đạo hàm bậc nhất tương ứng của xác suất đó
I i (θ s ) là hàm thông tin của câu hỏi i được tính theo công thức (1.2)
Quá trình trắc nghiệm đánh giá mức năng lực của mỗi thí sinh kết thúc khi đã đưa
ra được chính xác mức năng lực của thí sinh đó Trong quá trình trắc nghiệm thích nghi theo mô hình đề xuất, sau mỗi câu trả lời mức năng lực thí sinh sẽ được đánh giá lại Nếu sự chênh lệch mức năng lực thí sinh giữa hai lần đánh giá liên tiếp là rất nhỏ thì có thể xem đó là kết quả đánh giá cuối cùng về mức năng lực thí sinh Bởi vì nếu thí sinh
có trả lời thêm các câu hỏi nữa thì mức năng lực thí sinh gần như không đổi và đó cũng chính là kết quả đánh giá mức năng lực cuối cùng của thí sinh
2.3 Xây dựng mô hình TNTN dựa trên mạng Bayes kết hợp IRT 2 tham số
2.3.1 Mô hình TNTN
Một mô hình tổng thể TNTN cần có các thành phần sau:
Ngân hàng câu hỏi (Item banking)
Các thuật toán: Khởi tạo, lựa chọn câu hỏi, đánh giá kết quả, tính toán, dừng
và báo cáo
Hình 2.1 Mô hình TNTN
Module lựa chọn câu
hỏi tiếp theo
Module quản lý câu hỏi
Module đánh giá năng lực thí sinh
Ngân hàng câu hỏi
θs
θf
Thuật toán TNTN
Trang 262.3.2 Ngân hàng câu hỏi
Ngân hàng câu hỏi (NHCH) là nơi chứa toàn bộ các câu hỏi cho quá trình đánh giá thích nghi NHCH nằm ở trung tâm của tất cả các hệ thống TNTN Các NHCH là một tập hợp tổ chức các câu hỏi, chỉ có một số trong đó sẽ được trình bày cho bất kỳ
cá nhân thí sinh trong quá trình kiểm tra của mình Các tính chất quan trọng của một NHCH bao gồm kích thước, thành phần, cấu trúc và tính chất của mô hình đáp ứng đầy đủ các tính chất của TNTN NHCH gồm nhiều môn học và mỗi môn học có một
số lượng câu hỏi nhất định để thực hiện đánh giá thích nghi hiệu quả cho môn học đó Tại mỗi thời điểm, thí sinh chỉ được phép đánh giá trên một môn học Ngoài ra mỗi câu hỏi cần phải được ước lượng các tham số đặc trưng như độ khó, độ phân biệt theo quy ước của mô hình IRT 3 tham số Các tham số này là cơ sở tính toán mối tương quan giữa câu hỏi và thí sinh Tức là, câu hỏi thuộc mức quá dễ, dễ, bình thường, khó hay quá khó đối với thí sinh TNTN sẽ lựa chọn câu hỏi được cho là phù hợp nhất
Trang 27Khởi tạo mức năng lực θ
Lựa chọn câu hỏi
phù hợp Max(I i (θ))
Điều kiện dừng
Đánh giá lại mức năng lực θ
Trang 28Năng lực mới của thí sinh sau khi được đánh giá
Hoạt động thuật toán
Bước 1: Khởi tạo mức năng lực ban đầu cho thí sinh
Bước 2: Đánh giá tập câu hỏi chưa đưa ra cho thí sinh: tính hàm thông tin của
các câu hỏi này dựa trên mức năng hiện tại của thí sinh
Bước 3: Lựa chọn và đưa ra câu hỏi phù hợp nhất với mức năng lực hiện tại
của thí sinh
Bước 4: Đánh giá lại năng lực thí sinh trên cơ sở kết quả trả lời câu hỏi đưa
ra
Bước 5: Lặp lại từ Bước 2 cho đến khi gặp điều kiện dừng
2.3.4 Thuật toán lựa chọn câu hỏi
Trong TNTN, thuật toán lựa chọn câu hỏi là thuật toán quan trọng Thuật toán này là một thuật toán con hoạt động bên trong thuật toán TNTN Thuật toán này giúp lựa chọn câu hỏi từ danh sách các câu hỏi chưa được chọn sao cho phù hợp nhất với năng lực hiện tại của thí sinh Thuật toán tiến hành duyệt tất cả cả câu hỏi chưa được chọn, tính toán hàm thông tin cho mỗi câu hỏi và lựa chọn câu hỏi có giá trị thông tin lớn nhất Theo lý thuyết IRT, câu hỏi có giá trị thông tin lớn nhất là câu phù hợp nhất với thí sinh đó Hàm thông tin sẽ được tính toán dựa trên công thức (1.2) Sau khi đã chọn được câu hỏi, thuật toán sẽ đánh dấu câu hỏi được chọn để không phải tính toán cho lần lựa chọn tiếp theo
Mô tả thuật toán lựa chọn câu hỏi:
Đầu vào:
Danh sách câu hỏi theo môn học và chưa được chọn trong bài thi, mỗi câu hỏi đã được ước lượng các tham số đặc trưng
Năng lực (kiến thức) hiện tại của thí sinh
Đầu ra: Câu hỏi được chọn từ ngân hàng câu hỏi
Hoạt động:
- Bước 1: Khởi tạo maxiníor := 0; //GTLN của thông tin câu hỏi
Bước 2: Duyệt danh sách được chọn Với câu hỏi thứ i thực hiện:
Bước 2.1: Tính toán hàm đặc trưng câu hỏi cho các danh sách câu hỏi theo
công thức (20)
Bước 2.2: Tính giá trị hàm thông tin câu hỏi
Bước 3: Ghi nhận câu hỏi và đánh dấu đã chọn
Bước 4: Kết thúc
2.3.5 Ước lượng năng lực thí sinh
Đối với hệ thống trắc nghiệm thích nghi thì viêc năng lực của thí sinh sẽ được đánh giá liên tục trong sau khi trả lời mỗi câu hỏi, đây là một thuật toán quan trọng trong hệ thống trắc nghiệm thích nghi Sau khi thí sinh trả lời mỗi câu hỏi, thuật toán
Trang 29con này thực thi để tính toán năng lực hiện tại của thí sinh
Kết quả tính toán này sẽ là tiền đề để hệ thống trắc nghiệm thích nghi lựa chọn câu hỏi tiếp theo phù hợp với năng lực thí sinh hoặc là đưa ra kết quả đánh giá năng lực cuối cùng của thí sinh và dừng đợt kiểm tra
Trong mạng Bayes, năng lực được tính từ xác suất thành công trung bình của tất
cả k câu hỏi:
𝜃 = ∑ 𝑃𝑘 𝑟(𝑋𝑖)
𝑖
𝑘
Trong đó, P r (X i ) là xác suất ước tính thành công của câu hỏi i sau khi trả lời r
Để giải quyết vấn đề này cần định nghĩa mô hình cấu trúc của mạng Bayes
a Để biểu diễn một khái niệm cơ bản ta sử dụng một biến ngẫu nhiên C với phân phối Bernoulli, có nghĩa là C có hai giá trị khác nhau: 1 nếu thí sinh hiểu khái niệm hoặc 0 nếu ngược lại Định luật xác suất của C sẽ là:
P(C=x) = px(1-p)1-xTrong đó: p là xác suất để thí sinh biết khái niệm C và x có thể nhận giá trị 0 hoặc 1
b Một chủ đề là một cặp (C, w), trong đó:
- C là một tập các khái niệm độc lập với nhau, C=(C 1 , C 2 , …, C n )
- w=(w1, w2, …, wn) là một vec tơ trọng số đo tầm quan trọng tương đối của mỗi khái niệm trong chủ đề đó Chúng ta giả định rằng:
Trang 30- a=(a1, a2, …, as là một vec tơ trọng số đo tầm quan trọng tương đối của mỗi chủ đề trong môn học đó Chúng ta giả định rằng:
∑𝑠 𝑎𝑖 = 1
𝑖=1
Theo định nghĩa, mỗi chủ đề bao gồm một tập các khái niệm độc lập nhau với trọng số tương ứng của chúng, nghĩa là cho mỗi i=1, …, s thì chủ đề Ti bao gồm một tập các khái niệm {𝐶𝑖𝑗, … , 𝐶𝑖𝑛𝑖} và vector trọng số 𝑤 = (𝑤𝑖𝑗, … , 𝑤𝑖𝑛𝑖 ) được xác định bởi biểu thức:
Time (days)
Bảng 2.2 Phân cấp chi tiết môn Mathematics
Subject Topics Weights Concepts Weights
Mathematics Calculus a1 = 0.5
Differentiation w12 = 0.25 Integration w13 = 0.25
Trang 31Applications w14 = 0.3
Trigonometry a2 = 0.3
Basic concepts w21 = 0.3 Trigonometric functions w22 = 0.3 Applications w23 = 0.4
Geometry a3 = 0.2 Basic concepts w31 = 0.4
Applications w32 = 0.6
Trọng số của một chủ đề (khái niệm) có thể được tính như số ngày kết hợp với số ngày liên quan đến môn học (chủ đề) mà nó thuộc về Do đó, ví dụ trọng số cho các khái niệm Function của chủ đề Calculus là 18/90 Bảng 2.2 cho thấy hệ thống phân cấp chi tiết được kết hợp với ví dụ này
Tuy nhiên, lưu ý rằng các tiêu chí khác có thể được sử dụng để đặt tầm quan trọng tương đối của mỗi chủ đề (khái niệm) trong môn học (chủ đề), chẳng hạn như tỷ lệ yêu cầu của câu hỏi trong kỳ thi hoặc bất kỳ ước tính chủ quan nào khác của giáo viên
2.3.5.2 Nút chứng cứ
Các nút này được sử dụng để thu thập thông tin liên quan đến trạng thái hiểu biết của thí sinh Trong mô hình của chúng ta, nguồn chứng cứ là tập hợp các bài kiểm tra liên quan đến các nút kiến thức Để biểu diễn một nút chứng cứ, chúng ta sử dụng một biến ngẫu nhiên P với sự phân phối Bernoulli, nghĩa là nó sẽ lấy giá trị 1 khi thí sinh chọn đúng câu trả lời và 0 khi ngược lại Định luật xác suất của P được đưa ra bởi:
P(P=x) = p x (1-p) 1-x 2.3.5.3 Mô hình mối quan hệ nhân quả
Sau khi xác định các nút, chúng ta xác định mối quan hệ nhân quả giữa chúng như sau: các mối quan hệ tập hợp giữa các nút kiến thức ở các mức độ chi tiết khác nhau và các mối quan hệ giữa các nút chứng cứ và nút kiến thức
a Mô hình các quan hệ tập hợp
Để thảo luận về các mối quan hệ này chúng ta sử dụng khái niệm KI (Knowledge Element) để chỉ một môn học, một chủ đề hay khái niệm Các quan hệ hợp hoặc một phần được thiết lập giữa KI và các KI mà nó chứa Ví dụ, mối quan hệ được thiết lập giữa một môn học và các chủ đề của nó
Giả sử I là một KI có thể được chia thành các KI con được ký hiệu bởi I1, …, In Mỗi KI sẽ được đại diện bởi một biến ngẫu nhiên nhị phân với hai giá trị: nắm vững hoặc không nắm vững Để mô hình hóa mối quan hệ nhân quả giữa chúng, chúng ta có hai phương án:
- Phương án 1: Chúng ta cho rằng việc hiểu biết các mục cụ thể hơn có ảnh hưởng nhân quả đến việc hiểu được mục tổng quát hơn