1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng mạng bayes xây dựng hệ thống trắc nghiệm thích nghi

62 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng mạng bayes xây dựng hệ thống trắc nghiệm thích nghi
Tác giả Trần Thị Tố Loan
Người hướng dẫn TS. Đặng Hoài Phương
Trường học Đại học Đà Nẵng
Chuyên ngành Khoa học máy tính
Thể loại Luận văn
Năm xuất bản 2017
Thành phố Đà Nẵng
Định dạng
Số trang 62
Dung lượng 2,94 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hệ thống trắc nghiệm thích nghi TNTN đã được nghiên cứu hiện thực hóa và ứng dụng rộng rải nhờ tính chính xác và khách quan trong quá trình đánh giá năng lực kiến thức của thí sinh Tuy nhiên những mô hình và hệ thống TNTN đã tồn tại vẫn còn một số nhược điểm nhất định Nghiên cứu này được đề xuất nhằm khắc phục mở rộng tính toán cho hệ thống TNTN có câu hỏi chứa nhiều tham số chọn lựa câu hỏi phù hợp với mức độ kiến thức hiện tại của thí sinh Luận văn đã khái quát về TNTN giới thiệu các hệ thống TNTN đã tồn tại Từ lý thuyết mạng Bayes lý thuyết đáp ứng câu hỏi tác giả đã thiết kế và xây dựng hệ thống TNTN Các phân tích đánh giá hệ thống cũng được giới thiệu trong luận văn Tác giả đã tóm tắt các kết quả đạt được và đưa ra hướng phát triển tiếp theo

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Trang 2

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: TS ĐẶNG HOÀI PHƯƠNG

Đà Nẵng - Năm 2017

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan đề tài “Ứng dụng mạng Bayes xây dựng hệ thống trắc nghiệm

thích nghi” này là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của TS

Đặng Hoài Phương

Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực

Tác giả

Trần Thị Tố Loan

Trang 4

TÓM TẮT LUẬN VĂN

ỨNG DỤNG MẠNG BAYES XÂY DỰNG HỆ THỐNG TRẮC NGHIỆM

THÍCH NGHI Trần Thị Tố Loan, học viên cao học khóa 31, chuyên ngành Khoa học máy tính, mã

số: 60.48.01, trường Đại học Bách Khoa - Đại học Đà Nẵng

Tóm tắt - Hệ thống trắc nghiệm thích nghi (TNTN) đã được nghiên cứu, hiện thực hóa

và ứng dụng rộng rải nhờ tính chính xác và khách quan trong quá trình đánh giá năng lực, kiến thức của thí sinh Tuy nhiên, những mô hình và hệ thống TNTN đã tồn tại vẫn còn một số nhược điểm nhất định Nghiên cứu này được đề xuất nhằm khắc phục, mở rộng tính toán cho hệ thống TNTN có câu hỏi chứa nhiều tham số, chọn lựa câu hỏi phù hợp với mức độ kiến thức hiện tại của thí sinh Luận văn đã khái quát về TNTN, giới thiệu các hệ thống TNTN đã tồn tại Từ lý thuyết mạng Bayes, lý thuyết đáp ứng câu hỏi tác giả đã thiết kế và xây dựng hệ thống TNTN Các phân tích đánh giá hệ thống cũng được giới thiệu trong luận văn Tác giả đã tóm tắt các kết quả đạt được và đưa ra hướng phát triển tiếp theo

Từ khóa – Trắc nghiệm thích nghi; mạng Bayes; lý thuyết đáp ứng câu hỏi; thuật toán

ước lượng năng lực

BAYESIAN NETWORK APPLICATIONS FOR BUILDING COMPUTERIZED

ADAPTIVE TESTING SYSTEMS Abstract - Computerized Adaptive Testing (CAT) has been research, actualize and

wide apply because of their accuracy and objective in process of testing ability and knowledge of the candidate However existing CAT system model still have some limitation This research was proposed inorder to resolve; expand the calculation ability of CAT sytem which have many parameters; select the suitable question depend

on candidate’s current knowledge level The thesis is generaly describle about CAT; introduce about existing CAT model From Bayesian Network theory; Item Response Theory adapt to question which designes and created the CAT system Among these, the fuzzy controller to optimized the calculation for the ability estimatation agrorithm

of student The review and analysis for te system also mention in the Thesis The author was summarize the successful result and given the improvement direction next step

Key words - Computerized Adaptive Testing; Bayesian Network; Item Response

Theory; the ability estimatation agrorithm of student

Trang 5

MỤC LỤC

LỜI CAM ĐOAN i

TÓM TẮT LUẬN VĂN ii

MỤC LỤC iii

DANH MỤC CÁC CHỮ VIẾT TẮT v

DANH MỤC CÁC KÝ HIỆU vi

DANH MỤC CÁC BẢNG vii

DANH MỤC CÁC HÌNH viii

DANH MỤC CÁC BIỂU ĐỒ ix

MỞ ĐẦU 1

1 Lý do chọn đề tài 1

2 Mục đích và ý nghĩa đề tài 1

3 Mục tiêu và nhiệm vụ 2

4 Đối tượng và phạm vi nghiên cứu 2

5 Phương pháp nghiên cứu 2

6 Kết quả dự kiến 3

CHƯƠNG 1 CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN 4

1.1 Tổng quan về trắc nghiệm thích nghi 4

1.1.1 Khái niệm trắc nghiệm thích nghi 4

1.1.2 Lịch sử TNTN 4

1.2 Các thành phần của mô hình TNTN 5

1.2.1 Ngân hàng câu hỏi 5

1.2.2 Thuật toán lựa chọn câu hỏi 5

1.2.3 Đánh giá năng lực của thí sinh 5

1.2.4 Điều kiện dừng 6

1.3 Hoạt động của mô hình TNTN 6

1.4 Phân tích các mô hình TNTN 7

CHƯƠNG 2 XÂY DỰNG MÔ HÌNH TRẮC NGHIỆM THÍCH NGHI 9

2.1 Lý thuyết mạng Bayes 9

2.1.1 Giới thiệu 9

2.1.2 Định nghĩa mạng Bayes 9

2.1.3 Mạng Bayes nhân quả 10

2.1.4 Học cấu trúc 10

2.1.5 Học tham số 10

2.1.6 Suy luận trong mạng Bayes 11

2.1.7 Ứng dụng 11

Trang 6

2.2 Lý thuyết đáp ứng câu hỏi 12

2.2.1 Giới thiệu 12

2.2.2 Mô hình IRT 2 tham số 12

2.3 Xây dựng mô hình TNTN dựa trên mạng Bayes kết hợp IRT 2 tham số 14

2.3.1 Mô hình TNTN 14

2.3.2 Ngân hàng câu hỏi 15

2.3.3 Thuật toán TNTN 16

2.3.4 Thuật toán lựa chọn câu hỏi 17

2.3.5 Ước lượng năng lực thí sinh 17

2.3.6 Thuật toán dừng 25

CHƯƠNG 3 XÂY DỰNG VÀ TRIỂN KHAI HỆ THỐNG 26

3.1 Phân tích chức năng của hệ thống TNTN 26

3.1.1 Biểu đồ đặc tả chức năng của thí sinh 26

3.1.2 Biểu đồ đặc tả chức năng của giáo viên 27

3.1.3 Biểu đồ đặc tả chức năng của hệ thống 28

3.2 Biểu đồ use case của hệ thống TNTN 28

3.2.1 Các tác nhân của hệ thống 28

3.2.2 Use case thí sinh 28

3.2.3 Use case giáo viên 29

3.3 Biểu đồ trạng thái của hệ thống TNTN 29

3.3.1 Biểu đồ trạng thái của giáo viên 29

3.3.2 Biểu đồ trạng thái của thí sinh 30

3.3.3 Biểu đồ trạng thái của hệ thống 31

3.4 Biểu đồ tuần tự của hệ thống TNTN 32

3.5 Biểu đồ hoạt động của hệ thống TNTN 33

3.5.1 Biểu đồ hoạt động của thí sinh 33

3.5.2 Biểu đồ hoạt động của giáo viên 34

3.5.3 Biểu đồ hoạt động của hệ thống 35

3.6 Thiết kế cơ sở dữ liệu 36

3.7 Triển khai hệ thống TNTN 36

3.8 Đánh giá hệ thống TNTN 37

TÀI LIỆU THAM KHẢO 42 PHỤ LỤC

QUYẾT ĐỊNH GIAO ĐỀ TÀI

BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN

Trang 7

DANH MỤC CÁC CHỮ VIẾT TẮT

TNTN Trắc nghiệm thích nghi TNKQ Trắc nghiệm khách quan CSDL Cơ sở dữ liệu

NHCH Ngân hàng câu hỏi

Trang 8

DANH MỤC CÁC KÝ HIỆU

a Độ phân biệt câu hỏi

b Độ khó câu hỏi P(i) Xác suất trả lời đúng câu hỏi thứ i

θ Năng lực thí sinh

Trang 9

3.1 Bộ câu hỏi ước lượng tham số theo IRT 2 tham số 37 3.2 Kết quả đánh giá năng lực của thí sinh 40

Trang 10

DANH MỤC CÁC HÌNH

Trang 11

DANH MỤC CÁC BIỂU ĐỒ

Số hiệu

Biểu đồ 3.1 Biểu đồ biểu diễn lựa chọn câu hỏi cho thí sinh có θ=

Biểu đồ 3.2 Biểu đồ biểu diễn lựa chọn câu hỏi cho thí sinh có θ=

Trang 12

MỞ ĐẦU

1 Lý do chọn đề tài

Đánh giá kết quả học tập là một khâu quan trọng trong quá trình đào tạo, là một trong những yếu tố quyết định chất lượng giáo dục Các phương pháp đánh giá truyền thống như: vấn đáp, tự luận, … thường mất nhiều thời gian, khó chính xác và không khách quan Để khắc phục những hạn chế trên thì kiểm tra bằng hình thức trắc nghiệm

đã được đề xuất Nhờ vào đặc điểm luôn có sự rõ ràng của đáp án, tính khách quan trong đánh giá kết quả học tập của người học mà hình thức đánh giá này đã được áp dụng ở hầu khắp hệ thống giáo dục trên thế giới

Một trong những hệ thống trắc nghiệm đang được sử dụng phổ biến là trắc nghiệm khách quan (Objective test) [4] Tuy nhiên mô hình trắc nghiệm này vẫn chưa thực sự đưa ra kết quả đúng đắn hoặc công bằng do một số nguyên nhân: bộ câu hỏi trong một bài kiểm tra được lựa chọn một cách ngẫu nhiên nên sẽ có bài kiểm tra quá khó hoặc quá dễ, điều này dẫn đến gây nhàm chán cho thí sinh khi làm toàn câu hỏi dễ hoặc gây ức chế nếu gặp phải câu hỏi quá khó Để quá trình đánh giá mức năng lực của thí sinh được chính xác và khách quan hơn, một mô hình trắc nghiệm đã và đang được nghiên cứu hiện nay là trắc nghiệm thích nghi (TNTN) đặc biệt là mô hình thích nghi trên máy tính (Computerized Adaptive Testing - CAT) [14] Mô hình này cho phép lựa chọn câu hỏi tiếp theo phù hợp với mức kiến thức và năng lực hiện tại của thí sinh Hệ thống TNTN trên máy tính cho phép tự động đánh giá mỗi thí sinh với tập hợp câu hỏi trắc nghiệm là khác nhau về số lượng và nội dung câu hỏi Năng lực thí sinh được cập nhật thường xuyên trong quá trình đánh giá, và quá trình đánh giá sẽ kết thúc khi đưa ra được chính xác mức kiến thức và năng lực thực sự của thí sinh

Ngày nay, với sự phát triển vượt bậc của khoa học máy tính nên vấn đề triển khai các hệ thống TNTN dựa trên cơ sở các mô hình toán học là hoàn toàn khả thi Một số

mô hình TNTN đã được nghiên cứu và hiện thực hóa như: mô hình TNTN trên cơ sở

lý thuyết đáp ứng câu hỏi [19], mô hình TNTN trên cơ sở [15], … Tuy nhiên các mô hình TNTN kể trên vẫn còn tồn tại một số nhược điểm

2 Mục đích và ý nghĩa đề tài

a Mục đích

Xây dựng mô hình TNTN trên cơ sở mạng Bayes

Xây dựng hệ thống TNTN dựa trên mô hình đề xuất và triển khai ứng dụng cho việc đánh giá kiến thức và kỹ năng của sinh viên ở Trường ĐH Sư phạm Kỹ thuật Vĩnh Long đối với học phần Lập trình Web

b Ý nghĩa khoa học

Xây dựng mô hình TNTN ứng dụng mạng Bayes

Trang 13

Xây dựng mô hình TNTN trên cơ sở mạng Bayes;

Hiện thực hóa hệ thống Website đánh giá dựa trên mô hình đề xuất

b Nhiệm vụ

Đưa ra vấn đề và phân tích vấn đề;

Phát biểu, phân tích và xây dựng mô hình TNTN để giải quyết bài toán đặt ra; Triển khai thực tế và đánh giá kết quả đạt được của hệ thống

4 Đối tượng và phạm vi nghiên cứu

a Đối tượng nghiên cứu

Các mô hình và thuật toán TNTN;

Xây dựng Website TNTN trên cơ sở mô hình đề xuất;

Triển khai và đánh giá hệ thống

Trang 14

6 Kết quả dự kiến

a Kết quả của đề tài

Xây dựng mô hình TNTN trên cơ sở mạng Bayes và Lý thuyết đáp ứng câu hỏi; Hiện thực hóa hệ thống TNTN trên cơ sở mô hình đề xuất và triển khai thực tế đối với học phần Lập trình Web tại Trường Đại học Sư phạm Kỹ thuật Vĩnh Long

b Hướng phát triển của đề tài

Tối ưu hóa mô hình TNTN đề xuất;

Hoàn thiện hệ thống TNTN

Trang 15

CHƯƠNG 1 CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN

Chương này giới thiệu tổng quan về TNTN, các thành phần cơ bản, hoạt động chung của một mô hình TNTN; Phân tích các mô hình TNTN đã tồn tại, từ đó đưa ra lý

do để xây dựng TNTN trên cơ sở mạng Bayes

1.1 Tổng quan về trắc nghiệm thích nghi

1.1.1 Khái niệm trắc nghiệm thích nghi

Trắc nghiệm thích nghi (TNTN), tiếng Anh gọi là “Adaptive Test” là thuật ngữ để chỉ một phương pháp đánh giá thí sinh bằng hình thức kiểm tra trắc nghiệm nhưng đánh giá theo hướng năng lực của thí sinh bằng bộ câu hỏi tương ứng với mức năng lực

đó

Hệ thống trắc nghiệm thích nghi trên máy tính (CAT-Computerized Adaptive Testing) là phần mềm quản lý tự động với những câu hỏi có độ khó phù hợp với thí sinh dựa trên năng lực hiện thời của thí sinh Trái ngược với trắc nghiệm khách quan trên máy tính - hệ thống đưa ra bộ các câu hỏi theo trình tự đã được xác định trước hoặc ngẫu nhiên, hệ thống CAT đưa ra câu hỏi thích ứng với thí sinh Nếu thí sinh trả lời chính xác một câu hỏi thì câu hỏi trắc nghiệm tiếp theo khó hơn câu hỏi hiện thời

Do đó, nếu thí sinh trả lời sai câu hỏi hiện thời thì câu hỏi tiếp theo sẽ dễ hơn Vì vậy, những sinh viên khác nhau sẽ nhận được các tập các câu hỏi trắc nghiệm khác nhau dựa trên câu trả lời của họ về các câu hỏi

Quy trình đánh giá với khả năng thích nghi có các ưu điểm sau:

- Quy trình đánh giá trở nên động và riêng rẽ, vì nó được thích ứng với mỗi sự thực hiện của thí sinh

- Tránh được việc thí sinh phải làm bài thi trên những câu hỏi không phù hợp với năng lực của mình

- Số lượng các câu hỏi đã yêu cầu để ước lượng mức hiểu biết của thí sinh là giảm đi đáng kể, kết quả dẫn tới quy trình đánh giá bớt nhàm chán

1.1.2 Lịch sử TNTN

TNTN đã xuất hiện từ rất lâu và được ứng dụng nhiều trong thực tế cuộc sống như trắc nghiệm thông minh, trắc nghiệm tâm lý, Elearing, … Ý tưởng ban đầu của TNTN là của nhà Tâm lý học người Pháp Alfred Binet (1859- 1911) Năm 1905, ông

đã phát triển một thử nghiệm tư duy trên trẻ em Các thử nghiệm đối với nhiều độ tuổi khác nhau với những bộ câu hỏi phù hợp cho từng lứa tuổi Từ những thông tin của mỗi đợt kiểm tra, ông đưa đưa ra kết luận năng lực cho từng ứng viên Phương pháp của Binet là đơn giản và có thể thực hiện bằng máy vi tính

Năm 1980, Lord đưa ra phương pháp đánh giá có tên là Flexilevel Sau đó có một

số biến thể của phương pháp này như phương pháp Step của Henning (1987), phương

Trang 16

pháp Testle của Lewis và Sheehan (1990) Những phương pháp này là sự sàng lọc từ phương pháp của Binet Các câu hỏi được phân loại theo cấp độ độ khó khác nhau, mỗi cấp độ gồm nhiều câu hỏi Việc đánh giá sau đó sẽ được tiến hành với một bộ các câu hỏi thuộc một cấp nào đó tùy thuộc vào tỷ lệ thành công của mỗi cấp độ mà quyết định

di chuyển lên hay xuống một cấp Sau khi thực hiện một số tập con, có thể ước lượng được khả năng thực sự của một số thí sinh Với tốc độ phát triển chóng mặt của máy tính điện tử thì ngày nay các hệ thống TNTN đã trở nên phổ biến và giúp cho việc đánh giá năng lực (kiến thức) thí sinh ngày càng trở nên chính xác và hiệu quả hơn Một số thử nghiệm đã được công nhận như: Graduate Record Test, Graduate Management Admission Test, Scholastic Aptitude Test, …

1.2 Các thành phần của mô hình TNTN

Về cơ bản, mô hình TNTN có các thành phần: ngân hàng câu hỏi (Calibrated item bank), thuật toán lựa chọn câu hỏi (Item selection algorithm), thuật toán đánh giá (Scoring algorithm) và điều kiện dừng (Termination criterion) [7], [13], [14] Tuy nhiên, các thành phần này có những điểm khác so với trắc nghiệm khách quan

1.2.1 Ngân hàng câu hỏi

Là tập hợp câu hỏi đã được ước lượng các tham số đặc trưng như độ khó, độ phân biệt Ngân hàng câu hỏi được sử dụng để làm cơ sở đánh giá năng lực thí sinh Do đó, ngân hàng câu hỏi tốt đòi hỏi phải có số lượng tương đối lớn và phong phú

1.2.2 Thuật toán lựa chọn câu hỏi

Việc đánh giá năng lực của thí sinh trong TNTN phụ thuộc rất lớn vào thuật toán lựa chọn câu hỏi Nếu câu hỏi được chọn quá dễ so với năng lực hiện tại của thí sinh thì thí sinh có thể dễ dàng trả lời và ngược lại Điều này dễ dẫn tới việc đánh giá năng lực thí sinh không chính xác Thuật toán này được sử dụng để lựa chọn câu hỏi tốt nhất từ ngân hàng câu hỏi để đưa vào bài kiểm tra Câu hỏi được cho là tốt nhất là câu phù hợp nhất với năng lực hiện tại của thí sinh, nghĩa là câu hỏi hỏi này có các tham số câu hỏi tương ứng với tham số năng lực hiện tại của thí sinh

Thuật toán lựa chọn câu hỏi gồm các bước sau:

- Dựa trên tham số năng lực hiện tại, tính toán giá trị của hàm thông tin cho các câu hỏi chưa đưa ra cho thí sinh trả lời;

- Tìm và chọn câu hỏi phù hợp nhất với năng lực hiện tại của thí sinh (câu hỏi có hàm thông tin lớn nhất)

1.2.3 Đánh giá năng lực của thí sinh

Sau khi nhận kết quả trả lời câu hỏi của thí sinh, hệ thống sẽ tính toán lại mức năng lực của thí sinh Việc tính toán này sẽ đưa ra giá trị mới cho tham số năng lực Thông thường giá trị này không thay đổi nhiều so với lần đánh giá trước đó và sẽ tiến dần đến mức năng lực thực sự của thí sinh

Trang 17

1.2.4 Điều kiện dừng

Vì mô hình TNTN hoạt động theo thuật toán lặp các thao tác lựa chọn câu hỏi, thí sinh trả lời, đánh giá năng lực nên cần có điều kiện dừng để làm căn cứ kết thúc quá trình trắc nghiệm Điều kiện dừng có thể là một hoặc một số tiêu chí như: độ sai lệch năng lực thấp, thời gian làm bài vượt quá thời gian quy định, số lượng câu hỏi vượt quá mức quy định, …

1.3 Hoạt động của mô hình TNTN

Hình 1.1 Mô hình hoạt động của hệ thống TNTN

Hoạt động chung của mô hình TNTN là một thuật toán lặp gồm các bước sau:

- Bước 1: Khởi tạo giá trị mức năng lực ban đầu của thí sinh

- Bước 2: Dựa vào mức năng lực hiện tại của thí sinh, lựa chọn câu hỏi phù hợp nhất từ các câu hỏi chưa được chọn

- Bước 3: Tính toán lại mức năng lực mới dựa vào kết quả trả lời câu hỏi của thí sinh

- Bước 4: Quay lại bước 2 nếu điều kiện dừng chưa thỏa mãn

Bắt đầu

Khởi tạo mức năng lực

Lựa chọn câu hỏi phù hợp

Đánh giá lại mức năng lực

Điều kiện dừng

Sai Đúng

Báo cáo kết quả mức năng lực

Kết thúc

Trang 18

Trong mô hình TNTN, thuật toán lựa chọn câu hỏi tiếp theo phù hợp với năng lực hiện tại của thí sinh là khó khăn vì phải được tính toán một cách phức tạp Ngày nay với sự phát triển của khoa học máy tính thì vấn đề trên đã được giải quyết một cách tốt hơn, giúp hệ thống đánh giá năng lực của thí sinh một cách chính xác, nhanh chóng và giảm bớt thời gian cũng như chi phí của quá trình đánh giá

Thuật toán lựa chọn câu hỏi theo tiêu chuẩn thông tin tối đa (MI) [12] là thuật

toán phổ biến được sử dụng trong các mô hình TNTN Câu hỏi thứ n+1 được

lựa chọn cho thí sinh là câu hỏi cung cấp thông tin tối đa cho phép ước lượng khả năng của thí sinh ( n) dựa trên n câu hỏi trước đó mà thí sinh đã trả lời Thuật toán lựa chọn câu hỏi theo thông tin toàn cục (KL) là thuật toán lựa chọn câu hỏi dựa trên phương pháp thông tin tổng thể được đề xuất bởi Chang and Ying (1996) [11] Thuật toán này sử dụng độ đo Kullback-Leibler

để tính toán ước lượng trong việc lựa chọn câu hỏi

Thuật toán lựa chọn câu hỏi dựa trên sự phân tích tiên đoán theo tiêu chí tối

đa thông tin (MEI) là thuật toán lựa chọn câu hỏi dựa trên việc phân tích tiên đoán các tiêu chí tối đa thông tin dự kiến được đề xuất bởi van der Linden (1998) [19]

Thuật toán MI, KL và MEI sẽ dừng khi tiêu chuẩn lỗi (SE) đủ nhỏ Khi đó có thể nói đã xác định được mức năng lực của thí sinh

Bảng 1.1 Bảng đánh giá các thuật toán lựa chọn MI, KL và MEI (+: có, -: không)

Thuật toán lựa

chọn câu hỏi

Đánh giá thông số câu hỏi

Khả năng thích ứng liên tục với tham số năng lực

Số câu hỏi để xác định tiêu chuẩn lỗi (SE)

Thời gian tính toán hàm thông tin

Phân tích các mô hình TNTN sử dụng các thuật toán lựa chọn câu hỏi kể trên không tính toán đến thông số của câu hỏi sẽ ảnh hưởng như thế nào đến việc lựa chọn

Trang 19

(ví dụ như độ khó của câu hỏi), không có khả năng thích ứng liên tục với tham số năng lực của thí sinh Ngoài ra, khi tiêu chuẩn lỗi được đặt cố định ở mức thấp đòi hỏi phải cần nhiều câu hỏi cho bài kiểm tra và thời gian tính toán hàm thông tin phụ thuộc nhiều vào ngân hàng câu hỏi Từ phân tích trên thì các mô hình và hệ thống TNTN hiện có còn tồn tại nhiều hạn chế, vì vậy nên định hướng và nghiên cứu đề tài: “Ứng dụng mạng Bayes xây dựng mô hình trắc nghiệm thích nghi” là cần thiết để khắc phục các tồn tại nêu trên

Trang 20

CHƯƠNG 2 XÂY DỰNG MÔ HÌNH TRẮC NGHIỆM

đồ thị của mạng Cấu trúc đồ thị của một mạng Bayes dẫn tới các mô hình dễ giải thích

và tới các thuật toán học và suy luận hiệu quả Các nút có thể đại diện cho đủ loại biến, một tham số đo được, một biến ẩn (latent variable) hay một giả thuyết chứ không nhất thiết phải đại diện cho các biến ngẫu nhiên

2.1.2 Định nghĩa mạng Bayes

Một mạng Bayes là một đồ thị có hướng phi chu trình mà trong đó:

Các nút biểu diễn các biến;

Các cung biểu diễn các quan hệ phụ thuộc thống kê giữa các biến và phân phối xác suất địa phương cho mỗi giá trị nếu cho trước giá trị của các cha của

Nếu có một cung từ nút A tới nút B, thì biến B phụ thuộc trực tiếp vào biến A, và

A được gọi là cha của B Nếu với mỗi biến trong mạng là Xi, i ∈{1, ,N} và Pa(Xi) là tập hợp các biến cha của nút Xi thì phân phối xác suất có điều kiện phụ thuộc của các biến là tích của các phân phối xác suất địa phương

Với mỗi biến, sự phân phối có điều kiện {P(X i | Pa(X i )), i=1, …, n} Nếu X i

không có cha, ta nói rằng phân phối xác suất địa phương của nó là không có

Trang 21

điều kiện, ngược lại, nó là có điều kiện Nếu biến được biểu diễn bởi một nút được quan sát, thì ta nói rằng nút đó là một nút hiển nhiên (evidence node) Các câu hỏi về sự phụ thuộc không tương đẳng giữa các biến có thể được trả lời bằng cách nghiên cứu đồ thị Có thể chứng minh rằng trong đồ thị, tính độc lập có điều kiện được biểu diễn bởi tính chất đồ thị: cho trước một số nút hiển nhiên cụ thể, các nút

X và Y là d-separated (d-tách rời) trong đồ thị khi và chỉ khi các biến và Y là độc lập, biết trước các biến hiển nhiên tương ứng Tập hợp gồm tất cả các nút khác mà X có thể phụ thuộc trực tiếp được cho bởi Markov blanket của X

Một ưu điểm của mạng Bayes là về mặt trực quan, con người có thể hiểu các quan

hệ phụ thuộc trực tiếp và các phân phối địa phương dễ dàng hơn là phân phối có điều

kiện phụ thuộc hoàn chỉnh

2.1.3 Mạng Bayes nhân quả

Một mạng Bayes nhân quả là một mạng Bayes mà trong đó các cung có hướng của đồ thị được hiểu là các quan hệ nhân quả trong một miền xác định có thực nào đó Các cung có hướng không nhất thiết phải được hiểu là các quan hệ nhân quả; Tuy nhiên, trong thực tiễn, tri thức về các quan hệ nhân quả rất hay được dùng để hướng dẫn vẽ các đồ thị mạng Bayes, kết quả là có được các mạng Bayes nhân quả

2.1.4 Học cấu trúc

Trong trường hợp đơn giản nhất, một mạng Bayes được xây dựng bởi một chuyên gia và rồi được dùng để thực hiện việc suy luận Trong các ứng dụng khác, công việc xây dựng mạng quá phức tạp đối với con người Trong trường hợp này, cấu trúc và các tham số mạng của các phân bố địa phương phải được học từ dữ liệu

Học cấu trúc của một mạng Bayes (nghĩa là học đồ thị) là một phần rất quan trọng của ngành học máy Giả thiết rằng dữ liệu được sinh từ một mạng Bayes và tất cả các biến là thấy được trong mọi lần lặp, việc tối ưu hóa dựa trên phương pháp tìm kiếm có thể được dùng để tìm cấu trúc mạng Việc này đòi hỏi một hàm tính điểm (scoring function) và một chiến lược tìm kiếm Một hàm tính điểm thông dụng là xác suất hậu nghiệm (posterior probability) của cấu trúc khi cho trước dữ liệu huấn luyện Quá trình tìm kiếm duyệt toàn bộ để trả về một cấu trúc có số điểm tối ưu đòi hỏi thời gian cấp siêu lũy thừa (superexponential) theo số lượng biến Một chiến lược tìm kiếm địa phương thực hiện các thay đổi tăng dần hướng tới việc nâng cao điểm số của cấu trúc Một thuật toán tìm kiếm toàn cục như Phương pháp Monte Carlo xích Markov (Markov chain Monte Carlo) có thể tránh việc bị bẫy trong một cực tiểu địa phương

2.1.5 Học tham số

Để cụ thể hóa mạng Bayes và biểu diễn đầy đủ các phân bố xác suất phụ thuộc có điều kiện, đối với mỗi biến X, cần phải chỉ ra phân bố xác suất X theo các cha của X Phân bố của X theo các cha của nó có thể có hình thức bất kỳ Người ta thường dùng

Trang 22

các phân bố rời rạc hay phân bố Gauss, do các phân bố này làm đơn giản việc tính toán Đôi khi chỉ biết được các ràng buộc của các phân số người ta có thể dùng nguyên

lý entropy cực đại để xác định một phân bố đơn, phân bố với entropy cực đại thỏa mãn các ràng buộc đó Tương tự, trong ngữ cảnh cụ thể của một mạng Bayes động, người ta thường lấy phân bố có điều kiện cho sự phát triển theo thời gian của trạng thái ẩn để cực đại hóa hệ số entropy (entropy rate) của quá trình ngẫu nhiên được nói đến

Thông thường, các phân bố có điều kiện này bao gồm các tham số chưa biết và phải được ước lượng từ dữ liệu, đôi khi bằng cách tiếp cận khả năng cực đại (maximum likelihood) Việc cực đại hóa trực tiếp khả năng (hay xác suất hậu nghiệm) thường phức tạp khi có các biến không được quan sát Một cách tiếp cận truyền thống đối với vấn đề này là thuật toán cực đại hóa kỳ vọng (expectation-maximization algorithm), thuật toán này luân phiên giữa việc tính toán các giá trị mong đợi của các biến không được quan sát theo dữ liệu quan sát được, với việc cực đại hóa khả năng (hay hậu nghiệm) hoàn chỉnh với giả thuyết rằng các giá trị mong đợi đã tính được là đúng đắn Dưới các điều kiện chính quy và vừa phải, quá trình này hội tụ về các giá trị khả năng cực đại (hay hậu nghiệm cực đại) cho các tham số Một cách tiếp cận Bayes đầy đủ hơn đối với việc học tham số là coi các tham số như là các biến không quan sát được khác

và tính một phân bố hậu nghiệm đầy đủ trên toàn bộ các nút theo dữ liệu quan sát được, sau đó tách các tham số ra Cách tiếp cận này có thể có chi phí cao và dẫn đến các mô hình có số chiều

2.1.6 Suy luận trong mạng Bayes

Do mạng Bayes là một mô hình hoàn chỉnh cho các biến và các quan hệ giữa chúng, có thể dùng mạng Bayes để trả lời các truy vấn xác suất về các biến này Ví dụ, mạng Bayes có thể được dùng để tìm tri thức mới nhất về trạng thái của một tập con gồm các biến khi các biến khác (các biến hiển nhiên) được quan sát Quá trình tính phân bố hậu nghiệm này của các biến khi cho trước các biến hiển nhiên được gọi là suy luận xác suất Quá trình hậu nghiệm cho ra một thống kê đủ phổ quát (universal sufficient statistic) cho các ứng dụng phát hiện, khi người ta muốn chọn các giá trị cho một tập con các biến nhằm mục đích cực tiểu hóa một hàm phí tổn nào đó, chẳng hạn xác suất của lỗi quyết định Do đó, có thể coi mạng Bayes là một cơ chế cho việc xây dựng tự động các mở rộng của định lý Bayes cho các bài toán phức tạp hơn

Trang 23

2.2 Lý thuyết đáp ứng câu hỏi

2.2.1 Giới thiệu

Lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT) là một lý thuyết của khoa học về đo lường trong giáo dục Được Lord phát minh vào đầu những năm 1950

và phát triển mạnh mẽ cho đến ngày nay

Trước đó, Lý thuyết trắc nghiệm cổ điển (Clasical Test Theory – CTT) ra đời từ khoảng cuối thế kỷ 19 và hoàn thiện vào khoảng thập niên 1970, đã có nhiều đóng góp quan trọng cho hoạt động đánh giá trong giáo dục, nhưng cũng thể hiện một số hạn chế

Các nhà tâm trắc học đã xây dựng một lý thuyết hiện đại dựa trên mô hình toán học, đòi hỏi nhiều tính toán, nhưng nhờ sự tiến bộ vượt bậc của công nghệ tính toán bằng máy tính điện tử vào cuối thế kỷ 20 – đầu thế 20 kỷ 21 nên nó đã phát triển nhanh chóng và đạt được những thành tựu quan trọng trong quá trình đáng giá và kiểm định năng lực

Để đánh giá đối tượng nào đó, lý thuyết trắc nghiệm cổ điển tiếp cận ở cấp độ một đề kiểm tra còn lý thuyết trắc nghiệm hiện đại tiếp cận ở cấp độ từng câu hỏi, do

đó lý thuyết này thường được gọi là “Lý thuyết ứng đáp câu hỏi”

IRT xây dựng mô hình tính toán để xử lý dữ liệu dựa trên việc nghiên cứu mọi cặp tương tác giữa “Thí sinh” và “Câu hỏi” khi triển khai một bài thi trắc nghiệm Mỗi thí sinh đứng trước một câu hỏi sẽ trả lời như thế nào, điều đó phụ thuộc vào năng lực của thí sinh và một số đặc trưng của câu hỏi Thông thường có 3 tham số đặc trưng cho một câu hỏi đó là: độ khó, độ phân biệt và độ dự đoán Trong đó, độ khó là tham số quan trọng nhất thể hiện độ lệch của câu hỏi so với trình độ của thí sinh, tham số độ phân biệt nhằm mục đích phân biệt sự đáp ứng như thế nào giữa các thí sinh có trình độ khác nhau với câu hỏi và độ dự đoán là tham số chỉ định tỷ lệ dự đoán của thí sinh khi đứng trước một câu hỏi

Hiện nay có 3 mô hình tính toán phổ biến trong IRT, các mô hình này được phân loại theo số tham số đặc trưng mà nó sử dụng Mô hình 1 tham số (Rasch) chỉ xét đến

độ khó của câu hỏi, mô hình 2 tham số (Birnbaum) xét thêm độ phân biệt của câu hỏi

và mô hình 3 tham số xét thêm mức dự đoán của thí sinh khi trả lời câu hỏi

2.2.2 Mô hình IRT 2 tham số

Trong mô hình IRT 2 tham số được sử dụng các tham số độ khó (b) và độ phân

biệt (a) Khi đó xác suất trả lời đúng câu hỏi thứ i của thí sinh j được tính theo công

Trang 24

u i= 0 trong trường hợp ngược lại);

a i , b i là tập hợp các tham số của câu hỏi i: độ phân biệt, độ khó của câu hỏi i;

θ j là mức năng lực hiện tại của thí sinh j

Lựa chọn câu hỏi phù hợp với mức năng lực hiện tại của thí sinh là rất quan trọng Nếu câu hỏi đưa ra là quá khó hay quá dễ đối với thí sinh thì sẽ mang lại ít thông tin về mức năng lực thí sinh Để đánh giá được chính xác mức năng lực thí sinh cần thiết phải đưa ra câu hỏi với bộ tham số mang lại thông tin tối đa trong việc đánh giá mức năng lực thí sinh

Theo Birnbaum, mỗi câu hỏi trắc nghiệm cung cấp một lượng thông tin nào đó về

mức năng lực của thí sinh Birnbaum đề xuất hàm thông tin I i (θ) của câu hỏi i được

tính toán phụ thuộc vào năng lực θcủa thí sinh theo công thức sau:

𝐼𝑖(𝜃) = (𝑝𝑖′(𝑢𝑘=1|𝜃,𝑎𝑖,𝑏𝑖))

2

𝑝𝑖(𝑢𝑘=1|𝜃,𝑎𝑖,𝑏𝑖)(1−𝑝𝑖(𝑢𝑘=1|𝜃,𝑎𝑖,𝑏𝑖)) (1.2)

Trong đó:

p i (u k = 1|θ, a i , b i ) là xác suất trả lời đúng câu hỏi i với tập hợp tham số a i , b i ;

p i ’ (u k = 1|θ, a i , b i ) là đạo hàm bậc nhất của xác suất trả lời đúng câu hỏi i

theo mức năng lực

Như vậy, giá trị hàm thông tin I i (θ) được tính cho tập hợp các câu hỏi chưa đưa ra

cho thí sinh Phương pháp phổ biến nhất trong việc lựa chọn câu hỏi tiếp theo phù hợp với mức năng lực hiện tại của thí sinh là sử dụng hàm thông tin lớn nhất

Sau khi trả lời mỗi câu hỏi thì vấn đề đặt ra là làm sao đánh giá lại mức năng lực của thí sinh vì giá trị mức năng lực mới này sẽ được sử dụng để lựa chọn câu hỏi tiếp theo phù hợp với thí sinh Sử dụng phương pháp Maximum likelihood [17] để đánh giá mức năng lực của thí sinh sau mỗi câu trả lời, tức là tìm một giá trị mức năng lực mà hàm sau đây là tối đa:

u 1 , u 2 , …, u n là tập hợp câu trả lời của thí sinh đối với các câu hỏi đã đưa ra;

p i (u, θ) là xác suất trả lời đúng câu hỏi i của thí sinh có mức năng lực θ, được

tính theo công thức (1.1)

Trắc nghiệm được bắt đầu với mức năng lực của thí sinh là θ s, từ công thức (1.3)

có thể tiến hành đánh giá lại mức năng lực thí sinh là θ s+1 sau khi trả lời một câu hỏi theo công thức sau:

Trang 25

𝜃𝑠+1= 𝜃𝑠+∑𝑖𝜖𝑛𝑆𝑖 (𝜃 𝑠 )

Trong đó:

n là tập hợp bộ câu hỏi thí sinh đã trả lời;

S i (θ s ) được tính theo công thức:

𝑆𝑖(𝜃𝑠) =(𝑢𝑖 −𝑝𝑖(𝑢𝑖=1|𝜃𝑠,𝑎𝑖,𝑏𝑖)).𝑝𝑖′ (𝑢𝑖=1|𝜃𝑠,𝑎𝑖,𝑏𝑖)

𝑝𝑖(𝑢𝑖=1|𝜃 𝑠 ,𝑎𝑖,𝑏𝑖)(1−𝑝𝑖(𝑢𝑖=1|𝜃 𝑠 ,𝑎𝑖,𝑏𝑖)) (1.5)

Với p i (u i = 1|θ s , a i , b i ) và p i ’ (u i = 1|θ s , a i , b i ) là xác suất trả lời đúng câu hỏi i

và đạo hàm bậc nhất tương ứng của xác suất đó

I i (θ s ) là hàm thông tin của câu hỏi i được tính theo công thức (1.2)

Quá trình trắc nghiệm đánh giá mức năng lực của mỗi thí sinh kết thúc khi đã đưa

ra được chính xác mức năng lực của thí sinh đó Trong quá trình trắc nghiệm thích nghi theo mô hình đề xuất, sau mỗi câu trả lời mức năng lực thí sinh sẽ được đánh giá lại Nếu sự chênh lệch mức năng lực thí sinh giữa hai lần đánh giá liên tiếp là rất nhỏ thì có thể xem đó là kết quả đánh giá cuối cùng về mức năng lực thí sinh Bởi vì nếu thí sinh

có trả lời thêm các câu hỏi nữa thì mức năng lực thí sinh gần như không đổi và đó cũng chính là kết quả đánh giá mức năng lực cuối cùng của thí sinh

2.3 Xây dựng mô hình TNTN dựa trên mạng Bayes kết hợp IRT 2 tham số

2.3.1 Mô hình TNTN

Một mô hình tổng thể TNTN cần có các thành phần sau:

Ngân hàng câu hỏi (Item banking)

Các thuật toán: Khởi tạo, lựa chọn câu hỏi, đánh giá kết quả, tính toán, dừng

và báo cáo

Hình 2.1 Mô hình TNTN

Module lựa chọn câu

hỏi tiếp theo

Module quản lý câu hỏi

Module đánh giá năng lực thí sinh

Ngân hàng câu hỏi

θs

θf

Thuật toán TNTN

Trang 26

2.3.2 Ngân hàng câu hỏi

Ngân hàng câu hỏi (NHCH) là nơi chứa toàn bộ các câu hỏi cho quá trình đánh giá thích nghi NHCH nằm ở trung tâm của tất cả các hệ thống TNTN Các NHCH là một tập hợp tổ chức các câu hỏi, chỉ có một số trong đó sẽ được trình bày cho bất kỳ

cá nhân thí sinh trong quá trình kiểm tra của mình Các tính chất quan trọng của một NHCH bao gồm kích thước, thành phần, cấu trúc và tính chất của mô hình đáp ứng đầy đủ các tính chất của TNTN NHCH gồm nhiều môn học và mỗi môn học có một

số lượng câu hỏi nhất định để thực hiện đánh giá thích nghi hiệu quả cho môn học đó Tại mỗi thời điểm, thí sinh chỉ được phép đánh giá trên một môn học Ngoài ra mỗi câu hỏi cần phải được ước lượng các tham số đặc trưng như độ khó, độ phân biệt theo quy ước của mô hình IRT 3 tham số Các tham số này là cơ sở tính toán mối tương quan giữa câu hỏi và thí sinh Tức là, câu hỏi thuộc mức quá dễ, dễ, bình thường, khó hay quá khó đối với thí sinh TNTN sẽ lựa chọn câu hỏi được cho là phù hợp nhất

Trang 27

Khởi tạo mức năng lực θ

Lựa chọn câu hỏi

phù hợp Max(I i (θ))

Điều kiện dừng

Đánh giá lại mức năng lực θ

Trang 28

Năng lực mới của thí sinh sau khi được đánh giá

Hoạt động thuật toán

Bước 1: Khởi tạo mức năng lực ban đầu cho thí sinh

Bước 2: Đánh giá tập câu hỏi chưa đưa ra cho thí sinh: tính hàm thông tin của

các câu hỏi này dựa trên mức năng hiện tại của thí sinh

Bước 3: Lựa chọn và đưa ra câu hỏi phù hợp nhất với mức năng lực hiện tại

của thí sinh

Bước 4: Đánh giá lại năng lực thí sinh trên cơ sở kết quả trả lời câu hỏi đưa

ra

Bước 5: Lặp lại từ Bước 2 cho đến khi gặp điều kiện dừng

2.3.4 Thuật toán lựa chọn câu hỏi

Trong TNTN, thuật toán lựa chọn câu hỏi là thuật toán quan trọng Thuật toán này là một thuật toán con hoạt động bên trong thuật toán TNTN Thuật toán này giúp lựa chọn câu hỏi từ danh sách các câu hỏi chưa được chọn sao cho phù hợp nhất với năng lực hiện tại của thí sinh Thuật toán tiến hành duyệt tất cả cả câu hỏi chưa được chọn, tính toán hàm thông tin cho mỗi câu hỏi và lựa chọn câu hỏi có giá trị thông tin lớn nhất Theo lý thuyết IRT, câu hỏi có giá trị thông tin lớn nhất là câu phù hợp nhất với thí sinh đó Hàm thông tin sẽ được tính toán dựa trên công thức (1.2) Sau khi đã chọn được câu hỏi, thuật toán sẽ đánh dấu câu hỏi được chọn để không phải tính toán cho lần lựa chọn tiếp theo

Mô tả thuật toán lựa chọn câu hỏi:

Đầu vào:

Danh sách câu hỏi theo môn học và chưa được chọn trong bài thi, mỗi câu hỏi đã được ước lượng các tham số đặc trưng

Năng lực (kiến thức) hiện tại của thí sinh

Đầu ra: Câu hỏi được chọn từ ngân hàng câu hỏi

Hoạt động:

- Bước 1: Khởi tạo maxiníor := 0; //GTLN của thông tin câu hỏi

Bước 2: Duyệt danh sách được chọn Với câu hỏi thứ i thực hiện:

Bước 2.1: Tính toán hàm đặc trưng câu hỏi cho các danh sách câu hỏi theo

công thức (20)

Bước 2.2: Tính giá trị hàm thông tin câu hỏi

Bước 3: Ghi nhận câu hỏi và đánh dấu đã chọn

Bước 4: Kết thúc

2.3.5 Ước lượng năng lực thí sinh

Đối với hệ thống trắc nghiệm thích nghi thì viêc năng lực của thí sinh sẽ được đánh giá liên tục trong sau khi trả lời mỗi câu hỏi, đây là một thuật toán quan trọng trong hệ thống trắc nghiệm thích nghi Sau khi thí sinh trả lời mỗi câu hỏi, thuật toán

Trang 29

con này thực thi để tính toán năng lực hiện tại của thí sinh

Kết quả tính toán này sẽ là tiền đề để hệ thống trắc nghiệm thích nghi lựa chọn câu hỏi tiếp theo phù hợp với năng lực thí sinh hoặc là đưa ra kết quả đánh giá năng lực cuối cùng của thí sinh và dừng đợt kiểm tra

Trong mạng Bayes, năng lực được tính từ xác suất thành công trung bình của tất

cả k câu hỏi:

𝜃 = ∑ 𝑃𝑘 𝑟(𝑋𝑖)

𝑖

𝑘

Trong đó, P r (X i ) là xác suất ước tính thành công của câu hỏi i sau khi trả lời r

Để giải quyết vấn đề này cần định nghĩa mô hình cấu trúc của mạng Bayes

a Để biểu diễn một khái niệm cơ bản ta sử dụng một biến ngẫu nhiên C với phân phối Bernoulli, có nghĩa là C có hai giá trị khác nhau: 1 nếu thí sinh hiểu khái niệm hoặc 0 nếu ngược lại Định luật xác suất của C sẽ là:

P(C=x) = px(1-p)1-xTrong đó: p là xác suất để thí sinh biết khái niệm C và x có thể nhận giá trị 0 hoặc 1

b Một chủ đề là một cặp (C, w), trong đó:

- C là một tập các khái niệm độc lập với nhau, C=(C 1 , C 2 , …, C n )

- w=(w1, w2, …, wn) là một vec tơ trọng số đo tầm quan trọng tương đối của mỗi khái niệm trong chủ đề đó Chúng ta giả định rằng:

Trang 30

- a=(a1, a2, …, as là một vec tơ trọng số đo tầm quan trọng tương đối của mỗi chủ đề trong môn học đó Chúng ta giả định rằng:

∑𝑠 𝑎𝑖 = 1

𝑖=1

Theo định nghĩa, mỗi chủ đề bao gồm một tập các khái niệm độc lập nhau với trọng số tương ứng của chúng, nghĩa là cho mỗi i=1, …, s thì chủ đề Ti bao gồm một tập các khái niệm {𝐶𝑖𝑗, … , 𝐶𝑖𝑛𝑖} và vector trọng số 𝑤 = (𝑤𝑖𝑗, … , 𝑤𝑖𝑛𝑖 ) được xác định bởi biểu thức:

Time (days)

Bảng 2.2 Phân cấp chi tiết môn Mathematics

Subject Topics Weights Concepts Weights

Mathematics Calculus a1 = 0.5

Differentiation w12 = 0.25 Integration w13 = 0.25

Trang 31

Applications w14 = 0.3

Trigonometry a2 = 0.3

Basic concepts w21 = 0.3 Trigonometric functions w22 = 0.3 Applications w23 = 0.4

Geometry a3 = 0.2 Basic concepts w31 = 0.4

Applications w32 = 0.6

Trọng số của một chủ đề (khái niệm) có thể được tính như số ngày kết hợp với số ngày liên quan đến môn học (chủ đề) mà nó thuộc về Do đó, ví dụ trọng số cho các khái niệm Function của chủ đề Calculus là 18/90 Bảng 2.2 cho thấy hệ thống phân cấp chi tiết được kết hợp với ví dụ này

Tuy nhiên, lưu ý rằng các tiêu chí khác có thể được sử dụng để đặt tầm quan trọng tương đối của mỗi chủ đề (khái niệm) trong môn học (chủ đề), chẳng hạn như tỷ lệ yêu cầu của câu hỏi trong kỳ thi hoặc bất kỳ ước tính chủ quan nào khác của giáo viên

2.3.5.2 Nút chứng cứ

Các nút này được sử dụng để thu thập thông tin liên quan đến trạng thái hiểu biết của thí sinh Trong mô hình của chúng ta, nguồn chứng cứ là tập hợp các bài kiểm tra liên quan đến các nút kiến thức Để biểu diễn một nút chứng cứ, chúng ta sử dụng một biến ngẫu nhiên P với sự phân phối Bernoulli, nghĩa là nó sẽ lấy giá trị 1 khi thí sinh chọn đúng câu trả lời và 0 khi ngược lại Định luật xác suất của P được đưa ra bởi:

P(P=x) = p x (1-p) 1-x 2.3.5.3 Mô hình mối quan hệ nhân quả

Sau khi xác định các nút, chúng ta xác định mối quan hệ nhân quả giữa chúng như sau: các mối quan hệ tập hợp giữa các nút kiến thức ở các mức độ chi tiết khác nhau và các mối quan hệ giữa các nút chứng cứ và nút kiến thức

a Mô hình các quan hệ tập hợp

Để thảo luận về các mối quan hệ này chúng ta sử dụng khái niệm KI (Knowledge Element) để chỉ một môn học, một chủ đề hay khái niệm Các quan hệ hợp hoặc một phần được thiết lập giữa KI và các KI mà nó chứa Ví dụ, mối quan hệ được thiết lập giữa một môn học và các chủ đề của nó

Giả sử I là một KI có thể được chia thành các KI con được ký hiệu bởi I1, …, In Mỗi KI sẽ được đại diện bởi một biến ngẫu nhiên nhị phân với hai giá trị: nắm vững hoặc không nắm vững Để mô hình hóa mối quan hệ nhân quả giữa chúng, chúng ta có hai phương án:

- Phương án 1: Chúng ta cho rằng việc hiểu biết các mục cụ thể hơn có ảnh hưởng nhân quả đến việc hiểu được mục tổng quát hơn

Ngày đăng: 22/04/2021, 22:27

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Mai Văn Hà*, Đặng Hoài Phương (2016), “Ứng dụng mô hình 3 tham số Birnbaum xây dựng hệ thống tự động đánh giá năng lực người học”, Tạp chí Khoa học Công nghệ ĐHĐN, 5(102), trang 146 Sách, tạp chí
Tiêu đề: Ứng dụng mô hình 3 tham số Birnbaum xây dựng hệ thống tự động đánh giá năng lực người học”, "Tạp chí Khoa học Công nghệ ĐHĐN
Tác giả: Mai Văn Hà*, Đặng Hoài Phương
Năm: 2016
[2] PGS.TS Trần Khánh Đức (2012), Đo Lường Và Đánh Giá Trong Giáo Dục, NXB Đại học quốc gia Hà Nội Sách, tạp chí
Tiêu đề: Đo Lường Và Đánh Giá Trong Giáo Dục
Tác giả: PGS.TS Trần Khánh Đức
Nhà XB: NXB Đại học quốc gia Hà Nội
Năm: 2012
[5] Lê Xuân Tài, Đặng Hoài Phương (2015), “Xây dựng mô hình trắc nghiệm thích nghi trên cơ sở lý thuyết đáp ứng câu hỏi”, Một số vấn đề tiên tiến trong công nghệ thông tin và truyền thông, trang 5-17 Sách, tạp chí
Tiêu đề: Xây dựng mô hình trắc nghiệm thích nghi trên cơ sở lý thuyết đáp ứng câu hỏi”", Một số vấn đề tiên tiến trong công nghệ thông tin và truyền thông
Tác giả: Lê Xuân Tài, Đặng Hoài Phương
Năm: 2015
[6] Lâm Quang Thiệp (2008), Trắc nghiệm và Ứng dụng, NXB Khoa học kỹ thuật Sách, tạp chí
Tiêu đề: Trắc nghiệm và Ứng dụng
Tác giả: Lâm Quang Thiệp
Nhà XB: NXB Khoa học kỹ thuật
Năm: 2008
[7] Dương Thiệu Tống (2005), Trắc nghiệm và đo lường thành quả học tập, NXB Khoa học xã hội.Tiếng nước ngoài Sách, tạp chí
Tiêu đề: Trắc nghiệm và đo lường thành quả học tập
Tác giả: Dương Thiệu Tống
Nhà XB: NXB Khoa học xã hội. Tiếng nước ngoài
Năm: 2005
[8] Angel Syang (1993), “COMPUTERIZED ADAPTIVE TESTING IN COMPUTER SCIENCE : Assessing Student Programming Abilities”, ACM-24thCSE-2/93 - lN,USA, ACM 0-89791 -566 -6/93 /000210053, pp.53-57 Sách, tạp chí
Tiêu đề: COMPUTERIZED ADAPTIVE TESTING IN COMPUTER SCIENCE : Assessing Student Programming Abilities
Tác giả: Angel Syang
Năm: 1993
[9] Baker, F (2001). The Basics of Item Response Theory, University of Maryland, College Park, MD: ERIC Clear-inghouse on Assessment and Evaluation Sách, tạp chí
Tiêu đề: The Basics of Item Response Theory
Tác giả: Baker, F
Năm: 2001
[11] Chang, H.H., Ying, Z. (1996). A global information approach to computerized adaptive testing. Applied Psychological Measurement, 20, 213 Sách, tạp chí
Tiêu đề: A global information approach to computerized adaptive testing
Tác giả: Chang, H.H., Ying, Z
Năm: 1996
[12] Costa, D. R., Karino, C. A., Moura, F. A. S., & Andrade, D. F. (2009). A comparison of three methods of item selection for computerized adaptive testing.In D. J. Weiss (Ed.), Proceedings of the 2009 GMAC Conference on Computerized Adaptive Testing Sách, tạp chí
Tiêu đề: A comparison of three methods of item selection for computerized adaptive testing
Tác giả: Costa, D. R., Karino, C. A., Moura, F. A. S., & Andrade, D. F
Năm: 2009
[13] Gin-Fon N. Ju, Alfred Bork (2005), The Implementation of an Adaptive Test on the Computer, Proceedings of the Fifth IEEE International Conference on Advanced Learning Technologies (ICALT’05) Sách, tạp chí
Tiêu đề: The Implementation of an Adaptive Test on the Computer, Proceedings of the Fifth IEEE International Conference on Advanced Learning Technologies
Tác giả: Gin-Fon N. Ju, Alfred Bork
Năm: 2005
[14] Guido Makrankysky (2012), Computerized Adaptive Testing in Industrial and Organizational Psychology, University of Twente the Netherlands Sách, tạp chí
Tiêu đề: Computerized Adaptive Testing in Industrial and Organizational Psychology
Tác giả: Guido Makrankysky
Năm: 2012
[15] Guzmán, E., Conejo, R., & García-Hervás, E. (2005), “An Authoring Environment for Adaptive Testing, Educational Technology & Society”, 66- 76 Sách, tạp chí
Tiêu đề: An Authoring Environment for Adaptive Testing, Educational Technology & Society
Tác giả: Guzmán, E., Conejo, R., & García-Hervás, E
Năm: 2005
[16] John Michael Linacre, Ph.D.MESA Psychometric LaboratoryUniversity of Chicago (2000), “Computer-Adaptive Testing: A Methodology Whose Time Has Come”, Seoul, South Korea: Komesa Press Sách, tạp chí
Tiêu đề: Computer-Adaptive Testing: A Methodology Whose Time Has Come
Tác giả: John Michael Linacre, Ph.D.MESA Psychometric LaboratoryUniversity of Chicago
Năm: 2000
[17] K. Wauters, P. Desmet, and W. Van Den Noortgate, “Adaptive item-based learning environments based on the item response theory: Possibilities and challenges,” Journal of Computer Assisted Learning, vol. 26, no. 6, pp. 549–562, 2010 Sách, tạp chí
Tiêu đề: Adaptive item-based learning environments based on the item response theory: Possibilities and challenges
[19] Salma Parhizgar (2012). Testing and Technology: Past, Present and Future, Shiraz University, Shiraz, Iran. ISSN 1799-2591 Sách, tạp chí
Tiêu đề: Testing and Technology: Past, Present and Future
Tác giả: Salma Parhizgar
Năm: 2012
[20] Van Der Linden WJ (1998). Bayes Item Selection Criteria for Adaptive Testing. Psychometrika, 63, 201–216 Sách, tạp chí
Tiêu đề: Bayes Item Selection Criteria for Adaptive Testing
Tác giả: Van Der Linden WJ
Năm: 1998
[4] Trần Kiêm Hồng (2008), Trắc nghiệm khách quan trong đánh giá năng lực nhận thức của người học Khác
[10] Bernard P. Veldkamp, Mariagiulia Matteucci (2013), Bayes Computerized Adaptive Testing Khác
[18] Michel C. Desmarais and Xiaoming Pu (2005). Computer Adaptive Testing: Comparison of a probabilistic network approach with Item Response Theory.Ecole Polytechnique de Montreal, Montreal, QC, Canada Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w