LOT CAM BOAN Tôi xin cam đoan, Luận văn Thạc sĩ Đo lường và đánh giả trong giáo dục với đề tài “Triển khai dánh giá kết quả học tập môn oán lớp 12 bằng một dễ tổng kẹp với các câu hỏi nh
Trang 1
ĐẠI HỌC QUOC GIA HA NOT TRUONG DAI HOC GIAO DUC
TRAN VAN THANH
TRIEN KHAI DÁNH GIÁ KÉT QUÁ HỌC TẬP MÔN TOÁN LỚP
12 BẰNG MỘT ĐÈ TỎNG HIỢP VỚI CÁC CÂU HỎI NHỊ PHÂN,
ĐA PHẪN VÀ ĐA CHIẾU
LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC
Trang 2
ĐẠI HỌC QUOC GIA HA NOT TRUONG DAI HOC GIAO DUC
TRẢN VĂN THANH
TRIEN KHAI DANH GIA KET QUÁ HỌC TẬP MÔN TOÁN
LOP 12 BANG MOT DE TONG HOP VOI CAC CAU
HOI NHI PHAN, DA PHAN VA DA CHIEU
CHUYÊN NGÀNH: ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC
Mã số: 8140115
LUẬN VĂN THẠC SĨ NGẢNH GIÁO DỤC HỌC
Người hướng dẫn khoa hục: GS.TSKH LAM QUANG THIỆP
THã Nội - 2017
Trang 3LOT CAM BOAN
Tôi xin cam đoan, Luận văn Thạc sĩ Đo lường và đánh giả trong giáo dục với
đề tài “Triển khai dánh giá kết quả học tập môn (oán lớp 12 bằng một dễ tổng
kẹp với các câu hỏi nhị phan, đe phân và đa chiều” là công trình nghiên cửa
đười sự hướng din của GS.TSKH LÂM QUANG THIỆP
riêng của tôi,
Tôi xin cam doan:
- Luận văn là sản phẩm nghiên cứu của tôi
- Các thông tin, sẽ liêu, kết quã nghiên cửu trong luận văn là trung thực và chưa từng được ai công bó trong bất kỷ phương tiện thông tín đại chúng nào trước đây
Tôi xin chịu trách nhiệm về kết quả nghiên cửu của minh
Tác giả luân văn
‘Tram Văn Thanh
Trang 4LOT CAM ON
Tôi xin gửi lời cảm ơn trân trọng đến những người đã giúp đỡ tôi hoàn thành
luận van nay
Trước hết, tôi xin tran trọng cảm on các lãnh đạo Trường Dại Học Giáo dục,
Bô môn Đo lường và đánh giá, các thây, cô của trường Đại Học Giáo dục đã tận tỉnh giảng dạy, hướng dẫn và giúp đỡ lỗi trong quả trình học lập, nghiên cứu và làm:
hiện văn
Tôi xim bày tô sự biết ơn sâu sắc đến: GS.TSKH Lam Quang Thiện, thay
đã tân tâm giúp đỡ, hướng dẫn tôi trong quá trình nghiên cứu, thực hiện dễ tải Đặc
tiệt trong những lủe tôi gặp khó khán vẻ định hướng, động lực nghiên cứu, thây đã
n kế
động viễn và hướng đẫn tôi
‘Téi xin chan thành cam on déng nghiệp, gia dinh va bạn bè dã luôn dộng, viên, khuyên khích tôi trong suốt quá trình học tập và nghiên cứu
“Xin chan thanh cam on
‘Tac giá luận van
Tran Van Thanh
Trang 5DANH MỤC CAC HINH VE
DANH MUC CAC BANG BIRU
MO DAU
1 Ly do chon để tài
2 Mục dich nghiéu edu
3, Đối tượng và khách thể nghiên cửu
4 Câu hỏi nghiên cứu và giả thuyết nghiên cứu
5, Phương pháp nghiên cửu
6 Giới hạn và phạm vĩ nghiên cứu
7 Cầu trúc của luận văn
Chương 1: Cơ sở lý luân và tổng quan vẫn dễ nghiên cửu
1.1 Tổng quan vé do luởng trong giáo dục
1.1.1 Các khái niệm co ban vé đo lường đánh giá
1.1.2 Cáo phương pháp do lường trong giáo dục
1.3 Dénh giá kết quả học tập của học sinh
1.1.4 Công cụ đo lưỡng kết quả học tập
1.1.5 Sơ lược về khoa học do lường dánh giá trên thể giới và Việt Nam
1.2 Lý thuyết đánh giá cố điễn
1.3.1 Các tham số đặc trưng của câu hỏi trắc nghiệm và phân tích để trắc
Trang 61.3.1 Tổng quan về lý thuyết ứng dap cau hoi
1.3.2 Hàm đặc trung câu hỏi
1.3.3 Điểm thực và đường cong đặc trưng đề trắc nghiệm
1.3.4 Hàm thông tia của câu hối và cúa dé trắc nghiện:
1.3.5 Ước lượng năng lục thí sinh và tham số sâu hỏi
1.3.6 So bằng và kết nói các đề trắc nghiệm
1.3.7 Vẻ trắc nghiệm da phan va trac nghiệm da chiéu
1.3.8 Ví dụ về ước lượng tham số câu hỏi
Chương 3: Tổ chúc và thực hiện xây dung dé thi
2.1 Đặt vẫn để
2.2 Quy trình xây đựng một đê thị, để kiếm tra
3.3.1 Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan
2.2.2 Quy trình triển khai một ký thi trắc nghiệm khách quan
3 Xây đựng đẻ thi môn toán
3.2 Phân tích tham số câu hỏi thi
3.2.1 Phân tích câu hỏi thi bằng CTT
3.3.3 Phân tích câu hỏi thí bằng lý (huyết khảo lì hiện đại
3.2.3 Phan tich cau hoi thi da chiêu
3.2.4, Phin tich cau hỏi thí đa phân
3.3 Một số kết quả phán tích câu hỏi hi
iv
Trang 73.3.1 Quy trình hiệu chuẩn dẻ kiểm tra
3.3.2 Cáo đặc trưng vẻ các để thử nghiệm
Phụ lục 1: Phân phối chương trình toán Lớp 12
Phụ lục 2: Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến
thức kĩ năng bộ giáo dục ban hành
Phụ lục 3: Định dạng biên soạn câu hơi thủ
Phụ lục 4: Đặc tâ nội đung kiến thức từng câu hồi theo ma trận trọng số
Trang 8DANH MỤC CÁC TỪ VIẾT TAT
DKVP Dé kho vira phai
DICH Đặc trưng câu hồi
NHCH Ngân hàng câu hỏi
PCM Partial Credit Model
Trang 9DANH MUC CAC BANG BIEU
1 | Bàng 11 Sosánh ưu nhược điểm của đẻ thi TNKG và tự hận 10
3 | Bang 1.3 Mé ta cau nhém cdc cau hỏi trắc nghiệm 19
4 | Bảng L.4 Dữ liệu thử nghiệm của câu hối thi 4L
5 | Bảng 1.5 Dữ liệu tính toán ước lượng hàm đặc trưng câu hồi 4
6 | Bảng 1.6 Dữ liệu tính toán ước lượng hàm đặc trưng câu hồi 4
9 | Bang 2.3 Bang mô tả chú tiết từng câu hỏi trong dé thi 55
10 _ | Báng 2.4 Quy trình biên soạn câu hỏi thị 60
13 | Bảng 31 Dộ khó? của một câu hỏi trắc nghiệm sé 1 70
14 | Bảng 32 Bảng tham số các hỏi thi về mức độ phù hợp 71
15 _ | Bảng 3.3 Phân tích đa chiều năng lực của TS với để thi 01 8L
vii
Trang 10
„_ | Hình 1.2 Cáo đường cong ĐTĨCH hai tham số với các giá trị a khác | _-
Hinh 1.6 Các đường cong ĐLCH trắc nghiệm nhị phân ứng với xác
—_— | Hình 1.7 Các đường cong ĐTCH của một CH DƠM có 3 hạng điểm
8 | Hinh 1.8 Mặt ĐTCH với 2 chiều nắng lực Ô,Ô; 37 ọ_ | Bình 1 9 Hai kiểu biến hiện tính da chiếu của các ofu hoi uke „
nghiệm
12 | Hình 1.12 Ước lượng ham đặc trưng của câu hỏi AL
13 | Ainh 1.13 Tham sd ude lugng cita cin hai 4
14 | Hình 1.14 Đồ thí hàm đặc trưng của câu hôi 4
15 | Ainh 1.15 B6 thi cia ham đặc trưng câu hôi 4 1g | Hin L1 Fin ảnh ước lượng tham số câu Hỏi với tập mẫu có Z
năng lực thâp
l THình 1.17 Tinh ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực cao Z
viii
Trang 11Tình 1.18 Hình ảnh ước lượng tham số câu hỏi với lặp mẫu có
19 | Hinh3.1 Đề thị hàm đặc trưng câu hỏi số 4 73
20 | Hình 3.2 Đỗ thị hàm đặc trưng câu hỏi số 21 73
21 | Tlinh 3.3 Dé thi ham đặc trưng câu hỏi số 39 74
22 | Tlinh 3.4 Dé thi ham đặc trưng câu hỏi số 40 74
23 | Tlinh 3.5 Ban để phân bế độ khó câu hỏi thi và năng lực thí sinh 75
24 | Tĩình 3.6 Dường cong đặc trưng của để thị số L 7?
» Hình 3 14 Biểu đỗ tương quan giữa năng lực của thí sinh và dộ khó |
Trang 12lớn
TRnh thức kiểm tra trắc nghiệm cũng được triển khai trên thể giới tì những năm
đầu thể kỹ 20, và được du nhập vào nước la tại một số thời điểm trước năm 75 ỡ miễn Nam Đặc biết bộ giáo duc (BGD) da bat đầu dưa vào kì thi Quốc gia với các môn Lí,
Hóa, Sinh, Ngoại ngữ từ năm 2007 và các môn Toán, Sử, Địa từ năm 2017 hinh thức
thi trắc nghiêm khách quan Các ưu điểm nổi bật của kì thí đã được chứng mình như
khách quan, công bằng, tiết kiệm thời gian, tiên bạc Tuy vậy việc dưa kì thí vào tương, đối vội vàng, chưa có chuẩn bị đào tạo một cách bai bản nên gây nhiều khó khăn cho
giáo viên, học sinh trong oác khâu kiểm tra, đánh giá Đặc biệt hơn đo chưa có kinh
nghiệm nên các đề thị trắc nghiệm khách quan được biên soạn chú yếu với đo được
kiến thíc ở mức nhận biết, thông hiển, còn các thang kiên thức ở mức áp đụng, phân
tích, tổng hợp chưa do lường một cách chính xác Điều đỏ là một phần khó khăn cho
việc phân loại học sinh với các môn tư duy logie cao như môn toán
Việc học và thị trên thế giới đã diễn ra hàng nghìn năm trước đây, nhưng một khoa hoc vé đo lường trong giáo dục thật sự cá thể xem nhu bat dau tir thé ki XX, tai châu Au va phat triển mạnh khi du nhập vào Hoa Ky [3, tr 51]
Trong đo lường giáo dục, hai hệ lý thuyết đánh giá cơ bân đăng được sử dụng
Trang 13Ly thuyét danh giá cỗ dién (Classical Test Theory - CT1)
Ly thuyét danh gia hién dai (Modern Test Theory)
Hién nay cách thức xây dung dễ ti da số dựa theo lý thuyết đánh giá gỗ điển, nhưng cách phân tích đánh giá câu hỏi thị, đề thị trường kết hợp cả lý thuyết đánh giá
cố điền lẫn lý thuyết đánh giá hiện đại Hai hình thức đánh giá này thường bồ xung các tru nhược điểm cho nhau nên chúng thường dược sử dụng đồng thời Một trong những, trở ngại của lý thuyết khảo thí cổ điển là vẫn để chon mẫu, chuẩn hỏa và so bing Ly
thuyết khảo thì hiện đại, thường được gọi là lý thuyết ứng đáp sâu hỏi TRT) hoàn toàn
để dàng khắc phục các khó khăn nảy nhưng lại só những tính toán ước lượng phức tạp Khoảng hai chục năm gân day, cic nghiên cứu sâu vẻ IRT điễn ra ở nhiều nơi trên thế
giới đặc biết là Hoa Kì Tuy vậy các bài viết về TRT chủ yến mang tính lí thuyết, năng
nê về các công thức toán học nên việc triển khai, ứng dụng IRT trong công tác xây đụng để là chưa nhiêu, chủ yêu sử đụng TRT trong công việc phán tích đánh giá đề thi
Lý thuyết đo lường hiện đại đã đân chứng tổ các ưu điểm của nó so với lý
thuyết đo lường gỗ điển Hiện nay cáo công cụ hỗ trợ tính toán phức hợp (nảy tỉnh điện tứ, phân mềm chuyên dụng, ) được phổ biến thì nhu cầu ủng dụng các kết quá
nghiên eứu của lý thuyết khảo thí hiện đại vào thực tê ra đề thi trong cdc ki thi quốc
gia hay trong các nhà Irường phổ thông cảng trở nêu bức thiết Với mong muốn lý
thuyét LRT sớm dược phố biển trong công tác khảo thí đo lường ở Việt Nam, tối chọn nghiên cứu để tài “Triển khai đảnh gid kết quả bọc tập môn toán lớp 12 bằng một để
ting hợp vửi các câu hội nhị phân, du phân và da chiêu” nhằm thiết kế bộ do năng lực
môn toàn của học sinh phỏ thông, kiểm tra đảnh giá được một cách hệ thống vá toàn diện kiên thức và kỹ răng cia hoc sinh sau khi học xong môn toán lớp 12 Đồng thời đưa ra một quy trình xây đựng dé thi co umg dụng lý thuyết khảo thí hiện đại vào quá trình xây dựng để Lừ đó có thể đánh giả ưu nhược điểm của các hình thức vả cách thúc ra đề
Xem xét hai hình thức đo lường đánh giá này có bố xung, tốn tại cùng nhau hay loại
trừ nhau Điều nảy làm cho các kỉ thí kiểm tra, đánh giả năng lực của học sinh trở nên
đơn giản và chính xác hơn
2, Muc dich nghiên cứu
Trang 14Nghiên cửu tập chung tim hiểu cách xây đựng, thiết kế một dễ thị môn toàn lớp
12 và phân tích đánh giá đề thí theo lý thuyết đánh giá hiện đại (RT)
3 Đỗi tượng và khách thể nghiên cửu
Đôi tượng nghiên cứu: Cơ sở lý luận của việc kiểm tra đánh giá kết quả học lập của học sinh ở nhà trường phổ thông, phương pháp soạn thão, phản tích hệ thống câu hôi thì theo lý thuyết đánh giá hiện đại
Khách thể nghiên cứu: Nội đưng và các yêu cầu về kiến thức, kĩ năng môn toán lớp 13 Học siuh đã hoàn thành chuơng trình loán 12
4 Câu hỏi nghiên cứu và giả thuyết nghiên cứu
Việc xây dung đề thí nói chung và để thí THPT quốc gia nói riêng cho đến nay
van dang dién ra chủ yếu dựa trên cơ sở của lý thuyết đánh giá cỗ điển, phụ thuộc
nhiều vào các chuyên gia (câm tính) ra đề Mức độ khó để, phân biệt, giá tri, tín cây của câu hỏi trong các dé thi phụ cảm tinh nhiều vào hội đồng ra đề thí (tuổi tác, giới
tính, vùng miễn, trình độ ) nên việc chỉnh sửa những câu hỏi thí không tốt trong các
để lim thử nghiệm là ái khó khăn Xây dựng ngân hàng câu hỏi một cách khách quan,
ti cậy, giả trị luôn dược dặt lên hang đầu trong mỗi kí thí Mặc đủ có nhiều khó khăn khi tiếp cận IRT (oảc nghiên cứu về TRT chủ yếu là lí thuyết chưa có nhiêu triển khai mang tính ứng dụng, các công thúc tính toán nhiều, sần phần mềm chuyên đụng, .)
nhưng lý thuyết IRT sẽ phân nảo đáp ứng được việc xây dựng một ngân hảng câu hỏi,
ngân hàng đẻ theo sát các tiêu chí của một để thì quốc gia trung học phỏ thông Dn vậy
việc xây dựng ngân bảng câu hỏi thú theo dịnh đang cầu hôi nhị phân, da phân, da
chiêu đang là bảt toán được tập chung nghiên cứu nhiều gân đây không chí ở trên thể
giới mà ở Việt Nam cũng đang được quan tâm
Câu hỏi nghiên cứu:
Câu hỏi 1: Việc xây để thi môn toán lớp 12 ứng dụng theo lý thuyết đánh giá
hiện đại cần thục hiện như thế nào?
Câu hồi 2: Phân tích các câu hỏi thì nhị phân, da phân, da chiều trong một để thì
có giúp nâng, cao chất lượng đề thi hay không?
Trang 15Gia thuyết nghiên cứu: Dụa trên muc dich cia ki thy, nguyên tắc viết câu hỏi thí, ta có ma trận chỉ tiết của đề thị từ đó xây đựng để thí Thủ nghiệm và xác định tham số đặc trưng của câu hồi thi từ đó đánh giá chật lượng câu hải thị, tiến đên chuẩn
hỏa đề thí
Trang 165 Phương pháp nghiên cin
Nghiên cửu sử dụng cá phương pháp định tính và định lượng trong việc thu thập và xử lí thông tin Nghiên cứu dự định tiến hành thông qua ba giải đoạn: Nghiên
của cơ sở lý thuyết, xây dựng mỏ hình nghiên cửu và các thứ nghiệm Các phương, pháp nghiên cứu được sử dựng kết hợp phù hợp trong từng giai đoạn nghiên cửu
Nghiên cơ sở lý thuyết: Cơ sở lý luận của kiểm tra đánh giá trong dạy học, lý thuyết ứng đáp câu hỏi Nghiên cửu những lài liệu về kĩ thuật viết câu hỏi thí Nghiên cứu về các phần mém phan tich danh giá kết quả thị đặc biệt là phần mềm Conquest
Xây dựng mô hình nghiên cứu: Kghiên cửu co sở lý thuyết của lý thuyết khâo
thí hiện dai (IRT) X4y dimg ma tran đề thi và viết các câu hỏi thi Dùng phần mém
Ác đánh
Conquest để phân tích các câu hội thi Tir 46 định chuẩn một để thí mẫu và có
giá phân tích sơ bộ các tham số dặc trưng: Độ khó, dộ sai biệt, dộ tin cậy
'Thực nghiệm: Thực nghiệm lây mẫu, nhằm dánh giá dễ kiểm tra trắc nghiệm khách quan vẻ độ tin cậy, độ giá trị và tính khả thí của nó Phân tích đánh giá chất
Tượng của để thi
6 Giới hạn và phạm vi nghiên cứu
Xây dựng và phâu tích một đề thì rên toán lớp 12 và phân tích một để thủ môn toán bằng phần mém Conquest
” Cầu trúc của luận văn
Ngoài phan mé dau, phan két luận, khuyến nghị, luận văn gồm 3 phản sau:
Chương L: Ca sở lý luận và tổng quan vẫn đề nghiên cứu
Chương 2: Tổ chức và thực hiện xây dựng để thị
Chương 3: Kết quá nghiên cứu
Trang 17CHUONG 1
CO SG LY LUAN VA TONG QUAN VAN DÈ NGHIÊN CỨU
1.1 Tổng quan về do lường trong giao duc
Cùng với xu hướng chung là đổi mới nội đung và phương pháp giảng dạy trong
nhà trường Đo lường, đánh gia trong giao đục là một quá trình quan trọng, quyết định
sự thành bại của quá trình dải mới đó Đo lường tong giáo dục là công cụ để xác định
năng lực nhận thức người học, điều chỉnh quá trình đạy học, điều chỉnh nội dung,
phương tiện hỗ trợ quá trình dạy học nhằm đạt đuợc được các mục tiêu, mục đích giáo đục để ra Đôi mới phương pháp, nội dụng dạy học dược chú trọng dễ đáp ứng những,
yêu câu mới của mục riêu giáo đục Do vậy việc kiếm tra, đánh giá phải phải theo sát
quá trình giảng đạy và mục tiêu giáo dục để ra
Hầu hết các đại lượng tâm lý là các thuộc tính của tư duy, mả tư duy thủ không thể quan sắt trực Hếp (dại lượng ân), nhưng vẫn cỏ thể do một cách giản tiếp thông qua các hành vi có thể quan sát được của con người Ví dụ: để biết một học sinh có năm được nội dung của môn học hay không sau khi học xeng môn học đó, một bài kiếm tra
có thể cho chúng, ta biết một cách chính xác: học sinh đỏ hiểu đến mức nảo (chỉ nhận
biết khái niệm một cách máy móc hay oèn có khả năng đánh giá, chuyển giao nhận
thức của mình) Các công cụ đo lưỡng, quan sát (ví dạ bài kiểm tra) cần được thiết kế cần thận, có độ tr cậy cao để ghi nhận chỉnh xác các hành vị, làm cơ sở để xác định
đại lượng ân Đo lường nói chưng đòi hôi độ chính xác và chính xáo, vì kết quả được
hé tro dé có ý nghĩa đô để cụng cấp thông tín đáng tin cậy cho các hình thie ra qu
định khác nhau
1.1.1 Các khải niệm cơ bần về đo hường đánh pid
Đo lưỡng là quả trình mô tả mức độ cá nhân đạt được (hay đã cỏ) một đặc điểm
nào đỏ (nhu khả năng, thái độ, ) được ước hượng bằng những con số cụ thể Ví đụ
Học sinh X làm bài kiểm tra đạt diễm 8 Hợc sinh Y làm được 3⁄4 số điểm tối da của
bai thi tric nghiệm Toán lài của học sinh M được xếp hang k trong lớp Các điểm số
5, 3/4 hay thứ hạng k là những ký hiệu gián tiếp chỉ ra khả năng của học sinh về mặt
đính lính hay định hang [4, tr 352 - 353] Đo lường thành quả học tận là lượng giả
6
Trang 18mức độ đạt dược các mục tiêu cuối cùng (terminal) hay tiéu chi (criterion) trong mét
khóa học, một giai đoạn học
Trac nghiệm là một dựng cụ hay một phương thức hệ thống nhằm đo lường
thánh tích của một cá nhân so với các cá nhân khác hay so với những yêu cân, nhiệm
vụ học tập đã dược dự kiến Trong lĩnh vực giáo dục, thường dùng chữ “tắc nghiệm thành quả học tập” hay “trắc nghiệm thành tích” Trong trường học, từ “trắc nghiệm”
nghiệm khách
được dùng như là một tình thức kiếm tra, đánh giá học si: “Trả
quan”, không phải hiểu theo nghĩa đối lập với một do lường chủ quan nao, ma nén
hiểu là hình thúc kiếm tra này có tính khách quan cao hơn cách kiếm tra, đánh giá
bằng luận để (hình thức kiểm tra bự luậu) chẳng hạn Các điểm số thu thập được từ một bài trắc nghiệm thành tích có thể cùng cấp hai loại thông tin: (1) loại thứ nhất là mức
độ người học thực hiện được tiêu chỉ đã được ấn định, chẳng han như giải được đứng
xột bài Toán thông kê mô tâ, giải thích đúng các kết xuất (outpul) của một chương
trình thống kẽ v.v., không cân biết người ấy làm giỏi hơn hay kém hơn những người
khác, (2) loại thứ hai là sự xếp hạng tương đổi của các cá nhân liên quan đến mức độ
thực hiện của họ về bài trắc nghiệm đã ra, chẳng hạn học viên A có thể giải các bài
toán nhanh hơn, hoặc giới hon hee vién B [4, tr 364 - 366]
Kiểm tra là một hoạt động nhằm cung cấp những số liệu, những théng tin lam
cơ số cho việc giám sát, đánh giá Kiếm tra là một phân của quá trinh đạy học và có ảnh hưởng đến cuộc đời của tôi cũ học sinh Vi vậy giáo viên cầu quan tâm đến những, yêu tổ ảnh hưởng dến việc kiểm tra như: dễ thú phải rõ ràng, phủ hợp với mục dịch
kiếm tra, phải đọc và kiếm tra nhiều lần để không có những sai s : phía học sinh
không bị mất lập Irung chú ý Irong suốt thời gian làm bài
Lượng giá là dưa ra những thông tin ước lượng về trình đô, năng lực, phẩm chất của một cá nhân, một sắn phẩm, v.v, dựa trên các số đo cụ thể hoặc quan sát
được Trong day hoc, dua vào các điểm số một học sinh đạt được, người thay giáo
(hay nha quan ly gido dục) có thể ước lượng trình dé kiến thức, kỹ năng kỹ xảo của
học sinh đó Ví dụ: học sinh A hoàn thành xong 2⁄3 bài thí toán đại số được lượng giá 1à thuộc loại trung bình
Trang 19Danb gia 1a quả trình thu thập, diều tra, phân tích và giải thích thông tin một cách có chủ đích, hệ thẳng nhằm xác định mức độ đạt đến các mục tiêu đã đề ra Như vậy, số đo cung cap cho ta số liệu ding dé danh giả, còn việc suy đoán, diễn giải những con số này biển chúng thành sự đánh giá Ta có thể nói thêm về đánh giá như
sau: Dánh giá là mệt quá trình trong đó ta đưa ra những giá trị heặe án định những giá trị cho một cải gì đó Đặc điểm quan trọng của sự đánh giá đó là khả năng xét đoán
Danh giá thường mang tính định lượng Nó dựa trên những con số hoặc các tỉ lệ phẩn
trăm Sự xét đoán khi đánh giá gắn với một giá trị (định lượng) hay sự mô tả định tính
căn cứ vào số đo trên một bài kiểm tra Đánh giá là một quá trình gồm hai bước Bước thứ nhất dó là kiểm tra, trong đó sẻ liệu thu thập từ việc sử dụng một hoặc một chuỗi các bài kiếm tra Khi việc kiếm tra được thục hiện thì sự xét đoán cũng được thực hiện
về trình độ, thường là trong bối cảnh các mục đích có hướng dẫn
; Độ tín cây của một dụng cụ do là khái miệm cho biết mức dỗ ôn dịnh,
vững chãi cửa các kết quả đo được khi tiến hành đo vật thể đó nhiều lẫn Thí dụ có một
gói mút khi đặt lên cân, lần đân báo 750 gam sang lần thứ hai báo 735 gam, lần thứ ba
tảo 765 gam, v.v Ta nói cái câu nảy tim cậy Tương tự một bài trắc nghiệm được gọi
là tin cậy khi một học sinh làm nhiều lần bài trắc nghiệm nảy vào những thời điểm
cách xa nhan thi các kết quả điểm số thu được đến khá ỗn định (các điểm số của các
lân đo không chênh lệch qua nhiễu) Độ tin cây thường được È
êu hiện bằng một con
số trong khoảng từ 0 dén 1 Dé ién cang gân với I thì đụng cụ cảng tin cậy Ví đụ:
siêu từ 0.80 trở lên thì độ tin cậy được gọi là cao từ 0.40 đến 0.79 thi trơng đối tin cây, đưới 0.40 là tím cậy thấp
Giá trị: Độ giá trị của ruột dụng cụ do là một khái niệm chỉ ra rằng dụng cụ này
có khả năng đo đúng được cải cần đo Thí dụ: Một vật có trọng lượng thực là B00 gam
Nếu khi bỏ lêu cân thấy báo trị số 800 gam, la nói cấi cân này gid trị Con thay lráo là
700 gam, cân sẽ không giả trị vì không do đúng được trọng lượng cần do, Đặt vật lên,
xuống để cân nhiều lân, lân nào kết quá cũng không xé dich khối 700 gam, †a nói cân
6 tín cây nhưng không giá trí
1.1.2 Các phương pháp đo lường trong giáo dục
Trang 20Hiện nay ở Việt Nam dã biết dến một hệ thống phương pháp và kỹ thuật dank giá khá phong phú Vẻ phương pháp đánh giá có thẻ kể ra: quan sát, vẫn đáp, viết Trong viết còn bao gêm nhiều hình thức như: trắc nghiệm tự luận (tr luận), trắc nghiệm khách quan hay còn gọi là trắc nghiệm
Theo |3 và ý kiến của các chuyên gia về do lường đánh giá, la nên sử hình thức
kiểm tra tự luận để khảo sát thành quả học tập trong những trường hợp đưới day:
(1) Khi nhóm học sinh dy thi hay kiểm tra không quá đông và đẻ thi chỉ được
sử dựng một lần, không dùng lai nữa
(2) Khi thảy cô giáo cổ gắng tìm mọi cách có thể được để khuyến khích và khen thưởng sy phat triển kỹ năng, diễn tả bằng văn viết,
(3) Khi thay giáo muốn thăm dò thái độ hay tìm hiểu tư tướng của học sinh về một vẫn để nào đó hơn là khảo sát thành quả học tập của chúng
(1) Khi giáo viên tin trởng vào tài năng phê phán và chấm bài luận đề một cách
vô tr và chính xác hơn là khả năng soạn thão những câu trắc nghiệm thật tết
G) Khi thời gian soạn thảo bài khảo sát không nhiều
Mặt khác, la rên sử dụng trắc nghiệm khách quan trong những trường hợp sau:
(1) Khi ta cần khảo sát kết quả học tập của một sẻ lượng lớn học sinh, hay
muốn rằng bài khảo sát ấy có thể sử dụng lại vào một lúc khác
(2) Khi la những điểm ính xác khách quan, công bằng và nhanh chúng
(3) Khi la sần kiểm tra toàn điện kiên thức, ngắn ngữa gian lên thì cử
Cả trắc nghiệm lẫn tự luận đều cé thé sir dung dé:
Œ) Đo lường mọi thành quả học Tập mà học sinh thu nhận được ỡ các mức độ nhận thức
(2) Khao sat được các khá năng hiểu, suy nghĩ cỏ phê phản, giải quyết các vẫn
đề mới, phân tích, tổng hợp
(3) Khuyến khích, gọi động cơ học tập để nắm vững kiến thức
1.1.3 Đinh giá kết quá học tập của học sinh
Trang 21Với từng môn học thị cáo mục tiêu trên được cụ thé hoa thanh các mục tiểu về kiển thức, kỹ năng và thái độ Mục đích của giáo dục là sự tiền bộ của học sinh Dây chính là kết quả cuối cùng của quả trình học tập nhằm thay đối hành vi của học sinh Khi nhìn nhận mục tiêu giáo dục theo hưởng kết quả học tập, cần phải lưu tâm rằng
chủng ‡a đang để cập đến những sản phẩm của quá trình học tập chứ không phải bản
thân quá trình đó Mối liên hệ giữa mục tiêu giáo duc (san phẩm) và kinh nghiệm học tập (quá trình) dược thiết kế nhằm hướng tới những thay dối hành vị theo như mong mudn Vậy đánh giá kết quả học tập là quá trình phản hẻi thông tin, chât lượng giảng
dạy tới người quân lý, người dạy và người học
Khoa học đánh giá ngày oàng phái h loại hình đánh giả kết quả học lập
của học sinh dược phân loại theo các quan diễm tiếp cận mà có các loại hình đánh gia sau: đánh giá trên điện rộng và đánh giá trên lớp học, đánh giá chấn đoán, đánh giá ban dẫu, dánh giá trong tiên trình và đánh giá Lông kết Ngoài ra xét theo rnục tiêu học tap 3€ co hai loai dinh gid [A Assessment for Leaming (Đánh gid dé cai tiền việc học
14p) va Assessment of Learning (Dénh giá kết thúc giai đoạn học tập) Mỗi loại đánh
giả sẽ có mục dích dánh giá, phương pháp đánh gió, công cụ dánh giá và các khuyến nghị khác nhau
LILA Công cụ do lường kết quả học tập
Hoạt động danh giá dào tạo dược ra dời và phát triển song, sơng, cùng với hoạt
động đảo tạo Việc lượng hóa giá trị kết quả học tập nhờ sử đụng hình thức thị trắc
ngbiém (lest) 1a muội công đoạn quan trọng Irong quả trình dạy học Trắc nghiệm theo
nghĩa rộng là một hoạt động được thực hiện để đo lưỡng năng lực của các đối tượng
mảo đỏ nhẫn những mục đích xác định, chẳng hạn, phân loại thú sinh, tìm ra thứ sinh
nỗi trôi, sàng lọc ra những thí sinh chưa dạt chuẩn Trong giáo dục trắc nghiệm dược tiễn hành thường xuyên ở các kỳ thị, kiểm tra hay sát hạch nhằm đánh giá kết quá học
tập và giảng dạy đối với một phần của môn học hoặc toàn bộ môn học hay đổi với cả
một cấp học Ngoài ra trắc nghiệm cũng có thể dược sử dụng nhằm lọc chọn một số người có năng lục cao nhất vào học một khoá học nao đó Hiện nay trong giáo dục phổ thông có hai hình thức chủ yếu do hrang kết quả học tập của học sinh là cân hỏi trắc nghiêm tự hiận gợi tốt là
xét hai hình thức thì đưới bảng so sánh sau:
10
âu hỏi tu Ivan va cau hoi trac khach quan (TKKQ) Ta xem
Trang 22Bang 1.1 So sánh uu nhược điểm của đề thì TNKQ và tự luận
Ap dung được công nghệ mới trong việc nâng cao chất lượng
kỳ thủ, giữ bí mật để thi, hạn chế quay cóp khi thị, hạn chế | x
tiêu cục trong chắm thi và giúp phân tích kết quả thi
Nắm vững bản chất từng phương pháp củng điều kiện cơ sở vật chất và công, nghệ triển khai cụ thể, đề sử dụng hợp lí, tối tru mỗi phương pháp Theo [3, tr 29 — 36]
ta cd bang so sánh ưa nhược điểm cửa các hình thức thí TỊ, và TN như sai
Bảng 1.2 Hình thức thí TNKQ và tự luận
Một bộ câu héi trong dé mai | Một bộ câu hỏi trong đó mỗi
câu hỏi đều kèm theo các | câu hỏi không kèm theo các Tình thức cả TA HO ĐH tượng an rã lời cho sẵn để | phương án trâ lời mà học sinh en a ad ae
Trang 23Co nhiéu cau héi nén khé nho,
Hoe sinh khé sit dung tài liệu, | Học sinh dể quay cớp sử dụng,
loại trừ tiêu gực Grong Uni cử tài liệu, tiên cực trong thì cử
1uỏ phương án Học sinh có thể đoản mỏ trả lời đủ
Đô Em cây cao
Có thể danh giá dây đã các
mức nhận thức nếu các câu hôi
được soạn kỹ
Đô tu cậy thập
DE danh giá được các mức nhận thức cao (phân tích, tổng hợp, đánh giả)
Đao quát toàn bộ chương trình
nên dánh giá chỉnh xác hơn, có
thể có độ má trị cao hơn
Không bao quát toàn bộ
chương trình nên độ giá trị có
cau héi thi
Châm diém khich quan, công
bang
Có nhiều phin mém để phân
tích, đánh giá câu hỏi lựa
chọn những cầu hỏi có chất
chủ quan của người châm
Khó phản tích, đánh giá cầu hồi
Trang 24
1.1.5 Sơ lược về khoa hoc do leồờng đánh giả trên thể giới và Việt Nam
1.1.3.1 Sơ lược về khoa học đo lường đánh giá trên thế giới
Lý thuyết trắc nghiệm đã được xây dung và đưa vào ứng dung trong các trường
đại học ở Mỹ và một số nước khác từ khá sớnn (bắt đầu từ những năm 1920) Tý thuyết
trắc nghiệm là cơ sở khoa học giúp đánh giả chất lượng của bài thí trắc nghiệm (thông
tiên Btanford Achievement Test ra dời vảo năm 1923, Cho dến nay có hai hệ lý luận
chinh ding trong lý thuyết do lường giáo duc, đó là: lý thuyết trắc nghiệm cô điển
(Classical Test Theory - CTT); ly thuyét tmg dap céu héi (Item Response Theory - 1RT) LRT ra đời sau CTY vẻ bign nay tén thé gidi LRT duge ap dung rộng rãi trong các hệ thông đánh giá giáo dục, đạo biệt là ở Mỹ,
khác
Australia và một sô nước phát triển
Hai cach tiếp cận thông kê về lý thuyết đo lường, thường được gắn nhấn như là
"cổ điện" và "hiện đại" (lý thuyết ứng dap câu hói) (Gustaffson 1977, Crocker va
Algina 1986) Mặc dù chúng tuong đổi khác nhau, nhưng không nên xem chúng như
các đối thủ bởi chúng bỏ sưng các ưu hược điểm cho nhau Có lẽ vấn để khác biệt có
thể dược hiểu lá sự phụ thuộc vào mẫu vả so bằng của bai kiểm tra số diễn Điểm số được tính trên cơ sở các thủ tục phản tích cổ điển cung cấp thông tìn về khả năng của thi sinh chi & mot mere độ bạn chế Ngoài ra, vỉ kiểm tra các đặc tỉnh của thí sinh dược xác định trên cơ sở hồi đáp của một tập hợp hợc sinh, chỉ có thể được tái sử dụng với
củng một tập học sinh đó hoặc với một tập học sinh mới có những đặc điểm tương, đẳng với tập học sinh dã che - một trở ngại lớn trong cách hiệu quả xây dựng ngân hàng câu hỏi
liên cạnh về sự nghiên cứu và phát triển của lý thuyết khảo thi cỗ điển (CT1) những năm đâu thể kỉ 20 ở châu Âu và Mỹ, từ thập niên 50 những công trình đâu tiên
về lý thuyết khảo thí hiện đại TRT) để được công bổ Allen Bimbaut đã viết một loại
các bảo cáo kỹ thuật về các mỏ hình và mô hình kiếm tra dánh giả tham số vào nim
14
Trang 251957 va 195%, George Rasch (1960) xuất bản cuốn sách của ông để xuất một số mô
hình cho ứng đáp câu hỏi Trong những năm 1960, nhiều công việc trong lĩnh vực này
đã được đóng góp bởi Baker (1961) về so sánh thực nghiệm giữa các tiêu chí của bài
thi Có thể kế ra và Novick (1968), va Wright (1968) da lam việc trên cáo mô hình nhị
phân Samejima dé xuất mô hình đa phan trang nam 1969 Nhỏm học giả này đã mang,
lại các kết quả đáng kế trơng lĩnh vue nay Thông qua những năm 1970 và 1980, mội nhóm học giả mới nổi lên bao gồm Aldrich (1978), Anderson (1977, 1980),
Hambleton va Swaminathan (1986), Wright and Stone (1979), Swaminathan va Rogers (1981), va Harris (1989) Cũng có những đóng góp quan trọng cho lý thuyết khảo thí hiện dại [B4] Vào những năm 2000, lĩnh vực LKT đã dược thúc dẫy bởi một làn sóng các nhà nghiên cứu mới, những người không chỉ mỡ rộng các khía cạnh lý thuyết (dự toán, xác định mô hình, và sự phủ hợp), mà côn năng cao các khia cạnh tính toán và ứng dụng của nó Nghiên cứu sâu rộng về LIÈT trong 50 năm qua năm đã được
thẻ hiện bằng sự gia tăng số lượng các gói phản mềm được thiết kế đề phân tích câu
hỏi dữ liệu phần hỏi từ các khảo sát hoặc kiểm tra Nhiễu phân mềm thương mại khác
của HT cũng được tạo ra như BILOG, MULTILOG, WINSTEPS, IRTPRO, MPLUS, QUEST, CONQUEST và HLM, là cáo ví đụ Quan trạng hơn nữa là một số gói IRT đã
dược phát triên trong phân mềm mã nguồn mở R dễ ước tính các mô hình HRT khác nhau cũng xuất hiện và đã được công nhận Iao gẻm các gói lim cho [RT không giới
han ((Rizopoulos, 2006), eRm cho các mô hình Rasch mở rộng (Mair & Hatzinger,
3007), mrL cho đánh giá da cấp và Baycsian của một số mô Tỉnh TRT (Fox, 2007),
gpem (Johnson, 2007) cho một đự toán Bayesian của mô hinh tín dụng một phân tang
qual, MCMCpack cho Rayesian TRT (Marlin, Quinn, & Park, 2011), và min cho TRT
da chiéu (Chalmers, 2012) De Boeck (2008) va Wilson (2008) da st dụng gói thông,
kê chủng lme4 và kết hop cac mé hinh Rasch theo mé hinh hén hop tuyển tính tổng,
du nay làm cho c@ thé str dung SAS PROC NLMIXED (SAS Tustitute Ine.)
Bước ngoặt chơ sự phát triển nở rộ là ý tưởng thay mô hình dạng vòm chuẩn má Birnbaum va Lord để xuất cho ham đặc trưng câu hỏi bằng mô hình logistie mà George Rasch để xuất Từ dây các khó khăn về mô hình toán hoc trong TRT dược thảo
gd Trén cơ sở IRT công nghệ trắc nghiệm thích ứng nhờ máy tính (Computer
15
Trang 26Adaptive Test CAT) ra dời Ngoài ra, trén co sd nhiing think ty etia IRT, céng
nghé E-RATL cham tụ động các bài tự luận tiếng Anh nhờ máy tính của IITS đã được triển khai nhờ mạng Internet trong nhiều năm qua Hiện nay một số nước Nhật, Thái Lan, 'Irung Quốc bước đầu áp dụng lý thuyết LỲT vào các kỉ tủ điện rồng của mình
Trang 271.1.3.2 Ứng dựng trắc nghiệm ở Liệt Nam
Khoa hoe về đo lường vá đánh giá trong giáo đục ở nước ta thực sự chưa được quan lâm đảng mức Trước đây do chiến Iranh, nên các chuyên gia về đo lường đánh giá ở miền Bắc gần như khỏng cỏ Trước năm 1975, ở Miễn Nam: nước ta có một vai người được đào tạo bài bàn về đo lường đánh giá như GS Dương Thiệu Tống Những
năm 90 bộ giáo đục đã bước đâu cỏ định hướng gửi đi đào tạo các nước phát triển các
chuyên gia vẻ đo lường đảnh giả, nhưng số lượng còn qua it Liiện nay ngay trong một
số trường sư phạm môn đo hường đánh giá vẫn chưa được giảng đạy như một môn học
chính khóa Các sách viết về khoa học đo lường cho đến nay chủ yêu của hai giáo sư
GS Duong Thiệu Tổng và G5 Lâm Quang Thiệp Các cuồn sách này tương đổi hàn lâm với đa số người đọc và giáo viên Tuy nhiên những năm gân đây các hội thảo,
khôa học ngắn về đo lường đánh giá đã được các trường đại học, bộ giáo dục lễ chức thưởng xuyên nhằm từng bước “xóa mủ”, phổ cập cho giáo viên vả các nhà quản lý giáo đục Các kì thủ trung học phổ thông quốc gia chuyển dan sang hình thúc thi trắc
nghiêm và ứng dụng khoa học khảo thí vào công việc thiết kế, xây dựng, phân tích để thi Đây lá một vẫn để khoa học tương đối mới nên đổi ngũ nghiên cứu, đảo tạo lắm chuyên môn về khỗa thí hiện đại chưa nhiễu chủ yếu các nhóm nghiên cứu nằm trong, trường hoặc liên quan dén ĐHQG HN
Trang 281.2 Ly thuyat danh gid c6 dién
Mặc dủ LRT dã dược nghiên cứu trong 5U năm qua, CTT vẫn được nghiên cửu
và áp dụng liên tục Nhiều chương trình thử nghiệm vẫn côn thực hiện CTT trong thiết
kẻ và đánh giá kết quâ kiếm tra Điển này là đo một số lợi thể CTT so với TRT Ví đụ, CTT mô tả mối quan hệ giữa điểm số thực và diễm quan sal theo một cách tuyển tính
Jam cho mé hinh CTT dé hiéu va áp đựng nhiều nhà nghiên cứu Nó đựa hoàn toân vào
tổng số điểm hoặc điểm số của chính các câu trả lời Điểm quam sát của thí sinh là Lỗng
số diểm đạt được của mỗi thí sinh vả nó khác với điểm số thực sự của một điểm sẽ lỗi
thêng thường Phương pháp tính điểm này đã tạo ra một số lợi thê cũng như han ché Tai thé dau tiên của CTT la các phân tích yên cầu kích cỡ rnấu nhỏ hơn TRT Thứ hai,
CTT thủ tục toán học dơn giản hơn nhiều so với LRT, vì các mô hình trong CLT là
tuyển tính trong khi các mô hình của IRT lả phi tryến Thứ ba, mô hình tham sẻ tóc
tính trong CTT lả khái nig dơn giản và đòi hỏi tối thiểu giả dịnh, làm cho các mô hình hữu ich và áp đụng rộng rãi Thứ tự, các phân tích không yêu cầu sự nghiêm chỉnh của cáo nghiên cứu phủ hợp rằư trong IRT Tuy nhiên, CTT có một vải nhược
điểm lớn Nền tảng của nhiều phân tích CTT là các đặc tỉnh của các bài kiểm tra khỏ khăn và độ tin cậy Các chỉ số này được đo bằng tý lệ của phần %, p, của người kiếm tra, người mà trả lời câu hỏi một cảch chính xac và tống số câu hỏi tương quan, r: Tuy
nhiên, ác chỉ số không liên tục vì chúng hoàn toàn phụ thuộc vào mẫu của thí sinh
được lấy Không thể sử dụng chúng để chỉ ra đặc trưng hoặc chất lượng của một bải
kiếm tra Một nhược điểm nữa đó là điểm thi của thì sinh được kiêm chứng Nghĩa là, thí sinh có thể đại dược điểm cao hơn trên một bài kiểm tra dễ dàng hơn và điểm thâp
hơn trên một khó kiếm tra, và đo đó không có điểm số thực sự có thé được trích xuất
Điều ay không cho phép một cơ sở để kết hợp bài kiểm tra và mức độ khả năng Theo
nghĩa này, TRT có nhiều lợi ích hon CTT Trong khung TRT, các đặc diễm của mục là độc lặp mẫu và điểm tiểm ấn của một cả nhân được kiểm tra độc lập với điêu kiện là
cde md hình được lựa chọn phủ hợp với dữ liệu Vì vậy, điểm số mô tả trình độ thí
sinh không phụ thuộc vào số hượng cũng như năng lực của mẫu thứ nghiệm Điểm số của họ có thẻ thấp hơn khi các bài kiểm tra khỏ hơn và cao hon các bài kiểm tra dé đàng hơn nhưng điểm số về khả năng của chúng vẫn không đổi so với bất kỳ bài kiểm:
tra nảo tại thời điểm thử nghiệm hoặc khao sat IRT cũng cho phép tính toàn xác suất
Trang 29của một người trả lởi cụ thể chọn một trên một câu héi kiém tra Cac bài kiểm tra mẫu độc lập tạo điền kiện thuận lợi cho việc thiết kế bài kiểm tra thích nghỉ trên máy tính, cho phép so sánh chính xác hơn hoặc xác định rõ năng lực người kiểm tra Hơn nữa, TRT có thể được sử dụng để sàng lọc quy mỏ lớn hoặc rời rạc, vi nỏ cỏ khả năng tính
toán tiêu chuẩn lỗi và đo đó cưng cắp thông tin về chất lượng của mỗi câu hỏi thi Hỗ
Ha hỏi để loại trừ hoặc đưa vào một câu
trợ mày với việc làm quyết định lua chợn các
hỏi kiểm tra trong bai thí Ngoài ra, các câu hỏi cũng được lựa chọn dựa trên các chỉ số
độ khó, độ phân biệt của câu hỏi, nghĩa là khả năng của họ phân biệt các nhóm có đặo
khó giải thích cá bằng đỏ hợa và số Do vậy mà mô hình CTT vẫn được nghiên va
đùng phố biên hiện nay Dễ năm chắc về lý thuyết khảo thí cỗ điện chứng †a cân biết rõ
yê các khái niệm thống kề, các dăc trưng của câu hỏi trắc nghiệm
1.2.1 Các thaơn sé dic trong cia cau hoi trac nghiệm và phân tích để trắc nghiệm
1.3.1.1 Công thức tình độ khó của câu trắc nghiệm
Đề thị được cho là để khi H lệ học sinh làm đúng lrên tổng số thủ símh dự In là
một số gần bằng 1, ngược lại, khi tỉ lệ này gan bằng 0 Từ ý tưởng dỏ, người ta di dén
công thức tính độ khó của câu trắc nghiệm như sau:
Số người trả lời đúng câu ¡
Độ khó của câu¡ =
ng số người làm bài trắc nghiệm
Khi nao độ khó của câu lrắc nghiệm (TN) bằng 0? Kin nao dé kho cia cau TN bằng 1? Như vậy độ khỏ của câu TN có thẻ có những giá trị từ bao nhiên đến bao
nhiêu? Độ khó cảng gân 0 thì câu TN càng khó Độ khó càng gân 1 th cân TN càng
để, Thực ra độ khó ở dây dược biểu là năng lực thực hiên câu hỏi của T8,
1.3.1.2 Xúc dịnh độ khó vừa phải của câu trắc nghiệm
Trang 30Để có thể kết luận dược rằng một câu TN là để, khỏ hay vừa sức học sinh (H8), trước hết ta phải tính độ khó của câu TN ấy rồi so sánh với độ khó vừa phải (DKVP)
của loại cầu TN ây
- Nếu độ khó của cân TN > ĐKVT thì ta kết luận rằng câu TN ây là để so với trình độ HS lớp làm trắc nghiệm
~ Nếu độ khó của câu TN < ĐKVP, thi ta kết luận rằng câu TN ây là khỏ so với trình độ 118 của lớp làm trắc nghiệm
- Nếu độ khó của câu 'TN xắp xỉ với DKVP, thì ta kết luận rằng câu 'TN vừa sức
với trình độ HS của lớp làm trắc nghiện
Ta có thế biếu điễn điều ấy trên một trục hoành như sau:
ĐK P
Nhung Jam cách nào đề tính đuọc DKVP của câu TN?
Công thức tỉnh DKVP:
100% + % may rủi
Độ khỏ vừa phải câu i=
a
Mỗi loại câu TN có tỉ lệ % may rủi khác nhau Loại câu đúng- sai có tỉ lệ %
may rủi là 50%, loại cầu có 4 lựa chon có tí lệ % may rúi là 25%, loại câu có 5 lựa
chon có tỉ lệ % may rôi là 30% Từ đó bạn hãy linh độ khó vừa phải của Lừng loại câu
TN và nếu bạn có duge dé khó của một câu TN, thì bạn có thể kết luận dược rằng câu
‘EN ấy là khó hay dễ so với trinh độ 118 lớp làm trắc nghiệm
1.2.1.3 Dộ phân biệt của câu hài
Dé phân biệt của một cầu TN là một chỉ sẻ giúp ta phân biệt được 115 giỏi với
HS kém Cho nên, một bài TN gồm toàn những câu TN có độ phân cách tốt trở lên sẽ
Tà mội công pụ do lường có tinh lún cậy cao Nhưng làm cách nào để tỉnh dược độ phân
z0
Trang 31cách của câu TN? Sau khi di cham và cộng tông diễm của từng bai TN, ta co thé thie biện các bước sau đề biết được độ phân cách của một câu TN:
Bute 1: Xép đất các hài làm của học sinh (đã chấm, cộng điểm) theo thứ tự tổng điểm tir cao đến tháp
Bước 2 cứ trên tổng số bài TN, lây 27% của tổng số bài làm có điểm tir bai cao nhất trở xuống xép vào nhóm CAO và 27% tổng số bài làm có điểm từ bài thập nhất trở lên xếp vào nhom TLLAP
ước 3 Tĩnh tí lệ phản trăm học sinh làm đúng cäu TN riêng cho từng nhom
(CAO, THẬP) bằng cách đếm số người làm đúng trong mỗi nhón và chia cho số người của nhóm (lưu ý: số người mỗi nhỏm = 27% tổng số bài lam học sinh),
Bước 4: Tình dộ phân cach câu (Ð) theo công thức: l2 =
ding cau TN - Tỉ lệ % nhỏm thấp làm đúng câu TN
lệ % nhom cao lam
Lap lai cde bude 3 va 4 cho mdi cau trac nghiệm khác
Chit thich: Co thé tinh độ phân cách của một câu trắc nghiệm theo cách tương, đương: Thực hiện bước 1 và 2 nhờ mô tả trên Trong bước 3 đếm số người làm đứng,
trong mỗi nhóm, gọi là Đúng (CAO) và Đúng (THẬP) Sau đó thay vào công thức (bước 4)
Đừng (Cao) - Đúng (Thấp)
Sỗ người trong 1 nhom
'Theo công thức tỉnh độ phân cách ở phản 2, độ phần cảch của một cầu EM nằm
trong giới hạn từ -L.00 đến +1 00 Đề có thé dua ra két Iuan sau khi tính được độ phân
cách của một câu TN, ta căn cử vào quy dịnh sau:
* D> 0.40 Cau TN có độ phân cách rất tôi
*0.30< D <0.39 Câu TN có độ phân cách khá tốt nhưng có thể lănn cho tốt hơn
*0.20 < D <0.29 Câu TN có độ phân cách tạm được, cần phải điều chỉnh
* D 0.19 Cau TN có độ phân cách kém cần phải loại bố hay phải sữa chữa nhiều
4.2.1.4, Phan tich dé thi
z1
Trang 32a) Phân tích đáp ăn: Đáp án là lựa chọn dược xác dịnh là HÙNG NHẤT trong số các lựa chon của phân trả lời câu MCQ (hoặc là giá trị DUNG của mệnh đẻ trong câu Ping - Sai) Một câu hồi tốt nêu số người trả lời đúng ở nhóm cao hơn số người trả lời đảng ở nhỏm thấp Một câu hỏi có độ phân biệt tốt là tí lệ % số người ở nhỏm cao
chọn đáp án phải nhiều hơn số nguời ở nhóm thấp chọn đáp án từ 40% trở lên
b) Phân tích mỗi nhữ: Khác với đáp án, mỗi nhĩ là những lựa chọn được xác định là
SAT trong phan (7 lời Chúng được tập hợp Lừ những câu trả lời sai trong bài lâm của
nhiều H§ khi làm những, cầu hỏi đạng luận để giảo viên dặt
Vì vậy, một mỗi nhử dược gọi là tốt khi H8 thuộc nhóm CAO it chen nd, con
TS thuộc nhóm THIÁP chọn nó nhiêu hơn, nghĩa là sự chênh lệch số người chọn (hoặc
11 18%) cd hai nhém là lớn Để làm rõ hơn ý vừa nói, ta hãy phân Iích đáp án và môi
Ghi chit: B* la dap an
thân xét các lựa chọn câu 1: Quan sát các mỗi nhữ A, C, D ta thấy số người ở nhóm thập chọn nhiều hơn số người ở nhóm cao nhưng mức độ chênh lêch không nhidu, cho nên ta có thể nhận định đây là những môi nhữ chưa tốt lắm Thêm vào đó, tỉ
lệ % số người ở nhỏm cao chọn dap án B hơn tỉ lệ % số người ở nhỏm thấp chọn dap
án Ð chỉ có 27% nên độ phân cách của câu này không cao Ta hãy xem lại nội đụng cụ
thể của cầu trắc nghiệm sé 1 nay (dap án — B),
1.3.1.5, Một số tiêu chuẩn dễ chọn câu trắc nghiệm
Khi chon câu TN được chọn (lưu vào ngăn hàng để) ta cần chủ ý,
(1) Khững câu TN có độ khó quả thấp hay quả cao, đồng thời có độ phân cách
âm hoặc quá thấp là những cầu kém cần phải xem lại dễ loại di hay sửa chữa lại
22
Trang 33Œ) Với đáp ân trong câu TM, số người nhóm cao chọn phái nhiều hơn số người
xihóm thập
(3) Với cáo mỗi nhử, số người trong nhóm cao chọn phải it hơn số người trang,
nhhém thập
Dựa và các tiêu chí trên chúng ta hoàn toàn có thể xây dựng được các để tắc
nghiêm chất lượng Tuy nhiên như dã phân tích ở phan trước Với các mau thay déi, thí các tham số đặc trưng của câu hói (độ khỏ, độ phân biệt ) cũng thay đổi theo Nên trong lý thuyết GTT vấn để chọn mẫu là rất quan lrợng
1.22 Điểm sé hoc tip
1.2.2.1, Diém thé (raw scores)
Điểm sẻ trên một bài thi (bài tự luận, bái trắc nghiệm lớp học hay bai trac
nghiệm được tiêu chuẩn hóa) thường được xác định bởi điểm của mỗi câu Bài Lự luận,
điểm số một câu hỏi có thê lớn hơm 1, trong đó một sẻ ý đặc trưng trong câu trả lời được cho điểm theo một thang điểm đã định trước Với bài trắc nghiệm mãi câu hồi chỉ có thể quy về dùng hay sai Câu trả lời đúng thường được tính là 1 điểm Tổng
cộng các điểm số từng câu trắc nghiệm được gọi là điểm thô Ta thấy điểm thô của hai
trắc nghiệm không, giúp ta so sánh giữa các bài trắc nghiệm có độ khó khác nhau Vì vậy thường phải đổi diễm thô thánh các loại diễm khác phú hợp với việc nghiên cứu,
trình bảy và giái thích Liiện nay ở nước ta áp dụng điểm tử 0 đến 10
12
Diém phần trăm đúng Diém sẻ này tính bằng tỉ lệ phần trăm, theo công thức: X = 100 D/T Trong đó:
X = điểm tính theo tỉ lệ %;
B =s6 cau hoc sinh lam đúng;
T =tổng số câu của bài trắc nghiệm Điểm phản trăm đứng so sánh điểm của học sinh rảy với điểm số Lôi đa có thế đạt dược, Đây là một loại điểm tuyết đói Yếu tổ xác định diễm số mày là dé khó của nội dung bai trắc nghiệm, cần thận trọng khi sử dựng nó, vì dễ bị chú quan cúa người
ra để và thường không do lường được mức khả năng thực của học sinh Bởi vi người
ra đề thí có thể thay đổi số câu bắc nghiệm dé hay khó tùy theo ý muốn,
23
Trang 341.2.2.3 Diém chit
Về căn bản cũng giống như điểm phản trăm đúng, điểm chữ dùng các mẫu tự A, T,C,D, v.v và có thê ấn định: điểm A gồm các điểm phân trăm đứng từ 90 dén £00, điểm B gầm các điểm phản trăm đứng từ 70 đến 89, điểm Œ gồm các điểm phan tram đúng từ SỐ dén 69, v.v
24
Trang 351.2.2.4 That hang bach phan (Percentile Ranks, theang viét la PR)
Dây là điểm có được do sự biến đổi các điểm thỏ ra thánh các trị số phần trăm trong mội nhóm chọn làm chuẩn trực
a) Định nghĩa: Thử hạng bách phân là một con số nằm giữa 0 và 100, cho biết có bao nhiêu phần trăm trường hợp điểm số trong nhóm chuẩn mực rơi vào chính điểm số ây
hay ở đưới nó
b) Ÿ nghĩa: Dừng điểm PR có thể so sánh điểm của các học sinh làm bai tric nghiệm
nay với một nhóm lớn đã được chọn làm chuẩn nuục
1.3.2.5 Điểm tiêu chudn (Standard scores)
a) Mã tả: Điểm tiêu chuẩn là điểm biến đổi từ điểm thô đựa trên cơ sở độ lệch liễu
chuẩn của phân bố diễm số Chúng có thể được xem như là những diém số dã dược
gắn cho một trưng binh và một độ lệch tiêu chuân nảo đó Nó thưởng được sử dụng
trong trắc nghiêm vi một số đặc tính sau
- Mỗi loại điểm tiên chuấn có trung bình và độ lệch tiêu chuẩn chung cho mọi
bài trắc nghiệm và mọi nhóm người
- Điểm tiêu chuẩn cho phép ta thục hiện so sánh các trắc nghiệm hoặc giữa các
nhóm người
- Có thể xử lý bằng mọi phương pháp toản học
bì Các loại điểm tiêu chuẩn thông dụng: điễm Z„ điểm V Ở nước ngoài còn có
điểm Stanine (9 bac), diém C-Guilford, điểm T, Diễm AGCT, điểm CEEB Vé tric
nghiệm trỉ tuệ người ta dùng thương số trí tuệ IQ (với các trắc nghiệm Vechsler,
Stanford - Binet, v.v )
£) Ưu, nhược điểm của các loại điểm tiêu chuẩn: Diễm tiêu chuẩn có ưu điểm hơn điểm %4 đúng, thứ hạng bách phân vị nó có thế dùng tính toán hoặc đối chiêu các kết quả Như công các điểm tiêu chuẩn của nhiều bài rắc nghiệm môn học khác nhau dé tỉnh trung bình (ta vẫn hay làm trong điểm bài luận để lầu nay); so sánh hai hay nhiều điểm trưng bình của 1 bài trắc nghiệm ra trên rẩnïễu nhóm, đổi chiều điểm trên các bái trắc nghiệm khác nhau, tỉnh hệ số tương quan (với một bài trắc ng]iệm đã chuẩn hoa)
25
Trang 36để xác định tính giám của bải trắc nghiệm mới soạn Nhược diễm cua diém tiểu chuẩn
là:
+ Nến các đữ kiện có độ xiên quá lớn thì việc sử dụng điểm tiêu chuẩn là không Thích hợp vì là một loại điểm tương đôi, nêu bài quá đễ hay quá khó đối với nhóm học sinh thì điểm trung bình bị lệch nhiều so với vùng tung tâm Cúc diém số không còn
phân ánh đứng thực chất khả năng lĩnh hội bài học của học sinh
+ Vi điểm tiểu chuẩn phụ thuộc vào độ lệch tiêu chuẩn nên khó giải thích
nghĩa của các điểm số trắc nghiệm Học sinh đại 7 môn Anh văn có thể là giôi trong
lớp, trong khi điểm 7 môn Toán chỉ là khá trong lép do
1.2.2.6 Công thức dỗi diễm thô sang một sẽ diễm tiêu chuẩn
a) Điểm Z4 (⁄ score): Điểm Z liên hệ dấn phân bổ bình thường tiếu chuẩn với trung,
bình = Ó và độ lệch tiêu chuẩn = 1
Công thức chuyển đôi: Z = CX — điểm trung bình X) /s
‘Tvong dé X la mét diém thé, X = điểm thô trung bình của nhóm làm trắc nghiệm, s — độ lệch tiêu chuẩn của nhóm
Điểm Z7 cho biết vị trí của một học sinh có điểm thô X so voi trung bình cửa
nhóm học sinh củng làm bai trac nghiệm
Bang Z va công dụng: Dây là bảng cho các trị số là diện tích tính theo tỉ lễ %4
Diện tích này chính 1á tích phân (tích phân Laplace) giới hạn bối đường cong bình thường tiêu chuẩn (đường Gauss, N(O,1)) với trạc hoảnh tỉnh từ giá trị Z = Ö (tức ngay
tại trị trưng bình) đến giá trị Z.> 0 xác định mio đó (xin xem bang 7 đính kèm cuối chương này) Do tinh đối xứng của đường cong qua trục hưng (Z=0) nên tổng diện tích
trong bảng (từ trung binh trỏ lên) sẽ lá 50%
Công dụng: trị số đọc trong bảng cho ta tính ước lượng tỉ lệ %4 học sinh ở phía đưới lay phía trên một học sinh đạt diễm số Z, nào đó
b) Điểm tiêu chưẳn V: Căn bản giếng như diễm Z nhưng được quy về phân bỏ bình
thường cỏ trưng, bình = 10 vả độ lệch tiêu chuẩn là 4 Loại điểm nảy được áp dung tai
Việt Nam trước 1975, với hệ thẳng điểm cho từ 0 -> 20 Để có điểm V, trước hết đối
điểm thé % ra Z, san đó áp dụng công thức và làm tròn số để nhận được giá trị nguyên:
26
Trang 37Điểm tiêu chuẩn V = 4Z — 10 Ngay nay, dé phủ hợp với hệ thống diém tử 0 > 10, co thé ding điểm tiêu chuẩn V mới với trung bình = 5 va độ lệch tiêu chuẩn là 2 Diễm V
(mồi) = 2Z 1 5
Tổng quát, nêu ta đối một điểm thê X sang một loại điểm tiêu chuẩn Xã có trung bình Mụ, và dỏ lệch tiêu chuẩn sự nhờ trung gian diễm Z thì áp dụng công
thúc: Diễm tiêu chuan X,, = 8, Z +My
Chung ta di lam quen với khải niệm điểm thô của bài trắc nghiệm củng nhiều loại điểm số khác thường được sử dụng tương trắc nghiệm Điểm thô là lông điểm các câu học sinh làm dùng Điểm phản trăm dime, tht bac bach phân, diém tiêu chuẩn là điểm được biển đổi từ điểm thô theo các cách khác nhau Trong quá trình tiếp cận các công thức lính ta cũng tìm hiểu cả ý nghĩa và giải thích công dung của từng loại điểm 'Erong các loại điểm đã để cập, ta chú ý nhiều đến điểm tiêu chuẩn vị các ưu điểm của
nó Tuy nhiên, ta cần rihớ rằng không có một loại điểm nào là hoàn hảo mà tùy thuộc
vào mục đích sử dụng, vào tính chất của bài thi mã la chọn một loại điểm phù hợp
27
Trang 381.3 Ly thuyét ang đáp câu húi
Ly thuyét danb gia o6 dién (CYT) la cach tiếp cận chi phối cho dén nim 1953 khi Frederic Lord da cdng bổ luận văn tiền sĩ của mình về Lý thuyết năng lực tiềm 4n
(.atent Trait Theory) Vào nhĩmg năm 1970, lý thuyết img dap cin héi (RT — Ttem
Response Theory) bước dầu có những nghiên cứu một cách đột pha va day di, Dau
những năm 2000 khi các công cụ tính toán (phản mềm chuyên dụng) hễ trợ tốt hơn
ứng dụng TRT vào các hệ thống đánh giá, khảo thí mới thục sự điễn ra Tuy nhiên các
trung tâm nghiên cứu vẻ IRT chủ yếu vẫn Mỹ hoặc liên quan đến các trường dại học ở
My IRT được xây đựng đựa trên một số tiên để và đựa trên một hàm phân bố xác suất cửa năng lực thí sinh theo các than số (đồ khó, ) của cầu Hỏi
1.31 Tẵng quan về lý thuyết ứng đáp câu hôi
Để đo lường năng lực của thí sinh (TS), chứng ta cẩn bộ cầu hồi (CH) được
thiết kế đúng mục tiêu cân đo Khi đó năng lực của thí sinh là một đại lượng ấn, nó chỉ
được biếu hiện thông qua quan sát phản ứng của T3 với các câu hỏi Ching ta cân
công nhận với nhau rằng
- Nang luc tiém dn (latent trait) can do chi cd mal chiéu (unidimensionality),
hoặc ta chỉ quan tâm do một chiểu của năng lye dé ma các chiêu năng lực khác không
ảnh hưởng,
- Các câu hỏi trong một bài thi là độc lập với nhau địa tức là việc trả lời một
CHÍ không ảnh hưởng đến œ CH khác trong cũng một để thi
Khi đó chúng ta sẽ có một tương quan giữa năng lực của T5 biếu hiện qua sự
tmg dap của T5 vỡi mỗi câu hỏi vá bộ công cụ do (bộ CH) độc lập dịa phương với nhau (các câu hỏi không ảnh hưởng lẫn nhat) Mô hình vẻ mồi tương quan niy đã
được Alien Binbaum và I.ord để xuất mô hình vom chuẩn (dang phân phối chuản) để
biểu diễn mỗi quan hệ năng lực ứng đáp của L5 với CH Tuy nhiên mô hình toán học của dạng vòm chuẩn là quá phức tạp, và Birnbaum còn đề xuất một mô hình có luôn
thưưn số độ khó, độ phân biết nên việc tính toán ban đầu gặp rất nhiều khó khăm Năm:
1960 (thục ra nấm 1953) George Rasch dễ xuất một mỏ hình mdi 14 mé hinh logistic
thay thé cho mé hình vẻm chuẩn, đồng thời Rasch chỉ đưa vào mồ hình của minh một
tham số là độ khó Do vậy Rasch đã xây dựng được cơ sở lý (huyết cũa nó, phá dỡ các
28
Trang 39xảo căn mà mô hình của Lord và Bunbaum gặp phải Thực tế sau nảy (những năm 70)
các nhà nghiên cứu thẻ hệ hai đã dễ dàng chúng mình được hai mô hình: Vờm chuẩn
và logistie là tương đương nhau đồng thời trên mõ hình logistic ta có thế đưa vào các tham số khác ngoài độ khỏ như độ phân biệt, độ đoán mé, Chung ta sé tiếp cận mồ
hinh logistic lân hượt một, hai, ba tham số ở đoạn sau
Ứng với mỗi câu hỏi trong để thí, đừng để đo các năng lục khác nhau, mỗi năng
hỏi (Đường cong ĐYTCH - Item Characteristic Curve)
Đôi với các cặp TS CH, can xây dựng một thang đo chung dé biểu diễn mối tương tác giữa năng lực tiểm ân và đáp ứng với độ khó câu hỏi Theo [3, tr 87 — 88],
ta có thể biếu dién nang lực liểm ân của các T3 bằng ruột biển liên Lục @ doc theo mél trục, từ œ đến +œ, Khi xét phân bố năng lực của một tập hợp I'S ndo dé, ta gan gid tri
trưng bình của phân bổ năng lực của tập hợp TS đó bằng không làm gốc của thang đo
xăng lực, và độ lệch tiêu chuẩn của phân bổ năng lực bằng 1 Chọn một thuộc tính của
CHÍ để đổi sảnh với năng lục: tham số biểu điễn thuộc tinh quan trọng nhất đỏ lả độ
khó h của CH (cần lưu ý là đại lượng đô khó ở đây sẽ được xác định khác với trang
1.3.2 Hàm đặc trung câu hối
€ó nhiều cách tiếp cận để xây dựng mỗ hình hàm đặc trưng câu hỏi, nhưng cách xây dựng của l3aker [10] lá dễ hiểu và dễ tiếp cận Tài liệu [3] của giáo sư Lãm
Quang Thiệp
về vẫn đẻ này cũng hết sức logic, súc tích và dễ hiển Theo [3, tr S9
— 91J, Giả thiết cơ bản sau đây của George Rasch, nha loan hoc Ban Mạch, được đưa
xa lam cơ sở để xây dụng mô hình ham đáp ứng CH một tham sé:
23
Trang 40Adột người có năng lực cao hơn một người khác thì xác suất dễ người do tra loi đúng một câu hỗi bắt kì phải lớn hơn xác suất của người sau; cũng tương tự như vậy,
một câu hôi khá hơn một câu hỏi khác có nghĩa là xác suất để một người bắt kì trả lời
đúng câu bởi đó phải bé hơn xác suất đề trả lời đúng câu hồi sau [16, tr 117]
Với gi thiết nêu trên, theo |3, tr 89 - 91 | có thể thấy xác suất dễ một T8 trả lời
đúng một CII nào đó phụ thuộc vào tương quan giữa năng lực của TS và độ khó của
CH Chon © dé biéu điển năng lực của TS, và Ệ để biểu điển độ khó của CH Gọi P là xác suất trả lời đúng CH, xác suất do sé phy thuộc vào tương quan giữa Ø vả [ theo
mệt cách nào đó, do vậy ta có thể biếu diễn /(P)— 5 ay
Trong đó/ là một hàm nào đó của xác suất trả lời đúng, Lấy logarit tự nhiên
của (L)la được : In ƒ(P)=In 2 =h9 In/Ø#=Ø b@)
Khi xét mô hình trắc nghiệm nhị phân, Rasch chọn hàm ƒchính là mức được thưa (odds) Ó, hoặc khá năng thực hiện ding (likelyhood ratio), tuc là Z(P)—