Câu thường gồm bốn phần: o THÂN stem - câu hỏi hay sự phát biểu không đầy đủ o CÁC CÂU CHỌN options - các trả lời hay phương án gợi ý o CÁC CÂU NHIỄU distracters - các trả lời không đúng
Trang 1SỞ GIÁO DỤC VÀ ĐÀO TẠO DAKLAK TRƯỜNG THPT HUỲNH THÚC KHÁNG
-SÁNG KIẾN – KINH NGHIỆM
BƯỚC ĐẦU NGHIÊN CỨU CÁCH ĐÁNH GIÁ CÂU TRẮC NGHIỆM KHÁCH QUAN TRONG
RA ĐỀ KIỂM TRA MÔN SINH HỌC
NGƯỜI THỰC HIỆN: NGUYỄN ĐÌNH HOÀNG
TỔ CHUYÊN MÔN: SINH – KỈ THUẬT NÔNG NGHIỆP
KRÔNG BUK, THÁNG 3 NĂM 2009
Trang 2MỞ ĐẦU
Trong vấn đề cải cách giáo dục, ngoài đổi mới về mục tiêu, nội dung và phương pháp dạy học, việc đổi mới phương thức kiểm tra đánh giá (KTĐG) là một vấn đề hết sức cấp thiết nhằm tăng cường hiệu quả dạy và học Biết đánh giá một cách chính xác và đáng tin cậy kết quả học tập ta mới xác định được mục tiêu đề ra có đạt được hay không và đạt được đến mức độ nào, do đó mới xác định được tính thích hợp của nội dung và hiệu quả của phương pháp giảng dạy, trên cơ sở đó ta mới đề ra những phương pháp dạy học cải tiến
Tuy nhiên, trong thực tế hầu như vấn đề sử dụng câu trắc nghiệm hiện nay giáo viên chưa chú trọng đến chất lượng câu trắc nghiệm Thường là trích dẫn lại những câu trắc nghiệm từ nguồn sách tham khảo và sử dụng câu trắc nghiệm theo tính chủ quan của giáo viện
Từ thực tế đó, tôi đã tiếp cận và nghiên cứu đề tài ”BƯỚC ĐẦU NGHIÊN CỨU
CÁCH ĐÁNH GIÁ CÂU TRẮC NGHIỆM KHÁCH QUAN TRONG RA ĐỀ KIỂM TRA MÔN SINH HỌC” Đề tài bước đầu nghiên cứ không trái khỏi sự sai sót, rất
mong sự góp ý của đọc giả để ngày một hoàn thiện Chân thành cảm ơn
Trang 3PHẦN I: TỔNG QUAN TÀI LIỆU
I CƠ SỞ CỦA VIỆC SỬ DỤNG CÂU TRĂC NGHIỆM TRONG KIỂM TRA-ĐÁNH GIÁ
1, Cơ sở lí luận:
Theo chủ trương đổi mới thi cử của Bộ Giáo dục và Đào tạo, từ năm 2008 đến nay 4 môn Lý, Hóa, Sinh và ngoại ngữ đều áp dụng phương pháp thi trắc nghiệm khách quan
2, Cơ sở thực tiễn:
Trong vấn đề giảng dạy và học tập ở bất kỳ cấp học nào đều có bốn vấn đề quan trọng cần phải quan tâm, đó là: (1) mục tiêu giảng dạy, (2) cấu trúc của nội dung kiến thức, (3)
phương pháp giảng dạy và học tập và (4) đánh giá giảng dạy và học tập Giữa mục tiêu
và sự đánh giá có mối quan hệ mật thiết với nhau và có tầm quan trọng đặc biệt trên quan
điểm thống kê giáo dục
Chẳng hạn, sau mỗi bài hoặc tiết học, việc dùng hình thức tự luận để kiểm tra rõ ràng
là không thích hợp Trong khi đó, sử dụng phương pháp trắc nghiệm khách quan (TNKQ)
tỏ ra rất thuận lợi Vì vậy ta có thể và nên áp dụng phương pháp này vào cuối mỗi bài hoặc tiết học để vừa củng cố kiến thức, vừa đánh giá sơ bộ mức độ hoàn thành mục tiêu của bài học Nó cho phép thu được thông tin phản hồi một cách kịp thời, để từ đó nhanh chóng điều chỉnh phương pháp dạy-học sao cho phù hợp, đồng thời uốn nắn những nhận thức sai lầm lệch lạc có thể có ở học sinh (HS) Như thế việc tiếp cận phương pháp trắc nghiệm khách quan đang trở thành một vấn đề cấp bách trong hoạt động dạy và học ở các trường THPT nước ta hiện nay
II PHƯƠNG PHÁP KIỂM TRA - ĐÁNH GIÁ BẰNG TRẮC NGHIỆM KHÁCH QUAN NHIỀU LỰA CHỌN
Bài trắc nghiệm được gọi là khách quan chủ yếu bởi vì hệ thống chấm và cho điểm là
khách quan chứ không phải chủ quan như đối với bài trắc nghiệm tự luận Thông thường
một bài TNKQ có nhiều câu hỏi hơn là một bài trắc nghiệm tự luận, và mỗi câu hỏi thường có thể được trả lời bằng một dấu hiệu đơn giản
Câu trắc nghiệm nhiều lựa chọn (multiple choice question - MCQ): Đây là loại câu
trắc nghiệm thông dụng nhất, sau câu dẫn có 3-5 phương án trả lời cho sẵn chỉ có một
phương án là đúng hoặc đúng nhất, các phương án còn lại hoặc sai hoặc chỉ đúng một
phần, gọi là các câu nhiễu.
Câu thường gồm bốn phần:
o THÂN (stem) - câu hỏi hay sự phát biểu không đầy đủ
o CÁC CÂU CHỌN (options) - các trả lời hay phương án gợi ý
o CÁC CÂU NHIỄU (distracters) - các trả lời không đúng
o KHOÁ (key) - trả lời đúng
Ở hầu hết trường hợp, câu dẫn có thể sử dụng các tài liệu như đồ thị, sơ đồ, các kết quả thí nghiệm Trong những trường hợp này ta có thể kiểm tra các khả năng khác hơn
là sự nhớ lại kiến thức đã học Ở một số trường hợp, các câu hỏi có thể liên quan cùng một tài liệu đưa ra Trong những trường hợp như thế, phải cẩn thận khi viết các câu độc lập nhau (nghĩa là câu trả lời cho một câu hỏi không phụ thuộc vào phần trả lời ở câu trước)
Trang 4Trong một số trường hợp, các câu MCQ có thể dùng để kiểm tra các mức trí năng cao bằng cách yêu cầu người học phê bình các câu trả lời xác đáng nhất cho một vấn đề
từ nhiều câu trả lời "đúng" Hiển nhiên, phải rất thận trọng khi đặt một câu hỏi như vậy Thông thường một câu MCQ có 4 đến 5 sự lựa chọn, nhưng với 5 phương án thì bài trắc nghiệm có độ tin cậy cao hơn Tuy nhiên có thể gặp phải khó khăn khi đưa ra 5 sự lựa chọn có vẻ đúng và trong trường hợp này tốt hơn cả là làm 4 phương án
Một bộ câu hỏi MCQ thực sự hay cần phải được thiết kế cẩn thận sao cho có thể kiểm tra các mức độ nhận thức khác nhau (xem mục 4 ở dưới) Điều này quả thật khó đối với các mức nhận thức phức tạp Đặc biệt là khi người học biết rằng họ sẽ được kiểm tra
để rà soát điều chỉnh câu hỏi, không phải để lấy điểm thi Một hạn chế khác nữa của các bài trắc nghiệm MCQ là ở chỗ chúng không cho phép hoặc đòi hỏi người học truyền thông bất kỳ cách diễn đạt nào với người kiểm tra
Các bài trắc nghiệm MCQ thường được chọn dùng bởi vì chúng cho phép kiểm tra nhanh nhất một phạm vi kiến thức rộng lớn trên một số lượng học sinh đông Các bài trắc nghiệm MCQ ngắn được thiết kế tốt có thể rất thích hợp cho việc thu nhận thông tin phản hồi nhanh từ phía người học
Các bài trắc nghiệm MCQ được coi là tốt nhất khi ta có được một ngân hàng câu hỏi được xây dựng qua thời gian dài thử nghiệm và đã tiến hành phân tích các câu hỏi về
các chỉ số độ khó (degree of difficulty) và độ phân biệt (degree of discrimination) Thông
tin này về mỗi câu MCQ được dùng để xây dựng một bài kiểm tra thích hợp bằng trắc nghiệm MCQ từ ngân hàng câu hỏi được phát triển Các ngân hàng câu hỏi cần phải đảm bảo an toàn nghiêm mật, nghĩa là mỗi bài kiểm tra MCQ không được để rơi vào tay người học
II QUY TẮC XÂY DỰNG CÁC CÂU TRẮC NGHIỆM MCQ
1, Mục tiêu:
o Câu hỏi đưa ra nhằm đánh giá cái gì?
o Có phải trắc nghiệm khách quan là cách đánh giá tốt nhất không ?
o Kiểu trắc nghiệm khách quan nên dùng ở đây là gì?
Việc trả lời cho các câu hỏi này rất là quan trọng Bởi vì việc tăng cường sử dụng máy tính để chấm bài trắc nghiệm đã làm cho các bài trắc nghiệm MCQ ngày càng trở nên phổ biến, đặc biệt là ở các lớp đông Trong một số trường hợp, việc sử dụng các câu MCQ có thể không thích hợp Chẳng hạn, có thể khó tìm ra được các câu nhiễu thoả đáng cho một câu hỏi Nói cách khác, các tài liệu học tập và các khả năng đưa vào trắc nghiệm sẽ xác định bản chất của bài kiểm tra hơn là làm cho các tài liệu kiểm tra phù hợp với một kiểu trắc nghiệm đặc thù
2, Câu dẫn: Vấn đề hay câu hỏi nêu ra có rõ ràng và chính xác không?
Quan trọng nhất là ở chỗ câu dẫn phải được phát biểu rõ ràng và không có mơ hồ Nên dùng ngôn ngữ đơn giản và trong sáng Nếu không tuân theo các hướng dẫn này, câu trắc nghiệm sẽ giống như là kiến thức trong tài liệu chép ra Câu dẫn phải nói rõ điều kỳ vọng ở người học là cái gì trước khi đọc các câu chọn, nhưng quy tắc này lại không phải
là câu hỏi 'Điều này sau đây là đúng?'
3, Các câu chọn
Các câu chọn nên làm độc lập nhau, phù hợp về mặt logic và ngữ pháp với câu dẫn
và ngôn ngữ sử dụng phải rõ ràng và đơn giản Đặc biệt, người kiểm tra cần tránh các gợi
Trang 5ý cho câu trả lời đúng và các gợi ý mà học sinh dễ dàng loại bỏ ngay các câu nhiễu nhờ
có biết chút ít về tài liệu học tập Những câu hỏi được thiết kế tồi có thể cho phép học sinh lượt bớt số câu nhiễu có vẻ đúng và như thế nó làm tăng cơ may đoán được câu trả lời đúng Cụ thể, người xây dựng bài trắc nghiệm nên TRÁNH DÙNG:
Các cụm từ nguyên văn hoặc quá nổi bật, vì nó vô tình trực tiếp chỉ ra cho học sinh câu trả lời đúng;
Độ dài các câu chọn không cân xứng, bởi người ra đề sẽ vô tình làm cho câu trả lời đúng dài hơn các câu nhiễu một cách lộ liễu;
Các câu chọn loại trừ lẫn nhau ở chỗ, nếu một câu chọn là không đúng thì câu chọn đối lập của nó sẽ phải đúng;
Các câu chọn gối nhau, khi mà một hoặc nhiều câu chọn là một thành phần của câu kia;
Những sự không nhất quán về mặt ngữ pháp, trong đó các câu chọn có thể không liên quan nhau vì chúng không phù hợp về mặt ngữ pháp với câu dẫn;
Các từ có tính chất tuyệt đối (không bao giờ, luôn luôn, duy nhất, không có trường hợp nào ở trên, tất cả các trường hợp trên) Các phương án chọn này thông thường là không đúng;
Câu trả lời đúng ở một hình thức khác với các câu nhiễu làm cho dễ dàng nhận ra câu trả lời đúng;
Các từ phủ định kép - khiến cho người làm bài mơ hồ không hiểu điều người kiểm tra muốn hỏi Nếu có sử dụng, các từ này phải được in hoa, in nghiêng hoặc gạch dưới
III NHỮNG ƯU ĐIỂM VÀ NHƯỢC ĐIỂM CỦA CÁC BÀI TRẮC NGHIỆM MCQ
1 Những ưu điểm hay lợi thế chính của trắc nghiệm MCQ :
Có thể kiểm tra nhanh một phạm vi rộng các vấn đề, với một lượng kiến thức lớn trong một thời gian ngắn
Có thể sử dụng để thu nhận phản hồi thông tin từ người học, để duyệt nhanh trình
độ học vấn của một lớp học lúc mới bắt đầu hoặc kết thúc
Có thể sử dụng máy móc để chấm bài (phân tích, đánh giá) và cho điểm
Sự đánh giá không chịu ảnh hưởng bởi khả năng viết của người học
Có thể cho điểm đáng tin cậy vì tất cả câu trả lời đều được xác định trước
Có thể phân tích các chỉ số về độ khó (F) và độ phân biệt (D) của câu hỏi.
Có thể sử dụng lại các câu hỏi để thành lập một ngân hàng lớn các câu hỏi, nhằm giảm bớt thời gian chuẩn bị sau này
Nếu viết cẩn thận, có thể kiểm tra các kỹ năng nhận thức cao
2, Các nhược điểm hay hạn chế chính của trắc nghiệm MCQ :
Mất nhiều thời gian để viết được các câu hỏi MCQ hay, đặc biệt là trong trường hợp cần kiểm tra các kỹ năng thuộc mức nhận thức cao
Trừ phi cẩn thận, còn thì các câu MCQ có khuynh hướng kiểm tra kiến thức và chỉ yêu cầu nhớ lại
Trang 6 Có thể chẳng bao giờ kiểm tra được vốn văn chương, khả năng sắp xếp, phê phán
và phân tích của học sinh
Có thể chẳng bao giờ kiểm tra được tính sáng tạo, khả năng phát triển và tổ chức các ý tưởng cũng như sự trình bày các ý tưởng đó bằng cách lập luận
Có khuynh hướng làm cho học sinh xem các vấn đề ở góc độ trắng đen
Có khuynh hướng làm cho người học tiếp cận việc học chỉ trên bề mặt, nghĩa là chỉ cần học gạo để nhớ
Có thể gây ra sự đoán mò (trừ các câu nhiễu có vẻ đúng sẽ kích thích sự đoán mò thông minh)
Các câu hỏi thường được dùng lại, nên cần lưu tâm độ an toàn của chúng
Các câu hỏi cần được thử nghiệm trước và ưu tiên chọn những câu đảm bảo giá trị của các câu hỏi trắc nghiệm
Xu hướng thu hẹp phạm vi điểm số (nghĩa là độ lệch chuẩn càng hẹp) hiển nhiên
là kéo theo độ phân biệt càng giảm thấp
3 Vận dụng các mức độ nhận thức khác nhau để soạn các câu MCQ
Các nghiên cứu cho hay rằng phần lớn các bài trắc nghiệm quá nặng về kiểm tra
sự nhớ lại thông tin ở học sinh (Milton và cs, 1986 ) Theo Bloom và cs (1956), có sáu mức độ nhận thức từ thấp lên cao rất quan trọng đối với việc đo lường thành quả học tập của học sinh, đặc biệt là các mức cao Phỏng theo hệ thống phân loại của Bloom, dưới
đây chúng tôi nêu tóm tắt nội dung của từng mức kèm theo các động từ hành động mô tả
hành vi hay kỹ năng có thể dùng để xác định mục tiêu cần kiểm tra, và hai ví dụ minh hoạ
về cùng một vấn đề cho câu tự luận và câu MCQ - câu trả lời đúng được biểu thị bằng dấu (*) ở trước
BIẾT (Knowledge): Sự nhớ lại tài liệu đã được học tập trước đó như các sự kiện,
thuật ngữ hay các nguyên lý, quy trình Để đo mức nhận thức này, cần sử dụng các loại câu hỏi như: (Hãy) định nghĩa, mô tả, nhận biết, đánh dấu, liệt kê, gọi tên, phát biểu, chọn ra, phác thảo
HIỂU (Comprehension): Khả năng hiểu biết về các sự kiện và nguyên lý, giải thích
tài liệu học tập, nhưng không nhất thiết phải liên hệ các tư liệu Để đo mức hiểu này, hãy đặt các câu hỏi như: Biến đổi, ủng hộ, phân biệt, ước tính, giải thích, mở rộng, khái quát, cho ví dụ, dự đoán, tóm tắt, viết một đoạn
ÁP DỤNG (application): Khả năng vận dụng tài liệu đã học vào các tình huống mới
và cụ thể hoặc để giải các bài toán Để đo mức vận dụng kiến thức này, hãy đặt các câu hỏi như: Xác định, khám phá, tính toán, sửa đổi, thao tác, dự đoán, chuẩn bị, tạo ra, thiết lập liên hệ, chứng minh, giải quyết, sử dụng
PHÂN TÍCH (analysis): Khả năng phân tích sự liên hệ giữa các thành phần của một
cấu trúc có tính tổ chức sao cho có thể hiểu được, nhận biết được các giả địng ngầm hoặc các nguỵ biện có lý Để đo mức nhận thức này, cần sử dụng các loại câu hỏi sau: Vẽ sơ
đồ, phân biệt, minh hoạ, suy luận, chỉ ra, thiết lập quan hệ, chọn ra, tách biệt ra, chia nhỏ
ra
TỔNG HỢP (synthesis): Khả năng đặt các thành phần với nhau để tạo thành một
tổng thể hay hình mẫu mới, hoặc giải các bài toán bằng tư duy sáng tạo Để đo mức nhận
Trang 7thức này, cần sử dụng các loại câu hỏi sau: Phân loại, tổ hợp lại, biên tập lại, thiết kế, lý giải, tổ chức, lập kế hoạch, sắp xếp lại, cấu trúc lại, tóm tắt, sửa lại, viết lại, kể lại
ĐÁNH GIÁ (evaluation): Khả năng phê phán và thẩm định giá trị của tư liệu theo
một mục đích nhất định Để đo mức độ nhận thức phức tạp nhất này, hãyóỉư dụng các loại câu hỏi sau: Đánh giá, so sánh, đưa ra kết luận, thoả thuận, phê bình, mô tả, suy xét phân biệt, giải thích, đưa ra nhận định, ủng hộ
*Lưu ý: Trên thực tế, ngay cả nhiều giảng viên ở các khoa của một số trường Đại học
nước ngoài cũng thấy khó áp dụng hệ thống phân loại 6 mức nhận thức này, và một số nhà giáo dục đã giản lược thành 3 mức chung
IV PHÂN TÍCH CÂU HỎI VÀ ĐÁNH GIÁ BÀI TRẮC NGHIỆM MCQ
1 Nguyên tắc tổng quát cho việc xây dựng và khảo sát một bài trắc nghiệm
MCQ dùng ở lớp học
Bước 1: Xác định mục tiêu dạy học và lập kế hoạch cho bài trắc nghiệm
Bước 2: Soạn thảo các câu trắc nghiệm và duyệt lại bài trắc nghiệm
Bước 3: Tổ chức thực nghiệm kiểm định và chấm điểm bài trắc nghiệm
Bước 4: Phân tích các câu hỏi và đánh giá bài trắc nghiệm
Bước 5: Xây dựng kho dự trữ các câu hỏi trắc nghiệm
2 Trắc nghiệm (đo lường) bài trắc nghiệm
a Phân tích câu hỏi trắc nghiệm MCQ
Một trong những lợi thế của việc sử dụng các câu MCQ là việc thống kê và xử lý các bài trắc nghiệm một cách dễ dàng (đặc biệt là khi chấm điểm bằng máy tính) Các thông
số xác định chất lượng của các câu trắc nghiệm bao gồm độ phân biệt D (discrimination)
và độ khó F (facility or difficulty)
Phân tích các câu trả lời của thí sinh trong một bài trắc nghiệm là việc làm rất cần thiết và hữu ích, vì nó giúp cho người soạn thảo: Biết được mức độ khó của các câu trắc nghiệm; Lựa ra các câu có chỉ số D cao, nghĩa là phân biệt được các học sinh giỏi và kém; Biết được lý do vì sao câu trắc nghiệm không đạt hiệu quả như mong muốn và cần phải sửa đổi như thế nào cho tốt hơn
Để phân tích câu trắc nghiệm, ta tuần tự thực hiện các công việc như sau:
(1) Sắp xếp bảng trả lời của n thí sinh theo thứ tự điểm số từ cao đến thấp.
(2) Từ bảng điểm này ta chọn lấy hai nhóm: 27% số bài có điểm số cao nhất (tốp trên)
và 27% số bài có điểm số thấp nhất (tốp dưới)
(3) Thống kê và tính các chỉ số khó và phân biệt đối với từng câu của bài trắc nghiệm bằng cách sau đây:
- Ghi số lần (tần số) trả lời của học sinh trong mỗi nhóm cao và thấp cho mỗi lựa chọn của từng câu trắc nghiệm
- Cộng số câu trả lời đúng của cả hai nhóm rồi chia cho số bài của hai nhóm gộp lại Biểu thị thương số này bằng phần trăm, nghĩa là nhân nó với 100, ta được kết quả là chỉ
số khó F của câu hỏi đó
- Lấy tần số người làm đúng trong nhóm cao trừ số người làm đúng trong nhóm thấp,
Trang 8rồi chia hiệu số này cho 27% tổng số thí sinh dự thi Kết quả thương số thu được này chính là chỉ số phân biệt D của câu hỏi đó
Chỉ số độ phân biệt (D) so sánh số lượng các câu trả lời đúng đối với một câu
hỏi lấy từ 27% thuộc tốp trên và 27% thuộc tốp dưới của lớp học (dựa vào điểm số của toàn bài trắc nghiệm) Nếu như đối với bất kỳ câu nào mà con số các trả lời đúng từ các
em thuộc 27% của tốp dưới đối với toàn bài trắc nghiệm mà lớn hơn con số từ các em nằm trong 27% của tốp trên, thì câu đó được coi là không phân biệt một cách hiệu quả giữa các học sinh Công thức tính chỉ số phân biệt (D) của một câu hỏi cụ thể được giản lược như sau:
n
T C D
27 , 0
Trong đó: C là số lần trả lời đúng câu hỏi của tốp trên,
T là số số lần trả lời đúng câu hỏi của tốp dưới,
n là tổng số thí sinh dự thi (0,27n chính là 27% tổng số)
Thang đánh giá độ phân biệt (-1 D 1) được quy ước bởi các chuyên gia, giúp
ta chọn lựa các câu trắc nghiệm tốt dùng ở lớp học như sau:
D < 0: không đạt yêu cầu (loại bỏ)
0 D < 0,2: Kém, cần loại bỏ hoặc điều chỉnh 0,2 D < 0,3: Tạm được, có thể phải sửa đổi để hoàn thiện thêm 0,3 D < 0,4: Khá tốt, nhưng có thể làm cho tốt hơn
0,4 D 1,0: Rất tốt
Độ khó (F) là tỷ lệ phần trăm của lớp học trả lời đúng cho một câu hỏi Nói
chung:
nếu F < 30% câu hỏi đó được xem là khó
nếu F = 30-75% câu hỏi đó được xem là thoả mãn
nếu F > 75% câu hỏi đó được xem là dễ
Việc xem xét chấp nhận các câu hỏi đưa ra là khó hay không phần lớn do người ra
đề nhận định Một câu khó có độ phân biệt cao có thể hữu ích khi xếp vị thứ của các học sinh Một câu dễ có độ phân biệt thấp thì có thể bỏ qua và cũng có thể xem xét để sử dụng trong một kiểu đánh giá khác Các câu có độ phận biệt và độ khó chấp nhận được cần giữ lại để dùng sau này Bằng cách đó, qua một thời gian ta có thể xây dựng được một ngân hàng các câu hỏi trắc nghiệm được chọn lọc ngẫu nhiên dùng cho các bài trắc nghiệm
b, Sơ lược về sự đánh giá chất lượng một bài trắc nghiệm MCQ
Chất lượng của một bài trắc nghiệm hoàn thiện như thế được đo bằng độ giá trị
(validity, ký hiệu là v) và độ tin cậy (reliability, ký hiệu là r) của nó Độ giá trị (v) của các
bài trắc nghiệm do người thầy thiết lập được xác định thông qua nội dung và các mục tiêu của giáo trình, trong việc xác định độ giá trị bài trắc nghiệm đó thì nội dung và các mục tiêu phải trùng khớp nhau
Về mặt hiệu quả, độ tin cậy (r) là xác suất để cho điểm số như nhau trên một bài
trắc nghiệm sẽ đạt được khi ta lặp lại bài trắc nghiệm đó với số lượng học sinh giống như
Trang 9thế hoặc tương đương, hoặc khi bài trắc nghiệm đó được một người kiểm tra khác chấm điểm Các trị số thống kê này (tức hệ số tương quan r) biến thiên từ 0 đến 1; khi một trị
số là 0,7 hoặc lớn hơn nói chung là chấp nhận được Các bài trắc nghiệm khách quan nói chung có độ tin cậy cao hơn các bài tự luận, chủ yếu là do tính khách quan trong sự chấm bài và cho điểm
Cho đến nay, công thức thông dụng căn bản để ước tính hệ số tin cậy (r) là của Kuder-Richardson (K.R.) được đưa ra từ năm 1937 Thường để cho dễ tính toán, người ta
áp dụng công thức số 20 của K-R:
2 1
pq K
K r
trong đó K là số câu trắc nghiệm; p là tỷ lệ số câu trả lời đúng cho một câu (tức là độ khó F); q là tỷ lệ số câu trả lời sai cho một câu (q = 1 - p); và 2 là biến lượng các tổng điểm của các cá nhân đối với toàn bài trắc nghiệm
Trong trường hợp các câu trăc nghiệm không quá khác biệt nhau về độ khó (F, ở đây
là p), ta có thể ước lượng gần đúng pq bằng cách tính điểm trung bình (M) và biến lượng 2 của bài trắc nghiệm có K câu Khi đó ta áp dụng công thức số 21 của K-R, như
sau:
) 1 ( 1
1
K
M M K
K r
Chẳng hạn, với K = 100, 2
= 225 và M = 50, ta tính được r = 0,898
Cần nhớ lại rằng, công thức tính điểm trung bình (M hay x) và độ lệch chuẩn (s.d hay ) mà từ đó ta biết được biến lượng hay phương sai 2, như sau:
M = x n
trong đó: n là số thí sinh dự thi của lớp
) 1 (
) ( 2 2
n n
x
Tóm lại, độ giá trị nói lên tính chính xác của một tập hợp các điểm số trắc
nghiệm trong việc đo lường bất cứ cái gì mà nó muốn đo lường; còn độ tin cậy nói lên
tính vững chãi của một tập hợp các điểm số trắc nghiệm trong viêc đo lường bất cứ cái gì
mà nó muốn đo lường
Để cho một bài trắc nghiệm có giá trị, thì nó cũng phải đáng tin cậy Không thể nào một bài trắc nghiệm có giá trị mà lại không đáng tin cậy Ngược lại, một bài trắc nghiệm đáng tin cậy không nhất thiết là phải có giá trị Vì vậy, trong việc phân tích chất lượng của một bài trắc nghiệm về thành quả học tập, người ta thường nhấn mạnh chủ yếu trước hết vào độ tin cậy của các điểm số
Vậy độ tin cậy gia tăng trong những điều kiện hay trường hợp nào?
Độ tin cậy (r) tăng lên cùng với độ dài của bài trắc nghiệm và nếu như nó bao gồm được các câu hỏi có các trị số phân biệt cao Những lời hướng dẫn (làm bài trắc nghiệm) và các câu hỏi phải thật rõ ràng (để tránh cho học sinh khỏi nhầm lẫn) sẽ làm tăng thêm độ tin cậy của bài trắc nghiệm Tuy nhiên, độ tin cậy cao không hề ngụ ý độ
giá trị cao
Trang 103 Sự phỏng đoán và cách khống chế sự đoán mò
Các bài TNKQ thường bị phê phán bởi vì chúng khuyến khích sự phỏng đoán Quy trình cho điểm có thể lý giải cho giả định này bao gồm:-
Nâng điểm đỗ: Trong một bài trắc nghiệm có 100 câu hỏi với 5 sự lựa chọn cho
mỗi câu hỏi, sự đoán mò (random guessing) sẽ cho phép đạt điểm số trung bình là 20
điểm Hiển nhiên phạm vi các điểm số biến thiên là từ 20 đến 100 Điểm giữa của dãy biến thiên này (hay là điểm đỗ) là 60, hơn là 50 Phương pháp này giả định rằng sự đoán
mò xảy ra và điểm số bằng 60 nói lên được sự hoàn thành các mục tiêu của giáo trình đề
ra Cả hai sự giả định này có thể có giá trị hoặc không có giá trị
Những suy diễn về sự đoán mò: Một điểm số bằng 1/(n-1) được suy diễn cho mỗi một câu trả lời không đúng, trong đó n là con số các phương án lựa chọn cho mỗi câu Không có "quả phạt đền' cho một câu trả lời bỏ sót, không làm Các giả định này được tạo ra khi phương pháp này được áp dụng Thứ nhất, giả định rằng các câu trả lời không đúng được làm ra dựa trên cơ sở của sự đoán mò và rằng sự bỏ sót chỉ là do thông tin không thoả đáng Thứ hai, giả định rằng tất cả các sự lựa chọn đều có sức thu hút ngang nhau Các nhận định khác được đưa vào lý giải khi các phỏng đoán đúng được sử dụng bao gồm:
(1) sự ảnh hưởng của cá tính và chiến lược làm bài trắc nghiệm trên các điểm số của các học sinh - các học sinh trung thực có thể đoán; các học sinh cẩn thận có thể thích ứng với các quy trình "tránh sai lầm" (error avoidance);
(ii) vượt qua các khu vực trừ điểm khác, có nghĩa là điểm số không sai khác một cách trực tiếp với kiến thức
Rõ ràng là, chất lượng của việc viết câu hỏi trắc nghiệm có tác động lớn lên cách thức học sinh lựa chọn các phương án đúng hoặc phương án khác Nơi nào các câu nhiễu nghèo nàn được dùng tới thì học sinh sẽ sử dụng các phép suy diễn logic để trợ giúp họ tìm ra 'câu trả lời đúng' hơn là sự phỏng đoán Trong trường hợp này một trong những giả định đặt ra là làm sao để việc sử dụng các phỏng đoán đúng không áp dụng được