(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10(Luận văn thạc sĩ) Xây dựng ngân hàng câu hỏi trắc nghiệm và thiết kế phần mềm hỗ trợ kiểm tra đánh giá môn Toán 10
Mục tiêu nghiên cứu
Xây dựng ngân hàng CHTN và thiết kế phần mềm hỗ trợ KTĐG môn Toán 10.
Nhiệm vụ nghiên cứu
Để thực hiện mục tiêu trên, đề tài tập trung vào các nhiệm vụ cụ thể như sau: + Hệ thống cơ sở lý luận về TN
+ Phân tích nội dung môn Toán 10
+ Lập dàn bài trắc nghiệm môn Toán 10
+ Biên soạn ngân hàng CHTN, thiết lập bộ đề thi TN
+ Tổ chức thi (thử nghiệm)
+ Xử lý số liệu từ kết quả thử nghiệm
+ Hoàn chỉnh ngân hàng CHTN
+ Thiết kế phần mềm hỗ trợ KTĐG môn Toán 10 dựa trên phần mềm Trnghiem5Pr
+ Nhập dữ liệu từ ngân hàng CHTN vào phần mềm hỗ trợ KTĐG môn Toán 10
+ Thử nghiệm và triển khai phần mềm hỗ trợ KTĐG môn Toán 10.
Giới hạn đề tài
Vì thời gian hạn hẹp, học sinh THPT chỉ được tiếp cận với hình thức trắc nghiệm nhiều lựa chọn và một số điều kiện khách quan khác, nên nghiên cứu tập trung xây dựng ngân hàng câu hỏi trắc nghiệm (CHTN) cho chương trình Toán 10 chuẩn với loại câu hỏi MCQ Bên cạnh đó, nghiên cứu cũng thiết kế một hệ thống hỗ trợ kiểm tra, đánh giá môn Toán 10 dựa trên phần mềm tự do mã nguồn mở Trnghiem5Pr của thầy Phạm Văn Trung để triển khai thực thi.
Đối tượng và khách thể nghiên cứu
5.1 Đối tượng nghi ên c ứu:
Ngân hàng CHTN môn Toán 10 và phần mềm hỗ trợ KTĐG môn Toán 10
5.2 Khách th ể nghi ên c ứu:
Học sinh lớp 10 học môn Toán THPT theo chương trình chuẩn và phần mềm Trnghiem5Pr.
Giả thuyết nghiên cứu
Xây dựng ngân hàng câu hỏi Toán 10 chất lượng cao và tích hợp phần mềm hỗ trợ KTĐG sẽ giảm gánh nặng công tác đánh giá cho giáo viên và tạo điều kiện cho học sinh ôn tập tích cực hơn Những tài nguyên chuẩn hóa cùng công cụ đánh giá tự động giúp chấm bài nhanh, khách quan và nhất quán hơn, từ đó nâng cao hiệu quả KTĐG Việc này cũng thúc đẩy chất lượng học tập và giảng dạy bằng cách tối ưu hóa quá trình ôn luyện, phản hồi và điều chỉnh kế hoạch giảng dạy dựa trên dữ liệu đánh giá Tổng thể, hệ thống ngân hàng câu hỏi chất lượng và phần mềm KTĐG sẽ hỗ trợ giáo viên nâng cao chất lượng giảng dạy Toán 10 và giúp học sinh chủ động hơn trong học tập.
1 Thầy Phạm Văn Trung là giáo viên dạy Vật lý của trường THPT Bình Phú Tỉnh Bình Dương
Phương pháp nghiên cứu
Trên thế giới
Trắc nghiệm có nguồn gốc từ các nước phương Tây do các nhà tâm lý học nghiên cứu vào giữa thế kỉ XIX Cụ thể:
Năm 1845 tại Hoa Kỳ, trắc nghiệm thành tích học tập được xuất hiện lần đầu tiên do Horace Mann đề xuất
Vào năm 1859, nhà tâm lý học người Anh Francis Galton đã áp dụng nguyên tắc của Darwin để khảo sát sự khác biệt ở các cá thể và các tính chất tâm lý, sinh lý liên quan đến di truyền nhằm mục tiêu chọn ra những người sẽ làm cha mẹ tốt nhất Ông tiến hành các trắc nghiệm đo đạc một số đặc điểm được xem như chỉ số của sự ưu việt, và tin rằng một số năng lực thể chất nhất định có thể được dùng làm thước đo trí tuệ, nên gọi các trắc nghiệm này là trắc nghiệm về trí tuệ - mental test Các trắc nghiệm về trí tuệ đo sự tinh nhạy ở nghe và nhìn, cường độ cơ bắp, thời gian phản ứng và chức năng vận động của các cơ quan khác Thành tựu nổi bật của Galton là đưa tư duy đo lường vào nghiên cứu sự khác biệt cá nhân thông qua phương pháp thống kê Đầu năm 1879, Wilhelm Wundt thiết lập phòng thí nghiệm tâm lý học tại Leipzig, Đức, đây được xem là phòng thí nghiệm tâm lý học đầu tiên trên thế giới và những nghiên cứu tại đây mở ra phong trào nghiên cứu tâm lý học thực nghiệm, đồng thời từ đây ông đã chủ động áp dụng phương pháp trắc nghiệm như một công cụ khảo sát tâm lý.
Năm 1890, thuật ngữ trắc nghiệm được sử dụng rộng rãi sau khi cuốn sách:
Cuốn sách “Các trắc nghiệm và đo lường trí tuệ” được xuất bản tại New York và do nhà tâm lý học người Mỹ J Mc Cattell làm tác giả Trong tác phẩm này, Cattell trình bày khái niệm trắc nghiệm trí tuệ để chỉ ra bằng chứng tâm lý khác biệt giữa các cá nhân và từ đó mở rộng trắc nghiệm thành công cụ, phương tiện khảo sát và đo lường tâm lý Một năm sau, Joseph M Rice đã xử lý các kết quả trắc nghiệm bằng phương pháp toán học, cho thấy cách phân tích dữ liệu bằng toán học có thể nâng cao độ chính xác và hệ thống của đo lường trí tuệ.
Đầu thế kỉ XX, E Thorndike là người đầu tiên dùng trắc nghiệm như một phương pháp khách quan và nhanh chóng để đo trình độ kiến thức của học sinh, sau đó áp dụng cho một số môn học và các loại kiến thức khác Ở Pháp năm 1904, nhà tâm lý học Alfred Binet được giới lãnh đạo Paris giao nhiệm vụ xây dựng một phương pháp để xác định những trẻ bị tàn tật về mặt tâm thần không thể tiếp thu theo cách dạy bình thường; trắc nghiệm Binet ra đời từ đó, mang tên người phát minh Trắc nghiệm này khảo sát rất trực tiếp, đòi hỏi các kỹ năng tổng quát, cách lập luận phổ thông và có một kho thông tin cho những câu trả lời, với các điểm số được ghép theo tuổi trí lực (mental age) Nếu một em nhỏ tuổi hơn có thể trả lời cùng các câu hỏi của phần lớn các em ở độ tuổi lên mười chẳng hạn, người ta nói em ấy có độ tuổi trí lực bằng mười Mặc dù vậy, phương pháp trắc nghiệm thời ấy ở Pháp phát triển rất chậm và ít được sử dụng Mãi đến sau Thế chiến thứ hai, trắc nghiệm thành tích mới được dùng song song với kiểm tra cổ điển; đến thập niên 60, nó được phát triển mạnh và được sử dụng phổ biến ở cả trường phổ thông lẫn đại học.
Vào năm 1910, G I Rôxôlimô đã giới thiệu một phương pháp trắc nghiệm tâm lý; tác phẩm của ông nhanh chóng được dịch sang tiếng Đức và thu hút sự chú ý lớn ở Tây Âu và Mỹ Cùng trong năm đó, loạt trắc nghiệm do Munsterberg xây dựng nhằm tuyển chọn nghề nghiệp đã đóng góp đáng kể cho sự phát triển chung của việc ứng dụng trắc nghiệm.
Năm 1912, nhà tâm lý học người Đức V Stern giới thiệu khái niệm hệ số thông minh (IQ), là chỉ số đo nhịp độ phát triển trí tuệ và cho biết mức độ thông minh của một đứa trẻ so với tuổi thật của nó Đến năm 1916, giáo sư tâm lý tại Đại học Stanford và các cộng sự đã hai lần cải tổ trắc nghiệm thông minh của Binet để dùng cho trẻ em Mỹ Bản cải tiến này được gọi là trắc nghiệm Stanford-Binet và bài trắc nghiệm này được sửa lại một lần nữa vào năm 1960.
Trong giai đoạn từ 1926 đến 1931, Liên Xô có một số nhà sư phạm tại Matxcơva và Lêningrat đã dùng trắc nghiệm để chuẩn đoán đặc điểm tâm lý cá nhân và kiểm tra kiến thức của học sinh Tuy nhiên trắc nghiệm thời bấy giờ chưa hoàn chỉnh và còn bị phản đối nên việc sử dụng bị hạn chế; chỉ từ năm 1963 việc sử dụng trắc nghiệm mới được phục hồi Lúc ấy đã có nhiều công trình nghiên cứu trắc nghiệm cho các môn học khác nhau của các nhà nghiên cứu như E.E Solovieva (1963), V.A Korinskaia và L.M Pansetnicova (1964), K.A Craxmianscaia (1963), và nhiều tác giả khác.
Vào những năm 1940, Hoa Kỳ đã xuất hiện nhiều hệ thống trắc nghiệm nhằm đánh giá năng lực học tập của học sinh và một số trắc nghiệm nhóm như Alpha, Beta (xuất hiện trong thế chiến thứ nhất) để tuyển chọn nghề nghiệp quân sự Những bài trắc nghiệm phục vụ quân sự này nhằm kiểm tra kỹ năng, kỹ xảo cá biệt của binh sĩ để bố trí vào những vị trí phù hợp với năng lực, thể lực của họ Trong đó trắc nghiệm Alpha là trắc nghiệm viết, trắc nghiệm Beta là trắc nghiệm sử dụng công cụ; cả hai bài trắc nghiệm đều là trắc nghiệm nhóm và được chấm khách quan Đến năm 1961, Mỹ đã có hơn 2000 chương trình trắc nghiệm chuẩn Tiếp theo đó là công trình Ghecbêrich dùng máy tính điện tử để xử lý trắc nghiệm trên diện rộng xuất hiện vào năm 1963 Lúc bấy giờ, Hội đồng quốc gia hàng năm ở Anh đã có quyết định cho các trắc nghiệm chuẩn dùng trong các trường trung học Các thành tựu lý luận quan trọng của khoa học về đo lường trong giáo dục đạt được cho đến thập niên 70 của thế kỷ trước là “lý thuyết trắc nghiệm cổ điển”.
Trong khoảng bốn thập niên qua, từ lý thuyết trắc nghiệm cổ điển đã phát triển thành “lý thuyết trắc nghiệm hiện đại” hay “lý thuyết đáp ứng câu hỏi” (Item Response Theory – IRT), nâng cao đáng kể độ chính xác của các bài trắc nghiệm Dựa trên IRT, công nghệ trắc nghiệm thích ứng trên máy tính (Computer Adaptive Test – CAT) ra đời và ngày càng được ứng dụng rộng rãi Dựa trên thành tựu của IRT và ngôn ngữ học máy tính, công nghệ Criterion chấm tự động các bài thi tự luận tiếng Anh nhờ máy tính của EST đã được triển khai qua Internet trong những năm gần đây Những năm gần đây, trắc nghiệm được sử dụng phổ biến và sâu rộng tại nhiều nước trên thế giới để kiểm tra cuối môn ở cấp phổ thông và đại học, điển hình ở Anh, Mỹ, Pháp, Nga, Úc, Nhật Bản, Bỉ, Trung Quốc, Thái Lan và Hàn Quốc.
Trắc nghiệm khách quan là khái niệm khá muộn mà Việt Nam mới biết đến Lần đầu tiên sinh viên Việt Nam được làm quen với trắc nghiệm khách quan thông qua các cuộc khảo sát ngoại ngữ do các cơ quan quốc tế tổ chức tại Việt Nam vào đầu thập niên 50 thế kỉ XX, sau hơn một thế kỉ kể từ khi nó bắt đầu xuất hiện Tính đến cuối thập niên này, tài liệu sư phạm về trắc nghiệm của nước ta rất thiếu thốn, chỉ có một vài bài viết về lĩnh vực tâm lý và giáo dục đăng trên tập san Giáo dục từ năm 1960.
Kỳ thi trắc nghiệm đầu tiên của nước ta là kỳ thi tốt nghiệp phổ thông năm
1966 và chỉ được thi với ba môn là Lịch sử, Địa lý và Công dân Đến cuối năm
Vào năm 1969, môn trắc nghiệm được đưa vào giảng dạy như một thành phần mới của chương trình đào tạo ở các lớp cao học và tiến sĩ ngành giáo dục học tại trường Đại học Sư phạm Sài Gòn Sự bổ sung này nhằm chuẩn hóa đánh giá kết quả học tập và mở rộng cơ hội nghiên cứu về phương pháp đánh giá trong giáo dục Nhờ việc tích hợp môn trắc nghiệm, sinh viên cao học và tiến sĩ có điều kiện tiếp cận các kỹ thuật kiểm tra trắc nghiệm hiện đại, phục vụ cho các nghiên cứu và thực hành giảng dạy tại trường Đây được xem là bước đổi mới quan trọng trong hệ thống đào tạo sau đại học của ngành giáo dục tại Sài Gòn.
Vào năm 1972, các nhà giáo dục Việt Nam bắt đầu quan tâm đến trắc nghiệm thành quả học tập Đến năm 1974, lần đầu tiên nước ta cho thi trắc nghiệm loại câu nhiều lựa chọn đối với tất cả các môn học, được triển khai tại miền Nam và thực hiện trong hai khoá thi Tú tài liên tiếp.
Tuy nhiên, cho tới thập niên cuối của thế kỉ này trắc nghiệm khách quan ở nước ta mới có bước trở mình đáng kể Trong giai đoạn này, số lượng tài liệu phục vụ cho học tập và nghiên cứu được xuất bản nhiều hơn trước, và đáng lưu ý là sự xuất hiện của các ấn phẩm liên quan đến trắc nghiệm kiến thức và đánh giá khách quan, góp phần nâng cao chất lượng giáo dục.
Trong bài viết tổng hợp này, ba công trình đáng chú ý là "10 thức kỹ thuật nông nghiệp ở trường trung học phổ thông" của Châu Kim Lang (xuất bản 1988); "Trắc nghiệm và đo lường thành quả học tập (tập 1–2)" của Dương Thiệu Tống (xuất bản 1995); và "Phương pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập" của Nguyễn Phụng Hoàng và Võ Thị Ngọc Lan (xuất bản 1996) Một mốc quan trọng là kỳ thi tuyển đại học thí điểm tại Đại học Đà Lạt năm 1996 bằng phương pháp trắc nghiệm khách quan được Hội nghị rút kinh nghiệm của BGD&ĐT khẳng định có thành công Kỳ thi có 7.200 thí sinh dự tuyển, có hai loại đề trắc nghiệm và tự luận được sử dụng để thí sinh lựa chọn; khoảng 70% thí sinh chọn đề trắc nghiệm Trong gần 60 trường hợp vi phạm kỷ luật thi do quay cóp, chỉ có 4 thí sinh thuộc nhóm làm trắc nghiệm bị phát hiện.
Trong bước sang kỉ mới, BGD&ĐT chú ý phát triển đánh giá bằng phương pháp trắc nghiệm khách quan (KTĐG) thông qua việc cử nhiều chuyên gia đi nước ngoài học tập và tổ chức hội thảo tập huấn tại các trường như Đại học Sư phạm Hà Nội, Đại học Bách khoa Hà Nội, Cao đẳng Sư phạm Hà Nội, cùng nhiều cơ sở giáo dục khác Những năm gần đây, BGD&ĐT đã đưa một số câu hỏi trắc nghiệm khách quan vào sách giáo khoa (lồng ghép với câu hỏi tự luận) ở một số môn học trong trường phổ thông và dự kiến sẽ hoàn thiện việc này ở cấp THPT trong những năm tới Từ năm học 2006-2007, BGD&ĐT có chủ trương tổ chức thi tốt nghiệp THPT và thi tuyển sinh đại học bằng phương pháp trắc nghiệm khách quan đối với các môn: Lý, Hóa, Sinh và Tiếng Anh Những bước đi này hứa hẹn cho tương lai phát triển mạnh mẽ của phương pháp trắc nghiệm khách quan ở Việt Nam.
Các khái niệm liên quan
Trắc nghiệm có gốc tiếng Anh là Test, mang nghĩa thử, phép thử và sát hạch Theo nghĩa Hán–Việt, Trắc nghĩa là đo lường còn Nghiệm là suy xét, chứng thực Theo từ điển Tiếng Việt phổ thông (2001) của Viện ngôn ngữ học, Trắc nghiệm được định nghĩa là khảo sát, đo lường khi làm các thí nghiệm khoa học trong phòng Như vậy, trắc nghiệm vừa là công cụ đánh giá vừa là căn cứ kiểm chứng dữ liệu trong nghiên cứu và ứng dụng giáo dục.
Theo GS Dương Thiệu Tống, trắc nghiệm là công cụ hoặc phương thức hệ thống nhằm đo lường một mẫu các động thái (hành vi) để trả lời các câu hỏi nghiên cứu về hành vi, cung cấp dữ liệu có cấu trúc và có thể so sánh giữa các đối tượng khác nhau Trắc nghiệm giúp ghi nhận và phân tích các yếu tố hành vi một cách có hệ thống, từ đó khái quát xu hướng, mức độ ảnh hưởng và mối quan hệ giữa các biến, phục vụ cho các mục tiêu nghiên cứu và đánh giá khách quan.
“Thành tích của cá nhân như thế nào, so sánh với những người khác hay so sánh với một nhiệm vụ học tập dự kiến” [35 tr364]
Trần Thị Tuyết Oanh trích dẫn Gronlund với định nghĩa trắc nghiệm là một công cụ hoặc quy trình có hệ thống nhằm đo lường mức độ mà cá nhân đạt được trong một lĩnh vực cụ thể [25 tr61] Định nghĩa này nhấn mạnh tính khách quan và tính hệ thống của trắc nghiệm, biến nó thành công cụ đánh giá năng lực và thành tích cá nhân trong phạm vi được xác định dựa trên dữ liệu thu thập được.
Trắc nghiệm, theo nghĩa rộng, là hoạt động nhằm đo lường năng lực của một đối tượng để phục vụ các mục đích xác định Trong giáo dục, trắc nghiệm được tiến hành thường xuyên ở các kỳ thi và kiểm tra nhằm đánh giá kết quả học tập và quá trình giảng dạy đối với một học phần, của một môn học, hoặc của toàn cấp học; đồng thời nó được dùng để tuyển chọn những người có năng lực nhất vào một khóa học tiếp theo.
Có thể chia trắc nghiệm ra thành ba loại là quan sát, viết và vấn đáp
Hình 1.1: Phân loại trắc nghiệm theo cách thực hiện việc đánh giá
1.2.2 Tr ắc nghiệm khách quan
Trắc nghiệm khách quan là dạng trắc nghiệm phổ biến trong giáo dục, ở đó mỗi câu hỏi kèm theo đáp án sẵn để học sinh lựa chọn Loại câu hỏi này cung cấp cho học sinh một phần hoặc toàn bộ thông tin cần thiết và đòi hỏi các em chọn một đáp án đúng từ các phương án có sẵn hoặc chỉ cần điền thêm vài từ vào chỗ trống Ưu điểm của trắc nghiệm khách quan là giúp đánh giá nhanh hiểu biết và nhận diện kiến thức của học sinh, tối ưu quá trình ra đề và phân tích kết quả dựa trên dữ liệu lựa chọn Để tối ưu hóa nội dung cho công cụ tìm kiếm (SEO), nên kết hợp các từ khóa như trắc nghiệm khách quan, câu hỏi trắc nghiệm, đáp án sẵn, điền từ, đánh giá học sinh và phân tích dữ liệu làm bài.
Trắc nghiệm khách quan được gọi như vậy vì nó đảm bảo tính công bằng và nhất quán trong quá trình chấm điểm Kết quả chấm điểm không bị ảnh hưởng bởi quan điểm hay thiên vị của người chấm, mà dựa trên đáp án đúng và các tiêu chí chấm điểm được xác định trước Quá trình chuẩn hóa, sự thống nhất trong đáp án và tiêu chí đánh giá giúp tăng độ tin cậy và khả năng so sánh giữa các thí sinh cũng như giữa các kỳ thi khác nhau Nhờ hệ thống đánh giá chuẩn, trắc nghiệm phản ánh đúng năng lực người làm bài, giảm sai lệch do người chấm và tăng tính minh bạch của kết quả.
QUAN SÁT VIẾT VẤN ĐÁP
12 yếu tố, bao gồm các thức, kỹ năng và thái độ của người chấm bài thi, vẫn quyết định chất lượng đánh giá và thậm chí có thể không phụ thuộc hoàn toàn vào công cụ chấm Trong bối cảnh hiện nay, trước những bất công và tiêu cực liên quan đến thi cử trắc nghiệm khách quan, vai trò của người chấm ngày càng được quan tâm và ủng hộ để đảm bảo sự công bằng và minh bạch cho kỳ thi.
Theo hình 1.1, trắc nghiệm khách quan và trắc nghiệm tự luận thuộc nhóm trắc nghiệm có hình thức viết Ở Việt Nam, theo cách gọi phổ biến, trắc nghiệm khách quan được gọi là "trắc nghiệm" còn trắc nghiệm tự luận được gọi là "tự luận" Trong khuôn khổ luận văn này, người nghiên cứu vẫn dùng từ "trắc nghiệm" với nghĩa là trắc nghiệm khách quan.
Trắc nghiệm, theo PGS.TS Trần Khánh Đức, là một phép thử nhằm nhận dạng và xác định, đồng thời thu nhận những thông tin phản hồi về những khả năng, thuộc tính, đặc tính và tính chất của một sự vật hay hiện tượng nào đó Quá trình trắc nghiệm liên quan đến việc đặt câu hỏi, đo lường và phân tích dữ liệu để làm rõ các yếu tố cấu thành đối tượng, từ đó nhận diện các đặc điểm nổi bật Nhờ đó trắc nghiệm trở thành công cụ khách quan, cung cấp thông tin đáng tin cậy từ thực nghiệm và quan sát để rút ra những nhận định có cơ sở về sự vật hoặc hiện tượng được khảo sát.
Trắc nghiệm, theo Nguyễn Công Khanh, là một hình thức đánh giá hoặc đo lường được thực hiện bằng hệ thống các thủ pháp và kỹ thuật cụ thể nhằm thu thập thông tin và chuyển đổi chúng thành số liệu hoặc điểm số để lượng hóa những yếu tố cần đo [19 tr35].
Theo tác giả Trần Bá Hoành, trắc nghiệm là hình thức đặc biệt để thăm dò một số đặc điểm về trí tuệ của học sinh (như thông minh, trí nhớ, tưởng tượng, chú ý) hoặc để kiểm tra một số kiến thức, kỹ năng, kỹ xảo của học sinh thuộc một chương trình nhất định Đến nay, người ta hiểu trắc nghiệm là một bài tập nhỏ hoặc câu hỏi kèm theo đáp án sẵn, yêu cầu học sinh suy nghĩ rồi dùng một ký hiệu đơn giản đã quy ước để trả lời.
1.2.3 Thi ết kế phần mềm
Phần mềm, hay software trong tiếng Anh, là tập hợp các câu lệnh được viết bằng một hoặc nhiều ngôn ngữ lập trình theo một trật tự xác định nhằm tự động hóa các chức năng và giải quyết các bài toán cụ thể Nó cho phép máy tính thực hiện các tác vụ phức tạp một cách chính xác và hiệu quả, từ xử lý dữ liệu đến tương tác người dùng qua giao diện Phần mềm là thành phần then chốt của hệ thống công nghệ thông tin, được phát triển qua quy trình lập trình, kiểm thử và bảo trì để đảm bảo hiệu suất, tính ổn định và khả năng mở rộng.
Phần mềm có thể được hiểu theo nhiều nghĩa khác nhau Theo một cách, nó là một tập hợp những câu lệnh hoặc chỉ thị được viết bằng một hoặc nhiều ngôn ngữ lập trình, nhằm điều khiển máy tính thực thi các tác vụ cụ thể Ngoài ra, phần mềm còn được coi như một hệ sinh thái bao gồm ứng dụng, thư viện và giao diện người dùng, làm việc cùng nhau để giải quyết các nhu cầu công nghệ và nâng cao hiệu suất làm việc Việc nắm bắt các khía cạnh này giúp làm rõ chức năng, mục tiêu và cách tối ưu hóa phần mềm, đồng thời hỗ trợ tối ưu hóa nội dung và từ khóa cho SEO.
Phần mềm là một công cụ do các lập trình viên xây dựng nhằm tự động hóa các nhiệm vụ và giải quyết các vấn đề cụ thể Nó hoạt động qua các trình tự thực thi được sắp xếp theo một trật tự xác định và sẽ xử lý dữ liệu cùng các tài liệu liên quan để hoàn thành chức năng mong muốn Các ứng dụng phổ biến của phần mềm bao gồm nghe nhạc, xem phim, xử lý ảnh và chơi game, cho thấy tính đa dụng và tiện ích mà công nghệ mang lại cho người dùng.
Vậy ta có thể hiểu phần mềm theo nghĩa: “là một chương trình gồm nhiều câu lệnh được viết ra theo một hoặc nhiều ngôn ngữ lập trình nào đó nhằm thực hiện một công việc nhất định”
1.2.3.2 Phần mềm tự do mã nguồn mở
Tổng quan về các hình thức trắc nghiệm khách quan
Có nhiều hình thức đặt CHTN khác nhau, nhưng thông dụng nhất là bốn hình thức: trắc nghiệm đúng - sai, trắc nghiệm có nhiều lựa chọn, trắc nghiệm đối chiếu cặp đôi và trắc nghiệm điền khuyết
1.3.1 Tr ắc nghiệm Đúng - Sai (True - False question) [32 tr67],[40 tr100]
Gồm một câu phát biểu và phần HS trả lời bằng cách lựa chọn: Đúng (Đ) hay Sai (S) CHTN đúng - sai thường có hai dạng:
Dạng có thân chung: Câu hỏi gồm một phần thân chung và các ý trả lời
Người học phải xem xét các ý trả lời, so sánh với nội dung của phần thân chung để xác định câu nào đúng, câu nào sai
Phần thân chung là một cụm từ hoặc một vấn đề mang tính lý thuyết Câu trả lời cho phần này thường gồm 5 câu (đôi khi nhiều hơn); những câu trả lời này có thể đúng hoặc sai, nhưng luôn là những ý liên quan trực tiếp để làm rõ phần thân chung Mục tiêu là trình bày các ý chính một cách logic và liên kết, giúp người đọc nắm bắt khái niệm một cách nhanh chóng và tinh gọn Để tối ưu SEO, nên nhấn mạnh từ khóa liên quan và đảm bảo các câu trả lời phản ánh đúng nội dung chủ đề, đồng thời duy trì sự nhất quán giữa các ý trong phần thân chung Ví dụ minh họa cho phần thân chung cho người viết dễ hình dung cách triển khai và đảm bảo tính liền mạch cho toàn bài.
Hãy đánh dấu (X) vào cột Đ (đúng) hoặc cột S (sai) phù hợp trong các ý sau:
Giá trị cực đại của f(x) là
Giá trị cực đại của f(x) là
Tung độ tâm đối xứng của đồ thị hàm số f(x) là
Phương trình đường thẳng qua hai điểm cực trị có dạng:
Hệ số góc của tiếp tuyến tại tiếp điểm có hoành độ x = 0 là -2
Dạng không có thân chung trong đề thi là dạng câu hỏi đúng – sai được viết dưới dạng một câu hoàn chỉnh, thường mang tính khẳng định, và người làm bài sẽ lựa chọn đáp án phù hợp với nội dung câu được nêu ra Ví dụ minh họa cho dạng này là câu: Đồ thị hàm số y = ax^3 + bx^2 + cx + d (a ≠ 0) luôn có tâm đối xứng tại điểm uốn của đồ thị Dạng câu hỏi đúng – sai này giúp kiểm tra nhanh kiến thức về đặc tính của đồ thị hàm số và các khái niệm liên quan đến tâm đối xứng và điểm uốn.
Trong cả hai dạng đúng – sai của CHTN, câu đúng là câu có toàn bộ nội dung phù hợp với tri thức khoa học, còn chỉ một chi tiết không phù hợp với tri thức khoa học cũng khiến toàn bộ CHTN được đánh giá là sai; ưu điểm của nguyên tắc này là bảo đảm tính nghiêm ngặt, nhất quán và dễ kiểm chứng kết quả bằng cách tập trung vào sự phù hợp hoàn chỉnh với kiến thức khoa học.
- Có khả năng áp dụng rộng rãi
Việc cho phép đặt nhiều câu hỏi trong một bài trắc nghiệm với thời gian làm bài được cho trước sẽ tăng tính tin cậy của bài thi, đặc biệt khi các câu hỏi đúng–sai được soạn thảo theo đúng quy cách và chuẩn hóa.
Trong thời gian ngắn, có thể soạn được nhiều câu hỏi trắc nghiệm đúng-sai mà vẫn đảm bảo tính rõ ràng và súc tích Người ra đề có thể tận dụng các phát biểu cô đọng, dễ nhận diện đúng/sai và liên quan trực tiếp đến mục tiêu đánh giá, do đó không cần phải tìm thêm nhiều câu phát biểu khác nữa để làm phong phú đề thi Việc này giúp tiết kiệm thời gian soạn bài, tăng hiệu quả quản lý ngân hàng câu hỏi và nâng cao độ tin cậy của bài kiểm tra Để tối ưu, mỗi câu nên tập trung vào một khái niệm nhất định, đảm bảo có một đáp án đúng duy nhất, và được viết rõ ràng để người làm bài dễ hiểu và tránh nhầm lẫn.
HS so sánh và lựa chọn
- Có cấu trúc đơn giản nên ít phạm sai lầm về mặt kỹ thuật
- Học viên không phải viết câu trả lời nên kết quả hoàn toàn đúng so với đáp án, khi chấm điểm nhanh và rất dễ thống nhất
- Độ may rủi cao (50%), do đó dễ khuyến khích HS đoán mò
- Khả năng phân biệt HS giỏi và HS kém rất thấp
Những yêu cầu khi soạn câu hỏi trắc nghiệm đúng - sai:
- Mỗi CHTN chỉ nên diễn tả một ý nghĩa độc nhất, tránh những câu phức tạp, bao gồm quá nhiều chi tiết
- Không chép nguyên văn những câu hỏi từ SGK hoặc giáo trình, vì làm như vậy chỉ khuyến khích học thuộc lòng một cách máy móc
- Lựa chọn những câu phát biểu sao cho một người có khả năng trung bình không thể nhận ra ngay là đúng hay sai mà không cần suy nghĩ
Các câu phát biểu nên dựa trên những ý niệm cơ bản và có tính đúng sai được xác định chắc chắn, dựa trên cơ sở khoa học vững chắc Nội dung này không phụ thuộc vào quan điểm cá nhân hay ý kiến riêng của từng người mà phải dựa trên bằng chứng, dữ liệu và lý luận khách quan Khi trình bày thông tin, cần tập trung vào luận cứ có căn cứ khoa học, kiểm chứng lẫn nhau và tránh các tuyên bố mang tính chủ quan để đảm bảo tính chuẩn xác, tính khoa học và sức thuyết phục của bài viết, đồng thời tối ưu hóa cho các yếu tố SEO bằng cách sử dụng từ khóa liên quan đến khoa học, bằng chứng và sự khách quan.
Để tối ưu hóa cho SEO và nâng cao tính xác thực cho bài viết, hãy hạn chế dùng từ mang tính tuyệt đối và diễn đạt linh hoạt dựa trên ngữ cảnh thực tế Những câu quá khắc nghiệt hoặc khẳng định tuyệt đối thường dễ gây hiểu nhầm hoặc sai lệch, vì vậy lựa chọn từ ngữ vừa xác đáng vừa mềm mỏng sẽ giúp nội dung đáng tin hơn và dễ tiếp nhận bởi người đọc.
Tránh dùng các thuật ngữ mơ hồ về mức độ hay số lượng như "đôi khi", "thông thường", "phần lớn", "một số người", "trong hầu hết các trường hợp" vì những từ ngữ này mang tính dè dặt và dễ gây hiểu nhầm cho người đọc Thay vào đó, hãy cung cấp dữ liệu cụ thể hoặc phạm vi rõ ràng để tăng độ chính xác và tin cậy của bài viết, đồng thời tối ưu hóa SEO bằng cách lập nội dung súc tích, có từ khóa mục tiêu và câu chữ dễ quét Việc diễn đạt rõ ràng giúp độc giả nắm bắt ý tưởng nhanh hơn, tăng thời gian ở trang và giảm tỷ lệ thoát.
- Tránh dùng các câu ở thể phủ định, nhất là thể phủ định kép
- Tránh làm cho một câu trở nên sai vì một chi tiết vụn vặt hoặc một ý tưởng nhằm đánh lạc HS
- Trong bài thi, số câu đúng và số câu sai nên gần bằng nhau
Có hai phương pháp chấm điểm thường được áp dụng:
+ Phương pháp thứ nhất là chấm mỗi câu trả lời đúng 1 điểm và không kể đến câu làm sai hoặc không làm
+ Phương pháp thứ hai là đếm số câu trả lời đúng và trừ đi số câu trả lời sai hoặc không làm
Phương pháp thứ hai thường được dùng nhiều hơn để tránh trường hợp HS đoán mò, làm tăng tính giá trị cho bài trắc nghiệm
1.3.2 Tr ắc nghiệm nhiều lựa chọn (Multiple choice question) [32 tr71], [40 tr102] Cấu trúc :
Loại CHTN nhiều lựa chọn gồm có hai phần: Phần “gốc” (còn gọi là phần thân chung) và phần “lựa chọn” (còn gọi là phần trả lời)
Phần gốc của một bài kiểm tra có thể là một câu hỏi hoặc một câu bỏ lửng, và cũng có thể là một hình vẽ hoặc đồ thị; phần gốc phải tạo nền tảng cho sự lựa chọn bằng cách đặt ra một vấn đề hoặc trình bày một ý tưởng rõ ràng để người làm bài có thể hiểu đúng bản chất và mục tiêu của đề CHTN muốn hỏi điều gì để người làm bài có thể lựa chọn câu trả lời thích hợp.
Phần lựa chọn của câu hỏi trắc nghiệm thường gồm 4–5 đáp án, trong đó có một đáp án đúng hoặc đúng nhất Các đáp án còn lại là mồi nhử hoặc nhiễu, trông có vẻ hợp lý nhưng nhằm buộc học sinh phải cân nhắc kỹ trước khi đưa ra quyết định Ưu điểm của cấu trúc này là cho phép đánh giá nhanh kiến thức và khả năng phân tích của học sinh, tối ưu hóa việc chấm điểm và hỗ trợ ôn tập hiệu quả bằng cách so sánh các lựa chọn với đáp án đúng.
Để trả lời câu hỏi trắc nghiệm một cách chính xác, học sinh phải vận dụng suy nghĩ và phân tích để lựa chọn được đáp án đúng, đồng thời tránh các đáp án nhiễu chứ không chỉ dựa vào trí nhớ Nhờ đó, loại câu hỏi này có thể kiểm tra kiến thức ở mức cao hơn, đánh giá khả năng nhận diện khái niệm và tư duy phản biện của học sinh.
- Có thể hỏi trên phương diện rộng của chương trình, do đó có thể làm tăng độ giá trị
- Chấm điểm rất nhanh, chính xác nên tiết kiệm được thời gian chấm bài
Trong thiết kế câu hỏi trắc nghiệm, độ tin cậy của đề thi tăng lên khi các đáp án nhử (đáp án sai) không quá dễ nhận biết bởi học sinh Các lựa chọn sai được phân bổ hợp lý và có mức độ khó vừa phải buộc người làm bài phân tích, so sánh và suy luận thay vì chỉ nhận diện đáp án đúng Khi mồi nhử được cân nhắc kỹ, kết quả kiểm tra phản ánh đúng năng lực và hiểu biết của học sinh Ngược lại, nếu các đáp án nhử quá rõ ràng hoặc quá mờ, độ tin cậy của câu hỏi sụt giảm do sự phụ thuộc vào đoán mò hoặc nhận diện nhanh chóng.
- Vì chỉ có một câu trả lời đúng trong số các câu trả lời nên nếu HS biết trước,
HS sẽ không cần đọc các câu trả lời khác Trong trường hợp này, những câu “mồi nhử” hay việc lựa chọn sẽ không có ý nghĩa
- Việc soạn thảo câu hỏi có nhiều lựa chọn mất rất nhiều thời gian Nhiều khi rất khó tìm được câu “ mồi nhử” cho có vẻ hợp lý
Quá trình biên soạn gặp nhiều khó khăn khiến một số câu hỏi tập trung vào những kiến thức không quan trọng, từ đó làm giảm giá trị và hiệu quả của câu hỏi đối với người đọc và kết quả tìm kiếm.
Học sinh có óc sáng kiến có thể tìm ra câu trả lời sáng tạo tốt hơn phương án đúng đã cho, nên họ có thể không hài lòng hoặc cảm thấy khó chịu khi đáp án hiện có không phản ánh đầy đủ suy nghĩ và kỳ vọng của các em Điều này nhấn mạnh tầm quan trọng của việc khuyến khích tư duy độc lập và đánh giá đa chiều trong quá trình học tập, giúp giáo viên nhận diện những đóng góp sáng tạo và cung cấp phản hồi mang tính xây dựng.
- Câu hỏi có nhiều lựa chọn không đo được khả năng phán đoán tinh vi và khả năng giải quyết vấn đề khéo léo
- HS cần nhiều thời giờ để đọc câu hỏi và các câu trả lời
- Phần gốc của câu hỏi phải diễn đạt rõ ràng vấn đề để người trả lời hiểu được chính xác nội dung câu hỏi đề cập
- Phần gốc của câu hỏi nên mang trọn ý nghĩa và câu trả lời nên ngắn gọn
- Nên có 4 đến 5 phương án trả lời cho một câu hỏi, thống nhất trong một bài trắc nghiệm
- Không kết thúc phần gốc bằng các từ để lộ ý trả lời
- Tránh dùng phủ định trong phần gốc: những từ như “không”, “chẳng” tránh sử dụng trong câu hỏi
- Các câu trả lời để lựa chọn phải có vẻ hợp lý để HS buộc phải cân nhắc khi lựa chọn
Phân tích câu trắc nghiệm
CƠ SỞ LÝ LUẬN VỀ XÂY XỰNG NGÂN HÀNG CÂU HỎI TRẮC NGHIỆM VÀ THIẾT KẾ
PHẦN MỀM HỖ TRỢ KIỂM TRA ĐÁNH GIÁ
1.1 Tổng quan về vấn đề nghiên cứu
Trắc nghiệm có nguồn gốc từ các nước phương Tây do các nhà tâm lý học nghiên cứu vào giữa thế kỉ XIX Cụ thể:
Năm 1845 tại Hoa Kỳ, trắc nghiệm thành tích học tập được xuất hiện lần đầu tiên do Horace Mann đề xuất
Vào năm 1859, nhà tâm lý học người Anh Francis Galton đã áp dụng nguyên tắc của Darwin để khảo sát sự khác biệt giữa các cá thể, các đặc điểm tâm lý và sinh lý liên quan đến yếu tố di truyền nhằm mục đích chọn ra những người sẽ làm cha mẹ tốt nhất Galton đã triển khai các trắc nghiệm đo một số đặc điểm của con người, xem đó như những chỉ số cho sự ưu việt và cho rằng một số năng lực thể chất có thể được dùng làm thước đo trí tuệ nên gọi các trắc nghiệm này là mental test Trắc nghiệm về trí tuệ đo lường sự tinh nhạy trong nghe, nhìn, cường độ cơ bắp, thời gian phản ứng và chức năng vận động của các cơ quan, và đó là những ý tưởng trắc nghiệm đầu tiên; đóng góp lớn nhất của ông là xây dựng kỹ thuật nghiên cứu các khác biệt cá nhân dựa trên phương pháp thống kê Đầu năm 1879, Wilhelm Wundt thiết lập phòng thí nghiệm ở Leipzig, Đức, được xem là phòng thí nghiệm tâm lý học đầu tiên trên thế giới; các nghiên cứu tại đây mở đường cho phong trào tâm lý học thực nghiệm, và từ đây Wundt chủ động áp dụng phương pháp mới, đặc biệt là sử dụng trắc nghiệm làm công cụ khảo sát tâm lý.
Năm 1890, thuật ngữ trắc nghiệm được sử dụng rộng rãi sau khi cuốn sách:
“Các trắc nghiệm và đo lường trí tuệ” được xuất bản ở New York bởi nhà tâm lý học người Mỹ J Mc Cattell Trong tác phẩm này, Cattell đã đưa ra khái niệm trắc nghiệm trí tuệ nhằm chỉ ra bằng chứng tâm lý cho thấy sự khác biệt giữa các cá nhân Từ đó, trắc nghiệm được hiểu rộng như một công cụ, phương tiện và cách thức để khảo sát và đo lường các yếu tố tâm lý Một năm sau, Joseph M Rice đã xử lý thành công kết quả trắc nghiệm bằng phương pháp toán học.
Cuối thế kỉ XIX và đầu thế kỉ XX, E Thorndike là người đầu tiên sử dụng trắc nghiệm như một phương pháp khách quan và nhanh chóng để đo trình độ kiến thức của học sinh, ban đầu áp dụng cho một số môn học và dần mở rộng cho các loại kiến thức khác Tại Pháp năm 1904, Alfred Binet được giới lãnh đạo các trường ở Paris giao nhiệm vụ xây dựng một phương pháp nhằm xác định những trẻ em bị tàn tật về mặt tâm thần không thể tiếp thu theo cách dạy bình thường Trắc nghiệm do Binet thiết kế đáp ứng rất trực tiếp: nó đo các kỹ năng tổng quát, khả năng lập luận và đòi hỏi một kho thông tin để trả lời; các điểm số được tính theo tuổi trí lực (mental age) Nếu một em nhỏ tuổi hơn có thể trả lời các câu hỏi của phần lớn học sinh ở độ tuổi cao hơn, người ta nói em có độ tuổi trí lực tương ứng với tuổi của nhóm đó Dù vậy, ở Pháp trắc nghiệm thời bấy giờ phát triển chậm và ít được sử dụng Mãi đến sau chiến tranh thế giới thứ hai, trắc nghiệm thành tích học tập mới được dùng song song với kiểm tra cổ điển, và đến thập niên 60 nó được phát triển mạnh và phổ biến ở cả trường phổ thông lẫn đại học.
Vào năm 1910, G I Rôxôlimô giới thiệu phương pháp trắc nghiệm tâm lý; tác phẩm của ông ngay lập tức được dịch sang tiếng Đức và thu hút sự chú ý ở Tây Âu và Mỹ Cùng năm ấy, loạt trắc nghiệm do Munsterberg xây dựng dùng cho công tác tuyển chọn nghề nghiệp đã đóng góp đáng kể vào sự phát triển chung của việc sử dụng trắc nghiệm.
Năm 1912, nhà tâm lý học người Đức V Stern đề xuất khái niệm hệ số thông minh (IQ), là thước đo nhịp độ phát triển trí tuệ của một cá nhân và cho biết mức độ thông minh tương đối so với tuổi thật Đến năm 1916, một giáo sư tâm lý tại Đại học Stanford, Mỹ cùng với cộng sự đã hai lần cải tổ trắc nghiệm thông minh của Binet để phù hợp với trẻ em Mỹ Bản cải tiến này được gọi là Stanford-Binet, và bài kiểm tra này được sửa lại một lần nữa vào năm 1960.
Trong giai đoạn từ 1926 đến 1931, tại Matxcơva, Leningrad và Kiev có một số nhà sư phạm đã dùng trắc nghiệm để chẩn đoán đặc điểm tâm lý cá nhân và kiểm tra kiến thức của học sinh Tuy nhiên, các trắc nghiệm thời kỳ ấy chưa hoàn chỉnh và nhược điểm của chúng chưa được nhận diện đầy đủ nên bị phản đối khi đưa vào sử dụng Chỉ từ năm 1963 việc sử dụng trắc nghiệm mới được phục hồi Lúc này đã có nhiều công trình nghiên cứu trắc nghiệm cho các môn học khác nhau do các nhà nghiên cứu như E.E Solovieva (1963), V.A Korinskaia và L.M Pansetnicova (1964), K.A Craxmianscaia (1963) thực hiện.
Vào năm 1940, Hoa Kỳ đã xuất hiện nhiều hệ thống trắc nghiệm dùng để đánh giá năng lực học tập của học sinh và một số trắc nghiệm nhóm như trắc nghiệm Alpha (trắc nghiệm viết) và trắc nghiệm Beta (trắc nghiệm sử dụng công cụ) để tuyển chọn nghề nghiệp quân sự, nhằm kiểm tra kỹ năng, kỹ xảo cá biệt của binh sĩ để bố trí vào những vị trí phù hợp với năng lực và thể lực của họ Cả hai bài trắc nghiệm Alpha và Beta đều là trắc nghiệm nhóm và được chấm khách quan Đến năm 1961, Mỹ đã có hơn 2000 chương trình trắc nghiệm chuẩn [15 tr36] Tiếp theo là công trình Ghecbêrich dùng máy tính điện tử để xử lý trắc nghiệm trên diện rộng xuất hiện vào năm 1963 Lúc bấy giờ, Hội đồng quốc gia hàng năm ở Anh đã có quyết định cho các trắc nghiệm chuẩn dùng trong các trường trung học Các thành tựu lý luận quan trọng của khoa học về đo lường trong giáo dục đạt được cho đến thập niên 70 của thế kỷ trước là “lý thuyết trắc nghiệm cổ điển”.
Trong tiến trình phát triển sau thuyết đo lường cổ điển, lý thuyết trắc nghiệm hiện đại (Item Response Theory – IRT) mở ra một chuẩn mực mới về đo lường chất lượng bài thi IRT đã mang lại những thành tựu quan trọng giúp nâng cao độ chính xác của trắc nghiệm và từ đó dẫn tới sự ra đời của công nghệ trắc nghiệm thích ứng máy tính (Computer Adaptive Test – CAT) Trên cơ sở các thành tựu của IRT và ngôn ngữ học máy tính, công nghệ Criterion chấm tự động các bài thi tự luận tiếng Anh nhờ máy tính của EST đã được triển khai qua Internet trong những năm vừa qua Gần đây, trắc nghiệm được sử dụng phổ biến và rộng rãi trên thế giới để kiểm tra cuối môn ở cả bậc phổ thông và đại học, điển hình tại Anh, Mỹ, Pháp, Nga, Úc, Nhật Bản, Bỉ, Trung Quốc, Thái Lan và Hàn Quốc.
Trắc nghiệm khách quan ở Việt Nam được biết đến muộn so với nhiều nước khác Lần đầu tiên, sinh viên Việt Nam được làm quen với trắc nghiệm khách quan thông qua các khảo sát ngoại ngữ do các cơ quan quốc tế tổ chức tại Việt Nam vào đầu thập niên 1950, sau hơn một thế kỷ kể từ khi phương pháp này xuất hiện trên thế giới Đến cuối thập niên 1950, nguồn tài liệu sư phạm về trắc nghiệm ở nước ta vẫn rất thiếu thốn, chỉ có một vài bài viết về lĩnh vực tâm lý và giáo dục được đăng trên tập san Giáo dục từ năm 1960.
Kỳ thi trắc nghiệm đầu tiên của nước ta là kỳ thi tốt nghiệp phổ thông năm
1966 và chỉ được thi với ba môn là Lịch sử, Địa lý và Công dân Đến cuối năm
Vào năm 1969, môn trắc nghiệm được xem là một thành quả học tập mới và lần đầu tiên được đưa vào giảng dạy tại Trường Đại học Sư phạm Sài Gòn Môn này được áp dụng cho các lớp cao học và tiến sĩ giáo dục học, đánh dấu bước tiến quan trọng trong quá trình nâng cao chất lượng đào tạo sau đại học Việc tích hợp môn trắc nghiệm vào chương trình giảng dạy đã mở ra cơ hội cho sinh viên cao học và nghiên cứu sinh giáo dục học tiếp cận các phương pháp đánh giá khách quan và tin cậy.
Vào năm 1972, các nhà giáo dục Việt Nam bắt đầu quan tâm đến trắc nghiệm kết quả học tập; đến năm 1974, tại miền Nam Việt Nam lần đầu tổ chức thi trắc nghiệm dạng câu hỏi nhiều lựa chọn cho tất cả các môn học và được thực hiện trong hai khóa thi Tú tài liên tiếp.
Đến thập niên cuối của thế kỉ XX, trắc nghiệm khách quan ở nước ta mới thực sự có bước đột phá và dần chiếm lĩnh vị trí trong hệ thống đánh giá giáo dục Giai đoạn này chứng kiến sự gia tăng mạnh mẽ của các tài liệu phục vụ cho học tập và nghiên cứu, được xuất bản với số lượng lớn hơn trước Trong số các tài liệu được công bố, nổi bật là các ấn phẩm liên quan đến trắc nghiệm kiến thức và kỹ năng, nhằm nâng cao chất lượng đánh giá và độ tin cậy của các kỳ thi cũng như bài kiểm tra trong giảng dạy.
Ba nguồn tài liệu nổi bật về kỹ thuật nông nghiệp và đo lường kết quả học tập được nêu ra gồm: "10 thức kỹ thuật nông nghiệp ở trường trung học phổ thông" của Châu Kim Lang (1988); "Trắc nghiệm và đo lường thành quả học tập" (tập 1-2) của Dương Thiệu Tống (1995); và "Phương pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập" của Nguyễn Phụng Hoàng và Võ Thị Ngọc Lan (1996) Một dấu mốc đáng lưu ý là kỳ thi tuyển đại học thí điểm tại Đại học Đà Lạt năm 1996 bằng phương pháp trắc nghiệm khách quan, sự thành công của nó được Hội nghị rút kinh nghiệm của BGD&ĐT khẳng định Kỳ thi có 7.200 thí sinh dự tuyển, có hai loại đề trắc nghiệm và tự luận được sử dụng để thí sinh lựa chọn; khoảng 70% lượt thí sinh chọn đề trắc nghiệm, và trong gần 60 trường hợp vi phạm kỷ luật thi do quay cóp thì chỉ có 4 thí sinh từ nhóm làm trắc nghiệm.
Chuyển sang thập kỉ mới, Bộ Giáo dục và Đào tạo chú trọng phát triển đánh giá bằng phương pháp trắc nghiệm khách quan thông qua việc cử nhiều chuyên gia ra nước ngoài học tập và tổ chức các hội thảo tập huấn tại các trường trọng điểm như Đại học Sư phạm Hà Nội, Đại học Bách khoa Hà Nội và Cao đẳng Sư phạm Hà Nội; những năm gần đây, BGD&ĐT đã lồng ghép câu hỏi trắc nghiệm khách quan với các câu hỏi tự luận vào một số SGK ở trường phổ thông và sẽ tiếp tục mở rộng công việc này ở bậc THPT; từ năm học 2006-2007, BGD&ĐT đã có chủ trương tổ chức thi tốt nghiệp THPT và thi tuyển sinh đại học bằng phương pháp trắc nghiệm khách quan cho các môn Lý, Hóa, Sinh và Tiếng Anh, hứa hẹn một tương lai phát triển mạnh mẽ của phương pháp này tại Việt Nam.
1.2 Các khái niệm liên quan
Trắc nghiệm có nguồn gốc từ tiếng Anh là Test, mang nghĩa thử nghiệm, phép thử và sát hạch; theo nghĩa chữ Hán Việt, từ Trắc gồm hai yếu tố: “đo lường” và “nghiệm” là sự suy xét, chứng thực; theo từ điển Tiếng Việt phổ thông (2001) do Viện ngôn ngữ học biên soạn, Trắc nghiệm được hiểu là khảo sát, đo lường khi tiến hành các thí nghiệm khoa học trong phòng thí nghiệm.
Yêu cầu về độ tin cậy và độ giá trị của bài trắc nghiệm
Một bài trắc nghiệm kết quả học tập cần có hai yếu tố cơ bản để đánh giá chất lượng: độ giá trị và độ tin cậy Độ giá trị cho biết bài thi đo đúng nội dung và mục tiêu cần đánh giá, giúp kết quả phản ánh chính xác kết quả học tập của người làm bài Độ tin cậy thể hiện mức độ nhất quán và ổn định của kết quả qua các lần thi hoặc các phần khác nhau của đề thi, từ đó tăng độ tin cậy của đánh giá Vì vậy, hai tiêu chuẩn này là nền tảng quan trọng để đánh giá và cải thiện chất lượng bài trắc nghiệm.
Độ tin cậy của bài trắc nghiệm là thước đo mức độ chính xác của phép đo dựa trên kết quả của bài trắc nghiệm đó Bài trắc nghiệm được coi là đáng tin cậy khi các kết quả cho thấy sự ổn định, nghĩa là nếu làm bài nhiều lần thì thứ hạng tương đối của học sinh trong nhóm vẫn được duy trì Tính tin cậy phụ thuộc vào các yếu tố như sự lựa chọn câu hỏi, mức độ may rủi do phỏng đoán, và độ khó của đề thi Để đảm bảo độ tin cậy tối đa, cần xây dựng bộ câu hỏi phù hợp với nội dung, chuẩn hóa đáp án, kiểm tra và điều chỉnh độ khó ở mức vừa phải, giảm thiểu câu hỏi dễ đoán, tăng số lượng câu hỏi để làm giảm biến động điểm số, và tiến hành các phân tích độ tin cậy như Cronbach alpha hoặc các chỉ số liên quan để đánh giá và cải thiện đề thi trước khi đưa vào sử dụng rộng rãi.
+ Giảm thiểu các yếu tố may rủi đến mức tối thiểu bằng cách hạn chế việc sử dụng các loại câu hai lựa chọn
+ Viết những lời chỉ dẫn sao cho thật rõ ràng để HS khỏi bị nhầm lẫn
+ Chuẩn bị trước bảng chấm điểm, ghi rõ các câu đúng
Độ tin cậy của bài trắc nghiệm thể hiện tính khách quan của điểm số và sự nhất quán trong các câu trả lời, từ đó có thể phân biệt trình độ của học sinh Vì vậy, độ tin cậy được xem là một trong các yếu tố nền tảng hình thành chất lượng của bài trắc nghiệm.
Có nhiều phương pháp được sử dụng để có được các đo lường độc lập cần thiết nhằm ước lượng hệ số tin cậy của bài trắc nghiệm, như phương pháp trắc nghiệm hai lần và các dạng trắc nghiệm tương đương Tuy nhiên, hiện nay phổ biến nhất là phương pháp phân đôi bài trắc nghiệm và phương pháp Kuder–Richardson.
Giả thiết mỗi câu hỏi trong một đề trắc nghiệm là một đề trắc nghiệm tương đương (tức là các câu hỏi có cùng điểm trung bình và cùng phương sai), ta có thể xem các mục thi như một thước đo đồng nhất cho đặc tính đánh giá Nhờ đặc tính tương đương, tổng điểm của thí sinh phản ánh đúng mức độ phân bố và độ khó chung của toàn bộ đề, đồng thời cho phép so sánh và kết hợp các câu hỏi một cách khách quan Khi mọi câu hỏi có cùng điểm trung bình và phương sai, phương sai của điểm thi sẽ thể hiện sự đa dạng của thí sinh và độ nhạy của đề, từ đó hỗ trợ ước lượng độ tin cậy, tính nhất quán và khả năng phân biệt của từng mục Ứng dụng trong phân tích IRT và các kỹ thuật thống kê khác cho phép đánh giá tính đồng nhất của đề thi và tối ưu hóa cấu trúc để cân bằng giữa công bằng, phân hóa và tính khả thi trong đánh giá năng lực.
Trong đó: k: số câu hỏi của đề trắc nghiệm p: tỉ lệ trường hợp trả lời đúng cho câu hỏi q = 1 – p: tỉ lệ trường hợp trả lời sai cho câu hỏi
2: phương sai của tổng điểm mọi thí sinh với cả đề trắc nghiệm
N: Tổng số thí sinh tham gia làm bài trắc nghiệm
Y: Tổng điểm bài làm mỗi thí sinh
Đề xuất ở trên khó áp dụng vì nó đòi hỏi phải biết độ khó p của từng câu hỏi; giả thiết độ khó của các câu hỏi không khác nhau nhiều cho phép ta dùng một công thức dễ tính hơn, nhằm ước lượng nhanh chóng và dễ dàng hơn mà vẫn đảm bảo mức độ chính xác tương đối.
Trong đó M là giá trị trung bình của điểm số của cả đề trắc nghiệm
35 Độ tin cậy r Kết luận
Trên 0.80 Bài trắc nghiệm đáng tin cậy
Trên 0.70 Bài trắc nghiệm có độ tin cậy tạm chấp nhận
Từ 0.50 đến 0.70 Bài trắc nghiệm có độ tin cậy không cao, chắc chắn nhiều câu hỏi cần phải chỉnh sửa
Bảng 1.4: Kết luận từ độ tin cậy [12 tr40]
Độ giá trị của một bài trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu đo lường mà bài trắc nghiệm đó nhắm tới Để bài trắc nghiệm đạt được độ giá trị cao, cần xác định tỉ mỉ mục tiêu cần đo và bám sát mục tiêu ấy trong quá trình xây dựng ngân hàng câu hỏi trắc nghiệm (ngân hàng CHTN) cũng như khi tổ chức các kỳ thi.
Đánh giá độ giá trị của bài trắc nghiệm có thể xem xét từ nhiều góc độ khác nhau Vấn đề cốt lõi là dụng cụ đo có đo đúng những gì ta muốn đo hay không và ở mức độ nào Thông thường giá trị của bài trắc nghiệm đối với kết quả học tập được phân loại theo các khía cạnh liên quan đến sự phù hợp của đo lường và hiệu quả trong phản ánh mức tiến bộ của người học, từ đó hình thành các tiêu chí và phân loại đánh giá cụ thể.
Giá trị đồng thời thể hiện mối liên hệ giữa điểm số của bài trắc nghiệm và một tiêu chí khác đã có sẵn và được nhiều người chấp nhận, cho thấy bài kiểm tra đang đo lường đúng khả năng mà nó mong muốn đánh giá.
- Giá trị tiên đoán: nói lên mối liên hệ giữa điểm số của bài trắc nghiệm với một tiêu chí khác căn cứ vào khả năng (hay thành quả học tập) ở thời điểm tương lai
- Giá trị nội dung: là mức độ “bao trùm” được nội dung môn học, bài học
- Giá trị khái niệm tạo lập: là giá trị liên quan đến các loại học tập được quy định trong các mục tiêu dạy và học
- Giá trị thực nghiệm (hay giá trị thống kê): nói lên sự tương quan giữa các điểm số trắc nghiệm với một tiêu chí, tức là một loại đo lường nào đó, độc lập và trực tiếp, về khả năng (hay đặc điểm) mà bài trắc nghiệm ấy muốn đo lường
Giá trị yếu tố là mức tương quan giữa một bài trắc nghiệm và yếu tố chung tồn tại trong nhóm các bài trắc nghiệm Chỉ số này được ước lượng thông qua phân tích yếu tố, một phương pháp thống kê nhằm nhận diện và đo lường yếu tố tiềm ẩn liên kết giữa các bài trắc nghiệm trong tập hợp.
Giá trị của bài trắc nghiệm có thể được xem xét từ nhiều góc độ khác nhau Dựa vào định nghĩa về giá trị và căn cứ vào mục tiêu đề ra cho bài trắc nghiệm là muốn đo lường cái gì, khi soạn thảo hoặc xem xét một bài trắc nghiệm, người soạn thảo có thể dựa vào từng loại giá trị thích hợp làm cơ sở cho việc soạn thảo hoặc xem xét bài trắc nghiệm ấy.
Độ giá trị của bài trắc nghiệm liên quan đến mục tiêu của sự đo lường, còn độ tin cậy liên quan đến sự vững chắc của điểm số Tính giá trị phản ánh mức độ mà một bài trắc nghiệm đo được cái mà nó định đo, còn tính tin cậy phản ánh sự chính xác của phép đo Theo các chuyên gia đo lường, tính tin cậy và tính giá trị có liên quan với nhau Một bài trắc nghiệm muốn có giá trị thì phải có độ tin cậy Nhưng ngược lại, một bài trắc nghiệm có độ tin cậy cao chưa hẳn đã có giá trị cao, vì nó không đo được cái mà nó định đo Chính vì thế, để đảm bảo cho một bài trắc nghiệm thành quả học tập có chất lượng, cần phải xem xét cả tính giá trị và tính tin cậy.
Quy trình xây dựng ngân hàng câu hỏi trắc nghiệm
Ngân hàng CHTN là tập hợp khá lớn các câu hỏi TN, trong đó mỗi câu hỏi đã được định cỡ và gắn với các phần nội dung xác định cùng các tham số đánh giá (độ khó, độ phân biệt và các tham số khác) Việc chuẩn hóa nội dung và tham số cho từng câu hỏi giúp đảm bảo tính nhất quán, dễ tích hợp vào hệ thống kiểm tra và các đề thi, cũng như tối ưu hóa quá trình đánh giá trình độ học viên Nhờ đó, ngân hàng câu hỏi TN CHTN phục vụ nhiều mục đích từ kiểm tra định kỳ đến phân tầng độ khó, đồng thời nâng cao hiệu quả thiết kế đề thi và đo lường năng lực người học.
Phương pháp trắc nghiệm chỉ phát huy tối đa ưu điểm và giảm thiểu nhược điểm khi được triển khai đúng quy trình công nghệ xây dựng và phát triển ngân hàng câu hỏi (ngân hàng CHTN) Quy trình xây dựng ngân hàng CHTN cho một môn học khá phức tạp; để dễ hình dung, có thể tóm tắt các bước cơ bản như sau: xác định mục tiêu kiến thức và các mức độ nhận thức, thiết kế khung đề thi và tiêu chuẩn đánh giá, biên soạn và chuẩn hóa câu hỏi phù hợp với từng mức độ nhận thức, đánh giá và điều chỉnh độ khó của câu hỏi, phân loại và lưu trữ câu hỏi vào hệ thống ngân hàng câu hỏi, kiểm tra chất lượng và hiệu chỉnh dựa trên phản hồi từ bài thi thử hoặc đánh giá đồng nghiệp, và cuối cùng quản lý, cập nhật và bảo đảm an toàn, quyền sở hữu trí tuệ cũng như tính nhất quán của ngân hàng câu hỏi trong suốt vòng đời của nó.
- Xác định mục tiêu môn học
- Phân tích nội dung môn học
- Thiết lập dàn bài TN
- Biên soạn ngân hàng CHTN
- Thiết lập và thử nghiệm bộ đề thi TN
- Hoàn chỉnh ngân hàng CHTN
1.7 1 Xác định mục ti êu môn h ọc
1.7.1.1 Tầm quan trọng của việc xây dựng mục tiêu môn học:
Xác định mục tiêu cụ thể cho từng môn học là yếu tố then chốt để đảm bảo chất lượng giáo dục Điều này có nghĩa là phải xác định đầy đủ các tiêu chí, kỹ năng và kiến thức mà học sinh cần đạt sau khi kết thúc môn học, từ đó xây dựng quy trình và công cụ đánh giá để đo lường xem học sinh có đạt được các tiêu chí đó hay không Mục tiêu càng rõ ràng thì việc thiết kế chương trình môn học và đánh giá kết quả học tập của toàn bộ chu trình học tập càng dễ thực hiện, đồng thời tạo thuận lợi cho việc kiểm tra và chấm điểm công bằng Ngược lại, nếu mục tiêu chưa được xác định rõ ràng thì việc đánh giá thành tích học tập sẽ thiếu tính tin cậy Nói cách khác, việc đánh giá kết quả học tập của học sinh nên dựa trên đối chiếu với các mục tiêu giảng dạy đã đề ra Vì vậy, mục tiêu dạy và học là cơ sở để soạn thảo một bài thi phù hợp cho từng môn.
1.7.1.2 Đặc điểm của mục tiêu môn học: Để giảng dạy tốt một môn học cần có một danh mục chi tiết về các mục tiêu giảng dạy, thể hiện ở năng lực hay hành vi cần phát triển của người học qua quá trình giảng dạy Để viết một bài trắc nghiệm tốt cho môn học đó cần phải dựa vào các mục tiêu đã đề ra cho môn học Các câu phát biểu phải đảm bảo theo mô hình SMART [40 tr30]
1.7.1.3 Các mức độ của mục tiêu nhận thức
Cấu trúc kết quả học tập của Bloom (1956) được phân thành 6 mức nhận thức, từ những mức căn bản đến các mức cao như phân tích, tổng hợp và đánh giá; hiện nay, nhiều nhà khoa học trên thế giới đề nghị bổ sung hai mức nhận thức cao hơn là khả năng chuyển giao và khả năng sáng tạo để phản ánh đầy đủ hơn quá trình tư duy ở mức cao Tuy nhiên, đối với giáo dục Việt Nam, 6 mức nhận thức ban đầu vẫn đủ để đánh giá nhận thức của người học và làm cơ sở cho thiết kế mục tiêu, phương pháp giảng dạy và đánh giá phù hợp với ngữ cảnh Việt Nam.
Các mục tiêu nhận thức cần phải được xác lập cụ thể, rõ ràng, chính xác để chuyển sang viết thành câu hỏi kiểm tra
Thông thường trong các tài liệu ta thường thấy mục đích yêu cầu được viết với các từ phổ biến: Hiểu được…, Biết được…, Nắm vững được…, …
Cụ thể, rõ ràng Đo lường được
Có điều kiện thời gian
Những động từ dùng để chỉ mục tiêu nhận thức trước đây bị các nhà sư phạm nhận xét là mơ hồ, chưa rõ ràng và chưa nói lên cụ thể những khả năng người học có thể đạt được sau khi học Vì vậy sau S Bloom, các nhà nghiên cứu về soạn thảo mục tiêu nhận thức đã soạn thảo ra một bảng liệt kê các động từ kèm theo các túc từ có thể được sử dụng để xác định mục tiêu một cách rõ ràng Dưới đây là một số gợi ý về các động từ dùng để hỏi ứng với từng mức độ nhận thức [Phụ lục 2, phần 2].
1.7.2 Phân tích n ội dung môn học
Mọi nhiệm vụ học tập đều có hai yếu tố căn bản: nội dung học tập thiết yếu và các kỹ năng nhận thức liên quan trong quá trình học Do đó, khi đánh giá thành tích học tập, giáo viên cần cân nhắc cả nội dung kiến thức được trang bị và những gì học sinh thể hiện khi vận dụng lượng kiến thức đó vào thực tế học tập.
Phân tích nội dung môn học bao gồm chủ yếu công việc xem xét và phân biệt bốn loại nội dung học tập:
- Những thông tin mang tính chất sự kiện mà HS phải nhớ hay nhận ra
- Những khái niệm và ý tưởng mà chúng phải giải thích hay minh họa
- Những ý tưởng phức tạp cần được giải thích hay giải nghĩa
- Những thông tin, ý tưởng và kỹ năng cần được ứng dụng hay chuyển dịch vào một tình huống hay hoàn cảnh mới
Nhưng trong việc phân tích nội dung một phần nào đó của môn học, ta có thể thực hiện theo các bước như sau:
Bước 1: Tìm ra những ý tưởng chính yếu của môn học ấy
Bước 2 tập trung vào việc lựa chọn từ, nhóm chữ và cả ký hiệu (nếu có) mà học sinh sẽ phải giải nghĩa; để học sinh có thể hiểu rõ và giải thích các ý tưởng lớn, họ cần nắm vững các khái niệm và mối quan hệ giữa chúng Do đó, người soạn thảo câu hỏi trắc nghiệm phải xác định những khái niệm quan trọng trong nội dung môn học và đưa chúng vào các câu hỏi trắc nghiệm nhằm khảo sát mức độ hiểu biết của học sinh.
Bước 3: Phân loại hai dạng thông tin được trình bày trong môn học:
+ Những thông tin nhằm mục đích giải nghĩa hay minh họa
+ Những khái luận quan trọng của môn học
Người soạn thảo trắc nghiệm cần phải biết phân biệt hai loại thông tin ấy để lựa chọn những điều gì quan trọng mà HS cần phải nhớ
Ở Bước 4, học sinh được yêu cầu lựa chọn một số thông tin và ý tưởng đòi hỏi khả năng vận dụng những điều đã biết để giải quyết vấn đề trong các tình huống mới Những thông tin này có thể được khảo sát bằng nhiều phương pháp, chẳng hạn như đối chiếu, nêu ra sự tương đồng và dị biệt, hoặc đặt ra các bài toán và tình huống đòi hỏi HS phải ứng dụng kiến thức đã học để tìm ra cách giải quyết.
1.7.3 Thi ết kế d àn bài tr ắc nghiệm môn h ọc
Dàn bài trắc nghiệm thành quả học tập là bảng dự kiến phân bố hợp lý các câu hỏi của bài trắc nghiệm theo mục tiêu (hay quá trình tư duy) và nội dung của môn học, nhằm đảm bảo sự liên kết giữa kiến thức và năng lực cần đo Việc phân bổ câu hỏi theo mục tiêu và nội dung giúp đo lường chính xác các khả năng mà ta muốn kiểm tra, từ đó đánh giá hiệu quả quá trình học tập và mức độ đạt được của người học.
Trong thiết kế một dàn bài trắc nghiệm, một trong những phương pháp phổ biến là xây dựng ma trận hai chiều, còn được gọi là bảng quy định hai chiều Một chiều của ma trận biểu thị nội dung câu hỏi, còn chiều kia biểu thị các quá trình tư duy hay mục tiêu mà bài trắc nghiệm muốn khảo sát Mỗi phạm trù tổng quát trong hai phạm trù này được phân chia thành nhiều phạm trù nhỏ hơn, từ 4 hay 5 phạm trù con cho đến những mức độ chi tiết cao hơn, nhằm đảm bảo sự phong phú và phân tầng của các lựa chọn đáp án.
Việc phân loại mục tiêu học tập có thể dùng mười hoặc mười hai phạm trù, tùy thuộc tính chất của đơn vị học tập và mức độ phức tạp của các mục tiêu, cũng như mức chi tiết mà người soạn thảo muốn khảo sát qua bài trắc nghiệm Ta có thể bắt đầu bằng cách chọn ba hoặc bốn phạm trù lớn cho mỗi chiều, sau đó phân chia mỗi phạm trù lớn thành các phạm trù nhỏ hơn Trong mỗi ô của bảng hai chiều thiết kế, ta ghi số lượng hoặc tỉ lệ phần trăm CHTN dự trù cho mục tiêu hoặc đơn vị nội dung tương ứng với hàng cột và hàng ngang của ô ấy.
Cấu trúc một môn học thông thường gồm môn học, phần (nếu có), chương, bài học và đề mục; để tiến hành biên soạn bộ CHTN cho môn học và đảm bảo kết quả biên soạn cho các bước sau này, ta phải biên soạn CHTN thô cho từng bài, cho từng chương, phần (nếu có) và cho cả môn học; đồng thời để bộ đề trắc nghiệm cho môn học có giá trị và tin cậy, phải tiến hành phân tích các yếu tố liên quan đến đánh giá, như mục tiêu, nội dung, độ khó và tính phân biệt của câu hỏi, cũng như cách phân bổ và chuẩn hóa đề thi để thống nhất đánh giá và đảm bảo tính bao phủ nội dung.
Để đảm bảo chất lượng kiểm tra, cần xác định 41 nội dung của từng bài nhằm làm rõ tất cả mục tiêu kiểm tra chi tiết trước khi tiến hành lập dàn bài trắc nghiệm cho từng chương, phần (nếu có) và cho môn học.
Dàn bài trắc nghiệm cho bài học gồm nhiều đề mục; mỗi đề mục trong bài có thể soạn một hoặc nhiều câu dựa vào mục tiêu chi tiết Tùy theo tính chất của đề mục và mục tiêu chi tiết mà ta soạn CHTN loại nào: đúng sai, lựa chọn, ghép hợp, điền khuyết Các quy tắc và kỹ thuật soạn thảo trắc nghiệm từng loại đã được trình bày trong phần trên.