Những kết quả nghiên cứu trong lĩnh vực đánh giá thường được cơ quan quản lí tiếp thu một cách dè dặt, vì đây là một vấn đề không đơn giản. Thực tế cho thấy, nhiều giáo viên dạy giỏi nhưng lại là người chấm thi dở vì thiếu sự huấn luyện, đào tạo chu đáo.Việc chấm điểm chính xác sẽ giúp học sinh hiểu đúng về kết quả học tập của mình, tự đánh giá phù hợp, thấy được những điểm yếu của bản thân để điều chỉnh phương pháp học tập, đồng thời xác định cho mình mục tiêu phấn đấu mới và nâng cao tính tích cực học tập. Vì vậy, trong công tác đào tạo giáo viên ở nước ngoài, nội dung về đánh giá giáo dục và việc xử lí những vấn để nảy sinh trong đánh giá giáo dục được hết sức coi trọng. Hiện nay đây cũng là vấn đề đang được quan tâm đặc biệt trong chương trình đổi mới căn bản toàn diện giáo dục và đào tạo ở nước ta.
Trang 1MỘT SỐ KHÍA CẠNH TÂM LÝ TRONG ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH
Đào Thị Oanh – Viện Nghiên cứu Sư phạm
Khi đánh giá tình hình học tập của một học sinh, chúng ta chủ yếu tham khảo kết quả kiểm tra, thi cử của em đó Kết quả bài kiểm tra hay bài thi cung cấp thông tin phản hồi cho giáo viên và học sinh về tình hình học tập của học sinh
Giả sử trong một kì thi,một học sinh được điểm môn Văn là 7, điểm môn Toán là 8, thì liệu chúng ta có thể nói được rằng, kết quả học Toán của em đó khá hơn kết quả học Văn được không? Và, liệu chúng ta có thể căn cứ vào đó mà suy ra rằng, tình hình học Văn của em học sinh đó tồi hơn học môn Toán? Thật ra, để có một cái nhìn toàn diện thì cần phải nhìn nhận điểm số một cách khoa học hơn Có nhiều khía cạnh cần được lưu ý song ở đây chỉ đề cập đến yếu tố tâm lí ở người chấm bài
Từ những năm cuối thế kỉ 20, một số chuyên gia đánh giá người Pháp và Thụy Sĩ (Jacques Lecomte, Henri Piéron, Jean Cardinet, Georges Noizet ) đã có những nghiên cứu về vấn
đề này và đưa ra những bằng chứng cho sự “may rủi của việc thi cử”
Henri Pieron – chuyên gia Tâm lí học Thực nghiệm của Pháp đã công bố kết quả cuộc điều tra về 100 bài thi tú tài được rút ra một cách ngẫu nhiên Chúng được phân thành 6 nhóm cho 6 môn thi, gồm: Tập làm văn; Dịch tiếng Latinh; Anh văn; Triết học; Toán học và Vật lí), với mỗi nhóm gồm 5
Trang 2giám khảo chấm bài độc lập với nhau Kết quả là: với thang điểm 20, cùng một bài tập làm văn, số điểm chênh lệch nhau
là 13; đối với môn La tinh và Anh văn, số điểm chênh lệch là 12; đối với khoa học tự nhiên, khoảng cách về điểm số có giảm hơn: Toán là 9 điểm còn Vật lí là 8 điểm
Trong một cuộc thử nghiệm khác, 78 giáo viên đã chấm 3 bài Tập làm văn Qua bảng điểm của 1 bài, kết quả thật là khó hiểu: 36 giáo viên đã cho từ 6-7 điểm; 20 người cho từ 4-5 điểm; 6 người chỉ cho từ 2-3 điểm; thậm chí 1 người đã cho 1 điểm Số còn lại: 10 người cho từ 8-9 điểm; 3 người cho từ
10-11 điểm; 2 người cho từ 12-13 điểm Sự khác biệt trên đây khiến H.Piéron nói đại ý rằng,nếu muốn dự đoán điểm của một thí sinh, thì tốt nhất nên hiểu rõ về giáo viên chấm hơn là
về bản thân thí sinh J Cardinet – chuyên gia của Viện Nghiên cứu và Học liệu Sư phạm Thụy Sĩ đã nhận xét đại ý rằng, có bao nhiêu giáo viên thì có thể có bằng ấy cách cho điểm Không những cá tính của giáo viên ảnh hưởng tới việc cho điểm, mà qua trắc nghiệm của G Noizet, những thông tin khác liên quan đến học sinh cũng có thể ảnh hưởng tới bài chấm, như: là học sinh của trường tiên tiến hay trường bình thường;là học sinh của lớp giỏi hay lớp kém; nghề nghiệp của cha mẹ; tên học sinh
Ngoài những thông tin về học sinh, còn hai hiện tượng tâm lí rất quan trọng thường tác động đến sự cân nhắc, tính toán của giáo viênkhi chấm bài là “sự tương phản” và “sự đồng nhất”
Sự tương phản.
Trang 3Các nghiên cứu cho thấy, nhiều giáo viên xác nhận rằng có sự chênh lệch về điểm mà họ đã cho giữa những bài chấm đầuvà những bài chấm sau Điều đó đã thể hiện qua thử nghiệm sau:
có 3 bài thi được điểm 12/20 được đưa xen kẽ vào với 12 bài kém, rồi sau đó người ta lại kẹp chúng với 12 bài tốt Có 5 người chấm riêng biệt Kết quả là 3 bài đó khi nằm ở tập bài kém đã được điểm trung bình là 16/20, còn khi ở tập bài tốt
đã được điểm dưới 10/20 Có thể kết luận rằng các giáo viên
đã chấm điểm bằng cách so sánh bài này với bài kia
Qua một thử nghiệm khác người ta thấy những bài chấm đầu tiên bao giờ cũng được chấm nghiêm túc nhất, sát với barem nhất Những bài về cuối thường bị đánh giá sai lệch G Noizet giải thích rằng, việc đánh giá bằng cho điểm là một hoạt động so sánh giữa một sản phẩm của học sinh với một mẫu được dùng để tham chiếu Đối với những bài đầu, giám khảo lấy barem để đối chiếu, tham khảo Về sau người ta không so sánh với mẫu tham chiếu nữa, mà so sánh giữa các bài với nhau
Sự đồng nhất.
Qua thử nghiệm người ta đã xác định được rằng, khi cho điểm, giáo viên thường lưu ý tới những kết quả điểm số trước
đó của học sinh Người ta đã đưa một bài kiểm tra môn Anh văn cho nhiều giáo viên cùng chấm, kèm theo điểm số của vài bài kiểm tra trước đây Kết quả là, điểm trung bình của các giáo viên chấm chỉ xê xích 2 điểm so với điểm của bài trước Yếu tố “ngẫu nhiên” ở đây chỉ chiếm 5/1000 (5 phần nghìn)
G Noizet giải thích hiện tượng đồng nhất này là do giáo viên
Trang 4muốngiảm thiểu những rủi rotiềm tàng có thể xẩy ra, nên họ căn cứ vào các thông tin đã biết (ở đây là điểm số các bài cũ)
Những cải tiến trong cách cho điểm.
Các chuyên gia đánh giá xem việc cho điểm chính xác là rất khó thực hiện cho nên họ đã nghiên cứu đề xuất những cải tiến phù hợp cho phương pháp đánh giá và lượng giá (cho điểm) kết quả học tập Dưới đây chỉ là một số ví dụ:
- “Chấm kép” Cách chấm này khá phổ biến nhưng cũng
chỉ có tính tương đối Thực tế chứng minh rằng, việc ghép 2 giáo viên một cách tính cờ chỉ có một tác dụng rõ nhất: đây là dịp để họ đấu tranh với nhau về quan điểm và cuối cùng đi đến một sự đánh giá tối ưu Song cũng có thể xảy ra khả năng
là tập hợp hai giám khảo cùng dễ dãi, hoặc ngược lại, đều
“khắt khe”, thì kết quả sẽ vẫn còn gây nhiều bất ngờ
- Điều chỉnh theo điểm trung bình Yêu cầu những giáo viên
khắt khe liệt kê lại toàn bộ điểm số và điều chỉnh lại theo điểm số trung bình mà các giáo viên khác nhau đã cho đối với
bộ môn đó Cách này ít khi được áp dụng vì các giáo viên viện
lí do rằng, họ đã chấm một cách rất khách quan, đúng chất lượng của bài thi
- Đánh giá thường xuyên Nhiều giáo viên cho rằng những
điểm kiểm tra trong năm học là sự phản ánh tốt nhất về từng học sinh và nên giảm thiểu việc tùy tiện cho một điểm duy nhất Dù sao người ta cũng không quên những yếu tố có thể tác động đến giáo viên Vì thế, G Noizet cho rằng phương pháp này có thể tin cậy được nếu người cho điểm không biết
“tác giả” của bài thi là ai Nói một cách khác, người chấm bài
Trang 5không phải là người dạy học sinh mà chỉ biết kết quả học tập trong năm qua điểm số của học sinh
- Trắc nghiệm (nhiều lựa chọn) Mỗi câu hỏi sẽ có nhiều đáp
án, nhưng chỉ có một đáp án là đúng còn các đáp án khác sẽ
bị gạch đi Nhờ vậy, giáo viên có những đáp án để áp dụng, không cần phải suy xét nhiều Tuy nhiên, mặt trái của cách làm này là: học sinh gạch bừa và có khi để lại câu trả lời đúng
do ngẫu nhiên mà vẫn được điểm Có học sinh muốn chắc ăn, chỉ đánh dấu những câu trả lời nào mà họ tin là đúng, nhưng không xóa các câu khác Vì thế, cách này chỉ có tác dụng tìm hiểu trình độ hiểu biết của học sinh mà chưa đánh giá được khả năng sáng tạo của các em
Những kết quả nghiên cứu trong lĩnh vực đánh giá thường được cơ quan quản lí tiếp thu một cách dè dặt, vì đây là một vấn đề không đơn giản Thực tế cho thấy, nhiều giáo viên dạy giỏi nhưng lại là người chấm thi dở vì thiếu sự huấn luyện, đào tạo chu đáo.Việc chấm điểm chính xác sẽ giúp học sinh hiểu đúng về kết quả học tập của mình, tự đánh giá phù hợp, thấy được những điểm yếu của bản thân để điều chỉnh phương pháp học tập, đồng thời xác định cho mình mục tiêu phấn đấu mới và nâng cao tính tích cực học tập Vì vậy, trong công tác đào tạo giáo viên ở nước ngoài, nội dung về đánh giá giáo dục
và việc xử lí những vấn để nảy sinh trong đánh giá giáo dục được hết sức coi trọng Hiện nay đây cũng là vấn đề đang được quan tâm đặc biệt trong chương trình đổi mới căn bản toàn diện giáo dục và đào tạo ở nước ta
Trang 6LIỆU BÀI VIẾT KHOA HỌC CÓ ĐÁNG TIN CẬY HƠN BÀI VIẾT BÁO CHÍ?
Tác giả Ivan Oransky, Đại học New York
Người dịch: Xuân Toàn
Tạp chí Rolling Stone đã phải gỡ một bài báo gây xôn xao dư luận do sai lầm trong quy trình biên tập, bài báo này cáo buộc một vụ hiếp dâm tập thể được cho là diễn ra ở khuôn viên của đại học Virginia Đây quả là một sai lầm đáng được liệt vào danh sách những lỗi biên tập ngớ ngẩn nhất của nghề báo chí Rolling Stone đã thông báo về việc gỡ bài và lỗi biên tập một cách rất chi tiết và công khai Và việc một hãng tin tức như Rolling Stone lại phơi bày lỗi lầm của mình theo cách quá công khai như vậy đúng là hiếm có – dù không phải là chưa từng có tiền lệ
Từ lỗi lầm này, xuất hiện ý kiến cho rằng báo chí nên được biên tập giống cách biên tập và bình duyệt các bài cáo khoa học hơn nữa, vì khoa học được cho là một ví dụ điển hình về khả năng tự hiệu chỉnh Thời báo New York đã có bài viết về việc gỡ bài của Rolling Stone, trong đó có thuật lại rằng Nicolas Lemann, cựu Chủ nhiệm Trường Báo chí Columbia, dạy sinh viên của mình rằng “phương pháp làm báo chí” rất giống phương pháp làm khoa học: tất cả đều xoay quanh việc kiểm định các giả thuyết một cách hết sức nghiêm ngặt, xoáy vào các câu hỏi: Giả thuyết của tôi là gì và tôi sẽ bác bỏ nó bằng cách nào? Đó là những câu hỏi mà các nhà báo của Rolling Stone đã không đặt ra khi viết bài báo trên
Trang 7Hai lĩnh vực khoa học và báo chí có phương pháp làm việc khá tương đồng – nhưng phương pháp khoa học cũng không phải
là lý tưởng
Sai lầm trong quy trình biên tập
Steve Coll, người kế nhiệm vị trí của Lemann ở Trường Báo chí Columbia, và các đồng nghiệp đã công bố một bản báo cáo điều tra chính thức dài 12.700 từ về vụ việc Theo báo cáo này, một điều chắc chắn là Sabrina Rubin Erdely, tác giả bài báo về vụ việc trên, đã không cố gắng phản biện lại giả thuyết của cô ấy bằng cách phỏng vấn các bị cáo được cho là hãm hại cô gái Các biên tập viên của Rolling Stone cũng không yêu cầu Sabrina Rubin Erdely quay trở lại thực hiện một cuộc phỏng vấn trước khi xuất bản bài viết
Chúng tôi đánh giá việc này giống với việc thiếu bình duyệt các công trình khoa học, vốn là quy trình mà qua đó các chuyên gia có thể tìm ra các vấn đề trong phương pháp luận,
từ đó dẫn tới sự sai lệch trong các kết luận của tác giả Khi bạn không ép chính mình hay người khác phải tìm kiếm các vấn đề, thì một khả năng có thể xảy ra là bạn sẽ diễn đạt thông tin theo chiều hướng phù hợp với định kiến của bản thân Đây là khuynh hướng tự nhiên rất mạnh mẽ khi chúng
ta tìm kiếm các dẫn chứng để ủng hộ cho lý thuyết hay câu chuyện mà chúng ta tin là đúng
Một thực tế nữa trong báo cáo trên là hai trong ba lý do chủ yếu dẫn tới việc gỡ bỏ các bài báo của các phương tiện truyền thông – như miêu tả trong thời báo New York – rất giống trong khoa học: đó là hoàn toàn bịa đặt và đạo văn (loại lí do thứ ba thuộc về sai lầm của Rolling Stone, liên quan tới việc thiếu sự
Trang 8hoài nghi khi biên tập, chúng ta sẽ quay lại yếu tố thứ ba này sau)
Chuẩn mực trong quy trình công bố khoa học rất đáng
để noi theo
Nhưng sự tương đồng giữa hai lĩnh vực này chỉ dừng lại ở 2 lí
do trên
Khoa học và công bố khoa học hiếm khi trình bày kết quả từ một sự kiện đơn lẻ Các công trình khoa học đã được công bố, đặc biệt trong lĩnh vực Y Sinh, có đặc trưng là liên hệ tới những kết quả của các thí nghiệm bao gồm rất nhiều các bài kiểm tra (test) Điều mà Lemann thực sự miêu tả chỉ là một khía cạnh nhỏ, mặc dù thiết yếu, của phương pháp khoa học;
đó là nỗ lực để xác định và loại bỏ yếu tố thiên kiến chủ quan trong suy nghĩ con người hoặc trong việc kiểm định một giả thuyết
Khi một nghiên cứu khoa học được thực hiện đúng như yêu cầu, thì các khám phá từ nghiên cứu đó sẽ bổ sung thêm, thay đổi hoặc bác bỏ hoàn toàn nghiên cứu trước Khi kiến thức mới xuất hiện khiến chúng ta phải sửa đổi các kiến thức đang thịnh hành, các nhà khoa học có thể và thường xuyên chữa lại các tài liệu bằng cách gỡ bỏ các kết quả nghiên cứu trước đó của họ
Tuy nhiên, thực tế làm khoa học lại không như “chuẩn mực”
Vấn đề là trong khoa học – chính xác hơn là trong công bố khoa học – quy trình thực hiện lại hiếm khi đạt được như yêu cầu
Trang 9Qua công việc của chúng tôi tại Retraction Watch (chuyên
theo dõi việc gỡ bài của các tạp chí), chúng tôi thấy các tạp chí khoa học – ngay cả khi họ gỡ bài xuống (vốn phải là chuyện thường gặp trong thực tế) – hiếm khi họ đưa ra một thông báo đầy đủ và rõ ràng về nguyên nhân và quy trình bài báo ấy bị làm sai chuẩn mực Các thông báo gỡ bài trên tạp chí khoa học thông thường không có sự thuyết minh rõ ràng
và chi tiết như trong các thông báo gỡ bài của báo chí – và không bao giờ các thông báo gỡ bài khoa học lại kèm theo một báo cáo chi tiết như báo cáo về vụ việc của Rolling Stone, một vụ việc được thừa nhận là trường hợp hy hữu Một vài tạp chí khoa học thậm chí còn khuyên người đọc liên hệ với các tác giả của bài viết gốc để biết thêm chi tiết – việc này theo một cách nào đó khiến người đọc nghĩ rằng đó là một câu trả lời hợp lí – hơn là đăng tải chi tiết tới tất cả mọi người để họ nhìn thấy các vấn đề đã dẫn tới việc gỡ bài
Hiện nay, nhà quan sát truyền thông Craig Silverman đang kì công lên danh mục các hiệu chỉnh báo chí, mà theo như chúng tôi được biết là chưa một ai có được danh sách đầy đủ
về các vụ gỡ bài của báo chí, và dường như các trường hợp này lại không phổ biến bằng các vụ gỡ bài tạp chí khoa học Mặc dù, chính các tạp chí khoa học cũng rất hiếm khi gỡ bài: chỉ khoảng 400 đến 500 bài trong khoảng 1,4 triệu bài được công bố mỗi năm
Điều đó khiến chúng tôi quay trở lại với vấn đề thiếu sự hoài nghi Giống như một câu chuyện cuốn hút trên truyền thông, một bài báo khoa học muốn có sức nặng thì cũng phải có luận điểm thuyết phục Các tạp chí khoa học thường có xu hướng
Trang 10công bố các khám phá tích cực hơn là các kết quả tiêu cực Và theo xu hướng nghiên cứu gần đây thì sẽ không có gì lạ nếu
có những công bố khoa học không hề chính xác Và nguyên nhân lại là xu hướng thiên kiến khẳng định, xu hướng này được trợ giúp và thúc đẩy qua phương pháp sử dụng thống kê của nhiều nhà khoa học Nói một cách đơn giản là nếu bạn làm 20 thí nghiệm, và chỉ có một trong số chúng có kết quả
có thể xứng đáng được công bố Nhưng chỉ công bố riêng kết quả đó sẽ không làm cho những phát hiện trong nghiên cứu của bạn có giá trị Thực tế lại hoàn toàn ngược lại, công bố đó hoàn toàn không có giá trị
Tại sao việc công bố như vậy vẫn xảy ra? Bởi vì toàn bộ cộng đồng khoa học, từ các nhà nghiên cứu trẻ cho tới tổng biên tập, có chung điểm yếu là ít nhiều sự cả tin, và đây là điều đã khiến các biên tập viên của Rolling Stone trả giá, sự cả tin cũng là một dạng đặc trưng của xu hướng thiên kiến khẳng định Và hậu quả - ít nhất là trong ngành khoa học Sinh Hóa –
chính là sự khủng hoảng về nghiên cứu kế thừa Tóm lại, phần
nhiều nếu không muốn nói là hầu hết những bài báo khoa học được công bố ngày nay ở các tạp chí khoa học chỉ có chút ít khả năng đứng vững nếu phòng thí nghiệm khác tiến hành kiểm tra lại kết quả và thậm chí khả năng đứng vững còn không được một chút ít đó
Tất cả mọi người đều có thể làm và nên làm tốt hơn
Tạp chí khoa học cũng như báo chí phổ thông, nên đề ra tiêu chuẩn cao hơn đối với các bài viết của họ Cũng giống như