Các suy luận về số lượng và tỉ lệ là một dạng thức suy luận thông dụng trong XS – TK, có ứng dụng rộng rãi trong hầu hết các ngành khoa học, và các phân bố đặc biệt của biến ngẫu nhiên r
Trang 1B Ộ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH
Thành ph ố Hồ Chí Minh - 2013
Trang 2B Ộ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH
Mã s ố : 60 14 01 11
NGƯỜI HƯỚNG DẪN KHOA HỌC :
PGS.TS LÊ TH Ị HOÀI CHÂU
Thành phố Hồ Chí Minh - 2013
Trang 3L ỜI CẢM ƠN
Tôi xin được gửi lời cảm ơn chân thành tới quý thầy cô trong khoa Toán tin trường Đại học Sư phạm TPHCM đã tận tình giảng dạy và đóng góp ý kiến cho tôi trong suốt quá trình học tập và nghiên cứu tại trường
Đặc biệt, đề tài được hoàn thành là nhờ có những ý kiến đóng góp quan trọng của PGS.TS Lê Thị Hoài Châu Qua đây, tôi muốn được bày tỏ lòng biết ơn sâu sắc nhất tới cô
về tất cả những gì cô đã dành cho tôi và các bạn trong suốt thời gian qua
Tôi cũng cảm ơn hai giáo sư người Pháp Annie Bessot và Alain Birebent đã cho chúng tôi những lời góp ý chân thành và quý báu, giúp chúng tôi có những định hướng tốt hơn cho luận văn của mình
Tôi xin chân thành cám ơn :
Các anh chị và các bạn cùng lớp cao học chuyên ngành Didactic Toán khóa 22 đã chia sẻ, động viên tôi trong suốt quá trình học tập
Cô Trương Thị Thủy Tiên và các thầy cô trong tổ Toán trường THPT Lý Tự
Trọng đã luôn quan tâm, giúp đỡ tôi hoàn thành luận văn
Mẹ, chị gái, hai em trai yêu quý và những người thân trong gia đình đã luôn tin tưởng, động viên và ủng hộ tôi về mọi mặt
Lê Thị Hương
Trang 4M ỤC LỤC
L ỜI CẢM ƠN 1
M ỤC LỤC 2
DANH MỤC CÁC CHỮ VIẾT TẮT 4
M Ở ĐẦU 5
1 Lý do ch ọn đề tài 5
2 Khung lý thuy ết tham chiếu 7
3 Trình bày l ại câu hỏi nghiên cứu 8
4 M ục đích và phương pháp nghiên cứu 9
5 C ấu trúc luận văn 9
CHƯƠNG 1: MỘT ĐIỀU TRA KHOA HỌC LUẬN VỀ BIẾN NGẪU NHIÊN VÀ PHÂN B Ố NHỊ THỨC 11
1.1 Bi ến ngẫu nhiên và quy luật nghiên cứu biến ngẫu nhiên 11
1.2 Vai trò c ủa biến ngẫu nhiên trong XS - TK 15
1.3 V ề phân bố nhị thức 22
1.3.1 Sơ lược về qui luật phân bố nhị thức 23
1.3.2 Một vài kiểu nhiệm vụ suy luận cho tỉ lệ 26
1.4 K ết luận chương 1 30
CHƯƠNG 2: BIẾN NGẪU NHIÊN VÀ MÔ HÌNH PHÂN BỐ NHỊ THỨC TRONG D ẠY HỌC XS Ở TRƯỜNG PT VIỆT NAM 31
2.1 Bi ến ngẫu nhiên trong SGK lớp 11 nâng cao 32
2.1.1 Mục đích dạy học biến ngẫu nhiên 32
2.1.2 Biến ngẫu nhiên trong SGK lớp 11 33
2.2 K ết luận chương 2 48
CHƯƠNG 3: MỘT NGHIÊN CỨU THỰC NGHIỆM 50
3.1 M ục đích thực nghiệm 50
3.2 Bài toán th ực nghiệm và mục đích xây dựng 50
3.3 Dàn d ựng kịch bản 53
3.4 Phân tích tiên nghi ệm 54
3.4.1 Biến didactic, biến tình huống và giá trị của chúng 54
3.4.2 Các chiến lược và cái có thể quan sát được 56
3.5 Phân tích h ậu nghiệm 59
3.6 K ết luận chương 3 69
K ẾT LUẬN CHUNG 70
Trang 5TÀI LI ỆU THAM KHẢO 71 PHỤ LỤC 73
Trang 6DANH M ỤC CÁC CHỮ VIẾT TẮT
HS Nxb SBT SGK SGV THPT
Thống kê Thành phố Hồ Chí Minh Trang
Xác suất
Trang 7M Ở ĐẦU
1 Lý do ch ọn đề tài
1.1 T ổng quan về một số công trình nghiên cứu đối tượng “biến ngẫu nhiên” trong d ạy học toán ở trường phổ thông
Lý thuyết Xác suất (XS) và Thống kê (TK) toán là hai ngành toán học điển hình cho
cả hai hướng : toán học lý thuyết và toán học ứng dụng Đối tượng nghiên cứu của chúng là các hiện tượng ngẫu nhiên, đó là những hiện tượng phổ biến trong cuộc sống và trong nhiều lĩnh vực khoa học Thế nhưng khái niệm “ngẫu nhiên” lại không dễ dàng được thừa nhận và
là một chướng ngại cho việc nghiên cứu XS
Thừa nhận sự ngẫu nhiên rồi sau đó lại phải thừa nhận là có những quy luật cho phép nghiên cứu các hiện tượng ngẫu nhiên thực sự là một khó khăn với học sinh (HS) Vì vậy, nhiều công trình nghiên cứu về vấn đề dạy học XS - TK ở trường phổ thông (PT) đã đề cập
tới ngẫu nhiên Dưới đây chúng tôi sẽ điểm qua một số công trình với những kết quả chủ
yếu mà tác giả đã đạt được :
S ự ngẫu nhiên trong dạy học TK lớp 10, luận văn thạc sĩ của tác giả Võ Mai Như
phải ý thức được nguy cơ sai lầm từ những kết luận trên mẫu dữ liệu Qua phân tích SGK
lớp 10, chương TK, tác giả khẳng định vấn đề chọn mẫu và độ tin cậy của những kết luận rút ra từ mẫu đã không được đề cập đến, khiến HS không ý thức được những nguy cơ về sự thiếu chính xác từ việc nghiên cứu mẫu Tác giả đã tiến hành một thực nghiệm về sự biến động của tần suất để kiểm chứng ở HS vấn đề này
Khái ni ệm XS trong dạy - học toán ở trường THPT, luận văn thạc sĩ của tác giả Vũ
Như Thư Hương (2005)
Nghiên cứu quan hệ thể chế của tác giả (thực hiện qua việc phân tích chương trình và sách giáo khoa (SGK)) cho thấy ở Việt Nam ưu tiên cách tiếp cận khái niệm XS theo quan điểm của Laplace Điều này kéo theo ràng buộc của SGK trong việc lựa chọn các phép thử Định nghĩa TK có xuất hiện trong chương XS nhưng thể hiện khá mờ nhạt dẫn tới “nghĩa
Trang 8thực tế” của khái niệm XS cũng ít có cơ hội hình thành nơi HS Một tiểu đồ án được thiết kế
đã làm nổi rõ mối liên hệ giữa TK và XS mà cụ thể là mối liên hệ giữa tần suất và XS, phân
biệt hai khái niệm này, làm rõ phạm vi sử dụng hợp thức của định nghĩa cổ điển của XS
Une étude didactique sur l’introduction dans l’enseignement mathématique
vietnamien de notions statistiques dans leurs liens avec les probabilités, luận án tiến sĩ của
Vũ Như Thư Hương (2009)
Từ phân tích tri thức luận về quan hệ giữa XS và TK, tác giả chỉ ra ba bài toán ứng viên có thể làm cho mối quan hệ TK - XS sống được trong một thể chế dạy học Đó là : bài toán về sự không chắc chắn của các độ đo, bài toán so sánh giữa các phân bố TK thực nghiệm hay so sánh các phân bố TK thực nghiệm với các phân bố lý thuyết, bài toán về tính đại diện của một mẫu dữ liệu Trong đó, bài toán thứ hai (cũng chính là bài toán kiểm định
giả thiết) là nơi có thể tiếp cận gần của các đối tượng chung của TK mô tả và Lý thuyết XS, như các khái niệm biến (TK hay ngẫu nhiên), phân bố (TK hay XS), v.v… Thực nghiệm dàn dựng nên một biến động của quá trình chọn mẫu trong bài toán về “sự không chắc chắn
của ngẫu nhiên”, hình thành nên khoảng tin cậy thực nghiệm chính là khoảng biến động của
tần suất
Rèn luy ện năng lực tư duy TK cho HS trong dạy học XS-TK ở môn Toán THPT , luận
án tiến sĩ của tác giả Trần đức Chiển (2007)
Đề tài chủ yếu khai thác lợi ích của việc rèn luyện tư duy TK cho HS Tác giả cũng điểm qua về khái niệm biến ngẫu nhiên Theo tác giả, những số liệu có trong chương TK
lớp 10 chính là một cuốn sổ tay để các em sử dụng trong việc tiếp thu các kiến thức XS
Chẳng hạn: từ bảng phân bố tần suất có thể xem đó là hình ảnh gần đúng của bảng phân bố
XS, xấp xỉ giá trị trung bình của mẫu số liệu làm kì vọng của biến ngẫu nhiên
Như vậy, các công trình đã phần nào làm rõ mối liên hệ giữa XS và TK, khai thác các qui luật thực nghiệm để tìm ra qui luật lý thuyết Tuy nhiên, vấn đề sử dụng các phân bố
lý thuyết vào suy luận cho các mẫu rút ra từ tổng thể, hay bài toán so sánh giữa các phân bố
lý thuyết với các phân bố thực nghiệm thì chưa được đề cập tới
1.2 Câu h ỏi nghiên cứu của chúng tôi
Trong bài báo của mình, tác giả Lê Thị Hoài Châu (2010) đã nhắc lại ý kiến của J-C Girard : “nếu ta gặp nhiều khó khăn đến thế trong dạy học XS, phải chăng là vì rất khó lĩnh
hội khái niệm ngẫu nhiên ?” Vậy thì khái niệm này đã được đưa vào như thế nào trong
chương trình, sách giáo khoa (SGK) Đại số và Giải tích lớp 11, nơi mà khái niệm XS được
Trang 9đề cập đến ? Đặc biệt, các quy luật cho phép nghiên cứu đại lượng ngẫu nhiên được xem xét như thế nào ở cấp lớp này ? Đó là câu hỏi nghiên cứu đầu tiên mà chúng tôi cần phải đặt ra
Câu hỏi thứ hai xuất phát từ việc ủng hộ một nhận định của tác giả Lê Văn Phong (1982) : “Chính Lý thuyết XS sẽ cung cấp cho chúng ta những quy luật lý thuyết dùng để soi sáng các qui luật TK giúp ta nghiên cứu các quy luật thực nghiệm một cách hoàn thiện hơn” Vậy câu hỏi thứ hai mà chúng tôi đặt ra cho mình là : có hay không trong SGK lớp 11 các kiểu nhiệm vụ có sự tác động của các qui luật lý thuyết tới các qui luật thực nghiệm ?
Câu hỏi thứ ba nảy sinh từ việc ngẫu nhiên là hạt nhân của mối quan hệ giữa XS với
TK Hiểu được tác động của ngẫu nhiên trong trong suy luận TK là hiểu được sự cần thiết
phải tính đến XS xẩy ra một biến cố ngẫu nhiên Đó là một biểu hiện của tư duy TK Vậy,
nếu như các công trình trên đã chỉ ra rằng tư duy TK không được tính đến một cách đầy đủ trong dạy học TK ở lớp 10 thì trong dạy học khái niệm biến ngẫu nhiên ở lớp 11 có được quan tâm một cách thỏa đáng hay không ? Đây là câu hỏi thứ ba mà chúng tôi muốn tìm câu
trả lời
1.3 Gi ới hạn của luận văn
Chịu ảnh hưởng của chương trình XS được giảng dạy ở trường PT nên chúng tôi giới
hạn nghiên cứu của mình trong đối tượng biến ngẫu nhiên rời rạc Mặt khác, chúng tôi ghi
nhận rằng trong các qui tắc thực hành TK, người ta quan tâm nhiều hơn tới các qui luật phân
bố đặc biệt của biến ngẫu nhiên bởi chính các qui luật này chi phối cách thức sử dụng lý thuyết XS vào suy luận cho mẫu
Các suy luận về số lượng và tỉ lệ là một dạng thức suy luận thông dụng trong XS –
TK, có ứng dụng rộng rãi trong hầu hết các ngành khoa học, và các phân bố đặc biệt của
biến ngẫu nhiên rời rạc có vai trò quan trọng trong việc hình thành các qui tắc suy luận Trong khuôn khổ luận văn, chúng tôi chỉ đề cập tới qui luật phân bố nhị thức bởi đây là mô hình lí tưởng cho các suy luận trong tổng thể lớn và cũng là qui luật duy nhất xuất hiện trong các tài liệu hướng dẫn dạy học Qui luật này cũng cho phép có những ứng dụng của đại số tổ hợp, một phần lý thuyết được quan tâm ở trường PT Do đó, với câu hỏi nghiên
cứu thứ hai, chúng tôi giới hạn cho những phân bố lý thuyết có qui luật phân bố nhị thức
2 Khung lý thuy ết tham chiếu
Mỗi khung lý thuyết tham chiếu có những đặc trưng riêng, cung cấp những công cụ
lý thuyết giúp các nhà nghiên cứu vạch ra cho mình những hướng nghiên cứu lôgic, phù hợp
Trang 10để có thể đạt được mục đích cuối cùng Đứng trước những câu hỏi đã đặt ra, chúng tôi lựa
chọn và vận dụng một số kiến thức của Didactic toán
Các đối tượng nghiên cứu của luận văn là biến ngẫu nhiên và biến ngẫu nhiên có qui
luật phân bố nhị thức mà chúng tôi gọi là đối tượng O và O1, trong đó O1 là một trường hợp riêng của O Ba câu hỏi mà chúng tôi đặt ra xoay quanh cuộc sống hiện tại của đối tượng O trong thể chế dạy học XS ở lớp 11 của Việt Nam (thể chế I) Sự lựa chọn của I đối với O và
sự vận hành của O trong I có ảnh hưởng tới quan hệ cá nhân cá nhân HS lớp 11 (cá nhân X)
với O (đó là cách mà X hiểu về O, thao tác O, sử dụng O, suy nghĩ về O)
Chúng tôi sử dụng các kiến thức của Thuyết nhân học : quan hệ thể chế, quan hệ cá nhân, tổ chức toán học để tìm kiếm câu trả lời cho các câu hỏi của mình Làm rõ mối quan
hệ của thể chế I với đối tượng O giúp chúng tôi xác định bước đi đầu tiên trong nghiên cứu
đề tài này Nghiên cứu quan hệ thể chế với O được thực hiện thông qua phân tích SGK, bởi SGK vốn được các giáo viên ở Việt Nam xem như là thước đo chuẩn cho các kiến thức được giảng dạy ở trường PT Việc phân tích đánh giá các tổ chức toán học liên quan tới đối tượng O trong thể chế I, thấy được cách thức mà I đang khai thác O tạo điều kiện cho chúng tôi có những nhận định ban đầu về quan hệ giữa X với O Những kết luận cho đối tượng O1cũng được rút ra trong quá trình phân tích cho đối tượng O
Để đạt được mục đích cuối cùng của luận văn, chúng tôi sử dụng các công cụ khái
niệm đồ án didactic của lý thuyết tình huống do Brousseau đề xuất làm kim chỉ nam để xây
dựng thực nghiệm sư phạm
3 Trình bày l ại câu hỏi nghiên cứu
Trong phạm vi lý thuyết tham chiếu đã chọn và giới hạn nghiên cứu của luận văn, chúng tôi cụ thể hóa các câu hỏi ban đầu và trình bày lại thành ba nhóm câu hỏi nghiên cứu sau :
CH1 : Trong SGK Đại số và Giải tích lớp 11 nâng cao, đối tượng O và qui luật nghiên cứu đối tượng O được trình bày ra sao ? Có những ràng buộc nào trong việc lựa chọn các kiểu nhiệm vụ xoay quanh nó hay không ? Nếu có thì HS sẽ gặp khó khăn gì khi đối tượng O biến đổi vượt ra khỏi các ràng buộc đó ?
CH2 : Các biến ngẫu nhiên cho số lượng và tỉ lệ xuất hiện trong SGK, đối tượng O1
có được lựa chọn sử dụng hay không ?
Trang 11CH3 : Mối quan hệ giữa phân bố XS và phân bố thực nghiệm có được khai thác trong dạy học biến ngẫu nhiên ? Và có hay không các kiểu nhiệm vụ cho sự tác động của các qui luật lý thuyết tới các qui tắc thực hành và suy luận trong thực nghiệm ?
4 M ục đích và phương pháp nghiên cứu
Mục đích nghiên cứu của luận văn là tìm ra câu trả lời cho 3 nhóm câu hỏi trên Công
việc tìm kiếm các câu trả lời được tiến hành thông qua phân tích SGK, SBT và SGV Đại số
và Giải tích lớp 11 theo chương trình nâng cao
Nhưng trước hết phải hiểu rõ bản thân đặc trưng khoa học luận của đối tượng tri thức
cần nghiên cứu, trong đề tài này, tri thức mà chúng tôi đang nói đến là biến ngẫu nhiên rời
rạc và qui luật phân bố nhị thức Bởi vì những kiến thức được giảng dạy ở trường PT đã qua
một quá trình “chuyển hóa sư phạm” làm cho tri thức bị biến đổi so với nguồn gốc ban đầu
của nó Chính quá trình này đã tạo ra một khoảng cách thường là khá lớn giữa tri thức được
giảng dạy với tri thức ở cấp độ khoa học Tuy nhiên, do hạn chế về thời gian nên chúng tôi không thể tiến hành một nghiên cứu khoa học luận đầy đủ về đối tượng mà chỉ tiến hành tham khảo các giáo trình XS - TK ở bậc đại học - nơi mà các kiến thức được trình bày trong
đó được xem là có một khoảng cách gần hoặc nối tiếp các kiến thức ở trường PT Những kết
quả nghiên cứu tri thức trong các giáo trình ở bậc đại học cho phép xác định được những
vấn đề mà các đối tượng cho phép giải quyết nhưng có thể bị lãng quên trong SGK PT Mặt khác, có rất nhiều qui luật phân bố XS đặc biệt, nhưng tham khảo một số giáo trình XS - TK dành cho nhiều ngành nghề khác nhau chúng tôi nhận thấy chỉ có một vài mô hình XS thông
dụng cho những dạng thức suy luận phổ biến trong XS – TK Từ các kết quả nghiên cứu tri
thức luận và phân tích SGK cho phép chúng tôi rút ra những kết luận làm điểm tựa cho việc xây dựng tiểu đồ án didactic tạo cơ hội cho HS thấy được ứng dụng của phân bố XS suy
luận cho các mẫu dữ liệu, bổ sung cho mối quan hệ giữa XS và TK mô tả
5 C ấu trúc luận văn
Phần chính của luận văn gồm 3 chương :
Chương 1 - Một điều tra khoa học luận về biến ngẫu nhiên và phân bố nhị thứ :
Chúng tôi trình bày các kết quả phân tích về đối tượng biến ngẫu nhiên và phân bố nhị thức thu được từ việc tham khảo các giáo trình dành cho bậc đại học Từ đó chúng tôi chỉ rõ qui
luật nghiên cứu biến ngẫu nhiên về mặt toán học, vai trò của biến ngẫu nhiên trong XS –
Trang 12TK, những đặc trưng khoa học luận của phân bố nhị thức, sự ảnh hưởng của mô hình phân
bố này tới các qui tắc suy luận cho mẫu
Chương 2 - Biến ngẫu nhiên và qui luật phân bố nhị thức trong dạy học XS ở trường PT Việt Nam : Trong chương này chúng tôi trình bày các kết quả từ phân tích SGK,
SBT, SGV Đại số và Giải tích lớp 11 nâng cao Các kết quả phân tích trong chương 1 và chương 2 là cơ sở cho chúng tôi xây dựng tình huống thực nghiệm
Chương 3 – Một nghiên cứu thực nghiệm : Chương cuối cùng chúng tôi trình bày
cách xây dựng và triển khai tiểu đồ án didactic với đối tượng HS lớp 11 đã được học về khái
niệm XS và khái niệm biến ngẫu nhiên rời rạc
Trang 13CHƯƠNG 1: MỘT ĐIỀU TRA KHOA HỌC LUẬN VỀ BIẾN NGẪU
M ở đầu
Trong chương này, chúng tôi tham khảo một vài giáo trình XS-TK dùng ở bậc đại
học và cố gắng làm rõ đối tượng mà chúng tôi đang nghiên cứu là biến ngẫu nhiên và qui
luật phân bố nhị thức Cụ thể :
Khái niệm và phương pháp nghiên cứu một biến ngẫu nhiên, vai trò của biến ngẫu nhiên trong XS – TK
Phân bố XS thông dụng của biến ngẫu nhiên rời rạc : phân bố nhị thức ; ứng dụng
của mô hình này trong suy luận TK
Các tài liệu được tham khảo trong chương :
- Tô Văn Ban (2010), XS – TK
- David S Moore, George P McCabe, Bruce A Craig (2010), Th ực hành TK
- Lê Văn Phong (1982), Toán kinh tế PT tập 4, những khái niệm cơ bản của Lý thuyết
XS và TK toán
- Lê Văn Phong (1968), TK toán và một vài ứng dụng trong kinh tế
- Đỗ Đức Thái, Nguyễn Tiến Dũng (2010), Nhập môn hiện đại XS &TK
- Đặng Hùng Thắng (1997), Mở đầu về Lý thuyết XS
- Bùi Minh Trí (2011), XS - TK & quy ho ạch thực nghiệm
Chúng tôi tham khảo các giáo trình cho nhiều ngành nghề trong quá trình nghiên
cứu, tuy nhiên các giáo trình này đều có nét tương tự nhau trong phần trình bày về biến
ngẫu nhiên và qui luật phân bố nhị thức Những kết quả trình bày dưới đây chủ yếu nghiên
cứu từ các giáo trình của tác giả Lê Văn Phong, tác giả Đặng Hùng Thắng và tác giả David
S Moore
1.1 Bi ến ngẫu nhiên và quy luật nghiên cứu biến ngẫu nhiên
Biến cố hay hiện tượng ngẫu nhiên là những sự kiện mà việc xảy ra hay không xảy ra hoàn toàn ngẫu nhiên và người ta không thể đoán trước được Trong cuộc sống, chúng ta thường xuyên bắt gặp những hiện tượng ngẫu nhiên như vậy nhưng hiếm khi thấy được sự
lặp lại hay tính quy luật của chúng Cách tốt nhất để hiểu được tính ngẫu nhiên là quan sát
những biểu hiện ngẫu nhiên
Trang 14Có nhiều phương pháp được thiết lập cho phép gạt bỏ ngẫu nhiên hoặc trong trường hợp nào
đó cũng làm giảm được hậu quả phá hoại của nó Một trong những vấn đề thú vị và quan trọng nhất của loại này là vấn đề tách được tín hiệu cần thiết ra khỏi mớ hỗn độn những nhi ễu ngẫu nhiên với tín hiệu đó
(L Raxtrigin (1997), tr.6)
XS - TK là bộ môn toán học nghiên cứu các hiện tượng ngẫu nhiên bằng cách xây
dựng các mô hình toán học cho những hiện tượng ấy và tìm ra những qui luật ẩn dấu đằng sau đám đông các hiện tượng ngẫu nhiên cùng loại
Trong Lý thuyết XS, ngoài khái niệm XS của một biến cố là một số thể hiện khả năng xảy ra của biến cố đó, còn một khái niệm rất quan trọng cung cấp cho ta phương pháp nghiên cứu gần như hoàn chỉnh về hiện tượng ngẫu nhiên là “biến ngẫu nhiên” và đó cũng chính là một mô hình toán học cho các hiện tượng ngẫu nhiên
Bi ến ngẫu nhiên (hay đại lượng ngẫu nhiên) là đại lượng biến đổi phụ thuộc vào các biến cố
ngẫu nhiên
Bi ến ngẫu nhiên có thể nhận các giá trị định tính hay định lượng, tuy nhiên trong Lý thuyết
XS bằng khái niệm ánh xạ, chúng ta có thể chuyển việc nghiên cứu mọi biến ngẫu nhiên về nghiên c ứu các biến ngẫu nhiên chỉ nhận các giá trị bằng số Bởi vậy, biến ngẫu nhiên được
định nghĩa như sau: Biến ngẫu nhiên (thực) là một hàm (thực) các phần tử của không gian
m ẫu (Lê Thị Hoài Châu (2012), tr 23)
Như vậy, trong XS – TK chỉ xét biến ngẫu nhiên thực Có hai loại biến ngẫu nhiên
cũng chính là hai mô hình XS chi phối việc áp dụng XS vào suy luận TK đó là : biến ngẫu
nhiên r ời rạc và biến ngẫu nhiên liên tục Biến ngẫu nhiên là rời rạc hay liên tục phụ thuộc
vào các giá trị mà nó nhận được Biến ngẫu nhiên rời rạc là biến chỉ nhận rời rạc các giá trị, nghĩa là khi các giá trị được sắp xếp từ bé đến lớn thì giữa hai giá trị liên tiếp của 𝑋 ta không thể tìm được giá trị thứ ba Biến ngẫu nhiên liên tục là biến nhận giá trị liên tục trong
một khoảng, nghĩa là giữa hai giá trị bất kì luôn tìm được giá trị thứ ba
Để xác định một biến ngẫu nhiên trước tiên cần phải xác định được tập giá trị của nó Tuy nhiên, tập giá trị cho chúng ta rất ít thông tin về hiện tượng ngẫu nhiên Điều quan
trọng là xác định được biến ngẫu nhiên nhận mỗi giá trị đó với XS bao nhiêu Qua tham
khảo nhiều giáo trình ở bậc đại học chúng tôi nhận thấy sự giống nhau trong nghiên cứu
biến ngẫu nhiên là tìm ra mối liên hệ giữa các giá trị với XS tương ứng, thông thường được
thể hiện bằng bảng hay bằng hàm số gọi là luật phân bố hay luật phân bố XS của biến
ngẫu nhiên đó
Trang 15Định nghĩa : Mối quan hệ giữa các giá trị có thể của biến ngẫu nhiên với XS tương ứng được
g ọi là luật phân bố của biến ngẫu nhiên ấy (Tô Văn Ban (2010), tr.39)
Đối với biến ngẫu nhiên rời rạc thì luật phân bố XS của nó được thể hiện thông qua
bảng phân bố XS và hàm phân bố XS, đối với biến ngẫu nhiên liên tục thì luật phân bố XS
của nó thể hiện thông qua hàm phân bố XS và hàm mật độ XS
Phần trình bày sau đây, chúng tôi làm rõ về phân bố XS và các chỉ số đặc trưng của
biến ngẫu nhiên Từ đó làm nổi bật qui trình, cách thức nghiên cứu hiện tượng ngẫu nhiên
Do giới hạn nghiên cứu, chúng tôi trình bày cụ thể hơn cho biến ngẫu nhiên rời rạc Biến
ngẫu nhiên liên tục nằm ngoài giới hạn của luận văn Tuy nhiên, nếu thể hiện phân bố XS
bằng hàm phân bố hay hàm mật độ XS, và trong các công thức tính kỳ vọng, phương sai và
độ lệch chuẩn nếu thay dấu ∑ bởi dấu ∫, 𝑝𝑖 bởi hàm phân phối xác suất 𝑓(𝑥) ta cũng được các công thức tương ứng của biến ngẫu nhiên liên tục
Biến ngẫu nhiên rời rạc có thể nhận hữu hạn hoặc vô hạn đếm được các giá trị nên số
n ở trên có thể là +∞ Tuy nhiên trên thực tế chúng ta thường chỉ gặp những biến ngẫu
nhiên có hữu hạn giá trị Để tìm được bảng phân bố XS của biến ngẫu nhiên rời rạc X trước
tiên cần xác định được các giá trị có thể có của X Các giá trị được xác định bằng phương
pháp suy diễn (nếu các kết cục là đồng khả năng), hay phương pháp điều tra chọn mẫu (phương pháp TK) Gọi 𝐸𝑖 là biến cố “𝑋 = 𝑥𝑖” thì các biến cố 𝐸𝑖 là những biến cố đơn tức
là biến cố không thể chia nhỏ được nữa và loại trừ lẫn nhau, đồng thời tất cả các biến cố khác liên quan tới biến ngẫu nhiên đang xét được biểu diễn thông qua các biến cố 𝐸𝑖 Tiếp theo, việc thiết lập hàng thứ 2 được thực hiện bằng cách tính XS của các biến cố đơn vừa được xác định, đồng thời phải chú ý tới một điều kiện cần là ∑ 𝑝𝑖 = 1
Một khi đã xác định được phân bố XS của X thì coi như ta đã nắm được toàn bộ thông tin về
X (Đặng Hùng Thắng (1997), tr.44)
Thật vậy, bảng phân bố XS của biến ngẫu nhiên được xem như một bảng tóm tắt về
dữ liệu tổng thể, cho ta cái nhìn trực quan về phân bố XS của 𝑋 như : giá trị nào có XS xảy
ra lớn nhất, XS của các giá trị phân bố tập trung hay trải đều… Mặt khác, việc tính XS của
những biến cố phức hợp được thực hiện rất đơn giản là xác định những giá trị 𝑥𝑖 làm nên
Trang 16biến cố, sau đó cộng các XS tương ứng với những giá trị vừa xác định sẽ được XS của biến
cố cần tính
Trong TK mô tả, nếu bảng phân bố tần số, tần suất cho phép thu gọn dữ liệu và cho
ta những nhìn nhận ban đầu về dữ liệu thu được trên mẫu, thì trong XS, bảng phân bố XS cũng cho phép ta hình dung được sự phân bố của của các giá trị (dữ liệu) của tổng thể, việc thiết lập một bảng phân bố XS của biến ngẫu nhiên cung cấp một phương pháp nghiên cứu khoa học về hiện tượng ngẫu nhiên
Việc phản ánh quy luật phân bố XS của một biến ngẫu nhiên bằng bảng chỉ tiện lợi
với biến ngẫu nhiên rời rạc và hữu hạn giá trị, còn với biến ngẫu nhiên rời rạc vô hạn giá trị hay biến ngẫu nhiên liên tục việc liệt kê các giá trị có thể có của nó là khó khăn, và có khi là không thể Vì vậy, người ta sử dụng một khái niệm tổng quát có thể áp dụng cho mọi đại
lượng ngẫu nhiên là hàm phân bố XS
Hàm phân b ố XS (hay hàm phân bố) của đại lượng ngẫu nhiên X là một hàm F(x) xác định
v ới mội x theo công thức sau : F(x) = p(X < 𝑥)
( Đặng Hùng Thắng (1997), tr.46)
Đối với biến ngẫu nhiên rời rạc thì biến cố “ X < 𝑥” được tạo bởi các giá trị xi bé
hơn 𝑥 nên công thức trên trở thành : F(x) = ∑xi<𝑥pi
Như vậy F(x) chính là XS để xảy ra biến cố “X nhận giá trị nhỏ hơn x”, và đối với
biến ngẫu nhiên rời rạc thì tùy theo x biến thiên tới đâu thì sẽ cộng các XS của các giá trị 𝑥𝑖
nhỏ hơn x tới đó Do đó, hàm phân bố XS 𝐹(𝑥) còn được gọi là XS tích lũy
Hàm phân bố XS là hình thức tổng quát nhất thể hiện qui luật phân bố XS của 𝑋, hàm phân bố của biến ngẫu nhiên liên tục là liên tục, của biến ngẫu nhiên rời rạc là gián đoạn Do đó, người ta còn phân loại biến ngẫu nhiên dựa vào đặc tính của hàm phân bố :
Một đại lượng ngẫu nhiên được gọi là rời rạc nếu hàm phân phối XS của nó là một hàm gián đoạn Tương tự nó được gọi là liên tục nếu hàm phân phối của nó là liên tục (Lê Văn Phong tập 4, Q1 (1982), tr.148)
Tuy nhiên, hàm phân bố XS hữu dụng cho việc trình bày dữ liệu liên tục, còn dữ liệu
rời rạc trong XS – TK chủ yếu vẫn là dùng bảng phân bố XS
Các ch ỉ số đặc trưng
Bảng phân bố XS cũng như bảng phân bố tần số, tần suất đã phần nào thu gọn và
phản ánh được sự phân bố của các giá trị trong mẫu hay tổng thể Tuy nhiên, các số liệu vẫn còn nhiều không thuận tiện cho việc phân tích hay so sánh các mẫu hay tổng thể với nhau
Trang 17Vì vậy, sau khi tìm được bảng phân bố XS của một biến ngẫu nhiên, cần thiết phải tóm tắt chúng qua một vài con số đặc trưng :
+ Kì v ọng toán của biến ngẫu nhiên rời rạc X, kí hiệu là E(X), được tính theo công
Ba tham số : kỳ vọng, phương sai và độ lệch chuẩn là các tham số quan trọng nhất
của biến ngẫu nhiên, nó có vai trò tương tự như số trung bình 𝑋�, phương sai 𝑠2 và độ lệch chuẩn 𝑠 trong thực nghiệm Ngoài ra, trong từng trường hợp người ta cũng quan tâm tới các tham số : mode, mômen, hệ số bất đối xứng, hệ số nhọn, phân vị Tuy nhiên, những tham số
này chỉ dùng trong một số trường hợp nhất định nên chúng tôi không làm rõ ở đây Tóm lại, các tham số của tổng thể cũng như các trị số thống kê của mẫu được chia làm 2 nhóm là các tham số định tâm (kì vọng, mode) và các tham số đo độ phân tán (phương sai, độ lệch chuẩn)
Như vậy, XS gắn bó chặt chẽ và liên hệ mật thiết với khoa học TK về phương pháp thu thập, tổ chức, trình bày và diễn dịch dữ liệu Hơn nữa, các tham số trong tổng thể, đặc
biệt là kỳ vọng, phương sai và độ lệch chuẩn có mối liên hệ mật thiết với các trị số TK của
mẫu
Những gì được trình bày ở trên phần nào đã làm rõ về khái niệm và cách thức nghiên
cứu một biến ngẫu nhiên nói chung và biến ngẫu nhiên rời rạc nói riêng Biến ngẫu nhiên trong XS chính là một sự mô hình hóa toán học của các hiện tượng ngẫu nhiên, cung cấp
một phương pháp khoa học để nghiên cứu chúng Bước đầu cho thấy mối quan hệ giữa XS
với TK về phương pháp thu thập, và xử lý số liệu
1.2 Vai trò c ủa biến ngẫu nhiên trong XS - TK
Bi ến ngẫu nhiên – công cụ để nghiên cứu các hiện tượng ngẫu nhiên
Trang 18Trong Lý thuyết XS, người ta tập trung nghiên cứu các biến ngẫu nhiên, đó là mô hình toán học cho hiện tượng ngẫu nhiên đang xem xét Nghiên cứu biến ngẫu nhiên là tổng quát hơn, bao quát được hiện tượng hơn so với chỉ nghiên cứu các biến cố riêng lẻ Để làm
rõ hơn vấn đề này chúng tôi xét một bài toán rất gần gũi với Lý thuyết XS :
Bài toán “vé s ố” : Mỗi tờ vé số phát hành hàng ngày của công ty Xổ số Miền nam là
một dãy gồm 6 chữ số và trúng thưởng nếu các chữ số cuối trùng với các dãy số theo đúng
thứ tự mà công ty đưa ra tương ứng với các giải Chẳng hạn, kết quả xổ số tỉnh Tây Ninh ngày 24/10/2013 như sau
Kết quả trúng thưởng mỗi ngày được công ty quay số ngẫu nhiên, giả thiết rằng các
số trúng giải không trùng với các chữ số tận cùng của các giải lớn hơn theo đúng thứ tự
Một người mua một tờ vé số, gọi 𝑋 là số tiền người đó nhận được Ta có bảng phân bố XS
Trang 19Ta cũng nhanh chóng tính được XS của một số biến cố quan tâm như :
XS trúng thưởng là 0,011511 (nhỏ hơn khoảng 86 lần) so với XS không trúng thưởng
XS trúng thưởng lớn hơn hoặc bằng 1 triệu đồng là 0,000211, …
Kì vọng E(𝑋) ≈ - 6055 (đồng) Con số này cho thấy trung bình mỗi người mua một
tờ vé số bị lỗ 6055 đồng Nếu các giải thưởng được trao hết thì trung bình công ty vé số được lợi trên mỗi tờ vé số được bán là 6055 đồng Giả sử, mỗi dãy số chỉ in một tờ và được bán hết trong ngày thì số tiền lời công ty thu được là 6,055 tỉ đồng Con số này trừ đi các khoản chi phí in ấn, trả công vận chuyển và công cho người bán, … thì số tiền lời ước tính
vẫn là con số rất lớn
Như vậy, XS của từng biến cố cho phép ta dự đoán được khả năng xảy ra của từng
biến cố, nhưng biến ngẫu nhiên cho phép ta dự đoán kết cục bình quân của các giá trị trong
tổng thể bằng kì vọng, gán độ phân tán của các giá trị bằng các con số là phương sai hay độ
lệch chuẩn, cho chúng ta có những suy luận chính xác hơn khi so sánh các tổng thể với nhau, hay dự toán sự “được – mất” của mỗi bên
Ví dụ trên là sử dụng biến ngẫu nhiên một chiều, tuy nhiên số tiền lãi mà công ty thu được mỗi ngày còn phụ thuộc vào số tờ vé số bán được mỗi ngày Một hiện tượng ngẫu nhiên phụ thuộc cùng một lúc nhiều biến cố ngẫu nhiên khác nhau, người ta xác lập các biến
ngẫu nhiên phụ thuộc, biến ngẫu nhiên ta quan tâm lúc này là biến ngẫu nhiên n chiều Ví
dụ sau đây làm rõ hơn vai trò quan trọng của biến ngẫu nhiên
Ví d ụ : Một năm bán hàng, một cửa hàng kinh doanh hoa tươi tại Hà Nội nhận thấy số lẵng
hoa 𝑋 bán ra trong ngày theo tỉ lệ (XS) sau :
Mỗi lẵng hoa tươi mua vào 60 000 đồng, bán ra 100 000 đồng Nếu trong ngày bán không hết thì số hoa còn lại vứt bỏ Số lẵng hoa cần mua vào là bao nhiêu để lợi nhuận trung bình thu được là cao nhất
Gi ải Gọi 𝑌 là số lẵng hoa dự định mua, ta có bảng sau về số tiền lời dự định thu được :
Trang 20+ Nếu mua vào 9 lẵng hoa tiền lời trung bình là 𝐸𝑋 = 360 nghìn đồng
+ Nếu mua vào 10 lẵng hoa tiền lời trung bình là
+ Nếu mua vào 13 lẵng hoa tiền lời trung bình là 𝐸𝑋 = 415 nghìn đồng
+ Nếu mua vào 14 lẵng hoa tiền lời trung bình là 𝐸𝑋 = 380 nghìn đồng
+ Nếu mua vào 15 lẵng hoa tiền lời trung bình là 𝐸𝑋 = 330 nghìn đồng
Như vậy, ta chọn phương án mua vào 12 lẵng hoa thì tiền lời trung bình là cao nhất
Qua hai ví dụ, việc suy luận cho những con số xác thực cho thấy nghiên cứu biến
ngẫu nhiên là tổng quát hơn chỉ nghiên cứu các biến cố riêng lẻ của hiện tượng ngẫu nhiên
Bi ến ngẫu nhiên - một yếu tố tạo nên mối liên hệ giữa XS và TK
Ứng dụng to lớn của Lý thuyết XS là cung cấp các công cụ lý thuyết để giải quyết các bài toán TK, cho phép nhà TK sử dụng thông tin của một mẫu để đưa ra những suy luận hay để mô tả về tổng thể mà từ đó mẫu này được lấy ra
Trước hết là phương pháp xác định XS theo quan điểm TK có phạm vi ứng dụng hết
sức rộng rãi trong nhiều ngành khoa học, kinh tế, kỹ thuật, điều tra xã hội, … Cơ sở toán
học cho việc dùng TK để tính XS là luật số lớn và các định lý giới hạn
Trang 21Lu ật số lớn : Giả sử X1 , X 2 , … , X n là dãy các đại lượng ngẫu nhiên độc lập có cùng phân bố
và có kì v ọng là µ và phương sai σ 2 Khi đó trung bình cộng X1 +X 2 +,…,+X n
n sẽ hội tụ tới µ theo XS (Đặng Hùng Thắng (1997), tr.158)
Khi sử dụng phương pháp chọn mẫu ngẫu nhiên thì các trị số TK cũng chính là các đại lượng ngẫu nhiên phụ thuộc vào mẫu được lựa chọn Hệ quả sau đây (định lý Becnulli)
của luật số lớn là cơ sở cho định nghĩa TK của XS
Định lý Becnulli : Lặp lại thí nghiệm nào đó n lần và giả sử biến cố A đã cho xuất hiện nA
l ần Khi đó giới hạn của tần suất fn(A) =nA
n khi n tăng lên vô hạn được gọi là XS của biến
cố A theo quan điểm TK (Đặng Hùng Thắng (1997), tr.160)
Trong khoa học thực nghiệm, bằng phương pháp điều tra chọn mẫu, người ta thường
lấy tần suất trong mẫu làm XS thực nghiệm cho tổng thể, và do đó thì XS thực nghiệm là con số mang tính “ước lượng” Như vậy việc xấp xỉ tần suất làm XS kéo theo mối quan hệ
giữa các trị số TK khác trong mẫu với các tham số tổng thể tương ứng (số trung bình – kì
vọng, phương sai và độ lệch chuẩn của mẫu – phương sai và độ lệch chuẩn của tổng thể)
Việc sử dụng mẫu để suy luận cho tổng thể dẫn tới sự sai khác giữa các giá trị của các tham số được kết luận với các giá trị thực của các tham số đó Sự sai khác này là nguồn
gốc sinh ra các khái niệm độ tin cậy, mức ý nghĩa, hay các bài toán chọn mẫu, ước lượng,
ki ểm định giả thiết trong TK suy diễn
Mối quan hệ giữa phân bố thực nghiệm và phân bố lý thuyết được tóm gọn trong
𝑥𝑘
𝑓1
𝑓2
𝑓𝑘
X: đại lượng biến thiên
𝑥𝑖: giá trị quan sát được
𝑥𝑘
𝑝1
𝑝2
𝑝𝑘
X: biến ngẫu nhiên
𝑥𝑖: giá trị có thể có của X
𝑝𝑖: XS để X nhận giá trị 𝑥𝑖
Trang 22Điều kiện cơ bản :
chỉ là sự tương tự về mặt hình thức, mà các giá trị tương ứng ở 2 cột có mối liên hệ mật thiết
với nhau, mối liên hệ đó được thể hiện một cách chặt chẽ bằng các định lí giới hạn, luật số
lớn và các hệ quả Chẳng hạn, định lí Bernoulli thể hiện mối quan hệ giữa tần suất 𝑓 và XS
𝑝, định lí sau đây thể hiện mối liên hệ giữa 𝑋� và 𝜇
Định lí : Giả sử X1 , X2, … , Xnlà dãy các đại lượng ngẫu nhiên độc lập sao cho EX1= EX2= … = EX n = µ và DX i ≤ c với mọi i = 1, 2, …
Khi đó trung bình cộng X� =∑ni=1Xi
n hội tụ theo XS tới µ
(Đặng Hùng Thắng (1997), tr 161)
Các trị số TK ở cột bên trái là các giá trị chính xác cho mẫu, các tham số ở cột bên
phải là các giá trị chính xác cho tổng thể Tuy nhiên trên thực tế ta khó có thể biết được các giá trị chính xác của các tham số tổng thể, muốn biết chính xác phải điều tra toàn bộ nhưng
việc điều tra như vậy gây tốn kém về thời gian, công sức, tiền bạc, …Vì vậy, người ta sẽ
tiến hành phương pháp điều tra chọn mẫu, các giá trị thu được trên mẫu sẽ được dùng làm ước lượng cho các tham số của tổng thể
• Trung bình 𝑋� là ước lượng không chệch, vững, hiệu quả, hợp lý cực đại của
k ỳ vọng 𝜇 (ước lượng không chệch, vững được suy ra từ trường hợp đặc biệt của định
lý Trê bư sép )
• T ần suất 𝑓 =𝑚𝑛 là ước lượng không chệch, vững, hiệu quả, hợp lý cực đại của
XS (t ỉ lệ) p trong tổng thể (ước lượng không chệch, vững được suy ra từ luật số lớn)
• Phương sai mẫu hiệu chỉnh 𝑠′2 =𝑛−1𝑛 𝑠2 là ước lượng không chệch, vững, hợp
lý c ực đại của phương sai V(X) trong tổng thể
Trang 23Do ảnh hưởng của quá trình chọn mẫu, trong ước lượng điểm luôn có một sai số nhất định Nhưng do tổng thể chưa biết nên độ sai lệch này cũng không thể đo được mà tùy theo yêu cầu nghiên cứu mà người ta ấn định một số 𝜀 > 0 sao cho �𝜃� − 𝜃� < 𝜀 Số 𝜀 càng bé thì
yêu cầu ước lượng càng phải chính xác và được gọi là độ chính xác của ước lượng Từ đó
người ta xây dựng các khái niệm :
• Kho ảng tin cậy : (𝜃� − 𝜀, 𝜃� + 𝜀)
• Độ tin cậy 𝛽 là XS để tham số 𝜃 nằm trong khoảng tin cậy
• M ức ý nghĩa : 𝛼 = 1 − 𝛽
Vấn đề của ước lượng khoảng là tìm một khoảng không quá lớn sao cho XS (𝛽) để giá trị 𝑋 thuộc vào khoảng đó là chấp nhận được, XS này chính là độ tin cậy của ước lượng
Một bài toán khác có thể xem là bài toán ngược của bài toán ước lượng, liên quan tới việc
chọn mẫu đó là mẫu phải có kích thước bao nhiêu để đạt được khoảng tin cậy chọn trước
Động cơ của việc làm TK là dựa vào những thông tin thu được từ trên mẫu phải đưa
ra những nhận xét, đánh giá cho toàn bộ tổng thể Thông thường, tổng thể lớn nên những
nhận xét, đánh giá có thể thiếu chính xác Xuất phát từ điều này, người ta tiến hành xây
dựng các công thức cho bài toán kiểm định giả thiết
Trên thực tế, việc áp dụng phương pháp TK để nghiên cứu các hiện tượng ngẫu nhiên
là phổ biến Quá trình nghiên cứu thường tiến hành theo 3 giai đoạn:
- Trước hết phải điều tra, thu thập số liệu và trình bày số liệu một cách gọn gàng, có
hệ thống; tóm tắt số liệu qua một vài con số đặc trưng
- Các số liệu đặc trưng nói trên mới chỉ được tính toán trên các số liệu đã có chứ không phải toàn bộ số liệu cần phải có Do đó, cần có những lí luận soi đường để căn cứ vào
đó mà so sánh, phân tích, rút ra tính quy luật khách quan của hiện tượng
- Cuối cùng dựa trên những đặc tính quy luật khái quát ấy, ta phân tích trở lại hiện tượng đã được điều tra, tiến hành nhận định, dự đoán, rút ra các kết luận cần thiết cho mục tiêu nghiên cứu với một mức độ tin cậy nào đó
Ba giai đoạn nghiên cứu tương ứng với 3 phần : TK mô tả - Lý thuyết XS – TK suy
diễn TK mô tả cung cấp phương pháp thu thập, trình bày và biểu diễn dữ liệu thu được trên
mẫu, TK suy diễn là tiến hành suy luận để rút ra các kết luận về tổng thể hoặc một quá trình
dựa trên mẫu dữ liệu và được thể hiện bằng ngôn ngữ XS Như vậy, Lý thuyết XS là cầu nối
giữa 2 phần TK mô tả và TK suy diễn và để XS ứng dụng vào giải quyết các bài toán TK
Trang 24cần phải thông qua khái niệm biến ngẫu nhiên Việc xuất hiện trong hầu hết các định lí của
lí thuyết XS cho thấy vai trò trung tâm của khái niệm này
Tóm lại, biến ngẫu nhiên là khái niệm căn bản của Lý thuyết XS, cung cấp một đường lối khoa học, các công cụ lý thuyết cần thiết để nghiên cứu các hiện tượng ngẫu nhiên một cách hoàn chỉnh hơn
Biến ngẫu nhiên xuất hiện trong hầu hết các định lí quan trọng của XS, là mắt xích quan trọng trong cầu nối giữa TK mô tả và TK suy diễn Phân bố XS, các chỉ số đặc trưng
của biến ngẫu nhiên có mối liên hệ chặt chẽ với phân bố thực nghiệm và các trị số TK Các bài toán quan trọng của TK như bài toán ước lượng, kiểm định giả thiết, bài toán chọn mẫu
… đều xuất phát từ mối quan hệ này Mặt khác suy luận TK rất phong phú nhưng cũng chỉ
có một vài dạng thức thông dụng tương ứng với các tham số như suy luận cho tỉ lệ, cho giá
trị trung bình hay cho phương sai
1.3 V ề phân bố nhị thức
Nói tới biến ngẫu nhiên là nói tới luật phân bố XS của chúng Với biến ngẫu nhiên
rời rạc chính là bảng phân bố XS Trong Lý thuyết XS người ta giả định đã biết về tổng thể,
sử dụng phân bố tổng thể để đưa ra suy luận cho các mẫu khác nhau được rút ra từ tổng thể Tuy nhiên, việc lập bảng phân bố XS là không khả quan cho những biến ngẫu nhiên có nhiều giá trị Thực tế cho thấy rằng việc dạy cho người học hiểu biết về một số mô hình phân bố XS thông dụng còn quan trọng hơn là dạy cho người học thực hành tính toán trên các công thức tính các chỉ số đặc trưng từ định nghĩa bởi lẽ nếu có bảng phân bố XS thì
nhập dữ liệu vào máy tính cầm tay cũng nhanh chóng cho ta các giá trị của các chỉ số đặc trưng
Nét nổi bật trong tính toán mà các mô hình này mang lại là ở sự tiện lợi, nhanh gọn khi sử dụng công thức tính các chỉ số đặc trưng riêng biệt thay cho các công thức cồng kềnh như trong định nghĩa Trong XS - TK, thông thường ta chỉ quan tâm tới một giá trị tham số nào đó của tổng thể Thay vì phải mất nhiều thời gian để lập bảng phân bố lý thuyết và tính toán các tham số bằng định nghĩa, ta chỉ cần xem xét các dấu hiệu trong tổng thể để suy ra
dạng phân bố của nó, và việc tính tham số quan tâm đơn giản hơn rất nhiều Có rất nhiều
luật phân bố được áp dụng trong thực tế (khoảng trên 120 qui luật) Hơn nữa :
Chính các quy luật này là những mô hình miêu tả một cách hoàn chỉnh các hiện tượng ngẫu nhiên và là cơ sở giúp ta phân tích, nhận định về những quy luật thực nghiệm (Lê Văn Phong (1982), tr.61)
Trang 25Suy luận TK rất phong phú nhưng cũng chỉ có vài dạng thức chung nhất, thông dụng
nhất được áp dụng cho hầu hết các ngành khhoa học đó là : tìm các khoảng tin cậy (ước lượng khoảng), kiểm định giả thiết cho tỉ lệ, giá trị trung bình hay phương sai, tìm đường
hồi qui Trong đó nếu nói tới các bài toán TK về số lượng và tỉ lệ trong mẫu là nói tới qui
luật phân bố nhị thức, hay về giá trị trung bình là nói tới phân bố chuẩn, … Các qui luật phân bố chuẩn, phân bố student, …là những mô hình phân bố quan trọng của biến ngẫu nhiên liên tục nên nằm ngoài phạm vi nghiên cứu của lận văn Phần tiếp theo đây chúng tôi
tiếp tục nghiên cứu về mô hình phân bố nhị thức của biến ngẫu nhiên rời rạc Đây là một mô hình quan trọng của biến ngẫu nhiên rời rạc, ứng dụng rất tốt cho tổng thể có số lượng lớn
1.3.1 Sơ lược về qui luật phân bố nhị thức
Trong nhiều cuộc thăm dò ý kiến, điều tra xã hội như : hỏi ý kiến về việc ủng hộ hay không cho một vị lãnh đạo nào đó, điều tra xác định số sản phẩm bị lỗi, hay điều tra số trẻ
em sinh ra mà chết trước 1 tuổi của bộ y tế, … thì kết cục cuối cùng người ta quan tâm là tỉ
lệ hay số phần tử thỏa hay không thỏa dấu hiệu đang điều tra Như vậy, số lượng trong mẫu
và tỉ lệ mẫu là các TK thông dụng Các tình huống như trên đều có đặc điểm chung đó là :
- Có n phép thử (n lần quan sát) độc lập
- Kết cục của mỗi phép thử chỉ rơi vào một trong hai nhóm là “xảy ra biến cố 𝐴” hoặc
“không xảy ra biến cố 𝐴”
- XS xảy ra biến cố 𝐴 trong mỗi phép thử là p và không thay đổi qua các lần thử khác
Một dãy các phép thử thỏa 3 điều kiện trên được gọi là một lược đồ Bernoulli với 2 tham số 𝑛 và 𝑝 Giải quyết vấn đề này Bernoulli đã chứng minh công thức mang tên ông :
𝑝𝑛(𝑘) = 𝑐𝑛 𝑘𝑝𝑘 𝑞𝑛−𝑘 Trong đó, 𝑝𝑛(𝑘) là XS để biến cố 𝐴 cần xét sẽ xuất hiện k lần trong n
lần thử Việc chứng minh công thức Bernoulli hoàn toàn có thể sử dụng các kiến thức về đại
số tổ hợp, sự độc lập của các biến cố và công thức nhân XS, công thức cộng XS
Gi ả sử biến cố A xuất hiện trong k phép thử đầu tiên và biến cố 𝐴̅ xảy ra trong 𝑛 − 𝑘 phép thử sau
Trang 26- Các giá trị có thể có của nó là những số nguyên không âm 0, 1, 2, … , n
- XS để nó nhận ra mỗi giá trị này được tính theo công thức Bernoulli tức là p(X = k) =
c nkp k p n−k
Kí hi ệu : X ≈ B(n, p) với tham số (n, p)
(Lê V ăn Phong (1982), tr 199)
Khi đó bảng phân bố XS của biến 𝑋 có dạng :
Chứng minh tương tự đối với phương sai
Nhiều giáo trình bậc đại học lựa chọn cách chứng minh bằng cách sử dụng tính độc
lập của các biến ngẫu nhiên tuy ngắn gọn hơn nhưng cách chứng minh trên phù hợp với chương trình ở trường PT
Rõ ràng, các chỉ số đặc trưng của mô hình phân bố này rất đơn giản, dễ nhớ và gắn
liền với các tham số Việc áp dụng các công thức này sẽ nhanh gọn và chính xác hơn so với tính trực tiếp qua bảng phân bố Điều này rất cần thiết đối với tất cả mọi người học về XS –
TK Bởi vì khi số lượng 𝑥𝑖 lớn, việc tính các XS 𝑝𝑖 để lập bảng phân bố XS và áp dụng các công thức tính chỉ số đặc trưng là rất khó khăn, tốn kém thời gian, công sức Thay vào đó,
Trang 27người học chỉ cần nhận biết xem biến ngẫu nhiên đang xét tuân theo qui luật phân bố nào để
áp dụng các công thức riêng biệt một cách nhanh gọn
Ví dụ tung đồng xu rất quen thuộc và xa rời với những suy luận TK, nhưng nó lại là
ví dụ cho một phân bố nhị thức Nếu đồng xu là cân đối và thực hiện tung n lần, 𝑋 là số lần
xuất hiện mặt ngửa thì 𝑋 ≈ 𝐵(𝑛, 0.5)
Nếu tham số n trong phân bố nhị thức là số lượng của tổng thể thì phân bố của 𝑋 cũng là phân bố của tổng thể Tuy nhiên, trong chọn mẫu TK người ta cũng chứng minh được :
Trong m ột tổng thể có tỉ lệ p các lần xảy ra biến cố A Nếu tổng thể lớn hơn nhiều lần so với
m ẫu thì số lượng X các lần xảy ra biến cố A trong mẫu ngẫu nhiên có n phần tử được chọn ra
t ừ tổng thể gần đúng với phân bố nhị thức B(n, p) Độ chính xác của sự gần đúng này tăng lên khi qui mô của tổng thể tăng tương ứng với cỡ mẫu Như một qui tắc thực hành, chúng ta
s ẽ sử dụng phân bố mẫu nhị thức khi tổng thể lớn gấp ít nhất 20 lần mẫu
(David S Moore, George P McCabe, Bruce A Craig (2010), tr 304)
Mô hình phân bố nhị thức như là mô hình TK cho 1 con số đếm (đếm số lần xảy ra
biến cố 𝐴) Phân bố nhị thức có vai trò quan trọng trong một lớp các bài toán liên quan tới suy luận về tỉ lệ trong TK, đó là những bài toán thông dụng trong nhiều ngành khoa học, kinh tế, xã hội Tuy nhiên, biến ngẫu nhiên 𝑋 nói trên là biến cho số lượng, biến ngẫu nhiên
về tỉ lệ thì không phải phân bố nhị thức, nhưng ta hoàn toàn có thể chuyển đổi bất kì bài toán tỉ lệ nào về bài toán số lượng Hơn nữa, từ trung bình và độ lệch chuẩn của số lượng ta cũng có trung bình và độ lệch chuẩn của tỉ lệ là : 𝜇𝑝�= 𝑝, 𝜎𝑝� = �𝑝(1−𝑝)𝑛
X ấp xỉ phân bố nhị thức trong TK :
- Khi n lớn và p khá bé thì phân bố nhị thức với tham số (n, p) có thể xấp xỉ bởi phân bố poisson với tham số 𝜆 = 𝑛𝑝 Xấp xỉ là tốt khi 𝑛 > 50 và 𝑝 < 0,1 Xấp xỉ này giúp đơn giản trong tính XS của các biến cố
- Nếu kích thước tổng thể 𝑝 > 10𝑛 thì ta có thể coi qui luật siêu bội và qui luật nhị thức
xấp xỉ nhau
Hai trường hợp trên nhằm giảm thiểu những sai số trong tính toán
- Xấp xỉ phân bố nhị thức bởi phân bố chuẩn là quan trọng trong TK suy diễn, cho phép xây dựng các quy tắc suy luận cho tỉ lệ Xấp xỉ này được chứng minh bởi định lý giới hạn Moivre – Laplace (hệ quả của định lý giới hạn trung tâm) :
Gi ả sử X n là bi ến ngẫu nhiên có phân bố nhị thức B(n, p) (0 < p < 1)
Trang 28Đặt Zn=Xn −np
�npq , khi đó: limn→+∞P(Zn< 𝑥) =√2π1 ∫ e−∞x −t22 dt Hay nói cách khác Z nhội tụ theo luật tới phân bố chuẩn tắc
(Tô Văn Ban (2010), tr 120)
Từ đó, ta có xấp xỉ cho cả số lượng và tỉ lệ trong mẫu : biến ngẫu nhiên 𝑋 có phân bố
nhị thức B(n, p) Khi n lớn, 𝑋 có phân bố gần đúng với phân bố chuẩn 𝑝(𝑛𝑝, �𝑛𝑝𝑞), tỉ lệ 𝑝̂ = 𝑋𝑛 có phân bố gần đúng với phân bố chuẩn 𝑝(𝑝, �𝑝𝑞𝑛) Và trong thực hành TK, phép gần đúng này sẽ được đảm bảo khi số n thỏa 𝑛𝑝 ≥ 10 hay 𝑛𝑞 ≥ 10
Một kỹ năng quan trọng trong thực hành TK là việc lựa chọn mô hình XS phù hợp cho biến ngẫu nhiên Nghĩa là lựa chọn mô hình phù hợp với các dữ liệu đã biết về biến
ngẫu nhiên và cho phép chúng ta thực hiện những suy luận có thể có tốt nhất qua việc sử
dụng mô hình này Với biến ngẫu nhiên rời rạc có một hình cây quyết định
1.3.2 M ột vài kiểu nhiệm vụ suy luận cho tỉ lệ
T 1 : Ước lượng điểm cho tỉ lệ (XS)
Giả sử tổng thể có N phần tử, trong đó mỗi phần tử có thể mang hoặc không mang
một dấu hiệu A nào đó Trong trường hợp tổng thể là chưa biết, yêu cầu ước lượng tỉ lệ p các phần tử mang dấu hiệu A trong tổng thể
Kích thước của tổng thể có giới hạn?
S ử dụng ước lượng
x ấp xỉ
Trang 29 Kĩ thuật giải :
Lấy 1 mẫu ngẫu nhiên gồm n phần tử theo phương pháp hoàn lại
Xác định số m các phần tử mang dấu hiệu A trong mẫu Tính tần suất 𝑓𝐴 =𝑚𝑛
Ước lượng 𝑓𝐴 ≈ 𝑝
Chú ý :
• Nếu N ≥ 10n thì có thể lấy mẫu không hoàn lại
• Tần suất 𝑓𝐴 là ước lượng không chệch, vững, hiệu quả của p
T 2 : Ki ểu nhiệm vụ “ước lượng khoảng tin cậy cho tỉ lệ (XS)”
Giả sử cần ước lượng XS p của biến cố A Gọi 𝑋 là biến ngẫu nhiên có phân bố nhị
thức B(1, p) (hay phân bố Bernoulli) liên kết với biến cố A Ta tìm khoảng giá trị (𝜃1, 𝜃2) sao cho 𝑃(𝜃1 < 𝑋 < 𝜃2) = 1 − 𝛼 = 𝛽
Trường hợp n lớn : 𝑋 ≈ 𝐵(1, 𝑝) nên 𝐸(𝑋) = 𝑝, 𝑉(𝑋) = 𝑝𝑞 Như vậy, ước lượng tỉ
lệ p như là ước lượng giá trị trung bình của biến ngẫu nhiên 𝑋 Mặt khác, n lớn, nên phân bố
của 𝑋� xấp xỉ 𝑝 �𝑝,𝑝𝑞𝑛� và trong mẫu (𝑋1, 𝑋2, … , 𝑋𝑛) thì 𝑋� = 𝑓 = 𝑚/𝑛
Xác định khoảng tin cậy cho xác suất p từ công thức : 𝑓 ± 𝑧𝛼/2�𝑓(1−𝑓)𝑛
Trường hợp cỡ mẫu nhỏ : tần suất của mẫu f là biểu hiện của biến ngẫu nhiên có
phân bố nhị thức B(n, f) Do n nhỏ nên xấp xỉ chuẩn cho những tính toán thiếu chính xác nên không áp dụng công thức trên
Kĩ thuật giải :
Lập một mẫu ngẫu nhiên gồm n phần tử, tính 𝑓 = 𝑚𝑛
Gọi Y là biến ngẫu nhiên có phân bố nhị thức 𝐵(𝑛, 𝑓) Tính toán trực tiếp để tìm
2 số a, b sao cho 𝑃(𝑎 ≤ 𝑌 ≤ 𝑏) ≥ 𝛽
Kết luận khoảng ước lượng cho tỉ lệ p là (a, b)
Trang 30Trường hợp p nhỏ : Biến ngẫu nhiên 𝑌 = 𝑛𝑋� có phân bố xấp xỉ phân bố poisson
với tham số 𝜆 = 𝑛𝑝 ≈ 𝑛𝑓
Kĩ thuật giải :
Lập một mẫu ngẫu nhiên gồm n phần tử, tính 𝑓 = 𝑚𝑛
Gọi Y là biến ngẫu nhiên có phân bố poisson P(nf) Tính toán trực tiếp để tìm 2
số a, b sao cho 𝑃(𝑎 ≤ 𝑌 ≤ 𝑏) ≥ 𝛽 = 1 − 𝛼
Khoảng ước lượng cho np là (a, b) nên khoảng ước lượng cho p là (𝑎𝑛, 𝑏𝑛)
M ột vài nhận xét :
Trong bài toán ước lượng điểm cho kết quả là một con số duy nhất, nhưng con số này
sẽ có sự thay đổi khi mẫu thay đổi Ước lượng điểm không thể hiện mức độ sai số giữa con
số được ước lượng với giá trị đúng của tham số, khi cỡ mẫu n nhỏ thì sai số có thể lớn
Đối với bài toán ước lượng khoảng, khoảng tin cậy là đối xứng quanh giá trị trung bình, trên thực tế ta luôn mong muốn độ rộng khoảng ước lượng bé, độ tin cậy lớn, và n bé Nhưng rất khó có thể đạt được mong muốn vì sự mâu thuẫn Do đó, cần phải có sự tính toán
một độ tin cậy để có sự hài hòa giữa các giá trị
Tỉ lệ cá thể mang dấu hiệu A trong tổng thể là 𝑝 = 𝑁𝑘, nếu biết khoảng ước lượng của
p và biết số lượng tổng thể N thì sẽ ước lượng được số cá thể mang dấu hiệu A trong tổng
thể
T 3 : Ki ểu nhiệm vụ “tìm kích thước mẫu cần thiết”
Bề rộng của khoảng tin cậy đối xứng của p là 2𝑙, 𝑙 tỉ lệ thuận với độ tin cậy 𝛽 và tỉ lệ nghịch với n Cố định một độ tin cậy 𝛽, tìm cỡ mẫu cần thiết để 𝑙 ≤ 𝜀
Kĩ thuật giải:
Ước lượng khoảng của tỉ lệ :
𝑓 ± 𝑧𝛼/2�𝑓(1−𝑓)𝑛 ⇒ 2𝑙 = 𝑧𝛼/2�𝑓(1−𝑓)𝑛 ≤𝑧𝛼/2
√𝑛 do 𝑓(1 − 𝑓) ≤14Xét 𝑧𝛼/2
√𝑛 ≤ 2𝜀 ⇒ 𝑛 ≥𝑧4𝜀𝛼/222 (*)
Vậy cỡ mẫu n cần thiết là số n thỏa (*)
T 4 : Ki ểm định giả thuyết cho tỉ lệ
Giả sử XS xảy ra biến cố A trong tổng thể là p Vì những tác động chủ quan hoặc khách qua này mà tỉ lệ này có thể bị biến đổi Người ta đặt ra một giả thuyết (H0), sử dụng phương pháp chọ mẫu và các quy tắc kiểm định để kiểm tra xem giả thuyết đặt ra là là đúng
Trang 31hay sai Tuy nhiên, suy luận từ 1 mẫu cho tổng thể nên không thể tuyệt đối chính xác, và do
đó vẫn có những sai lầm :
Sai lầm loại 1 : H0đúng nhưng lại bác bỏ H0
Sai lầm loại 2 : H0sai nhưng lại chấp nhận H0
Trong kiểm định, người ta luôn mong muốn hạn chế tối thiểu cả hai loại sai lầm nhưng điều này bị mâu thuẫn XS xảy ra sai lầm loại 1 là 𝛼 gọi là mức ý nghĩa của kiểm định Tùy từng trường hợp cụ thể để đưa ra mức ý nghĩa này
Với T41, nếu |𝑧| > 𝑧𝛼/2 thì bác bỏ H0, ngược lại thì chấp nhận H0
Với T42, nếu 𝑧 > 𝑧𝛼 thì bác bỏ H0, ngược lại thì chấp nhận H0
Với T43, nếu 𝑧 < −𝑧𝛼 thì bác bỏ H0, 𝑧 ≥ 𝑧𝛼 ngược lại thì chấp nhận H0
Nh ận xét :
• Qui tắc kiểm định trên được dùng cho mẫu lớn, trong đó đã ngầm ước lượng tỉ lệ
p của tổng thể bằng tỉ lệ trên mẫu
• Ta thấy 𝑧 = 𝑚−𝑛𝑝0
�𝑛𝑝 0 𝑞0=𝑚−𝐸(𝑋)𝑉(𝑋) ⇒ trị TK z cho ta một sự so sánh giữa độ lệch của
tần số trong mẫu và kỳ vọng (tần số lý thuyết) với độ lệch chuẩn trong lý thuyết, mặt khác với mức ý nghĩa 𝛼 ∊ [0.01; 0.05] thì 𝑧𝛼/2 nằm trong khoảng (1.96; 2.6) và 𝑧𝛼
nằm trong khoảng (1.65, 2.3) Và như vậy :
Với T41, chấp nhận H0 nếu độ lệch giữa tần số thực nghiệm với tần số lý thuyết (𝑚 − 𝐸(𝑋)) rơi vào khoảng từ 2 đến 2,6 lần độ lệch chuẩn
Với T42, chấp nhận H0 nếu độ lệch giữa tần số thực nghiệm với tần số lý thuyết (𝑚 − 𝐸(𝑋)) rơi vào khoảng từ 1.65 đến 2.3 lần độ lệch chuẩn
Do n lớn, phân bố nhị thức xấp xỉ chuẩn nên những nhận xét trên cũng gần gũi với qui tắc 2𝛿, 3𝛿 trong phân bố chuẩn
Trang 32Các bài toán suy luận TK về tỉ lệ là một trong những bài toán thông dụng nhất của
TK Trong đó, các mô hình phân bố đặc biệt của biến ngẫu nhiên rời rạc có vai trò rất quan
trọng Đặc biệt mô hình phân bố nhị thức là mô hình tốt nhất cho tổng thể lớn Từ mô hình phân bố cho tổng thể, người ta xây dựng mô hình hợp lí cho những mẫu rút ra từ tổng thể
Việc lựa chọn các qui luật phân bố phù hợp có ảnh hưởng trực tiếp tới các qui tắc trong thực hành TK
1.4 K ết luận chương 1
Biến ngẫu nhiên là một khái niệm cơ bản của Lý thuyết XS Nghiên cứu biến ngẫu nhiên tổng quát hơn, khoa học hơn nghiên cứu từng biến cố riêng lẻ của hiện tượng ngẫu nhiên, cung cấp cái nhìn đầy đủ và bao quát hơn về các hiện tượng ngẫu nhiên
Bảng phân bố XS của biến ngẫu nhiên rời rạc và các chỉ số đặc trưng có mối quan hệ
mật thiết với các đối tượng tương ứng trong TK mô tả, lột tả được mối quan hệ này là đã nêu bật được mối quan hệ XS – TK, sự phát triển qua lại của mối quan hệ hai chiều này,
thấy được ý nghĩa của các qui tắc trong thực hành TK
Các mô hình phân bố đặc biệt của biến ngẫu nhiên nói chung và biến ngẫu nhiên rời
rạc nói riêng cung cấp các công thức tính các chỉ số đặc trưng ngắn gọn, cho phép ta bỏ qua các bước tính toán phức tạp và các công thức cồng kềnh trong tính toán Hơn nữa, các mô hình phân bố đăc biệt còn cho ta xây dựng các mô hình suy luận trong các mẫu được rút ra
từ tổng thể, và có vai trò quyết định tới các qui tắc trong thực hành TK
Mô hình phân bố nhị thức là một trong những mô hình quan trọng nhất của biến ngẫu nhiên rời rạc, là mô hình lí tưởng cho các suy luận TK về tỉ lệ và số lượng phần tử trong
mẫu và từ mẫu suy luận cho tổng thể Đây là dạng thức suy luận thông dụng trong TK và trong nhiều ngành khoa học
Trang 33CHƯƠNG 2: BIẾN NGẪU NHIÊN VÀ MÔ HÌNH PHÂN BỐ NHỊ
Qua phân tích chương 1 cho thấy :
- Khái niệm biến ngẫu nhiên là một sự mô hình hóa toán học của hiện tượng ngẫu nhiên, cung cấp một phương pháp nghiên cứu khoa học hơn về hiện tượng ngẫu nhiên, là nhân tố tạo nên mối liên hệ giữa XS và TK mô tả
- Phân bố XS và các chỉ số đặc trưng của biến ngẫu nhiên được dùng để tóm tắt dữ liệu
tổng thể, ảnh hưởng trực tiếp tới một số dạng thức thông dụng trong suy luận TK
- Các mô hình phân bố XS có vai trò to lớn trong suy luận TK, được TK sử dụng như
những mô hình lý thuyết nhằm xây dựng các mô hình suy luận cho mẫu Mô hình phân bố
nhị thức của biến ngẫu nhiên rời rạc là mô hình ứng dụng cho các suy luận mẫu về tỉ lệ và
số lượng
Trong chương hai, chúng tôi tiến hành phân tích SGK giải tích lớp 11 ban nâng cao cùng
với bộ sách giáo viên và những tài liệu hướng dẫn dạy học của bộ giáo dục hiện hành Mục đích của chúng tôi là tìm câu trả lời cho các câu hỏi đã đặt ra :
CH1 : Trong SGK Đại số và giải tích lớp 11 nâng cao, đối tượng O và qui luật nghiên c ứu đối tượng O được trình bày ra sao ? Có những ràng buộc nào trong việc lựa
ch ọn các kiểu nhiệm vụ xoay quanh nó hay không ? Nếu có thì HS sẽ gặp khó khăn gì khi đối tượng O biến đổi vượt ra khỏi các ràng buộc đó ?
CH2 : Các bi ến ngẫu nhiên cho số lượng và tỉ lệ xuất hiện trong SGK, đối tượng O 1
có được lựa chọn sử dụng hay không ?
CH3 : M ối quan hệ giữa phân bố XS và phân bố thực nghiệm có được khai thác trong d ạy học biến ngẫu nhiên ? Và có hay không các kiểu nhiệm vụ cho sự tác động của các qui lu ật lý thuyết tới các qui tắc thực hành và suy luận trong thực nghiệm ?
TK mô tả được đưa vào chương trình PT từ trước nhưng XS thì đây lại là lần đầu tiên Tầm quan trọng của hai bộ môn toán ứng dụng này trong chương trình toán PT được các tác giả viết SGK khẳng định :
Đối với cuộc sống, những kiến thức về TK rất cần thiết, dù ra đời sau này HS phải làm nghề
gì hay học tiếp lên các bậc học cao hơn Vì vậy nối tiếp một số kiến thức ban đầu về TK mô
t ả ở bậc Trung học cơ sở, sang bậc THPT HS phải được cung cấp những hiểu biết về XS và
TK một cách có hệ thống hơn và gắn với thực tiễn trong xã hội nước ta (SGV 10 cơ bản, tr.3)
Trang 34Các nội dung của XS được đưa vào trong chương trình (ban nâng cao) bao gồm :
biến cố và XS của biến cố, các qui tắc tính XS, biến ngẫu nhiên rời rạc Mục tiêu của dạy
học XS được nêu rõ trong SGV 11 nâng cao như sau :
Về kiến thức, giúp HS
- N ắm các khái niệm : phép thử, không gian mẫu, kết quả thuận lợi cho một biến cố ;
- N ắm vững cách tính XS theo định nghĩa cổ điển ;
- N ắm vững quy tắc cộng và quy tắc nhân XS ;
- Làm quen với khái niệm biến ngẫu nhiên rời rạc và các đặc trưng quan trọng của nó
là kì v ọng, phương sai và độ lệch chuẩn Nhớ công thức tính kì vọng, phương sai và độ lệch chu ẩn
Về kĩ năng, giúp HS
- Bi ết vận dụng các kiến thức tổ hợp để tính XS theo định nghĩa cổ điển của XS ;
- Biết vận dụng quy tắc cộng và qui tắc nhân XS để giải một số bài toán XS đơn giản ;
- Bi ết lập bảng phân bố XS ; biết tính kỳ vọng, phương sai và độ lệch chuẩn của một biến ngẫu nhiên rời rạc
(SGV 11 nâng cao, tr75)
Qua mục tiêu chung của việc dạy học các yếu tố của XS, định nghĩa TK của XS không được nhắc tới Rõ ràng thể chế đã ưu ái định nghĩa cổ điển của XS và xem XS như là ứng dụng của đại số tổ hợp Vậy thì sự “ưu ái” của thể chế có gây trở ngại gì cho người học khi học về biến ngẫu nhiên ? Để có câu trả lời trước hết chúng tôi phân tích SGK 11 nâng cao, cụ thể là bài “Biến ngẫu nhiên rời rạc”
2.1 Bi ến ngẫu nhiên trong SGK lớp 11 nâng cao
2.1.1 M ục đích dạy học biến ngẫu nhiên
Khái niệm biến ngẫu nhiên chỉ được đưa vào chương XS lớp 11 ban nâng cao, ban cơ
bản thì không học khái niệm này, và cũng chỉ có khái niệm biến ngẫu nhiên rời rạc còn biến
ngẫu nhiên liên tục thì không xuất hiện trong chương trình Biến ngẫu nhiên rời rạc xuất
hiện trong bài cuối cùng của chương (§6 Biến ngẫu nhiên rời rạc) với thời lượng là 2 tiết trong tổng số 21 tiết của chương II : Tổ hợp – XS
Kiến thức : Giúp HS
- Hi ểu thế nào là một biến ngẫu nhiên rời rạc;
- Hiểu và đọc được nội dung của bảng phân bố XS của biến ngẫu nhiên rời rạc
- N ắm được công thức tính kỳ vọng, phương sai và độ lệch chuẩn của biến ngẫu nhiên rời rạc
- Hi ểu được ý nghĩa của kỳ vọng, phương sai và độ lệch chuẩn
Trang 35Kỹ năng: Giúp học sinh HS
- Bi ết cách lập bảng phân bố XS của một biến ngẫu nhiên rời rạc;
- Biết cách tính các XS liên quan tới một biến ngẫu nhiên rời rạc từ bảng phân bố XS của
nó
- Biết cách tính kỳ vọng, phương sai và độ lệch chuẩn của biến ngẫu nhiên rời rạc (SGV
11 nâng cao, tr 107)
Tóm lại, thể chế chỉ yêu cầu người học hiểu và nhận biết được một biến ngẫu nhiên
rời rạc, nắm được những yếu tố cơ bản liên quan đó là bảng phân bố XS và ba chỉ số đặc trưng thông dụng nhất, trong đó bảng phân bố XS là một yêu cầu không thể thiếu khi nghiên
cứu về biến ngẫu nhiên Về kĩ năng, yêu cầu của thể chế thiên về các kiểu nhiệm vụ trong
XS bao gồm lập được bảng phân bố XS và tính các chỉ số đặc trưng bằng các công thức theo định nghĩa, không có yêu cầu nào liên quan tới các kiểu nhiệm vụ trong TK
2.1.2 Bi ến ngẫu nhiên trong SGK lớp 11
Trong phần này chúng tôi tập trung phân tích bài “biến ngẫu nhiên rời rạc” trong SGK 11 nâng cao
2.1.2.1 V ề lý thuyết
Khái ni ệm biến ngẫu nhiên rời rạc:
Sau một ví dụ về tung đồng xu cho người học hình dung, định nghĩa được đưa ra như sau :
Đại lượng 𝑋 được gọi là một biến ngẫu nhiên rời rạc nếu nó nhận giá trị bằng số thuộc một
tập hữu hạn nào đó và giá trị ấy là ngẫu nhiên không dự đoán trước được
(SGK 11 nâng cao, tr 86)
Như vậy : SGK chỉ giới thiệu biến ngẫu nhiên rời rạc định lượng và nhận hữu hạn giá
trị Biến định tính cũng như cách chuyển từ nghiên cứu biến định tính sang nghiên cứu biến định lượng không được giới thiệu Để xác định một biến ngẫu nhiên rời rạc chỉ cần chỉ ra hai điều kiện thỏa mãn là :
• X nhận giá trị bằng số thuộc một tập hữu hạn
• Giá trị của X là ngẫu nhiên không đoán trước được
Ví dụ tung đồng xu rất quen thuộc với HS trong học tập XS, giúp người học dễ hình dung về tính ngẫu nhiên của các giá trị của 𝑋 nhưng mang nặng tính suy diễn Các giá trị
của 𝑋 được liệt kê đầy đủ như không gian mẫu trong định nghĩa cổ điển của XS Và với mỗi
biến ngẫu nhiên có một bảng phân bố XS duy nhất và chính xác
Trang 36Khái niệm mẫu ngẫu nhiên và các phương pháp điều tra chọn mẫu không được giới thiệu trong chương trình TK ở lớp 10 lẫn chương trình XS lớp 11 Phần này, SGK cũng không đề cập tới mối liên hệ giữa biến ngẫu nhiên với các dấu hiệu điều tra trong TK mô tả,
và không có tình huống nào cho người học xác định các giá trị có của biến ngẫu nhiên từ
những mẫu số liệu thu được nhờ điều tra ngẫu nhiên Như vậy người học sẽ khó hay phải
miễn cưỡng chấp nhận những bảng phân bố lý thuyết có sẵn trong các phần sau đó hay bài
tập
Phân b ố XS của biến ngẫu nhiên rời rạc
Trong SGK chỉ giới thiệu về bảng phân bố XS của biến ngẫu nhiên rời rạc hữu hạn
mà không giới thiệu hàm phân bố XS, điều kiện 𝑝1+ 𝑝2+ ⋯ + 𝑝𝑛 = 1 được thừa nhận không chứng minh
Về cách lập bảng phân bố XS của biến ngẫu nhiên X, SGV cũng hướng dẫn thực hiện
qua hai bước :
Bước 1 : Xác định tập giá trị {x 1 , x2, … , xn} của X
Bước 2 : Tính các XS P(X = x i ) = p i (i = 1, 2, … , n) Tính P(X = x i ) nghĩa là tính XS của
bi ến cố “X nhận giá trị x i”
(SGV 11 nâng cao, tr 107)
SGV cũng chứng minh và giải thích rất rõ về điều kiện ∑ 𝑝𝑛 𝑖 = 1
𝑖=1 :
Đó là điều kiện cần của bảng phân bố XS của X mà ta thiết lập là đúng Điều kiện này không
là điều kiện đủ, nói một cách khác, nếu điều kiện này bị vi phạm thì bảng lập là sai Nhưng
n ếu điều kiện này được thỏa mãn thì cũng chưa đảm bảo bảng ta lập là đúng (SGV 11 nâng cao, tr 108)
Sau khi đưa ra khái niệm, SGK cũng đưa ra hai ví dụ :
Ví dụ 2 và hoạt động H1 nhằm mục đích :
đánh giá xem HS đã biết đọc hiểu nội dung của bảng phân bố XS và tính các XS liên quan hay chưa (SGV 11 nâng cao, tr.109)
Ví d ụ 2 : Số vụ vi phạm luật giao thông trên đoạn đường A vào tối thứ bảy hàng tuần là một
bi ến ngẫu nhiên rời rạc X Giả sử X có bảng phân bố như sau :
P 0,1 0,2 0,3 0,2 0,1 0,1
B ảng 2
SGK cũng hướng dẫn cách đọc bảng phân bố :
Nhờ bảng 2 ta biết được chẳng hạn XS để tối thứ bảy trên đoạn đường A không có vụ vi
ph ạm luật giao thông nào là 0,1 và XS để xảy ra nhiều nhất một vụ vi phạm luật giao thông
là 0,1 + 0,2 = 0,3
Trang 37Tiếp theo là hoạt động H1 để củng cố :
H1 : Tính XS để tối thứ bảy trên đoạn đường A a) Có hai vụ vi phạm luật giao thông b) Có nhi ều hơn ba vụ vi phạm luật giao thông
(SGK 11 nâng cao, tr 87)
Tóm lại, nếu biết bảng phân bố XS của X, ta có thể tính được XS của tất cả các biến
cố liên quan tới 𝑋
Ví dụ 3 và hoạt động H2 nhằm mục đích
Giúp HS th ấy cách thiết lập dòng thứ 2 của bảng phân bố XS của X
(SGV 11 nâng cao, tr 109)
Ví d ụ 3 : Một túi đựng viên bi đỏ và 4 viên bi xanh Chọn ngẫu nhiên 3 viên bi, gọi X là số
viên bi xanh trong 3 viên bi được chọn ra Rõ ràng X là biến ngẫu nhiên rời rạc nhận giá trị trong t ập {0, 1, 2, 3}
(SGK 11 nâng cao, tr 87)
SGK cũng đưa ra lời giải tìm các XS P(X = 0), P(X = 1) làm mẫu nhưng không giải
hết mà yêu cầu người học thực hiện hoạt động 2 :
H2 : Hãy tính P(X = 2) và P(X = 3) và lập bảng phân bố XS của X (SGK 11 nâng cao, tr 88)
Như vậy để lập bảng phân bố XS của biến ngẫu nhiên 𝑋 trong ví dụ 3 hoàn toàn sử
dụng những kiến thức về tổ hợp và định nghĩa cổ điển của XS đã học Ví dụ có tính liên kết
chặt chẽ với những bài học trước, người học lập bảng phân bố xác suất dựa vào suy diễn, các giá trị 𝑥𝑖 được liệt kê đầy đủ, các XS 𝑝𝑖 là những con số được tính toán chính xác
Về ví dụ 2, bảng phân bố XS được cho sẵn, SGK chỉ yêu cầu người học biết đọc các
nội dung liên quan tới bảng phân bố XS Nhưng phương pháp để thiết lập bảng phân bố này không được nhắc tới Việc tìm ra bảng phân bố này không thể tiến hành bằng phương pháp như trong ví dụ 3, tức là dùng định nghĩa cổ điển để tính các XS 𝑃(𝑋 = 𝑥𝑖) mà phải dùng định nghĩa TK của XS Mối liên hệ giữa bảng phân bố XS với bảng phân bố tần suất chỉ được nhắc tới trong phần đọc thêm, và chúng tôi cũng không tìm thấy bất kì hoạt động hay bài tập nào thực hành về mối liên hệ này
Qua 3 ví dụ và lướt qua phần bài tập thì các biến ngẫu nhiên được đưa ra chỉ có rất ít giá trị (dưới 13 giá trị) nên việc lập bảng phân bố sẽ không mất nhiều thời gian Nhưng trên
thực tế thường gặp những biến ngẫu nhiên có con số lớn các giá trị thì việc lập bảng phân bố hoàn chỉnh là không khả thi Trong những trường hợp này cần thiết phải sử dụng các mô hình phân bố XS Tuy nhiên, tính đến thời điểm này, SGK cũng không nhắc tới mô hình
Trang 38phân bố nào, ngay cả việc tính các chỉ số đặc trưng cũng chỉ yêu cầu người học biết tính
trực tiếp qua bảng phân bố XS
Các ch ỉ số đặc trưng
Phần này, thể chế dạy học chỉ yêu cầu người học là nắm được các công thức tính kì
vọng, phương sai và độ lệch chuẩn của một biến ngẫu nhiên rời rạc ; biết tính các chỉ số đó
trực tiếp qua bảng phân bố XS và hiểu được ý nghĩa của chúng
• Kì v ọng
SGK đưa ra định nghĩa, đó cũng là công thức tính kì vọng của biến ngẫu nhiên rời
rạc đồng thời cũng đưa ra ý nghĩa về mặt toán học của kì vọng :
Định nghĩa : Cho X là biến ngẫu nhiên rời rạc với tập giá trị {x1 , x 2 , … , x n } Kì vọng của X
kí hi ệu là E(X) là một số được tính theo công thức : E(X) = x1p1+ x2p2+ ⋯ + xnpn= ∑ xni=1 ipiở đó pi = P(X = xi)
Ý nghĩa : E(X) là một số cho ta ý niệm về độ lớn trung bình của X Vì vậy, kì vọng E(X) còn được gọi là giá trị trung bình của X
Nh ận xét : Kì vọng của X không nhất thiết phải thuộc tập giá trị của X
(SGK 11 nâng cao, tr 88)
SGK cũng minh họa về cách tính và ý nghĩa của kì vọng bằng ví dụ sát với thực tiễn
là tính E(𝑋) từ bảng phân bố XS về số vụ vi phạm luật giao thông trên đoạn đường A vào
tối thứ bảy
• Phương sai và độ lệch chuẩn
Cũng như kì vọng, SGK cũng đưa ra định nghĩa và đó cũng chính là công thức tính phương sai V(𝑋)
Định nghĩa: Cho X là biến ngẫu nhiên rời rạc với tập giá trị {x1 , x2, … , xn} Phương sai của
X kí hiệu là V(X) là một số được tính theo công thức : V(X) = ∑ (xni=1 i − µ) 2 p i ở đó p i = P(X = x i ) (i = 1,2, … , n) và µ = E(X)
Ý nghĩa : Phương sai là một số không âm Nó cho ta ý niệm về mức độ phân tán các giá trị
c ủa X xung quanh giá trị trung bình Phương sai càng lớn thì độ phân tán càng lớn
Định nghĩa : Căn bậc hai của phương sai, kí hiệu là σ(X) được gọi là độ lệch chuẩn của X,
nghĩa là σ(X) = �V(X)
(SGK 11 nâng cao, tr 89)
Các chỉ số đặc trưng: kì vọng, phương sai và độ lệch chuẩn có ứng dụng rất lớn trong
thực tiễn Thể chế cũng yêu cầu người học không những biết cách tính mà còn phải hiểu được ý nghĩa của chúng SGK chỉ đưa ra ý nghĩa chung nhất về mặt toán học, nhưng để có
thể làm rõ bản chất, ý nghĩa thực tiễn của các khái niệm này đòi hỏi nhiều ví dụ thuộc nhiều
Trang 39lĩnh vực khác nhau, đặc biệt là những lĩnh vực đang được quan tâm (mang tính thời sự)
nhằm tạo hứng thú học tập cho HS, và giúp người học cập nhật và phân tích các số liệu chứa đựng trong đó
Phần này SGK chỉ nêu 1 ví dụ nhằm hướng dẫn HS tính theo công thức Phần mối liên hệ với các chỉ số đặc trưng chỉ được giới thiệu trong phần đọc thêm, cũng không có thêm một hoạt động hay bài tập nào nói về mối liên hệ này
Việc tính các chỉ số đặc trưng bằng công thức sẽ khiến người học gặp nhiều khó khăn
và rất mất thời gian bởi công thức khá cồng kềnh và phải lập bảng phân bố XS Trên thực
tế, ta chỉ quan tâm tới một vài chỉ số đặc trưng nào đó và trong thực hành TK thường sử
dụng các mô hình phân bố để tính các chỉ số đặc trưng đó mà rất ít khi phải lập bảng phân
bố XS hoàn chỉnh Tuy nhiên, lại không có bất cứ mô hình phân bố nào được nhắc tới trong SGK
Liên h ệ với thống kê mô tả :
Theo nghiên cứu của tác giả Võ Mai Như Hạnh (2012), chương TK lớp 10 ban nâng cao đã cung cấp tương đối đầy đủ các yếu tố cơ bản của TK để nghiên cứu một mẫu số liệu Tuy nhiên, các tổ chức giúp nhận thấy tính thay đổi của các kết quả thu được từ các mẫu số
liệu khác nhau của cùng một tổng thể dữ liệu, từ đó có ý thức về nguy cơ thiếu chính xác từ
mẫu đã không tồn tại Ngay từ bài đầu tiên của chương TK, SGK 10 nâng cao, đã đưa ra khái niệm điều tra toàn bộ và điều tra mẫu :
Nếu thực hiện điều tra trên mọi đơn vị điều tra thì đó là điều tra toàn bộ Nếu chỉ điều tra trên m ẫu thì đó là điều tra mẫu
… Người điều tra phải kiểm định chất lượng các hộp sữa của một nhà máy chế biến sữa bằng cách mở hộp sữa để kiểm tra Có thể điều tra toàn bộ hay không ?
… Điều tra toàn bộ đôi khi không khả thi vì số lượng điều tra quá lớn hoặc vì muốn điều tra thì
ph ải phá hủy đơn vị điều tra Chúng ta thường chỉ điều tra mẫu và phân tích xử lí mẫu số
li ệu thu được (SGK 10 nâng cao, tr 160)
Nhiệm vụ của người điều tra phải làm là từ những số liệu thu được trên mẫu rút ra
những kết luận về tổng thể Để làm được điều này cần thiết phải có sự hỗ trợ của các kiến
thức của lý thuyết XS Thế nhưng, trong tất cả các bài tập của chương XS chúng tôi không tìm thấy một yêu cầu nào giải quyết những vấn đề còn tồn tại của TK mô tả là suy luận từ
mẫu tới tổng thể
Trang 40Về mối liên hệ giữa bảng phân bố XS với bảng phân bố tần suất ; kì vọng, phương sai, độ lệch chuẩn của biến ngẫu nhiên với số trung bình, phương sai, độ lệch chuẩn của
mẫu số liệu được SGK cũng giới thiệu trong phần đọc thêm :
Xét d ấu hiệu 𝑋 với tập giá trị hữu hạn {𝑥1 , 𝑥 2 , … , 𝑥 𝑛} Giả sử trên một mẫu điều tra kích
thước 𝑝 về dấu hiệu 𝑋, ta thấy có 𝑛𝑖 s ố liệu có giá trị 𝑥𝑖 (𝑖 = 1, 2, … , 𝑛), tức là giá trị 𝑥𝑖 có
t ần số 𝑛𝑖 T ần suất của giá trị 𝑥𝑖 là 𝑓𝑖 =𝑛𝑖
Chúng ta đã biết rằng tần suất 𝑓𝑖 là giá tr ị gần đúng của XS 𝑝𝑖 Do đó bảng phân bố tần
su ất của mẫu số liệu cho ta một “hình ảnh” gần đúng về bảng phân bố XS của 𝑋
Vì 𝑓 ≈ 𝑝 𝑖 nên 𝑥̅ = ∑𝑛𝑖=1 𝑥 𝑖 𝑓 𝑖 ≈ ∑𝑛𝑖=1 𝑥 𝑖 𝑝 𝑖 = 𝐸(𝑋)
Như vậy, số trung bình của mẫu số liệu là giá trị gần đúng của kì vọng của 𝑋
Tương tự, phương sai của mẫu số liệu là
𝑠 2 =∑𝑛𝑖=1𝑛𝑖𝑝(𝑥 − 𝑥̅)2= �(𝑥 − 𝑥̅) 2 𝑓𝑖
𝑛 𝑖=1
≈ �(𝑥 − 𝜇) 2 𝑝𝑖
𝑛 𝑖=1
Tuy nhiên, trong cùng một đơn vị điều tra, tần suất cũng như các chỉ số đặc trưng có
thể bị biến đổi khi thay đổi các đơn vị điều tra hay cỡ mẫu Theo nghiên cứu của tác giả Võ Mai Như Hạnh (2012), trong chương TK ở lớp 10 không xuất hiện kiểu nhiệm vụ nào cho
thấy sự biến động của tần suất Mối quan hệ giữa XS – TK xuất hiện trong chương trình là định nghĩa TK của XS được đưa ra trong SGK 11 nâng cao :