Biến cố a Định nghĩa: Các kết quả của một phép thử là ngầu nhiên, không thể xác định trước.. Các loại biên cóa Bién còi không thể: Một biến cô không bao giờ xảy ra khi thực hiện một phép
Trang 1TRƯỜNG ĐẠI HỌC s ư PHẠM KHOA ĐÀO TẠO GIÁO VIÊN MẨM NON
Nguyễn Thị Tuyết Mai
ĐÊ CƯƠNG BÀI GIẢNG
THỐNG KÊ
DÙNG CHO SINH VIÊN CHUYÊN NGÀNH GIÁO DỤC MẦM n o n
TRÌNH ĐÔ ĐAI HỌC
Thái Nguyên - 2011
Trang 3Chương 4 Trình bày số liệu thống kê
Chương 5 Các tham số giá trị trung tâm
5.3 Tham số biểu thị hình dáng của phân phối thống kê 75
Trang 4LỜI NÓI ĐẦU
Nhiệm vụ của người giáo viên mầm non là chăm sóc, nuôi dưỡng và giáo dục trỏ Vì vậy, người giáo viên mầm non không những cần phải nắm vững những kiến thức khoa học cơ bản, khoa học giáo dục, phương pháp chăm sóc, nuôi dưỡng và giáo dục trẻ mà còn phải có kỹ năng và ứng dụng những kiên thức
đã học vào việc giáo dục trẻ Hơn nữa, thực tế giáo dục mầm non đòi hỏi người giáo viên mầm non còn phải biết nghiên cứu, tìm tòi, sáng tạo để nâng cao vốn kiến thức, kinh nghiệm cho bản thân và hiệu quả của công tác chăm sóc, giáo dục trẻ Muốn thực hiện được việc nghiên cứu này người giáo viên mầm non cần
có kiến thức, kỹ năng nghiên cuus, phân tích và tổng hợp Học phần thống kê nhằm cung cấp cho sinh viên những kiến thức và kỹ năng này
Giáo dục mầm non nói chung và sự nghiệp đào tạo giáo viên mầm non nói riêng đang trên con đường xây dựng và phát triển Vì vậy tài liệu học tập còn rất thiếu thốn Để giúp cho sinh viên có được một tài liệu học tập, được sự phê duyệt cùa Ban Giám hiệu trường Đại học Sư phạm Đại học Thái Nguyên tôi đã biên soạn đề cương bài giảng Thống kê cho sinh viên chuyên ngành Mầm non, hệ đại học Đẻ cương bài giảng Thống kê gồm 2 nội dung chính:
Nội dung thứ nhất là một số kiến thức cơ bản về xác suất Nội dung này được trình bày trong chương 1 với mục đích cung cấp cho sinh viên nhữn'T kiến thức cơ bản về xác suất phục vụ cho công việc giải các bài toán thống kê
Nội dung thứ nhất là những vấn đề cơ bản vầ thống kê Nội durẦg này được trình bày trong bốn chương còn lại nhằm cung cấp cho sinh viên những khái niệm cơ bản về thống kê, các công thức cơ bản và cách thức tiến hành nghiên cứu, xử lý, phân tích và trình bày tài liệu thống kê
Tác giả mong nhận được những góp ý của các bạn đồng nghiệp và độc giả
vé nội dung cũng như việc trình bày để đề cương bài giảng này được hoàn thiện hơn
3
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 5“ c ầ n nhớ rằng môn khoa học bắt đầu từ việc xem xét các trò choi may rủi lại hứa hẹn trở thành đối tượng quan trọng nhất của tri thức luài người Phẩn lớn những vấn đê quan trọng nhất của đời sống thực ra chỉ
là những bài toán của xác x u ấ t”, p s Laplace (1812)
Chương 1: BIẾN c ố NGAU n h i ê n
b) Ví dụ: *) Gieo đồng tiền xu (Việt nam) có hai khả năng xảy ra:
Xuất hiện mặt quốc huy,
- Xuất hiện mặt số
*) Gieo con xúc sắc có sáu khả nãng xảy ra:
Xuất hiện mặt 1 chấm,Xuất hiện mặt 2 chấm,
- Xuất hiện mặt 6 chấm
1.1.2 Biến cố
a) Định nghĩa: Các kết quả của một phép thử là ngầu nhiên, không thể xác định
trước Mỗi kết quả của một phép thử được gọi là một biến cố (sơ cấp), kí hiệu (ú.
Ta có thể liệt kê ra tất cả các kết quả của một phép thử (như ví dụ) Tập hợp tất cả các kết quả có thể có của một phép thử được gọi là không gian mẫu, ký hiệu Q
b) Ví dụ: Không gian mẫu của phép thử gieo con xúc sắc là:
Q = {xuất hiện mặt một chấm, xuất hiện mặt hai chấm xuất hiện mặtsáu chấm )
Trang 61ỂI.3 Các loại biên có
a) Bién còi không thể: Một biến cô không bao giờ xảy ra khi thực hiện một phép thử được gọi là biến cố không thể (biến cố trống, biến cố rỗng), kí hiệu: 0
*) Vi dụ: Khi thực hiện phép thử gieo con xúc sắc, biến cố “Xuất hiện mật bẩy
chấm" là biến cố không thể
b) Biên cô chắc chán: Một biến cố luôn luôn xảy ra khi thực hiện một phép thử được gọi là biến cố chắc chắn Biến cố chắc chắn tương đương với toàn bộ không gian mẫu
*) Ví dụ: +) Khi thực hiện phép thử gieo con xúc sắc, biến cố “Xuất hiện một
trong các mặt một chấm, hai c h ấ m , s á u chấm” là một biến cố chắc chắn.+ ) Khi thực hiện phép thử gieo đồng xu, biến cố “Xuất hiện mặt quốc huy hoặc mặt số” là một biến cố chắc chắn
c) Biến cô có thẻ: Một biến cố có thể xảy ra khi thực hiện một phép thử được gọi là hiến cố có thể
*) \ 7 dụ: Khi thực hiện phép thử gieo con xúc sắc, biến cố “Xuất hiện mặt bốn
chấm” là một biến cố có thể
1.1.4 Quan hệ giữa các biến cố.
a) Kéo theo: Biến cố A được gọi là kéo theo biến cố B nếu khi A xảy ra thì B
cũng xáy ra, kí hiệu: A <z B
*) Ví dụ: Khi thực hiện phép thử gieo đồng xu, nếu A là biến cố : “ Không xuất hiện mặt quốc huy”, B là biến cố : “ Xuất hiện mặt số” thì A cz B
b) Biến cỏ đối: Một biến cố được gọi là biến cố đối cùa biến cố A nếu nó xảy ra
khi ă\ không xảy ra, kí hiệu A
*) Vi dụ: + ) Khi thực hiện phép thử gieo đồng xu, biến cô' “Xuất hiện mặt quốc
huy” là biến cố đối của biến cố “Xuất hiện mặt số”
+ ) Khi thực hiện phép thử gieo con xúc sắc, biến cố “Xuất hiện mật bốn chấm” có biến cố đối là biến cố “Xuất hiện một trong các mặt một chấm, hai chấm, ba chấm, năm chấm, sáu chấm”
* ) Nhận xét: A = Q \ A , A = A
5
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 7c) Hai biến cỏ xung khắc: Hai biến cô A và B được gọi là hai biên cố xung khãc nếu A và B không đồng thời xảy ra khi thực hiện một phép thử.
*) Ví dụ: +) Khi thực hiện phép thử gieo đồng xu, biến cố “xuất hiện mặt quoc huy” và biến cô “xuất hiện mặt số” là hai biến cố xung khắc
+) Khi thực hiện phép thử gieo con xúc sắc, biến cố “Xuất hiện mặt bốn chấm” và biến cố “Xuất hiện mặt một chấm” là hai biến cố xung khắc
*) Nhận xét: Hai biến cố đối là hai biến cố xung khắc nhưng 2 biến cố xung khắc
chưa chắc là hai biến cô đối
d) Hai biến cố độc lập: Hai biến cố A, B được gọi là độc lập với nhau nêu việc xảy ra hay không xảy ra biến cố này không làm ảnh hưởng đến việc xảy ra haỵ không xảy ra biến cố kia
e) Hợp của các biến cố: Cho hai biến cố A, B Một biến cố xảy ra nếu ít nhất một trong hai biến cố A, B xảy ra được gọi là hợp của hai biến cố A, B Kí hiệu
A k j B
g) Giao của các biến cố: Cho hai biến cố A, B Một biến cố xảy ra nếu cả hai
biến cố A, B đều xảy ra được gọi là giao của hai biến cố A, B Kí hiệu A B Chú ý: Khái niệm hợp, giao của các biến cố có thể mở rộng một cách tự nhiên
cho trường hợp nhiều biến cố
l Ếl ẻ5 Ví dụ: Ba xạ thủ X, Y, z inỗi xạ thủ nhằm bắn một viên đạn vào mục tiêu Giả sù A, B, c tương ứng là các biến cố: Xạ thủ X bắn trúng, xạ thủ Y bắn trúng,
xạ thủ z bắn trúng
a) Hãy mô tả các biến cố: A B C , A B C , A kj B< j C.
b) Hãy biểu diễn các biến cố sau theo các biến cố A, B, c
a) ABC là biến cố: Cả 3 xạ thủ X, Y, z đều bắn trúng
A B C là biến cố: Cả 3 xạ thủ đều bắn trượt.
Trang 81.2ếl Xác suất của một biến cố
Xác suất cúa một biến cố là một số nằm giữa 0 và 1, số này đo lường khả nãng xuất hiện của biến cố đó khi phép thử được thực hiện Xác suất của biến cố
A được ký hiệu là P(A)
Có 2 phương pháp cơ bản gán xác suất cho các biến cố đó là: định nghĩa xác suất cổ điển, định nghĩa xác suất dựa trên tần xuất,
a) Định nghĩa xác suất cổ điển
Giả sử phép thử có một số hữu hạn các kết quả có thể Hơn nữa giả thiếtrằng các kết quả này có đồng khả năng xuất hiện Khi đó xác suất của biến cố A được định nghĩa ỉà tý số giữa số các kết quả thuận lợi và số các kết quả có thể cùa biến cố A
Kí hiệu: |/4 |;|n | tương ứng là số các kết quả thuận lợi của biến cố A và số các kết
quá có thể khi thực hiện phép thử Khi đó, theo định nghĩa ta có P ( A ) = I I
p ị
*) Nhận xét: +) Trong trường hợp này việc tính xác suất của một biến cố A được
đưa về việc đếm số các kết quả thuận lợi và số các kết quả có thể của biến cô' A
Đê việc đếm này được thực hiện một cách nhanh chóng và chính xác ta cần một
số kiến thức về giải tích tổ hợp :
Pn = 1.2.3 «, 4 =7J ï L c ỉ = - nì
{ n - k ) \ k \ { n - k ) \
+ ) Định nghĩa xác suất cổ điển này dựa trên 2 giả thiết quan trọng:
i) Sô các kết quả có thể là hữu hạn
ii) Các kết quả có thế là đồng khả năng xuất hiện
7
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 9Các giá thiết này thường được thỏa mãn khi chúng ta tính toán xác suất trong các trò chơi may rủi (gieo xúc sắc, gieo đồng xu, xố số, .), hoặc khi việc lựa chọn là vô tư, khách quan, không thiên vị.
*) Ví dụ 1: Gieo đồng thời 3 con xúc sắc được chế tạo cân đối đồng chất Tính
xác suất để tổng số chấm xuất hiện trên 3 con xúc sắc là 9
-Gọi A là biến cố “ tổng số chấm xuất hiện trên 3 con xúc sắc là 9”
Mỗi kết quả của một phép thử (một lần gieo đồng thời 3 con xúc sắc) là một bộ
ba (a,b,c), trong đó 1 < a \b \c < 6 Vậy không gian mẫu của phép thử là:
Q = ị(a;b;c);ỉ < a \b \c < 6} => Số các kết quả có thể là |Q| = 6 6.6 = 216.
Các bộ 3 có ĩổng là 9 là: (1; 2; 6); (1; 3; 5); (1; 4; 4); (2; 2; 5);(2; 3; 4); (3;3; 3) và các hoán vị của chúng Do vậy số các kết quả thuận lợi là tổng số các hoán vị của 6
bộ ba nêu trên \A\ = 6 + 6 + 3 + 3 + 6 + 1 = 25 Vì các con xúc sắc được chế tạo
cân đối đổng chất nên có thể cho rằng các kết quả là đồng khả năng Ịiếtụ
/>(,4) = 1 4 = -0 ,1 1 5 7
|Q| 216 b) Định nghĩa xác suất bằng tẩn suất
Nếu số các kết quả có thể là vô hạn hoặc không đổng khả nãng xuất hiện, cách tính xác suất cổ điển như trên không còn dùng được Vì vậy người ta uã đưa
ra cách tính xác suất như sau:
Giả sử phép thử có thể được thực hiện lặp đi lặp lại rất nhiều lần trong
những điều kiện giống hệt nhau Nếu trong n lần thực hiện phép thử (€ biến cố
f n{A) luôn dần tới một giới hạn xác định Giới hạn đó được gọi là xác suất của
biến cố A
Trang 10Kí hiệu: P{A) = lim f n (A).
Trẽn thực tế P{Ẩ) đươc tính xấp xỉ bởi f n(A) với n đủ lớn.
*) Ví dụ: Đê tính xác suất một người đàn ông 25 tuổi bị chết trong vòng 1 nãm
sau đó là bao nhiêu người ta theo dõi 100.000 thanh niên 25 tuổi trong vòng 1 năm Kết quả cho là có 138 người bị chết trong năm đó Vậy xác suất cần tìmxấp xi bằng — — = 0,00138
c) Nguyên lý xác suất nhỏ
*) Một biến cô không thể có xác suất bắng 0 Tuy nhiên trên thực tế biên
cò có xác suất bằng 0 vẫn có thể xảy ra trong một số lớn phép thử Qua thực nghiệm và quan sát thực tế người ta thấy rằng các biến cố có xác suất bé sẽ không xảy ra khi ta chỉ thực hiện một phép thử hay một vài phép thử Từ đó, người ta thừa nhận nguyên lý sau đây gọi là nguyên lý xác suất nhỏ:
"Nếu một biến c ố có xác suất nhỏ thì trên thực tế có thể cho rằng trong một phép thừ biến c ố đó sẽ không xảy ra ”
\ 'í dụ: Với mỗi chiếc máy bay biến cố “xảy ra tai nạn” đều có thể xảy ra vói một
xác suất rất nhó Tuy vậy trên thực tế người ta vẫn không từ chối đi máy bay vì người ta tin tưởng rầng chuyến bay mà họ đi sẽ không xảy ra tai nạn
*) Việc quy định một mức xác suất như thế nào được gọi là nhỏ sê tùy thuộc vào từng bài toán cụ thể
17 dụ: Nếu xác suất để một máy bay rơi là 0,01 thì xác suất đó chưa thể được coi
là nhỏ Nhưng nếu xác suất để một chuyên tầu khởi hành chậm là 0,01 thì lại có thể coi mức xác suất này là nhỏ
*) Mức xác suất nhỏ được gọi là mức ý nghĩa Nếu a là mức ý nghĩa thì
ß = 1 - a được gọi là độ tin cậy Dựa trên nguyên lý xác suất nhỏ ta tuyên bố rằng: Biến cố A có xác suất nhỏ (tức P( A) < a ) sẽ không xảy ra trên thực tế Độ tin cậy cúa biến cố này là ß Tính đúng đắn của tuyên bố này chỉ xảy ra trong
Tương tự như trên ta có thể đưa ra nguyên lý xác suất lớn Nếu biến cố A
Trang 11có xác suất gần bằng 1 thì trên thực tê có thể cho rằng biên cô A sẽ xảy ra trong một phép thử Cũng như ở trên, việc quy định một mức xác suất như thế nào được gọi ià lớn sẽ tùy thuộc vào từng bài toán cụ thể.
Chú ý: Ngoài hai định nghĩa trên còn có nhiều cách định nghĩa xác suất khác như định nghĩa xác suất theo tiên đề [6], định nghĩa xác suất hình học [5], định nghĩa xác suất theo lý thuyết độ đo [1],
1.2.2 Các quy tắc tính xác suất
a) Quy tắc cộng xác suất
Nếu A và B là hai biến cố xung khắc thì: P( A u B) = P( A) + P { B )
Tổng quát: N ế u A ], A2, -,An là các biến cố đôi một xung khắc thì:
P( ẨÌ U A2U U A „ ) = P ( A Ì) + P( A 2) + P(A„)
b) Quy tác cộng xác suất tổng quát
Nếu A và B là hai biến cố bất kỳ (không nhất thiết xung khắc) thì:
c) Quy tắc chuyển sang biến cô' đối
Trong nhiều bài toán việc tìm xác suất của biến cố A khó hơn nhiều so với
việc tính xác suất của biến cố đối A của A Khi đó ta sẽ tính P ( A ) rồi tìm P(A) nhờ quạn hệ sau: P{ A) - 1 - P ( A ).
*) Ví dụ: Trong một vùng dân cư, tỷ lệ người mắc bệnh tim là 99c, mắc bệnh
huyết áp là 12%, mắc cả hai bệnh tim và huyết áp là 7% Chọn ngẫu nhiên môt người trong vùng đó Tính xác suất để người đó không mắc cá bệnh tim và bệnh huyết áp
Trang 12G i ái:
/ĩ
Gọi A là biến cố “ Người được chọn mắc bệnh tim”, B là biến cô' “ Người được chọn mắc bệnh huyết áp’
Ị y Theo giả thiết ta có: P( A) = 0,09; P{B) = 0,12; P( AB) = 0,07.
Gọi H là biến cố “ Người được chọn không mắc cả bệnh tim và bệnh huyết
áp” Khi đó H = Ẩ U B Theo quy tắc cộng xác suất tổng quát ta có:
p ( H ) = P( A u B) = P{A) + P( B) - P( AB) = 0 ,09 + 0,12 - 0,07 - 0,14.
V Theo quy tắc chuyển sang biến cố đối P { H) - 1 - P { H ) = 1 - 0 ,1 4 = 0,86.
d) Quy tác nhân xác suất
^NỊếiuẠ, B là hai biến cố độc lập thì P ( A B ) = P(A) P(B).
*) Ví dụ: Ba xạ thủ X, Y, z độc lập với nhau cùng nhằm bắn vào mục tiêu Xác
suất bắn trúng của các xạ thủ X, Y, z tương ứng là: 0,4; 0,5; 0,7
i) Tính xác suất của biến cố “ Chỉ có duy nhất một xạ thủ bắn trúng”ii) Tính xác suất của biến cố “ Có ít nhất một xạ thủ bắn trúng”
Trang 13= 0,4 + 0,5 + 0,7 - 0,4.0,5 - 0 ,5 0 ,7 - 0,4.0,7 + o, 4.0,5.0,7 = 0,91 Cách khác: ta có thể tìm P(D) bằng cách chuyển sang biến cỏ đối:
D = A B C => p (D ) = P (Ã ).P (B ).P {C ) = 0,6.0,5.0,3 = 0,09
=>P( D) = l - P ( Õ ) = 1 - 0 ,0 9 = 0,91.
1.3 Phép thử lặp - Công thức Becnuli
1.3.1 Phép thử lặp
Xét một phép thử và một biến cố A liên quan tới phép thứ đó Xác suất
Ị xuất hiện biến cố A là p Ta thực hiện phép thử n lần độc lập Bài toán đặt ra
^ là tính xác suất để trong n lần thực hiện phép thử biến cố A xuất hiện đúng k
trong đó biến cố A xuất hiện k lần, biến cố A xuất hiện (n - k) lần Do tính độc
lập của phép thử lặp, mỗi biến cố như vậy có xác suất là:
P (A ).P (A ) P (Ã ) P (A ) P (A ) = p k ( 1 - p ) ”~k
Dễ thấy H k là hợp của c ị biến cố có dạng (*) => P { H k ) = c „ p k (1 - p)"~k
Trang 14Vậy ta có công thức Becnuli sau đây:
1.3.2 Định lý: Ký hiệu Pfr(n;p) là xác suất để trong một dãy n phép thử độc
lập biên cố A xuất hiện k lần Ta có: Pk ( n \ p ) = c * p k ( 1 - p ) " k trong đó
P = P(A).
1.3.3ễ Ví dụ: Xác suất thành công của một thí nghiệm sinh hóa là 40% Một nhóm gồm 9 sinh viên tiến hành cùng một thí nghiệm trên độc lập với nhau Tìm xác suất để:
b) Gọi c là biến cố “Có ít nhất một trong 9 thí nghiệm thành công” => c là biến
cố “Không có thí nghiệm nào thành công”
Theo công thức Becnuli:
=> P( C) = 1 - P( C) = 1- 0,0101 * 0,9899.
c) Gọi D là biến cố “Có ít nhất 8 trong 9 thí nghiệm thành công” =í> D là hợp cứa 2 biên cố : Có 8 thí nghiệm thành công, có 9 thí nghiệm thành công Theo công thức Becnuli:
Trang 151.4 Xác suất có điểu kiện - Quy tác nhân tổng quát
1.4Ể1 Xác suất có diều kiện
a) Định nghĩa: Giả sử A, B là hai biến cố Xác xuất của B được tính trong điều kiện A đã xảy ra được gọi là xác suất của B với điều kiện A Kí hiệu: ■
b) Ví dụ: Trong một vùng dân cư có a người gồm n đàn ông và m phụ nữ (a = m + n ) Trong n đàn ông có p người bị cận thị và trong m phụ nữ có q người
bị cận thị Chọn ngẫu nhiên một người trong vùng đó Tính xác suất để người được chọn bị cận thị nếu biết rằng đó là một phụ nữ
Giải: Gọi B là biến cố: “Người được chọn bị cận thị” A là biến cố: “Người được
*) Tổng quát: Cho A, B là hai biến cô' bất kỳ, P(A) * 0 Khi đó xác suất có điểu
*) Chú ý: +) Nếu P(Ẩ) = 0 thì xác suất vẫn tổn tại nhưng ta không thểtính dược theo công thức trên
+) Xác suất có điều kiện có thể tính được một cách trực tiếp từ bốicảnh của bài toán mà không cần qua công thức trên
*) Ví dụ: Gieo đồng thời 2 con xúc sắc được chế tạo cân đối đồng chất Tính xác
suất để tổng số chấm xuất hiện trên 2 con xúc sắc không nhỏ hơn 10, biết rằng ít nhất một trong 2 con có 5 chấm
Trang 16Giải: Gọi A là biến cố “ ít nhất một trong 2 con xúc sắc xuất hiện 5 chấm”, B là
hiến cố "Tổng sô' chấm xuất hiện trên 2 con xúc sắc không nhỏ hơn 10” Theo
A là biến cố cả hai con xúc sắc đều không xuất hiện 5 chấm Xác suất để
môt con xúc sắc không xuất hiên 5 chấm là —
6
Không gian mẫu gồm 6 x 6 = 36 kết quả đồng khả năng trong đó có 3 kết quả thuận lợi cho biến cố A là: (5;6); (6;5); (5;5)
36 \ / A ) P(A) P(A) 1 1 /, % 11n
1.4ệ2 Quy tác nhân tổng quát
Cho A, B là hai biến cố bất kỳ, theo công thức ( 1 ) ta có:
P(AB) = P(A).P(B/ ' ) Tổng quát: Với n biến cổ bất kỳ Ẩị, A2, , An ta có:
n A , ^ ) = p ( A í m y Ai) P Ớ / A iA ỉ) p ( y Aí AJ
*) Ví dụ: Một anh thủ kho có một chùm 9 chiếc chìa khóa trong đó chỉ có 2
chiếc mò được cứa kho Một người tiến hành thử mở cửa kho bằng chùm chìa khóa đó Lần lượt thử từng chiếc chìa khóa một, chìa nào không mở được thì bỏ
ra Tính xác suất để người đó mở được cửa ở lần thử thứ ba
Trang 17+) P ị là xác suất của biến cô “Người đó không mở được cửa ở lần thử thứ 2
a) Định nghĩa: Các biến cố của một phép thử được gọi là một hệ
đầy đủ các biến cố nếu chúng đôi một xung khắc (Bt r \ B j = 0; v/,y = 1,
và hợp của chúng là một biến cố chắc chắn (B ị B 2u u B n = Q )
*) Ví dụ: Gieo một con xúc sắc Gọi Bị(i = 1, ,6) là biến cố: " Xuất hiện mật i chấm” Các Bị đôi một xung khắc và hợp của chúng là một biến cố chắc chắn
Do đó B ị, B2, B6 tạo thành một hệ đầy đủ các biến cố
b) Công thức xác suất đầy đủ
*) Định lý: Nếu là một hệ đầy đủ các biến cố thì đối với mỗi biến
*) Ví dụ: Có 2 chuồng thỏ: Chuồng thứ nhất có 3 thỏ trắng và 3 thỏ nâu, chuồng
thứ hai có 6 thỏ trắng và 4 thỏ nâu Bắt ngẫu nhiên 4 con thỏ ớ chuồng thứ nhất
bỏ vào chuồng thứ hai, sau đó bắt ngẫu nhiên 1 con thó ở chuồng thứ hai ra Tính
n
cố A ta có: P( A) = ỵ P ( B ' ) P ( % )
;=1
Trang 18xác xuất để con tho bắt ra là thỏ nâu.
n A / , 5 , v < / P( AB2) _ 6 a / 7
v V P(B, ) 14 / « 2 P ( 8 2) 14 y V />(Bj) 14Theo công thức xác suất đầy đủ:
b) Chú ý: +) Các xác suất P (5ị ) , P( B2), ,P (B n) được gọi là các xác suất tiên
nghiệm (trước thí nghiệm) Sau khi quan sát rằng biến cố A đã xảy ra, các xác
suất cùa Bị được tính trên thông tin này (tức các xác suất có điều kiện
P ( ^ y ^ ) ụ được gọi là các xác suất hậu nghiệm VI vậy công thứcBayet còn được gọi là công thức xác suất hậu nghiệm
17
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 19+) Công thức Bayet có rất nhiều ứng dụng, đặc biệt là trong nghiên cứu \ã hội học và trong y học.
1.6 Biến ngẫu nhiên
Tính toán bằng số vốn đã quen thuộc và dễ sử dụng trong ứng dụng, nhất
là có sự hõ trợ của máy tính Khi nghiên cứu các sự kiện ngẫu nhiên, rất bất tiện khi mô tả và làm tính với các sự kiện Khái niệm biến sô (đại lượng biến thiên)
đã rất thông dụng trong toán học Chính vì thế ta tìm cách đưa vào khái niệm
biến s ố ngẫu nhiên như là một đại lượng phụ thuộc vào kết quả của một phép thử
ngấu nhiên nào đó
Về mặt hình thức, có thể định nghĩa biến ngẫu nhiên như là một hàm có giá trị thực xác định trên không gian các biến cố sơ cấp (sao cho nghịch ảnh của một khoảng số là một biến cố) Căn cứ vào tập giá trị của của bién ngẫu nhiên, người ta chia các biến ngẫu nhiên thành hai loại: Biến ngẫu nhiên rời rạc, biến ngẫu nhiên liên tục Trong chương trình nay ta chỉ nghiên cứu biến ngẫu nhiên rời rạc và từ nay về sau ta chỉ gọi đơn giản là biến ngẫu nhiên
a) Định nghĩa: Hàm X xác định trên không gian các biến cố sơ cấp Q vu nhận các giá trị X ị , X 2 , - - ; X n , trong tập số thực K được gọi là biến ngẫu nhiên rời
rạc nếu tập [<y I X( ũ ỉ ) = JC/J;/ề = 1,2, là biến cố ngẫu nhiên.
^ Các biến ngẫu nhiên thường được ký hiệu bằng các chữ: X, Y, giá trị
của nó thường được ký hiệu bằng các chữ cái nhỏ xn y ị,
b) Ví dụ: +) Gọi X là số con trai trong một lần sinh (một con) Khi đó X là biến ngẫu nhiên, giá trị nó có thể nhận là 0, 1
+) Gọi X là số viên đạn trúng đích khi bắn n viên đạn vào mục tiêu thì X là biến ngẫu nhiên, giá trị nó có thể nhận là 0, 1, 2,
+) Gọi X là số chấm xuất hiện khi gieo một con xúc sắc cân đối, đổno chất thì X là biến ngẫu nhiên, giá trị nó có thể nhận là 1, 2, ,6
Trang 201.6.2 Bàng phàn phối xác suất của biến ngảu nhiên
a) Định nghĩa: Ta gọi dẫy P Ỵ ỵ = *,] = P ị,i -1 ,2 , là phàn phối xác suất của
bicn ngẫu nhiên X
Bảng phân phối xác suất của biến ngẫu nhiên X là:
Không gian mẫu của phép thử gieo con xúc sắc là : Q = {l, 2 ,3 ,4 ,5 ,6 }
Vì các biến cô' trên đồng khả năng xuất hiện nên bảng phân phối xác suất của X
i(2) Gọi X là số mặt số xuất hiện khi gieo đồng thời 2 đồng tiền cân đối đồng chất Lập bảng phân phối xác suất của X
Trước hết X có thể nhận 3 giá trị: 0, 1,2 Bây giờ ta phải tìm các xác suất
p [ x = 0] , p [ x = ì ] p [ x = 2],
Không gian mẫu của phép thử gieo 2 đồng xu là : Q = { S S , S N , x s , x x }
trong đó s ký hiệu xuất hiện mặt quốc huy, N ký hiệu xuất hiện mặt số Vì các hiến cổ trên đổng khả nãng xuất hiện nên:
p[ss] = />[ A'.Y] = - :/>[£V] = />[.vs] = i.
Vậy bảng phân phối xác suất của X là
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 21ra Lập bảng phân phối xác suất của X.
X có thể nhận 6 giá trị: 0, 1, 2, 3, 4, 5 Phân phôi xác suất của X là
Phân p lối trong ví dụ này được gọi là phân phổi siêu bội.
1.6.3 Hàm phán phối của biến ngẫu nhiên
a) Định nghĩa: Nếu ta sắp xếp các giá trị của X theo thứ tự tăng dần, tức là
Xị < x2 < < x n < thì hàm số F( x ) xác định như sau được gọi là hàm phân
phối của biến ngẫu nhiên X
Trang 22Viết hàm phàn phối cùa X.
1.6.4 Kì vọng của biến ngảu nhiên
a) Định nghĩa: Bảng phân phối xác suất của biến ngẫu nhiên X là:
Trang 23Nếu ta tiến hành đo một cách độc lập n lần đại lượng ngẫu nhiên X với kêt
quả là X ị , X2, - - ; X n với một sô' giả thiết nhất định thì Xị + x~) + + X n xấp xỉ bằng E X với n đủ lớn.
1.6.5 Phương sai của biến ngẫu nhiên
a) Định nghĩa: Đại lượng E ( X - E X)2 được gọi là phương sai cúa biến ngảu
nhiên X và ký hiệu D X = E ( X — E X Ÿ
b) Một sô tính chất của phương sai
Từ tính chất của kì vọng ta dễ dàng suy ra các tính chất sau của phương sai:
C)Ý nghĩa của phương sai
Phương sai dùng để đo mức độ phân tán của các giá trị của X so với vị trí
kì vọng EX của nó v ề toán học, phương sai DX là độ lệch bình phương trung bình giữa các X so với kì vọng EX
d)Vế dụ: Cho bảng phân phối xác xuất của X là:
Trang 24Tính kì vọng và phương sai của X.
-l ẽ6ẽ6 Độ -lệch chuẩn của biến ngẫu nhiên
a) Định nghĩa: Đại lượng ơ ( X ) = \JD X được gọi là độ lệch chuẩn của biến
a) 3 sinh viên cùng vào một quán
b) 2 sinh viên vào cùng 1 quán còn người kia vào quán khác
2 Có 5 mảnh bìa được đánh số từ 1 đến 5 Chọn ngẫu nhiên liên tiếp 3 mảnh và
xep thành một sô’ có 3 chữ số Tìm xác suất để số đó là sô' chẩn
3 Gieo đồng thời 2 con xúc sắc cân đối, đồng chất Tim các xác suất để:
a) Tổng số chấm xuất hiện bằng 5
b) Hiệu số chấm xuất hiện có trị tuyệt đối bằng 3
4 Gieo đồng thời 3 con xúc sắc cân đối, đồng chất Tìm các xác suất để tổng sô' chấm xuất hiện của 3 con bằng 10
5.Khoa ĐTGV Mầm non cần tuyển 2 giáo viên Có 6 người dự thi tuyển trong đó
có 4 nam và 2 nữ Giả sử khả năng trúng tuyển của cả 6 người là như nhau Hãy tính xác suất để:
a) Cá hai người trúng tuyển đều là nam
b) Có ít nhất một người nam trúng tuyển
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 256 Trong một hộp bi có 6 viên đỏ và 4 viên trắng cùng cỡ Lấy ngẫu nhiên ra 2 viên bi Tính xác suất để:
a Cả hai viên bi đều là bi đỏ
b ít nhất một viên bi mầu đỏ
c Viên thứ hai mầu đỏ
7.Trong một lớp có 50 sinh viên trong đó có 3 bạn trùng tên Huyền Tìm xác suâl
để không có 2 bạn Huyền nào ngồi cạnh nhau
8.Có 2 túi đựng các quả cầu Túi thứ nhất chứa 3 quả trắng, 7 quả đỏ và 15 quá xanh Túi thứ hai chứa 10 quả trắng, 6 quả đó và 9 quả xanh Từ mỗi túi ta chọn ngẫu nhiên 1 quả cầu Tim xác suất để 2 quả cầu được chọn có có cùng mầu
9 Hai đấu thủ a, b thi đấu cờ Xác suất thắng của a trong một ván là 0,6 (không
có hoà) Trận đấu bao gồm 5 ván, người nào thắng sô' ván lớn hơn là người tháng cuộc Tính xác suất để b là người thắng cuộc
10 Gọi X là biến ngẫu nhiên chỉ số con trai trong một gia đình có 2 con (mỗi lần sinh một con)
a) Lập bảng phân phối xác suất của X
b) Viết hàm phân phối F(x)
c) Tính xác suất p [ 0 < X < 1,5]
Biết rằng xác suất sinh con trai bằng 0,51
11 Tìm hàm phân phối của các biến ngẫu nhiên trong 3 ví dụ mục 1.6.2
Trang 27Thu thập, lưu trữ và c h ế biến thông tin là một năng ¡ực đặc biệt của con người Đ ã từ lâu, thống kê được giao nhiệm vụ thu thập và lưu trữ dữ liệu, sô liệu
Từ nhiều th ế kỷ nay, thống kê là một bộ môn quan trọng của kinh kế Ngày nay, khi máy tính điện tử xuất hiện và phát triển, việc lưu trữ thông tin dễ dàng, được
tổ chức khoa học và hiệu quả hơn rất nhiều Tuy vậy, thống kê ứng dụng vẫn còn nguyên giá trị của nó: Thu thập s ố liệu và những c h ế biến, tính toán ban đầu từ những sô'liệu thu thập được.
Thông kẽ là một lĩnh vực rộng tới mức khó có thể đưa ra định nghĩa chung
Ta có thể tóm tắt thống kê như là một khoa học về phân tích dữ liệu (bao gồm cả thu thập và xử lý) nhằm thu thập thông tin chân thực về đối tượng nghiên cứu với một độ tin cậy nhất định và rút ra những kết luận hợp lý Những quyết định thống
kê có ứng dụng to lớn như: dự báo, chuẩn đoán, điều khiển ngẫu nhiên, kiểm tra chất lượng sản phẩm, thăm dò dư lu ậ n ,
Cần lưu ỷ rằng các vấn đề thống kê xuất hiện nếu có hai điều kiện:
Có nhiều tình huống cẩn phải lựa chọn.
Cố các thông tin về tình huống thông qua dữ liệu thống ké.
Chúng ta tập trung chủ yếu vào việc nghiên cứu xử lý dữ liệu mà la thường hay gọi là xử lý s ố liệu.
25
Trang 28Chương 2: CÁC KHÁI NIỆM c ơ BẢN CỦA TH Ố NG KÊ
2ếl Thống kê học
2.1.1ế Thống kẻ
Thuật ngữ thống kê có hai nghĩa:
+) Nghĩa thứ nhất: Thống kê là việc ghi chép lại một hệ thống các con sô'
đẽ phản ánh các hiện tượng của tự nhiên, xã hội, kinh tế,
Ví dụ: Việc ghi chép các số liệu về mức nước lên xuống của một dòng sông, sản lượng, năng xuất lúa của một tỉnh, chiều cao, cân nặng của trẻ mầm non, thường được gọi là thống kê
+) Nghĩa thứ hai: Thống kê là hệ thống các phương pháp thu thập, ghi
chép, phân tích, trình bày các con số để qua đó người ta biết được bản chất, quy luật của các hiện tượng và nhờ đó có thể đưa ra các kết luận, dự báo, phương pháp mới nhằm cải tạo và phát triển các hiện tượng kinh tế, tự nhiên, xã h ộ i, 2.1Ế2 Thông kẻ học
Thống kê học là khoa học nghiên cứu hệ thống các phương pháp thu thập, ghi chép và phân tích các con số (mật lượng) của những hiện tượng số lớn để tìm hiểu bản chất và những quy luật vốn có (mặt chất) của chúng trong những điều kiện địa điểm và thời gian cụ thể
2.2 Tổng thể thống kê
2.2.1 Khái niệm
Tổng thể thống kê là một khái niệm quan trọng của thống kê học, nó nói
rõ phạm vi nghiên cứu của hiện tượng đang là đối tượng nghiên cứu Từ đó giúp chúng ta xác định phạm vi điều tra tổng hợp và phân tích sô' liệu của hiện tượng tronc thời gian và địa điểm xác định
2.2.2 Các đơn vị của tổng thê
*) Trong tổng thể thống kê sẽ có các đơn vị của tổng thể
Vi dụ: Khi nghiên cứu về chiều cao của các cháu độ tuổi mẫu giáo nhỡ ờ tỉnh
Thái \ T2uyén trong năm 2009 thì tổng thể thống kê là tất cả các cháu độ tuổi
26
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 29mẫu giáo nhỡ ở tỉnh Thái Nguyên trong năm 2009 Tổng thể này có thế chia thành các đơn vị của tổng thể Nếu dựa vào địa giới hành chính thì tổng thế này
có các đơn vị là các cháu ở các huyện và thành phố
*) Tổng thể thống kê có thể được phân chia bằng nhiều phương pháp
2.3 Tiêu thức thống kê
2.3.1 Khái niệm
Nghiên cứu thống kê phải dựa vào các đơn vị của tổng thể Mỗi đơn vị của tổng thể có nhiều đặc điểm trong đó có những đặc điểm cấu thành tổng thể và những đặc điểm khác, những đặc điểm này gọi chung là tiêu thức thống kê
V í dụ: Điều tra dân số của một khu vực, chẳng hạn tỉnh Thái Nguyên thì người ta
phải điều tra các đặc điểm: độ tuổi, giới tính, trình độ văn hóa, tình trạng hôn nhân, nghề n gh iệp, đó là các tiêu thức thống kê dân sô'ủ
2.3.2 Các loại tiêu thức thống kê
Tiêu thức thống kê được chia làm hai loại:
*) Tiêu thức về số lượng: là những tiêu thức phải biểu thị bằng các con số
Ví dụ: Chiều cao, cân nặng, tuổi, trình độ vãn hóa, sản lượng lúa, doanh th u ,
*) Tiêu thức vé thuộc tính: là những tiêu thức không thể biểu thị bằng các con số
Ví dụ: Giới tính, sỏLthích, tình tran% hỏn nhân,.
2.4 Chỉ tiêu thống kê
2.4.1 Khái niệm : Chỉ tiêu thống kê phản ánhhĩrợng gắn" vói chất của các mật các chất cơ bản của hiện tượng số lớn trong những điều kiện địa điểm và thời gian cụ thể
Ví dụ: Trong lượng phải xét những đối tượng nào? trong những thời gian nào?
2.4.2 Các mặt của chỉ tiêu UỊỘng kê
Chỉ tỉêu thổng k ể co 2 mặt: $fật khái niệm và mặt mức độ.
Tổng thể bộc lộ - Tổng thể tiềm ẩn
Tổng thể chung - Tổng thể bộ phí
Tổng thể đồng chất - Tổng thể kh
Trang 30+) Khái niệm có nội dung là định nghĩa và giới hạn về thuộc tính, số lượng, thời gian.
+) Mức độ biểu hiện bằng các loại thang đo khác nhau
2.5ế Các loại thahg đo
*s
Trong thống kê có 4 loại thang đo
2.5.1 Thang đo định danh (đặt tên)
Thang đo định danh thường được biểu thị bằng các ký tự Nếu dùng thang
đo này thì các con số ở đây không có sự hơn kém (không có quan hệ thứ tự), các phép toán không được thực hiện
Ví dụ: Thống kê giới tính thang đo là Nam, Nữ (không có quan hệ lớn hơn, nhỏ
hơn không thể so sánh được hai khái niệm nam, nữ)
2.5.2 Thang đo thứ bậc
Thang đo thứ bậc là thang đo định danh, các con số ở đây đã có sự hơn kém nhưng các phép toán vẫn chưa được thực hiện
Ví dụ: Trình độ vãn hóa: lớp 1 , 2 , 1 2 là một thang đo thứ bậc, phân biệt cho ta
trình độ của từng trẻ em trong độ tuổi đến trường, nhưng không thể có lớp 2 + 3 chẳng hạn nên các phép toán không được sử dụng
Chú ý: Trong thang đo thứ bậc không phải cứ số lớn là hơn số nhỏ.
17 dụ: +) Huân chương hạng nhất hơn huân chương hạng hai, huân chương hạng
hai hơn huân chương hạng ba
+) Xếp hạng học sinh trong một lớp: Học sinh xếp thứ 1 là học sinh học giỏi nhất
2.5ẵ3 Thang đo khọảng.
Thang đo khoảng là thang đo thứ bậc, các đối tượng được phân đều nhau, các phép toán được sử dụng
Ví dụ: Thang điểm 10 là một thang đo khoảng, với khoảng cách đều nhau là 1
điểm, ta có thể cộng điểm, tính điểm trung bình, như vậy các phép toán được
sử dụng
28
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 312.5.4 Thang đo tỷ lệ
Thang đo tỷ lệ là thang đo khoảng và có điểm không tuyệt đối
Chú ý: Theo thứ tự ở trên, thang đo sau có chất lượng tốt hơn (phản ánh chính xấc hơn thực tế khách quan) so với thang đo trước nhưng cũng phức tạp hơn Vì vậy, trước khi chọn thang đo cho một loại thống kê cần lưu ý xem tiêu thức thống
kê cần loại thang đo nào thì dùng thang đo ấy
2.6 Một vài phương pháp lấy mẫu đơn giản
2Ế6.Ỉ Các quan sát độc lập
Các quan sát được tiến hành một cách độc lập với nhau, kết quả của quan sát này không phụ thuộc vào kết quả của quan sát khác và cũng không ảnh hưởng đến khả năng xảy ra kết quả của quan sát khác
Ví dụ: Năm xạ thủ mỗi xạ thủ bắn một viên đạn nhằm vào bia đó là nãm quan sát
2.6.3 Lấy mẫu ngẫu nhiên có hoàn lại
Lấy một cách ngẫu nhiên một phần tử từ một tập hợp nào đó, quan sát, ghi chép lại những số liệu đặc trưng cần thiết của phần tử đó, trả nó lại tập ban đầu rồi tiếp tục lấy ngẫu nhiên một phần tử khác,
Ví dụ: +) Việc quay sổ số bằng lồng cầu trong đó có 10 quả cầu được đánh sô từ
0 đến 9 chính là việc lấy mẫu ngẫu nhiên có hoàn lại
+) Khi giảng bài, giáo viên thường gọi học sinh trả lời câu hỏi dể kiểm tra ^ việc hiểu bài cũng là lấy mẫu ngẫu nhiên có hoàn lại
2Ế6.4ễ Lấy mẫu ngẫu nhiên không hoàn lại
Lấy một cách ngẫu nhiên một phần tử từ một tập hợp nào đó, quan sát ghi chép lại những sô' liệu đặc trưng cần thiết của phần tử đó, không trả nó lại tập
Trang 32ban đâu rồi tiêp tục lấy ngẫu nhiên một phần tử khác từ tập đó,
I / dụ: Kiểm tra chất lượng sản phẩm của các lô hàng thực phẩm người ta phải
mang 1 sản phẩm bất kỳ trong lô hàng đi phân tích chất lượng sản phẩm, (mở bao
bì, làm các thí nghiệm để kiểm tra các chỉ số theo đăng ký chất lượng sản phẩm)
vì thế sản phẩm này không thể trả lại lô hàng để mang đi bán được, nếu sản phẩm kém chất lượng người ta có thể tiếp tục lấy thêm một sản phẩm nữa để kiêm tra Đày là một ví dụ về lấy mẫu ngẫu nhiên không hoàn lại
2.7Ề Điều tra chọn mẫu
Nhiều khi đối tượng điều tra quá lớn, ta không có đủ điểu kiện về thời gian, nhân lực kinh phí để điều tra mọi đối tượng Vậy chọn đối tượng nào để điều tra và cách chọn ra sao đó chính là vấn đề của chọn mẫu Có ba cách chọn mẫu như sau:
2.7.1 Chọn mẩu với xác suất đều
ứng với mỗi đơn vị điều tra, có một hay nhiều tiêu thức điều tra, người ta thường phân loại các tiêu thức điều tra và giải quyết vấn đề chọn mẫu theo hai cách sau:
Tiêu thức về kết cấu được chọn làm tiêu thức chọn mẫu: Người ta chọn mẫu sao cho cơ cấu theo các tiêu thức này tính trên mẫu chọn trùng với cơ cấu của chúng đã biết trên tổng thể
Ví dụ: Tuổi, giới tính, nghề nghiệp, địa vị, của các nhân được chọn làm tiêu thức chọn mẫu
Tiêu thức về các đặc tính riêng cần điều tra được chọn làm tiêu thức chọn mẫu Tinh đại diện của mẩu thể hiện ở chỗ tiêu thức điều tra đo lường trên mẫu chọn có thể suy rộng cho tổng thể, cũng như phân phối của nó trên mẫu có thể suy ra phân phối của tiêu thức đó trên tổng thể với một độ tin cậy nào đó Mẫu đại diện là hình ảnh thu nhỏ của tổng thể chung một cách tương đối trung thực
2ễ7.2 Chọn mẫu với xác suất không đều
Trên các lĩnh vực của tự nhiên, xã hội, kinh tế sự không đồng đều về quy
mô là khá phổ biến Do đó việc thu thập thông tin dựa vào các mẫu đồng loạt sẽ
30
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 33hạn chế tính đại diện Chẳng hạn, các hiện tượng văn hóa, xã hội, tinh thần không xuất hiện đồng đều theo thời gian và không gian mà thường rộ lên ở một sô' thời điểm nhất định, một số nơi nhất định Vì vậy, chọn mẫu theo thời gian, không gian, đối tượng với xác suất không đều tùy theo quy mỏ xuất hiện các hiện tượng cho các mẫu đại diện tốt hơn các mẫu chọn theo xác suất đều.
Ví dụ: +) Hiện tượng mê tín dị đoan thường tập trung vào các thời điểm lễ hội, ở
những nơi có lễ hội, những nơi xa xôi hẻo lánh, trình độ dân trí th ấ p ,
+) Người nhiễm HIV thường tập trung các đối tượng nghiện hút, tiêm chích ma túy, gái mại dâm,
2.7.3ề Điều tra nhóm trội
Điều tra nhóm trội ỉà một dạng điều tra trọng điểm, nhưng với những điểu kiện nhất định có khả năng suy rộng cho toàn bộ tổng thể
Ví dụ: Nghiên cứu quý thời gian rỗi của nhóm người có đời sống cao, có giao lưu
vãn hóa mạnh, có trình độ văn hóa nhất định, ta có thể suy rộng (có điều chỉnh) ra cho toàn bộ dân cư vói một khoảng thời gian đủ dài để nâng cao mức sống vật chất và tinh thần toàn thể lên mức hiện tại của nhóm trội
Trang 34Chương 3 QUÁ TRÌNH NGHIÊN CÚT TH Ố N G KÊ
Quá trình nghiên cứu thống kê cũng là một quá trình nghiên cứu khoa học nên nó có đầy đủ các bước của một quá trình nghiên cứu khoa học, ngoài ra vì nó mang đặc thù của thống kê nên nó có những bước sau:
3.1ẻ Bước 1:
Xác định mục đích nghiên cứu
Phân tích đối tượng ' * í
- Xác định nội dung nghiên cứu
-3.2 Bước 2:
- Xây dựng hệ thống khái niệm, chỉ tiêu thống kê
- Định hướng điều tra
- Lập các bảng biểu thống kê
3.3 Bước 3:
Điểu tra thống kê (Đi thu thập số liệu thống kê)
3.4 Bước 4:
Xư lý số liệu ban đầu Các số liệu thu thập được đang ờ dạng số liệu thô,
để có thể xừ lý số liệu theo mục đích nghiên cứu cần phải sắp xếp, thu gọn số liệu
3.5 Bước 5:
Lựa chọn phương pháp thống kê, chọn chương trình nhập và xừ lý số liệu trẽn máy tính Hiện nay có nhiều phần mềm xử lý số liệu trên máy tính, ta có thể tìm thấy các phần mềm này trên m ạ n g Cần phải chọn phần mềm nào phù hợp với bài toán thống kê cần xử lý Nhờ các phần mềm này các nhà nghiên cứu có nhiều thuận lợi hơn khi xù lý số liệu thống kê
Trang 353Ề7 Bước 7:
Trình bày kết quả nghiên cứu
Báo cáo, truyền đạt kết quả nghiên cứu
- Đưa ra những đề xuất, kiến nghị
Trang 36Chương 4.ễ TRÌNH BÀY SÔ LIỆU TH Ố NG KÊ
Sau khi điều tra thống kê, chúng ta thu thập được hàng loạt thông tin Để những thông tin này có tác dụng, cần phải sắp xếp chúng theo một trật tự nhất định phù hợp với mục đích sử dụng, khi đó người quản lý thông tin có thể dễ dàng đưa ra những quyết định đúng đắn
V / dụ: Việc nhập và quản lý điểm của sinh viên sao cho có thể dễ dàng chọn
được những sinh viên theo những mục đích cụ thể, chẳng hạn: Xét học bổng, xét điểm rèn luyện, xét làm đề tài NCKH, luận văn tốt nghiệp,
Việc lựa chọn cách thức quản lý thông tin là rất quan trọng, người ta thường làiji theo cách sau:
4ễl Sáp xếp sô liệu và phân tổ
4.1.1ằ Sắp xếp sô' liệu
*) Sau khi điều tra ta được các số liệu, các số liệu này chưa được xử lý được gọi là các số liệu thô Để đạt được mục đích nghiên cứu ta phải sắp xếp các
số liệu thô theo một số tiêu chí cụ thể
Ví dụ: Để xét cấp học bổng cho sinh viên ta phải sắp xếp điểm trung binh chung
học tập của sinh viên từ cao đến thấp Tương ứng với số xuất học bổng được cấp (hoặc tiêu chuẩn về điểm nếu không hạn chế số người được cấp học bổng) ta chỉ việc cắt theo danh sách từ cao xuống cho đến lúc đủ số lượng cần chọn thì thôi
*) Sau khi sắp xếp các số liệu thô lại thành một bảng thì bảng sắp xếp có những ưu điểm sau:
Từ bảng sắp xếp ta có thể dễ dàng biết được giá trị nào lớn nhất, giá trị nào bé nhất
Từ bảng sắp xếp ta biết được giá trị nào xuất hiện bao nhiêu lần
Từ bảng sắp xếp ta có thể dễ dàng chia tổ, nhóm
Ví dụ: Khi điều tra chiều cao của các cháu ở tuổi mẫu giáo lớn, người ta chọn đo
ở một lớp 30 cháu và thu được kết quả như sau: (đơn vị đo là cm)
34
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn
Trang 37*) Chia tổ nhóm: Nhiều khi có nhiều số liệu thống kê cần phải xử lý Để việc xử
lý số liệu được đơn giản, nhanh chóng và chính xác ta có thể chia các số liệu thu được thành các nhóm (thành các khoảng)
+) Khoảng thường ký hiệu là: a - b;
Trang 38+) a được gọi là giới hạn dưới của khoảng.
+) b được gọi là giới hạn trên của khoảng
+) Hiệu b-a dược gọi là biên độ của khoảng
+) Trung bình cộng của a và b được gọi là điểm giữa của khoảng
*) Chú ý: +) Đối với mỗi lớp số liệu thu thập được, có nhiều cách chia tổ, nhóm
+) Có thể chia tổ với khoảng cách đều nhau, cũng có thể chia tổ với khoảng cách không đều nhau
*) Ví dụ: Sô liệu về sô đo chiều cao của 30 cháu mẫu giáo lớn ở trên có thể chia
nhóm như sau:
+) Chia nhóm với khoảng cách đều nhau:
+) Chia nhóm vói khoảng cách không đều nhau:
Trang 394.1.2 Phân tổ thống kê
Phân tổ thống kê là một phương pháp quan trọng của phân tích số liệu thống kê, đồng thời là cơ sở để thực hiện các phương pháp thống kê khác Chí sau khi đã phân chia tổng thể phức tạp thành các tổ có những đặc điểm khác nhau thì các chỉ tiêu phân tích khác mới có ý nghía Có nhiều cách phân tổ thống kê
a) Phân tổ theo một tiêu thức
Ta chỉ dựa vào một tiêu thức để phân tổ thống kê Khi phân tổ thống kê cần phải chú ý khoảng cách của từng tổ, có thể khoảng cách đều nhau, có thể khoảng cách không đều nhau tùy thuộc vào mục đích nghiên cứu và vào lớp số liệu thu thập được
V í dụ: +) Khi nghiên cứu sự phát triển thể chất của trẻ mẫu giáo lớn, có các tiêu
thức thống kê: chiều cao, cân nặng, khả năng vận động Người ta có thể căn cứ vào một trong 3 tiêu thức đó để phân tổ thống kê Chẳng hạn, căn cứ vào số đo chiều cao ta có thể chia trẻ thành 3 tổ (nhóm): nhóm có chiểu cao phát triển tốt, nhóm có chiều cao phát triển bình thường, nhóm có chiều cao phát triển chậm
Từ đó ta mới phân tích tổng thể của từng nhóm (kết hợp với cân nặng và khả năng vận dộng)
+) Khi điều tra dân số của một tỉnh (Thái Nguyên chẳng hạn) thường có các tiêu thức thống kê: Họ và tên, tuổi, giới tính, nơi thường trú, trình độ văn hóa, trình độ chuyên môn, nghề nghiệp, đơn vị công tác, đoàn viên (đảng viên), .Nếu căn cứ vào tiêu thức nơi thường trú thì ta có thể chia tổng thể thành các đơn vị: Thành phố Thái nguyên, huyện Phổ Yên, huyện Phú Bình, huyện Đại từ, Huyện
Võ nhai, huyện Định hóa, Huyện Đồng hỷ, huyện Phú lương, .Với mỗi đơn vị này ta có thể chia nhỏ hơn Thành phố chia theo các phường, các phường lại chia đến các tổ dân phố, .Các huyện chia theo các xã, các xã lại chia đến các thôn,
x ó m ,
Hay nói cách khác, đây là cách chia tổ theo địa giới hành chính
b) Phân tổ theo nhiều tiêu thức
Ta có thể dựa vào nhiều tiêu thức để phân tổ thống kê
V í dụ: Điều tra sự phát triển của trẻ mẫu giáo lớn người ta phải căn cứ vào các
Trang 40tiêu thức: chiểu cao, cân nặng, khả nãng ngôn ngữ, khả năng nhận thức, khả nãng
tư duy, tình trạng sức k h ỏ e, để chia trẻ thành ba nhóm:
4.2.1 Cấu trúc của một bảng thống kê
Người ta chia bảng thống kê theo hai khái niệm:
a) Về hình thức:
Bảng thống kê gồm các hàng ngang và các cột dọc, các tiêu đề và các số liệu
*) Hàng ngang và cột dọc phản ánh quy mô của bảng Bảng càng nhiều hàng, nhiều cột thì quy mô của bảng càng lớn và độ phức tạp của bảng càng cao
*) Tiêu đề của bảng thống kê phản ánh nội dung của bảng
Ví dụ: Bảng điểm học kỳ I lớp mầm non K Tiêu đề này phản ánh nội dung của bảng đó là điểm học kỳ I của tất cả các môn học trong học kỳ I, của tất
cà các học viên lcrp mầm lion K
*) Các sổ liệu dược ghi vào các ô của bảng, mổi ô có một địa chỉ theo dòng và một địa chỉ theo cột
Chú V Khi lập bảng thống kê không nên nhiều hàng, nhiều cột quá Bảng thống
kẽ không nên phức tạp quá, nhumg cũng không nên sơ sài quá Bảng thống kê chỉ nên vừa đủ cho mục đích thống kê
38
Số hóa bởi Trung tâm Học liệu – ĐH TN http://www.lrc-tnu.edu.vn