p gần 0 hoặc 1 thì hai phương pháp cho kết quả rất khác nhau. Nên sử dụng theo cách thứ nhất. Hỏi cần phải lấy mẫu với kích thước tối thiểu là bao nhiêu. b) Nếu anh ta không có một chú[r]
Trang 1TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2019
Trang 2ThS NGUYỄN THỊ VÂN HÒA (Chủ biên) ThS ĐẶNG THỊ NGỌC ÁNH, ThS VŨ THỊ KHUYÊN
ThS NGUYỄN THỊ THU
BÀI GIẢNG
TOÁN THỐNG KÊ CHO KHOA HỌC XÃ HỘI
TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2019
Trang 4MỤC LỤC
MỤC LỤC i
LỜI NÓI ĐẦU 1
Chương 1 ĐẠI CƯƠNG VỀ LÝ THUYẾT XÁC SUẤT 3
1.1 Biến cố ngẫu nhiên và xác suất 3
1.1.1 Ý nghĩa của xác suất 3
1.1.2 Phép thử và biến cố 3
1.1.3 Quan hệ giữa các biến cố 4
1.2 Định nghĩa xác suất cổ điển 4
1.2.1 Phương pháp liệt kê các phần tử 5
1.2.2 Phương pháp dùng các quy tắc đếm 6
1.3 Các công thức tính xác suất 8
1.3.1 Công thức cộng xác suất 8
1.3.2 Công thức nhân xác suất 10
1.4 Công thức Bernoulli 12
1.4.1 Dãy phép thử Bernoulli 12
1.4.2 Công thức Bernoulli 13
1.5 Biến ngẫu nhiên rời rạc 15
1.5.1 Khái niệm biến ngẫu nhiên rời rạc 15
1.5.2 Bảng phân phối xác suất 16
1.5.3 Các số đặc trưng của biến ngẫu nhiên rời rạc 18
1.5.4 Phân phối nhị thức 21
1.6 Biến ngẫu nhiên liên tục 21
1.6.1 Khái niệm biến ngẫu nhiên liên tục 21
1.6.2 Phân phối xác suất của biến ngẫu nhiên liên tục 21
1.6.3 Các số đặc trưng của biến ngẫu nhiên liên tục 24
1.6.4 Phân phối chuẩn 25
BÀI TẬP 28
Chương 2 MẪU THỐNG KÊ VÀ ƯỚC LƯỢNG THAM SỐ 34
2.1 Giới thiệu bài toán 34
2.2 Lý thuyết mẫu 34
2.3 Mẫu ngẫu nhiên 35
2.4 Cách thu gọn và biểu diễn số liệu 36
2.5 Các số đặc trưng mẫu 41
Trang 52.5.1 Kỳ vọng mẫu, phương sai mẫu 41
2.5.2 Cách tính giá trị cụ thể của trung bình mẫu và phương sai mẫu 42
2.5.3 Các đặc trưng khác 43
2.5.4 Phân phối của kỳ vọng mẫu và phương sai mẫu 45
BÀI TẬP 46
Chương 3 ƯỚC LƯỢNG THAM SỐ 47
3.1 Ước lượng điểm 47
3.2 Ước lượng khoảng 48
3.2.1 Khoảng tin cậy cho kỳ vọng của biến ngẫu nhiên X có phân phối chuẩn 49
3.2.2 Khoảng tin cậy cho xác suất 51
3.2.3 Bài toán xác định cỡ mẫu 52
BÀI TẬP 54
Chương 4 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 57
4.1 Đặt vấn đề 57
4.2 Bài toán và phương pháp chung giải quyết kiểm định giả thiết 58
4.3 Các bài toán kiểm định giả thiết thường gặp 60
4.3.1 Bài toán kiểm định giả thiết cho kì vọng 60
4.3.2 Kiểm định cho xác suất hay tỉ lệ 65
BÀI TẬP 67
Chương 5 BÀI TOÁN SO SÁNH 69
5.1 So sánh hai giá trị trung bình 69
5.2 Bài toán so sánh hai tỉ lệ (xác suất) 72
5.3 Kiểm định tính độc lập của hai biến ngẫu nhiên (hai dấu hiệu) 74
BÀI TẬP 77
Chương 6 SƠ LƯỢC VỀ LÝ THUYẾT TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH 79
6.1 Phân tích tương quan tuyến tính 79
6.1.1 Hệ số tương quan 79
6.1.2 Hệ số tương quan mẫu 80
6.2 Phân tích hồi quy tuyến tính 81
6.2.1 Mô hình 81
6.2.2 Ước lượng bình phương cực tiểu 82
BÀI TẬP 85
TÀI LIỆU THAM KHẢO 87 PHỤ LỤC
Trang 6LỜI NÓI ĐẦU
Xác suất thống kê là một chuyên ngành khó của Toán học nhưng lại có nhiều ứng dụng trong rất nhiều ngành nghề, từ khoa học tự nhiên đến khoa học
xã hội, kinh tế, nông nghiệp, lâm nghiệp…
Để đáp ứng nhu cầu học tập môn học này cho những người học khối xã hội
và đặc biệt là cho sinh viên chuyên ngành Công tác xã hội của Trường Đại học Lâm nghiệp, nhóm giảng viên bộ môn Toán đã biên soạn cuốn Bài giảng Toán Thống kê cho khoa học xã hội dựa trên đề cương môn học này Trong bài giảng nhóm tác giả đã chọn cách diễn giải, trình bày các vấn đề lý thuyết một cách đơn giản, dễ hiểu tránh các vấn đề toán học phức tạp Kèm theo đó là các ví dụ có giải thích cặn kẽ để người đọc dễ theo dõi, áp dụng
Nội dung gồm các bài tập được trình bày theo các chương:
- Chương 1: Đại cương về lý thuyết xác suất;
- Chương 2: Thống kê mô tả;
- Chương 3: Ước lượng tham số;
- Chương 4: Kiểm định giả thiết thống kê;
- Chương 5: Bài toán so sánh;
- Chương 6: Sơ lược về lý thuyết tương quan và hồi quy tuyến tính
Mặc dù rất cẩn thận nhưng trong quá trình biên soạn và chế bản chắc chắn không tránh khỏi các sai sót Rất mong nhận được những ý kiến đóng góp quý báu của sinh viên và đồng nghiệp
Nhóm tác giả
Trang 8Chương 1 ĐẠI CƯƠNG VỀ LÝ THUYẾT XÁC SUẤT
1.1 Biến cố ngẫu nhiên và xác suất
1.1.1 Ý nghĩa của xác suất
Vì khái niệm xác suất giữ vai trò quan trọng trong lý thuyết và ứng dụng của thống kê nên chúng ta phải trang bị những hiểu biết đầy đủ về xác suất trước khi nghiên cứu những chi tiết có tính kỹ thuật của thống kê
Các trò chơi có tính may rủi như quay số, rút bài, tung đồng xu cho chúng
ta khái niệm về “phép thử”, khi một phép thử được thực hiện có thể dẫn đến nhiều kết cục khác nhau, nhưng thông thường ta không thể nào tiên đoán được chính xác kết quả nào sẽ xảy ra trước khi thực hiện phép thử
Chẳng hạn trong phép thử gieo một con xúc sắc, chúng ta biết được các khả năng xuất hiện là xúc sắc sẽ ra 1 chấm, 2 chấm 6 chấm Tuy nhiên, trong một lần cụ thể ta sẽ không thể biết được xúc sắc ra kết quả nào Nhưng nếu tiếp tục thực hiện phép thử n lần (với n là một số đủ lớn) và gọi m là số lần mà có kết quả thành công như là xuất hiện mặt 3 chấm ngửa lên, khi đó thực nghiệm cho thấy rằng tỷ số f = m/n sẽ tiến tới một giới hạn ổn định nếu như số lần tung xúc sắc n ngày càng lớn Tính ổn định trên chính là nền tảng của lý thuyết xác suất
1.1.2 Phép thử và biến cố
Phép thử ngẫu nhiên (hay gọi tắt là phép thử) là một hành động hay một thí
nghiệm hoặc một quan sát mà kết quả của nó không thể dự báo trước được Tập hợp các kết quả có thể xảy ra khi thực hiện phép thử được gọi là không gian mẫu của phép thử đó
Biến cố sơ cấp là một kết cục sơ đẳng nhất của phép thử
Biến cố cũng là kết cục của phép thử nhưng nó là một tập hợp các biến cố
sơ cấp có chung một đặc tính Như vậy, một biến cố có thể là một tập hợp của nhiều biến cố sơ cấp, cũng có thể chỉ bao gồm một biến cố sơ cấp duy nhất, cũng có khi biến cố là một tập hợp rỗng (biến cố không thể) hay là toàn bộ không gian mẫu (biến cố chắc chắn)
Chẳng hạn, xét một phép thử tung con xúc sắc cân đối và đồng chất trên một mặt phẳng:
- Biến cố sơ cấp là biến cố xuất mặt 2 chấm, hoặc biến cố xuất hiện mặt 3 chấm Ta có 6 biến cố sơ cấp;
Trang 9- Biến cố xuất hiện mặt có số chấm chẵn là biến cố C gồm các kết quả xuất hiện mặt 2 chấm, 4 chấm và 6 chấm Lúc này C không phải là biến cố sơ cấp;
- Biến cố xuất hiện mặt có số chấm bằng 7 là biến cố không thể vì nó không thể xảy ra
1.1.3 Quan hệ giữa các biến cố
Trong lý thuyết xác suất, người ta xét các quan hệ sau đây của các biến cố:
- Quan hệ kéo theo: Biến cố A gọi là kéo theo biến cố B nếu khi A xảy ra
thì B cũng xảy ra Kí hiệu AB;
- Quan hệ tương đương: Hai biến cố A và B được gọi là tương đương nếu
AB và BA Kí hiệu A = B;
- Phép hợp: Hợp của 2 biến cố A và B là một biến cố xảy ra nếu ít nhất một
trong hai biến cố trên xảy ra Kí hiệu là A B
Hợp của một dãy hữu hạn n biến cố A , A , , A 1 2 n, kí hiệu là biến cố n i
i 1
A
Biến cố này xảy ra khi có ít nhất một trong các biến cố A i xảy ra
- Phép giao: Giao của hai biến cố A và B là một biến cố xảy ra khi cả hai
biến cố trên xảy ra Kí hiệu:A B hay AB
Giao của một dãy hữu hạn n biến cố A , A , , A 1 2 n, kí hiệu là biến cố n i
i 1
A
Biến cố này xảy ra khi tất cả các biến cố A i cùng xảy ra
- Quan hệ đối lập: Biến cố đối của biến cố A là biến cố xảy ra khi và chỉ
khi A không xảy ra Kí hiệu là A;
- Quan hệ xung khắc: Hai biến cố A và B được gọi là xung khắc với nhau
nếu chúng không đồng thời xảy ra trong một phép thử Kí hiệu AB ;
- Hiệu của hai biến cố: Hiệu của biến cố A và biến cố B là một biến cố xảy
ra khi A xảy ra nhưng B không xảy ra Kí hiệu A\B;
- Biến cố độc lập: Hai biến cố A và B được gọi là độc lập với nhau nếu việc
xảy ra hay không xảy ra của biến cố này không làm thay đổi khả năng xảy ra của biến cố kia và ngược lại
1.2 Định nghĩa xác suất cổ điển
Xác suất của một biến cố là một con số đặc trưng cho khả năng xảy ra của biến cố đó khi thực hiện phép thử, ví dụ theo trực giác ta luôn tin rằng khả năng xuất hiện mặt số khi tung một đồng xu là 50%, như vậy có thể nói “xác suất của biến cố xuất hiện mặt số khi tung đồng xu là 0,5”
Trang 10Xét một phép thử Giả sử không gian mẫu của phép thử đó gồm n (hữu hạn) trường hợp đồng khả năng Nếu biến cố A liên quan đến phép thử gồm có
m trường hợp thuận lợi thì tỷ số m
n để biểu thị khả năng xảy ra biến cố A được
gọi là xác suất của biến cố A
Kí hiệu: P(A) = m
n Tính chất của xác suất:
1 Nếu A là biến cố bất kỳ thì 0 P A( ) 1;
2 Xác suất của biến cố chắc chắn là P( ) 1;
3 Xác suất của biến cố không thể là P( ) 0;
4 Nếu A là biến cố đối của biến cố A thì P( )A 1 P A( ).
- Các kết quả của phép thử phải đồng khả năng;
- Số trường hợp đồng khả năng phải hữu hạn
Các bước để tính xác suất của một biến cố theo định nghĩa cổ điển nếu xem biến cố A như là tập con của không gian mẫu thì:
+ Xác định không gian mẫu , rồi tính số phần tử n() của;
+ Xác định các trường hợp thuận lợi của biến cố A, rồi tính số trường hợp thuận lợi để xảy ra biến cố A là n(A);
+ Tính P(A) theo công thức (A) ( )
( )
n A P
1.2.1 Phương pháp liệt kê các phần tử
Ví dụ 1 Gieo một con xúc xắc cân đối và đồng chất Tìm xác suất để:
a) Mặt trên của con xúc xắc xuất hiện một chấm?
b) Mặt trên của con xúc xắc có số chấm chẵn?
Trang 11c) Mặt trên của con xúc xắc có số chấm nhỏ hơn 7?
d) Mặt trên của con xúc xắc xuất hiện 7 chấm?
Khi đó:
- Không gian mẫu gồm 6 trường hợp;
- Các kết quả thuận lợi của biến cố B là 3 trường hợp {2,4,6}
P(A)=3
6c) Gọi C là biến cố mặt trên của con xúc xắc xuất hiện số chấm nhỏ hơn 7 Khi đó:
- Không gian mẫu gồm 6 trường hợp;
- Các kết quả thuận lợi của biến cố C là 6 trường hợp (bằng số trường hợp thuận lợi của không gian mẫu)
P(A)=6 1
6 d) Gọi D là biến cố mặt trên của con xúc xắc xuất hiện 7 chấm
Khi đó:
- Không gian mẫu gồm 6 trường hợp;
- Các kết quả thuận lợi của biến cố D là 0 (không có mặt 7 chấm)
Trang 12- Giai đoạn 1 có n1 cách hoàn thành;
- Giai đoạn 2 có n2 cách hoàn thành;
…
- Giai đoạn k có nk cách hoàn thành
Khi đó số cách thực hiện công việc A là n1.n2…nk
* Nhận xét:
- Điều quan trọng ở đây là làm sao khi đọc đề bài chúng ta biết được phải
sử dụng quy tắc cộng hay quy tắc nhân Thông thường, nếu một bài toán mà công việc có thể giải quyết theo nhiều phương án hay có nhiều trường hợp xảy
ra thì ta thường dung quy tắc cộng, còn nếu bài toán mà công việc được thực hiện bằng những công việc nhỏ liên tiếp, nhiều công đoạn hay là trường hợp nhỏ này liên kết với trường hợp nhỏ kia thì ta thường dung quy tắc nhân;
- Trong nhiều trường hợp chúng ta cần kết hợp cả hai quy tắc để giải bài toán
Ví dụ 2 Một đoàn đại biểu Quốc hội của tính nọ gồm 10 người, trong đó có
3 đại biểu là người dân tộc ít người Chọn ngẫu nhiên trong đoàn ra 3 người, tìm khả năng xảy ra các tình huống sau:
a) Chọn được cả 3 đại biểu đều là người dân tộc ít người
b) Chọn được đúng 2 đại biểu là người dân tộc ít người
c) Không chọn được đại biểu nào thuộc dân tộc ít người
P A
n C
Trang 13b) Gọi B là biến cố chọn được đúng 2 đại biểu đều là người dân tộc ít người
a) Công thức cộng xác suất cho 2 biến cố
Cho A và B là hai biến cố bất kỳ, khi đó:
- Nếu A và B là hai biến cố xung khắc (AB ) thì:
P A B P A P B
- Nếu B A ta có 1 P(A A) P(A) P(A)
Ví dụ 3 Hai vận động viên A và B của một địa phương cùng tham gia giải
bóng bàn toàn quốc Khả năng vận động viên A lọt vào chung kết là 80%, khả năng vận động viên B lọt vào chung kết là 60% và khả năng cả hai cùng vào chung kết là 48%
Tính xác suất để:
a) Có ít nhất một vận động viên vào chung kết?
b) Không có vận động viên nào vào đến chung kết?
Giải:
Với bài toán này chúng ta sẽ không sử dụng công thức xác suất cổ điển mà phải sử dụng công thức cộng xác suất
Gọi A là biến cố vận động viên A lọt vào chung kết, P(A) = 0,8
Alà biến cố vận động viên A không lọt vào chung kết
Gọi B là biến cố vận động viên B lọt vào chung kết, P(B) = 0,6
Blà biến cố vận động viên B không lọt vào chung kết
Khi đó AB là biến cố cả hai vận động viên đều lọt vào chung kết, P(AB)
= 0,48
Trang 14a) Biến cố có ít nhất một vận động viên vào chung kết là C A B
b) Biến cố không có vận động viên nào vào chung kết là D A B
=> Biến cố đối của biến cố D là biến cố C
b) Mở rộng công thức cộng xác suất
Cho A, B, C là 3 biến cố bất kỳ, khi đó:
Ví dụ 4 Khảo sát về mức độ quan tâm của người dân trong một khu phố
đối với 3 tờ báo A, B, C, người ta thu được số liệu sau:
Có 20% người dân xem báo A; 15% người dân xem báo B; 10% người dân xem báo C; Có 5% người dân xem A và B; 3% người dân xem B và C; 4% người dân xem A và C; Có 2% người dân xem cả A, B và C
a) Tính xác suất để người dân xem ít nhất một tờ báo nào đó?
b) Tính xác suất để người dân không xem bất kỳ tờ báo nào?
Giải:
Gọi A, B, C lần lượt là các biến cố người dân xem báo A, B, C
Từ đó ta có:
P(A) = 0,2; P(B) = 0,15; P(C) = 0,1;
P(AB) = 0,05; P(BC) = 0,03; P(AC) = 0,04; P(ABC) = 0,02
a) Gọi D là biến cố “người dân xem ít nhất một tờ báo” => D = A B C
b) Gọi E là biến cố “người dân không xem tờ báo nào” => E ABC
Từ giả thiết bài toán ta không thể trực tiếp được E, vì vậy ta phải sử dụng biến cố đối của E chính là biến cố D
Trang 151.3.2 Công thức nhân xác suất
a) Khái niệm về xác suất có điều kiện
Cho A và B là hai biến cố bất kỳ thỏa mãn P(A) > 0 Xác suất có điều kiện của biến cố B với điều kiện biến cố A đã xảy ra (gọi là xác suất của B với điều kiện A), kí hiệu là P(B|A) được định nghĩa như sau:
(AB) (B | A)
b) Công thức nhân xác suất cho 2 biến cố
Từ công thức xác suất có điều kiện ta suy ra công thức nhân xác suất của hai biến cố là:
(AB) (A | B) P(B) P(B | A) P(A)
Ví dụ 5 Trong một hộp kín có 20 nắp bia Tiger, trong đó có 2 nắp ghi
“Chúc mừng bạn đã trúng thưởng xe BMW” Bạn được chọn lên rút thăm lần lượt hai nắp bia (rút không hoàn lại), tính xác suất để cả hai nắp đều trúng thưởng
Giải:
Gọi A là biến cố “nắp bia rút được lần đầu là nắp có thưởng”
Gọi B là biến cố “nắp bia rút được lần hai là nắp có thưởng”
Ví dụ 6 Một người chuẩn bị tham dự lấy phiếu tín nhiệm vào một chức vụ,
bắt buộc phải qua hai vùng, ở vùng I khả năng đủ tín nhiệm là 60% Nếu đủ ở
Trang 16vùng I thì khả năng đủ tín nhiệm ở vùng II là 85%, nếu không đủ ở vùng I thì khả năng đủ tín nhiệm ở vùng II là 30% Tìm khả năng của người đó:
a) Đủ tín nhiệm ở cả hai vùng?
b) Chỉ đủ tín nhiệm ở một vùng?
Giải:
a) Gọi A là biến cố người đó đủ tín nhiệm ở vùng I
B là biến cố người đó đủ tín nhiệm ở vùng II
Theo giả thiết: P(A) = 0,6; P(B|A) = 0,85; P(B A)= 0,3
Khả năng người đó đủ tín nhiệm ở cả hai vùng là:
P(AB) = P(A)P(B|A)=0,6.0,85 = 0,51 b) Khả năng người đó chỉ đủ tín nhiệm ở một vùng là:
P ABAB P A P B A P P B A = 0,4.0,3 + 0,6.0,15 = 0,21
Khái niệm sự độc lập của hai biến cố
Hai biến cố A và B được gọi là độc lập với nhau trong một phép thử nếu biến cố A có xảy ra hay không cũng không ảnh hưởng đến khả năng xảy ra của biến cố B và ngược lại
Các phát biểu sau là tương đương:
i) Hai biến cố A và B là độc lập với nhau P(AB)=P(A)P(B);
ii) Hai biến cố A và B là độc lập với nhau P(A|B) = P(A) hoặc P(B|A)
= P(B);
Ví dụ 7 Trong bình có 4 quả cầu trắng và 5 quả cầu xanh
Lấy ngẫu nhiên từ trong bình ra 1 quả cầu Gọi A là biến cố “lấy được quả cầu xanh” Hiển nhiên P(A) = 5/9
Quả cầu lấy ra được bỏ lại vào bình và tiếp tục lấy 1 quả cầu Gọi B là biến
cố “lần thứ 2 lấy được quả cầu xanh”, khi đó P(B) = 5/9
Rõ ràng xác suất của biến cố B không thay đổi khi biến cố A xảy ra hay không xảy ra và ngược lại Vậy hai biến cố A và B độc lập nhau
* Chú ý:
Nếu A và B độc lập với nhau thì A và B, A và B, A và B cũng độc lập với nhau
* Mở rộng công thức nhân xác suất cho nhiều biến cố
Cho 3 biến cố A, B, C, khi đó: P(ABC) P(A) P(B | A) P(C | AB)
Trang 17 Khái niệm về một dãy biến cố độc lập
Một dãy n biến cố A1, A2, …, An được gọi là độc lập với nhau (hay độc lập trong toàn bộ) nếu mỗi biến cố độc lập với tích bất kỳ của các biến cố còn lại Khi đó:
Ví dụ 8 Một xí nghiệp có 3 ô tô hoạt động độc lập Xác suất để trong một ngày
các ô tô bị hỏng lần lượt là 0,1; 0,15 và 0,2 Tìm xác suất để trong một ngày có: a) Cả 3 ô tô bị hỏng?
Vì các biến cố A B C, , độc lập nên áp dụng công thức nhân xác suất ta được:
- Mỗi phép thử chỉ có hai kết quả: A và A;
- Xác suất P(A) = p, (0 < p < 1), không đổi cho mọi phép thử
Giá trị p được gọi là xác suất thành công trong mỗi lần thử
Trang 18Chú ý: Dãy phép thử độc lập là dãy các phép thử mà kết quả của phép thử
này không làm ảnh hưởng tới kết quả của phép thử khác
Công thức này mang tên nhà toán học người Thụy Sĩ Jacob Bernoulli (còn được biết đến với tên James hoặc Jacques) (1654 - 1705)
Ví dụ 9 Gieo một đồng xu cân đối và đồng chất 5 lần => Đó là dãy 5 phép
thử Bernoulli Ở mỗi phép thử (tức là mỗi lần gieo) có hai kết quả A là biến cố gieo được mặt sấp hoặc ngược lại
Ví dụ 10 Một người bắn độc lập lần lượt 10 viên đạn vào bia => Đó là dãy
10 phép thử Bernoulli Ở mỗi phép thử (tức là mỗi lần bắn) có hai kết quả A là biến cố bắn trúng hoặc ngược lại Việc gọi A là biến cố nào tùy thuộc vào từng bài toán cụ thể
1.4.2 Công thức Bernoulli
Xác suất để trong n lần thực hiện phép thử, biến cố A xảy ra đúng k lần
(0 k n) với xác suất mỗi lần A xảy ra là p (0< p <1) Được ký hiệu là P n (k,p)
và cho bởi công thức sau:
k k n-k
P (k, p) = C p (1- p)Công thức trên được gọi là công thức Bernoulli
Chứng minh công thức Bernoulli:
Gọi B là biến cố trong n lần thực hiện phép thử biến cố A xảy ra đúng k lần
Ta biểu diễn biến cố B là tích của các biến cố A và A như sau:
Ví dụ 11 Giả sử tỷ lệ người dân tham gia giao thông ở Hà Nội có hiểu biết
cơ bản về luật giao thông là 80% Chọn ngẫu nhiên 20 người đang tham gia giao thông trên đường Hãy tính xác suất của các trường hợp sau:
a) Có 15 người hiểu biết về luật giao thông?
Trang 19b) Có 8 người không hiểu biết về luật giao thông?
c) Có ít nhất 1 người hiểu về luật giao thông?
Mở rộng bài toán: Tính xác suất để trong n lần thực hiện phép thử:
i) Biến cố A xảy ra từ k1 đến k2 lần;
ii) A xảy ra ít nhất 1 lần;
iii) Tìm số lần biến cố A xảy ra có khả năng nhất
Giải quyết bài toán:
Sử dụng công thức Bernoulli đã xây dựng ở trên và các quy tắc đếm, ta dễ dàng chứng minh được các công thức sau:
i) Xác suất để biến cố A xảy ra từ k1 đến k2 lần là:
Ví dụ 12 Theo con số thống kê công bố năm 1997, ở Việt Nam tỷ lệ các
cặp vợ chồng vô sinh là 1/8 Từ số đăng ký kết hôn ở một phường cách đây 10 năm cho thấy có 1.240 cặp vợ chồng
a) Tính xác suất để trong đó có 100 cặp vô sinh?
b) Hãy viết công thức tính xác suất để có không quá 2 cặp vợ chồng vô sinh? c) Tìm số cặp vô sinh có khả năng nhất?
d) Tính xác suất có ít nhất 1 cặp vô sinh?
Giải:
a) Đây là một dãy 1.240 phép thử Bernoulli, để tính xác suất trong đó có
100 cặp vô sinh ta áp dụng công thức:
100 1240
Trang 20Ví dụ 13 Tín hiệu thông tin được phát đi 3 lần độc lập nhau Xác suất thu
được tín hiệu ở mỗi lần là 0,4
a) Tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần?
b) Tìm xác suất để nguồn thu nhận được thông tin đó?
c) Nếu muốn xác suất thu được tin 0,9 thì phải phát đi ít nhất bao nhiêu lần?
Giải:
Có thể xem mỗi lần phát tin là một phép thử Bernoulli với mục đích thành công của phép thử là nguồn thu nhận được tin Theo giả thiết xác suất thành công p của mỗi lần thử là 0,4
Xác suất để nguồn thu nhận được thông tin đúng 2 lần là:
Vì n nguyên dương nên ta chọn n = 5
1.5 Biến ngẫu nhiên rời rạc
1.5.1 Khái niệm biến ngẫu nhiên rời rạc
Khi tiến hành một phép thử ngẫu nhiên, các kết quả của phép thử thường là các đặc trưng định tính (biến cố ngẫu nhiên) Tuy nhiên, trong nhiều phép thử mỗi một kết quả của phép thử thường được gán tương ứng với một giá trị định lượng nào đó
Trang 21Ví dụ 14 Gieo một con xúc sắc cân đối và đồng chất Kí hiệu A1, A2, A3,
A4, A5, A6 lần lượt là biến cố “mặt 1 chấm xuất hiện”, “mặt 2 chấm xuất hiện”, , “mặt 6 chấm xuất hiện”
Thay vì xét các biến cố như trên, ta xét đại lượng X là số chấm xuất hiện khi gieo con xúc xắc Khi đó X có thể nhận các giá trị 1, 2, 3, 4, 5, 6 một cách ngẫu nhiên
Ví dụ 15 Gieo đồng thời hai con xúc sắc Gọi X là tổng số chấm xuất hiện
ở hai mặt trên => X là biến ngẫu nhiên rời rạc nhận một trong các giá trị:
{2, 3, 4, 5, 6, , 11, 12}
Ví dụ 16 Một người bắn vào bia cho tới khi trúng mục tiêu thì dừng Gọi Y
là số viên đạn cần dùng
=> Y là biến ngẫu nhiên rời rạc nhận các giá trị: 1, 2, 3, , n,
Ta thường dùng các chữ cái X, Y, Z để kí hiệu các biến ngẫu nhiên và các chữ cái thường x, y, z hoặc xi, yi, zi để chỉ các giá trị cụ thể mà biến ngẫu nhiên đó nhận
Như vậy, đối với biến ngẫu nhiên người ta chỉ quan tâm xem nó nhận một giá trị nào đó hoặc nhận giá trị trong một khoảng nào đó với xác suất bằng bao nhiêu
1.5.2 Bảng phân phối xác suất
Mục đích của thống kê là suy diễn từ những thông tin thu thập được trên một mẫu thành những sự hiểu biết về tổng thể, phương pháp này đòi hỏi sự hiểu biết về xác suất kết hợp với các trị số của biến ngẫu nhiên, nói nôm na là chúng
ta phải xác định được các xác suất tương ứng với các giá trị có thể có của biến ngẫu nhiên để hoàn toàn xác định nó
Như vậy, chúng ta phải xác định được quy luật phân phối xác suất của biến ngẫu nhiên, tức là sự tương ứng giữa các giá trị có thể có của biến ngẫu nhiên và các xác suất tương ứng với các giá trị đó
Quy luật này đối với một biến ngẫu nhiên rời rạc được thể hiện dưới dạng bảng phân phối xác suất được định nghĩa như sau:
Trang 22Giả sử X là biến ngẫu nhiên rời rạc nhận các giá trị có thể x i với xác suất
tương ứng là p i (P{X = x i } = p i ); p i > 0, i = 1, 2 Ta có thể biểu diễn dưới dạng
Ví dụ 17 Gieo một con xúc sắc cân đối và đồng chất Ký hiệu X là số
chấm xuất hiện ở mặt trên của con xúc xắc
a) Tìm phân phối xác suất của X
b) Viết hàm phân phối của X
- Kiểm tra điều kiện P(X = 1) + P(X = 2) + … + P(X = 6) = 1
Vậy phân phối của X là một bảng có dạng:
b) Tìm hàm phân phối của X dựa vào định nghĩa ở trên:
Trang 23Xét tương tự ta có kết quả sau:
khi x khi x khix
x x x p
p
x x x p
x x
x F
khi 1
khi khi
khi 0
)
2 1
1
1
Nhận xét: Hàm phân phối của biến ngẫu nhiên rời rạc X là hàm bậc
thang, không giảm, gián đoạn tại các điểm có thể có của X, độ lớn của bước nhảy tại x i là p i
1.5.3 Các số đặc trưng của biến ngẫu nhiên rời rạc
1.5.3.1 Định nghĩa kỳ vọng của biến ngẫu nhiên rời rạc
Giả sử phân phối xác suất của biến ngẫu nhiên rời rạc X là:
X x1 x2 xn …
p p1 p2 pn …
1 2 3 4 5 6 1/6
1
Trang 24 , khi đó kỳ vọng toán của biến ngẫu nhiên X, ký hiệu
là E(X) được định nghĩa như sau:
Ví dụ 19 Chọn ngẫu nhiên 3 viên bi từ 1 túi có 6 bi đen và 4 bi trắng Gọi X
là số bi trắng trong 3 bi vừa chọn Tìm bảng phân bố của X và tính kỳ vọng của X
C 30
2 1
6 4 3 10
3 10
3 10
Khi đó: E(X) 0. 5 1.15 2. 9 3. 1 1, 2
Ý nghĩa của kỳ vọng toán:
Kỳ vọng mang ý nghĩa là trị số trung bình mà biến ngẫu nhiên nhận được, hoặc là trọng tâm của phân phối xác suất với khối lượng 1 Chính vì vậy mà người ta hay dùng kỳ vọng để xác định vị trí của phân phối
Khái niệm kỳ vọng được áp dụng rộng rãi trong nhiều lĩnh vực Trong kinh doanh và quản lý, kỳ vọng được ứng dụng dưới dạng lợi nhuận kỳ vọng hay doanh số kỳ vọng
Tính chất của kỳ vọng:
1 E(C) = C với mọi hằng số C;
2 E(CX) = CE(X) với mọi hằng số C;
3 E(X + Y) = E(X) + E(Y); E(X – Y) = E(X) - E(Y);
4 E(XC) = E(X) C;
Trang 255 Nếu X và Y là hai biến ngẫu nhiên độc lập và E(X), E(Y) tồn tại thì:
Đại lượng D X( ) được gọi là độ lệch tiêu chuẩn (hay sai tiêu chuẩn)
Với biến ngẫu nhiên rời rạc, ta có công thức tính E(X2) = 2
1
i i i
D(X) = E(X2) – (EX)2 = 2 – 1,22 = 0,56
Ý nghĩa của phương sai:
Phương sai của biến ngẫu nhiên X là một số không âm dùng để đo mức độ phân tán (mức độ tản mát) của các giá trị của biến ngẫu nhiên X xung quanh tâm E(X) của nó
D(X) nhỏ thì mức độ phân tán nhỏ, độ tập trung lớn D(X) càng lớn thì độ phân tán càng cao
Trong kỹ thuật phương sai đặc trưng cho mức độ phân tán của các chi tiết gia công hay sai số của thiết bị Trong quản lý và kinh doanh thì phương sai đặc trưng cho mức độ rủi ro của các quyết định
Trang 261.5.4 Phân phối nhị thức
Đây là một dạng phân phối đặc biệt của biến ngẫu nhiên rời rạc thường gặp Biến ngẫu nhiên X được gọi là có phân phối nhị thức với tham số (n, p) (Trong đó n N và 0 < p < 1) nếu:
n
P X k C p q q p k n
Kí hiệu:XB n p( ; )
Nhận xét: Chúng ta đã xét dãy phép thử độc lập và công thức Bernoulli
Nếu thực hiện n phép thử độc lập, trong mỗi phép thử biến cố A xuất hiện với xác suất p không đổi thì biến ngẫu nhiên X chỉ số lần xuất hiện biến cố A trong
n phép thử có phân phối nhị thức
1.6 Biến ngẫu nhiên liên tục
1.6.1 Khái niệm biến ngẫu nhiên liên tục
Biến ngẫu nhiên liên tục là biến ngẫu nhiên mà các giá trị của nó có thể nhận là tất cả mọi điểm trong khoảng (a; b) nào đó, a có thể bằng và b có thể bằng
Ví dụ 21 Gọi Z là thời gian sống của một con chíp điện tử
=> Z là biến ngẫu nhiên nhận các giá trị thực 0 Z
Đối với biến ngẫu nhiên liên tục X, xác suất để X nhận một giá trị cụ thể nào đó luôn luôn bằng không: P(X = a) = 0 Thành thử ta quan tâm đến xác suất
để X rơi vào một khoảng (a, b) nào đó, chứ không quan tâm tới xác suất để X nhận một giá trị cụ thể như trong trường hợp biến rời rạc
Phân phối xác suất của biến ngẫu nhiên liên tục X được xác định bởi một
Trang 27f( ) ,
7 P(a X < b) = F(b) − F(a) =b ( )
a
f x dx
Chú ý: Đối với biến ngẫu nhiên liên tục ta có thêm tính chất sau:
P(a X b) = P(a < X b) = P(a < X < b) = P(a X < b)
Nhận xét:
i) Hàm mật độ xác suất là đạo hàm của hàm phân phối Tức là f(x) = F ’ (x);
ii) Giá trị của hàm F(x) bằng diện tích hình phẳng giới hạn bởi đồ thị của hàm mật độ f(x), trục hoành và đường thẳng song song với trục tung có hoành
Trang 28du du
u f
Trang 291.6.3 Các số đặc trưng của biến ngẫu nhiên liên tục
a) Định nghĩa kỳ vọng của biến ngẫu nhiên liên tục
Nếu biến ngẫu nhiên X có hàm mật độ là f(x) và x f(x)dx
2
1 1
15E(X) xf(x)dx xf(x)dx xf(x)dx xf(x)dx 0 x dx 0
32x
dx
b) Phương sai của biến ngẫu nhiên liên tục
Phương sai của biến ngẫu nhiên X, ký hiệu là D(X) được xác định bởi công thức:
Trang 301.6.4 Phân phối chuẩn
a Định nghĩa phân phối chuẩn
Biến ngẫu nhiên X được gọi là có phân phối chuẩn với hai tham số µ và 2
- Đồ thị của hàm f(x) là đường cong hình chuông đối xứng qua đường x =
µ và đạt giá trị cực đại tại điểm x = µ Vì vậy giá trị Mod(X) = µ
- Tiệm cận với trục hoành khi x
- Diện tích giới hạn bởi đồ thị và trục hoành bằng 1
* Kỳ vọng và phương sai: Nếu X N(µ; 2) thì E(X) = a và D(X) = 2
DX được gọi là độ lệch chuẩn
Phân phối chuẩn chiếm vị trí quan trọng trong lý thuyết xác suất, là vị trí trung tâm trong các kết luận thống kê sau này Trong thực tế có nhiều biến ngẫu nhiên tuân theo quy luật chuẩn hoặc tiệm cận chuẩn chẳng hạn như trọng lượng, chiều cao của một nhóm người nào đó, điểm thi của các thí sinh, lực chịu đựng của một thanh sắt, các sai số đo đạc, độ bền dẻo của máy móc, khối lượng, kích thước của các sản phẩm, năng suất cây giống, mức lãi suất của công ty, nhu cầu tiêu thụ của một mặt hàng nào đó…
b Phân phối chuẩn tắc
Nếu X N(µ; 2), ta đổi biến
Z
Trang 31Khi đó Z có phân phối chuẩn N(0,1) với kỳ vọng bằng 0 và phương sai bằng 1 gọi là có phân phối chuẩn tắc (hay phân phối tiêu chuẩn)
Phép đổi biển
Z được gọi là phép chuẩn hóa
Hàm mật độ của biến ngẫu nhiên có phân phối chuẩn tắc là:
Đồ thị của hàm mật độ của phân phối chuẩn tắc N(0,1) như sau:
Người ta đã xây dựng sẵn bảng các giá trị của hàm (x) và ( )x Trong các bài tập cần lưu ý đưa về phân phối chuẩn tắc để tính toán
Tính xác suất theo phân phối chuẩn:
Trang 32Quy tắc 2: Nếu biến ngẫu nhiên X có phân phối chuẩn với hai tham số µ
và 2thì có đến 95,46% giá trị của X sẽ nằm trong khoảng (µ - 2 ; µ + 2) Quy tắc 3: Nếu biến ngẫu nhiên X có phân phối chuẩn với hai tham số µ
và 2thì hầu như chắc chắn X nhận các giá trị trong khoảng (µ - 3 ; µ + 3)
Ví dụ 25 Giả sử X có phân phối chuẩn N(2100; 2002) Tính:
Ví dụ 26 Chiều cao của phụ nữ Việt Nam là biến ngẫu nhiên có phân phối
chuẩn N(155, 2,52) Tính tỷ lệ phụ nữ có chiều cao trên 160 cm
Trang 33BÀI TẬP
Bài 1 Xác suất của biến cố A là 0,7 Hãy cho biết con số đó có ý nghĩa gì? Bài 2 Tần suất xuất hiện biến cố viên đạn trúng đích của một xạ thủ là
0,85 Tìm số viên đạn trúng đích của xạ thủ đó nếu người này bắn 200 viên đạn?
Bài 3 Một công ty cần tuyển hai nhân viên Có 6 người nộp đơn trong đó
có 4 nữ và 2 nam Giả sử rằng khả năng trúng tuyển của 6 người là như nhau:
a Tính xác suất để hai người trúng tuyển đều là nam?
b Tính xác suất để hai người trúng tuyển đều là nữ?
c Tính xác suất để có ít nhất một nữ trúng tuyển?
Bài 4 Có thể xem xác suất sinh được con trai là bao nhiêu nếu theo dõi
88200 trẻ sơ sinh ở một vùng thấy có 45.600 con trai?
Bài 5 Trên một giá sách có 15 quyển sách, trong đó có 5 quyển văn
nghệ Lấy ngẫu nhiên từ đó ba quyển Tìm xác suất sao cho có ít nhất một quyển văn nghệ?
Bài 6 Số lượng nhân viên của công ty A được phân loại theo lứa tuổi và
giới tính như sau:
Tìm xác suất để lấy ngẫu nhiên một người của công ty đó thì được:
a) Một nhân viên từ 40 tuổi trở xuống
b) Một nam nhân viên trên 40 tuổi
c) Một nữ nhân viên từ 40 tuổi trở xuống
Bài 7 Giả sử xác suất sinh con trai và con gái là như nhau Một gia đình có
3 con, tính xác suất để gia đình đó có:
a) Hai con gái
b) Ít nhất 2 con gái
Bài 8 Một lô sản phẩm gồm 100 chiếc ấm sứ trong đó có 20 chiếc vỡ nắp, 15
chiếc sứt vòi, 10 chiếc mẻ miệng, 7 chiếc vừa vỡ nắp vừa sứt vòi, 5 chiếc vừa vỡ
Trang 34nắp vừa mẻ miệng, 3 chiếc vừa sứt vòi vừa mẻ miệng, 1 chiếc vừa vỡ nắp vừa sứt vòi vừa mẻ miệng Lấy ngẫu nhiên 1 sản phẩm để kiểm tra, tính xác suất:
a) Sản phẩm đó có khuyết tật
b) Sản phẩm đó chỉ bị sứt vòi
c) Sản phẩm đó bị sứt vòi biết rằng nó bị vỡ nắp
Bài 9 Một chi tiết được lấy ngẫu nhiên có thể là chi tiết loại 1 (ký hiệu
biến cố này là A) hoặc chi tiết loại 2 (ký hiệu là B) hoặc chi tiết loại 3 (ký hiệu
là C) Hãy mô tả các biến cố sau đây:
a) A + B
b) AB + C
c) AB
d) AC
Bài 10 Gọi A là biến cố sinh con gái và B là biến cố sinh con có trọng
lượng trên 3 kg Hãy mô tả tổng và tích của hai biến cố trên?
Bài 11 Một công ty tham gia đấu thầu 2 dự án Gọi A và B tương ứng là
biến cố công ty thắng thầy dự án thứ nhất và thứ hai Hãy mô tả tổng và tích của
A và B?
Bài 12 Công ty sử dụng hai hình thức quảng cáo là đài phát thanh và vô
tuyến truyền hình Giả sử 25% khách hàng nắm được thông tin này qua vô tuyến truyền hình, 34% khách hàng nắm được thông tin qua đài phát thanh và 10% khách hàng nắm được thông tin này qua cả hai hình thức quảng cáo Tìm xác suất để chọn ngẫu nhiên 1 khách hàng thì người đó nắm được thông tin về sản phẩm công ty?
Bài 13 Một nhân viên bán hàng mỗi ngày đi chào hàng ở 10 nơi với xác
suất bán được hàng mỗi nơi là 0,2
a) Tìm xác suất để người đó bán được hàng ở 2 nơi?
b) Tìm xác suất để người đó bán được hàng ở ít nhất 1 nơi?
Bài 14 Một siêu thị lắp 5 chiếc chuông báo cháy hoạt động độc lập nhau
Xác suất để khi có cháy mỗi chuông kêu là 0,95 Tìm xác suất để có chuông kêu khi có cháy?
Bài 15 Hai máy cùng sản xuất một loại sản phẩm Tỷ lệ phế phẩm của máy
I là 3%, máy II là 2% Từ một kho gồm 2/3 sản phẩm của máy I và 1/3 sản phẩm của máy II ta lấy ra một sản phẩm
a) Tính xác suất để đó là sản phẩm tốt?
Trang 35b) Giả sử sản phẩm lấy ra là sản phẩm tốt Khả năng sản phẩm đó do máy nào sản xuất?
Bài 16 Tỷ lệ người dân nghiện thuốc lá ở một vùng là 30% Biết rằng tỷ lệ
người bị viêm họng trong số người nghiện thuốc lá là 60%, tỷ lệ người bị viêm họng trong số người không hút thuốc lá là 40% Chọn ngẫu nhiên 1 người để kiểm tra
a) Biết rằng người đó bị viêm họng Tính xác suất người đó nghiện thuốc lá? b) Nếu người đó không bị viêm họng, tính xác suất để người đó là người nghiện thuốc?
Bài 17 Trong một bệnh viện, tỷ lệ bệnh nhân các tỉnh như sau: Tỉnh A là
25%, tỉnh B là 35%, tỉnh C là 40% Biết rằng tỷ lệ bệnh nhân là kỹ sư của các tỉnh A, B, C lần lượt là 0,2; 0,4 và 0,3 Chọn ngẫu nhiên 1 bệnh nhân, tính xác suất để bệnh nhân đó là kỹ sư?
Bài 18 Thống kê 2.000 sinh viên một khóa của trường kinh tế theo giới
tính và nghành học thu được các số liệu sau:
Lấy ngẫu nhiên một sinh viên khóa đó Tìm xác suất để được:
a) Nam sinh viên?
b) Sinh viên học kinh tế?
c) Hoặc nam sinh viên hoặc học kinh tế?
d) Nam sinh viên và học kinh tế?
Bài 19 Tại một siêu thị, hệ thống phun nước tự động được lắp liên kết với
một hệ thống báo động hỏa hoạn Khả năng hệ thống phun nước bị hỏng là 0,1 Khả năng để hệ thống báo động bị hỏng là 0,2 Khả năng để hai hệ thống này cùng hỏng là 0,04 Hãy tính xác suất:
a) Có ít nhất một hệ thống hoạt động bình thường?
b) Cả hai hệ thống hoạt động bình thường?
Bài 20 Một xí nghiệp có hai ô tô vận tải hoạt động Xác suất trong ngày
làm việc các ô tô bị hỏng tương ứng lần lượt là 0,1 và 0,2 Gọi X là số ô tô bị hỏng trong thời gian làm việc
a) Tìm quy luật phân phối xác suất của X?
b) Thiết lập hàm phân bố xác suất của X?
Trang 36Bài 21 Một thiết bị gồm 3 bộ phận hoạt động độc lập với nhau Xác suất
trong thời gian T các bộ phận bị hỏng tương ứng là 0,4; 0,2 và 0,3
a) Tìm quy luật phân phối xác suất của số bộ phận bị hỏng X?
b) Tìm xác suất để trong thời gian T có không quá 2 bộ phận bị hỏng?
Bài 22 Tại một cửa hàng bán xe máy Honda người ta thống kê được số xe
máy bán ra hàng tuần (X) với bảng phân phối xác suất như sau:
P 0,05 0,12 0,17 0,08 0,12 0,20 0,07 0,02 0,07 0,02 0,03 0,05
a) Tìm số xe trung bình bán được mỗi tuần?
b) Tìm phương sai và độ lệch chuẩn cho số xe bán ra mỗi tuần và giải thích
ý nghĩa kết quả đạt được?
Bài 23 Thống kê số khách trên một ô tô buýt tại một tuyến giao thông thu
được các số liệu sau:
Tìm kỳ vọng và phương sai của số khách đi mỗi chuyến?
Bài 24 Cho biến ngẫu nhiên rời rạc X nhận 3 giá trị -1; 0; 1 Tìm xác suất
tương ứng để X nhận các giá trị này biết rằng E(X) = 0,1 và E(X2
Bài 25 Kinh nghiệm cho thấy là số lượng một loại sản phẩm mà một khách
hàng có thể mua có bảng phân phối xác suất như sau:
Trang 37Bài 26 Gọi X là tỷ lệ khách hàng phản ứng tích cực đối với một chiến dịch
quảng cáo X là biến ngẫu nhiên có bảng phân phối xác suất như sau:
a) Hãy chứng tỏ các xác suất trên lập thành bảng phân phối xác suất?
b) Tìm tỷ lệ khách hàng trung bình phản ứng tích cực với chiến dịch quảng cáo đó?
c) Tìm xác suất để có trên 20% khách hàng phản ứng tích cực đối với chiến dịch quảng cáo?
Bài 27 Qua theo dõi trong nhiều năm kết hợp với sự đánh giá của các
chuyên gia tài chính thì lãi suất đầu tư vào một công ty là biến ngẫu nhiên X có bảng phân phối xác suất như sau:
P 0,05 0,15 0,3 0,2 0,15 0,1 0,05 a) Tìm xác suất để khi đầu tư vào công ty đó sẽ đạt được lãi suất ít nhất 12%? b) Tìm lãi suất có thể hy vọng khi đầu tư vào công ty đó?
c) Mức độ rủi ro khi đầu tư vào công ty đó có thể đánh giá bằng cách nào?
Bài 28 Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau:
Tìm p, E(X), D(X)?
Bài 29 Nhu cầu hàng năm về loại hàng A là biến ngẫu nhiên liên tục X có
hàm mật độ xác suất như sau (đơn vị: ngàn sản phẩm):
b) Tìm xác suất để nhu cầu về loại hàng đó không vượt quá 12000 sản phẩm trong năm?
c) Tìm nhu cầu trung bình hàng năm về loại hàng đó?
Bài 30 Thời gian xếp hàng chờ mua hàng của khách là biến ngẫu nhiên
liên tục với hàm phân bố xác suất như sau (đơn vị: phút):
Trang 38b) Tìm thời gian xếp hàng trung bình?
Bài 31 Tỷ lệ mắc một loại bệnh trong một vùng dân cư là biến ngẫu nhiên
Bài 32 Trọng lượng của một con bò là một đại lượng ngẫu nhiên có phân
bố chuẩn với kỳ vọng là 250 kg và độ lệch tiêu chuẩn 40 kg Tìm xác suất để một con bò có trọng lượng:
a) Nặng hơn 300 kg?
b) Nhẹ hơn 175 kg?
c) Trong khoảng 260 kg đến 270 kg?
Bài 33 Thời gian hoạt động của một loại ti vi là một biến ngẫu nhiên có
phân bố chuẩn với µ = 4.300 giờ và δ = 250 giờ Giả thiết mỗi ngày người ta dùng trung bình là 10 giờ và thời hạn bảo hành miễn phí là 1 năm (360 ngày): a) Tìm tỷ lệ sản phẩm phải bảo hành?
b) Tính xác suất để thời gian hoạt động của loại ti vi này không quá 4600 giờ?
Bài 34 Lãi suất đầu tư vào một công ty là biến ngẫu nhiên có phân phối
chuẩn với lãi suất trung bình là 10% một năm và độ lệch tiêu chuẩn là 0,002 Tính xác suất khi đầu tư vào công ty đó:
a) Lãi suất không vượt quá 10,8% một năm?
b) Lãi suất tối thiểu đạt 9,5% một năm?
Trang 39Chương 2 MẪU THỐNG KÊ VÀ ƯỚC LƯỢNG THAM SỐ
2.1 Giới thiệu bài toán
Thống kê xã hội thực chất là những kết quả đơn giản của Thống kê ứng dụng (một phần của Thống kê toán học) được dùng trong nghiên cứu xã hội Giả sử ta cần nghiên cứu một đặc trưng xã hội nào đó, ta coi đó là một biến ngẫu nhiên Quy luật phân phối xác suất sẽ cho thông tin đầy đủ về biến ngẫu nhiên này hoặc các số đặc trưng sẽ cho ta các thông tin quan trọng Trong phạm
vi của bài giảng này, chúng ta không có câu trả lời về phân phối xác suất mà chỉ
có câu trả lời cho các số đặc trưng đặc biệt là hai đặc trưng quan trọng là trung bình và tỷ lệ
Để có câu trả lời chúng ta phải thu thập thông tin về biến ngẫu nhiên X đang xét Nhưng đó không phải là thông tin đầy đủ mà chỉ là mẫu đại diện Đó
là thông tin duy nhất mà chúng ta dựa vào để xử lý, rút ra kết luận Vì vậy đòi hỏi thông tin đó phải đại diện trung thực, khách quan cho tập giá trị mà X nhận
2.2 Lý thuyết mẫu
Lấy mẫu là một vấn đề rất quan trọng và phong phú trong nghiên cứu thống
kê Ngoài các phương pháp lấy mẫu chung dùng trong khoa học thống kê, đối với mỗi lĩnh vực riêng biệt lại có những phương pháp lấy mẫu mang đặc thù riêng Trong thống kê xã hội, đối tượng điều tra thường rất lớn, chúng ta không có
đủ điều kiện thời gian, tài chính để điều tra hết, vì vậy vấn đề đặt ra là chọn đối tượng nào để điều tra và cách chọn như thế nào Có ba cách chọn mẫu như sau:
- Chọn mẫu với xác suất đều;
- Chọn mẫu với xác suất không đều;
- Chọn mẫu theo nhóm trội
* Chọn mẫu với xác suất đều:
Ứng với mỗi đơn vị điều tra có một hay nhiều tiêu thức điều tra Người ta thường phân loại các tiêu thức điều tra và giải quyết các vấn đề chọn mẫu theo hai cách sau:
- Tiêu thức về kết cấu xã hội của các cá nhân thuộc tổng thể điều tra như tuổi, giới tính, nghề nghiệp, địa vị, trình độ văn hóa… được chọn làm tiêu thức nghiên cứu Người ta chọn mẫu sao cho cơ cấu theo các tiêu thức này tính trên mẫu chọn trùng với cơ cấu của chúng đã biết trên tổng thể;
Trang 40- Tiêu thức về các đặc tính riêng cần điều tra được chọn làm tiêu thức nghiên cứu Tính đại diện thể hiện ở chỗ tiêu thức nghiên cứu đo lường trên mẫu
có thể suy rộng cho tổng thể, cũng như phân phối của nó trên mẫu có thể suy ra phân phối của tiêu thức đó trên tổng thể với độ tin cậy nào đó Mẫu đại diện là hình ảnh thu nhỏ của tổng thể chung một cách tương đối trung thực
* Chọn mẫu với xác suất không đều:
Trên các lĩnh vực xã hội, sự không đồng đều về quy mô của hiện tượng là phổ biến, do đó việc thu thập thông tin dựa vào các mẫu đồng loạt sẽ hạn chế tính đại diện, chẳng hạn các hiện tượng xã hội, văn hóa, tinh thần không xuất hiện đồng đều theo thời gian mà thường rộ lên ở một số thời điểm nhất định Chọn mẫu theo thời gian với xác suất không đều tùy theo quy mô xuất hiện các hiện tượng cho các mẫu đại diện tốt hơn các mẫu chọn theo xác suất đều Ví dụ: nhu cầu sử dụng điều hòa tăng cao vào các tháng hè…
* Điều tra nhóm trội:
Điều tra nhóm trội là một dạng điều tra trọng điểm, nhưng với những điều kiện nhất định có khả năng suy rộng cho toàn bộ tổng thể Chẳng hạn, nghiên cứu quỹ thời gian rỗi của nhóm người có điều kiện sống cao, có giao lưu văn hóa mạnh, có trình độ văn hóa nhất định… ta có thể suy rộng (có điều chỉnh) ra cho toàn bộ dân cư với khoảng thời gian đủ dài để nâng cao mức sống vật chất
và tinh thần của toàn thể lên mức hiện tại của nhóm trội
2.3 Mẫu ngẫu nhiên
Nếu dấu hiệu nghiên cứu có tính định lượng, nghĩa là được thể hiện bằng cách cho tương ứng mỗi cá thể của tổng thể nhận một giá trị thực nào đó thì ta
có thể xem dấu hiệu X này là một biến ngẫu nhiên xác định trên tổng thể
Tiến hành n quan sát độc lập về biến ngẫu nhiên X Gọi Xi là việc quan sát lần thứ i về biến ngẫu nhiên X Về lý thuyết mẫu ngẫu nhiên kích thước n là một dãy gồm n biến ngẫu nhiên (X1, X2, …, Xn) độc lập cùng phân phối với X
Ta gọi xi là kết quả của lần quan sát thứ i (i = 1, 2, …, n) Về thực nghiệm
ta coi n kết quả quan sát (x1, x2,…, xn) là mẫu ngẫu nhiên
Mẫu ngẫu nhiên là thông tin duy nhất để dựa vào đó và dùng các phương pháp, kết quả của Thống kê để phân tích và rút ra các kết luận cần thiết Do vậy, đòi hỏi mẫu phải đại diện trung thực và khách quan cho hiện tượng hoặc cho tập giá trị của đại lượng mà ta đang nghiên cứu