Nội dung• Trong lý thuyết mẫu hay thống kê suy diễn ta thường dùng các đặc trưng của mẫu statistic để ước tính các đặc trưng của tổng thể parameter • Nếu ta lấy mẫu cỡ n từ tổng thể thì
Trang 1LÝ THUYẾT MẪU
Chương 5
Trang 3Nội dung
• Trong lý thuyết mẫu hay thống kê suy diễn ta thường dùng các đặc trưng của mẫu (statistic) để ước tính các đặc trưng của tổng thể (parameter)
• Nếu ta lấy mẫu cỡ n từ tổng thể thì điều gì sẽ xảy ra? Trung bình mẫu sẽ có quy luật phân phối gì? Tỷ
lệ mẫu có quy luật gì?
• Để ước tính trung bình tổng thể ta dùng đặc trưng nào của mẫu? Tương tự cho các tham số khác như
tỷ lệ và phương sai?
• Phải hiểu rõ quy luật phân phối của mẫu
Trang 4Tổng thể Mẫu TQ Mẫu cụ thểKích
Trang 5• Sai số chuẩn (Standard error) là độ lệch chuẩn của mộtthống kê mẫu
• Độ lệch chuẩn (Standard deviation) liên quan đến mộtmẫu
Trang 6Phân phối của trung bình mẫu
• Một bể cá lớn từ trại cá giống đang được chuyển đến hồ.
Ta muốn biết chiều dài trung bình của cá trong bể Thay vì
đo chiều dài của toàn bộ cá trong bể ta chọn ngẫu nhiên một mẫu và sử dụng trung bình mẫu để ước lượng cho trung bình tổng thể.
• Đặt trung bình mẫu là Giá trị của là ngẫu nhiên do phụ thuộc vào mẫu được chọn ra.
• Trung bình mẫu được gọi là một thống kê.
• Trung bình của tổng thể là cố định, ta ký hiệu là μ.
• Phân phối của trung bình mẫu cũng là phân phối của biến ngẫu nhiên
• Thông thường, phân phối của trung bình mẫu rất phức tạp ngoại trừ trường hợp cỡ mẫu rất nhỏ hoặc rất lớn.
• Phương pháp chọn mẫu là ngẫu nhiên, không hoàn lại.
Trang 7Ví dụ minh họa
• Tổng thể là trọng lượng của sáu quả bí ngô (kg) đượctrưng bày trong một gian hàng trò chơi "đoán trọnglượng" của hội chợ Bạn được yêu cầu đoán trọnglượng trung bình của sáu quả bí ngô bằng cách lấy mộtmẫu ngẫu nhiên mà không hoàn lại từ tổng thể
Quả bí A B C D E F Trọng lượng (kg) 19 14 15 9 10 17
Trung bình tổng thể: μ=14 (kg)
Trang 10Tổng hợp
• Nếu cỡ mẫu lớn thì?
• Cần chọn mẫu cỡ bao nhiêu?
• Trung bình mẫu có quy luật phân phói như thế nào?
• Xu hướng trung tâm của trung bình mẫu là?
• Mức độ biến động của trung bình mẫu so với xuhướng trung tâm?
Trang 11Phân phối xác suất của thống kê mẫu
• Bị ảnh hưởng bởi:
Cỡ mẫu
Phân phối của tổng thể
Cách thức chọn mẫu
Trang 12Tổng thể và tham số tổng thể
• Kích thước N, gồm các phần tử có cùng một dấu hiệu nghiên cứu X
Trang 13Mẫu ngẫu nhiên – tổng quát
• Định nghĩa Tập hợp n biến ngẫu nhiên độc lập X1, X2,
…, Xn thành lập từ biến ngẫu nhiên gốc X được gọi làmẫu ngẫu nhiên cỡ n (kích thước n)
• Ký hiệu: W=(X1, X2, …, Xn) trong đó Xi là các bnn
• Xi có cùng quy luật phân phối với X
• Một phép thử với mẫu ngẫu nhiên là một mẫu cụ thểgồm n quan sát w=(x1,x2,…,xn)
E X E X V X V X
Trang 14Các đặc trưng mẫu (statistic)
n
Trang 16Thực hành tính thống kê mẫu
Điều tra thời gian sử dụng internet trong tuần của 90sinh viên một trường ta được bảng số liệu sau:
Hãy tính các thống kê mẫu sau:
a) Trung bình mẫu, phương sai mẫu (đã hiệu chỉnh),
phương sai mẫu chưa hiệu chỉnh?
b) Tỷ lệ sinh viên trong mẫu có thời gian sử dụng trên 5
giờ một tuần?
Trang 19Cách 1_Lập bảng
• Cỡ mẫu:
• Trung bình mẫu:
• Phương sai mẫu chưa hiệu chỉnh:
• Phương sai mẫu đã hiệu chỉnh:
i i
x n x
Trang 20Cách 2 dùng máy tính 570ES
1 Shift + 9 + 3 + = + =: Reset máy
2 Shift + Mode + + 4 + 1: bật tần số (frequency on)
3 Mode + 3 + 1: vào tính thống kê 1 biến (stat1-var)
4 Khi này ta có bảng sau:
123
Trang 23mẫuc) Tính độ lệch chuẩn
mẫu hiệu chỉnh
Trang 24Mô phỏng phân phối mẫu
• http://onlinestatbook.com/stat_sim/sampling_dis t/index.html
•
http://www.jbstatistics.com/sampling-distributions/
• https://newonlinecourses.science.psu.edu/stat41 4/node/132/
• https://shiny.rit.albany.edu/stat/
Trang 25Phân phối xác suất của thống kê mẫu
• A Biến ngẫu nhiên gốc có phân phối chuẩn
• B Biến ngẫu nhiên gốc có phân phối B(1,p)
• C Hai tổng thể có phân phối chuẩn
• D Hai tần suất của hai tổng thể
Trang 261 Tổng thể có phân phối chuẩn
• Cho tổng thể có phân phối chuẩn
Trang 272 Tổng thể có phân phối nhị thức
• Gọi p là tỷ lệ một tính chất A nào đó của tổng thể.
• Khi này ppxs của bnn gốc X là: B(1;p) hay A(p)
• Lấy mẫu nn cỡ n, gọi F là tỷ lệ mẫu.
Trang 283 Hai tổng thể có phân phối chuẩn
• Cho hai tổng thể và 2 bnn gốc:
• Ta tiến hành lấy 2 mẫu độc lập:
• Các thống kê mẫu tương ứng:
Trang 293 Hai tổng thể có phân phối chuẩn
Trang 303 Hai tổng thể có phân phối chuẩn
• Nếu chưa biết 2 phương sai nhưng mẫu lớn m>30,n>30 thì:
Trang 313 Hai tổng thể có pp Chuẩn, mẫu nhỏ
• Hai tổng thể có phân phối chuẩn
• Trường hợp mẫu nhỏ (m hay n<30) và có thêm giảthuyết 2 phương sai bằng nhau (chưa biết) ta có:
• Với S2 là phương sai chung được ước lượng như sau
Trang 323 Hai tổng thể có pp Chuẩn, mẫu nhỏ
• Hai tổng thể có phân phối chuẩn
• Trường hợp mẫu nhỏ (m hay n<30) và có thêm giảthuyết 2 phương sai khác nhau (chưa biết) ta có:
Trang 333 Hai tổng thể có phân phối chuẩn
Trang 343 Hai tổng thể có phân phối chuẩn
Trang 354 Hai tổng thể chưa biết ppxs, mẫu lớn
• Hai tổng thể có ppxs chưa biết
• Kích thước mẫu lớn m>30, n>30
• Đã biết hai phương sai
• Chưa biết hai phương sai:
Trang 365 Hai tổng thể có phân phối B(n,p)
• Cho hai tổng thể có tỷ lệ lần lượt là p1; p2
• Lấy mẫu cỡ n từ tổng thể 1, tần suất mẫu F1=k1/n
• Lấy mẫu cỡ m từ tổng thể 2, tỷ lệ mẫu F2=k2/m
Trang 37Tổng thể Mẫu TQ Mẫu cụ thểKích
Trang 38Tổng thể Mẫu TQ Mẫu cụ thểTrung
N
Trang 39Tổng hợp phân phối mẫu
Trang 40Ví dụ 1
• Giả sử bạn lấy mẫu 100 giá trị từ tổng thể có trung bình 500 và độ lệch chuẩn 80 Tính xác suất để trung bình mẫu nằm trong khoảng (490, 510)
Trang 43Ví dụ 4
• Chiều dài của một loại sản phẩm là bnn pp chuẩn với trung bình 20 m và độ lệch chuẩn 0,2 m Lấy một mẫu ngẫu nhiên 25 sp.
a) Cho biết ppxs của trung bình mẫu Tính kỳ vọng
và phương sai của nó.
b) Xs để trung bình mẫu tối thiểu 30,06m
c) Tìm số k để tỷ số giữa phương sai mẫu hiệu
chỉnh và phương sai tổng thể ít nhất bằng k có xác suất bằng 0,1.
Trang 44Ví dụ 5
• Giả sử X là năng suất lúa vùng A có pp chuẩn với phương sai bằng 3 (tạ/ha)2 Lấy một mẫu ngẫu nhiên kích thước 100 Tính xác suất để: