Xác suất thống kêChương 4: Mẫu trong thống kê TS.. Chương 4: Mẫu trong thống kêĐịnh nghĩa Mẫu trong thống kê Tần số và tỷ lệ mẫu Các đặc trưng của mẫu Biểu diễn dữ liệu bằng đồ thị Định
Trang 1Xác suất thống kê
Chương 4: Mẫu trong thống kê
TS Trần Vũ Đức
Bộ môn Toán, khoa KHCN, ĐH Hoa Sen
Học kỳ 1, 2010-2011
Trang 2Chương 4: Mẫu trong thống kê
Định nghĩa Mẫu trong thống kê
Tần số và tỷ lệ mẫu
Các đặc trưng của mẫu
Biểu diễn dữ liệu bằng đồ thị
Định lý giới hạn trung tâm
Phân phối của các đặc trưng mẫu
Trang 3Định nghĩa
Nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập
có cùng phân phối F, thì X1, X2, , Xn được gọi
là một mẫu (sample) của phân phối F
Trang 4Chương 4: Mẫu trong thống kê
Định nghĩa Mẫu trong thống kê
Tần số và tỷ lệ mẫu
Các đặc trưng của mẫu
Biểu diễn dữ liệu bằng đồ thị
Định lý giới hạn trung tâm
Phân phối của các đặc trưng mẫu
Trang 5Tần số và tỷ lệ mẫu
Xét 1 mẫu X1, , Xn từ phân phối F
Tần số ni là số lần lặp lại của quan sát Xi trong mẫu
Tỷ lệ pi là tỷ số giữa tần số ni với tổng số quan sát
pi = ni
n
Example
Ví dụ 2.2b trang 12
Trang 6Chương 4: Mẫu trong thống kê
Định nghĩa Mẫu trong thống kê
Tần số và tỷ lệ mẫu
Các đặc trưng của mẫu
Biểu diễn dữ liệu bằng đồ thị
Định lý giới hạn trung tâm
Phân phối của các đặc trưng mẫu
Trang 7Trường hợp dữ liệu thô
Cho mẫu có n quan sát x1, x2, , xn
• Trung bình mẫu:
¯
x = 1 n
n
X
i=1
xi
• Phương sai mẫu:
s2n = 1 n
n
X
i=1
(xi −x)¯ 2 =
1 n
n
X
i=1
x2i
−¯2
Trang 8Trường hợp dữ liệu thô
• Phương sai mẫu hiệu chỉnh:
s2 = s2n−1 = 1
n − 1
n
X
i=1
(xi −¯x)2
=
1
n − 1
n
X
i=1
x2i
− n
n − 1¯
2
• Độ lệch chuẩn: là căn bậc hai của phương sai mẫu hiệu chỉnh
s =
√
s2
Trang 9Trường hợp dữ liệu thô
Example
Bảng sau cho biết số lượng tai nạn máy bay đã xảy ra trên thế giới từ năm 1985 đến năm 1993
Năm 1985 1986 1987 1988 1989 1990 1991 1992 1993
Số tai nạn 22 22 26 28 27 25 30 29 24
Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh và độ lệch chuẩn số lượng tai nạn máy bay trong các năm này
Trang 10Trường hợp dữ liệu có tần số
Xét 1 tập dữ liệu có k giá trị khác nhau x1, , xk
với các tần số tương ứng là n1, , nk Tập dữ liệu này sẽ có tổng cộng n =
k
P
i=1
ni quan sát
• Trung bình mẫu:
¯
x = 1 n
k
X
i=1
nixi
• Phương sai mẫu:
s2n = 1
n
k
X
i=1
ni(xi −¯x)2 =
1 n
k
X
i=1
nix2i
−¯2