Chương 5 Lý thuyết mẫu 1 Chương 5 Lý thuyết mẫu Khái niệm Mục tiêu chính của thống kê là quan sát , thu thập dữ liệu , thiết kế thí nghiệm , và dùng các phương pháp thích hợp để phân tích dữ liệu , từ[.]
Trang 11
Chương 5: Lý thuyết mẫu
Khái niệm: Mục tiêu chính của thống kê là
quan sát , thu thập dữ liệu , thiết kế thí
nghiệm , và dùng các phương pháp thích hợp để phân tích dữ liệu , từ đó đưa ra kết luận
Các bước thu thập , sắp xếp , biểu diễn ,
tổng hợp dữ liệu được gọi là thống kê mô
tả Phân tích và phiên giải dữ liệu được
gọi là thống kê suy diễn
Trang 22
§1.Một số khái niệm về mẫu
1 Tổng thể:
Khái niệm: Tập hợp tất cả các phần tử để
nghiên cứu theo 1 dấu hiệu nghiên cứu
nào đó gọi là tổng thể Số phần tử của
tổng thể được gọi là kích thước N của nó Đại lượng ngẫu nhiên đặc trưng cho dấu hiệu nghiên cứu gọi là đại lượng ngẫu
nhiên gốc X
Trang 33
Dấu hiệu nghiên cứu được chia ra làm 2 loại: Định lượng và định tính
-Định lượng:
-Định tính:
Gọi a là trung bình tổng thể , p là tỉ lệ tổng thể
gọi là phương sai tổng thể
gọi là độ lệch tổng thể
Chú ý: Định tính là trường hợp riêng của định
lượng với hai lượng là 0 và 1 Cho nên p là
trường hợp riêng của a, còn p.q là trường hợp riêng của
2
2
2
,
Trang 44
2.Mẫu:
Từ tổng thể lấy ngẫu nhiên ra n phần tử để nghiên cứu được gọi là lấy 1 mẫu kích thước n
đại lượng ngẫu nhiên độc lập có cùng phân phối với X.Véc tơ ngẫu nhiên n chiều được gọi là 1 mẫu kích thước n Thực hiện phép thử ta nhận được là giá trị cụ thể hay giá trị thực hành của mẫu W Phép thử có
thể thực hiện nhiều lần , khi ấy gọi là bài toán có lặp
Mẫu chia làm 2 loại: Định lượng và định tính
Mẫu chia thành 2 loại theo cách lấy mẫu là có
hoàn lại và không hoàn lại
1 2
W , n
1, 2 n
w x x x
Trang 55
§2 Các phương pháp mô tả mẫu
1 Bảng phân phối tần số mẫu
Ví dụ 2.1: Từ kho lấy ra 1 số bao gạo được bảng
số liệu:
TL(kg) 48 49 50
Số bao 20 15 25
Định nghĩa 2.1: Bảng phân phối tần số mẫu là:
1
k
i i
k
X x x x
n n n n
Trang 66
Chú ý: (1 khoảng tương ứng với
trung điểm của nó)
2.Tỷ lệ mẫu(Chỉ dành cho mẫu định tính)
Định nghĩa 2.2: Giả sử trong 1 mẫu định tính kích thước n
có đúng m phân tử mang dấu hiệu nghiên cứu Khi ấy tỷ
lệ của mẫu là
Chú ý: Bảng phân phối tần số của mẫu định tính có dạng:
X 0 1
n-m m
,
2
i i
a b
a b x
m
n
i
n
Trang 77
§3 Các đặc trưng của mẫu
1.Trung bình mẫu:
Định nghĩa 3.1 : Xét mẫu
Trung bình của mẫu W là:
Chú ý: (Khi ta xét mẫu định tính)
Từ định lý giới hạn trung tâm ( chương 4 ) ta có :
1 2
W X X, , ,X n
.
f x
Định lý 3.1: Giả sử đại lượng ngẫu nhiên gốc X có kỳ vọng µ và phương sai σ² Khi ấy
2
,
n
1 , 2 , , n
X
Trang 88
2 Phương sai mẫu:
Định nghĩa 3.2 : Phương sai của mẫu W là:
2
1
1 n
i
X
n
Định lý 3.3 :
.
Phân phối của trung bình mẫu trên là:
Trang 99
Định nghĩa 3.3: Phương sai điều chỉnh mẫu là
2
1
2
2
1
n n S
S
n
n
n
-độ lệch chuẩn mẫu -độ lệch chuẩn điều chỉnh mẫu
Chú ý: Kể từ nay ta sẽ chỉ dùng S nên quy ước gọi
phương sai điều chỉnh mẫu là phương sai mẫu và gọi độ lệch chuẩn điều chỉnh mẫu S là độ lệch chuẩn mẫu S
Định nghĩa 3.4: Sai số chuẩn ( mẫu ) cho giá trị trung bình là
S se
n
Chú ý: Sai số chuẩn ( tổng thể ) cho giá trị trung bình là
SE
n
Trang 10Cách dùng máy tính bỏ túi ES
Mở tần số : Shift Mode Stat On
• Nhập: Mode Stat 1-var
AC: báo kết thúc nhập
Cách đọc kết quả : Shift Stat Var
1
49, 0833
0, 8620
n n
x
48 20
49 15
50 25
Trang 11Đóng tần số : Shift Mode Stat Off
• Nhập: Mode Stat 1-var
AC: báo kết thúc nhập
Cách đọc kết quả : Shift Stat Var
1
0, 938
0,1682
1 0,1881
n n
x
11
Chú ý : Khi đóng cột tần số , máy tính sẽ tự hiểu các tần số đều bằng 1
.62 1.08 1.07 99 93
ij
x
Trang 12Cách dùng máy tính bỏ túi MS :
Vào Mode chọn SD Xóa dữ liệu cũ: SHIFT CLR SCL =
Cách nhập số liệu : 48; 20 M+
49; 15 M+
50; 25 M+
Cách đọc kết quả:
SHIFT S – VAR
12
1
49, 0833
0, 8620
n n
x
Trang 1313
Định nghĩa 3.4: Xét một mẫu kích thước n Xếp n quan
sát này theo thứ tự tăng dần:
Trung vị mẫu là giá trị nằm chính giữa dãy số này Cụ thể , nếu n=2k+1 thì trung vị là
Nếu n=2k thì trung vị là trung bình cộng
Định nghĩa 3.5: Trung vị mẫu chia mẫu thành hai phần
bằng nhau Trung vị của nửa mẫu nhỏ được gọi là điểm
tứ phân vị (mẫu) thứ nhất (dưới) , và trung vị của
nửa mẫu lớn được gọi là điểm tứ phân vị (mẫu) thứ ba
(trên) Hiệu giữa điểm tứ phân vị trên và điểm tứ
phân vị dưới được gọi là khoảng tứ phân vị (mẫu) và ký hiệu là IQR Bộ năm giá trị gồm giá trị nhỏ nhất , giá trị lớn nhất , trung vị và các điểm tứ phân vị trên , dưới
được gọi là bộ tóm tắt 5 điểm của dữ liệu ,
3 Trung vị , các điểm tứ phân vị , khoảng tứ phân vị mẫu:
1 2 n
x x x
1
k
x
1 (x k x k ) / 2
1
Q
3
Q
Trang 1414
Ví dụ 3.1:
Bài tập: