Thông tin đầu tiên và nhiều khi cũng là thông tin duy nhất mà chúng ta dựa vào để nghiên cứu, phân tích chính là các kết quả mà chúng ta quan sát được, vì vậy các kết quả này phải đảm
Trang 1CHƯƠNG 4: LÝ THUYẾT MẪU
Trang 2 Thông tin đầu tiên và nhiều khi cũng là thông tin duy nhất mà chúng ta dựa vào để nghiên cứu, phân tích chính là các kết quả mà chúng
ta quan sát được, vì vậy các kết quả này phải đảm bảo tính chính xác, tính ngẫu nhiên của
nó, phải là các đại diện một cách trung thực cho hiện tượng hoặc cho đại lượng mà chúng
ta đang nghiên cứu.
Xuất phát từ thông tin sai lệch thì các kết luận nhận được sẽ phản ánh không đúng hiện tượng nghiên cứu, thậm chí còn làm cho ta
nghi ngờ ngay cả tính hiệu quả của phương pháp ta sử dụng Do vậy trước tiên ta quan
tâm đến việc thu thập thông tin ban đầu.
BÀI 4.1: CÁC PHƯƠNG PHÁP LẤY MẪU ĐƠN GIẢN
Trang 3 Các quan sát độc lập hay các phép thử độc lập: Các quan sát được tiến hành một cách độc lập với nhau, kết quả của quan sát ( phép thử ) này không phụ thuộc vào kết quả quan sát ( phép thử ) khác và cũng không ảnh hưởng đến khả năng xảy ra kết quả quan sát (
phép thử ) khác
Các phép thử lặp: Các phép thử được tiến hành trong các điều kiện hoàn toàn như nhau.
Lấy mẫu ngẫu nhiên có hoàn lại: rút ngẫu nhiên từ một tập nào đó ra một phần tử Ghi lại các số đặc trưng cần thiết từ phần tử đó, sau đó trả nó trở lại tập ban đầu trước khi rút tiếp ngẫu nhiên lần sau.
Lấy mẫu ngẫu nhiên không hoàn lại: tương tự như trên, chỉ khác ở chỗ các phần tử được rút ra sẽ không được trả lại tập ban đầu.
BÀI 4.1: CÁC PHƯƠNG PHÁP LẤY MẪU ĐƠN GIẢN
Trang 4Phương pháp thu thập thông tin
Trực tiếp Gián tiếp
Qua xử sự bằng lời Qua hành vi Qua văn bản
Phương pháp
phỏng vấn
Phương pháp nghiên cứu
Phương pháp phân tích tư liệu
Trang 5 Tiến hành n quan sát độc lập về biến ngẫu nhiên X nào đó ta gọi
là việc quan
sát thứ i về biến ngẫu nhiên Khi đó ( ) được gọi là mẫu ngẫu nhiên, n được gọi là cỡ mẫu hay số lần quan sát Như vậy mẫu ngẫu nhiên cỡ n thực chất là n biến ngẫu nhiên độc lập, cùng phân phối như biến ngẫu nhiên X
Ta gọi là kết quả quan sát được ở lần thứ i Khi đó ( )
là n giá trị cụ thể ta quan sát được Đó là một giá trị cụ thể mà
ngẫu nhiên ( ) nhận
Từ nay về sau, khi nói rằng ta có một mẫu ngẫu nhiên cỡ n được rút ra từ biến ngẫu nhiên X, ta sẽ hiểu đó là n biến ngẫu
nhiên độc lập cùng phân phối nếu ta không quan tâm đến kết quả
cụ thể quan sát được mà ta muốn nghiên cứu các tính chất chung của mẫu, của các đặc trưng mẫu, còn ta sẽ hiểu đó là n giá trị cụ thể quan sát được nếu ta quan tâm đến kết quả cụ thể và ta cần
những tính toán cụ thể
Như vậy chúng ta có trong tay một mẫu ngẫu nhiên, dựa
trên đó ta sẽ dùng các phương pháp và kết quả của thống kê để phân tích và rút ra những kết luận cần thiết
BÀI4 2: MẪU NGẪU NHIÊN
n
X X
X1, 2, ,
n
X X
X1, 2, ,
n
X X
X1, 2, ,
Trang 6Xuất phát từ các mẫu cụ thể khác nhau ta nhận được các
hàm phân phối thực nghiệm khác nhau Đồ thị của
chúng đều là các đường bậc thang Các đường bậc thang khác nhau đều có chung một tính chất là: khi cỡ mẫu
tăng vô hạn các hàm phân phối thực nghiệm tiến đến
hàm phân phối lý thuyết cần tìm Điều đó được thể hiện qua định lý sau:
Định lý Glivencô: giả sử là hàm phân phối của biến ngẫu nhiên X mà ta đang cần tìm là hàm phân phối thực
nghiệm nhận được từ mẫu ngẫu nhiên cỡ n Khi đó
P{ khi n }= 1
BÀI 4.3: PHÂN PHỐI THỰC NGHIỆM
0
n( ) ( ) F
x F
x x
Trang 7BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
0
0.05
0.1
0.15
0.2
0.25
300 550 850 1150 1450
Trang 8BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
Trang 91 2
8
10
18
17
12
9
7
6
Tổ chức đồ thực nghiệm
BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
Trang 10khoảng
glucoza
số người khoảng số người
(65-70)
(70-75)
(75-80)
(80-85)
(85-90)
(90-95)
(95-100)
1 0 2 5 8 16 18
(100-105) (105-110) (110-115) (115-120) (120-125) (125-130)
17 16 9 5 2 1
BÀI 4.4 ĐA GIÁC TẦN SUẤT VÀ TỔ CHỨC ĐỒ
Trang 11Bài 4.5: CÁC ĐẶC TRƯNG MẪU
DX
X;
n
X X
p ' i 1
Trang 12Kỳ vọng mẫu:
Do X1,X2,…,Xn là các biến ngẫu nhiên độc lập cùng phân phối như X, nên kỳ vọng
mẫu là một biến ngẫu nhiên Do đó ta lại
tìm kỳ vọng và phương sai của :
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
i
i X E
X
1
n
1 X
X
1 X
n
1 X
n
1 i
n
E E
n n
DX DX
n n
DX n
X
D
n
i
2
2 1
2
1
Trang 13Phương sai mẫu:
Ta có:
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
1
2
2
X
X n
X
X n
X D s
n
i
i
1
2 1 s
i
X
2
1
-X
n
n
i
2
1
n
n n
DX DX
X D DX
n n
Trang 14Vì giá trị trung bình của s2 không đúng bằng , do đó nhiều khi thay cho s2 ta dùng.
Khi đó
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
2
2
1
2
1 1
1
n
n X
X n
s
n
i
2 2
1
s
E 1
-n
n sˆ
n
n n
n
Trang 15Cách tính và
Ta lập bảng tính như sau:
Nếu các giá trị mẫu không gọn, lại cách đều nhau thì ta có thể thu gọn số liệu bằng
phép biến đổi tuyến tính
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
X s 2
xi mi ui miui mi u2
h
x
x
ui i 0
Trang 16 Từ bảng tính ta tính được
phương tiện thô sơ thì việc lập bảng tính và thu gọn số liệu là rất cần thiết và có lợi.
chọn mỗi khoảng một điểm đại diện, thông thường là điểm giữa khoảng lúc đó ta lại có mẫu thu gọn
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
k
i
i
u n
u
1
i m 1
2
.
n
u h x
. u
Trang 17(nghìn đồng)
mi x i m i /n u i u i ×m i
2 0 15 31 65 52
57
40 20 11 2 4 0 1
300 350 450 550 650 750
850
950 1050 1150 1250 1350 1450 1550
0,006 0
0,05 0,103 0,216 0,173
0,19
0,133 0,066 0,036 0,006 0,013 0
0,003
-6 -5 -4 -3 -2 -1
0
1 2 3 4 5 6 7
-12 0 -60 -93 -130 -52
0
40 40 33 8 20 0 7
72 0 240 279 260 52
0
40 80 99 32 100 0 49
2
i
i u
m
1500
] 1500 1400
(
] 1400 1300
(
] 1300 1200
(
] 1200 1100
(
1100 1000
1000
900
900
800
800
700
700
600
] 600
500
(
] 500
400
(
] 400
300
(
300
Bài 4.5: CÁC ĐẶC TRƯNG MẪU
Trang 18Qua bảng trên ta tính được :
780 ,
47 778
, 4 100
784 )
66 , 0 ( 100
850
778 ,
4 )
066 ,
0
( 300
1303 1
66 ,
0 300
199 1
2 2
2 2
0
2 1
2 2
2
1
u x
k
i
i i
u
k
i
i i
s h
S
u h
X X
u u
m n
s
u
m n
u
Bài 4.5: CÁC ĐẶC TRƯNG MẪU