Phần 9 - Suy luận và so sánh về các giá trị trung bình. Chương này gồm có những nội dung chính sau: Các suy luận về các trị trung bình (Inferences about means), so sánh các trị trung bình (Comparing means), mẫu đôi (Paired samples). Mời các bạn cùng tham khảo.
Trang 1Phần 09 Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
©2010, Nguyễn Duy Long, Tiến Sỹ 1
Các suy luận về các trị trung bình
So sánh các trị trung bình
So sánh các trị trung bình
Mẫu đôi
©2010, Nguyễn Duy Long, Tiến Sỹ 2
Trang 2Inferences about means
©2010, Nguyễn Duy Long, Tiến Sỹ 3
Ta làm việc với trị trung bình (means): khoảng tin
chắc và kiểm nghiệm giả thiết dựa trên mô hình
phân phối mẫu
Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng
mô hình phân phối mẫu cho trị trung bình là mô
hình chuẩn với trị trung bình μ và độ lệch chuẩn là:
n
4
©2010, Nguyễn Duy Long, Tiến Sỹ
Trang 3 Với các phần, có sự liên hệ giữa giá trị của phần
(proportion value) và độ lệch chuẩn của phần của
mẫu (sample proportion)
Với trị trung bình thì không! Biết trị trung bình của
mẫu không cho ta biết điều gì về
Ta làm tất cả những gì có thể: ước lượng thông số
quần thể σ với trị thống kê của mẫu s
( )
SD y
Sai số chuẩn của trị trung bình của mẫu:
SE y
n
5
©2010, Nguyễn Duy Long, Tiến Sỹ
Ta có thêm sự biến đổi trong sai số chuẩn từ s, độ
lệch chuẩn của mẫu ệ
◦ Ta cần xét sự biến đổi thêm này để không lẫn (mess up)
với các tính toán về biên sai
Và hình dạng (shape) của mô hình mẫu thay đổi –
mô hình không còn là mô hình chuẩn nữa
◦ Vậy mô hình mẫu ra sao?
6
©2010, Nguyễn Duy Long, Tiến Sỹ
Trang 4 William S Gosset, nhân viên công ty bia Guinness
ởIreland, tìm ra mô hình mẫu
Mô hình mẫu do Gosset tìm ra được gọi là t của
Student (Student’s t)
◦ Các mô hình t của Student hình thành một tập các phân
phối liên quan phụ thuộc vào thông số bậc tự do ( degrees
of freedom ), gọi tắc là df.
◦ Viết tắc mô hình này dưới dạng t df
7
©2010, Nguyễn Duy Long, Tiến Sỹ
Mô hình phân phối mẫu thực tiễn cho các trị trung bình
Khi các điều kiện thỏa, trị trung bình mẫu được chuẩn hóa:
Theo mô hình phân phối t của Student vớin– 1 bậc tự do
Ta ước lượng sai số chuẩn theo:
y t
SE y
s
SE y
với n là kích thước của mẫu
n
8
©2010, Nguyễn Duy Long, Tiến Sỹ
Trang 5 Khi Gosset sửa mô hình cho sự không chắc chắn thêm (extra
uncertainty), biên sai ME lớn hơn.
◦ Khoảng tin chắc sẽ rộng hơn một chút
◦ Khoảng tin chắc sẽ rộng hơn một chút
Các mô hình t ( t-models ) là một mốt, đối xứng, và có hình
chuông tựa như mô hình chuẩn
◦ Các mô hình t với vài bậc tự do có đuôi dày hơn mô hình chuẩn.
◦ Khi df tăng, các mô hình t càng giống mô hình chuẩn
◦ Mô hình t với df vô tận thì chính là mô hình chuẩn.
Mô hình chuẩn Mô hình t với 2 bậc tự do
9
©2010, Nguyễn Duy Long, Tiến Sỹ
Mô hình t khác nhau bởi
bậc tự do (n-1)
Bảng tra cho giá trị tới hạn
Bảng tra cho giá trị tới hạn
của mô hình t (t-model
critical values)
Với n = 16 và C = 95%, t*=
+/-2.131
◦ Nếu n = 8 và kiểm nghiệm
một phương đuôi trên với
=5%, t*=1.895
©2010, Nguyễn Duy Long, Tiến Sỹ
Một phần của Bảng T (tr.A-58)
10
Trang 61) Giả định tính độc lập:
◦ Điều kiện ngẫu nhiên hóa: Dữ liệu từ mẫu ngẫu
nhiên hay thí nghiệm được ngẫu nhiên hóa thích
hợp
◦ Điều kiện 10%
©2010, Nguyễn Duy Long, Tiến Sỹ 11
2) Giả định quần thể chuẩn:
◦ Điều kiện gần chuẩn “Nearly Normal”:Dữ liệu từ
phân phối một mốt và đối xứng
Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất
Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất.
Kích thước mẫu càng nhỏ (n < 15), dữ liệu càng nên theo
mô hình chuẩn
Với các kích thước mẫu trung bình (n giữa15 và 40), t sẽ
hữu hiệu khi dữ liệu là một mốt và gần đối xứng
Với kích thước mẫu lớn hơn, t sẽ an toàn để dùng thậm chí
dữ liệu là bị lệch.
©2010, Nguyễn Duy Long, Tiến Sỹ 12
Trang 7 Khi các điều kiện thỏa, có thể tìm khoảng tin chắc
cho trị trung bình của mẫu, μ
Khoảng tin chắc:
Với sai số chuẩn của
trị trung bình của mẫu:
1
n
CI y t SE y
*
t
SE y
n
Giá trị tới hạn phụ thuộc vào mức tin chắc, C, và
số bậc tự do, n – 11
*
n
t
©2010, Nguyễn Duy Long, Tiến Sỹ 13
Các điều kiện cho kiểm nghiệm một mẫu ( one-sample t-test )
cho trị trung bình giống với khoảng t cho một mẫu ( one-sample
t-interval )
Kiểm nghiệm giả thiết H 0 : = 0 dùng trị thống kê kiểm
Kiểm nghiệm giả thiết H 0 : 0 dùng trị thống kê kiểm
nghiệm:
với sai số chuẩn của trị trung bình của mẫu:
0
1
n
y t
SE y
SE y
n
Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theo
mô hình t của Student với n – 1 bậc tự do
©2010, Nguyễn Duy Long, Tiến Sỹ 14
Trang 8 Nhà sản xuất rượu kiểm tra dây chuyền đóng chai
750ml để đảm bảo việc rót đủ rược, nếu khống phải
dùng dây chuyền và kiểm tra mọi thứ, một qui trình
mất thời gian và tốn kém Trong khi một số biến đổi
là tự nhiên và chấp nhận được, mẫu 15 chai có
dung tích trung bình 740ml và độ lệch chuẩn 20ml
◦ Tìm 95% CI cho dung tích trung bình của các chai rượu
◦ Nếu ta quan tâm việc đóng chai lớn hơn hay nhỏ hơn dung
tích trên nhãn và sẽ chấp nhận mức = 5%, dùng loại kiểm
nghiệm nào?
Ta có dừng dây chuyền không?
◦ Nếu ta chỉ quan tâm đóng chai ít rượu hơn, loại kiểm
nghiệm gì cần thực hiện? Nếu = 5%, ta vẫn dùng cùng
mức tin chắc ở trên?
©2010, Nguyễn Duy Long, Tiến Sỹ 15
Comparing Means
©2010, Nguyễn Duy Long, Tiến Sỹ 16
Trang 9 Các thí nghiệm để so sánh hai nhóm thường
xảy ra cả trong khoa học và công nghiệp y g ọ g g ệp
So sánh hai trị trung bình không khác mấy so
với so sánh hai phần
©2010, Nguyễn Duy Long, Tiến Sỹ 17
Khi các điều kiện thỏa, sự khác nhau được
chuẩn hóa của mẫu giữa các trị trung bình g ị g
của hai nhóm độc lập,
có thể mô hình bởi mô hình t của Student với
bậc tự do theo công thức đặc biệt Sai số
ẩ
) (
) (
) (
2 1
2 1 2 1
y y SE
y y
t
chuẩn được ước tính:
©2010, Nguyễn Duy Long, Tiến Sỹ 18
2 2
1
2 ) ( y1 y2 s n n s
Trang 10 Xác định bậc tự do theo:
2 2
2 s
s
Qui tắc dễ hơn:
◦ df = min(n1, n2) nhưng không lớn hơn (n1 + n2 – 2)
2 2
2 2 1 2 1 2 1
2 1 1 1 1
2 2
2 1 1
) ( )
(
) (
n
s n n
s n
n
s n
s
df
©2010, Nguyễn Duy Long, Tiến Sỹ 19
Giả định tính độc lập
Giả định quần thể chuẩn
Giả định quần thể chuẩn
Giả định các nhóm độc lập
©2010, Nguyễn Duy Long, Tiến Sỹ 20
Trang 11 Khi các điều kiện thỏa, khoảng tin chắc cho
sự khác nhau giữa các trị trung bình của hai ự g ị g
nhóm độc lập, µ1 - µ2, là:
) (
) ( y1 y2 tdf* SE y1 y2
©2010, Nguyễn Duy Long, Tiến Sỹ 21
Kiểm nghiệm t cho hai mẫu ( two-sample
t-test )
H0: µ1 - µ2 = Δ0
Trị thống kê kiểm nghiệm: ( ( ) )
2 1
0 2 1
y y SE
y y
t
©2010, Nguyễn Duy Long, Tiến Sỹ 22
Trang 12Paired Samples
©2010, Nguyễn Duy Long, Tiến Sỹ 23
Dữ liệu đôi ( paired data ) xuất hiện dưới nhiều
cách.
sau một liệu pháp
Không thể dùng các phương pháp hai mẫu ở
phần trên cho dữ liệu đôi.
©2010, Nguyễn Duy Long, Tiến Sỹ 24
Trang 13Tên Dặm lái xe với tuần
làm việc 5 ngày Dặm lái xe với tuần làm việc 4 ngày Khác nhau
©2010, Nguyễn Duy Long, Tiến Sỹ 25
y
Nguồn: De Veaux, 2006, tr.574
Vì ta quan tâm đến các sự khác nhau, ta coi
tất cả chúng (cột ngoài cùng bên phải) như
thể chúng là dữ liệu, bỏ qua hai cột đầu.
Ta chỉ có một cột các giá trị để xem xét, ta có
thể dùng kiểm nghiệm t một mẫu (
Về tính toán, kiểm nghiệm t đôi ( paired
t-test ) chỉ là kiểm nghiệm t một mẫu cho các trị
trung bình của sự khác nhau từng đôi
cặp
©2010, Nguyễn Duy Long, Tiến Sỹ 26
Trang 14 Giả định dữ liệu đôi
Giả định tính độc lập
Giả định tính độc lập
Giả định quần thể chuẩn
©2010, Nguyễn Duy Long, Tiến Sỹ 27
Khi các điều kiện thỏa, ta có thể kiểm nghiệm
trị trung bình của sự khác nhau từng đôi có ị g ự g
khác nhau đáng kể so với không.
Giả thiết rỗng H0: µ0 = Δ0
Trị số thống kê: 1 ( 0)
d SE
d n
Sai số chuẩn:
©2010, Nguyễn Duy Long, Tiến Sỹ 28
n
s d
d
Trang 15 Khi các điều kiện thỏa, ta có thể tìm khoảng
tin chắc cho trị trung bình của sự khác nhau ị g ự
từng đôi:
Với
) (
*
1 SE d t
n
s d
d
©2010, Nguyễn Duy Long, Tiến Sỹ 29
©2010, Nguyễn Duy Long, Tiến Sỹ 30