dùng cho các bạn sinh viên ĐH- CĐ
Trang 1Người trình bầy: Nguyễn đình Hiền
Trang 2x1, x2, , xn
Trang 3Dùng mẫu quan sát để làm gi?
Thường giả thiết số cá thể của tổng thể rất lớn, không thể khảo sát hết được hoặc khôngcần thiết phải khảo sát hết.Khảo sát mẫu để đưa ra các kết luậnchung đối với tổng thể, gọi là các kết luận thống kê
Một kết luận thống kê cụ thể chỉ có thể đúng hoặc sai Tỷ lệ đúng (xác suất đúng)của kết luận thống kê là mức tin cậy
P, tỷ lệsai (xác suất sai) là mức ý nghĩa α
Thông thường lấy P = 0,95 hay α = 0,05
Trang 4Số liệu thu được khi lấy mẫu gọi là số liệu
gốc Khi chuẩn bị xử lý thì sắp xếp lại
X0+h- X0+h- X0+h- X0+(k-1)h-
x0 + kh Điểm giữa x1 x2 xk
Trang 6a/ Nhật dồ
Trang 8Stat Basic statistics Graphical summary
50 40
30 20
10
Median Mean
32 30
28 26
24 22
1st Q uartile 20.000
M edian 26.500 3rd Q uartile 34.250
M aximum 49.000 24.130 30.737 22.457 31.771
M inimum 11.000
A nderson-Darling N ormality Test
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian
95% C onfidence Interv al for S tDev
9 5 % C onfidence Inter vals
Summary for Dai
Trang 10) (
s
n
i
) 1 (
) ( 1
2 2
k
i i
∑
) 1 (
)
( 1
2 2
x s
k
i i
) 1 (
)
(
1
2 2
x s
k
i i
Trang 11 Thí dụ
Trang 14MiniTab Stat Basic statistics Display Descriptive Statistics
Trang 15Bài 2 Ước lượng kiểm định
2.1 Ước lượng
Tổng thể Θ
Mẫu Tính một số thống kê
Ước lượng khoảng
Trang 16Ước lượng điểm
= 1
tần suất t= m/n là ước lượng của p
X ~ B(n,p) xtb/n là ước lượng của p
Trang 17Ước lượng khoảng
Biến X ~N(µ,σ2)
Mẫu (n, xtb, s2, p)
a- Biết phương sai σ2
b- Khôngbiết phương sai
c- Ước lượng xác suất p
Trang 19Stat Basic statistics One- sample T
Trang 202.2 Kiểm định giả thiết
Bài toán kiểm định nói chung
Hay gặp Giả thiết H0: Θ = Θ 0 Đối thiết H1: Θ ≠ Θ 0 (hai phía)
Đối thiết H1: Θ > Θ 0 (một phía) Đối thiết H1: Θ < Θ 0 (một phía)
Trang 21Hai loại sai lầm khi kiểm định giả thiết
H1 Sai lầm loại 2
mức rủi ro loại 2 Thường viết là β
Kết luận đúng Lực lượng của kiểm định 1- β
Trang 22Kiểm định giả thiết đối với kỳ vọng của biến X phân phối chuẩn N( µ , σ 2 )
Trang 23b/ Không biết phương sai σ2
Trang 26Kiểm định giả thiết đối với phương sai σ2
Trang 29Stat Basic statistics Paired T-test
Trang 30( )
tn
y x
y x U
n n
σ σ
−
=
+
Trang 31So sánh hai trung bình khi biết phương sai
Trang 32b/ Không biết phương sai σx2 và σy2
tn
y x
y x U
Trang 33c/ Không biết phương sai σx2 và σy2
Mấu nhỏ (không phải cả hai mấu >= 30)
Bước 1 So sánh hai phương sai
Nếu chấp nhận ngay từ đầu ”hai phương sai bằng nhau” hoặc qua bước 1 chấp nhận ” hai phương sai bằng nhau” thì làm tiếp bước 2 nếu không thì tính gần đúng
2 2
y tn
x
s F
s
=
2 2
x tn
y
s F
s
=
Trang 35So sánh mẫu độc lập phương sai bằng nhau trong Excel
Trang 36So sánh mẫu độc lập phương sai khác nhau trong Excel
Trang 37MiniTab
Stat Basic statistics 2 variances
Trang 38MiniTab Stat Basic statistics
2 samples T assuming equal variances
Trang 39MiniTab Stat Basic statistics
2 samples T assuming unequal variances
Trang 40II/ So sánh hai xác suất
Trang 413.1 Kiểm định một phân phối
Trang 42MiniTab Stat Tables
Chi square goodness of fit Test
Trang 44MiniTab Stat Tables
Chi square goodness of fit Test
Trang 45Các bước cần làm đối với việc kiểm định một phân phối
Tõ gi¶ thiÕt H0: r1 r2 rk t ng R viÕt c¸c tÇn suÊt fi=ri/R ổ
Trang 463.2 Bảng tương liên
Trang 48MiniTab Stat Tables
Cross tabulation and Chi square
Trang 49Cỏc bước cần làm đối với Bảng tương liờnCác bước cần làm:
Viết giả thiết H0: Hàng và cột độc lập
Tính các tổng hàng THi, tổng cột TCj, tổng toàn bộ N
Tính tần số lý thuyết tij = THi x TCj / N.
Tính dij = (mij – tij)^2/tij
TH TC
χ
= =
Trang 51giong kqua1 solg
Trang 52MiniTab Stat Tables
Cross tabulation and Chi square
Trang 53Theo dõi hai biến định lượng X, Y
Trang 54Xét ba trường hợp
X, Y phân phối chuẩn hai chiều (Binormal)
Đây là trường hợp phổ biến khi xem xét 2 biến định lượng đo trên cùng một cá thể trong mẫu chọn ngẫu nhiên từ một tổng thể
X, Y phân phối ngẫu nhiên hai chiều
X không ngẫu nhiên, chỉ có Y ngẫu nhiên
Phổ biến trong thiết kế thí nghiệm khi theo dói ảnh hưởng của X đến Y
Trang 55Phân phối chuẩn 1 chiều
Hàm mật độ chuẩn với μ = 10 σ= 2,5
Trang 56Phân phối chuẩn hai chiều (Binormal)
Hàm mật độ
Trang 57Hàm mật độ với r = 0,7
Trang 59Chọn X trưoc, với mỗi giá trị của X có nhiều giá trị tương ưng của Y, các giá trị đó phân phối chuẩn với kỳ vọng μX Khi cho
X thay đổi kỳ vọng đó chạy trên một đường thẳng gọi là đường hồi quy tuyến tính Y theo X (y = a + bx)
Chọn Y trước kỳ vọng μY của các X ứng với Y chạy trên hồi quy tuyến tính X theo Y (x
tuyến tính X theo Y (x = c + dy)
Trang 60Kiểm định giả thiết H0: r = 0 đối thiết H1: r <> 0
Ttn=r/sqrt((1- r2)/(n-2)) sqrt là căn bậc hai
so abs(Ttn) với t(a/2, n-2)
Nếu abs(Ttn) <= t(a/2, n-2) chấp nhận H0
HQTT
y = a + bx b = cov(X,Y)/s2x = r sy/sx a = ytb – bxtb
X = c + dy d = cov(X,Y)/s2y = r sx/sy c = xtb – dytb
Dự báo thuận: Cho xdb tìm ydb = a + b*xdb
Dự báo ngược: Cho ydb tìm xdb =(ydb – a)/b
Ý nghĩa sinh học của hệ số b : Khi cho x thêm 1 đơn vị thì y tăng
b đơn vị
Trang 64MiniTab Stat
regression regression
Trang 65MiniTab Stat
regression regression
Trang 66MiniTab Stat
regression Fitted line plot
Trang 67Trường hợp X không ngẫu mhiên, Y ngẫu nhiên Hồi quy TT là đường thẳng tốt nhất theo nguyên tắc bình phương bé nhất Không tính sai số, không kiểm định, chỉ có R 2 có ý nghĩa Dự báo mang tính chất nội suy nhưng về hình thức vẫn có thể tính r, b, a qua các hàm correl, slope, intercept
Trang 70Nếu X chủ động bố trí hay theo dõi, Y ngẫu nhiên thì mô hình hồi quy TT có dạng Y = a + bx + e
sai số e phân phối chuẩn N(0,σ2), các sai số ei độc lập
Có thể tính sai số của r, b, a Có thể kiểm định, có thể dự báo như trường hợp phân phối chuẩn hai chiều
Trang 71Hệ số tương quan r và các hệ số hồi quy a, b được tính kèm
theo sai số và khi dùng đường hồi quy để dự tính dự báo thì có thể tính được sai số dự báo
2 1
2 1
1
)(
)(
))(
(
y y
x x
y y
x
x r
i
n
i n
n
i i
)(
) (
2 2
1 1
2 2
1
n
y y
n
x x
n
y x
y x r
n
i
n
i i
n
i i
i i XY
Trang 76X, Y là 2 biến đo trên cùng một cá thể và được giả thiết ngẫu nhiên phân phối chuẩn 2 chiều
Trang 77X chất độc, Y tăng trọng
Trang 78X chủ động mỗi X đều lặp lại, Y ngẫu nhiên giả thiết Y phân phối chuẩn
Trang 79Kiểm định phương sai bằng nhau
Trang 80Hồi quy tuyến tính Y theo X
Trang 81Hồi quy bậc hai Y theo X
Trang 82Minitab Stat regression