Slide 1 Kiểm tra bài cũ CHƢƠNG 3 BÀI 1 ĐẠI LƢỢNG NGẪU NHIÊN HAI CHIỀU RỜI RẠC BÀI 2 ĐẠI LƢỢNG NGẪU NHIÊN HAI CHIỀU LIÊN TỤC I ĐỊNH NGHĨA VÀ BẢNG PHÂN PHỐI ĐỒNG THỜI 1 Định nghĩa ĐLNN 2 chiều (véctơ ngẫu nhiên 2 chiều) rời rạc là một bộ (có thứ tự) 2 đại lƣợng ngẫu nhiên rời rạc X, Y Ký hiệu V = (X, Y) Ví dụ Tung đồng thời hai con xúc xắc, gọi X là số chấm xuất hiện trên con xúc xắc thứ nhất, Y là số chấm xuất hiện trên con xúc xắc thứ hai 2 Bảng phân phối xác suất đồng thời X là đại lƣợng ngẫu n.
Trang 1Kiểm tra bài cũ
Trang 31 Định nghĩa
ĐLNN 2 chiều (véctơ ngẫu nhiên 2 chiều) rời rạc là một bộ
(có thứ tự) 2 đại lƣợng ngẫu nhiên rời rạc X, Y
Ký hiệu V = (X, Y)
Ví dụ: Tung đồng thời hai con xúc xắc, gọi X là số chấm xuất hiện trên con xúc xắc thứ nhất, Y là số chấm xuất hiện trên con xúc xắc thứ hai
Trang 42.Bảng phân phối xác suất đồng thời
X là đại lƣợng ngẫu nhiên rời rạc nhận giá trị x1 , x2, …, xn
Y đại lƣợng ngẫu nhiên rời rạc nhận giá trị y1 , y2, …, ym
Bảng phân phối xác suất đồng thời của (X, Y):
Trang 5II PHÂN PHỐI LỀ (BIÊN DUYÊN)
1 Phân phối lề của X
P[X = xi ] = với i = 1, 2,
j ij p
Trang 6Ví dụ
Trang 72 Phân phối lề của Y
P[Y = yj] = , j = 1, 2,
i ij
p
Trang 8Ví dụ
Trang 9III HÀM CỦA HAI ĐLNN
Cho (x,y) là hàm hai biến
Nếu X, Y là hai ĐLNN rời rạc thì ĐLNN Z = (x,y) cũng là
một ĐLNN rời rạc
Ta nói Z là hàm của X, Y
P(Z = a) = P{ X = x, Y = y} mà (x,y) = a
Trang 10Ví dụ
Trang 11IV ĐỘC LẬP VỀ XÁC SUẤT CỦA X VÀ Y
Trang 12V Các tham số đặc trƣng của biến ngẫu nhiên
) ,
( )
\
(
j y Y
P
j y Y
i x X
P j
y Y
i x X
) ,
( )
\
(
i x X
P
j y Y
i x X
P i
x X
j y Y
)
\ ( X xi Y y P X xi
)
\ (Y y j X x P Y y j
P
Trang 13Ví dụ
Trang 142 HIỆP PHƯƠNG SAI, HỆ SỐ TƯƠNG QUAN
a, Hiệp phương sai
Cov(X, Y) = E(XY) – EX.EY
Trang 15b, Hệ số tương quan
DY DX
Y E X E Y
X
E r
.
) ( ).
( )
(
ii Nếu r = 0 ta nói X và Y không tương quan
r = 1 ta nói X và Y tương quan tuyến tính
hay
DY DX
Y X
Cov r
.
) , (
Trang 16Ví dụ
Trang 18CHƯƠNG IV MẪU THỐNG KÊ VÀ ƯỚC LƯỢNG
Phần 2.Ước lượng tham số của biến ngẫu nhiên
•Khái niệm ước lượng
•Các bài toán ước lượng khoảng
Trang 19I.M ỘT SỐ KHÁI NIỆM CƠ BẢN
1.1.Biến ngẫu nhiên gốc
1.2.Phương pháp nghiên cứu 1.3.Tổng thể
Trang 201.1.Biến ngẫu nhiên gốc
Những khái niệm cơ bản của thống kê toán là đối tượng nghiên cứu, dấu hiệu nghiên cứu và đại lượng nghiên cứu
gốc chính là đại lƣợng nghiên cứu, nhận các giá trị ngẫu nhiên tùy từng đối tƣợng nghiên cứu
Trang 211.2.Phương pháp nghiên cứu
Nghiên cứu tổng thể : nghiên cứu toàn bộ các đối tượng theo
dấu hiệu nghiên cứu đã xác định
Nghiên cứu mẫu : nghiên cứu bộ phận, từ tổng thể nghiên cứu ta lấy ra một tập con và nghiên cứu các phần tử trong tập con đó
Trang 231.3.Tổng thể
các đại lƣợng nghiên cứu của tổng thể hay trên biến ngẫu
nhiên gốc, phản ánh một khía cạnh của tổng thể, gọi là tham
số của tổng thể
Trang 25phân phối với X
Tiến hành một phép thử với mẫu ngẫu nhiên
thì đƣợc gọi là mẫu cụ thể (mẫu thực nghiệm)
(x1 , x2 ,…,xn )
2.2 Mẫu ngẫu nhiên và mẫu cụ thể
Trang 26ni: số lần X nhận giá trị xi , i = 1,2,…,k, hay gọi là tần số;
∑ni = n và n được gọi là dung lượng mẫu (kích thước mẫu)
Trang 282.4.Các tham số đặc trƣng mẫu
2.4.1 Kỳ vọng mẫu (Trung bình mẫu)
a) Định nghĩa: Giả sử cho (X1, X2, , Xn) là mẫu ngẫu nhiên Ta gọi:
x n
x
x 1. 1 2. 2 k. k
Trang 29Ví dụ
Trang 302.4.2 Phương sai mẫu
a) Định nghĩa: Giả sử cho (x1, x2,
) (
1
x x
n n
'
)
( 1 1
1 )
n
n x
n n
n
ES2 1
Trang 312.4.3 Độ lệch tiêu chuấn mẫu
Độ lệch chuẩn mẫu( chưa hiệu chỉnh) : S
Độ lệch chuẩn mẫu (hiệu chỉnh) : S
Độ lệch chuẩn mẫu được xác định là căn bậc hai của phương sai mẫu
Trang 32III Qui luật phân phối của các tham số mẫu
n1, n2 thì
) / ,
N(
~ 2 n
X
) 1 , 0 (
~ )
(
N n a
'
) (
S
n a X
có phân phối Student (n – 1) bậc tự do Khi n khá lớn thì phân phối Student hội tụ khá nhanh về phân phối chuẩn tắc, do đó với n
> 30 ta có thể xem T ~ N(0, 1)
) 1, 0 (
~ ) (
) (
2
2 2 1
2 1
2 1 2 1
N
n n
a a X X U
Trang 3434
Khái niệm ước lượng thường được dùng trong thực tế Ví dụ
để đánh giá trình độ học tập của học sinh,
ta tính điểm trung bình một học kì nào đó
Điểm trung bình là một ước lượng điểm số của học sinh, nó
dựa vào thông tin quá khứ là tất cả các điểm mà hs nhận
tổng thể dựa vào quan sát trên mẫu lấy ra từ tổng thể
=> 1 mẫu
Trang 352 PP ước lương bằng khoảng tin cậy
Xét là tham số chưa biết
Với giá trị 0 1, nếu ký hiệu mức xác suất cho phép sai lầm là thì xác suất kết luận đúng là = 1 -
, ta có:
P( 1 < < 2 ) =
Khi đó, khoảng ( 1, 2) gọi là khoảng tin cậy cho
tham số với độ tin cậy = 1 -
Trang 36II.Các bài toán ước lượng khoảng
Trang 371 TH1: Biết phương sai 2
Bài toán 1 Ước lượng khoảng cho kỳ vọng của biến ngẫu nhiên theo phân phối chuẩn
2 TH2: Phương sai 2 chưa biết
Giả sử tổng thể X có phân phối chuẩn, ký hiệu X N (, 2 ) tức là
Thực hiện 1 phép thử với mẫu ngẫu nhiên (X1 , X2 ,…, Xn ), thu được mẫu cụ thể (x1 , x2 ,…, xn )
Trang 38 Khoảng tin cậy đối xứng của :
sai số (độ chính xác)
2 /
,
n
s x
U n
)
( x x
Trang 39Ví dụ
Trang 40Phân phối Student - t
Ký hiệu: là phân vị mức của biến ngẫu nhiên T có
phân phối Student với n bậc tự do
n
t
Trang 41 Khoảng tin cậy đối xứng:
Viết khoảng tin cậy bên phải? Bên trái?
với sai số (độ chính xác)
) ,
( x x
1 2 /
.
t n
s
)
,
s x
t n
s x
hay
Trang 42 Khoảng tin cậy bên phải (dùng để ƣớc lƣợng giá trị tối thiểu của ):
Khoảng tin cậy bên trái (dùng để ƣớc lƣợng giá trị tối đa của ):
Trang 43Ví dụ
Trang 44Với độ tin cậy cho trước ta thấy mối liên hệ giữa kích thước mẫu n và độ dài khoảng tin cậy:
Kích thước mẫu càng lớn thì khoảng tin cậy càng hẹp nghĩa
là độ chính xác của ước lượng càng cao, sai số càng nhỏ
Hạn chế khi n lớn: mất nhiều thời gian và công sức
nhiêu để đạt được độ chính xác mong muốn?
XÁC ĐỊNH KÍCH THƯỚC MẪU
Trang 45* Xác định cỡ mẫu bài toán ước lượng : chưa biết
TH1: n 30
TH2: n > 30
làm tương tự như tìm cỡ mẫu ở trên
+Nếu n1 nguyên thì cỡ mẫu = n1
+Nếu n1 không nguyên thì cỡ mẫu = [n1] +1
1 2 / 1
.
t n
s
2 / 1
Trang 46Ví dụ
Trang 47Giả sử n là số lần thực hiện phép thử (thí nghiệm, quan sát)
Bài toán 2 Ƣớc lượng khoảng cho tỉ lệ
p (xác suất)
m là số phần tử thoả mãn điều kiện đang xét
Ví dụ: Lấy ngẫu nhiên 200 sản phẩm ở một kho hàng thấy có 21 phế phẩm Gọi tỉ lệ phế phẩm ở kho hàng là
p Tìm tỉ lệ phế phẩm ở mẫu (f =? )
f = 21/200 = 0,105
là tỉ lệ ở mẫu
p là tỉ lệ ở tổng thể (cần ƣớc lƣợng)
Trang 48m là số phần tử thoả mãn điều kiện đang xét
Khoảng tin cậy đối xứng: p (f - , f + ) với / 2 f (1 f )
U
n
Viết khoảng tin cậy bên phải? Bên trái?
Khoảng tin cậy bên trái (dùng để ƣớc lƣợng giá trị tối đa
(
,
)1
(
n
f
f U
f n
f
f U
Trang 49*CỠ MẪU ƢỚC LƢỢNG CHO TỈ LỆ
+Nếu n1 nguyên thì cỡ mẫu = n1+Nếu n1 không nguyên thì cỡ mẫu = [n1] +1
n
f f
/ 1
) 1
Trang 51Khoảng tin cậy “đối xứng”:
Khoảng tin cậy bên trái:
Khoảng tin cậy bên phải:
Phân phối khi bình phương, ký hiệu 2
1 ( 2 2 / 1
2 )
1 ( 2 2 /
)(
1,
)(
1
s
n s
n
n n
1 ( 2 1
)(
1,
b) Chưa biết kỳ vọng của biến ngẫu nhiên gốc
Viết khoảng tin cậy bên phải? Bên trái?
Bài toán 3 Ước lượng khoảng cho phương sai của biến ngẫu nhiên theo phân phối chuẩn
Trang 52Kiểm tra bài cũ
Trang 54Chương 5:
Kiểm định giả thiết
thống kê
Trang 55Ví dụ: chiều cao trung bình của người dân vùng A là 1,55m
Tỉ lệ học sinh giỏi ở trường B là 20% Bác bỏ hay
chấp nhận
Trang 56Tổng kết các dạng (với 0 là số đã biết)
c, bài toán kiểm
Xét một bài toán với các quy ƣớc sau:
Mỗi bài toán chỉ có hai tình huống (gọi là giả thiêt H0 và đối thiết
Trang 57Các bước giải bài toán kiểm định GTTK:
Bước 1: Thiết lập bài toán với giả thiết H0 và đối thiết H1
Bước 2: Xây dựng tiêu chuẩn kiểm định G và
miền bác bỏ giả thiết, kí hiệu W
Trang 58KIỂM ĐỊNH KỲ VỌNG (TRUNG BÌNH)
Giả sử X là biến ngẫu nhiên có phân phối chuẩn N(μ, 2) với EX = chưa biết (ta sẽ kiểm định) và μ0 là giá trị cho trước
DẠNG 1
a) Trường hợp phương sai 2 đã biết:
b) Trường hợp phương sai 2 chưa biết
Trang 59Bài toán 3: Kiểm định bên phải H0 : = 0
H1 : > 0
Miền bác bỏ giả thiết là: W = (U , +)
Bài toán 2: Kiểm định bên trái H0 : = 0
H1 : < 0
Miền bác bỏ giả thiết là: W = (- , -U )
Bài toán 1: Kiểm định hai phía H0 : = 0
H1 : ≠ 0
Miền bác bỏ giả thiết là: W = (- , -U/2 ) (U/2 , +)
TH1: n ≥30
n s
Trang 60Ví dụ :
Trang 61TH2:n<30
Bài toán 1: Kiểm định hai phía H0 : = 0 /H1 : ≠ 0
Miền bác bỏ giả thiết là: W = (- , -t (n-1)
/2 ) (t (n-1)
/2 , +)
Xác định miền bác bỏ hai bài toán còn lại?
n s
x
Trang 62VD
Trang 64VD
Trang 65DẠNG 3:
KIỂM ĐỊNH VỀ PHƯƠNG SAI CỦA BIẾN
NGẪU NHIÊN PHÂN PHỐI CHUẨN
:
2 0
2 1
2 0
2 0
Trang 66) (
) 1
(
s
n G
Trang 67vd
Trang 691 HỆ SỐ TƯƠNG QUAN
độ phụ thuộc tuyến tính của hai biến
EY EX
XY E
.)
với E(XY) = i j x i y j p ij trong đó pij
là phân phối đồng thời của (X, Y)
Tính chất
1) -1 1 2) Nếu X, Y độc lập thì
= 0 3) Khi > 0 thì Y có xu hướng tăng cùng X Khi < 0 thì Y có xu hướng giảm cùng X
Trang 70Ví dụ: Cho X, Y là 2 ĐLNN có bảng phân phối xác suất đồng thời như sau
a,Tính hệ số tương quan của X và Y?
b, Hai biến ngẫu nhiên X và Y là hai biến ngẫu nhiên độc lập
hay phụ thuộc?
Trang 712 Hệ số tương quan mẫu
1 2
i i
n i
i i
y n y
x n x
y x n y
x r
Ta tính các hiệp phương sai mẫu hiệu chỉnh
) )(
( 1
1
1
y y
x
x n
2 1
Do đó
Y X
XY
S S
S r
i n
i
i
i n
i
i
y y
x x
y y
x x r
1
2 2
1
1
) (
) (
) )(
(
]
[ 1
n S
Trang 72Kết quả
5,87
x i
5,1198
y i
03,702
2
x i
83 , 5
X
9 , 79
Y
r = -0,5417
7,
Trang 75t
t t
t
e
e e
Trang 76VD
Trang 77Bài toán 1: Kiểm định giả thiết là X, Y có độc lập không
Trang 78VD
Trang 79Bài toán 2: Kiểm định hệ số tương quan
H0 : = 0 | H1 : 0
Miền bác bỏ giả thiết là: W = (- , -U/2 ) (U/2 , +)
3
) 1 (
2 1
1 ln 2
Tiêu chuẩn kiểm định:
Kiểm định 2 phía
Trang 80Bài 2
Chương 6
PHÂN TÍCH TƯƠNG QUAN
VÀ HỒI QUY