Nội dungTập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Tổng thể và mẫu Mô hình xác suất của
Trang 1Bài Giảng Môn học Xác Suất và Thống Kê
Nguyễn Văn Thìn
Khoa Toán - Tin Học Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM
Ngày 4 tháng 9 năm 2011
Trang 2Nội dung
Tập hợp - Giải tích tổ hợp
Biến cố và xác suất
Biến ngẫu nhiên và quy luật phân phối xác suất
Một số biến ngẫu nhiên thông dụng
Lý thuyết mẫu
Tổng thể và mẫu
Mô hình xác suất của tổng thể và mẫu
Các tham số đặc trưng của mẫu
Trang 3Định nghĩa
Trong bài toán thống kê ta cần khảo sát một hay nhiểu dấu hiệu
nào đó và các dấu hiệu này thể hiện trên nhiều phần tử khác nhau
Tập hợp tất cả các phần tử chứa đựng thông tin về các dấu hiệu
ta cần nghiên cứu gọi là Dân số hay tổng thể
Ví dụ
Ta cần nghiên cứu về thu nhập của những người làm việc trong
ngành thư viện Dấu hiệu ta cần khảo sát là "thu nhập" và những
thông tin về thu nhập được thu thập ở những người làm việc trong
ngành này Vậy tất cả những người làm việc trong ngành thư viện
được coi là tổng thể
Trang 4Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau:
N: Số phần tử của tổng thể và được gọi là kích thước của tổng
thể
X?: Dấu hiệu ta cần khảo sát, nghiên cứu Cần nhấn mạnh rằng
khi ta nghiên cứu một tổng thể có nghĩa là ta nghiên cứu dấu
hiệu X? được thể hiện trên các phần tử của tổng thể
xi: với i = 1, 2 k là các giá trị của dấu hiệu X? đo được trên các
phần tử của tổng thể
Ni: Tần số của xi - là số phần tử nhận giá trị xi Ta luôn có
Pk
i =1Ni = N
pi: Tần suất của xi - là tỷ số giữa tần số của xi và kích thước
tổng thể pi = Ni
N
Trang 5Các đặc trưng của tổng thể
Định nghĩa
Trung bình của tổng thể (ký hiệu là µ), được xác định theo công
thức
µ =
k
X
i =1
xipi
Định nghĩa
Phương sai của tổng thể (ký hiệu là σ2), được xác định theo công
thức
σ2 =
k
X
i =1
(xi − µ)2pi
Trang 6Định nghĩa
Độ lệch chuẩn của tổng thể (ký hiệu là σ), được xác định theo
công thức
σ =
√
σ2
Định nghĩa
Tỷ lệ tổng thể (ký hiệu là p), được định nghĩa như sau: Giả sử
tổng thể gồm N phần tử, trong đó có M phần tử có tính chất A
Gọi p = MN là tỷ lệ các phần tử có tính chất A của tổng thể (hay
gọi tắt là tỷ lệ tổng thể)
Trang 7Để có thể khảo sát được các một số tính chất của đặc tính ta
quan tâm nếu ta đi điều tra toàn bộ tổng thể thì gặp các khó khăn
sau đây
• Phải chịu chi phí lớn về tiền của, thời gian, nhân lực, phương
tiện,
• Một số trường hợp sẽ phải phá hủy các phần tử được điều tra
• Có những trường hợp ta không thể xác định được toàn bộ các
phần tử của tổng thể
Trang 8Khái niệm về mẫu
Định nghĩa
Một tập hợp gồm n phần tử lấy ra từ tổng thể được gọi là một
mẫu Số phần tử của mẫu n được gọi là kích thước mẫu hay cỡ
mẫu
Trong thực tế có nhiều cách lấy mẫu: Lấy mẫu ngẫu nhiên, chọn
mâu cơ giới, chọn mẫu bằng cách phân lớp Việc lấy mẫu được
tiến hành chủ yếu theo 2 phương thức:
• Lấy mẫu có hoàn lại (có lặp)
• Lấy mẫu không hoàn lại (không lặp)
Nhờ các định lý về giới hạn của xác suất, người ta đã chứng minh
được rằng: Khi số phần tử của tổng thể đủ lớn thì có thể coi hai
cách lấy mẫu có lặp và không lặp là như nhau
Trang 9Ta có thể mô hình hóa dấu hiệu X? bằng một đại lượng ngẫu
nhiên như sau:
Nếu lấy ngẫu nhiên từ tổng thể ra 1 phần thử và gọi X là giá trị
của dấu hiệu X? đo được trên phần tử lấy ra đó thì X là đại lượng
ngẫu nhiên có phân phối xác suất như sau
X x1 x2 · · · xk
P p1 p2 · · · pk Như vậy dấu hiệu mà ta nghiên cứu X? có thể được mô hình hóa
bởi một đại lượng ngẫu nhiên X Quy luật phân phối xác suất của
X được gọi là quy luật phân phối gốc
Trang 10Các tham số của đại lượng ngẫu nhiên gốc
Định nghĩa
Với quy luật phân phối xác suất được cho bởi bảng trên, theo định
nghĩa kỳ vọng của X là
E(X ) =
k
X
i =1
xipi = µ
Định nghĩa
Phương sai của đại lượng ngẫu nhiên gốc là
Var (X ) =
k
X
i =1
(xi − E(X ))2pi =
k
X
i =1
(xi − µ)2pi
Trang 11Mẫu ngẫu nhiên
Định nghĩa
Cho một đại lượng ngẫu nhiên X với quy luật phân phối xác suất
nào đó Một mẫu ngẫu nhiên kích thước n được thành lập từ đại
lượng ngẫu nhiên X là n đại lượng ngẫu nhiên độc lập, có cùng
phân phối với đại lượng ngẫu nhiên X
Ta ký hiệu mẫu ngẫu nhiên kích thước n được thành lập từ đại
lượng ngẫu nhiên X là (X1, X2, , Xn)
Ở mỗi lần khảo sát hay lấy mẫu ta thu được một mẫu cụ thể với
kích thước n, đây là một giá trị của mẫu ngẫu nhiên có kích thước
n và mẫu cụ thể này được ký hiệu là (x1, x2, xn)
Trang 12Các phương pháp mô tả số liệu mẫu
• Mô tả mẫu bằng bảng phân phối tần số thực nghiệm
xi x1 x2 · · · xk
ni n1 n2 · · · nk
• Mô tả mẫu bằng bảng phân phối tần suất thực nghiệm
xi x1 x2 · · · xk
fi f1 f2 · · · fk
Trang 13Các tham số đặc trưng của mẫu
Cho mẫu ngẫu nhiên kích thước n, (X1, X2, , Xn) được xây dựng
từ đại lượng ngẫu nhiên X
Định nghĩa
Trung bình mẫu ngẫu nhiên, ký hiệu là ¯X được định nghĩa là
¯
X =
Pn
i =1Xi n
Khi có mẫu cụ thể (x1, x2, , xn) từ mẫu ngẫu nhiên
(X1, X2, , Xn) ta sẽ thu được một giá trị cụ thể của ¯X ký hiệu là
¯
x được tính theo công thức
¯
x =
Pn
i =1xi n
Trang 14Tính chất
Nếu đại lượng ngẫu nhiên gốc X có kỳ vọng toán E(X ) = µ và
phương sai Var (X ) = σ2 thì E( ¯X ) = µ và Var ( ¯X ) = σ2
n
Trang 15Định nghĩa
Phương sai mẫu ngẫu nhiên, ký hiệu là S2 được định nghĩa là
S2=
Pn
i =1(Xi − ¯X )2
n − 1
Khi có mẫu cụ thể (x1, x2, , xn) từ mẫu ngẫu nhiên
(X1, X2, , Xn) ta sẽ thu được một giá trị cụ thể của S2 ký hiệu là
s2 được tính theo công thức
s2=
Pn
i =1(xi− ¯x )2
n − 1
Trang 16Tính chất
Nếu đại lượng ngẫu nhiên gốc X có kỳ vọng toán E(X ) = µ và
phương sai Var (X ) = σ2 thì E(S2) = σ2
Định nghĩa
Độ lệch chuẩn của mẫu ngẫu nhiên, ký hiệu S là căn bậc hai của
phương sai mẫu S =√S2
Nếu có mẫu cụ thể thì độ lệch chuẩn của mẫu cụ thể này là một
giá trị của S
Trang 17Phương pháp tính các tham số đặc trưng của mẫu
• Trường hợp mẫu cho dưới dạng gồm đủ n giá trị quan sát:
¯
x =
Pn
i =1xi n
s2 = 1
n − 1
n
X
i =1
xi2− n(¯x )2
!
• Trường hợp số mẫu cho dưới dạng tần số ni
¯
x =
Pk
i =1nixi n
s2 = 1
n − 1
k
X
i =1
nixi2− n(¯x )2
!
Chú ý trong trường hợp số liệu của mẫu được cho dưới dạng
từng khoảng thì khi áp dụng hai công thức trên ta thay mỗi
khoảng bằng giá trị trung tâm của khoảng đó