tài liệu tổng hợp thông tin kiến thức môn xac suất thống kê và ứng dụng năm học 2021, bao gồm các kiến thức tổng hớp từ xác suất, công thức nhân cộng, đến thống kế, chứa đầy đủ các nội dung cần thiết, tài liệu có đầy đủ cấc công thức cần thiết của phần thống kế
Trang 1ÔN TẬP XÁC SUẤT THỐNG KÊ ỨNG DỤNG (MATH132901) CHƯƠNG 1: TỔNG QUAN và THỐNG KÊ MÔ TẢ
Thống kê bao gồm Thống kê mô tả và Suy luận thống kê
- Histogram cho biến rời rạc
- Histogram cho biến liên tục: chia lớp [a;b)
+ Biến liên tục có độ rộng lớp bằng nhau
+ Biến liên tục có độ rộng lớp khác nhau
+ Hình dạng biểu đồ: 1 đỉnh, 2 đỉnh, nhiều đỉnh, đối xứng, nghiêng dương, âm + Dữ liệu định tính
2 Đo lường tính toán
2.1 Đo lường vị trí:
- Trung bình (Mean): 1
n i i
xx
n
- Trung vị (Median x ): sắp xếp các giá trị quan sát của mẫu từ nhỏ đến lớn ( với bất
kì giá trị quan sát nào lặp lại trong mẫu) Khi đó :
+ Nếu n là số lẻ thì x là giá trị chính giữa thứ 1
Trang 2Trung bình và trung vị đều để miêu tả sự tập trung Tuy nhiên trung bình là giá trị trung bình của mẫu, trung vị là giá trị ở giữa của tổng thể
- Trung bình thu gọn (trimmed mean): a% ( trường hợp có giá trị ngoại lai, giảm được các hạn chế của trung bình và trung vị)
- Tứ phân vị, phân vị mức phần trăm: Trung vị chia dữ liệu thành 2 phần có kích thước bằng nhau Tham số tứ phân vị chia dữ liệu thành bốn phần bằng nhau Tương
tự cho tham số phần trăm
Có 2 cách vẽ biểu đồ hộp gồm cách cho trung vị nằm trong 2 khoảng chia hoặc không
- Boxplot có ngoại lai (outlier)
B Thống kê suy luận : kiểm định, ước lượng, hồi quy
C Phần mềm: Minitab, R, SAS, S-plus
Trang 3CHƯƠNG 2: PHÉP TÍNH XÁC SUẤT
2.1 Không gian mẫu và biến cố:
- Phép thử: là một nhóm các hành động hoặc thí nghiệm do ta tiến hành hoặc dự định tiến hành nhằm nghiên cứu một vấn đề nào đó
- Không gian mẫu : Tập hợp tất cả các kết quả của một phép thử
- Biến cố: một tập hợp con của không gian mẫu Thường kí hiệu bằng chữ in: A, B,…
Biến cố sơ cấp : kết quả đơn giản nhất có thể xảy ra khi thực hiện phép thử Biến cố chắc chắn: là biến cố luôn xảy ra khi thực hiện phép thử Kí hiệu : Biến cố không thể: là biến cố không thể xảy ra Kí hiệu là
Biến cố kép: là biến cố chứa nhiều hơn một kết quả
- Mối quan hệ của lý thuyết tập hợp:
a Hợp của hai biến cố: Kí hiệu: C = A + B hay C A B ( chỉ cần ít nhất một biến cố xảy ra)
Công thức cộng xác suất: P(A B) P(A) P(B) P(AB)
Mở rộng :P(A B+C) P(A) P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)
Nếu A, B là hai biến cố xung khắc thì P(A B) P(A) P(B)
b Giao của hai biến cố: Kí hiệu : C = A.B hay C A B (hai biến cố đồng thời xảy ra)
d Xung khắc (rời nhau) :A B
e Độc lập: Biến cố A độc lập với biến có B khi khả năng xảy ra của biến cố này không ảnh hưởng đến biến cố kia và ngược lại
2.2 Các tiên đề và tính chất của xác suất:
- Định nghĩa xác suất theo lối cổ điển: ( ) mA
P A
n
Trang 4- Tính chất: A : 0P A( ) 1 ; P ( ) 1, P ( ) 0 ;P(A) 1 P(A)
2.3 Giải tích tổ hợp:
a Quy tắc nhân: ( các giai đoạn phụ thuộc nhau) n n n1 .2 nk
b Quy tắc cộng: (các phương pháp ko phụ thuộc nhau)m m1 m2 mk
- Công thức xác suất điều kiện: P(A|B) P(AB)
P(B)
(Xác suất xảy ra A với điều kiện B đã xảy ra)
- Công thức nhân xác suất: P(AB) P(A) P(B|A)
Mở rộng :P(ABC) P(A) P(B|A) P(C|AB)
Hai biến cố A và B gọi là độc lập thì :P(AB) P(A)P(B)
Trang 5CHƯƠNG 3: BIẾN NGẪU NHIÊN RỜI RẠC VÀ PHÂN PHỐI XÁC SUẤT
3.1 Biến ngẫu nhiên ( đại lượng ngẫu nhiên): 2 loại ĐLNN (BNN)
- BNN rời rạc: tập giá trị của nó là hữu hạn hay vô hạn đếm được
- BNN liên tục: tập giá trị của nó lấp đầy một khoảng nào đó tên trục số và xác suất của một điểm bất kì luôn là 0
3.2 Phân phối xác suất của biến ngẫu nhiên rời rạc:
a/ Hàm phân phối xác suất của biến rời rạc X ( hay hàm khối lượng xác suất) là
b/ Hàm phân phối tích luỹ (CDF) : kí hiệu F x ( )
(cả biến rời rạc và biến liên tục đều có hàm phân phối xác suất tích luỹ)
Trang 6b/ Phương sai: V X ( ) 2 E X ( 2 ) ( EX ) 2 với ( 2 ) 2 (x)
3.4 -3.6 Các phân phối xác suất ( biến rời rạc)
1/ Phân phối nhị thức: Kí hiệu: X Bin n p ( , )
X là số phép thử xảy ra trong n phép thử, xs của mỗi phép thử xảy ra là p.(mỗi phép thử chỉ có hai kết quả)
Hàm khối lượng xác suất của X kí hiệu là b x n p ( , , ) :
x x n x n
3/ Phân phối nhị thức âm: (khác với trong sách)
Y là số phép thử thực hiện cho đến khi nào có r phép thử xuất hiện thì dừng
Trang 71 1 1
Trang 8CHƯƠNG 4: BIẾN NGẪU NHIÊN LIÊN TỤC và PHÂN PHỐI XÁC SUẤT 4.1 Hàm mật độ của biến ngẫu nhiên liên tục (pdf) : kí hiệu fX
X là biến ngẫu nhiên liên tục có hàm mật độ thoả
4.2 Hàm phân phối tích luỹ và các đặc trưng
a/ Hàm phân phối tích luỹ F(x) của biến ngẫu nhiên liên tục X là :
Trang 9c/ Trung vị của một phân phối liên tục, kí hiệu , là phân vị thứ 50, sao cho thoả mãn F( ) 0.5 Hay trung vị là giá trị chia phân phối thành 2 phần bằng nhau
4.3 Các phân phối xác suất ( biến liên tục):
1/ Phân phối đều: X có phân phối đều trên đoạn [a;b] nếu
1( )0X
2/ Phân phối chuẩn:
a/ Phân phối chuẩn chuẩn tắc: Kí hiệu: Z N (0;1) , 0 ; 1
Trang 10c/ Phân phối chuẩn: Kí hiệu:
d/ Sự hội tụ của phân phối nhị thức về phân phối chuẩn: X Bin n p ( , )
Nếu đồ thị của phân phối nhị thức không quá lệch ( không quá mất đối xứng)
(np 10 ; (1 n p ) 10 ) thì có thể xấp xỉ X như một phân phối chuẩn bằng
Trang 114/ Phân phối Gamma: (đọc thêm)
- Cho 0 , khi đó hàm gamma 1
0( ) x e dx x
- Biến ngẫu nhiên liên tục X có phân phối gamma nếu hàm mật độ của X là
11
( )( ; , )
( )( ; ,1)
F là hàm gamma không đầy đủ
5/ Phân phối Chi-bình phương: X 2 bậc tự do
X có phân phối chi- bình phương với tham số nếu hàm mật độ xác suất của X là hàm mật độ gamma có tham số / 2 ; 2 Hàm mật độ của X có phân phối Chi-bình
phương là
/2 1 /2 /2
1
2 ( / 2)( ; )
Trang 124.3 Một số phân phối liên tục khác : ( đọc sách) Phân phối Weibull ; Phân phối lô-ga chuẩn; phân phối Bê ta
CHƯƠNG 5: PHÂN PHỐI XÁC SUẤT ĐỒNG THỜI VÀ MẪU NGẪU NHIÊN (đọc sách)
CHƯƠNG 6,7: ƯỚC LƯỢNG
- Tổng thể: tập hợp tất cả các phần tử mà từ các phần tử đó ta có thể thu thập, khảo sát những thông tin về các dấu hiệu ta cần nghiên cứu được gọi là tổng thể (population)
- Mẫu ngẫu nhiên: Cho đại lượng ngẫu nhiên X với quy luật phân phối xác suất nào đó Một mẫu ngẫu nhiên kích thước n được thành lập từ đại lượng ngẫu nhiên X là n đại lượng ngẫu nhiên độc lập X X1, , ,2 Xn , có cùng phân phối xác suất với đại lượng ngẫu nhiên X
+ Chọn ngẫu không hoàn lại
+ Chọn mẫu có hoàn lại
x: trung bình mẫu
2
s : phương sai của mẫu hiệu chỉnh
s: Độ lệch chuẩn mẫu hiệu chỉnh ( hoặc kí hiệu n1 )
Trang 13 Calculator fx570 ES :
Bước 1: (gọi cột tần số) Shift Mode 4 1.on
Bước 2: Mode 3.STAT 1
Nhập dữ liệu rồi nhấn AC
Bước 3: Shift 1 5.Var 1.n
2 x
4 x n1 or s Chú ý:
Shift 1 3.Edit 2 Del (xoá dữ liệu)
Bước 3: OPTN 2 Sẽ thấy n, x , x n1 or s
1 Phương pháp ước lượng điểm: (ước lượng không chệch)
Dùng trung bình mẫu x để ước lượng cho trung bình tổng thể
Dùng phương sai mẫu s 2 để ước lượng cho phương sai tổng thể 2
Dùng tỷ lệ mẫu p để ước lượng cho tỷ lệ tổng thể p
2 Phương pháp ước lượng khoảng:
- Độ tin cậy : kí hiệu với 1 ( là mức ý nghĩa)
2.1 Ước lượng khoảng cho trung bình của tổng thể :
a/ Khoảng ước lượng đối xứng :
Gọi là trung bình của tổng thể ( chưa biết), ta cần tìm ước lượng khoảng đối xứng của
với độ tin cậy 1
- Trung bình mẫu: x
- Độ chính xác ( sai số) của ước lượng:
Trang 14
( tra bảng T - Student)
- Khoảng ước lượng cho trung bình : ( x x )
( Xem giới thiệu về phân phối Student trong giáo trình)
b/ Khoảng ước lượng 1 phía :
- Giá trị ước lượng tối đa cho trung bình tổng thể là:
4.z sn
Trang 152.2 Ước lượng khoảng cho tỷ lệ của tổng thể p :
a/ Khoảng ước lượng đối xứng :
Gọi p là tỷ lệ các phần tử có tính chất A của tổng thể ( p chưa biết), ta cần tìm ước lượng khoảng đối xứng của p với độ tin cậy 1
- Tìm tỷ lệ mẫu m A
p n
- Sai số ước lượng ( độ chính xác) :
/2
p(1 p)z
n
(tra bảng Z)
- Khoảng ước lượng (khoảng tin cậy): (p p p )
b/ Khoảng ước lượng 1 phía :
- Giá trị ước lượng tối đa cho tỉ lệ tổng thể p là: p(1 p)
2.3 Ước lượng khoảng cho phương sai của tổng thể 2 :
a/ Khoảng ước lượng đối xứng :
Gọi 2
là phương sai của tổng thể ( 2
chưa biết), ta cần tìm ước lượng khoảng đối xứng của 2
với độ tin cậy 1 Ta có :
Trang 162 2 2
b/ Khoảng ước lượng 1 phía :
- Giá trị ước lượng tối đa cho phương sai tổng thể 2
là:
2 2
CHƯƠNG 8: KIỂM ĐỊNH DỰA TRÊN MỘT MẪU ĐƠN
1 Một số khái niệm cơ bản:
- Giả thiết thống kê: là những giả thiết về các tham số, phân phối xác suất, hoặc tính độc lập của các đại lượng ngẫu nhiên
- Kiểm định giả thiết thống kê: việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết
- Giả thiết không : giả thiết cần kiểm định Ký hiệu là H0
- Giả thiết đối : một mệnh đề đối lập với H0 Ký hiệu là Ha
- Kiểm định giả thiết hai phía: H0: 0 ; Ha: 0
( là tham số nào đó của ĐLNN mà ta đang nghiên cứu; 0 là giá trị đã biết)
- Kiểm định giả thiết một phía : H0: 0 ; Ha: 0 ( hay Ha: 0)
( một phía bên phải; một phía bên trái)
- Sai lầm loại 1 và sai lầm loại 2: Từ bài toán thực tế nêu giả thiết H0 và H a
Trang 17- Mức ý nghĩa : P sai lam loai ( 1) ; 1
( Xác suất không mắc sai lầm loại 2 là )
- Miền bác bỏ là miền chứa các giá trị làm cho giả thuyết Ho bị bác bỏ
Miền chấp nhận là miền chứa các giá trị giúp cho giả thuyết Ho không bị bác bỏ (tạm chấp nhận hoặc chưa đủ cơ sở để bác bỏ Ho)
2 Kiểm định giả thiết về trung bình tổng thể :
Trường hợp 1: X có phân phối chuẩn; 2 đã biết
Giả thiết không: H0: 0
Tiêu chuẩn kiểm định: z x 0 n
/ 2
z z : bỏ H0 nhận Ha
Nếu z z/ 2 : nhận H0
Trang 18Trường hợp 2: Mẫu lớn (n>40) , X có phân phối chuẩn; 2 chưa biết
Giả thiết không: H0: 0
Tiêu chuẩn kiểm định: z x 0 n
Trường hợp 3: Mẫu nhỏ , X có phân phối Student; 2 chưa biết
Giả thiết không: H0: 0
Tiêu chuẩn kiểm định: t x 0 n
tt / 2, n 1
t t
Trang 193 Kiểm định giả thiết về tỉ lệ tổng thể p: (cho mẫu lớn n p 0 10 ; (1 n p0) 10 ) Giả thiết không: H0: p p0
Tiêu chuẩn kiểm định: 0
Trang 20P-value:
P-value là xác suất được tính khi giả định giả thiết không H0 đúng (chú ý là P-value không
phải xác suất để H0 đúng) P-value là mức ý nghĩa nhỏ nhất mà H0bị bác bỏ Vì tiêu chuẩn kiểm định z khác nhau khi mẫu khác nhau nên cho P-value trong mỗi mẫu khác nhau
- Mặt khác, nếu quy định trước mức ý nghĩa thì có thể dùng p-value để kết luận theo
Nếu p-value thì bác bỏ H0, thừa nhận Ha Nếu p-value thì chưa có cơ sở để bác bỏ H0 Tuy nhiên phương pháp dùng p-value để kiểm định cũng giống như dùng miền bác bỏ để kiểm định
- P-value cho kiểm định Z (chuẩn):
- P-value cho kiểm định T (Student):
CHƯƠNG 9: KIỂM ĐỊNH DỰA TRÊN 2 MẪU
1/ Kiểm định so sánh hai trung bình của hai tổng thể
Trang 21𝑡 = 𝑥̅ − 𝑦 − ∆
𝑠
𝑛 +
𝑠𝑛
Trang 22b/ Khoảng tin cậy cho D:
Khoảng tin cậy 2 phía: d t / 2,n1 sD/ n
Tìm khoảng tin cậy một phía thì thay t/2 bởi t
CHƯƠNG 12: HỒI QUY TUYẾN TÍNH ĐƠN GIẢN và HỆ SỐ TƯƠNG QUAN
1 Mô hình hồi quy tuyến tính đơn giản:
- Các biến có giá trị được cố định bởi người quan sát sẽ kí hiệu là X , giá trị của nó là x
và gọi là biến độc lập, biến để dự đoán hay biến giải thích với x cố định, biến thứ hai
sẽ là ngẫu nhiên Ta thường kí hiệu biến ngẫu nhiên là Y, giá trị của nó là y và gọi biến này là biến phụ thuộc hay biến đáp
ứng, biến mong đợi
- Hình ảnh trên biểu đồ cho cặp dữ liệu
Trang 23- Sử dụng phương pháp ước lượng bình phương bé nhất để ước lượng các tham số của đường hồi quy, thì đường hồi quy được ước lượng là : y A Bx (hay y o1x)
2 Cách bấm máy tính bỏ túi để giải bài toán hồi quy:
Casio fx-570 ES:
Bước 1: (gọi cột tần số) Shift Mode 4 1.on
Bước 2: Mode 3.STAT 2
Nhập dữ liệu rồi nhấn AC
Bước 3: Shift 1 7.Reg 1.A
2 B
3 r : hệ số tương quan Chú ý: Phương trình hồi quy tuyến tính là Y=A+BX