Tổng hợp lý thuyết + công thức học phần Lý thuyết Xác suất và Thống kê toán 1Tài liệu được xem miễn phí toàn bộ, nếu thấy hay và có ích các bạn có thể ủng hộ mình bằng cách chọn mua nhé. Cảm ơn các bạn
Trang 1Kênh: Eureka! Uni
Sản xuất: Hoàng Bá Mạnh
HỆ THỐNG
LÝ THUYẾT
NEU – Spring 2020
Trang 2CHÚ Ý KHI IN
In khổ giấy A5 và đóng thành sách để sử dụng hiệu quả hơn ^^ GIỚI THIỆU
Tác giả
Tác giả: Love NeverDies, nghệ danh: Hoàng Bá Mạnh
Năm sinh: 1994 Năm mất: chưa rõ SĐT: 0986.960.312
Tác phẩm
Đối tượng: Sinh viên khối ngành kinh tế nói chung và sinh viên Kinh tế Quốc dân nói riêng
Mục tiêu:
- Ôn theo chương trình học
- Luyện tập củng cố theo giáo trình
- Ôn tập giữa kì, cuối kì
Chịu trách nhiệm nội dung và giải đáp bởi tác giả
Đôi lời nhắn nhủ tới bạn đọc của tác giả
Đây là tài liệu phục vụ ôn tập nên tôi không khuyến khích các bạn biến
nó thành phao thi -_-! Mặc dù, trong giây phút lầm đường lạc lối, bế tắc
không lối thoát, vẫn có nhưng con chiên làm liều vì cùng quẫn, nhưng
chúng tôi vẫn khẳng định về mục đích đã đề cập phía trên!
Chúc bạn đọc ôn tập hiệu quả và đạt kết quả tốt cho học phần này! Goodluck!
NEU, Spring 2020 Created 29/03/2020 by Mạnh
Trang 3Mục lục
1 A-1: Xác suất 1
1.1 Biến cố và xác suất biến cố 1
1.1.1 Phép thử, biến cố và phân loại 1
1.1.2 Xác suất biến cố 1
1.1.3 Các phương pháp xác định xác suất biến cố 2
1.1.4 Nguyên lý xác xuất lớn – nhỏ 3
1.1.5 Định lý nhân 3
1.1.7 Hệ quả của định lý cộng – nhân 5
1.2 Biến ngẫu nhiên và quy luật phân phối xác suất 5
1.2.1 Biến ngẫu nhiên và phân loại 5
1.2.2 Quy luật phân phối xác suất 6
1.2.3 Các tham số đặc trưng 7
1.3 Phân phối xác suất thông dụng 9
1.4 Biến ngẫu nhiên 2 chiều rời rạc 10
1.4.1 Biến hai chiều rời rạc 10
1.4.2 Các bảng phân phối xác suất 10
1.4.3 Tương quan tuyến tính 11
2 A-2: Thống kê toán 12
2.1 Tổng thể - Mẫu và các tham số 12
2.1.1 Mẫu và Tổng thể 12
2.1.2 Các tham số đặc trưng 12
2.1.3 Mẫu liệt kê, mẫu phân nhóm, mẫu theo cặp 13
2.1.4 Tính toán các tham số mẫu 13
2.2 Quy luật phân phối xác suất của các thống kê 13
Trang 42.3 Suy diễn thống kê 14
2.3.1 Suy đoán cho trung bình mẫu X̅ 14
2.3.2 Suy đoán cho tần suất mẫu p̂ 15
2.4 Ước lượng tham số 15
2.4.1 Ước lượng điểm bằng hàm ước lượng 16
2.4.2 Ước lượng bằng khoảng tin cậy 17
2.5 Kiểm định giả thuyết 19
2.5.1 Những vấn đề chung 19
2.5.2 Kiểm định tham số tổng thể 21
2.5.3 Kiểm định phi tham số 26
Trang 5Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1 A-1: Xác suất
1.1.Biến cố và xác suất biến cố
1.1.1 Phép thử, biến cố và phân loại
Phép thử là một (nhiều) hành động, thao tác xảy ra
Biến cố là kết quả của phép thử
Tùy theo góc nhìn ta có thể đặt biến cố khái quát hoặc bóc tách thành từng biến cố thành phần nhỏ hơn cho thuận tiện, phù hợp
Biến cố Chắc chắn Ngẫu nhiên Không thể có Đặc điểm
Xác suất biến cố là đại lượng đặc trưng cho sự xuất hiện của biến cố
Kết quả (biến cố) càng dễ xảy ra => xác suất càng lớn
Thành
Bại
Friendzone Brotherzone Ngườilạ-zone Người yêu V
Trang 6Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1.1.3 Các phương pháp xác định xác suất biến cố
Kết cục: kết quả có thể xảy ra khi thực hiện phép thử
Duy nhất: các kết quả không bị trùng lặp, không có điểm chung Đồng khả năng: Xác suất xuất hiện mỗi kết cục là như nhau
Ví dụ 1: Tung 1 xúc xắc (cân đối đồng chất) Ta thấy:
Có 6 kết cục duy nhất đồng khả năng (1,2,3,4,5,6)
Trong đó có 3 kết cục thỏa mãn biến cố A: “mặt lẻ chấm”
( ) 3 0,56
Trang 7Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Định nghĩa thống kê về xác suất
Tần suất ( ) ( ) Sè phÐp thö cã A xuÊt hiÖn
Thực tế có thể coi như A luôn xảy ra coi như A không xảy ra
- 0,01 là nhỏ?
- 0,99 là lớn?
Tùy tình huống mà xác suất coi là lớn hay nhỏ
Ví dụ:
- Tỉ lệ tai nạn xe máy là 0,01 => xác suất không
nhỏ (vì theo đó cứ 100 người điều khiển xe máy
thì có 1 người tai nạn)
1.1.5 Định lý nhân
Biến cố tích: AB
Xuất hiện khi cả A và B xuất hiện
Phần giao nhau của A và B
thức P(AB) = P(A)P(B) P(AB) ≠ P(A)P(B) P(A|B)=P(AB)/P(B) P(AB) = P(A)P(B|A) = P(B)P(A|B)
Hệ n biến cố A1, A2, , An gọi là:
Độc lập từng đôi: 2 biến cố bất kì độc lập nhau
A 1 độc lập A 2 , A i độc lập A j ,
Trang 8Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Độc lập toàn phần: các tổ hợp bất kì (tích – tổng) độc lập nhau
1.1.6 Định lý cộng
Biến cố tổng: (A + B)
Xuất hiện khi hoặc A, B , AB xảy ra
Toàn bộ phần màu xanh
Tương tác biến cố
Biến cố Xung khắc Không xung khắc Đối lập
A và B - không giao nhau
- có ảnh hưởng
- có giao nhau - không giao
- hai nửa của U Biểu
Hệ n biến cố A1, A2, , Anxung khắc từng đôi khi
Hai biến cố bất kì xung khắc nhau: Ai xung khắc Aj (i ≠ j)
Trang 9Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1.1.7 Hệ quả của định lý cộng – nhân
P H là các xác suất tiên nghiệm
- Biến cố được hỏi là
biến cố kèm điều kiện
Sau khi A xảy ra, tính ngược lại xác suất của các
1.2.Biến ngẫu nhiên và quy luật phân phối xác suất
1.2.1 Biến ngẫu nhiên và phân loại
Biến ngẫu nhiên
Liên tục
Không liệt kê, đếm được hết
Trang 10Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1.2.2 Quy luật phân phối xác suất
Giá trị của X
Phân phối xác suất
= F(b) – F(a)
f(x) = F′(x) f(x) ≥ 0 ( )
+
- ∞f x dx=1
∞
∫P(X=a) = 0 P(a < X < b) =
( )
b a
= f x dx∫
Trang 11Trang Eureka Uni https://www.fb.com/EurekaUni.No1
- Phản ánh xu hướng trung tâm
- Là con số có được khi loại bỏ sự chênh lệch các giá trị của X
- Mỗi biến X chỉ có duy nhất một E(X) Trung vị md : P X( ≤m0)= 0, 5 (đv của X) - Phản ánh xu hướng trung tâm
- Nằm chính giữa, ngăn PPXS thành 2 nửa Mốt m0 : P X( =m0)=pmax (đv của X) - Phản ánh xu hướng trung tâm
- Phản ánh độ phân tán, biến động, đồng đều,
ổn định về mặt giá trị của X (hay các xi)
- Các xi càng sai lệch, phương sai càng lớn
- Trong một số trường hợp, phương sai còn được gọi là độ rủi ro
Trang 12Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Hệ số
bất đối xứng 3 33
µασ
mức α P X( >xα)=α (đv của X) xα xác định một xác suất α tương ứng
E(X+Y) = E(X) + E(Y) V(X+Y) = V(X) + V(Y)E(XY) = E(X).E(Y) nếu X độc lập Y
Trang 13Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1.3.Phân phối xác suất thông dụng
Nhị thức X ~ B(n,p) P(X = k) = Cnk p k (1 − p) n−1
E(X) = np V(X) = np(1-p) np+p–1 ≤ m 0 ≤ np+p
n ≥ 100 hội tụ chuẩn Poisson X ~ P(λ) P(X = k) =λk
k! e−λ
E(X) = V(X) = λ
λ – 1 ≤ m 0 ≤ λ
λ > 20 hội tụ chuẩn
Chuẩn X ~ N(μ;σ 2 )
P(a < X < b) = Ф �b − µσ � − Ф �a − µσ �P(X < b) = Ф �b − µσ �
P(X > a) = 1 − Ф �a − µσ �P(|X − µ| < ε) = 2Ф �εσ� − 1
E(X) = μ V(X) = σ 2
α 3 = 0
α 4 = 3
𝑍𝑍 =𝑋𝑋 − 𝜇𝜇𝜎𝜎thì
fα(n2 ,n 1 )
�
Trang 14Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1.4.Biến ngẫu nhiên 2 chiều rời rạc
1.4.1 Biến hai chiều rời rạc
1.4.2 Các bảng phân phối xác suất
Bảng phân phối xác suất đồng thời
- Tính được các tham số của X: E(X), V(X),
Bảng phân phối xác suất có điều kiện
- Điều kiện Y = y j
- pi là các xác suất điều kiện
- pi = P(X = xi; Y = yj)/P(Y = yj)
Biến ngẫu nhiên 2
chiều rời rạc: (X,Y) Biến ngẫu nhiên X rời rạc Biến ngẫu nhiên Y rời rạc
X|Y=yj x1 x2 x3 … xn
Xác suất p1 p2 p3 … pn
Trang 15Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1.4.3 Tương quan tuyến tính
ρx,y= 0 => X và Y không tương quan
ρx,y= ±1 => X và Y tương quan hàm số
tuyến tính
Chú ý V(aX+bY) = aE(XY) = p 2V(X) + b2 V(Y) + 2abCov(X,Y)
11.x1y1 + p12.x2y1 + + p21.x1y2 + + pmn.xnym
Cov(X,Y) = 0
Trang 16Trang Eureka Uni https://www.fb.com/EurekaUni.No1
1000 sinh viên NEU
Trang 17Trang Eureka Uni https://www.fb.com/EurekaUni.No1
2.1.3 Mẫu liệt kê, mẫu phân nhóm, mẫu theo cặp
Mẫu liệt kê: x1, x2, x3, , xn hay w = {xi, i=1,2,3, n}
Mẫu theo cặp gồm 2 dấu hiệu X, Y trên cùng một đối tượng:
Trang 18Trang Eureka Uni https://www.fb.com/EurekaUni.No1
2.3.Suy diễn thống kê
Tổng thể đã xác định => suy đoán thông tin của mẫu
2.3.1 Suy đoán cho trung bình mẫu X̅
Giả thiết có tổng thể X ~ N(μ;σ2) xác định (biết μ và σ)
Trung bình mẫu ngẫu nhiên kích thước n lúc này X ~N ; 2
n
σµ
−
Dù chưa thực hiện điều tra chọn mẫu, nhưng ta vẫn có thể đoán biết được trung bình mẫu sẽ có giá trị giao động trong khoảng nào, tối đa, tối thiểu bao nhiêu với một xác suất đủ lớn, đủ để tin cậy được
μ, σ2, p
2, p̂
(Mẫu)
Trang 19Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Trong đó 1−α là mức xác suất (đủ lớn), thường là 0,9 hoặc 0,95
Các biểu thức trên có được bằng các vận dụng quy luật phân phối xác suất của X̅ và giá trị tới hạn chuẩn hóa: P Z( >zα)= −1 α
2.3.2 Suy đoán cho tần suất mẫu p̂
Giả thiết có tổng thể phân phối A(p) xác định (đã biết p)
Với mẫu lớn (n ≥ 100), ta có tần suất mẫu (1 )
Trang 20Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Tổng thể chưa xác định, dùng thông tin từ mẫu để suy đoán
2.4.1 Ước lượng điểm bằng hàm ước lượng
2.4.1.1.Hàm ước lượng
Giả sử cần ước lượng tham số θ nào đó (có thể là μ, σ, p)
- Lập mẫu ngẫu nhiên W = (X 1 , X 2 , …, X n )
- Chọn lập thống kê G =f X X( 1; 2; ;Xn)
- Tìm mẫu cụ thể w = (x 1 , x 2 , ,x n ) và thay vào G thu được giá trị
g f x x( 1; ; ;2 xn)
θ = = chính là ước lượng điểm của θ
Các hàm ước lượng quan trọng cần nhớ:
1
1 n
i i
n i i
2.4.1.2.Các tiêu chí đảm bảo tính tin cậy của ước lượng điểm
Rõ ràng với mỗi mẫu khác nhau ta sẽ có giá trị θ� khác nhau trong khi thực
tế chỉ có duy nhất 1 giá trị θ!
=>Điều gì đảm bảo θ� vừa tính là sát thực?
Với ước lượng điểm, ta có các tiêu chí đánh giá độ tốt sau:
bình thì sẽ không còn lệch nữa!
μ, σ2, p
2, p̂
(Mẫu)
Trang 21Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Khi θ� là ước lượng không chệch, nếu nó có phương sai nhỏ nhất thì ta nói θ� là ước lượng hiệu quả cho θ!
Với ε là số dương bé tùy ý, n là kích thước mẫu để tính ra θ�
Hàm ý rằng, mẫu càng lớn thì càng dễ tìm được 𝜃𝜃� gần với θ
Các ước lượng điểm đảm bảo các tính chất tốt kể trên: X̅, S2, p̂
2.4.2 Ước lượng bằng khoảng tin cậy
Tương tự như việc suy đoán khoảng giá trị cho các tham số mẫu với một mức xác suất đủ lớn, người ta cũng thực hiện việc suy đoán ngược lại cho tổng thể bằng một khoảng giá trị (gọi là khoảng tin cậy), với một xác
suất lớn gọi là độ tin cậy
Công việc này gọi là ước lượng bằng khoảng tin cậy!
2.4.2.1.Khoảng tin cậy cho trung bình tổng thể μ
Biểu thức tổng quát với độ tin cậy 1−α, (α α1+ 2 =α)
Mức xác suất
Độ tin cậy
Trang 22Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Độ dài khoảng tin cậy và độ chính xác (sai số) ước lượng
Với khoảng đối xứng, ta có 2 đại lượng sau:
( 1 )
2 n
I = ε gọi là độ dài khoảng tin cậy
2.4.2.2.Khoảng tin cậy cho phương sai tổng thể σ 2
Biểu thức tổng quát với độ tin cậy 1−α là:
χ là giá trị tới hạn Khi-bình phương
Từ trên, ta cũng suy ra được khoảng đối xứng, tối đa, tối thiểu cho σ2
2.4.2.3.Khoảng tin cậy cho tần suất (tỷ lệ) tổng thể p
Biểu thức tổng quát với độ tin cậy 1−α là:
Trong đó zα là giá trị tới hạn chuẩn
Từ trên, ta cũng suy ra được khoảng đối xứng, tối đa, tối thiểu cho p
Với khoảng đối xứng, độ chính xác ước lượng là: p( )1 p
z
Trang 23Trang Eureka Uni https://www.fb.com/EurekaUni.No1
2.5.Kiểm định giả thuyết
2.5.1 Những vấn đề chung
Ngoài việc tìm ra khoảng giá trị mà các tham số tổng thể (μ, σ2, p) rơi vào, người ta còn muốn có những kết luận mạnh hơn, cụ thể hơn cho chúng thông qua việc so sánh với các giá trị đối chiếu (θ = θ0, θ > θ0, hay
θ < θ0) hay về dạng phân phối của dấu hiệu nghiên cứu (phân phối chuẩn hay không?), về sự độc lập hay phụ thuộc của các dấu hiệu!
Các yêu cầu trên dẫn ta tới bài toán kiểm định, với hai nhánh lớn là
kiểm định tham số và kiểm định phi tham số!
2.5.1.1.Các thành phần của bài toán kiểm định
Bài toán kiểm định nói chung sẽ có các thành phần sau:
Cặp giả thuyết thống kê (H0 và H1)
H0: giả thuyết gốc, (chứa dấu =, ≥, ≤ với KĐ tham số)
H1: giả thuyết đối, (chứa dấu ≠, <, > với KĐ tham số)
H0 và H1 đối nhau (ngược nhau) và trong khuôn khổ môn học, chỉ xét
H0 là giả thuyết đơn, dạng θ = θ0, cho cả 3 trường hợp:
θ = θ0, θ ≥ θ0, θ ≤ θ0
Việc xác định cặp giả thuyết dựa trên yêu cầu (câu hỏi) bài ra
Tiểu chuẩn kiểm định và quy tắc bác bỏ giả thuyết (miền bác bỏ)
- Tiêu chuẩn kiểm định là 1 hàm thống kê (G) xác định quy luật phân phối xác suất khi H0 đúng
- Miền bác bỏ H0 là tập hợp các giá trị cho kết quả ngược lại với H0, được xác định dựa trên nguyên lý xác suất nhỏ
Mức ý nghĩa của bài toán kiểm định (α)
Mức ý nghĩa (α) là xác suất mắc sai lầm khi đưa ra kết luận bác bỏ
H0, được cho trước với các giá trị thường là 10%, 5%, 1%
2.5.1.2.Thủ tục kiểm định
Bao gồm các bước:
- Lập cặp giả thuyết thống kê
Trang 24Trang Eureka Uni https://www.fb.com/EurekaUni.No1
- Từ mẫu tính toán các giá trị quan sát (Gqs) và giá trị tới hạn (gα) trong miền bác bỏ
- So sánh Gqs với gα để kết luận:
Nếu thỏa mãn miền bác bỏ => “Bác bỏ H0, chấp nhận H1” Nếu không thỏa mãn => “Chưa đủ cơ sở bác bỏ H0”
2.5.1.3.Sai lầm loại I, loại II
Các kết luận thu được từ bài toán kiểm định là không chắc chắn 100%, nói cách khác là có thể mắc phải sai lầm!
Có hai loại sai lầm mắc phải tương ứng với các kết luận thu được, cụ thể như sơ đồ sau:
Bác bỏ H0| thực tế nó đúng => sai lầm loại I
P(mắc phải) = α (mức ý nghĩa) Chưa bác bỏ H0| thực tế nó sai => sai lầm loại II
P(mắc phải) = β Sai lầm loại II để lại hậu quả nghiêm trọng hơn
Lực kiểm định: 1 – β
2.5.1.4.Kiểm định bằng giá trị xác suất (p-value hay probability)
Một vài đặc điểm về p-value:
Trang 25Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Trang 26Trang Eureka Uni https://www.fb.com/EurekaUni.No1
H 0 –Tiêu chuẩn H 1 Miền bác bỏ W α H 0 –Tiêu chuẩn H 1 Miền bác bỏ W α
:
n n α α
S F S
Trang 27Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Trang 28Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Bảng kết quả Excel: T-test (kiểm định 2 trung bình tổng thể)
: Two-sample
t Test−
Nếu 15,85
x = ≈ y =15,275 ⇒µX =µY và µX ≠µY
Nếu x y> ⇒µX >µY Nếu x y< ⇒µX <µY
Trang 29Trang Eureka Uni https://www.fb.com/EurekaUni.No1
Bảng kết quả Excel: F-test (kiểm định 2 phương sai tổng thể)
X qs Y
sFs
=P(F<=f) one-tail
Trang 30Trang Eureka Uni https://www.fb.com/EurekaUni.No1
2.5.3 Kiểm định phi tham số
2.5.3.1.Kiểm định phân phối chuẩn
1
::
HH
HH