CHƯƠNG 3 HỆ PHƯƠNG TRÌNH TUYẾN TÍNH HỌC PHẦN TOÁN ĐẠI CƯƠNG CHƯƠNG 4 THỐNG KÊ TOÁN Giảng viên T S Trịnh Thị Hường Bộ môn Toán Email trinhthihuong@tmu edu vn NỘI DUNG CHÍNH 4 1 LÝ THUYẾT MẪU 4 2 ƯỚC LƯ[.]
Trang 1HỌC PHẦN TOÁN ĐẠI CƯƠNG
CHƯƠNG 4:
THỐNG KÊ TOÁN
Giảng viên: T.S Trịnh Thị Hường
Bộ môn : Toán Email: trinhthihuong@tmu.edu.vn
Trang 2NỘI DUNG CHÍNH
4.1 LÝ THUYẾT MẪU
4.2.1 ƯỚC LƯỢNG ĐIỂM
4.3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Trang 3Giả sử cần ước lượng tham số θ của ĐLNN X trên một
đám đông nào đó
• Ta lấy mẫu ngẫu nhiên W = (X 1 ,X 2 ,…,X n)
• Tùy thuộc vào θ, XDTK: θ* = f(X 1 ,X 2 ,…,X n)
• Khi n khá lớn với mẫu cụ thể w = (x 1 ,x 2 ,…,x n), tínhtoán
θ*
tn = f (x 1 ,x 2 ,…,x n)
Ta lấy θ ≈ θ*tn làm ước lượng điểm cho tham số θ
4.2 Ước lượng tham số của ĐLNN
4.2.1 Ước lượng điểm
Trang 4C ÁC TIÊU CHUẨN ĐÁNH GIÁ BẢN CHẤT TỐT CỦA ƯỚC LƯỢNG
a Ước lượng không chệch (unbiased estimator)
b Ước lượng vững (consistent estimator)
c Ước lượng hiệu quả (efficient estimator)
Trang 5a Ước lượng không chệch.
của θ nếu
E(θ*) = θ Ngược lại, ta nói θ* được gọi là ước lượng chệch của θ
Trang 6b Ước lượng vững
θ* được gọi là ước lượng vững của θ nếu với mọi ε > 0 ta có:
lim𝑛→∞ 𝑃 ( 𝜃∗ − 𝜃 < 𝜀) = 1
Ví dụ:
𝑋 là ước lượng vững của μ.
f là ước lượng vững của p.
Trang 7c Ước lượng hiệu quả (không chệch tốt nhất)
θ* được gọi là ước lượng hiệu quả của θ nếu nó là ước lượng không chệch và có phương sai nhỏ nhất
so với mọi ước lượng không chệch khác được xây dựng trên cùng một mẫu.
Trang 8Hạn chế của phương pháp ước lượng điểm
• Kết quả ước lượng không đáng tin cậy nếu n
không đủ lớn
• Không chỉ ra sai số, độ tin cậy của ước lượng
=> Phương pháp: Ước lượng bằng khoảng tin cậy
Trang 94.2.2 Ước lượng bằng khoảng tin cậy
a Ước lượng khoảng, khoảng tin cậy và độ tin cậy
Giả sử cần ước lượng tham số θ của ĐLNN X trên đám
đông
Chọn mẫu ngẫu nhiên W = (X1,X2, …, Xn),
Từ ước lượng điểm tốt nhất của θ xây dựng thống kê:
G = f(X1,X2, …, Xn, θ)sao cho G có quy luật xác định
Trang 10Với γ = 1 - α cho trước, xác định α1 ≥ 0, α2 ≥ 0 thỏa
mãn α1+ α2 = α
Từ đó xác định các phân vị g1- α1 và gα2
𝑃 𝑔1−𝛼1 < 𝐺 < 𝑔𝛼2 = 1 − 𝛼1 − 𝛼2 = 1 − 𝛼
𝑃 𝜃1∗ < 𝐺 < 𝜃2∗ = 1 − 𝛼
Xác suất = 1 - α được gọi là độ tin cậy
Khoảng 𝜃1∗, 𝜃2∗ được gọi là khoảng tin cậy
𝐼 = 𝜃2∗ − 𝜃1∗ được gọi là độ dài khoảng tin cậy
Trang 11Chú ý:
+ Thường chọn độ tin cậy khá lớn như 0,9; 0,95 hay 0,99… theo nguyên lý xác suất lớn thì biến cố (θ*1 < θ < θ*2 ) hầu chắc chắn xảy ra trong một lần thực hiện phép thử.
+ Xác suất mắc sai lầm trong ước lượng khoảng là α.
+ Khi G có phân phối N(0,1) hoặc phân phối Student nếu chọn α1= α2 = α/2 ta có khoảng tin cậy ngắn nhất và đó là các khoảng tin cậy đối xứng
+ Để ước lượng giá trị tối đa hoặc tối thiểu của θ ta chọn
α1= α hoặc α2 = α
Trang 12b Ước lượng kỳ vọng toán của ĐLNN
Giả sử ĐLNN X trên đám đông có E(X) = μ và
Var(X) = σ2 trong đó μ chưa biết
Bài toán đặt ra: từ mẫu ngẫu nhiên thu được, ta
ước lượng μ
Trường hợp 1: ĐLNN gốc X phân phối chuẩn, σ2 đã biết Trường hợp 2: ĐLNN gốc X phân phối chuẩn, σ2 chưa biết
Trường hợp 3: Chưa biết luật PPXS của X, nhưng n > 30
Trang 13TRƯỜNG HỢP 1: ĐLNN GỐC X PHÂN PHỐI CHUẨN, Σ 2 ĐÃ BIẾT
Trang 14Xác suất Khoảng tin cậy
Trang 15Ta có 3 bài toán cần giải quyết:
Bài toán 1: Cho n, cho 𝛾 , tìm sai số hoặc khoảng tin cậy
Bài toán 2: Cho n, cho sai số ε hoặc khoảng tin cậy, tìm độ
n u
Bài toán 3: Cho độ tin cậy, cho sai số hoặc khoảng tin cậy, tìm n
𝑛 = 𝜎
2 𝑢𝛼/22
𝜖2Chú ý: Nếu biết μ, cần ước lượng ത 𝑋 ta sẽ có:
𝑃 𝜇 − 𝜖 < ത 𝑋 < 𝜇 + 𝜖 = 1 − 𝛼 = 𝛾
Trang 16T RƯỜNG HỢP 2: ĐLNN GỐC X PHÂN PHỐI CHUẨN ,
Trang 17Xác suất Khoảng tin cậy
Trang 18TRƯỜNG HỢP 3: CHƯA BIẾT LUẬT PPXS CỦA X,
Trang 20Từ đám đông ta lấy mẫu ngẫu nhiên kích thước n
≃ 𝑁 0,1
Trang 21Xác suất Khoảng tin cậy