CHƯƠNG 3 HỆ PHƯƠNG TRÌNH TUYẾN TÍNH HỌC PHẦN TOÁN ĐẠI CƯƠNG CHƯƠNG 4 THỐNG KÊ TOÁN Giảng viên T S Trịnh Thị Hường Bộ môn Toán Email trinhthihuong@tmu edu vn NỘI DUNG CHÍNH 4 1 LÝ THUYẾT MẪU 4 2 ƯỚC LƯ[.]
Trang 1HỌC PHẦN TOÁN ĐẠI CƯƠNG
CHƯƠNG 4:
THỐNG KÊ TOÁN
Giảng viên: T.S Trịnh Thị Hường
Bộ môn : ToánEmail: trinhthihuong@tmu.edu.vn
Trang 2NỘI DUNG CHÍNH
4.1 LÝ THUYẾT MẪU
4.2 ƯỚC LƯỢNG THAM SỐ CỦA ĐLNN 4.3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Trang 34.1 LÝ THUYẾT MẪU
4.1.1 Khái niệm đám đông và mẫu
4.1.2 Các phương pháp mô tả mẫu
4.1.3 Các đặc trưng mẫu quan trọng
4.1.4 Quy luật PPXS của một số thống kê quan trọng
Trang 44.1.1 KHÁI NIỆM ĐÁM ĐÔNG VÀ MẪU
a Đám đông
Dấu hiệu X cần nghiên cứu là một ĐLNN và được gọi
là ĐLNN gốc, phân phối của X được gọi là phân phối
lý thuyết, tham số của X được gọi là tham số của đám đông hay tham số lý thuyết.
▪ Dấu hiệu cần nghiên cứu là định tính hoặc định
lượng
▪ N thường lớn và có thể coi là vô hạn.
Trang 5- Kiểm tra: mỗi hộp thực phẩm có bị hỏng không.
→ Dấu hiệu nghiên cứu
Việc làm này không phù hợp về mặt kinh tế
Trang 6Ví dụ 2: Đánh giá chiều cao của thanh niên Việt Nam năm 2016, biết năm 2016 có khoảng 25 triệu thanh niên.
- Dấu hiệu nghiên cứu X: Chiều cao của mỗi thanh niên
- Đám đông: 25 triệu thanh niên Việt Nam
- Kích thước đám đông: N= 25 triệu thanh niên
- Gọi X là chiều cao của một thanh niên Việt Nam năm
2016
→ X là ĐLNN, gọi là ĐLNN gốc.
Trang 7Ví dụ 3: Cần nghiên cứu trọng lượng của loại sản phẩm do một máy tự động sản xuất.
- Dấu hiệu nghiên cứu X: trọng lượng của mỗi sản
Trang 8b Mẫu
Nghiên cứu dấu hiệu X trên đám đông thườngkhông thực hiện được vì:
- N quá lớn hoặc vô hạn
- Rất tốn kém về thời gian, công sức và tiền bạc
Định nghĩa: Từ đám đông ta chọn ra một tập
hợp gồm n phần tử để nghiên cứu, tập hợp này
được gọi là mẫu
n: kích thước mẫu.
Trang 9Ví dụ: Đánh giá chiều cao của thanh niên Việt
Nam năm 2016
Chọn ngẫu nhiên 10.000 thanh niên điều tra
Ta có một mẫu kích thước n=10.000
Câu hỏi: Chọn mẫu như thế nào để mẫu đại
diện cho đám đông cần nghiên cứu?
Trang 10✓ -Chọn NN đơn giản có hoàn lại - Mẫu lặp (1)
✓ Chọn NN đơn giản không hoàn lại - Mẫu không
lặp (2)
✓ Điển hình
✓ Máy móc
Chú ý: Khi n << N thì hai cách chọn mẫu (1) và (2)
cho kết quả xấp xỉ nhau Do đó trên thực tế ta dùngcách chọn mẫu (2) nhưng kết quả áp dụng côngthức mẫu (1)
c Các phương pháp chọn mẫu
Trang 11DỮ LIỆU SƠ CẤP VÀ THỨ CẤP
Dữ liệu thứ cấp là dữ liệu đã qua tổng hợp, xử lý
Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối
tượng nghiên cứu Phương pháp thu thập: thực nghiệm, khảo sát qua điện thoại, thư hỏi, quan sát trực tiếp và phỏng vấn cá nhân.
Trang 12Mẫu ngẫu nhiên kích thước n là tập hợp của n ĐLNNđộc lập 𝑋1, 𝑋2 , 𝑋𝑛 được rút ra từ ĐLNN gốc X và cócùng quy luật phân phối với X.
Ký hiệu: W = 𝑋1, 𝑋2 , 𝑋𝑛 Trong một lần lấy mẫu Xinhận giá trị xi, ta có mẫu cụ thể
w = 𝑥1, 𝑥2 , 𝑥𝑛
d Mẫu ngẫu nhiên
Trang 13Ví dụ: Nghiên cứu kết quả học tập môn TĐC của
sinh viên 1 trường đại học hiện nay, biết trường
hiện có 20.000 sinh viên
Đám đông: Tất cả sinh viên của trường, N= 20.000 Gọi X là điểm môn TĐC của một SV thì X là
ĐLNN gốc
Lấy mẫu n=100 và X i là điểm LTXS và TKT của SV
i trên mẫu.
Mẫu ngẫu nhiên: W=(X 1 , X 2 ,… X 100 )
Điều tra 100 sinh viên ở 3 khóa ta thu được kếtquả w=(5.4, 6.8, 7.9, 3.3,…, 6.5)
Trang 144.1.2 CÁC PHƯƠNG PHÁP MÔ TẢ MẪU
a Dãy số liệu thống kê
Trong một lần lấy mẫu kích thước n, ta có mẫu cụ thể
w = 𝑥1, 𝑥2 , 𝑥𝑛Dãy giá trị 𝑥1, 𝑥2 , 𝑥𝑛 được gọi là dãy số liệu thống kê.
Trang 15Ví dụ: Điều tra giá thịt bò bắp (nghìn đồng/kg)
tại 30 quầy hàng ở 10 chợ trên địa bàn Hà Nộithu được dãy số liệu:
Trang 16b Bảng phân phối tần số thực nghiệm
Ta sắp xếp các giá trị quan sát theo thứ tự tăng dần
x 1 <x 2 <…<x k, trong đó n i là tần số của quan sát x i
Trang 17c Bảng phân phối tần suất thực nghiệm
Trang 18Ví dụ: Điều tra giá thịt bò bắp (nghìn đồng/kg) tại
30 cửa hàng tại Hà Nội
Trang 194.1.3 CÁC ĐẶC TRƯNG MẪU QUAN TRỌNG
Cho 1 mẫu ngẫu nhiên về dấu hiệu X, W=(X1, X2,…,Xn)
Trang 20Ví dụ: Tính giá thịt bò bắp trung trình của 30 cửa
Trang 21b Tần suất mẫu
Gọi p là tỷ lệ các phần tử mang dấu hiệu A trên đám đông.Gọi X là số phần tử mang dấu hiệu A khi chọn ngẫu nhiên mộtphần tử từ đám đông
Khi đó X ~ A(p) và E(X) = p, Var(X) = pq
Gọi nA là số phần tử mang dấu hiệu A trên mẫu thuđược Khi đó ta có tần suất mẫu: 𝑓 = 𝑛𝐴
Trang 22c Phương sai mẫu
Trang 23d Phương sai mẫu điều chỉnh
𝑛𝑖𝑥𝑖2 − 𝑛 lj𝑥2
Trang 24e Độ lệch tiêu chuẩn mẫu, độ lệch tiêu chuẩn mẫu điều chỉnh
𝑆 = 𝑆2 𝑆′ = 𝑆′2
Trên mẫu cụ thể ta có
𝑠 = 𝑠2 𝑠′ = 𝑠′2
Trang 25Ví dụ: Tính 𝑥 , s2, s’2.
Trang 264.1.4 QUY LUẬT PHÂN PHỐI CỦA MỘT SỐ THỐNG KÊ MẪU
Giả sử ta có mẫu ngẫu nhiên về dấu hiệu cần
nghiên cứu X: W=(X1, X2,…,Xn)
Hàm G = f(X1, X2,…,Xn) được gọi là thống kê.
Khi mẫu ngẫu nhiên nhận giá trị cụ thể
w = (x1, x2,…,xn) thì G cũng nhận giá trị cụ thể:
g = f(x1, x2,…,xn)
Trang 27Trường hợp 1: X có phân phối chuẩn
Trang 28Trường hợp 2: Chưa biết luật PPXS của X, mẫu đủ lớn
Trang 29Trường hợp 3: Quy luật phân phối của tần suất mẫu f
Xét đám đông: kích thước N, có M phần tử mang dấu hiệu A.
Gọi p là tỷ lệ phần tử mang dấu hiệu A trên đám đông.
≃ 𝑁 0,1