Biến số, thống kê, tham số• Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng: – Có hút thuốc lá hay không hút thuốc lá – Chiều cao của một người • Thống kê: đặc trưng củ
Trang 1Ước lượng và kiểm định thống kê
TS Đỗ Văn Dũng
www.fphhcm.org
Trang 2• Dân số mục tiêu (target population): quần thể mà chúng ta muốn áp dụng kết quả nghiên cứu
• Mẫu (sample – study population): quần thể được khảo sát để tìm ra kết quả nghiên cứu – Mẫu là tập hợp các đối tượng nghiên cứu (subjects)
Trang 3Biến số, thống kê, tham số
• Biến số: Đặc tính hay đại lượng có thể thay đổi của các đối tượng:
– Có hút thuốc lá hay không hút thuốc lá
– Chiều cao của một người
• Thống kê: đặc trưng của đặc tính hay đại lượng của mẫu
– Tỉ lệ hút thuốc lá ở trong mẫu nghiên cứu gồm 100 thanh niên
– Chiều cao trung bình 100 thanh niên trong mẫu nghiên cứu
• Tham số: Đặc trưng của đặc tính hay đại lượng của dân số
– Tỉ lệ hút thuốc lá ở nam thanh niên Việt Nam
– Chiều cao trung bình của nam thanh niên Việt Nam
Trang 6Định lí giới hạn trung tâm
1 Giá trị x và s thay đổi từ mẫu này sang mẫu khác
2 Giá trị x phân bố đối xứng chung quanh giá trị trung bình dân số µ
3 Giá trị x tập trung chung quanh giá trị µ Nói cách khác giá trị gần µ sẽ xuất hiện nhiều hơn các giá trị xa µ
X~N(µ,σ2) =>
) ,
(
~
2
n N
Trang 7• Độ lệch chuẩn (standard deviation) nói lên sự phân tán của biến số (đo lường của cá thể)
• Sai số chuẩn (standard error) nói lên sự phân tán của thống kê (trung bình mẫu)
• Sai số chuẩn = độ lệch chuẩn/sqrt(N)
Trang 8• Std Err (Standard error): Sai số chuẩn
– Ước lượng sự khác biệt giữa thống kê (trung bình mẫu) và tham số (trung bình dân số)
• 95% Confident Interval (95% CI): Khoảng tin cậy 95% của tham số
– Thống kê ± 1,96 * sai số chuẩn
• Thống kê t = Thống kê của biến số / sai số chuẩn
Trang 9• 95% Confident Interval (95% CI): Khoảng tin cậy 95% của tham số
– Thống kê ± 1,96 * sai số chuẩn
• Ước lượng khoảng tin cậy 95% của trung bình dân số
– Trung bình mẫu ± 1,96 * sai số chuẩn
• Ước lượng khoảng tin cậy 95% của tỉ lệ trong dân số
– Tỉ lệ mẫu ± 1,96 * sai số chuẩn
Trang 10Một nghiên cứu ghi nhận trên cỡ mẫu 1235 trẻ sơ sinh ở tỉnh Đồng Tháp cho thấy trọng lượng trung bình của trẻ sơ sinh là
3121 gram và độ lệch chuẩn là 435 gram Hãy ước lượng
khoảng tin cậy 95% của trọng lượng trung bình của trẻ sơ sinh tỉnh Đồng Tháp
-Hãy tính sai số chuẩn của trọng lượng trung bình
-Ước lượng khoảng tin cậy 95% của trung bình trọng lượng sơ sinh tỉnh Đồng Tháp
Trang 13Cỡ mẫu Trung bình mẫu
Độ lệch chuẩn mẫu Mức tin cậy
Một nghiên cứu ghi nhận trên cỡ mẫu 1235 trẻ sơ sinh ở tỉnh Đồng Tháp cho thấy trọng lượng trung bình của trẻ sơ sinh là
3121 gram và độ lệch chuẩn là 435 gram Hãy ước lượng
khoảng tin cậy 95% của trọng lượng trung bình của trẻ sơ sinh tỉnh Đồng Tháp
Trang 14ư
Trang 15s n
s e
s
2
.
Trang 16• Mở tập tin ivf_v2
• Thực hiện thống kê mô tả cho trọng lượng sơ sinh
• Ở 641 trẻ sơ sinh trọng lượng sơ sinh có trung bình là 3129,137 gram và độ lệch chuẩn là 652,78 gram Anh chị hãy cho biết khoảng tin cậy 95% của trọng lượng trẻ sơ sinh
Trang 20Cỡ mẫu Thành công (có biến cố quan tâm
Mức tin cậy
Điều tra trên 127 thanh niên có 45 thanh niên hút thuốc lá Hãy tính tỉ lệ thanh niên hút thuốc lá và khoảng tin cậy 95% của tỉ lệ hút thuốc lá.
Trang 23• Điều tra tại tỉnh Tiền Giang trên cỡ mẫu 1000 người phát hiện 40 người bị đái tháo đường
• Tỉ lệ đái tháo đường ở mẫu nghiên cứu là bao nhiêu?
• Tỉ lệ đái tháo đường ở người dân tỉnh Tiền Giang là bao nhiêu?