Bài giảng Thống kê ứng dụng trong kinh doanh: Chương 6 - Phân tích phương sai được biên soạn với các nội dung sau: Tổng quan về phân tích phương sai; Phân tích phương sai một yếu tố; Phân tích phương sai hai yếu tố; Thực hành phân tích dữ liệu bằng phân tích ANOVA với Excel/SPSS. Mời các bạn cũng tham khảo bài giảng tại đây!
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
CHƯƠNG 6
PHÂN TÍCH PHƯƠNG SAI
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH
Trang 2Nội dung chính
6.1 Tổng quan về phân tích phương sai (Bài giảng video)
6.2 Phân tích phương sai một yếu tố (Bài giảng video)
6.3 Phân tích phương sai hai yếu tố
6.4 Thực hành phân tích dữ liệu bằng phân tích ANOVA với Excel/SPSS
Trang 3Mục tiêu của chương
Sau khi kết thúc chương này, người học có thể:
§ Hiểu được phạm vi ứng dụng và những giả định cần có khi thực hiện ANOVA (phân tích phương sai)
§ Nắm vững quy trình thực hiện ANOVA một yếu tố
§ Biết cách đọc bảng ANOVA và mối liên hệ giữa các chỉ tiêu trong bảng ANOVA
§ Mô tả được quy trình thực hiện ANOVA hai yếu tố: trường hợp có một quan sát trong một ô và nhiều quan sát trong một ô.
§ Biết cách thực hiện phân tích phương sai với Excel/SPSS
Trang 46.1 Giới thiệu chung
§ AN ALYSIS O F VA RIANCE: ANOVA
§ Là sự mở rộng của kiểm định trung bình
KĐ tỷ lệ
KĐ phương sai
KĐ trên k tổng thể (k>2)
ANOVA 1 yếu tố ANOVA 2 yếu tố
Trang 56.1 Giới thiệu chung
§ AN ALYSIS O F VA RIANCE: ANOVA
§ Là sự mở rộng của kiểm định trung bình
§ Cho phép so sánh trung bình của nhiều nhóm/ tổng thể cùng một lúc
§ Nghiên cứu mối quan hệ giữa một biến phân loại và một biến định lượng
Cách trưng bày sản phẩm Cách 1 Cách 2 Cách 3
Trang 66.1 Giới thiệu chung
Bản chất của ANOVA
§ Mục đích của ANOVA: Phân tích ảnh hưởng của biến đầu vào X đến biến đầu ra Y,
trong đó:
§ X có dữ liệu định tính, có từ 3 biểu hiện/ giá trị trở lên
§ Y có dữ liệu định lượng (thang đo khoảng, tỷ lệ)
§ Xem xét tác động của 1 biến X1 đến Y:
ANOVA một yếu tố (one-way ANOVA/ Single factor ANOVA)
§ Xem xét tác động của 2 biến đầu vào X1 và X2 tới Y:
ANOVA hai yếu tố (two-way/ two-factor ANOVA)
Trang 76.2 Phân tích phương sai một yếu tố
Giả sử cần so sánh số trung bình của k tổng thể độc lập.
§ Lấy k mẫu có số quan sát là n1, n2… nk; tuân theo PP chuẩn.
§ Trung bình của các tổng thể được ký hiệu là μ1; μ2 ….μk
§ Mô hình phân tích phương sai một yếu tố ảnh hưởng được mô tả dưới dạng kiểm định giả thuyết như sau:
Ho: μ1 = μ2 =….=μk
H1: Tồn tại ít nhất 1 cặp có μi ≠μ j; i ≠ j
Trang 86.2 Phân tích phương sai một yếu tố
Để kiểm định cần 3 giả thiết sau:
§ Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
§ Các phương sai tổng thể bằng nhau
§ Lấy k mẫu độc lập từ k tổng thể Mỗi mẫu được quan sát nj lần.
Trang 96.2 Phân tích phương sai một yếu tố
Trang 106.2 Phân tích phương sai một yếu tố
CÁC BƯỚC KIỂM ĐỊNH
§ Bước 1: Tính các trung bình mẫu của các nhóm và trung bình chung
Công thức trung bình mẫu
Công thức trung bình chung
k
i i
Trang 116.2 Phân tích phương sai một yếu tố
CÁC BƯỚC KIỂM ĐỊNH
Bước 2: Tính tổng các độ lệch bình phương
B2.1 Tổng các chênh lệch bình phương trong nội bộ nhóm
( SSW - S um of S quares W ithin group)
1
2 1
=
2 2
Trang 12-6.2 Phân tích phương sai một yếu tố
Trang 136.2 Phân tích phương sai một yếu tố
CÁC BƯỚC KIỂM ĐỊNH
Bước 3: Tính các phương sai (là trung bình của các chênh lệch bình phương)
Phương sai trong nội bộ nhóm
Phương sai giữa các nhóm
SSW MSW
k
=
Trang 14
-6.2 Phân tích phương sai một yếu tố
CÁC BƯỚC KIỂM ĐỊNH
Bước 4: Kiểm định giả thuyết
Tính tiêu chuẩn kiểm định F (F thực nghiệm/ F quan sát)
Nếu Fstat > F ((k-1; n-k);α)
MSB F
MSW
=
stat
Trang 156.2 Phân tích phương sai một yếu tố
Bảng ANOVA
Tra giá trị tới hạn F bằng excel
=FINV(probability, degree of freedom1, degree of freedom2)
Trang 166.2 Phân tích phương sai một yếu tố
Ví dụ
Các nhà quản lý của một công ty đang nghiên cứu xem liệu có sự khác biệt về số lượng sản phẩm lỗi trên 1 triệu sản phẩm sản xuất ra khi áp dụng các cách thức kiểm soát chất lượng khác nhau Dưới đây là số liệu về sản phẩm lỗi trên mỗi triệu sản phẩm theo 3 cách thức:
Hãy kiểm định câu hỏi nghiên cứu của nhà quản lý với
Trang 176.2 Phân tích phương sai một yếu tố
205.8 x
226.0 x
249.2
x
Trang 186.2 Phân tích phương sai một yếu tố
Trang 196.2 Phân tích phương sai một yếu tố
25.275 93.3
2358.2 MSW
Trang 206.2 Phân tích phương sai một yếu tố
§ Data | data analysis | ANOVA: single factor
SUMMARY
Groups Count Sum Average Variance
Cách 1 5 1246 249.2 108.2 Cách 2 5 1130 226 77.5 Cách 3 5 1029 205.8 94.2
ANOVA
Source of
Between Groups 4716.4 2 2358.2 25.275 4.99E-05 3.89Within
Groups 1119.6 12 93.3Total 5836.0 14
Trang 216.2 Phân tích phương sai một yếu tố
Kiểm tra các giả định của phân tích phương sai
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
§ Dùng đồ thị: Histogram, biểu đồ hộp và râu, kiểm định Chi- bình phương (chương 9)
2) Các phương sai tổng thể bằng nhau
§ Dùng biểu đồ hộp và râu
§ Dùng kiểm định Levene: PP Hartley Fmax (tham khảo trang 264 SGK),
Tính Fmax =(𝑆"#$% / 𝑆"&'% ) và so sánh với Hartley F(k,df),a , df="𝑛 − 1
3) Lấy k mẫu độc lập từ k tổng thể Mỗi mẫu được quan sát nj lần: Do cách lấy mẫu
Trang 226.2 Phân tích phương sai một yếu tố
Phân tích sâu/ hậu ANOVA (Post-Hoc Test)
Mục đích: Phân tích sâu hơn trong trường hợp bác bỏ H0 để xác định cặp nhóm/ tổng thể có trungbình lớn hơn hay nhỏ hơn
Phương pháp:
§ Tukey (HSD- Honestly Significant Difference)
Giá trị kiểm định: D= | 𝑥 *!- 𝑥 *"| ; Giá trị tới hạn T=𝑞#$,&'$. ()*&!
q- giá trị tra bảng pp Tukey, ni chọn cỡ mẫu nhỏ nhất
§ LSD - Least Significant Difference: Ước lượng KTC
&&- &(± 𝑡)/%'+, 𝑀𝑆𝑊 (
-'& +
-'() Nếu 0 nằm trong KTCà không khác biệt
Nếu 0 không nằm trong KTCà có khác biệt
H0:µi=µj
H1:µi¹µj i¹j
Trang 236.3 Phân tích phương sai hai yếu tố
§ Phân tích phương sai 2 yếu tố nhằm xem xét cùng lúc hai yếu tố nguyên nhân (dưới dạng dữliệu định tính) ảnh hưởng đến yếu tố kết quả (dưới dạng dữ liệu định lượng) đang nghiên cứu
§ Ví dụ: Nghiên cứu ảnh hưởng của loại chất đốt và loại lò sấy đến tỷ lệ vải loại 1 sấy khô.
§ Phân tích phương sai 2 yếu tố giúp chúng ta đưa thêm yếu tố nguyên nhân vào phân tích làmcho kết quả nghiên cứu càng có giá trị
Trang 246.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ô
Lấy mẫu không lặp lại à sắp xếp các đơn vị mẫu của yếu tố nguyên nhân thứ nhất thành K nhóm(cột), các đơn vị mẫu của yếu tố nguyên nhân thứ hai thành H khối (hàng) à Bảng kết hợp 2 yếu tốnguyên nhân gồm K cột và H hàng và (K x H) ô dữ liệu Tổng số mẫu quan sát là n = (K x H)
Trang 256.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ô
Để kiểm định cần 2 giả thiết sau:
1) Mỗi mẫu tuân theo phân phối chuẩn N(μ, σ2)
2) Ta lấy K mẫu độc lập từ K tổng thể, H mẫu độc lập từ H tổng thể Mỗi mẫu được quan sát
1 lần không lặp
Trang 266.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ô
Bước 1:
§ Tính trung bình riêng của từng nhóm (K cột) và từng khối (H hàng)
§ Trung bình chung của toàn bộ mẫu quan sát
1
1, 2
H
i j j
i
X X
j
X X
n K H
Trang 276.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ô
Tổng các độ lệch bình phương giữa các khối (SSB) Phản ánh biến động
của yếu tố kết quả do ảnh hưởng của yếu tố nguyên nhân thứ hai (xếp theo
hàng ) – K - tổng số cột
Tổng các độ lệch bình phương phần dư (SSE)
Phản ánh biến động của yếu tố kết quả do ảnh hưởng của yếu tố nguyên
nhân khác không nghiên cứu
Trang 286.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ô
Bước 3: Tính các phương sai
• Phương sai giữa các nhóm (cột)
• Phương sai giữa các khối (dòng)
• Phương sai dư
Trang 296.3 Phân tích phương sai hai yếu tố
6.3.1 Trường hợp có 1 quan sát trong 1 ô
§ Bước 4: Tính các giá trị kiểm định
Trang 306.3 Phân tích phương sai hai yếu tố
6.3.2 Trường hợp có nhiều quan sát trong 1 ô
Trang 316.3 Phân tích phương sai hai yếu tố
6.3.2 Trường hợp có nhiều quan sát trong 1 ô
Kiểm định 3 giả thuyết H 0
§ Trung bình của K tổng thể theo yếu tố nguyên nhân thứ nhất (cột) bằng nhau
§ Trung bình của H tổng thể theo yếu tố nguyên nhân thứ hai (dòng) bằng nhau
§ Không có tác động qua lại giữa yếu tố thứ nhất (cột) và yếu tố thứ hai (dòng)
Tham khảo quy trình kiểm định trang 271 SGK
Trang 326.4 Thực hành phân tích dữ liệu bằng phân tích ANOVA
với Excel/SPSS
(Sinh viên thực hành theo hướng dẫn của giảng viên)
Trang 33TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
CHÚC CÁC BẠN HỌC TỐT