GIẢ THUYẾT NGHIÊN CỨU Hypothesis • Giả thuyết về mối quan hệ hay tương quan giữa hai hay nhiều biến H0: Hai nhiều biến khảo sát độc lập với nhau không có H1: Tồn tại mối quan hệ hoặc t
Trang 1KIỂM ĐỊNH THỐNG KÊ
PHÂN TÍCH DỮ LIỆU
VỚI SPSS
Hồ Thanh Trí
Trang 2THỐNG KÊ SUY DIỄN
tham số của đám đông.
định thống kê để kiểm nghiệm các giả thuyết về tổng thể.
Trang 3Giả thuyết nghiên cứu
• H0: Giả thuyết không (null hypothesis) – mô tả hiện tượng lúc bình thường, dạng cấu trúc mang dấu bằng (=, ≥, ≤).
• HR: Giả thuyết thay thế (alternative hypothesis)
-mô tả tình trạng ngược lại H0, dạng cấu trúc không
có dấu bằng (≠,>,<).
đúng
Trang 4GIẢ THUYẾT NGHIÊN CỨU
(Hypothesis)
• Giả thuyết về mối quan hệ hay tương quan giữa hai hay nhiều biến
H0: Hai (nhiều) biến khảo sát độc lập với nhau (không có)
H1: Tồn tại mối quan hệ hoặc tương quan giữa 2 (nhiều) biến
• Giả thuyết về các giá trị trung bình
H0: Giá trị trung bình của 2 hoặc nhiều hơn 2 mẫu ngang bằng nhau(không có sự khác biệt)
H1: Tồn tại sự khác biệt giữa các giá trị trung bình của 2 (nhiều)biến
• Giả thuyết về các phương sai
H0: Phương sai giữa 2 (nhiều) mẫu là ngang bằng
H1: Phương sai giữa 2 (nhiều) mẫu là không ngang bằng
Trang 5Giả thuyết nghiên cứu
Nguyên tắc kiểm định trong SPSS:
Dựa vào mức ý nghĩa kiểm định (xác xuất sai lầm loại
1) (Significance level), viết tắt Sig.
• Nếu Sig ≥ : từ chối giả thuyết HR (chấp nhận H0).
• Nếu Sig < : chấp nhận giả thuyết HR (từ chối H0).
Chú ý: = 0.05 (trong khoa học kinh tế)
Trang 6THỐNG KÊ SUY DIỄN
• Kiểm định mối quan hệ giữa hai biến định tính: kiểm định mối quan hệ giữa hai biến trong bản chéo Sử dụng kiểm định Chi bình phương.
• Kiểm định sự khác nhau giữa hai giá trị trung bình
Kiểm định Student’s t cho hai mẫu độc lập (Independent samples t test)
Kiểm định Student’s t cho cặp mẫu (Paired samples test)
t-Phân tích phương sai một yếu tố (One-way ANOVA)
Trang 7THANG ĐO Phương pháp
kiểm định
Ghi chú
Biến độc lập Biến phụ thuộc
Định danh Định danh Chi bình phương
Thứ bậc Thứ bậc Chi bình phương
Giá trị số Định lượng One Sample T-Test
Định tính (2 nhóm) Định lượng Independent Sample
Định lượng One – way ANOVA
1 Định lượng 1 Định lượng Hồi quy đơn (SLR)
Trang 8THANG ĐO Phương pháp
Trang 9Các bước kiểm định giả thuyết nghiên
cứu
• Thiết lập giả thuyết cần kiểm định
• Chọn phép kiểm định thích hợp và tính giá trị thống kê
kiểm định của nó (giá trị xác xuất p hay mức nghĩa Sig.).
• So sánh giá trị p với mức nghĩa a = 0.05 để ra quyết
định
• Diễn giải kết quả kiểm định giả thuyết nghiên cứu
Trang 101- KIỂM ĐỊNH MỐI QUAN HỆ GIỮA
HAI BIẾN ĐỊNH TÍNH
•
Trang 11•
Trang 12KIỂM ĐỊNH MỐI QUAN HỆ GIỮA
Trang 13KIỂM ĐỊNH MỐI QUAN HỆ GIỮA
HAI BIẾN ĐỊNH TÍNH
Các đại lượng thống kê trong kiểm định χ2
Trang 14KIỂM ĐỊNH MỐI QUAN HỆ GIỮA 2 BIẾN
> Crosstabs)
Trang 15KIỂM ĐỊNH MỐI QUAN HỆ GIỮA 2
BIẾN ĐỊNH TÍNH
Trang 162-KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG
BÌNH TỔNG THỂ (1 biến định lượng)
Các bước kiểm định giả thuyết nghiên cứu:
• Thiết lập giả thuyết cần kiểm định
• Chọn mức ý nghĩa mong muốn
• Chọn phép kiểm định thích hợp và tính giá trị thống kê kiểm
định của nó (giá trị xác xuất p hay mức nghĩa Sig.).
• So sánh giá trị p với mức ý nghĩa = 0.05 để ra quyết định
• Diễn giải kết quả kiểm định giả thuyết nghiên cứu
Trang 17KIỂM ĐỊNH THAM SỐ TRUNG BÌNH
(Analyze > Compare Means > One - Sample
T Test)
Trang 18KIỂM ĐỊNH THAM SỐ TRUNG BÌNH
(Analyze > Compare Means > One - Sample
T Test)
Trang 19Trong nhiều trường hợp cần so sánh trị trung bình về một chỉ tiêu nghiên cứu nào đó giữa hai đối tượng bạn quan tâm Bạn có 2 biến tham gia trong một phép kiểm định trung bình: 1 biến định lượng và 1 biến định tính dùng để chia nhóm ra để tính, bạn sử dụng kiểm định independent – samples T-test.
3-KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
Trang 20Bước 1: Kiểm nghiệm phương sai ngang bằng (Levene’s test)
Thiết lập giả thuyết
Ho: Phương sai giữa 2 mẫu ngang bằng nhau
H1: Phương sai giữa 2 mẫu không ngang bằng nhau
Kiểm nghiệm F
Công thức tính F:
Nếu p-value (sig.) <= α Bác bỏ Ho Lựa chọn kiểm nghiệm t sosánh trung bình mẫu với điều kiện phương sai không ngang bằng
(Equal variances not assumed)
Nếu p-value (sig.) > α Chấp nhận Ho Lựa chọn kiểm nghiệm t so
sánh trung bình mẫu với điều kiện phương sai ngang bằng (Equal
variances assumed)
KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
Trang 21KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
•
Trang 22Ước lượng tham số trung bình:
• Dữ liệu: định lượng (liên tục)
• Độ tin cậy (1-mức ý nghĩa)
So sánh trung bình hai mẫu độc lập (kích thước 2 mẫu
Dữ liệu định lượng (liên tục)
Dữ liệu của hai nhóm phải tuân theo quy luật phân phối chuẩn
KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
Trang 23KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ (Analyze > Compare Means > Independent Sample T Test)
Trang 24KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
Nếu Sig trong kiểm
định phương sai < 0,05
thì phương sai của 2
mẫu không bằng nhau,ta
dùng kết quả kiểm định
t ở dòng thứ 2
Trang 25Ho: Không có sự khác biệt về tiền lương giữa người nam và nữH1: Có sự khác biệt về tiền lương giữa người nam và nữ
(ví dụ:euro0608)
KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
Trang 26KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ
Trang 274-SO SÁNH 2 BIẾN PHỐI HỢP TỪNG
Sample T-Test)
• Đây là loại kiểm định dùng cho 2 nhóm tổng thể có liên hệ với nhau
Dữ liệu của mẫu thu thập ở dạng thang đo định lượng
• Quá trình kiểm định sẽ bắt đầu với việc tính toán chênh lệch giá trị trêntừng cặp quan sát bằng phép trừ Sau đó kiểm nghiệm xem chênh lệchtrung bình của tổng thể có khác 0 không, nếu = 0 tức là không có khácbiệt
• Lợi thế của phép kiểm định này là loại trừ được những yếu tố tác độngbên ngoài vào nhóm thử
• Phương pháp kiểm định này rất thích hợp với dạng thử nghiệm trước vàsau, một thử nghiệm rất hay gặp trong nghiên cứu,
Trang 28SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP
• Ví dụ: khi công ty chế biến thực phẩm của bạn khảo sát ngườitiêu dùng về loại đậu phộng chế biến sẵn vừa cải tiến về thànhphần lớp vỏ bên ngoài, bạn phải tổ chức cho dùng thử sảnphẩm trên cùng một nhóm người mới có thể thu được nhữngthông tin xác thực về sự đánh giá mùi vị, độ ngon
• Bạn sẽ tìm ra kết quả bằng cách yêu cầu người dùng đánh giásản phẩm, càng ngon thì cho điểm càng cao
• Sau đó áp dụng phương pháp kiểm định trị trung bình của 2mẫu phối hợp từng cặp và đưa ra kết luận
• Nếu khi cả 2 sản phẩm được đánh giá như nhau, tức là phươngpháp cải tiến không thu được kết quả gì
Trang 29Điều kiện áp dụng:
Kích cỡ 2 mẫu so sánh phải bằng nhau
Phân phối chuẩn
Trang 31SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP
Trang 32• Mục tiêu của phân tích phương sai ANOVA (Analysis of Variance) là
so sánh trung bình của nhiều tổng thể dựa trên các giá trị trung bình củacác mẫu quan sát từ các tổng thể này, và thông qua kiểm định giả thuyết
để kết luận về sự bằng nhau giữa các trung bình tổng thể
• Trong thực tiễn, chúng ta dùng ANOVA như là một công cụ để phân
tích ảnh hưởng của một yếu tố nguyên nhân đến một kết quả nào đó,
gọi là phân tích phương sai một yếu tố (One-way ANOVA); việc xem
xét ảnh hưởng của hai yếu tố nguyên nhân đến một yếu tố kết quả nào
đó gọi là phân tích phương sai 2 yếu tố (Two-way ANOVA).
• Phân tích phương sai là sự mở rộng của kiểm định Samples T-Test (biến định tính có 3 sự lựa chọn trở lên)
independent-• Khi thực hiện ANOVA, yếu tố nguyên nhân phải là biến định tính, kýhiệu là biến xi, yếu tố kết quả (biến phụ thuộc) thường là biến địnhlượng, ký hiệu là biến y
5.PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG: PHÂN TÍCH PHƯƠNG SAI
Trang 335.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Một số giả định đối với phân tích phương sai một yếu tố:
Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên
Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn đểđược xem như tiệm cận phân phối chuẩn
Các nhóm có cùng phương sai
Từ một biến phân loại X, chúng ta chia tổng thể thành k nhóm độc lập,nhóm 1 có n1 quan sát, nhóm 2 có n2 quan sát, nhóm k có nk quan sát.Chú ý, n = n1 + n2 + + nk
• Giả thuyết H0 là các nhóm (tổng thể) có trung bình bằng nhau:
• H0: µ1 = µ2 =… = µi = µk; trong đó, µi là trung bình của nhóm thứ i Giả thuyết đối H1 : có ít nhất hai trung bình là khác nhau.
Trang 34Các bước tiến hành kiểm định:
Bước 1: Tổng các biến thiên giữa các nhóm SSG (between-group
sums of squares) là:
Bước 2: Tổng các biến thiên trong nội bộ nhóm SSW
(within-group sums of squares) là:
Bước 3: Tổng biến thiên trong nhóm và giữa các nhóm SST (totalsum of squares):
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 35Loại biến
thiên
Tổng biến thiên
Bậc tự do
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 36Quy tắc bác bỏ H 0 là nếu giá trị thống kê F lớn hơn giá trị tới hạn Fk-1,
n-k,α Khi sử dụng SPSS, quy tắc bác bỏ H 0 là giá trị p-value (sig.)
nhỏ hơn mức ý nghĩa kiểm định α.
Bây giờ, chúng ta kiểm định ảnh hưởng của 4 nhóm dân tộc khác nhau
lên thu nhập Trong SPSS, ta thao tát như sau: Analyze > Compares means > One – way ANOVA > đưa biến thunhap vào ô Dependent List và đưa biến dantoc vào ô Factor > nhấn Options > nhấp chọn Descriptive và Homogeneity of variance test (kiểm định phương sai
đồng nhất, nghĩa là 4 nhóm có cùng phương sai theo giả thuyết củaANOVA)
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 375.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 38• Bảng Descriptives trình bày thống kê mô tả của biến thunhap
theo 4 nhóm dân tộc
• Bảng Test of Homogeneity of variances kiểm định phương sai
bằng nhau của các nhóm Vì giá trị sig = 801 > 05 (α = 5%)
nên chấp nhận giả thuyết H0: bốn phương sai bằng nhau
• Bảng ANOVA cho thấy sig = 958 > 0.05 nên chấp nhận giả
thuyết H0 : các giá trị trung bình là bằng nhau
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 39• Một ví dụ khác, chúng ta phân tích “yếu tố nguyên nhân” thamgia đoàn/hội (biến doanhoi) có ảnh hưởng đến tửu lượng (biến tuuluong) của SV hay không? Để trả lời câu hỏi này, chúng ta
cần so sánh giá trị trung bình của biến tuuluong theo hai nhóm:
SV tham gia đoàn/hội và SV không tham gia đoàn/hội và kiểmđịnh rằng có hay không có sự khác biệt một cách có ý nghĩathống kê giữa hai nhóm
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 40Test of Homogeneity of Variances
33-point drinking scale
Levene
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Từ bảng Test of Homogeneity of Variance, ta thấy Sig = 058 > 0.05 chấp nhận H0: phương sai đồng nhất thỏa mãn giả thuyết về phân tích ANOVA.
ANOVA
So ly bia uong duoc
Sum of Squares df
Mean Square F Sig.
ý nghĩa thống kê giữa nhóm SV có tham gia đoàn/hội với nhóm SV không tham gia đoan/hội về tửu lượng.
Trang 41Bây giờ, chúng ta phân tích “yếu tố nguyên nhân” sinh viên
năm thứ nhất, thứ hai, thứ ba và năm cuối (biến namhoc) có
ảnh hưởng đến tửu lượng hay không? Như vậy, chúng ta cần
so sánh giá trị trung bình của biến tuuluong theo 4 nhóm SV
và kiểm định rằng có hay không có sự khác biệt có ý nghĩa thống kê giữa các nhóm này.
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 42m Maximum
Lower Bound BoundUpper Nam thu
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 435.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
ANOVA
So ly bia uong duoc
Sum of Squares df
Mean Square F Sig.
SV không khác biệt một cách có ý nghĩa thống kê Kết quả phân tích
ANOVA như trên có thể sử dụng tốt Tuy nhiên, bảng trên chưa cho biết sự khác biệt giữa các cặp trong 4 nhóm
SV Chúng ta cần thực hiện kiểm định hậu ANOVA, với 2 phương pháp kiểm
định bonferroni và scheffe.
Trang 44CÁC LOẠI KIỂM ĐỊNH
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)
Trang 45Multiple Comparisons Dependent Variable:So ly bia uong duoc
(I) Dang hoc nam thu
(J) Dang hoc nam thu
Mean
95% Confidence Interval
* The mean difference is significant at the 0.05 level.
Trang 46Cả 2 phương pháp bonferroni và scheffe đều cho thấy
sự khác biệt có ý nghĩa trong trị trung bình giữa nhóm
SV năm thứ hai và SV năm thứ tư, trong khi các nhóm khác thì không.
5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU
TỐ(ONE WAY- ANOVA)