KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊKiểm định mối liên hệ giữa 2 biến • Kiểm định Chi bình phương Dùng để kiểm định mối liên hệ giữa hai biến định tính 2 biến định danh hoặc giữa biến định danh
Trang 1TẬP HUẤN
PHƯƠNG PHÁP NGHIÊN CỨU
(THỰC TẬP NGHỀ NGHIỆP KHÓA 43)
Trang 2PHÂN TÍCH DỮ LIỆU
• Phân tích thống kê mô tả
• Kiểm định giả thuyết thống kê
• Phân tích tương quan và hồi quy
• Phân tích nhân tố
Trang 3PHÂN TÍCH THỐNG KÊ MÔ TẢ
Các phương pháp cơ bản để tiến hành phân tích thống kê mô tả cho các biến:
- Bảng tần số
- Các đại lượng thống kê mô tả
- Bảng kết hợp nhiều biến
- Biểu đồ, đồ thị
Trang 4PHÂN TÍCH THỐNG KÊ MÔ TẢ
•Bảng tần số (cho cả biến định tính và định lượng)
Thực hiện trên SPSS:
Analyze => Descriptive Statistics => Frequencies
Từ danh sách các biến, chọn biến cần phân
tích và chuyển vào hộp Variable(s) bằng cách
nhấp chuột lên phím mũi tên
Trang 5PHÂN TÍCH THỐNG KÊ MÔ TẢ
• Các đại lượng thống kê mô tả (cho biến định lượng )
- Các đại lượng đo lường mức độ tập trung: trung
bình (mean), trung vị (median), số mode, tứ phân
vị (quartiles)…
- Các đại lượng đo lường mức độ phân tán:
khoảng biến thiên (range), phương sai (variance),
độ lệch chuẩn (standard deviation)…
- Các đại lượng mô tả phân phối: hệ số Skewness
và hệ số Kurtosis
Trang 6PHÂN TÍCH THỐNG KÊ MÔ TẢ
• Các đại lượng thống kê mô tả (cho biến định lượng)
Thực hiện:
Analyze => Descriptive Statistics => Descriptives
- Chọn biến định lượng cần phân tích vào khung Variable(s)
- Mở hộp thoại Options, chọn các đại lượng thống
kê cần tính toán để mô tả cho phân phối của biến định lượng đó
Trang 7PHÂN TÍCH THỐNG KÊ MÔ TẢ
• Các đại lượng thống kê mô tả (cho biến định lượng )
Lập bảng tần số kết hợp tính toán các đại lượng thống kê mô tả cho biến định lượng
Analyze => Descriptive Statistics => Frequencies
- Chọn biến định lượng vào khung Variable(s)
- Mở hộp thoại Statistics để lựa chọn các đại
lượng thống kê mô tả cho biến định lượng đó
Trang 8PHÂN TÍCH THỐNG KÊ MÔ TẢ
• Bảng kết hợp nhiều biến
- Bảng kết hợp giữa các biến định tính
Analyze => Descriptive Statistics => Crosstabs
Analyze => Tables => Custom Tables
Row(s) : ô chứa biến dòng khi truy xuất
bảng dữ liệu
Column(s): ô chứa biến cột khi truy xuất
bảng dữ liệu
Trang 9PHÂN TÍCH THỐNG KÊ MÔ TẢ
• Bảng kết hợp nhiều biến
- Bảng kết hợp giữa biến định lượng và biến định tính
Analyze => Tables => Custom Tables
- Chọn biến định lượng vào ô Rows
- Chọn biến định tính vào ô Columns
- Chọn hộp thoại Summary Statistics để tính toán
các giá trị thống kê Row%, Col%
- Chọn hộp thoại Catagories and Total để thể hiện
giá trị Tổng
Trang 10PHÂN TÍCH THỐNG KÊ MÔ TẢ
• Biểu đồ, đồ thị:
Các loại đồ thì cơ bản:
- Biểu đồ thanh (Bar Chart): được sử dụng biểu
diễn dữ liệu dưới dạng tần số hay tần suất %
- Biểu đồ hình tròn (Pie Chart): sử dụng biểu diễn
dữ liệu định tính dạng tần số hay tần suất % khi có
ít nhóm
- Biểu đồ đường gấp khúc (Line Chart) và diện tích (Area Chart): áp dụng tốt cho dữ liệu định lượng
Trang 11KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Trang 12KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
• Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số liệu của mẫu ngẫu nhiên
• Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ giả thuyết H 0 thì ra quyết định bác bỏ, ngược lại sẽ chấp nhận giả thuyết H 0
Trang 13KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Với SPSS, ta dùng giá trị Sig để ra quyết định
• Giá trị Sig là xác suất phạm sai lầm loại I, như vậy nó có cùng ý nghĩa với mức ý nghĩa α
• Nếu giá trị Sig nhỏ hơn mức ý nghĩa α, giả
thuyết H0 bị bác bỏ, chấp nhận giả thuyết H1
• Nếu giá trị Sig lớn hơn mức ý nghĩa α, không đủ bằng chứng thống kê để bác bỏ giả thuyết H0
Trang 14KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Kiểm định mối liên hệ giữa 2 biến
• Kiểm định Chi bình phương
Dùng để kiểm định mối liên hệ giữa hai biến định tính (2 biến định danh hoặc giữa biến định danh – biến thứ tự) trong tổng thể
Cho biết có tồn tại mối liên hệ giữa hai biến hay không
Giả thuyết H 0 : hai biến độc lập với nhau
Giả thuyết H 1 : hai biến có liên hệ với nhau Đọc kết quả:
- Sig ≤ α: bác bỏ giả thuyết H 0
- Sig > α: không bác bỏ giả thuyết H 0
Trang 15KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Kiểm định mối liên hệ giữa 2 biến
• Kiểm định Chi bình phương
- Kiểm định Chi bình phương chỉ có ý nghĩa khi số quan sát
đủ lớn (tỷ lệ các ô chéo trong bảng có tần số <5 phải
nhỏ hơn 20%)
- Kiểm định này không cho biết độ mạnh của mối liên hệ
giữa hai biến mà phải sử dụng các đại lượng Cramer V,
hệ số liên hợp (Coefficient of contigency)…
Trang 16KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Kiểm định mối liên hệ giữa 2 biến
• Sử dụng các đại lượng Gamma, tau – b của Kendall, d của Somer …
Dùng để kiểm định mối liên hệ giữa hai biến thứ bậc trong tổng thể
Giả thuyết H 0 : hai biến không có mối liên hệ (các giá trị này đều bằng 0)
Giả thuyết H 1 : hai biến có mối liên hệ (các giá trị này khác 0)
Đọc kết quả:
- Sig ≤ α: bác bỏ giả thuyết H 0
- Sig > α: không bác bỏ giả thuyết H 0
Trang 17KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Kiểm định mối liên hệ giữa 2 biến
• Sử dụng các đại lượng Gamma, tau – b của
Kendall, d của Somer …
Cách thực hiện:
- Lập bảng chéo (Crosstabs) để tìm hiểu mối quan
hệ giữa hai biến
- Chọn Statistics, đánh dấu chọn Gamma,
Somers’ d, Kendall’s tau – b (nếu bảng cân đối,
số hàng bằng số cột); Kendall’s tau – c (nếu
bảng không cân đối)
Trang 18KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
• Kiểm định giá trị trung bình tổng thể
- Nếu muốn so sánh giá trị trung bình tổng thể với một giá trị
cụ thể nào đó => Kiểm định giả thuyết về trung bình của tổng thể ONE – SAMPLE T - TEST
- Nếu muốn so sánh hai giá trị trung bình của hai tổng thể
riêng biệt => Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể, mẫu độc lập INDEPENDENT –
SAMPLES T – TEST
- Nếu muốn so sánh hai giá trị trung bình của hai tổng thể
phụ thuộc lẫn nhau => Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể, mẫu phụ thuộc PAIRED – SAMPLES T – TEST
- Nếu muốn so sánh giá trị trung bình giữa ba nhóm tổng thể riêng biệt trở lên => Kiểm định giả thuyết về sự bằng nhau giữa trung bình 3 tổng thể trở lên ONE – WAY ANOVA
Trang 19KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
One – Sample T – test
So sánh giá trị trung bình của một tổng thể với một giá trị cụ thể nào đó, sử dụng
kiểm định One – sample T – test
Điều kiện áp dụng:
- Mẫu được chọn phải ngẫu nhiên
- Mẫu phải có phân phối chuẩn hoặc xấp xỉ chuẩn
Trang 20KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
One – Sample T – test
- Chọn biến đưa vào khung Test variable
- Khai báo giá trị Test Value
Đọc kết quả:
- Sig ≤ α: bác bỏ giả thuyết H 0
- Sig > α: không bác bỏ giả thuyết H 0
Trang 21KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Independent – samples T – test
So sánh hai trung bình của hai tổng thể dựa trên hai mẫu độc lập, sử dụng kiểm định Independent – samples T – test
Trang 22KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Independent – samples T – test
Giả thuyết
H 0 : μ 1 = μ 2
H 1 : μ 1 ≠ μ 2
Cách thực hiện:
- Trên thanh Menu, chọn Analyze/Compare
Means/Independent – samples T – test
- Chọn biến định lượng đưa vào khung Test Variable
- Chọn biến định tính (chia số quan sát thành 2 nhóm mẫu độc lập) đưa vào khung Grouping Variable
- Chọn Define Groups để khai báo hai nhóm cần so sánh với nhau
Trang 23KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Independent – samples T – test
Dựa vào kết quả kiểm định sự bằng nhau của hai phương sai (Levene’s test) với giả thuyết
H0: Phương sai của hai tổng thể là như nhau
H1: Phương sai của hai tổng thể là khác nhau
• Nếu giá trị sig ≤ α => bác bỏ giả thuyết H0, do
đó sử dụng kết quả kiểm định t ở cột Equal
variances not assumed
• Nếu giá trị sig > α => không bác bỏ giả thuyết
H0, do đó sử dụng kết quả kiểm định t ở cột
Equal variances assumed
Trang 24KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Paired – samples T – test
So sánh hai giá trị trung bình của hai tổng thể dựa trên hai mẫu phụ thuộc hay mẫu phối hợp từng cặp, sử dụng Paired – samples T – test
Điều kiện áp dụng:
- Kích thước 2 mẫu bằng nhau
- Chênh lệch giữa các giá trị của 2 mẫu phải có
phân phối chuẩn hoặc kích thước mẫu đủ lớn để xem như có phân phối chuẩn
Trang 25KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Paired – samples T – test
- Chọn 2 biến chứa các giá trị của 2 mẫu quan sát đưa
vào khung Paired Variables để so sánh
Đọc kết quả:
- Sig ≤ α: bác bỏ giả thuyết H 0
- Sig > α: không bác bỏ giả thuyết H 0
Trang 26KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
One – way ANOVA
Nếu muốn so sánh giá trị trung bình của
các nhóm khác nhau
Trang 27KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
One – way ANOVA
Điều kiện áp dụng:
- Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên
- Các nhóm so sánh phải có phân phối
chuẩn hoặc cỡ mẫu đủ lớn để được xem như là phân phối chuẩn
- Phương sai của các nhóm so sánh đồng nhất (đều nhau)
Trang 28KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
One – way ANOVA
- Chọn biến định lượng đưa vào khung Dependent List
- Chọn biến phân loại xác định các nhóm cần so sánh đưa vào khung Factor
- Chọn Options: đánh dấu vào Descriptive và Homogeneity – of – variance
Trang 29KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
One – way ANOVA
- Nhấp chọn nút Post Hoc để mở hộp thoại này
- Trong hộp thoại này, có rất nhiều phương pháp kiểm định thống kê để so sánh các giá trị trung bình giữa các nhóm
Trang 30KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Trang 31TƯƠNG QUAN TUYẾN TÍNH
• Là mối liên hệ thuận chiều hoặc nghịch
chiều giữa 2 biến định lượng phân tích
• Sử dụng hệ số tương quan đơn r
(Pearson Correlation Coefficient) hoặc hệ
số tương quan hạng (Rank Correlation
Coefficient) để kiểm tra mối quan hệ tuyến
tính
Trang 32TƯƠNG QUAN TUYẾN TÍNH
• Cách thực hiện:
- Analyze => Correlate => Bivariate
- Chọn 2 biến cần phân tích vào khung Variables
- Chọn hệ số kiểm định tính toán
+ Pearson: phù hợp với dữ liệu được thu thập dưới dạng thang đo định lượng, thỏa điều kiện đối với phân phối chuẩn
+ Kendall’s tau – b và Spearman: không thỏa điều kiện đối với phân phối chuẩn
- Đọc kết quả: dựa vào giá trị Sig
Trang 33HỒI QUY TUYẾN TÍNH
Phân tích hồi quy là phân tích thống kê nhằm xác định ảnh hưởng của các biến độc lập đến các
biến phụ thuộc
Hồi quy tuyến tính là mô hình biểu diễn mối quan
hệ nhân quả giữa một biến được gọi là biến phụ
thuộc (hay biến được giải thích) và một hay
nhiều biến độc lập (hay biến giải thích), giúp nhà
nghiên cứu đưa ra dự báo mức độ của biến phụ thuộc khi biết trước giá trị của biến độc lập
Trang 34HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
Mô hình xây dựng từ dữ liệu mẫu có dạng
Y = B0 + B1*X Trong đó, X: biến độc lập
Trang 35HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Cách xây dựng mô hình trên SPSS:
- Analyze => Regression => Linear
- Chọn biến phụ thuộc, đưa vào ô
Dependent
- Chọn biến độc lập, đưa vào ô Independents
Trang 36HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Các giả định đối với phân tích hồi quy
tuyến tính đơn biến
- Liên hệ tuyến tính
- Phương sai của sai số không đổi
- Phân phối chuẩn của phần dư
- Tính độc lập của sai số (không có tương quan giữa các phần dư)
Trang 37HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Đánh giá độ phù hợp của mô hình
Để biết mô hình hồi quy tuyến tính đã xây dựng trên dữ liệu mẫu phù hợp đến mức độ nào với dữ liệu: sử dụng hệ số xác định R bình phương
- Hệ số này càng gần với 1 thì mô hình càng phù hợp, càng gần với 0 thì mô hình kém phù hợp với tập dữ liệu mẫu
- Hệ số xác định còn đo lường mối tương quan giữa X và Y
Trang 38HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Kiểm định giả thuyết
- Kiểm định độ phù hợp của mô hình hồi quy tổng thể, sử dụng đại lượng F từ bảng
phân tích phương sai ANOVA
+ Giả thuyết H0: hệ số R2 của tổng thể là 0 + Đọc kết quả: nếu Sig < α : bác bỏ giả
thuyết H0 và kết luận mô hình hồi quy
tuyến tính xây dựng phù hợp với tổng thể
Trang 39HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Kiểm định giả thuyết
- Kiểm định ý nghĩa của hệ số hồi quy
+ Độ dốc của mô hình tổng thể β1 = 0
+ Cách đọc kết quả: sử dụng giá trị Sig để kết
luận
+ Nếu Sig < α: bác bỏ giả thuyết H0, kết luận
giữa hai biến trong tổng thể có liên hệ tuyến tính+ Nếu Sig > α: chưa đủ bằng chứng thống kê
để bác bỏ giả thuyết H0
Trang 40HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Dò tìm sự vi phạm các giả định
1 Giả định về liên hệ tuyến tính
- Chọn hộp thoại Saves trong Linear Regression
để sao lưu giá trị phần dư chuẩn hóa
(standardized residual value) và giá trị dự đoán
chuẩn hóa (standardized predicted value)
- Vẽ biểu đồ phân tán (scatter) với giá trị phần dư
chuẩn hóa trên trục tung và giá trị dự đoán
chuẩn hóa trên trục hoành
Trang 41HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Dò tìm sự vi phạm các giả định
2 Giả định phương sai của sai số không đổi
- Sao lưu giá trị phần dư chưa chuẩn hóa trong hộp thoại
Saves
- Lấy giá trị tuyệt đối của phần dư bằng lệnh Transform =>
Compute
- Tiến hành kiểm định tương quan hạng Spearman với
biến độc lập và phần dư chưa chuẩn hóa
Với giả thuyết H 0 : hệ số tương quan hạng của tổng thể là 0 Nếu kết quả kiểm định không đủ bằng chứng để bác bỏ H 0
thì có thể kết luận phương sai của sai số là không đổi
Trang 42HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Dò tìm sự vi phạm các giả định
3 Giả định về phân phối chuẩn của phần dư
- Sao lưu giá trị phần dư chuẩn hóa trong
hộp thoại Saves
- Vẽ biểu đồ tần số Histogram; hoặc biểu đồ
Q – Q plot; hoặc kiểm định K – S 1 mẫu
nhằm kiểm tra phân phối chuẩn của phần dư
Trang 43HỒI QUY TUYẾN TÍNH ĐƠN BIẾN
• Dò tìm sự vi phạm các giả định
4 Giả định về tính độc lập của sai số (không có tương quan giữa các phần dư)
- Tính đại lượng thống kê Durbin – Watson (d)
trong hộp thoại Statistics
- Dựa vào giá trị d tính toán để đưa ra quyết định
Trang 44HỒI QUY TUYẾN TÍNH ĐA BIẾN
Mô hình xây dựng từ dữ liệu mẫu có dạng
Y = B0 + B1*X1 + B2*X2 + … + Bk*Xk
Trong đó, X1, X2 … Xk: biến độc lập
Y: biến phụ thuộc
B0, B1, B2 … Bk: hệ số hồi quy
Trang 45HỒI QUY TUYẾN TÍNH ĐA BIẾN
• Các giả định đối với phân tích hồi quy tuyến tính
đa biến
- Liên hệ tuyến tính
- Phương sai của sai số không đổi
- Phân phối chuẩn của phần dư
- Tính độc lập của sai số (không có tương quan giữa các phần dư)
- Không có mối tương quan giữa các biến độc lập (không xảy ra hiện tượng đa cộng tuyến)
Trang 46HỒI QUY TUYẾN TÍNH ĐA BIẾN
• Quá trình thực hiện:
- Xem xét ma trận hệ số tương quan
- Đánh giá độ phù hợp của mô hình
- Kiểm định giả thuyết về mức độ phù hợp của mô hình
- Kiểm định giả thuyết về từng hệ số hồi quy riêng phần (βk)
Trang 47PHÂN TÍCH NHÂN TỐ
Phân tích nhân tố là phương pháp phân tích
đa biến phụ thuộc lẫn nhau vì các biến
được đưa vào phân tích không có biến
độc lập và biến phụ thuộc
Phân tích nhân tố được sử dụng nhằm rút gọn số lượng các biến trong phân tích,
đồng thời giúp nhà nghiên cứu gộp các
biến có mối liên hệ thành các thành phần chung
Trang 48PHÂN TÍCH NHÂN TỐ
• Cách thực hiện với SPSS
Factor
phân tích nhân tố đưa vào khung
Variable(s)
chọn các đại lượng thống kê mô tả cơ bản
Trang 49PHÂN TÍCH NHÂN TỐ
Tùy chọn hiển thị các thống
kê mô tả của các biến sử dụng để phân tích nhân tố Tùy chọn giúp ta biết được lượng biến thiên của một biến được giải thích chung với các biến khác
Trình bày ma trận hệ số tương quan giữa các biến đưa vào phân tích
Mức ý nghĩa của các hệ số tương
quan
Định thức của ma trận tương quan
Ma trận nghịch đảo của
ma trận tương quan
Đại lượng KMO: xem xét sự thích hợp của
phân tích nhân tố Kiểm định Bartlett: với giả thuyết các biến không có tương quan trong tổng thể
Trang 50PHÂN TÍCH NHÂN TỐ
• Cách thực hiện với SPSS
Trang 51PHÂN TÍCH NHÂN TỐ
Phương pháp rút trích nhân tố
Principal components: rút gọn dữ liệu, giảm cộng
tuyến giữa các nhân tố trong việc phân tích hồi quy bội tiếp theo
Principal axis factoring: khám phá cấu trúc thang
đo, sử dụng tiếp tục với CFA hoặc SEM
Ma trận tương quan
Ma trận hiệp phương sai
Hiển thị phương án nhân tố
chưa xoay Hiển thị biểu đồ dốc của các factor theo Eigenvalue