Bài giảng Nghiên cứu Marketing - Chương 8: Phân tích dữ liệu cung cấp các kiến thức giúp người học có thể hiểu được: Các loại phân tích thống kê, kiểm định tương quan, tiến trình phân tích, phân tích Chi-Square, phân tích hồi quy nhị biến,... Mời các bạn cùng tham khảo.
Trang 1Phân tích dữ liệu 2
Trang 2Hôm nay
Kiểm định tương quan
Phân tích hồi quy
Trang 3Các loại phân tích thống kê
Phân tích mô tả
Để mô tả những đặc điểm chính của dữ liệu
Kiểm định sự khác biệt
Để điểm định sự khác biệt trung bình
Kiểm định tương quan
Để xác định mối quan hệ giữa các biến
Kiểm định sự phụ thuộc lẫn nhau
Để tóm tắt thông tin dữ liệu bằng cách nhóm các biến hoặc nhóm các đối tượng nghiên cứu
Trang 4
Kiểm định tương quan
Những đặc điểm để mô tả mối quan hệ
Sự hiện diện của tương quan
Phương hướng của tương quan
Sức mạnh của tương quan
Thái độ thương hiệu Ý định mua hàng
Trang 5Kiểm định tương quan
Những đặc điểm để mô tả quan hệ
Sự hiện diện của tương quan
Phương hướng của tương quan
Sức mạnh của tương quan
Source: socialresearchmethods.net
Trang 6Kiểm định tương quan
Những đặc điểm để mô tả mối quan hệ
Sự hiện diện của tương quan
Phương hướng của tương quan
Sức mạnh của tương quan
Yếu: những sự thay đổi trong 1 biến có
Trang 7Kiểm định tương quan – Các Loại Quan hệ
Mối quan hệ tuyến tính
(Liner Relationship)
Sức mạnh và phương
hướng mối quan hệ giữa
2 biến vẫn giữ như cũ
Mối quan hệ có thể mô
Trang 8
Tiến trình phân tích
Chọn các biến để phân tích
Xác định thang đo của các biến
Sử dụng phép phân tích mối quan hệ đúng
Xác định sự hiện diện của mối quan hệ
Nếu có quan hệ, xác định phương hướng của mối quan hệ
Nếu có quan hệ, đánh giá điểm mạnh của mối quan hệ
Trang 9Kiểm định tương quan (Phần I)
Loại kiểm định Mục đích của kiểm định
Chi-Square Analysis (X2) Kiểm định mối quan hệ
giữa 2 biến định danh
Spearman Rank Order
Correlation Coefficient
Kiểm định mối quan hệ giữa 2 biến, trong đó có ít nhất 1 biến có thang đo thứ tự
Pearson Product Moment
Correlation Coefficient
Kiểm định mối quan hệ giữa 2 biến có thang đo khoảng và/hoặc tỉ lệ
Trang 10Một số định nghĩa
Ý nghĩa thống kê và sức mạnh
Ý nghĩa thống kê (Statistical Significance) đề cập đến mối quan hệ bạn tìm ra trong mẫu có thể
được tổng quát hóa cho tổng thể hay không
Sức mạnh đề cập đến mối quan hệ bạn tìm thấy trong mẫu là mạnh, yếu hay không tồn tại
Trang 11
Hệ số tương quan (Correlation Coefficients)
Nó là một số hướng dẫn sắp xếp từ -1 đến +1, mô tả phương hướng và sức mạnh của mối quan hệ giữa hai biến
Không Yếu Vừa phải Mạnh Rất mạnh
Trang 18Spearman Rank Order Correlation
Đo lường sức mạnh và phương hướng của mối quan hệ trong đó có ít nhất một biến thứ tự
H0: Không có mối tương quan giũa hai biến Ha: Có 1 mối tương quan giữa 2 biến
Trang 22Pearson Product Moment Correlation
Đo lường sức mạnh và phương hướng của mối quan hệ giữa 2 biến có thang đo là khoảng va/hoặc tỉ lệ
H0: Không có sự tương quan giữa hai biến Ha: Có một sự tương quan dương giữa hai biến
Trang 26Kiểm định tương quan (Phần II)
Phân tích hồi quy
Cả hai mô tả mối quan hệ và tạo dự đoán
Trang 27Các loại phân tích hồi quy
Loại phân tích Mục đích của phân tích
Phân tích hồi quy
Trang 28Phân tích hồi quy nhị biến
Phân tích mối quan hệ tuyến tính giữa biến một biến độc lập khoảng/tỉ lệ và một biến phụ thuộc
khoảng/tỉ lệ
Y = b 0 + b 1 X + e
Y: biến phụ thuộc
X: biến độc lập
b 0: tung độ gốc (the intercept)
b 1: độ dốc (slope (hệ số hồi quy))
e: sai số (error)
Trang 29Những giả định phân tích hồi quy)
Giả định 1: Các biến được đo lường với thang đo
khoảng hoặc tỉ lệ
Giả định 2: Các biến được phân phối chuẩn
Giả định 3: giả định có mối quan hệ tuyến tính giữa
IV và DV
Giả định 4: sai số được phân phối chuẩn và độc lập
Trang 30Phân tích hồi quy nhị biến
H 0 : Không có mối quan hệ giữa hai biến
H a : Có một mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc
Trang 31Phân tích hồi quy nhị biến
y = b0 + b1 x + e
H 0 : b 1 = 0
H a : b 1 ≠ 0
Trang 32Phân tích hồi quy nhị biến
Trang 33Phân tích hồi quy nhị biến
Giả định 3: Giả định có mối quan hệ tuyến tính giữa
IV và DV
Trang 35Phân tích hồi quy nhị biến
Giả định 4: sai số được phân phối chuẩn và độc lập
Kiểm tra “Standardized Predicted Dependent
Variable” (ZPRED) và “Standardized Residual”
(ZRESID)
Trang 41y = 0.506 + 0.682 x + 1.120
Hệ số chưa chuẩn hóa B (Unstandardized
Coefficient) trong bảng Coefficient : sức mạnh của
mối quan hệ giữa x và y
Sig value trong bảng Coefficient : Xác suất cho mối quan hệ giữa x và y tồn tại (p<0.05 có ý nghĩa tại
mức ý nghĩa 95%)
H0: b 1 = 0
Ha: b 1 ≠ 0 y = b 0 + b 1 x + e
Trang 42Phân tích hồi quy đa biến
Phân tích mối quan hệ tuyến tính giữa
nhiều biến độc lập có thang đo khoảng/tỉ
lệ và một biến phụ thuộc có thang đa
khoảng/tỉ lệ
Trang 43Phân tích hồi quy đa biến
Multiple Regression Analysis
Trang 44Phân tích hồi quy đa biến
Y = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3 + b i X i + e
Y: biến phụ thuộc (dependent variable)
X 1 -X i : biến độc lập (independent variable)
b 0: tung độ gốc
b 1 - b i: hệ số hồi quy (egression coefficients) e: sai số
Trang 45Phân tích hồi quy đa biến
Trang 48R Square adjusted:
Cho biết mô hình đường thẳng khớp với đồ thị
phân tán các điểm đến mức nào
Được sử dụng để phản ánh sát hơn mức độ phù hợp của mô hình hồi quy tuyến tính đa biến
Adjusted R square < R square
Trang 49Sig (F-value) in the ANOVA Table:
Ý nghĩa thống kê của mô hình hồi quy tổng quát
Nếu nó có ý nghĩa thống kê (p<0.05), nó cho biết có
ít nhất 1 biến độc lập giải thích biến phụ thuộc
Kiểm định mô hình tổng quát
H 0 : b 1 = b 2 = b 3 =…b i = 0
H a : ít nhất một b ≠ 0
Trang 50Hệ số chuẩn hóa Beta (Standardized Coefficients - Beta) trong bảng Coefficient :
phụ thuộc
vị đo lường khác nhau, do đó ảnh hưởng đến hệ số chưa chuẩn hóa (B) Vì vậy, trong phân tích hồi quy đa biến, hệ số chuẩn hóa Beta được sử dụng thay cho hệ số chưa chuẩn hóa B
Y = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3 + b i X i + e
Trang 51Sig value trong bảng Coefficient :
Xác suất để tồn tại mối quan hệ giữa biến độc lập
và biến phụ thuộc (p<0.05 có ý nghĩa tại mức ý nghĩa 95%)
Mỗi biến độc lập
H 0 : b i = 0
H a : b i ≠ 0
Y = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3 + b i X i + e
Trang 52Thống kê cộng tuyến (Collinearity Statistics): kiểm định
nếu các biến độc lập được tương quan cao
cộng tuyến (<=0.10 cho biết có sự cộng tuyến)
Hệ số phóng đại phương sai -VIF (Variance Inflation Factor):
Những giá trị lớn hơn cho biết đa cộng tuyến (>=5 cho biết
có sự cộng tuyến)
Trang 53Nếu hiện tượng đa cộng tuyến xảy ra:(Tolerance<=0.10; VIF
>=5):
tương quan trên 0.70
Trang 54Phân tích biến có nhiều lựa chọn
Trang 61Bài tập
Công ty giày thời trang T&T được thành lập cách đây gần 20 năm tại TP.HCM Hiện công ty có số lượng cửa hàng khắp các tỉnh miền Đông Nam Bộ trên 30 cửa hàng
Năm ngoái, công ty đã tiến hành thu thập một số dữ liệu ở các cửa hàng bán lẻ để phân tích các nhân tố ảnh hưởng đến doanh thu của cửa hàng Bộ dữ liệu bao gồm doanh số trong mỗi cửa hàng (ĐVT: tỉ đồng) [tên biến: Doanh số], số lượng nhân viên [tên biến: nhân viên], số năm thành lập [tên biến:
số năm], và diện tích cửa hàng [tên biến: diện tích]
Trang 62Bài tập
Yêu cầu:
1. Sử dụng SPSS, thực hiện phân tích tương quan giữa hai biến độc lập (nhân viên kinh doanh và số năm thành lập) và biến phụ thuộc (doanh số)
2.Sử dụng SPSS, thực hiện lần lượt hồi quy nhị biến giữa các biến độc lập và biến phụ thuộc Diễn dịch kết quả Mô hình nào dự báo tốt nhất
3.Thực hiện hồi quy đa biến để xác định ảnh hưởng của 3 biến độc lập lên biến phụ thuộc Diễn dịch kết quả và đề xuất giải pháp cho công ty