Chương 1. Tổng quan về dữ liệu (LT: 6, BT:3) 1.1. Phân loại dữ liệu 1.1.1. Một số khái niệm 1.1.2. Phân loại dữ liệu 1.1.3. Các cấp bậc đo lường và thang đo 1.2. Thu thập dữ liệu 1.2.1. Xác định dữ liệu cần thu thập 1.2.2. Dữ liệu sơ cấp và dữ liệu thứ cấp 1.2.3. Phương pháp thu thập dữ liệu sơ cấp 1.2.4. Kỹ thuật lấy mẫu 1.3. Trình bày dữ liệu bằng bảng và đồ thị 1.3.1. Cách lập bảng tần số cho dữ liệu định tính và định lượng 1.3.2. Trình bày dữ liệu bằng đồ thị phân phối tần số và đa giác tần số 1.4. Trình bày dữ liệu định tính dạng phân loại bằng đồ thị 1.4.1. Đồ thị hình thanh 1.4.2. Đồ thị hình tròn 1.4.2. Biểu đồ Pareto Chương 2. Thiết kế bảng câu hỏi, tổ chức thu thậpthông tin định lượng và thu thập thông tin định tính (LT: 6, BT:3)2.1. Thiết kế bảng câu hỏi 2.1.1. Khái niệm bảng câu hỏi 2.1.2. Những thuộc tính của một bảng câu hỏi tốt 2.1.3. Trình tự 8 bước thiết kế một bảng câu hỏi 2.1.4. Điều tra thử2.2. Tổ chức thu thập thông tin định lượng 2.2.1. Tổ chức thu thập thông tin 2.2.2. Hiệu chỉnh thông tin2.3. Thu thập thông tin định tính 2.3.1. Thu thập thông tin định tính 2.3.2. Kỹ thuật thu thập thông tin định tính Chương 3. Phân tích dữ liệu bằng phần mềm SPSS (LT:6, BT:6) 3.1. Giới thiệu về phân tích dữ liệu 3.1.1. Nghiên cứu và phân tích dữ liệu 3.1.2. Bản chất của phân tích dữ liệu 3.1.3. Thống kê và phân tích dữ liệu 3.2. Giới thiệu về phần mềm SPSS 3.2.1. Giới thiệu 3.2.2. Công dụng
Trang 1BÀI GIẢNG PHÂN TÍCH DỮ LIỆU
Trang 2CHƯƠNG MỞ ĐẦU GIỚI THIỆU MÔN HỌC PHÂN TÍCH DỮ LIỆU
Trang 3
1 Thông tin chung về môn học
Tên môn học: PHÂN TÍCH DỮ LIỆU
Mã môn học:
Số tín chỉ: 3
Môn học: bắt buộc
- Các môn học tiên quyết: Xác suất thống kê,
Nguyên lý thống kê, Tin học đại cương, Kinh tế
lượng.
- Các môn học kế tiếp (những môn học ngay sau
môn này):
Trang 4- Giờ tín chỉ đối với các hoạt động:
Nghe giảng lý thuyết: 18 tiết
Làm bài tập trên lớp: 12 tiết
Trang 52 Mục tiêu của môn học
Học phần Phân tích dữ liệu còn trang bị cho sinh
viên ngành Kinh tế và các ngành khác cách thức vận dụng các kiến thức được học trong học phần này để
ứng dụng phân tích dữ liệu tại các đơn vị kinh
doanh Dữ liệu được phân tích, xử lý, chọn lọc để ứng dụng xây dựng các giải pháp nhằm khai thác tốt các
cơ hội và hạn chế các nguy cơ, thách thức từ môi
trường kinh doanh Qua đó, nâng cao năng lực và vị thế cạnh tranh cho doanh nghiệp.
Trang 63 Tóm tắt nội dung môn học
Môn học cung cấp những kiến thức về Thống kê Dữ liệu, Phân tích dữ liệu…Ngoài ra còn hướng dẫn cho sinh viên các phần mềm ứng dụng như EXCEL,
EVIEWS, SPSS để giải quyết các bài tập liên quan
đến bài học cũng như thực tế thực tập tại các doanh nghiệp
Trang 74 Tài liệu học tập
1 Khánh Duy – Các phương pháp phân tích – Chương trình
giảng dạy kinh tế Fulright – 2007/2008 (tài liệu tải trên mạng internet)
2 Quốc Duy – Các phương pháp phân tích – Chương trình
giảng dạy kinh tế Fulright – 2006/2007 (tài liệu tải trên mạng internet)
3 Đặng Hấn – Xác suất thống kê – NXB Thống kê – 1996
4 Hoàng Ngọc Nhậm chủ biên – Kinh tế lượng – NXB Trường Đại học Kinh tế TP Hồ Chí Minh – 2006
5 Phạm Lê Hồng Nhung – Hướng dẫn thực hành SPSS cơ bản
(tài liệu tải trên mạng internet)
6 Nguyễn Đình Thọ – Nghiên cứu Marketing – NXB Giáo dục –
1998
Trang 87 Nguyễn Đình Thọ, Nguyễn Thị Mai Trang – Nghiên cứu
Khoa học Marketing – NXB Lao động – 2011
8 Nguyễn Đình Thọ – Phương pháp nghiên cứu khoa học trong kinh doanh – NXB Lao động Xã hội – 2012
9 Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Thống kê ứng dụng trong Kinh tế Xã hội – NXB Thống kê – 2008
10 Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Bài tập và bài giải Thống kê ứng dụng trong Kinh tế Xã hội – NXB Lao động xã
hội – 2012
11 Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Phân tích dữ liệu với SPSS – NXB Hồng Đức – 2008
Trang 95 Các phương pháp giảng dạy và học tập của môn học
- Giảng lý thuyết kết hợp với bài tập thực hành và Case study.
- Cung cấp bài giảng, tài liệu liên quan đến môn học để sinh viên nghiên cứu trước khi đến lớp.
- Chia nhóm để mỗi nhóm sinh viên làm các tiểu luận theo yêu cầu và hướng dẫn của giảng viên.
- Cập nhật và bổ sung các tài liệu mới liên quan đến
môn học.
Trang 106.Chính sách đối với môn học và các yêu cầu khác
của giảng viên
- Dự lớp, nghe giảng.
- Làm bài tập, kiểm tra giữa kỳ, thi hết môn.
- Thuyết trình đề tài tiểu luận của từng nhóm.
7 Thang điểm đánh giá: 10/10
Trang 118 Phương pháp, hình thức kiểm tra - đánh giá kết
quả học tập môn học
- Điểm quá trình: 30%, bao gồm: bài tiểu luận
nhóm, thuyết trình nhóm, bài tập kiểm tra từng
chương, bài thu hoạch của sinh viên sau khi nghe đề tài được thuyết trình.
- Điểm cuối kỳ: 70% (thực hành phân tích dữ liệu)
Trang 12Chương 1 Tổng quan về dữ liệu
(LT: 6, BT:3)
1.1 Phân loại dữ liệu
1.1.1 Một số khái niệm
1.1.2 Phân loại dữ liệu
1.1.3 Các cấp bậc đo lường và thang đo
1.2 Thu thập dữ liệu
1.2.1 Xác định dữ liệu cần thu thập
1.2.2 Dữ liệu sơ cấp và dữ liệu thứ cấp
Trang 131.3 Trình bày dữ liệu bằng bảng và đồ thị
1.3.1 Cách lập bảng tần số cho dữ liệu định tính và định lượng
1.3.2 Trình bày dữ liệu bằng đồ thị phân phối tần
Trang 141.5.1 Các đại lượng đo lường độ tập trung phổ biến
1.5.2 Nhóm các đại lượng mô tả sự phân bố của tập
dữ liệu
1.5.3 Ưng dụng EXCEL
1.5.4 Các đại lượng đo lường độ phân tán xung
quanh giá trị trung bình
1.5.5 Nhóm các đại lượng mô tả cho bảng tần số
1.5.6 Sử dụng kết hợp trung bình và độ lệch tiêu
chuẩn
Trang 15Chương 2 Thiết kế bảng câu hỏi, tổ chức thu thập
thông tin định lượng và thu thập thông tin định tính
(LT: 6, BT:3)
2.1 Thiết kế bảng câu hỏi
2.1.1 Khái niệm bảng câu hỏi
2.1.2 Những thuộc tính của một bảng câu hỏi tốt
2.1.3 Trình tự 8 bước thiết kế một bảng câu hỏi
2.1.4 Điều tra thử
2.2 Tổ chức thu thập thông tin định lượng
2.2.1 Tổ chức thu thập thông tin
2.2.2 Hiệu chỉnh thông tin
2.3 Thu thập thông tin định tính
Trang 16Chương 3 Phân tích dữ liệu bằng phần mềm SPSS
(LT:6, BT:6)
3.1 Giới thiệu về phân tích dữ liệu
3.1.1 Nghiên cứu và phân tích dữ liệu
3.1.2 Bản chất của phân tích dữ liệu
3.1.3 Thống kê và phân tích dữ liệu
3.2 Giới thiệu về phần mềm SPSS
3.2.1 Giới thiệu
3.2.2 Công dụng
Trang 173.3.5 Phân tích nhân tố EFA.
3.3.6 Xây dựng mô hình hồi quy tuyến tính
Trang 18CH ƯƠNG 1: NG 1:
T NG QUAN D LI U ỔNG QUAN DỮ LIỆU Ữ LIỆU ỆU
DỮ LIỆU VÀ PHÂN LOẠI DỮ LIỆU
Trang 191.1 PHÂN LOẠI DỮ LIỆU
1.1.1 Một số khái niệm
1.1.1.1 Dữ liệu, thông tin và tri thức
a) Dữ liệu
Dữ liệu bao gồm các biểu hiện dùng để phản ảnh thực tế của đối tượng nghiên cứu Những biểu hiện
này bao gồm, con số, từ ngữ hay hình ảnh
Dữ liệu là các sự kiện và con số được thu thập,
phân tích và tổng kết để trình bày và giải thích
Tập dữ liệu là tất cả các dữ liệu được thu thập
Trang 20b) Thông tin
Thông tin là kết quả của việc xử lý, sắp xếp và
tổ chức dữ liệu sao cho qua đó cho người đọc có
thêm hiểu biết và tri thức Là nội dung của dữ liệu
đã thu thập.
c) Tri thức
Tri thức là những điều đã được biết Thuật ngữ tri
thức cũng còn được dùng để hàm ý về những hiểu biết tin chắc về một sự vật, có thể dùng hiểu biết này để
Trang 211.1.1.2 Tổng thể và đơn vị tổng thể
Tổng là tập hợp, thể là cá thể, phần tử, tổng thể là tập hợp nhiều cá thể hay phần tử
Tổng thể trong đó bao gồm các đơn vị (hay phần tử) mà ta có thể trực tiếp quan sát hoặc nhận biết được gọi là tổng thể bộc lộ
Thí dụ như tổng thể công nhân viên của một doanh nghiệp, tổng thể các ngân hàng thương mại cổ phần,
tổng thể sinh viên của một trường đại học…
Trang 22Khi xác định tổng thể có thể gặp trường hợp các đơn vị tổng thể không trực tiếp quan sát hoặc nhận biết được, ta gọi đó là tổng thể tiềm ẩn.
Thí dụ như tổng thể những người đồng ý việc
bắt buộc đội nón bảo hiểm khi đi xe máy; tổng thể những người ưa thích đi du lịch sinh thái…
Trang 23Tổng thể trong đó bao gồm các đơn vị (hay phần tử) giống nhau ở một hay một số đặc điểm chủ yếu
có liên quan trực tiếp đến mục đích nghiên cứu được gọi là tổng thể đồng chất.
Ngược lại, nếu tổng thể trong đó bao gồm các
đơn vị (hay phần tử) không giống nhau ở những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu được gọi là tổng thể không đồng chất.
Trang 24Thí dụ:
Tìm hiểu về hiệu quả sử dụng vốn của các
doanh nghiệp trên một địa bàn Tổng thể các
doanh nghiệp dệt trên địa bàn là tổng thể đồng
chất, nhưng tổng thể tất cả các doanh nghiệp ở
những ngành khác nhau trên địa bàn là tổng thể
không đồng chất.
Tùy theo tính chất sản xuất, quy mô vốn đầu tư ban đầu … sẽ có hiệu quả sử dụng vốn không so
Trang 25Tổng thể có thể là hữu hạn hoặc vô hạn (không thể hoặc khó xác định được số đơn vị tổng thể như tổng thể trẻ sơ sinh, tổng thể sản phẩm do một loại máy sản xuất ra …)
Cho nên khi xác định tổng thể thống kê không
những phải giới hạn về thực thể (tổng thể là tổng
thể gì), mà còn phải giới hạn về thời gian và không gian (tổng thể tồn tại ở thời gian nào, không gian
nào)
Trang 261.1.1.3 Mẫu (Sample)
Mẫu là một số đơn vị được chọn ra từ tổng thể
chung theo một phương pháp lấy mẫu nào đó Các đặc trưng mẫu được sử dụng để suy rộng ra các đặc trưng của tổng thể chung.
Trang 271.1.2 Phân loại dữ liệu
1.1.2.1 Dữ liệu định tính và định lượng
Dữ liệu định tính: Phản ánh tính chất, sự hơn thua và không thể tính được giá trị trung bình
Trang 28• Dữ liệu định lượng: Phản ánh mức độ, mức độ
hơn thua và tính được giá trị trung bình Dữ liệu
định lượng là dữ liệu cho biết số lượng bao nhiêu
của một đại lượng nào đo và thể hiện bằng con số thu thập được
Thí dụ:
- Đo lường nhiệt độ của từng giờ trong ngày
- Điểm trung bình học tập
Trang 29Thời gian làm thêm Kết quả học tập
Giỏi Định tính
Trang 30Các dữ liệu định tính và định lượng được thu thập bằng 4 thang đo sau:
- Dữ liệu định tính sử dụng thang đo danh nghĩa
hoặc thang đo thứ bậc; có thể đo bằng số hoặc
không bằng số.
- Dữ liệu định lượng sử dụng thang đo khoảng cách hoặc thang đo tỷ lệ.
Trang 31DỮ LIỆU
DỮ LIỆU ĐỊNH TÍNH
THANG ĐO THỨ BẬC
DỮ LIỆU ĐỊNH LƯỢNG
THANG ĐO KHOẢNG CÁCH
THANG ĐO
DANH NGHĨA
THANG ĐO TỶ LỆ
Trang 321.1.2.2 Phân loại dữ liệu theo đặc tính của dữ liệu
a) Sự kiện
Bao gồm những sự lượng định hoặc đo lường về
những gì thực sự đã hoặc đang tồn tại Sự kiện có
thể hữu hình hoặc vô hình
Sự kiện hữu hình là những sự kiện có thể lượng
định được Thí dụ như năm 2012 doanh nghiệp ABC bán được 2.000 sản phẩm, hơn năm 2011 là 502 sản
phẩm, thì đó là một sự kiện hữu hình
Trang 33Sự kiện có thể phân loại thành:
- Sự kiện dân số học: Những dữ kiện được sử dụng mô tả các đặc điểm nhân khẩu của dân cư hay
khách hàng như thu nhập hàng năm của hộ gia
đình, số thành viên gia đình, tuổi tác, giới tính của họ…
- Sự kiện xã hội học: Bao gồm các dữ liệu về tầng
lớp xã hội của khách hàng (thượng lưu, trung lưu,
hay tầng lớp bình dân ), tôn giáo,
Trang 34- Sự kiên tâm lý: Thể hiện nhận thức, động cơ hay lối sống của một cá nhân hay của một nhóm
người.
- Sự kiện thái độ: Phản ánh cách cư xử của con
người trong việc lựa chọn mua hàng, nó mô tả
hành vi và trạng thái ứng xử trước một sự lựa
chọn về sản phẩm hay dịch vụ.
Trang 35b) Kiến thức
Kiến thức là loại dữ liệu phản ánh sự hiểu biết
của người tiêu dùng và ý thức của họ về nhãn hiệu
hàng hóa, thị trường, người bán.
Thí dụ: Khi quyết định mua một gói bột giặt trong số các nhãn hiệu Omo, Tide, người tiêu dùng cần có hiểu biết nhất định về công dụng, cách thức sử dụng bột giặt Ngoài ra phải biết được sự khác biệt về tính năng tác dụng giữa các loại bột giặt, những điểm đặc thù hình hành nên một nhãn hiệu để phân biệt với
các loại khác… để từ đó chọn đúng thứ bột giặt thích
Trang 36c) Dư luận
N gười tiêu dùng lựa chọn mua sản phẩm hay
dịch vụ không chỉ dựa vào kiến thức của mình về
sản phẩm, dịch vụ đó mà còn dựa vào (hay chỉ dựa vào) dư luận.
Dư luận phản ánh sự cảm nhận của quần chúng về điều gì đó, thường là sự cảm nhận chung về một loại nhãn hiệu hay các tác dụng tốt hoặc tác dụng
không mong muốn của sản phẩm, biểu tượng của
Trang 37Một dạng khác của định kiến là ý niệm (images) của khách hàng như nhiều người cùng có một hình tượng giống nhau về một doanh nghiệp hay một
nhãn hiệu nào đó
Hầu hết người tiêu dùng Việt Nam đều nhìn
nhận xe máy của hãng HONDA là bền và đẹp
Định kiến ảnh hưởng đến cách cư xử, thái độ của
nhiều người một cách dai dẳng trong quá trình mua
- bán.
Trang 38d) Ý định
Ý định là suy nghĩ sắp sẵn trong đầu về hành
động sẽ thực hiện trong tương lai, là thái độ xử sự
sắp tới của đối tượng Ý định và mức độ thay đổi ý
định về một hành vi tiêu dùng là những thông tin
then chốt trong nghiên cứu marketing
Thí dụ nếu hãng VMEP, qua số liệu điều tra cho biết là có 10% gia đình có ý định mua xe máy mới
trong vòng 2 năm tới, khác với số liệu báo cáo năm
Trang 39e) Động cơ
Động cơ là lực nội sinh khiến con người cư xử
theo một cách nào đó Những động cơ trực tiếp thì nói chung là rõ ràng, dễ nói ra Nhưng những
nguyên nhân cơ bản sâu xa của thái độ cư xử thì
rất khó bộc lộ
Trang 401.1.2.3 Phân loại dữ liệu theo chức năng của dữ liệu
a) Dữ liệu phản ánh tác nhân
Đây là loại dữ liệu phản ảnh nguyên nhân dẫn đến một hành vi tiêu dùng
Thí dụ: SYM cần biết yếu tố nào là nguyên nhân chính dẫn người tiêu dùng đến quyết định mua một chiếc xe máy nhãn hiệu Attila trong số các yếu tố
như giá rẻ, hình thức mua trả góp, chất lượng của xe, hay thu nhập của người tiêu dùng Kết quả của việc nghiên cứu các dữ liệu này sẽ giúp cho doanh nghiệp
Trang 41b) Dữ liệu phản ánh kết quả
Thu thập các dữ liệu để đánh giá kết quả của
các giải pháp marketing (như là nguyên nhân) để
từ đó tìm ra mối quan hệ nhân quả trong hoạt
động marketing là rất quan trọng
Trong thí dụ trên, việc phân tích các dữ liệu về số lượng xe, doanh thu bán ở từng cửa hàng … là
những minh họa cho các dữ liệu kết quả
Trang 42c) Dữ liệu mô tả tình huống
Dữ liệu dùng để nghiên cứu những đặc điểm
riêng biệt hay phần tiêu biểu của đối tượng nghiên cứu, làm cơ sở đề ra các quyết định phù hợp với
từng nhóm đối tượng
Thí dụ: Đặc điểm cá nhân hay gia đình có thể
ảnh hưởng đến hành động mua sắm của họ, vì thế
những đặc điểm khác nhau đó cần được khảo sát
để có kết luận đúng về mối quan hệ nhân quả.
Trang 431.1.2.4 Phân loại dữ liệu theo địa điểm thu thập dữ liệu
Địa điểm thu thập dữ liệu bao gồm nơi sinh sống của đối tượng (nhà ở), nơi đối tượng làm việc, trên đường
phố hay trong lúc di chuyển
Nếu đối tượng của nghiên cứu là những người tiêu
dùng thì thu thập dữ liệu tại nơi mua sắm, là nơi có mật độ người tiêu dùng cao, là hết sức tiện lợi Ngày càng
có nhiều cơ sở nghiên cứu chọn đối tượng ngẫu nhiên
tại những nơi mua bán hàng hóa để tiến hành phỏng
vấn cá nhân
Trang 441.1.2.5 Phân loại dữ liệu theo nguồn thu thập dữ liệu a) Dữ liệu thứ cấp
Dữ liệu thứ cấp là loại dữ liệu được sưu tập sẵn, đã công bố nên dễ thu thập, ít tốn thời gian, tiền bạc trong quá trình thu thập.
Thí dụ: Khi nghiên cứu về ảnh hưởng của điều
kiện ăn ở sinh hoạt đến kết quả học tập của sinh
viên, những dữ liệu liên quan đến kết quả học tập
của sinh viên có thể lấy từ Phòng Đào tạo hay thư
ký khoa như điểm trung bình, số môn thi lại… là dữ
Trang 45b) Dữ liệu sơ cấp
Các dữ liệu sơ cấp được thu thập trực tiếp từ đối tượng nghiên cứu, có thể là người tiêu dùng, nhóm
người tiêu dùng Nó còn được gọi là các dữ liệu gốc, chưa được xử lý.
Dữ liệu sơ cấp có thể thu thập từ việc quan sát, ghi chép hoặc tiếp xúc trực tiếp với đối tượng điều tra; cũng có thể sử dụng các phương pháp thử nghiệm để thu thập dữ liệu sơ cấp.
Thí dụ: Những dữ liệu liên quan đến điều kiện ăn ở sinh hoạt của sinh viên thì không có sẵn, phải trực
tiếp thu thập từ sinh viên là dữ liệu sơ cấp.
Trang 46c) Dữ liệu thu thập từ các cuộc thử nghiệm
Để thu thập dữ liệu, đặc biệt trong những trường hợp cần kiểm chứng các quan hệ nhân quả, hoặc
cân nhắc giữa các phương án để ra quyết định,
người nghiên cứu có thể dùng phương pháp thử
nghiệm để thu thập dữ liệu.
Thử nghiệm có thể được thực hiện trong phòng
thí nghiệm (thử nghiệm các đặc tính kỹ thuật của
sản phẩm ) hoặc thử nghiệm trên hiện trường (thử
Trang 47d) Dữ liệu thu thập từ các mô hình giả định
Thay vì thực hiện các cuộc thử nghiệm nhằm
làm rõ những vấn đề còn nằm trong giả thiết thì
phải tiêu tốn mất nhiều thời gian và tiền bạc,
người ta có thể lập các mô hình giả định để phân
tích Các mô hình giả định đưa ra những tình
huống có thật, nó không bao gồm mọi biến cố có
trên thực tế mà được đơn giản hóa hơn nhiều so
với thế giới hiện thực.
Trang 48CH ƯƠNG 1: NG 1:
TỔNG QUAN DỮ LIỆU CÁC LOẠI THANG ĐO
Trang 491 CÁC CẤP BẬC ĐO LƯỜNG
Các dữ liệu định tính và định lượng được thu thập bằng 4 thang đo sau:
- Dữ liệu định tính sử dụng thang đo danh nghĩa hoặc thang đo thứ bậc; có thể đo bằng số hoặc không bằng số.
- Dữ liệu định lượng sử dụng thang đo khoảng cách
hoặc thang đo tỷ lệ.