1. Trang chủ
  2. » Giáo án - Bài giảng

Bài Giảng Phân Tích Dữ Liệu ( Data Analyst )

217 32 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài Giảng Phân Tích Dữ Liệu
Chuyên ngành Phân Tích Dữ Liệu
Thể loại Bài Giảng
Định dạng
Số trang 217
Dung lượng 2,67 MB
File đính kèm tài liệu môn DỮ LIỆU.zip (46 KB)

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Chương 1. Tổng quan về dữ liệu (LT: 6, BT:3) 1.1. Phân loại dữ liệu 1.1.1. Một số khái niệm 1.1.2. Phân loại dữ liệu 1.1.3. Các cấp bậc đo lường và thang đo 1.2. Thu thập dữ liệu 1.2.1. Xác định dữ liệu cần thu thập 1.2.2. Dữ liệu sơ cấp và dữ liệu thứ cấp 1.2.3. Phương pháp thu thập dữ liệu sơ cấp 1.2.4. Kỹ thuật lấy mẫu 1.3. Trình bày dữ liệu bằng bảng và đồ thị 1.3.1. Cách lập bảng tần số cho dữ liệu định tính và định lượng 1.3.2. Trình bày dữ liệu bằng đồ thị phân phối tần số và đa giác tần số 1.4. Trình bày dữ liệu định tính dạng phân loại bằng đồ thị 1.4.1. Đồ thị hình thanh 1.4.2. Đồ thị hình tròn 1.4.2. Biểu đồ Pareto Chương 2. Thiết kế bảng câu hỏi, tổ chức thu thập thông tin định lượng và thu thập thông tin định tính (LT: 6, BT:3) 2.1. Thiết kế bảng câu hỏi 2.1.1. Khái niệm bảng câu hỏi 2.1.2. Những thuộc tính của một bảng câu hỏi tốt 2.1.3. Trình tự 8 bước thiết kế một bảng câu hỏi 2.1.4. Điều tra thử 2.2. Tổ chức thu thập thông tin định lượng 2.2.1. Tổ chức thu thập thông tin 2.2.2. Hiệu chỉnh thông tin 2.3. Thu thập thông tin định tính 2.3.1. Thu thập thông tin định tính 2.3.2. Kỹ thuật thu thập thông tin định tính Chương 3. Phân tích dữ liệu bằng phần mềm SPSS (LT:6, BT:6) 3.1. Giới thiệu về phân tích dữ liệu 3.1.1. Nghiên cứu và phân tích dữ liệu 3.1.2. Bản chất của phân tích dữ liệu 3.1.3. Thống kê và phân tích dữ liệu 3.2. Giới thiệu về phần mềm SPSS 3.2.1. Giới thiệu 3.2.2. Công dụng

Trang 1

BÀI GIẢNG PHÂN TÍCH DỮ LIỆU

Trang 2

CHƯƠNG MỞ ĐẦU GIỚI THIỆU MÔN HỌC PHÂN TÍCH DỮ LIỆU

Trang 3

1 Thông tin chung về môn học

Tên môn học: PHÂN TÍCH DỮ LIỆU

Mã môn học:

Số tín chỉ: 3

Môn học: bắt buộc

- Các môn học tiên quyết: Xác suất thống kê,

Nguyên lý thống kê, Tin học đại cương, Kinh tế

lượng.

- Các môn học kế tiếp (những môn học ngay sau

môn này):

Trang 4

- Giờ tín chỉ đối với các hoạt động:

Nghe giảng lý thuyết: 18 tiết

Làm bài tập trên lớp: 12 tiết

Trang 5

2 Mục tiêu của môn học

Học phần Phân tích dữ liệu còn trang bị cho sinh

viên ngành Kinh tế và các ngành khác cách thức vận dụng các kiến thức được học trong học phần này để

ứng dụng phân tích dữ liệu tại các đơn vị kinh

doanh Dữ liệu được phân tích, xử lý, chọn lọc để ứng dụng xây dựng các giải pháp nhằm khai thác tốt các

cơ hội và hạn chế các nguy cơ, thách thức từ môi

trường kinh doanh Qua đó, nâng cao năng lực và vị thế cạnh tranh cho doanh nghiệp.

Trang 6

3 Tóm tắt nội dung môn học

Môn học cung cấp những kiến thức về Thống kê Dữ liệu, Phân tích dữ liệu…Ngoài ra còn hướng dẫn cho sinh viên các phần mềm ứng dụng như EXCEL,

EVIEWS, SPSS để giải quyết các bài tập liên quan

đến bài học cũng như thực tế thực tập tại các doanh nghiệp

Trang 7

4 Tài liệu học tập

1 Khánh Duy – Các phương pháp phân tích – Chương trình

giảng dạy kinh tế Fulright – 2007/2008 (tài liệu tải trên mạng internet)

2 Quốc Duy – Các phương pháp phân tích – Chương trình

giảng dạy kinh tế Fulright – 2006/2007 (tài liệu tải trên mạng internet)

3 Đặng Hấn – Xác suất thống kê – NXB Thống kê – 1996

4 Hoàng Ngọc Nhậm chủ biên – Kinh tế lượng – NXB Trường Đại học Kinh tế TP Hồ Chí Minh – 2006

5 Phạm Lê Hồng Nhung – Hướng dẫn thực hành SPSS cơ bản

(tài liệu tải trên mạng internet)

6 Nguyễn Đình Thọ – Nghiên cứu Marketing – NXB Giáo dục –

1998

Trang 8

7 Nguyễn Đình Thọ, Nguyễn Thị Mai Trang – Nghiên cứu

Khoa học Marketing – NXB Lao động – 2011

8 Nguyễn Đình Thọ – Phương pháp nghiên cứu khoa học trong kinh doanh – NXB Lao động Xã hội – 2012

9 Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Thống kê ứng dụng trong Kinh tế Xã hội – NXB Thống kê – 2008

10 Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Bài tập và bài giải Thống kê ứng dụng trong Kinh tế Xã hội – NXB Lao động xã

hội – 2012

11 Hoàng Trọng, Chu Nguyễn Mộng Ngọc – Phân tích dữ liệu với SPSS – NXB Hồng Đức – 2008

Trang 9

5 Các phương pháp giảng dạy và học tập của môn học

- Giảng lý thuyết kết hợp với bài tập thực hành và Case study.

- Cung cấp bài giảng, tài liệu liên quan đến môn học để sinh viên nghiên cứu trước khi đến lớp.

- Chia nhóm để mỗi nhóm sinh viên làm các tiểu luận theo yêu cầu và hướng dẫn của giảng viên.

- Cập nhật và bổ sung các tài liệu mới liên quan đến

môn học.

Trang 10

6.Chính sách đối với môn học và các yêu cầu khác

của giảng viên

- Dự lớp, nghe giảng.

- Làm bài tập, kiểm tra giữa kỳ, thi hết môn.

- Thuyết trình đề tài tiểu luận của từng nhóm.

7 Thang điểm đánh giá: 10/10

Trang 11

8 Phương pháp, hình thức kiểm tra - đánh giá kết

quả học tập môn học

- Điểm quá trình: 30%, bao gồm: bài tiểu luận

nhóm, thuyết trình nhóm, bài tập kiểm tra từng

chương, bài thu hoạch của sinh viên sau khi nghe đề tài được thuyết trình.

- Điểm cuối kỳ: 70% (thực hành phân tích dữ liệu)

Trang 12

Chương 1 Tổng quan về dữ liệu

(LT: 6, BT:3)

1.1 Phân loại dữ liệu

1.1.1 Một số khái niệm

1.1.2 Phân loại dữ liệu

1.1.3 Các cấp bậc đo lường và thang đo

1.2 Thu thập dữ liệu

1.2.1 Xác định dữ liệu cần thu thập

1.2.2 Dữ liệu sơ cấp và dữ liệu thứ cấp

Trang 13

1.3 Trình bày dữ liệu bằng bảng và đồ thị

1.3.1 Cách lập bảng tần số cho dữ liệu định tính và định lượng

1.3.2 Trình bày dữ liệu bằng đồ thị phân phối tần

Trang 14

1.5.1 Các đại lượng đo lường độ tập trung phổ biến

1.5.2 Nhóm các đại lượng mô tả sự phân bố của tập

dữ liệu

1.5.3 Ưng dụng EXCEL

1.5.4 Các đại lượng đo lường độ phân tán xung

quanh giá trị trung bình

1.5.5 Nhóm các đại lượng mô tả cho bảng tần số

1.5.6 Sử dụng kết hợp trung bình và độ lệch tiêu

chuẩn

Trang 15

Chương 2 Thiết kế bảng câu hỏi, tổ chức thu thập

thông tin định lượng và thu thập thông tin định tính

(LT: 6, BT:3)

2.1 Thiết kế bảng câu hỏi

2.1.1 Khái niệm bảng câu hỏi

2.1.2 Những thuộc tính của một bảng câu hỏi tốt

2.1.3 Trình tự 8 bước thiết kế một bảng câu hỏi

2.1.4 Điều tra thử

2.2 Tổ chức thu thập thông tin định lượng

2.2.1 Tổ chức thu thập thông tin

2.2.2 Hiệu chỉnh thông tin

2.3 Thu thập thông tin định tính

Trang 16

Chương 3 Phân tích dữ liệu bằng phần mềm SPSS

(LT:6, BT:6)

3.1 Giới thiệu về phân tích dữ liệu

3.1.1 Nghiên cứu và phân tích dữ liệu

3.1.2 Bản chất của phân tích dữ liệu

3.1.3 Thống kê và phân tích dữ liệu

3.2 Giới thiệu về phần mềm SPSS

3.2.1 Giới thiệu

3.2.2 Công dụng

Trang 17

3.3.5 Phân tích nhân tố EFA.

3.3.6 Xây dựng mô hình hồi quy tuyến tính

Trang 18

CH ƯƠNG 1: NG 1:

T NG QUAN D LI U ỔNG QUAN DỮ LIỆU Ữ LIỆU ỆU

DỮ LIỆU VÀ PHÂN LOẠI DỮ LIỆU

Trang 19

1.1 PHÂN LOẠI DỮ LIỆU

1.1.1 Một số khái niệm

1.1.1.1 Dữ liệu, thông tin và tri thức

a) Dữ liệu

Dữ liệu bao gồm các biểu hiện dùng để phản ảnh thực tế của đối tượng nghiên cứu Những biểu hiện

này bao gồm, con số, từ ngữ hay hình ảnh

Dữ liệu là các sự kiện và con số được thu thập,

phân tích và tổng kết để trình bày và giải thích

Tập dữ liệu là tất cả các dữ liệu được thu thập

Trang 20

b) Thông tin

Thông tin là kết quả của việc xử lý, sắp xếp và

tổ chức dữ liệu sao cho qua đó cho người đọc có

thêm hiểu biết và tri thức Là nội dung của dữ liệu

đã thu thập.

c) Tri thức

Tri thức là những điều đã được biết Thuật ngữ tri

thức cũng còn được dùng để hàm ý về những hiểu biết tin chắc về một sự vật, có thể dùng hiểu biết này để

Trang 21

1.1.1.2 Tổng thể và đơn vị tổng thể

Tổng là tập hợp, thể là cá thể, phần tử, tổng thể là tập hợp nhiều cá thể hay phần tử

Tổng thể trong đó bao gồm các đơn vị (hay phần tử) mà ta có thể trực tiếp quan sát hoặc nhận biết được gọi là tổng thể bộc lộ

Thí dụ như tổng thể công nhân viên của một doanh nghiệp, tổng thể các ngân hàng thương mại cổ phần,

tổng thể sinh viên của một trường đại học…

Trang 22

Khi xác định tổng thể có thể gặp trường hợp các đơn vị tổng thể không trực tiếp quan sát hoặc nhận biết được, ta gọi đó là tổng thể tiềm ẩn.

Thí dụ như tổng thể những người đồng ý việc

bắt buộc đội nón bảo hiểm khi đi xe máy; tổng thể những người ưa thích đi du lịch sinh thái…

Trang 23

Tổng thể trong đó bao gồm các đơn vị (hay phần tử) giống nhau ở một hay một số đặc điểm chủ yếu

có liên quan trực tiếp đến mục đích nghiên cứu được gọi là tổng thể đồng chất.

Ngược lại, nếu tổng thể trong đó bao gồm các

đơn vị (hay phần tử) không giống nhau ở những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu được gọi là tổng thể không đồng chất.

Trang 24

Thí dụ:

Tìm hiểu về hiệu quả sử dụng vốn của các

doanh nghiệp trên một địa bàn Tổng thể các

doanh nghiệp dệt trên địa bàn là tổng thể đồng

chất, nhưng tổng thể tất cả các doanh nghiệp ở

những ngành khác nhau trên địa bàn là tổng thể

không đồng chất.

Tùy theo tính chất sản xuất, quy mô vốn đầu tư ban đầu … sẽ có hiệu quả sử dụng vốn không so

Trang 25

Tổng thể có thể là hữu hạn hoặc vô hạn (không thể hoặc khó xác định được số đơn vị tổng thể như tổng thể trẻ sơ sinh, tổng thể sản phẩm do một loại máy sản xuất ra …)

Cho nên khi xác định tổng thể thống kê không

những phải giới hạn về thực thể (tổng thể là tổng

thể gì), mà còn phải giới hạn về thời gian và không gian (tổng thể tồn tại ở thời gian nào, không gian

nào)

Trang 26

1.1.1.3 Mẫu (Sample)

Mẫu là một số đơn vị được chọn ra từ tổng thể

chung theo một phương pháp lấy mẫu nào đó Các đặc trưng mẫu được sử dụng để suy rộng ra các đặc trưng của tổng thể chung.

Trang 27

1.1.2 Phân loại dữ liệu

1.1.2.1 Dữ liệu định tính và định lượng

Dữ liệu định tính: Phản ánh tính chất, sự hơn thua và không thể tính được giá trị trung bình

Trang 28

Dữ liệu định lượng: Phản ánh mức độ, mức độ

hơn thua và tính được giá trị trung bình Dữ liệu

định lượng là dữ liệu cho biết số lượng bao nhiêu

của một đại lượng nào đo và thể hiện bằng con số thu thập được

Thí dụ:

- Đo lường nhiệt độ của từng giờ trong ngày

- Điểm trung bình học tập

Trang 29

Thời gian làm thêm Kết quả học tập

Giỏi Định tính

Trang 30

Các dữ liệu định tính và định lượng được thu thập bằng 4 thang đo sau:

- Dữ liệu định tính sử dụng thang đo danh nghĩa

hoặc thang đo thứ bậc; có thể đo bằng số hoặc

không bằng số.

- Dữ liệu định lượng sử dụng thang đo khoảng cách hoặc thang đo tỷ lệ.

Trang 31

DỮ LIỆU

DỮ LIỆU ĐỊNH TÍNH

THANG ĐO THỨ BẬC

DỮ LIỆU ĐỊNH LƯỢNG

THANG ĐO KHOẢNG CÁCH

THANG ĐO

DANH NGHĨA

THANG ĐO TỶ LỆ

Trang 32

1.1.2.2 Phân loại dữ liệu theo đặc tính của dữ liệu

a) Sự kiện

Bao gồm những sự lượng định hoặc đo lường về

những gì thực sự đã hoặc đang tồn tại Sự kiện có

thể hữu hình hoặc vô hình

Sự kiện hữu hình là những sự kiện có thể lượng

định được Thí dụ như năm 2012 doanh nghiệp ABC bán được 2.000 sản phẩm, hơn năm 2011 là 502 sản

phẩm, thì đó là một sự kiện hữu hình

Trang 33

Sự kiện có thể phân loại thành:

- Sự kiện dân số học: Những dữ kiện được sử dụng mô tả các đặc điểm nhân khẩu của dân cư hay

khách hàng như thu nhập hàng năm của hộ gia

đình, số thành viên gia đình, tuổi tác, giới tính của họ…

- Sự kiện xã hội học: Bao gồm các dữ liệu về tầng

lớp xã hội của khách hàng (thượng lưu, trung lưu,

hay tầng lớp bình dân ), tôn giáo,

Trang 34

- Sự kiên tâm lý: Thể hiện nhận thức, động cơ hay lối sống của một cá nhân hay của một nhóm

người.

- Sự kiện thái độ: Phản ánh cách cư xử của con

người trong việc lựa chọn mua hàng, nó mô tả

hành vi và trạng thái ứng xử trước một sự lựa

chọn về sản phẩm hay dịch vụ.

Trang 35

b) Kiến thức

Kiến thức là loại dữ liệu phản ánh sự hiểu biết

của người tiêu dùng và ý thức của họ về nhãn hiệu

hàng hóa, thị trường, người bán.

Thí dụ: Khi quyết định mua một gói bột giặt trong số các nhãn hiệu Omo, Tide, người tiêu dùng cần có hiểu biết nhất định về công dụng, cách thức sử dụng bột giặt Ngoài ra phải biết được sự khác biệt về tính năng tác dụng giữa các loại bột giặt, những điểm đặc thù hình hành nên một nhãn hiệu để phân biệt với

các loại khác… để từ đó chọn đúng thứ bột giặt thích

Trang 36

c) Dư luận

N gười tiêu dùng lựa chọn mua sản phẩm hay

dịch vụ không chỉ dựa vào kiến thức của mình về

sản phẩm, dịch vụ đó mà còn dựa vào (hay chỉ dựa vào) dư luận.

Dư luận phản ánh sự cảm nhận của quần chúng về điều gì đó, thường là sự cảm nhận chung về một loại nhãn hiệu hay các tác dụng tốt hoặc tác dụng

không mong muốn của sản phẩm, biểu tượng của

Trang 37

Một dạng khác của định kiến là ý niệm (images) của khách hàng như nhiều người cùng có một hình tượng giống nhau về một doanh nghiệp hay một

nhãn hiệu nào đó

Hầu hết người tiêu dùng Việt Nam đều nhìn

nhận xe máy của hãng HONDA là bền và đẹp

Định kiến ảnh hưởng đến cách cư xử, thái độ của

nhiều người một cách dai dẳng trong quá trình mua

- bán.

Trang 38

d) Ý định

Ý định là suy nghĩ sắp sẵn trong đầu về hành

động sẽ thực hiện trong tương lai, là thái độ xử sự

sắp tới của đối tượng Ý định và mức độ thay đổi ý

định về một hành vi tiêu dùng là những thông tin

then chốt trong nghiên cứu marketing

Thí dụ nếu hãng VMEP, qua số liệu điều tra cho biết là có 10% gia đình có ý định mua xe máy mới

trong vòng 2 năm tới, khác với số liệu báo cáo năm

Trang 39

e) Động cơ

Động cơ là lực nội sinh khiến con người cư xử

theo một cách nào đó Những động cơ trực tiếp thì nói chung là rõ ràng, dễ nói ra Nhưng những

nguyên nhân cơ bản sâu xa của thái độ cư xử thì

rất khó bộc lộ

Trang 40

1.1.2.3 Phân loại dữ liệu theo chức năng của dữ liệu

a) Dữ liệu phản ánh tác nhân

Đây là loại dữ liệu phản ảnh nguyên nhân dẫn đến một hành vi tiêu dùng

Thí dụ: SYM cần biết yếu tố nào là nguyên nhân chính dẫn người tiêu dùng đến quyết định mua một chiếc xe máy nhãn hiệu Attila trong số các yếu tố

như giá rẻ, hình thức mua trả góp, chất lượng của xe, hay thu nhập của người tiêu dùng Kết quả của việc nghiên cứu các dữ liệu này sẽ giúp cho doanh nghiệp

Trang 41

b) Dữ liệu phản ánh kết quả

Thu thập các dữ liệu để đánh giá kết quả của

các giải pháp marketing (như là nguyên nhân) để

từ đó tìm ra mối quan hệ nhân quả trong hoạt

động marketing là rất quan trọng

Trong thí dụ trên, việc phân tích các dữ liệu về số lượng xe, doanh thu bán ở từng cửa hàng … là

những minh họa cho các dữ liệu kết quả

Trang 42

c) Dữ liệu mô tả tình huống

Dữ liệu dùng để nghiên cứu những đặc điểm

riêng biệt hay phần tiêu biểu của đối tượng nghiên cứu, làm cơ sở đề ra các quyết định phù hợp với

từng nhóm đối tượng

Thí dụ: Đặc điểm cá nhân hay gia đình có thể

ảnh hưởng đến hành động mua sắm của họ, vì thế

những đặc điểm khác nhau đó cần được khảo sát

để có kết luận đúng về mối quan hệ nhân quả.

Trang 43

1.1.2.4 Phân loại dữ liệu theo địa điểm thu thập dữ liệu

Địa điểm thu thập dữ liệu bao gồm nơi sinh sống của đối tượng (nhà ở), nơi đối tượng làm việc, trên đường

phố hay trong lúc di chuyển

Nếu đối tượng của nghiên cứu là những người tiêu

dùng thì thu thập dữ liệu tại nơi mua sắm, là nơi có mật độ người tiêu dùng cao, là hết sức tiện lợi Ngày càng

có nhiều cơ sở nghiên cứu chọn đối tượng ngẫu nhiên

tại những nơi mua bán hàng hóa để tiến hành phỏng

vấn cá nhân

Trang 44

1.1.2.5 Phân loại dữ liệu theo nguồn thu thập dữ liệu a) Dữ liệu thứ cấp

Dữ liệu thứ cấp là loại dữ liệu được sưu tập sẵn, đã công bố nên dễ thu thập, ít tốn thời gian, tiền bạc trong quá trình thu thập.

Thí dụ: Khi nghiên cứu về ảnh hưởng của điều

kiện ăn ở sinh hoạt đến kết quả học tập của sinh

viên, những dữ liệu liên quan đến kết quả học tập

của sinh viên có thể lấy từ Phòng Đào tạo hay thư

ký khoa như điểm trung bình, số môn thi lại… là dữ

Trang 45

b) Dữ liệu sơ cấp

Các dữ liệu sơ cấp được thu thập trực tiếp từ đối tượng nghiên cứu, có thể là người tiêu dùng, nhóm

người tiêu dùng Nó còn được gọi là các dữ liệu gốc, chưa được xử lý.

Dữ liệu sơ cấp có thể thu thập từ việc quan sát, ghi chép hoặc tiếp xúc trực tiếp với đối tượng điều tra; cũng có thể sử dụng các phương pháp thử nghiệm để thu thập dữ liệu sơ cấp.

Thí dụ: Những dữ liệu liên quan đến điều kiện ăn ở sinh hoạt của sinh viên thì không có sẵn, phải trực

tiếp thu thập từ sinh viên là dữ liệu sơ cấp.

Trang 46

c) Dữ liệu thu thập từ các cuộc thử nghiệm

Để thu thập dữ liệu, đặc biệt trong những trường hợp cần kiểm chứng các quan hệ nhân quả, hoặc

cân nhắc giữa các phương án để ra quyết định,

người nghiên cứu có thể dùng phương pháp thử

nghiệm để thu thập dữ liệu.

Thử nghiệm có thể được thực hiện trong phòng

thí nghiệm (thử nghiệm các đặc tính kỹ thuật của

sản phẩm ) hoặc thử nghiệm trên hiện trường (thử

Trang 47

d) Dữ liệu thu thập từ các mô hình giả định

Thay vì thực hiện các cuộc thử nghiệm nhằm

làm rõ những vấn đề còn nằm trong giả thiết thì

phải tiêu tốn mất nhiều thời gian và tiền bạc,

người ta có thể lập các mô hình giả định để phân

tích Các mô hình giả định đưa ra những tình

huống có thật, nó không bao gồm mọi biến cố có

trên thực tế mà được đơn giản hóa hơn nhiều so

với thế giới hiện thực.

Trang 48

CH ƯƠNG 1: NG 1:

TỔNG QUAN DỮ LIỆU CÁC LOẠI THANG ĐO

Trang 49

1 CÁC CẤP BẬC ĐO LƯỜNG

Các dữ liệu định tính và định lượng được thu thập bằng 4 thang đo sau:

- Dữ liệu định tính sử dụng thang đo danh nghĩa hoặc thang đo thứ bậc; có thể đo bằng số hoặc không bằng số.

- Dữ liệu định lượng sử dụng thang đo khoảng cách

hoặc thang đo tỷ lệ.

Ngày đăng: 01/11/2023, 15:59

TỪ KHÓA LIÊN QUAN

w