Bài giảng Thống kê trong nghiên cứu khoa học xã hội: Chương 2 Thu thập và trình bày dữ liệu cung cấp cho người học những kiến thức như: Các khái niệm cơ bản trong thống kê; thu thập và trình bày dữ liệu bài; tóm tắt dữ liệu; phân phối mẫu; ước lượng cho một tham số thống kê; kiểm định giả thuyết cho một tham số thống kê; hồi quy và tương quan. Mời các bạn cùng tham khảo!
Trang 1Bài giảng THỐNG KÊ TRONG NGHIÊN CỨU
KHOA HỌC XÃ HỘI
Chương 2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Nguyễn Công Nhựt
Trang 2GIỚI THIỆU MÔN HỌC THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC XÃ HỘI
Hướng dẫn cách học - chi tiết cách đánh giá môn học
Tài liệu, video bài giảng được đưa lên elearning hàng tuần Sinh viên tải về, in ra và mangtheo khi học Điểm tổng kết môn học được đánh giá xuyên suốt quá trình học
Trang 31 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
Trang 41 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
7 HỒI QUY VÀ TƯƠNG QUAN
Trang 5THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
NỘI DUNG
1-1 Nguồn dữ liệu
1-2 Cách trình bày một mẫu cụ thể
Trang 6THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
NỘI DUNG
1-1 Nguồn dữ liệu
1-2 Cách trình bày một mẫu cụ thể
Trang 7Bài 1 NGUỒN DỮ LIỆU
NỘI DUNG
Trang 82.1 Dữ liệu thứ cấp (Secondary data)
Dữ liệu thứ cấp là các thông tin đã có sẵn và có thể thu thập từ các nguồn sau:
a) Số liệu nội bộ là loại số liệu đã được ghi chép và cập nhật trong đơn vị hoặc được thuthập từ các cuộc điều tra trước đây
b) Số liệu từ các ấn phẩm của nhà nước: các dữ liệu do các cơ quan thống kê nhà nướcphát hành định kỳ như niên giám thống kê,
c) Báo, tạp chí chuyên ngành: các báo và tập chí đề cập đến vấn đề có tính chất chuyênngành như tạp chí thống kê,
d) Thông tin của các tổ chức, hiệp hội nghề nghiệp: Viện nghiên cứu kinh tế, phòng thươngmại,
e) Các công ty tổ chức thu thập thông tin, nghiên cứu và cung cấp thông tin theo yêu cầu
Số liệu thứ cấp có ưu điểm là ít tốn kinh phí, số liệu được cập nhật kịp thời Tuy nhiên dữliệu thứ cấp thường đ¯a qua tổng hợp và xử lý nên ít sử dụng cho dự báo thống kê
Trang 92.2 Dữ liệu sơ cấp (Primary data)
Dữ liệu sơ cấp là các thông tin thu thập từ các cuộc điều tra Căn cứ vào phạm vi điều tra
có thể chia làm hai loại: điều tra toàn bộ và điều tra chọn mẫu
Điều tra toàn bộ là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc tổng thểnghiên cứu Mặc dù, điều tra toàn bộ cung cấp tất cả thông tin về đơn vị tổng thể nhưng việctiến hành điều tra rất tốn thời gian, khi phí và một số trường hợp do thời gian kéo dài nên sốliệu kém chính xác do hiện tượng biến động theo thời gian; đôi khi phá vơ tổng thể nghiên cứu.Điều tra chọn mẫu là từ tổng thể ta lấy một số phần từ đại diện cho tổng thể và tính nhữngđặc trưng cơ bản của nó và từ đó dùng phương pháp thống kê để ước lượng cho các tham sốcủa thổng thể
Trang 102.3 Các phương pháp thu thập thông tin
Quan sát trụcc tiếp là phương pháp thu thập dữ liệu bằng mắt và số liệu được người thuthập ghi lại dựa trên những gì bản thân thu thập được trong quá trình đó
Phương pháp gủi thử : Nhân viên điều tra gửi bảng câu hỏi đến đối tượng cung cấp thôngtin thông qua đường bưu điện Phương pháp này có thể thu thập được nhiều thông tin, tiếtkiệm chi phí so với các phương pháp khác nhưng tỷ lệ đối tượng trả lời thường rất thấp
Phỏng vấn bằng điện thoại: thu thập thông tin bằng cách phỏng vấn bằng điện thoại.Phương pháp này thu thập thông tin nhanh chóng tuy nhiên rất tốn kém, nội dung thu thậpthông tin bị hạn chế
Phỏng vấn trực tiếp thích hợp cho việc điều tra nhiều thông tin, nội dung của thông tintương đối phức tạp cần thu thập thông tin chi tiết Thường có hai hình thức
Phỏng vấn cá nhân: Nhân viên điều tra tiếp xúc với đối tượng cung cấp thông tin tại nhàriêng hoặc nơi làm việc, thương áp dụng cho các cuộc điều tra chính thức
Phỏng vấn nhóm: Nhân viên điều tra phỏng vấn từng nhóm để thảo luận về một vấn đềnào đó, thường được sử dụng để kiểm tra lại bảng câu hỏi có hoàn chỉnh chưa hoặc cần tìmhiểu về một vấn đề phức tạp cần phải có ý kiến cụ thể của những người am hiểu
Trang 11Bài 2 TRÌNH BÀY DỮ LIỆU
NỘI DUNG
Trang 122.4 Các cách trình bày một mẫu cụ thể
2.4.1 Cách lập bảng tần số cho dữ liệu định tính
Để đưa ra quyết định từ dữ liệu dạng thô thường rất khó Do vậy, ta cần phải tổ chức lại
dữ liệu Ta có hai dạng tổ chức dữ liệu: bảng hoặc đồ thị
Ta s¯e lập bảng phân phối tần số với những thông tin sau: Cột thứ nhất liệt kê tất cả cácbiểu hiện có thể có của đối tượng theo đặc điểm ta đang muốn lập bảng tần số để tót tắt dữliệu.|
Cột thứ hai là cột tần số được điền số liệu bằng cách đếm xem có bao nhiêu quan sát cócùng một biểu hiện Tổng của cột tần số phải bằng tổng số quan sát của tập dữ liệu
Cột thứ ba là cột tần suất được tính bằng cách lấy tần số chia cho tổng số quan sát củatập dữ liệu, lấy kết quả nhân với 100% rồi ghi vào cột tần suất tại vị trí tương ứng cùng hàngnhằm so sánh với tổng số quan sát thì số đơn vị có cùng biểu hiện chiếm bao nhiêu % Tổngcột tần suất đúng bằng 100%
Trang 132.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Đối với dữ liệu định lượng mà đặc điểm quan tâm có ít biểu hiện
Các trình bày c¯ung giống như cách trình bày cho dữ liệu định tính, lúc này mỗi giá trị xemnhư là một biểu hiện Giả sử một mẫu cụ thể(x1,x2, ,xk) có:
+x1 có n1 giá trị, x2 có n2 giá trị, ,xk có nk giá trị +x1 < x2 < · · · < xk và
n1+n2+ · · · +nk =n Ta có thể mô tả dữ liệu bằng bảng phân phối tần số như sau:
Hình
Trang 142.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Để có được nhiều thông tin hơn khi đọc bảng phân phối tần số thì người ta thêm vào cộttần số tích l¯uy, tần suất và tần suất tích l¯uy
Hình
Trang 152.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Điều tra thời gian đợi phục vụ của khách hàng tại một cửa hàng (đơn vị: phút) Người tachọn ngẫu nhiên 10 người, kết quả thu được như sau: 4, 5, 5, 7, 8, 7, 8, 7, 9, 9
Hình
Trang 162.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Đối với dữ liệu định lượng mà đặc điểm quan tâm có nhiều biểu hiện
Đối với dữ liệu có nhiều biểu hiện thì việc liệt kê từng biểu hiện giống như trên không cònphù hợp mà bảng tần số khá dài dòng Để thuận tiện người ta tiến hành phân tổ dự liệu
Phưng pháp phân tổ dũ liệu
- Các tổ không được trùng nhau, một quan sát bất kỳ chỉ thuộc về một tổ
- Tất cả các tổ được phân chia phải đảm bảo bao quát hết tất cả các giá trị hiện có củatập dữ liệu
- Tránh không để tổ rỗng do không có quan sát nào thuộc về tổ
Tham khảo các bước thực hiện phân tổ Q Xác định số tổ cần chiak (không có quy địnhchính xác về số tổ cần chia là bao nhiêu nhưng theo kinh nghiệm người ta thấy nên chia từ 5đến 15 tổ) Công thức phân chia số tổ
k = (2×n)1
Trang 172.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Chú ý: nếu số lẻ thì phải làm tròn
Xác định khoảng cách tổ
h= xmax−xmin
kTrong đó:
xmax là giá trị lớn nhất của tập dữ liệuxmin là giá trị nhỏ nhất của tập dữ liệu
Trang 182.4.2 Cách lập bảng tần số cho dữ liệu định lượng
k số tổ cần chia
Tổ thứ nhất: (xmin;xmin+h)
Tổ thứ hai:(xmin+h; xmin+2h)
Đếm các giá trị quan sát vào tổ Trường hợp giá trị bằng đúng cận trên của tổ thì ta xếpgiá trị đó vào tổ kế tiếp, tức là cận dưới ≤xi < cận trên
Để đơn giản ta có thể lập bảng phân phối tần số như sau:
Mỗi nhóm (lớp) có bề rộng bằng nhau,
Bề rộng của mỗi nhóm được xác định bởi, Giá trị lớn nhất−Giá trị bé nhất
Số khoảng cần chiaTối thiểu là 5 khoảng, nhưng không nhiều hơn 15 khoảng,
Các khoảng không trùng nhau
Trang 192.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Chọn ngẫu nhiên 20 ngày mùa đông có nhiệt độ cao và đo nhiệt độ (đơn vị: độF) được sốliệu như sau:
- Xác định miền dữ liệu (range):58−12=46
- Chọn số khoảng cần chia: 5 (thông thường từ 5 đến 15 )
- Xác định độ rộng của khoảng: 10 (làm tròn46/5)
Trang 202.4.2 Cách lập bảng tần số cho dữ liệu định lượng
Hình
Trang 211 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
Trang 221 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
7 HỒI QUY VÀ TƯƠNG QUAN
Trang 231 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
Trang 241 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
7 HỒI QUY VÀ TƯƠNG QUAN
Trang 251 CÁC KHÁI NIỆM CƠ BẢN TRONG THỐNG KÊ
2 THU THẬP VÀ TRÌNH BÀY DỮ LIỆU
Bài 1 NGUỒN DỮ LIỆU
Bài 2 TRÌNH BÀY DỮ LIỆU
3 TÓM TẮT DỮ LIỆU
4 PHÂN PHỐI MẪU
5 ƯỚC LƯỢNG CHO MỘT THAM SỐ THỐNG KÊ
6 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ