VÀI LỜI GIỚI THIỆU Ở Việt Nam trong vòng một hai thập niên trở lại đây, ngày càng có nhiều công trình điều tra kinh tế-xã hội sử dụng một số phương pháp thống kê trong việc khảo sát các
Trang 1TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH KHOA XÃ HỘI HỌC-CÔNG TÁC XÃ HỘI-ĐÔNG NAM Á
PHƯƠNG PHÁP
THỐNG KÊ TRONG
NGHIÊN CỨU XÃ HỘI
Lê Minh Tiến
Trang 22
MỤC LỤC
VÀI LỜI GIỚI THIỆU 5 LỜI NÓI ĐẦU 7
PHẦN MỘT PHÂN TÍCH ĐƠN BIẾN ERROR! BOOKMARK NOT DEFINED
CHƯƠNG 1: CÁC KHÁI NIỆM CĂN BẢN: THỐNG KÊ VÀ BIẾN SỐ ERROR ! B OOKMARK NOT DEFINED
1.1 Thống kê và dữ liệu Error! Bookmark not defined
1.2 Các loại thống kê Error! Bookmark not defined
1.3 Mẫu và dân số (Sample and Population) Error! Bookmark not
defined
1.4 Biến số (Variable) Error! Bookmark not defined
1.5 Các cấp độ đo (Levels of measurement) Error! Bookmark not
defined
1.6 Biến số liên tục và biến số rời rạc Error! Bookmark not defined
1.7 Các giá trị loại trừ và bổ sung lẫn nhauError! Bookmark not defined
1.8 Ý tưởng và tư duy Error! Bookmark not defined
CHƯƠNG 2: TRÌNH BÀY DỮ LIÊU ERROR ! B OOKMARK NOT DEFINED
2.1 Bảng phân phối tần số Error! Bookmark not defined
2.2 Bảng phân phối tỷ lệ phần trăm (Percentage) Error! Bookmark not
defined
2.3 Phân phối phần trăm tích lũy (Cumulative percent) Error! Bookmark
not defined
2.4 Trình bày một bảng dữ liệu Error! Bookmark not defined
2.5 Gộp nhiều giá trị lại với nhau (Grouping) Error! Bookmark not
defined
2.6 Loại bỏ các dữ liệu thiếu (Missing value) Error! Bookmark not
defined
2.7 Biểu đồ/đồ thị (Chart) Error! Bookmark not defined
2.8 Những trường hợp dị biệt Error! Bookmark not defined
CHƯƠNG 3: CÁC ĐẠI LƯỢNG ĐO LƯỜNG XU HƯỚNG TẬP TRUNG (MEASURES OF CENTRAL TENDENCY) ERROR ! B OOKMARK NOT DEFINED
3.1 Mốt (Mode) Error! Bookmark not defined
3.2 Trung vị (Median) Error! Bookmark not defined
3.3 Trung bình (Mean/Average) Error! Bookmark not defined
3.4 Mốt, Trung vị hay Trung bình? Error! Bookmark not defined
CHƯƠNG 4: CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN/BIẾN THIÊN (MEASURES
OF DISPERSION) ERROR ! B OOKMARK NOT DEFINED
4.1 Khoảng biến thiên (Range) Error! Bookmark not defined
4.2 Phương sai (Variance) Error! Bookmark not defined
4.3 Độ lệch chuẩn (Standard deviation) Error! Bookmark not defined
4.4 Hệ số biến thiên (Coefficient of Variation) Error! Bookmark not
defined
4.5 Điểm số chuẩn hóa (Scores-Z) Error! Bookmark not defined
Trang 34.6 Phân phối chuẩn (Normal distribution) Error! Bookmark not
defined
4.7 Khoảng tin cậy (Confidence interval) Error! Bookmark not defined
4.8 Lưu ý cho các thống kê đơn biến Error! Bookmark not defined
PHẦN HAI: PHÂN TÍCH HAI BIẾN ERROR! BOOKMARK NOT DEFINED
CHƯƠNG 5: PHÂN TÍCH BẢNG HAI CHIỀU ERROR ! B OOKMARK NOT DEFINED
5.1 Bảng hai chiều tần số Error! Bookmark not defined
5.2 Bảng hai chiều phần trăm Error! Bookmark not defined
5.3 Cách đọc tỷ lệ phần trăm trong bảng hai chiều Error! Bookmark not
defined
5.4 Quan hệ tương quan dương, quan hệ tương quan âm và tương quan cong Error! Bookmark not defined
5.5 Trình bày bảng hai biến Error! Bookmark not defined
5.6 Lưu ý khi bảng hai chiều có (n) quá nhỏ Error! Bookmark not
defined
5.7 Quan hệ tương quan không phải là quan hệ nhân-quả Error!
Bookmark not defined
CHƯƠNG 6: KIỂM ĐỊNH «KHI-BÌNH PHƯƠNG» (CHI-SQUARE TEST) ERROR !
B OOKMARK NOT DEFINED
6.1 Lôgíc của kiểm định ý nghĩa thống kê Error! Bookmark not defined
6.2 Kiểm định khi-bình phương Error! Bookmark not defined
6.3 Khi tần số lý thuyết nhỏ hơn 5 Error! Bookmark not defined
6.4 Ý nghĩa thống kê và ý nghĩa “thực tế” Error! Bookmark not defined
CHƯƠNG 7: ĐO LƯỜNG MỨC ĐỘ MỐI QUAN HỆ GIỮA HAI BIẾN ĐỊNH DANH VÀ THỨ BẬC E RROR ! B OOKMARK NOT DEFINED
7.1 Sơ lược về các đo lường tương quan Error! Bookmark not defined
7.2 Các loại đo lường tương quan dựa trên khi-bình phương dành cho các
biến định danh: c, v , và lambda Error! Bookmark not defined
7.3 Lựa chọn đo lường tương quan cho các biến định danh Error!
Bookmark not defined
7.4 Đo lường tương quan cho hai biến thứ bậc Error! Bookmark not
defined
7.5 Tóm lược các loại đo lường tương quan Error! Bookmark not
defined
CHƯƠNG 8: SO SÁNH TRUNG BÌNH VÀ KIỂM ĐỊNH T (STUDENT'S T-TESTS)
E RROR ! B OOKMARK NOT DEFINED
8.1 Kiểm định t về sự khác biệt giữa hai trung bình Error! Bookmark not
defined
8.2 Một số giả định và lưu ý liên quan đến kiểm định t Error! Bookmark
not defined
8.3 Kiểm định t một phía và kiểm định t hai phía Error! Bookmark not
defined
8.4 Khoảng tin cậy dành cho sự khác biệt giữa hai trung bình Error!
Bookmark not defined
Trang 44
CHƯƠNG 9: PHÂN TÍCH PHƯƠNG SAI (ANALYSE OF VARIANCE) ERROR !
B OOKMARK NOT DEFINED
9.1 Mục đích và những điều kiện của phân tích phương sai Error!
Bookmark not defined
9.2 Logic của phân tích phương sai Error! Bookmark not defined
9.3 Bảng anova Error! Bookmark not defined
9.4 Tỷ lệ tương quan (e²) Error! Bookmark not defined
9.5 Phân tích phương sai với nhiều biến độc lập Error! Bookmark not
defined
9.6 Ba lưu ý liên quan đến các mức ý nghĩa thống kê của f Error!
Bookmark not defined
CHƯƠNG 10: HỒI QUI VÀ TƯƠNG QUAN ĐƠN (REGRESSION AND CORRELATION)
E RROR ! B OOKMARK NOT DEFINED
10.1 Đồ thị phân tán và mức độ của mối quan hệ Error! Bookmark not
defined
10.2 Phương trình hồi qui tuyến tính (Linear regression) Error! Bookmark
not defined
10.3 Hệ số tương quan (Correlation coefficient) Error! Bookmark not
defined
10.4 Hệ số xác định và kiểm định f cho hệ số tương quan Error! Bookmark
not defined
10.5 Ma trận tương quan (Correlation matrix) Error! Bookmark not
defined
10.6 Hệ số tương quan hạng (Spearman’s Rho) Error! Bookmark not
defined
CHƯƠNG 11: PHÂN TÍCH BẢNG ĐA BIẾN ERROR ! B OOKMARK NOT DEFINED
11.1 Lôgíc của mối quan hệ nhân quả Error! Bookmark not defined
11.2 Mối quan hệ giả và mối quan hệ thật Error! Bookmark not defined
11.3 Biến số trung gian Error! Bookmark not defined
11.4 Gamma bộ phận (Gp) Error! Bookmark not defined
11.5 Tương quan bộ phận Error! Bookmark not defined
11.6 Hồi qui bội Error! Bookmark not defined
11.7 Hệ số tương quan bội Error! Bookmark not defined
11.8 Hệ số hồi qui chuẩn hóa (các hệ số bê-ta) Error! Bookmark not
defined
11.9 Hồi qui với biến định tính và biến giả Error! Bookmark not defined
THƯ MỤC THAM KHẢO ERROR ! B OOKMARK NOT DEFINED
Trang 5VÀI LỜI GIỚI THIỆU
Ở Việt Nam trong vòng một hai thập niên trở lại đây, ngày càng có nhiều công trình điều tra kinh tế-xã hội sử dụng một số phương pháp thống kê trong việc khảo sát các sự kiện và hiện tượng Tuy nhiên, phần lớn các công trình, nhất là các công trình nghiên cứu xã hội học, thường chỉ dừng lại ở một số chỉ tiêu thống kê tương đối đơn giản và chưa đi sâu ứng dụng những thuật toán thống kê chuyên nghiệp hơn, và đặc biệt là cũng chưa khai thác những phương pháp phân tích thống kê nhằm ứng dụng vào việc lý giải các dữ liệu một cách có hiệu quả
Và ở trong nước cho đến nay hình như cũng chưa có nhiều quyển sách trình bày một cách chuyên sâu về các phương pháp thống kê ứng dụng vào lĩnh vực điều tra xã hội cũng như lĩnh vực nghiên cứu xã hội học Chính vì thế, theo thiển ý chúng tôi, sự ra đời của tập sách này là một
nỗ lực đáng trân trọng nhằm góp phần đáp ứng nhu cầu bức bách này
Lẽ tất nhiên, trong một công trình nghiên cứu, điều quan trọng nhất là làm sao đưa ra được những giả thuyết mới và phác thảo ra được những lập luận vững chắc và mang tính thuyết phục Hay nói như nhà xã hội học nổi tiếng Wright Mills, trong lĩnh vực nghiên cứu xã hội học, người
ta cần phải trui rèn một “trí tưởng tượng xã hội học” để có thể khám phá những điều bất ngờ, tìm ra được những sợi dây liên hệ giữa những sự kiện tưởng chừng như không dính dáng gì với nhau, và nối kết lại những ý tưởng thoạt nhìn có vẻ nghịch lý với nhau
Thế nhưng, vì đây là công việc khoa học, cho nên người làm công tác nghiên cứu vẫn buộc phải tuân thủ những qui trình và thao tác nghiên cứu theo những nguyên tắc nhất định Và trong quá trình xử lý các dữ liệu phong phú mà người nghiên cứu đã thâu thập được từ thực tại kinh tế-xã hội, các phương pháp thống kê hiển nhiên là một công cụ hết sức hữu ích nếu chúng ta biết cách sử dụng chúng đúng lúc đúng chỗ một cách thích hợp Thậm chí trong không ít trường hợp, các phương pháp thống kê còn có thể giúp cho người nghiên cứu phát triển và kiểm chứng những ý tưởng xuất phát từ “trí tưởng tượng xã hội học” của mình Dĩ nhiên, thống kê không thể nào thay thế được tư duy, con số hoặc máy tính không thể làm thay công việc của cái đầu Nhưng nếu người làm công tác khoa học không biết tận dụng những phương tiện này thì có thể nói khó lòng mà thúc đẩy các tri thức khoa học tiến lên đạt
Trang 66
Hy vọng rằng quyển sách này sẽ được đón nhận trong giới nghiên cứu cũng như giới sinh viên khoa học xã hội như một người ta đồng hành trong các công trình nghiên cứu của mình
PGS.TS Trần Hữu Quang
Trang 7LỜI NÓI ĐẦU
Trong bối cảnh nghiên cứu của các ngành khoa học xã hội tại nước ta nói chung và ngành xã hội học nói riêng, các loại tài liệu tham khảo chuyên ngành bằng tiếng Việt còn khá khiêm tốn Với mong muốn góp phần làm phong phú thêm nguồn tư liệu tham khảo cho khoa học xã hội nói chung và xã hội học nói riêng là lý do đầu tiên thúc đẩy chúng tôi biên soạn tài liệu này
Bên cạnh đó, các công trình nghiên cứu trong khoa học xã hội nói chung và nghiên cứu xã hội học nói riêng trong những năm gần đây thường sử dụng loại hình nghiên cứu định lượng thông qua việc khảo sát và phân tích dữ liệu dựa vào phương pháp thống kê Tuy nhiên theo quan sát của chúng tôi, khá nhiều công trình nghiên cứu đã áp dụng các thuật toán thống kê chưa thích hợp do chưa nắm vững những tri thức căn bản trong phân tích thống kê Do đó, tài liệu này trình bày những kiến thức căn bản trong thống kê dành cho giới làm nghiên cứu trong lĩnh vực khoa học xã hội: thống kê đơn biến (thống kê mô tả), thống kê hai biến và một phần nào đó là thống kê đa biến Đó là những kỹ thuật thống kê cơ bản mà người làm công tác nghiên cứu cần nắm vững để
có thể thực hiện những nghiên cứu định lượng của mình
Lần tái bản này chúng tôi đã có những chỉnh sửa, bớt những phần thừa không cần thiết và bổ sung thêm nhiều ví dụ minh họa phù hợp hơn nhằm giúp cho người đọc cũng như các bạn sinh viên có thể dễ dàng nắm bắt và có thể tự học một cách dễ dàng Vì là tài liệu biên soạn nên chúng tôi đã tham khảo nhiều tài liệu khác nhau và tất nhiên tài liệu này cũng không phải là một tài liệu hoàn chỉnh về mọi thuật toán thống kê, bởi chúng tôi chỉ trình bày những thuật toán thống kê căn bản mà thôi Do vậy, cũng giống như mọi tài liệu khoa học khác, tài liệu này chắc chắn có những thiếu sót, thậm chí là sai sót, vì vậy chúng tôi rất mong nhận được những phản hồi góp ý của người đọc, các bạn sinh viên để những lần tái bản sau chúng tôi có thể chỉnh sửa cho phù hợp hơn
Nhân đây, chúng tôi xin trân trọng cảm ơn cố Thạc sĩ Nguyễn Thị Oanh, người đã động viên và hỗ trợ cho lần xuất bản đầu tiên của tập sách này; Phó Giáo sư-Tiến sĩ Trần Hữu Quang, người thầy đã khuyến khích và viết lời giới thiệu cho tập sách này
Lê Minh Tiến
Trang 88