• Định lý giới hạn trung tâm The Central Limit TheoremSố trung bình của một tập hợp các biến ngẫu nhiên tuân theo phân phối chuẩn, khi mẫu được chọn có quy mô đủ lớn, cho dù từng biến cá
Trang 1TIN HỌC ỨNG DỤNG TRONG KHXH
Giảng viên: Lâm Thị Ánh Quyên Khoa Xã hội học- Công tác xã hội-
Đông Nam Á Trường đại học Mở TPHCM
Trang 2THỐNG KÊ MÔ TẢ
PHÂN TÍCH ĐƠN BIẾN (Univariable Data Analysis)
Trang 3THỐNG KÊ?
thập, tổ chức, trình bày, phân tích và
xử lý dữ liệu.
chúng ta sản xuất ra thông tin.
Trang 4HAI LOẠI THỐNG KÊ
Trang 5• Bức tranh tổng thể về những khuôn mẫu trong
dữ liệu.
-Dùng những điểm số để mô tả
-Mô tả những mối quan hệ giữa các biến
-> Những điểm số mang tính đặc trưng nhất trong mỗi nhóm
Trang 712/15/2019 7
Tập hợp dữ liệu:
1 ) D â n s ố / T ổ n g t h ể / Q u ầ n t h ể (Population): Khoa XHH-CTXH-ĐNA có
2)Mẫu (Sample): Từ 1000 sinh viên chọn
phương pháp chọn mẫu, công thức tính qui mô mẫu)
Trang 812/15/2019 8
THỐNG KÊ SUY DIỄN (Inferential Statistics)
Từ kết quả của một mẫu suy diễn cho toàn bộ
dân số.
Mẫu Tổng thể
Trang 9• Định lý giới hạn trung tâm (The Central Limit Theorem)
Số trung bình của một tập hợp các biến ngẫu nhiên tuân theo phân phối chuẩn, khi mẫu được chọn có quy mô đủ lớn, cho dù từng biến cá biệt chấp nhận dạng phân phối nào.
N=30
Trang 11THỐNG KÊ MÔ TẢ- PHÂN TÍCH ĐƠN BIẾN
-Tần số- %- Phân bố (Frenquency Distribution)
-Đại lượng đo xu hướng tập trung (Central Tendency: Mean, Median, Mode)
-Sự phân tán (Dispersion: Standard Deviation-Variance)
Trang 12Ø TẦN SỐ (Frenquency): MỨC ĐỘ XUẤT HIỆN/ SỐ LẦN LẬP LẠI CỦA MỘT GIÁ
KÝ HIỆU: f
Trang 13• ĐÂY LÀ BƯỚC ĐẦU TIÊN TRONG PHÂN TÍCH DỮ LIỆU Tìm sự phân bố
• Đặc biệt: Trình bày đặc điểm nhân khẩu của mẫu
Trang 17Thich lanh dao la:
302 1
Valid Missing N
• N Valid 302: Có 302 người trả lời câu hỏi “Thích lãnh đạo là”
• N Missing 1: Có 1 người không trả lời câu hỏi
“Thích lãnh đạo là”
Trang 18Thich lanh dao la:
Trang 19Toi cam thay cang thang trong nhom khi co dong nguoi khac gioi
58 2
Valid Missing N
Trang 20% TÍCH LŨY
• D ù n g % t í c h l ũ y ( C u m u l a t i v e Percent) cho biến có thang đo nào?
Định Danh Thứ bậc Khoảng
Tỷ lệ
?????????????????????
Trang 22So luong nguoi doc bao SGTT trong gia dinh?
117 383
Valid Missing N
Valid
System
MissingTotal
Frequency Percent Valid Percent CumulativePercent
Trang 23Lưu ý: Bảng tần số đối với biến có thang khoảng-tỷ lệ
• Bảng tần số rất dài.
• VD: Bảng tần số tuổi của 90 trường hợp.
=> Phân nhóm tuổi = Lệnh Select Cases.
Trang 24ĐO XU HƯỚNG TẬP TRUNG
Trang 2512/15/2019 25
TÌM HIỂU SỰ PHÂN BỐ CỦA TẬP HỢP DỮ LIỆU
• Phân bố: vị trí mà các giá trị phân bố tập trung
ở đó và mức độ phân tán của toàn phân bố so với vị trí trung tâm đó
• Đo đạc vị trí trung tâm: TRUNG BÌNH ( cộng …)
• Đo mức độ phân tán: ĐÔ LỆCH CHUẨN (hoặc phương sai)
Trang 26TRUNG BÌNH CỘNG- MEAN
ĐO MỨC ĐỘ TẬP TRUNG
mà tử số là tổng các giá trị của từng trường hợp của tập hợp mẫu nghiên cứu, còn mẫu số là tổng số các trường hợp.
Là giá trị trung bình của tất cả dữ liệu.
Số trung bình đo lường vị trí trung tâm.
Trang 2712/15/2019 27
Sử dụng Mean đối với biến
có thang đo nào?
Trang 28TRUNG VỊ- MEDIAN
• Định nghĩa: Cho các giá trị x1, x2,
x3,…, xn của biến số A đo trên một
mẫu và sắp xếp theo thứ tự tăng
dần Số trung vị của mẫu được cho
Trang 30Sử dụng trung bình cộng (Mean) khi:
+"Phần lớn" số liệu gần số trung bình (càng nhiều càng tốt)
+Nếu không = một kiểu “nói láo” của thống kê
Trang 31Sử dụng trung vị- Median đối với biến có thang đo nào?
• định danh?
• thứ bậc?
• khoảng và tỷ lệ?
Trang 32• Mode là giá trị được gặp nhiều lần nhất trong một dải các giá trị.
• Mode là giá trị có tần
số lớn nhất.
• Sử dụng Mode khi biến
có thang đo nào?
Trang 3412/15/2019 34
Statistics
Co nhieu tien
500 0 5.48 6.00 7
Valid Missing
N
Mean Median Mode
Valid Frequency Percent Valid Percent
CumulativePercent
Trang 36N
MeanMedianMode
Trang 37Quan trong trong cuoc song: Ban be
Trang 38Quan trong trong cuoc song: Gia dinh
Valid
GTKKHKUDKTLKBTotal
Missing
Total
Frequency Percent Valid Percent CumulativePercent
Trang 39Quan trong trong cuoc song: Ban be
GTKKHKUDKTLKBTotalMissing
Total
Frequency Percent Valid Percent CumulativePercent
Trang 40Hai long voi doi song gia dinh? (Thang khoang)
Trang 41Tin tuong gia dinh cua ban? (Thang khoang)
Total
Valid
Gia tri khuyet Khong hoi Khong ung dung Khong tra loi Khong biet Total
Missing
Total
Frequency Percent Valid Percent Cumulative Percent
Trang 42Hai long voi doi song gia dinh? (Thang khoang)
Valid
Khong hoiKhong tra loiKhong bietTotal
Missing
Total
Frequency Percent Valid Percent CumulativePercent
Trang 44Con cai can mot mai nha co cha va me
Co xu huong dong y Total
Valid
Gia tri khuyet Khong hoi Khong ung dung Khong tra loi Khong biet Total
Missing
Total
Frequency Percent Valid Percent Cumulative Percent
Trang 45Phu nu can co con cai de hoan thien
Valid
Gia tri khuyet Khong hoi Khong tra loi Khong biet Total
Missing
Total
Frequency Percent Valid Percent Cumulative Percent
Trang 46Bài tập mở rộng: So sánh hai bảng sau
Trang 473 trieu va honTotal