m Mục đích của việc sử dụng phương pháp thống Bai 2: Cac khai niém co ban t.t a Bién déc lap independent variable a Bién phu thudc dependent variable Thao tac hoa operationalization Do l
Trang 11 Tên môn học: Thống kê cho khoa học xã hội Mã môn học: DA1005
2 Số tín chỉ: 02
3 Trình độ: sinh viên năm 1 va 2
4 Phân bỗ thời gian: 30 tiết lý thuyết
5 Điều kiện tiên quyết
Sinh viên đã được học môn phương pháp nghiên cứu khoa học
6 Mục tiêu của học phần
Cung cấp cho sinh viên những khái niệm và kiến thức cơ bản về thông kê, về khả năng nhận định và kiêm tra những giả thuyết thông kê trong nghiên cứu khoa học nói chung,
khoa học xã hội nói riêng
7 Mô tả văn tắt nội dung môn học
Môn học, bao gồm phần bài giảng, thảo luận, và bài tập, cung cấp những khái niệm và
kỹ thuật cơ bản về thống kê giúp cho sinh viên trong việc xử lý những kết quả thu được
từ những cuộc nghiên cứu điều tra thực tế trong nhiều lĩnh vực khác nhau như: xã hội học, nhân hoc, công tác xã hội, báo chí, địa lý
8 Nhiệm vụ của sinh viên
- Sinh viên có nhiệm vụ tham dự đầy đủ các buỗi học trên lớp (6 buổi), những sinh viên
văng mặt quá 20% tông thời gian học trên lớp sẽ không đủ điêu kiện thi kết thúc môn
học
- Trén cơ sở những tài Hiệu được giao đọc ở nhà, sinh viên có nhiệm vụ đọc kỹ lưỡng và
tom tat nội dung phân đọc, và trình bày những hiểu biệt của mình qua phân thảo luận
tại lớp vào buôi học kê tiệp
- Bài tập: trong các buổi học, sinh viên có nhiệm vụ phải làm các bài tập trên lớp Đây
là loại bài tập nhanh, sinh viên sẽ có cơ hội ghi 01 dau (+) [04 dâu “+” tương đương 1 diém thưởng được cộng điêm vào bài kiêm tra giữa kỳ
- Giáo trình SPSS Tác giả: Nguyễn Văn Thắng và Phan Thành Huấn Nhà xuất bản
Đại học Quốc gia TPHCM Năm 2003.
Trang 210 Tiêu chuẩn đánh giá sinh viên:
Điểm thưởng (nếu có): 10% (Bài tập nhanh / chuyên cắn)
11 Thang điểm: Thang điểm 10
12 Nội dung chỉ tiết môn học
Bài 1: Giới thiệu
Thống kê trong các nghiên cứu xã hội
Ý nghĩa của phương pháp thống kê trong các nghiên cứu khoa học xã hội
Mục đích của việc sử đụng phương pháp thống kê xã hội
- Vai trd của máy tính trong thống kê
Bai 2: Cac khái niệm cơ bản
Tổng thể (population) Mẫu (sample)
Bién (variable)
Dinh dé (proposition) Biến độc lập (independent variable) Biến phụ thuộc (dependent variable) Thao tac hoa (operationalization)
Do luong (measurement) Bài 3 Chọn mẫu và Các loại thang do
Chon mau (sampling) Cac
loai thang do (scale)
Thang do danh nghia (nominal) Thang do thir bac (ordinal) Thang do khoang cach (interval) Thang do ti 1é (ratio)
Bài 4 Thẳng kê mô tả
Trình bày dưới đạng bảng (tables)
Mô tả dữ liệu thô (raw data) Phân bé tan sé (frequency distributions): biéu diễn dưới dạng tỉ lệ (proportion)
va phan tram (percent)
Phân bổ tần số lũy tiến (cummulative)
Trang 3~ test cho mẫu độc lập (independent-sample t-test)
Bai 6:
[ Thiết lập giả thuyét (hypothesis)
HH Công thức (formula) [ Giải thich (interpretation)
Kiểm định giả thuyết (tiếp theo)
- _ Cho mỗi quan hệ giữa hai biến định đanh (Chi-square test)
[ Thiết lập giả thuyết (hypothesis)
[ Công thức (formula)
ñ Giải thích (interpretation)
13 Kế hoạch giảng dạy và học tập cụ thể
* Đối với lớp học 05 tiết/tuần
Thời Nội dung môn học Số | Nộidunghociậpcủa | Số
cứu khoa học xã hội
KHI Thống kê ứng dụng trong kinh tê xã hội phương pháp thống kê xã
Tuần | Hoàng Trọng và Chu Nguyễn Mộng Ngọc hội
Ú5 | thống kê
- Các khái niệm cơ bản Các loại thang đo
Thông kê ứng dụng trong kinh tê xã hội Hy pene
- Thang do ti lệ
(O Thông kê ứng dụng trong kinh tế xã hội
02 Chương II, tr.16-34 0517 Trình bày dưới dạng bảng 05
Thống kê mô tá: Báng phân bỗ tần suất
Thống kê ứng dụng trong kinh tế xã hội
Hoàng Trọng và Chu Nguyễn Mộng Ngọc
-_ Phân bỗ tần số: biểu điễn
Trang 4ĐI Thông kê ứng dụng trong kinh tê xã hội T
Hoàng Trọng và Chu Nguyễn Mộng Ngọc
ue Thi giữa kỳ
Thống kê suy luận : Kiểm định giả
Thông kê ứng dụng trong kinh lê xã hội
Chương VHI, tr 208 - 228
Thống kê suy luận : Kiểm định giá thuyết
06 Doc tai ligu: II Thắng kê ứng dụng trong kinh tế xã hội 05 định danh (Chi-square test) 05
Hoàng Trọng và Chu Nguyễn Mộng Ngọc
Trang 5Trình độ: sinh viên nămthứ l và 2
Phân bỗ thời gian: 30 tiết
Mục tiêu của học phần: Cung cấp cho sinh viên
những khái niệm và kiên thức cơ bản về thông kê, về
khả năng nhận định và kiêm tra những giả thuyết
thông kê trong nghiên cứu khoa học
Mô tả vắn tắt nội dung
Môn học, bao gồm phần bài giảng, thảo luận, và
bài tập, Cung cấp những khái niệm và kỹ thuật cơ bản
về thống kê giúp cho sinh viên trong việc xử lý những kết quả thu được từ những cuộc nghiên cứu điều tra thực tế trong nhiều lĩnh vực khác nhau như:xã hội học, nhân học, báo chí, địa lý, v.v
- Làm bài tập tại lớp hoặc bài tập ở nhà
- Chuẩn bị các câu hỏi, bài tháo luận
~ Dụng cụ học tập: máy tính bỏ túi
Nội dung chỉ tiết học phần
«Bài 1: Giới thiệu (1 tiế)
«Bài 2: Các khái niệm cơ bản (3 tiếu
«Bài 3: Các loại thang đo (2 tiế)
«Bài 4: Thống kê mô tả (12 tiếp
œBài 5: Thống kê suy diễn (9 tiếp)
œBài 6: Kiểm định giả thuyết (3 tiét)
Trang 6
Nội dung chỉ tiết học phần
n Bài |; Giới thiêu (1 tiếp
ø Thống kê trong các nghiên cứu xã hội
= Ý nghĩa của phương pháp thống kê trong các
nghiên cứu khoa học xã hội
m Mục đích của việc sử dụng phương pháp thống
Bai 2: Cac khai niém co ban (t.t)
a Bién déc lap (independent variable)
a Bién phu thudc (dependent variable)
Thao tac hoa (operationalization)
Do ludng (measurement)
Bài 3: Các loại thang đo (2 tiết)
Thang đo danh nghĩa (norminal)
8 Thang đo thứ bậc (ordinal)
m Thang đo khoảng cách (interval)
m Thang đo tỉ lệ đatio)
Bài 4: Thống kê mô tả (12 tiết)
Trinh bay đưới dạng bắng (tables)
Mô tả dữ liệu thô (raw đata)
Phân bổ tần số (frequency distributions):
biểu dién dudi dang tf 1€ (proportion) va
phan tram (percent)
Phân bổ tan số lũy tiến (cummulative)
Bài 4: Thống kê mô tả (1)
= Mô tả độ tập trung của biến (central
tendency): yéu vị (mode), trung vi (median),
và trung bình (mean)
ø Mô tả độ phân tán của biến (dispersed
tendency): cách độ (range), phương sai (variance), độ lệch chuân (standard deviation)
Trang 7
Bài 5: Thống kê suy diễn (9 tiếp)
Kiểm định giả thuyết
Bài 5: Thdng ké suy dién (t.t)
> T-Test cho m4u phụ thudc (dependent sample t-test)
a Thiét lap gia thuyét (hypothesis)
Bài 5: Thống kê suy dién (t.t)
> T-Test cho mẫu độc lập (independent
Bai 6: Kiém dinh gia thuyét (3 tiét)
> Cho mối quan hệ giữa haibién dinhtinh (Chi-
square fest)
m Thidt lap gid thuyét (hypothesis)
a Cong thitc (formula)
# Giai thich (interpretation)
Thống kê cung cấp phương pháp:
n Thiết kế: lập kế hoạch và tiến hành nghiên
cứu
n Mô tả: tập hợp và khai thác dữ liệu
G Suy diễn: đưa ra những dự báo hay khái quát hóa hiện tượng từ việc phân tích dữ liệu
Trang 8
Thiết kế
q Giúp xác định phương cách tốt nhất để thụ
thập dữ liệu nghiên cứu
Œ Ví dụ, những yếu tố trong việc thiết kế 1 cuộc
nghiên cứu là xem xét làm thể nào để tiến
hành một cuộc điều tra, bao gồm xây dựng
bảng câu hỏi và chọn mẫu
Rete
Mô tả
œ Mô tâ và khai thác dữ liệu ~ bao gồm những cách thức tổng hợp và khai thác các đặc trưng của dữ liệu đã được đo lường
a Muc đích chính là xác định những số liệu rời
rạc, không có ý nghĩa và trình bày chúng trong một cách có ý nghĩa và có thể hiểu
Œ Bao gồm những cách để đưa ra các dự báo
dựa trên dữ liệu thu thập được
Hñ Những sự dự báo này được gọi là những suy
luận thông kê
Vai trò của máy tính trong thông kê
SPSS: Statistical Package for the Social Sciences
Một công cụ hữu hiệu để phân tích dữ liêu
Hoc cai gi?
O Cac khai niém co ban (basic concepts)
© Bién va Thang do (variable & measurement)
Một vài thống kê mô ta (descriptive statistics)
œ Kiểm định giả thuyết (hypothesis testing)
Tài liệu học tập
_thong keer
© Giáotrinh chính Tà
1 Thống kê ứng dụng trong linh Ỷ
tế xã hội Tác giả Hoàng Trọng
va Chu Nguyễn Mộng Ngọc, Nhà xuất bản thống kề, năm
2007
2 Thống kê trong nghiên cứu xã
hội Tác gia: Alan Agresti va *
Barbara Finlay Nha xudt ban s—
Prentice Hai, năm 1997 Sanne
Trang 9
Tài liệu học tập
ä Sách tham khảo
1, Giáo trìnhSP§§ Tác giả Đỗ Văn Thắng và_
Phan Thành Huân Nhà xuất bản Đại học Quốc
gia TPHCM, năm 2003
2 Phân tích đữ liện nghiên cứu với SPSS Tác
giả Hoàng Trọng và Chủ Nguyễn Mộng Ngọc
Nhà xuất bản thông kê, năm 2005
Đánh giá ra sao?
œ Thang điểm: 10
ñ Trong đó:
@ 30% kiểm tra giữa kỳ
+ Điện thưởng: 109% (nếu có)
+> Bài tập nhanh : Chuyên cân
a 70% kiểm tra cuối kỳ
œ Đưới 50% ~> điều gì xây ra?
2 Từ bạn bè/ sinh viên khóatrước
3 Tự tra cứu trên internet
4 Khác
Trang 10
CøNhững mong muốn đạt được của bạn khi học
môn Thống kê cho khoa học xã hội? t2
dùng để thu thập, xử lý và phân tích các con
số (mặt lượng) của những hiện tượng số lớn
để tìm hiểu bản chất và tính quy luật vốn có
của chúng (mặt chất) trong những điều kiện
thời gian và địa điểm cụ thể
Thống kê chía thành 02 lĩnh vực:
+ Thống kê mô tả:B ao gồm các phương pháp
thu thập, mô ta và trình bày số liệu;
Thống kê suy diễn: Bao gồm các phương
pháp như ước lượng, kiểm định, phân tích
QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ
XÁC ĐỊNH MỤC ĐÍCLL NỘI DỰNG, DỐI TƯỜNG
VẤN ĐỀ NGHIÊN CÚU
XÂY ĐỰNG HỆ THỐNG GÁC KHÁI MỆM, CHE TIEU THONG KE
DIEU TRA THONG KE
XỬ LÝ SỐ LIỆU: —_
“TẬP HỢP, SẮP XẾP SỐ LIỆU
CHON CAC PHAN MEM XU LY 96 LIRU
PHAN TICH THONG KỆ SƠ BỘ
THÂN TÍCH VÀ GIẢI THÍCH KẾT QUA
DỰ ĐOÁN XU HƯỚNG PHÁT TRIEN CỦA HIỆN TUGNG
VIỆT BẢO CÁO VÀ TRUYỂN ĐẠT KẾT QUÁ NGHIÊN COU
Các khái niệm cơ bản
_ Tổng thể (population): là tập hợp các phần
tử được quan tâm trong một nghiên cứu Nó
có thê hầu như là mọi thứ
Vị dụ: dân số Việt Nam, tổng thể sinh viên của
trường ĐH KHXH&NV hay tông số sinh viên của một Khoa
Trang 11
Các khái niệm cơ bản (t.t)
ñ_ Mẫu (sample): là tập hợp con của téng thé Vị dụ: Một công ty nghiên cứu thị trường tiễn
được chon ra để tiền hành thu thập dữ liệu hành khảo sát 650 người tiêu dùng để thu thập
nghiên cứu thông tin về thị hiểu dùng sữa của người dan
Khi mẫu duoc chon đảm bảo tính đại diện, sẽ thành phô HCM
Các khái niệm cơ bản (1.0 Các khái niệm co ban (t.t)
Hi Biến (variable): là tập hợp các đặc trưng và n Định đề (proposition): là một phát biêu về
giá trị được dùng đề chỉ một khái niệm môi liên hệ giữa các khái niệm
biến Giới tính: có hai giá trị nam và nữ; Xí du:
biến Tôn giáo: bao gồm Phật giáo, Thiên chúagiáo, Hút thuốc lá dẫn đến bệnh ung thư phổi, hay
Tin lành, Hòa Hảo, khác và không tôn giáo Quan hệ tình dục không an toàn đẫn đến nguy
Các khái niệm cơ bản (tt)
ci Biến độc lập Gndependent variable): là biến œ Vídụu, hút thuốc lá => biến độc lập
được dùng để giải thích cho nguyên nhân của ung thư phổi = biến phụ thuộc
một hiện tượng
œ_ Biến phụ thuộc (dependent variable): duoc giới tính => biến độc lập
coi là biển kết quả, nó chịu sự chỉ phối của lựa chọn ngành học ©Ð biến phụ thuộc
biên độc lập
Trang 12
Các khái niệm cơ bản (.t)
G Thao tac héa (operationalization):
Là một phương pháp để quan sát và ghỉ nhận
những khía cạnh của một cá nhân, khách thé,
hay một sự kiện có liên quan để tiến hành
kiêm định giả thuyết
Các khái niệm cơ bản (t.t)
Q Bo iwong (measurement): 1a cach thie gan
những con sô hay giá trị cho các quan sát
* Đối với biến đỉnh tính, những đặc trưng phân biệt
dựa trên sự khác biệt về đặc tính, chứ không phái vệ
số lượng hoặc độ lớn
“+ Các biến được gọi là đình lương khí mà các giá trị của biến cho thấy sự khác biệt về độ lớn hay số lượng giữa chúng,
Các loại thang đo
co Tương ứng với 02 loại biến định tính và định
lượng, có 02 loại thang đo chính:
> Thang đo biến số chữ:
+ Thang do danhnghia/dinh danh(Nominal scale)
+ Thang do thirbac (Ordinal scale)
>> Thang đo biến số số:
+ Thang đo khoảng (ntervabcale)
+ Thang đo tỉ lệ(Ratio scale)
Thang đo danh nghĩa (Nominal scale)
@ Thang đo danh nghĩa là loại thang đo định tính và thường được dùng tật rộng rãi với các tiêu thức thuộc tính mã các biểu hiện của nó là một hệ thống các loại khác nhau, như: Giới tính, khu vực địa lý, nghê nghiệp, tôn giáo,
Các con số trên thang đo không biển thị quan hệ hơn kém, cao thấp, nhưng khi chuyển từ số _ bay sang số khác thì dấu hiệu “do đã có sự thay đổi về chất
Trang 13
Thang đo danh nghĩa (Nominal scale)
ti Một biến đượcxác định bởi thang đo danhnghia bao
gôm hệ thông các chỉ báo khác nhau biểu thị thuộc
tính hay tính chất của biến đó
Œì Các chỉ báo này có tính chấtngang nhau và không
theo một thứ tư nào
0 Mét thang do danhnghia phải có 2 chỉ báo trở lên
Thang do thir bac (ordinal scale)
o La thang do danh nghĩa nhưng các chỉ báo hay các phương án trả lời được sắp xếp theo một trật tự
nhất định
Nói một cách khác, giữa các chỉ báo này có quan
hệ thứ bậc hơn kém, nhưng thường thì mức độ hơn kém giữa chúng không xác định được
Thang đo thứ bậc (ordinal scale)
HThanh đo thứ bậc thường được sử dụng cho các
đặc điểm thuộc tính, và đôi khi cũng được áp
dụng cho các đặc điểm số lượng
oThuéc đo độ tập trung là mode hay trung vị,
trung vị cung cấp nhiều thông tin hơn là mode
Ch úng ta cũng hay gặp loại thang đo này trong
các câu hỏi dạng so sánh
“
Ví dụ
a) Anh/chi/éng/bahay xếp hạng các chủ đề sau trên
báo Sài Gòn Tiếp Thị tùy theo mức độ quan tâm
(Chủ đề nào quan tâm nhất thì ghỉ số 1, quan lâm
thứ nhủ thì ghỉ số 2, quan tâm thứ ba thì ghỉ số 3)
- Thông tin thitrường
-Muasim aaa -Giađình —
Trang 14
Từ 1 triệu đến dưới 2 triệu na
Từ 2 triệu đến dưới 3 triệu Há
Từ 3 triệu trở lên Qs
fi Thu nhap cia anh/chi/éng/ba hangthang:
1.<3 triệu đồng 2.Từ3-5 triệu đồng 3 > 5 triệu đồng
Ví du (t.t)
O Kinh té gia đình so với 5 năm trước
Khá hơn rất nhiều HI
Kha hon chút đỉnh 2 Cũng vậy Hà
Té hon chit dinh B4
'Tệ hơn nhiều os
Thang do khoang (interval scale)
tLà thang đo có đầy đủ tính chất của một thang
đo danh nghĩa và thứ bậc, nhưng khoảng cách
giữa các chí số được xác định một cách cụ thể
và đều nhau
Đối với loại thang đo này ta có thể sử đụng một
sô các phép tính toán học như tính trung bình
hay tính toán tỉ lệ chênh lệch giữa các chỉ số
Thang do khoang (interval scale)
lai Dữ liệu thu thập từ thang đo khoảng có thể là mode,
trung vị và trưng bình cộng, trong đồ trung bình cộng chứa nhiêu thông tín nhất
n Điểm “không” củathang đo này là tùy ý
XD: Thang do nhiệt độ hôm nay là 12°C (53,6 °F) và hôm qua là 6° (42,8°F), Nhiệt độ hôm nay âm áp gấp đôi hôm qua ? Nêu
chuyên từ ®C sang °F thì tỷ lệ không con 14 2/1 (53,6/42,8)
Hơn nữa, nêu nhiệt độ là 0%C, không có nghĩa là không có nhiệt độ 0°C tương đương với 32°F đương nhiên là âm hơn 10°E
“
Thang do khoang (interval scale)
=> Nhu vay thang đo khoảng cho phép chúng ta đo
lường chính xác sự khác nhau giữa hai giá trị bất kỳ
(trong thang đo thứ bậc thì không thê)
Œ Ta hay gặp loại thang đo này trong các câu hỏi
phòng vân dạng đánh giá
Bạn có đồng ý hay không với nhận định: “Những
người có học vẫn cao sẽ có thu nhập cao ”
1 2 3 4 $ 6 7
tả thông sit ding y
Thang do ti Ié (ratio scale)
gThang đo tỉ lệ là thang đo dùng cho đặc tính số
lượng
nMột thang đo tỉ lệ có tất cả những phẩm chất của
những loại thang đo trước Ngoài ra thang đo này
có một giá trị 0 “thực”, cho phép lấy tỷ lệ so sánh
giữa hai giá trị thu thập
10
Trang 15
Thang đo tỉ lệ (ratio scale)
D Tương tự như thang đo khoảng, khuynh hướng trung
tâm của dữ liệu thu thập từ thang đo tỷ lệ có thể là
mode, trung vj và trung bình cộng, trong đó trung
bình cộng chứa nhiều thông tỉn nhất
f1 Sự khác nhau giữa thang do khoảng và thang đo ti
thường bị lẫn lộn vì hai điêm sau:
+ Điểm “0° trongthang đo tỷ lệ là một trị số thật
+ Trong thang đo khoảng, sự so sánh về mặt tỷ lệ
giữa các giá trị thu thập không có ý nghĩa
oNéu ban có 5 triệu đồng, anh của bạn có 10 triệu
động => Sô tiên của anh ban gap đôi số tiên của
bạn (kế cả quy đôi sang $, £, X, )
Nếu số tiền của bạn bị mất hay bị đánh cắp thì
bạn có 0 đồng Số 0 ở đây là giá trị that
=> Tiền tệ có trị số 0 là thật và loại thang đo ở
đây chính là thang đo tỷ lệ
Thang do Thang do Thang do Thang do danh nghia thứ bậc khoảng tỉ lệ
Các chỉ báo được Khoảng cách giữacác Gia te
CAP BAC BO LUONG VA THANG ĐO
+ Trong thực tế, vận đề thang đo phứctạp và trở nên
quan trọng hơn nhiêu vì:
> Chúng ta có thể áp dụng thang đo địnhtính đối với
đặc điểm sô lượng (thu nhập, chỉ tiêu)
> Ngược lại, có thể áp dụng thang đo định lượng đối
với các đặc điểm thuộc tính(đồng ý, không đồng ý)
=> Trong các trường hợp này, loại dữ liệu ta thu thập
được là tủy thuộc vào thang đo, chứ không phải tùy
thuộc vào tiêu thức thông kê đề thu thập đữ liệu
11
Trang 16œ Tiết kiệm thời gian và chỉ phí
d Các nghiên cứu căn cứ trên dữ liệu mẫu thực sự có tính đại diện thường tốt hơn nghiên cứu toàn bộ tổng,
thể,
a Kha nang sai sót khi điều tra nghiên cứu trên mẫu sẽ
thấp hơn so với khi nghiên cứu trên tổng thể, đồng
thời có thể tập trung các chuyên gia có trình độ vào nghiên cứu
Khung mẫu (Sampling frame)
{_ Khung mẫu là danh sách các đơn vị của tổng thể cần
nghiên cứu, cân thu thập dữ liệu
Đanh sách này còn được gọi là khung lấy mẫu hay
đàn chọn mẫu
q_ Các đơn vị tổng thể trong danh sách này có thể được
sắp xếp theo một trật tự nào đó, ví đụ như vẫn ABC,
theo quy mô, theo địa chỉ, và được gán cho một số
thứ tự từ đơn vị thứ 1 đến đơn vị cuối cùng
Các phương pháp chọn mẫu
1 Phương pháp chọn mẫu ngẫu nhiên:
> Chon mau ngẫu nhiên đơn giản;
+ Chọn mẫu ngẫu nhiên hệ thống;
+ Lấy mẫu cả khối/ cụm và lấy mẫu nhiều giai đoạn;
“> Lấy mẫu phân tầng
2 Lấy mẫu phí xác suất
Phương pháp chọn mẫu ngẫu nhiên đơn giấn
(Simple random sampling)
a La phuong phap chon mau trong dé méi đơn vị
của tổng thé được chọn với sự ngẫu nhiên như
nhau, hay nói cách khác là các đơn vị tổng thể
được chọn vào mẫu với cơ hội bằng nhau
+ Từ khung mẫu và số thứ tự từng đơn vị, thực hiện
việc lấy đơn vị mẫu ra bing nhiều cách như bốc
thăm, quay sô, hay dùng số ngẫu nhiên
+ Hỗ trợ từ phần mềm máy tính Exeel, SPSS Hoặc,
dùng cách lấy mẫu hệ thống
Phương pháp chọn mẫu ngẫu nhiên đơn giản
(Simple random sampling)
Papulation me
12
Trang 17
Phương pháp chọn mẫu ngẫu nhiên hệ thống
(Systematic sampling)
Trong mẫu ngẫu nhiên hệ thống, chỉ cần
chọn ra một con số ngẫu nhiên là có thể xác
định được tất cả các đơn vị mẫu cần lấy ra từ
danh sách chọn mẫu (thay vì phải chọn ra n số
ngẫu nhiên ứng với n đơn vị mẫu cần lấy ra)
Phương pháp chọn mẫu ngẫu nhiên hệ thống
(Systematic sampling)
œ_ Quy trình lấy mẫu hệ thống bao gồm các bước:
* Khung mu đã được đánh số thứ tự cho các đơn vị trong
danh sách, tổng số đơn vị trong danh sách là N
vˆ Xác định cỡ mẫu muốn lay, ví dụ n quan sat
Y Chia N đơn vị tống thể thành k nhóm theo công thức:
k= Nya, k duge goi 14 khoảng cách chọn mẫu
v Trong k đơn vị đầu tiên, ta chọn ngẫu nhiên ra một đơn vị, đây là đơn vị mẫu đầu tiên, các đơn vị mẫu tiếp theo được
lây cách đơn vị này 1 khoảng 14 k, 2k, 3k,
a Nhu vay có thể nói chọn mẫu hệ thống là phương
pháp chọn mẫu trong đó các đơn vị mẫu được chọn
ra cách nhau một khoảng là k đơn vị
‘Sample every #°)
Phương pháp chọn mẫu ngẫu nhiên hệ thông
(Systematic sampling)
a Có hai trường hợp chọn mẫu hệ thông:
# Trường hợp 1; Lấy mẫu hệ thống đường thẳng
(Linear systematic sampling) khi k 1a s6 nguyén
(N chia chan cho n)
Truong hop 2: Lay mau hé théng quay vòng {Circular systematic sampling) khi k là sô thập
phân (N không chia chan cho n)
Chon | sé ngẫu nhiên từ 1 đến 7:
> Néu số ngẫu nhiên được chọn là 2, thì các đơn vị lấy ra sẽ là: 2, 9, 16, 23, 30, 37, 44, 51, 58, 65
Trang 18
TH2: LẤy mẫu hệ thống quay vòng
a Khi tổng thể N không chia chẵn cho n mẫu thì các
đơn vị không có cùng Ì xác suất chọn ra như nhau
và khí dùng kết quả trung bình mẫu để ước lượng
trung bình tông thể thì rất có khả năng bị lệch
» Chọn mẫu hệ thống quay vòng
TH2: Lấy mẫu hệ thống quay vòng
Giá sử cần chọn ra n đơn vị mẫu từ tổng thể N, thứ tự các bước như sau:
» Tinh khoảng cách chọn mẫu:k =N/n
> Chon 1 số ngẫu nhiên trong khoảng từ | dén N, don vi
mẫu đầu tiên có số thứ tự với số đã được chọn ra,
> Các đơn vị tiếp theo cách đơn vị mẫu đầu tiên I khoảng
Ik, 2k, 3k,
>_ Nếu hết danh sách N đơn vị chưa đủ n đơn vị mẫu, ta quay
trở lại từ đầu danh sách với quy ước: N + l tương đương
với đơn vị thứ nhật; N + 2 tương đương với đơn vị thứ hai trong danh sách
Lay 1 số ngẫu nhiên trong khoảng từ 1 đến 13,
ví dụ chọn được số 6, các đơn vị mẫu tương ứng sẽ là:
6,9, 12, và [(12+ 3)— 13]=2
Cách tính:Khí số thứ tự lớn hơn N thị
Số thứ tự chọn mẫu = Số thứ tự - N
Lấy mẫu cã khối/ cum (Cluster sampling)
va lay mau nhiéu giai doan (Multi-stage sampling)
a Chon miu cả khối/cụm hay chọn mẫu nhiều giai
đoạn giúp chúng ta vượt qua điều kiện đầu tiên của chọn mẫu ngẫu nhiên là phải có danh sách
các đơn vị chọn mẫu/ khung chọn mẫu ngay từ đầu
Đầu tiên, tổng thể được chia thành nhiều cum, mỗi cụm xem như lä một tổng thể con, lấy ngẫu
nhiên đơn giản m cụm, sau đó khảo sát hết các đối tượng trong các cụm mẫu đã được lấy ra
Lấy mẫu câ khối/ cụm (Cluster sampling)
va lay mau nhiéu giai doan (Multi-stage sampling)
_ Lay mau ca khdi/ cum (Cluster sampling)
va lây mẫu nhiêu giai doan (Multi-stage sampling)
a Do cụm mẫu thường được chọn các yếu tế như: vị
trí địa lý, các tô chức, đơn vị xã hội, các cụm dân cư, Sau khi có danh sách các cụm, tiến hành chọn ngẫu nhiên để xác định các cụm đại diện, sau đó chọn ngẫu thiên các phan tk trong mdi cum để lập danh sách mẫu nghiên cứu Cứ tiếp tục như vậy chúng ta có chọn mẫu nhiều giai đoạn
Trang 19
Lấy miu phan tang (Stratified sampling)
a Chon mau phân tầng được sử dung khi chúng ta đã
biết thông tin về tổng thể dân số trước khi chọn mẫu
a Để bất đầu, tất cả những phần tử của tổng thể sẽ
được phân biệt theo những đặc tính của chúng, và
được xếp vào từng tầng khác nhau Tiếp theo, các
phân tử sẽ được chọn ngẫu nhiên theo các phân tầng
đó
Lấy mẫu phân tầng (Stratified sampling)
Ví dụ: Một trường ĐH có 1⁄4 nữ và 1⁄4 nam, vậy mẫu được chọn cũng sẽ có tỷ lệ tương tự
Lấy mẫu phân tầng
n VD Tại một trường ĐH có 20.000 SV ở 5 hệ dao
tạo và cấp đào tạo khác nhau, để khảo sát về chất
lượng và mức độ hải lòng của sinh viên.Mỗi hệ đào
tạo cử nhân và cấp đào tạo cao học được coi 1a 1
tang
ao Số lượng dự định lây là 1000 (5% của tông thổ),
_ nếu phân bê mẫu vào từng tầng theo tỷ lệ thì kết
quả như trong băng sau:
Lấy mẫu phân tầng
a
Lấy mẫu phí xác suất (Non-probability sampling)
Trong thực tế, nhiều khi chúng ta không có thời
gian, thông tin và chỉ phí để thực biện lấy mẫu
ngẫu nhiên —» Lấy mẫu phí xác suất (hay mẫu
phi ngẫu nhiên)
MẪU phí xác suất không đại diện để ước lượng
cho toàn bộ tông thể, nhưng được chấp nhận
trong nghiên cứu khám phá và trong kiểm định
giả thuyết
Lấy mẫu phi xác suất (Non-probabiliy sampling)
Oo Lấy mẫu thuận tiện (convenient sampling)
- Mẫu thuận tiện được dùng khi bạn muốn có một
ước lượng sơ bộ về kết quả bảng câu hỏi bạn quan tâm mã không muốn mất nhiều thời gian và chỉ phí,
- Cần suy nghĩ kỹ về thời gian, địa điểm hay hoàn
cảnh mà ta sẽ gặp đối tượng và thu thập dữ liệu ở đó
(không tùy tiện, ngẫu hứng)
Ví dụ: Vấn đề sv quan tâm trong trường ĐH hiện nay; Hay vấn đề du lịch, giải trí của phụ nữ ở tầng
lớp trung lưu ở đô thị lớn
15
Trang 20
Lay mau phí xác suất (Non-probability sampling)
o Lay mau định mire (quota sampling)
-LÁ y mẫu định mức tương tự như lấy mẫu xác suất
phân tang (phan chia tổng thê thành các tầng — tổng
thể con) Điểm khác biệt cơ bản là trong từng tổng
thể con người phỏng vấn được chọn mẫu tại hiện
trường theo cách thuận tiện hay phán đoán, trong khi
mẫu phân tang chọn ra theo kiểu xác suất
Vị du: Lấy mẫu 400 người lớn tại Tp, người NC có
thể quyết định 50% nam ~ nữ; trong đó 1⁄2 trên 40
tuổi;⁄2 là lao động tự đo,
Lấy mẫu phi xác suất (Non-probability sampling)
o Lay mau phan don (Judgement sampling) Bạn chính là người quyết định sự thích hợp các đối tượng để mời họ tham gia vào mẫu khảo sát, do
đó tính đại diện của mẫu khảo sát thực tế sẽ phụ thuộc nhiều vào kiến thức và kinh nghiệm của người nghiên cứu điều tra mà còn phụ thuộc vào những người thu thập đữ liệu trực tiếp
e: mức sai số mong muốn (tính bingty 1é %
từ công thức [1- độ tin cậy giả định])
Nếu không biết quy mô tổng thế?
3 Trong nhiều trường hợp, éu ta không biết trước được một cách cụ thê quy mô của tong thé © rat kho chon được
mẫu xác suất,
_ Trong tình huỗng này, người ta thường ước lượng kích
cỡ mẫu, sau đó tùy theo mà chọn tỷ lệ phù hợp (1%, 2%,
54 hay 10% của tông thể)
œ_ Để đảm bao cho phép thực hiện các tính toán thống kê thì
dung lượng mẫu tôi thiểu phải là 30 đơn vị,
Q Néu khong biết được quy mô tổng thể, đương nhiên sẽ không kiểm soát được mức sai số mẫu
Đầu * cho thầy là giã định về phân bố bình thường thấp,
đo đó không thể áp dụng công thức tính trong các trường hợp trên
Thực hành
œ Nhận biết thang đo của những câu hỏi sau đây:
Câu L: So với 5 năm trước, đời sống gia đình ta có tốt hơn không?
Khá hơn BI Khó trả lời 4 Cũng vẫn nhưthế 2 Không trả lời 99 Kém hơn trước v13
Trang 21
Câu 2: Xin Ông (Bà) vui lòng cho biết để dùng sinh hoạt hiện có
tong gia dinh (kém theo quan sát, nếu thấy nhường gì hiển nhiên
không có, không nêu hải)
Loai dé ding Loại đồ dùng
- Tỉ ví màu C7 - May giat 117
- Đầu máy video [l8 - Điện thoại D1
Câu 4: Trong các phương tiện TTĐC trên, Ông (Bà) thích loại
nào nhất ? (không tính: đến việc có thường xuyên xem lay
Câu 5: Trong các tờ báo đã đọc, Ông (Bà) thường đọc những mục
gì nhấU (Chỉ chọn tối đa 3 mục tường đạc nhất)
Các mục í
Câu 6: (Chỉ hồi những người có nghe radio) Ông (Bà) thường
nghe radio như thế nào?
© Thường nghe hấu hết tất cỉ các chương trình 8L
© *nghe, nên lúc eink gip cdi gì nghe cái đấy œ
© Luôn nghe chương trình quan tím nhất Ø Câu.7: Trong các chương trình truyễn hình, Ông (Bà) thường coi chương trình nào nhiều nhất ? (Cñl chọn tối đa 3 mục thường xem nhấU
C4u 8: Trong các loại hình nghệ thuật nói chung, Ông (Bà)
thích loại não?%(bao hàm cễ trên các PTTTĐC và sân khẩu)
Chọn tối đa 3 loại hình thích niưất rồi chọn thứ tự ta
- Ca khúc hiện đại Ủ -LajiMiếc
Câu 16: Và theo Ông (Bà), người Raglay ta cẩn phải học đến lớp mấy thì mới được?
Lớp: được đến đâu hay đến đấy 19
Câu 11: Nhưng trên thực tế gia đình ta có thể cho con cái học
Trang 22
Câu 12: Theo ông bà, có cần dạy chữ viết của người Raglai
cho người Raglai hay không?
Câu 13: Nếu trong gia đình không có điều kiện cho tất cả
các con đi học ,, theo ông bà nên ưu tiên cho con trai hay
14: Theo ông bà, khi rong nhà có người bị bệnh có
cần mời thây cúng đến cóng để được khỏi bệnh không?
(PVV không gợi ý, nếu người được phông vấn khó trẻ lời
thì nêu các phương pháp có thổ)
1 Nhất thiết phải mới ĐI
3 Mời cũng được, không mới cũng dược — f2
3 Không cần thiết phái mồi os
4 Không biết ti
5 Khó (Không trả l8) B5
ó Tự những người kết hôn quyết định 86
Câu 18: Trước khi kết hôn có cần xem tuổi cô dâu, chủ rể
Câu 19: Khi phụ nữ mang thai, họ có cần kiêng cữ điều gì
không? (rong sinh hoạt, ăn uống)
1,Có on
3, Không, m
3 Khả trổ li t5
Câu 230: Trước khi lập gia đình, người con trai, con gái có được ai
đồ giải thích, hướng đẫn những điều cần thiết khí lập gia đình
không? (Có thể chọn nhiều ý, PVV không đọc các phương án trả lời)
5.Anh, chị ts 10.Không aì cố 010
Câu 2: Trong gia đình Ông (Bà) ai là người quyết định những việc sau xác định mức quyết định của mỗi thành viên bằng những con số rôi viết vào cắc cột tưởng ông sao cho tổng mức qugết định = 10 phẫu )
Loại việc Mức để quyết | Mdcdé Ì Thành
định của quyếi -Í viêo khúe chứng đình của j (nhi rổ]
IS? aa
3 hay aa nd etfs
5, Những quyết định có liển quaa đếu sức
, Mua các 46 ding dit rida (TY, xe
a cửa con ea)
Trang 23Câu 22: Ông (Bã) hãy cho biết đánh giá của mình về những
nhận định dưới đây (khoanh vào ô tương ứng sao cho hàng
nào cũng có mã số được khoanh và không trùng nhau)
3 cing vide cba dens neat ghey we t 2 5
+ ig duit ohn oc sự vs sẽ cây ngyời chong † 2 3
8` | Phụ nữ không nôn Đam gia vàocông việc của thôn sốma,đe| 1
là Việc của đàn ông
CAu 24: Bay giờ tôi sẽ đọc tên các mối quan hệ mã chúng ta
thường có Ông (Bà) hãy lắng nghe và cho chúng tôi biết mức
độ quan trọng của từng mối quan hệ đối với Ông (Bà)
(Hãy gại ý để người trề lài xác định mỗi quan hệ quan trọng nhất rồi nói:
cầu trong những quan kệ còn lại, cái nào quan trọng nhất? Khi có câu trễ
tòi, khoanh tròn th tự theo tăng hằng)
Tàn kòn không đất quan
quan trọng Trọng,
1 Quan bệ trong ga định 123456789 0
3 Quan hệ vội bà con bọ làng 1 2 3 4 5 6 7 6 9 10
3 Chữa bệ với bạu bờ 123456789 0
4 Quan hệ với đồng nghiệp 1 3 3 4 5 060 7 8 9 10
5, Quan hệ với làng xòm, 123456789 10
6 Quan hệ v6iedlp ken 12343 67 8910
Câu.25: Bà con trong cộng đồng có thường đến thăm nhà Ông (Ba) hay không?
106 8!
2 Không G2 *> chuyển qua cầu 26
Câu 26: Nếu có hãy cho biết mức độ họ đến thăm của họ
Câu 27: Ông(Bà) có thể mô tả người láng giêng ở sát
bên nhà mình như thế nào?
3/Cơi như người trong gia định 1 4 3Nhữ những ngỪii xalg 04
Câu 28: Khi trong nhà có người bị bệnh, thông thường gia đình
Ông (Bà) thường làm thế nào để họ khối bệnh? (chọn một
phương án thường xuyên nhất)
sit Điện gháp
1 Ra mamxd kha byob ue
2, Ra bdi bieu inte a
3 Tehva bbag drut cam oF
4 MỡHhầy đến cúng cà
5 Khối không trẻ le) 05
Câu 29: Ông (Bà) có biết các loại lễ hội từ trước tới nay do
cộng đồng mình tổ chức hay không? (kể câ những lỄ hội, ngày nay không còn tổ chúc nữa)
Trang 24
Phan 1
Thong ké m6 ta (Descriptive statistics)
Théng kê mô tả là phương pháp liên quan
đến việc tổ chức, tổng hợp và trình bày số liệu
thu thập được từ mẫu nghiên cứu hoặc tổng thê
pháp thống kê là để tổng hợp và mô tả dữ liệu,
làm cho thông tin được trình bày rõ ràng hơn
PP thống kê mô tả dudi dang bang
© Phan phối tần suất: 1 bảng trình bày số lần
xuất hiện của một hay nhiêu giá trị được quan
sát trong mẫu hoặc tông thê
PP thống kê mô tả dudi dang bang
cl Các kiểu phân phối tần suất
Phân phối tần suất
Ø Một số ky higu str dung trong tính toán phân
phôi tân suất
v n= téng sé mẫu quan sat
v x= bién
¥ i gid trị (thành phần) của biến X
v ,# = tân suất quan sát của giá trị thứ ¡
Phân phối tần suất (t.t)
œ Các thành phần (giá trị) của biến phải:
Trang 25
Phân phối tần suất (t.9
= Bảng phân phối tần suất nên bao gồm:
ø_ Tiêu đề môtả nội đụng của bảng
a Tên biến
Nhân giá trị cho các thành phần biến
œ_ Tổng các quan sát của mẫu
ø Khai báo nguồn đỡ liệu
a
1 Bảng phân phối tần suất thô
Bang 1, Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọt thích Số đếm được "Tần suất
(Tally) (Frequency) 1.Coca - Cola 4 4 2.Pepsi 2 2 i.Khac 24 24
2 Bảng phân phối tần suất liên hệ
Bang 2 Loại nước ngọt ưa thích của sinh viên lớp TKXH
Loại nước ngọtthích Tầnsuất-fí Tilệ-pi Phan tram-%i
(frequency) (proportion) (percent)
3 Bảng phân phối tần suất lũy tiến
Bảng 3 Loại nước ngọt ưa thích của sinh viên lớp TKXH
Trang 26
Dap án thử tài
Bảng phân phối tần suất thế hiện tâm trạng khi học TKXH:
Tâm THE trăm trăm
5 Bang phân phối tần suất cho biến có
thang đo khoảng - tỉ lệ
Bảng 5.:Danh sách sinh viên lớp TK04 với điểm trung bình chung năm học
Bang 5.2: Phân bố tần suất điểm trung bình chung năm học của
SV lop TK04
SV _ ĐiểmTR sv Diém TE sv Điểm TR
Diém TB chung “Tân suất Phan trim
(s6 sinh vién) (%) 50-55 1 33
56 ~- 60 2 6,7 61~65 8 267
66 ~ 70 12 400 71-75 5 16,6
76 ~ 80 2 67
Téng 30 100,0
Nguôn: Khảo sát lớp hẹc T04, thang 11, 2007 Nguân: Khảo sắt lớp hoc TKO, tháng 11, 2007
18
© Kiéu phan bé tan sudt trong vi du tir bang 5.2
là kiêu phân tổ theo kinh nghiệm
Ø Trong thực tế, khi gặp đạng dữ liệu nhiều biéu
biện người ta có quy tắc đề tiền hành phân tổ
=> Phương pháp phân tổ dữ liệu
Phương pháp phân (ỗ dữ liệu
1 Khi phân tổ dữ liệu, tùy theo mục đích thể biện đữ liệu cũng như phân bố đều đặn hay không đều dan
của dữ liệu mà có thể tiến hành phân tổ đều hoặc
phân tổ không đều
œ Khái niệm đều hoặckhông đều liên quan đến khái
niệm khoảng cách của tô
Chênh lệch giữa giới hạn dưới và giới hạntrên là trị
số khoảng cáchtô
2
Trang 27
Các bước của thủ tục phân tổ
n Xác định số tổ cần chia:
Không có một con số quy định chính xác con
sô cân chia là bao nhiêu, nhưng theo kinh
nghiệm người ta thây nên chia trong khoảng
Căn cứ trên số tổ định chia, người ta xác định
trị sô khoảng cách tô theo công thức như sau:
Với: Xu„„„ X„„ là giá trị lớn nhất và nhỏ nhất
của tập đữ liệu; k là số tổ định chia
Các bước của thủ tục phân tổ
O Xác định giới hạn dưới và giới hạn trên của
các tô:
Tổ thứ nhất: Q„ÿ Xuuyth)
Tổ thứ hai: (X„u£h; Xu jsth th) = Q irth; Xuu„t2h)
Té ther ba: (Nyigth, Xpict2h +h) = (Xpigt 2h; Xpit 3h)
"
Phân tổ cho báng đữ liệu 5.1
DIEMTB TAN SUAT PHAN TRAM (%)
55-61 3 10,00
61-67 40 33,33 67-73 1+8 43,34
Dữ liệu của miột mẫu điều tra nhỏ vềđộ tuổi của30
sinh viên hệ VLVHnăm Ï như sau:
Phân tê dữ liệu
6 Dé bang tin số dam bao tinh khoa học, chúng ta tiến hanh phan tich tô đữ liệu rôi mới lập bangtan so
Trang 28
Phân tổ dữ liệu
B3 Xác định giới hạn dưới và trên của các tô:
Với h = 5, ta xác định cận trên và đưới các tổ lần
lượt như sau:
Độ tuôi (tuôi)Số SV
19~24 9 24~29 10 29~34 §
34 trở lên 3 Tông 30
Một số điều kiện phải tuân thủ khi
tiên hành phân tô
œ Các tổ không được trùng nhau, để cho một quansát bắt kỳ chỉ thuộc về một tổ
œ1 Tất cả các tổ được phân chia phải bảo đảm bao quát
hết tất cả các giá trị hiện cócủa tập đữ liệu
œ_ Tránh không để tả rỗng do không có quan sát nào
VDI Khảo sát mức độ thường xuyên đọc tài liệu chuyên
ngành, kết quả ghỉ nhận như sau: (Nguồn: Thông kê lớp 02)
Mức độ “Tần suất % 3% lũy tiến