Chọn mẫu: Chọn mẫu là việc lấy một số phần tử của một tổng thể để nghiên cứu và từ đó, rút ra được kết luận về chính tổng thể đó.. Mẫu Là một tập hợp nhỏ những phần tử lấy ra từ một tổng
Trang 11 Các khái niệm cơ bản về chọn mẫu
1.1 Chọn mẫu:
Chọn mẫu là việc lấy một số phần tử của một tổng thể để nghiên cứu và từ đó, rút
ra được kết luận về chính tổng thể đó
Điều này có nghĩa khi nghiên cứu một tổng thể nào đó, ta không nghiên cứu toàn
bộ tổng thể mà chí nghiên cứu một bộ phận của tổng thể Và cách để người nghiên cứu tìm ra bộ phận đó chính là chọn mẫu
VD: Khi nấu canh, sau khi nêm nếm, ta sẽ thử một muỗng nhỏ để biết nồi canh đó
đã vừa miệng hay chưa
Chọn mẫu hay còn gọi là lấy mẫu là một công việc phải tiến hành một cách khoa
học và mẫu được chọn phải có đủ những tính chất điển hình của tổng thể Việc
lấy mẫu sai sẽ dẫn đến việc ta có những nhận định sai về tổng thể mà ta nghiên cứu, hậu quả sẽ hết sức nguy hại
VD: Nghiên cứu số lượng thịt trung bình người dân TPHCM tiêu thụ trong một tháng nhưng lại đi chọn mẫu là người ăn chay thì sai hoàn toàn.
1.2 Tổng thể
Tổng thể là tập hợp tất cả các đối tượng nghiên cứu mà nhà nghiên cứu cần nghiên cứu để thỏa mãn mục đích và phạm vi nghiên cứu của mình Chính vì vậy việc xác định số lượng và thu thập dữ liệu của tổng thể là một việc khó khả thi
Trang 2Vd: Nhãn hàng Bobby muốn nghiên cứu chi tiêu trung bình của các hộ gia đình có con nhỏ dành cho tã bỉm hàng tháng trên địa bàn TPHCM Vậy tổng thể sẽ là tất cảcác gia đình có con nhỏ trên địa bàn TPHCM.
Vd: Nhà nghiên cứu xác định đối tượng nghiên cứu là người tiêu dùng tại TpHCM
có độ tuổi từ 18 đến 40 Vậy tổng thể là toàn bộ những người sinh sống tại Tp HCM trong độ tuổi từ 18-40
Các loại tổng thể:
Tổng thể bộc lộ là tổng thể mà trong đó bao gồm các đơn vị mà ta có thể
trực tiếp quan sát hoặc nhận biết được (VD: Tổng thể các thương hiệu cà phê trên địa bàn TPHCM)
Tổng thể tiềm ẩn khi xác định tổng thể, nhà nghiên cứu có thể gặp trường
hợp các đơn vị tổng thể không thể trực tiếp quan sát hoặc nhận biết được Tổng thể tiềm ẩn thường gặp trong các nghiên cứu về các hiện tượng, hành
vi (VD: Tổng thể những người có thói quen đi ngủ trước 12g)
Tổng thể đồng chất là tổng thể bao gồm các đơn vị giống nhau ở một hay
một số đặc điểm, chủ yếu có liên quan trực tiếp đến mục đích nghiên cứu
Ngược lại là tổng thể không đồng chất nếu các đơn vị trong tổng thể không
giống nhau về những đặc điểm chủ yếu liên quan đến mục đích nghiên cứu
(VD: nhà nghiên cứu muốn nghiên cứu hiệu quả truyền thông của các doanh nghiệp trên địa bàn Hà Nội, vậy tổng thể các doanh nghiệp cung cấp dịch vụ
Trang 3ăn uống gọi là đồng chất còn tổng thể tất cả các doanh nghiệp là không đồngchất)
1.3 Mẫu
Là một tập hợp nhỏ những phần tử lấy ra từ một tổng thể lớn, người ta sẽ nghiên cứu những mẫu đó để tìm ta các đặc trưng của mẫu Các đặc trưng mẫu được sử dụng để suy rộng ra các đặc trưng chung của tổng thể do nó làm đại diện
VD: Nhà nghiên cứu chọn 100 liều vaccine trong lô vaccine Sinopharm để làm mẫu kiểm tra chất lượng của tất cả vaccine
VD: Khung chọn mẫu của lô giày thể thao ra mắt trong chiến dịch “Đi để trở về” của thương hiệu Biti’s Hunter: Thấm hút mồ hôi tốt; êm chân; hợp túi tiền của người tiêu dùng; đế giày bền;
2 Lợi ích và hạn chế việc chọn mẫu
Lợi ích
Tiết kiệm được thời gian và chi phí so với tổng điểu tra
Làm giảm sai số phi chọn mẫu (sai số do cân, đo, khai báo, ghi chép)
Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê
Cho phép thu thập nhiều chỉ tiêu thống kê ,đặc biệt với các chỉ tiêu có nội dung phức tạp, không có điều kiện điều tra ở diện rộng
Tổng thể nghiên cứu quá rộng, phân bố rải rác, và khó tiếp cận
Việc kiểm tra hay khảo sát đôi khi làm hủy hoại hay thay đổi mẫu khảo sát,
do đó không thể thử nghiệm toàn bộ mà chỉ thử nghiệm một mẫu nhỏ
Trang 4Ví dụ: Quá trình điều tra gắn liền với việc phá huỷ sản phẩm như điều tra đánh giá chất lượng đồ đóng hộp, đánh giá chất lượng đạn dược, y tá phải lấy máu của bệnh nhân xét nghiệm Trường hợp trên, nếu điều tra toàn bộ thì sau khi điều tra toàn bộ sản phẩm sản xuất ra hoặc lượng máu trong cơ thể bệnh nhân bị phá huỷ
Hạn chế
Tồn tại "Sai số chọn mẫu“
Bao gồm: Lập báo cao không chính xác, người phỏng vấn chỉ dẫn, hoặc giải thích các hướng dẫn sai; ghi chép không đầy đủ, Lý giải sai các vấn đề cho dùng từ ngữ mập mờ,…
Kết quả cuô nc nghiên cứu không thể tiến hành phân nhỏ theo mọi phạm vi và tiêu thức nghiên cứu như điều tra toàn bộ
Giải thích tấm hình:
Có 2 loại sai số khi nghiên cứu là: sai số lấy mẫu và sai số không lấy mẫu ( sai số ngoài sai số lấy mẫu ) Sai số lấy mẫu liên quan tới sự khác biệt giữa kết quả ta thu được trên mẫu so với trên tổng thể, là liên quan tới tính đại diện của mẫu Nghĩa là
ta chọn mẫu càng đại diện cho tổng thể thì sai số càng nhỏ , ta chọn mẫu càng ít đại diện cho tổng thể thì sai số càng lớn Sai số liên quan tới phương pháp và kinh nghiệm lấy mẫu Nhìn hình nè
Trang 5Giải thích tấm hình : hình này minh họa 2 loại sai số là sai số lấy mẫu và sai số không lấy mẫu , thì khi ta tăng kích thước lấy mẫu dần lên thì ta thấy có xu hướng sai số lấy mẫu càng giảm , và khi ta lấy kích thước mẫu bằng với tổng thể điều tra thì sai số lấy mẫu lúc này bằng 0 Và nhìn hình thì sai số không lấy có xu hướng tăng thi ta tăng kích thước lấy mẫu Do đó nên lựa chọn kích thước mẫu phù hợp
Trang 6Chọn mẫu xác suất Chọn mẫu phi xác suất
Ưu điểm Tính đại diện cao Khái quát hóa cho tổng
thể
Tính đại diện thấp
Nhược điểm Tốn kém chi phí và thời
gian Tiết kiệm thời gian và chi phí
Phạm vi áp dụng Nghiên cứu mô tả
Nghiên cứu định lượng
Nghiên cứu thăm dò
Nghiên cứu định tính
3.1 Phương pháp chọn mẫu theo xác xuất
Chọn mẫu theo phương pháp ngẫu nhiên đơn giản
Trong phương pháp chọn mẫu ngẫu nhiên đơn giản, các phần từ đều có xác suất tham gia vào mẫu biết trước và như nhau Để đảm bảo tính ngẫu nhiên, có thể quay
số, hoặc chọn ngẫu nhiên bằng phần mềm máy tính
– Để chọn một mẫu ngẫu nhiên đơn bạn cần:
B1: Lập danh sách toàn bộ những đơn vị trong quần thể từ đó bạn muốn rút ra mộtmẫu
B2: Đánh số thứ tự các cá thể
Trang 7Vd: Kiểm tra chất lượng sản phẩm trong dây chuyền sản xuất hàng loạt.
Ưu điểm: đơn giản, dễ thực hiện, tính đại diện cao; Có thể lồng vào các kĩ thuật chọn mẫu khác
Nhược điểm: Cần phải có khung mẫu; Các cá thể được chọn vào mẫu có thể phân
bố tản mạn trong quần thể, do vậy việc thu thập số liệu tốn kém và mất thời gian
Chọn mẫu theo phương pháp hệ thống
Là chọn mẫu mà mỗi đơn vị mẫu được chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã được sắp xếp sẵn của tổng thể chung
B1: Chuẩn bị danh sách đơn vị lấy mẫu
B2: Tính bước nhảy (khoảng cách) k dựa vào N và n (k= N/n)
B3: Chọn ngẫu nhiên mẫu đầu tiên
B4: Lần lượt lấy các mẫu tiếp theo dựa vào bước nhảy
Trang 8Vd: Nhà nghiên cứu cần chọn 2000 hộ gia đình tại TpHCM để nghiên cứu về chi tiêu của hộ
Có danh sách theo thứ tự vần của tên chủ hộ, bao gồm 240.000 hộ
Vậy khoảng cách chọn là :
k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu
Ưu điểm: giúp khắc phục được khả năng phân bố không đều ở phương pháp ngẫu nhiên đơn giản
Nhược điểm: nếu khung mẫu được xếp theo chu kỳ và tần số của nó thì mẫu sẽ bị lệch
Chọn mẫu theo phương pháp phân tầng
Là phân chia tổng thể thành các nhóm theo một tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu ( nói đơn giản hơn là chia các cá thể của quần thể thành các nhóm riêng lẽ )
Trong từng nhóm , dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu
Tỷ lệ mẫu lấy trong từng tổ bằng với tỉ lệ của tổ đó trong tổng thể
Tầng có thể chia theo : khu vực địa lý Bắc Trung Nam, giới tính, tuổi, nghề
nghiệp.,,
Trang 9Vd: để khảo sát nguy cơ gây bệnh Tiểu đường tại Việt Nam, nhà nghiên cứu có thể phân chia tầng theo người thành thị và người nông thôn
Phương pháp này có tính phân bố cao trong thị trường nghiên cứu, hiệu quả thống
kê cao do các phần tử trong cùng nhóm có tính đồng nhất, ít tốn kém
Chọn mẫu theo phương pháp chọn theo nhóm
Nhà nghiên cứu chia đám đông thành nhiều nhóm Nhưng các phần tử trong cùng nhóm có tính dị biệt cao và khác nhóm thì đồng nhất cao Nghĩa là cùng nhóm dị biệt khác nhóm đồng nhất Sau đó dùng phương pháp hệ thống hoặc ngẫu nhiên đơn giản để chọn ngẫu nhiên một số nhóm
Vd: Chọn mẫu nhóm trong xác định tỉ lệ bao phủ tiêm chủng trẻ dưới 5 tuổi của tỉnh Quảng Bình
Chọn mẫu theo nhóm một bước: tất cả phần tử trong các nhóm sẽ tạo thành phần tửcủa mẫu, kích thước mẫu là tổng phần tử các nhóm đã chọn
Chọn mẫu theo nhóm hai bước: sau khi chọn nhóm chúng ta lại tiến hành chọn phần tử tham gia vào mẫu
Tương tự ta có chọn mẫu theo nhóm 3 bước, 4 bước,
Vd: Chọn 7 vùng sinh thái ở Việt Nam, chọn 1 tỉnh ở mỗi vùng sinh thái, chọn 1 huyện ở 1 tỉnh , chọn 1 xã ở 1 huyện, chọn 1 thôn ở một xã, chọn 200 hộ gia đình
ở mỗi thôn theo cỡ mẫu
Ưu điểm: Chi phí thấp, xác định được đặc điểm của cả cụm và quần thể
Nhược điểm: Sai số lớn hơn so với các phương pháp ngẫu nhiên khác
Trang 104.2 Các phương pháp chọn mẫu phi xác suất
Chọn mẫu theo phương pháp thuận tiện
Trong phương pháp chọn mẫu thuận tiện, nhà nghiên cứu có thể chọn những phần
tử nào mà họ tiếp cận được
Vd: Chọn mẫu có kích thước n= 200 từ thị trường TPHCM, cả nam và nữ có độ tuổi từ 18 đến 40, tầng lớp có thụ nhập trung bình Trong phương pháp thuận tiện, bất kỳ người nào đồng ý tham gia khảo sát đều nhận vào mẫu
Chọn mẫu theo phương pháp phán đoán
Cách lấy mẫu tùy theo phán đoán phụ thuộc vào kiến thức và kinh nghiệm của nhà nghiên cứu Chỉ áp dụng khi các đặc tính của phần tử được chọn khá rõ ràng.Vd: một phần tử nào đó thuộc thị trường nghiên cứu (thị trường TPHCM, cả nam
và nữ có độ tuổi từ 18 đến 40, thu nhập trung bình) Nếu phần tử đó được nhà nghiên cứu đoán rằng có thể đại diện cho đám đông thì sẽ được mời tham gia vào mẫu
Vd: Nhân viên phỏng vấn được yêu cầu đến các trung tâm thương mại chọn các phụ nữ ăn mặc sang trọng để phỏng vấn Như vậy phỏng vấn viên không có tiêu chuẩn cụ thể “thế nào là sang trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần phỏng vấn
Chọn mẫu theo phương pháp phát triển mầm ( tích lũy nhanh )
Trang 11Chọn ngẫu nhiên một số phần tử cho mẫu, sau đó thông qua các phần tử ban đầu hỏi ý kiển những người này để họ giới thiệu những phần tử khác cho mẫu.
Vd: nghiên cứu thị trường dụng cụ chơi golf tại TP.HCM, nhà nghiên cứu chọn một số người biết chơi golf (chọn mầm) và thông qua những người này tìm những người chơi golf khác (phát triển mầm) tham gia vào mẫu
Áp dụng cho nghiên cứu đặc biệt, mẫu khó tìm hoặc khó tiếp xác định
Chọn mẫu theo phương pháp định mức ( theo lớp )
Dựa vào các đặc tính kiểm soát xác định trong đám đông để chọn số phần cho mẫu sao cho chúng có cùng tỉ lệ của đám đông theo các thuộc tính kiểm soát này
Vd: Cần phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố Phân tổ theo giới tính và tuổi như sau: chọn 400 người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn 400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên
Xin chào tất cả mọi người , mình là Ni Na và mình sẽ cùng các bạn đi vào tìm hiểu mục
4 Quy trình chọn mẫu
Thì như đã nói ở trên Chọn mẫu là quá trình chọn lựa một bộ phận tương đối nhỏ
từ một tổng thể , mang tính cách đại diện cho tổng thể nghiên cứu bao gồm 5 bước:
- Bước 1 : Xác định tổng thể nghiên cứu ( N )
- Bước 2 : Xác định khung chọn mẫu
- Bước 3 : Xác định kích thước mẫu ( n )
- Bước 4 : Lựa chọn phương pháp lấy mẫu : xác suất hoặc phi xác suất
Trang 12- Bước 5 : Viết ra các chỉ dẫn để nhận ra và chọn các phần tử của mẫu
Xác định tổng thể nghiên cứu là khâu đầu tiên trong quá trình chọn mẫu
số cửa hàng của một khu vực, số sinh viên đại học của một trường.)
Vd: Ta cần nghiên cứu về thu nhập của những người làm việc trong ngành giáo dục Vậy tất cả những người làm việc trong ngành giáo dục được coi là tổng thể.Hay là Phân tích các yếu tố tác động đến việc lựa chọn ( mua) sản phẩm bột giặt OMO của khách hàng trên thị trường TP.HCM.
Sau khi xác định tổng thể nghiên cứu thì công việc tiếp theo là xác định khung mẫu
4.2 Xác định khung chọn mẫu
Các khung chọn mẫu có sẵn thường thấy là: Thông tin khách hàng có sẵn số điệnthoại, địa chỉ, độ tuổi, địa chỉ nhà,…có được từ các câu lạc bộ, ngân hàng, sự kiện ,hoạt động mà khách hàng từng tham gia
Trang 13Vd: Ta muốn chọn một mẫu gồm 100 hộ gia đình có thu nhập từ 20 triệu VNĐtrong phường Linh Xuân, ta phải xin UBND phường cung cấp danh sách các hộtrong địa bàn phường, danh sách đó chính là khung chọn mẫu.
Tuy nhiên, khi một thị trường mà ở đó, dữ liệu thứ cấp về dân số chưa hoàn chỉnhnhư tại Việt Nam thì việc xác định khung mẫu rất khó khăn và tốn kém
Trong thực tế, khung chọn mẫu không phải lúc nào cũng có sẵn
Vd: Nghiên cứu những người quan tâm đến giày trượt tuyết , khung đối tượng nàykhông có sẵn do đó người ta phải xác định khuôn khổ chung, sau đó sàng lọc dầncăn cứ vào (giới tính, tuổi tác, kích cỡ chân, màu sắc, ) rồi dần lọc ra được chínhxác các đối tượng cần nghiên cứu Công việc này tốn kém rất nhiều thời gian vàchi phí
4.3 Xác định kích thước mẫu ( n )
Là xác định số lượng đơn vị điều tra trong tổng thể mẫu để tiến hành thu thập sốliệu
Việc xác định qui mô mẫu theo lý thuyết là vô cùng phức tạp Trên thực tế
nhà nghiên cứu áp dụng nhiều cách xác định mang tính khả thi hơn như xác định
cỡ mẫu theo kinh nghiệm điều tra thực tế.
Việc xác định cỡ mẫu phụ thuộc vào:
Trang 14 Mục tiêu nghiên cứu
Yêu cầu của dữ liệu phân tích
Hạn chế về thời gian
Hạn chế về chi phí
Cỡ mẫu tương quan với mẫu lớn của tổng thể
Cỡ mẫu khi chọn mẫu phi xác suất
Z - Chi phí cần thiết cho tất cả các khâu điều tra tính cho một đơn vị điều tra
Các bước xác định cỡ mẫu khi ước lượng tham số trên tổng thể:
Bước 1 :Xác định sai số cho phép hay còn gọi là dung sai E
Xác định sai số e cho phép:
Trang 15 Phụ thuộc vào độ nhạy của kết quả, quyết định đối với biến ước lượng đangkhảo sát
Thường từ: 10 - 20% của đơn vị đo nhỏ nhất
Vd: Điều tra mức tiêu thụ trung bình về bia, ta muốn rằng ước lượng về mức tiêuthụ trung bình về bia của mẫu nằm trong khỏang trên dưới 5% hay 0,05 so với trị
số trung bình thật của tổng thể nghiên cứu, khi đó: E = ± 0,05
Vd: KFC định mở một cửa hàng tại một vùng dân cư mới Quyết định có mở haykhông phụ thuộc vào thu nhập trung bình của người dân sống trong khu vực đó.Giả sử nếu thu nhập trung bình từ 10triệu/tháng trở lên thì mở Vấn đề đặt ra là xácđịnh thu nhập trung bình của người dân với một sai số cho cho phép cho trước (vd:
1 triệu VNĐ )
Bước 2: Xác định độ tin cậy và giá trị Z
Mức tin cậy thường được chọn là 99%, 95% và 90%
Trong thực tế thường chọn 95% z = 1.96
Trang 16Bước 3: Ước tính độ lệch chuẩn
TH1: Biến liên tục ( Ước tính độ lệch chuẩn )
Sử dụng công thức theo quy tắc 3σ xichma
Trang 17Bước 4: Sử dụng công thức thống kê
Vd: Mấy cái form khảo sát mà các bạn hay điền trên facebook thì phần trả lời cóhoàn toàn không đồng ý cho tới hoàn toàn đồng ý thì đó là thang đo dạng liên tụchay là biến liên tục
Vd: iến giới tính thì không trả lời theo dạng hoàn toàn đồng ý hay không đồng ýB
được mà phải là hoặc nam hoặc nữ , thì đó là biến tỷ lệ
Trường hợp giá trị tham số của tổng thể là một số tuyệt đối ( biến liên tục )
Vd: Hãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1 năm của hộ nông dân trênđịa bàn tỉnh “Y” có 200.000 hộ gia đình (N = 200.000), với xác xuất tin cậy là0,9875 (tức là Z = 2,5), phạm vi sai số chọn mẫu (ε) không vượt quá 2,52 triệuđồng/năm trong điều kiện có phương sai về thu nhập của hộ: S^2=61,52
= 60,55