1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu khoa học - Chọn mẫu và tính toán có mẫu

31 661 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Chọn mẫu và tính toán có mẫu
Trường học Trường Đại Học Nông Nghiệp Hà Nội
Chuyên ngành Đại học Nông nghiệp
Thể loại Nghiên cứu khoa học
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 31
Dung lượng 1,32 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Phương pháp Chọn mẫu và tính toán có mẫu thường được áp dụng trong bài nghiên cứu khoa học

Trang 1

CHỌN MẪU VÀ TÍNH TOÁN CỠ MẪU

Chọn mẫu?

 Nếu tất cả các cả thể của một quần thể đều

giống nhau, chúng ta có một quần thể thuần

nhất (homogenous) Khi đó, đặc tính của mỗi

cá thể cũng chính là của quần thể Không có sự khác nhau/ giao động tính chất giữa các cá thể

Trang 2

Chọn mẫu?

 Khi các cá thể trong một quần thể khác nhau, chúng ta có

một quần thể hỗn tạp/ không thuần nhất (heterogeneous)

Khi đó đặc tính của một cá thể bất kỳ không mang tính đại diện cho cả quần thể Có sự khác nhau/ giao động giữa các cá thể

 Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng

cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các

cá thể của quần thể để quan sát

Suy ra

Trang 3

Chọn mẫu?

tin hữu ích về quần thể đó Do vậy, mẫu phải đảm bảo

có được những biến thiên cơ bản giữa các cá thể như

ở quần thể

 Một quần thể càng không đồng nhất…

Thì sác xuất một mẫu khó có thể mô tả quần càng lớn 

Sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính của quần thể

 Và…

Thì số lượng cá thể của mẫu phải càng lớn để có thể mô

tả quần thể tốt  Một mẫu phải có số lượng cá thể đủ lớn

để cho thể suy đặc tính của mẫu thành của quần thể

Chọn mẫu?

thể cho quan sát, để có thể coi kết quả quan sát mẫu thành kết quả quan sát quần thể, ở một mức độ chấp nhận mà xác định được

Mẫu là đại diện của một quần thể Mức độ đại diện phải

được xác định/ đo lường được

Chọn mẫu không ngẫu nhiên

Chọn mẫu ngẫu nhiên

Trang 4

Các khái niệm cơ bản

 Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác

định không gian và thời gian

 Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc

tính, trong một khoảng không gian và thời gian xác định.

 Mẫu/ quần thể quan sát được: Là tập hợp một số lượng cá

thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm

 Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần

thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm

 Danh sách/ khung mẫu: Là danh sách các cá thể của một

quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu

 Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng

xác định/ không xác định cá thể của quần thể vào một tập hợp mẫu.

 Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu

thành kết quả của quần thể

Phân loại các phương pháp

chọn mẫu

Chọn mẫu

Ngẫu nhiên

Ngẫu nhiên đơn Theo cụm

Hệ thống Phân tầng

Không ngẫu nhiên

Chỉ tiêu Chủ đích

Thuận tiện Ném bóng

tuyết

Trang 5

Chọn mẫu ngẫu nhiên

 Chọn mẫu ngẫu nhiên ñơn

 Đảm bảo mỗi cá thể của quần thể ñược lựa chọn với xác suất như nhau vào mẫu

 Ghép cặp mỗi cá thể với một số ngẫu nhiên, các cá thể ñược lựa chọn theo sự ngẫu nhiên của con số

Sác xuất lựa chọn =

Cỡ mẫu Tổng số cá thể của quần thể

Chọn mẫu ngẫu nhiên đơn

Khoảng cách giữa các cá thể là ngẫu nhiên, không có quy luật nào

Trang 6

 Ưu ñiểm

Không cần nhiều thông tin về quần thể

Tính gía trị cao, xác ñịnh ñược sai số

thống kê

Dễ dàng phân tích dữ liệu

 Hạn chế

 Tốn kém

 Yêu cầu danh sách cá thể trong quần thể

 Không cần chuyên môn của nghiên cứu viên

 Nguy cơ sai số ngẫu nhiên

 Chọn mẫu hệ thống

 Cá thể ñầu tiên ñược lựa chọn ngẫu nhiên trong quần thể, các cá thể tiếp theo ñược lựa chọn theo một khoảng cách xác ñịnh

so với cá thể trước ñó Khoảng cách xác ñịnh ñược gọi là khoảng cách mẫu =

Tổng số cá thể của quần thể/ cỡ mẫu

Trang 7

Chọn mẫu hệ thống

Khoảng cách giữa các cá thể bằng nhau

 Mang tính quy luật

 Ưu ñiểm

Chi phí hợp lý, hay ñược sử dụng

Tính gía trị cao, xác ñịnh ñược sai số thống kế

Trang 8

 Chọn mẫu phân tầng

Chia quần thể theo một đặc tính cụ thể thành các

nhóm/ tầng (strata) (Ví dụ: Chia quần thể sinh

viên trường ĐHY Hà Nội thành 3 nhóm/ tầng: học viên tiến sĩ, học viên thạc sĩ và học viên đại học)

Các cá thể trong mỗi tầng đồng nhất, nhưng

không đồng nhất giữa các tầng

Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay chọn mẫu hệ thống ở mỗi tầng (strata) Số mẫu mỗi tầng tham gia vào tổng mẫu có thể bằng nhau (chọn mẫu phân tầng không cân xứng) hay

tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân tầng cân xứng)

Chọn mẫu phân tầng không cân xứng

Trang 10

 Chọn mẫu theo cụm/ chùm

 Cụm ñây là cụm ñịa lý nơi các các thể sinh sống Đầu tiên là chọn cụm, sau ñó mới chọn cá thể trong cụm

 Phương pháp hay ñược sử dụng khi

không có danh sách cá thể của quần thể

 Các loại chọn mẫu theo cụm/ chùm

Chọn mẫu theo cụm 2 bước:

Chọn cụm – chọn cá thể trong cụm

Chọn mẫu theo cụm nhiều bước:

Ví dụ: chọn 7 vùng sinh thái ở Việt

Nam, chọn 1 tỉnh ở mỗi vùng sinh

thái, chọn 1 huyện ở 1 tỉnh, chọn 1 xã

ở 1 huyện, 1 thôn/ bản ở 1 xã, chọn

200 hộ gia ñình ở 1 thôn/ bản theo cỡ mẫu

Trang 11

 Ưu ñiểm

 Chí phí thấp/ hãy sử dụng

 Không yêu cầu danh sách cá thể của cả quần thể, chỉ yêu cầu danh sách cụm, tiểu cụm, tiểu tiểu… cụm, và danh sách cá thể của ñơn vị cụm cuối cùng

 Xác ñịnh ñược ñặc ñiểm của cả cụm và quần thể

 Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả một quốc gia

Hệ thống Phân tầng

Không ngẫu nhiên

Chỉ tiêu Chủ đích

Thuận tiện Ném bóng

tuyết

Trang 12

Chọn mẫu không ngẫu nhiên

 Chọn mẫu thuận tiện

 Cá thể ñược lựa chọn vào mẫu một cách

“thuận tiện”, sẵn có và dễ tiếp cận

 Tại sao dùng: nhanh và chi phí thấp

 Phải giải trình và ñánh giá giá trị nếu

chọn mẫu thuận tiện.

 Độ biến thiên và sai số không ño lường

và kiểm soát ñược.

 Khó giải trình việc suy luận kết quả thống

kê trên mẫu ra của quần thể.

Trang 13

 Chọn mẫu có chủ ñích (Judgment or Purposive Sampling)

 Chọn cá thể có một số ñặc tính mong muốn vào mẫu với chủ ñích của nghiên cứu viên

 Khó giải trình việc suy luận kết quả thống

kê trên mẫu ra của quần thể.

Trang 14

 Chọn mẫu theo chỉ tiêu

 Mẫu ñảm bảo ñặc tính của quần thể, ñại diện ở một mức ñộ mà nghiên cứu viên mong muốn

Trang 15

 Chọn mẫu “Ném bóng tuyết“

(Snowball sampling)

 Chọn mẫu bắt ñầu từ một cá thể, ñược chọn một cách ngẫu nhiên hay không ngẫu nhiên Các cá thể tiếp theo ñược chọn từ cá thể ban ñầu hay trước ñó,

giống như trò chơi ném bóng tuyết, ai trúng thì ñược lựa chọn

 Khó giải trình việc suy diễn kết quả thống

kê trên mẫu ra của quần thể.

Trang 16

Tính toán cỡ mẫu

 Thông tin/ dữ liệu cần thiết

Loại nghiên cứu

Các thuật toán thống kê sử dụng

Đắc tính của cá thể - Thể hiện qua biến số (khác biệt cơ bản giữa biến liên tục – biến phân hạng) Kết quả các nghiên cứu trước được đưa vào làm cơ sở tính toán

Độ tin cậy (95%, 90%)

Gía trị p chấp nhận kết quả kiểm định (0,05/ 0,001)

Mức độ biến thiên của kết quả mẫu so với kết quả thực của quần thể (độ chính xác tương đối)

Sức mạnh của mẫu nói lên mức độ kết quả mẫu đại diện cho kết quả của quần thể

Tính toán cỡ mẫu

 Tính toán cỡ mẫu đơn giản:

Dựa vào công thức cơ bản,

Không tính đến thiết kế nghiên cứu,

Không tính đến các thuật toán thống kê sử dụng trong thiết kế

Tính toán đơn giản, bằng máy calculator

Trang 17

Tính toán cỡ mẫu

 Tính toán cỡ mẫu nâng cao:

Dựa vào một số phần mềm tính toán cỡ mẫu tốt (Ví dụ: Sampling Size for Health Studies của WHO)

Đã đề cập một số thiết kế nghiên cứu cơ bản + thuật toán thống kê hay sử dụng cho thiết kế đó + biến số/ dữ liệu liên qua

Có công thức tính cỡ mẫu cho giải trình, phải chụp màn hình, lưu ở dạng jpg

Chính xác hơn tính toán cỡ mẫu đơn giản

Chưa toàn diện so với tính toán cỡ mẫu chuyên nghiệp

Giao diện chọn các thiết kế nghiên cứu trong phần

mền tính cỡ mẫu nâng cao

Trang 18

Giao diện tính toán cỡ mẫu

Ô tính ra

cỡ mẫu

Nhập giá trị mong muốn cho mẫu

Công thức máy tính tính cỡ mẫu cho thiết kế

Tính toán cỡ mẫu chuyên nghiệp

 Dựa vào phần mềm tính toán cỡ mẫu chuyên nghiệp, trong gói SAS, hoặc chuyên nghiệp với n-query Phần mềm rất đắt (cỡ 1 triệu USD cho SAS, 1050 USD cho nquery) Học viên có nhu cầu học thêm ứng dụng của phần mềm nquery có thể liên hệ với giáo viên

 Nghiên cứu viên nhập thiết kế nghiên cứu, thuật toán thống kê sử dụng và các dữ liệu liên quan đến biến số vào phần mềm để tính ra cỡ mẫu Nghiên cứu viên có thể phân tích độ nhạy mối liên quan giữa Sức mạnh mẫu

và cỡ mẫu Nghiên cứu viên phải có kiển thức chuyên sâu về thiết kế nghiên cứu và các thuật toán thống kê để

có thể sử dụng được phần mềm cũng như phiên giải kết quả

Trang 19

Loại phân tích thống kê

Cụ thể hóa nhập liệu thuật toán thống kê

Nhập giá trị cụ thể của biến số

và mong muốn đặc tính mẫu

Bước 2: Xác định giá trị cụ thể của biến số

và mong muốn đặc tính mẫu

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Các ô tính ra

cỡ mẫu

Trang 20

Nhập giá trị cụ thể của biến số

và mong muốn đặc tính mẫu

Bước 3: Xác định sức mạnh mẫu từ các cỡ mẫu và ngược lại

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Các ô kết quả

Bước 4: Phân tích độ nhạy của mối quan hệ Sức mạnh mẫu – Cỡ mẫu

4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp

Biểu đồ của phân tích độ nhạy

Trang 21

Tính toán cỡ mẫu cơ bản

3 công thức cơ bản (phần in đậm là công thức gốc):

- Từ trung bình n = (ZS/E) 2 = (Z(d-c)/E) 2

- Quần thể xác biến thiên hay không biến thiên bằng cách nhân

và không nhân với bình phương độ lệch chuẩn, bình phương 1/6 (hiệu giá trị lớn nhất – giá trị thấp nhất)

 Công ty A quyết định tuyển sinh viên mới tốt

nghiệp Giám đốc cần quyết định mức lương cạnh tranh Từ kinh nghiệm của các công ty khác cho thấy, lương sinh viên mới ra trường giao động từ 3,8 – 4,2 triệu, mức trung bình là 3,9 triệu Độ lệch chuẩn ở vào mức 0,3 triệu

 Công ty muốn làm một nghiên cứu nhỏ, lựa chọn một số sinh viên làm mẫu, và muốn suy kết quả mức lương trung bình của nhóm sinh viên trong mẫu suy ra mức lương trung bình của tất cả sinh viên mới tốt nghiệp Độ tin cậy: 95%, và giá trị xê địch trong khoảng +/- 50 nghìn

 Hãy tính cỡ mẫu cho nghiên cứu của công ty?

 N = (1,96 x 0,3/ (2 x 0,05)) 2 = 34,57

Ví dụ 1

Trang 22

 VTV muốn làm một nghiên cứu nhỏ để xác định được tỷ

lệ người xem chương trình của họ nếu phát sóng Họ muốn chọn một số người xem truyền hình để phỏng vấn

Họ mong muốn kết quả thống kê trên mẫu phản ánh được kết quả thực sự ở mức xê dịch +/- 5% và với độ tin cậy 99%

 Cỡ mẫu mà VTV cần để khảo sát là bao nhiêu?

 N = 2,58 2x 0,2 x (1-0,2) / (2 x 0,05) 2= 106,5

Ví dụ 3

 Xác định cỡ mẫu cần thiết để điều tra phụ nữ tại một xã X biết về việc khám thai đủ 3 lần trước sinh là cần thiết Khoảng tin cậy là 95% với sai

Trang 23

Chọn mẫu từ quần thể

BN2 BN12 BN22 BN32 BN42 BN52 BN62 BN72 BN82 BN92 BN3 BN13 BN23 BN33 BN43 BN53 BN63 BN73 BN83 BN93 BN4 BN14 BN24 BN34 BN44 BN54 BN64 BN74 BN84 BN94 BN5 BN15 BN25 BN35 BN45 BN55 BN65 BN75 BN85 BN95 BN6 BN16 BN26 BN36 BN46 BN56 BN66 BN76 BN86 BN96 BN7 BN17 BN27 BN37 BN47 BN57 BN67 BN77 BN87 BN97 BN8 BN18 BN28 BN38 BN48 BN58 BN68 BN78 BN88 BN98 BN9 BN19 BN29 BN39 BN49 BN59 BN69 BN79 BN89 BN99 BN10 BN20 BN30 BN40 BN50 BN60 BN70 BN90 BN90 BN100

Có 100 bệnh nhân từ BN1 đến BN100

Bài tập chọn mẫu từ quần thể

 Hãy chọn 30 bệnh nhân một cách ngẫu nhiên từ 100 bệnh nhân bằng 3 cách

Cách 1: Cắt 100 mạnh giấy, ghi tên 100 bệnh nhân, cho vào 1 cái rọ, rồi nhắm mắt, thò tay vào rọ, lấy ra 30 tờ

Cách 2: In danh sách 100 bệnh nhân ra, mở bảng số ngẫu nhiên, cho BN1 một số ngẫu nhiên bất kỳ trong bảng, 99 bệnh nhân tiếp theo cũng nhận được một số ngẫu nhiên tiếp theo từ số ngẫu nhiên của BN1

Cách 3: Dùng hàm rand() trong Excel cho mỗi bệnh nhân một số ngẫu nhiên, tráo bệnh nhân bằng sort, lựa chọn 30 bệnh nhân từ trên xuống dưới

 Hãy chọn 30 bệnh nhân hệ thống từ 100 bệnh nhân

Trang 24

Tính toán cỡ mẫu nâng cao

- Học viên mang theo máy tính để thực

Kết quả: 139

Trang 25

Bài tập 1.1.2

Viện vệ sinh dịch tễ trung ương muốn xác định tỷ lệ trẻ em trong toàn quốc được tiêm phòng đúng theo quy định Mẫu

nghiên cứu cần bao nhiêu trẻ nếu muốn kết quả của mẫu nghiên cứu xê dịch 5%

so với kết quả thực của quần thể, với độ tin cậy là 95%

Kết quả: 385

Bài tập 1.3.1

Tỷ lệ thành công của một can thiệp tim mạch ngoại khoa X được báo cáo trong y văn là 70% Một phương pháp mới Y được đề xuất mang lại hiệu quả tương tự Một cơ sở điều trị không

có năng lực ngoại khoa muốn áp dụng phương pháp điều trị mới Y Trước đó họ cần phải

nghiên cứu bao nhiêu bệnh nhân để kiểm định giả thuyết phương pháp mới cũng có tỷ lệ

thành công là 70% với p = 0,05 Nghiên cứu muốn có một sức mạnh 90% rằng giá trị xê

dịch +/- 5%

Kết quả: 912

Trang 26

Bài tập 2.1.2

Một nghiên cứu với 50 công nhân đang tham gia một dự án thủy lợi cho thấy 40% số họ bị nhiễm sán máng Một nghiên cứu tương tự

cũng với 50 công nhân nhưng không làm cho

dự án thủy lợi nào, tỷ lệ nhiễm sán máng chỉ là 32% Một nhóm dịch tễ học muốn tiến hành

một nghiên cứu lớn hơn để có được kết quả

khác biệt giữa hai nhóm ở mức p=0,05, với

mức tin cậy 95% thì họ phải lựa chọn bao

nhiêu công nhân ở mỗi nhóm cho nghiên cứu

tỷ lệ người làm nghề đi biển, đánh bắt cá trong

quần thể tương đương, và nhóm dịch tễ học muốn làm một nghiên cứu lớn hơn ở cả hai nhóm bệnh

và chứng, để tính ra được sự khác biệt giữa hai nhóm với mức tin cậy 90% và p = 0,05, thì mẫu họ phải chọn ở mỗi nhóm là bao nhiêu?

Kết quả: 519

Trang 27

chứng để xác định xem nguồn nước nơi đây có

phải là nguyên nhân dẫn đến sự lây lan của bệnh

tả hay không?

Kết quả: 408

Bài tập 4.1.1

Một nhóm nghiên cứu dịch tễ học lên kế hoạch

nghiên cứu xác định xác suất bệnh phổi X có liên quan đến chất Y ô nhiễm trong không khí Mẫu

nghiên cứu ở hai nhóm có và không tiếp xúc với chất Y là bao nhiêu? nếu nghiên cứu muốn xác

định nguy cơ tương đối tới 50% giá trị thực của

quần thể và với độ tin cậy 95% Từ trong y văn,

bệnh phổi X đang phối biến ở mức 20% trong

nhóm người không phới nhiễm với chất Y

Kết quả: 44

Trang 28

Bài tập 4.2.1

Hai phương pháp điều trị một bệnh ung thư được đánh giá trong một nghiên cứu thuần tập thử nghiệm lâm sàng

Người bệnh được lựa chọn ngẫu nhiên cho mỗi phương

pháp điều trị và được theo dõi tình trạng tái phát bệnh trong

5 năm Phương pháp điều trị A là một phương pháp mới giảm một nửa nguy cơ tái phát trong 5 năm đầu 35% người bệnh được điều trị bằng phương pháp điều trị B tái phát

trong 5 năm đầu Mẫu bệnh nhân mỗi nhóm điều trị A và B

là bao nhiêu nếu nhóm nghiên cứu muốn có mức tin cậy 90% để có thể loại trừ giả thuyết Ho (Nguy cơ tương đôi =1) Nếu không thì kiểm định được chấp nhận ở độ tin cậy

95%

Kết quả: 385

Trang 29

Bài tập 6.2.2

Trên cơ sở số liệu 5 năm của BV X, theo dõi một số lượng nhỏ bệnh nhân mắc bệnh X, tỷ lệ mắc mới bệnh này được báo cáo là 40%

Nhóm dịch tế học cần nghiên cứu trên bao

nhiêu bệnh nhân để kiểm định xem tỷ lệ mắc mới bệnh X trên cộng đồng có đúng là 40% với p=0,05 hay không? Nghiên cứu được mong

muốn có một sức mạnh 80% xác định tỷ lệ mới thực hàng năm là 50%

Kết quả: 146

Bài tập 6.3.2

Để biết về tác động lâu dài của tiếng ồn tới sức khỏe, nhóm nghiên cứu A lên kế hoạch theo dõi dọc, so sánh hai nhóm công nhân làm việc trong môi trường có tiếng

ồn và ít tiếng ồn Y văn có nếu tỷ lệ suy giảm thính lực hàng năm của công nhân làm trong môi trường ồn ào

là 25% Mẫu nghiên cứu phải là bao nhiêu ở mỗi nhóm

để kiểm định loại bỏ Ho (giữa hai nhóm không có sự khác biệt) Gỉa thuyết Ha là tỷ lệ giảm thính lực hàng năm ở công nhân làm việc trong môi trường ít tiếng ồn

là 10% Độ mạnh của kiểm định là 80%, p=0,05

Kết quả: 23

Ngày đăng: 01/04/2014, 12:53

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w