1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bg phuong phap nghien cuu khoa hoc 2022 phan 2 6395

66 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phương Pháp Nghiên Cứu Khoa Học 2022 Phần 2 6395
Trường học Bệnh viện Y học Cổ truyền Hà Nội
Chuyên ngành Khoa học Y sinh
Thể loại Giáo trình môn học
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 66
Dung lượng 1,29 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ví dụ, để có thể thu thập được số liệu về sẹo lao ở trẻ em trong một cộng đồng nông thôn không biết danh sách các hộ gia đình, người nghiên cứu có thể xác định một quy luật chọn mẫu trướ

Trang 1

BÀI 4 PHƯƠNG PHÁP THỐNG KÊ Y SINH HỌC

NỘI DUNG HỌC TẬP

Việc trình bày số liệu thu thập đuợc trong nghiên cứu là một công việc hết sức quan trọng để the hiện kết quả của nghiên cứu số liệu sau khi thu thập thuờng là hỗn độn, vì vậy, muốn từ các số liệu ấy tính toán các giá trị đặc trưng và thực hiện các kỹ thuật suy luận thống kê để rút ra những kết luận có giá trị, ta phải biết cách sắp xếp và trình bày số liệu một cách rõ ràng, gọn và có hệ thống

Hai chiến luợc cơ bản giúp chúng ta tiến hành khảo sát một bộ số liệu:

(1) Bắt đầu bằng khảo sát từng biến Sau đó chuyển sang nghiên cứu mối tuơng quan giữa các biến

(2) Bắt đầu với một bảng/biểu/đồ thị hoặc nhiều bảng/biểu/đồ thị Sau đó bổ sung các số liệu tống hợp về những đặc trưng cụ thể của số liệu

Chúng ta cần tuân thủ những nguyên tắc nàỵ trong suốt quá trình phân tích Trong bài học này, chúng ta sẽ băt đâu băng việc trình bày các bảng phân phối tần số, và bằng các biểu đồ, đồ thị

1 BẢNG PHÂN PHỐI TẦN SỐ

1.1 Tiêu chuẩn của một bảng tốt

Mặc dù không có một quy định nào chặt chẽ về việc trình bày số liệu bằng bảng, nhưng có một vài nguyên tắc chung đươc coi là tiêu chuẩn:

+ Bảng càng cần đơn giản càng tốt: nên dùng bảng đơn giản để người đọc dễ hiểu hơn

là bảng phức tạp với nhiều biến số Nhìn chung, một bảng nên chỉ được lập với tối

đa là 3 biến số

+ Bảng cần phải đảm bảo yếu tố tự giải thích

MỤC TIÊU HỌC TẬP

1 Lập được kế hoạch phân tích và trình bày số liệu

2 Lựa chọn được phương pháp thống kê phù hợp với các loại số liệu

3 Trình bày được một bộ số liệu cụ thể dưới dạng các bảng, biểu đồ và đồ thị thích hợp, và phiên giải được ý nghĩa của số liệu trong các bảng, biểu, đồ thị

Trang 2

+ Các mã hóa, chữ viết tắt hoặc biểu tượng cần phải giải thích cụ thể trong phần chú thích ở cuối trang

+ Cần ghi rõ ràng và chính xác trong từng dòng và từng cột

+ Các đơn vị đo lường cụ thế cho từng số liệu cần được chỉ rõ

+ Tiêu đề của bảng cũng cần phải rõ ràng, chính xác và đúng trọng tâm cần trả lời các câu hỏi: Cái gì? Khi nào? Ở đâu?

+ Số tổng cộng cần phải được trình bày trong bảng

+ Tiêu đề của bảng cần phải được phân cách với nội dung bảng bằng dòng kẻ hoặc một khoảng cách dòng Trong các bảng nhỏ, các dòng kẻ ngang phân cách các dòng

có thế không cần thiết

+ Nếu số liệu là trích dẫn, thì nguồn gốc, xuất xứ của số liệu cần được chỉ rõ trong phần chú thích ở dưới bảng

1.2 Các loại bảng phân phối tần số

1.2.1 Bảng phân phổi tần số một chiều

Dùng để trình bày sự phân phối của một đặc tính khảo sát

Khảo sát cho biến định tính

Bảng 2 Phân bố trình độ học vấn của dân số trong độ tuổi 25-34

Trang 3

Khảo sát cho biến định lượng

Bảng 3 Phân bố chiều cao của 40 thanh niên

Lớp Ranh giới lớp

(cm)

Giá trị trung tâm (cm)

Tần số (n)

Tần số tương đối (%)

Tần số tương đối cộng dồn (%)

+ Cột 6: Tần số tương đối cộng dồn xác định tỷ lệ phần trăm những thanh niên có chiều cao dưới một giới hạn nào đó Ở bảng này, có 50% thanh niên có chiều cao<162,5 cm

Trang 4

1.2.2 Bảng phân phối tần số hai chiều (2x2)

Dùng để trình bày sự phân phối của một đặc tính khảo sát tương quan với một đặc tính khác

Bảng 4 Kết quả xét nghiêm Creatinine Kinase (CK) trên bệnh nhân nghi ngờ mắc

nhồi máu cơ tim cấp tính

Ket quả test CK Nhồi máu cơ tim cấp (AMI) Tổng

Trình độ học vấn của mẫu Số lượng (n) Tỷ lệ (%)

Trang 5

2 Biểu đồ và đồ thị

2.1 Nguyên tắc chung

Khi biểu đồ, đồ thị đã được vẽ một cách chính xác, người đọc có thể hiểu toàn bộ

số liệu một cách nhanh chóng Một vài nguyên tắc quan trọng nhất khi vẽ đồ thị là:

+ Dùng biểu đồ, đồ thị càng đơn giản càng có hiệu quả

+ Tất cả các biểu đồ, đồ thị cần đảm bảo yếu tố tự giải thích

+ Tiêu đề có thể đặt ở phía dưới của biểu đồ, đồ thị

+ Khi có nhiều biến số được trình bày trên biểu đồ, đồ thị, thì từng biến số phải được phân biệt rõ ràng bằng lời chú giải hoặc chú dẫn

+ Không nên sử dụng các trục tọa độ khác khi không cần thiết

+ Đường biểu diễn đồ thị cần đậm hơn các trục tọa độ khác

+ Tân số luôn luôn đuợc trình bày theo độ chia thăng đứng và phương pháp phân loại trình bày theo độ chia nằm ngang

+ Đối với độ chia số học, các độ chia bằng nhau đại diện cho các đơn vị tính như nhau + Sự phân chia các độ trên biểu đồ, đồ thị cần phải rõ ràng cũng như các đơn vị tính tương ứng trên nó

2.2 Biểu đồ

Biểu đồ là phương pháp trình bày số liệu thống kê bằng hình với một hệ tọa độ Dưới đây là các loại biểu đồ thường dùng

2.2.1 Biểu đồ cột (bar chart)

Biểu đồ cột được sử dụng trong các trường hợp sau:

+ So sánh số liệu giữa hai hoặc nhiều nhóm,

+ Mô tả tần số tuyệt đối hoặc tần số tương đối (còn gọi là tỷ lệ)

+ Thể hiện các số đo lường

Trong biểu đồ cột, tần số tuyệt đối hoặc tỷ lệ được thể hiện qua chiều dài các cột (độ rộng cột là như nhau) Giữa các cột có khoảng trống để nhấn mạnh tính chất không liên tục của biến số và khoảng cách này là như nhau giữa các cột (không giống như tổ chức

đồ - histogram) Các cột có thể được thể hiện trên trục hoành hoặc trục tung (biểu đồ cột đứng hoặc cột nằm ngang) với cách thể hiện màu sắc hoặc làm đậm, vạch chéo khác nhau

để phân biệt giữa các cột có ý nghĩa khác nhau Tốt nhất là nên biểu diễn các cột theo thứ

Trang 6

tự tăng lên hoặc giảm xuống cho dễ đọc với biến định danh, hoặc theo thứ bậc với biến thứ bậc Ví dụ:

Hình 6 Biểu đồ phân bố trình độ học vấn của bệnh nhân trong nghiên cứu

2.2.2 Biểu đồ tròn (pie chart)

Biểu đồ hình tròn được dùng để biểu thị tỷ lệ các nhóm khác nhau của một biến số Tổng tỷ lệ của các nhóm này phải bằng 100%, quy ước là bắt đầu từ điểm 12 giờ để chia các phần theo độ lớn khác nhau từ phần lớn nhất và tiếp tục cho đến hết toàn bộ mặt đồng

hồ Cách chuyển từ tỷ lệ sang các độ hình tròn để chia là nhân số tỷ lệ phần trăm với 3,6

vì 360°/100 = 3,6°, Ví dụ:

Hình 7 Phân bố giới tình của trẻ <5 tuổi trong nghiên cứu

2.2.3 Biểu đồ cột chồng (component bar chart)

Biểu đồ cột chồng là một dạng biểu đồ trong đó mỗi cột được chia ra thành nhiều phần với các màu khác nhau để thể hiện sự khác biệt giữa các phần Mỗi cột trong biểu đồ cột chồng có thể dùng thay thế cho một biểu đồ hình tròn

Biểu đồ cột chồng được sử dụng trong trường hợp ta cần so sánh tỷ lệ các phần của hai hay nhiều nhóm khác nhau

Trang 7

Hình 8 Tình trạng dinh dưỡng của các xã trong nghiên cứu

2.3 Đồ thị

2.3.1 Đồ thị đường

Khi chúng ta cần thể hiện xu hướng thay đổi của số liệu theo thời gian thì đồ thị dạng đường thẳng là thích hợp nhất Một đồ thị thời gian của một biến vẽ từng quan sát theo thời gian mà tại đó quan sát được đo đạc Thời gian được biểu diễn trên trục hoành của đồ thị và trị số của biến được bố trí ở trục tung Nối các điểm dữ liệu sẽ giúp chỉ ra những thay đổi theo thời gian Ví dụ:

Hình 9 Số ca mắc Sốt xuất huyết vào mùa mưa của 3 xã

2.3.2 Đồ thị dạng cột liên tục – Tổ chức đồ (histogram)

Dùng để diễn tả sự phân phối tần số các đặc tính định lượng liên tục Đồ thị cột liên tục thường được vẽ dựa trên tần số tương đối.Một số điểm cần chú ý khi thực hiện vẽ đồ thị cột liên tục:

+ Giữa các cột không có khoảng cách do đồ thị này mô tả phân bố của một biến định lượng liên tục

Trang 8

+ Độ rộng của cột tùy thuộc vào tần số và giá trị (độ rộng) của các nhóm

+ Đối với các biến có giá trị của các nhóm bằng nhau, độ rộng của các cột là tương đương, do đó khi so sánh chỉ cần chú ý tới chiều cao của các cột

Hình 10 Phân bố cân nặng sơ sinh của trẻ trong nghiên cứu

2.3.3 Đa giác tần số

Nếu muốn trình bày nhiều tập hợp số liệu dưới dạng phân bố tần số thì số liệu cần được trình bày bằng đa giác tần số Đa giác tần số được xây dựng bằng cách nối các điểm giữa của đỉnh các cột trong đồ thị dạng cột liên tục với nhau Đường biểu diễn đa giác tần

số cho ta hình dung xu thế thay đổi của đặc tính khảo sát

Một nguyên tắc khi vẽ đa giác tần số là đa giác “đóng”, nghĩa là điểm đầu và cuối phải được tiếp xúc với trúc hoành của đồ thị, và diện tích nằm trong đa giác tần số cần phải đảm bảo tương đương với phần diện tích của đồ thị tần số

2.3.4 Đồ thị phân tán (scatter diagram)

Đồ thị phân tán được dùng để biểu thị mối tương quan giữa hai biến định lượng được đo lường trên cùng các cá thể Từng cá thể được thể hiện trên đồ thị dưới dạng từng điểm và được định vị với trị số của hai biến định lượng tương ứng trên trục tung và trục hoành cho cá thể đó Tập hợp các diêm sẽ cho chúng ta thây hình dạng hướng và cường độ của mối tương quan giữa hai biến

Khi tập hợp các điểm tạo nên hình dạng hướng đi từ dưới lên theo chiều từ trái sang phải (như ở đồ thị trên), ta gọi đó là mối tương quan thuận, trong khi tương quan là nghịch khi hình dạng hướng đi từ trên xuống dưới theo chiều từ trái sang phải Ngoài ra, ta cũng

có thể biết được cường độ của mối tương quan thông qua tính hệ số tương quan r giữa hai biến số Khi tương quan thuận, r sẽ mang giá trị dương, và ngược lại khi tương quan nghịch,

Trang 9

r sẽ mang giá trị âm và r chạy trong khoảng từ -1 đến +1 Giá trị r càng gần +1 hoặc -1, cường độ tương quan càng lớn, r càng gần 0, cường độ tương quan càng nhỏ

Hình 11 Ví dụ về Scatter Plot

2.4 Biểu thị số liệu dưới dạng bản đồ

Các số liệu dịch tễ học khi biểu thị dưới dạng bản đồ cho phép có thể biết được tính chất phân bố về mặt không gian và thời gian, ứng dụng công nghệ GIS (hệ thống thông tin địa lý) là một phương tiện hữu dụng để quản lý dữ liệu không gian Trong y tế, GIS cho phép phân tích nguyên nhân khởi phát của bệnh và khả năng lây lan của bệnh trong cộng đồng

3 Hướng dẫn về thiết kê và sử dụng các bảng, biểu đồ và đồ thị

3.1 Lựa chọn dạng phù hợp nhất với số liệu và mục đích diễn giải

Để đưa ra quyết định về việc lựa chọn hình thức trình bày số liệu phù hợp sẽ dựa trên ý tưởng về mức độ chính xác mà bạn muốn thông tin tới đối tượng Ví dụ: lựa chọn phương pháp đồ thị đường biểu diễn liên tục sẽ phù hợp với việc so sánh xu thể; biểu đồ cột thể hiện rõ ràng sự so sánh số lượng trong một giới hạn nhất định; biểu đồ tròn có ưu điểm trong so sánh từng phần với toàn bộ; và đồ thị phân tán phù hợp khi muốn biết xu hướng và độ lớn của sự kết hợp

3.2 Đặt ra mục đích cho mỗi phương pháp trình bày

Chỉ trình bày với một mục đích hay ý tưởng: hạn chế số lượng dữ liệu và chỉ nên trình bày một loại dữ liệu trong một biểu đồ/ đồ thị (trừ khi cần so sánh)

Sử dụng kiểu trình bày đền, trắng để diễn tả

Do việc in màu thường là rất đắt tiền, vì vậy nên trình bày thay thế màu bằng cách dùng các gạch chéo hoặc các điểm chấm đế thế hiện cho mỗi cột khác nhau; hoặc đối với

Trang 10

đường biểu diễn thì dùng đường liền hoặc cách đoạn và dùng điểm chấm, điểm gạch đậm, hoặc kết hợp các dạng khác nhau

3.3 Nên chú giải chính xác và đặt đúng chỗ phù hợp

Tiêu đề biểu đồ thường nêu lên “cái gì, ở đâu và khi nào” về dữ liệu cần trình bày Tất cả các tiêu đề sẽ phải rõ ràng, sáng sủa và dễ hiếu, và cũng như tiêu đề của biếu đồ, nó phải được ghi ở ngoài vùng của dữ liệu trình bày Chỉ có lời chú giải ngắn gọn (như lời chú giải theo từng hình “dạng khối”) có thể đặt cạnh trong vùng trình bày dữ liệu của biểu

đồ

3.4 Nêu rõ nguồn dữ liệu

Số liệu có được từ đâu? Biết rõ nguồn dữ liệu sẽ giúp cho việc thẩm tra hoặc phân tích thêm của độc giả Ngoài ra, việc tiếp cận với nguồn dữ liệu gốc có thể giúp ích cho độc giả xem xét về nội dung trích dẫn được trình bày hoặc các kết luận mà bạn đưa ra từ

đó

3.5 Rất thận trọng trong việc đưa ra các kết luận

Đưa ra kết luận là phản ánh toàn bộ thông tin mà từ đó số liệu trích dẫn được nêu ra; chỉ đưa ra kết luận mà từ số liệu bạn trình bày có thể hiển thị Tuy nhiên, luôn phải ghi nhớ rằng các bảng, biểu đồ và đồ thị mới chỉ nêu lên sự khái quát về thông tin của dữ liệu Ghi chú giải thích làm sao nối bật rõ lên những chi tiết quan trọng mà số liệu không rõ nghĩa Tránh các kết luận mà không cân nhắc đến sự không toàn vẹn của số liệu

TÀI LIỆU THAM KHẢO

1 Đào Văn Dũng (2020) Phương Pháp Nghiên Cứu Khoa Học-Nghiên Cứu Hệ Thống

Y Tế, NXB Y học

2 Lưu Ngọc Hoạt (2013) Phương pháp Nghiên cứu sức khỏe cộng đồng, NXB Y học

3 Lưu Ngọc Hoạt (2017) Thống kê sinh học & Nghiên cứu Y học, NXB Y học

4 Hoàng Văn Minh (2018) Phương pháp nghiên cứu trong bệnh viện, NXB Y học

5 Hoàng Văn Minh, Lưu Ngọc Hoạt, Đỗ Văn Dũng, Võ Văn Thắng (2017) Khái niệm

và thuật ngữ cơ bản sử dụng trong các nghiên cứu khoa học sức khỏe định lượng,

NXB Y học

6 Nguyễn Văn Tuấn (2018) Y học thực chứng, NXB Y học

Trang 11

BÀI 5 XÁC ĐỊNH CỠ MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU

NỘI DUNG HỌC TẬP

1 KHÁI NIỆM VỀ MẪU VÀ QUẦN THỂ NGHIÊN CỨU

1.1 Mẫu nghiên cứu (study sample)

Về lý luận, khi muốn tìm hiểu một hiện tuợng sức khỏe hoặc một mối quan hệ nhân quả nào đó trong một quần thể nhất định thì lý tưởng nhất là phải tiến hành nghiên cứu trên tất cả các cá thể sống trong quần thể đó, tức là phải làm một nghiên cứu toàn bộ (ví dụ làm điều tra dân số) Tuy nhiên, trên thực tế người ta thường không thế hoặc không cần thiết phải tiến hành các nghiên cứu toàn bộ, đặc biệt với các quần thể lớn vì một số lý do sau: + Không đủ nguồn lực, thời gian để triển khai một nghiên cứu toàn bộ

+ Chất lượng điều tra, nghiên cứu có thể không tốt do thường có nhiều sai số hơn khi triển khai một nghiên cứu lớn (sự chênh lệch về trình độ, kỹ năng của điều tra viên, giám sát viên, dụng cụ, phương tiện nghiên cứu không giống nhau )

+ Mặt khác, nêu nghiên cứu được làm trên một số đủ lớn các cá thể đại diện cho quần thể thì kết quả nghiên cứu vẫn cho phép có the ngoại suy cho toàn bộ quần thế đó + Nhóm các cá thể được rút ra từ quần thể nghiên cứu để phục vụ trực tiếp cho mục đích nghiên cứu được gọi là mẫu nghiên cứu Nghiên cứu với mẫu có thể khắc phục được một số hạn chế của nghiên cứu toàn bộ

Trang 12

1.2 Quần thể nghiên cứu và quần thể đích

Quần thể nghiên cứu (study population) là quần thể mà từ đó mẫu được được rút ra cho nghiên cứu Tuy nhiên mục đích của người điều tra thường không chỉ dừng lại ở quần thể nghiên cứu mà họ muốn ngoại suy, khái quát hóa ra một quần thể lớn hơn được gọi là quần thể đích (target population) Như vậy quần thể đích là quần thể mà người nghiên cứu mong muốn kết quả nghiên cứu của mình được ngoại suy ra Cần lưu ý rằng cả quần thể nghiên cứu và đích đều được xác định bởi người nghiên cứu, chúng có chung một hiện tượng sức khỏe mà người nghiên cứu quan tâm, mặt khác chúng phải bao hàm các yếu tố

về đối tượng (ai? cái gì?), không gian (ở đâu?) và thời gian (khi nào?) Trong các nghiên cứu dịch tễ học, nó sẽ là lý tưởng nếu quần thể nghiên cứu và quần thể đích là một Tuy nhiên trong nhiều trường hợp do thiếu thông tin cho việc chọn mẫu, thiếu sự chấp nhận của cộng đồng, hoặc thiếu các nguồn lực, người điều tra phải tách ra loại quần thể đích và quần thể nghiên cứu

Ví dụ, trẻ em <5 tuổi ở một tỉnh có thể coi là một quần thể đích cho việc nghiên cứu tình trạng suy dinh dưỡng Tuy nhiên, do một số lý do nào đó, mẫu nghiên cứu có thể chỉ được rút ra từ số trẻ em <5 tuổi của 3 huyện A, B, c trong số 10 huyện của tỉnh Khi đó trẻ

em <5 tuổi tại 3 huyện này là quần thể nghiên cứu

1.3 Đơn vị quan sát và đơn vị mẫu (observation unit, sampling unit)

Khi lựa chọn một mẫu, cần thiết phải xác định cái gì là đơn vị quan sát và cái gì là đơn vị mẫu Đơn vị quan sát là một chủ thể hoặc người mà sự quan sát hoặc đo lường sẽ được tiến hành khi thực hiện nghiên cứu, trong khi đơn vị mẫu là chủ thể được sử dụng khi chọn mẫu nghiên cứu Trong rất nhiều trường hợp, hai khái niệm này là trùng nhau, tuy nhiên có trường hợp chúng là khác nhau

Ví dụ, trong một điều tra đánh giá tình trạng suy dinh dưỡng của trẻ em trước tuổi

đi học (<5 tuổi), do danh sách của đối tượng này thường là không có sẵn trong cộng đồng nên danh sách của các hộ gia đình được sử dụng để chọn mẫu Tất cả trẻ em <5 tuổi trong các hộ gia đình được chọn vào mẫu đều được khám Khi đó đơn vị quan sát là trẻ em <5 tuổi, còn đơn vị mẫu là hộ gia đình

1.4 Khung chọn mẫu (sampling frame)

Để có thể dễ dàng chọn được một mẫu từ quần thể nghiên cứu, cần thiết phải có một danh sách các đơn vị mẫu hoặc bản đồ phân bố các đơn vị mẫu Danh sách hoặc bản

Trang 13

đồ như vậy được gọi là khung mẫu Đây là một điều kiện quan trọng trong việc lựa chọn thiết kế mẫu thích hợp cho nghiên cứu

Trong một số trường hợp, khung mẫu không sẵn sàng cho việc chọn mẫu thì ta có thể phải chuyển đổi đơn vị chọn mẫu để phù hợp với khung mẫu sẵn có Ví dụ khi ta muốn chọn mẫu các trẻ em dưới 5 tuổi cho một nghiên cứu về suy dinh dưỡng trẻ em, thì rất khó

để có được một khung mẫu là danh sách trẻ em dưới 5 tuổi trong cộng đồng, khi đó ta có thể phải quy đổi đơn vị chọn mẫu từ trẻ em ra hộ gia đình

1.5 Phân bố mẫu (sampling distribution)

Khi các mẫu có cùng kích cỡ được rút ra từ một quần thể nghiên cứu, kết quả thu được từ các mẫu cũng rất khác nhau Sự biến thiên này được gọi là phân bố mẫu

1.6 Tham số quần thể và tham sổ mẫu

1.6.1 Tham số quần thể (parameter)

Là biểu thị một hiện tượng sức khỏe nào đó có được khi quan sát toàn bộ một quầnthể nghiên cứu Nó luôn là một hằng số đối với mỗi một quần thể trong một thời điểm nhất định (ví dụ chiều cao trung bình của thanh niên trong tỉnh A tại thời điểm X là một hằng số) Tuy nhiên do hiếm khi tiến hành được một nghiên cứu trên toàn bộ quần thể lớn, nên tham số quần thể thường không được biết

1.6.2 Tham số mẫu (statistic)

Là biểu thị một hiện tượng sức khỏe đạt được khi quan sát một mẫu được rút ra từ một quần thể nghiên cứu

1.6.3 Lỗi chọn mẫu (sampling error)

Là sự khác biệt giữa tham số mẫu và tham số quần thể của một biến số nào đó trong một nghiên cứu Điều này phụ thuộc rất nhiều vào cách chọn mẫu, cỡ mẫu, kỹ thuật đo lường và cả việc phân tích số liệu

1.7 Khái niệm về suy luận thống kê

Do lỗi chọn mẫu là khó có thể tránh khỏi nên khi nhiều mẫu có cùng cỡ mẫu được rút ra từ một quần thế nghiên cứu sẽ có the cho các tham số mẫu khác nhau Các tham số mẫu này có thể là các giá trị trung bình (với biến định lượng) hoặc là các tỷ lệ (với biến định tính) Khi đó tập hợp của các tham số mẫu này sẽ cho một phân bố mẫu

Trang 14

1.7.1 Định nghĩa

Là một quá trình khái quát hóa hoặc rút ra kết luận về một quần thể nghiên cứu dựa trên kết quả đạt được từ một mẫu Trong trường hợp này, từ tham số mẫu ta có thể ngoại suy ra giá trị của tham số của quần thể mà từ đó mẫu được rút ra

Một nguyên tắc cơ bản trong quá trình này là cỡ của mẫu phải đủ lớn và mẫu phải đại diện cho quần thể nghiên cứu thì quá trình suy luận thống kê mới thực hiện được, vấn

đề này sẽ được bàn thêm trong phần chọn mẫu

1.7.2 Loại suy luận thông kê: có 2 loại

1.7.2.1 Ước lượng (estimation)

Ước lượng là quá trình mà một tham số thu được từ một mẫu được sử dụng đế ước đoán tham số quần thế tưong ứng trong quần thế nghiên cứu

Có 2 loại ước lượng:

(1) Ước lượng điểm (point estimation) Trong trường hợp này người nghiên cứu cho là

tham số mẫu chính bằng với tham số quần thể Ví dụ: tỷ lệ suy dinh dưỡng độ 3 của trẻ em tìm được từ mẫu nghiên cứu là 5% Nếu ước lượng điểm được sử dụng tức

là người nghiên cứu cho rằng tỷ lệ này trong quần thể nghiên cứu cũng là 5% (2) Ước lượng khoảng (interval estimation) do tham số quần thể thường không được

biết và do sai số chọn mẫu là khó có thể tránh khỏi, nên sẽ thiếu cơ sở để khẳng định rằng tham số mẫu bằng với tham số quần thế Vì vậy để có một kết luận khôn

Trang 15

ngoan hơn, người nghiên cứu đưa ra một khái niệm ước lượng khoảng, tức là tìm một khoảng mà giá trị của tham số quần thể được ựớc tính là nằm trong khoảng này với một độ tin cậy nhất định Khoảng này bao gồm một giá trị giới hạn thấp và một giá trị cao và được tính từ giá trị của tham số mẫu tương ứng

1.7.2.2 Kiểm định giả thuyết (hypothesis testing)

Kiểm định giả thuyết là một dạng khác của suy luận thống kê Mục đích của kiểm định giả thuyết chính là tìm các test thống kê thích hợp để tính toán giá trị p (xác suất) và thông qua p để đưa ra các kết luận thích hợp

2 ĐẠI CƯƠNG VỀ MẪU VÀ CỠ MẪU

Như đã đề cập trong phần trên, một nghiên cứu sẽ có giá trị hơn nếu tất cả các cá thể trong một quần thể được bao hàm trong nghiên cứu Tuy nhiên, điều này thường rất khó thực hiện vì đa số các quần thể nghiên cứu thường quá lớn Trên thực tế, một đặc trưng của quần thể có thể được ngoại suy từ kết quả thu được từ một mẫu được rút ra từ quần thể này Sự ngoại suy này sẽ chính xác hơn nếu như mẫu nghiên cứu đại diện cho quần thể và

là đủ lớn

Có 3 câu hỏi thường được đặt ra khi chọn mẫu là:

(1) Quần thể nào mà từ đó mẫu sẽ được lấy ra cho nghiên cứu?

(2) Làm thế nào để mẫu có thể đại diện cho quần thể nghiên cứu?

(3) Mẫu bao nhiêu là đủ cho một nghiên cứu?

Trả lời cho 3 câu hỏi này chính là giải quyết vấn đề xác định quần thể nghiên cứu (study population), chọn mẫu và xác định cõ’ mẫu cho một nghiên cứu

Việc xác định quần thể nghiên cứu tùy thuộc vào nhiêu vấn đề như ý tưởng của người làm nghiên cứu, vấn đề cần được nghiên cứu, các thông tin sẵn có cho việc chọn mẫu, kỹ thuật chọn mẫu, sự hiện diện của các nguồn lực phục vụ cho nghiên cứu Quần thể nghiên cứu cần xác định rõ, phải bao hàm cả khái niệm thời gian và không gian đê phục

vụ cho việc chọn mẫu

Một thiết kế mẫu được coi là tốt nếu như nó đáp ứng một số tiêu chuẩn sau:

+ Đại diện cho quần thể nghiên cứu: Khi nó có tất cả các tính chất cơ bản của quần thể mà từ đó nó được rút ra

+ Mẫu là đủ lớn: Để có thể cho phép khái quát hóa một cách tin cậy cho quần thế nghiên cứu

+ Tính thực tế và tiện lợi: Đe việc thu thập số liệu là dễ dàng và thuận tiện

Trang 16

+ Tính kinh tế và hiệu quả: Mẫu được chọn sao cho thông tin thu được là nhiều nhất trong khi chi phí là thấp nhất

3 CHỌN MẪU

Có hai nhóm kỹ thuật chọn mẫu đó là chọn mẫu xác suất (probability sampling) và không xác suất (nonprobability sampling) Mẫu được chọn theo kỹ thuật xác suất có tính đại diện cho quần thể hơn

3.1 Kỹ thuật chọn mẫu xác suất

Mỗi một cá thể trong quần thể có một cơ hội biết trước để chọn vào mẫu Kỹ thuật này chỉ thực hiện được khi biết khung mẫu của quần thể nghiên cứu

3.1.1 Mẫu ngẫu nhiên đơn (simple random sampling)

Là mẫu mà tất cả các cá thể trong quần thể có cùng cơ hội (cùng xác suất) để được chọn vào mẫu

Ví dụ: Chọn 500 hồ sơ trong số 5000 sản phụ đã đẻ tại bệnh viện A trong năm 2005

để nghiên cứu Nếu theo cách chọn ngẫu nhiên đơn thì mỗi sản phụ có xác suất là 10% được chọn vào mẫu Ta có thể tiến hành như sau:Lập một khung chọn mẫu chứa đụng tất

cả các đơn vị mẫu

Sử dụng một quá trình ngẫu nhiên để chọn các cá thể vào mẫu Có nhiều cách để chọn một mẫu ngẫu nhiên đơn từ quần thể như: Tung đồng xu, tung súc sắc, bốc thăm, sử dụng bảng số ngẫu nhiên

Ưu điểm:

+ Cách làm đơn giản, tính ngẫu nhiên và tính đại diện cao;

+ Là kỹ thuật chọn mẫu xác suất cơ bản và có thể lồng vào tất cả các kỹ thuật chọn mẫu xác suất cơ bản và có thể được lồng vào tất cả các kỹ thuật chọn mẫu xác suất phức tạp khác

Trang 17

3.1.2 Mẫu hệ thống (systematic sampling)

Trong mẫu hệ thống, mỗi cá thể trong một danh sách được chọn bằng cách áp dụng một khoảng hằng định theo sau bởi một sự bắt đầu ngẫu nhiên

Ưu điểm:

+ Nhanh và dễ áp dụng;

+ Nếu danh sách cá thể của quần thể được xếp ngẫu nhiên, chọn mẫu hệ thống tương

tự như chọn ngẫu nhiên đơn;

+ Nếu danh sách cá thể được xếp theo thứ tự tầng, đây là cách lựa chọn tương tự như mẫu tầng có tỷ lệ (proportionate stratified sample) tức là tầng có cỡ lớn hơn sẽ có nhiều cá thể được chọn vào mẫu hơn;

Trang 18

+ Trong một số trường hợp, mặc dù khung mẫu không có hoặc không biết tổng số cá thể trong quần thể, nhưng chọn mẫu hệ thống vẫn có thế đựoc áp dụng bằng cách xác định một quy luật phù hợp trước khi tiến hành chọn mẫu

Ví dụ, để có thể thu thập được số liệu về sẹo lao ở trẻ em trong một cộng đồng nông thôn không biết danh sách các hộ gia đình, người nghiên cứu có thể xác định một quy luật chọn mẫu trước thu thập số liệu như sau: Hộ gia đình đầu tiên được điều tra là hộ thứ nhất nằm bên trái của UBND xã Các hộ tiếp theo sẽ được chọn bằng cách người nghiên cứu tiếp tục đi về bên trái và cứ cách 7 gia đình lại điều tra một gia đình (khoảng cách các hộ gia đình được chọn vào nghiên cứu có thế được chọn bằng cách lấy tổng số hộ gia đình trong cộng đồng chia cho số hộ gia đình dự kiến điều tra) Nếu gặp lối rẽ thì người nghiên cứu chỉ được rẽ trái Tất cả các trẻ em trong các hộ gia đình được chọn đều được kiểm tra sẹo lao cho đến khi có đủ so trẻ cần được điều tra Số hộ gia đình cần điều tra có thể được ước đoán từ số trẻ em trung bình trong một gia đình ở cộng đồng và số trẻ cần nghiên cứu (cỡ mẫu)

Trong một số trường hợp khác, các cá thể trong quần thể nghiên cứu có thể không cần lên danh sách để chọn, người nghiên cứu có thể đưa ra một quy luật trước khi chọn mẫu như sau: tất cả các bệnh nhân đến phòng khám vào ngày thứ năm trong tuần sẽ được tham gia vào nghiên cứu Hoặc nệnh nhân đến khám ngày lẻ sẽ vào nhóm 1, đến ngày chẵn

sẽ vào nhóm 2 để phục vụ cho một thử nghiệm nào đó Hoặc các cá thể trong mẫu được chọn cho một nghiên cứu đứng vòng tròn, sau đó đếm lần lượt 1,2,3; 1,2,3 cho đến hết, người đếm số 1 đầu tiên phải được chọn ngẫu nhiên Các cá thế đếm số 1 sẽ vào nhóm 1,

số 2 vào nhóm 2, số 3 vào nhóm 3, như vậy ta đã có 3 nhóm ngẫu nhiên cho một thử nghiệm

Nhược điểm:

Khi việc sắp xếp khung mẫu có một quy luật nào đó tình cờ trùng với khoảng chọn mẫu hệ thống, các cá thể trong mẫu có thể thiếu tính đại diện

Ví dụ: một cộng đồng được hình thành bởi nhiều dãy nhà, trong đó mỗi nhà đều có

10 gia đình Nếu tình cờ hệ số k trong chọn mẫu hệ thống cũng bằng 10 và hộ gia đình đầu tiên được chọn vào mẫu là gia đình nằm ở đầu một dãy nhà thì tất cả các gia đình trong mẫu sẽ đều là các gia đình ở đầu các dãy nhà Như vậy mẫu sẽ thiếu tính đại diện về phân

bố không gian

Trang 19

3.1.3 Mẫu ngẫu nhiên phân tầng (stratified random sampling)

Là mẫu đạt được bởi việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm riêng rẽ được gọi là tầng và cách chọn mẫu ngẫu nhiên đơn sẽ được sử dụng trong mỗi tầng

Các bước:

+ Phân chia quần thể nghiên cứu thành các tầng khác nhau dựa vào một hoặc vài đặc điểm nào đó như nhóm tuổi, giới, tầng lớp xã hội, dân tộc Giữa các tầng không có

sự chồng chéo

+ Thực hiện việc chọn mẫu ngẫu nhiên đơn trong từng tầng

Các phân tích thống kê (như giá trị trung bình, độ lệch) được tính toán riêng cho mỗi tầng sau đó sẽ kết hợp lại trên cơ sở kích cỡ của từng tầng (cân bằng trọng: weighted)

để cho kết quả của toàn bộ quần thể

Ví dụ trong nghiên cứu tại các Bệnh viện của một khu vực, nếu số lượng các nhóm bệnh viện không bằng nhau, ta có thể chia làm các tầng như sau:

Ưu điểm:

+ Tạo ra trong mỗi tầng có một sự đồng nhất về yếu tố được chọn để phân tầng, do

đó sẽ giảm sự chênh lệch giữa các cá thể;

+ Quá trình thu thập số liệu thường dễ hơn so với mẫu ngẫu nhiên đơn;

+ Khi nguyên tắc mẫu tỷ lệ được sử dụng, tầng có kích cỡ lớn hơn sẽ có nhiều cá thể được chọn vào mẫu hơn

+ Nguyên tắc mẫu không tỷ lệ cũng có thể được áp dụng trong mẫu tầng, khi đó tỷ lệ mẫu trong các tầng sẽ khác nhau, với những tầng có biến thiên lớn giữa các cá thể hoặc chi phí cho chọn mẫu thấp, người ta thường áp dụng tỷ lệ mẫu lớn, cách này giúp cho người điều tra có đủ số cá thể trong mỗi tầng để có thể phân tích được

Trang 20

+ Mẫu chọn từ mỗi tầng có tính đại diện và khái quát hóa cao cho tầng đó

+ Nếu yếu tố được chọn để phân tầng có tính đồng nhất cao trong mỗi tầng, nhưng lại thấp giữa các tầng thì kết quả nghiên cứu sẽ có độ chính xác cao hơn là mẫu chọn theo cách ngẫu nhiên đơn (2 cách phải có cùng với cỡ mẫu)

Nhược điểm:

Cũng như chọn mẫu ngẫu nhiên đơn, danh sách tất cả các cá thể trong mỗi tầng phải được hệt kê và được gắn số ngẫu nhiên Điều này thường khó thực hiện trong thực tế

3.1.4 Mẫu chùm (cluster sampling)

Hay còn gọi là mẫu cụm, là mẫu đạt được bởi việc lựa chọn ngẫu nhiên các nhóm

cá thể được gọi là chùm từ nhiều chùm trong một quần thể nghiên cứu Trong trường hợp này đơn vị mẫu là các chùm chứ không phải là các cá thế

Các bước:

+ Xác định các chùm thích hợp: Việc này thường được làm bởi người điều tra Chùm được làm bởi tập hợp các cá thế gần nhau (làng, xã, trường học, khoa phòng, bệnh viện ) do đó thường có chung một số đặc diem Các chùm thường không có cùng kích cỡ

+ Lập danh sách tất cả các chùm, chọn ngẫu nhiên một số chùm vào mẫu Từ đây sẽ

có 2 cách chọn tiếp tùy theo ý tưởng của người nghiên cứu:

Cách 1: Tất cả các cá thế trong các chùm đã chọn sẽ được bao gồm vào nghiên cứu Trong cách này đơn vị mẫu (sampling unit) chính là các chùm được chọn, trong khi yếu tố quan sát (observation element) lại là các cá thể trong chùm (ví dụ, các hộ gia đình trong thôn được chọn, trẻ em trong các hộ gia đình được chọn ) Cách này được gọi là mẫu chùm một bậc và xác suất của một chùm được chọn vào mẫu bằng

số chùm dự kiến chọn chia cho tổng số các chùm

Cách 2: Liệt kê danh sách các cá thể trong các chùm đã chọn, sau đó áp dụng cách chọn mẫu ngẫu nhiên đon hoặc ngẫu nhiên hệ thống trong mỗi chùm đế chọn các

cá thế vào mẫu Trong trường hợp này đơn vị mẫu và đơn vị quan sát là trùng nhau (mẫu 2 bậc)

Ưu điểm:

+ Nó thường được áp dụng trong các nghiên cứu điều tra trong một phạm vi rộng lớn,

độ phân tán cao, danh sách của tất cả các cá thể trong quần thể không thể có được (do khó hoặc đắt), trong khi chỉ có danh sách hoặc bản đồ các chùm

Trang 21

+ Sự lựa chọn thường dễ hơn, chi phí cho nghiên cứu với mẫu chùm thường rẻ hơn nhiều do các cá thể trong một chùm thường gần nhau

Nhược điểm:

+ Tính đại diện cho quần thể hoặc tính chính xác (precision) của mẫu được chọn theo phương pháp mẫu chùm thường thấp hơn so với mẫu được chọn bằng phương pháp ngẫu nhiên đơn (nếu có cùng cỡ mẫu) Vì vậy, để tăng tính chính xác này người ta thường tăng cỡ mẫu bằng cách nhân cỡ mẫu (được tính theo công thức cho các chọn mẫu ngẫu nhiên đơn) với hệ số ảnh hưởng của thiết kế (design effect) Hệ số ảnh hưởng của thiết kế được tính theo công thức khá phức tạp nên người ta khuyên rằng nếu không tính chính xác được hệ số này thì ta có thế coi nó bằng 2

+ Có một sự tương quan nghịch giữa cờ của chùm và tính đại diện của mẫu, do vậy

cỡ chùm càng nhỏ càng tốt, tuy nhiên chi phí cho điều tra sẽ cao hơn số chùm được chọn vào nghiên cứu tốt nhất là phải >30

+ Phân tích số liệu từ mẫu chùm thường phức tạp hơn các mẫu khác

+ Việc lựa chọn chùm vào mẫu nghiên cứu cũng khá phức tạp, đặc biệt là khi cỡ chùm không đều nhau Trong trường hợp này, người ta có thể áp dụng phương pháp chọn chùm theo phương pháp PPS

3.1.5 Mẫu nhiều giai đoạn (multistage sampling)

Trên thực tế, nhiều nghiên cứu với các quần thể lớn có cấu trúc phức tạp cần phải

áp dụng nhiều kỹ thuật chọn mẫu trong các giai đoạn khác nhau Có thể kết hợp cả mẫu xác suất và không xác suất Với các thiết kế nghiên cứu trên diện rộng mà tiêu thức nghiên cứu biến đổi nhiều giữa các vùng sinh thái, các tầng lớp xã hội hoặc các loại nghề nghiệp khác nhau, thông thường người ta thực hiện bước thiết kế phân tầng trước, sau đó trong mỗi tầng sẽ thực hiện thiết kế chọn chùm (vì khi đó tiêu thức nghiên cứu giữa các chùm trong mỗi tầng là tương đối đồng đều) Tiếp đó trong mỗi chùm lại có thể chọn ngẫu nhiên đơn, ngẫu nhiên hệ thống, hoặc thậm chí có thể chọn chùm lại lần nữa để có được cỡ mẫu thích hợp

Một điểm Cần lưu ý là trong các nghiên cứu khi phải áp dụng nhiều lần chọn mẫu chùm thì cứ mỗi lần chọn mẫu chùm, cỡ mẫu lại phải nhân lên với hệ số thiết kế đế đảm bảo tính đại diện của mẫu nghiên cứu so với quần thể

Trang 22

3.1.6 Chọn mẫu chùm theo phương pháp PPS (probability proportionate to size - xác suất tỷ lệ với cỡ của quần thế)

Đây là phưong pháp rất hay được áp dụng trong nghiên cứu cộng đồng khi quần thể nghiên cứu quá lớn và các cộng đồng có kích thước không đều nhau Các điều tra về tiêm chủng mở rộng hoặc suy dinh dưỡng trên trẻ em dưới 5 tuổi trong các cộng đồng lớn thường

áp dụng kỹ thuật chọn mẫu này Trong trường hợp này, chùm được định nghĩa là một nhóm dân cư được lựa chọn ngẫu nhiên mà trong đó chứa một số lượng nhất định số trẻ em dưới

5 tuồi

Để đảm bảo độ tin cậy về thống kê, người ta khuyên rằng điều tra nên được tiến hành cho tối thiểu 30 chùm Khi áp dụng phương pháp PPS, các cộng đồng (huyện hoặc xã) có kích thước lớn hơn sẽ có cơ hội lớn hơn để được chọn vào mẫu nghiên cứu

Lý tưởng nhất cho quá trình chọn mẫu này là liệt kê tất cả các cộng đồng trong vùng

dự kiến nghiên cứu (tỉnh, vùng hoặc một nước) và dân số của các vùng đó, sau đó áp dụng phương pháp chọn mẫu PPS để chọn ra các cộng đồng chứa các chùm nghiên cứu Tuy nhiên, do địa bàn quá rộng, trong khi có nhiều hạn chế về nguồn lực và thời gian, người ta thường chọn cộng đồng theo vài giai đoạn Ví dụ phương pháp PPS để chọn ra một số huyện trong một tỉnh, sau đó chọn tối thiểu 30 chùm từ các huyện đã chọn Phương pháp này sẽ hạn chế việc đi lại và các chi phí khác

3.2 Kỹ thuật chọn mẫu không xác suất

3.2.1 Mẫu thuận tiện (convenience or accidental sampling)

Đạt được trên cơ sở các cá thể có sẵn khi thu thập số liệu (Ví dụ: tất cả các bệnh nhân đến khám tại phòng khám trong ngày) Phương pháp này không quan tâm đến việc

sự lựa chọn có ngẫu nhiên hay không Đây là cách chọn mẫu rất hay gặp trong các nghiên cứu lâm sàng

3.2.2 Mẫu chỉ tiêu (quota sampling)

Là phương pháp đảm bảo rằng một số nhất định các đơn vị mẫu từ các loại khác nhau của quần thể nghiên cứu với các tính chất đặc trưng sẽ có mặt trong mẫu Nó gần giống như cách chọn mẫu tầng nhưng không ngẫu nhiên Người nghiên cứu đặt kế hoạch

là sẽ chọn bao nhiêu đối tượng cho mỗi tầng hoặc nhóm đối tượng và bằng cách chọn mẫu thuận tiện để chọn cho đủ số lượng này từ mỗi tầng

Trang 23

3.2.3 Mẫu có mục đích (purposive sampling)

Người nghiên cứu đã xác định trước các nhóm quan trọng trong quần thể để tiến hành thu thập số liệu Các nhóm khác nhau sẽ có tỷ lệ mẫu khác nhau.Đây là cách rất hay dùng trong các điều tra thăm dò, phỏng vấn sâu

Các ứng dụng của các phương pháp chọn mẫu không xác suất

Các cách chọn mẫu không xác suất thường dễ làm, rẻ, nhưng do lựa chọn không ngẫu nhiên nên tính đại diện cho quần thể nghiên cứu rất thấp Nếu như mục đích của nghiên cứu là để đo lường các biến số và từ đó khái quát hóa cho một quần thể thì các kết quả thu được từ mẫu không xác suất thường không đủ cơ sở khoa học cho việc ngoại suy

Do đó cần phải dè dặt khi đưa ra các kết luận

Tuy nhiên, với một số loại nghiên cứu được thiết kế với mục đích thăm dò hoặc muốn tìm hiểu sâu một vấn đề nào đó của quần thể (như kiến thức, động cơ, thái độ, niềm tin ) thì khi đó việc chọn mẫu xác suất là không cần thiết và có thế áp dụng cách chọn mẫu không xác suất

Ngoài ra, trong một số thử nghiệm lâm sàng, mẫu thường phải bao gồm những người tình nguyện, khi đó cách chọn mẫu xác suất không thể áp dụng được

3.3 Sự kết hợp giữa chọn mẫu xác suất và không xác suất

Trong thực tế, có nhiều mẫu được chọn theo nhiều giai đoạn, khi đó cả 2 cách chọn mẫu nêu trên có thể được kết hợp trong cùng một thiết kế nghiên cứu Người điều tra có thể thực hiện một chọn mẫu xác suất trên cơ sở một mẫu không xác suất đã được chọn ở giai đoạn trước Việc quyết định chọn mẫu xác suất hay không tùy thuộc vào tính chất của nghiên cứu, thời gian, kinh phí và nhiều vấn đề khác, nhưng người làm nghiên cứu phải biết được ưu điểm và hạn chế trong các cách chọn mẫu đã sử dụng.Chọn mẫu trong các thử nghiệm lâm sàng hoặc thực nghiệm

Thường được áp dụng khi tác giả muốn so sánh tác dựng của các phương pháp điều trị khác nhau, hiệu quả của các thuốc mới Trong trường này cần phải có ít nhất 2 nhóm nghiên cứu để so sánh.Khi nghiên cứu này được áp dụng trên người, sẽ có rất nhiều vấn đề

về chọn mẫu và đạo đức trong nghiên cứu Người nghiên cứu phải đảm bảo về tính an toàn của can thiệp Mục đích và lợi ích của nghiên cứu cần phải được giải thích rõ ràng cho các đối tượng được chọn vào nghiên cứu và việc tham gia vào nghiên cứu là hoàn toàn tự nguyện Do đặc tính này nên mẫu được chọn trong các nghiên cứu loại này thường thiếu tính đại diện cho quần thể chung, tuy nhiên nó có thể phần nào đại diện cho nhóm cá thể

Trang 24

có cùng mọi tính chất như các cá thể được chọn vào thử nghiệm Một điều cần lưu ý là mục đích ngoại suy ở đây thường không quan trọng bằng mục đích thử nghiệm, do vậy điều quan trọng hơn là phân bố đối tượng vào các nhóm nghiên cứu sao cho ngẫu nhiên (randomization)

3.5 Một số sai lệch (bias) thường gặp khi chọn mẫu và cách khắc phục

Đây là một loại sai số hệ thống trong quá trình chọn mẫu dẫn đến sự sai lạc kết quả nghiên cứu.Các sai lệch này là hậu quả của quá trình chọn mẫu không đúng làm cho mẫu thiếu khả năng đại diện.Có thể có các loại sai lệch thường gặp sau

3.5.1 Sai số không đáp ứng (non response)

Là hiện tượng một số cá thể trong mẫu từ chối tham gia nghiên cứu Thông thường nhóm từ chối này có một số tính chất khác với nhóm tham gia, điều đó làm mẫu nghiên cứu trở nên thiếu tính đại diện, mặc dù trước đó nó đã được lựa chọn rất ngẫu nhiên Loại sai lệch này rất hay gặp trong các thử nghiệm lâm sàng hoặc một số loại điều tra Sai số này có thể khắc phục bằng các cách sau:

Chuẩn hóa các phương pháp thu thập số liệu: Các bảng kiểm cho phỏng vấn, bộ câu hỏi phải được thử test và sửa lại cho phù hợp

Giải thích kỹ cho các đối tượng trước khi thu thập số liệu, nhất là với các nghiên cứu thử nghiệm

Nếu không đáp ứng do vắng mặt thì ngưòi điều tra phải quay lại gặp bằng được Nêu đôi tượng không muôn hợp tác, thì cân phải xem xét lại các đối tượng này để tìm ra các đặc điểm khác với những đối tượng tham gia

Có thể chọn thêm để thay thế những người không tham gia, tuy nhiên điều này chỉ nên làm khi lí do của sự vắng mặt không liên quan đến chủ đề nghiên cứu

3.5.2 Nghiên cứu với người tình nguyên

Thông thường những người tình nguyện tham gia một nghiên cứu nào đó thường quan tâm với vấn đề đang được nghiên cứu hơn những người không tình nguyện Đó là nguồn phát sinh ra các sai sót Trong các nghiên cứu thử nghiệm lâm sàng hoặc can thiệp,

để hạn chế sai sót này, người ta có thể dùng giải pháp “mù” (blinding), thuốc giả dược (placebo) hoặc phân nhóm ngẫu nhiên (randomization)

3.5.3 Mẫu chỉ bao gồm các bệnh nhân đến khám

Những bệnh nhân này thường có những đặc tính khác với những bệnh nhân muốn điều trị bệnh tại nhà

Trang 25

3.5.4 Sai số do mùa

Là những sai số gặp phải khi điều tra một số bệnh chịu ảnh hưởng của thời tiết, ví

dụ sởi hoặc tiêu chảy

3.5.5 Sai số Tarmac

Một số vùng được chọn cho nghiên cứu vì dân cư ở đó dễ tiếp cận, có thể sẽ có sự khác biệt một cách hệ thống giữa dân vùng này và vùng khác

3.6 Đạo đức trong việc chọn mẫu nghiên cứu

Vấn đề đạo đức trong nghiên cứu cần phải được cân nhắc kỹ nhất là trong các thử nghiệm lâm sàng hoặc nghiên cứu can thiệp Nếu can thiệp là tốt thì nhóm chứng sẽ mất

cơ hội để được hưởng sự can thiệp, còn nếu can thiệp có tác dụng phụ nguy hiếm thì nhóm thử nghiệm có nguy cơ cao hơn

4 CỠ MẪU TRONG NGHIÊN CỨU

4.1 Các yếu tố ảnh hưởng đến cỡ mẫu nghiên cứu

Một trong số các câu hỏi khó trả lời nhất khi làm một đề cương nghiên cứu là cỡ mẫu

sẽ là bao nhiêu nếu một nghiên cứu mẫu được thực hiện? Câu trả lời cho vấn đề này tùy thuộc vào một số yếu tố sau:

Loại thiết kế nghiên cứu: Có các công thức tính cỡ mẫu khác nhau với mỗi loại thiết

kế nghiên cứu Thông thường các loại nghiên cứu dọc (longitudinal) thường yêu cầu cỡ mẫu cao hơn loại nghiên cứu ngang (cross-sectional study) Trong nghiên cứu thăm dò, cỡ mẫu nhiều khi không phải là vấn đề quan trọng vì quá trình ngoại suy tham số mẫu là không cần thiết

+ Loại phương pháp chọn mẫu: Nhìn chung thiết kế mẫu chùm yêu cầu cỡ

mẫu lớn hơn thiết kế mẫu khác

+ Độ lớn của tham số được nghiên cứu: Sự kiện nghiên cứu càng hiếm thì cỡ

mẫu càng phải cao (cho các biến định tính)

+ Đặc tính biến thiên của tham số nghiên cứu: Sự khác nhau của tham số này

giữa các cá thể trong quần thể càng lớn thì cỡ mẫu càng phải nhiều Mức độ sai lệch cho phép giữa tham số mẫu và tham số quần thể càng nhỏ thì cỡ mẫu càng lớn

+ Kế hoạch phân tích số liệu: Phân tích số liệu đa biến (multivariate) yêu cầu

cỡ mẫu lớn hơn phân tích đơn biến (univariate) Phân tích tầng yêu cầu cỡ mẫu

Trang 26

Nếu người nghiên cứu muốn khảo sát nhiều biến số trong cùng một nghiên cứu thì

cỡ mẫu phải được xác định riêng với từng biến sau đó lựa chọn cỡ mẫu lớn nhất

Khả năng thực thi của nghiên cứu thường rất quan trọng trong việc chọn cỡ mẫu như: kinh phí hiện có, nhân lực (số và chất lượng), việc đi lại, thời gian dành cho nghiên cứu

4.2 Công thức tính cỡ mẫu

4.2.1 Nghiên cứu dựa trên ước lượng khoảng

Công thức ước tính cỡ mẫu cho 1 trung bình

Công thức ước tính cỡ mẫu cho 1 tỷ lệ

Trang 27

Cỡ mẫu so sánh 2 tỷ lệ

4.2.1 Nghiên cứu dựa trên kiểm định giả thuyết

Cỡ mẫu cho nghiên cứu bệnh chứng

Cỡ mẫu cho nghiên cứu thuần tập

Trang 28

TÀI LIỆU THAM KHẢO

1 Đào Văn Dũng (2020) Phương Pháp Nghiên Cứu Khoa Học-Nghiên Cứu Hệ Thống

Y Tế, NXB Y học

2 Lưu Ngọc Hoạt (2013) Phương pháp Nghiên cứu sức khỏe cộng đồng, NXB Y học

3 Lưu Ngọc Hoạt (2017) Thống kê sinh học & Nghiên cứu Y học, NXB Y học

4 Hoàng Văn Minh (2018) Phương pháp nghiên cứu trong bệnh viện, NXB Y học

5 Hoàng Văn Minh, Lưu Ngọc Hoạt, Đỗ Văn Dũng, Võ Văn Thắng (2017) Khái niệm

và thuật ngữ cơ bản sử dụng trong các nghiên cứu khoa học sức khỏe định lượng,

NXB Y học

6 Nguyễn Văn Tuấn (2018) Y học thực chứng, NXB Y học

Trang 29

BÀI 6 SAI SỐ VÀ NHIỄU

NỘI DUNG HỌC TẬP

1 TỔNG QUAN

Một nghiên cứu được cho là thành công khi kết quả nghiên cứu có tính ứng dụng cao, đưa ra được các bằng chứng khoa học tạo tiền đề cho các nghiên cứu cao hơn, sâu hơn hay đưa ra các bằng chứng là cơ sở cho một phương pháp điều trị mới hay một chính sách

y tế mới Trong mỗi nghiên cứu, số liệu để từ đó đưa ra được các kết quả nghiên cứu hay các bằng chứng đóng một vai trò quan trọng hay nói cách khác số liệu chính là yếu tố quyết định sự thành công của nghiên cứu Bộ số liệu tốt phù hợp với mục tiêu nghiên cứu sẽ cho

kết quả chính xác, bằng chứng chính xác Theo định nghĩa “Số liệu là các giá trị định tính hay định lượng là cơ sở cho các tính toán và đo lường”, số liệu là cơ sở để từ đó có thể

đưa ra các thông tin và kiến thức Từ các số liệu thu thập được, người nghiên cứu phải phân tích, tính toán và phiên giải để chuyển các số liệu thu thập được thành các thông tin

có ý nghĩa hay chính là các bằng chứng khoa học cho việc ra quyết định của các nhà lập sách Khi đề cập đến số liệu thông thường người ta nghĩ ngay đến quá trình thu thập số liệu Tuy nhiên đây chỉ là một bước trong toàn bộ quá trình nghiên cứu Đê hoàn thành một nghiên cứu, người nghiên cứu phải trải qua nhiều giai đoạn: thiết kế nghiên cứu, thu thập số liệu, xử lý, phân tích số liệu, viết báo cáo và chất lượng số liệu liên quan đến ba trong bốn giai đoạn này:

Một bộ số liệu đảm bảo chất lượng là một bộ số liệu hoàn chỉnh (được thu thập một cách đầy đủ trên cơ sở bộ công cụ thu thập số liệu được thiết ke khoa học), đáng tin cậy (quá trình thu thập đảm bảo chính xác, tin cậy), được xử lý chính xác (bộ số liệu được làm sạch, mã hóa và xử lý chính xác) Một bộ số liệu chất lượng được đảm bảo bởi:

MỤC TIÊU HỌC TẬP

Sau khi học xong bài này sinh viên có khả năng:

1 Nêu được các khái niệm về số liệu và chất lượng số liệu

2 Nêu được khải niệm về các loại sai số

3 Liệt kê được các sai sót trong các giai đoạn nghiên cứu và biện pháp khắc phục

Trang 30

- Các giả thuyết nghiên cứu rõ ràng

- Bộ câu hỏi được chuẩn bị tốt

Các công cụ, bảng kiểm giám sát cần được tuân thủ nghiêm ngặt Trên thực tế, khi

đề cập đến chất lượng số liệu, giai đoạn thu thập số liệu thường được đề cập đến đầu tiên, trong khi các hoạt động làm sạch số liệu, xử lý số liệu cần được quan tâm không kém Do

đó để đảm bảo có một bộ số liệu có chất lượng, chất lượng số liệu phải được quan tâm ở

cả ba giai đoạn

Một bộ số liệu có chất lượng đòi hỏi trách nhiệm, sự quan tâm không phải chỉ của nghiên cứu viên chính, chủ nhiệm đề tài hay giám đốc dự án mà phải có sự tham gia của các điều tra viên, những người tham gia nhập liệu, các nhà thống kê, nghiên cứu viên tham gia phân tích số liệu, nhân viên lưu trữ số liệu Chính vì vậy người nghiên cứu cân phải nắm được thực sự nghiên cứu đã được tiến hành như thế nào vì người nghiên cứu không chỉ chịu trách nhiệm triển khai nghiên cứu mà còn có trách nhiệm phiên giải toàn bộ các kết quả nghiên cứu thu được Do đó, một khi kiểm soát được chất lượng của toàn bộ các giai đoạn sẽ giúp người nghiên cứu hiểu rõ ý nghĩa thực sự của từng số liệu, nắm được điểm mạnh, điểm yếu và những điểm đáng chú ý của quá trình thu thập số liệu từ đó có những quyết định hợp lý trong phân tích và phiên giải số liệu

2 CÁC LOẠI SAI SỐ

2.1 Khái niệm về sai số

Sai số được định nghĩa là bất kỳ sai lầm nào xảy ra trong quá trình thiết kế, triển khai và phân tích số liệu của một nghiên cứu mà kết quả dẫn đến ước lượng sai về mối liên quan giữa yếu tố nguy cơ và bệnh

2.2 Phân loại sai số

Đối với các nghiên cứu dịch tễ học, phổ biến có các sai số ngẫu nhiên, sai số hệ thống và yếu tố nhiễu làm ảnh hưởng đến kết quả nghiên cứu

2.2.1 Sai số ngẫu nhiên:

Định nghĩa: Sai số ngẫu nhiên còn gọi là sai số do may rủi, xảy ra trong quá trình

chọn mẫu nghiên cứu Trong một quần thể có một tập hợp N cá thể, với cùng một cỡ mẫu, cùng một cách chọn mẫu, ta có thể lấy được vô số các mẫu ngẫu nhiên có n cá thể Do vậy,

sẽ có những mẫu nghiên cứu không giống như quần thể nghiên cứu ban đầu Mẫu nghiên cứu sẽ chỉ được coi là đại diện cho quần thể khi nó có cỡ mẫu đủ lớn và đại diện cho quần

Trang 31

thể nghiên cứu Sai số ngẫu nhiên sẽ xảy ra nếu ta không chọn được mẫu nghiên cứu như vậy

Nguồn sai số: Sai số ngẫu nhiên chỉ liên quan đến quá trình tính toán cỡ mẫu và

chọn mẫu nghiên cứu

Cách khắc phục: Để khắc phục sai số ngẫu nhiên, cần thiết phải tăng cỡ mẫu đủ

lớn, thích hợp đủ để giảm sai số Tuy nhiên không thể tăng cỡ mẫu quá lớn tới gần bằng hay bằng quần thể nghiên cứu Áp dụng các kỹ thuật chọn mẫu đúng, phù hợp sao cho mẫu nghiên cứu là hình ảnh thu nhỏ của quần thế nghiên cứu

Đánh giá vai trò của yếu tố may rủi: Sử dụng hai kỹ thuật là kiểm định giả thuyết

và ước lượng khoảng tin cậy

Kiểm định giả thuyết là phương pháp giúp đánh giá sự khác biệt của một mẫu nghiên cứu so với kết quả quan sát được của một nghiên cứu dựa trên xây dựng một giả thuyết vô hiệu (H0) phát biểu không có sự khác biệt, và giả thuyết của người nghiên cứu (Ha)là có sự khác biệt Để đánh giá sự khác biệt (chấp nhận hay bác bỏ H0) cần phải làm 1 test ý nghĩa thống kê

Ước lượng khoảng tin cậy, Giá trị xác suất P phụ thuộc vào 2 yếu tố: độ mạnh của

sự kết hợp và cỡ mẫu Do đó mà có thể có những trường hợp chỉ có sự khác biệt rất nhỏ nhưng vẫn có thể có ý nghĩa thống kê nếu cỡ mẫu đủ lớn Ngược lại, có thể có sự khác biệt lớn nhưng không đạt ý nghĩa thống kê nếu cỡ mẫu nhỏ Vì vậy để đưa ra một quyết định thống kê phù hợp, người ta tính khoảng tin cậy (CI - Confidence Interval)

Khoảng tin cậy biểu thị một khoảng giới hạn nào đó mà độ lớn thực sự của kết hợp

sẽ nằm trong khoảng đó với một mức đảm bảo mong muốn Khoảng tin cậy có thể cung cấp thông tin của trị số P-value, cho biết ý nghĩa thống kê của sự kết hợp Nếu trị số zero nằm trong khoảng tin cậy 95% thì trị số P tương ứng sẽ lớn hơn 0,05 Nếu trị số zero không nằm trong khoảng tin cậy thì trị số P tương ứng sẽ nhỏ hơn 0,05 và kết hợp là có ý nghĩa thống kê

2.2.2 Sai số hệ thống

Định nghĩa: Sai số hệ thống là sai số xảy ra trong bất kỳ giai đoạn nào của quá trình

nghiên cứu mà không bao gồm sai số ngẫu nhiên Sai số hệ thống làm sai lệch ước lượng

sự kết hợp giữa phơi nhiễm và bệnh Một số loại sai số hệ thống như:

Sai số lựa chọn xảy ra khi chọn không đúng đối tượng nghiên cứu do không có tiêu

chuẩn chẩn đoán rõ ràng hay là do chẩn đoán nhầm

Trang 32

Sai số nhớ lại do trí nhớ của các cá thể khác nhau và do nhận thức của các đối tượng

khác nhau Loại sai số này thường xảy ra trong các nghiên cứu bệnh chứng và các nghiên cứu thuần tập hồi cứu

Sai số thu thập thông tin hay sai số phỏng vấn: xảy ra khi cân, đo, hỏi không đúng

với đặc tính của biến số cần đo lường

Sai số bỏ cuộc xảy ra trong các nghiên cứu thuần tập tương lai do không ý thức

được tầm quan trọng của nghiên cứu, do chuyển chỗ ở hay do chết

Sai số phân loại (xếp lẫn): Một thể loại sai số đặc biệt khác trong các sai số quan

sát là sai số phân loại, nó xảy ra khi người nghiên cứu phân loại nhầm lẫn hoặc về tình trạng phơi nhiễm hoặc về tình trạng bệnh của những người tham gia nghiên cứu

Sai số khai báo: do vấn đề nghiên cứu quá nhạy cảm hay mang tính bí mật mà các

đối tượng nghiên cứu không muốn nói sự thật

Ngoài ra còn rất nhiều sai số hệ thống khác ảnh hưởng đến kết quả nghiên cứu như sai số nảy sinh khi nhập số liệu vào máy tính

Hạn chế các sai số hệ thống: Muốn hạn chế sai số hệ thống thì cần phải tuân thủ

thật nghiêm ngặt thiết kế nghiên cứu và các quy trình nghiên cứu Dựa vào nguyên nhân gây ra sai số hệ thống mà đề ra cách hạn chế sai số

2.2.3 Sai số do nhiễu

Định nghĩa: Nhiễu là yếu tố vừa liên quan đến bệnh vừa có liên quan đến yếu tố

nguy cơ trong mối quan hệ nhân quả mà ta khảo sát

Trong thực tế có khá nhiều yếu tố nhiễu thường gặp và dễ nhìn thấy như tuổi, giới, nghề nghiệp, trình độ văn hoá Tuy nhiên, có những yếu tố nhiễu thường hay bị bỏ qua

do khó nhìn thấy, và nó phụ thuộc vào từng mục đích nghiên cứu

Ví dụ, nghiên cứu theo dõi tình hình mắc bệnh và việc sử dụng dịch vụ y tế của người dân Một số yếu tố nhiễu dễ thấy đó là tuổi, giới tính, nghề nghiệp, dân tộc, trình độ văn hoá và đặc biệt là yêu tô tuôi vì trẻ càng nhỏ thì sử dụng dịch vụ y tế càng nhiều Tuy nhiên, một yếu tố nhiễu khác khó thấy và có thể bị bỏ qua là mức độ nặng/nhẹ của bệnh Bệnh càng nặng thì người dân càng sử dụng dịch vụ y tế nhà nước càng nhiều Yếu

tố kinh tế cũng là yếu tố nhiễu ảnh hưởng rất lớn đến việc sử dụng dịch vụ y tế

Cách hạn chế nhiễu

Trong quá trình thiết kế nghiên cứu, có thể khử yếu tố nhiễu bằng cách sử dụng đon độc hoặc phối hợp các kỹ thuật sau:

Trang 33

- Kỹ thuật ngẫu nhiên hoá trong các nghiên cứu can thiệp để phân bổ các cá thể vào các nhóm can thiệp và đối chứng

- Thu hẹp tiêu chuẩn tham gia nghiên cứu, nghĩa là chọn các cá thế tương đối giống nhau về các đặc trưng đề nghiên cứu

- Ghép cặp là kỹ thuật loại bỏ nhiễu tiềm ẩn quan trọng, hiệu quả nhất, nó loại bỏ nhiễu bằng cách chọn lựa các cá thể vào nghiên cứu sao cho nhiễu bị triệt tiêu hoàn toàn Tuy nhiên kỹ thuật này mang nhiều hạn chế Tốn kém về thời gian và chi phí, không thể đánh giá được hậu quả của một yếu tố nhiễu nhất định, không thế loại trừ được các yếu tố nhiễu không được thấy trước

Ngoài những kỹ thuật khử yếu tố nhiễu từ giai đoạn thiết kế kể trên, trong quá trình phân tích cũng có những kỹ thuật loại bỏ nhiễu, quan trọng nhất là kỹ thuật phân tầng và phân tích đa biến, đây là những kỹ thuật phức tạp và khó làm

3 CÁC SAI SÓT THƯỜNG GẶP TỪNG GIAI ĐOẠN NGHIÊN CỨU VÀ CÁC BIỆN PHÁP KHẮC PHỤC

3.1 Trong giai đoạn thiết kế nghiên cứu

Trong giai đoạn thiết kế nghiên cứu, sau khi đã xác định được mục tiêu nghiên cứu, người nghiên cứu cần xác định những biến số cần thu thập để đạt được mục tiêu nghiên cứu Từ danh sách các biến số cần thu thập người nghiên cứu sẽ phải lựa chọn phương pháp thu thập thông tin và thiết kế công cụ thu thập thông tin phù hợp với từng loại biến

số trước khi lên kế hoạch thu thập số liệu tại thực địa

Có thê nói chât lượng số liệu phụ thuộc vào chât lượng của công cụ thu thập số liệu Lựa chọn phương pháp thu thập số liệu thích hợp đảm bảo tính chính xác của số liệu cũng như tính khả thi của nghiên cứu Để bộ công cụ được thiết kế phù hợp với mục tiêu nghiên cứu và sát với thực tế nên thực hiện theo các bước sau:

+ Phỏng vấn một số cá nhân (có thể là đối tượng nghiên cứu hoặc các cá thể có những điểm tương đồng với đối tượng nghiên cứu)

+ Ghi chép hoặc ghi âm lại các cuộc phỏng vấn + Gỡ băng, mã hóa các số liệu thu được

+ Phân tích, phiên giải các nội dung thu được + Thiết kế bộ câu hỏi

+ Thử nghiệm bộ câu hỏi

Ngày đăng: 28/06/2023, 21:32

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Đào Văn Dũng (2020) Phương Pháp Nghiên Cứu Khoa Học-Nghiên Cứu Hệ Thống Y Tế, NXB Y học Sách, tạp chí
Tiêu đề: Phương Pháp Nghiên Cứu Khoa Học-Nghiên Cứu Hệ Thống Y Tế
Tác giả: Đào Văn Dũng
Nhà XB: NXB Y học
Năm: 2020
2. Lưu Ngọc Hoạt (2013) Phương pháp Nghiên cứu sức khỏe cộng đồng, NXB Y học Sách, tạp chí
Tiêu đề: Phương pháp Nghiên cứu sức khỏe cộng đồng
Tác giả: Lưu Ngọc Hoạt
Nhà XB: NXB Y học
Năm: 2013
3. Lưu Ngọc Hoạt (2017) Thống kê sinh học &amp; Nghiên cứu Y học, NXB Y học Sách, tạp chí
Tiêu đề: Thống kê sinh học & Nghiên cứu Y học
Tác giả: Lưu Ngọc Hoạt
Nhà XB: NXB Y học
Năm: 2017
4. Hoàng Văn Minh (2018) Phương pháp nghiên cứu trong bệnh viện, NXB Y học Sách, tạp chí
Tiêu đề: Phương pháp nghiên cứu trong bệnh viện
Tác giả: Hoàng Văn Minh
Nhà XB: NXB Y học
Năm: 2018
5. Hoàng Văn Minh, Lưu Ngọc Hoạt, Đỗ Văn Dũng, Võ Văn Thắng (2017) Khái niệm và thuật ngữ cơ bản sử dụng trong các nghiên cứu khoa học sức khỏe định lượng, NXB Y học Sách, tạp chí
Tiêu đề: Khái niệm và thuật ngữ cơ bản sử dụng trong các nghiên cứu khoa học sức khỏe định lượng
Tác giả: Hoàng Văn Minh, Lưu Ngọc Hoạt, Đỗ Văn Dũng, Võ Văn Thắng
Nhà XB: NXB Y học
Năm: 2017
6. Nguyễn Văn Tuấn (2018) Y học thực chứng, NXB Y học Sách, tạp chí
Tiêu đề: Y học thực chứng
Tác giả: Nguyễn Văn Tuấn
Nhà XB: NXB Y học
Năm: 2018

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w