KHOẢNG TIN CẬY Trong nghiên cứu nhiều khi tìm được giá trị p vẫn chưa thể có kết luận về ý nghĩa thống kê một cách chắc chắn vì nếu các giá trị xung quanh trị số trung bình hay giá trị ư
Trang 1KHOẢNG TIN CẬY
Trong nghiên cứu nhiều khi tìm được giá trị p vẫn chưa thể có kết luận về ý nghĩa thống kê một cách chắc chắn vì nếu các giá trị xung quanh trị số trung bình hay giá trị ước lượng có chứa phần nhiều hay ít giá trị của quần thể thật hay không Nếu chưa nhiều và hội tụ gần thì chứng tỏ giá trị thu được tập trung và đại diện hoặc ngược lại Khi tìm được 2 cực của khoảng tin cậy là ta tìm được giới hạn tin cậy Thông thường trong nghiên cứu người ta hay giới hạn khoảng tin cậy ở mức 95% (p = 0,05) nên gọi là CI 95% để đánh giá sự may rủi
Đối với các phân phối chuẩn hoặc có hệ thống thì khoảng tin cậy được tính theo công thức sau:
(Nếu CI 95% thì tbtd = 1,96 (dựa theo biểu đồ Gauss)
Trong đó:
B
A X
X − là các giá trị trung bình ngẫu nhiên hoặc mẫu chứng
Scb là đọ lệnh chung
tbtd: Trị số phân phối t ở các bậc tự do với ý nghĩa thống kê có mức ấn định Đối với các biến rời rạc khoảng tin cậy được tính trên cơ sở giá trị của nguy cơ tương đối RR hoặc tỷ xuất chênh OR Cách này có sự phức tạp của sự hiển diện ở công thức một cách logarit tự nhiên với giá trị tương quan khác nhau Để đơn giản người ta dựa trên trắc nghiệm đã tính được χ2 để tính xấp xỉ và tìm phương sai theo công thức sau:
z: Là trị số tương ứng với mức tin cậy mong muốn (1,645; l,96; 2,3261 2,576)
Khoảng tin cậy có thể cung cấp các thông tin của trị số p, nên khoảng rộng của khoảng tin cậy dao động lớn, nhỏ có ý nghĩa rõ rệt và liên quan đến lực và cơ mẫu Cỡ mẫu càng lớn thì ước lượng càng ổn định và khoảng tin cậy càng hẹp và ngược lại, chính vì vậy giá trị tin cậy cũng được xác định
Trang 2SAI SỐ QUAN TRẮC
1 Ba loại sai số
Ta biết rằng, dù với sự quan trắc khá chính xác cùng một loại đại lượng, các kết quả của các quan trắc riêng biệt vẫn sai khác nhau, và do đó có chứa sai số
Hiệu x - a giữa kết quả quan trắc x và giá trị chân thực a của đại lượng được quan trắc gọi là sai số quan trắc Đây lại một trong những bài toán cơ bản của việc xử lý bằng toán học các kết quả thực nghiệm chính là ước lượng giá trị chân thực của đại lượng quan trắc theo các kết quả đã thu được Để giải bài toán đó, cắn biết các tính chất cơ bản của sai số quan trắc và biết cách sử dụng chúng
1.1 Sai số thô
Sai số sinh ra do vi phạm các điều kiện cơ bản của công việc quan trắc hoặc do
sơ xuất của người làm thí nghiệm Khi phát hiện có sai số thô, cần bỏ ngay kết quả quan trắc và quan trắc lại Ta luôn luôn xem tằng chỉ giữ lại để xử lý bằng toán học các kết quả quan trắc không chứa sai số thô
1.2 Sai số hệ thống
Các sai số quan trắc do một số lớn nguyên nhân mang nhiều vẻ khác nhau gây nên Ví dụ do không điều chính chính xác dụng cụ, do thay đổi của các điều kiện bên ngoài, ta có thể dễ dàng trừ bỏ các loại sai số hệ thống bằng cách dựa vào các hiệu chỉnh với sự tương ứng trong kết quả quan trắc Ta xem rằng ngay từ đầu của việc sử
lý bằng toán học các kết quả quan trắc, tất cả các sai số hệ thống đều đã được phát hiện
và trừ bỏ
1.3 Sai số ngẫu nhiên
Sai số quan trắc còn lại sau khi đã khử tất cả các sai số hệ thống được gọi là sai
số ngẫu nhiên Sai Bố ngẫu nhiên gây nên bởi một số rất lớn các nhân tố, mà tác dụng của chúng bé đến mức ta không thể tách riêng và tính riêng biệt cho từng nhân tố được Bằng các phương pháp của lý thuyết xác suất, có thể tính được ảnh hưởng của chúng đến việc ước lượng giá trị chân thực của các đại lượng được quan trắc
2 Phân phối của sai số ngẫu nhiên trong các quan trắc
Sai số ngẫu nhiên trong các quan trắc được đặc trưng bởi một luật phân phối xác định
Trong mô hình lý thuyết xác xuất, có sai số ngẫu nhiên z = x - a cũng được xem như là các đại lượng ngẫu nhiên (hay là biến ngẫu nhiên) có thể nhận các giá trị thực tuỳ ý đồng thời mỗi khoảng (l1, z2) tương ứng với một số hoàn toàn xác định được gọi
là xác suất để đại lượng ngẫu nhiên z rơi vào khoảng đó, và ký hiệu là p (z < z < z )
Trang 3hoặc p (z ∈ z1 z2) xác Suất đó là Sự lý tưởng hoá của tần suất tương đối của sự rơi vào khoảng (z1, z2) tức là trong thực hành, chính tần suất tương đối đã nêu trên đây gần với xác suất đó
Quy tắc cho phép tìm xác suất p (z1 < z < z2) đối với khoảng (z1, z2) tuỳ ý được gọi là luật phân phối xác suất của đại lượng ngẫu nhiên z Ta có thể viết dưới dạng tích phân:
Trong đó p (z) là một hàm không âm nào đó, được chuẩn hoá bởi điều kiện:
Hàm đó xác định hoàn toàn luật phân phối xác suất tương ứng và được gọi là mật
độ xác suất (hay gọi mật độ phân phối)
3 Phương pháp khử sai số thô
3.1 Phương pháp khử sai số thô khi biết δ
Ta ký hiệu giá trị đột xuất là XA còn tất cả các giá trị còn lại là X1,
và so sánh giá trị tuyệt đối của hiệu XA− X với đại lượng, đối với tỷ số thu được:
Ta tính xác suất để cho tỷ số đang xét nhận một cách ngẫu nhiên giá trị không bé hơn 1 với điều kiện giá trị XA không chứa sai số thô Nếu như xác suất tính được bằng cách đó rất bé, thì giá trị “đột xuất” chứa sai số thô và cần phải bỏ giá trị đó trong việc
sử lý tiếp theo các kết quả quan trắc
Ví dụ: Giả sử trong số 41 kết quả quan trắc độc lập được tiến hành và sau khi tính toán ta có kết quả s = 0,133; Phát hiện có giá trị đột xuất x* = 6,866, đồng thời giá trị trung bình của 40 kết quả còn lại là X = 6,500 có thể xem rằng giá trị “đột suất” đó chứa sai số và như vậy nó có giá trị nào đó trong việc xử lý các kết quả nghiên cứu về sau không? Trong tình huống này chúng ta phải làm một phép thử đặc hiệu để đánh giá
và sau đó đưa ra hướng giải quyết theo công thức:
Trang 4Giải:
Ta tính xác suất 1 -2 Φ (t) = 0,0066 < 0,007
Độ tin cậy của kết luận p > 0,993 => có thể xem rằng giá trị x* chứa sai số thô và
bỏ giá trị đó trong việc sử lý sau này các kết quả quan trắc
3.2 Phương pháp khử sai số thô khi không biết s
Ta dùng sai số tiêu chuẩn thực nghiệm vì s không tìm thấy trong tài liệu hoặc vì
lý do nào đó mà ta không sử dụng được Công thức áp dụng và cách làm được tiến hành như sau:
Ví dụ: Giả sử n kết quả quan trắc độc lập cùng độ chính xác ta có được giá trị
trung bình x = 6,500 còn sai số tiêu chuẩn thực nghiệm S = 0,133 và giả Bộ quan trắc
lần thứ n + 1 cho kết quả X* = 6,866 Ta đang đứng trước tình huống cần xem xét, lựa chọn vì giá trị trung bình của lần quan trắc ni lớn hơn so với kết quả quan trắc độc lập
Có thể khử kết quả đó khỏi việc xử lý về sau không là điều mà nhà nghiên cứu cần hết sức cân nhắc để sao cho mẫu nghiên cứu không nhỏ đi nếu không cần thiết, ngược lại nếu để thì có làm sai lệch toàn bộ các kết quả nghiên cứu chung đã thu được hay không
Giải:
Nếu số các kết quả chấp nhận được là n = 40 thì tỷ số thu được vượt quá giá trị tới hạn 2,74 với độ tin cậy p = 0,99 và ta có thể khử giá trị x với độ tin cậy của kết luận lớn hơn 0,99 Còn nếu số các kết quả chấp nhận được là hơn 5, tỷ số thu được bé hơn giá trị tới hạn là 2,78 ngay cả với độ tin cậy p = 0,95 ta cũng không nên khử giá trị
x* vì mất quá nhiều số liệu (đây là sự vừa lòng với xác suất p = 5)
Trang 5PHẦN PHỤ LỤC
Bảng 1: Bảng t
P
1 12,706 31,821 63,657 636,619
3 3,182 4,541 5,841 12,924
4 2,776 3,747 4,604 8,610
6 2,447 3,143 3,707 5,595
7 2,365 2,998 3,499 5,408
8 2,306 2,896 3,355 5,401
9 2,262 2,821 3,250 4,781
10 2,228 2,764 3,169 4,587
11 2,201 2,718 3,106 4,437
12 2,179 2,681 3.055 4,318
13 2,160 2,650 3,012 4,221
14 2,145 2,524 3,977 4,140
15 2,131 2,602 2,947 4,073
16 2,120 2,583 2,931 4,015
17 2,110 2,567 2,808 3,965
18 2,101 2,552 2,878 3,922
19 2,093 2,539 2,861 3,883
20 2,086 2,528 2,845 3,850
21 2,080 2,518 2,831 3,819
22 2,074 2,508 2,819 3,792
23 2,069 2,500 2,807 3,767
24 2,064 2,492 2,797 3.745
25 2,060 2,485 2,787 3,725
26 2,056 2,479 2,779 3,707
27 2,052 2,473 2,771 3,690
28 2,048 2,467 2,763 3,674
29 2,045 2,462 2,756 3,659
30 2,042 2,457 2,750 3,646
31 1,960 2,326 2,576 3,291
Trang 6Bảng 2: Bảng χ2
P
1 3,841 5,412 6,635 10,827
2 5,991 7,824 9,210 13,815
3 7,815 9,837 11,315 16,266
4 0488 11,668 13,277 18,467
6 12,592 15,033 16,812 22,457
7 14,067 16,622 18,475 24,322
8 15,507 18,168 20,090 26,125
9 16,019 19,679 21,666 27,877
10 18,367 21,161 23,209 20,588
11 19,675 22,618 24,725 31,261
12 21,026 24,054 26,217 32,909
13 22,362 25,472 27,688 34,528
14 23,685 26,873 29,141 36,123
15 24,996 28,259 30,578 37,697
16 26,296 29,633 32,000 39,252
17 27,587 30,995 33,409 40,790
18 28,869 32,346 34,805 42,312
19 30,144 33,687 36,191 43,820
20 31,410 35,020 37,566 45,315
21 32,871 36,315 38,932 46,797
22 33,921 37,659 40,289 48,268
23 35,172 38,968 41,638 49,728
24 36,415 40,270 42,980 51,179
25 37,652 41,566 44,314 52,620
26 38,885 42,856 45,642 54,052
27 40,113 44,140 46,963 55,476
28 41,337 15,419 48,278 56,893
29 42,557 46,693 49,588 58,302
30 43,773 47,962 50,892 59,703
Trang 7Bảng 3: Bảng hệ số tương quan
P Đtd 0,05 0,02 0,01 0,001
1 0,0877 0,9969 0,9995 0,9999
2 0,9000 0,9500 0,9800 0,9900
3 0,8054 0,8783 0,9343 0,9587
4 0,7293 0,8114 0,8822 0,9172
5 0,6694 0,7545 0,8329 0,8745
6 0,6215 0,7067 0,7887 0,8343
7 0,5822 0,6664 0,7498 0,7977
8 0,5494 0,6319 0,7155 0,7646
9 0,5214 0,6021 0,6851 0,7348
10 0,4973 0,5760 0,6581 0,7079
11 0,4762 0,5529 0,6339 0,6835
12 0,4575 0,5324 0,6120 0,6611
13 0,4409 0,5139 0,5923 0,6411
14 0,4259 0,4973 0,5742 0,6226
15 0,4124 0,4821 0,5577 0,6055
16 0,4000 0,4683 0,5425 0,5897
17 0,3887 0,4555 0,5285 0,5751
18 0,3783 0,4438 0,5155 0,5614
19 0,3687 0,4329 0,5034 0,5487
20 0,3598 0,4227 0,4921 0,5368
21 0,3233 0,3809 0,4451 0,4869
22 0,2960 0,3494 0,4093 0,4487
23 0,2746 0,3246 0,3810 0,4182
24 0,2573 0,3044 0,3578 0,3932
25 0,2428 0,2875 0,3384 0,3721
26 0,2306 0,2732 0,3218 0,3541
27 0,2108 0,2500 0,2948 0,3248
28 0,1954 0,2319 0,2937 0,0317
29 0,1829 0,2172 0,2565 0,2830
30 0,1726 0,2050 0,2422 0,2673
31 0,1638 0,1946 0,2301 0,2540
Trang 8TÀI LIỆU THAM KHẢO
1 Bộ Y tế (2004), Cẩm nang thực hành quản lý và chăm sóc sức khoẻ Nhà xuất
bản Lao động - Xã hội tr 11-93
2 Ngô Như Hoà (1982) Thống kê trong nghiên cứu y học Nhà xuất bản Y học,
tập I, II
3 Nguyễn Đình Khoa (1975) Phương pháp thống kê ứng dụng trong sinh học
Tủ sách Đại học Tổng hợp
4 Nguyễn Xuân Phách và cộng sự (1992) Toán thống kê và tin học trong
nghiên cứu y sinh, dược học Học viện Quân Y
5 Lê Khánh Trai, Hoàng Hữu Như (1974) Ứng dụng xác suất thống kê trong
y sinh học Nhà xuất bản Khoa học Kỹ thuật
6 Dương Đình Thiện (1998) Dịch tễ học Nhà xuất bản Y học
7 Trường Đại học Y khoa Hà Nội (1992) Phương pháp nghiên cứu Bức khỏe
cộng đồng Nhà xuất bản Y học
8 Akhnaarova S (1989), Experiment optimization in chemistry and chemical
engineering Mockva
9 Daliansyah Danil (2006), ProcesB Hazard Analysis Application through
Design for Earlier Incident prevention, The 22st annual conference of the Asia Pacific Occupational safety & health organization Bangkok Thailand B 1 - B 11
10 Jim whiting (2005), The new international safety risk management standard,
The 21st annual conference of the Asia Paciflc Occupational safety & health organization Ban- Indonesia p 1750
11 Joseph Lellouch (1974) Methodes StatistiqueB en experimentation
biologique P Flammation
12 Mendenhall (1974) Introduction to probability and statistics W.P.C Ins
Balmont
Trang 9PHUƠNG PHÁP LUẬN TRONG NGHIÊN CÚU KHOA HỌC Y HỌC
(Giáo trình sau đại học)
NHÀ XUẤT BẢN Y HỌC
352 Đội Cấn Ba Đình Hà Nội ĐT: (04) 7.625922, 7.625934 Fax: (04) 7.625923 -
Chịu trách nhiệm xuất bản:
HOÀNG TRỌNG QUANG
Biên tập và sửa bản in:
BAN BIÊN TẬP SÁCH DẠY NGHỀ - GIÁO TRÌNH
Trình bày bìa:
THANH HUYỀN
In 500 cuốn, khổ 19 x 27 (cm), tại Xí nghiệp in, Nhà xuất bản Lao động - Xã hội Giấy chấp nhận đăng ký kế hoạch xuất bản số 22-2007/CXB/245 151/YH
In xong và nộp lưu chiểu Quý II/2007