[r]
Trang 1TH NG KÊ, BI N S VÀ PHÂN PH IỐ Ế Ố Ố Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng:ứ ủ ề ọ ả
Trình bày đ nh nghĩa c a th ng kê, s li u, thông tin và bi n sị ủ ố ố ệ ế ố
Phân bi t đệ ược các lo i bi n s : đ nh lạ ế ố ị ượng và đ nh tính trong có có bi n s nh giá,ị ế ố ị danh đ nh hay th t ị ứ ự
Xây d ng đự ược b ng phân ph i t n su t cho s li u đ nh tính và đ nh lả ố ầ ấ ố ệ ị ị ượng
L a ch n đự ọ ược các lo i bi u đ hay đ th thích h p đ trình bày s li u đ nh tính vàạ ể ồ ồ ị ợ ể ố ệ ị
đ nh lị ượng
Tính được các s th ng kê tóm t t nh trung bình, trung v , y u v , đ l ch chu n,ố ố ắ ư ị ế ị ộ ệ ẩ
phương sai.
1 Một số định nghĩa
Th ng kê là phố ương pháp khoa h c dùng đ thu th p, tóm t t, trình bày và phân tích sọ ề ậ ắ ố
li u. Phệ ương pháp th ng kê đố ược s d ng trong nghiên c u nh m đ so sánh m tử ụ ứ ằ ể ộ nhóm đ i tố ượng ch không nh m nghiên c u t ng cá nhân đ n l ứ ằ ứ ừ ơ ẻ
S li u: K t qu có đố ệ ế ả ược do vi c quan sát hay thu th p đ c tính hay đ i lệ ậ ặ ạ ượng cácở
đ i tố ượng khác nhau hay th i gian khác nhau.ở ờ
Thí d : Quan sát gi i tính c a các h c viên trong l p, s li u ghi nh n đụ ớ ủ ọ ớ ố ệ ậ ược là:
Nam, nam, n , n , n , nam, n , v.vữ ữ ữ ữ
Thí d : M t nhà nghiên c u đo n ng đ hemoglobin c a 70 thai ph có k t qu nhụ ộ ứ ồ ộ ủ ụ ế ả ư sau:
và nh ng con s này đữ ố ược g i là s li u.ọ ố ệ
C n l u ý s li u ph i liên k t v i m t đ c tính hay đ i lầ ư ố ệ ả ế ớ ộ ặ ạ ượng nh t đ nh. Ghi nh nấ ị ậ
gi i tính ngớ ở ười này, tu i c a ngổ ủ ười khác, qu n áo c a m t ngầ ủ ộ ười khác n a thì k tữ ế
qu này đả ược không ph i là s li u.ả ố ệ
S d ng phử ụ ương pháp th ng kê chúng ta có th tóm t t s li u trên s d ng n ng đố ể ắ ố ệ ử ụ ồ ộ hemoglobin trung bình=11,98 và đ l ch chu n b ng 1.42. S li u độ ệ ẩ ằ ố ệ ược tóm t t, trìnhắ bày hay phân tích b ng phằ ương pháp th ng kê s tr thành thông tin.ố ẽ ở
Trang 22 Biến số và các loại biến số
Bi n s là nh ng đ i lế ố ữ ạ ượng hay nh ng đ c tính có th thay đ i t ngữ ặ ể ổ ừ ười này sang
người khác hay t th i đi m này sang th i đi m khác.ừ ờ ể ờ ể
Nh v y bi n s có th th hi n đ i lư ậ ế ố ể ể ệ ạ ượng hay đ c tính. N u nó th hi n m t đ iặ ế ể ệ ộ ạ
lượng nó được g i là bi n s đ nh lọ ế ố ị ượng. N u nó nh m th hi n m t đ c tính noế ằ ể ệ ộ ặ
được g i là bi n s đ nh tính. ọ ế ố ị
Bi n s đ nh tínhế ố ị
Bi n s đ nh tính còn đế ố ị ược chia làm 3 lo i: bi n s th t , bi n s danh đ nh và bi nạ ế ố ứ ự ế ố ị ế
s nh giá.ố ị
Bi n s th t là bi n s đ nh tính v i các giá tr có th s p x p th t đế ố ứ ự ế ố ị ớ ị ể ắ ế ứ ự ược
Thí d : tình tr ng kinh t xã h i (giàu, khá, trung bình, nghèo, r t nghèo) là bi n s thụ ạ ế ộ ấ ế ố ứ
t b i vì ngự ở ười giàu có đi u ki n kinh t t t h n ngề ệ ế ố ơ ười khá, người khá h n ngơ ườ i trung bình, trung bình h n nghèo, v.vơ
Nh ng thí d khác là h c l c c a h c sinh (gi i, khá, trung bình, kém), tiên lữ ụ ọ ự ủ ọ ỏ ượng (t t,ố khá, x u, t vong).ấ ử
Theo phân lo i tăng huy t áp c a T ch c Y t Th gi i đạ ế ủ ổ ứ ế ế ớ ược trình bày nh sau, theoư phân lo i huy t áp v i các giá tr huy t áp bình thạ ế ớ ị ế ường, tăng huy t áp đ 1, tăng huy tế ộ ế
áp đ 2, tăng huy t áp đ 3 là bi n s th tộ ế ộ ế ố ứ ự
Huy t áp bình thế ường: HA tâm thu ≤139 và HA tâm trương ≤ 89
Tăng huy t áp đ 1: ế ộ HA tâm thu ≤ 179 hay HA tâm trương ≤ 104
Tăng huy t áp đ 2:ế ộ HA tâm thu ≥ 180 hay HA tâm trương >114
Tăng huy t áp đ 3:ế ộ HA tâm thu ≥180 và HA tâm trương ≥ 115 mmHg
Bi n s danh đ nh là bi n s đ nh tính mà giá tr c a nó không th bi u th b ng s màế ố ị ế ố ị ị ủ ể ể ị ằ ố
ph i bi u di n b ng m t tên g i (danh: tên) và các giá tr này không th s p đ t theoả ể ễ ằ ộ ọ ị ể ắ ặ
m t tr t t t th p đ n cao.ộ ậ ự ừ ấ ế
Thí d : Bi n s dân t c v i các giá tr : Kinh, Khmer, Hoa, Chăm,… là bi n s đ nhụ ế ố ộ ớ ị ế ố ị tính vì chúng ta không th s p x p các giá tr này t theo m t tr t t t th p đ n caoể ắ ế ị ừ ộ ậ ự ừ ấ ế hay ngượ ạc l i
M t s thí d khác c a bi n s danh đ nh là tình tr ng hôn nhân (có 4 giá tr : đ c thân,ộ ố ụ ủ ế ố ị ạ ị ộ
có gia đình, li d , góa) nhóm máu (A, B, AB và O).ị
Đôi khi bi n s danh đ nh ch có 2 giá tr : thí d nh s ng hay ch t; có hút thu c lá hayế ố ị ỉ ị ụ ư ố ế ố không hút thu c lá; có suy dinh dố ưỡng hay không suy dinh dưỡng; nam hay n Nh ngữ ữ
bi n s thu c lo i này đế ố ộ ạ ược g i là bi n s nh giá (binary variable)ọ ế ố ị
Mã hoá
Trong phân tích th ng kê, đ ti n vi c nh p s li u hay lí gi i k t qu , ngố ể ệ ệ ậ ố ệ ả ế ả ười ta có
th ánh x (mapping) các giá tr c a bi n đ nh tính vào các con s Vi c này để ạ ị ủ ế ị ố ệ ược g iọ
là mã hóa và c n hi u r ng vi c mã hóa này hoàn toàn có tính ch t áp đ t và các con sầ ể ằ ệ ấ ặ ố
được dùng trong mã hóa không ph n ánh b n ch t c a bi n s danh đ nh.ả ả ấ ủ ế ố ị
Trang 3Gi i tính là bi n s danh đ nh và có hai giá tr là nam và n Chúng ta có th mã hóa gi i tính và ớ ế ố ị ị ữ ể ớ quy ướ c Nam là 1 và N là 2. Tuy nhiên vi c mã hóa này là áp đ t và chúng ta hoàn toàn có th ữ ệ ặ ể quy ướ c Nam là 1 và N là 0. Vi c mã hóa ch nh m giúp vi c nh p s li u và x lí s li u tr ữ ệ ỉ ằ ệ ậ ố ệ ử ố ệ ở nên d dàng h n ch không nh m ph n ánh b n ch t c a bi n s đó ễ ơ ứ ằ ả ả ấ ủ ế ố
Bi n s đ nh lế ố ị ượng
Bi n s đ nh lế ố ị ượng nh m th hi n m t đ i lằ ể ệ ộ ạ ượng và do đó có giá tr là nh ng con s ị ữ ố Thí d : tu i là bi n s liên t c b i vì ta có th nói ngụ ổ ế ố ụ ở ể ười này 20 tu i, ngổ ười kia 32
tu i, v.v.ổ
Nh ng thí d khác là đữ ụ ường huy t, hemoglobin, hematocrite, chi u cao, cân n ng, thuế ề ặ
nh p, v.vậ
3 Phương pháp trình bày số liệu bảng
S li u ghi nh n các đ c tính hay đ i lố ệ ậ ặ ạ ượng có th trình bày thành b ng và b ng nàyể ả ả
được g i là b ng phân ph i t n su t.ọ ả ố ầ ấ
Phân ph i t n su t c a bi n s đ nh tínhố ầ ấ ủ ế ố ị
S li u c a bi n s r i r c có th đố ệ ủ ế ố ờ ạ ể ược trình bày dướ ại d ng m t phân ph i t n su t.ộ ố ầ ấ Phân ph i t n su t là m t b ng ch ra t n su t xu t hi n c a t ng giá tr r i r c c aố ầ ấ ộ ả ỉ ầ ấ ấ ệ ủ ừ ị ờ ạ ủ
bi n s (B ng 1). Nh v y b ng phân ph i t n su t g m 2 c t, m t c t li t kê các giáế ố ả ư ậ ả ố ầ ấ ồ ộ ộ ộ ệ
tr c a bi n s và m t c t trình bày t n su t tị ủ ế ố ộ ộ ầ ấ ương ng c a các giá tr đó.ứ ủ ị
Table 1. Phân ph i gi i tính c a 69 h c sinh l p c m th ố ớ ủ ọ ớ ơ ườ ng tr ườ ng m m non 23 tháng 11, Huy n Hóc ầ ệ môn
Gi iớ S trố ẻ Ph n trămầ
B ng trên là b n phân ph i t n su t c a gi i tính. B i vì gi i tính có 2 giá tr nam vàả ả ố ầ ấ ủ ớ ở ớ ị
n nên ta li t kê 2 giá tr này m t c t. c t th nhì ta ghi t n su t tữ ệ ị ở ộ ộ Ở ộ ứ ầ ấ ương ng c aứ ủ các giá tr này. Ðôi khi b ng phân ph i t n su t có thêm c t ph n trăm nh trong thí dị ả ố ầ ấ ộ ầ ư ụ trên. B ng 2 là m t thí d khác v b ng phân ph i t n su t
Table 2. Ph ươ ng pháp đ đ c a 600 tr trong b nh vi n ỡ ẻ ủ ẻ ệ ệ
Phương pháp đỡ
Trang 4Ðôi khi trong b ng phân ph i ngả ố ười ta không ghi con s th c t c a t n su t mà chố ự ế ủ ầ ấ ỉ ghi nh n ph n trăm. Trong trậ ầ ường h p h p này, ph i ghi rõ s đ i tợ ợ ả ố ố ượng c a toàn bủ ộ phân ph i (s đ i tố ố ố ượng toàn b trong thí d trên là 600)ộ ụ
Phân ph i t n su t c a bi n s đ nh lố ầ ấ ủ ế ố ị ượng
N u bi n s là bi n s liên t c chúng ta không th li t kê t t c các giá tr c a bi nế ế ố ế ố ụ ể ệ ấ ả ị ủ ế
s Trong trố ường h p này chúng ta có th nhóm (làm tròn) giá tr c a bi n s l i.ợ ể ị ủ ế ố ạ
C th các bụ ể ước xây d ng b ng phân ph i t n su t cho bi n s đ nh lự ả ố ầ ấ ế ố ị ượng nh sau:ư 1 Tìm ph m vi (giá tr c c ti u và giá tr c c đ i) c a s li u. Trong thí d vạ ị ự ể ị ự ạ ủ ố ệ ụ ề hemoglobin c a 70 ph n ph m vi là 8,8 đ n 15,1ủ ụ ữ ạ ế
2. Chia ph m vi s li u ra làm n kho ng v i đ r ng c a m i kho ng là d. C n l u ýạ ố ệ ả ớ ộ ộ ủ ỗ ả ầ ư
đ r ng m i kho ng d nên là đ i lộ ộ ỗ ả ạ ượng ch n nh 1, 2, 5, 10 hay 0,5, 0,2 và s cácẵ ư ố kho ng n nên t 512 (trung bình là 78). Trong thí d trên ta có th chia ph m vi raả ừ ụ ể ạ làm 8kho ng v i chi u r ng kho ng b ng 1 đ n v Khi đó các kho ng là: 88,9; 99,9;ả ớ ề ộ ả ằ ơ ị ả 1010,9; 1111,9; 1212,9; 1313,9; 1414,9; 1515,9
3. Ð m các giá tr thích h p vào kho ng đã đ nh trế ị ợ ả ị ước
Hemoglobin
(g/100ml)
Ð mế
1010,9 1111 1111 1111 1111,9 1111 1111 1111 1111 1212,9 1111 1111 1111 1313,9 1111 1111 111
4. Xây d ng b ng phân ph i t n su t v i bi n s và các kho ng giá tr c a bi n s vàự ả ố ầ ấ ớ ế ố ả ị ủ ế ố
t n su t tầ ấ ương ng v i các kho ng giá tr đó. Chúng ta cũng có th thêm vào c t ph nứ ớ ả ị ể ộ ầ trăm và c t ph n trăm tích lũy (n u thích h p)ộ ầ ế ợ
Table 3. Hemoglobin c a 70 ph n ủ ụ ữ
Hemoglobin T nầ
su tấ Ph nầ
trăm Ph n trăm tích
lũy
Trang 51111,9 19 27.14 52.86
Thí d nh n u biên s là chu vi vòng cánh tay c a tr chúng ta có th làm tròn chu viụ ư ế ố ủ ẻ ể vòng cánh tay đ n 1 cm. Khi đó ta có th xem thang đo c a bi n s là r i r c và trìnhế ể ủ ế ố ờ ạ bày b ng phân ph i t n su t c a bi n s (b ng 2).ả ố ầ ấ ủ ế ố ả
Table 4. Phân ph i s đo vòng cánh tay c a 69 tr l p c m th ố ố ủ ẻ ớ ơ ườ ng nhà tr 23 tháng 11, Hóc môn ẻ
Vòng cánh tay T nầ
su tấ Ph nầ
trăm Ph n trăm tích
lũy
4 Các số thống kê mô tả
Vi c trình bày s li u b ng b ng là th a mãn cho các bi n s đ nh tính (c bi n sệ ố ệ ằ ả ỏ ế ố ị ả ế ố danh đ nh và bi n s th t ). Tuy nhiên các s li u đ nh lị ế ố ứ ự ố ệ ị ượng có th tóm t t h n n aể ắ ơ ữ
b ng các s th ng kê mô t Có hai lo i th ng kê mô t : th ng kê mô t khuynhằ ố ố ả ạ ố ả ố ả
hướng t p trung và th ng kê mô t tính phân tán.ậ ố ả
Th ng kê mô t khuynh hố ả ướng t p trungậ
Th ng kê mô t khuynh hố ả ướng t p trung có th là trung bình (mean), trung v (median)ậ ể ị
và y u v (mode). Nh ng th ng kê này cho bi t giá tr tiêu bi u cho s li u.ế ị ữ ố ế ị ể ố ệ
Thí d : có hai lo i thu c h áp A và B. Gi s có 5 đ i t ụ ạ ố ạ ả ử ố ượ ng sau khi s d ng thu c h áp A ử ụ ố ạ
s có huy t áp 110 115 120 125 130 và 5 đ i t ẽ ế ở ố ượ ng khác sau khi s d ng thu c h áp B ử ụ ố ạ
s có huy t áp 120 125 130 135 140. Con s tiêu bi u nh t đ cho bi t tác d ng c a ẽ ế ố ể ấ ể ế ụ ủ thu c A là huy t áp trung bình sau khi s d ng thu c A và là 120. Con s huy t áp trung bình ố ế ử ụ ố ố ế này th p h n huy t áp trung bình sau khi s d ng thu c B cho bi t thu c A có tác d ng m nh ấ ơ ế ử ụ ố ế ố ụ ạ
h n ơ
Trung bình c a s li u, đủ ố ệ ược kí hi u là ệ x (đ c là x g ch) là t ng các giá tr c a sọ ạ ổ ị ủ ố
li u chia cho s l n quan sát (N).ệ ố ầ
Trang 6x
Thí d : S li u v huy t áp tâm thu c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135,
150. Huy t áp tâm thu trung bình s là 132 ế ẽ
132 5
150 135 130 125 120
N
x
Do không th th c hi n các phép toán s h c trên các bi n s đ nh tính (danh đ nh vàể ự ệ ố ọ ế ố ị ị
th t ) chúng ta ch có th tính trung bình cho s li u c a bi n s đ nh lứ ự ỉ ể ố ệ ủ ế ố ị ượng
N u chúng ta s p x p s li u theo th t , giá tr đ ng gi a đế ắ ế ố ệ ứ ự ị ứ ở ữ ược g i là trung v ọ ị
N u có hai giá tr cùng đ ng gi a, trung bình c ng c a hai giá tr này là trung v ế ị ứ ở ữ ộ ủ ị ị
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130,
135, 150. Trung v c a huy t áp tâm thu là giá tr đ ng gi a và b ng 130 ị ủ ế ị ứ ở ữ ằ
S li u v chi u cao (cm) c a 6 ng ố ệ ề ề ủ ườ i là 153, 155, 160, 162, 165, 161. Ð tính ể trung v , tr ị ướ c tiên chúng ta ph i s p x p s li u này: 153, 155, 160, 161, 162, ả ắ ế ố ệ
165. Do có hai giá tr 160 và 161 cùng gi a, trung v s là (160+161)/2 = ị ở ữ ị ẽ 160,5 cm
Ðôi khi người ta ch n con s th ng kê tiêu bi u là y u v (mode). Y u v là giá tr xu tọ ố ố ể ế ị ế ị ị ấ
hi n ph bi n nh t (có t n su t cao nh t).ệ ổ ế ấ ầ ấ ấ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130,
135, 150. Trong tr ườ ng h p này không có y u v ợ ế ị
Ði m s c a 5 h c sinh là 5, 5, 6, 7, 9. Y u v c a đi m s là 5 ể ố ủ ọ ế ị ủ ể ố Trong m t s li u c th , có th không có y u v , có th có m t y u v ho c hai hayộ ố ệ ụ ể ể ế ị ể ộ ế ị ặ nhi u y u v Ðây là khuy t đi m chính c a s th ng kê này. Do v y ngề ế ị ế ể ủ ố ố ậ ười ta thườ ng
ch dùng trong các trỉ ường h p đ c bi tợ ặ ệ
Có th s d ng trung bình, trung v hay y u v cho bi n s đ nh lể ử ụ ị ế ị ế ố ị ượng. Khi bi n sế ố
đ nh lị ượng có phân ph i bình thố ường (hình chuông) thì ba con s này x p x b ng nhauố ấ ỉ ằ
và khi đó người ta thường tính trung bình b i vì trung bình có nh ng đ c tính toán h cở ữ ặ ọ
m nh. Tuy nhiên n u s li u b l ch thì con s trung v ph n ánh giá tr tiêu bi u m tạ ế ố ệ ị ệ ố ị ả ị ể ộ cách chính xác h n.ơ
Thí d : B nh nhân b loét d dày tá tràng đ ụ ệ ị ạ ượ c đi u tr theo m t phác đ di t vi ề ị ộ ồ ệ khu n Helicobacter. Sau đi u tr , b nh nhân đ ẩ ề ị ệ ượ c theo dõi và ghi nh n th i gian k t ậ ờ ể ừ khi s d ng thu c đ n lúc b t đ u c i thi n tri u ch ng đau. 10 b nh nhân th i ử ụ ố ế ắ ầ ả ệ ệ ứ Ở ệ ờ gian này (ngày ) là nh sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. B nh nhân có th i gian t lúc ư ệ ờ ừ
đi u tr đ n lúc gi m tri u ch ng là 30 ngày trên th c ch t là b nh nhân không đáp ề ị ế ả ệ ứ ự ấ ệ
ng v i đi u tr Trung v và trung bình c a s li u là 2 và 5 ngày. Con s trung v
ph n ánh chân th c h n b i vì v i t cách là m t bác sĩ lâm sàng t s li u trên có th ả ự ơ ở ớ ư ộ ừ ố ệ ể
nh n xét r ng m t b nh nhân tiêu bi u s gi m đau sau 2 ngày dùng thu c. Con sôs 30 ậ ằ ộ ệ ể ẽ ả ố trong thí d trên đ ụ ượ c g i là s ngo i lai (outlier) và làm s li u b l ch. Nhìn chung, ọ ố ạ ố ệ ị ệ khi s li u b l ch thì con s trung bình s b nh h ố ệ ị ệ ố ẽ ị ả ưở ng r t nhi u và không ph n ánh ấ ề ả giá tr tiêu bi u nh con s trung v ị ể ư ố ị
Th ng kê mô t tính phân tán:ố ả
Th ng kê mô t tính phân tán có t m quan tr ng th hai sau con s mô t khuynhố ả ầ ọ ứ ố ả
hướng t p trung.ậ
Trang 7Thí d : Thu c h áp A đ ụ ố ạ ượ ử ụ c s d ng trên 5 b nh nhân và huy t áp tâm thu sau khi dùng thu c ệ ế ố
là 110, 115, 120, 125 và 130. Thu c h áp B đ ố ạ ượ ử ụ c s d ng trên 5 b nh nhân và có huy t áp sau ệ ế
s d ng thu c là 100, 110, 120, 130, 140. Nh v y hai thu c h áp này có hi u qu h áp là ử ụ ố ư ậ ố ạ ệ ả ạ
t ươ ng đ ươ ng (b i vì trung bình c a hai s li u là b ng nhau) nh ng k t qu c a thu c B phân ở ủ ố ệ ằ ư ế ả ủ ố tán h n và đi u này làm thu c B tr nên kém an toàn ơ ề ố ở
Ð l ch chu n (standard deviation vi t t t là SD hay s) là con s đánh giá m c độ ệ ẩ ế ắ ố ứ ộ phân tán và được tính theo công th c:ứ
n
i
i
N
x x s
1
2
1
) (
Nh v y đ l ch chu n ph n ánh kho ng cách trung bình c a s li u so v i giá tr tiêuư ậ ộ ệ ẩ ả ả ủ ố ệ ớ ị
bi u. Khái ni m đ l ch chu n ch có th áp d ng cho bi n s đ nh lể ệ ộ ệ ẩ ỉ ể ụ ế ố ị ượng b i vìở chúng ta có th th c hi n các phép toán s h c trên các đ i lể ự ệ ố ọ ạ ượng nh ng không thư ể
th c hi n trên các giá tr c a bi n s đ nh tính là các đ c tính.ự ệ ị ủ ế ố ị ặ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 150. Trung bình c a huy t áp là 132 và đ l ch chu n b ng ủ ế ộ ệ ẩ ằ
5 , 11 5 , 132 4
530 4
324 9 4 49 144
1 5
) 132 150 ( ) 132 135 ( ) 130 132 ( ) 132 125 ( ) 132 120 (
1
) (
2 2
2 2
2 1
2
n
i
i
N
x x s
Phương sai v m t t nguyên là bình phề ặ ừ ương c a sai bình phủ ương c a đ l chủ ộ ệ chu n. Phẩ ương sai (variance) có th để ược kí hi u và Var hay s2 và đệ ược tính theo công
th c sau:ứ
i
n
1
1
Ph m vi c a s li u là t t c các giá tr c a s li u t giá tr nh nh t đ n giá tr l nạ ủ ố ệ ấ ả ị ủ ố ệ ừ ị ỏ ấ ế ị ớ
nh t.ấ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 150. Ph m ạ
vi c a bi n s huy t áp là 120 đ n 150 ủ ế ố ế ế Thí d : Thu c h áp A đ ụ ố ạ ượ ử ụ c s d ng trên 5 b nh nhân và huy t áp tâm thu sau khi dùng thu c ệ ế ố
là 110, 115, 120, 125 và 130. Thu c h áp B đ ố ạ ượ ử ụ c s d ng trên 5 b nh nhân và có huy t áp sau ệ ế
s d ng thu c là 100, 110, 120, 130, 140. S li u c a thu c B có tính phân tán cao h n do ử ụ ố ố ệ ủ ố ơ
ph m vi thay đ i t 100140 trong khi đó ph m v c a s li u thu c A ch t 110130 ạ ổ ừ ạ ị ủ ố ệ ố ỉ ừ
Kho ng t v (interquartile): N u chúng ta chia s li u s p theo th t làm 2 ph nả ứ ị ế ố ệ ắ ứ ự ầ
đ u nhau, kho ng t v là kho ng cách c a trung v ph n trên và trung v ph n dề ả ứ ị ả ủ ị ầ ị ầ ướ i Trung v c a ph n trên c a s li u đị ủ ầ ủ ố ệ ược g i là t v trên (upper quartile) và trung vọ ứ ị ị
c a phân dủ ướ ố ệi s li u được g i là trung v dọ ị ưới (lower quartile)
Trang 8Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 150. S ố
li u này đ ệ ượ c chia làm 2 ph n: ph n 1 g m 120, 125, 130 và ph n 2 g m 130, 135, và 150. ầ ầ ồ ầ ồ Trung v c a ph n trên là 125 trung v c a ph n d ị ủ ầ ị ủ ầ ướ i là 135, do đó ph m t v là 125135 ạ ứ ị
Do b n ch t c a kho ng t v là trung v c a ph n s li u trên và ph n s li u dả ấ ủ ả ứ ị ị ủ ầ ố ệ ầ ố ệ ướ i, cũng gi ng nh trung v , kho ng t v không b nh hố ư ị ả ứ ị ị ả ưởng b i các giá tr ngo i lai nhở ị ạ ư trong trường h p c a đ l ch chu n. Cũng nh trung v , kho ng t v ch có th ápợ ủ ộ ệ ẩ ư ị ả ứ ị ỉ ể
d ng cho bi n s đ nh lụ ế ố ị ượng hay th t ứ ự
Có 3 th ng kê mô t tính phân tán: đ l ch chu n, kho ng t v và ph m vi c a số ả ộ ệ ẩ ả ứ ị ạ ủ ố
li u. Vi c l a ch n th ng kê mô t tính phân tán đệ ệ ự ọ ố ả ược trình bày trong b ng 2.ả
B ng 6. Ch n l a các th ng kê mô t tính phân tán cho các lo i bi n s ả ọ ự ố ả ạ ế ố
Trường h pợ Th ng kê tóm t t giá tr tiêuố ắ ị
Phân ph i cân đ iố ố Trung bình (mean) Ð l ch chu n (standardộ ệ ẩ
deviation)
Th ng kê b l chố ị ệ Trung v (median)ị Kho ng t v (interquartile)ả ứ ị
Ph m vi (Range)ạ
Câu h i: Phân tích trên máy tính v bi n s hemoglobin cho k t qu sau. Hãy th đ cỏ ề ế ố ế ả ử ọ
và lí gi i k t qu :ả ế ả
Variable | Obs Mean Std Dev Min Max
-+ -hemoglobin | 70 11.98429 1.416122 8.8 15.1
Thí d v s li u b l ch: Th i gian n m vi n c a 17 đ i tụ ề ố ệ ị ệ ờ ằ ệ ủ ố ượng sau khi ph u thu tẫ ậ (đượ ắc s p x p t nh đ n l n) là:ế ừ ỏ ế ớ
3 4 4 6 8 8 8 10 10 12 14 14 17 25 27 37 42
Phân ph i này b l ch nên con s th i gian n m vi n trung bình là 14,6 không ph i conố ị ệ ố ờ ằ ệ ả
s phù h p đo lố ợ ường trung tâm. Ð đánh giá T phân ph i này ta nh n th y trung v làể ừ ố ậ ấ ị 10; t v trên là 17 và t v dứ ị ứ ị ưới là 8
Logarithm
M t cách khác đ đ i phó v i s l ch b l ch, trong trộ ể ố ớ ố ệ ị ệ ường h p b l ch dợ ị ệ ương là sử
d ng logarithm (hay g i t t là log) c a giá tr s li u thay vì dùng b n thân giá tr ụ ọ ắ ủ ị ố ệ ả ị
Có nhi u lo i logarithms khác nhau. Logarithm c s 10 là lo i thề ạ ơ ố ạ ường đượ ử ụ c s d ng trong quá kh đ nhân hay chia các con s m t cách nhanh chóng. G n đây do s phátứ ể ố ộ ầ ự tri n c a các máy vi tính và máy tính c m tay, vi c s d ng logarithms c s 10 trể ủ ầ ệ ử ụ ơ ố ở nên b phôi pha. Hi n này ngị ệ ười ta thường ch dùng logarithms c s e (e=2,71) hayỉ ơ ố còn g i là logarithms t nhiên do lo i logarithms này có m t s đ c tính toán h cọ ự ạ ộ ố ặ ọ đáng quý. Logarithms t nhiên c a m t s x thự ủ ộ ố ường được kí hi u ln(x).ệ
Logarithms t nhiên có các đ c tính toán h c chính nh sau:ự ặ ọ ư
ln(xy)=ln(x) + ln(y)
Trang 9ln(x/y)=ln(x)ln(y) ln(xn)=ln(xx x)=ln(x)+ln(x)+ +ln(x)=nln(x) ln(1+x)(x (v i x nh )ớ ỏ
N u chúng ta đã bi t ln(x) và mu n bi t x b ng bao nhiêu chúng ta s d ng hàmế ế ố ế ằ ử ụ antilog(x) hay còn g i là hàm exp(x).ọ
Trong trường h p s li u b l ch dợ ố ệ ị ệ ương, người ta l y log c a s li u và tính trungấ ủ ố ệ bình c a log s li u. Sau đó tính giá tr th i gian n m vi n tiêu bi u (con s này đủ ố ệ ị ờ ằ ệ ể ố ượ c
g i là trung bình nhân geometric mean) b ng cách l y antilog c a trung bình c a logọ ằ ấ ủ ủ
s li u.ố ệ
Tr l i thí d v th i gian n m vi n c a 17 b nh nhân. Sau khi l y log chúng ta cóở ạ ụ ề ờ ằ ệ ủ ệ ấ trung bình c a log th i gian n m vi n b ng 2,41 và l y antilog c a s này chúng ta cóủ ờ ằ ệ ằ ấ ủ ố trung bình nhân c a th i gian n m vi n là 11,13. Con s này g n v i giá tr trung v làủ ờ ằ ệ ố ầ ớ ị ị
10 h n con s trung bình c ng là 14,6ơ ố ộ
Bi u đ và đ thể ồ ồ ị
S li u cũng có th đố ệ ể ược trình bày dướ ại d ng đ th ho c bi u đ M c dù không cóồ ị ặ ể ồ ặ ranh gi i tuy t đ i hoàn toàn rõ r t, nói chung đ th (graph) có tính ch t toán h cớ ệ ố ệ ồ ị ấ ọ nhi u h n, trong đó có tr c hoành và tr c tung còn bi u đ (chart) là hình nh mangề ơ ụ ụ ể ồ ả tính ch t tấ ượng tr ng.ư
N u bi n s là bi n r i r c, có th trình bày dế ế ố ế ờ ạ ể ướ ại d ng bi u đ hình thanh (bar chart ể ồ hình 1) ho c bi u đ hình bánh (pie chart). N u bi n s là bi n liên t c, thì phân ph iặ ể ồ ế ế ố ế ụ ố
c a bi n s có th trình bày dủ ế ố ể ướ ại d ng t ch c đ (histogram hình 2) ho c đa giácổ ứ ồ ặ
t n su t.ầ ấ
Bi u đ hình thanhể ồ
Bi u đ hình thang là bi u đ nh m mô t s phân b c a bi n s r i r c. Bi u để ồ ể ồ ằ ả ự ố ủ ế ố ờ ạ ể ồ hình thanh g m có tr c hoành trên đó xác đ nh nh ng giá tr c a bi n s ng v i t ngồ ụ ị ữ ị ủ ế ố Ứ ớ ừ giá tr c a bi n s ngị ủ ế ố ười ta v các thanh có chi u cao t l v i t n su t c a giá tr đó.ẽ ề ỉ ệ ớ ầ ấ ủ ị
C n l u ý luôn luôn có kho ng tr ng gi a các thanh.ầ ư ả ố ữ
45
24
0 10 20 30 40 50
Trang 10Figure 2. Bi u đ hình thanh (bar chart) mô t phân b gi i tính c a nh ng h c sinh trong tr ể ồ ả ố ớ ủ ữ ọ ườ ng m m ầ non 23/11, Hóc môn
Chúng ta cũng có th xây d ng các thanh theo chi u ngang nh trong ví d sauể ự ề ư ụ
478 65
57
S inh thö ô øng
S inh fo rceps
S inh mo å
Figure 3. Ph ươ ng pháp sinh c a 600 tr sanh t i b nh vi n X trong năm 1998 ủ ẻ ạ ệ ệ
Ð i v i bi n s th t , đi u c n l u ý là các giá tr c a bi n s ph i đố ớ ế ố ứ ự ề ầ ư ị ủ ế ố ả ượ ẵc s p x pế
th t theo tr c hoành.ứ ự ụ
e d u m a t
m u ø c h ö õ c a áp 1 c a áp 2 - 3 ñ a ïi h o ï 0
1 0 0 0
2 0 0 0
Figure 4. Trình đ h c v n c a các bà m trong nghiên c u ộ ọ ấ ủ ẹ ứ
Bi u đ hình bánhể ồ
Bi u đ hình bánh cũng để ồ ược dùng đ mô t s phân b c a bi n s r i r c. Bi u đôể ả ự ố ủ ế ố ờ ạ ể hình bánh là m t vòng tròn độ ược chia làm nhi u cung tề ương ng v i các giá tr c aứ ớ ị ủ
bi n s Ð l n c a cung t l v i t n su t c a giá tr bi n s ế ố ộ ớ ủ ỉ ệ ớ ầ ấ ủ ị ế ố