1. Trang chủ
  2. » Địa lý lớp 12

Bài giảng Thống kê y học - Bài 6: Thống kê, biến số và phân phối

10 12 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 415,05 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

[r]

Trang 1

TH NG KÊ, BI N S  VÀ PHÂN PH IỐ Ế Ố Ố Mục tiêu

Sau khi nghiên c u ch  đ , h c viên có kh  năng:ứ ủ ề ọ ả

­ Trình bày đ nh nghĩa c a th ng kê,  s  li u, thông tin và bi n sị ủ ố ố ệ ế ố

­ Phân bi t đệ ược các lo i bi n s : đ nh lạ ế ố ị ượng và đ nh tính trong có có bi n s  nh  giá,ị ế ố ị   danh đ nh hay th  t ị ứ ự

­ Xây d ng đự ược b ng phân ph i t n su t cho s  li u đ nh tính và đ nh lả ố ầ ấ ố ệ ị ị ượng

­ L a ch n đự ọ ược các lo i bi u đ  hay đ  th  thích h p đ  trình bày s  li u đ nh tính vàạ ể ồ ồ ị ợ ể ố ệ ị  

đ nh lị ượng

­ Tính được các s  th ng kê tóm t t nh  trung bình, trung v , y u v , đ  l ch chu n,ố ố ắ ư ị ế ị ộ ệ ẩ  

phương sai. 

1 Một số định nghĩa

Th ng kê là phố ương pháp khoa h c dùng đ  thu th p, tóm t t, trình bày và phân tích sọ ề ậ ắ ố 

li u. Phệ ương pháp th ng kê đố ược s  d ng trong nghiên c u nh m đ  so sánh m tử ụ ứ ằ ể ộ   nhóm đ i tố ượng ch  không nh m nghiên c u t ng cá nhân đ n l ứ ằ ứ ừ ơ ẻ

S  li u: K t qu  có đố ệ ế ả ược do vi c quan sát hay thu th p đ c tính hay đ i lệ ậ ặ ạ ượng   cácở  

đ i tố ượng khác nhau hay   th i gian khác nhau.ở ờ

Thí d :  Quan sát gi i tính c a các h c viên trong l p, s  li u ghi nh n đụ ớ ủ ọ ớ ố ệ ậ ược là:

Nam, nam, n , n , n , nam, n , v.vữ ữ ữ ữ

Thí d : M t nhà nghiên c u đo n ng đ  hemoglobin c a 70 thai ph  có k t qu  nhụ ộ ứ ồ ộ ủ ụ ế ả ư  sau:

và nh ng con s  này đữ ố ược g i là s  li u.ọ ố ệ

C n l u ý s  li u ph i liên k t v i m t đ c tính hay đ i lầ ư ố ệ ả ế ớ ộ ặ ạ ượng nh t đ nh. Ghi nh nấ ị ậ  

gi i tính   ngớ ở ười này, tu i c a ngổ ủ ười khác, qu n áo c a m t ngầ ủ ộ ười khác n a thì k tữ ế  

qu  này đả ược không ph i là s  li u.ả ố ệ

S  d ng phử ụ ương pháp th ng kê chúng ta có th  tóm t t s  li u trên s  d ng n ng đố ể ắ ố ệ ử ụ ồ ộ  hemoglobin trung bình=11,98 và đ  l ch chu n b ng 1.42. S  li u độ ệ ẩ ằ ố ệ ược tóm t t, trìnhắ   bày hay phân tích b ng phằ ương pháp th ng kê s  tr  thành thông tin.ố ẽ ở

Trang 2

2 Biến số và các loại biến số

Bi n s  là nh ng đ i lế ố ữ ạ ượng hay nh ng đ c tính có th  thay đ i t  ngữ ặ ể ổ ừ ười này sang 

người khác hay t  th i đi m này sang th i đi m khác.ừ ờ ể ờ ể

Nh  v y bi n s  có th  th  hi n đ i lư ậ ế ố ể ể ệ ạ ượng hay đ c tính. N u nó th  hi n  m t đ iặ ế ể ệ ộ ạ  

lượng nó được g i là bi n s  đ nh lọ ế ố ị ượng. N u nó nh m th  hi n m t đ c tính noế ằ ể ệ ộ ặ  

được g i là bi n s  đ nh tính. ọ ế ố ị

Bi n s  đ nh tínhế ố ị

Bi n s  đ nh tính còn đế ố ị ược chia làm 3 lo i: bi n s  th  t , bi n s  danh đ nh và bi nạ ế ố ứ ự ế ố ị ế  

s  nh  giá.ố ị

Bi n s  th  t  là bi n s  đ nh tính v i các giá tr  có th  s p x p th  t  đế ố ứ ự ế ố ị ớ ị ể ắ ế ứ ự ược

Thí d : tình tr ng kinh t  xã h i (giàu, khá, trung bình, nghèo, r t nghèo) là bi n s  thụ ạ ế ộ ấ ế ố ứ 

t  b i vì ngự ở ười giàu có đi u ki n kinh t  t t h n ngề ệ ế ố ơ ười khá, người khá h n ngơ ườ  i trung bình, trung bình h n nghèo, v.vơ

Nh ng thí d  khác là h c l c c a h c sinh (gi i, khá, trung bình, kém), tiên lữ ụ ọ ự ủ ọ ỏ ượng (t t,ố   khá, x u, t  vong).ấ ử

Theo phân lo i tăng huy t áp c a T  ch c Y t  Th  gi i đạ ế ủ ổ ứ ế ế ớ ược trình bày nh  sau, theoư   phân lo i huy t áp v i các giá tr  huy t áp bình thạ ế ớ ị ế ường, tăng huy t áp đ  1, tăng huy tế ộ ế  

áp đ  2, tăng huy t áp đ  3 là bi n s  th  tộ ế ộ ế ố ứ ự

Huy t áp bình thế ường:  HA tâm thu ≤139 và HA tâm trương ≤ 89

Tăng huy t áp đ  1: ế ộ HA tâm thu ≤ 179 hay HA tâm trương ≤ 104

Tăng huy t áp đ  2:ế ộ HA tâm thu ≥ 180 hay HA tâm trương >114

Tăng huy t áp đ  3:ế ộ HA tâm thu ≥180 và HA tâm trương ≥ 115 mmHg

Bi n s  danh đ nh là bi n s  đ nh tính mà giá tr  c a nó không th  bi u th  b ng s  màế ố ị ế ố ị ị ủ ể ể ị ằ ố  

ph i bi u di n b ng m t tên g i (danh: tên) và các giá tr  này không th  s p đ t theoả ể ễ ằ ộ ọ ị ể ắ ặ  

m t tr t t  t  th p đ n cao.ộ ậ ự ừ ấ ế

Thí d : Bi n s  dân t c v i các giá tr : Kinh, Khmer, Hoa, Chăm,… là bi n s  đ nhụ ế ố ộ ớ ị ế ố ị   tính vì chúng ta không th  s p x p các giá tr  này t  theo m t tr t t  t  th p đ n caoể ắ ế ị ừ ộ ậ ự ừ ấ ế   hay ngượ ạc l i

M t s  thí d  khác c a bi n s  danh đ nh là tình tr ng hôn nhân (có 4 giá tr : đ c thân,ộ ố ụ ủ ế ố ị ạ ị ộ  

có gia đình, li d , góa) nhóm máu (A, B, AB và O).ị

Đôi khi bi n s  danh đ nh ch  có 2 giá tr : thí d  nh  s ng hay ch t; có hút thu c lá hayế ố ị ỉ ị ụ ư ố ế ố   không hút thu c lá; có suy dinh dố ưỡng hay không suy dinh dưỡng; nam hay n  Nh ngữ ữ  

bi n s  thu c lo i này đế ố ộ ạ ược g i là bi n s  nh  giá (binary variable)ọ ế ố ị

Mã hoá

Trong phân tích th ng kê, đ  ti n vi c nh p s  li u hay lí gi i k t qu , ngố ể ệ ệ ậ ố ệ ả ế ả ười ta có 

th  ánh x  (mapping) các giá tr  c a bi n đ nh tính vào các con s  Vi c này để ạ ị ủ ế ị ố ệ ược g iọ  

là mã hóa và c n hi u r ng vi c mã hóa này hoàn toàn có tính ch t áp đ t và các con sầ ể ằ ệ ấ ặ ố 

được dùng trong mã hóa không ph n ánh b n ch t c a bi n s  danh đ nh.ả ả ấ ủ ế ố ị

Trang 3

Gi i tính là bi n s  danh đ nh và có hai giá tr  là nam và n  Chúng ta có th  mã hóa gi i tính và  ớ ế ố ị ị ữ ể ớ quy  ướ c Nam là 1 và N  là 2. Tuy nhiên vi c mã hóa này là áp đ t và chúng ta hoàn toàn có th   ữ ệ ặ ể quy  ướ c Nam là 1 và N  là 0. Vi c mã hóa ch  nh m giúp vi c nh p s  li u và x  lí s  li u tr ữ ệ ỉ ằ ệ ậ ố ệ ử ố ệ ở  nên d  dàng h n ch  không nh m ph n ánh b n ch t c a bi n s  đó ễ ơ ứ ằ ả ả ấ ủ ế ố

Bi n s  đ nh lế ố ị ượng

Bi n s  đ nh lế ố ị ượng nh m th  hi n m t đ i lằ ể ệ ộ ạ ượng và do đó có giá tr  là nh ng con s ị ữ ố Thí d : tu i là bi n s  liên t c b i vì ta có th  nói ngụ ổ ế ố ụ ở ể ười này 20 tu i, ngổ ười kia 32 

tu i, v.v.ổ

Nh ng thí d  khác là đữ ụ ường huy t, hemoglobin, hematocrite, chi u cao, cân n ng, thuế ề ặ  

nh p, v.vậ

3 Phương pháp trình bày số liệu bảng

S  li u ghi nh n các đ c tính hay đ i lố ệ ậ ặ ạ ượng có th  trình bày thành b ng và b ng nàyể ả ả  

được g i là b ng phân ph i t n su t.ọ ả ố ầ ấ

Phân ph i t n su t c a bi n s  đ nh tínhố ầ ấ ủ ế ố ị

S  li u c a bi n s  r i r c có th  đố ệ ủ ế ố ờ ạ ể ược trình bày dướ ại d ng m t phân ph i t n su t.ộ ố ầ ấ   Phân ph i t n su t là m t b ng ch  ra t n su t xu t hi n c a t ng giá tr  r i r c c aố ầ ấ ộ ả ỉ ầ ấ ấ ệ ủ ừ ị ờ ạ ủ  

bi n s  (B ng 1). Nh  v y b ng phân ph i t n su t g m 2 c t, m t c t li t kê các giáế ố ả ư ậ ả ố ầ ấ ồ ộ ộ ộ ệ  

tr  c a bi n s  và m t c t trình bày t n su t tị ủ ế ố ộ ộ ầ ấ ương  ng c a các giá tr  đó.ứ ủ ị

Table 1. Phân ph i gi i tính c a 69 h c sinh l p c m th ố ớ ủ ọ ớ ơ ườ ng tr ườ ng m m non 23 tháng 11, Huy n Hóc  ầ ệ môn

Gi iớ S  trố ẻ Ph n trămầ

B ng trên là b n phân ph i t n su t c a gi i tính. B i vì gi i tính có 2 giá tr  nam vàả ả ố ầ ấ ủ ớ ở ớ ị  

n  nên ta li t kê 2 giá tr  này   m t c t.   c t th  nhì ta ghi t n su t tữ ệ ị ở ộ ộ Ở ộ ứ ầ ấ ương  ng c aứ ủ   các giá tr  này. Ðôi khi b ng phân ph i t n su t có thêm c t ph n trăm nh  trong thí dị ả ố ầ ấ ộ ầ ư ụ   trên. B ng 2 là m t thí d  khác v  b ng phân ph i t n su t

Table 2. Ph ươ ng pháp đ  đ  c a 600 tr  trong b nh vi n ỡ ẻ ủ ẻ ệ ệ

Phương   pháp   đỡ 

Trang 4

Ðôi khi trong b ng phân ph i ngả ố ười ta không ghi con s  th c t  c a t n su t mà chố ự ế ủ ầ ấ ỉ  ghi nh n ph n trăm. Trong trậ ầ ường h p h p này, ph i ghi rõ s  đ i tợ ợ ả ố ố ượng c a toàn bủ ộ  phân ph i (s  đ i tố ố ố ượng toàn b  trong thí d  trên là 600)ộ ụ

Phân ph i t n su t c a bi n s  đ nh lố ầ ấ ủ ế ố ị ượng

N u bi n s  là bi n s  liên t c chúng ta không th  li t kê t t c  các giá tr  c a bi nế ế ố ế ố ụ ể ệ ấ ả ị ủ ế  

s  Trong trố ường h p này chúng ta có th  nhóm (làm tròn) giá tr  c a bi n s  l i.ợ ể ị ủ ế ố ạ

C  th  các bụ ể ước xây d ng b ng phân ph i t n su t cho bi n s  đ nh lự ả ố ầ ấ ế ố ị ượng nh  sau:ư 1­ Tìm ph m vi (giá tr  c c ti u và giá tr  c c đ i) c a s  li u. Trong thí d  vạ ị ự ể ị ự ạ ủ ố ệ ụ ề  hemoglobin c a 70 ph  n  ph m vi là 8,8 đ n 15,1ủ ụ ữ ạ ế

2. Chia ph m vi s  li u ra làm n kho ng v i đ  r ng c a m i kho ng là d. C n l u ýạ ố ệ ả ớ ộ ộ ủ ỗ ả ầ ư  

đ  r ng m i kho ng d nên là đ i lộ ộ ỗ ả ạ ượng ch n nh  1, 2, 5, 10 hay 0,5, 0,2 và s  cácẵ ư ố   kho ng n nên t  5­12 (trung bình là 7­8). Trong thí d  trên ta có th  chia ph m vi raả ừ ụ ể ạ   làm 8kho ng v i chi u r ng kho ng b ng 1 đ n v  Khi đó các kho ng là: 8­8,9; 9­9,9;ả ớ ề ộ ả ằ ơ ị ả   10­10,9; 11­11,9; 12­12,9; 13­13,9; 14­14,9; 15­15,9

3. Ð m các giá tr  thích h p vào kho ng đã đ nh trế ị ợ ả ị ước

Hemoglobin

(g/100ml)

Ð mế

10­10,9 1111  1111  1111 11­11,9 1111  1111  1111  1111 12­12,9 1111  1111  1111 13­13,9 1111  1111  111

4. Xây d ng b ng phân ph i t n su t v i bi n s  và các kho ng giá tr  c a bi n s  vàự ả ố ầ ấ ớ ế ố ả ị ủ ế ố  

t n su t tầ ấ ương  ng v i các kho ng giá tr  đó. Chúng ta cũng có th  thêm vào c t ph nứ ớ ả ị ể ộ ầ   trăm và c t ph n trăm tích lũy  (n u thích h p)ộ ầ ế ợ

Table 3. Hemoglobin c a 70 ph  n ủ ụ ữ

Hemoglobin T nầ  

su tấ Ph nầ  

trăm Ph n trăm tích

lũy

Trang 5

11­11,9 19 27.14 52.86

Thí d  nh  n u biên s  là chu vi vòng cánh tay c a tr  chúng ta có th  làm tròn chu viụ ư ế ố ủ ẻ ể   vòng cánh tay đ n 1 cm. Khi đó ta có th  xem thang đo c a bi n s  là r i r c và trìnhế ể ủ ế ố ờ ạ   bày b ng phân ph i t n su t c a bi n s  (b ng 2).ả ố ầ ấ ủ ế ố ả

Table 4. Phân ph i s  đo vòng cánh tay c a 69 tr  l p c m th ố ố ủ ẻ ớ ơ ườ ng nhà tr  23 tháng 11, Hóc môn ẻ

Vòng cánh tay T nầ  

su tấ Ph nầ  

trăm Ph n trăm tích

lũy

4 Các số thống kê mô tả

Vi c trình bày s  li u b ng b ng là th a mãn cho các bi n s  đ nh tính (c  bi n sệ ố ệ ằ ả ỏ ế ố ị ả ế ố  danh đ nh và bi n s  th  t ). Tuy nhiên các s  li u đ nh lị ế ố ứ ự ố ệ ị ượng có th  tóm t t h n n aể ắ ơ ữ  

b ng các s  th ng kê mô t  Có hai lo i th ng kê mô t : th ng kê mô t  khuynhằ ố ố ả ạ ố ả ố ả  

hướng t p trung và th ng kê mô t  tính phân tán.ậ ố ả

Th ng kê mô t  khuynh hố ả ướng t p trung

Th ng kê mô t  khuynh hố ả ướng t p trung có th  là trung bình (mean), trung v  (median)ậ ể ị  

và y u v  (mode). Nh ng th ng kê này cho bi t giá tr  tiêu bi u cho s  li u.ế ị ữ ố ế ị ể ố ệ

Thí d : có hai lo i thu c h  áp A và B. Gi  s  có 5 đ i t ụ ạ ố ạ ả ử ố ượ ng sau khi s  d ng thu c h  áp A  ử ụ ố ạ

s  có huy t áp 110 ­ 115 ­120 ­ 125 ­130 và   5 đ i t ẽ ế ở ố ượ ng khác sau khi s  d ng thu c h  áp B  ử ụ ố ạ

s  có huy t áp 120 ­ 125 ­ 130 ­ 135 ­ 140. Con s  tiêu bi u nh t đ  cho bi t tác d ng c a   ẽ ế ố ể ấ ể ế ụ ủ thu c A là huy t áp trung bình sau khi s  d ng thu c A và là 120. Con s  huy t áp trung bình  ố ế ử ụ ố ố ế này th p h n huy t áp trung bình sau khi s  d ng thu c B cho bi t thu c A có tác d ng m nh  ấ ơ ế ử ụ ố ế ố ụ ạ

h n ơ

Trung bình c a s  li u, đủ ố ệ ược kí hi u là ệ x (đ c là x g ch) là t ng các giá tr  c a sọ ạ ổ ị ủ ố 

li u chia cho s  l n quan sát (N).ệ ố ầ

Trang 6

x

Thí d : S  li u v  huy t áp tâm thu c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 

150. Huy t áp tâm thu trung bình s  là 132 ế ẽ

132 5

150 135 130 125 120

N

x

Do không th  th c hi n các phép toán s  h c trên các bi n s  đ nh tính (danh đ nh vàể ự ệ ố ọ ế ố ị ị  

th  t ) chúng ta ch  có th  tính trung bình cho s  li u c a bi n s  đ nh lứ ự ỉ ể ố ệ ủ ế ố ị ượng

N u chúng ta s p x p s  li u theo th  t , giá tr  đ ng   gi a đế ắ ế ố ệ ứ ự ị ứ ở ữ ược g i là trung v ọ ị  

N u có hai giá tr  cùng đ ng   gi a, trung bình c ng c a hai giá tr  này là trung v ế ị ứ ở ữ ộ ủ ị ị

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 

135, 150. Trung v  c a huy t áp tâm thu là giá tr  đ ng   gi a và b ng 130 ị ủ ế ị ứ ở ữ ằ

S  li u v  chi u cao (cm) c a 6 ng ố ệ ề ề ủ ườ i là 153, 155, 160, 162, 165, 161. Ð  tính ể   trung v , tr ị ướ c tiên chúng ta ph i s p x p s  li u này: 153, 155, 160, 161, 162,  ả ắ ế ố ệ

165. Do có hai giá tr  160 và 161 cùng   gi a, trung v  s  là (160+161)/2 =  ị ở ữ ị ẽ 160,5 cm

Ðôi khi người ta ch n con s  th ng kê tiêu bi u là y u v  (mode). Y u v  là giá tr  xu tọ ố ố ể ế ị ế ị ị ấ  

hi n ph  bi n nh t (có t n su t cao nh t).ệ ổ ế ấ ầ ấ ấ

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 

135, 150. Trong tr ườ ng h p này không có y u v ợ ế ị

Ði m s  c a 5 h c sinh là 5, 5, 6, 7, 9. Y u v  c a đi m s  là 5 ể ố ủ ọ ế ị ủ ể ố Trong m t s  li u c  th , có th  không có y u v , có th  có m t y u v  ho c hai hayộ ố ệ ụ ể ể ế ị ể ộ ế ị ặ   nhi u y u v  Ðây là khuy t đi m chính c a s  th ng kê này. Do v y ngề ế ị ế ể ủ ố ố ậ ười ta thườ  ng

ch  dùng trong các trỉ ường h p đ c bi tợ ặ ệ

Có th  s  d ng trung bình, trung v  hay y u v  cho bi n s  đ nh lể ử ụ ị ế ị ế ố ị ượng. Khi bi n sế ố 

đ nh lị ượng có phân ph i bình thố ường (hình chuông) thì ba con s  này x p x  b ng nhauố ấ ỉ ằ  

và khi đó người ta thường tính trung bình b i vì trung bình có nh ng đ c tính toán h cở ữ ặ ọ  

m nh. Tuy nhiên n u s  li u b  l ch thì con s  trung v  ph n ánh giá tr  tiêu bi u m tạ ế ố ệ ị ệ ố ị ả ị ể ộ   cách chính xác h n.ơ

Thí d : B nh nhân b  loét d  dày ­ tá tràng đ ụ ệ ị ạ ượ c đi u tr  theo m t phác đ  di t vi  ề ị ộ ồ ệ khu n Helicobacter. Sau đi u tr , b nh nhân đ ẩ ề ị ệ ượ c theo dõi và ghi nh n th i gian k  t   ậ ờ ể ừ khi s  d ng thu c đ n lúc b t đ u c i thi n tri u ch ng đau.   10 b nh nhân th i  ử ụ ố ế ắ ầ ả ệ ệ ứ Ở ệ ờ gian này (ngày ) là nh  sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. B nh nhân có th i gian t  lúc  ư ệ ờ ừ

đi u tr  đ n lúc gi m tri u ch ng là 30 ngày trên th c ch t là b nh nhân không đáp  ề ị ế ả ệ ứ ự ấ ệ

ng v i đi u tr  Trung v  và trung bình c a s  li u là 2 và 5 ngày. Con s  trung v  

ph n ánh chân th c h n b i vì v i t  cách là m t bác sĩ lâm sàng t  s  li u trên có th   ả ự ơ ở ớ ư ộ ừ ố ệ ể

nh n xét r ng m t b nh nhân tiêu bi u s  gi m đau sau 2 ngày dùng thu c. Con sôs 30 ậ ằ ộ ệ ể ẽ ả ố   trong thí d  trên đ ụ ượ c g i là s  ngo i lai (outlier) và làm s  li u b  l ch. Nhìn chung,  ọ ố ạ ố ệ ị ệ khi s  li u b  l ch thì con s  trung bình s  b   nh h ố ệ ị ệ ố ẽ ị ả ưở ng r t nhi u và không ph n ánh  ấ ề ả giá tr  tiêu bi u nh  con s  trung v ị ể ư ố ị

Th ng kê mô t  tính phân tán:ố ả

Th ng kê mô t  tính phân tán có t m quan tr ng th  hai sau con s  mô t  khuynhố ả ầ ọ ứ ố ả  

hướng t p trung.ậ

Trang 7

Thí d : Thu c h  áp A đ ụ ố ạ ượ ử ụ c s  d ng trên 5 b nh nhân và huy t áp tâm thu  sau khi dùng thu c  ệ ế ố

là 110, 115, 120, 125 và 130. Thu c h  áp B đ ố ạ ượ ử ụ c s  d ng trên 5 b nh nhân và có huy t áp sau  ệ ế

s  d ng thu c là 100, 110, 120, 130, 140.  Nh  v y hai thu c h  áp này có hi u qu  h  áp là  ử ụ ố ư ậ ố ạ ệ ả ạ

t ươ ng đ ươ ng (b i vì trung bình c a hai s  li u là b ng nhau) nh ng k t qu  c a thu c B phân  ở ủ ố ệ ằ ư ế ả ủ ố tán h n và đi u này làm thu c B tr  nên kém an toàn ơ ề ố ở

Ð  l ch chu n (standard deviation ­ vi t t t là SD hay s) là con s  đánh giá m c độ ệ ẩ ế ắ ố ứ ộ  phân tán và được tính theo công th c:ứ

n

i

i

N

x x s

1

2

1

) (

Nh  v y đ  l ch chu n ph n ánh kho ng cách trung bình c a s  li u so v i giá tr  tiêuư ậ ộ ệ ẩ ả ả ủ ố ệ ớ ị  

bi u. Khái ni m đ  l ch chu n ch  có th  áp d ng cho bi n s  đ nh lể ệ ộ ệ ẩ ỉ ể ụ ế ố ị ượng b i vìở   chúng ta có th  th c hi n các phép toán s  h c trên các đ i lể ự ệ ố ọ ạ ượng nh ng không thư ể 

th c hi n trên các giá tr  c a bi n s  đ nh tính là các đ c tính.ự ệ ị ủ ế ố ị ặ

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 150. Trung  bình c a huy t áp là 132 và đ  l ch chu n b ng ủ ế ộ ệ ẩ ằ

5 , 11 5 , 132 4

530 4

324 9 4 49 144

1 5

) 132 150 ( ) 132 135 ( ) 130 132 ( ) 132 125 ( ) 132 120 (

1

) (

2 2

2 2

2 1

2

n

i

i

N

x x s

Phương sai v  m t t  nguyên là bình phề ặ ừ ương c a sai ­ bình phủ ương c a đ  l chủ ộ ệ   chu n. Phẩ ương sai (variance) có th  để ược kí hi u và Var hay s2 và đệ ược tính theo công 

th c sau:ứ

i

n

1

1

Ph m vi c a s  li u là t t c  các giá tr  c a s  li u t  giá tr  nh  nh t đ n giá tr  l nạ ủ ố ệ ấ ả ị ủ ố ệ ừ ị ỏ ấ ế ị ớ  

nh t.ấ

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 150. Ph m  ạ

vi c a bi n s  huy t áp là 120 đ n 150 ủ ế ố ế ế Thí d : Thu c h  áp A đ ụ ố ạ ượ ử ụ c s  d ng trên 5 b nh nhân và huy t áp tâm thu  sau khi dùng thu c  ệ ế ố

là 110, 115, 120, 125 và 130. Thu c h  áp B đ ố ạ ượ ử ụ c s  d ng trên 5 b nh nhân và có huy t áp sau  ệ ế

s  d ng thu c là 100, 110, 120, 130, 140. S  li u c a thu c B có  tính phân tán cao h n do  ử ụ ố ố ệ ủ ố ơ

ph m vi thay đ i t  100­140 trong khi đó ph m v  c a s  li u thu c A ch  t  110­130 ạ ổ ừ ạ ị ủ ố ệ ố ỉ ừ

Kho ng t  v  (inter­quartile): N u chúng ta chia s  li u s p theo th  t  làm 2 ph nả ứ ị ế ố ệ ắ ứ ự ầ  

đ u nhau, kho ng t  v  là kho ng cách c a trung v  ph n trên và trung v  ph n dề ả ứ ị ả ủ ị ầ ị ầ ướ  i Trung v  c a ph n trên c a s  li u đị ủ ầ ủ ố ệ ược g i là t  v  trên (upper quartile) và  trung vọ ứ ị ị 

c a phân dủ ướ ố ệi s  li u được g i là trung v  dọ ị ưới (lower quartile)

Trang 8

Thí d : S  li u v  huy t áp tâm thu (mmHg) c a 5 đ i t ụ ố ệ ề ế ủ ố ượ ng là 120, 125, 130, 135, 150. S   ố

li u này đ ệ ượ c chia làm 2 ph n: ph n 1 g m 120, 125, 130 và ph n 2 g m 130, 135, và 150.  ầ ầ ồ ầ ồ Trung v  c a ph n trên là 125 ­ trung v  c a ph n d ị ủ ầ ị ủ ầ ướ i là 135, do đó ph m t  v  là 125­135 ạ ứ ị

Do b n ch t c a kho ng t  v  là trung v  c a ph n s  li u trên và ph n s  li u dả ấ ủ ả ứ ị ị ủ ầ ố ệ ầ ố ệ ướ  i, cũng gi ng nh  trung v , kho ng t  v  không b   nh hố ư ị ả ứ ị ị ả ưởng b i các giá tr  ngo i lai nhở ị ạ ư  trong trường h p c a đ  l ch chu n. Cũng nh  trung v , kho ng t  v  ch  có th  ápợ ủ ộ ệ ẩ ư ị ả ứ ị ỉ ể  

d ng cho bi n s  đ nh lụ ế ố ị ượng hay th  t ứ ự

Có 3 th ng kê mô t  tính phân tán: đ  l ch chu n, kho ng t  v  và ph m vi c a số ả ộ ệ ẩ ả ứ ị ạ ủ ố 

li u. Vi c l a ch n th ng kê mô t  tính phân tán đệ ệ ự ọ ố ả ược trình bày trong b ng 2.ả

B ng 6. Ch n l a các th ng kê mô t  tính phân tán cho các lo i bi n s   ả ọ ự ố ả ạ ế ố

Trường h pợ Th ng kê tóm t t giá tr  tiêuố ắ ị  

Phân ph i cân đ iố ố Trung bình (mean) Ð   l ch   chu n   (standardộ ệ ẩ  

deviation)

Th ng kê b  l chố ị ệ Trung v  (median)ị Kho ng t  v  (inter­quartile)ả ứ ị

Ph m vi (Range)ạ

Câu h i: Phân tích trên máy tính v  bi n s  hemoglobin cho k t qu  sau. Hãy th  đ cỏ ề ế ố ế ả ử ọ  

và lí gi i k t qu :ả ế ả

Variable | Obs Mean Std Dev Min Max

-+ -hemoglobin | 70 11.98429 1.416122 8.8 15.1

Thí d  v  s  li u b  l ch: Th i gian n m vi n c a 17 đ i tụ ề ố ệ ị ệ ờ ằ ệ ủ ố ượng sau khi ph u thu tẫ ậ   (đượ ắc s p x p t  nh  đ n l n) là:ế ừ ỏ ế ớ

3  4  4  6  8  8  8   10  10  12  14  14  17  25  27  37  42

Phân ph i này b  l ch nên con s  th i gian n m vi n trung bình là 14,6 không ph i conố ị ệ ố ờ ằ ệ ả  

s  phù h p đo lố ợ ường trung tâm. Ð  đánh giá T  phân ph i này ta nh n th y trung v  làể ừ ố ậ ấ ị   10; t  v  trên là 17 và t  v  dứ ị ứ ị ưới là 8

Logarithm

M t cách khác đ  đ i phó v i s  l ch b  l ch,  trong trộ ể ố ớ ố ệ ị ệ ường h p b  l ch dợ ị ệ ương là sử 

d ng logarithm (hay g i t t là log) c a giá tr  s  li u thay vì dùng b n thân giá tr ụ ọ ắ ủ ị ố ệ ả ị

Có nhi u lo i logarithms khác nhau. Logarithm c  s  10 là lo i thề ạ ơ ố ạ ường đượ ử ụ  c s  d ng trong quá kh  đ  nhân hay chia các con s  m t cách nhanh chóng. G n đây do  s  phátứ ể ố ộ ầ ự   tri n c a các máy vi tính và máy tính c m tay, vi c s  d ng logarithms c  s  10 trể ủ ầ ệ ử ụ ơ ố ở  nên b  phôi pha. Hi n này ngị ệ ười ta thường ch  dùng logarithms c  s  e (e=2,71) hayỉ ơ ố   còn g i là logarithms t  nhiên do lo i   logarithms này   có m t s  đ c tính toán h cọ ự ạ ộ ố ặ ọ   đáng quý. Logarithms t  nhiên c a m t  s  x thự ủ ộ ố ường được kí hi u ln(x).ệ

Logarithms t  nhiên có các đ c tính toán h c chính nh  sau:ự ặ ọ ư

ln(xy)=ln(x) + ln(y)

Trang 9

ln(x/y)=ln(x)­ln(y) ln(xn)=ln(xx x)=ln(x)+ln(x)+ +ln(x)=nln(x) ln(1+x)(x (v i x nh )ớ ỏ

N u chúng ta đã bi t ln(x) và mu n bi t x b ng bao nhiêu chúng ta s  d ng hàmế ế ố ế ằ ử ụ   antilog(x) hay còn g i là hàm exp(x).ọ

Trong trường h p s  li u b  l ch dợ ố ệ ị ệ ương, người ta l y log c a s  li u và tính trungấ ủ ố ệ   bình c a log s  li u. Sau đó tính giá tr  th i gian n m vi n tiêu bi u (con s  này đủ ố ệ ị ờ ằ ệ ể ố ượ  c

g i là trung bình nhân ­ geometric mean) b ng cách l y antilog c a trung bình c a logọ ằ ấ ủ ủ  

s  li u.ố ệ

Tr  l i thí d  v  th i gian n m vi n c a 17 b nh nhân. Sau khi l y log chúng ta cóở ạ ụ ề ờ ằ ệ ủ ệ ấ   trung bình c a log th i gian n m vi n b ng 2,41 và l y antilog c a s  này chúng ta cóủ ờ ằ ệ ằ ấ ủ ố   trung bình  nhân c a th i gian n m vi n là 11,13. Con s  này g n v i giá tr  trung v  làủ ờ ằ ệ ố ầ ớ ị ị  

10 h n con s  trung bình c ng là 14,6ơ ố ộ

Bi u đ  và đ  thể ồ ồ ị

S  li u cũng có th  đố ệ ể ược trình bày dướ ại d ng đ  th  ho c bi u đ  M c dù không cóồ ị ặ ể ồ ặ   ranh gi i tuy t đ i hoàn toàn rõ r t,  nói chung đ  th   (graph) có tính ch t toán h cớ ệ ố ệ ồ ị ấ ọ   nhi u h n, trong đó có tr c hoành và tr c tung còn bi u đ  (chart) là hình  nh mangề ơ ụ ụ ể ồ ả   tính ch t tấ ượng tr ng.ư

N u bi n s  là bi n r i r c, có th  trình bày dế ế ố ế ờ ạ ể ướ ại d ng bi u đ  hình thanh (bar chart ­ể ồ   hình 1) ho c bi u đ  hình bánh (pie chart). N u bi n s  là bi n liên t c, thì phân ph iặ ể ồ ế ế ố ế ụ ố  

c a bi n s  có th  trình bày dủ ế ố ể ướ ại d ng t  ch c đ  (histogram ­ hình 2) ho c đa giácổ ứ ồ ặ  

t n su t.ầ ấ

Bi u đ  hình thanhể ồ

Bi u đ  hình thang là bi u đ  nh m mô t  s  phân b  c a bi n s  r i r c. Bi u để ồ ể ồ ằ ả ự ố ủ ế ố ờ ạ ể ồ  hình thanh g m có tr c hoành trên đó xác đ nh nh ng giá tr  c a bi n s   ng v i t ngồ ụ ị ữ ị ủ ế ố Ứ ớ ừ   giá tr  c a bi n s  ngị ủ ế ố ười ta v  các thanh có chi u cao t  l  v i t n su t c a giá tr  đó.ẽ ề ỉ ệ ớ ầ ấ ủ ị  

C n l u ý luôn luôn có kho ng tr ng gi a các thanh.ầ ư ả ố ữ

45

24

0 10 20 30 40 50

Trang 10

Figure 2. Bi u đ  hình thanh (bar chart) mô t  phân b  gi i tính c a nh ng h c sinh trong tr ể ồ ả ố ớ ủ ữ ọ ườ ng m m  ầ non 23/11, Hóc môn

Chúng ta cũng có th  xây d ng các thanh theo chi u ngang nh  trong ví d  sauể ự ề ư ụ

478 65

57

S inh thö ô øng

S inh fo rceps

S inh mo å

Figure 3. Ph ươ ng pháp sinh c a 600 tr  sanh t i b nh vi n X trong năm 1998 ủ ẻ ạ ệ ệ

Ð i v i bi n s  th  t , đi u c n l u ý là các giá tr  c a bi n s  ph i đố ớ ế ố ứ ự ề ầ ư ị ủ ế ố ả ượ ẵc s p x pế  

th  t  theo tr c hoành.ứ ự ụ

e d u m a t

m u ø c h ö õ c a áp 1 c a áp 2 - 3 ñ a ïi h o ï 0

1 0 0 0

2 0 0 0

Figure 4. Trình đ  h c v n c a các bà m  trong nghiên c u ộ ọ ấ ủ ẹ ứ

Bi u đ  hình bánhể ồ

Bi u đ  hình bánh cũng để ồ ược dùng đ  mô t  s  phân b  c a bi n s  r i r c. Bi u đôể ả ự ố ủ ế ố ờ ạ ể   hình bánh là m t vòng tròn độ ược chia làm nhi u cung tề ương  ng v i các giá tr  c aứ ớ ị ủ  

bi n s  Ð  l n c a cung t  l  v i t n su t c a giá tr  bi n s ế ố ộ ớ ủ ỉ ệ ớ ầ ấ ủ ị ế ố

Ngày đăng: 09/03/2021, 07:33

🧩 Sản phẩm bạn có thể quan tâm

w