• Phương pháp phi tham số non-parametric methods – kĩ thuật thống kê không cần các giả thuyết về tính phân phối bình thường của số liệu.. • Kết quả đúng khi số liệu phân phối bình thườn
Trang 1Phép kiểm phi tham số
Trang 2• Phương pháp phi tham số (non-parametric methods)
– kĩ thuật thống kê không cần các giả thuyết về tính phân phối bình thường của số liệu
• Kết quả đúng khi số liệu phân phối bình thường và phân phối không bình thường
– hữu dụng khi không có tính bình thường
• trong một nhóm số liệu nhỏ mà không thể sửa chữa bằng phép biến đổi thích hợp
• Khi không cần kiểm tra tính bình thường
Trang 3• Khuyết điểm của phương pháp phi tham
số (non-parametric methods)
– Khó tính được khoảng tin cậy
– Không thể mở rộng sang đa biến
Trang 44
Trang 5Số giờ ngủ Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
Trang 6• 1 Loại bỏ mọi hiệu số bằng zero Sắp xếp các hiệu số
còn lại theo thứ tự tăng dần
• 2 Cộng các hạng có hiệu số dương và các hạng theo
hiệu số âm và kí hiệu tổng này là T+ và
T-• T + = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5
• T - = 3,5 + 1 = 4,5
• 3 Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ và
placebo thì tổng T+ và T- phải bằng nhau Nếu có sự khác
biệt thì một tổng sẽ lớn hơn và tổng kia sẽ nhỏ hơn Kí hiệu tổng nhỏ hơn là T
• T = số nhỏ hơn của T+ và
T-• Trong thí dụ này T = 4,5
• 4 Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc
đánh giá T, số nhỏ hơn
Trang 7Tính toán R
> hieuso<-round(data1$thuoc-data1$placebo,2)
> rank1<-rank(abs(hieuso))
> tapply(rank1,sign(hieuso),sum)
> rank1
[1] 3.5 3.5 10.0 7.0 5.0 8.0 6.0 2.0 9.0 1.0
> wilcox.test(data1$thuoc,data1$placebo,paired=T)
Wilcoxon signed rank test
data: data1$thuoc and data1$placebo
V = 50, p-value = 0.01953
alternative hypothesis: true location shift is not equal to 0
Trang 9Không hút thuốc Hút thuốc lá nặng Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7 3,79 24 2,84 5 3,60* 18 2,90 6 3,73 22 3,27 11 3,21 8 3,85 26 3,60* 18 3,52 14 4,08 28 3,23 9 3,61 20 2,76 4 3,83 25 3,60* 18 3,31 12 3,75 23 4,13 29 3,59 16 3,26 10 3,63 21 3,54 15 2,38 2 3,51 13 2,34 1 2,71 3
Tổng số = 272 Tổng số = 163
Trang 10Kiểm định tổng sắp hạng
Wilcoxon
• 1 Sắp hạng các quan sát trong cả hai nhóm
theo thứ tự độ lớn như trong bảng Nếu có giá
trị nào bằng nhau thì lấy trung bình của chúng
• 2 Cộng các hạng trong nhóm có cỡ mẫu nhỏ
Trong trường hợp này chính là nhóm người hút
thuốc lá và tổng sắp hạng là 163 Nếu hai nhóm
có cỡ mẫu bằng nhau thì lấy nhóm nào cũng
được.
• T = tổng các hạng của nhóm có cỡ mẫu nhỏ
• 3 So sánh tổng số này với giá trị quyết định
trong bảng A8 được sắp đặt hơi khác
Trang 13Tương quan sắp hạng Spearman
• 1 Sắp hạng các giá trị của mỗi biến riêng, như trình
bày trong bảng:
• 2 Tính hiệu số d, giữa mỗi cặp sắp hạng, bình
phương chúng và cộng lại
• 3 Tính tương quan sắp hạng Spearman
• 4 Ý nghĩa của sự liên quan được kiểm định bằng
cách so sánh rs với mức ý nghĩa trong Bảng A9
) 1 (
6
2
n n
d
rs
Trang 14• > weight<-c(58, 70, 74, 63.5, 62, 70.5, 71, 66)
• > rank1
• [1] 1 4 8 7 2 5 6 3
• > plasma<-c(2.75, 2.86, 3.37, 2.76, 2.62, 3.49, 3.05, 3.12)
• > rank2
• > bphs<-(rank1-rank2)^2
• > n <- 8
• > 1-6*sum(bphs)/(n*(n^2-1))
Trang 15Hệ số tương quan pearson
• Hệ số tương quan
• Tính chất
– Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]
– Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến.
– Nếu r=0 (hay r < 0,1) , không có mối liên hệ tuyến tính giữa hai biến số Nếu r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan hệ trung bình và trên 0,5 là quan hệ mạnh.
– Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan giữa hai biến số
– R 2 nói lên tỉ lệ sự biến thiên của biến số phụ thuộc được giải thích bởi biến số độc lập
1
/ ) (
) (
) (
) )(
(
2
n s
s
y x n xy y
y x
x
y y
x
x r
y x i
i
i i
Trang 16Hệ số tương quan Spearman
• Hệ số tương quan Spearman (phi tham số)
• Tính chất
– Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]
– Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là
nghịch biến
– Nếu r=0 (hay r < 0,1) , không có mối liên hệ tuyến tính giữa hai biến số Nếu r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan hệ trung bình và trên 0,5 là quan hệ mạnh
– Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan giữa hai biến số
) 1 (
6
2
n n
d
rs
Trang 17Tóm tắt về phép kiểm phi tham số
• Signed rank test
– wilcox.test(y1,y2,paired=T)
• Sum rank test
– wilcox.test(y1,y2,paired=F)
– wilcox.test(y~x,paired=F)
• Kruskal wallis
– kruskal.test(y1,y2,paired=F)
• Hệ số tương quan spearman
– cor.test(y,x,method="spearman")