Lẽ Đức Ngọc- Nhập môn xứ lý sổ liệu và kế hoạch hóa thực nghiệm-12/2011MỤC LỤC Lòi nói đầu Mục lục PHẦN I: THỐNG KÊ VÀ PHÂN TÍCH THÓNG KÊ SÓ ĐO Chương 1: Các đặc trưng thông kê của một
Trang 2Lẽ Đức Ngọc- Nhập môn xứ lý sổ liệu và kế hoạch hóa thực nghiệm-12/2011
MỤC LỤC
Lòi nói đầu
Mục lục
PHẦN I: THỐNG KÊ VÀ PHÂN TÍCH THÓNG KÊ SÓ ĐO
Chương 1: Các đặc trưng thông kê của một tập số liệu kết quả đo
1 Các tham số đặc trưng về sự tập trung của tập số liệu
2 Các tham số đặc trưng về sự phân tán của tập sổ liệu
2.1 Phương sai (o2hoặc s 2)
2.2 Độ lệch chuẩn (ơ f hoặc Sf)
2.3 Độ sai chuẩn (ơx hoặc Sx)
2.4 Hệ số biến thiên (Cv)
3 Các đặc trưng phân phối thong kê cùa tập so liệu
3.1 Phân phối Chuẩn (phân phối Gauss) (u)
3.2 Phân phổi Student (phân phối t)
3.3 Phân phối Fisher
3.4 Phân phối Khi bình phương
3.5 Phân phối Poisson
3.6 Phân phối Nhị thức
3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối
Chương 2: Phân tích đánh giá tập số liệu kết quả đo
4.1 Sai số đo
4.2 Độ chính xác của tập sổ liệu kết quả thực nghiệm
4.3 Độ sai biệt của tập số liệu kết quả thực nghiệm
4.4 Sai số tối đa cho phép AP(X)
4.5 Khoảng chính xác tin cậy
4.6 Khoảng giới hạn tin cậy của một tập số liệu kết quả đo
Chương 3: Phân tích so sánh cặp tham số đặc trưng của hai tập số liệu kết quả đo
5.1 Giả thiết thống kê và kết luận thống kê
5.2 Quan hệ giữa chuẩn phân phổi và kết luận thống kê
5.3 Phân tích so sánh
5.3.1 So sánh độ chính xác
5.3.2 So sánh sai biệt
PHẦN II: PHÂN TÍCH NHÂN TÓ ẢNH HƯỞNG LÊN SÓ ĐO
Chương 4 : Phân tích Hồi qui và Tương quan của các nhân tố
6.1 Hồi qui và Tương quan hai nhân tố
6.1.1 Hồi qui tuyến tính
6.1.2 Hồi qui phi tuyến tính
6.1.3 Hệ sổ tương quan (r) Spearman
6.1.4 Hệ số tương quan thứ bậc Spearman rho
6.2 Hồi qui và tương quan đa nhân tố
Trang 3Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
Chương 5: Phân tích tác động của các nhân tố qua tham số
( phân tích bằng phương s a i)
7.1 Bài toán 1 nhân tố, k mức đo,mỗi mức đo lặp lại n lần
7.2 Bài toán 2 nhân tố A và B; nhân tố A, k mức đo; nhân tố B, m mức đo; với mỗi mức cùa
2 nhân tổ A và B đều tiến hành đo lặp lại n lần
7.3 Bài toán 3 nhân tổ trở lên ( Phưcmg pháp Ô vuông Latin)
Chương 6: Phân tích tác động của các nhân tố không qua tham số
8.1 Bài toán tỷ lệ giữa 2 đại lượng, mỗi đại lượng 2 mức
8.1.1 Dùng chuẩn Khi bình phương (x2) để đánh giá
8.1.2 Dùng Hệ số tương quan để đánh giá
8.2 Bài toán tỷ lệ giữa 2 đại lượng X (có s mức) và Y (cỏ r mức)
8.3 Bài toán so sánh 2 tỷ lệ
PHẦN III: KẾ HOẠCH HOÁ THựC NGHIỆM
Chương 7: Mô hình hoá thực nghiệm đa nhân tố bậc một đầy đủ và rút gọn
9.1 Đại cương về mô hình hoá thực nghiệm đa nhân tố
9.2 Mô hình hoá thực nghiệm bậc 1 đầy đủ
9.3 Mô hình hoá thực nghiệm bậc 1 rút gọn
Chương 8: Mô hình hoá thực nghiệm đa nhân tố bậc hai đầy đủ hay rút gọn
10.1 Mô hình hoá thực nghiệm bậc 2 tâm trực giao
10.2 Mô hình hoá thực nghiệm bậc 2 tâm xoay
Chương 9: Phương pháp mạng đơn hình
PHẦN IV: TÓI ƯU HOẢ TH ựC NGHIỆM
Chương 10 Tối ưu hóa thực nghiệm
10.1 Khái niệm và phân loại các phương pháp tối ưu hoá
10.2 Phương pháp thực nghiệm theo đường dốc nhất
10.3 Phương pháp khảo sát mặt mục tiêu
10.4 Phương pháp thực nghiệm theo đơn hình
Trang 4PHẦN I
XỬ LÝ SÓ LIỆU KẾT QUẢ ĐO
CHƯƠNG 1
CÁC ĐẶC TRƯNG THỐNG KÊ CỦA MỘT TẬP SỎ LIỆU KỂT QUẢ ĐO
Những đại lượng đặc trưng chính cho một tập số liệu kết quả đo, được phân làm 3 loại chính: 1/ Các tham số đặc trưng về sự tập trung của tập số liệu, 2/ Các tham số đặc trưng về
sự phân tán của tập số liệu, 3/ Đặc trưng phân phối thống kê của tập số liệu
1 Các tham số đặc trưng về sự tập trung của tập số liệu
1.1 Tần suất (p¡)
Giả thiết có một tập số liệu kết quả đo gồm có N số liệu, trong đó có n¡ giá trị Xi (Xi
xuất hiện n¡ lần) n¡ gọi là tần số của giá trị Xi, khi đó, tần suất của giá trị Xi được tính như sau:
N
Pi là tần suất xuất hiện giá trị Xj, khi N —> co thì Pi —» Pj (Pj là xác suất, xuất hiện giá trị Xị).
Lè Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
Ví dụ 1: Khi khảo sát 100 đối tượng đo X, thu được 100 số liệu đo cho ở bảng sau:
Trang 5Lê Đức Ngọc- Nhập môn xủ lý số liệu và kế hoạch hóa thực nghiệm-12/2011
Bảng biểu diễn số liệu thống kê 100 kết quả đo từ 100 đối tượng đã cho trên đây theo phân nhóm cách nhau khoảng 17 đon vị một, được trình bày như sau:
Nhóm Tần số Giá trị TB Tấn suất Tần suất dồn
Lóp trội từ 4.18 đên 4.35 là lớp có tân suât lớn nhât (0.24)
Bảng số liệu trên có thể được biểu diễn trên 2 loại đồ thị sau:
Việc phân nhóm một tập số liệu được tiến hành qua một số bước, thông thường, chia làm 10 nhóm
Vi dụ 2: Dưới đây là điểm trắc nghiệm môn toán của 50 học sinh trong một lớp học Hãy
phân tập số liệu này thành 10 nhóm
Bước 3: Tính khoảng của nhóm có giá trị nhỏ nhất: 12 + 3 = 15, ta có nhóm có giá trị nhỏ nhất là 12-15, từ đó xây dựng nên các nhóm có giá trị cao hơn, đếm các giá trị nằm trong tập
số liệu để tìm tần số của nhóm, kết quả ta có tập số liệu trên được phân nhóm như sau:
-5
Trang 6-Lẽ Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
Số trội (Mo) là số có tần suất lớn nhất (chính là số có tần số xuất hiện lớn nhất) trong
tập số liệu kết quả đo
1.3 Khoảng của tập số (R)
Khoảng của tập sổ, R, là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập
số liệu kết quả đo Như vậy, khoảng của tập số được tính theo công thức sau:
1.4 SỐ trung vị (Med) và số tứ phân vị (Q)
So trung vị (Med) là sổ đúng giữa tập sổ liệu đã được sấp xếp theo thứ tự từ bé đến
lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu
a/ Đôi với các số liệu không nhóm lại:
Giả sử Xi, X2, X3, , x n là dãy các giá trị của tập sổ liệu kết quả đo, được sắp xếp theo thứ tự tăng dần, thì:
- Số trung vị của tập N số lẻ được tính theo công thức sau:
Med — X Ịx[+]
2
Vi dụ 3 : Tìm trung vị của tập số: 5 , 7 , 9 ,1 3 ,1 5 ,1 6 ,1 9
Giải: Med = X(7+i)/2 = X4, số thứ 4 là số 13 vậy Med = 13
- Sổ trung vị của tập N số chẵn được tính theo công thức sau:
b/ Đối với số liệu gộp thành nhóm:
- Tìm trung vị tập số liệu có phân nhóm theo công thức sau:
Trong đó : LL = Giới (lowest limit);
N = Tổng số trường hợp; cf = Tần số dồn (cumulative frequency)
fm = Tần số ứng với khoảng điểm kế tiếp với khoảng điểm có tần số dồn được chọn
i = Giá trị khoảng điểm (Interval)
Trang 7Vi dụ 5: Tính giá trị trung vị cho tập số liệu sau:
Số tứ phân vị là các số chia tập số liệu thành 4 phần tư Có 3 số tứ phân vị là Qi= Xi/4,
Q2= X2/4 và Q3= X-ị/4 số Q2 = X2/4 trùng với số trung vị Med.
a/ Đối với các số liệu không nhóm lạ i:
- Số tứ phân vị của tập N giá trị chia hết cho 4, thì tính theo công thức:
b/ Đổi với so liệu gộp thành nhóm :
Giả sử nhóm thứ i (Xi, Xj + 1) có n, giá trị nằm trong nhóm đó và ta cỏ:
thì Med nằm trong nhóm thứ k ( Xk, Xk + i) được tính như sau:
Me =
- ĩ « /=1
Tuơng tự, các tứ phân vị được xác định theo công thức chung sau đây:
7
Trang 8Lé Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
03 = 69.5 + '3 3 7 5 -2 9 "
V 5 , x5 = 69.5 + 4.75 = 74.25
1.12
1.5 Trung bình cộng
Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm thì X được
tính theo công thức sau:
X =
khi X, xuất hiện ni lần thì tính theo :
1.13
Ví dụ 7: Điểm thi môn toán của 10 học viên thuộc nhóm khá là: 78, 79, 62, 84, 90, 71, 76, 83,
98, 77 Điểm trung bình của 10 học viên là:
x = 1 ^ v _ 78 + 79 + 62 + 84 + 90 + 71 + 76 + 83 + 98 + 77
N h X l '
= 79 điểm
10
Trang 9Lê Đức Ngọc- Nhập môn xử lý sổ liệu và kế hoạch hóa thực nghiệm-12/2011
Trong trường họp tập số liệu được phân nhóm, giá trị trung bình cộng được tính theo công thức tổng quát sau:
ỵ / 1*1 +f ĩ x 2 + - + f kXk l y f x
/ , + / 2 + + /* ^Trong đó: Xi là giá trị trung bình của nhóm, fịtần số của nhóm
Ví dụ 8: Điểm thi trắc nghiệm của 100 học viên cho ở bảng sau:
Điển số Tần số Giá trị trung
bình nhóm
Tần số X giá trị trung bình nhóm
1.15
Khi âó, x = ~ y f tx, = = 62.1
1 ' 100
Công thức tính giá trị trung bình cho tập sổ liêu phân nhóm cũng dùng cho trường hợp
tính giá trị trung bình gia quyền (có trọng sổ), khi đó f, trọng số của giá trị Xj.
Trong thực tế, người ta tỉnh giả trị trung bình của một tập so liệu phân nhóm theo công thức sau:
X = Mean = Am +( ~ 7 —)•*Y f d .
Trong đó: Am = số trung bình cộng giả thiết (Assumed mean)
f = Tần số (Frequency), d = Độ lệch (deviation)
i = Khoảng điểm (interval), N = số lượng các trường hợp (Numbers)
Ví dụ 9: Tính số trung bình cộng của các điểm số được nhóm thành các khoảng điểm của tập
Trang 10-Lẽ Đức Ngọc- Nhập món xử lỳ số liệu và kế hoạch hóa thực nghiệm-12/2011
X - Mean = 61 +"35"
,5 0 , X 5 = 70.5
1.6 Trung bình nhân
Thường dùng để tính tốc độ tăng trung bình của tăng theo cấp số, sự pha loãng
Ví dụ 10: Thống kê số học viên tại chức đăng ký dự thi trong 4 năm của một cơ sở đào tạo
cho ở bảng dưới đây Tính: 1/ Bình quân số đăng ký dự thi trong 4 năm, 2/ Tốc độ đăng ký dự thi tăng bình quân trong 4 năm
2001 là: 800:500= 1.6; 2002 là: 1600:800 = 2; 2003 là: 3200:1600 = 2
Vậy tốc độ đăng ký dự thi tăng bình quân trong 4 năm là: GMx = \l 1.6 X 2 X 2 = 1.86
Tức bình quân tốc độ đăng ký dự thi tăng 186% so với nămg trước Nói một cách khác, hàng năm tốc độ tăng bình quân đăng ký dự thi là 86%
1.7 Trung bình điều hoà
Dùng để tính vận tốc, thời gian trung b ìn h ,
Vi dụ 11: Trung bình 1 giờ, học viên A giải được 8 bài toán, học viên B giải được 7 bài toán,
học viên c được 10 bài toán Tính tốc độ giải toán bình quân của 3 học viên trên
Dùng để tính trung bình của hệ gồm nhiều tập số liệu hoặc tập số liệu có trọng s ố ,
Ví dụ 12: Tính điểm bình quân của 5 lớp khối 10 thi môn Toán theo bảng dữ kiện sau:
Trang 11Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
2 Các tham số đặc trưng cho sự phân tán của tập số liệu
2.1 Phương sai (ơ2 hoặc s2)
Phương sai là trung bình của tổng bình phương sai khác giũa các giá trị của tập số liệu
so với giá trị trung bình của tập số liệu kết quả đo:
ơ 2 hay s 2 = ~ £ < x i - x >
N i=l
I u : XT ^ OA /_ 2 x x r i _X
Với: N' = N khi N > 30 (ơz) N' = N - 1 khi N < 30 (Sz)
N' có bản chất là bậc tự do của tập số liệu kết quả đo
Công thức thực dụng để tìm phương sai:
Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo Phương sai càng
lớn, sai biệt càng lớn Ngược lại phương sai càng nhỏ thì sai biệt càng nhỏ
Phương sai còn biểu diễn độ phân tán của tập sổ liệu kết quả đo đối với giá trị trung
bình Phương sai càng lớn độ phân tán xung quanh giá trị trung bình càng lớn và ngược lại
2.2 Độ lệch chuẩn (ơf hoặc Sf)
Độ lệch chuẩn của một tập số liệu kết quả đo là giá trị căn bậc 2 trị số phương sai của nó:
Độ lệch chuẩn có cùng thứ nguyên và cũng có ý nghĩa như phương sai
Trong thực tế, người ta hay tính độ lệch chuẩn theo công thức sau đây:
Trang 12-Lẽ Đức Ngọc- Nhập môn xử lỷ số liệu và kế hoạch hóa thực nghiệm-12/2011
2.3 Độ sai chuẩn (ơ ^ hoặc S ỵ )
Độ sai chuẩn bằng độ lệch chuẩn chia cho căn bậc 2 của số giá trị kết quả đo:
Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ số biến thiên để
so sánh gần đúng độ sai biệt của các kết quả đo thu nhận được bàng các cách khác nhau
Khi độ lệch chuẩn lớn (Sf) (tức sai biệt của các sổ liệu đo lớn), thì c v lón và ngược lại
Ví dụ 16: Đánh giá sự phát triển của trẻ 7 tuổi theo cân nặng trung bình là 20.37 kg với độ
lệch chuẩn là 2.16 kg; trong khi đó, nếu đánh giá theo chiều cao trung bình là 113.64 cm với
độ lệch chuẩn là 4.04 cm Hỏi đánh giá nào mắc sai số lớn hơn?
Trang 13Lẽ Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-ì2/2011
Theo cân năng: cv = — — X100% - 10.6%
20.37Theo chiều cao: cv - — ^ X100% = 3.56%
113.64Vậy theo cân nặng mắc sai số lớn hơn
Ví dụ 17: 10 người học có điểm trung bình môn Toán và môn ngoại ngữ tương ứng là 85 và
72, trong khi đó học có độ lệch chuẩn của môn Toán và ngoại ngữ đều là 6.82
Tính Cv cho môn toán là:
= X100% = 8 02%
1 85Còn Cv cho môn ngoại ngữ là
2 72Vậy, tuy có đô lệch chuẩn giống nhau, nhung sai số đổi với môn ngoại ngũ’ lớn hơn
3 Các đặc trưng phân phối thống kê của tập số liệu
Đặc trung phân phối thống kê của một tập số liệu kết quả đo là qui luật phản bố ngẫu
nhiên của các giá trị kêt quả đo trên trục sô thực Đặc trung phân phôi thông kê là qui luật,
nên về mặt toán học nó thường được biểu diễn bằng một hàm số và có đồ thị tương úng
Mỗi tập sổ liệu kết quả nghiện cứu là một tập số ngẫu nhiên (thường là rời rạc) có những đặc trung phân phối thống kê riêng và thường tuân theo 1 trong 6 qui luật phân phối thống kê ngẫu nhiên phổ biến nhất, đó là:
3.1 Phân phối chuẩn (phân phối Gauss)(u)
- Hàm số của phân phối chuẩn được biểu diễn bằng phương trình toán học:
Ị J X - M Ý
crv2 n
Trong đó:
X: là biến số ngẫu nhiên
p: là hàng số, bằng giá trị kỳ vọng của biến ngẫu nhiên ơ: là hàng số, bằng giá trị phương sai của biến ngẫu nhiên
Gọi u là chuẩn Gauss và đặt:
ơthay vào phương trình trên ta được dạng chính tắc của hàm phân phối chuẩn:
1
ơ N l n Dạng chính tắc của hàm phân phối chuẩn là dạng của hàm phân phổi chuẩn đã chuyển
hệ toạ độ từ Y(X) sang Y(u)
Nếu đặt ơ là đơn vị của thang chia trục hoành mà giá trị của nó được xác định từ điếm uốn của đường cong chuẩn hạ xuống trục hoành, p là tham số đặc trung cho sự tập trung các giá trị của hàm phân phối, thì hàm phân phối chuẩn có dạng chuông úp
Hàm phân phối chuẩn có đặc diểm là: X = Mo = Med = p.
- 13
Trang 14-Lê Đức Ngọc- Nhập môn xử lỷ so liệu và kế hoạch hóa thực nghiệm-12/2011
ĐỒ thị của hàm phân phối chuẩn:
Xác suất thong kê gắn liền với khái niệm độ tin cậy thống kê (P) Diện tích giới hạn
bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện Xj trong khoảng tích phân Kí hiệu độ tin cậy thống kê để xuất hiện giá trị Xi nằm trong vùng (- 00, Xi) là P(Xị)
Độ tin cậy thống kê luôn là một số nhỏ hon hoặc bằng 1 (P(Xj) <1).
Nếu kí hiệu cc là Độ không tin cậy thắng kê, thì:
p + a = 1 hay p = 1 - a hoặc a = 1 - p
Khi p =1, điều đó có nghĩa là xác suất xuất hiện giá trị Xi là 100%
Trong xác suất, người ta qui ước:
Biến cố cỏ p = 0.9999 là biến cố hoàn toàn chắc chắn.
Trang 15Từ hàm phân phổi chuẩn, khi cho một giá trị Ui (X) thì ta tính được độ tin cậy thống kê
Pị, úng với một diện tích P j Ngược lại, khi cho giá trị Pj thì có thể tính được một giá trị Uj(X)
Thay cho tính toán, người ta lập sẵn nhũng bảng số để tra giá trị u khi biết giá trị p hoặc ngược lại (xem phụ lục A)
3.2 Phân phối Student (phân phối t)
Hàm sổ của phân phối Student có dạng:
Lẽ Đức Ngọc- Nhập môn xứ lý số liệu và kế hoạch hóa thực nghiệm-12/2011
y ( t , f ) = B(ỉ +
.2 -/+1
—) 2 /
Sf là độ lệch chuẩn, S x là độ sai chuẩn
Hàm phân bổ t phụ thuộc vào biến số t là một biến ngẫu nhiên
f: bậc tự do (f = N - 1); B: là một hằng số
Sf! độ lệch chuẩn Vậy t bao giờ cũng phụ thuộc vào bậc tự do
- Đồ thị của hàm phân phối student:
Khi Xi là sổ có tần số rất lớn (tức là số có tần suất rất lớn) thì có thể suy ra gần đúng
X, = X (giá trị có tần suất rất lớn thì giá trị của nó coi như trùng với giá trị trung bình).
Đồ thị của hàm Student giống như hàm phân phối chuẩn có dạng chuông úp Nó có đầy đủ các tính chất giông như hàm phân phôi chuân Nhưng khác ở chô: độ nhọn của đô thị hàm phân phối student phụ thuộc vào bậc tự do Y(p, f)
Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại Do độ nhọn phụ thuộc vào bậc
tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do t(p,f) Trong thực tế, người ta nhận thấy:
N > 30: tuân theo phân phối chuẩn
N < 30: tuân theo phân phối Student
Đối với phân phổi Student cũng có bảng tra chuẩn Student tính sẵn Dựa vào bảng này, khi biết hai trong ba giá trị t, f và p thì xác định được giá trị còn chưa biết
- 15
Trang 16-Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/201 !
CÓ 2 loại bảng tra giá trị t (gọi là bảng phân vị của chuẩn t) Khi giả thiết thống kê:
Thì tra bảng phân vị của chuẩn t theo 2 phía
3.3 Phân phối Fisher
Hàm số của phân phối Fisher có dạng:
Y (F ,f,,f2) = A - / A
Trong đó: F là biến số ngẫu nhiên; f], f2 là các bậc tự do; A là hằng số phụ thuộc fl và f2
F phụ thuộc vào hai loại bậc tự do và được tính theo công thức sau:
Tuỵ thuộc vào bậc tự do mà đồ thị có các dạng khác nhau Hàm phân phổi Fisher cũng
có tính chât như các hàm phân phôi khác Diện tích giới hạn bởi đường cong cũng biêu diễn
độ tin cậy thống kê
Người ta cũng lập các bảng tra sẵn, khi cho (P, fl và f2) sẽ tra được giá trị của chuẩn F, ngược lại cho 3 trong 4 thông số ( F,p,f],f2 ) sẽ tra được số thứ 4 chưa biết
Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95,fi, f2) và bảng F(0.99,fi,f2) (xem phụ lục A)
Trang 17Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
3.4 Phân phối Khi bình phương
Hàm số của phân phối Khi bình phương có dạng:
Với: x 2 = V (— — —) 2 Khi lấy các giá trị: 0 < X < + ũ0 1-36
i=l ơ f
Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do
Đồ thị của hàm phân phối Khi bình phương có dạng:
Nếu cho trước độ tin cậy thống kê p và giá trị f, tra bảng sẽ tìm được giá trị X2 và ngược lại
3.5 Phân phối Poisson
- Hàm số của phân phổi Poisson có dạng:
tix e " ^
X!
Như vậy, kì vọng và phương sai của hàm phân phối Poisson trùng nhau
- Đồ thị của hàm phân phối Poisson có dạng:
- Kì vọng của biến ngẫu nhiên X là: Np
- 17
Trang 18-Lẽ Đức Ngọc- Nhập môn xử lý sô liệu và kế hoạch hóa thực nghiệm- ì 2/201 ì
- Phương sai của biến ngẫu nhiên X là: ơ2 = Npq
- Độ lệch chuẩn của biến ngẫu nhiên X là: Vỡ = VNpq 1.39
- Độ sai chuẩn của biến ngẫu nhiên X là: ơx = pq
- Đồ thị của hàm phân phổi nhị thức có dạng:
cần phân biệt khái niệm hàm phân phối và chuẩn phán phối (chuẩn thống kê):
- Hàm phân phối là qui luật phân bổ số liệu kết quả đo có tính ngẫu nhiên (các biển
Người ta so sánh giữa giá trị tra bảng và giá trị tính được để đánh giá độ tin cậy thống
kê của một sự kiện, theo điều kiện cho trước (theo giá trị tra bảng)
3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối
Ta có nhận xét, một tập số liệu kết quả thực nghiệm phụ thuộc vào bậc tự do:
+ 2 bậc tự do thì tuân theo hàm F
+ 1 bậc tự do thì tuân theo hàm t hoặc X 2+ Không phụ thuộc vào tự do thì tuân theo hàm u hoặc p
Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập số liệu kết quả
đo như sau:
- Nếu N >30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo có qui luật phân phối chuẩn:
1/ Đồ thị phân phối tần suất có dạng chuông
2/ Mo = Med = X .
3/ Xj nhận các giá trị ở ngoài khoảng X ± 2 ơ là 5% hoặc
Xi nhận các giá trị nằm trong khoảng X ± 2 ơ là 95%.
- Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo có qui luật phân phối Student
Trang 19Lẽ Đức Ngọc- Nhập môn xử lý so liệu và kế hoạch hóa thực nghiệm-12/2011
Sơ đồ sau đây cho thấy các qui luật phân phối thống kê đã trình bày chi là 1 trường hợp riêng của nhau mà thôi:
Y(p,q)
- 19
Trang 20-CHƯƠNG 2
ĐÁNH GIÁ TẬP SÓ LIỆU KẾT QUẢ ĐO
Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua các đại lượng chính sau đây:
4.1 Sai số đo
Có 4 loại sai số đo:
- Sai số tuyệt đối:
Sai số tuyệt đổi là sự sai khác của một giá trị đo nào đó với giá trị trung bình (hoặc giá
trị thật) Sai khác này có thể là âm hoặc dương
- Sai số tương đối:
£ R = ^ ^ 1 0 0 = ^4 ^ 1 0 0 2.2
Sai số tương đổi là tỷ số của sai số tuyệt đối đối với giá trị trung bình Sai số này
không có thứ nguyên cho nên được dùng để so sánh sai số tương đối của các phương pháp đo cho kết quả không cùng thứ nguyên
- Sai số hệ thống:
Nếu hiệu số này là đáng tin cậy tức là khác không là đáng tin cậy thì số đo đã mắc sai
sổ hệ thống, Khi đó giá tri X; tập trung về một phía của giá trị thực trên trục sô Sai số hệ
thống có thể tìm được nguyên nhân gây sai số hệ thống để loại bỏ
- Sai số ngẫu nhiên:
Phép đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bỉnh cộng X với giá trị
thật gần bằng không là đáng tin cậy Khi đó các giá trị Xj phân bổ đều hai phía của giá trị thực trên trục số Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ có thể tìm các giải pháp để giảm sai số ngẫu nhiên
4.2 Độ chính xác của tập số liệu kết quả đo
Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệm nên độ chính xác của tập sổ liệu kết quả đo được đánh giá thông qua giá trị trung bình cộng Giá trị trung bình cộng mà sai khác với giá trị thật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại
Nguyên nhân dẫn đến độ chính xác kém có thể là:
- Chọn mẫu không đúng về chất lượng và số lượng
- Giải pháp đo số liệu không chính xác
4.3 Độ sai biệt của tập số liệu kết quả đo
Vì phương sai biểu diễn độ sai biệt trung bình của các giá trị trong tập số liệu kết quả
đo so với giá trị trung bình Phương sai càng nhỏ thì độ sai biệt càng nhỏ và ngược lại
Nguyên nhân chính dẫn đến độ sai biệt lớn:
- Chọn mẫu về chất lượng và sổ lượng không đặc trung cho mục tiêu đo
- Tay nghề người làm đo kém, không thu thập được sổ đo
Thực ra giá trị trung bình cộng X cũng phản ánh phần nào độ sai biệt khi so với giá trị thật
và ngược lại giá trị phương sai s 2 cũng phản ánh phần nào độ chính xác khi độ sai biệt nhỏ
Lê Đức Ngọc- Nhập môn xử lý so liệu và kê hoạch hóa thực nghiệm-12/201 /
Trang 21Lẽ Đức Ngọc- Nhập môn xử lý só liệu và kế hoạch hóa thực nghiệm-12/2011
Tuy nhiên mỗi đại lượng có tính trội biểu diễn cho độ chính xác và độ sai biệt khác nhau: X
có tính trội phản ánh độ chính xác, s 2 có tính trội phản ánh độ sai biệt:
Kết luận Đúng - Tốt Sai số ngẫu nhiên Sai số hệ thống
4.4 Sai số tối đa cho phép AP(X)
Sai số tối đa cho phép AP(X) của một tập số liệu kết quả đo được qui định: cho phép
lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là ±3ơ Nó phản ánh tính thống kê
của kết quả đo Sai số tối đa cho phép chia làm hai loại:
+ Sai số tối đa cho phép tuyệt đối:
AP(X) = ±3ơ+ Sai số tối đa cho phép tương đối:
Nhũng giá trị kết quả đo nào nằm ngoài khoảng sai số tối đa cho phép tuyệt đổi thì phải loại bỏ (và gọi các giá trị đó đã mắc sai số thô)
4.5 Khoảng chính xác tin cậy
Khoảng chính xác tin cậy được tính theo công thức sau:
Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:
t(P,f): là giá trị tra ở bảng phân vị của hàm phân phối Student
Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả mãn với độ tin cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu (N) đo số mẫu đo cần thiết để có
-21
Trang 22-Lê Đức Ngọc- Nhập môn xứ lý sổ liệu và kế hoạch hóa thực nghiệm-12/2011
khoảng chính xác tin cậy trùng với khoảng chính xác tin cậy lý thuyết cho trước, được tính theo công thức sau:
\ t ự j ) s f Ỵ
N
4.6 Khoảng giói hạn tin cậy của một tập số liệu kết quả đo
Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui định nằm trong khoảng:
X ± AX(p,f) = X ± t(p,f) ss 2.10
Giá trị Xi bất kỳ của một tập sổ liệu kết quả đo được chấp nhận theo độ tin cậy thống
kê p cho trước, có bậc tự do f = N-l phải luôn nằm trong khoảng giới hạn tin cậy và thường được biểu diễn như sau:
a/ Tinh các đại lượng đặc trưng của tập số liệu trên,
b/ Phân tích đánh giá tập số liệu
Trang 23Lê Đức Ngọc- Nhập môn xứ lý số liệu và kế hoạch hóa thực nghiệm-12/2011
- Khoảng giới hạn tin cậy:
Với độ tin cậy 95%,
Trang 24-CHƯƠNG 3
SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SÓ LIỆU KẾT QUẢ ĐO
Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
5.1 Giả thiết thống kê và kết luận thống kê
5.1.1 Giả thiết thống kê
Giả sử ta có Xj và x k là hai tham số đặc trưng của hai tập số liệu kết quả đo Xuất hiện hai giả thiết thống kê, trình bày ở bảng sau:
Giả thiết không
(giả thiết không liên quan) Ho Xi = x k
Trong đó: Xị và x k có thể là hai sự kiện, hai biển cố, hoặc hai đại lượng ngẫu nhiên có cùng thứ nguyên
5.1.2 Kết luận thống kê
Có hai loại kết luận thống kê:
Bảng phân loại các kết luận thống kê:
Thật Giả Ket luận thống kê loại 1:
Bác bỏ Ho; Chấp nhận Ha
Kết luận thống kê loại 2:
Chấp nhận Ho; Bác bỏ Ha
Ho (Xj=Xk) HaíXj*Xk) Sai (Sai lầm loại 1) Đúng
H a(X ,* X k) Ho(X| = Xk) Đúng Sai ( Sai lầm loại 2)
+ Kết luận thống kê loại 1: Phủ định Ho (bác bỏ Ho) và khẳng định Ha (chấp nhận Ha).
Kết luận thống kê loại 1 dẫn đến sai lầm loại 1, đó là Đúng là Ho (Xj s x k) lại kết luận là
Ha (Xj * Xk) Nói một cách khác: đúng là chúng giống nhau lại bảo chúng khác nhau
+ Kết luận thống kê loại 2: Phủ định Ha (bác bỏ Ha) Khẳng định Ho (chấp nhận Ho).
Ket luận thống kê loại 2 dẫn đến sai lầm loại 2, đó là đúng là Ha (Xi * Xk) lại kết luận
là Ho (Xi = Xk) Nói một cách khác: đúng là chúng khác nhau lại kết luận chúng giống nhau.
Cần nhớ rằng: Kết luận thống kê là khẳng định (hay chấp nhận) một giả thiết thống kê này và phủ nhận (hay bác bỏ) già thiết thống kê kia, chứ không có nghĩa là cho rằng giả thiết thống kê này đúng còn giả thiết thống kê kia sai
Trong trường hợp buộc phải kết luận thống kê thì phải giữ nguyên tắc: thà mắc sai
lầm loại 1 còn hon mắc sai lầm loại 2 Nói cách khác: nếu không đủ bằng chứng để khẳng định giả thiết Ho, thì thà phủ nhận giả thiết Ho, còn hơn khẳng định giả thiết Ho.
5.2 Quan hệ giữa chuẩn phân phối và kết luận thống kê
Các chuẩn phân phối có thể tính được từ các số liệu của tập số liệu kết quả đo:
x - p
ơ ^ P O - x "Sf x hoàc
-x - pSx
Sf
Sơ đồ quan hệ giữa chuẩn phân phối và kết luận thống kê:
Trang 25Lê Đức Ngọc- Nhập môn xử lý sổ liệu và lcế hoạch hóa thực nghiệm-12/2011
- Nếu ttính < tbãng nghĩa là độ tin cậy thống kê của ttính nhỏ hơn độ tin cậy thống kê
của tbàng vậy thì ttính không đáng tin cậy băng tbáng
Do ttính không đáng’tin cậy bằng tbáng nên hiệu so X - p không đáng tin cậy, điều đó có nghĩa sự khác nhau giữa giá trị trung bình và giá trị thật là không đáng tin cậy Vì chúng khác
nhau không đáng tin cậy cho nên có thể coi như chúng giống nhau (chấp nhận Ho, phủ nhận
Ha)
- Nếu ttính > tbảng, thì ttính có độ tin cậy thống kê lớn hơn độ tin cậy thống kê của tbàng
Vì vậy ttính đáng tin cậy và do đó hiệu số X - p chỉ sự sai khác giữa X và p là đáng tin cậy
(phủ nhận Ho, chấp nhận Ha).
- Nếu ttính = tbảng thì độ tin cậy bằng nhau cho nên X - 10 thoả mãn độ tin cậy thống kê cho trước Nói cách khác độ chính xác tin cậy của tập số liệu kết quả đo thoả mãn độ tin cậy thống kê cho trước Trong trường hợp này, chúng ta chọn thà mắc sai lầm loại 1 còn hơn mac sai lầm loại 2 để kết luận thống kê Nghĩa là thà kết luận X khác p hơn là kết luận X giống
p để chọn quyết định cho phù hợp
Do tbáng phụ thuộc độ tin cậy thống kê (P) cho trước, nên một kết luận thống kê rút ra được chỉ ứng với một độ tin cậy thống kê cho trước mà thôi Khi độ tin cậy thống kê thay đổi thì kết luận thống kê cũng có thể thay đổi theo
Lập luận về quan hệ giữa chuẩn phân phối t và kết luận thống kê cũng áp dụng cho các chuân phân phôi khác Và việc sử dụng các chuân phân phôi của các hàm phân phôi đê kêt
luận thống kê cho đúng - gọi là kiểm định thong kê (xem các ví dụ cuối chương).
-25
Trang 26-Ví dụ 19: Sử dụng 4 kết quả đo A, B, c và D Kết quả làm lặp lại theo mỗi đo 6 lần thu được trình bày trong bảng sau:
Lê Đức Ngọc- Nhập môn xừ lý sô liệu và kê hoạch hóa thực nghiệm-12/2011
b/ Biết giá trị thật là 18.1 Phân tích đánh giá sai số của mỗi mẫu đo
Trang 27Lê Đức Ngọc- Nhập món xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
18.05-18.1
Kết luận: Ho: x= p —» sai số ngẫu nhiên
Il8 l-1 8 ll
- Đối với mẫu B, ta có: t B - — ■ - = 0 « tbãng (95 5) - 2.57
Kết luận: Ho: x= {0 —> sai số ngẫu nhiên
Il7.75-18.il
- Đối với mẫu c, ta có: tc = -— —-= 8.174 » ÍB (95 5 ) — 2.57
V o.oil Vó
Kết luận: Ha: X * p -> sai số hệ thống
Trên thực tế, người ta còn sử dụng giá tri độ tin cậy P-value để kết luận thống kê:
P-value một phía = 0.5000 (giá trị của z tại p = 0) - giá trị tra bảng của z
P-vaỉue hai phía = 2(0.5000 - giá trị tra bảng của z)
Với: P-value < a thì bác bỏ giả thiết Ho, chấp nhận Ha
P-value > a thì chấp nhận giả thiết Ho, bác bỏ Ha.
Vỉ dụ 20: Điểm thi bài trắc nghiệm trung bình của khối 10 là 24, lấy ngẫu nhiên 36 thí sinh
tính được giá trị trung binh ià 24.7 với độ lêch chuẩn là 2 Đánh giá xem giá trị trung bình của các thí sinh này có khác của khối không?
Giải:
- Giả thiết Ho là p < 24, Ha là p > 24
- Tra bảng phụ lục A l: z = 2.10, tra được z (a = 0.05) = (0.98214 - 05000 ) = 0.4821
- Tính hiệu: 0.5000 - 0.4821 = 0.0179, trong trường hợp 1 phía này đó chính là P-value
Vậy P-value = 0.0179 < 0.05 (a), kết luận: bác bỏ Ho, nghĩa là 36 thí sinh này thực sự có
điểm trung bình cao hơn khối 10
Ví dụ 21: Một nghiên cứu trẻ khuyết tật có chỉ số IQ trung bình là 80, kiểm tra lại với mẫu là
32 trẻ khuyết tật, cho thấy chúng có chỉ số IQ trung bỉnh là 82, với độ lệch chuẩn là 6 Tại ot=0.05 với mẫu kiểm tra như vậy có đủ độ tin cậy (P- value) để cho rằng nghiên cứu trên khác với mẫu kiểm tra không?
Trang 28Tính hiệu: 0.5000 0.4706 = 0.0294, trong trường hợp hai phía này, P value cần nhân với 2.
Vậy P-value = 2(0.0294) = 0.0588 > 0.05, kết luận: chấp nhận Hũ, nghĩa là kết quả nghiên cứu không khác với mẫu kiểm tra
5.3 So sánh cặp tham số đặc trưng của hai tập số liệu kết quả đo
Cỏ hai cặp tham số đặc trưng quan trọng nhất thường phân tích so sánh đó là:
* So sánh độ chính xác: Đặc trưng bởi X , khi đó có hai trường họp chính:
1 So sánh X với \x
2 So sánh X A và X B
* So sánh độ sai biệt: đặc trưng bởi s 2
Tuỳ theo Na và Nb nhỏ hay lớn, giống nhau hay khác nhau, tiến hành so sánh theo cách khác nhau
5.3.1 So sánh độ chính xác
Nguyên tắc so sánh là dùng chuẩn u hoặc chuẩn t để so sánh, vì:
Lẽ Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/201 I
u - X-JU t = — - hoặc t = — - -Xi - X , , X A - X B
Với N > 30 dùng chuẩn u , còn N < 30 dùng chuẩn t
Cách tính toán chuẩn u hoặc t và so sánh với các giá trị tra bàng được phân thành các trường hợp sau:
4 n = N A N tì
N a + N b
3.4
5.3.1.2 Nếu N a và N b < 30, dùng chuẩn t để so sảnh chia làm hai trường hợp chính:
1/ Nếu N ạ ĩ *N b <30 (giống trường họp 3.1.1)
F J s r s ,
VTrong đó: d = X A - X B
S 2 A( N A - ì ) + S j ( N f í - ỉ ) ( N a - ì ) + ( N b - \ )
3.5
3.63.7
\ n a + n b
f = ( N a - 1) + (N b - 1) = N a + N b - 2
3.83.9
Trang 29Lê Đức Ngọc- Nhập môn xử lý so liệu và kế hoạch hóa thực nghiệm-12/2011
N'
3.103.11
3.12
3.133.14
Trang 30-Lê Đức Ngọc- Nhập môn xứ lỷ số liệu và kế hoạch hóa thực nghiệm-12/2011
S 2 a = — ^ ( X u - X a ) 2 = — — [(33.5 — 33.02) 2 + ( 3 3 9 - 33.02) 2 + + (3 1 7 -3 3 0 2 )2j= 1.679
Tương tự ta tính được s ị =0.619
(có thể sử dụng công thức 1.21 để tính phương sai)
*Không liên quan từng đôi một:
Ho = 2 kết quả đo không khác nhau.
Kết luận tt > tb -» chấp nhận Ha, bác bỏ Ho
*Liên quan từng đôi một:
Ho = 2 kết quả đo không khác nhau.
Nhận x é t: - Khảo sát liên quan từng đôi một và khảo sát không liên quan từng đôi một đều
cho thấy sự khác nhau giữa 2 kết quả
- Khi thay đổi độ tin cậy thống kê thì có 1 sổ trường hợp có thể dẫn đến thay đổi kết luận thống kê
5.3.2 So sánh độ sai biệt
Vì Phương sai đặc trung cho độ sai biệt, nên so sánh độ sai biệt, chính là so sánh phương sai Người ta sử dụng chuẩn Fisher để so sánh:
s 2Chuẩn Fisher: F(p,f , f 2 ) = “ T (S? > s ị ) 3.21
Trang 31s 2
Vỉ: ^ V >1 n ên :S ,2 > s 22
Sỉ
Việc so sánh Ftính và Fbàng luôn phụ thuộc vào độ tin cậy thống kê cho trước
Ví dụ 23: Cho hai tập số đo A và B thu được từ kết quả nghiên cứu như sau :
Lẽ Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thục nghiệm-12/2011
-a/ Tính các đại lượng đặc trung của tập hai tập kết quả đo trên,
b/ So sánh giá trị phưcmg sai của 2 tập kết quả đo A và B
Trang 32-PHẦN II PHÂN TÍCH NHÂN TÓ TÁC ĐỘNG LÊN SÓ ĐO
Lê Đức Ngọc- Nhập môn xứ lỷ số liệu và kê hoạch hỏa thực nghiệm-12/2011
CHƯƠNG 4
PHÂN TÍCH HÒI QUI VÀ TƯƠNG QUAN CỦA CÁC NHÂN TÓ
6.1 Hồi qui và tương quan hai nhân tố
Phân tích hồi qui và tương quan là tìm mối quan hệ giữa hai nhân tố X và Y xem chúng tuân theo qui luật nào (có thể được mô tả bằng mô hình toán học nào) Các qui luật đó đều được biểu diễn bằng một hàm số Trong các tương quan, có tương quan tuyến tính được
sử dụng nhiều nhất
6.1.1 HỒI qui tuyến tính
Hồi qui tuyển tính giữa X và Y được biểu diễn bằng hàm số có dạng:
6.L2 Hồi quì phi tuyển tính
Hồi qui phi tuyến giữa 2 nhân tố X và Y là một đường cong, có thể mô tả bằng đường hồi qui Parabon, Hypebon hay Hàm số mũ
1/Hồi qui Parabon có dạng:
Trang 33Lẽ Đức Ngọc- Nhập môn xử lỷ số liệu và kế hoạch hóa thực nghiệm-Ị2/2011
6.1.3 Hệ số tương quan (r) Spearman
Hệ số r, đánh giá mức độ tương quan giữa X và Y:
r > 0 giữa X và Y có tương quan thuận,
r < 0 gữa X và Y có tương quan nghịch
Ý nghĩa của hệ số tương quan:
0 1 > r > 0.7 thì X và Y rắt tương quan.
0.7 > r > 0.5 thì X và Y khá tương quan.
0.5 > r > 0.3 thì X và Y có tương quan.
0.3 > r thì X và Y không tương quan.
6.1.4 Hệ số tương quan thứ bậc Spearman rho
Hệ số p, đánh giá mức độ tương quan thứ bậc có thông số hoặc không thông số giữa 2 nhân tố X và Y với N số liệu đo tính theo công thức sau:
rho = 1 - 6( Ị > , 2)
Trong đó:
- d là sự sai khác giữa Xi và Yj Đẻ tính giá trị d, Xi phải được xếp theo thứ tự từ thấp
đến cao hoặc ngược lại, còn Yj được xếp tương ứng từng cặp
- N sổ số liệu đo (.sổ giá trị Xi hay Y j)
Ví dụ 24:Khảo sát kết quả thi trắc nghiệm môn Toán (T) và môn Hoá (Hj cuối học kì của 10 học sinh, cho ở bảng sau:
HS Điểm
T
ĐiểmH
2 11" TxH Thứ hạng
t '
Thứ hạng H
dt.hạng
d2thạng
Trang 34-Lê Đức Ngọc- Nhập môn xử lý sổ liệu và kể hoạch hóa ihực nghiệm-12/2011
a-Tìm phương trình hồi qui tương quan tuyến tính,
b- Hệ số tương quan Spearman,
c- Hệ số tương quan Spearman rho
Vậy phương trình hồi qui tuyến tính có dạng: y = 0.556 X + 13.97
b- Hệ số tương quan spearman:
6.2 Tính tương quan của sự kiện nhị phân
Ví dụ 25: Lấy ngẫu nhiên 15 điểm môn Toán trong bảng điểm của một lơp học, kết quả cho ở
bảng sau đây, trong đó có điểm của 9 Trai và 6 Gái:
Trang 35Lẽ Đức Ngọc- Nhập món xử tỷ số liệu và kế hoạch hóa thực nghiệm-12/2011
- Theo công thức 1.20, tính phương sai của điểm số con trai:
s 2 = — [(86- 80)2 + (91 - 80)2 + + (67 - 80)2 + (85 - 80)2 ] = 171
- Độ lệch chuẩn của điểm số con trai tính ra là: ơt = 13.08
- Tỷ lệ con trai là p =9/15=0.6; Tỷ lệ con gái là q = p-1 = 0.4
- Tính điểm trung bình của Trai và Gái:
— 86 + 91 + 90 + 6 6 H - h67 + 85
9Vậy hệ số tương quan tính được là:
X n - X „ ,— 8 0 -7 5 r
-r = —í - X J p q = ■ Vo.óx 0.4 = 0.187
Bậc tự do trong trường hợp này được tính theo công thức: f = N-2, vậy ta có:
df = 1 5 - 2 = 13, tra bảng tương quan nhi phân ta được: ^ 3)0 05 =0.514 Vậy: rpb < ^,3)005
Ta có thể kết luận là khả năng toán học của Tra và Gaí giống nhau
6.3 Hồi qui và tương quan đa nhân tố
Phương trình hồi qui đa nhân tố (n nhân tổ) có dạng tổng quát như sau:
r - « , +a,±x, + a , Ì x , X j + aiJ n ịj X lX r
Hồi qui và tương quan đa nhân tố cũng được phân thành hai loại tuyến tính và phi tuyển tính Việc giải các bài toán hồi qui và tương quan đa nhân tố cũng theo nguyên tắc có bao nhiêu hệ số phải có bấy nhiêu phương trình tham số để giải
Để có được các tham sổ để giải, người ta phải lập các ma trận thử nghiệm riêng (ma trận tâm trực giao, ma trận tâm xoay, ) và tiến hành thử nghiệm để có tập dữ liệu tương ứng cho việc giải
35
Trang 36Lê Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm-12/2011
C H Ư Ơ N G 5
PHÂN T ÍC H TÁ C ĐỘNG CỦA CÁC NHÂN TÓ QUA THAM SỎ LÊN SÓ ĐO
(PHÂN T ÍC H PHƯƠNG SAI)
P h ư ơ n g p h á p p h â n tíc h p h ư ơ n g sa i (A N O V A ) c ó h ai lo ại b ài to á n p h ổ b iế n v à co i n h ư
S o sá n h s ự sai k h á c g iũ a c á c g iá trị k ế t q u ả đ o (yjj) d o th a y đ ổ i c á c m ứ c đ o (Aj) c ủ a
n h ân tố A , p h ư ơ n g sai c ủ a s ự th a y đ ổ i c á c m ứ c đ o v ớ i sai sổ đ o (p h ư ơ n g sai c ủ a sai sổ đ o ) có
S 2 2: Đ ặ c trư n g c h o sai số đ o n ó i c h u n g , vì làm n g h iê n c ứ u b a o g iờ c ũ n g m ắ c sai số.
f i : B ậ c tự d o c ủ a tổ n g sổ c á c m ứ c đo đ ã làm fi = k - 1
Ĩ 2 ' B ậc tự d o c ủ a tổ n g số c á c đ o đ ã tiế n h à n h q u i h o ạ c h đ o Ỉ 2 = k (n - 1).
V ớ i: H 0: sf = sỉ ; H a: sỉ * sị ;
V ì F lu ô n lớ n h ơ n 1 (F > 1), n ê n :
- N ế u Ftinh < Fbảng th ì Ftinh k h ô n g đ á n g tin c ậ y , tứ c là S ]2 Ỷ S2 2 k h ô n g đ á n g tin c ậ y c h o
n ên c h ú n g đ ư ợ c co i là g iô n g n h a u C h ú n g k h ô n g k h á c n h a u c h o n ê n n h â n tô A k h i th a y đ ô i
m ứ c đ ã tỏ ra k h ô n g c ó ả n h h ư ở n g đ ế n k ế t q u ả đo.
- N ế u Ftinh > Fbang th ì Ftinh đ á n g tin c ậ y , tứ c là S]2 Ỷ S2 2 s u y ra n h â n tố A đ ã ản h h ư ờ n g lên kết q u ả đo.
Trang 37Lẽ Đức Ngọc- Nhập môn xử lý số liệu và kế hoạch hóa thực nghiêm-12/2011
Nhằm dễ tính toán, tránh nhầm lẫn, người ta lập bảng các công đoạn tính phương sai
để so sánh cho bài toán 1 nhân tố, k mức đo và n lần lặp lại như trên
Bảng trên thực chất đã sử dụng công thức tính phương sai:
7.2 Bài toán hai nhân tố
Bài toán phân tích phương sai hai nhân tố:
Nhân tố A: k mức đo
Nhân tố B: m mức đo
Mỗi mức thử nghiệm lặp lại n làn
Bảng qui hoạch đo của bài toán như sau:
Trang 38Lê Đức Ngọc- Nhập môn xứ lý so liệu và kế hoạch hóa thực nghiệm-12/2011
Phương pháp tính phương sai của qui hoạch đo 2 nhân tổ cho ở bảng sau:
- Sa2: Đặc trưng cho ảnh hưởng của nhân tố A lên kết quả đo
- Sb2: Đặc trưng cho ảnh hưởng cùa nhân tố B lên kết quà đo
- S ab 2: Đặc trưng cho ảnh hưởng đồng thời của cả hai nhân tổ A và B lên kết quả đo
- S tn 2: Đặc trung cho sai số đo
Các bước tính phương sai theo bảng trên như sau:
u=\
Trong đó: u - đo lặp lại thứ u; i - mức đổi với A; j - mức đối với B
Công thức trên chính là tổng tất cả các kết quả đo trong một ô (1 ô là tương ứng mô tả
điêu kiện đo Xịj theo mức A (aị) và mức B (bj) trong đó làm lặp lại n lân)
Làm đo theo một qui hoạch định trước theo bảng qui hoạch hoá đo của 2 nhân tố ảnh
lên kết quả đo trên phải có 3 trường hợp so sánh như sau:
c 2
fA = k - l ; f B = m - l ; f AB = ( k - l)(n - 1) và fjN = mk(n - 1)
Trang 39Lẽ Đức Ngọc- Nhập môn xử lý sổ liệu và kế hoạch hóa thực nghiệm-12/2011
Ví dụ 26: Qui hoạch hai nhân tổ: A, k mức; B, m mức; mỗi cặp mức làm lặp lại n lần.
53.448.3
13.613.2
lESyyu = EAi = EBj =818.3
6 Tìm tổng bình phương của tất cả các kết quả:
Trang 40Lê Đức Ngọc- Nhập môn xử lỷ số liệu và kế hoạch hóa thực nghiệm-12/2011
8 Tìm tổng bình phương của tổng các hàng chia cho số kết quả mỗi hàng: