Các đặc tarng phân bố thống kê của một tập số liệu, Ba chương đầu trình bày khái niệm, cách xác định các tham số đặc trưng cua một tập số liệu kết quả đo bất kỳ.. So sánh các cặp tham số
Trang 3MỤC LỤC
Trang
Lời nói đau 7
PHẦN I X Ử LÝ SÓ LIỆU KÉT QUẢ ĐO C h ư ơ n g 1 Các tham số đặc tarng về sự tập trung của tập số l iệ u 9
I I Tần suất (pO 9
1.2 Số trội ( M o ) 13
1.3 Khoảng của tập số ( R ) 13
1.4 Số tmng vị (Med) và số tứ phân vị (Q) 13
1.5 Tmng binh cộng ( X ) 18
1.6 Trung binh nhân 20
1.7 Trung binh điều h ò a 21
1.8 Taing bình cua các trung b in h 21
C h ư ơ n g 2 Các tham số đặc trưng cho sự phân tán của tập số l iệ u 23
2.1 Phương sai (ơ^ hoặc s^) 23
2.2 Độ lệch chuẩn (ơj hoặc Sr) 24
2.3 Độ sai chuẩn ( ơ - hoặc s~ ) 26
2.4 Hệ số biến thiên (Cv) 26
Chu'0’ng 3 Các đặc trưng phân phối thống kê của tập số liệ u 29
3.1 Phân phối chuấn (phân phối Gauss) (u hoặc z ) 29
3 2 Phân phối Student (phân phối t ) 32
3 3 Phân phối Pisher ( F ) 34
3.4 Phân phối Khi binh phưoTig (x^) 35
3 5 Phân phoi Poisson 35
3.6 Phân phối nhị th ứ c 36
3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân p h ố i 37
BÀI TẬP CHƯƠNG 1, 2 và 3 39
Trang 4C hư o’ng 4 Đánh giá tập số liệu kết quả đ o 41
4 1 Sai số đ o 41
4.2 Độ chinh xác của tập số liệu kết quả đ o 42
4.3 Độ sai biệt của tập số liệu kết quả đ o 42
4.4 Sai số tối đa cho phép AP(X) 43
4.5 Khoảng chính xác tin c ậ y 43
4.6 Khoảng giới hạn tin cậy của một tập số liệu kết quả đ o 44
BÀI TẬP CHƯƠNG 4 47
C h ư ơ n g 5 So sánh cặp tham số đặc trung của hai tập số liệu kết quả đ o 49
5.1 Giả thiết thống kê và kết luận thống k ê 49
5.1.1, Giả thiết thống k ê 49
5 1.2 Kết luận thống k ê 49
5.2 Quan hệ giữa chuẩn phân phố! và kết luận thống k ê 50
5.3 So sánh cặp tham số đặc trưng của hai tập số liệu 57
5.3.1 So sánh độ sai biệt 57
5.3.2 So sánh độ chính x á c 60
BÀI TẬP CHƯƠNG 5 69
PHẦN n ĐÁNH GIÁ TÁC ĐỘNG CỦA CÁC NHÂN T ố LÊN KÉT QUẢ ĐO C h ư o ’ng 6 Hồi quy và tương quan giữa các nhàn t ố 71
6.1 Hồi quy và tương quan hai nhân tố 71
6 1 i Hồi quy tuycn tín h .71
6.1.2 Hồi quy phi tuyên tính 72
6.1.3 Hệ số tirơng quan (r) S pearm an 72
6.1.4 Hệ số tươím quan íhứ bậc Speannan r h o 74
6.2 Tính tương quan cùa sự kiện nhị phân 75
6.3 Hồi quy và tương quan đa nhân tố 77
BÀI TÀP CHU'ƠNG 6 77
4 NHẬP MÔN XỬ LÝ s ổ LIỆU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
Trang 5Mục lục 5
C h ư ơ n g 7 Đánh giá tác động của các nhân tố qua tham số
(Phân tích phương s a i) 79
7 1 Bài toán một nhân t ố 79
7.2 Bài toán hai nhân tố .81
7.3 Bài toán ba nhân tố trở lên: Phum igpháp ô vuông L a tin 87
BÀI TẬP CHƯƠNG 7 92
C h ư ơ n g 8, Đánh giá tác động của các nhân tố không qua tham s ố 95
8.1 Bài toán có tham số tỷ lệ giữa 2 nhân tố, mỗi nhân tố 2 m ứ c 95
8.1.1 Dùng chuẩn Khi bình phương (x^) để đánh g i á 95
8.1.2 Dùng hệ số tương quan để đánh g i á 96
8.2 Bài toán tỷ lệ giữa 2 nhân tố X (có s mức) và Y (có r m ức) 97
8.3 Bài toán so sánh 2 tỷ l ệ 99
BÀI TẢP C H U Ơ N G8 101
PHẦN III KÉ HOẠCH HÓA THỰ C NGHIỆM • • • C h ư ơ n g 9 M ô hình hóa thực nghiệm đa nhân tố bậc một đầy đu và rút g ọ n 103
9 1 Đại cương về mô hình hóa thực nghiệm đa nhân t ố 103
9.2 Mô hình hóa thực nghiệm bậc 1 đầy đủ 105
9.3 Mô hinh hóa thực nghiệm bậc 1 rút g ọ n 117
BÀI TẬP CHƯƠNG 9 123
C h ư ơ n g 10 M ô hình hóa thực nghiệm đa nhân tố bậc hai đầy đủ hay rút g ọ n 127
10.1 Mô hinh hóa thực nghiệm bậc 2 tâm trục g i a o 127
10.2 M ô hình hóa thực nghiệm bậc 2 tâm xoay 138
BÀI TẬP CHƯƠNG 10 145
C h ư ơ n g 11 Mô hình hóa theo phương pháp mạng đơn h ìn h 149
B À IT Ả P CHƯƠNG 11 155
Trang 6PHẦN IV TÓI UtJ HÓA TH ỤC NGHIỆM
C h ư ơ n g 12 Tối ưu hóa thực nghiệm 157
12,1 Khái niệm và phân loại các phương pháp tối ưu h o á 157
12 2 Phương pháp thực nghiệm theo đường dốc n h ấ t 158
12 3 Phương pháp khảo sát mặt mục tiê u Ió3 12.4 Phương pháp thực nghiệm theo đơn h ìn h 168
BÀI TẬP CHƯƠNG 12 174
Tài liêu tham k h ả o 181
Phụ !ục 1 Gợi ý và đáp số các bài t ậ p 183
Phụ lục 2 Các bảng tra cứu tham số thống kê tính s ẵ n 196
1 Bang chuẩn u / z 196
2 Bảng chuấn Student t 200
3 Bảng chuẩn Khi bình phưững 202
4 Bảng tương quan nhị phân r 204
5 Bảng chuẩn Pisher F 206
6 NHẠP MÒN x ử LÝ s ố LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
Trang 7LỜI NÓI ĐẦU
Thực nghiệm khoa học là quá trình thu thập và xử lý thông tin Các thông tin chủ yếu là các số đo kết qua thực nghiệm cần được xử lý để xây dựng các luận cứ, phục vụ cho việc chứng minh hoặc bác bỏ các giả thuyết khoa học qua thực nghiệm
Cuốn sách “Nhập môn Xử lý số liệu và Kế hoạch hóa thực nghiệm hóa học” được biên soạn gồm 1 2 chương:
Chương 1 Các tham số đặc trưng về sự tập taing của một tập số liệu,Chương 2 Các tham số đặc tm ng về sự phân tán của một tập số liệu,Chương 3 Các đặc tarng phân bố thống kê của một tập số liệu,
Ba chương đầu trình bày khái niệm, cách xác định các tham số đặc trưng cua một tập số liệu kết quả đo bất kỳ
Chương 4 Đánh giá tập số liệu kết quả đo,
Chương này trình bày cách đánh giá giá trị của một tập số liệu kết quả đo mà thực nghiệm thu được
Chương 5 So sánh các cặp tham số đặc trưng của hai tập số liệu kết
quả đo,Chuơng này trình bày cách so sánh một cách thống kê giữa các cặp tham số đặc trưng để tim ra có hay không sự khác biệt giữa các kết quả
đo mà thực nghiệm thu được
Chương 6 Hồi quy và tuơng quan giữa các nhân tố,
Chưong 7 Đánh giá tác động của các nhân tố qua tham số (Phân
tích phương sai),Chương 8 Đánh giá tác động của các nhân tố không qua tham số,
Ba chương tiếp theo này là các quy hoạch thực nghiệm để tìm ra mối quan hệ giữa các nhân tố hay tác động của các nhân tố thực nghiệm lên kết quả đo
Chương 9 Mô hinh hóa thực nghiệm đa nhân tố bậc một đầy đủ và
rút gọn,
Trang 8Chương 10 Mô hình hóa thực nghiệm đa nhân tố bậc hai đầy đu hay
rút gọn,Chương 1 1 Mô hinh hóa theo phương pháp mạng đơn hình,
Ba chương này trinh bày ba loại kế hoạch hóa thực nghiệm chinh đế tim ra mô hình toán học mô tả thực nghiệm, giúp chúng ta tim ra quy luật của thực nghiệm, tiên đoán kết quả thực nghiệm và điều khiến thực nghiệm theo mong muốn
Chương 12 Tối ưu hóa thực nghiệm
Chương cuối sách, giới thiệu ba phương pháp tối ưu hóa thực nghiệm để tìm ra các điều kiện tối ưu theo mong muốn
Ngoài ra, sau mỗi chương đều có bài tập, gợi ý và đáp số vói hy vọng độc giả có thể nắm bắt được cách thức đánh giá các kết qua thực nghiệm, tự đề xuất được quy hoạch hay kế hoạch thực nghiệm đề tim được các điều kiện tối ưu của thực nghiệm theo mong muốn Trên cơ sỏ'
đó có thể hiểu và phân tích đánh giá được các kết quả thực nghiệm hóa học trình bày trong các sách hay tạp chí trong và ngoài nước
Sách biên soạn lấy các ví dụ chủ yếu lừ các thực ntĩhiệm Hóa học, nhưng những độc già làm việc trong các lĩnh vực liên quan đến thực nghiệm như các ngành Y-Sinh-Nông, Địa chất-Vật lý-Môi trườny , đều
có thể tham khảo để áp dụng cho các bài toán thực nghiêm của minh
Cho du đã rà soát và chinh sửa cấn thận, nhưng cuốn sách khó tránh khỏi những thiếu sót nhất định Các tác giả rất mong đuợc bạn đoc xa gần đóng góp ý để cuốn sách được hoàn thiện iiưn
Xin trân trọng cảm ơn
Trang 9PHẦN ỉ
Xử LÝ SỐ LIỆU KẾT QUẢ ĐO
Những đại lượng đặc tarng chính cho một tập số liệu kết quả đo, được phân làm 3 loại chính: 1/ Các tham số đặc trưng về sự tập taing của tập số liệu; 2/ Các tham số đặc tarng về sự phân tán của tập số liệu; 3/ Đặc trưng phân phối thống kê của tập số liệu
Giả thiết có một tập số liệu kết quả đo gồm có N số liệu, trong đó có
n, giá trị X, (X, xuất hiện n, lần) Khi đó, lần suất Pi của giá trị X, được tính như sau:
n, fp,
N N (0 < p < 1) (1.1)
suất xuất hiện giá trị Xi)
Ví dụ 1.1. Khi khảo sát 100 đối tượng đo X, thu được 100 số liệu đo thể hiện trên bảng 1.1,
B ả n g 1.1 Kết quả khảo sát 100 đối tượng đo X
Trang 1010 NHẬP MÔN Xử LÝ SỐ LIỆU VÀ KẾ HOẠCH HÓA THựC NGHIẸM
Trang 11Chuơng 1 Các tham số đặc truTig về sụ tập trung của tập số liệu 1 1
Bảng 1.2 số liệu thống kê 100 kết quả đo biểu diễn theo phân nhóm
n,
Giá trị trung bình X.
Tẩn suất
p, = nị/N
Tần suất dồn
Tần suất dồn (%)
Trang 1212 NHẠP MÒN x ừ LÝ s ố LIỆU VÀ KẾ HOẠCH HÓA THỰC NGHIỆM
Ví dụ 1.2. Các số liệu dưới đây là điểm trắc nghiệm môn toán của
50 học sinh trong một lớp học Hãy phân tập số liệu này thành 10 nhóm
Bước 2: Tính khoảng của nhóm : 36:10 = 3,6
Bước 3: Tính khoảng của nhóm có giá trị nhỏ nhất: 12 + 3,6 = 15,6Như vậy, nhóm có giá trị nhỏ nhất là nhóm có các giá trị trong đoạn 12-15,6]; tim khoảng của nhóm giá trị tiếp theo bằng cách cộng thêm khoảng của nhóm vào giá trị cao cùa nhóm thứ nhất
Bước 4: Đếm các giá trị nằm trong tập số liệu để tìm tần số của nhóm.Kết quả ta có tập số liệu trên trinh bày dưới dạng phân nhóm thế hiện trên bảng 1.3
B à n g 1.3 Đ iểm trắc nghiêm môn toán của 50 học sinh trinh bày dướĩ dạng phán nhóm
Trang 13Chuang 1 Các tham số đặc truTig về sụ tập trung của tập số liệu
1.2 Số trội (Mo)
Khái niệm số trội được Karl Pearson sử dụng lần đầu tiên năm 1894
Số trội (Mo) là số có tần suất lớn nhất (chinh là số có tần số xuất hiện lớn nhất) trong tập số liệu kết quả đo
1.3 Khoảng của tập số (R)
Khoang cua tập sổ, R, là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập số liệu kết quả đo Như vậy, khoảng của tập số được tính theo công thức:
í 4 Số trung vị (Med) và số tứ phân vị (Q)
Số Irung vị (Med) là số đứng giữa tập số liệu đã được sắp xếp theo giá trị từ bé đến lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu
a) Đoi với các so liệu không nhóm lại
Giả sử Xi, X2, X3, , Xn là dãy các giá trị của tập số liệu kết quả đo, được sắp xếp theo thứ tự tăng dần, thi:
- Số trung vị của tập N số lẻ được tính theo công thức:
Med = x N+l
2
(1.3)
Vỉ dụ 1.3. Tim taing vị của tập số: 5, 7, 9, 13, 15, 16, 19
Giai: Med = X( 7 , i)/2 = X 4 , số thứ 4 là số 13 vậy Med = 13
- Số tnjng vị của tập N số chẵn được tính theo công thức:
Trang 1414 NHẠP MÔN XỬ LÝ s ố LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
h) Đối với sổ liệu gộp thành nhỏm:
- Tim tmng vị tập số liệu có phân nhóm theo công thức sau:
V - c f
(1.5)m
trong đó: Lb! biên dưới của nhóm có chứa số tm ng vị (lovver boundary of median class),
N: tổng số tần suất (sum o f ữequencies),
cf: tần số dồn cùa nhóm ngay trước nhóm chứa số tainíí vị (cumulative frequency of class immediately preceding median class);
fn,; tần số ứng với nhóm chứa số trung vị (ữequency of the median class);
w: khoảng của nhóm chứa số trung vị (width o f median class)
Ví dụ 1.5. Tính giá trị trung vị cho tập số liệu trên bảng 1.4
Bảng 1.4 số liệu thống kê 50 kết quả đo của tập số liệu A
biểu diễn theo phản nhóm
Trang 15ChuoTig 1 Các tham số đặc truTig về sụ tập trung ciia tập số liệu 15
Tập số liệu cho ở báng 1.4 gồm 50 số liệu, số tm ng vị là số chia đôi tập số liệu (đã đưọc sắp xếp theo giá trị tăng dần) thành 2 nhóm, mỗi nhóm gồm 25 số liệu Do đó, số trung vị sẽ là sổ có giá trị nằm giữa số thứ 25 và số thứ 26, nên sẽ thuộc nhóm 7 (nhóm có tần số dồn cf = 29).Biên dưới của nhóm có chứa trung vị:
trùng với số trung vị Med
a) Đ oi với các so liệu không nhỏm lại:
- Số tứ phân vị của tập N giá trị chia hết cho 4, thì tính theo công thức:
Trang 1616 NHẬP MÓN XỬ LÝ s ố LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
h) Đối với số liệu gộp thành nhóm:
Gia sử nhóm thứ i (Xi, Xị.i) có n, giá trị nằm trong nhóm đó và ta co:
Trong thực tế, ngưòi ta tính tứ phân vị Qi và Q3 cho một tập số liệu
có phân nhóm theo công thức giống như công thúc tính trung vị, tuy nhiên có sự khác nhau về vị trí nên công thức có khác nhau chút ít:
flĩl
trong đó; Li,: biên dưới của nhóm có chứa số tứ phân vị cẩn tim (lower boundary of quartile dass);
N : tồng số tần suất (sum of írequencies);
cf: tần số dồn của nhóm ngay trước nhóm chứa số tư phân vị cần tìm (cumulative ữequency of class immediately preceding quartile class),
Trang 17f„i: tần số ứng với nhóm chứa số tứ phân vị cần tim (frequency of the quartile class);
w: khoảng của nhóm chứa số tứ phân vị (width of quartile class)
Ví dụ 1.6. Tính Qi và Qĩ cho tập sô liệu phân nhóm trên bảng 1.5
Bảng 1.5 số liệu thống kê 45 kết quả đo của tập số liệu B
biểu diễn theo phân nhóm
Chuông 1 Các tham số đặc trung về sự tập trung của tập số liệu 17
Tập số liệu cho ở bàng 1.5 gồm 45 số liệu, số tứ phân vị thứ nhất sẽ
là số có giá trị nằm giữa số thứ 1 1 và số thứ 12 của tập số liệu (đã sắp xếp theo giá trị tăng dần) nên thuộc nhóm thứ 10 (có cf = 14) số tứ phân
vị thứ 3 sẽ là số có giá trị nằm giữa số thứ 33 và số thứ 34 của tập số liệu trên nên thuộc nhóm thứ 5 (có cf = 34)
Biên dưới của nhóm có chứa số tứ phân vị:
44 + 45 40 + 49
^bi
Trang 18-18 NHẠP MÒN XỬ LÝ SÓ LIẸU VÀ KÉ HOẠCH HÓA THựC NGHIẸM.
Vĩ dụ 1.7. Điếm thi môn toán của 10 học viên thuộc nhóm kha là:
78, 79, 62, 84, 90, 71, 76, 83, 98, 77 Điếm trung bình của 10 học viên là:
_ 78 + 79 + 62 + 84 + 90 + 71 + 76 + 83 + 98 + 77
Tõ
= 79,8 điểmTrong trường hợp tập sổ liệu được phân nhóm, giá trị tuinẹ binb cộng được tính theo công thức tổng quát:
•ụ _ f, X X, + Í2X X + f X Xi^ _ 1 , % — ; -
í, + Ỉ2 + + ÍỊ, N ịtrong đo: X, là giá trị trung bình của nhóm, t"! tấn số của nhóm
Trang 19Chương 1 Các tham số đặc truTig về sự tập trung của tập sô liệu
Ví dụ Ị 8. Tính giá trị trung binh điêm thi của học viên thê hiện trên bang 1.6
Bảng 1.6 Kết quả điểm thi trắc nghiệm của 100 học viên
Đ iểm số Tằn số (f) Giá trị trung
bình nhóm
Tần số X giá trị trung bình nhóm
Trang 2020 NHẬP MÒN Xử LÝ s ố LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
Ví dụ 1.9. Tinh số trung bỉnh cộng điểm thi trắc nghiệm môn tiêng Anh của 50 học viên
Bảng 1.7 Kết quả điểm số thị trắc nghiệm môn tiếng Anh của 50 học viên
Ví dụ ỉ.ĩếỉ. Thòng kê số học viên tại chức đăntí ký dự thi trong
4 năm cua một CO' sở đào tạo cho ở bảng dưới đày Tinh:
ỉ Bình quân số đăng kv ciir thi trong 4 năm;
2 Tốc độ đăng ký dự thi tăim bình quân trontì 4 năm
Trang 211.7 Trung bình điều hòa
N Ế ĨX ,dùng để tính vận tốc, thời gian tmng bình,
Vỉ dụ 1.11. Taing bình 1 giờ, học viên A giải được 8 bài toán, học viên B giải được 7 bài toán, học viên c đưọc 10 bài toán Tính tốc độ giái toán binh quân cửa 3 học viên trên
Trang 2222 NHẤP MÔN XỬ LÝ s ó LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
Vỉ dụ 1.12. Tính điểm bình quân kết quá điểm thi môn Toán cua khối 1 0
Bảng 1.8 Kết quả điểm thi môn Toán của 5 lớp khối 10
Trang 23Chương 2
CÁC THAM SÓ ĐẠC TRƯÌNG
2.1 Phuong sai (ơ^ hoặc s^)
Phương sai là trung binh của tổng binh phương sai khác giữa các giá trị của tập số liệu so với giá trị trung bình của tập số liệu kết quả đo:
với: N' = N - 1 (N' có bản chất là bậc tự do của tập số liệu kết quả đo)
P ìíiam g sai của hệ:
Phương sai đặc tarng cho sự sai hiệl cúa các số liệu trong kết quả
đo Phương sai càng lớn, sai biệt càng lớn Ngược lại phương sai càng nhỏ thì sai biệt càng nhò
Phương sai còn biếu diễn độ phán tán của tập số liệu kết quả đo đối với giá trị taing binh Phương sai càng lớn độ phân tán xung quanh giá trị trung bình càng lớn và ngược lại
Chú ý; Phương sai của mẫu (saiĩiple) thường kí hiệu s^ Phương sai của tống thể (population) thường kí hiệu ơ^
Trang 2424 NHẠP MÔN x ử LÝ SÓ LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM
2.2 Độ lệch chuẩn ( ơ f hoặc Sf)
Độ lệch chìiâìì của một tập số liệu kết quả đo là giá trị căn bậc 2 trị
số phương sai của nó:
-V 9
= 6.254
Trang 25Chương 2 Các tham số đặc truTig cho sụ-phân tán của tập số liệu 25
Vỉ dụ 2.2. Tính độ lệch chuấn cua tập số liệu gồm 30 dữ liệu được phến nhóm sau đây:
12 + 11 + 9
d, = 8 0 - 7 9 , 6 3 8 = 0,362
= 7 7 ,8 - 7 9 ,6 3 8 = 1,838 d-, = 8 1 ,4 - 7 9 ,6 3 8 = 1,762
= 79,638
Trang 2626 NHÁP MÒN x ừ LÝ s ố LIỆU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM.
Sh = 1
3 2 - 1
= 8.64
1 2 x 8 5 7 8 ^ + 1 1 x 6 8 2 0 ^ + 9 x 9 9 1 2 ^ + 1 2 x 0 3 6 2 + 11x1.838 + 9 x 1 7 6 2
2.3 Độ sai chuẩn (ơịi;; hoặc )
Độ sai chuán bằng độ lệch chuẩn chia cho căn bậc 2 cua số giá trị kết quả đo;
Vi hệ số biến thiên không có thứ nguyên, cho nên có thế dựa vào hệ
số biến thiên để so sánh gần đúng độ sai biệt của các kết quả đo thu nhậnđược bằng các cách khác nhau
Khi độ lệch chuân lớn (Sf) (tức sai biệt của các số liệu đo lớn), thi c\
lớn và ngược lại
Ví dụ 2.4. Đánh giá sự phat trien cua tré 7 luối theo cân nặntí trung binh là 20,37 kg vói độ lệch chuẩn là 2,16 kg; trong khi đo, nếu đánii giá theo chiều cao trung binh là 113,64 cm với độ lệch chuẩn là 4,04 cm Hói đánh giá nào mắc sai số lon hơn‘ĩ’
2,16Theo cân nặníí: Cv = — X ] 00% = 10,6“ố
20,374.04
rh e o chiêu cao: c = : -X ] 00% = 3,56%
113,64Vậy theo cân nặng mắc sai số lớn hơn
Trang 27Ví dụ 2.5. 10 người học có điểm taing binh môn toán và môn ngoại ngừ tương ứng là 85 và 72, trong khi đó độ lệch chuấn của môn toán và ngoại ngũ đều là 6,82.
Tinh Cv cho môn toán là:
6,82
Cv = - ^ x l 00% = 8,0 2%
85Còn Cy cho môn ngoại ngữ là:
C v = - ^ x l 00% = 9,47%
72Vậy, tuy có độ lệch chuẩn giống nhau, nhưng sai số đối với môn ngoại ngữ lón hơn
Chương 2 Các tham số đặc truTig cho sụ phân tán của tập sô Hệu 27
Trang 28Mồi tập số liệu kết quả nghiên cứu là một tập số ngẫu nhiên (thường
là rời rạc) có những đặc tarng phân phối thống kê riêng và thường tuân theo
1 trong 6 quy luật phân phối thống kê ngẫu nhiên phổ biến nhất, đó là:
3.1 Phân phối chuẩn (phân phối Gauss) (u hoặc z)
- Hàm số của phân phối chuẩn đưọ'c biểu diễn bằng phương trình toán học:
(X-^r
<JyJ2Tl
trong đó; X: là biến số ngẫu nhiên;
|.i: là hằng số, bằng giá trị kỳ vọng của biến ngẫu nhiên;
ơ: là độ lệch chuẩn của biến ngẫu nhiên
Gọi z là chuâìi Gauss và đặt:
Trang 2930 NHẠP MÔN XỬ LÝ SÓ LIẸU VÀ KẾ HOẠCH HÓA THỰC NGHIẸM .
Nếu đặt ơ là đơn vị của thang chia trục hoành mà giá trị cua no đưọ'c xác định từ điểm uốn của đường cong chuân hạ xuống trục hoành, |i là tham số đặc tm ng cho sự tập taing các giá trị của hàm phân phối, thi hàm phân phối chuấn có dạng chuông úp
Hàm phân phối chuẩn có đặc diểm là: X = Mo = Med = ụ
Đồ thị cúa hàm phân phối chuấn:
Trang 30- Y nghĩa hình học của tích phân là diện tích giới hạn bởi đường
Chưong 3 Các đặc trung phân phối thống kê của tập số liệu 31
Xác suất thống kê gắn liền vói khái niệm độ lin cậy ihórìg kẽ (P)
Diện tích giói hạn bởi đường cong cũng chính là độ tin cậy thống kê đe xuất hiện X, trong khoáng tích phàn Ki hiệu độ tin cậy thống kê để xuất hiện giá trị X, nằm trong vùng ( - oo, X,) là P(Xi)
Độ tin cậy thống kê luôn là một số nho hơn hoặc bằng 1 (P(Xị) < 1).Neu kí hiệu a là độ không tin cậy ihốiìỊỉ kê, thì;
p + a = 1 hay p = 1 - a hoặc a = 1 - pKhi p = 1, điều đó có nghĩa là xác suất xuất hiện giá trị X, là 100%
Trong xác suất, người ta quy ước;
Biến cố có p = 0,9999 là biến cố hoàn loàn chắc chan,
Biến cố có p = 0,999 là biến cố héí sức chắc chắn,
Biến cố có p = 0,99 là biến cố rấí chắc chan,
Biến cố có p = 0,95 là biến cố chắc chắn,
Biến cố có p = 0,90 là biến cố có chiều hivớng chắc chằn,
Từ hàm phân phối chuẩn, khi cho một giá trị z, (X) thi ta tính được
độ tin cậy thống kê Pi, ứng với một diện tích p, Ngược lại, khi cho giá trị
p, thì có thể tinh đưọc một giá trị Z|(X) Thay cho tinh toán, người ta lậpsẵn nhũng bảng số để tra giá trị z khi biết giá trị p hoặc ngược lại (xem bảng chuẩn u/z)
Trang 3132 NHẬP MÒN x ừ LÝ SÓ LIẸU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM .
3.2 Phân phối Student (phân phối t)
Hàm số của phân phối Student có dạng:
Khi Xi là số có tần số rất lớn (tức là số có tần suất rất lớn) thi có thể suy ra gần đúng Xi = X (giá trị có tần suất rất lón thi giá trị cua nó coi như trùng với giá trị trung binh)
Đồ thị của hàm Student giông như hàm phân phoi chuân có dạng chuông úp Nó có đầy đủ các tính chất giống như hàni phân phối chuẩn Nhưng khác ở chỗ ; độ nhọn của đồ thị hàm phân phối Student phụ thuộc vào bậc tự do Y(p, f)
Bậc íự do càng lớn thi độ nhọn càng nhó và ngưọc lai Do độ nhọn phụ thuộc vào bậc tự do, nên giá trị chuẫn t cũng phụ thuộc vào bậc tự do t(p,f) Trong tliực tế, người ta nhận thấy ;
N > 30 : tuân theo phân phối chuân
N < 30: tuân theo phân phối Student
Trang 32ChưoTig 3 Các đặc truTig phân phối thống kê của tập số liệu
Đồ thị của hàm phân phối Student:
Đối với phân phối Student cũng có bảng tra chuẩn Student tính sẵn Dựa vào bảng này, khi biết hai trong ba giá trị t, f và p thì xác định được giá trị còn chưa biết
Có 3 loại bảng tra giá trị t (gọi là bảng chuẩn t)
B ả n g 3.1 Kiểm định giả thiết thống kẽ và tra giá trị t (bảng chuẩn t)
Ho: M' ^ Mk
(hoặc fJi - |Jk^ 0)
Ho: Mi ^ Mk (hoặc |J - Mk^ 0)
Ho: Mi = |Jk
(hoặc | J , - |J k = 0 ) Ha: |J,< Mk
(hoặc ụ ,- M k < 0)
Ha: Mi> Mk (hoặc |J, - |Jk> 0)
Ha: |J.?^ Mk (hoặc ụ, - |Jk^ 0)
Thì tra bảng phản vị
(1 phía) của chuẩn t
theo phía trái
0 Thì tra bảng phân vị (1 phía) của chuẩn t theo phía phải
0 Thì tra bảng phân vị (2 phía) của chuẩn t theo 2 phía
Chủ ý: Với bảng phân vị 2 phía, giá trị a phái chia cho 2 khi tra bảng
Trang 3334 NHẠP MÔN x ừ LÝ SÓ LIỆU VÀ KÉ HOẠCH HÓA THỰC NGHIẸM .
3.3 Phân phối Pisher
Hàm số của phân phối Pisher có dạng;
Ngưòi ta cũng lập các bảng tra san, khi cho (P, fi và í’2) sẽ tra đưọc giá trị của chuàn F, ngược lại cho 3 trong 4 thông số (F, p, í'i, t'2) sẽ tra đươc số thứ 4 chưa biết
Trang 34Chuơng 3 Các đặc trung phân phối thống kê của tập số liệu 35
3.4 Phân phối Khi bình phương ( x")
Hàm sô cua phân phối Khi bình phương có dạng:
r - 2
Y ( x ^ f ) = C x e 2 X(x^) 2
vói
1=1 V y
khi lấy các giá trị: 0 < X < +
Hàm Khi binh phương chỉ phụ thuộc vào 1 bậc tự do
Đồ thị cua hàm phân phối Khi bình phương có dạng:
3.5 Phân phối Poisson
- Hàm số cúa phân phối Poisson có dạng:
Trang 3536 NHẬP MÒN XỬ LÝ s ó LIỆU VÀ KÉ HOẠCH HÓA THỰC NGHIỆM
- ĐỒ thị của hàm phân phối Poisson có dạng:
N == số lần thử nghiệm;
n = số lần biến cố A xuất hiện,
Khi đó, nếu X là biến ngẫu nhiên có đặc trưng phàn phối thống kêvới tham số (N,p) là phân phối nhị thức thì:
+ Kì vọng cúa biến ngẫu nhiên X là:
Np-I- Phương sai của biến ngẫu nhỉên X là;
= N x p x q+ Độ lệch chuẩn cùa biến ngẫu ahiên X ỉà:
!• Độ sai chuẩn của biến ngẫu nhiên X là:
ơx =
Trang 36Chương 3 Các đặc trung phân phôi thông kê của tập sô liệu M
- Đồ thị của hàm phân phối nhị thức có dạng:
Người ta so sánh giữa giá trị tra bảng và giá trị tính được đề đánh giá
độ tin cậy thống kê của một sự kiện, theo điều kiện cho trước (theo giá trị tra bảng)
3.7 Mối quan hệ giữa các hàm phân phối và các chuẩn phân phối
Ta có nhận xét, một tập số liệu kết quá thực nghiệm phụ thuộc vào bậc tự do:
+ 2 bậc tự do thì tuân theo hàm F;
+ 1 bậc tự do thì tuân theo hàm t hoặc
+ Không phụ thuộc vào tự do thì tuân theo hàm u hoặc p
Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập
số liệu kết quả đo như sau:
Trang 3738 NHẠP MÔN x ử LÝ SÓ LIẸU VÀ KẾ HOẠCH HÓA THỰC NGHIẸM .
- Neu N > 30 và có 1 trong 3 tính chất sau thi tập số liệu kết qua đo
có quy luật phân phối chuẩn:
1 Đồ thị phân phối tần suất có dạng chuông
2 Mo = M e d = X
3 X, nhận các giá trị ở ngoài khoảng X ± 2ơ là 5% hoặc
X, nhận các giá trị năm trong khoảng X ± 2ơ là 95%
- Nếu N < 30 và có 1 trong 3 tính chất trên thi tập số liệu kết qua đo
có quy luật phân phối Student
Sơ đồ sau đây cho thấy các quy luật phân phối thống kê đã trinh bày chỉ là 1 trường hợp riêng cúa nhau mà thôi:
Trang 38Chưong 3 Các đặc truTig phân phôi thông kê của tập sô liệu
BÀĨ TẬP C H llơ N G 1, 2 và 3
Bài 1.1 Tiến hành nghiên cứu lưọng axit sunfuric 98,3% một phòng thí
nghiệm (lit) sư dụng trong hai năm 2007 và 2009 Ket quả như sau:
Nám 2007 30,39 30,5 30,2 33,97 29,4 29,8 31,8 30,4 30,5 30,87 Năm 2009 31,4 34,12 32,0 33,0 41,0 33,34 38,9 32,3 36,1 35,0
Xác định các tham số đặc trưng về sự tập taing của tập số liệu trên:
số trội, khoảng của tập số, số tnang vị, taing bình cộng
Bài 1.2 Theo một nghiên cứu, thời gian đọc sách của sinh viên mỗi ngày
tại 12 lớp học của một taròng là:
Bài 1.3 Tiến hành khảo sát khoảng thời gian taing bình (giờ/tháng) sinh
viên năm thứ ba dành thòi gian làm nghiên cửu khoa học, kết quả thu đươc như sau:
Tính các đại lượng đặc tm ng của tập số liệu trên: khoảng của tập số,
số trội, số taing vị, tmng bình cộng, phương sai, độ lệch chuẩn, hệ số biến thiên
Trang 39ChLPơng 4
ĐÁNH GIÁ TẬP SỐ LIỆU KÉT QƯẢ ĐO
Một tập số liệu kết quả đo có thể được phân tích đánh giá thông qua các đại lượng chính sau đây;
4.1 Sai số đo
Có 4 loại sai số đo:
— Sai số tuyệt đổi:
S a = X , - X s x , - | i (4.1)
taing binh (hoặc giá trị thật) Sai khác này có thể là âm hoặc dương
— Sai sổ tương đổi:
Nếu hiệu sổ này là đáng tin cậy tức là khác không là đáng tin cậy thì
số đo đã mắc sai số hệ thống. Khi đó giá trị X, tập trung về một phía của giá trị thực trên trục số Sai số hệ thống có thể tìm được nguyên nhân gây sai số hệ thống để loại bỏ
— Sai sổ ngẫu nhiên:
Phép đo mắc sai S'ố ngẫu nhiên khi hiệu số giữa giá trị tmng bình cộng
X với giá trị thật gần bằng không là đáng tin cậy Khi đó các giá trị X, phân
bố đều hai phía của giá trị thực trên trục số Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ có thể tìm các giải pháp để giảm sai số ngẫu nhiên
Trang 4042 NHẠP MÔN X ử LÝ SÓ LIỆU VÀ KẾ HOẠCH HÓA THỰC NGHIẸM .
4.2 Độ chính xác của tập số liệu kết quả đo
Vi trung bình cộng biếu diễn độ tập trung cua các giá trị thục nghiệm nên độ chính xác của tập số liệu kết qua đo đưọc đánh íỉiá thông qua giá trị trung binh cộng Giá trị trung binh cộng mà sai khác vói giá trị thật càng nhỏ thi độ chính xác của số đo càng lón và ngược lại
Nguyên nhân dẫn đến độ chính xác kém có thể là:
- Chọn m ẫu không đ ú n g v ề chất lượng v à số lượng;
- Giải pháp đo số liệu không chính xác
4.3 Độ sai biệt của tập số liệu kết quả đo
Phương sai biểu diễn độ sai biệt trung bình của các giá trị trong tập
số liệu kết quả đo so với giá trị tm ng binh PhưoTig sai càng nhò thi độ sai biệt càng nhỏ và ngược lại
Nguyên nhân chinh dẫn đến độ sai biệt lớn:
- Chọn mẫu về chất lượng và số lượng không đặc trưng cho mục tiêu đo;
- Tay nghề người làm đo kém, không thu thập đuọ'c số đo
Thực ra giá trị taing binh cộng X cũng phản ánh phần nào độ sai biệt khi so với giá trị thật và ngược lại, giá trị phu'ơnt> sai s' cũng phản ánh phần nào độ chính xác khi độ sai biệt nhỏ Tuy nhiên, mỗi đại lượnt4
có tinh trội biếu diễn cho độ chính xác và độ sai biệt khac nhau: X có tính trội phản ánh độ chính xác, có tính trội phản ánh độ sai biệt;
ứ nỸ) Í(G))
Kết luận Đ úng - Tốt Sai số ngẫu nhiên Sai số hệthổng
Hình 4 1 Minh hoạ độ chinh xác và độ sai biệt