1.2.Sai số đo Trong thực nghiệm, những giá trị nhận được là giá trị gần đúng của các đại lượng thực Nếu biểu diễn giá trị thực của một vật là a.. EX = 1.2 ∫−∞∞xfxdx Vậy kỳ vọng toán
Trang 1CHƯƠNG I
MỘT SỐ THÔNG SỐ CỦA ĐẠI LƯỢNG NGẪU NHIÊN
1 CÁC THÔNG SỐ THỰC NGHIỆM
1.1 Đại lượng ngẫu nhiên
Trong thực tế đời sống, hay trong kỹ thuật, thường xuyên chúng ta phải gặp những yếu tố ngẫu nhiên sự biến động giá cả, sự thay đổi nhiệt độ chúng là những đại lượng nhận nhiều giá trị khác nhau với những điều kiện thí nghiện không đổi với một xác suất nào đó
Đại lượng ngẫu nhiên (X) là tập hợp tất cả các đại lượng mà gía trị của nó mang lại một cách ngẫu nhiên Tức là sự xuất hiện là không biết trước Ví dụ như khi ta tung con xúc sắc, sự xuất hiện của một mặt là ngẫu nhiên
Đại lượng ngẫu nhiên X được gọi là rời rạc khi nó nhận hữu hạn hoặc vô hạn các giá trị đếm được khác nhau
Đại lượng ngẫu nhiên X được gọi là liên tục nếu nó nhận giá trị bất kỳ trong một khoảng của trục số
Khi xây dựng mô tả toán học, những đại lượng mà người nghiên cứu quan tâm
đó là những đại lượng ngẫu nhiên
1.2.Sai số đo
Trong thực nghiệm, những giá trị nhận được là giá trị gần đúng của các đại lượng thực
Nếu biểu diễn giá trị thực của một vật là a
Kết quả quan sát được là x
Độ lệch giữa a và x là Dx
Dx = x-a gọi là sai số đo
1.2.1 Sai số thô
Là sai số phạm phải do phá vỡ những điều kiện căn bản của phép đo, dẫn đến các lần đo có kết quả khác nhau nhièu Sai số này dễ phát hiện và khử được
Trang 2Cách khử sai số thô: Khi phát hiện ra sai số thô, trước hết ta phải kiểm tra các
điều kiện cơ bản có bị vi phạm không, sau đó sử dụng một phương pháp đánh giá,
để loại bỏ hay giữ lại những kết quả không bình thường
1.2.2 Sai số hệ thống
Là sai số không làm thay đổi trong một loạt phép đo, mà thay đổi thay đổi theo
một qui luật nhất định
Có nhiều nguyên nhân gây ra sai số này: Không điều chỉnh chính xác dụng cụ
đo, hoặc một đại lượng luôn thay đổi theo một qui luật nào đó như nhiệt độ Các sai
số này có thể phát hiện, đo đạc tìm được nguyên nhân và hiệu chỉnh được Thông
thường người ta đặt một hệ số hiệu chỉnh ứng với mỗi nguyên nhân
1.2.3 Sai số ngẫu nhiên
Là sai số còn lại sau khi đã khử sai số thô và sai số hệ thống Sai số ngẫu
nhiên do nhiều yếu tố gây ra, tác dụng rất nhỏ, không thể tách riêng ra, vì thế không
loại trừ được Đối với loại sai số này, người ta có thể tìm ra qui luật, xác định được
các ảnh hưởng của chúng đến kết quả thực nghiệm Việc xác định ảnh hưởng này
dựa vào các hiểu biết về qui luật phân phối các đại lượng ngẫu nhiên
1.3 Các đặc trưng số của đại lượng ngẫu nhiên
Hàm phân phối của biến ngẫu nhiên, chứa đựng những thông tin chính về biến
ngẫu nhiên Nhưng trong thực tế, nhiều trường hợp, không thể hoặc không đòi hỏi
phải xác định hàm phân phối Lúc này người ta sử dụng các thông số quan trọng
đặc trưng cho đại lượng ngẫu nhiên như: Kỳ vọng, số mod, phương sai đặc trưng
cho sự phân tán của của đại lượng ngẫu nhiên
1.3.1 Kỳ vọng
Cho X là biến ngẫu nhiên, kỳ vọng toán của biến ngẫu nhiên X là một số thực
được ký hiệu E(X) và xác định như sau:
Nếu X là biến ngẫu nhiên rời rạc và giá trị xi có thể nhận các xác suất pi (i =
1,2, ) thç:
E(X) = (1.1)
∑
=
n
i i
ix p
1
Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất làf(x) thì:
Trang 3E(X) =
(1.2)
∫−∞∞xf(x)dx
Vậy kỳ vọng toán của biến ngẫu nhiên X là số đặc trưng cho giá trị trung bình tính
theo xác suất của tất cả giá trị của X
• Kỳ vọng mẫu thực nnghiệm
Khi nghiên cứu bằng thực nghiệm, giá trị thực (a) và sai số chuẩn (s) của đại
lượng ngẫu nhiên người ta chưa biết Để ước lượng các sai số của các số liệu thực
nghiệm người ta phải dùng giá trị trung bình của đại lượng xi (kỳ vọng mẫu thực
nghiện) và sai số thực của thực nghiệm
Kỳ vọng mẫu thực nghiệm được xác định bằng giá trị trung bình của các số
liệu quan sát của mỗi phép đo
m
(1.3)
∑
=
m
i i
x
1
Trong đó: xi là số đo của đại lượng x ở lần đo thứ i
m là số lần đo
• Mod của biến ngẫu nhiên
Mod của biến ngẫu nhiên rời rạc X là điiểm xo sao cho P(X = x0) = max P (X = xi)
i = 1,2, , Tức là tại đó xác suất xi là lớn nhất
1.3.2 Phương sai điều chỉnh mẫu thực nghiệm
Phương sai là đặc trưng quan trong để phản ánh độ phân tán giá trị biến ngẫu
nhiên xung quanh kỳ vọng và được ký hiệu S2
• Phương sai mẫu thực nghiệm
Giả sử x1 , x2 , xm là mẫu thực nghiệm của X, khi đó số thực ký hiệu S2 gọi là
phương sai mẫu thực nghiệm của X, được xác định như sau:
1
2 1 (x x)
m S
m
i
i −
=
(1 3)
Trong đó: S2 là phương sai mẫu
m là số lần đo hay số lần quan sát được
Trang 4xi là đo của đại lượng x ở lần đo thứ i
x là trung bình mẫu thực nghiệm
• Phương sai điều chỉnh mẫu thực nghiệm
Giả sử S2 là phương sai mẫu thực nghiệm khi đó số thực S21 được gọi là
phương sai mẫu hiệu chỉnh của X được xác định như sau:
2 1 2
S f
Si = (1 4)
f = m -1 là bậc tự do (độ tự do) đặc trưng cho mẫu thí nghiệm, về giá trị f nhỏ
thua mẫu thí nghiệm một đơn vị Phương sai điều chỉnh cho ước lượng không
chệch
1.3.3 Độ lệch chuẩn (Stamdard Diviation -SD)
Từ công thức tính phương sai ta thấy, đơn vị đo của phương sai bằng bình
phương đơn vị đo của biến ngẫu nhiên Do đó để xác định độ phân tán của biến
ngẫu nhiên có cùng đơn vị với nó, người ta xét một tham số đặc trưng khác với
phương sai đó là độ lệch chuẩn (SD) và xác định như sau
Giả sử S2 và S12 là phương sai và phương sai điều chỉnh mẫu ngẫu nhiên của
X, khi đó S và S1 được gọi là độ lệch tiêu chuẩn và độ lệch tiêu tiêu chuẩn điều
chỉnh mẫu thực nghiệm của X và xác điịnh như sau:
(1.5)
S1 = S1 (1.6)
1.3.4 Sai số chuẩn (Standard Error - SE)
Mỗi một mẫu thực nghiệm với sự phân bố chuẩn sẽ có độ lệch chuẩn điều
chỉnh riêng của nó và gọi là độ lệch chuẩn trung bình mẫu Nó sẽ được gọi là sai số
chuẩn (SE) khi nó được biểu diễn tỷ lệ của chính nó với căn bậc hai của dung
lượng mẫu
N
S
SE=σ = 1 (1 7)
Trang 5Trong đó: S1 lă độ lệch chuẩn điều chỉnh mẫu thực nghiệm
N lă dung lượng mẫu thực nghiệm
Sai số chuẩn (SE) lă một thông số thống kí quan trọng để đânh giâ mức độ
phđn tân của mẫu vă chính nó biểu thị sai số của số trung bình Sai số ở đđy không
phải lă sai phạm hay sai sót do người lập hay thu thập số liệu, mă sai số do sự
chính lệch cơ học có hệ thống của số liệu mă phương thức chọn mẫu lă một trong
những nguyín nhđn chính gđy nín Mục đích tính SE lă xâc định mức độ phđn tân
của giâ trị trung bình mầu vă giới hạn tin cậy của mẫu thực nghiệm
1.3.3 Ý nghĩa của phương sai, độ lệch chuẩn, sai số chuẩn
Kỳ vọng mẫu (trung bình mẫu) lă đại lượng đại diện câc giâ trị của mẫu thực
nghiệm Nó không phản ânh được tính đồng đều hay mức độ chính lệch giữa câc
giâ trị của mẫu thực nghiệm
Ngược lại phương sai, độ lệch chuẩn, sai số chuẩn giúp cho ta nhận biết được
mức độ đồng đều của giâ trị thực nghiệm
Nếu phương sai, độ lệch chuẩn, sai số chuẩn nhỏ câc giâ trị thực nghiệm tương
đối đồng đều vă tập trung xung quanh giâ trị trung bình
1.4 Độ chính xâc vă độ tin cậy của phĩp đo
Khi đânh giâ kết qủa thực nghiệm, điều quan trọng không chỉ ở độ chính xâc
mă còn ở độ tin cậy của câc số đo
Giả sử một phĩp đo với sai số sau
⏐X −X⏐= Δx = ε
Độ tin cậy γ lă xâc suất để kết quả câc lần đo rơi văo khoảng tin cậy tức là P(x−ε <x< x+ε)=γ
Độ tin cậy thường cho trước 0,95; 0,99;
0,999
2 PHĐN TÍCH THỐNG KÍ GIÂ TRỊ THỰC NGHIỆM
2.1 Phương sai tâi hiện
Để xâc định độ chính xâc của phương phâp được sử dụng, người nghiín cứu
phải lăm thí nghiệm lặp Do lăm nhiều thí nghiệm dẫn đến những sai số mă người
ta không thể kiểm tra được Vậy chúng ta phải xâc định phương sai tâi hiện để xâc
định sai số tâi hiện
Trang 62.1.1 Phương sai tâi hiện của một thí nghiệm
Giả sử một thí nghiệm được lặp đi lặp lai m lần với giâ trị tương ứng thu được
lă y1 , y2 ym Phương sai tâi hiện của một mẫu thực nghiệm được ký hiệu vă xâc
định như sau:
2 =
th
1
) (
1
y y f
m
i
i −
∑
=
(1 8)
1
1
1
∑
=
−
−
i i
m
(1 9)
Trong đó: f = m -1 là độ tự do đăcû
trưng cho khả năng biến đổi mà không làm thay đổi
hệ
m là số lần lặp
2.2.2 Phương sai tâi hiện của một cuộc thí nghiệm
Giả sử một nghiín cứu, người ta phải tiến hănh N thí nghiệm khâc nhau
1 2 u N
Mỗi thứ nghiệm có m lần lặp m1 m2 mu mN
Với độ tự do tương ứng lă f1 f2 fu fN
Phương sai tâi của mỗi thí nghiệm lă S1 S2 Su SN
Phương sai tâi hiện của một cuộc thí nghiệm được tính như sau
N u
N N u
u th
f f f
f
S f S
f S
f S f S
2 1
2 2
2 2 2
2 1 1 2
+ + + +
+ + +
+ +
(1.10)
Nếu số lần lặp của câc thí nghiệm lă như nhau: m1 = m2 = mk = mN = m thì
bậc tự do của từng thí nghiệm cũng bằng nhau tức lă: f1 = f2 = fu = fN = f= m-1
f N
S S
s S f
th
)
2
2 1
(1.11)
=
= N
u u
N
S
1
2
2 1
(1.12)
Trang 7Trong đó: 2
1
1
1
u m
i ui
m
−
=
(1.13)
Thay (1.12) văo (1.13) ta có:
=
=
−
−
i
u ui N
u
m N
S
1
2 1
) 1 (
1
(1.14)
u = 1,2,3, ,N : i = 1,2, ,m
Công thức (1.14) để tính phương sai tâi hiện của một cuộc thí nghiệm, thường
được sử dụng cho phương ân thí nghiệm song song
Phương sai phđn phối trung bình cho từng thí nghiệm
) ( th
m y
(1.15)
Thí dụ 1: Tính phương sai tâi hiện của một cuộc thí nghiệm tương ứng với
những số liệu thực nghiệm thu được ở bảng 1.1
Bảng1.1 Kết quả thực nghiệm
Kết quả S.T.N
(u)
Số lần lặp (m)
1 u
u
y
1
2
3
4
5
6
7
8
3
3
3
3
3
3
3
3
73
58
54
84
100
98
77
105
69
58
59
94
106
90
85
95
68
64
52
92
109
97
78
100
70
60
55
90
105
95
80
100
Từ bảng số liệu trín ta thấy i = 1,2,3 ; u =1,2, 8 ; m = 3 ; N = 8
Để tính phương sai tâi hiện của một cuộc ta lập bảng 1.2
Bảng 1.2
u (yui −yu)2
(1)
2
(yu −yu
(2)
2
(yu −yu
(3)
u
S
Trang 81
2
3
4
5
6
7
8
9
4
1
36
25
9
9
25
1
4
16
16
1
25
25
25
4
16
9
4
16
4
4
0
14
24
26
56
42
38
38
50
7
12
13
28
21
19
19
25
Âp dụng công thức (1.12)
=
= 8
1
2 2
u u
th S S
8
144
= 18 Phương sai phđn phối trung bình cho một thí nghiệm
3
18 1
)
2 = th = =
m y S
2.2 Phương sai dư
Độ dư: Hiệu giữa giâ trị thực nghiệm thu được vă giâ trị tính được theo phương
trình hồi qui của câc thông số tối ưu gọi lă độ dư
Phương sai tìm được trín cơ sở tổng bình phương câc độ dư gọi lă phương sai
dư được ký hiệu vă xâc định như sau
1
2 1 N (~ u)
u u dư
f
S = ∑ −
=
(.16)
Trong đó: fdư = N-L độ tự do dư
N lă số thí nghiệm
L số hệ số có nghĩa trong phương trình hồi qui
~ giâ trị được tính theo phương trình hồi qui ứng với điều kiện yu
thí nghiệm thứ u
yu lă giâ trị trung bình thực nghiệm tại thí nghiệm thứ u
2.3 Kiểm định thống kí
Trang 9Trong thí nghiệm hóa học, sau khi xâc định thông số thống kí cơ bản của từng nhđn tố như: trung bình mẫu (x), phương sai mẫu (S2), độ lệch chuẩn (S) sai số chuẩn (σ ) Người ta cần phải thực hiện một phương phâp kiểm định câc giả thiết thống kí nhất định nhằm khảng định ảnh hưởng của từng nhđn tố cũng như việc xem xĩt câc giả thiết đưa ra có được chấp nhận hay không vă chấp nhận ở mức độ năo
Hơn nữa, hầu hết câc thông số thống kí quan trọng của mẫu đều phụ thuộc văo trung bình mẫu vă độ lệch chuẩn mẫu Nếu trung bìnb mẫu, độ lệch chuẩn mẫu chính xâc thì câc thông số thống kí thu được từ bộ số liệu thực nghiệm mới có ý nghĩa vă số liệu thực nghiệm đó mới tuđn theo phđn phối chuẩn
2.3.1 Kiểm tra sự đồng nhất của câc phương sai
• Tại sao phải kiểm tra sự đồng nhất của câc phương sai?
Kiểm tra sự đồng nhất của câc phương sai lă kiểm tra độ hội tụ của câc câc giâ trị thực nghiệm Phương phâp kiểm tra năy chỉ được âp dụng trong phương ân thí nghiệm song song Tức lă trong phương ân năy mỗi một thí trong ma trận thực nghiệm được tiến hănh lăm lặp từ 2 lần trở lín
Để kiểm tra người ta sử dụng chuẩn Cochoren (G), tức lă so sânh chuẩn Cochoren thực nghiệm (Gtn) vă chuẩn Cochoren tra bảng (Gb) trong điều kiện bậc
tự do vă mức dộ tin cậy xâc định
Cấu trúc bảng phđn bố Cochoren (phụ lục) được trích dẫn vă trình băy đơn giản bảng 1.3
Bảng 1.3 Câc điểm phđn vị của phđn phối chuẩn cochoren với P = 0,05
Số T.N.(N)
Độ tự do (f = m
- 1)
1 2 3
2
3
‘‘
‘‘
∞
0,998
5 0,966
9
‘‘
‘‘
0,000
0,975
0 0,870
9
‘‘
‘‘
0,000
0,939
2 0,797
7
‘‘
‘‘
0,000 Trong đó: N lă số thí nghiệm trong một cuộc thí nghiệm
f lă độ tự do ứng với thí nghiệm có phương sai tâi hiện lớn nhất
Trang 10m là số lần lặp của thí nghiệm có phương sai lớn nhất
Gb được tìm thấy ở bảng 1.3 với mức ý nghĩa đã chọn là điểm vuông góc giữa
hàng biểu thị số thí nghiệm N và cột biểu thị bậc tự do f
• Các bước tiến hành kiểm tra
- Tính Gtn theo công thức sau
∑
=
= N
u u
u tn
S
S G
1 2
2
max
(1.17)
u = 1,2,3, ,N
N số thí nghiệm trong một cuộc thí nghiệm
- Tra bảng Gb với mức ý nghĩa P đã chọn, số thí nghiệm N và độ tự do f của
thí nghiệm có phương sai tái hiện lớn nhất
- So sánh Gtn và Gb
Giả thiết được chấp nhận nếu Gtn < Gb , tức là phương sai đông nhất, hay các
số liệu thực nghiệm được đo với cùng một sai số Số liệu thực nghiệm được sử
dụng để xác định hệ số b trong PTHQ
Giả thiết không được chấp nhận nếu Gtn > Gb , tức là phương sai không đồng
nhất số liệu thực nghiệm không được chấp nhận để ước lượng tiếp theo
Ví dụ 2 Từ số liệu của thí dụ 1 (N = 8 ; m = 3) ta xét xem các phương sai có
đông nhất hay không
Từ bảng 1.2 ta thấy, thí nghiệm thứ 4 có phương sai tái hiện lớn nhất
S2max = 28
8 144
1
2 =
∑
ku u
S
Gtn = 0,1943
14428 =
Gb ( 0,05; 8 ; 2) = 0,5157
Ta có Gtn ,< Gb vậy phương sai đông nhất, số liệu thực nghiệm ở bảng 1.1
được sử dụng để ước lượng hệ số b trong PTHQ
Trang 112.3.1 Kiểm tra ý nghĩa của câc hệ số trong phương trình hồi qui
• Tại sao phải kiểm tra ý nghĩa của câc hệ số (b) trong (PTHQ)?
Câc hệ số (b) trong (PTHQ) được xâc định bằng bộ số liệu thực nghiệm của
một cuộc thí nghiệm, vì vậy nó có những sai số nhất định
Mỗi hệ số bj trong PTHQ nói lín sự ảnh hưởng của yếu tố thứ j đến quâ trình
thực nghiệm Mục đích của kiểm tra năy lă xem câc hệ số bj trong PTHQ có khâc
không với một độ tin cậy năo đấy hay không
Nếu hệ số b khâc 0 ít, tức lă yếu tố đó ít ảnh hướng đín quâ trình cuối cùng, ta
có thể loại bỏ chúng ra khỏi phương trình hồi qui
Để kiểm tra ý nghĩa của câc hệ số trong phương trình hồi qui ta phđỉ sử dụng
chuẩn Student (t) Phương phâp kiểm tra t lă để so sânh t tính được của thực
nghiệm (ttn) với t tra ở bảng phđn bố Student (tb) với độ tự do vă mức độ tin cậy đê
được xâc định
• Cấu trúc bảng phđn phối chuẩn t
Cấu trúc bảng phđn bố chuẩn t (phần phụ lục) được trích dẫn vă trình băy một
câch đơn giản biểu diễn ở (bảng 1.4) với 2 mức ý nghĩa
Bảng 1.4.Tích dẫn bảng phđn bố chuẩn t
Mức ý nghĩa (P) Số
bậc tự
do (f)
0,05 0,01
1
2
‘‘
‘‘
∞
12,71 4,3
‘‘
‘‘
1,96
63,66 9,93
‘‘
‘‘
2,58 Trong đó:
P lă khả năng chấp nhận giả thiết hay còn gọi lă mức ý nghĩa 1-P độ tin cđy của
phương phâp kiểm tra
f lă độ tự do hay bậc tự do, f = m -1
Để tra cứu t trong bảng phđn bố t, trước tiín ta phải xâc định mức ý nghĩa P
(mức độ tin cậy) Tùy thuộc văo tính chất của từng loại thí nghiím, phưong phâp
kiểm tra mă ta chọn mức ý nghĩa p lă bao nhiíu, thông thường ta chọn p = 0,05