Muốn tìm giá trị KQ đúng của X: Chọn được PPPT đúng → SS hệ thống Tiến hành nhiều TN để tìm độ lặp lại của KQ → SS ngẫu nhiên Biện luận SS sẽ đánh giá PPPT → người PT phải giải th
Trang 1XỬ LÝ KẾT QUẢ THỰC NGHIỆM
THEO PHƯƠNG PHÁP
THỐNG KÊ
CHƯƠNG 5
Trang 2Tại sao phải xử lý số liệu thực
nghiệm theo PP thống kê?
Mọi công trình thực nghiệm nghiêm túcđều cần phép xử lý thống kê (XLTK) →đánh giá khách quan thực nghiệm
Hoá học phân tích thực chất là hoá học đolường Mục đích phân tích: trả KQ khảosát trên mẫu X chưa biết
XLTK là áp dụng TOÁN HỌC THỐNG KÊ
để XỬ LÝ các kết quả đo lường trong thực
Trang 3Tại sao phải xử lý số liệu thực
nghiệm theo PP thống kê?
Muốn tìm giá trị KQ đúng của X:
Chọn được PPPT đúng → SS hệ thống Tiến hành nhiều TN để tìm độ lặp lại
của KQ → SS ngẫu nhiên
Biện luận SS sẽ đánh giá PPPT →
người PT phải giải thích được KQPT và
dự đoán cho trường hợp khác
Trang 4NỘI DUNG CHÍNH
(1LT + 1BT)
1 CÁC ĐẠI LƯỢNG THỐNG KÊ
-CÁC LOẠI SAI SỐ
2 SỰ PHÂN PHỐI CỦA SAI SỐ
NGẪU NHIÊN – ĐƯỜNG CONG CỦA SAI SỐ CHUẨN
3 ỨNG DỤNG
Trang 51 CÁC ĐẠI LƯỢNG THỐNG KÊ VÀ
1.5 Độ đúng – độ lặp lại – độ chính xác
Trang 7→ trung tâm phân bố của {xi} là
(có thứ nguyên trùng với xi)
x
Trang 81.1 Số định tâm
Số định tâm của {x1, x2,…., xn}:
Nồng độ thực của DD HCl: µ (không biết)
Trang 91.2 Số phân tán
Xét tập hợp {xi} :
Sự sai khác giữa các xi mang tính ngẫu nhiên.
Số phân tán là đại lượng mô tả mức
độ lệch của các xi thu thập được.
So với mỗi xi có một độ lệch ngẫu nhiên d x i
Trang 101.2 Số phân tán
Độ lệch với từng giá trị đo:
→ {d i }: đại diện cho sai số ngẫu nhiên của
phép đo
Độ lệch với giá trị trung bình:
Trang 111.2 Số phân tán
Tốn học CM rằng: đại diện cho sai số ngẫu nhiên là phương sai mẫu D n
)xvớinguyên
thứcùng
không:
D
(
dD
hệliên
PTsố
n(f)
-dotự bậc
Số
dotự bậc
Số
lệchđộ
của phương
bìnhcác
Tổngmẫu
saiPhương
n
1
2 i
Trang 12) x
( n
1 x
1 n
) x x
( s
n 1
2 n
1 i
2 i
n 1
2 i
Trang 131.2 Số phân tán
Xét Tập hợp tổng quát (n →∞):
n
) x x
(
D s
lim
x
lim
n 1
2 i
n n
= σ
⇒
= σ
= μ
Trang 14Hệ số biến thiên hay chỉ số phân tán:
s
V =
1.2 Số phân tán
Trang 17 Giá trị lớn nhất của độ ngờ tuyệt đối thường bằng ½ hay ¼ độ chia nhỏ nhất trên dụng cụ đo lường
Nếu không xác định thì độ ngờ tuyệt đối bằng 1 đơn vị đối với chữ
số cuối cùng.
1.3 Độ ngờ
Trang 18Ví dụ: buret có thể tích 25,00ml:
1.3 Độ ngờ
Trang 19TH độ ngờ tuyệt đối được xác định:
TH độ ngờ tuyệt đối không được xác định:
1.3 Độ ngờ
Trang 20Độ ngờ tuyệt đối của một tổng hay hiệu haiđại lượng bằng tổng độ ngờ tuyệt đối củacác số hạng.
Y X
Z
Nếu
Y Y
và
X X
±
=
Δ + Δ
+
1.3 Độ ngờ
Trang 21 Độ ngờ tương đối là tỷ số giữa độ ngờtuyệt đối và giá trị đo được, không có thứnguyên, biểu diễn bằng % hay ‰.
1.3 Độ ngờ
Trang 22Độ ngờ tương đối của một tích hoặc mộtthương bằng tổng độ ngờ tương đối củacác số hạng.
Y X
Z
Y
X Z
hay
Y X Z
Δ +
1.3 Độ ngờ
Trang 23 Sai số: sự khác biệt giữa giá trị thực μ vàgiá trị tính x được xác định thông qua một chuỗi các phép đo lường và tính toán.
Tương tự độ ngờ, ta cũng có
Sai số tuyệt đối
Sai số tương đối
1.4 Sai số
SS hệ thống – SS ngẫu nhiên
Trang 241.4 Sai số - SS hệ thống – SS ngẫu nhiên
Trang 25SS hệ thống
Giả sử x đ là giá trị đúng của đại lượng X (căn cứ theo mẫu chuẩn hoặc chấtchuẩn)
Sai số hệ thống Δ:
thiếu số
sai :
0
thừa số
sai :
0
x -
Trang 26SS hệ thống
KQ của
đúng
độ hưởng
ảnh
: x
x
: đối tương
thống hệ
số ai
S
thống.
hệ số
sai
mắc không
đo phép
Trang 28 Do sự không hoàn hảo của dụng cụ đo lường trong quá trình chế tạo
VD: các vạch chia của buret không đồngđều
Do sự xuống cấp của dụng cụ đo lường trong quá trình sử dụng
VD: quả cân chuẩn bị mài mòn, thang bướcsóng của máy so màu lệch khỏi bướcsóng chuẩn…
Sai số dụng cụ
Trang 30 Do trình độ tay nghề của cá nhân người phân tích làm cho KQ đo luôn
lệch về một phía so với xđ
VD: quan sát sự thay đổi màu sắc dung dịch trong chuẩn độ…
Sai số cá thể
Trang 31 Là sai số thuộc về nguyên lý của phương pháp phân tích.
PPPT so màu: sai số pha loãng (phức
bị phân ly) và sai số do bức xạ khảo sátkhông đơn sắc…
Sai số phương pháp
Trang 32Ví dụ: Chuẩn độ NaOH bằng dd HCl 0,050N
NaOH + HCl → NaCl + H 2 OSai số phương pháp
Trang 33 Sai số có thể xác định nếu biết nguyênnhân → làm giảm, loại trừ hay hiệu chỉnh.
Sử dụng nguyên lý “Lấy số đo theo hiệu số”
Phép đo gồm hai giai đoạn:
Tiến hành đo trên mẫu nghiên cứu
Tiến hành đo trên mẫu so sánh
C ách loại bỏ SS hệ thống
Trang 34Thông thường sử dụng hai cách:
1 Phương pháp dùng thí nghiệm trắng mẫu
2 Phương pháp thêm chuẩn vào mẫu
Cách loại bỏ SS hệ thống
Trang 35Mục đích: loại trừ sai số hóa chất.
Tiến hành phân tích mẫu nghiên cứu, thu được kết quả x 1
Tiến hành với mẫu trắng: x 0
Hàm lượng chất phân tích được tính
theo hiệu: x đ = x 1 – x 0
Thí nghiệm “rỗng hay TN
trắng mẫu
Trang 36Thí nghiệm “rỗng hay TN trắng mẫu
VD: Cần xác định hàm lượng các acid béo
tự do trong tinh dầu, cân chính xáckhoảng 1,000g tinh dầu, hòa tan trong20ml cồn 90% rồi chuẩn độ với NaOH0,050N
V 1 : TT NaOH pứ với mẫu chứa 1,000g TD
V 0 : TT NaOH pứ với mẫu trắng (0g TD)
Trang 37Mục đích: loại bỏ sai số hệ thống khiphân tích mẫu có hàm lượng vết (<0,01%)
Mẫu ứng hàm lượng 0, đo được tín hiệu
Nếu y = k x (quan hệ tuyến tính)
Phương pháp thêm chuẩn vào mẫu
Trang 38Phương pháp thêm chuẩn vào mẫu
1 2
0
1 1
y y
y
y
Trang 39Độ lệch chuẩn (mẫu hoặc tổng quát):
Là thước đo của sai số ngẫu nhiên
Biểu thị độ phân tán của các KQ đo x i
Biểu thị độ lặp lại của phép đo
Thay đổi tùy thuộc PP đo, điều kiện đo, độlớn của đại lượng đo, cá nhân người phântích
→ là thông số thống kê quan trọng củaPPPT
SAI SỐ ngẫu nhiên
Trang 40 Sai số không xác định → nguyên nhânkhông cố định, không dự đoán, không cóquy luật.
Luôn luôn tồn tại → đôi khi không xácđược sai số hệ thống
Sai số này triệt tiêu khi (n →∞) thực tế thì
n = 20-30 → giảm bằng cách tăng n
Ảnh hưởng độ lặp lại của kết quả →
SS ngẫu nhiên
Trang 41 Là sai số lớn, nghĩa là có giá trị xi quá lớn hay quá nhỏ so với các giá trị khác.
Cần phải biết nguyên nhân để hiệu chỉnh hay loại bỏ giá trị bị phạm sai
số thô.
Cách loại các giá trị nghi ngờ x? (xem 3.4)
Sai số thô
Trang 43 Độ đúng: sự ít khác biệt giữa μ và
Độ lặp lại: sự ít khác biệt giữa các x i qua các thí nghiệm song song
Độ chính xác: một PPPT gọi là chính xáckhi có độ đúng và độ lặp lại cao
x
1.5 Phân biệt độ đúng, độ lặp lại, độ
chính xác
Trang 44Không đúng (lặp lại tốt)
Trang 452 SỰ PHÂN PHỐI CỦA SAI SỐ NGẪU NHIÊN
– ĐƯỜNG CONG CỦA SAI SỐ CHUẨN
2.1 Phân phối Gauss
(phân phối chính quy)
2.2 Phân phối Student
2.3 Phân phối Fisher
Trang 46 Sai số ngẫu nhiên (SSNN) tuân theo hàm phân bố xác suất Gauss.
Giả sử SSNN thể hiện trong tập hợp tổng quát {x}, có kỳ vọng μ và phương sai σ2
Yếu tố x đứng cách trung tâm phân
bố μ một khoảng (d = x – μ) có xác
2.1 Phân phối Gauss
Trang 472.1 Phân phối Gauss
2
x 2
1
e 2
1 )
x (
= ϕ
Trang 482.1 Phân phối Gaussy
S = xác suất bắt gặp
xi thuộc [a,b]
Trang 492.1 Phân phối Gauss
Xác suất để x i thuộc [a,b] là
[a,b] là khoảng tin cậy ứng với xác suất tin cậy P.
[a,b] → [-∞,+∞]: Diện tích giới hạn bởiđường cong: S = 1→ XÁC SUẤT bắt gặp xi là100%
dx
e 2
1 )
b x
a
(
P
2 x
ba
Trang 50 Thực tế: không tính P như trên vì không biết µ và σ
Tính P bằng cách biến đổi PP Gauss thành phân phối chính quy chuẩn với
TRA BảNG.
2.1 Phân phối Gauss
Trang 51μ σ
μ
) (
) (
)(
)(
)
()
(
b
a
dz z
f
b z
a P
b x
a P
x
x 1
z
x
x 0
Trang 522.1 Phân phối Gauss
0 +1 +2 +3 -2 -1
-3
Trang 532.1 Phân phối Gauss
Đa số các phép đo của PPPT tuân theo phân phối Gauss (n >>).
Tiến hành vô số phép đo trên X → nếu không xác định được sai số: các
giá trị xi phân phối đều 2 phía của giá trị thực µ
Trang 542.1 Phân phối Gauss
Đường phân bố chuẩn có đỉnh càng cao khi σ càng nhỏ (độ phân tán thấp hay độ lặp lại cao)
tập trung xung quanh trung tâm phân
bố μ.
Trang 552.2
PHÂN PHỐI STUDENT
Trang 56 Mật độ phân phối lệch khỏi quy luật chính quy khi n không đủ lớn (n < 15)
Loại trừ chênh lệch bằng PP đối xứng biến dạng → PP Student (PP t)
Khi n →∞: PP Student là PP Gauss
2.2 Phân phối Student
Trang 572.2 Phân phối Student
Trang 582.2 Phân phối Student
Mối quan hệ giữa diện tích và xác suất trênđường PP Student tương tự như PP Gauss
t) , (-t
: 2
dt ) t ( P
t(b)) (t(a),
cậy tin
khoảng với
ứng :
dt ) t ( P
) b ( t
t
t t đx
) b ( t
) a ( t
α
= ϕ
Trang 592.2 Phân phối Student
Với mục đích thực tế, người ta thường quan tâm giá trị t trong khoảng đối xứng (-t, +t) sao cho xác suất Pđx bằng những giá trị thông dụng (90%; 95%; 99%).
Những giá trị t này gọi là hệ số Student,
P
tν ,
Trang 60Tính Xác Suất bằng PP Student
5.1/86 bảng
tra :
t
xđ tại
P là t)
(-t, thuộc
t gặp
suất bắt xác
:
t
PP của
do tự
bậc :
1 n
: Với
P , ν
•
2.2 Phân phối Student
Trang 61 Ứng dụng tương tự hàm Gauss.
Dùng ước lượng μ.
Tính khoảng tin cậy của giá trị khảo sát: Khoảng tin cậy là khoảng giới hạn để ước lượng giá trị thực µ của mẫu ứng với một xác suất nhất định (độ đúng KQPT đánh giá bằng PP Thống kê)
2.2 Phân phối Student
Trang 62 Trong thực tế, khoảng tin cậy có thể xét 2 phía (giới hạn trên và giới hạn dưới)
Trang 632.2 Phân phối Student
Trang 64 Khoảng tin cậy xét 1 phía (ví dụ giá trị
thực không vượt quá giới hạn nào đó)
Trang 652.2 Phân phối Student
Ví dụ: đo 4 lần pH có kết quả 7,29; 7,35; 7,31; 7,33 Tính khoảng tin cậy khi P = 90%; P = 99%
Giải:
Trang 662.2 Phân phối Student
Trang 67Tra bảng 5.1/86
2.2 Phân phối Student
Trang 68 Tương tự:
2.2 Phân phối Student
Trang 692.3
PHÂN PHỐI
FISHER
Trang 70 Giả sử có 2 tập hợp mẫu {xI} dung lượng nI và {xII} dung lượng nII
Lần lượt tính được phương sai mẫu
sI 2 và sII 2
Nếu hai tập hợp mẫu nói trên thuộc
cùng một tập hợp tổng quát thì sự sai khác giữa sI 2 và sII 2 phải mang
2.3 Phân phối Fisher
Trang 71 Fisher đề nghị biểu thị sự sai khác ngẫu nhiên này theo tỷ số giữa chúng và đưa
ra một biến ngẫu nhiên mới:
F = sI 2/ sII 2 (0 ≤ F < + ∞)
Hàm phân bố φ(F):
Là hàm phân bố mẫu.
Có đầy đủ tính chất của hàm mật độ xác suất
2.3 Phân phối Fisher
Trang 72 φ(F) cho biết giới hạn của khoảng
(F(a),F(b)) mà trong khoảng này, sự sai khác của sI 2 và sII 2 mang tính ngẫu nhiên.
Khi sự khác biệt mang tính hệ thống
thì F nằm ngoài khoảng này
2.3 Phân phối Fisher
Trang 73Phân phối Fisher (PP F):
Là hàm PP bất đối xứng vẽ trong góc phần tư thứ nhất (F = 0 đến F = ∞)
Là hàm phân bố mẫu đặc biệt vì phụ thuộc cùng lúc hai số bậc tự do ט1 =
n1-1; ט2 = n2-1
2.3 Phân phối Fisher
Trang 742.3 Phân phối Fisher
φ(F) φ(F) với ( ט1 = 10; ט2 = 50)
φ(F) với ( ט1 = 10; ט2 = 4)
Trang 752.3 Phân phối Fisher
: dF )
F ( P
: dF )
F ( P
: 1 dF
) F ( P
) b ( F 0
) b ( F
) a ( F 0
= +∞
Trang 76 Dùng để so sánh độ lặp lại của các thínghiệm trong một PPPT
Từ {x 1 , x 2 ,…., x n }: lấy 2 mẫu có kích thước n 1 , n 2.
Tính phương sai s 1 2 ; s 2 2 với các bậc tự
do ט 1 = n 1 -1; ט 2 = n 2 -1
Lập tỉ số F = s 2 / s 2 → F sẽ tuân
Ứng dụng Phân phối Fisher
Trang 77 Giá trị F(ט1,ט2,P): giá trị lý thuyết, tra bảng 5.2/87 ứng với P xác định.
Fthựcnghiệm = s1 2/s2 2 ≤ F(ט1,ט2,P): TN1
và 2 có độ lặp lại như nhau.
Ứng dụng Phân phối Fisher
Trang 78Ví dụ: Một mẫu nước chứa 12,07 ± 0,03 ppm Pb2+ Hai PTN cho kết quả lần lượtnhư sau:
12,01 – 12,18 – 12,06 (PTN1)
12,43 – 12,36 – 12,28 (PTN2)
Đánh giá độ lặp lại của 2 KQ (P = 95%).
2.3 Phân phối Fisher
Trang 792.3 Phân phối Fisher
Trang 802.3 Phân phối Fisher
Trang 812.3 Phân phối Fisher
Trang 823 ỨNG DỤNG
3.1 Khoảng tin cậy
3.2 So sánh giá trị đo trung bình và giá trị thực µ
3.3 So sánh các giá trị trung bình của nhiều phép đo
3.4 Cách loại các giá trị nghi ngờ
3.5 Cách viết KQPT với chữ số có
Trang 833.2 So sánh giá trị đo trung bình và
giá trị thực µ
Sai số hệ thống (loại được nếu biết đượcnguyên nhân)
Sai số ngẫu nhiên
Nếu hàm phân phối của KQ đo tuân theophân phối Student thì với xác suất nhấtđịnh, giá trị đo phân bố đều 2 bên giá trị thực trong vùng giới hạn bởi t
x
Trang 843.2 So sánh giá trị đo trung bình và giá
Trang 85 Ví dụ: kết quả xác định hàm lượng Au
trong một mẫu quặng của 4 TN lần lượt là8,05; 8,36; 8,12; 8,83ppm Giả sử hàmlượng thực là 8,55ppm Phép xác định cómắc phải sai số hệ thống hay không ứngvới các mức xác suất 90; 95; 99%
3.2 So sánh giá trị đo trung bình và giá
trị thực µ
Trang 863.2 So sánh giá trị đo trung bình và
giá trị thực µ
Trang 873.2 So sánh giá trị đo trung bình và giá
trị thực µ
Trang 883.3
So sánh các giá trị
trung bình của nhiều phép đo
Trang 89 So sánh tính đúng:
So sánh riêng lẽ từng GTTB với µ(phần 3.2)
Trang 903.3 So sánh các giá trị trung bình của
2 2
2 1
x x
Trang 913.4
Cách loại các giá trị nghi ngờ x?
Trang 923.4 Cách loại các giá trị nghi ngờ x?
Khi có sai số thô, quyết định bỏ hay nhận giá trị lệch nhiều này bằng cách:
d
Trang 933.4 Cách loại các giá trị nghi ngờ x?
x?
hay
d 4 x
Trang 94Khi xác định hàm lượng Cl- trong mẫu nước sinh hoạt, kết quả của 5 lần thí nghiệm thu được là:
100,9; 101,2; 101,5; 101,6; 103,2ppm Bằng cách so sánh với d hoặc s, cho biết nên giữ lại kết quả 103,2 hay
3.4 Cách loại các giá trị nghi ngờ x?
Trang 953.4 Cách loại các giá trị nghi ngờ x?
Trang 963.4 Cách loại các giá trị nghi ngờ x?
Trang 97 Nếu Q tn > Q lt : loại giá trị x?
3.4 Cách loại các giá trị nghi ngờ x?
Trang 983.4 Cách loại các giá trị nghi ngờ x?
Xét VD(*) theo tiêu chuẩn Q:
xi = {100,9; 101,2; 101,5; 101,6; 103,2}
Trang 993.5 Cách viết KQPT với
chữ số có nghĩa
3.5.1 Khái niệm chữ số có nghĩa
3.5.2 Vì sao phải viết KQPT với chữ
số có nghĩa
3.5.3 Quy tắc giữ chữ số có nghĩa
Trang 100 Số chữ số có nghĩa (CSCN) của một số
X.10 y (0<X<10; y là số nguyên):
3.5.1 Khái niệm chữ số có nghĩa
Trang 103Vì vậy:
Độ chính xác của KQPT phụ thuộc
hoàn toàn vào độ chính xác của phép
đo gốc, của PPPT, của máy đo…
Trang 1043.5.2 Vì sao phải viết KQPT với
chữ số có nghĩa
VD:
Cân 0,5013g muối NaCl, sấy ở nhiệt độ
1050C trong 4 giờ cho đến khi khối lượngmuối thu được không đổi là 0,4218g Xácđịnh độ ẩm của mẫu muối trên
Trang 105Cho nên:
Giá trị một đại lượng trong PTĐL phải được biểu diễn bằng một con số gồm những chữ số có nghĩa.
Các đại lượng trong PTĐL phải thể hiện độ tin cậy, nghĩa là chỉ có con số cuối cùng là đáng ngờ
3.5.2 Vì sao phải viết KQPT với chữ
số có nghĩa
Trang 1063.5.2 Vì sao phải viết KQPT với
chữ số có nghĩa
Mức độ nghi ngờ có thể được xác định hoặc không được xác định.
Nếu được xác định: mức độ đáng ngờ
là độ ngờ hoặc sai số tuyệt đối.
đáng ngờ có giá trị bằng 1 đơn vị của chữ số cuối cùng
Trang 107Tóm lại:
→ bỏ các chữ số không có nghĩa theo quy tắc làm tròn.
3.5.2 Vì sao phải viết KQPT với
chữ số có nghĩa
Trang 1083.5.2 Vì sao phải viết KQPT với
chữ số có nghĩa
Trang 1103.5.3
Quy tắc giữ chữ số có nghĩa
Trang 111 Đối với một giá trị riêng lẽ: làm tròn chữ
số được giữ lại.
Đối với kết quả một phép tính phức tạp, dùng quy tắc “số chữ số có nghĩa ít
nhất”: lượng số CSCN của KQPT không được vượt quá lượng số CSCN của thành phần có ít CSCN nhất.
3.5.3 Quy tắc giữ chữ số có nghĩa
Trang 112 Đối với phép cộng và phép trừ: lượngchữ số có nghĩa được tính từ sau dấu phẩy.
Ví dụ:
a/ 8,37+1,345+123,528 = 133,243 →
b/ 4,32.10-2 + 3,98.10-3 + 0,14.10-4 =
4,32.10-2 + 0,398.10-2 + 0,0014.10-2 = 4,77194 10-2 =
Quy tắc “Số CSCN ít nhất”
Trang 113 Đối với phép nhân và chia hay phép tính hỗn hợp: lượng CSCN của KQPT bằng lượng CSCN của thành phần ít CSCN nhất.
VD:
a/ 9,0 x 1,2000 = 10,8 →
b/ 4,3 x 6,893 x 0,5372 = 15,8952 →
Quy tắc “Số CSCN ít nhất”
Trang 114c/ Một mẫu hợp kim cân nặng 0,5238g đượchoà tan bằng HNO3, phần không tan cânnặng 0,0748g Tính % của phần không tan
Quy tắc “Số CSCN ít nhất”
Trang 115Ghi chú
Trong 1 phép phân tích, chỉ xét CSCN đối với các thành phần như: