Trình bày được khái niệm về sai số, các đại lượng đặc trưng của toán thống kêỨng dụng toán thống kê để xử lý các kết quả thu được từ thực nghiệm Trình bày kết
Trang 2Trình bày được khái niệm về sai số, các đại lượng đặc trưng của toán thống kêỨng dụng toán thống kê để xử lý các kết quả thu được từ thực nghiệm
Trình bày kết quả phân tích đảm bảo được mức độ chính xác theo yêu cầu
Nội dung
As far as the laws of mathematics refer to reality, they are not certain;
as far as they are certain, they do not refer to reality
Albert Einstein
Trang 3thực hay không
* Giá trị thực nằm ở
khoảng nào của giá trị
thực nghiệm?
1.282
1.199 1.356
1.456
1.462
?
Trang 41 MỞ ĐẦU
tránh khỏi, tuy nhiên trong quá trình
thấp nhất có thể
Nghĩa là kết quả thu được khi tiến hành
phải sai số.
Trang 5n i i
1
) 1 (
) (
1
2 2
n
i
tb i
1
) (
n i
Xtb
SD
% 100
2.4 ĐỘ LỆCH CHUẨN TƯƠNG ĐỐI
2.5 GIỚI HẠN TIN CẬY
2.6 KHOẢNG TIN CẬY
2.2 ĐỘ LỆCH
2.4’ HỆ SỐ BiẾN THIÊN
Trang 6Không sử dụng khái niệm độ lệch trung bình vì xi - X có thể có giá trị (-) hay (+) và có thể gặp trường hợp
Σ=0
Hệ số biến thiên CV dùng để
đánh giá độ phân tán của dãy giá trị đo so với giá trị trung bình hoặc để so sánh độ chính xác của các dãy giá trị đo.
Khoảng tin cậy là khoảng mà
trong đó giá trị trung bình X còn cách giá trị thực M một giới hạn
e Nói cách khác: giá trị thực M nằm ở trong khoảng M= X± e
http://biolibogy.com/statistical%20analysis.html#What_are_error_bars_
2 ĐẠI LƯỢNG ĐẶC TRƯNG
Trang 7Thí dụ
Hàm lượng của dung dịch KMnO 4 được xác định sau 7 lần chuẩn độ:
3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
Hãy tìm giá trị trung bình, phương sai s, giới hạn tin cậy e, khoảng tin cậy
với xác suất 99%; 95%; 90%.
Trang 8D= xi- X
) 1 (
) (
1
2 2
n
i
tb i
1
) (
n i
Xtb
SD
% 100
Xtb
051 , 0 1
7
01556 ,
051 ,
0
RSD
047 ,
0 7
05 , 0 45 , 2
2.4 ĐỘ LỆCH CHUẨN TƯƠNG ĐỐI
2.5 GIỚI HẠN TIN CẬY
2.6 KHOẢNG TIN CẬY
2.2 ĐỘ LỆCH
2.4’ HỆ SỐ BiẾN THIÊN
Trang 9XỬ LÝ KẾT QUẢ THỰC NGHIỆM
Excel – tool - data analysis
- nếu lấy với P = 0,95 t = 3,707
e = (2,447 x 0,051) :7 1/2 = 0.0471
Trang 10XỬ LÝ KẾT QUẢ THỰC NGHIỆM
Excel – tool - data analysis
X = 3.117 SD = 0.051 Với n = 7 , độ tự do là n - 1 = 6
a = 0,05 xác suất = 95%
a = 0,01 xác suất = 99%
a = 0,1 xác suất = 90%
Trang 11From D.C Harris (2003) Quantitative Chemical Analysis, 6th Ed.
Bảng Student’s t
Trang 123 SAI SỐ TRONG PHÂN TÍCH
Giá trị thực của một mẫu là M, không thể xác định đúng giá trị M mà chỉ xác địnhđược giá trị trung bình giữa các lần đo lặp lại
Sai số: mức độ sai lệch của phép đo, thể hiện độ lệch giữa các giá trị thực
toàn sai số
http://faculty.sdmiramar.edu/fgarces /zCourse/All_Year/Ch100_OL/aMy_ FilesLab/09LbOL_Resources/LabR esource.html
Trang 133.1 SAI SỐ TUYỆT ĐỐI
3.2 SAI SỐ TƯƠNG ĐỐI S
Trang 14- hàm lượng Paracetamol: 500,9 mg
- hàm lượng Codein : 30,7 mg.
Sai số tuyệt đối khi xác định hai hoạt chất trên là như nhau:
S = x - X = 500,9 - 500,2 mg = 30,7 - 30 mg = 0,7 mg
%14,0
%
1002,500
7,
%
10030
7,
Trang 15định
nguyên nhân
luật nên không thể hiệu
chỉnh hay loại trừ
cách
tích
liệu thực nghiệm
bằng thống kê
3.3 Sai số ngẫu nhiên
bình hay giá trị thựccủa mẫu
Trang 16phân bố của X không
có sai số ngẫu nhiên
Nguyên nhân:
do thay đổi thời tiết : nhiệt độ không ổn
do người phân tích : không thành
thạo các kỹ thuật phân tích v.v…
T
Trang 17do dụng cụ đo lường: do quá trình chế
tạo và chuẩn hoá dụng cụ v.v…
Trang 203.3 Sai số ngẫu nhiên
(random error)
Trang 213.4 Sai số hệ thống (systematic errors) (= sai số xác định):
3.4.1: Sai số do dụng cụ: do quá trình chế tạo và chuẩn hoá dụng cụ v.v…
http://library.tedankara.k12.tr/chemistry/vol4/Volumetric%20analys is%20and%20problem%20solving/z4.gif
bình định mức có V =100ml nhưng nếu thực
tế chỉ có 99,90 ml thì sai số là 99,90 – 100,00
= - 0,10 ml
Dễ phát hiện và hiệu chỉnh bằng cách định kỳ
chuẩn hoá các dụng cụ trong phòng thí
nghiệm.
Trang 223.4.2 Sai số do phương pháp đo:
thẩm định qui trình để chứng minh sai số rất thấp và có thể chấp nhận được
http://www.westgard.com/images/es15f4.gif
3.4 Sai số hệ thống
Phát hiện:
- Thực hiện song song mẫu trắng để loại
các đáp ứng gây ra do các chất không cần
phân tích.
- Phân tích mẫu chuẩn để kiểm tra độ đúng
của phương pháp.
- Phân tích cùng một mẫu nhưng bằng
phương pháp dự kiến và thực hiện song
song với ít nhất một phương pháp khác và
so sánh hai kết quả.
Trang 233.4.3 Sai số do người làm công tác phân tích:
hoặc do tính quá cẩn thận hay quá cẩu thả;
http://library.tedankara.k12.tr/chemistry/vol4/Volumetric%20analysis%20and%20problem%20solving/z5.gif
khắc phục
nghiệm phân tích
- nhiều kiểm nghiệm viên thực hiện trên
cùng một mẫu thử.
3.4 Sai số hệ thống
Trang 243.4.4 XÁC ĐỊNH SAI SỐ HỆ THỐNG
nghiệm)
Sử dụng thống kê tính giá trị rồi so sánh với theo bảng Student căn cứ vào bậctự do (n -1) và xác suất P (95%)
n SD
M
Xtb
Thí dụ: giả sử mẫu thử KMnO4 trong thí dụ 1 có hàm lượng thật M là 3,110 mg.
Trang 25XÁC ĐỊNH SAI SỐ HỆ THỐNG
Thí dụ: Kiểm tra lại qui trình phân tích xem có sai số hệ thống hay không bằng
Các kết quả thu được sau 5 lần thực hiện:
5 0973
, 0
76 , 98 59
, 98
Trang 263.5 SAI SỐ THÔ (gross error)
Để phát hiện và loại trừ sai số thô cần phải
http://fuzzyco.com/outliers/images/outliers.gif
http://www aivosto.co m/project/
boxplot.gif
help/pm-http://www.gmat.unsw.edu.au/snap/gps/gps_surve y/chap2/fig5.jpg
Trang 27Loại trừ sai số thô
3.5.1 Phương pháp dùng chuẩn Dixon (chuẩn Q)
Áp dụng: khi n < 10
- Bước 1: sắp xếp các số liệu theo thứ tự tăng dần hoặc giảm dần: x1, x2, x3,
liệu lân cận của số liệu nghi ngờ
-Bước 2: dùng test Q để tính giá trị Qtn:
-Bước 3: so sánh giá trị Qtn với Qlt:
Qlt > Qtn thì x1 được giữ lại
Qlt < Qtn thì x1 bị loại bỏ
gặp P thông thường là 95%
minmax
21
x x
x
x Qtn
Trang 29Thí dụ: có dãy số liệu: 17,61 16,86 16,93 16,84 16,95 16,91
Bước 1: sắp xếp theo thứ tự 16,84 16,86 16,91 16,93 16,95 17,61;
thường là hai số liệu đáng nghi ngờ
Bước 2: tính giá trị Qtn
Bước 3: tra bảng kiểm định Q với n = 6; P = 0,95
Bài tập: thực nghiệm qua 5 lần thu được kết quả
4.85, 6.18, 6.28, 6.49, 6.69
Có thể loại 4.85 như là sai số thô ở độ tin cậy 95%?
Giải:
Qtn = (6.18 - 4.85) / (6.69 - 4.85) = 0.722
Qtn lớn hơn Qlt (=0.710, với độ tin cậy: 95% và N=5)
Vậy có thể loại 4.85
86 , 0 84 , 16 61 , 17
95 , 16 61 ,
86,1684
Trang 303.5.2 Phương pháp dùng bảng kiểm định T
Áp dụng với n bất kỳ
Sai số thô thường rơi vào các giá trị cực đại hay cực tiểu của dãy số liệu,
Thí dụ: với dãy số liệu 16,84 16,86 16,91 16,93 16,95 17,61
Với giá trị 17,61:
Với giá trị 16,84:
Tlt (= 1,996) < Ttn (= 2,02) nên giá trị 17,61 bị loại bỏ
Tlt (= 1,996) > Ttn (= 0,61) nên giá trị 16,84 được giữ lại
SD Xtb
X Ttn ( max ) /
SD X
Xtb Ttn ( min) /
02 , 2 292
, 0
) 02 , 17 61 , 17
Ttn
61 , 0 292
, 0
84 , 16 02
,
Ttn
Trang 32TÓM TẮT CÁC BƯỚC TIẾN HÀNH KHI XỬ LÝ SỐ LIỆU
Bước 1: sắp xếp dãy số liệu thu được theo thứ tự tăng hoặc giảm dần
Bước 2: loại các giá trị không phù hợp, lọai sai số thô
Bước 3: tính giá trị; độ lệch chuẩn SD, RSD%, xét sai số hệ thống
Bước 4: xác định giới hạn tin cậy e và khoảng tin cậy µ
Bước 5: báo cáo kết quả
Thí dụ: theo số liệu của thí dụ 1, các bước tiến hành như sau:
Bước 1: 3,056; 3,080; 3,094; 3,107; 3,112; 3,174; 3,198 (g/l)
Bước 2: lọai sai số thô theo chuẩn Q hoặc T: không loại bỏ giá trị nào
= 0,3786 < tlt = 2,45: không có sai số hệ thống
Bước 4: ứng với P = 95% và n =7 tlt = 2,45 tính e = ± 0,047
n SD
M Xtb
t tn
Trang 33Một số vấn đề:
- So sánh kết quả đo được với giá trị đã biết trước?
- So sánh kết quả đo được trên cùng mẫu bằng 2 phương pháp:
+ So sánh kết quả của 2 phương sai?
+ So sánh kết quả trung bình của 2 dãy giá trị?
Trang 34-Trong trường hợp so sánh hai dãy kết quả:
Sử dụng thử nghiệm F (F-test) để kiểm tra độ chính xác hay độ lặp lại của hai dãy kết quả xem có đồng nhất hay không.
Sử dụng thử nghiệm t ( t-test) để so sánh hai giá trị trung bình xem sự khác nhau giữa hai giá trị này có ý nghĩa hay không.
http://w ww.che m.uoa.
gr/appl ets/App letTtest /Appl_
Ttest2.
html
Phần mềm để
tính test
Trang 35Các quy định của F-Test
và phải lần lượt tương ứng với n 1 và n 2 , cùng với mức xác suất được sử dụng để xác định vùng loại bỏ trong đường biểu diễn
Sử dụng Bảng phân phối F (F-distribution table) cần có 3 biến số:
- Xác suất mong muốn có ý nghĩa
- Bậc tự do của tử số : n 1 -1
- Bậc tự do của mẫu số : n 2 -1
2
A
4.1 So sánh 2 phương sai - Áp dụng F- test
Sử dụng chuẩn F để so sánh độ chính xác (độ lặp lại) của hai dãy thí nghiệm A và B với nA, nB là số lần thực hiện của A và B
B
A tn
Trang 36Bảng phân phối F (F-distribution table)
http://mips.stanford.edu/public/classes/stats_data_analysis/lesson_5/234_8_k.html
Trang 37Từ thí dụ 1:
Đặt sA = 0.12 và sB = 0.073
So sánh Ftính toán với Fbảng tại bậc tự do df = (n1 -1), (n2 -1) = 3,3 (xs 95%).
Nếu Ftính toán Fbảng, phương sai khác nhau không ý nghĩa tại 95%.
Nếu Ftính toán Fbảng, phương sai khác nhau có ý nghĩa tại 95%.
Fbảng (df=3,3; 95%) = 9.28
Vì Ftính toán (2.70) < Fbảng (9.28), phương sai của 2 dãy kết quả khác nhau không ý nghĩa tại 95% (Độ lặp lại tương tự).
70
2 )
073
0 (
) 12 0
tính
s
s F
4.1.So sánh 2 phương sai - Áp dụng F- test
PP1: Quang phổ hấp thu nguyên tử
Trang 3860.8 45.7 75.4 118.0 74.3 59.8 59.9 92.7 66.9 76.6 44.1 82.5 65.2 82.3 80.1 70.0
138.2 94.2 54.3 121.7 70.7 110.3 71.0 75.6 95.3 99.0 104.0 65.6 105.1 92.3 99.1 106.7
Thuốc giảm đau được thử nghiệm trên 16 người tình nguyện Nhóm chứng là
Kết quả trên nhóm thử nghiệm là:
Với giới hạn tin cậy là 0.05, hãy kiểm tra khẳng định rằng phương sai của nhóm
Tính toán các phương sai:
Nhóm thử nghiệm = 322.077, Nhóm chứng = 481.320
Trang 39- F lý thuyết = 0.4106F thực nghiệm = 0.6692 :
khác nhau có ý nghĩa
Phương sai của :
Nhóm thử nghiệm = 322.077,
Trang 404.2 So sánh 2 số trung bình - Áp dụng t test
Bước 1: so sánh hai phương sai và (phép thử F; F –test)
Bước 2: có hai trường hợp
Trường hợp 1: phương sai không khác nhau, t tn được tính
) n / 1 ( ) n / 1 ( S
X X
t
B A
chung
tbB tbA
S 1 n S 1 n S
B A
2 B B
2 A A
tn
n S n
S
X X
/ /
/ /
2 2 2
2
2 2 2
A A
B B A A
n n S n
n S
n S n S
Bước 3: kết luận có hay không có sự khác nhau của hai phương pháp đo
Cho dù được tính theo công thức (3.15) hay (3.17):
Trang 414.2 So sánh 2 số trung bình - Áp dụng t test
Kiểu 1: So sánh giá trị trung bình của 2 mẫu dữ liệu cỡ nhỏ và phụ thuộc (n 30) : sử dụng trắc nghiệm t tương ứng từng cặp
trưởng Laxon của tuyến yên trong 1 tháng cho kết quả
(trước khi sử dụng)
xét xem hormon có ảnh hưởng?
dãy có nA kết quả, dãy kia có nB kết quả Hai giá trị trung bình sai khác khôngnhiều Phải kết luận sai khác này có đáng kể không?
Trang 42khẳng định là thuốc Laxon thành công trong sự làm gia tăng chiều cao trung bình của học sinh.
Trang 434.2 So sánh 2 số trung bình - Áp dụng t test
Kiểu 2: So sánh kết quả đo được với giá trị đã biết: là giá trị chắc chắn
điển hình thực hiện từ nguyên liệu chuẩn - standard reference material (SRM)
Áp dụng t test
thích hợp, bậc tự do df = n -1 đối với thử nghiệm này
Nếu |t tính toán| < t bảng, Kết quả khác nhau không có ý nghĩa ở xác suất 95% Nếu |t tính toán| t bảng, Kết quả khác nhau có ý nghĩa ở xác suất 95%.
n s
x biêt
đã tri iá
g
ttính toán
thực nghiệm Người thực hiện phân tích lặp lại phương pháp và cần so sánh kếtquả đo được Xi với giá trị đã biết trước X xem khác nhau có ý nghĩa hay không ?
Trang 44Nếu |t tính toán| < t bảng, Kết quả khác nhau không có ý nghĩa ở xác suất 95%.
Nếu |t tính toán| t bảng, Kết quả khác nhau có ý nghĩa ở xác suất 95%.
n s
x biêt
đã tri iá
g
ttính toán
Thí dụ 1: giả sử mẫu thử KMnO4 trong mẫu có hàm lượng thật M
là 3,110 mg và giá trị trung bình là 3,117 mg Hãy xét xem 2 kết quả này khác nhau có ý nghĩa ? (n=7)
3786 ,
0
7 051
, 0
117 , 3 110 ,
3
ttn
ttn = 0,3786 < tlt = 2,45 nên kết quả khác nhau không ý nghĩa 95%)
Trang 45Thí dụ 2
Định lượng Fe trong nước biển Giá trị đã biết = 5.85 nM
Kết quả thực nghiệm: 5.76 ± 0.17 nM (n = 10)
tbảng(bậc tự do df = 9) = 2.262 (xác suất 95%)
ý nghĩa xác suất 95%
674 1 10
17 0
76 5 85 5 n
s
x biêt đã ri t giá
Trang 46Kiểu 3: So sánh kết quả đo lặp lại (replicate measurements)
hay là so sánh kết quả trung bình của 2 dãy số liệu
2 1
2 1
chung
2 1
toán tính
n n
n n s
x
x t
2 n
n
) 1 n
( s ) 1 n
(
s s
2 1
2
2 2 1
2 1
Sẽ so sánh ttính toán với giá trị t được xếp thành cột tại df và xác suất thích hợp
(bậc tự do df = n1 + n2 – 2) đối với thử nghiệm này
4.2 So sánh 2 số trung bình - Áp dụng t test
Trang 47thí dụ: ĐịNH LƯợNG NICKEN BằNG 2 PHƯƠNG PHÁP QUANG PHổ
PP1: Quang phổ hấp thu nguyên tử
0 2
4 4
) 1 4 ( ) 12 0 ( ) 1 4 ( ) 073 0 ( 2
n n
) 1 n
( s ) 1 n ( s s
2 2
2 1
2
2 2 1
2 1
5 4
4
) 4 )(
4 ( 0993
0
59 3 945
3 n
n
n n s
x
x t
2 1
2 1
chung
2 1
Nếu | ttính toán| tbảng, kết quả khác nhau không có ý nghĩa ở 95%
Nếu | ttính toán| tbảng, kết quả khác nhau có ý nghĩa ở 95%.
Vì | ttính toán| (5.056) tbảng (2.447), các kết quả từ 2 pp khác nhau có ý nghĩa ở xác suất 95%
Trang 484.3 Sơ đồ tổng quát chọn F- test và t-test
2 dãy số liệu (mẫu)
Phương sai
khác nhau không
ý nghĩa
Phương sai khác nhau có ý nghĩa
Means
còn trắc nghiệm z (z-test) ít được sử dụng trong ngành dược
F - test: Two-Sample
for Variances
Trang 49https://www.fleshandbones.com/readingroom/pdf/1056.pdf
http://www.fao.org/docrep/W7295E/w7295e09.htm#7.3.2%20detecti on%20limit
Excel tool – data analysis
Trang 50Cho
những chữ số thập phân từ hàng phần nghìn trở đi đều vô nghĩa
http://dictionary.bachkhoato anthu.gov.vn/default.aspx? param=149DaWQ9Mzc4O TAmZ3JvdXBpZD0zNCZra W5kPSZrZXl3b3JkPQ==&p age=2
5 CHỮ SỐ CÓ NGHĨA
(Tự điển bách khoa toàn thư)
Trang 51Chữ số có nghĩa : (significant digits; significant figures)
Số liệu thu đuợc từ thực nghiệm có thể là
" Chữ số có nghĩa "?
Số lượng chữ số có nghĩa trong một kết quả đơn giản là số chữ số biết được với độ tin cậy nào đó
Số 13.2 có 3 chữ số có nghĩa Số 13.20 có 4 chữ số có nghĩa
Trang 5252
Trang 53Chữ số có nghĩa
Các số liệu này phải được thể hiện sao cho người đọc hiểu được mức độ chính
xác của chúng vì vậy khi ghi kết quả phải tuân theo qui tắc về chữ số có nghĩa.
Vài quy tắc chọn lựa các chữ số có nghĩa
Trang 55Rules: the underlined numbers are significant
all non-zero digits are significant 2.346
zeros between non-zero digits are significant 3.004
zeros to the left of the first non-zero digit in a number are not significant 0.034
when a number ends in zeros to the right of decimal point, the zeros are significant
2.300
when a number ends in zeros which are to the left of the decimal those zeros may
or may not be significant 2000 or 2000 or 2000 or 2000
Bài tập
Bao nhiêu chữ số
có nghĩa?