1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Ứng dụng tin học trong công nghệ hóa học

155 575 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 155
Dung lượng 9,52 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các tham số đặc trưng về sự tập trung của tập số liệu a Tần suất p i Giả thiết có một tập gồm có N số liệu kết quả đo, trong đó có ni giá trị X i Xi xuất hiện ni lần ni gọi là tần số của

Trang 1

Häc viÖn kü thuËt qu©n sù

BµI GI¶NG

tin häc øng dông

TRONG c«ng nghÖ HãA HäC

Hµ néi - 2017

Trang 2

Môc lôc

Chương 1 5

PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU THỰC NGHIỆM 5

1.1 CÁC ĐẶC TRƯNG THỐNG KÊ CỦA TẬP SỐ LIỆU ĐO 5

1.1.1 Các tham số đặc trưng về sự tập trung của tập số liệu 5

1.1.2 Các tham số đặc trưng về sự phân tán của tập số liệu 7

1.1.3 Các đặc trưng phân phối thống kê của tập số liệu 9

1.2 ĐÁNH GIÁ TẬP SÓ LIỆU KỂT QUẢ ĐO 14

1.2.1 Sai số đo 14

1.2.2 Độ chính xác của tập số liệu kết quả đo 15

1.2.3 Độ sai biệt của tập số liệu kết quả đo 15

1.2.4 Sai số tối đa cho phép 15

1.2.5 Khoảng chính xác tin cậy 16

1.2.6 Khoảng giới hạn tin cậy của một tập số liệu kết quả đo 16

1.3 SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO 18

1.3.1 So sánh 2 trung bình với phương sai đã biết hay mẫu lớn (N > 30) 18

1.3.2 So sánh 2 trung bình với dữ liệu từng cặp 20

1.3.3 So sánh trung bình với phương sai bằng nhau 21

1.3.4 So sánh 2 trung bình với phương sai khác nhau 23

1.3.5 So sánh 2 phương sai 24

1.4 BÀI TOÁN PHÂN TÍCH PHƯƠNG SAI (ANOVA) 26

1.4.1 Phân tích phương sai 1 nhân tố 26

1.4.2 Phân tích phương sai 2 nhân tố 29

1.4.3 Phân tích phương sai 2 nhân tố có lặp 31

1.5 PHÂN TÍCH TƯƠNG QUAN, HỒI QUY 35

1.5.1 Phân tích tương quan 35

1.5.2 Phân tích hồi quy 36

1.6 TÌM HÀM HỒI QUY 43

1.6.1 Sử dụng các hàm SLOPE, INTERCEPT và RSQ 43

1.6.2 Sử dụng Trendline 44

1.6.3 Kết hợp hàm INDEX và LINEST 45

1.6.4 Sử dụng hàm LINEST 45

1.6.5 Sử dụng chức năng “Solver” 46

Chương 2 51

QUY HOẠCH THỰC NGHIỆM 51

Trang 3

2.1 CÁC PHƯƠNG PHÁP QUY HOẠCH THỰC NGHIỆM 51

2.1.1 Một số khái niệm 51

2.1.2 Qui hoạch thực nghiệm yếu tố toàn phần 2 k 55

2.1.3 Qui hoạch thực nghiệm yếu tố từng phần 2 k - p 56

2.1.4 Qui hoạch trực giao cấp 2 57

2.1.5 Qui hoạch thực nghiệm để tìm cực trị 59

2.2 XÁC ĐỊNH CÁC HỆ SỐ CỦA PHƯƠNG TRÌNH HỒI QUY 61

2.2.1 Tính hệ số hồi qui b j của phương trình hồi qui tuyến tính 62

2.2.2 Tính hệ số hồi qui b j của phương trình hồi qui bậc 2 62

2.3 ỨNG DỤNG EXCEL ĐỂ TỐI ƯU HÓA THỰC NGHIỆM 62

Chương 3 76

PHƯƠNG PHÁP SỐ GIẢI CÁC BÀI TOÁN 76

TRONG HÓA HỌC VÀ CÔNG NGHỆ HÓA HỌC 76

3.1 CÁC BÀI TOÁN LIÊN QUAN ĐẾN PHƯƠNG TRÌNH ĐẠI SỐ PHI TUYẾN 76

3.1.1 Phương pháp số giải phương trình đại số phi tuyến 76

3.1.2 Sử dụng “Goal Seek” tìm nghiệm phương trình đại số phi tuyến 78

3.2.3 Thể tích mol và hệ số chịu nén nhờ phương trình trạng thái 79

3.1.4 Vận tốc giới hạn của bi cầu rơi vào trong chất lỏng 80

3.2 CÁC BÀI TOÁN LIÊN QUAN ĐẾN HỆ PHƯƠNG TRÌNH ĐẠI SỐ 81

3.2.1 Phương pháp số giải hệ phương trình đại số 81

3.2.2 Sử dụng “Solver” của Excel để giải hệ phương trình đại số 85

3.2.3 Cân bằng vật chất trong hệ thống phân tách ở chế độ ổn định 90

3.2.4 Cân bằng hóa học trong hệ đa cấu tử 91

3.3 CÁC BÀI TOÁN LIÊN QUAN ĐẾN HỆ PHƯƠNG TRÌNH VI PHÂN THƯỜNG 92

3.3.1 Các phương pháp số giải phương trình và hệ phương trình vi phân thường 92

3.3.2 Tính toán động học phản ứng 96

3.3.3 Trao đổi nhiệt trong dãy thùng trộn ở chế độ không ổn định 97

3.3.4 Sự khuếch tán cùng phản ứng hóa học trong không gian một chiều 100

Chương 4 102

ỨNG DỤNG PHẦN MỀM DESIGN-II TRONG TÍNH TOÁN VÀ MÔ HÌNH HÓA QUÁ TRÌNH CÔNG NGHỆ HÓA HỌC 102

4.1 SƠ LƯỢC QUÁ TRÌNH PHÁT TRIỂN CÁC HỆ THỐNG TỰ ĐỘNG HÓA THIẾT KẾ CÔNG NGHỆ HÓA HỌC 102

Trang 4

4.2.3 Các thiết bị cân bằng lỏng - hơi 110

4.2.4 Các thiết bị công nghệ phụ trợ khác 112

4.3 CƠ SỞ DỮ LIỆU TÍNH CHẤT NHIỆT ĐỘNG HỌC CÁC CHẤT 113

4.3.1 Phân tích nhiệt động học 113

4.3.2 Sử dụng cơ sở dữ liệu của DESIGN-II làm sổ tay tra cứu 116

4.4 CÁC BƯỚC SỬ DỤNG PHẦN MỀM DESIGN-II 116

4.4.1 Khởi động DESIGN-II 116

4.4.2 Tạo một tài liệu mới 117

4.4.3 Sắp đặt các mẫu thiết bị lên trang làm việc 117

4.4.4 Liên kết các mô-đun thiết bị bằng dòng công nghệ và định hướng dòng công nghệ 118

4.4.5 Lựa chọn hệ đơn vị đo 119

4.4.4 Lựa chọn các chất và các thông số của dòng vào 120

4.4.7 Lựa chọn phương pháp nhiệt động để tính toán tính chất các cấu tử 123

4.4.8 Thiết lập các thông số đầu vào của thiết bị 123

4.4.9 Xác định phương pháp hội tụ khi tính toán lặp 125

4.4.10 Lưu và thực thi tính toán 126

4.4.11 Hiển thị giá trị các dòng lên trang làm việc 127

TÀI LIỆU THAM KHẢO 3

Phô lôc 4

Trang 5

Chương 1 PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU THỰC NGHIỆM

1.1 CÁC ĐẶC TRƯNG THỐNG KÊ CỦA TẬP SỐ LIỆU ĐO

1.1.1 Các tham số đặc trưng về sự tập trung của tập số liệu

a) Tần suất p i

Giả thiết có một tập gồm có N số liệu kết quả đo, trong đó có ni giá trị

X i (Xi xuất hiện ni lần) ni gọi là tần số của giá trị Xi, khi đó, tần suất của giá trị Xi được tính như sau:

Khi N   thì pi  Pi (Pi là xác suất, xuất hiện giá trị Xi).

Để tìm tần số của từng giá trị khác nhau trong dãy số liệu, có thể sử dụnghàm FREQUENCY (data_array, bins_array) Trong đó, data_array là địa chỉmảng dữ liệu; bins_array là địa chỉ mảng các giá trị khác nhau của dữ liệu

Ví dụ 1: Cho một tập số liệu kết quả đo:

Dãy các giá trị của tập số liệu đo được sắp xếp lại theo thứ tự tăng dần

và tính tần suất, tần suất dồn theo bảng sau:

Trang 6

- Nhập vào Data Range : $E$2:$E$12 và chọn mục Column;

- Chọn Tab Series, nhập địa chỉ cột giá trị: $F$3:$F$8 vào Category (X)

Sổ trội là số có tần suất lớn nhất trong tập số liệu kết quả đo Hàm Excel

tính số trội: MODE (number1, number2, ).

Số trội của tập số liệu trong ví dụ 1: Mo = 33 (pi = 4).

c) Số trung vị

Số trung vị Med là số đứng giữa tập số liệu đã được sắp xếp theo thứ

tự từ bé đến lớn, chia dãy số đó làm 2 phần bằng nhau về số số liệu

Giả sử X1, X2, X3, XN là dãy các giá trị của tập số liệu kết quả đo, đượcsắp xếp theo thứ tự tăng dần, thì:

- Số trung vị của tập N số lẻ được tính theo công thức sau:

Med = X(N+1)/2

- Số trung vị của tập N số chẵn được tính theo công thức sau:

Hàm Excel tính trung vị: MEDIAN (number1, number2, ).

Trong ví dụ 1, số trung vị:

d) Trung bình cộng

Gọi X là giá trị trung bình cộng của một tập số liệu không phân nhóm

thì X được tính theo công thức sau:

Trang 7

Hàm Excel tính trung bình nhân: GEOMEAN (number1, number2, ).

f) Trung bình điều hòa

(1.4)Trung bình điều hòa thường dùng để tính vận tốc, thời gian trung bình

Hàm Excel tính trung bình điều hòa: HARMEAN (number1, number2, ).

g) Trung bình gia quyền (có trọng số)

1.1.2 Các tham số đặc trưng về sự phân tán của tập số liệu

a) Phương sai (2 hay S 2 )

Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị

của tập số liệu so với giả trị trung bình của tập số liệu kết quả đo:

(1.6)Với N’ = N khi N > 30 (phương sai ký hiệu là 2); N’ = N - 1 khi N < 30

Trang 8

(1.7)

Phương sai đặc trưng cho sự sai biệt của các số liệu trong kết quả đo.

Phương sai càng lớn, sai biệt càng lớn Ngược lại phương sai càng nhỏ thì saibiệt càng nhỏ

Phương sai còn biểu diễn độ phân tán của tập số liệu kết quả đo đối với

giá trị trung bình Phương sai càng lớn độ phân tán xung quanh giá trị trungbình càng lớn và ngược lại

Hàm Excel tính phương sai: VAR(number1, number2, ).

Trong ví dụ 1, giá trị phương sai:

Hàm Excel tính độ lệch chuẩn: STDEV(number1, number2, ).

Trong ví dụ 1, giá trị độ lệch chuẩn:

c) Độ sai chuẩn ( hay )

hay (1.10)

Độ sai chuẩn có thể hiểu là trung bình phân tán của các giá trị kết quả đo

Trong ví dụ 1, giá trị độ sai chuẩn:

d) Hệ số biến thiên

Hệ số biến thiên là tỷ số giữa độ lệch chuẩn với giá trị trung bình:

Trang 9

(1.11)

Vì hệ số biến thiên không có thứ nguyên, cho nên có thể dựa vào hệ sốbiến thiên để so sánh gần đúng độ sai biệt của các kết quả đo nhận được bằngcác cách khác nhau

Khi độ lệch chuẩn lớn (Sf) (tức sai biệt của các số liệu đo lớn), thì CV lớn

và ngược lại

Trong ví dụ 1, hệ số biến thiên:

Bài tập

Kết quả xác định hàm lượng (%) P2O5 trong hệ (NH4)2HPO4-K2CO3

-H2O bằng phương pháp so màu được cho trong bảng dưới đây:

1.1.3 Các đặc trưng phân phối thống kê của tập số liệu

Đặc trung phân phối thống kê của một tập số liệu kết quả đo là quy

luật phân bố ngẫu nhiên của các giá trị kêt quả đo trên trục số thực Đặc

trưng phân phối thống kê là quy luật, nên về mặt toán học nó thường đượcbiểu diễn bằng một hàm số và có đồ thị tương ứng

Mỗi tập số liệu kết quả nghiên cứu là một tập số ngẫu nhiên (thường làrời rạc) có những đặc trưng phân phối thống kê riêng Dưới đây trình bày các

Trang 10

hay (1.12)Trong đó: X là biến số ngẫu nhiên;  là hằng số, bằng giá trị kỳ vọngcủa biến ngẫu nhiên;  là hằng số, bằng giá trị phương sai của biến ngẫu

Hàm phân phối chuẩn có đặc diểm là:  Mo  Med  .

Đồ thị hàm phân phối chuẩn có dạng như hình 1.1 Diện tích nằm dưới

đường cong phân phối chuẩn chính là tần suất dồn của các giá trị nằm trong

vùng lấy tích phân Diện tích này cũng biểu diễn xác suất xuất hiện của các

giá trị X, nằm trong vùng lấy tích phân.

Hình 1.1 Đồ thị phân phối chuẩn Gauss

Xác suất thống kê gắn liền với khái niệm độ tin cậy thống kê (P) Diện

tích giới hạn bởi đường cong cũng chính là độ tin cậy thống kê để xuất hiện

Xi trong khoảng tích phân Kí hiệu độ tin cậy thống kê để xuất hiện giá trị Xi nằm trong vùng (- , Xi) là P(Xi) Độ tin cậy thống kê luôn là một số nhỏ hơn hoặc bằng 1 tức là P(Xi) < 1.

Nếu kí hiệu  là độ không tin cậy thống kê, thì:

P +  = 1 hay P = 1 -  hoặc  = 1 – P.

Trong xác suất, người ta qui ước:

Biến cố có P = 0,9999 là biến cố hoàn toàn chắc chắn.

Biến cố có P = 0,999 là biến cố hết sức chắc chắn.

Biến cố có P = 0,99 là biến cố rất chắc chắn.

Biến cố có P = 0,95 là biến cố chắc chắn.

Biến cố có P = 0,90 là biến cố có chiều hướng chắc chắn.

Từ hàm phân phổi chuẩn, khi cho một giá trị ui(X) thì ta tính được độ tin cậy thống kê Pi, ứng với một diện tích Pi Ngược lại, khi cho giá trị Pi thì có

Trang 11

thể tính được một giá trị ui(X) Thay cho tính toán, người ta lập sẵn những bảng số để tra giá trị u khi biết giá trị P hoặc ngược lại.

Hàm Excel trả về giá trị hàm phân phối chuẩn: NORMDIST(x, mean,standard_dev, cumulative)

b) Phân phối Student

Hàm phân phối Student có dạng:

; hoặc (1.13)

Trong đó: t là một biến ngẫu nhiên; f là bậc tự do (f = N - 1); B là hằng số

Khi Xi là số có tần suất rất lớn thì có thể coi Đồ thị của hàmStudent giống như hàm phân phối chuẩn Tuy nhiên, độ nhọn của đồ thị hàmphân phối Student phụ thuộc vào bậc tự do

Hình 1.2 Đồ thị phân phối Student

Bậc tự do càng lớn thì độ nhọn càng nhỏ và ngược lại Do độ nhọn phụthuộc vào bậc tự do, nên giá trị chuẩn t cũng phụ thuộc vào bậc tự do Trong thực tế, người ta nhận thấy:

N > 30: tuân theo phân phối chuẩn

N < 30: tuân theo phân phối Student

Đối với phân phổi Student cũng có bảng tra chuẩn Student tính sẵn Dựa

vào bảng này, khi biết hai trong ba giá trị t, f và P thì xác định được giá trị

Trang 12

(1.35)

Với: Khi lấy các giá trị: 0 <  < + (1.36)Hàm Khi bình phương chỉ phụ thuộc vào 1 bậc tự do Đồ thị của hàmphân phối Khi bình phương có dạng:

Nếu cho trước độ tin cậy thống kê P và giá trị f, tra bảng sẽ tìm được giá trị 2 và ngược lại

d) Phân phối Fisher

Hàm số của phân phối Fisher có dạng:

(1.14)

Trong đó: F là biến số ngẫu nhiên; f1, f2 là các bậc tự do; A là hằng số phụ

thuộc f1 và f2 F phụ thuộc vào hai loại bậc tự do và được tính theo công thứcsau:

với 0  F  + (1.34)

Đồ thị của hàm Fisher có dạng

Trang 13

Tùy thuộc vào bậc tự do mà đồ thị có các dạng khác nhau Hàm phânphối Fisher cũng có các tính chất như các hàm phân phôi khác Diện tích giớihạn bởi đường cong cũng biêu diễn độ tin cậy thống kê.

Người ta cũng lập các bảng tra sẵn, khi cho (P, f1 và f2) sẽ tra được giátrị của chuẩn F, ngược lại cho 3 trong 4 thông số ( F, P, f1,f2) sẽ tra được sốthứ 4 chưa biết Có 2 loại bảng số chính để tra chuẩn F: Bảng F(0.95, f1, f2)

và bảng F(0.99, f1, f2)

e) Phân phối Poisson

- Hàm số cùa phân phối Poisson có dạng:

với (1.14)

Tức là kỳ vọng và phương sai bằng nhau X là số tự nhiên.

Hình 1.3 Đồ thị hàm phân phối Poisson

Cần phân biệt khái niệm hàm phân phối và chuẩn phân phối (chuẩn

thống kê):

-Hàm phân phối là qui luật phân bổ số liệu kết quả đo có tính ngẫu

nhiên (các biến ngẫu nhiên)

-Chuẩn phân phối là những giá trị của hàm phân phối tính được theo

điều kiện cho trước

Như vậy chuẩn phân phối có 2 dạng:

Trang 14

+ Không phụ thuộc vào bậc tự do thì tuân theo hàm Gauss hoặc Poisson.Trong thực nghiệm, cách xác định định tính luật phân phối của 1 tập

số liệu kết quả đo như sau:

Nếu N > 30 và có 1 trong 3 tính chất sau thì tập số liệu kết quả đo cóqui luật phân phối chuẩn Gauss:

1) Đồ thị phân phối tần suất có dạng chuông;

2) Mo = Med = X;

3) Xi nhận các giá trị ở ngoài khoảng X ± 2 là 5% hoặc Xi nhận các

giá trị nằm trong khoảng X ± 2 là 95%

Nếu N < 30 và có 1 trong 3 tính chất trên thì tập số liệu kết quả đo cóqui luật phân phối Student

1.2 ĐÁNH GIÁ TẬP SÓ LIỆU KỂT QUẢ ĐO

Một tập số liệu kết quả đo có thể được phân tích đánh giá thông quacác đại lượng chính sau đây

1.2.1 Sai số đo

Có 4 loại sai số đo:

- Sai số tuyệt đối:

(1.15)Sai số tuyệt đổi là sự sai khác của một giá trị đo nào đó với giá trị trung bình (hoặc giá trị thật) Sai khác này có thể là âm hoặc dương

- Sai số tương đối:

(1.16)Sai số tương đối là tỷ số của sai số tuyệt đối đối với giá trị trung bình.Sai số này không có thử nguyên cho nên được dùng để so sánh sai sổ tươngđối của các phương pháp đo cho kết quả không cùng thứ nguyên

- Sai số hệ thống:

(1.17)

Nếu hiệu số này đáng tin cậy thì số đo đã mắc sai số hệ thống, Khi đó giá tri Xi tập trung về một phía của giá trị thực trên trục số Có thể tìm được

nguyên nhân gây sai số hệ thống để loại bỏ

-Sai số ngẫu nhiên:

(1.18)Phép đo mắc sai số ngẫu nhiên khi hiệu số giữa giá trị trung bình cộng

với giá trị thật gần bằng không Khi đó các giá trị Xi phân bổ đều hai phía

Trang 15

của giá trị thực trên trục số Sai số ngẫu nhiên bao giờ cũng mắc phải và chỉ

có thể tìm các giải pháp để giảm sai số ngẫu nhiên

1.2.2 Độ chính xác của tập số liệu kết quả đo

Vì trung bình cộng biểu diễn độ tập trung của các giá trị thực nghiệmnên độ chính xác (Accuracy) của tập số liệu kết quả đo được đánh giá thôngqua giá trị trung bình cộng Giá trị trung bình cộng mà sai khác với giá trịthật càng nhỏ thì độ chính xác của số đo càng lớn và ngược lại

Nguyên nhân dẫn đến độ chính xác kém có thể là:

- Chọn mẫu không đúng về chất lượng và số lượng;

- Giải pháp đo số liệu không chính xác

1.2.3 Độ sai biệt của tập số liệu kết quả đo

Vì phương sai biểu diễn độ sai biệt trung bình (Precision) của các giátrị trong tập số liệu kết quả đo so với giá trị trung bình nên phương sai càngnhỏ thì độ sai biệt càng nhỏ và ngược lại

Nguyên nhân chính dẫn đến độ sai biệt lớn:

- Chọn mẫu có chất lượng, số lượng không đặc trưng cho mục tiêu đo;

- Tay nghề người đo kém, không thu thập được số đo

Thực ra giá trị trung bình cộng cũng phản ánh phần nào độ sai biệt

khi so với giá trị thật và ngược lại giá trị phương sai S2 cũng phản ánh phần

nào độ chính xác khi độ sai biệt nhỏ Tuy nhiên mỗi đại lượng có tính trội

biểu diễn cho độ chính xác và độ sai biệt khác nhau: có tính trội phản ánh

độ chính xác, S2 có tính trội phản ánh độ sai biệt:

Hình 1.4 Minh họa tính trội của độ chính xác và độ sai biệt

Kết luận Đúng-Tốt Sai số ngẫu nhiên Sai số hệ thống

1.2.4 Sai số tối đa cho phép

Sai số tối đa cho phép P(X) của một tập số liệu kết quả đo được qui

định: cho phép lấy các giá trị Xi sai khác với giá trị trung bình X lớn nhất là

Trang 16

P(X) = ±3f (1.19)+ Sai số tối đa cho phép tương đối:

(1.20)Sai số tối đa tương đối cho phép được biểu diễn dưới dạng phần trăm(%) do đó không còn thứ nguyên, dùng để so sánh sai số tối đa cho phéptương đối của phương pháp đo này với sai số tối đa cho phép tương đối củaphương pháp đo khác Những giá trị kết quả đo nào nằm ngoài khoảng sai sốtối đa cho phép tuyệt đối thì phải loại bỏ (các giá trị đó đã mắc sai số thô)

1.2.5 Khoảng chính xác tin cậy

Khoảng chính xác tin cậy được tính theo công thức sau:

quả đo phụ thuộc vào độ tin cậy thống kê (P) và bậc tự do (f).

Khoảng chính xác tin cậy của mỗi giá trị kết quả đo được tính như sau:

(1.22)

Trong đó: t(P, f) là giá trị tra ở bảng phân vị cùa hàm phân phối Student.

Khi một tập số liệu kết quả đo có khoảng chính xác tin cậy không thoả

mãn với độ tin cậy thống kê (P) cho trước thì có thể tăng thêm số mẫu đo

(N) Số mẫu đo cần thiết để có khoảng chính xác tin cậy trùng với khoảngchính xác tin cậy lý thuyết cho trước, được tính theo công thức sau:

(1.23)Trong đó: X là giá trị cho trước

1.2.6 Khoảng giới hạn tin cậy của một tập số liệu kết quả đo

Khoảng giới hạn tin cậy của một tập số liệu kết quả đo được qui địnhnằm trong khoảng:

(1.24)

Trang 17

Giá trị Xi bất kỳ của một tập số liệu kết quả đo được chấp nhận theo độ tin cậy thống kê p cho trước, có bậc tự do f = N - l phải luôn nằm trong

khoảng giới hạn tin cậy

Trong ví dụ 1, khoảng giới hạn tin cậy được tính như sau:

Với độ tin cậy 95%:

Tra bảng phân vị Student:

Hay

Với độ tin cậy 99%:

Tra bảng phân vị Student:

Hay

Như vậy, rõ ràng yêu cầu độ tin cậy càng cao thì khoảng giá trị tin cậy

sẽ càng rộng

Ngoài cách sử dụng các hàm của Excel, chúng ta còn có thể sử dụng

chúng ta còn có thể sử dụng công cụ Data Analysis để tính đặc trưng thống

kê số liệu như sau:

- Nhập dữ liệu trong cột A1:A12;

- Chọn menu Data/Data Analysis…/Descriptive Statistics;

Trang 18

- Nhập các mục:

Input Range: địa chỉ tuyệt đối chứa dữ liệu $A$1:$A$12

Output Range: địa chỉ xuất kết quả

Confidence Level for Mean (Độ tin cậy cho trung bình).

Kết quả bao gồm: Kỳ vọng (trung bình), phương sai, trung vị, mode, độlệch chuẩn, độ nhọn, độ nghiêng (hệ số bất đối xứng so với phân phốichuẩn), khoảng biến thiên, max, min, sum, số mẫu (count), khoảng tin cậycủa trung bình ở mức 95%

Sau đây là kết quả tính các đặc trưng thống kê của ví dụ 1 khi sử dụngcác hàm của Excel và sử dụng Data Analysis

Chú ý: khi số mẫu n > 30, ta sẽ sử dụng hàm CONFIDENCE.NORM thay cho hàm CONFIDENCE.T (sử dụng chuẩn phân bố Gauss thay vì phân

bố Student)

Bài tập 1

Giá trị nhiệt độ trung bình của lò nung xác định được qua 4 lần đo độclập bằng hỏa quang kế là 2250 oC với độ lệch chuẩn Sf = 10 oC Xác địnhkhoảng tin cậy của nhiệt độ lò nung với độ tin cậy 95%?

Đáp số: 2240,2  T  2259,8

Bài tập 2

Tạp chất độc hại có trong các muối photphat dùng làm thực phẩm là flo.Dưới đây là kết quả phân tích hàm lượng flo trong sản phẩm thương mại(%): 0,18; 1,12; 0,13; 0,15 Hãy xác định giới hạn trên của hàm lượng flotrong sản phẩm này với độ tin cậy 95%

Đáp số: F(%) < 0,19

Bài tập 3

Trang 19

Khi chuẩn độ 10ml NaOH 0,1N bằng HCl thu được thể tích dung dịchchuẩn HCl: 10,09; 10,11; 10,09; 10,10; 10,12 ml Xử lý số liệu thực nghiệmvới độ tin cậy α = 0,952

Kết quả phân tích hàm lượng iot trong một mẫu nước biển ở Thanh Hóatheo phương pháp động học xúc tác-trắc quang lần lượt là: 24,75; 25,12;24,76; 26,28; 25,15 µg/l Xử lý số liệu thực nghiệm với độ tin cậy α = 0,95

1.3 SO SÁNH CẶP THAM SỐ ĐẶC TRƯNG CỦA HAI TẬP SỐ LIỆU KẾT QUẢ ĐO

1.3.1 So sánh 2 trung bình với phương sai đã biết hay mẫu lớn (N > 30)

 Dùng menu: Tools/ Data Analysis… / z-test:Two Sample for Means

 Tiêu chuẩn kiểm định:

 Phân vị 2 phía z/2 là: z Critical two-tail (z/2 = NORM.S.INV(1-/2))

 Nếu thì bác bỏ H0 , chấp nhận H1 (trung bình hai mẫu khác nhau)

 Nếu thì chấp nhận H0 , bác bỏ H1 (trung bình hai mẫu như nhau)

Ví dụ:

Người ta chọn 2 mẫu, mỗi mẫu 10 máy lấy từ hai lô (I và II được sảnxuất với phương sai biết trước tương ứng là 1 và 0,98) để khảo sát thời gianhoàn thành công việc theo phút của chúng:

I 6 8 9 10 6 15 9 7 13 11

II 5 5 4 3 9 9 6 13 17 12Hỏi khả năng hoàn thành công việc của hai máy có khác nhau hay không?với  = 0,05

Trang 20

- Output options: chọn cách xuất kết quả

Kết quả

Do nên trung bình hai mẫu không bằng nhau, nói một cáchkhác là khả năng làm việc của hai lô máy này khác nhau (lô I lớn hơn lô II)

1.3.2 So sánh 2 trung bình với dữ liệu từng cặp

 Được dùng khi mẩu bé, phụ thuộc, phương sai 2 mẫu không bằng nhau

và mỗi phần tử khảo sát có 2 chỉ tiêu X (trước), Y (sau) khi thay đổi điềukiện thí nghiệm

 Dùng menu: Tools/Data Analysis…/ t-test:Paired Two Sample for

Means

Trang 21

 Phân vị 2 phía t/2 là: t Critical two-tail (t/2 = T.INV.2T(,f))

 Nếu thì bác bỏ H0 , chấp nhận H1 (trung bình hai mẫu khác nhau)

 Nếu thì chấp nhận H0 , bác bỏ H1 (trung bình hai mẫu như nhau)

Ví dụ:

Để nghiên cứu của một loại thuốc ngủ, người ta cho 10 bệnh nhân uốngthuốc Lần khác họ cũng cho bệnh nhân uống thuốc nhưng là thuốc giả(thuốc không có tác dụng) Kết quả thí nghiệm như sau:

Bệnh nhân 1 2 3 4 5 6 7 8 9 10

Số giờ ngủ có thuốc 6,1 7,0 8,2 7,6 6,5 8,4 6,9 6,7 7,4 5,8

Số giờ ngủ với thuốc giả 5,2 7,9 3,9 4,7 5,3 5,4 4,2 6,1 3,8 6,3Giả sử số giờ ngủ của các bệnh nhân có qui luật chuẩn Với mức ý nghĩa  =0,05 hãy kết luận về ảnh hưởng của loại thuốc ngủ trên?

Nhập và xử lý dữ liệu

Kết quả

Trang 22

= 3,1835 > = 2,2622 nên chấp nhận H1 Vậy loại thuốc ngủ trên có ảnhhưởng làm tăng số giờ ngủ trung bình.

1.3.3 So sánh trung bình với phương sai bằng nhau

Được dùng khi 2 mẫu bé, độc lập và phương sai 2 mẫu bằng nhau;

Chọn menu: Tools/Data Analysis…/ t-test:Two-Sample Assuming Equal

Variances;

Phân vị 2 phía là: t Critical two-tail;

Nếu thì bác bỏ H0, chấp nhận H1 (hai trung bình khác nhau);

Nếu thì chấp nhận H0, bác bỏ H1 (hai trung bình như nhau)

Ví dụ: Người ta cho 10 bệnh nhân uống thuốc hạ cholesterol đồng thời cho

10 bệnh nhân khác uống giả dược, rồi xét nghiệm về nồng độ cholesteroltrong máu (g/l) của cả 2 nhóm:

Thuốc 1,10 0,99 1,05 1,01 1,02 1,07 1,10 0,98 1,03 1,12Giả dược 1,25 1,31 1,28 1,20 1,18 1,22 1,22 1,17 1,19 1,21Với  = 0,05 hãy cho biết thuốc có tác dụng hạ cholesterol trong máu không?

Nhập và xử lý dữ liệu

Trang 23

Kết quả

Do ( ) nên chứng tỏ trung bình hai mẫu khác nhau,thuốc có tác dụng hạ cholesterol trong máu (1,047 < 1,223)

Bài tập:

Khi nghiên cứu quá trình polyme hóa theo cơ chế gốc của các muối trên

cơ sở 4-vinylpyridin và hai ankyl halogen khác nhau: butyl iodua C4H9I vàetyl bromua C2H5Br nhận thấy: hiệu suất phản ứng trung bình của C4H9I là

67,72% (N1 = 8), còn của C2H5Br là 91,61% (N2 = 8) Phương sai của chúngđều bằng S = 16,6% Hãy so sánh hiệu suất phản ứng của hai chất trên với 

= 0,05?

Đáp số:

Hiệu suất của C H Br cao hơn so với C H I

Trang 24

Chọn menu: Tools/Data Analysis…/ t-test:Two-Sample Assuming UnEqual

Variances

Tiêu chuẩn kiểm định:

Phân vị 2 phía /2 là: t Critical two-tail

Nếu thì bác bỏ H0, chấp nhận H1 (hai trung bình khác nhau);

Nếu thì chấp nhận H0, bác bỏ H1 (hai trung bình như nhau)

Ví dụ: Thời gian tan rã (phút) của một loại viên bao từ 2 xí nghiệp dược

phẩm (XNDP) khác nhau được kiểm nghiệm như sau:

Trang 25

Do (0,9152 < 2,1448) nên chấp nhận H0 tức là thời gian tan rãtrung bình của viên bao thuộc 2 XNDP như nhau.

1.3.5 So sánh 2 phương sai

So sánh 2 phương sai được áp dụng để so sánh độ sai biệt của 2 phươngpháp đo khác nhau;

Chọn menu: Tools/Data Analysis…/F-Test Two-Sample for Variances;

Tính tiêu chuẩn kiểm định

Nếu F < F thì chấp nhận giả thiết H0: (tức là hai phương pháp này

có độ sai biệt như nhau) và ngược lại: F = F.INV.RT(, df 1 , df 2 )

Ví dụ 1: Một mẫu được phân tích bởi hai phương pháp A và B nhận được kết

quả như sau:

Trang 26

Kết quả

Do F = 4,1718 > 3,7870 nên độ chính xác của hai phương pháp này làkhác nhau Do phương sai (0,4857 > 0,1164) nên phương pháp thứhai có độ chính xác cao hơn phương pháp thứ nhất

Bài tập

Xác định hàm lượng P2O5 trong phân bón bằng phương pháp axitsunfuric cho kết quả là: 17,2; 16,3; 15,5 Khi áp dụng phương pháp xitrat chokết quả hàm lượng P2O5 như sau: 16.5; 15,9; 16,6; 15,8 So sánh độ chính xáccủa hai phương pháp phân tích này?

Đáp số: Không thể kết luận phương pháp xitrat cho kết quả ít sai biệt

hơn

Trang 27

1.4 BÀI TOÁN PHÂN TÍCH PHƯƠNG SAI (ANOVA)

Trong bất kỳ thí nghiệm nào, giá trị trung bình của các đại lượng quansát bị thay đổi do sự thay đổi của các yếu tố chủ chốt quyết định điều kiện thínghiệm và cả do các yếu tố ngẫu nhiên Việc nghiên cứu ảnh hưởng của yếu

tố này hay yếu tố khác tới sự thay đổi của giá trị trung bình được gọi là phân

tích phương sai.

1.4.1 Phân tích phương sai 1 nhân tố

Giả sử nhân tố A có k mức X1, X2 , … , Xk Mỗi mức có nj (j = 1, 2,…,k) số liệu đo và tuân theo phân phối chuẩn N(a,s2) như bảng dưới đây:

12

Với mức ý nghĩa , hãy kiểm định giả thiết :

H0: a1 = a2 =  = ak (A không ảnh hưởng tới trung bình đại lượng đo)

H1: “Tồn tại j1 ≠ j2 sao cho (A có ảnh hưởng tới trung bình đại lượngđo)

Giải Tính các đại lượng thống kê:

Tổng số quan sát:

Trung bình mẫu nhóm j ( j =1, , k ): với

Phương sai hiệu chỉnh nhóm j:

Tổng bình phương các độ lệch:

Tổng bình phương độ lệch của các nhóm so với :

Trang 28

Tiêu chuẩn Fisher đánh giá:

Nếu H0 đúng (A không ảnh hưởng tới trung bình) thì

Miền H1 đúng (A ảnh hưởng tới trung bình) thì

Bảng ANOVA

Nguồn sai số phương SSTổng bình Bậc tựdo df Bình phươngtrung bình

MS

Giá trịthống kê FYếu tố

Trang 29

3) Chọn các mục như hình dưới

4) Kết quả

Trang 30

Bài tập:

Sử dụng phân tích phương sai một yếu tố làm rõ ảnh hưởng của cácankyl halogen (yếu tố A) tới quá trình polymer hóa theo cơ chế gốc tới hiệusuất phản ứng (%), biết số liệu thí nghiệm của 5 loại ankyl halogen: CH3I(X1), C3H7I (X2), C4H9I (X3), C2H5Br (X4), C3H7Br (X5) được cho trong bảng

Đáp số: Các ankyl halogen có ảnh hưởng khác nhau tới hiệu suất phản ứng

1.4.2 Phân tích phương sai 2 nhân tố

Phân tích nhằm đánh giá sự ảnh hưởng của 2 nhân tố A và B trên cácgiá trị quan sát xij Giả sử nhân tố:

- Trung bình nhân tố cột bằng nhau;

- Trung bình nhân tố hàng bằng nhau;

- Không có sự tương tác giữa nhân tố cột và hàng

* Tiến hành tính toán theo bảng dưới đây:

B

Trang 32

a5

150110

7075

6054Hãy xét ảnh hưởng của phương pháp chiết suất và dung môi đến kết quảchiết suất chất X với  = 0,01

Giả thiết H0 :

* Trung bình của 3 phương pháp chiết suất bằng nhau;

* Trung bình của 5 dung môi bằng nhau;

* Không có sự tương tác giữa phương pháp chiế suất và dung môi

Chọn mục: Data\Data Analysis…\Anova: Two-Factor without replication

Chọn các mục như hình

Kết quả

Do FA < F4 ; 8 ; 0,99 = 7,006  Dung môi không ảnh hưởng đến kết quả chiết

Do FB > F2 ; 8 ; 0,99 = 8,649  Phương pháp ảnh hưởng đến kết quả chiết

1.4.3 Phân tích phương sai 2 nhân tố có lặp

Tương tự như bài toán phân tích phương sai 2 nhân tố không lặp, chỉkhác mỗi mức (ai , bj) đều có sự lặp lại r lần thí nghiệm và ta cần khảo sátthêm sự tương tác (interaction term) FAB giữa 2 nhân tố A và B

* Mẫu điều tra:

Trang 34

Khô Đầu mùaGiữa mùa 2,42,4 2,12,2 3,23,2

Dùng EXCEL

* Chọn mục: Data\Data Analysis…\Anova: Two Factor With Replication

* Chọn các mục như trong hình

Trang 35

Kết quả

FA > F1; 12; 0,95 = 4,7472: Hàm lượng saponin khác nhau theo mùa

FB > F2; 12 ; 0,95 = 3,8853: Hàm lượng saponin khác nhau theo miền

FAB < F2 ; 12 ; 0,95 = 3,8853: Chấp nhận H0 (không có tương tác giữa A vàB)

Vậy hàm lượng saponin trong dược liệu khác nhau theo mùa, theo miền

và không có sự tương tác giữa mùa và miền trên hàm lượng saponin

Bài tập:

Kết quả nghiên cứu ảnh hưởng của hai nhân tố dung môi (A) và loạiankyl halogen lên hiệu suất quá trình tổng hợp hữu cơ được cho trong bảng:

A

Trang 36

Đáp số: Dung môi và anky halogen đều ảnh hưởng tới hiệu suất tổng

hợp Hai yếu tố này có sự tương tác với nhau

1.5 PHÂN TÍCH TƯƠNG QUAN, HỒI QUY

Phân tích tương quan, hồi quy dùng để làm rõ và mô tả sự phụ thuộc

giữa các đại lượng ngẫu nhiên theo số liệu thực nghiệm

1.5.1 Phân tích tương quan

Để nghiên cứu thực nghiệm sự phụ thuộc của các đại lượng ngẫu nhiên

X và Y người ta tiến hành n thí nghiệm độc lập Kết quả thí nghiệm thứ i

được ký hiệu là (xi, yi), i = 1, 2, , n Khi biểu diễn trên hệ tọa độ x, y, ta sẽ

có các dạng như sau:

a) tương quan thuận (dương);

b) tương quan thuận chặt;

c) tương quan nghịch yếu;

d) không tương quan

Hệ số tương quan Spearman r:

Nếu R > 0 thì X, Y tương quan thuận;

Nếu R < 0 thì X, Y tương quan nghịch;

Ý nghĩa của hệ số tương quan r:

1 > |r| > 0,7  X và Y rất tương quan và có quan hệ hàm số bậc nhất; 0,7 > |r| > 0,5  X và Y khá tương quan;

Trang 37

1.5.2 Phân tích hồi quy

Đối với đặc trưng của dạng quan hệ khi nghiên cứu sự phụ thuộc tươngquan, người ta sử dụng phương trình hồi quy gần đúng Dạng của phươngtrình hồi quy phụ thuộc vào phương pháp gần đúng được sử dụng, trong đóphương pháp bình phương tối thiểu được sử dụng phổ biến

Trang 38

sao cho nó phản ánh một cách tốt nhất xu hướng phụ thuộc giữa và Ởđây, - giá trị bảng của đối số; - giá trị bảng của hàm số (đại lượng vật

lý phụ thuộc); - giá trị tính toán của hàm xấp xỉ; = vectơ tham số của hàm xấp xỉ

-Khi đó, bài toán xây dựng hàm hồi quy được đưa về việc tìm các hệ số sao cho hàm hồi quy mô tả tốt nhất sự phụ thuộc giữa các đại lượng cầnnghiên cứu Tiêu chuẩn để bảo đảm sự “mô tả tốt nhất” đó là tổng bìnhphương sai lệch giữa giá trị hàm đo đạc được với giá trị tính toán là nhỏ nhất(tiêu chuẩn của phương pháp bình phương tối thiểu), tức là:

(3.20)

Từ biểu thức (3.20) ta nhận thấy, f(a1, a2, , am) là hàm của m đối số a1,

a2, , am Điều kiện để hàm f đạt giá trị cực tiểu là:

(3.21)

Hệ phương trình (3.21) có thể là tuyến tính hoặc phi tuyến tùy thuộc vào

dạng của hàm y = Nếu phương trình hàm xấp xỉ y = là một

đa thức bậc m, tức là:

thì hệ phương trình (3.21) sẽ trở thành

Trang 39

Ta ký hiệu:

Biến đổi hệ phương trình sau khi ký hiệu lại ta được:

(3.22)Sau khi giải hệ phương trình tuyến tính trên, ta tìm được giá trị các hệ

số trong hàm hồi quy dạng đa thức a1, a2, …, am.

Để phản ánh mức độ “phù hợp” của hàm hồi quy với số liệu bảng,

người ta sử dụng hệ số tương hợp R2 (R-squared value) được xác định nhưsau:

; (3.23)

Hệ số này càng gần bằng 1 thì hàm hồi quy càng “phù hợp” với số liệu bảng

Chú ý: Nếu hàm hồi quy y = không có dạng đa thức như đã nêu

ở trên, ví dụ nó có dạng y = ba x thì bằng cách biến đổi đặt ẩn phụ, ta có thểđưa về dạng đa thức rồi thực hiện phép hồi quy như đã nêu ở trên Ví dụ, vớihàm dạng mũ như trên ta biến đổi nó bằng cách logarit hai vế, tức là:

lny = x.lna + lnb

Từ số liệu thực nghiệm ta tính được các giá trị logarit tự nhiên sẽ trở

thành mô hình hồi quy tuyến tính với biến phụ thuộc lny và biến độc lập x rồi

áp dụng phương pháp như đã mô tả ở trên

Để hồi quy tuyến tính cũng có thể được thực hiện bằng cách sử dụng góicông cụ Add-In là Analysis ToolPak Nếu Analysis ToolPak Add-In được càiđặt, trên Data Ribbon sẽ xuất hiện cửa sổ Data Analysis, kích chuột vào đó sẽxuất hiện cửa sổ như hình 3.9

Trang 40

Hình 3.9 Cửa sổ Data Analysis

Nếu trong đó không có menu Data Analysis thì cần vào Excel Option,vào mục Add-In để cài đặt Analysis ToolPak hoặc Analysis ToolPak (VBA)

Từ cửa sổ Data Analysis, chọn Regression trong hộp danh sách Cửa sổRegression Dialog Box (hình 3.10) sẽ xuất hiện Trong cửa sổ này, người

dùng sẽ nhập vào vùng dữ liệu (range) chứa biến phụ thuộc (y) và vùng dữ liệu chứa biến độc lập (x), cũng như có hay không hằng số nào đó có giá trị

bằng không (“Constant is Zero“), có hay không ô (cell) đầu tiên trong mỗivùng là nhãn, và mức độ tin cậy mô tả thể hiện trong báo cáo tổng hợp Sau

đó, người dùng chọn vùng để hiển thị bảng báo cáo tổng hợp (chỉ cần lựachọn một ô duy nhất cho vùng đó, ô này luôn nằm góc trên bên trái của vùnglựa chọn)

Hình 3.10 Cửa sổ Regression Dialog Box.

b) Hồi quy tuyến tính đơn

 Phương trình hồi quy tuyến tính: y = a + bx, ;

 Kiểm định hệ số a, b:

Ngày đăng: 22/01/2018, 23:15

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1) Nhập môn xử lý số liệu và kế hoạch hóa thực nghiệm, Lê Đức Ngọc, 2011 Khác
2) Trần Vĩnh Quý. Giáo trình hoá tin học. Nxb Đại học Sư phạm, Hà Nội, 2008 Khác
3) Đặng Ứng Vận. Giáo trình hóa tin cơ sở. Nxb Đại học Quốc gia Hà Nội, Hà Nội, 2007 Khác
4) Billo E. J. Excel for Scientists and Engineers – Numerical Methods. John Wiley &amp; Sons, New York, 2007 Khác
5) Robert de Levie. How to Use Excel in Analytical Chemistry and in General Scientific Data Analysis. Cambridge University Press, 2004 Khác
6) OriginLab Corporation. OriginPro 8 SR0 – Tutorial . Version 8.0. 2007 7) WinSim Inc. DESSIGN II ChemTran – General Reference Guide – Version 9.0. 2003 Khác
8) WinSim Inc. DESSIGN II – User Guide – Version 9.0. 2003 Khác
9) WinSim Inc. DESSIGN II – Unit Module Reference Guide – Version 9.0. 2003 Khác

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w