Kính chào quý thầy và các bạn Qua thời gian học tập, nghiên cứu môn học Quy hoạch xử lý số liệu thực nghiệm, chúng em đã tiếp thu và lãnh hội được nhiều kiến thức bổ ích về môn học này như: phân tích một mẫu, so sánh nhiều mẫu, so sánh nhiều giá trị trung bình, phân tích tương quan hồi qui đơn giản, hồi qui đa thức, phân tích hồi qui môn hình nhiều biến …. Qua đó, nhằm hiểu rõ hơn về môn học, nhóm chúng em tiến hành chọn một bảng số liệu thực tế về vấn đề nghiên cứu, kiểm tra nhiệt lượng phát sinh trong quá trình đông cứng của xi măng porland thông qua hàm lượng các thành phần hoá học. Trong quá trình học tập, nghiên cứu, tiến hành thực hiện tiểu luận sẽ không mắc phải những thiếu sót do thời gian ngắn, kiến thức hạn chế nên rất mong sự đóng góp ý kiến của thầy và các bạn để nhóm chúng em có thêm hiểu biết và điều chỉnh cho bài tiểu luận hoàn chỉnh hơn. Chúng em xin chân thành cám ơn thầy TS Châu Minh Quang đã hướng dẫn và tạo điều kiện tốt nhất cho chúng em hoàn thành môn học. Cám ơn sự hỗ trợ và giúp đỡ nhiệt tình của các bạn. Thân chào Mục lục 1 Phân tích một mẫu trang 05 2 So sánh nhiều mẫu trang 06 3 So sánh nhiều giá trị trung bình trang 08 4 Phân tích tương quan hồi quy đơn giản trang 09 5 Hồi quy đa thức trang 17 6 Phân tích hồi quy mô hình nhiều biến trang 21 BÀI TIỂU LUẬN Nghiên cứu kiểm tra nhiệt lượng phát sinh trong quá trình đông cứng của xi măng Portland. Nhiệt lượng này được giả định là một hàm của các thành phần hóa học, gồm các biến sau đây: X1: số lượng tricalcium silicate (3CaO • SiO2) X2: số lượng tetracalcium aluminoferrite (CaO)4 • Al2O3 • Fe2O3 X3: số lượng dicalcium silicate (2CaO • SiO2)
Trang 1Lời nói đầu
Kính chào quý thầy và các bạn! Qua thời gian học tập, nghiên cứu môn học Quy hoạch xử lý số liệu thực nghiệm, chúng em đã tiếp thu và lãnh hội được nhiều kiến
thức bổ ích về môn học này như: phân tích một mẫu, so sánh nhiều mẫu, so sánhnhiều giá trị trung bình, phân tích tương quan hồi qui đơn giản, hồi qui đa thức, phântích hồi qui môn hình nhiều biến …
Qua đó, nhằm hiểu rõ hơn về môn học, nhóm chúng em tiến hành chọn một bảng số
liệu thực tế về vấn đề nghiên cứu, kiểm tra nhiệt lượng phát sinh trong quá trình đông cứng của xi măng porland thông qua hàm lượng các thành phần hoá học.
Trong quá trình học tập, nghiên cứu, tiến hành thực hiện tiểu luận sẽ không mắcphải những thiếu sót do thời gian ngắn, kiến thức hạn chế nên rất mong sự đóng góp
ý kiến của thầy và các bạn để nhóm chúng em có thêm hiểu biết và điều chỉnh cho bàitiểu luận hoàn chỉnh hơn
Chúng em xin chân thành cám ơn thầy TS Châu Minh Quang đã hướng dẫn và tạođiều kiện tốt nhất cho chúng em hoàn thành môn học Cám ơn sự hỗ trợ và giúp đỡnhiệt tình của các bạn
Thân chào!
Trang 21/ Phân tích một mẫu trang 05
2/ So sánh nhiều mẫu trang 06
3/ So sánh nhiều giá trị trung bình trang 08
4/ Phân tích tương quan hồi quy đơn giản trang 09
5/ Hồi quy đa thức trang 17
6/ Phân tích hồi quy mô hình nhiều biến trang 21
BÀI TIỂU LUẬN
Trang 3Nghiên cứu kiểm tra nhiệt lượng phát sinh trong quá trình đông cứng của xi măng Portland Nhiệt lượng này được giả định là một hàm của các thành phần hóa học, gồm các biến sau đây:
X1: số lượng tricalcium silicate (3CaO · SiO2 )
X2: số lượng tetracalcium aluminoferrite [(CaO)4 · Al 2 O 3 · Fe 2 O 3 ]
X3: số lượng dicalcium silicate (2CaO · SiO2 )
Y : nhiệt lượng toả ra tính bằng calo trên mỗi gram xi măng.
Trang 424 9,1 6,2 7,2 20
1/ PHÂN TÍCH MỘT MẪU
Chọn mẫu: X1: số lượng tricalcium silicate (3CaO · SiO 2 )
Trang 5Bảng này hiển thị tóm tắt số liệu thống kê của 2 mẫu thí nghiệm Các số liệu hiểnthị trong việc phân tích này dùng để kiểm tra xem liệu có sự khác biệt lớn nào ở haimẫu thí nghiệm hay không là hết sức quan trọng Điều quan trọng ở đây là độ lệchchuẩn và độ nhọn để xác định xem các mẫu thí nghiệm có phân bố bình thường hay
ko Những giá trị nằm ngoài khoảng [-2;2] sẽ được bỏ đi Sau khi loại bỏ, những giátrị của độ lệch chuẩn và độ nhọn đã ở trong khoảng cho phép
Biểu đồ biểu thị mật độ phân phối
Trang 6The StatAdvisor
Tùy chọn này thực hiện một lập bảng tần số bằng cách chia khoảng CDN vàokhoảng chiều rộng bằng nhau và đếm số lượng các giá trị dữ liệu trong mỗi khoảngthời gian Các tần số hiển thị số của các giá trị dữ liệu trong mỗi khoảng thời gian,trong khi tần suất tương đối cho thấy tỷ lệ trong mỗi khoảng thời gian Bạn có thểthay đổi định nghĩa của khoảng thời gian bằng cách nhấn nút chuột thay thế và chọnPane Options Bạn có thể xem kết quả của các bảng biểu đồ bằng cách chọn tần sốHistogram từ danh sách các đồ họa Options
2/ SO SÁNH NHIỀU MẪU
So sánh 2 mẫu thí nghiệm – X1 và X3
Mẫu X1: số lượng tricalcium silicate (3CaO · SiO 2 )
Mẫu X3: số lượng dicalcium silicate (2CaO · SiO 2 )
Mẫu X1 gồm 24 giá trị khác nhau từ 5,6 đến 13,8
Mẫu X3 gồm 24 giá trị khác nhau từ 6,2 đến 16,7
Quy trình này được thiết kế để so sánh 2 mẫu thí nghiệm của dữ liệu Nó sẽ hiển thị
ra những số liệu thống kê và những đồ thị minh họa cho mỗi mẫu thí nghiệm, và nó
sẽ kiểm nghiệm có sự khác nhau giữa 2 mẫu thí nghiệm hay không
Trang 7Bảng này hiển thị tóm tắt số liệu thống kê của 2 mẫu thí nghiệm Các số liệu hiểnthị trong việc phân tích này dùng để kiểm tra xem liệu có sự khác biệt lớn nào ở haimẫu thí nghiệm hay không là hết sức quan trọng Điều quan trọng ở đây là độ lệchchuẩn và độ nhọn để xác định xem các mẫu thí nghiệm có phân bố bình thường hay
ko Những giá trị nằm ngoài khoảng [-2;2] sẽ được bỏ đi Sau khi loại bỏ, những giátrị của độ lệch chuẩn và độ nhọn đã ở trong khoảng cho phép
Biểu đồ biểu thị mật độ phân phối
Kết luận: Từ bảng thống kê số liệu và biểu đồ phân phối cho thấy:
- Độ nhọn và độ lệch chuẩn nằm ngoài khoảng [-2;2]
- Số liệu được chọn là phù hợp
So sánh các tiêu chuẩn độ lệch
Ý nghĩa của việc so sánh
95% khoảng tin cậy của X1: 9,8625 +/- 1,08609 [8,77641; 10,9486]
95% khoảng tin cậy của X3: 11,1792 +/- 1,11268 [10,0665; 12,2919]
95% khoảng tin cậy sự khác nhau giữa những ý nghĩa giả thiết phương sai bằng nhau:-1,31667 +/- 1,51297 [-2,82963; 0,196301]
Biểu đồ biểu thị mật độ phân phối
Đồ thị độ nhọn
Trang 8Đồ thị box và whisker
3/ SO SÁNH NHIỀU GIÁ TRỊ TRUNG BÌNH
Đầu tiên ta so sánh 2 mẫu X1 và X2
X1: số lượng tricalcium silicate (3CaO · SiO2 )
X2: số lượng tetracalcium aluminoferrite [(CaO)4 · Al 2 O 3 · Fe 2 O 3 ]
Trang 9Đầu tiên ta viết phương trình của X1 và Y Ta được:
Biến số lệ thuộc Y : nhiệt lượng toả ra tính bằng calo trên mỗi gram xi măng.
Biến số độc lập X1: số lượng tricalcium silicate (3CaO · SiO 2 )
Phương trình hồi quy có dạng: Y = a + b*X
KẾT LUẬN:
Phương trình hồi quy có dạng:
Vì giá trị P = 0,0000 nên phương trình có ý nghĩa thống kê
Bảng so sánh các mẫu thay thế:
Trang 10Bảng này thể hiện:
Double reciprocal có giá trị R2 = 89,72 % là chính xác nhất
Các đồ thị minh họa:
Trang 12Tương tự: ta viết phương trình của X2 và Y Ta được:
Biến số lệ thuộc: Y
Biến số độc lập: X2
Phương trình hồi quy có dạng: Y = a + b*X
KẾT LUẬN:
Phương trình hồi quy có dạng:
Vì giá trị P = 0,0004 nên phương trình có ý nghĩa thống kê
Bảng so sánh các mẫu thay thế:
Trang 13Bảng này thể hiện:
Exponential có giá trị R2 = 49,46 % là chính xác nhất
Các đồ thị minh họa:
Trang 15Tương tự: ta viết phương trình của X3 và Y Ta được:
Biến số lệ thuộc: Y
Biến số độc lập: X3
Phương trình hồi quy có dạng: Y = a + b*X
KẾT LUẬN:
Phương trình hồi quy có dạng:
Vì giá trị P = 0,0000 nên phương trình có ý nghĩa thống kê
Trang 16Bảng này thể hiện:
Squared-X có giá trị R2 = 65,86 % là chính xác nhất
Các đồ thị minh họa:
Trang 185/ HỒI QUY ĐA THỨC
Đầu tiên xét X1 và Y
Biến số lệ thuộc Y : nhiệt lượng toả ra tính bằng calo trên mỗi gram xi măng.
Biến số độc lập X1: số lượng tricalcium silicate (3CaO · SiO 2 )
Nhấn Improve – Regression Analyss – One factor – Polynominal Regression
Ta được hộp thoại Polynominal Regression:
Nhấn OK để hiển thị hộp thoại Polinominal Regression Analysis
Trang 19Phương trình có dạng:
Các giá trị P ứng với các hệ số hồi quy > 0,01
Mô hình không phù hợp để mô tả mối liên hệ giữa X1 và Y
Tương tự ta xét X2 và Y
Trang 20Các giá trị P ứng với các hệ số hồi quy > 0,01
Mô hình không phù hợp để mô tả mối liên hệ giữa X2 và Y
Tương tự ta xét X3 và Y
Phương trình có dạng:
Các giá trị P ứng với các hệ số hồi quy > 0,01
Mô hình không phù hợp để mô tả mối liên hệ giữa X3 và Y
Trang 21Lựa chọn biến số ảnh hưởng: Improve/Regression Analysis/Multiple
Factors/Regression Model Selection Trong hộp thoại chọn biến phụ thuộc và các
biến độc lập thăm dò, thông thường hàm Power mô phỏng tốt quan hệ phi tuyến, do
đó nên lấy log các biến số phụ thuộc và độc lập
Trang 22Kết luận:
Kết quả thăm dò tìm biến độc lập ảnh hưởng cho thấy theo tiêu chuẩn bé
nhất Cp và R 2 cao nhất thì cả 3 biến số X1 , X2 và X3 tham gia vào mô hình là tốt
nhất (Cp gần bằng số biến số là 4 (3 biến số + sai số của mô hình), đồng thời và
Trang 23Ta được bảng số liệu:
Phương trình có dạng:
Trang 24Ta được bảng số liệu:
Phương trình có dạng:
Mô hình phi tuyến tổ hợp biến:
Trang 25Ta được bảng số liệu:
Phương trình có dạng:
Với kết quả thử nghiệm 3 loại mô hình trên cho thấy trong trường hợp này
mô hình phi tuyến với đa biến số đơn là tốt nhất với R 2 cao nhất, các tham số có
P< 0.05, chỉ số MAE bé nhất và biến động residuals rải đều quanh giá trị ước lượng.
Vì vậy mô hình được lựa chọn là:
Trang 27Kết qủa mô hình có trọng số tuy có R2 không cao hơn mô hình bình thường, tuynhiên biến động Residuals được cải thiện rõ rệt, biến động quanh trục y = 0 vàtrong pham vi sai số ±2 Trong thiết lập mô hình hồi quy, hệ số xác định R2 caonhất chưa phải là mô hình tốt nhất, trong trường hợp này R2 của mô hình có trọng
số thấp hơn một ít, tuy nhiên biến động sai số được cân bằng và cải thiện tốt hơn
Do đó mô hình có trọng số được lựa chọn là tối ưu
Phương trình tối ưu có trọng số: