Trong mọi ngành khoa học thực nghiệm, mọi kết quả bằng số đạt được trong thí nghiệm, hay nói chung trong thực tế đều là giá trị của một biến ngẫu nhiên, phụ thuộc vào nhiều nhân tố nội sinh và ngoại sinh ở các tổ hợp mức độ hay tổ hợp giá trị khác nhau của các nhân tố đó, mà để ước lượng được quy luật phụ thuộc bằng phân tích độ biến động người ta sử dụng phương pháp thống kê toán học.
CÁC KIẾN THỨC CƠ BẢN VỀ BỐ TRÍ THÍ NGHIỆM
Các khái niệm thống kê
Tổng thể là tập hợp các đơn vị thuộc hiện tượng nghiên cứu, cần được quan sát và phân tích theo các đặc trưng nhất định Các phần tử trong tổng thể được gọi là đơn vị tổng thể, là nguồn thông tin ban đầu cần thu thập Khi xác định tổng thể thống kê, cần giới hạn không chỉ về thực thể mà còn về thời gian và không gian nghiên cứu.
Tổng thể thường rất lớn và việc quan sát toàn bộ có thể không khả thi về thời gian, công sức và tài chính Do đó, chúng ta chỉ cần chọn một số đơn vị từ tổng thể thông qua phương pháp lấy mẫu, từ đó suy luận về các tham số và quy luật của tổng thể Các phần tử được chọn để nghiên cứu được gọi là mẫu, và số lượng phần tử này được gọi là kích thước mẫu.
1.1.2 Ước lượng các tham số đặc trưng của mẫu
Trong nghiên cứu thực nghiệm, các nhà nghiên cứu không có giá trị thực của các đặc trưng số của đại lượng ngẫu nhiên, do đó họ phải ước lượng các đặc trưng này dựa trên kết quả từ các thí nghiệm Hơn nữa, số lượng thí nghiệm thường bị hạn chế, khiến cho những ước lượng này chỉ được coi là ước lượng mẫu.
Kỳ vọng toán học m x được ước lượng bằng giá trị trung bình:
� , Trong đó: (1.1) x i - số đo của đại lượng x ở phép đo thứ i (mẫu thứ i ) n - số lượng mẫu
1.1.2.2 Ước lượng phương sai và phương sai tái hiện
Phương sai được ước lượng bằng phương sai mẫu:
Để đánh giá độ chính xác của các phương pháp thực nghiệm, cần thực hiện nhiều thí nghiệm lặp lại Việc này giúp xác định sai số tái hiện của phép đo, đồng thời hạn chế các sai số không kiểm tra được.
Nếu thực nghiệm n thí nghiệm song song với các giá trị đo được là
Và sai số thí nghiệm là s th s th 2
Để phân tích m mẫu, thực hiện một số thí nghiệm song song khác nhau cho mỗi mẫu, từ n1 đến n2m Các phương sai tính được lần lượt là s1, s2, , sm Phương sai tái hiện được tính theo công thức cụ thể.
(1.4) f i là bậc tự do của những thí nghiệm song song thứ i
1.1.2.3 Khoảng tin cậy và xác suất tin cậy
Các đặc trưng của mẫu là các ước lượng cho các đặc trưng số của tập chính khi số lượng mẫu đủ lớn Khi số lượng mẫu hạn chế, cần đánh giá độ chính xác của các ước lượng Nghiên cứu này tập trung vào việc đánh giá độ chính xác của giá trị trung bình thay cho kỳ vọng, thông qua việc xem xét hiệu x̄ - x.
Một trong những yếu tố quan trọng để đánh giá sự hoàn thiện của quá trình kỹ thuật là mức độ ổn định của các kết quả khi thực hiện thí nghiệm nhiều lần trong điều kiện tối ưu.
Việc xác định các chỉ tiêu về chất lượng sản phẩm và kinh tế kỹ thuật thường bị giới hạn trong những biên xác định cụ thể Tuy nhiên, việc tìm ra giá trị của các biên này qua số lượng thí nghiệm hạn chế là một thách thức lớn Để khắc phục khó khăn này, có thể áp dụng thống kê toán học, bao gồm khoảng tin cậy và xác suất tin cậy, nhằm nâng cao độ chính xác trong các kết quả nghiên cứu.
Cho xác suất đủ lớn sao cho sự kiện với xác suất có thể xem là chắc chắn và tìm giá trị f thỏa mãn :P x m ( x � ).
Miền giá trị thực tế có thể có sai số khi thay m x bằng x, được ký hiệu là εβ Xác suất tin cậy β thể hiện độ chính xác của ước lượng, thường được chọn là 0.90, 0.95 hoặc 0.99 Khoảng Iβ = x ± εβ được gọi là khoảng tin cậy.
Các điểm x ' x , " x x là những điểm biên của khoảng tin cậy.
càng lớn thì càng lớn.
Với đại lượng ngẫu nhiên có phân phối chuẩn:
( n là số lượng mẫu) Đặt x k
Khi xác định giá trị của hàm Laplace, ta có thể suy ra khoảng tin cậy x k−βσ x ≤ m x x k+βσ x, trong đó x phụ thuộc vào số thí nghiệm song song n Đặc biệt, xác suất tin cậy εβ cũng phụ thuộc vào n; khi n tăng, xác suất tin cậy sẽ gia tăng.
Rõ ràng những sai số có giá trị tuyệt đối lớn hơn chỉ xuất hiện với xác suất nhỏ: p 1 ; p được gọi là mức ý nghĩa, biểu diễn theo phần trăm.
1.1.3 Kiểm định giả thiết thống kê
Giả thiết thống kê là những giả thiết liên quan đến sự phân bố giá trị hoặc tính chất của một đại lượng ngẫu nhiên Trong nghiên cứu khoa học, việc đưa ra và kiểm định các giả thiết này thông qua thực nghiệm là rất quan trọng để giải quyết nhiều vấn đề.
Kiểm định giả thiết thống kê là quá trình so sánh các chỉ tiêu thống kê, gọi là tiêu chuẩn kiểm định, được tính toán từ số liệu thực nghiệm với các chỉ tiêu được đề xuất trong giả thiết Để thực hiện kiểm định, trước tiên cần xác định một giả thiết cụ thể.
Giả thiết H 0, được gọi là giả thiết không theo thuật ngữ của Fisher, cần được kiểm định thông qua một bộ quy tắc xác định phương pháp kiểm định Để chấp nhận hoặc bác bỏ giả thiết H 0, mức ý nghĩa phải được xác định, với xác suất tin cậy tương ứng là 1 Dựa vào xác suất tin cậy và giả thiết phân phối của ước lượng, ta xác định các biên của khoảng tin cậy /2 và u 1 /2 , thường đối xứng với 0 Các giá trị u /2 và u 1 /2 được gọi là giá trị tới hạn, trong khi các giá trị u u /2 và u u 1 /2 tạo thành miền tới hạn của giả thiết H 0 Nếu giá trị u tính từ mẫu rơi vào miền tới hạn, giả thiết H 0 sẽ bị bác bỏ, và trong trường hợp chỉ có một đối thiết H, việc loại bỏ H 0 đồng nghĩa với việc chấp nhận H.
1.1.3.1 Kiểm định sự đồng nhất của hai phương sai
Trong nghiên cứu thống kê, khi có hai mẫu I và II với kích thước lần lượt là n1 và n2, vấn đề cần giải quyết là kiểm định xem hai mẫu này có được lấy từ các tập hợp có cùng phương sai hay không Việc xác định phương sai đồng nhất giữa hai mẫu là rất quan trọng trong nhiều phân tích thống kê, giúp đảm bảo tính chính xác và độ tin cậy của các kết quả nghiên cứu.
Tiêu chuẩn kiểm định: Muốn kiểm định hai phương sai, người ta dùng tiêu chuẩn F - tiêu chuẩn Fisher Với:
Tính theo các số đo của mẫu thứ I và mẫu thứ II với giá trị tra bảng
Khi dùng tiêu chuẩn một phía thì đối thiết H: 1 2 2 2 , Nếu
F F f thì chấp nhận giả thiết H 0 , ngược lại H 0 bị bác bỏ.
Khi dùng tiêu chuẩn hai phía thì đối thiết H: 1 2 � 2 2 , Nếu
F F f thì chấp nhận giả thiết H 0
1.1.3.2 So sánh hai giá trị trung bình
Khi so sánh hai giá trị trung bình nhận được theo mẫu lấy từ hai tập chính phân phối chuẩn, người ta dùng tiêu chuẩn t Giả sử hai mẫu
1, , , ; , , ,2 n 1 1 2 n 2 x x x y y y , lấy từ hai tập phân phối chuẩn với các đặc trưng số tương ứng: m x , , , x 2 m y y 2 từ các mẫu ta nhận được các ước lượng: x, s x 2 ,y,
2 s y Cần kiểm định giả thiết không.
Với điều kiện x 2 y 2 2 , ở mức ý nghĩa phải tính:
So sánh với giá trị tra bảng t f ( ): n n 1 2 2
Nếu t t f� ( ) thì H 0 được chấp nhận.
Khi x 2 � y 2 thì dùng tiêu chuẩn t gần đúng.
Nếu t t f� ( ) thì H 0 được chấp nhận.
1.1.4 Hệ số tương quan và hồi quy tuyến tính
Công thức: Hệ số tương quan của hai biến ngẫu nhiên X và Y, ký hiệu xy được xác định bởi công thức : ( , )
V X , V Y( )lần lượt là phương sai của hai biến ngẫu nhiên X và Y
Cov X Y là hiệp phương sai giữa hai biến ngẫu nhiên X và Yvà dược xác định bởi công thức:
Cov X Y E X E X Y E Y�� ��E XY E X E Y Ý nghĩa: Hệ số tương quan của hai biến là đại lượng thể hiện chiều hướng và độ mạnh của mối quan hệ tuyến tính giữa hai biến đó xy càng gần
1 thì mối quan hệ tuyến tính càng mạnh và xy càng gần 0 thì mối quan hệ tuyến tính càng yếu.
Một số khái niệm về bố trí thí nghiệm
1.2.1 Nguyên tắc bố trí thí nghiệm
Sự lặp lại trong nghiên cứu là cần thiết để đảm bảo tính chính xác và độ tin cậy của kết quả Việc lặp lại các ứng dụng nghiên cứu trên nhiều đơn vị thí nghiệm giúp ước lượng hiệu quả một cách đáng tin cậy hơn và cung cấp thông tin về biến đổi giữa các đơn vị Điều này cho phép đánh giá các phương pháp nghiên cứu khác nhau, đồng thời chỉ ra độ chính xác và hiệu quả của các ước tính Trong những trường hợp nghiên cứu đặc biệt, việc tăng cường sự lặp lại có thể mang lại lợi ích lớn, trong khi đó, giảm sự lặp lại có thể được áp dụng khi nguồn lực cho phương pháp nghiên cứu là hạn chế và tốn kém, như trong trường hợp sử dụng hạt giống cho giống mới.
Ngẫu nhiên hóa là yếu tố quan trọng để đảm bảo phân bổ công bằng các phương pháp nghiên cứu cho các đơn vị, giúp bảo vệ chống lại thiên vị và xử lý sự biến đổi tự nhiên giữa các đơn vị thí nghiệm Trong các trường hợp đơn giản, sự ngẫu nhiên yêu cầu mỗi hoán vị của tập hợp phương pháp nghiên cứu có xác suất xảy ra như nhau, đảm bảo rằng mỗi nghiên cứu có khả năng áp dụng đồng đều cho cả các đơn vị 'tốt' và 'xấu'.
Chia khối là phương pháp nhằm tạo ra sự đồng nhất trong các đơn vị thử nghiệm để so sánh các phương pháp nghiên cứu, từ đó giảm thiểu biến đổi nền và tăng độ chính xác trong việc phát hiện sự khác biệt nhỏ giữa các xử lý Khi các đơn vị thử nghiệm có tính đa dạng, khả năng phát hiện sự khác biệt sẽ giảm Việc sử dụng các đơn vị đồng nhất giúp tăng cường khả năng so sánh giữa các phương pháp nghiên cứu Tuy nhiên, không phải lúc nào cũng có thể đạt được sự đồng nhất hoàn toàn cho tất cả các đơn vị thử nghiệm Trong trường hợp này, có thể xác định các nhóm đơn vị thử nghiệm tương đối đồng nhất, mặc dù vẫn có sự khác biệt trong phản ứng giữa các nhóm Những nhóm này có thể được coi là khối trong thiết kế thí nghiệm Chia khối các đơn vị theo cách này giúp tăng độ chính xác của thử nghiệm khi so sánh các phương pháp nghiên cứu trong khối đối với một nhóm đồng đều hơn Do đó, chia khối được coi là một phương pháp kiểm soát sự thay đổi, còn được biết đến như là kiểm soát địa phương.
1.2.2 Xác định số thí nghiệm lập
Để xác định số thí nghiệm tối thiểu cần lặp lại trong mỗi thực nghiệm, giá trị trung bình x theo mẫu phải khác với kỳ vọng toán không vượt quá một đại lượng cho trước là Để giải quyết bài toán này, cần tính độ lệch bình phương trung bình s², từ đó xác định giá trị n.
(1.23) Đại lượng t tìm theo bảng phụ thuộc vào hệ số q và bậc tự do f Nếu số thí nghiệm > 120 thì thay vì t ta xác định như sau: q 0,2 0,1 0,05 0,01 0,005
Nếu biểu diễn giá trị thực là a, kết quả quan sát là X, thì độ lệch giữa giá trị thực và số đo được gọi là sai số quan sát X.
Mỗi kết quả đo lường đều là một kết quả ngẫu nhiên, dẫn đến việc sai số quan sát cũng mang tính chất ngẫu nhiên Sai số đo lường được phân loại thành ba loại chính.
Sai số thô là loại sai số xảy ra khi vi phạm các điều kiện cơ bản trong quá trình đo lường, dẫn đến kết quả đo khác biệt rõ rệt so với các lần đo khác Chính vì vậy, sai số thô thường dễ dàng được phát hiện và loại bỏ.
Sai số hệ thống là loại sai số không thay đổi qua các lần đo và tuân theo quy luật nhất định Để loại bỏ sai số này, cần thực hiện một nghiên cứu chuyên sâu; khi đã xác định được nguyên nhân, có thể khắc phục bằng cách áp dụng các hiệu chỉnh phù hợp.
Sai số ngẫu nhiên là những sai số còn lại trong phép đo sau khi đã loại bỏ sai số hệ thống và sai số thô Những sai số này thường có phân phối đối xứng xung quanh giá trị không Chúng ta chỉ tập trung vào sai số ngẫu nhiên vì tầm quan trọng của chúng trong việc phân tích và cải thiện độ chính xác của các phép đo.
1.2.4 Định luật cộng sai số
Các đại lượng ngẫu nhiên độc lập có tính chất cộng phương sai.
Giả sử X i i ( 1, ) n là những đại lượng ngẫu nhiên, a i i ( 1, ) n là những đại lượng không ngẫu nhiên và 1 1 2 2
Phương sai s 2 Z của Z được tính như sau:
Nếu các đại lượng X X 1, 2, X n được xem như kết quả của n quan sát độc lập của cùng một đại lượng ngẫu nhiên X thì
1.2.5 Quá trình nghiên cứu nhờ bố trí thí nghiệm
1.2.5.1 Phỏng đoán Đây là bước định hướng cho quá trình nghiên cứu, đòi hỏi người nghiên cứu có kiến thức nền tảng về lĩnh vực nghiên cứu để phỏng đoán một loạt hoạt động như:
Để tối ưu hóa quy trình, trước tiên cần xác định mục tiêu và vấn đề nghiên cứu rõ ràng Điều này bao gồm việc xác định biến đáp ứng cần phân tích, từ đó tìm ra phương án tối ưu, cũng như các nhân tố cần kiểm soát và thực nghiệm.
Xác định các loại phép đo, các mức độ cần thực nghiệm.
1.2.5.2 Lựa chọn mô hình thống kê
Mô hình thống kê cần được xây dựng dựa trên mối quan hệ giữa các biến và phân phối lỗi, phụ thuộc vào mục tiêu nghiên cứu, số lượng và mức độ của các nhân tố, cũng như phương pháp đo lường và thực nghiệm Các loại mô hình có thể bao gồm mô hình tuyến tính, mô hình bậc hai và mô hình tác động ngẫu nhiên.
Tiến hành xây dựng bố trí thí nghiệm dựa trên mục tiêu và mô hình thống kê đã chọn, sau đó thực hiện các thí nghiệm dựa trên các nhân tố và phép đo đã xác định Cần đảm bảo rằng mọi yếu tố được kiểm soát chặt chẽ để thu được kết quả chính xác và đáng tin cậy.
Dựa trên dữ liệu thực nghiệm, người nghiên cứu cần phân tích số liệu để đánh giá tính phù hợp của mô hình và tìm ra giải pháp tối ưu cho mục tiêu nghiên cứu Quá trình này thường bao gồm các bước cụ thể.
Đánh giá giả thuyết thống kê tùy theo mô hình lựa chọn (sẽ được trình bày trong chương 2 và chương 3)
Kiểm định tính phù hợp của mô hình như: ý nghĩa của hệ số hồi quy, tính tương thích của phương trình hồi quy.
Tối ưu hóa mô hình nhờ sự hỗ trợ của phần mềm MODDE 5.0,
1.2.5.5 Kiểm nghiệm phương án tối ưu
Khi xác định phương án tối ưu, người nghiên cứu cần tiến hành kiểm nghiệm các nghiệm thức để đánh giá và kết luận về độ chính xác của quá trình nghiên cứu.
MỘT SỐ BỐ TRÍ THÍ NGHIỆM
Bố trí thí nghiệm nhân tố toàn phần dạng 2 k
2.1.1 Giới thiệu mô hình bố trí thí nghiệm nhân tố toàn phần dạng 2 k
Bố trí nhân tố 2 k là bố trí k nhân tố, mỗi nhân tố có 2 mức độ X 1min và
X 1max Để tiện cho việc tính toán ta chuyển từ nhân tố tự nhiên sang nhân tố mã hóa bằng phép biến đổi: ax min ax min
Phân tích tác động của k nhân tố X1, X2, , Xk, với mỗi nhân tố có hai mức độ, được thực hiện thông qua mô hình thống kê bố trí nhân tố 2k Mô hình này bao gồm k tác động chính, C(k, 2) tác động tương tác giữa hai nhân tố, C(k, 3) tác động tương tác giữa ba nhân tố, và tiếp tục cho đến C(k, k) tác động tương tác giữa k nhân tố Tổng cộng, có 2k tác động, bao gồm cả tác động trung bình.
Bảng 2.1 Giá trị thí nghiệm mã hóa của bố trí thí nghiệm nhân tố 2 2
Nhân tố mã hóa Kết quả thực nghiệm x 0 x 1 x 2 x x 1 2 y
Bảng 2.2 Giá trị thí nghiệm mã hóa của bố trí thí nghiệm nhân tố 2 3
Nhân tố mã hóa Giá trị thực nghiệm x 0 x 1 x 2 x 3 x x 1 2 x x 1 3 x x 2 3 x x x 1 2 3 y
Bố trí nhân tố 2 k có các đặc trưng sau:
Tính đối xứng và tâm quy hoạch: Tổng đại số các phần tử cột của bất kỳ nhân tố nào đều bằng 0:
� ( i 1, , k ; N là số thí nghiệm bố trí) (2.2)
Tính chuẩn hóa: Tổng bình phương các phần tử cột của một nhân tố bất kỳ bằng số thí nghiệm bố trí:
� ( i 1, , k ; N là số thí nghiệm bố trí) (2.3)
Tính trực giao: Tổng của tích 2 cột bất kỳ trong ma trận quy hoạch bằng 0: ij uj
� ( i u i u � , , 1, , k ; N là số thí nghiệm bố trí) (2.4)
Mô hình hồi quy tuyến tính của thiết kế nhân tố 2 k là:
Bằng phương pháp bình phương nhỏ nhất ta được mô hình:
2.1.2 Tìm hệ số hồi quy bố trí thí nghiệm nhân tố toàn phần dạng 2 k
Bài toán nghiên cứu tập trung vào hai nhân tố X1 và X2, mỗi nhân tố có hai mức độ: thấp và cao, với n quan sát cho mỗi mức Để đảm bảo tính chính xác, tổng thể cần thỏa mãn điều kiện phân phối chuẩn và phương sai giữa các nhóm nghiên cứu phải đồng nhất Nghiên cứu sẽ phân tích tác động riêng lẻ của từng nhân tố X1 và X2, cũng như tác động đồng thời của cả hai nhân tố lên hiện tượng được khảo sát.
Bảng 2.3 Dữ liệu tự nhiên của bố trí nhân nhân tố 2 2
Giá trị nhân tố tự nhiên Kết quả thực nghiệm
Thực hiện phép biến đổi:
Mô hình hồi quy tuyến tính của thiết kế nhân tố 2 2 là:
0 1 1 2 2 12 1 2 y x x x x Bằng phương pháp bình phương nhỏ nhất ta được mô hình:
0 1 1 2 2 12 1 2 y � � � x � x � x x (2.6) Để dễ tính toán ta viết mô hình hồi quy lại như sau:
Theo phương pháp bình phương nhỏ nhất, các hệ số trong mô hình hồi quy được xác định:
Quay lại mô hình hồi quy biểu thức (2.6)
2.1.3 Kiểm định ý nghĩa phương trình hồi quy và tính thích hợp của phương trình hồi quy Để kiểm định tính ý nghĩa của các hệ số hồi quy và sự tương thích của phương trình hồi quy với thực nghiệm ta tìm phương sai tái hiện s th 2
Ma trận (X X T)1 là ma trận đường chéo, cho thấy rằng các hệ số không có ý nghĩa loại khỏi mô hình sẽ không ảnh hưởng đến các hệ số còn lại Các hệ số được chọn là những ước lượng không lẫn lộn của các hệ số chính tương ứng, trong đó j là ước lượng của b j.
Giá trị của các hệ số b j phản ánh mức độ đóng góp của nhân tố thứ j vào biến đáp ứng Các phần tử trên đường chéo chính của ma trận hiệp biến là bằng nhau, do đó mọi hệ số trong phương trình được xác định với độ chính xác cao.
Quá trình tính toán được thực hiện:
Tính giá trị trung bình:
Tính phương sai ở mỗi thí nghiệm:
Kiểm định sự đồng nhất của phương sai theo tiêu chuẩn Cochran:
So sánh giá trị tính được với giá trị bảng G 1 ( , )f f 1 2 , với mức ý nghĩa
Nếu G G 1 ( , )f f 1 2 ta có phương sai đồng nhất.
Tính phương sai tái hiện:
Tính các hệ số hồi quy:
Vì y nhận được theo mẫu có số lượng m nên
/ y th m s s , do đó; s b 2 j s th Nm 2 /
Kiểm định ý nghĩa của hệ số hồi quy theo tiêu chuẩn t (tiêu chuẩn Student). j j j b t b
Nếu t j t f ( ), f N m ( 1)thì b j bị loại khỏi phương trình hồi quy.
Kiểm định sự tương thích của mô hình hồi quy:
Với p là số hệ số có ý nghĩa trong phương trình hồi quy.
Nếu FF 1 ( , )f f 1 2 thì phương trình hồi quy tương thích với thực nghiệm Trong đó f 1 N p f, 2 N m( 1).
Nếu F F 1 ( , )f f 1 2 thì phương trình hồi quy không tương thích với thực nghiệm và phải tăng bậc của đa thức.
Nghiên cứu tác động của chất phản ứng (x1) và chất xúc tác (x2) lên năng suất của quá trình hóa học cho thấy hai mức độ của chất phản ứng là 15% và 25% Hiệu quả của chất xúc tác được phân loại thành hai mức độ: cao với 2 pounds và thấp với 1 pound Thí nghiệm được thực hiện ba lần để thu thập dữ liệu.
Bảng 2.4 Mô hình bố trí thí nghiệm và kết quả thực nghiệm
Nhân tố Kết quả thực nghiệm x 1 x 2 y j 1 y j 2 y j 3
Ví dụ 2.1 sẽ được tính toán theo hai phương pháp là tính theo công thức toán và sử dụng phần mềm MODDE 5.0 kiểm tra kết quả.
Bảng 2.5 Kết quả tính toán
Nhân tố mã hóa Kết quả thực nghiệm Kết quả tính toán x 0 x 1 x 2 x x 1 2 y j 1 y j 2 y j 3 y j � y j s 2 j
Các hệ số hồi quy:
Mô hình hồi quy xây dựng được là:
Kiểm tra ý nghĩa của các hệ số hồi quy:
Hệ số được kiểm định theo tiêu chuẩn Student có ý nghĩa quan trọng trong việc đánh giá mức độ ảnh hưởng của các nhân tố đến biến đáp ứng Việc kiểm tra này được thực hiện với mức ý nghĩa α = 0.05, giúp xác định độ tin cậy của các kết quả thu được.
Vì t 3 1.42 2.31 ta kết luận rằng nhân tố tương tác ảnh hưởng không đáng kể đến mô hình hồi quy nên ta có thể loại khỏi mô hình
Mô hình hồi quy trở thành:
Kiểm tra sự tương thích của mô hình hồi quy theo tiêu chuẩn Fisher.
Với mức ý nghĩa 0.05 ; f th 4; f tt N n ( 1) 8(3 1) 16
Vì F 1.61F 0.95(4,16) 3.0 , nên tính thích hợp của mô hình hồi quy được thỏa.
Sử dụng phần mềm MODDE 5.0 phân tích dữ liệu ví dụ 2.1 ta được kết quả sau:
Bố trí thí nghiệm toàn phần hai nhân tố, mỗi nhân tố 2 mức độ Chọn chức năng Ofjective/Screening/full fac (2 level)
Hình 2.1 Chọn kiểu bố trí thí nghiệm toàn phần (Full fac (2 levels))
Các lựa chọn như hình 2.1, kết quả:
Hình 2.2 Kết quả bố trí thí nghiệm (MODDE 5.0) ví dụ 2.1
Phân tích hồi quy chọn: analysis/ coefficients/ list
Bảng 2.6 Kết quả phân tích hồi quy ví dụ 2.1
Qua trinh phan ung Coeff SC Std Err P Conf. int(±)
Kết quả từ bảng 2.6 cho thấy hệ số hồi quy của tác động tương tác x x 1 2 có giá trị P < 0.05, cho thấy rằng tác động của tương tác này là không đáng kể.
Investigation: phan tich 2^2 (MLR) Scaled & Centered Coefficients for Qua trinh phan ung
Hình 2.3 Mức độ, chiều hướng tác động của các nhân tố ví dụ 1
Kết quả phân tích hồi quy cho thấy chất phản ứng (x1) có tác động tích cực đến quá trình phản ứng, trong khi chất xúc tác (x2) lại ảnh hưởng tiêu cực đến biến đáp ứng Biến tương tác (x1x2) không có ảnh hưởng đáng kể và có thể được loại bỏ khỏi mô hình Với mức ý nghĩa α = 0.05, giá trị P nhỏ cho thấy tính tương thích của mô hình hồi quy được xác nhận, tức là các yếu tố độc lập có tác động đáng kể đến biến đáp ứng Tiếp theo, nghiên cứu sẽ tiến hành phân tích phương trình hồi quy để tìm ra phương án tối ưu.
Bố trí thí nghiệm nhân tố riêng phần dạng 2 k p
2.2.1 Giới thiệu mô hình bố trí thí nghiệm nhân tố riêng phần dạng 2 k P
Bố trí thí nghiệm nhân tố riêng phần là thực nghiệm chỉ tiến hành ở một số kết hợp giữa các mức của nhân tố.
Khi áp dụng mô hình tuyến tính, số thí nghiệm trong bố trí thí nghiệm nhân tố toàn phần thường quá lớn so với số hệ số hồi quy cần tính Tuy nhiên, nếu sử dụng bố trí thí nghiệm nhân tố riêng phần, số thí nghiệm có thể giảm đáng kể Để có được lời giải riêng phần, cần chọn bố trí thí nghiệm với số nhân tố nhỏ hơn làm cơ sở Chẳng hạn, để đánh giá ảnh hưởng của ba nhân tố x1, x2, x3 lên biến đáp ứng y, mô hình tuyến tính có thể được biểu diễn theo dạng phù hợp.
Để xác định các hệ số hồi quy b j thông qua lời giải riêng phần, chúng ta áp dụng bố trí thí nghiệm nhân tố toàn phần với hai nhân tố Trong ma trận bố trí thí nghiệm, cột x x 1 2 được thay thế bằng x 3, dẫn đến việc chỉ cần thực hiện 4 nghiệm thức thay vì 8 nghiệm thức như trong bố trí thí nghiệm nhân tố toàn phần 2 3.
Bảng 2.7 Ma trận bố trí thí nghiệm riêng phần 2 3 1
Một cách tổng quát số thí nghiệm trong phương án bố trí thí nghiệm nhân tố riêng phần được tính theo công thức:
Trong mô hình bố trí thí nghiệm nhân tố riêng phần, k đại diện cho số nhân tố chung, trong khi p là giá trị đặc trưng cho độ riêng phần, được thay thế bằng số tác động tuyến tính Sự kết hợp giữa k và p cho phép xác định số nhân tố trong mô hình.
Trong bố trí thí nghiệm nhân tố toàn phần 2^3, nếu một trong các tác động tương tác (x1x2, x1x3, x2x3, x1x2x3) được thay thế bằng nhân tố thứ 4 (x4), chúng ta sẽ có mô hình bố trí thí nghiệm riêng phần 2^4-1 Ở đây, k = 4 và p = 1, dẫn đến số thí nghiệm trong bố trí thí nghiệm nhân tố toàn phần giảm đi 1.
Nếu hai hiệu ứng tương tác được thay thế bằng x x 4, 5, mô hình bố trí thí nghiệm riêng phần sẽ là 2 5 2 Trong đó, k 5 và p 2, dẫn đến số thí nghiệm trong bố trí thí nghiệm nhân tố toàn phần giảm 1.
Trong lời giải riêng phần, các nhân tố mới thay thế phần tương tác, dẫn đến hệ số hồi quy tương ứng với các nhân tố này trở thành ước lượng đồng thời cho các tác động tuyến tính và tác động tương tác Điều này cho thấy sự lẫn lộn của các tác động khi các tác động tương tác không được thay thế bằng giá trị không.
Ví dụ, trong bố trí thí nghiệm riêng phần 2 4 1 :
Khi thay x 4 x x 2 3 thì b 4 là hệ số tác động thay thế 4 23
Khi thay x 4 x x 1 3 thì b 4 là hệ số tác động thay thế 413
Khi thay x 4 x x 1 2 thì b 4 là hệ số tác động thay thế 412
Trước khi tiến hành thí nghiệm theo phương án bố trí thí nghiệm nhân tố riêng phần, cần xác định khả năng giải quyết của lời giải riêng phần Sử dụng công cụ phù hợp sẽ giúp quá trình này trở nên thuận tiện hơn.
Trong bố trí thí nghiệm nhân tố riêng phần 2^4-1, việc thay thế hiệu ứng tuyến tính x₄ = x₁x₂x₃ (hoặc x₄ = -x₁x₂x₃) được gọi là biểu thức sinh Khi nhân hai vế với nhân tố ở vế trái, ta thu được một biểu thức mới.
I x x x x hay I x x x x 1 2 3 4(vì x i 2 I ) gọi là độ tương phản xác định. Độ tương phản xác định cho ta khả năng xác định khả năng giải được lời giải riêng phần.
Khi nhân độ tương phản xác định với các tương tác, ta nhận được ước lượng đồng thời của các hệ số hồi quy sau:
1 2 3 4 x �x x x b 1 là hệ số tác động thay thế 1� 234
2 1 3 4 x �x x x b 2 là hệ số tác động thay thế 2�134
3 1 2 4 x �x x x b 3 là hệ số tác động thay thế 3�124
4 1 2 3 x �x x x b 4 là hệ số tác động thay thế 4�123
1 2 3 4 x x �x x b 12 là hệ số tác động thay thế 12 �34
1 3 2 4 x x �x x b 13 là hệ số tác động thay thế 13�24
1 4 2 3 x x �x x b 12 là hệ số tác động thay thế 14 �23
Trong thực tế, các tác động tương tác ba thường ít hơn so với các tác động tương tác đôi Ví dụ, ta có thể chọn một tích của hai nhân tố làm biểu thức sinh, chẳng hạn như x^4 = x * x^2 * x^3 (hoặc x^4 = -x * x^2 * x^3) Độ tương phản xác định sẽ được tính là I = x * x * x^2 * x^3 * x^4.
Và nhận được các ước lượng sau đây:
1 1 2 3 4 x x x x x b 1 là hệ số tác động thay thế 1 1234
2 3 4 x x x b 2 là hệ số tác động thay thế 2134
3 2 4 x x x b 3 là hệ số tác động thay thế 3 24
4 2 3 x x x b 4 là hệ số tác động thay thế 4 23
1 2 1 3 4 x x x x x b 12 là hệ số tác động thay thế 12134
1 3 1 2 4 x x x x x b 13 là hệ số tác động thay thế 13124
1 4 1 2 4 x x x x x b 14 là hệ số tác động thay thế 14123
Do đó, bố trí thí nghiệm nhân tố riêng phần với biểu thức sinh x 4 x x 2 3 chỉ có ý nghĩa khi ta quan tâm đến các hệ số hồi quy 12, 13, 14.
Ngoài độ tương phản được xác định như trên, chúng ta còn có thể sử dụng độ tương phản suy rộng – bằng tích các độ tương phản.
Ví dụ, Bố trí thí nghiệm nhân tố riêng phần 2 5 2 Nếu dùng biểu thức sinh x 4 x x x 1 2 3, x 5 x x 1 2 Các độ tương phản xác định suy rộng:
Để đạt được ước lượng chính xác cho các tác động tuyến tính, số lượng thí nghiệm trong bố trí thí nghiệm nhân tố riêng phần cần phải tuân thủ điều kiện: k + 1 ≤ N < 2^k.
Nếu số thí nghiệm N k 1 tương ứng với hệ số cần xác định trong phương trình hồi quy tuyến tính, thì việc bố trí thí nghiệm theo phương án bão hòa là cần thiết Để kiểm định sự tương thích của phương trình tuyến tính này, việc thực hiện thêm thí nghiệm, thường là một thí nghiệm ở tâm phương án, là điều không thể thiếu.
Nếu thí nghiệm lập lại m lần, ma trận bố trí thí nghiệm được cho ở bảng sau:
Bảng 2.8 Ma trận tổng quát bố trí thí nghiệm riêng phần
2.2.2 Phân tích mô hình bố trí thí nghiệm nhân tố riêng phần dạng 2 k P
Quá trình tính toán được thực hiện như sau:
Tính giá trị trung bình:
Tính phương sai ở mỗi thí nghiệm:
Kiểm định sự đồng nhất của phương sai theo tiêu chuẩn Cochran:
So sánh giá trị tính được với giá trị bảng G 1 ( , )f f 1 2 , với mức ý nghĩa
Nếu G G 1 ( , )f f 1 2 ta có phương sai đồng nhất.
Tính phương sai tái hiện:
Tính các hệ số hồi quy:
Vì y nhận được theo mẫu có số lượng m nên:
2 2 / y th m s s , do đó: s b 2 j s th Nm 2 /
Kiểm định ý nghĩa của hệ số hồi quy theo tiêu chuẩn t : j j j b t b
Nếu t j t f ( ), f N m ( 1)thì b j bị loại khỏi phương trình hồi quy.
Kiểm định sự tương thích của mô hình hồi quy:
� , với l là số hệ số có ý nghĩa trong phương trình hồi quy.
Nếu FF 1 ( , )f f 1 2 thì phương trình hồi quy tương thích với thực nghiệm Trong đó f 1 N l f, 2 N m( 1).
Nếu F F 1 ( , )f f 1 2 thì phương trình hồi quy không tương thích với thực nghiệm và phải tăng bậc của đa thức.
Ví dụ 2.2: Nghiên cứu sự biến tính của nhôm nguyên chất bằng molipden Thông số tối ưu hóa y được chọn là số hạt nhôm trên bề mặt 1cm 2
Các nhân tố ảnh hưởng đến thông số tối ưu bao gồm: (1) Lượng molipden đưa vào nhôm tính bằng phần trăm, (2) Nhiệt độ nung nóng tính bằng độ C, (3) Thời gian nung nóng tính bằng phút, và (4) Tốc độ làm lạnh (ủ).
1 2 3 x x x là những yếu tố định lượng quan trọng, trong khi x 4 là yếu tố định tính với hai giá trị: làm lạnh nhanh bằng đá graphit và làm lạnh chậm bằng gạch chịu lửa.
Bảng 2.9 Dữ liệu tự nhiên bố trí thí nghiệm ví dụ 2.2
Biến đầu vào Mức độ
Mô hình được chọn là mô hình hồi quy tuyến tính
Thực nghiệm được chọn là bố trí thí nghiệm nhân tố riêng phần: 2 4 1
Với biểu thức sinh x 4 x x x 1 2 3, các thí nghiệm không lặp lại Ma trận bố trí thí nghiệm được cho ở bảng 2.10.
Bảng 2.10 Kết quả thực nghiệm ví dụ 2.2
Ví dụ 2.2 sẽ được tính toán theo hai phương pháp là tính theo công thức toán và sử dụng phần mềm MODDE 5.0 kiểm tra kết quả.
Bảng 2.11 Kết quả tính toán thực hiện 3 thí nghiệm ở tâm
Các hệ số trong mô hình được tính theo công thức:
Kiểm định ý nghĩa của phương trình hồi quy: j j j b t b
Tra bảng Student ta được: t 0.05( )f th t 0.05(n 0 1) t 0.05(2) 4.3
Ta có t j t 0.05 ( ) f với j0,1, 2,3, 4 Do đó các hệ số hồi quy đều có ý nghĩa và phương trình hồi quy có dạng:
Kiểm định sự tương thích của mô hình theo tiêu chuẩn Fisher
Bảng 2.12 Kết quả tính toán ví dụ 2.2
Nếu F 2 F 1 ( , ) 19.2f f 1 2 nên phương trình hồi quy tương thích với thực nghiệm.
Sử dụng phần mềm MODDE 5.0 phân tích dữ liệu ví dụ 2.2 ta được kết quả sau:
Bố trí thí nghiệm riêng phần 2 4 1 , không lặp Chọn chức năng Ofjective/ Screening/ Frac Fac res IV.
Hình 2.4 Chọn kiểu bố trí thí nghiệm riêng phần 2 4 1 (Frac Fac res IV)
Các lựa chọn như hình 2.4, kết quả:
Hình 2.5 Kết quả bố trí thí nghiệm (MODDE 5.0) ví dụ 2.2 Phân tích hồi quy chọn: analysis/ coefficients/ list
Bảng 2.13 Kết quả phân tích hồi quy ví dụ 2.2
Bien tinh nhom Coeff SC Std Err P Conf int(±)
Kết quả từ bảng 2.13 cho thấy các hệ số hồi quy đều có giá trị P < 0.05, chứng tỏ chúng có ý nghĩa thống kê Hệ số tương quan R² = 0.997 cho thấy mô hình có tính tương quan cao.
Investigation: phan tich 2^4-1 (MLR) Scaled & Centered Coefficients for Bien tinh nhom
N=8 R2=0.997 R2 Adj.=0.993 DF=3 Q2=0.979 RSD=2.3363 Conf lev.=0.95
Hình 2.6 Mức độ, chiều hướng tác động của các nhân tố ví dụ 2.2
Kết quả hồi quy trong bảng 2.13 và đồ thị hình 2.6 cho thấy nhân tố x1 và x4 có tác động tích cực, trong khi nhân tố x2 và x3 lại có tác động tiêu cực Đặc biệt, nhân tố x4 thể hiện sự ảnh hưởng mạnh mẽ nhất đến biến đáp ứng.
Tìm phương án tối ưu chọn: Prediction/ optimizer
Bảng 2.14 Kết quả tìm giá trị tối ưu bằng MODDE 5.0
Luong molipden nhiet do nung thoi gian nung
Bien tinh nhom iter log(D)
Vậy kết quả của biến đáp ứng (số hạt nhom trên cm 2 ) đạt giá trị lớn nhất khi: x 1 0.55%;x 2 �740 0 C;x 3 �6 phút;x 4 là đá graphit.
2.3 Bố trí thí nghiệm nhân tố bậc hai 3 k (Bố trí thí nghiệm 3 k )
Ứng dụng 1
2.4.1 Tổng quan về ứng dụng
Khảo sát ảnh hưởng của tỉ lệ muối, đường và rượu phối trộn đến quá trình chuyển hóa nitơ trong sản phẩm mắm cá sặc xương mềm, nhằm xác định tỉ lệ tối ưu của các thành phần này để cải thiện chất lượng sản phẩm.
Chuẩn bị mẫu cá nguyên liệu chất lượng và kích cỡ phù hợp, xử lý bằng cách loại bỏ nội tạng, đầu và vảy, sau đó ngâm trong 4 giờ, chà vảy và rửa sạch, để ráo trong 1 giờ Mỗi nghiệm thức sử dụng 300g cá, bổ sung muối, đường, rượu với tỷ lệ khác nhau, 5% thính, gừng và ớt Cuối cùng, cho hỗn hợp vào keo gài nén và bịt kín Thí nghiệm được thiết kế với ba nhân tố và thực hiện ba lần lặp lại.
Bảng 2.16 Ký hiệu các biến đầu vào của ứng dụng 1
Biến đầu vào Mức độ
Mức thấp -1 Mức cơ sở 0 Mức cao 1
Phương pháp thực hiện bao gồm việc sử dụng phần mềm Modde 5.0 để bố trí thí nghiệm và phân tích kết quả Chúng tôi thiết lập phương trình hồi quy bậc 2 nhằm xác định mối tương quan giữa biến đầu vào và biến mục tiêu, với phương trình có dạng cụ thể.
Bố trí thí nghiệm toàn phần 3 3 ba nhân tố, mỗi nhân tố 3 mức độ, lặp lại 2 lần Chọn chức năng Ofjective/Screening/full fac (3 level)
Hình 2.10 Chọn kiểu bố trí thí nghiệm toàn phần 3 ví dụ 2.3 2 Các lựa chọn như hình 2.11, kết quả:
Hình 2.11 Kết quả bố trí thí nghiệm (MODDE 5.0) ứng dụng 1
Phân tích hồi quy chọn: analysis/ coefficients/ list
Bảng 2.17: Ma trận bố trí thí nghiệm ứng dụng 1
Stt Nhân tố x 1 Nhân tố x 2 Nhân tố x 3
- Kết quả thí nghiệm thu được theo phụ lục 1
- Phân tích giả thuyết thống kê: analysis/ summary list
Bảng 2.18 Kết quả phân tích giả thuyết thống kê
Tổng số mẫu thí nghiệm: 27 mẫu x 3 lần lặp lại = 81 mẫu
Hệ số hồi quy R² = 0.723 cho thấy sự ảnh hưởng rõ rệt của các biến độc lập đến biến đáp ứng, cho thấy rằng các yếu tố đầu vào có tác động quan trọng đến quá trình chuyển hóa đạm nitơ trong sản phẩm mắm cá sặc xương mềm.
Bảng 2.19 Kết quả phân tích hồi quy cho ứng dụng 1
Dam trong san pham Coeff SC Std Err P Conf int(±)
Investigation: phan tich 3^3 amin bac 2 (MLR) Scaled & Centered Coefficients for Dam trong san pham
N R2=0.723 R2 Adj.=0.688 DFq Q2=0.655 RSD=4.9182 Conf lev.=0.95
Hình 2.12 Mức độ, chiều hướng tác động của các nhân tố ứng dụng 1
Kết quả phân tích hồi quy cho thấy tương tác x22 có ảnh hưởng mạnh nhất đến biến đáp ứng, trong khi các nhân tố x1, tương tác x13 và x23 không có tác động đáng kể đến quá trình chuyển hóa nitơ của sản phẩm mắm cá sặc xương mềm, do đó đã được loại bỏ khỏi mô hình Mô hình phương trình hồi quy cuối cùng được xác định như sau:
Với mức ý nghĩa 0.05, hệ số hồi quy 0.723 nên phương trình hồi quy có tính tương thích với thực nghiệm.
- Tìm phương án tối ưu chọn: Prediction/ optimizer
Bảng 2.20 Kết quả giá trị phương án tối ưu của thí nghiệm
Muoi Duong Ruou Dam trong san pham iter log(D)
Quá trình chuyển chuyển hóa đạm của sản phẩm mắm cá sặc xương mềm đạt giá trị lớn nhất khi:
Nhân tố x 1 (Tỉ lệ muối) = 10.8;
Nhân tố x 2 (tỷ lệ đường) = 14.2;
Nhân tố x 3 (tỷ lệ rượu)= 3.8
Kết quả này cho phép xác định tỷ lệ muối, đường và rượu cần thiết nhằm tối ưu hóa quá trình chuyển hóa nitơ trong sản phẩm mắm cá sặc xương mềm.
Investigation: phan tich 3^3 amin bac 2 (MLR) Response Surface Plot
Hình 2.13 Biểu đồ mặt đáp biểu thị chuyển hóa đạm trong sản phẩm khi cố định rượu bằng 3%
BỐ TRÍ THÍ NGHIỆM VỚI NHÂN TỐ NGẪU NHIÊN
Bố trí thí nghiệm với nhân tố ngẫu nhiên
Khi chúng ta chọn ngẫu nhiên một trong những mức của các nhân tố quan tâm, các nhân tố này được xem là ngẫu nhiên Mặc dù các biến số liên tục có thể được đo ở các mức ngẫu nhiên, chúng ta thường hình dung các tác động theo cách hệ thống như tuyến tính hoặc bậc hai Ngược lại, tác động ngẫu nhiên không mang tính hệ thống Mô hình dưới đây minh họa rõ ràng điều này: ij i ij y = μ + τ + e, với i = 1, , a và j = 1, , n.
Trong đó: y ijlà kết quả nghiên cứu trên đơn vị thí nghiệm
là hiệu quả trung bình
i là hiệu quả của mức độ thứ i của nhân tố X 1 e ijlà sai số trên một đơn vị thí nghiệm
Cả hai thuật ngữ "lỗi" và "hiệu quả tác động" được xem là các biến ngẫu nhiên độc lập Chúng ta giả định rằng các biến ngẫu nhiên i và e ijk có phân phối chuẩn, với trung bình bằng không và phương sai V( i) = 2 và V(e ijk) = 2.
Các nhân tố được coi là ngẫu nhiên khi chúng ta xem chúng như một mẫu từ một quần thể lớn hơn, và hiệu quả của chúng không có hệ thống Sự ngẫu nhiên không phải lúc nào cũng rõ ràng; ví dụ, nếu một công ty thử nghiệm chính sách quản lý tại tất cả 5 cửa hàng hiện có, thì "cửa hàng" là một nhân tố cố định Ngược lại, nếu công ty có 100 cửa hàng và chọn 5 cho thử nghiệm, hoặc đang có kế hoạch mở rộng và thực hiện chính sách ở các địa điểm mới, thì "cửa hàng" trở thành một nhân tố ngẫu nhiên Thông thường, các nhân tố ngẫu nhiên ít được xem xét trong thiết kế thí nghiệm 2k hoặc 3k do số mức độ không đủ để ước tính sai số.
Trong các mô hình tác động cố định, việc kiểm tra sự bình đẳng của phương pháp nghiên cứu không còn phù hợp do các phương pháp được chọn ngẫu nhiên Chúng ta nên tập trung vào số lượng các phương pháp nghiên cứu thay vì chỉ một trường hợp cụ thể Thí nghiệm giả thuyết là công cụ phù hợp để áp dụng cho tác động ngẫu nhiên.
Tương tác hai nhân tố với nhân tố ngẫu nhiên
Giả sử có hai nhân tố X1 và X2 với nhiều mức độ khác nhau Chúng ta sẽ ngẫu nhiên chọn mức độ a cho nhân tố X1 và mức độ b cho nhân tố X2 Nếu thực hiện thí nghiệm n lần, mô hình hồi quy tuyến tính có thể được biểu diễn như sau.
Mô hình được xây dựng dựa trên các thông số là các biến ngẫu nhiên độc lập, trong đó các biến ngẫu nhiên \(\tau\), \(\beta\) và \(e\) đều có phân phối chuẩn với trung bình bằng không Phương sai của các biến này được xác định là \(V(\tau_i) = \sigma_{\tau}^2\), \(V(\beta_i) = \sigma_{\beta}^2\), \(V(\tau\beta_{ij}) = \sigma_{\tau\beta}^2\) và \(V(e_{ijk}) = \sigma^2\).
Các tính toán trong phân tích phương sai vẫn không thay đổi giống như trong trường hợp mức độ nhân tố cố định.
- Khi đó ta tính được giá trị quan sát:
- Giá trị tra bảng F 1 ( N 1, ab n ( 1)
Trong một thử nghiệm R&R điển hình từ Montgomery (2009), một dụng cụ đo được sử dụng để đo chiều dài giới hạn của các bộ phận Hai mươi bộ phận được chọn ngẫu nhiên từ quá trình sản xuất, và ba toán tử cũng được chọn ngẫu nhiên để thực hiện hai lần đo cho mỗi bộ phận Thứ tự các phép đo hoàn toàn ngẫu nhiên, tạo thành một thực nghiệm với hai nhân tố ngẫu nhiên và hai lần lặp lại.
MSE Giá trị tra bảng Fisher F 0.05(N1,ab n( 1))F 0.05(119,60) 1.4
Giả sử ký hiệu X 1 là nhân tố bộ phận được đo, X 2là nhân tố thiết bị đo.
Sử dụng phần mềm MINITAB 18.0:
Bảng 3.1 Kết quả phân tích phương sai (Minitab 18.0) cho ví dụ 3.1
Source DF Adj SS Adj MS F-Value P-Value
Bảng 3.2 Kết quả phân tích ý nghĩa hệ số hồi quy (Minitab 18.0) cho ví dụ 3.1
Source Variance % of Total StDev % of Total
* Value is negative, and is estimated by zero
Kết quả cho thấy tương tác X X 1 2 có tác động không đáng kể đến kết quả đo Khi đó ta loại tương tác X X 1 2ra khỏi mô hình.
Nghiên cứu khả năng của hệ thống đo lường là ứng dụng phổ biến trong bố trí thí nghiệm Để minh họa, ta xem xét mô hình thiết kế thực nghiệm với nhân tố ngẫu nhiên, cụ thể là mô hình hai nhân tố, mỗi nhân tố có hai mức độ, tức là a = 2 và b = 2.
Phương sai của mỗi quan sát: Var y ijk 2 2 2 2
Và hiệp phương sai là:
Ma trận hiệp phương sai cấp 8x8 11 12
Trong đó: 11; 12; 21; 22 là ma trận cấp 4x4.
Ma trận 21như ma trận 12chỉ là ma trận chuyển vị của 12.
Hiện nay, mỗi quan sát thường tuân theo phân phối chuẩn với phương sai Nếu giả định rằng tất cả N = abn quan sát đều có cùng phân phối chuẩn, thì hàm likelihood của mô hình ngẫu nhiên sẽ được xác định như sau:
Trong đó: j N là véctơ N x1, ước lượng khả năng lớn nhất của
2 , , , 2 2 2 là giá trị của các tham số này để hàm L( , , , 2 2 2 2 ) đạt giá trị lớn nhất.
Mô hình tác động ngẫu nhiên với dữ liệu bảng
3.3.1 Thực nghiệm với nhân tố tác động cố định (FE)
Xét một mối quan hệ bao gồm một biến phụ thuộc Y, và hai biến giải thích quan sát được X 1 và X 2 Chúng ta có dữ liệu bảng cho Y, X 1 và X 2.
Dữ liệu bảng gồm có N đối tượng và T thời điểm, và vì vậy chúng ta có NxT quan sát.
Mô hình tuyến tính cổ điển không có hệ số cắt được cho bởi dạng
Giá trị Y của đối tượng i tại thời điểm t được xác định bởi các yếu tố X1 và X2, trong đó X1 và X2 lần lượt là giá trị của chúng cho đối tượng i tại thời điểm t Ngoài ra, sai số của đối tượng i tại thời điểm t được ký hiệu là ε.
Mô hình hồi quy tác động cố định là một dạng mở rộng của mô hình tuyến tính cổ điển được cho bởi dạng:
Sai số trong mô hình hồi quy tuyến tính cổ điển được chia thành hai thành phần chính Thành phần i 0 phản ánh các yếu tố không quan sát được khác nhau giữa các đối tượng nhưng ổn định theo thời gian Trong khi đó, thành phần u it thể hiện những yếu tố không quan sát được khác nhau giữa các đối tượng và có sự thay đổi theo thời gian.
3.3.2 Thực nghiệm với nhân tố tác động ngẫu nhiên (RE)
Xét một mối quan hệ bao gồm một biến phụ thuộc Y, và hai biến giải thích quan sát được X 1 và X 2 Chúng ta có dữ liệu bảng cho Y, X 1 và X 2.
Dữ liệu bảng gồm có N đối tượng và T thời điểm, và vì vậy chúng ta có NxT quan sát.
Mô hình tác động ngẫu nhiên được viết dưới dạng:
Sai số cổ điển được chia thành hai thành phần chính Thành phần 0i đại diện cho các yếu tố không quan sát được, khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian Trong khi đó, thành phần u it thể hiện các yếu tố không quan sát được, biến đổi giữa các đối tượng và theo thời gian Giả sử rằng 0i được xác định bởi:
i là là số hạng sai số ngẫu nhiên với một giá trị trung bình bằng 0 và phương sai bằng 2
Khi đó ta đặt it i u it , mô hình được viết lại như sau:
it is it jt it js 0
Nghĩa là, các sai số không tương quan nhau và không tự tương quan theo không gian (đối tượng) và thời gian.
Từ đó suy ra: E it 0 ; V ar it 2 u 2 ; cov( it ; is ) 2 2 2 u
3.3.3 Ước lượng hệ số hồi quy nhân tố tác động ngẫu nhiên
Giả sử, chúng ta có M biểu thức được xem là có mối quan hệ với nhau (vì thành phần sai số bị tương quan với nhau)
Hệ thống M biểu thức có thể được viết lại dưới dạng y = Xβ + ε, trong đó y là véctơ cột kích thước Tx1, X là ma trận kích thước TxK chứa các quan sát, β là véctơ cột kích thước 1xK đại diện cho các hệ số, và ε là véctơ cột kích thước Tx1 biểu thị phần dư Ở đây, T là số lượng quan sát, K là số biến giải thích, và M là số phương trình trong mô hình.
Mô hình này được dựa trên các giả định sau:
- Dạng hàm của biểu thức tổng quát là tuyến tính theo các tham số.
- Thành phần sai số của biểu thức tổng quát có giá trị trung bình bằng 0.
- Phân bố của sai số trong biểu thức tổng quát thỏa mãn:
(i) Phương sai sai số của mỗi biểu thức riêng rẻ là không đổi
(ii) Phương sai của sai số có thể khác nhau ở các biểu thức riêng rẻ
Các sai số của từng biểu thức riêng lẻ không có sự tự tương quan, trong khi các sai số giữa các biểu thức khác nhau lại có sự tương quan đồng thời.
- Thành phần sai số của biểu thức tổng quát có phân phối chuẩn
- Thành phần sai số của biểu thức tổng quát không có tương quan với các biến giải thích trong xác định ma trận phương sai - hiệp phương sai trên.
Ma trận là một ma trận MxM chứa phương sai và hiệp phương sai của M biến riêng biệt Ma trận đơn vị I và tích Kronecker của với I được minh họa trong hình dưới đây.
Để ước lượng các tham số của mô hình SUR, việc lựa chọn một ước lượng phù hợp là rất quan trọng Chúng ta có thể xem xét bốn loại ước lượng: Ước lượng bình phương thông thường tối thiểu (OLS) là không thiên chệch nhưng không hiệu quả và không phải là ước lượng hợp lý cực đại (MLE) Ước lượng bình phương tổng quát tối thiểu (GLS) lại không khả thi do các phần tử của ma trận phương sai – hiệp phương sai W chưa được biết Trong khi đó, ước lượng bình phương tổng quát tối thiểu khả thi (FGLS) theo phương pháp Zellner, hay còn gọi là ước lượng SUR, là một ước lượng tiệm cận với GLS và cũng là một ước lượng hợp lý tối đa (MLE), mang lại các tính chất tiệm cận như không thiên chệch, hiệu quả và nhất quán.
Các công thức ước lượng hệ số hồi quy của các phương pháp:
3.3.4 Ước lượng tính thích hợp của mô hình hồi quy với nhân tố tác động ngẫu nhiên bằng kiểm định Hausman.
Phương trình hồi quy góc:
Hausman test là một phép thử về sự độc lập của phần dư i và biến độc lập X itk
Kiểm định Hausman được áp dụng để xác định phương pháp ước lượng tối ưu giữa tác động cố định và tác động ngẫu nhiên Giả thuyết H0 cho rằng không tồn tại mối liên hệ giữa sai số đặc trưng của các đối tượng ( i) và các biến độc lập X it trong mô hình.
H 0 có nghĩa không nên sử dụng ước lượng tác động ngẫu nhiên
H 0 không có nghĩa sử dụng ước lượng tác động ngẫu nhiên
Nghiên cứu này phân tích tác động của số năm kinh nghiệm (exp) và số năm đi học (ed) đến mức lương (lwage) của người lao động, sử dụng dữ liệu bảng cân bằng với 4.165 quan sát, bao gồm 7 giai đoạn thời gian (T=7) và 595 đối tượng lao động (nY5) Kết quả nghiên cứu cho thấy mối quan hệ giữa kinh nghiệm, trình độ học vấn và mức lương của người lao động.
Ước lượng hệ số hồi quy (phần mềm STATA)
Bảng 3.3 Kết quả phân tích hồi quy (STATA) của ví dụ 3.2
Conf Interval ed 1144867 0062539 18.31 0.000 1022292 1267443 exp 0574212 0011052 51.96 0.000 055255 0595874 cons 4.065693 0881292 46.13 0.000 3.892963 4.238423
Bảng 3.4 Kết quả kiểm định Hausman
Test: Ho: difference in coefficients not systematic chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B)
Phân tích bằng phần mềm STATA với mức ý nghĩa = 0.05 cho thấy giá trị P = 0.000, cho thấy các nhân tố ảnh hưởng đến biến đáp ứng Kết quả kiểm định Hausman test với giá trị Prob>chi2 = 0.0000 cho thấy giả thiết H0 có nghĩa, do đó không nên sử dụng mô hình tác động ngẫu nhiên.
Ứng dụng 2
Nghiên cứu ứng dụng mô hình tác động ngẫu nhiên nhằm phân tích ảnh hưởng của các yếu tố như quy mô doanh nghiệp (SIZE), tốc độ tăng trưởng (GROW), tài sản hữu hình (TAN), tỷ lệ sinh lời tổng tài sản (ROA), và lợi nhuận (QR) đến đòn bẩy tài chính (LEV).
Dữ liệu được thu thập tại 47 doanh nghiệp trên sàn chứng khoáng Việt Nam thời gian từ năm 2012 đến năm 2015 (Trung tâm nghiên cứu định lượng).
Sử dụng phần mềm STATA phân tích mô tả dữ liệu:
Dùng lệnh: sum LEV ROA QR SIZE GROW TAN
Bảng 3.5 Mô tả dữ liệu:
Variable Mean Std Dev Min Max
Tìm ma trận tương quan
Dùng lệnh: pwcorr LEV ROA QR SIZE GROW TAN
Bảng 3.6 Ma trận tương quan
LEV ROA QR SIZE GROW TAN
Phân tích hồi quy theo mô hình cố định (FEM)
Dùng lệnh: xtreg LEV ROA QR SIZE GROW TAN,fe
Bảng 3.7 Kết quả phân tích hồi quy theo mô hình FEM
Phân tích hồi quy theo mô hình ngẫu nhiên (REM)
Dùng lệnh: xtreg LEV ROA QR SIZE GROW TAN,re
Bảng 3.8 Kết quả phân tích hồi quy theo mô hình REM
Kết quả kiểm định tự tương quan:
Wooldridge test for autocorrelation in panel data
P mô hình tồn tại tự tương quan
Kết quả kiểm định phương sai thay đổi:
H0: sigma(i)^2 = sigma^2 for all i in fixed effect regression model
Modified Wald test for groupwise heteroskedasticity
P mô hình tồn tại phương sai thay đổi
Dùng lệnh: hausman fe re
Kết quả kiểm định Hausman:
Test: Ho: difference in coefficients not systematic
P-value nhỏ hơn 0.05 cho thấy mô hình FEM phù hợp
Mô hình tồn tại cả tự tương quan và phương sai thay đổi Tiến hành hiệu chỉnh bằng GLS thu được kết quả sau:
Dùng lệnh: xtgls LEV ROA QR SIZE GROW TAN,fe xtgls LEV ROA QR SIZE GROW TAN
Bảng 3.9 Kết quả phân tích hồi quy theo GLS
Kết quả nghiên cứu cho thấy tỷ lệ sinh lời tổng tài sản (ROA) và lợi nhuận (QR) có tác động ngược chiều đến đòn bẩy tài chính (LEV), với P value nhỏ hơn 0.05 và hệ số beta âm Ngoài ra, các yếu tố như quy mô doanh nghiệp (SIZE) và tốc độ tăng trưởng cũng đóng vai trò quan trọng trong mối quan hệ này.
(GROW), tài sản hữu hình (TAN), tác động không đáng kể lên đòn bảy tài chính (LEV).