1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích thống kê hiệu quả đào tạo cao đẳng tại trường đại học sao đỏ

118 20 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 118
Dung lượng 900,5 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Có không ít sinh viên ra trường không đáp ứng đượcvới thực tế xã hội.Đã có rất nhiều bài báo, bài tham luận xuất hiện và phân tích thực trạng dạy và học ở các trường một cách định tính,

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – Năm 2013

Trang 3

MỤC LỤC

LỜI MỞ ĐẦU 3

Chương 1: CÁCMÔ HÌNH TUYẾN TÍNH TRONG PHÂN TÍCH THỐNG KÊ 7

1.1 Mô hình Hồi quy tuyến tính cổ điển 7

1.1.1 Hồi quy tuyến tính đơn 7

1.1.2 Hồi quy tuyến tính bội 16

1.2 Mô hình Phân tích phương sai 22

1.2.1 Mô hình Phân tích phương sai một nhân tố 23

1.2.2 Mô hình Phân tích phương sai hai nhân tố 28

1.2.3 Mô hình ba nhân tố 31

1.2.4 Mô hình bốn nhân tố 32

1.2.5 Cơ sở lý thuyết của các phép kiểm định trong phân tích phương sai 33

1.3 Mô hình tuyến tính tổng quát 35

1.3.1 Ký hiệu 38

1.3.2 Mô hình 38

1.3.3 Phân bố mẫu của các tổng bình phương 40

1.3.4 Kiểm tra tham số trên tập hợp con 40

1.3.5 Phép kiểm định phù hợp 42

1.3.6 Trường hợp độ biến động không thuần nhất 45

1.3.7 Phân bố không chuẩn và mô hình tuyến tính suy rộng 46

Chương 2: PHÂN TÍCH SỐ LIỆU 49

2.1 Khái quát về trường Đại học Sao Đỏ 49

2.2 Dữ liệu dùng trong nghiên cứu 50

2.3 Phân tích số liệu 51

2.3.1 Phân tích tác động riêng rẽ các nhân tố lên kết quả học tập 51

2.3.2 Phân tích tác động đồng thời của nhiều nhân tố lên kết quả học tập 65

2.3.3 Phân tích tác động của nhiều nhân tố lên mức độ tiến bộ của sinh viên 78

KẾT LUẬN 90

TÀI LIỆU THAM KHẢO 93

PHỤ LỤC 94

2

Trang 4

LỜI MỞ ĐẦU

Trong suốt cuộc đời cách mạng của mình, Chủ tịch Hồ Chí Minh đã dànhnhững tâm tư và tình cảm đặc biệt đối với sự nghiệp giáo dục của nước nhà.Trong di sản tư tưởng của Người để lại, có tới hơn 592 lần nhắc đến “giáodục”, 159 lần nhắc đến “đào tạo”, trên 190 lần nhắc đến “trường học”, gần

100 lần nhắc đến “đại học”, 92 lần nhắc đến “trường học, giáo sư”, 81 lầnnhắc đến “giáo viên”, 80 lần nhắc đến “thầy giáo”, khoảng 145 lần nhắc đến

“sinh viên” và đến 225 lần nhắc đến “học sinh” Người coi “con người” làvốn quý nhất, là yếu tố quyết định của sự nghiệp cách mạng Người cũngthường xuyên nhắc nhở rằng: “Vì lợi ích mười năm thì phải trồng cây, vì lợiích trăm năm thì phải trồng người”

Tư tưởng phát triển con người toàn diện của Chủ tịch Hồ Chí Minh đã gópphần to lớn vào việc đào tạo những người con ưu tú, làm thay đổi căn bản vịthế của nước ta trên trường quốc tế Theo người, con người toàn diện phảiđược tự do, được hạnh phúc, con người phải được giải phóng, được giáo dục– đào tạo và được sống trong xã hội hòa bình ổn định

Đại hội Đảng lần thứ X đã khẳng định “Phát triển giáo dục và đào tạo là một trong những động lực quan trọng thúc đẩy sự nghiệp công nghiệp hóa, hiện đại hóa, là điều kiện để phát huy nguồn lực con người – yếu tố cơ bản để phát triển xã hội, tăng trưởng kinh tế nhanh và bền vững” [6] Nhiệm vụ trọng

yếu, nền tảng của chương trình giáo dục Đại học là xây dựng và đào tạo chođất nước một đội ngũ trí thức có nhân cách, có đạo đức, có chuyên mônnghiệp vụ tốt, với thể chất mạnh khỏe để đáp ứng tốt yêu cầu của sự nghiệpcông nghiệp hóa, hiện đại hóa

Trang 5

Trong những năm qua, giáo dục và đào tạo có những đóng góp nhất địnhtrong giải quyết các vấn đề kinh tế, khai thác nội lực và phát huy tiềm năng,lợi thế của đất nước, tạo ra vị thế trên trường quốc tế Tuy nhiên, thực tế côngtác giáo dục còn nhiều tồn tại , điều kiện giáo dục còn trong tình trạng lạc hậu,trì trệ, chất lượng thấp Có không ít sinh viên ra trường không đáp ứng đượcvới thực tế xã hội.

Đã có rất nhiều bài báo, bài tham luận xuất hiện và phân tích thực trạng dạy

và học ở các trường một cách định tính, nhưng rất ít nghiên cứu với cách tiếpcận định lượng để có được những kết luận thực sự mang tính thuyết phục.Việc nghiên cứu và dự đoán những nhân tố ảnh hưởng đến chất lượng học tậpcủa sinh viên từ đó tạo đầu ra tốt nhất cho xã hội cũng đang là một trongnhững yêu cầu cơ bản và cấp thiết hiện nay

Bản luận văn này là một thử nghiệm nghiên cứu định lượng về tình trạng dạy

và học tại trường Đại học Sao Đỏ Với số liệu thu thập được từ ba khoa: khoaĐiện, khoa Điện tử -Tin học và khoa Kinh tế của trường Đại học Sao Đỏ,bằng các phương pháp thống kê thích hợp, luận văn này mong muốn chỉ rađược các nhân tố ảnh hưởng đến kết quả học tập của sinh viên nhằm đưa ranhững đề xuất giúp nâng cao chất lượng học tập của sinh viên trường Đại họcSao Đỏ

Sau Lời mở đầu, luận văn này sẽ có hai chương, Kết luận, Danh mục tài liệutham khảo và phần phụ lục chứa các câu hỏi điều tra Chương 1 sẽ trình bàycác phương pháp phân tích thống kê được dùng chủ yếu trong nghiên cứu cụthể ở đây Phương pháp phân tích bằng mô hình hồi quy tuyến tính được mô

tả súc tích, cô đọng, đảm bảo chính xác về mặt toán học Mô hình phân tíchphương sai sẽ được trình bày dựa trên cơ sở phân tích phương sai một nhân

tố, hai nhân tố rồi mở rộng ba nhan tố và bốn nhân tố Sau cùng là mô hìnhtuyến tính tổng quát mở rộng của hai mô hình trên

4

Trang 6

Chương 2 gồm ba mục lớn Mục một và hai được dành riêng cho việc mô tảđối tượng nghiên cứu, phương pháp lấy mẫu, thu thập và tổ chức giữ liệu.Mục ba sử dụng phần mềm SPSS tiến hành tất cả các tính toán và phân tích.

Để đánh giá các nhân tố ảnh hưởng thực sự đến kết quả học tập của từng học

kỳ và tác động lên sự tiến bộ của học kỳ sau so với kỳ trước

Cuối cùng là phần Kết luận để bàn luận về các kết quả thu được Các nhân tốảnh hưởng thực sự đến kết quả học tập của sinh viên đưa ra một số đề suấtnhằm nâng cao chất lượng học tập của sinh viên

Luận văn này được hoàn thành dưới sự hướng dẫn của PGS.TS Hồ ĐăngPhúc, chuyên gia của Viện toán học, Viện KHCN Việt Nam Tôi xin bày tỏbiết tỏ lòng biết ơn sâu sắc đối với sự quan tâm chỉ dẫn đầy nhiệt huyết củathầy

Tôi xin chân thành cám ơn các thầy giáo của khoa Toán -Cơ -Tin trường Đạihọc tự nhiên –ĐHQG Hà Nội đã tham gia giảng dạy lớp cao học khóa 2009-

2011, cùng các thầy cô trong phòng đào tạo sau đại học của trường ĐHQGHN

đã nhiệt tình giúp đỡ tôi trong suốt thời gian học tập Tôi xin gửi lời cảm ơntới anh chị em khóa học 2009-2011, nhóm Semina Xác suất Thống kê –Việntoán học cùng các bạn đồng nghiệp và gia đình đã đóng góp ý kiến nhiệt tình,động viên, giúp đỡ tôi trong suốt quá trình học tập và hoàn thiện luận văn.Đặc biệt, tôi xin gửi lời cảm ơn sâu sắc tới các em sinh viên cùng gia đình, tậpthể giáo viên, phòng Đào tạo và phòng Công tác học sinh- sinh viên trườngĐại học Sao đỏ đã nhiệt tình cung cấp thông tin chính xác và quý báu mà nếuthiếu nguồn số liệu này thì nghiên cứu của tôi không thực hiện được

Tôi xin chân thành cảm ơn các thầy cô trong khoa Khoa học cơ bản, Ban giámhiệu trường Đại học Sao Đỏ đã tạo điều kiện thuận lợi cho tôi hoàn thành kếhoạch học tập và nghiên cứu

Trang 7

Tuy đã có nhiều cố gắng nhưng bản luận văn cũng không tránh khỏi nhữngthiếu sót Tác giả rất mong có được sự tham gia đóng góp ý kiến các thầy côgiáo, các nhà nghiên cứu Xác suất Thống kê, nghiên cứu Giáo dục và các độcgiả quan tâm đến luận văn này.

Hà nội, ngày 28/1/2013

Phan Văn Tác

6

Trang 8

Chương 1: CÁC MÔ HÌNH TUYẾN TÍNH TRONG PHÂN TÍCH THỐNG

1.1 Mô hình Hồi quy tuyến tính cổ điển

1.1.1 Hồi quy tuyến tính đơn

Mô hình hồi quy tuyến tính giữa 2 biến Y và X có dạng sau:

Y= b 0 + b 1 X + e (1.1)

trong đó e là sai số ngẫu nhiên của mô hình Y được gọi biến phụ thuộc haybiến được giải thích hay đáp ứng X được gọi biến độc lập hay biến giải thích.Với (X,Y), giả sử ta đã biết n cặp giá trị quan sát {(X1, Y1),…(Xn,Yn)} tạothành một “đám mây điểm” trên mặt phẳng (X,Y) Hãy tìm một đường thẳng

Trang 9

nên H là ma trận xác đinh dương và điểm dừng chính là điểm cực tiểu của S.

Các giả thiết của mô hình hồi quy tuyến tính đơn

Trang 10

8

Trang 11

1) Các giá trị của biến độc lập X là không ngẫu nhiên (tất định) và

Các tính chất của ước lượng

a) Trung bình của các sai lệch bằng 0 :

Trang 12

(Y i Y )2 = SST, tổng bình phương này thể hiện sựbiến động của Y.

Từ những khái niệm trên, ta có thể định nghĩa hệ số xác định R2 như sau:

R2= Biến động được giải thích bằng hồi quy/ Biến động tổng cộng

R2 = SSR SST

SSE

Trang 13

R2càng gần 1 càng tốt vì khi đó mô hình hồi quy tuyến tính sẽ phù hợp (có ý

nghĩa) vì nó giải thích hầu hết các biến động của Y; phần biến động không

được giải thích bởi hồi quy (SSE) sẽ nhỏ

Các tổng bình phương trên đều gắn với một số gọi là bậc tự do (viết tắt là df)

Ví dụ để tính SST, chỉ cần biết n-1 quan sát độc lập, lúc đó bậc tự do của SST

là n-1 Để tính SSR= b1 2 X iX2 chỉ cần 1 số hạng, bậc tự do của SSR là 1

Bằng phép trừ, ta suy ra để tính biến động không được giải thích bằng hồi

quy, cần (1) –1 = 2 số hạng độc lập, bậc tự do của sai số ngẫu nhiên là

n-2 Với các khái niệm như trên, ta có thể thiết lập bảng phân tích phương sai

đối với hồi quy tuyến tính đơn như sau:

Nguồn biến Bậc tự Tổng bình phương Trung bình bình phương F động do (df)

/(n-2)

Y i MSE= (Y i Y i)

Tổng cộng n-1 SST= (Y iY ) 2

Ta có thể sử dụng bảng phân tích phương sai để kiểm tra tính phù hợp của dữ

liệu với mô hình Cụ thể dữ liệu được coi là phù hợp với mô hình (hay nói

cách khác, mô hình Hồi quy tuyến tính đơn có ý nghĩa đối với số liệu), nếu

F

Khoảng tin cậy và kiểm định giả thuyết và trong phân tích hồi quy

a) Ta muốn kiểm định giả thuyết H0 : b1  0 (đường hồi quy song song với trục

X) so với đối thuyết H1 : b1  0 dựa trên giá trị

Trang 14

( X i  X )2

11

Trang 15

Liên quan đến việc kiểm định H0 , Ta có thể dùng khoảng tin cậy trên đây:Nếu 0 b1l , b1h  thì chấp nhận giả thiết b1=0 Nêu ngược lại, ta bác bỏ giảthiết.

thì chấp nhận giả thuyết H0: b1= 0 Nếu ngược lại, ta bác bỏ giả thuyết H0

b) Tương tự, ta tìm khoảng tin cậy của b0 và kiểm định giả thuyết

Trang 16

Khoảng tin cậy của b0 được xác định bằng b0l, b0h.

12

Trang 17

Ta cũng có thể kiểm định giả thuyết H 0 : "b0  0" so với đối thuyết H1 : " b0 

ˆ

tc b0

ˆ

S b0

rồi so sánh t c với giá trị tới hạn t(1/ 2;n2) có được qua tra bảng Lúc đó,

nếu t c t(1  /2;n2) thì chấp nhận giả thuyết H0: b0= 0 Nếu ngược lại, ta bác bỏgiả thuyết H0

Giá trị trên đạt cực tiểu khi X p X và tăng dần khi X p dịch chuyển xa dần

X theo cả 2 hướng Như vậy, khi khoảng cách giữa X pX càng lớn, sai số

ước lượng càng lớn (xem Hình 1.2)

Các bước cần thực hiện khi dùng mô hình hồi quy tuyến tính đơn

Trang 18

13

Trang 20

9 Tính độ lệch chuẩn của dự báo:

Ví dụ 1: Số lần vào/ ra đĩa và thời gian sử dụng CPU của 7 chương trình máy

tính được thống kê như sau: (14,2) (16,5), (27,7), (42,9) (39,10), (50,13),(83,20) Hãy lập một mô hình tuyến tính để dự đoán thời gian sử dụng CPUtheo số lần vào/ra đĩa

Mô hình hồi quy tuyến tính dự báo thời gian sử dụng CPU có

dạng: Thời gian sử dụng CPU = -0,0083 + 0,2438( số lần vào/ ra

đĩa)

Hình 1 cho ta đồ thị của dữ liệu và đường thẳng hồi quy với độ dốc 0,2438

và hệ số chặn -0.0083 Hệ số xác định R2

tuyến tính đơn là tốt và có ý nghĩa

Trang 21

Hình 1.1: Hồi quy tuyến tính đơn

Hình 1.2: Khoảng tin cậy của dự báo

15

Trang 22

1.1.2 Hồi quy tuyến tính bội

Mô hình và ước luợng BPBN

Mô hình hồi quy tuyến tính bội cho phép ta dự báo một biến đáp ứng Y nhờmột hàm tuyến tính của k biến dự báo X1, X2 , ,X k :

Trang 23

16

Trang 24

Y=Xb + e, (1.6)

trong đó

Y là véc tơ cột gồm n giá trị quan sát được của Y =Y1 ,Y2, ,Y n ;

X là ma trận n hàng k+1 cột, với các giá trị của cột 1 luôn bằng 1; b

véc tơ cột gồm k+1 phần tử b0 , b1 , b k

Ta có thể giả thiết

E (e) =0 và D ( e) = I2 (1.7)trong đó I là ma trận đơn vị cấp n với n phần tử trên đường chéo bằng 1, các

eˆ i Y i  (b0  b1 X 1i  b2 X 2i   b k X ki )

Véc tơ 1 ,2 , ,eˆ n' là véc tơ các sai số Véc tơ b được chọn sao cho tổng

bình phương các sai lệch sau đạt cực tiểu,

e ' e  (Y  Xb) ' (Y  Xb)  Y 'Y  b ' X 'Y  Y ' Xb  b ' X ' Xb  Y 'Y  2b ' X 'Y  b ' X ' Xb (1.9)

(điều này suy ra từ việc b ' X 'Y là ma trận 1  1 tức là hằng số nên ma trận

chuyển vị của nó chính bằng nó, ( (b' X'Y)' Y'Xb )

Ước lượng bình phương bé nhất ˆ của bđược tính bằng cách đạo hàm (1.9) b

theo b rồi gán bằng 0 và được phương trình sau:

( X ' X )b  X 'Y (1.10)Nếu X'X không suy biến, nghiệm của phương trình (1.10) là

Trang 25

1) Các giá trị của các biến độc lập X1 ,X2 , ,X k là không ngẫu nhiên (tất định)

Các tính chất của ước lượng

a) Ước lượng của các hệ số hồi quy là ước lượng không chệch:

là ước lượng không chệch của 2 tức là: Eˆ 2  2

d) Các giá trị dự báo của các tham số và sai lệch không tương quan với

nhau:

cov b, eˆ   0; cov b, ˆ

Các bước thực hiện khi dùng mô hình hồi quy tuyến tính bội

1 Xác định mô hình:

Y  b0  b1 X 1   b k X k  e i

haydưới dạng ma trận

18

Trang 26

8 Tínhđộ lệch chuẩn của sai số: S e

9 Tínhđộ lệch chuẩn của ước lượng:

F 1 ; k , n  k 1

MSE

S b j  S e C jj trong đó C jj là phần tử

Trang 27

thứ j trên đường chéo của ma trận C  (X'X) 

Ví dụ2 Số liệu trong Bảng 1.1 cho biết thời gian sử dụng CPU (mili giây),

dung lượng bộ nhớ (tính bằng kilobyte) và số lần vào/ ra đĩa của7 chương

trình máy tính.Ta muốn tìm một hàm tuyến tính để ước lượng thời gian sử

dụng CPU dạng

Thời gian sử dụng CPU = b0 b1 số lần vào/ ra đĩa + b2 dung lượng bộ nhớ

Bảng 1.1 Số liệu thông số kỹ thuật của chương trình máy tính

Trang 28

Như vậy, ta có phương trình

Thời gian sd CPU = - 0,1614 +0,1182 lần vào ra đĩa +0,0265 dung lượng

bộ nhớ

Bảng các 1.2 trình bàycác giá trị dự báo theo phương trình hồi quy trên đây

cùng các sai số dự báo tương ứng

Bảng 1.2 Giá trị dự báo thời gian sử dụng CPU

Do đó, hệ số xác định của phương trình hồi quy sẽ là

R2  SST SSR  200,

205,7141  0,97 .Ngoài ra, ta còn có hệ số tương quan bội R  0, 97  0, 99 ; độ lệch chuẩn

củasai số

Trang 29

s e  SSE n3  5, 3 / 4 1.2 .

Để minh hoạ cho dự báo, ta xét trường hợp một quan sát riêng lẻ trong tương

lai với x1 100 và x2  550 Giá trị trung bình dự báo được cho bởi

1.2 Mô hình Phân tích phương sai

Phân tích phương sai (ANOVA) là phương pháp phân tích thống kê rất tổng

quát, được sử dụng hữu ích một cách rất rộng rãi cho các bài toán kể từ các

thiết kế thí nghiệm đơn giản đến các mô hình thực sự phức tạp Về cơ bản,

ANOVA được sử dụng để đánh giá cách thức và mức độ thay đổi của giá trị

trung bình của một số biến định lượng, được gọi là biến phụ thuộc hoặc biến

mô tả, trên một tập hợp các điều kiện khác nhau trong cùng một thí nghiệm.

Các điều kiện khác nhau được so sánh trong thí nghiệm được xác định qua

một hay nhiều biến định tính gọi là biến độc lập Nói một cách ngắn gọn,

ANOVA được sử dụng để đánh giá mối quan hệ giữa giá trị trung bình của

một biến phụ thuộc định lượng và giá trị của một hay nhiều biến độc lập định

tính.

Ta có thể biểu diễn tóm tắt cấu trúc của mô hình ANOVA qua phương

trình sau:

Giá trị biến PT = TB chung + Ảnh hưởng của nhân tố + Tương tác + Sai số

Sử dụng ký hiệu tương ứng trong Bảng 1.2, phương trình trên được viết lại

thành

Y = µ + A + B + C + … + AB + AC + BC +…+S(nhóm)

22

Trang 30

trong đó,

Y là giá trị thực nghiệm đo được của đại lượng cần nghiên cứu;

µ là phần trung bình chung cho tất cả các quan sát, đại diện cho hiệu

quả chung của thí nghiệm;

A, B, C,…, là các phần tác động chính của các nhân tố trong mô hình,

ảnh hưởng lên giá trị của đại lượng cần nghiên cứu

AB, BC, CA, … là tương tác giữa các nhân tố, AB, BC, CA là tương tác

hai chiều, trong mô hình còn có thể có các tương tác ba chiều ABC; ABD; ACD;

BCD và tương tác bốn chiều ABCD.

S(nhóm) là sai số ngẫu nhiên trong mô hình, được tính bằng độ sai lệch

giữa giá trị của đại lượng cần nghiên cứu tại mỗi quan sát so với giá trị

trung bình tính riêng cho nhóm chứa quan sát đó

Bảng 1.3 Các thành phần của dữ liệu thực nghiệm trong phân tích phương sai

Khía cạnh của thí nghiệm Thành phần của mô hình Ký hiệu

Biến phụ thuộc định lượng Giá trị đo được của biến Y

Ảnh hưởng chung của thí Giá trị cơ bản (giá trị trung

nhân tố

1.2.1 Mô hình Phân tích phương sai một nhân tố

Giả sử để nghiên cứu chất lượng học tập của sinh viên, ta chọn ngẫu nhiên ra ba

nhóm sinh viên được giảng dạy bằng ba phương pháp khác nhau, sau đó cho làm

bài kiểm tra chung để thu được điểm số phản ánh chất lượng học tập Gọi µ1, µ2,

µ3 là trung bình thật sự của điểm kiểm tra ứng với ba phương pháp giảng dạy

Chúng ta có thể sử dụng phương pháp Phân tích phương sai một

Trang 31

nhân tố để giải quyết bài toán này Bài toán kiểm định giả thuyết trong mô

hình Phân tích phương sai một nhân tố được phát biểu như sau:

Bài toán kiểm định: Thành lập giả thuyết và đối thuyết

H0 :  1 2   K

H1 : h  k (h  k ); h, k 1, 2, K ,

trong đó ˜i là kỳ vọng của biến ngẫu nhiên cần nghiên cứu trong nhóm thứ i,

i=1,…,K Với một mức ý nghĩa α cho trước, ta cần đưa ra quyết định chấp

nhận hay bác bỏ giả thuyết

Dữ liệu của mô hình thiết kế ngẫu nhiên có dạng trong Bảng 1.1

Nếu biến ngẫu nhiên của thiết kế thỏa mãn điều kiện của Định lý 1 và giả

thuyết H0 được xem là đúng, thì theo các Định lý 1 và Định lý 2,các thống kê

có phân phối Khi - bình phương với bậc tự do tương ứng là N-1và K-1 Phần

biến động do sai số gây ra,

Trang 32

24

Trang 33

có phân phối Khi – bình phương với bậc tự do N-K.Từ đó, đại lượng

a) Phương pháp xác suất ý nghĩa X là biến ngẫu nhiên có phân phối Fisher

có bậc tự do (K-1, N-K) ta tính xác suất p= P(X ≥F) với mức ý nghĩa α cho trước, nếu α ≤ p thì ta bác bỏ giả thuyết Ho ; còn nếu α>p thì ta chấp nhận giả

thuyết đó

b) Phương pháp giá trị tới hạn Với mức ý nghĩa α cho trước, tra bảng để xác định giá trị tới hạn F(α;K−1,N−K) , là phân vị 1−α của phân phối Fisher với bậc tự

do (K-1, N-K) Khi ấy, ta bác bỏ giả thuyết Ho nếu F ≥F(α;K−1,N −K)

và chấp nhận giả thuyết nếu F <F(α;K−1,N −K).

Chú ý So sánh các tham số của Bài toán kiểm định 1 với công thức của mô

hình một nhân tố, ta thấy µ i =µ+ A i Như vậy giả thuyết H0 tương đương vớigiả thuyết H0’: A1 =A 2 =…=A n =0.

Mô hình Phân tích phương sai một nhân tố được trình bày lại

thành Y ij    A i  S ( A) ijvớii = 1,…,n; j=1, …m.

25

Trang 34

Trong mô hình đó, để biết được mức độ khác biệt về giá trị trung bình giữacác nhóm có vượt quá độ khác biệt do các sai số ngẫu nhiên gây ra hay không,

ta cần ước lượng độ biến động giữa các nhóm (thể hiện tác động của nhân tố)

và độ biến động nội tại bên trong các nhóm (phản ánh tác động gây sai lệchcủa các yếu tố ngẫu nhiên) Dựa vào số liệu ta đưa ra các phương trình

Y 11 = µ + A 1 + S(A) 11 , Y 12 = µ + A 1 + S(A) 12 , …, Y nm = µ + A n +

S(A) nm Như vậy với mô hình này ta cần tính các giá trị ước lượng

  Y , A i  Y i.   , S(A)ij  Y ij  A i   .Trong đó, Y là trung bình chung của tất cả các phần tử trong dữ liệu, Yi. là trung bình của nhóm thứ i và

j

Đồng thời, ta cần phải tính các tổng bình phương của mô hình, gồm tổng bình

phương độ sai lệch riêng cho từng nhóm A i , ký hiệu là SS A; tổng bình phương

độ sai lệch nội tại trong các nhóm tương tác S(A) ij , ký hiệu là SS S(A); tổngbình phương trung bình trung SSµ và tổng toàn phần các bình phương độ lệch

SS Y Từ đó ta có phương trình SS Y = SS µ + SS A +SS S(A) Như vậy,

SS A  n j ( y j  y )2

với y j là trung bình của nhóm j

Sau khi có các tổng bình phương độ sai lệch như trên, ta có thể tính các giá trịtrung bình bình phương độ sai lệch (là ước lượng của các độ biến động) bằng

Trang 35

cách lấy từng tổng bình phương độ sai lệch chia cho bậc tự do tương ứng Ta

+ Bậc tự do của giá trị trung bình µ luôn bằng 1(df µ =1).

+ Bậc tự do của nhân tố là số nhóm trừ đi 1 (df A = số nhóm -1= K-1).

+ Bậc tự do của sai số ngẫu nhiên (df S(A) = số đối tượng -số nhóm = N-K).

Nói một cách ngắn gọn, các độ biến động của mô hình được ước lượng bằng

công thức MS=S

dfS , với SS là tổng bình phương độ sai lệch, df là ký hiệu của

bậc tự do tương ứng Ta tóm tắt các thành phần của phương pháp Phân tích

phương sai một nhân tố như trong Bảng 1.4

Bảng 1.4 Tóm tắt các thành phần trongPhân tích Phương sai một nhân tố

+ F là tiêu chuẩn kiểm định của giả thuyết thống kê H0

Ta thấy nếu giả thuyết H0 đúng và sai số trong các nhóm có cùng phân phối

với phương sai như nhau, thì F có phân phối Fisher với bậc tự do K-1 và K.Như vậy, ta sẽ bác bỏ giả thuyết H 0 nếu F ≥ Fk-1, N-k(1-α) Ngược lại, ta

N-chấp nhận giả thuyết H 0 nếu F < Fk-1, N-k(1-α)

27

Trang 36

1.2.2 Mô hình Phân tích phương sai hai nhân tố

Giả sử bài toán có dữ liệu sau:

Các mức của Các mức của nhân tố thứ hai (B) nhân tố thứ nhất

Trong đó, a là mức của nhân tố thứ nhất, b là mức của nhân tố thứ hai,

a b

N  n(i , j)

là tổng số các quan sát trong số liệu.Với dữ liệu ở trên ta có các bài toán sau

Bài toán kiểm định Đánh giá tác động của nhân tố A:

H0A: µA1= µA2 = µA3 =…= µAa

H1A: µAh ≠ µAk với h≠ k nào đó; h, k=1,2, …a

với µ Ai là kỳ vọng của Y trong nhóm thứ i (i=1,…,a) của nhân tố A.

Bài toán kiểm định Đánh giá tác động của nhân tố B:

H0B: µB1= µB2 = µB3 =…= µBa

H1B: µBh ≠ µBk với h≠ k nào đó; h, k=1,2, …b

với µ Bi là kỳ vọng củaY trong nhóm thứ i (i=1,…,b) của nhân tố B

Bài toán kiểm định Đánh giá tác động tương tác của nhân tố A và B:

H0AB: µAB1= µAB2 =…= µABab

H1AB: µABh ≠ µABk với h≠ k nào đó; h, k=1,2, …ab

Trang 37

28

Trang 38

với µABi là kỳ vọng các biến ngẫu nhiên Y trong nhóm thứ i (i=1,…,ab)

của nhân tố A và B

Để giải quyết bài toán trên ta đưa bài toán mô hình Phân tích phương sai hainhân tố với tương tác giữa các nhân tố có dạng

Y ijk = µ + A i +B j + AB ij +S(AB) ijk

Trong mô hình hai nhân tố có hai nhân tố chính là A, B và có sự tương tác củahai nhân tố AB trên đây,Yijk là giá trị quan sát thứ k của Y trên nhóm thứ icủaA và nhóm thứ j của B; ˜ là trung bình mẫu, số hạng Ai là hiệu quả donhân tố A gây ra ở mức thứ i; số hạng Bj là hiệu quả có được ở mức thứ j củanhân tố B; số hạng ABij là hiệu quả do sự tương tác giữa mức thứ i của A vàmức thứ j của B; còn S(AB)ijk là sai số ngẫu nhiên

Ta thực hiện các tính toán cho mô hình hai nhân tố theo các bước

+ Ước lượng kỳ vọng ˜ bằng trung bình mẫu,

Y ijk , N

i , j , k

trong đó N là tổng số các quan sát;

+ Ước lượng hiệu quả chính của mỗi nhân tố trên một mức của nhân tố

đó bằng hiệu số của giá trị trung bình lấy trong mức tương ứng trừ đi ước

lượng trung bình chung của mẫu,

Trang 39

SSS(AB)  S ( AB)ijk2

Các tiêu chuẩn kiểm định của mô hình được tính bằng các trung bình bình

phương MS=S

dfS , trong đó SS là ký hiệu tổng bình phương, df là ký hiệu của

bậc tự do

+ Bậc tự do cho giá trị trung bình µ luôn bằng 1(df µ=1)

+ Bậc tự do cho nhân tố chính là số nhóm của nhân tố trừ đi 1(df A= Số

nhóm của nhân tố A trừ 1, df B= Số nhóm của nhân tố B trừ 1)

+ Bậc tự do cho tương tác bằng tích các bậc tự do của các nhân tố

chính, df AB = df A df B

+ Bậc tự do cho sai số ngẫu nhiên (df S(AB)= Số đối tượng – Tổng số nhóm

tương tác của tất cả các nhân tố)

Ta có thể tóm tắt các đại lượng cần tính toán trong bảng ANOVA dưới đây

Nguồn sai số Bậc tự do Tổng bình Trung bình bình phương Tiêu chuẩn kiểm định

Trang 40

Trong bảng ANOVA trên ta có

+ µ là giá trị trung bình chung của mẫu

+ A, B là các nhân tố chính

+ AB là tương tác giữa hai nhân tố

+S(AB) là sai số ngẫu nhiên

Ngày đăng: 20/11/2020, 09:35

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w