Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
MAI THỊ HOA
THỬ NGHIỆM PHÂN TÍCH THỐNG KÊ SỐ LƯỢNG
TUYỂN SINH ĐẠI HỌC 2016
LUẬN VĂN THẠC SĨ KHOA HỌC CHUYÊN NGÀNH: TOÁN ỨNG DỤNG
Hà Nội - 2019
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
MAI THỊ HOA
THỬ NGHIỆM PHÂN TÍCH THỐNG KÊ SỐ LƯỢNG
TUYỂN SINH ĐẠI HỌC 2016
LUẬN VĂN THẠC SĨ KHOA HỌC CHUYÊN NGÀNH: TOÁN ỨNG DỤNG
Người hướng dẫn khoa học:
PGS.TS HỒ ĐĂNG PHÚC
Hà Nội - 2019
Trang 3i
LỜI CAM ĐOAN
Tôi xin cam đoan bài luận văn “Thử nghiệm phân tích thống kê số lượng tuyển sinh Đại học 2016” là do tôi thực hiện với sự hướng dẫn của PGS.TS Hồ
Đăng Phúc Đây không phải là bản sao chép của bất kỳ một luận văn nào khác
Tôi xin hoàn toàn chịu trách nhiệm về những nội dung mà tôi đã trình bày trong luận văn này
Hà Nội, ngày 07 tháng 04 năm 2019
Tác giả
Mai Thị Hoa
Trang 4ii
LỜI CẢM ƠN
Lời đầu tiên tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc nhất đến thầy hướng dẫn, PGS.TS Hồ Đăng Phúc, người đã tận tình hướng dẫn, chỉ bảo để luận văn này được hoàn thành, cũng như giúp tác giả có thêm kiến thức, niềm đam
mê nghiên cứu khoa học Bên cạnh đó tác giả cũng xin chân thành cảm ơn sự dạy dỗ, chỉ bảo tận tình và quan tâm của các thầy cô trong Viện Toán ứng dụng và Tin học trong suốt thời gian tác giả theo học và nghiên cứu
Cuối cùng tác giả xin cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động viên, khích lệ tác giả trong suốt thời gian qua
Trong suốt quá trình học tập và nghiên cứu, tác giả cũng không thể tránh khỏi những thiếu sót Rất mong nhận được sự thông cảm và góp ý từ các thầy cô và tất cả mọi người
Xin trân trọng cảm ơn!
Trang 5iii
Mục lục
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
Mục lục iii
Danh mục bảng biểu v
LỜI MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích nghiên cứu 2
3 Đối tượng, phạm vi nghiên cứu 2
4 Phương pháp nghiên cứu 2
5 Đóng góp của luận văn 2
CHƯƠNG I: CƠ SỞ LÝ THUYẾT 3
1.1 Giới thiệu mô hình hồi quy 3
1.2 Khái niệm số chênh và tỷ số chênh 5
1.3 Hồi quy logit đơn biến 7
1.3.1 Mô hình 7
1.3.2 Ước lượng tham số của mô hình hồi quy logit đơn biến 8
1.3.3 Ý nghĩa của tham số trong mô hình hồi quy logit đơn biến 10
1.3.4 Ví dụ 11
1.4 Hồi quy Logit đa biến 12
1.4.1 Mô hình 12
1.4.2 Ước lượng tham số của mô hình hồi quy Logit đa biến 12
1.4.3 Mã hóa lại các biến độc lập định tính nhận nhiều giá trị 14
1.4.4 Ý nghĩa của tham số trong mô hình hồi quy Logit đa biến 15
1.5 Kiểm định giả thuyết đối với mô hình hồi quy Logit 16
1.5.1 Kiểm định sự phù hợp của mô hình 16
1.5.2 Kiểm định hệ số hồi quy 18
Trang 6iv
CHƯƠNG II: ỨNG DỤNG MÔ HÌNH HỒI QUY LOGIT 21
VÀO PHÂN TÍCH SỐ LIỆU TUYỂN SINH ĐẠI HỌC NĂM 2016 21
2.1 Mô tả số liệu 21
2.2 Kết quả phân tích 26
2.2.1 Nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng 26 2.2.2 Nhân tố ảnh hưởng đến khả năng chọn ngành kỹ thuật 32
2.2.3 Nhân tố ảnh hưởng đến khả năng đăng ký vào Cao đẳng 36
2.3 Bàn luận và kiến nghị 41
2.3.1 Về nhân tố ảnh hưởng đến khả năng trúng tuyển 41
2.3.2 Về nhân tố ảnh hưởng đến việc chọn ngành kỹ thuật 42
2.3.3 Về nhân tố ảnh hưởng đến việc đăng ký vào cao đẳng 44
KẾT LUẬN CHUNG 46
TÀI LIỆU THAM KHẢO 47
Trang 7v
Danh mục bảng biểu
Bảng 1 Mối tương quan giữa hút thuốc lá và mắc bệnh phổi 5
Bảng 2 Mô hình hồi quy logit đơn biến mô tả mối quan hệ giữa biến phụ thuộc “Đăng ký vào HV Ngân hàng” và biến độc lập “Giới tính” 11 Bảng 3 Phân bố của học sinh theo trường đăng kí và khu vực ưu tiên 22
Bảng 4 Phân bố của học sinh theo khu vực và giới tính 23
Bảng 5 Phân bố của học sinh theo đăng ký ngành kỹ thuật và giới tính 23
Bảng 6 Phân bố của học sinh theo tuổi và giới tính 24
Bảng 7 Các tham số thống kê cơ bản của điểm số các môn thi tốt nghiệp THPT 24
Bảng 8 Mô hình hồi quy logit xác định các yếu tố ảnh hưởng đến khả năng trúng tuyển 28
Bảng 8’ Mô hình hồi quy logit rút gọn với các yếu tố ảnh hưởng khả năng trúng tuyển 29
Bảng 9 Mô hình hồi quy logit xác định các yếu tố ảnh hưởng đến khả năng chọn kỹ thuật 33
Bảng 9’ Mô hình hồi quy logit rút gọn với các yếu tố ảnh hưởng khả năng chọn kỹ thuật 34
Bảng 10 Mô hình hồi quy logit xác định các yếu tố ảnh hưởng đến khả năng chọn cao đẳng 38
Bảng 10’ Mô hình hồi quy logit rút gọn với các yếu tố ảnh hưởng khả năng chọn tuyển cao đẳng 39
Trang 8Tới thời gian cuối cấp, học sinh trung học phổ thông luôn băn khoăn mình nên chọn trường nào, theo ngành nào và quan trọng là phải phù hợp với sức học của mình Đôi khi chỉ vì yêu thích một ngành học, trường nổi tiếng mà chọn trường đại học quá sức học của bản thân khiến cho học sinh không tìm được trường phù hợp và không qua được kỳ tuyển chọn vào đại học/ cao đẳng
Nhằm giải đáp phần nào các vấn đề trên, luận văn này định hướng vào đề tài nghiên cứu “Thử nghiệm phân tích thống kê số lượng tuyển sinh Đại học 2016” Cụ thể, trong luận văn đã sử dụng mô hình hồi quy logit để xác định các nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng, khả năng chọn ngành học của học sinh để từ đó có thể đưa ra một số khuyến nghị đối với công tác tuyển sinh đại học/ cao đẳng
Luận văn này bao gồm phần mở đầu, phần nội dung và phần kết luận Phần nội dung được chia thành 2 chương:
Chương 1 (Cơ sở lý thuyết): Giới thiệu tổng quan về cơ sở lý thuyết của các
mô hình hồi quy logit đơn biến và đa biến, trình bày phương pháp xây dựng mô hình, cách diễn giải ý nghĩa các hệ số trong mô hình hồi quy logit
Chương 2 (Ứng dụng mô hình hồi quy logit vào phân tích số liệu tuyển sinh đại học năm 2016): Thông qua việc áp dụng phần mềm SPSS để xử lý bộ số liệu
tuyển sinh đại học năm 2016 của 12 trường miền Bắc, chương này tiến hành xây dựng các mô hình hồi quy logit mô tả lần lượt mối quan hệ giữa khả năng trúng tuyển đại học/ cao đẳng của học sinh; khả năng lựa chọn nhóm ngành kỹ thuật và khả năng lựa chọn hệ cao đẳng với các nhân tố tiềm năng như điểm số các môn thi
Trang 92
tốt nghiệp; giới tính; tuổi; khu vực cư trú; nhóm ưu tiên; … Kết quả ước lượng của
mô hình được phân tích để xác định các nhân tố ảnh hưởng đến các khả năng trúng tuyển; khả năng lựa chọn nhóm ngành kỹ thuật và khả năng chọn hệ cao đẳng của học sinh dự tuyển vào các trường Từ đó Luận văn đưa ra một vài bàn luận và kiến nghị đối với công tác tuyển sinh đại học/ cao đẳng
2 Mục đích nghiên cứu
Nghiên cứu này có mục đích sử dụng phương pháp thống kê để xác định các nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng, khả năng lựa chọn ngành kỹ thuật và khả năng lựa chọn đăng ký cao đẳng của học sinh
3 Đối tượng, phạm vi nghiên cứu
Đối tượng nghiên cứu: Một số vấn đề về phương thức tuyển sinh đại học và cao đẳng dựa trên kết quả thi tốt nghiệp trung học phổ thông của học sinh, mối liên quan giữa các yếu tố - đặc điểm cá nhân của học sinh với kết quả tuyển sinh và khuynh hướng lựa chọn ngành nghề của học sinh
Phạm vi nghiên cứu: Số liệu tuyển sinh đại học năm 2016 của 12 trường đại học ở miền Bắc, bao gồm các thông tin cá nhân của học sinh; điểm số các môn thi tốt nghiệp trung học phổ thông; thông tin đăng ký tuyển sinh và kết quả tuyển sinh
4 Phương pháp nghiên cứu
Luận văn sử dụng các phương pháp thống kê để phân tích, xây dựng mô hình đánh giá các nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng, khả năng lựa chọn ngành kỹ thuật và khả năng lựa chọn đăng ký cao đẳng của học sinh
5 Đóng góp của luận văn
Luận văn này là một thử nghiệm sử dụng phương pháp phân tích thống kê vào nghiên cứu các vấn đề trong tuyển sinh đại học/ cao đẳng Phương pháp phân tích thống kê này có thể triển khai áp dụng rộng rãi hơn trong các nghiên cứu về công tác giáo dục – đào tạo nói riêng và các nghiên cứu trong các ngành khoa học thực nghiệm nói chung, như nông nghiệp; lâm nghiệp; y học; sinh học; môi trường; kinh tế; tài chính ; bảo hiểm; xã hội học …
Trang 101 2
( , , , k)
Y f X X X Trong đó Y là biến đáp ứng (biến phụ thuộc),
X X1, 2, ,X k là các biến giải thích (biến độc lập),
là sai số (phần dư) hồi quy
Các mô hình hồi quy thông thường đã được trình bày trong sách giáo khoa liên quan đến trường hợp biến đáp ứng là biến định lượng, đơn giản nhất là mô hình hồi quy tuyến tính đơn, có dạng
E Y b Tuy nhiên, có nhiều bài toán thực tế lại xuất hiện biến đáp ứng không phải là biến liên tục mà là biến rời rạc nhận vài giá trị định tính, trong một số trường hợp chỉ nhận hai giá trị đối kháng, chẳng hạn sản phẩm mới có được chấp nhận hay không, người vay có trả được nợ hay không, doanh nghiệp có phá sản hay không, khách hàng có thực hiện giao dịch hay không, … Những biến có hai biểu hiện như vậy sẽ được mã hóa thành hai giá trị 0 và 1, được gọi là biến nhị phân Khi biến phụ thuộc ở dạng nhị phân như vậy, chúng ta có thể áp dụng được những mô hình nào? Xét biến phụ thuộc Y nhận giá trị 1 với xác suất p và giá trị 0 với xác suất
1 p, cần xây dựng mô hình mô tả mối quan hệ giữa Y (hoặc p) với một số biến độc lập X X1, 2, ,X k Các nhà nghiên cứu thống kê đã từng bước đề xuất một số mô hình để giải quyết vấn đề đó
Mô hình 1: Mô hình hồi quy tuyến tính
( ) k k
pE Y X X X
Trang 114
Nhìn vào phương trình này, ta nhận thấy vế trái của mô hình chỉ nhận các giá trị trong đoạn [0,1], mặc dù vế phải có thể nhận giá trị bất kì thuộc khoảng (-∞,+∞) Một số nhà nghiên cứu đã đưa ra giải pháp là sử dụng mô hình 1 và loại bỏ các quan sát bất hợp lý, nhưng nhược điểm của giải pháp đó là chỉ dùng được cho rất ít bộ dữ liệu, nên không được đa số các nhà nghiên cứu chấp nhận
Mô hình 2: Dùng hàm liên kết lập mô hình
tỷ lệ chênh lệch giữa hai khả năng xảy ra sự kiện và không xảy ra sự kiện được thể hiện như sau:
Trang 125
Ưu điểm của mô hình này là giải quyết triệt để các nhược điểm của những mô hình được đề xuất trước đó và trùng hợp với cách tiếp cận phân tích tỷ số chênh của Dịch tễ học
1.2 Khái niệm số chênh và tỷ số chênh
Số chênh (Odd) của biến cố X là tỷ số giữa xác suất để biến cố X xảy ra và
xác suất để biến cố X không xảy ra Ta có,
Trong nghiên cứu dịch tễ, người ta thường so sánh tần suất “mắc bệnh” giữa hai tổng thể “phơi nhiễm” (thử) và “không phơi nhiễm” (chứng)
Ví dụ: Khi nghiên cứu về bệnh phổi, bác sĩ cần so sánh tần suất mắc bệnh phổi của nhóm người hút thuốc (phơi nhiễm) và nhóm người không hút thuốc (không phơi nhiễm) Bảng dữ liệu dưới đây nghiên cứu mối tương quan giữa hút thuốc lá và mắc bệnh phổi
Bảng 1 Mối tương quan giữa hút thuốc lá và mắc bệnh phổi
Phơi nhiễm Không phơi nhiễm
Trong đó: a là số người hút thuốc lá và mắc bệnh
b là số người hút thuốc lá và không mắc bệnh
c là số người không hút thuốc và mắc bệnh
d là số người không hút thuốc và không mắc bệnh
Ta đưa ra một số khái niệm sau:
Trang 13Sử dụng thuật ngữ số chênh của dịch tễ học, phương trình (1.3) có thể viết lại thành
Số chênh = exp( 0) * exp( 1X1) * exp( kXk) (1.4)
Biểu thức này sẽ được dùng để diễn giải ý nghĩa của các hệ số hồi quy trong
mô hình logit đơn biến và đa biến sẽ được trình bày tiếp dưới đây
Trang 14Gọi p P Y ( 1| X )là xác suất có điều kiện để cho Y=1 khi X xảy ra Giả
sử p có mối quan hệ với biến X , nhƣng ta không thể tìm trực tiếp mối quan hệ này vì p chỉ nhận giá trị thuộc [0,1] trong khi X nhận giá trị bất kì Do đó, ta có thể thay thế bằng mối quan hệ giữa Ln p /(1 p ) và X nhƣ sau:
p
= Logit( p) ,
0, 1 là hai hệ số hồi quy
Để đơn giản kí hiệu, chúng ta sẽ sử dụng x P Y ( 1| X ) Khi đó, mô hình hồi quy logit có dạng
0 1
0 11
X X
e X
Trang 158
1.3.2 Ước lượng tham số của mô hình hồi quy logit đơn biến
Để ước lượng các tham số trong mô hình hồi quy thông thường người ta dùng phương pháp bình phương bé nhất Tuy nhiên, trong mô hình hồi quy logit rất phức tạp, vì thế ta sử dụng phương pháp ước lượng hợp lí cực đại
Giả sử ta có n mẫu quan sát độc lập ( , x y ), i = 1,…,n Gọi i i ( ) x là xác suất
có điều kiện để y= 1 khi x xảy ra, khi đó 1 ( ) x là xác suất có điều kiện để y= 0 khi x xảy ra Từ phương trình (1.5) ta có:
e x
x n
Trang 16i i
i
y
x n
e e
e y
Trang 171.3.3 Ý nghĩa của tham số trong mô hình hồi quy logit đơn biến
Đối với mô hình hồi quy logit đơn biến, biểu thức (1.4) thu gọn lại thành
Số chênh = exp(0)*exp(1X) (1.6)
Từ công thức (1.6), có thể hiểu hệ số cho biết khi X tăng lên một đơn vị thì logarit cơ số e của số chênh tăng 1 đơn vị Xét đến chiều hướng có thể thấy nếu hệ
số 1 mang dấu dương thì X sẽ làm tăng khả năng Y nhận giá trị 1 trong khi hệ số
này mang dấu âm sẽ làm giảm khả năng này
Để diễn giải ý nghĩa của các hệ số hồi quy, ta có thể xây dựng kịch bản thay đổi xác suất cho từng mức tác động của X khi xác suất ban đầu là một giá trị nào đó
Gọi p0là xác suất ban đầu và p1 là xác suất thay đổi khi X tăng thêm 1 đơn
vị Ta có:
0 1
0 0
1
X
p
e p
Do đó,
Trang 18Như vậy, hệ số e1 sẽ được nhân thêm vào số chênh khi X tăng thêm 1 đơn
vị Đối với trường hợp X là biến nhị phân, e1 chính là tỷ số chênh so sánh giữa
nhóm đối tượng nhận giá trị X 1 với nhóm đối tượng nhận giá trị X 0
Mặt khác, khi 10 ta có
0
0 0
1
p
e p
0 0
0
1
e p
Bảng 2 Mô hình hồi quy logit đơn biến mô tả quan hệ giữa biến phụ thuộc
“Đăng ký vào HV Ngân hàng” và biến độc lập “Giới tính”
B Sai số
chuẩn
Thống kê Wald Bậc tự do
Xác suất ý nghĩa Exp(B)
Trang 1912
nhóm học sinh Nữ, nhận giá trị X 0, xác suất để các đối tƣợng này đăng ký vào Học viện Ngân hàng đƣợc ƣớc lƣợng bằng
0 0
( )
1
g g
e e
X X
1.4.2 Ƣớc lƣợng tham số của mô hình hồi quy Logit đa biến
Giả sử ta có n mẫu quan sát độc lập xi, yi Gọi
yi là giá trị của biến phụ thuộc, i = 1,…,n
xij là các giá trị của biến độc lập, i = 1…n, j = 1,…,k
Trang 20i
x
e e
1
k j j
i
j j
j
i
e L
Trang 21k j j
k j j
k j j
0 0
n
i n
1.4.3 Mã hóa lại các biến độc lập định tính nhận nhiều giá trị
Trong một số trường hợp biến độc lập là rời rạc hoặc là biến định tính, ví dụ như địa chỉ cư trú của học sinh, khu vực ưu tiên Để đưa những biến này vào mô hình ta sử dụng phương pháp thiết kế biến (lập biến giả)
Giả sử, biến độc lập là “Khu vực ưu tiên” của học sinh có khả năng nhận bốn giá trị là: "đô thị lớn", "đô thị nhỏ/ ngoại thành", “nông thôn” và "miền núi" Ta thiết kế ba biến giả D1, D2 và D3 Khi đó
Tổ hợp giá trị (D1 =0, D2 =0, D3=0) tương ứng với học sinh cư trú tại khu vực “đô thị lớn”;
Tổ hợp giá trị (D1 =1, D2 =0, D3=0) tương ứng với học sinh cư trú tại khu vực “đô thị nhỏ/ ngoại thành”;
Tổ hợp giá trị (D1 =0, D2 =1, D3=0) tương ứng với học sinh cư trú tại khu vực “nông thôn”;
Trang 22 Tổ hợp giá trị (D1 =0, D2 =0, … , D(k−1)=1) tương ứng với khả năng biến độc
lập nguyên thủy nhận giá trị thứ k
Trong một số trường hợp chúng ta có thể xây dựng biến giả từ một biến liên tục Ví dụ có biến tuổi liên tục nhưng nghiên cứu lại quan tâm tới các nhóm tuổi Vì vậy ta có thể phân chia các nhóm tuổi và coi các nhóm này là các khả năng xảy ra của một biến tính, sau đó thực hiện thiết kế biến giả như đã trình bày trên đây Khi xây dựng biến giả từ một biến liên tục ta cần chú ý một số điều sau:
* Khoảng cách giữa các nhóm nên bằng nhau
* Cỡ các nhóm nên bằng nhau
* Cân nhắc ý nghĩa thực tế của kết quả phân nhóm
Chú ý là trong mô hình hồi quy logit (và cả trong các mô hình hồi quy khác), các biến độc lập luôn luôn phải được xuất hiện dưới dạng biến định lượng hoặc biến định tính nhị phân
1.4.4 Ý nghĩa của tham số trong mô hình hồi quy Logit đa biến
Tương tự như mô hình hồi quy logit đơn biến, đối với mô hình hồi quy logit
đa biến ta cũng có
Số chênh = exp( 0) * exp( 1X1) * exp( kXk)
Trang 2316
Từ công thức trên có thể hiểu hệ số k cho biết khi X k tăng lên một đơn vị thì logarit cơ số e của số chênh tăng k đơn vị Xét đến chiều hướng có thể thấy nếu hệ số k mang dấu dương thì X k sẽ làm tăng khả năng Y nhận giá trị 1, trong khi hệ số âm sẽ làm giảm khả năng này
Để diễn giải ý nghĩa của các hệ số hồi quy, ta có thể xây dựng kịch bản thay đổi xác suất cho từng mức tác động của X k khi xác suất ban đầu là một giá trị nào đó Gọi p0là xác suất ban đầu và p1 là xác suất thay đổi khi X k tăng thêm 1 đơn
vị, ta có:
0 0
1
X k X k
p
e p
k
p p
0
k k
p e p
1.5 Kiểm định giả thuyết đối với mô hình hồi quy Logit
1.5.1 Kiểm định sự phù hợp của mô hình
Bài toán kiểm tra sự phù hợp của mô hình với dữ liệu dựa trên việc kiểm định giả thuyết
H : 1 2 k 0
Trang 24
17
Nếu giả thuyết đúng thì xác suất để biến phụ thuộc Y nhận giá trị bằng 1 không phụ thuộc vào giá trị của các biến độc lập Khi đó
0 0
1
H
e L
K
i
e L
K
L G
L
Định lý 1: Nếu giả thuyết H đúng thì đại lượng thống kê G có phân phối tiệm cận
phân phối 2 với k bậc tự do
Với hiệu lực của định lý trên đây, bài toán kiểm định giả thuyết về sự phù hợp của mô hình hồi quy logit đối với dữ liệu được tiến hành qua các bước dưới đây
Trang 25- Nếu p ta bác bỏ H, khẳng định rằng trong số các hệ số 1, 2, …, k
phải có một hệ số nào đó thực sự khác 0, có ít nhất một biến độc lập có vai trò ảnh
hưởng đến xác suất để biến phụ thuộc Y nhận giá trị bằng 1 Lúc đó có thể sử dụng
mô hình hồi quy để mô tả mối quan hệ giữa biến phụ thuộc Y và các biến độc lập
Như vậy, phương trình hồi quy thực sự có ý nghĩa, mô hình thành lập được tốt
1.5.2 Kiểm định hệ số hồi quy
Bài toán kiểm tra vai trò của một biến độc lập X j nào đó đối với giá trị của Y (tức là đối với giá trị của p) dựa trên kiểm định giả thuyết
Trang 2619
Trong đó se j là sai số chuẩn của ƣớc lƣợng tham số j , đƣợc tính nhƣ sau
Với mẫu gồm n quan sát độc lập x1j, x2j, , xnj, j=1,…,k, gọi 0, j lần lƣợt
là ƣớc lƣợng hợp lý cực đại của 0 và j, j=1,…,k Đồng thời gọi p x ( )là xác suất
ƣớc lƣợng đƣợc của mô hình cho giá trị x Khi đó ta có:
k j j
Khi đó, sai số chuẩn của 0, j lần lƣợt là
i
x se
SS w
Trang 27( )
j j se