1. Trang chủ
  2. » Luận Văn - Báo Cáo

Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016

54 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 54
Dung lượng 1,14 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016 Thử nghiệm phân tích thống kê số lượng tuyển sinh đại học 2016

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

MAI THỊ HOA

THỬ NGHIỆM PHÂN TÍCH THỐNG KÊ SỐ LƯỢNG

TUYỂN SINH ĐẠI HỌC 2016

LUẬN VĂN THẠC SĨ KHOA HỌC CHUYÊN NGÀNH: TOÁN ỨNG DỤNG

Hà Nội - 2019

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

MAI THỊ HOA

THỬ NGHIỆM PHÂN TÍCH THỐNG KÊ SỐ LƯỢNG

TUYỂN SINH ĐẠI HỌC 2016

LUẬN VĂN THẠC SĨ KHOA HỌC CHUYÊN NGÀNH: TOÁN ỨNG DỤNG

Người hướng dẫn khoa học:

PGS.TS HỒ ĐĂNG PHÚC

Hà Nội - 2019

Trang 3

i

LỜI CAM ĐOAN

Tôi xin cam đoan bài luận văn “Thử nghiệm phân tích thống kê số lượng tuyển sinh Đại học 2016” là do tôi thực hiện với sự hướng dẫn của PGS.TS Hồ

Đăng Phúc Đây không phải là bản sao chép của bất kỳ một luận văn nào khác

Tôi xin hoàn toàn chịu trách nhiệm về những nội dung mà tôi đã trình bày trong luận văn này

Hà Nội, ngày 07 tháng 04 năm 2019

Tác giả

Mai Thị Hoa

Trang 4

ii

LỜI CẢM ƠN

Lời đầu tiên tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc nhất đến thầy hướng dẫn, PGS.TS Hồ Đăng Phúc, người đã tận tình hướng dẫn, chỉ bảo để luận văn này được hoàn thành, cũng như giúp tác giả có thêm kiến thức, niềm đam

mê nghiên cứu khoa học Bên cạnh đó tác giả cũng xin chân thành cảm ơn sự dạy dỗ, chỉ bảo tận tình và quan tâm của các thầy cô trong Viện Toán ứng dụng và Tin học trong suốt thời gian tác giả theo học và nghiên cứu

Cuối cùng tác giả xin cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động viên, khích lệ tác giả trong suốt thời gian qua

Trong suốt quá trình học tập và nghiên cứu, tác giả cũng không thể tránh khỏi những thiếu sót Rất mong nhận được sự thông cảm và góp ý từ các thầy cô và tất cả mọi người

Xin trân trọng cảm ơn!

Trang 5

iii

Mục lục

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

Mục lục iii

Danh mục bảng biểu v

LỜI MỞ ĐẦU 1

1 Lý do chọn đề tài 1

2 Mục đích nghiên cứu 2

3 Đối tượng, phạm vi nghiên cứu 2

4 Phương pháp nghiên cứu 2

5 Đóng góp của luận văn 2

CHƯƠNG I: CƠ SỞ LÝ THUYẾT 3

1.1 Giới thiệu mô hình hồi quy 3

1.2 Khái niệm số chênh và tỷ số chênh 5

1.3 Hồi quy logit đơn biến 7

1.3.1 Mô hình 7

1.3.2 Ước lượng tham số của mô hình hồi quy logit đơn biến 8

1.3.3 Ý nghĩa của tham số trong mô hình hồi quy logit đơn biến 10

1.3.4 Ví dụ 11

1.4 Hồi quy Logit đa biến 12

1.4.1 Mô hình 12

1.4.2 Ước lượng tham số của mô hình hồi quy Logit đa biến 12

1.4.3 Mã hóa lại các biến độc lập định tính nhận nhiều giá trị 14

1.4.4 Ý nghĩa của tham số trong mô hình hồi quy Logit đa biến 15

1.5 Kiểm định giả thuyết đối với mô hình hồi quy Logit 16

1.5.1 Kiểm định sự phù hợp của mô hình 16

1.5.2 Kiểm định hệ số hồi quy 18

Trang 6

iv

CHƯƠNG II: ỨNG DỤNG MÔ HÌNH HỒI QUY LOGIT 21

VÀO PHÂN TÍCH SỐ LIỆU TUYỂN SINH ĐẠI HỌC NĂM 2016 21

2.1 Mô tả số liệu 21

2.2 Kết quả phân tích 26

2.2.1 Nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng 26 2.2.2 Nhân tố ảnh hưởng đến khả năng chọn ngành kỹ thuật 32

2.2.3 Nhân tố ảnh hưởng đến khả năng đăng ký vào Cao đẳng 36

2.3 Bàn luận và kiến nghị 41

2.3.1 Về nhân tố ảnh hưởng đến khả năng trúng tuyển 41

2.3.2 Về nhân tố ảnh hưởng đến việc chọn ngành kỹ thuật 42

2.3.3 Về nhân tố ảnh hưởng đến việc đăng ký vào cao đẳng 44

KẾT LUẬN CHUNG 46

TÀI LIỆU THAM KHẢO 47

Trang 7

v

Danh mục bảng biểu

Bảng 1 Mối tương quan giữa hút thuốc lá và mắc bệnh phổi 5

Bảng 2 Mô hình hồi quy logit đơn biến mô tả mối quan hệ giữa biến phụ thuộc “Đăng ký vào HV Ngân hàng” và biến độc lập “Giới tính” 11 Bảng 3 Phân bố của học sinh theo trường đăng kí và khu vực ưu tiên 22

Bảng 4 Phân bố của học sinh theo khu vực và giới tính 23

Bảng 5 Phân bố của học sinh theo đăng ký ngành kỹ thuật và giới tính 23

Bảng 6 Phân bố của học sinh theo tuổi và giới tính 24

Bảng 7 Các tham số thống kê cơ bản của điểm số các môn thi tốt nghiệp THPT 24

Bảng 8 Mô hình hồi quy logit xác định các yếu tố ảnh hưởng đến khả năng trúng tuyển 28

Bảng 8’ Mô hình hồi quy logit rút gọn với các yếu tố ảnh hưởng khả năng trúng tuyển 29

Bảng 9 Mô hình hồi quy logit xác định các yếu tố ảnh hưởng đến khả năng chọn kỹ thuật 33

Bảng 9’ Mô hình hồi quy logit rút gọn với các yếu tố ảnh hưởng khả năng chọn kỹ thuật 34

Bảng 10 Mô hình hồi quy logit xác định các yếu tố ảnh hưởng đến khả năng chọn cao đẳng 38

Bảng 10’ Mô hình hồi quy logit rút gọn với các yếu tố ảnh hưởng khả năng chọn tuyển cao đẳng 39

Trang 8

Tới thời gian cuối cấp, học sinh trung học phổ thông luôn băn khoăn mình nên chọn trường nào, theo ngành nào và quan trọng là phải phù hợp với sức học của mình Đôi khi chỉ vì yêu thích một ngành học, trường nổi tiếng mà chọn trường đại học quá sức học của bản thân khiến cho học sinh không tìm được trường phù hợp và không qua được kỳ tuyển chọn vào đại học/ cao đẳng

Nhằm giải đáp phần nào các vấn đề trên, luận văn này định hướng vào đề tài nghiên cứu “Thử nghiệm phân tích thống kê số lượng tuyển sinh Đại học 2016” Cụ thể, trong luận văn đã sử dụng mô hình hồi quy logit để xác định các nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng, khả năng chọn ngành học của học sinh để từ đó có thể đưa ra một số khuyến nghị đối với công tác tuyển sinh đại học/ cao đẳng

Luận văn này bao gồm phần mở đầu, phần nội dung và phần kết luận Phần nội dung được chia thành 2 chương:

Chương 1 (Cơ sở lý thuyết): Giới thiệu tổng quan về cơ sở lý thuyết của các

mô hình hồi quy logit đơn biến và đa biến, trình bày phương pháp xây dựng mô hình, cách diễn giải ý nghĩa các hệ số trong mô hình hồi quy logit

Chương 2 (Ứng dụng mô hình hồi quy logit vào phân tích số liệu tuyển sinh đại học năm 2016): Thông qua việc áp dụng phần mềm SPSS để xử lý bộ số liệu

tuyển sinh đại học năm 2016 của 12 trường miền Bắc, chương này tiến hành xây dựng các mô hình hồi quy logit mô tả lần lượt mối quan hệ giữa khả năng trúng tuyển đại học/ cao đẳng của học sinh; khả năng lựa chọn nhóm ngành kỹ thuật và khả năng lựa chọn hệ cao đẳng với các nhân tố tiềm năng như điểm số các môn thi

Trang 9

2

tốt nghiệp; giới tính; tuổi; khu vực cư trú; nhóm ưu tiên; … Kết quả ước lượng của

mô hình được phân tích để xác định các nhân tố ảnh hưởng đến các khả năng trúng tuyển; khả năng lựa chọn nhóm ngành kỹ thuật và khả năng chọn hệ cao đẳng của học sinh dự tuyển vào các trường Từ đó Luận văn đưa ra một vài bàn luận và kiến nghị đối với công tác tuyển sinh đại học/ cao đẳng

2 Mục đích nghiên cứu

Nghiên cứu này có mục đích sử dụng phương pháp thống kê để xác định các nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng, khả năng lựa chọn ngành kỹ thuật và khả năng lựa chọn đăng ký cao đẳng của học sinh

3 Đối tượng, phạm vi nghiên cứu

Đối tượng nghiên cứu: Một số vấn đề về phương thức tuyển sinh đại học và cao đẳng dựa trên kết quả thi tốt nghiệp trung học phổ thông của học sinh, mối liên quan giữa các yếu tố - đặc điểm cá nhân của học sinh với kết quả tuyển sinh và khuynh hướng lựa chọn ngành nghề của học sinh

Phạm vi nghiên cứu: Số liệu tuyển sinh đại học năm 2016 của 12 trường đại học ở miền Bắc, bao gồm các thông tin cá nhân của học sinh; điểm số các môn thi tốt nghiệp trung học phổ thông; thông tin đăng ký tuyển sinh và kết quả tuyển sinh

4 Phương pháp nghiên cứu

Luận văn sử dụng các phương pháp thống kê để phân tích, xây dựng mô hình đánh giá các nhân tố ảnh hưởng đến khả năng trúng tuyển đại học/ cao đẳng, khả năng lựa chọn ngành kỹ thuật và khả năng lựa chọn đăng ký cao đẳng của học sinh

5 Đóng góp của luận văn

Luận văn này là một thử nghiệm sử dụng phương pháp phân tích thống kê vào nghiên cứu các vấn đề trong tuyển sinh đại học/ cao đẳng Phương pháp phân tích thống kê này có thể triển khai áp dụng rộng rãi hơn trong các nghiên cứu về công tác giáo dục – đào tạo nói riêng và các nghiên cứu trong các ngành khoa học thực nghiệm nói chung, như nông nghiệp; lâm nghiệp; y học; sinh học; môi trường; kinh tế; tài chính ; bảo hiểm; xã hội học …

Trang 10

1 2

( , , , k)

Yf X X X  Trong đó Y là biến đáp ứng (biến phụ thuộc),

X X1, 2, ,X k là các biến giải thích (biến độc lập),

 là sai số (phần dư) hồi quy

Các mô hình hồi quy thông thường đã được trình bày trong sách giáo khoa liên quan đến trường hợp biến đáp ứng là biến định lượng, đơn giản nhất là mô hình hồi quy tuyến tính đơn, có dạng

E Y   b Tuy nhiên, có nhiều bài toán thực tế lại xuất hiện biến đáp ứng không phải là biến liên tục mà là biến rời rạc nhận vài giá trị định tính, trong một số trường hợp chỉ nhận hai giá trị đối kháng, chẳng hạn sản phẩm mới có được chấp nhận hay không, người vay có trả được nợ hay không, doanh nghiệp có phá sản hay không, khách hàng có thực hiện giao dịch hay không, … Những biến có hai biểu hiện như vậy sẽ được mã hóa thành hai giá trị 0 và 1, được gọi là biến nhị phân Khi biến phụ thuộc ở dạng nhị phân như vậy, chúng ta có thể áp dụng được những mô hình nào? Xét biến phụ thuộc Y nhận giá trị 1 với xác suất p và giá trị 0 với xác suất

1  p, cần xây dựng mô hình mô tả mối quan hệ giữa Y (hoặc p) với một số biến độc lập X X1, 2, ,X k Các nhà nghiên cứu thống kê đã từng bước đề xuất một số mô hình để giải quyết vấn đề đó

Mô hình 1: Mô hình hồi quy tuyến tính

( ) k k

pE Y  X  X   X 

Trang 11

4

Nhìn vào phương trình này, ta nhận thấy vế trái của mô hình chỉ nhận các giá trị trong đoạn [0,1], mặc dù vế phải có thể nhận giá trị bất kì thuộc khoảng (-∞,+∞) Một số nhà nghiên cứu đã đưa ra giải pháp là sử dụng mô hình 1 và loại bỏ các quan sát bất hợp lý, nhưng nhược điểm của giải pháp đó là chỉ dùng được cho rất ít bộ dữ liệu, nên không được đa số các nhà nghiên cứu chấp nhận

Mô hình 2: Dùng hàm liên kết lập mô hình

tỷ lệ chênh lệch giữa hai khả năng xảy ra sự kiện và không xảy ra sự kiện được thể hiện như sau:

Trang 12

5

Ưu điểm của mô hình này là giải quyết triệt để các nhược điểm của những mô hình được đề xuất trước đó và trùng hợp với cách tiếp cận phân tích tỷ số chênh của Dịch tễ học

1.2 Khái niệm số chênh và tỷ số chênh

Số chênh (Odd) của biến cố X là tỷ số giữa xác suất để biến cố X xảy ra và

xác suất để biến cố X không xảy ra Ta có,

Trong nghiên cứu dịch tễ, người ta thường so sánh tần suất “mắc bệnh” giữa hai tổng thể “phơi nhiễm” (thử) và “không phơi nhiễm” (chứng)

Ví dụ: Khi nghiên cứu về bệnh phổi, bác sĩ cần so sánh tần suất mắc bệnh phổi của nhóm người hút thuốc (phơi nhiễm) và nhóm người không hút thuốc (không phơi nhiễm) Bảng dữ liệu dưới đây nghiên cứu mối tương quan giữa hút thuốc lá và mắc bệnh phổi

Bảng 1 Mối tương quan giữa hút thuốc lá và mắc bệnh phổi

Phơi nhiễm Không phơi nhiễm

Trong đó: a là số người hút thuốc lá và mắc bệnh

b là số người hút thuốc lá và không mắc bệnh

c là số người không hút thuốc và mắc bệnh

d là số người không hút thuốc và không mắc bệnh

Ta đưa ra một số khái niệm sau:

Trang 13

Sử dụng thuật ngữ số chênh của dịch tễ học, phương trình (1.3) có thể viết lại thành

Số chênh = exp( 0) * exp( 1X1) * exp( kXk) (1.4)

Biểu thức này sẽ được dùng để diễn giải ý nghĩa của các hệ số hồi quy trong

mô hình logit đơn biến và đa biến sẽ được trình bày tiếp dưới đây

Trang 14

Gọi pP Y (  1| X )là xác suất có điều kiện để cho Y=1 khi X xảy ra Giả

sử p có mối quan hệ với biến X , nhƣng ta không thể tìm trực tiếp mối quan hệ này vì p chỉ nhận giá trị thuộc [0,1] trong khi X nhận giá trị bất kì Do đó, ta có thể thay thế bằng mối quan hệ giữa Ln p  /(1  p )  và X nhƣ sau:

p

  

 = Logit( p) ,

0, 1 là hai hệ số hồi quy

Để đơn giản kí hiệu, chúng ta sẽ sử dụng    xP Y (  1| X ) Khi đó, mô hình hồi quy logit có dạng

  0 1

0 11

X X

e X

Trang 15

8

1.3.2 Ước lượng tham số của mô hình hồi quy logit đơn biến

Để ước lượng các tham số trong mô hình hồi quy thông thường người ta dùng phương pháp bình phương bé nhất Tuy nhiên, trong mô hình hồi quy logit rất phức tạp, vì thế ta sử dụng phương pháp ước lượng hợp lí cực đại

Giả sử ta có n mẫu quan sát độc lập ( , x y ), i = 1,…,n Gọi i i  ( ) x là xác suất

có điều kiện để y= 1 khi x xảy ra, khi đó 1   ( ) x là xác suất có điều kiện để y= 0 khi x xảy ra Từ phương trình (1.5) ta có:

e x

x n

Trang 16

i i

i

y

x n

e e

e y

Trang 17

1.3.3 Ý nghĩa của tham số trong mô hình hồi quy logit đơn biến

Đối với mô hình hồi quy logit đơn biến, biểu thức (1.4) thu gọn lại thành

Số chênh = exp(0)*exp(1X) (1.6)

Từ công thức (1.6), có thể hiểu hệ số  cho biết khi X tăng lên một đơn vị thì logarit cơ số e của số chênh tăng 1 đơn vị Xét đến chiều hướng có thể thấy nếu hệ

số 1 mang dấu dương thì X sẽ làm tăng khả năng Y nhận giá trị 1 trong khi hệ số

này mang dấu âm sẽ làm giảm khả năng này

Để diễn giải ý nghĩa của các hệ số hồi quy, ta có thể xây dựng kịch bản thay đổi xác suất cho từng mức tác động của X khi xác suất ban đầu là một giá trị nào đó

Gọi p0là xác suất ban đầu và p1 là xác suất thay đổi khi X tăng thêm 1 đơn

vị Ta có:

0 1

0 0

1

X

p

e p

   

Do đó,

Trang 18

Như vậy, hệ số e1 sẽ được nhân thêm vào số chênh khi X tăng thêm 1 đơn

vị Đối với trường hợp X là biến nhị phân, e1 chính là tỷ số chênh so sánh giữa

nhóm đối tượng nhận giá trị X  1 với nhóm đối tượng nhận giá trị X  0

Mặt khác, khi 10 ta có

0

0 0

1

p

e p

0 0

0

1

e p

Bảng 2 Mô hình hồi quy logit đơn biến mô tả quan hệ giữa biến phụ thuộc

“Đăng ký vào HV Ngân hàng” và biến độc lập “Giới tính”

B Sai số

chuẩn

Thống kê Wald Bậc tự do

Xác suất ý nghĩa Exp(B)

Trang 19

12

nhóm học sinh Nữ, nhận giá trị X  0, xác suất để các đối tƣợng này đăng ký vào Học viện Ngân hàng đƣợc ƣớc lƣợng bằng

0 0

( )

1

g g

e e

X X

1.4.2 Ƣớc lƣợng tham số của mô hình hồi quy Logit đa biến

Giả sử ta có n mẫu quan sát độc lập xi, yi Gọi

yi là giá trị của biến phụ thuộc, i = 1,…,n

xij là các giá trị của biến độc lập, i = 1…n, j = 1,…,k

Trang 20

i

x

e e

1

k j j

i

j j

j

i

e L

Trang 21

k j j

k j j

k j j

0 0

n

i n

1.4.3 Mã hóa lại các biến độc lập định tính nhận nhiều giá trị

Trong một số trường hợp biến độc lập là rời rạc hoặc là biến định tính, ví dụ như địa chỉ cư trú của học sinh, khu vực ưu tiên Để đưa những biến này vào mô hình ta sử dụng phương pháp thiết kế biến (lập biến giả)

Giả sử, biến độc lập là “Khu vực ưu tiên” của học sinh có khả năng nhận bốn giá trị là: "đô thị lớn", "đô thị nhỏ/ ngoại thành", “nông thôn” và "miền núi" Ta thiết kế ba biến giả D1, D2 và D3 Khi đó

 Tổ hợp giá trị (D1 =0, D2 =0, D3=0) tương ứng với học sinh cư trú tại khu vực “đô thị lớn”;

 Tổ hợp giá trị (D1 =1, D2 =0, D3=0) tương ứng với học sinh cư trú tại khu vực “đô thị nhỏ/ ngoại thành”;

 Tổ hợp giá trị (D1 =0, D2 =1, D3=0) tương ứng với học sinh cư trú tại khu vực “nông thôn”;

Trang 22

 Tổ hợp giá trị (D1 =0, D2 =0, … , D(k−1)=1) tương ứng với khả năng biến độc

lập nguyên thủy nhận giá trị thứ k

Trong một số trường hợp chúng ta có thể xây dựng biến giả từ một biến liên tục Ví dụ có biến tuổi liên tục nhưng nghiên cứu lại quan tâm tới các nhóm tuổi Vì vậy ta có thể phân chia các nhóm tuổi và coi các nhóm này là các khả năng xảy ra của một biến tính, sau đó thực hiện thiết kế biến giả như đã trình bày trên đây Khi xây dựng biến giả từ một biến liên tục ta cần chú ý một số điều sau:

* Khoảng cách giữa các nhóm nên bằng nhau

* Cỡ các nhóm nên bằng nhau

* Cân nhắc ý nghĩa thực tế của kết quả phân nhóm

Chú ý là trong mô hình hồi quy logit (và cả trong các mô hình hồi quy khác), các biến độc lập luôn luôn phải được xuất hiện dưới dạng biến định lượng hoặc biến định tính nhị phân

1.4.4 Ý nghĩa của tham số trong mô hình hồi quy Logit đa biến

Tương tự như mô hình hồi quy logit đơn biến, đối với mô hình hồi quy logit

đa biến ta cũng có

Số chênh = exp( 0) * exp( 1X1) * exp( kXk)

Trang 23

16

Từ công thức trên có thể hiểu hệ số k cho biết khi X k tăng lên một đơn vị thì logarit cơ số e của số chênh tăng k đơn vị Xét đến chiều hướng có thể thấy nếu hệ số k mang dấu dương thì X k sẽ làm tăng khả năng Y nhận giá trị 1, trong khi hệ số âm sẽ làm giảm khả năng này

Để diễn giải ý nghĩa của các hệ số hồi quy, ta có thể xây dựng kịch bản thay đổi xác suất cho từng mức tác động của X k khi xác suất ban đầu là một giá trị nào đó Gọi p0là xác suất ban đầu và p1 là xác suất thay đổi khi X k tăng thêm 1 đơn

vị, ta có:

0 0

1

X k X k

p

e p

k

p p

0

k k

p e p

1.5 Kiểm định giả thuyết đối với mô hình hồi quy Logit

1.5.1 Kiểm định sự phù hợp của mô hình

Bài toán kiểm tra sự phù hợp của mô hình với dữ liệu dựa trên việc kiểm định giả thuyết

H : 1  2   k  0

Trang 24

17

Nếu giả thuyết đúng thì xác suất để biến phụ thuộc Y nhận giá trị bằng 1 không phụ thuộc vào giá trị của các biến độc lập Khi đó

0 0

1

H

e L

K

i

e L

K

L G

L

     

Định lý 1: Nếu giả thuyết H đúng thì đại lượng thống kê G có phân phối tiệm cận

phân phối 2 với k bậc tự do

Với hiệu lực của định lý trên đây, bài toán kiểm định giả thuyết về sự phù hợp của mô hình hồi quy logit đối với dữ liệu được tiến hành qua các bước dưới đây

Trang 25

- Nếu p   ta bác bỏ H, khẳng định rằng trong số các hệ số 1, 2, …, k

phải có một hệ số nào đó thực sự khác 0, có ít nhất một biến độc lập có vai trò ảnh

hưởng đến xác suất để biến phụ thuộc Y nhận giá trị bằng 1 Lúc đó có thể sử dụng

mô hình hồi quy để mô tả mối quan hệ giữa biến phụ thuộc Y và các biến độc lập

Như vậy, phương trình hồi quy thực sự có ý nghĩa, mô hình thành lập được tốt

1.5.2 Kiểm định hệ số hồi quy

Bài toán kiểm tra vai trò của một biến độc lập X j nào đó đối với giá trị của Y (tức là đối với giá trị của p) dựa trên kiểm định giả thuyết

Trang 26

19

Trong đó se j là sai số chuẩn của ƣớc lƣợng tham số j , đƣợc tính nhƣ sau

Với mẫu gồm n quan sát độc lập x1j, x2j, , xnj, j=1,…,k, gọi  0, j lần lƣợt

là ƣớc lƣợng hợp lý cực đại của 0 và j, j=1,…,k Đồng thời gọi p x ( )là xác suất

ƣớc lƣợng đƣợc của mô hình cho giá trị x Khi đó ta có:

k j j

  Khi đó, sai số chuẩn của  0, j lần lƣợt là

i

x se

SS w

Trang 27

( )

j j se

Ngày đăng: 25/02/2021, 17:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Hồ Đăng Phúc (2005), Sử dụng phần mềm SPSS trong phân tích số liệu, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội Sách, tạp chí
Tiêu đề: Sử dụng phần mềm SPSS trong phân tích số liệu
Tác giả: Hồ Đăng Phúc
Nhà XB: Nhà xuất bản Khoa học và Kỹ thuật
Năm: 2005
[2] Trần Mạnh Tuấn (2004), Xác suất và Thống kê, Nhà xuất bản Đại học Quốc gia, Hà Nội.Tiếng Anh Sách, tạp chí
Tiêu đề: Xác suất và Thống kê", Nhà xuất bản Đại học Quốc gia, Hà Nội
Tác giả: Trần Mạnh Tuấn
Nhà XB: Nhà xuất bản Đại học Quốc gia
Năm: 2004
[3] David W.; Hosmer Jr.; Stanley Lemeshow (1989), Applied Logistic Regression, John Wiley & Sons Sách, tạp chí
Tiêu đề: Applied Logistic Regression
Tác giả: David W.; Hosmer Jr.; Stanley Lemeshow
Năm: 1989
[4] Graybill and Iyer (1994), Regression analysis. Concepts and applications, CA: Duxbury Press Sách, tạp chí
Tiêu đề: Regression analysis. Concepts and applications
Tác giả: Graybill and Iyer
Năm: 1994
[5] McCullagh P.; Nelder J.A (1997), Generalized Linear Models, 2nd edition, Chapman & Hall/CRC Sách, tạp chí
Tiêu đề: Generalized Linear Models
Tác giả: McCullagh P.; Nelder J.A
Năm: 1997
[6] Scott Menard(2002), Applied logistic regression analysis, Second edition, Sage Publications Sách, tạp chí
Tiêu đề: Applied logistic regression analysis
Tác giả: Scott Menard
Năm: 2002

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w