Chương 2PHÂN TÍCH HỒI QUY Phân tích hồi quy là một phương pháp phân tích thống kê để dự đoán hoặc ướclượng giá trị của một đại lượng biến được ước lượng, được mô tả theo một haynhiều đại
Trang 1Trờng đại học vinh
Trang 3MỞ ĐẦU
Trong thời đại ngày nay, công nghệ thông tin đang trở thành nhân tố quantrọng cho sự phát triển kinh tế - xã hội Việc khai thác và ứng dụng các phần mềm đểphân tích và xử lý số liệu thống kê là rất bổ ích và thiết thực Winstat là một trongnhững phần mềm đó Nó là phần mềm bổ trợ cho Excel để phân tích và xử lý các sốliệu thống kê Phương pháp phân tích hồi quy là phương pháp để xác định mức độphụ thuộc của một lượng theo một hay nhiều đại lượng khác Việc sử dụng phươngpháp phân tích hồi quy và tương quan cho ta thấy được mối liên hệ giữa các yếu tố,thuộc tính của số liệu
Trên cơ sở đó, cùng với sự chỉ bảo và định hướng của TS Nguyễn Trung Hoà,
tác giả đã lựa chọn đề tài “Khai thác phần mềm Winstat để xử lý số liệu bằng phương
pháp phân tích hồi quy” để nghiên cứu.
Nội dung của luận văn bao gồm ba chương:
Chương 1 Các kiến thức cơ sở
Chương này tác giả hệ thống những kiến thức cơ bản nhất về xác suất thống
kê Nó là công cụ để nghiên cứu tiếp chương sau
Chương 2 Phân tích hồi quy
Chương này trình bày lí thuyết mô hình phân tích Hồi quy đơn, Hồi quy đathức, Hồi quy bội và các phương pháp phân tích và kiểm định các giả thiết thống kê
Chương 3 Phân tích hồi quy trong Winstat
Chương này giới thiệu phần mềm Winstat, hướng dẫn cài đặt và sử dụng vềphần mềm đó Giới thiệu các gói lệnh phân tích hồi quy của phần mềm Winstat Sửdụng các gói lệnh đó để phân tích ví dụ trong thực tiễn từ đó để đưa ra một số kếtluận thống kê
Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn của TS.
Nguyễn Trung Hoà Tác giả xin được bày tỏ lòng biết ơn chân thành và sâu sắc nhất
đến thầy - người đã đặt ra vấn đề và thường xuyên giúp đỡ tác giả trong suốt quá trìnhhọc tập và nghiên cứu
Trang 4Nhân dịp này, tác giả cũng xin chân thành cảm ơn các thầy cô giáo trong khoaToán, khoa Sau đại học và các bạn học viên lớp cao học 15 - Xác suất thống kê đãthường xuyên giúp đỡ tác giả trong quá trình học tập và hoàn thành luận văn.
Mặc dù có nhiều cố gắng, song luận văn không thể tránh được những thiếu sót,tác giả rất mong được những đóng góp quý báu từ các thầy cô giáo và các bạn
Vinh, tháng 12 năm 2009
Tác giả
Trang 5Chương 1
CÁC KIẾN THỨC CƠ SỞ
1.1 Biến ngẫu nhiên và hàm phân phối
1.1.1 Biến ngẫu nhiên
Để dễ hình dung, ta hiểu một đại lượng (hay một biến) nhận các giá trị của
nó với xác suất tương ứng nào đấy gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên.
Các biến ngẫu nhiên được ký hiệu là X Y Z, , hoặc Y Y1, , ,2 Y m; X X1, 2, ,X n
còn các giá trị có thể có của chúng được ký hiệu là x y, hoặc x x1, , ,2 x n;
1, , ,2 m
y y y .
Nếu tập các giá trị mà biến ngẫu nhiên nhận là một tập gồm một số hữu hạn điểm hoặc vô hạn đếm được Khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc.
Nếu tập các giá trị mà biến ngẫu nhiên lấp đầy một khoảng nào đó khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên liên tục.
nhiên nhận giá trị nhỏ hơn x (hoặc bên trái x).
1.2 Các loại biến thường gặp trong xử lý thống kê
Trong xử lý thống kê, khi xem xét một tổng thể nào đó theo các tính chất(thuộc tính của nó), người ta thường xem mỗi thuộc tính có mối liên hệ đến một hoặc
Trang 6nhiều thuộc tính khác Mỗi thuộc tính đó có thể được xem là một biến Thông thườngcác biến được phân loại như sau
1.2.1 Biến định lượng
Thông thường các số đo đều là biến định lượng Biến định lượng có thể chia thành các loại
- Biến nhận các giá trị thực liên tục: Các biến có thể có giá trị là một số
thực nào đó nằm trong một đoạn thẳng trên một trục số Ví dụ: Cân nặng, chiều cao, nồng độ …
- Biến nhận giá trị thực rời rạc: Các biến có tập giá trị là tập hữu hạn các
số thực Ví dụ: Mức lương, loại giá vé xe… Biến nhận các giá trị nguyên, như:
Tuổi, số người…
1.2.2 Biến định tính
Thường biến định tính xác định tính chất nào đó của đối tượng nghiên cứu, giá trị của các biến thường không phải là các số Ví dụ: Giới tính, lí do vay mượn, quan điểm về một vấn đề…là các biến định tính Biến định tính được chia làm hai loại.
- Biến định tính có thứ tự là biến mà các giá trị của nó có khả năng được
sắp xếp theo một thứ tự nào đó, biểu thị mức độ quan trọng khác nhau của các giá trị đó Ví dụ: Nhà cửa, nguồn nước sử dụng…
- Biến định tính không có thứ tự là biến mà các giá trị có thể của nó không
được xếp theo thứ tự hơn kém Ví dụ: Dân tộc, tôn giáo…
Biến phụ thuộc còn gọi là biến được mô tả thể hiện kết quả của hiện tượng,
thường nằm ở vế phải của công thức, là đối tượng chính, mục tiêu của công việc nghiên cứu.
Chú ý:
* Sự phân biệt giữa các loại biến đó cũng có tính tương đối, tuỳ thuộc vào
Trang 7mục đích của vấn đề và ý đồ của người nghiên cứu mà một biến ở chỗ này được xem là biến định lượng mà ở nơi khác có thể được cho là biến định tính Ví dụ:
“Đồ đạc tiện nghi trong gia đình” là biến định tính nếu xét dưới góc độ xem xét chất lượng đời sống sinh hoạt, song lại là một biến định lượng khi muốn xác định tài sản gia đình Một biến định tính lúc này không được xem là có thứ tự, lúc khác lại được xem là có thứ tự.
* Trong mô hình nhiều mức, một biến có thể vừa là biến phụ thuộc, vừa là biến độc lập.Ví dụ: “chi tiêu cho ăn uống hàng ngày” là biến “được mô tả” (biến phụ thuộc) nếu xét trong mối quan hệ với các yếu tố thu nhập và điều kiện sống, song lại là biến “dùng để mô tả” (biến độc lâp) khi muốn biểu diễn ảnh hưởng của nó đến sức khoẻ của các thành viên trong gia đình.
* Các loại biến vừa nêu trên có thể là tất định, có thể mang yếu tố ngấu
nhiên và trong luận văn này ta giới hạn việc xem xét các loại biến đó là biến ngẫu
nhiên hoặc qua một phép biến đổi đơn giản chúng được quy về một biến ngẫu
nhiên.
1.3 Mẫu ngẫu nhiên và mẫu quan sát
tập hợp n biến ngẫu nhiên X X1, 2, ,X độc lập, có cùng phân phối xác suất với , n X
kí hiệu là:
( 1, 2, , n)
W = X X X
• Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc
• Các biến ngẫu nhiên X i được gọi là các bản sao của X.
• Phương pháp nghiên cứu không toàn bộ là phương pháp nghiên cứu thông qua mẫu ngẫu nhiên và mẫu quan sát
1.3.2 Mẫu quan sát
Mẫu quan sát W =(x x1, , ,2 x n) là một thể hiện cụ thể của mẫu ngẫu nhiên hay
nó là tập hợp các số liệu quan sát cụ thể về một biến ngẫu nhiên gọi tắt là các số liệuthực nghiệm
Trang 8Bảng phân phối tần số thực nghiệm:
• x i là giá trị phân biệt thứ icủa các quan sát
• n i là số lượng các quan sát nhận giá trị tương ứng
• Bảng trên được gọi là bảng mẫu thu gọn
Giá trị cụ thể của hàm G tương ứng với tập giá trị quan sát
( x x1, , ,2 x n) là số Gqs= f x x( 1, , ,2 x n) nó là một thể hiện của thống kê G, thu được từ mẫu quan sát (số liệu) về biến ngẫu nhiên gốc X và được gọi là giá trị quan sát của thống kê G
1.4.2 Thống kê trung bình mẫu
Giả sử W =( X X1, 2, ,X n) là mẫu ngẫu nhiên, khi đó trung bình mẫu của mẫu ngẫunhiên W là thống kê
1
1
n i i
n =
Trang 9Vì mỗi X i là một bản sao của biến ngẫu nhiên gốc X nên chúng đều có cùng kỳ vọng và
phương sai mẫu tương ứng là:
( )2
2
1
11
n i i
S cũng là một biến ngẫu nhiên
Trang 10thì giá trị quan sát của phương sai mẫu được tính bởi:
( )2
2
1
11
k
i i i
Trang 11thì giá trị quan sát của phương sai mẫu được tính bởi:
1.4.4 Thống kê tần suất mẫu
Nếu A là một biến cố nào đó với xác suất xuất hiện biến cố A là p, gọi X
là biến ngẫu nhiên có phân phối không-mộtA p( )và nếu
n n
∑
Trang 12Chương 2
PHÂN TÍCH HỒI QUY
Phân tích hồi quy là một phương pháp phân tích thống kê để dự đoán hoặc ướclượng giá trị của một đại lượng (biến được ước lượng, được mô tả) theo một haynhiều đại lượng khác (biến dùng để ước lượng, dùng để mô tả) thông qua một côngthức nào đó Nó cũng được vận dụng để đánh giá hiệu quả tác động của biến độc lậpđối với biến phụ thuộc
Tuỳ từng trường hợp để dự đoán và ước lượng mà ta sử dụng các phương phápphân tích hồi quy tuyến tính, phương pháp hồi quy đa thức, phương pháp hồi quy phituyến v.v cho phù hợp
2.1 Hồi quy đơn
2.1.1 Hồi quy tuyến tính đơn
Đây là thủ tục ước lượng các hệ số trong một phương trình hồi quy, khi biến
dự báo phụ thuộc một cách tuyến tính vào các biến mô tả Phương trình hồi quy tuyếntính tốt nhất được xác định thông qua tiêu chuẩn sai số bình phương tối thiểu
Mô hình hồi quy tuyến tính đơn được diễn đạt qua phương trình
Y =a X b e+ +
Trong đó
*a cho biết khi tăng mỗi đơn vị của biến độc lập X thì biến phụ thuộc Y
sẽ tăng hay giảm bao nhiêu đơn vị;
* blà hằng số hồi quy cho biết điểm xuất phát của Y khi X bằng 0 là ở đâu - âm hay dương, đường hồi quy có đi qua gốc tọa độ hay không.
* e là phần dư hồi quy, nó cho biết sai số của phương trình hồi quy tại từng quan sát.
2.1.2 Hồi quy phi tuyến
Khi biến độc lập và biến phụ thuộc không có mối quan hệ tuyến tính Lúc đóphải dùng mô hình hồi quy phi tuyến
( )
Y = f X +e
Một số dạng phi tuyến
Trang 13Ước lượng tham số hồi quy bằng phương pháp bình phương bé nhất
( , ),(X Y X Y, ), ,(L X Y n, ),nxây dựng hàm hồi quy mẫu dạng
Cần tìm ước lượng của các tham số sao cho tổng bình phương các sai số (phầndư) là nhỏ nhất:
m
i i i i
f
Y a X b a
f
Y a X b X a
Trang 14Nghiệm trên sẽ là lời giải cần tìm nếu đạo hàm riêng phần bậc 2 của ftại điểm đó (ma trận Hessian)là một ma trận xác định dương (điều kiện đủ):
Ma trận trên là ma trận xác định dương, vậy f đạt min tại ( )a b$$,
2.1.3 Một số tính chất của tham số hồi quy ước lượng bằng phương pháp bình phương bé nhất
a) Trung bình của các phần dư bằng 0:
1
1
0
m i i
1) Các giá trị của biến độc lập X là giá trị được xác định trước
2) Sai số ngẫu nhiên có kỳ vọng bằng 0:
Trang 15( i, j) 0,
Cov e e = ∀ ≠i j
2.1.5 Khoảng tin cậy của các hệ số hồi quy
Các tham số cần ước lượng là đại lượng ngẫu nhiên, phụ thuộc vào mẫu quansát Muốn đánh giá được độ chính xác của các ước lượng đó ta cần biết khoảng tincậy của chúng Trước tiên cần ước lượng độ biến động của chúng:
Trang 16Kiểm định giả thiết đối với các hệ số hồi quy
- Nếu θ0 nằm trong khoảng đó thì chấp nhận giả thiết,
- Nếu θ0 nằm ngoài khoảng đó thì bác bỏ giả thiết
Chú ý Đối với bài toán kiểm định một phía, ta phải dùng xác suất ý nghĩa
θ θβ
trong đó T là biến ngẫu nhiên có phân phối T Student− với (m− 2) bậc tự do
a) Đối với bài toán 2 phía, so sánh giá trị β với mức ý nghĩa α đã định
- Nếu β α> thì chấp nhận giả thiết,
- Nếu β α≤ thì bác bỏ giả thiết
b) Đối với bài toán 1 phía, so sánh giá trị β với mức ý nghĩa α đã định
- Nếu β >2α thì chấp nhận giả thiết,
- Nếu β ≤2α thì bác bỏ giả thiết
Cách 2’
Trang 17a) Đối với bài toán 2 phía, qua đại lượng ngẫu nhiên T có phân phối
T Student− với (m−2) bậc tự do, tính giá trị tới hạn t m−2( )α với giá trị mức ý nghĩa α đã định:
b) Đối với bài toán một phía, qua đại lượng ngẫu nhiên T có phân phối
T Student− với (m−2) bậc tự do, tính giá trị tới hạn t m−2( )2α với giá trị mức ý nghĩa α đã định:
Trang 182.2 Hồi quy đa thức
Khi mối liên hệ giữa biến phụ thuộc và các biến độc lập không còn là tuyến tính, cần dùng mô hình hồi quy bậc cao hơn để mô tả quy luật.
2.2.1 Mô hình bậc hai
Với các biến độc lập X X1, 2, X mvà biến phụ thuộc Y, ta tìm các hệ số hồi
quy α γi, iJ, ij=1,2, ,m để ước lượng Y:
tương tác của các biến độc lập trong mô hình hồi quy Có nghĩa là kiểm tra được
xem các biến độc lập có “cộng hưởng” với nhau trong việc tác động lên biến phụ thuộc hay không.
- Bằng phương pháp tương tự như trên, ta có thể thành lập các mô hình hồi quy đa thức bậc cao hơn.
2.2.2 Mô hình hồi quy phân tầng
Trang 19Trong mô hình trên, nếu xét thêm đặc thù của các nhóm bệnh (hoặc nhóm đối tượng bệnh nhân) khác nhau thì các hệ số a và b cần phải phản được cả những đặc thù ấy.
Đây là mô hình hồi quy tuyến tính với 1 k+ biến độc lập.
- Hệ số b i cho biết chi phí ban đầu của nhóm thứ i
- Hệ số a cho biết quy luật chung cho tất cả các nhóm: trung bình chi phí hàng ngày của người bệnh là bao nhiêu
Việc kiểm giả thiết bằng nhau của các hằng số b b1, , ,2 b kchính là việc xác
định xem có tồn tại tính đặc thù trong các nhóm hay không
Trường hợp 2 Chi phí ban đầu như nhau, chi phí hàng ngày khác nhau giữa các nhóm
Từ các biến phụ đã thành lập như trên và biến X nguyên thủy, ta lập k
Đây là mô hình hồi quy tuyến tính với 1 k+ biến độc lập.
- Hệ số a i cho biết trung bình chi phí hàng ngày của nhóm thứi
Trang 20- Hệ số b cho biết quy luật chung cho tất cả các nhóm: chi phí ban đầu chung cho mọi người bệnh là bao nhiêu
Nhận xét.
- Có thể lập mô hình hồi quy phân tầng với nhiều biến độc lập nguyên thủy
- Có thể kết hợp hai mô hình phân tầng đã nêu cho trường hợp nhiều biến độc lập nguyên thủy.
2.2.3 Mô hình hồi quy phi tuyến tổng quát
Giả sử có mẫu ( X Y1, 1) (, X Y2, 2) (, X Y m, m) Ta muốn xây dựng hàm hồi quy
Ước lượng tham số hồi quy bằng phương pháp lặp
Giả sử f là một hàm khả vi liên tục Lúc đó đạo hàm riêng phần của g sẽ triệt tiêu tại điểm (giá trị của tham số) g đạt min:
Trang 21Cơ sở giải tích Cho một giá trị ban đầu β(0) nào đó của véc tơ các tham số
β Lúc đó, theo Định lý giá trị trung bình ta có
thay vào vị trí của β0 trong (***) để tiến hành bước tiếp của chu trình lặp.
Bước N Quá trình được dừng lại sau N bước hoặc khi chênh lệch giữa hai véc tơ ước lượng của hai bước liên tiếp đủ nhỏ:
2 23 Hồi quy bội
2 23 1 Hồi quy bội tuyến tính
Mô hình hồi quy bội tuyến tính được diễn đạt qua phương trình
Trang 221 1 2 2 k k 0
Y =a X +a X + +L a X + + =b e
* X X1, 2, ,X k là các biến độc lập dùng để dự báo biến Y
từng biến độc lập vào sự tăng giảm của biến phụ thuộc ;
tất cả các biến độc lập bằng 0;
Khi vế phải của phương trình hồi quy phía trên được thay bằng một biểu
thức phi tuyến của các biến độc lập, ta sẽ có mô hình hồi quy phi tuyến bội.
2 2 1.1 Ước lượng tham số hồi quy bằng phương pháp bình phương bé nhất
LƯớc lượng tham số hồi quy bằng phương pháp bình phương bé nhất
Trang 23m m km
X X X
X X X X
hiện tượng đa cộng tuyến giữa các biến độc lập.
Cách giải quyết
điểm đó là một ma trận xác định dương (điều kiện đủ):
đạt min tại nghiệm vừa tìm được
2 2 1.2 Tính chất của tham số hồi quy ước lượng bằng phương pháp bình phương bé nhất
Trang 24f) Ước lượng của các tham số là ước lượng không chệch:
i i
2 2 1.3 Đánh giá chất lượng của mô hình
Khi đã ước lượng được các hệ số của phương trình hồi quy, thay giá trị của
các biến độc lập vào vế phải (không kể phần dư e ), ta thu được một biến mới, kí
* Biến phần dư e bằng hiệu Y Y− ';
ánh tính “gần gũi” giữa hai biến phụ thuộc và dự đoán Cùng một cỡ mẫu, hệ số nàycàng lớn thì mô hình càng tốt, dự đoán càng chính xác
lập và biến phụ thuộc;
biến phụ thuộc Yvà tập biến độc lập, { X X1, 2, ,X k} .
* Trong thực hành, để tiện tính toán và nhận xét, người ta thường dùng đại
3 Đánh giá chất lượng của mô hình qua việc phân tích các sai số
Sau khi đã ước lượng được mô hình, có thể dùng đồ thị đám mây điểm biểudiễn quan hệ giữa phần dư hồi quy và biến phụ thuộc để kiểm tra
Trang 25b) Xu thế thay đổi nào đó của sai số, nếu có.
Từ đó tìm cách hiệu chỉnh mô hình cho phù hợp hơn.Một số dạng phân bố có thể của sai số
Dạng 1:
Trang 26Các sai số tập trung quanh trục Y, tương đối đều về hai phía so với trục đó và
độ chính xác gần như nhau Mô hình đã được lựa chọn đúng đắn Nếu độ phân tán
các biến độc lập (thêm hoặc biến đổi, sửa chữa các biến mô tả chẳng hạn)
Dạng 2:
các mô hình nhiều mức
Dạng 3:
Giá trị ước lượng trong mô hình bị thừa ở đoạn này song lại hụt ở đoạn khác
lại mô hình các mô hình phi tuyến
2 2 1.4 Đánh giá mô hình qua việc kiểm định các giả thiết thống kê
Hệ số tương quan bội R của phương trình hồi quy chưa nói lên đầy đủ đượcchất lượng của mô hình
Trang 27- Nếu hai mô hình có các biến mô tả khác nhau xuất hiện trong phương trình hồi quy thì dùng hệ số tương quan bội không kết luận được mô hình nào tốt hơn.
- Có thể việc loại bỏ bớt một số biến nào đó ra khỏi phương trình hồi quy tuy làm thay đổi hệ số tương quan bội, song về thực chất lại không làm giảm đáng kể chất lượng của mô hình.
- Trong thực hành, nhiều khi dùng ít biến mô tả trong phương trình hồi quy thì “kinh tế” hơn, mặc dù sai số ước lượng có thể lớn hơn
Như vậy, phải dựa vào các phép kiểm định để tiến hành đánh giá, lựa chọn mô hình.
Bài toán kiểm định 1
Kiểm định giả thiết H := = = = =a1 a2 a k 0
Định lý Giả sử R là hệ số tương quan bội trong mô hình hồi quy tuyến tính
a = =a L a = Như vậy mọi biến độc lập đều không có vai trò gì đối với mô
hình hồi quy, không có ràng buộc nào giữa các biến này và biến phụ thuộc bên
vế trái của phương trình Lúc đó mô hình hồi quy không tốt, cần tìm mô hình khác.
Bài toán kiểm định 2
Trang 28Kiểm định giả thiết H a i: i =0 với một inào đó cần kiểm tra.
Dùng phép kiểm định này ta có thể xác định rõ ràng được biến độc lập nào thực sự có đóng góp cho phương trình hồi quy tuyến tính.
Để kiểm định các giả thiết này, người ta dùng biến T n m( − −1) là một biến có phân phối Student n m( − −1) bậc tự do, với nlà số lượng quan sát,m là
số lượng biến độc lập có mặt trong phương trình hồi quy.
Đối với mỗi hệ số ai ứng với biến độc lập Xi, ta thành lập tham số t i và
tính xác suất p i= xác suất để T n m( − − >1) t i
Tiếp đó, so sánh p i với mức ý nghĩa alpha đã định:
- Nếu p i >anpha thì chấp nhận H icoi, a i =0
- Nếu p i ≤anpha thì bác bỏ H i khẳng định a i khác 0
Biến gây nhiễu và biến bị gây nhiễu
Trong phương trình hồi quy, một biến độc lập có thể thực chất không gây ảnh hưởng đối với biến phụ thuộc song vì chịu tác động của một biến khác mà lại tỏ ra có vai trò nào đó.
Ngược lại, cũng có thể một biến độc lập có vai trò nhất định đối với việc
dự đoán biến phụ thuộc, song vì tác động của một biến thứ ba mà vai trò của nó
bị che lấp đi Do đó người ta cần phải xác định được những biến gây nhiễu (tác động) và biến bị nhiễu (chịu tác động).
Có thể dùng phép kiểm định 2 trên để vạch ra những biến gây nhiễu và những biến bị nhiễu Trong số các biến xuất hiện trong phương trình hồi quy, nên quan tâm những biến mà hệ số của nó khác 0 một cách có nghĩa (xác suất kiểm định nhỏ hơn mức cho phép)
Chú ý:
- Trong nhiều phương trình hồi qui, có khi không nên loại bỏ những biến
mà hệ số của nó không khác 0 một cách có nghĩa, vì theo thực tế chúng vẫn có đóng góp nào đó hoặc có tác dụng hiệu chỉnh những ảnh hưởng thái quá của những biến khác.
- Có những biến thể hiện vai trò của mình trong phương trình hồi quy với một tổ hợp biến độc lập này nhưng lại không thể hiện vai trò trong một tổ
Trang 29hợp biến khác Do đó nên tiến hành phân tích nhiều mô hình khác nhau để so sánh.
- Phải dựa vào ý nghĩa thực tế để lựa chọn mô hình hồi quy.
Bài toán kiểm định 3
Để so sánh sự hơn kém của hai mô hình hồi quy với các số biến mô tả khác nhau, ta có thể xét bài toán sau:
Giả sử q< <p n là các số nguyên, cần so sánh mô hình hồi quy tuyến tính
với Y được mô tả qua p biến X X1, 2, ,X pvới mô hình được mô tả qua q biến.
R R
n p F
Lúc đó tỷ số trên có phân phối Fisher với(n p− )và ( p q− )bậc tự do.
Theo định lý đó, ta có thể sử dụng thống kê Fisher để kiểm định sự hơn kém của hai mô hình nêu trên.
1 Ta thành lập giả thiết
H: hai mô hình tốt như nhau
để so với đối thiết
Khi mối liên hệ giữa biến phụ thuộc và các biến độc lập không còn là tuyếntính, cần dùng mô hình hồi quy bậc cao hơn để mô tả quy luật
Trang 302.3.2 Mô hình hồi quy phân tầng
2.3.3 Mô hình hồi quy phi tuyến tổng quát
Giả sử có mẫu ( X Y1, 1) (, X Y2, 2) (, X Y m, m) Ta muốn xây dựng hàm hồi quymẫu dạng
Trang 31Chương 3
PHÂN TÍCH HỒI QUY TRONG WINSTAT
3.1 Giới thiệu và cài đăt phần mềm Winstat
3.1.1 Giới thiệu về Winstat
- Như ta đã biết, Excel là phần mềm được ứng dụng rộng rải trong công tác kếtoán, văn phòng trên môi trường Windows Excel thực hiện được nhiều phép tính từđơn giản đến phức tạp Nó cũng được ứng dụng nhiều trong việc phân tích và xử lýcác số liệu thống kê Excel tổ chức và lưu dữ thông tin dưới dạng bảng tính Tuynhiên việc sử dụng Excel để phân tích và xử lý số liệu thống kê là rất phức tạp, đòi
hỏi người sử dụng phải nắm vững và chính xác các hàm cần nhập để xử lý Trong
nhiều trường hợp ta cần phải bổ xung thêm công cụ phân tích dữ liệu và sử dụng các
trình cài thêm Chính vì những hạn chế của Excel trong việc phân tích và xử lý số liệu
thống kê đó mà phần mềm Winstat ra đời Vậy Winstat là gi?
Winstat là phần mềm bổ trợ cho Excel để xử lý các số liệu thống kê Winstat
có các chức năng sau
- Danh mục các chức năng của Winstat
Basics (Khái niệm cơ bản)
• Descriptive Statistics (Thống k ê m ô tả)
• Frequencies (Tần số)
• Means ( G i á trị trung b ì nh)
• Test of Randomness ( Kiểm định tính ngẫu nhi ê n)
• Test of Outliers ( Kiểm định Outlers)
• Chi-Square Test ( Kiểm định Chi-Square)
Comparison of 2 Groups (So sánh 2 nhóm)
• t-Test Independent (t- Kiểm định biến đ ộc lập)
• t-Test Dependent (t- Kiểm định biến phụ thuộc)
• Wilcoxon Test (Kiểm định Wilcoxon)