1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

62 679 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai thác phần mềm Winstat để xử lý số liệu bằng phương pháp phân tích hồi quy
Tác giả Phùng Duy Ngọc
Người hướng dẫn TS. Nguyễn Trung Hoà
Trường học Trường Đại Học Vinh
Chuyên ngành Xác Suất Thống Kê Toán Học
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2009
Thành phố Vinh
Định dạng
Số trang 62
Dung lượng 2,1 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Chương 2PHÂN TÍCH HỒI QUY Phân tích hồi quy là một phương pháp phân tích thống kê để dự đoán hoặc ướclượng giá trị của một đại lượng biến được ước lượng, được mô tả theo một haynhiều đại

Trang 1

Trờng đại học vinh

Trang 3

MỞ ĐẦU

Trong thời đại ngày nay, công nghệ thông tin đang trở thành nhân tố quantrọng cho sự phát triển kinh tế - xã hội Việc khai thác và ứng dụng các phần mềm đểphân tích và xử lý số liệu thống kê là rất bổ ích và thiết thực Winstat là một trongnhững phần mềm đó Nó là phần mềm bổ trợ cho Excel để phân tích và xử lý các sốliệu thống kê Phương pháp phân tích hồi quy là phương pháp để xác định mức độphụ thuộc của một lượng theo một hay nhiều đại lượng khác Việc sử dụng phươngpháp phân tích hồi quy và tương quan cho ta thấy được mối liên hệ giữa các yếu tố,thuộc tính của số liệu

Trên cơ sở đó, cùng với sự chỉ bảo và định hướng của TS Nguyễn Trung Hoà,

tác giả đã lựa chọn đề tài “Khai thác phần mềm Winstat để xử lý số liệu bằng phương

pháp phân tích hồi quy” để nghiên cứu.

Nội dung của luận văn bao gồm ba chương:

Chương 1 Các kiến thức cơ sở

Chương này tác giả hệ thống những kiến thức cơ bản nhất về xác suất thống

kê Nó là công cụ để nghiên cứu tiếp chương sau

Chương 2 Phân tích hồi quy

Chương này trình bày lí thuyết mô hình phân tích Hồi quy đơn, Hồi quy đathức, Hồi quy bội và các phương pháp phân tích và kiểm định các giả thiết thống kê

Chương 3 Phân tích hồi quy trong Winstat

Chương này giới thiệu phần mềm Winstat, hướng dẫn cài đặt và sử dụng vềphần mềm đó Giới thiệu các gói lệnh phân tích hồi quy của phần mềm Winstat Sửdụng các gói lệnh đó để phân tích ví dụ trong thực tiễn từ đó để đưa ra một số kếtluận thống kê

Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn của TS.

Nguyễn Trung Hoà Tác giả xin được bày tỏ lòng biết ơn chân thành và sâu sắc nhất

đến thầy - người đã đặt ra vấn đề và thường xuyên giúp đỡ tác giả trong suốt quá trìnhhọc tập và nghiên cứu

Trang 4

Nhân dịp này, tác giả cũng xin chân thành cảm ơn các thầy cô giáo trong khoaToán, khoa Sau đại học và các bạn học viên lớp cao học 15 - Xác suất thống kê đãthường xuyên giúp đỡ tác giả trong quá trình học tập và hoàn thành luận văn.

Mặc dù có nhiều cố gắng, song luận văn không thể tránh được những thiếu sót,tác giả rất mong được những đóng góp quý báu từ các thầy cô giáo và các bạn

Vinh, tháng 12 năm 2009

Tác giả

Trang 5

Chương 1

CÁC KIẾN THỨC CƠ SỞ

1.1 Biến ngẫu nhiên và hàm phân phối

1.1.1 Biến ngẫu nhiên

Để dễ hình dung, ta hiểu một đại lượng (hay một biến) nhận các giá trị của

nó với xác suất tương ứng nào đấy gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên.

Các biến ngẫu nhiên được ký hiệu là X Y Z, , hoặc Y Y1, , ,2 Y m; X X1, 2, ,X n

còn các giá trị có thể có của chúng được ký hiệu là x y, hoặc x x1, , ,2 x n;

1, , ,2 m

y y y .

Nếu tập các giá trị mà biến ngẫu nhiên nhận là một tập gồm một số hữu hạn điểm hoặc vô hạn đếm được Khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc.

Nếu tập các giá trị mà biến ngẫu nhiên lấp đầy một khoảng nào đó khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên liên tục.

nhiên nhận giá trị nhỏ hơn x (hoặc bên trái x).

1.2 Các loại biến thường gặp trong xử lý thống kê

Trong xử lý thống kê, khi xem xét một tổng thể nào đó theo các tính chất(thuộc tính của nó), người ta thường xem mỗi thuộc tính có mối liên hệ đến một hoặc

Trang 6

nhiều thuộc tính khác Mỗi thuộc tính đó có thể được xem là một biến Thông thườngcác biến được phân loại như sau

1.2.1 Biến định lượng

Thông thường các số đo đều là biến định lượng Biến định lượng có thể chia thành các loại

- Biến nhận các giá trị thực liên tục: Các biến có thể có giá trị là một số

thực nào đó nằm trong một đoạn thẳng trên một trục số Ví dụ: Cân nặng, chiều cao, nồng độ …

- Biến nhận giá trị thực rời rạc: Các biến có tập giá trị là tập hữu hạn các

số thực Ví dụ: Mức lương, loại giá vé xe… Biến nhận các giá trị nguyên, như:

Tuổi, số người…

1.2.2 Biến định tính

Thường biến định tính xác định tính chất nào đó của đối tượng nghiên cứu, giá trị của các biến thường không phải là các số Ví dụ: Giới tính, lí do vay mượn, quan điểm về một vấn đề…là các biến định tính Biến định tính được chia làm hai loại.

- Biến định tính có thứ tự là biến mà các giá trị của nó có khả năng được

sắp xếp theo một thứ tự nào đó, biểu thị mức độ quan trọng khác nhau của các giá trị đó Ví dụ: Nhà cửa, nguồn nước sử dụng…

- Biến định tính không có thứ tự là biến mà các giá trị có thể của nó không

được xếp theo thứ tự hơn kém Ví dụ: Dân tộc, tôn giáo…

Biến phụ thuộc còn gọi là biến được mô tả thể hiện kết quả của hiện tượng,

thường nằm ở vế phải của công thức, là đối tượng chính, mục tiêu của công việc nghiên cứu.

Chú ý:

* Sự phân biệt giữa các loại biến đó cũng có tính tương đối, tuỳ thuộc vào

Trang 7

mục đích của vấn đề và ý đồ của người nghiên cứu mà một biến ở chỗ này được xem là biến định lượng mà ở nơi khác có thể được cho là biến định tính Ví dụ:

“Đồ đạc tiện nghi trong gia đình” là biến định tính nếu xét dưới góc độ xem xét chất lượng đời sống sinh hoạt, song lại là một biến định lượng khi muốn xác định tài sản gia đình Một biến định tính lúc này không được xem là có thứ tự, lúc khác lại được xem là có thứ tự.

* Trong mô hình nhiều mức, một biến có thể vừa là biến phụ thuộc, vừa là biến độc lập.Ví dụ: “chi tiêu cho ăn uống hàng ngày” là biến “được mô tả” (biến phụ thuộc) nếu xét trong mối quan hệ với các yếu tố thu nhập và điều kiện sống, song lại là biến “dùng để mô tả” (biến độc lâp) khi muốn biểu diễn ảnh hưởng của nó đến sức khoẻ của các thành viên trong gia đình.

* Các loại biến vừa nêu trên có thể là tất định, có thể mang yếu tố ngấu

nhiên và trong luận văn này ta giới hạn việc xem xét các loại biến đó là biến ngẫu

nhiên hoặc qua một phép biến đổi đơn giản chúng được quy về một biến ngẫu

nhiên.

1.3 Mẫu ngẫu nhiên và mẫu quan sát

tập hợp n biến ngẫu nhiên X X1, 2, ,X độc lập, có cùng phân phối xác suất với , n X

kí hiệu là:

( 1, 2, , n)

W = X X X

• Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc

• Các biến ngẫu nhiên X i được gọi là các bản sao của X.

• Phương pháp nghiên cứu không toàn bộ là phương pháp nghiên cứu thông qua mẫu ngẫu nhiên và mẫu quan sát

1.3.2 Mẫu quan sát

Mẫu quan sát W =(x x1, , ,2 x n) là một thể hiện cụ thể của mẫu ngẫu nhiên hay

nó là tập hợp các số liệu quan sát cụ thể về một biến ngẫu nhiên gọi tắt là các số liệuthực nghiệm

Trang 8

Bảng phân phối tần số thực nghiệm:

x i là giá trị phân biệt thứ icủa các quan sát

n i là số lượng các quan sát nhận giá trị tương ứng

• Bảng trên được gọi là bảng mẫu thu gọn

Giá trị cụ thể của hàm G tương ứng với tập giá trị quan sát

( x x1, , ,2 x n) là số Gqs= f x x( 1, , ,2 x n) nó là một thể hiện của thống kê G, thu được từ mẫu quan sát (số liệu) về biến ngẫu nhiên gốc X và được gọi là giá trị quan sát của thống kê G

1.4.2 Thống kê trung bình mẫu

Giả sử W =( X X1, 2, ,X n) là mẫu ngẫu nhiên, khi đó trung bình mẫu của mẫu ngẫunhiên W là thống kê

1

1

n i i

n =

Trang 9

Vì mỗi X i là một bản sao của biến ngẫu nhiên gốc X nên chúng đều có cùng kỳ vọng và

phương sai mẫu tương ứng là:

( )2

2

1

11

n i i

S cũng là một biến ngẫu nhiên

Trang 10

thì giá trị quan sát của phương sai mẫu được tính bởi:

( )2

2

1

11

k

i i i

Trang 11

thì giá trị quan sát của phương sai mẫu được tính bởi:

1.4.4 Thống kê tần suất mẫu

Nếu A là một biến cố nào đó với xác suất xuất hiện biến cố Ap, gọi X

là biến ngẫu nhiên có phân phối không-mộtA p( )và nếu

n n

Trang 12

Chương 2

PHÂN TÍCH HỒI QUY

Phân tích hồi quy là một phương pháp phân tích thống kê để dự đoán hoặc ướclượng giá trị của một đại lượng (biến được ước lượng, được mô tả) theo một haynhiều đại lượng khác (biến dùng để ước lượng, dùng để mô tả) thông qua một côngthức nào đó Nó cũng được vận dụng để đánh giá hiệu quả tác động của biến độc lậpđối với biến phụ thuộc

Tuỳ từng trường hợp để dự đoán và ước lượng mà ta sử dụng các phương phápphân tích hồi quy tuyến tính, phương pháp hồi quy đa thức, phương pháp hồi quy phituyến v.v cho phù hợp

2.1 Hồi quy đơn

2.1.1 Hồi quy tuyến tính đơn

Đây là thủ tục ước lượng các hệ số trong một phương trình hồi quy, khi biến

dự báo phụ thuộc một cách tuyến tính vào các biến mô tả Phương trình hồi quy tuyếntính tốt nhất được xác định thông qua tiêu chuẩn sai số bình phương tối thiểu

Mô hình hồi quy tuyến tính đơn được diễn đạt qua phương trình

Y =a X b e+ +

Trong đó

*a cho biết khi tăng mỗi đơn vị của biến độc lập X thì biến phụ thuộc Y

sẽ tăng hay giảm bao nhiêu đơn vị;

* blà hằng số hồi quy cho biết điểm xuất phát của Y khi X bằng 0 là ở đâu - âm hay dương, đường hồi quy có đi qua gốc tọa độ hay không.

* e là phần dư hồi quy, nó cho biết sai số của phương trình hồi quy tại từng quan sát.

2.1.2 Hồi quy phi tuyến

Khi biến độc lập và biến phụ thuộc không có mối quan hệ tuyến tính Lúc đóphải dùng mô hình hồi quy phi tuyến

( )

Y = f X +e

Một số dạng phi tuyến

Trang 13

Ước lượng tham số hồi quy bằng phương pháp bình phương bé nhất

( , ),(X Y X Y, ), ,(L X Y n, ),nxây dựng hàm hồi quy mẫu dạng

Cần tìm ước lượng của các tham số sao cho tổng bình phương các sai số (phầndư) là nhỏ nhất:

m

i i i i

f

Y a X b a

f

Y a X b X a

Trang 14

Nghiệm trên sẽ là lời giải cần tìm nếu đạo hàm riêng phần bậc 2 của ftại điểm đó (ma trận Hessian)là một ma trận xác định dương (điều kiện đủ):

Ma trận trên là ma trận xác định dương, vậy f đạt min tại ( )a b$$,

2.1.3 Một số tính chất của tham số hồi quy ước lượng bằng phương pháp bình phương bé nhất

a) Trung bình của các phần dư bằng 0:

1

1

0

m i i

1) Các giá trị của biến độc lập X là giá trị được xác định trước

2) Sai số ngẫu nhiên có kỳ vọng bằng 0:

Trang 15

( i, j) 0,

Cov e e = ∀ ≠i j

2.1.5 Khoảng tin cậy của các hệ số hồi quy

Các tham số cần ước lượng là đại lượng ngẫu nhiên, phụ thuộc vào mẫu quansát Muốn đánh giá được độ chính xác của các ước lượng đó ta cần biết khoảng tincậy của chúng Trước tiên cần ước lượng độ biến động của chúng:

Trang 16

Kiểm định giả thiết đối với các hệ số hồi quy

- Nếu θ0 nằm trong khoảng đó thì chấp nhận giả thiết,

- Nếu θ0 nằm ngoài khoảng đó thì bác bỏ giả thiết

Chú ý Đối với bài toán kiểm định một phía, ta phải dùng xác suất ý nghĩa

θ θβ

trong đó T là biến ngẫu nhiên có phân phối T Studentvới (m− 2) bậc tự do

a) Đối với bài toán 2 phía, so sánh giá trị β với mức ý nghĩa α đã định

- Nếu β α> thì chấp nhận giả thiết,

- Nếu β α≤ thì bác bỏ giả thiết

b) Đối với bài toán 1 phía, so sánh giá trị β với mức ý nghĩa α đã định

- Nếu β >2α thì chấp nhận giả thiết,

- Nếu β ≤2α thì bác bỏ giả thiết

Cách 2’

Trang 17

a) Đối với bài toán 2 phía, qua đại lượng ngẫu nhiên T có phân phối

T Studentvới (m−2) bậc tự do, tính giá trị tới hạn t m−2( )α với giá trị mức ý nghĩa α đã định:

b) Đối với bài toán một phía, qua đại lượng ngẫu nhiên T có phân phối

T Studentvới (m−2) bậc tự do, tính giá trị tới hạn t m−2( )2α với giá trị mức ý nghĩa α đã định:

Trang 18

2.2 Hồi quy đa thức

Khi mối liên hệ giữa biến phụ thuộc và các biến độc lập không còn là tuyến tính, cần dùng mô hình hồi quy bậc cao hơn để mô tả quy luật.

2.2.1 Mô hình bậc hai

Với các biến độc lập X X1, 2, X mvà biến phụ thuộc Y, ta tìm các hệ số hồi

quy α γi, iJ, ij=1,2, ,m để ước lượng Y:

tương tác của các biến độc lập trong mô hình hồi quy Có nghĩa là kiểm tra được

xem các biến độc lập có “cộng hưởng” với nhau trong việc tác động lên biến phụ thuộc hay không.

- Bằng phương pháp tương tự như trên, ta có thể thành lập các mô hình hồi quy đa thức bậc cao hơn.

2.2.2 Mô hình hồi quy phân tầng

Trang 19

Trong mô hình trên, nếu xét thêm đặc thù của các nhóm bệnh (hoặc nhóm đối tượng bệnh nhân) khác nhau thì các hệ số ab cần phải phản được cả những đặc thù ấy.

Đây là mô hình hồi quy tuyến tính với 1 k+ biến độc lập.

- Hệ số b i cho biết chi phí ban đầu của nhóm thứ i

- Hệ số a cho biết quy luật chung cho tất cả các nhóm: trung bình chi phí hàng ngày của người bệnh là bao nhiêu

Việc kiểm giả thiết bằng nhau của các hằng số b b1, , ,2 b kchính là việc xác

định xem có tồn tại tính đặc thù trong các nhóm hay không

Trường hợp 2 Chi phí ban đầu như nhau, chi phí hàng ngày khác nhau giữa các nhóm

Từ các biến phụ đã thành lập như trên và biến X nguyên thủy, ta lập k

Đây là mô hình hồi quy tuyến tính với 1 k+ biến độc lập.

- Hệ số a i cho biết trung bình chi phí hàng ngày của nhóm thứi

Trang 20

- Hệ số b cho biết quy luật chung cho tất cả các nhóm: chi phí ban đầu chung cho mọi người bệnh là bao nhiêu

Nhận xét.

- Có thể lập mô hình hồi quy phân tầng với nhiều biến độc lập nguyên thủy

- Có thể kết hợp hai mô hình phân tầng đã nêu cho trường hợp nhiều biến độc lập nguyên thủy.

2.2.3 Mô hình hồi quy phi tuyến tổng quát

Giả sử có mẫu ( X Y1, 1) (, X Y2, 2) (, X Y m, m) Ta muốn xây dựng hàm hồi quy

Ước lượng tham số hồi quy bằng phương pháp lặp

Giả sử f là một hàm khả vi liên tục Lúc đó đạo hàm riêng phần của g sẽ triệt tiêu tại điểm (giá trị của tham số) g đạt min:

Trang 21

Cơ sở giải tích Cho một giá trị ban đầu β(0) nào đó của véc tơ các tham số

β Lúc đó, theo Định lý giá trị trung bình ta có

thay vào vị trí của β0 trong (***) để tiến hành bước tiếp của chu trình lặp.

Bước N Quá trình được dừng lại sau N bước hoặc khi chênh lệch giữa hai véc tơ ước lượng của hai bước liên tiếp đủ nhỏ:

2 23 Hồi quy bội

2 23 1 Hồi quy bội tuyến tính

Mô hình hồi quy bội tuyến tính được diễn đạt qua phương trình

Trang 22

1 1 2 2 k k 0

Y =a X +a X + +L a X + + =b e

* X X1, 2, ,X k là các biến độc lập dùng để dự báo biến Y

từng biến độc lập vào sự tăng giảm của biến phụ thuộc ;

tất cả các biến độc lập bằng 0;

Khi vế phải của phương trình hồi quy phía trên được thay bằng một biểu

thức phi tuyến của các biến độc lập, ta sẽ có mô hình hồi quy phi tuyến bội.

2 2 1.1 Ước lượng tham số hồi quy bằng phương pháp bình phương bé nhất

LƯớc lượng tham số hồi quy bằng phương pháp bình phương bé nhất

Trang 23

m m km

X X X

X X X X

hiện tượng đa cộng tuyến giữa các biến độc lập.

Cách giải quyết

điểm đó là một ma trận xác định dương (điều kiện đủ):

đạt min tại nghiệm vừa tìm được

2 2 1.2 Tính chất của tham số hồi quy ước lượng bằng phương pháp bình phương bé nhất

Trang 24

f) Ước lượng của các tham số là ước lượng không chệch:

i i

2 2 1.3 Đánh giá chất lượng của mô hình

Khi đã ước lượng được các hệ số của phương trình hồi quy, thay giá trị của

các biến độc lập vào vế phải (không kể phần dư e ), ta thu được một biến mới, kí

* Biến phần dư e bằng hiệu Y Y− ';

ánh tính “gần gũi” giữa hai biến phụ thuộc và dự đoán Cùng một cỡ mẫu, hệ số nàycàng lớn thì mô hình càng tốt, dự đoán càng chính xác

lập và biến phụ thuộc;

biến phụ thuộc Yvà tập biến độc lập, { X X1, 2, ,X k} .

* Trong thực hành, để tiện tính toán và nhận xét, người ta thường dùng đại

3 Đánh giá chất lượng của mô hình qua việc phân tích các sai số

Sau khi đã ước lượng được mô hình, có thể dùng đồ thị đám mây điểm biểudiễn quan hệ giữa phần dư hồi quy và biến phụ thuộc để kiểm tra

Trang 25

b) Xu thế thay đổi nào đó của sai số, nếu có.

Từ đó tìm cách hiệu chỉnh mô hình cho phù hợp hơn.Một số dạng phân bố có thể của sai số

Dạng 1:

Trang 26

Các sai số tập trung quanh trục Y, tương đối đều về hai phía so với trục đó và

độ chính xác gần như nhau Mô hình đã được lựa chọn đúng đắn Nếu độ phân tán

các biến độc lập (thêm hoặc biến đổi, sửa chữa các biến mô tả chẳng hạn)

Dạng 2:

các mô hình nhiều mức

Dạng 3:

Giá trị ước lượng trong mô hình bị thừa ở đoạn này song lại hụt ở đoạn khác

lại mô hình các mô hình phi tuyến

2 2 1.4 Đánh giá mô hình qua việc kiểm định các giả thiết thống kê

Hệ số tương quan bội R của phương trình hồi quy chưa nói lên đầy đủ đượcchất lượng của mô hình

Trang 27

- Nếu hai mô hình có các biến mô tả khác nhau xuất hiện trong phương trình hồi quy thì dùng hệ số tương quan bội không kết luận được mô hình nào tốt hơn.

- Có thể việc loại bỏ bớt một số biến nào đó ra khỏi phương trình hồi quy tuy làm thay đổi hệ số tương quan bội, song về thực chất lại không làm giảm đáng kể chất lượng của mô hình.

- Trong thực hành, nhiều khi dùng ít biến mô tả trong phương trình hồi quy thì “kinh tế” hơn, mặc dù sai số ước lượng có thể lớn hơn

Như vậy, phải dựa vào các phép kiểm định để tiến hành đánh giá, lựa chọn mô hình.

Bài toán kiểm định 1

Kiểm định giả thiết H := = = = =a1 a2 a k 0

Định lý Giả sử R là hệ số tương quan bội trong mô hình hồi quy tuyến tính

a = =a L a = Như vậy mọi biến độc lập đều không có vai trò gì đối với mô

hình hồi quy, không có ràng buộc nào giữa các biến này và biến phụ thuộc bên

vế trái của phương trình Lúc đó mô hình hồi quy không tốt, cần tìm mô hình khác.

Bài toán kiểm định 2

Trang 28

Kiểm định giả thiết H a i: i =0 với một inào đó cần kiểm tra.

Dùng phép kiểm định này ta có thể xác định rõ ràng được biến độc lập nào thực sự có đóng góp cho phương trình hồi quy tuyến tính.

Để kiểm định các giả thiết này, người ta dùng biến T n m( − −1) là một biến có phân phối Student n m( − −1) bậc tự do, với nlà số lượng quan sát,m

số lượng biến độc lập có mặt trong phương trình hồi quy.

Đối với mỗi hệ số ai ứng với biến độc lập Xi, ta thành lập tham số t i

tính xác suất p i= xác suất để T n m( − − >1) t i

Tiếp đó, so sánh p i với mức ý nghĩa alpha đã định:

- Nếu p i >anpha thì chấp nhận H icoi, a i =0

- Nếu p ianpha thì bác bỏ H i khẳng định a i khác 0

Biến gây nhiễu và biến bị gây nhiễu

Trong phương trình hồi quy, một biến độc lập có thể thực chất không gây ảnh hưởng đối với biến phụ thuộc song vì chịu tác động của một biến khác mà lại tỏ ra có vai trò nào đó.

Ngược lại, cũng có thể một biến độc lập có vai trò nhất định đối với việc

dự đoán biến phụ thuộc, song vì tác động của một biến thứ ba mà vai trò của nó

bị che lấp đi Do đó người ta cần phải xác định được những biến gây nhiễu (tác động) và biến bị nhiễu (chịu tác động).

Có thể dùng phép kiểm định 2 trên để vạch ra những biến gây nhiễu và những biến bị nhiễu Trong số các biến xuất hiện trong phương trình hồi quy, nên quan tâm những biến mà hệ số của nó khác 0 một cách có nghĩa (xác suất kiểm định nhỏ hơn mức cho phép)

Chú ý:

- Trong nhiều phương trình hồi qui, có khi không nên loại bỏ những biến

mà hệ số của nó không khác 0 một cách có nghĩa, vì theo thực tế chúng vẫn có đóng góp nào đó hoặc có tác dụng hiệu chỉnh những ảnh hưởng thái quá của những biến khác.

- Có những biến thể hiện vai trò của mình trong phương trình hồi quy với một tổ hợp biến độc lập này nhưng lại không thể hiện vai trò trong một tổ

Trang 29

hợp biến khác Do đó nên tiến hành phân tích nhiều mô hình khác nhau để so sánh.

- Phải dựa vào ý nghĩa thực tế để lựa chọn mô hình hồi quy.

Bài toán kiểm định 3

Để so sánh sự hơn kém của hai mô hình hồi quy với các số biến mô tả khác nhau, ta có thể xét bài toán sau:

Giả sử q< <p n là các số nguyên, cần so sánh mô hình hồi quy tuyến tính

với Y được mô tả qua p biến X X1, 2, ,X pvới mô hình được mô tả qua q biến.

R R

n p F

Lúc đó tỷ số trên có phân phối Fisher với(n p− )( p q− )bậc tự do.

Theo định lý đó, ta có thể sử dụng thống kê Fisher để kiểm định sự hơn kém của hai mô hình nêu trên.

1 Ta thành lập giả thiết

H: hai mô hình tốt như nhau

để so với đối thiết

Khi mối liên hệ giữa biến phụ thuộc và các biến độc lập không còn là tuyếntính, cần dùng mô hình hồi quy bậc cao hơn để mô tả quy luật

Trang 30

2.3.2 Mô hình hồi quy phân tầng

2.3.3 Mô hình hồi quy phi tuyến tổng quát

Giả sử có mẫu ( X Y1, 1) (, X Y2, 2) (, X Y m, m) Ta muốn xây dựng hàm hồi quymẫu dạng

Trang 31

Chương 3

PHÂN TÍCH HỒI QUY TRONG WINSTAT

3.1 Giới thiệu và cài đăt phần mềm Winstat

3.1.1 Giới thiệu về Winstat

- Như ta đã biết, Excel là phần mềm được ứng dụng rộng rải trong công tác kếtoán, văn phòng trên môi trường Windows Excel thực hiện được nhiều phép tính từđơn giản đến phức tạp Nó cũng được ứng dụng nhiều trong việc phân tích và xử lýcác số liệu thống kê Excel tổ chức và lưu dữ thông tin dưới dạng bảng tính Tuynhiên việc sử dụng Excel để phân tích và xử lý số liệu thống kê là rất phức tạp, đòi

hỏi người sử dụng phải nắm vững và chính xác các hàm cần nhập để xử lý Trong

nhiều trường hợp ta cần phải bổ xung thêm công cụ phân tích dữ liệu và sử dụng các

trình cài thêm Chính vì những hạn chế của Excel trong việc phân tích và xử lý số liệu

thống kê đó mà phần mềm Winstat ra đời Vậy Winstat là gi?

Winstat là phần mềm bổ trợ cho Excel để xử lý các số liệu thống kê Winstat

có các chức năng sau

- Danh mục các chức năng của Winstat

Basics (Khái niệm cơ bản)

• Descriptive Statistics (Thống k ê m ô tả)

• Frequencies (Tần số)

• Means ( G i á trị trung b ì nh)

• Test of Randomness ( Kiểm định tính ngẫu nhi ê n)

• Test of Outliers ( Kiểm định Outlers)

• Chi-Square Test ( Kiểm định Chi-Square)

Comparison of 2 Groups (So sánh 2 nhóm)

• t-Test Independent (t- Kiểm định biến đ ộc lập)

• t-Test Dependent (t- Kiểm định biến phụ thuộc)

• Wilcoxon Test (Kiểm định Wilcoxon)

Ngày đăng: 19/12/2013, 10:40

HÌNH ẢNH LIÊN QUAN

Bảng phân phối tần số thực nghiệm: - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy
Bảng ph ân phối tần số thực nghiệm: (Trang 8)
Bảng số liệu là điểm các môn thi tốt nghiệp của 299 học sinh (Lê Lợi có 168 học sinh, Lam kinh có 231 học sinh), năm học 2008-2009 của hai trường Lê Lợi và Lam Kinh. - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy
Bảng s ố liệu là điểm các môn thi tốt nghiệp của 299 học sinh (Lê Lợi có 168 học sinh, Lam kinh có 231 học sinh), năm học 2008-2009 của hai trường Lê Lợi và Lam Kinh (Trang 52)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w