1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận mô hình hồi quy giải thích sự khác biệt về tuổi thọ của phụ nữ trên thế giới

18 692 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 18
Dung lượng 762,32 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuy ến tính là một kỹ thuật hay m ô hình quan trọng để tìm ra sự tương quan của các biến nguy ên nhân và kết quả để ta có thể hình d

Trang 1

TRƯỜNG Đ ẠI HỌ C MỞ TP.HCM

LỚ P CAO HỌC Q UẢN TRỊ KINH DOANH KHÓA 8

TIỂU LUẬN MÔ N HỌC:

PHÂN TÍCH Đ ỊNH LƯỢNG

ĐỀ TÀI TIỂU LUẬN:

NHÓM THỰC HIỆN:

Đào Hùng Anh

Võ Ph ương H ồn g C úc

Lê Trọng Đoan Cao Văn Tuấn

TP H ồ Chí Minh, tháng 2 năm 2009

Trang 2

ĐẠI HỌC MỞ TP HỐ CHÍ M INH CỘNG HÒA XÃ HỘI CHỦ NGHĨ A VI ỆT NAM

ĐỀ KIỂM TRA

Yêu cầu:

Sử dụn g dữ liệu trong file World 95 Tieng Viet.sav đính k èm, bạn hãy tự xây dựn g cho mình một m ô

hình hồi quy giải thích sự khác biệt về tuổi thọ ph ụ nữ giữa các quố c gia trên thế giới

Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũn g như tự quyết định dạng thức của các liên hệ giữa biến giải thích và biến kết quả

Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của m ô hình này bằn g các côn g c ụ chẩn đoán và đánh giá m ô hình Giải thích ý ngh ĩa c ác kết quả của mô hình rút ra

Sản phẩm nộp:

1 Bài làm dạn g fi le Word ( có ghi tên các thành viên của nhóm ở trang đầu)

2 File output SP SS

Cả 2 file được đặt tên như sau M BA8_KT _nhom X (X là số thứ tự nhóm )

Hình thức:

File Word định dạn g khổ giấy A4 (canh lề 2cm m ỗi phía),

font chữ T ime New Roman, cỡ 12 points

Cách đoạn ( Spacin g before) 6 points, giãn dòng ( line spa cin g) 1.2

Chúc thành c ông!

Trang 3

Lời nói đầ u:

Phân tích định lượng là m ôn học nh ằm trang bị kiến thức và phương ph áp trong việc xây dựn g m ô hình, thu thập thông tin về thị t rường và đời sốn g xã hộ i, phân tích số liệu, đánh giá số liệu nhằm khái quát hóa các vấn đề n ghiên cứu trong mô hình đã xây dựng Đằn g sau nhữn g kiến thức đó cần có kiến thức về thống kê toánvà c ác kỹ năng sử dụn g các loạ i phần mềm ch uyên n gh iệp cho bộ m ôn này như SPSS, E VIEW S hay Excel Qua đó ta thấy đây là m ột lĩnh vực rộn g lớn cần có sự trau dồi và tích lũy kiến thức lâu dài cũng như sự yêu nghề để đạt được sự hiểu biết tường tận và thực hiện tốt công việc này

Trong hệ thống kiến thức rộng lớn đó kỹ thuật hồi quy tuy ến tính là một kỹ thuật hay m ô hình quan trọng để tìm ra sự tương quan của các biến nguy ên nhân và kết quả để ta có thể hình dun g tương đối mối liên kết đó, giúp ta có thể ứn g dụng mô hình trong thực tế đời sốn g xã hộ i hay kinh tế T rong tiểu luận ch úng ta đi n ghiên cứu t uổi thọ của ph ụ nữ kh ác nhau nh ư thế nào trên thế giới thông qua các biến nguyên nhân như GDP, học vấn hay số lượn g sinh sản … sau đó đánh giá mô hình thông qua các chỉ số liên k ết, các ch ỉ số v ề sự chính xác và tươn g quan của các biến n ghiên c ứu

Nhóm xin chân thành biết ơn và cảm t ạ thầy Hoàng Trọng, đã hết lòng truyền thụ kiến thức và chia sẻ những kinh nghiệm quý báu trong quá trình hướng dẫn lớp MBA-08 môn học phân tích định lượn g Kính ch úc thầy nhiều sức khỏ e để tiếp tục truyền th ụ sự hiểu biết cho các khóa đàn em mai sau

Trang 4

MỤC LỤC

I Lý thuyết về hồi quy tuy ến tính

1 Hệ số tương quan đơn

2 Xây dựn g ph ươn g trình hồi quy tuyến tính

3 Đánh giá sự phù hợp của m ô hình

4 Kiểm định giả thuyết về độ ph ù hợp của m ô hình và ý nghĩa c ủa h ệ số hồi quy

5 Hồi quy bội, những vấn đề cần quan tâm khi thực hiện

II Ứ ng dụn g Hồi quy tuyến tính vào để xây dựn g m ột m ô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới

1 Xác định biến n guy ên nhân và k ết quả

2 Xây dựn g m ô hình hồi quy t uyến tính

3 Đánh giá sự phù hợp và kiểm định mô hình

4 Mô hình đa biến, chọn lựa biến nguyên nh ân, xây dựn g và đánh giá

Kết luận

Trang 5

I.Lý thuyết tổng quát về hồi quy đơn biến

1 H ệ số tươ ng quan.( correlatio n co efficient)

- Hệ số tươn g quan r nhằm nói lên sự liên kết chặt chẽ giữa h ai biến nào đó

- Hệ số tương quan cho m ẫu là ước lượn g của hệ số tương quan r để đo lường mối liên k ết tuyến chặt chẽ giữa các biến của mẫ u

- Hệ số này không có đơn vị

- Hệ số này có giá trị biến thiên từ -1 đến 1

- Khi có giá trị âm hệ hai biến có tươn g quan nghịch biến

- Khi có giá trị dương h ệ hai biến có tươn g quan đồn g biến

- Khi gía trị này bằng khôn g thì hai biến khôn g có liên k ết

- Côn g thức tính toán hệ số tươn g quan mẫu:

Trong đó:

r: hệ số tương quan, X : gía trị hệ số nguyên nhân, Y: giá trị hệ số kết quả, X: hệ số trun g bình biến nguyên nh ân, Y: giá trị trung bình biến k ết quả, n : độ lớn mẫ u

- Giá trị r giữa hai biến có thể là r ất thấp nhưng chưa hẳn hai biến đó hoàn toàn khôn g có mối liên hệ,

có thể nó lại có dạn g liên quan khá c như liên hệ phi tuyến

- Giá trị r có thể là rất cao có khi gần bằn g 1 nhưng thực tế khôn g có sự liên quan nào, n gười ta gọi là

sự tươn g quan giả, ví dụ như n gười ta ngh iên cứu số lượng trẻ sơ sinh phụ thuộc vào dân số c ủa thành phố HCM có sự tươn g quan rất cao vào năm 200x nhưng thực tế hai biến này có sự tương quan giả,

do khoản thời gian đó k inh tế suy giảm các n ăm gần đó tỷ lệ sinh giảm, nhưng đặc biệt năm đó là năm

Trang 6

may mắn nên các gia đình quy ết định sinh con nhiề u Nh ư vậy t a thất ở đây tương quan thật phải là số lượn g trẻ sơ sinh và n ăm t ốt

- Như vậy h ệ số tương quan ch ỉ được coi là m ột chỉ số nói lên sự chặt chẽ giữa các biến

2.Xây d ựng phương trình hồi quy tuyến tính:

Sau khi đã nghiên cứu hệ số tươn g quan r, ta thấy rằng có thể hai biến có hệ số tương quan chặt chẽ một cách tuyến tính nhưng thực tế thì không có sự liên hệ nào về thực chất, do vậy để xây dựn g phương trình hồi quy tuy ến tính của các biến với nhau thì xem như ta đã nghiên cứu thấu đáo về sự liên quan giữa chúng trong thực tế, và có xét đến hệ số tươn g quan cần thiết khá cao

Sau đó ta tiến hành xây dựng mô hình Lý thuyết thông thường người ta đặt biến Y là biến k ết quả và biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung T rong phần nghiên cứu c ủa tiểu luận ta chi đi khảo sát m ối liên quan tuyến tính theo đường thẳng đố i với m ối liên hệ theo các hình khác như p ara bol hay hình gấp kh úc không được đề cập

Phươn g trình hồi quy tuyến tính của tổng thể và mẫu có dạn g đườn g thẳng như sau:

Yi = 0 + 1Xi + , Yi = B0 + B1Xi + 

Trong đó Y là biến kết quả dự đoán thứ i, Xi là biến nguyên nhân thứ i, B0 hệ số tươn g quan tun g độ góc là giá trị của Y khi X bằn g khôn g, B1 là hệ số tươn g quan độ dốc của đường thẳng biểu diễn m ô hình hồi quy,  là gía trị khác biệt giữa hồi quy và giá trị thực tế

Ý nghĩa của các hệ số :

- B0 nói lên giá trị của biến dự đoán kh i gía trị n guyên nh ân bằn g khôn g

đổi X B1 đơn v ị

-  nói lên sự khác biệt giữa giá trị hồ i quy v à gía trị thực tế, ví dụ một biến kết quả có thể ảnh h ưởn g bởi rất nhiều biến n guyên nhân nh ưn g ta lại chỉ khảo sát một biến n guyên nhân duy nhất, điều này đưa đến sự có giá trị khác biệt này, khi giá trị  càng nhỏ thì sự ảnh hưởng của biến n guyên nhân đó càn g lớn và c àn g có sự chính xác kh i áp dụng mô hình hồi quy

- Ví dụ khi ta khảo sát chi ều c ao của của đứa trẻ 8 tuổi t heo chế độ dinh dưỡn g thì ta có gía trị  lớn, thì có nghỉa rằn g chiề u cao của đứa trẻ ph ụ th uộc v ào dinh dưỡn g v à còn phụ thuộc v ào cá c biến khác như chiều cao của cha mẹ, nơi ăn chốn ở hay cách chăm sóc… hay nói cách khác gía trị  nhằm nói đến sự sai lệch do ta ch ưa khảo sát hết tất cả các biến ảnh hưởn g đến biến phụ thuộc mà ta đang khảo sát

- Sau khi có được mô hình hồi quy tuyến tính ta có thể t ính gía trị biến phụ thuộ c thông qua giá trị biến không ph ụ thuộc với một giá trị chênh lệch  nào đó mà ta chưa biết, nhưn g giá trị đó nhỏ hơn

Trang 7

giá trị sai biệt khi ta chỉ t ính trị trung bình so với giá trị thực tế cần khảo sát Để hiểu hơn ta có thể đi đến m ục sau: Đánh giá sự phù hợp của m ô hình hồi quy tuy ến tính

3.Đánh giá sự phù hợp của m ô hình:

Vấn đề quan trọng tron g c ác m ô hình hồi quy là phải ch ứng minh được sự phù hợp của m ô hình mà ta đan g khảo sát, hầu nh ư khôn g có đườn g thẳng hồi quy nào đều hoàn t oàn phù hợp với tập dữ liệu khảo sát và luôn có gía trị sai lệch giữa các trị dự báo từ hồi quy v à giá trị thực tế, sự sai lệch này thể hiện qua phần dư  Do vậy người ta phải n ghỉ đến một thước đo nào đó để chỉ ra mức độ ph ù hợp của mô hình

Thông thường thước đo cho mô hình tuyến tính được dùn g là hệ số xác định R2 R2 được tính theo công thức:

Trong đó SSR được xem như là giá trị sai lệch giữa gía t rị dự đo án theo hồi quy so với giá trị trung bình của tập dữ liệu, nó nói lên ph ần giá trị m à ta có thể ước lượng gần với thực tế hơn khi có ph ươn g pháp hồi quy so với khi ta chỉ t ính giá trị t run g bình của tổng thể tập mẫu

Ví dụ khi ta tính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồn g/n gười như vậy khi một gia đình có 3 người đi làm thì ta có t hể hiểu là gia đình n ày thu nhập là 15 triệu đồn g Nhưng ta đã biết lươn g bổn g thì ph ụ thuộc vào rất nhi ều vấn đề như trình độ học thức, năm kinh nghi ệm , loại công ty hay sự quan h ệ vớ i cấp trên … như v ậy khi ta dùn g m ô hình hồi quy để tính lươn g của m ột người theo trình độ học v ấn thì ta có thể tính như sau:

Lương = B0 + B1*t rình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía trị trình độ là 3 thì Lương =1 +2.5*3 =8.5 triệu Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung bình và giá trị tính theo hồi là SSR

Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trun g bình của tập khảo sát và giá thị thực tế của một giá trị thực tế nào đó

mô hình không ph ù hợp do m ô hình hồi quy không có tác dụng làm sai lệch nhỏ đi m à nó cũn g giốn g

gía trị dự đoán hầu như ch ính xác với gía trị thực tế

Ngoài SST và SSR người ta còn có SSE là giá trị chênh lệch giữa giá trị thực tế và giá trị hồi quy, giá trị này chính là sai số 

Trang 8

Vậy SST = SSE +SSR hay sai lệch tổng = sai lệch ngoài + sai l ệch hồi quy Để hiểu rỏ hơn ta xem hình vẽ sau:

4.Kiểm định giả t huyết về độ ph ù hợp của m ô hình và ý nghĩa của hệ số hồi q uy

a Kiểm định giả thuyết về độ phù hợp của m ô hình hay phân tích ph ương sai:

Khi xây dựng xon g m ô hình hồi quy tuy ến tính vấn đề quan trọng ta ph ải đi kiểm định về độ phù hợp

mô hình hồi quy đó, do trong khi đánh giá sự ph ù hợp của m ô hình bằn g ch ỉ số Rsquare ch ỉ cho ta cái nhìn của tập m ẫu nhưn g khôn g hẳn tổng thể có giá trị ph ù hợp tươn g ứn g

Từ đó ta đi kiểm định, để k iểm định độ ph ù hợp c ủa mô hình hồi quy tổng thể ta đặt giả thuyết

công cho việc kiểm định sự ph ù hợp của mô hình

Đại lượng F được dùn g để kiểm định, nếu xác suất F nhỏ thì ta có thể bác bỏ giả định H0, F có công

thức sau :

2 1

2 1

ˆ

N

i i N

i i

Y Y p F

Y Y N p

b kiểm định giả thuyết về hệ số hồ i quy của tổng thể:

Kiểm định thường được thực hiện chính là độ dốc của m ô hình tổng thể, ý nghĩa của v iệc phải đi kiểm

tổng thể 1 là khác 0

Như vậy cũng tươn g tự nh ư kiểm định giả thuyết về độ phù hợp của mô hình tổng thể ta đặt giả th uyết

và kết quả, hay mô hình hồi quy có quan h ệ thật chứ không là quan hệ giả

Đườn g thẳng hồ i quy

Gía trị trun g bình

Trang 9

Trị thống kê dùng để kiểm định giả thuyết là : t = B1/SB1

Ta cũn g có thể đi k iểm định B0 giống như kiểm định B1 với trị thống k ê là: t = B0/SB0

5 Hồi quy bội , những vấn đề cần quan tâm khi thực hiện

Hồi quy bội có quá trình xây dựn g giống như hồi quy đơn nhưn g ở đây ta có nhiề u biến n guy ên nhân

và chỉ m ột biến kết quả Ví dụ nh ư xét đến s ự hao phí nhiên liệu cho m ột độn g cơ đốt trong thì có thể

có m ột số biến nguyên nhân là: độ nặng của xe, dun g tích cylin der, số cylinder hay tỉ số nén, khoản g cách từ tử điểm trên đến tử điểm dưới…

Mô hình hồi quy bộ i có dạng: Y = 0+1X1+2X2+…+pXp+e

Y: là biến k ết quả, k là các hệ số hồi quy riên g phần, Xk là c ác biến nguyên nhân, e là sai số

Các ưu điểm của hồi quy bội so với hồ i quy đơn:

- Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn kh i ta chọn được các biến nguyên nhân chính xác

- Giúp ta hiểu rõ hơn về vấn đề đan g nhiên cứu, do mọi vấn đề hay hiện tượn g trong tự nhiên hay trong kinh tế, xã hội đều có nhiề u n guy ên nhân gây r a chứ khôn g phải ch ỉ m ột nguyên nh ân ảnh hưỡn g duy nhất

- Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù h ợp

Nh ược đ iểm :

- Có quy trình khảo sát và thu thập dữ liệu khó

- Có hiện tượng đa cộn g tuyến xảy r a khi n ghiên c ứu các biến nguyên nhân Điều n ày xảy ra khi các biến nguyên nh ân ảnh hưởng lẫn nhau

- Có mối liên hệ giả giửa biến n guy ên nhân và biến kết quả

Xây dựng m ô hình:

Bước đầ u tiên khi xây dựn g m ô hình thì ta phải đi xem xét các mối tươn g quan tuyến tính giửa các biến bằn g c ách xây dựn g m a trận tương quan giữa các biến, t ừ đó ta có thể đánh giá sự tương quan của các biến n guy ên nhân với nha u hay sự tác động đến biến kết quả

Để đánh giá độ ph ù hợp của m ô hình hồi quy tuy ến tính bội: ta c ũn g quan sát hệ số R2, khi ta đưa vào

mô hình càng nhiều biến n guyên nhân thì hệ số R2 c ang tăng, nh ưn g thực tế cho thấy khi số biến nguyên nh ân tăng thì khôn g hẳn m ô hình càn g ph ù hợp Do đó đối với mô hình hồi quy tuyến tính bội người ta xét độ ph ù hợp của m ô hình thông qua giá trị Rs quare adjust Giá trị Rsquare điều ch ỉnh này không nhất thiết tăng cao gần một khi ta thêm vào mô hình nhiều biến hơn vì nó không phụ th uộc vào

độ lệch phóng đại của R2, R2 điều ch ỉnh được tính như sau:

P là biến số độc lập trong phương trình ( trong m ô hình hồi quy đơn biến thì p = 1)

Kiểm định độ phù hợp của mô hình:

Cũn g giốn g như phần hồi quy đơn biến thì ta phải đi kiểm định độ phù h ợp của tổng thể, kiểm định F được sử dụn g, ý tưởng của kiểm định này là xem xét tất cả các biến nguyên nh ân có liên hệ v ới biến

ta kết luận độ phù hợp tron g m ô hình giải thích được biến khảo sát

Trang 10

Xét hệ số beta riêng phần cho mơ hình:

Hệ số này nĩi lên sự tác động riên g c ủa m ột biến nguyên nhân n ào đĩ vào biến kết quả khi các biến nguyên nh ân cịn lại khơn g cĩ sự thay đổi, hệ số n ày cịn được k iểm định thơng qua m ức ý ngh ĩa sig khi mức ý ngh ĩa càng nhỏ thì ta đánh giá biến nguyên nhân đĩ cĩ tác động đến mơ hình, n gược lại khi giá trị của m ức ý n ghĩa lớn hơn 0.05 chẵn g h ạn thì khơng cĩ sự tác độn g lớn của biến n guyên nhân đĩ đến mơ hình

II Ứng dụng Hồi quy đơn biến tuyến tính vào để xây dựng m ột mơ hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế gi ới

1.Xác đ ịnh biến nguyên nhâ n và kết quả

Để x ác định biến thì ta dùn g SPSS tìm hệ số tương quan r giữa các biến so v ới biến tuổi thọ phụ nữ, trong đĩ cĩ ba điều kiện cần xem xét:

- Các điểm trên đồ thị Scatter phải tươn g đối tuyến tính theo đườn g thẳng do ta khảo sát mơ hình hơi quy tuy ến tính đơn

- Hệ số tươn g quan càn g gần 1 càn g tốt

- Cĩ sự xem xét thực tế là biến n guyên nhân đĩ cĩ thật sự tươn g quan ảnh hưởng đến biến kết quả là tuổi thọ phụ nữ

Ta lần lược chạy vẽ đồ thị Scatter và tính hệ số tươn g quan r giữa tuổi thọ phụ nữ và các biến nguyên nhân, sau đĩ sẽ chọn biến nào cĩ ảnh hưởng đến t uổi thọ phụ n ữ theo ba tiêu ch í nêu trên

- T uổi thọ phụ nữ theo tỷ lệ dân biết chữ

Ty le d an biet ch u(%)

120 100 80 60 40

20

0

90

80

70

60

50

40

** Co rrelati on is s igni fic ant at the 0.01 level (2-tailed )

T uổi tho ï TB

ph ụ nữ

T ỉ l ệ

da ân bi ế t

c hữ (%)

T uo åi thọ TB

ph ụ nữ

Pears on Correl ation 1 .865 (**) Sig (2-tailed) 00 0

T ỉ l ệ d ân

bi ế t c hữ (%)

Pears on Correl ation .86 5(** ) 1 Sig (2-tailed) 00 0

Ngày đăng: 20/05/2014, 15:07

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w