1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích thống kê số lượng

30 228 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 1,33 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mục Lục Câu 1: Thực hiện các yêu cầu phân tích hồi quy bội Hồi quy bội còn gọi là phương pháp hồi quy đa biến, dùng phân tích mối quan hệ giữa nhiều biến số độc lập tức biến giải thích

Trang 1

Mục Lục

Câu 1: Thực hiện các yêu cầu phân tích hồi quy bội

Hồi quy bội còn gọi là phương pháp hồi quy đa biến, dùng phân tích mối quan hệ giữa nhiều biến số độc lập (tức biến giải thích hay biến nguyên nhân) ảnh hưởng đến 1 biến phụ thuộc (tức biến phân tích hay biến kết quả)

Trong thực tế, có rất nhiều bài toán kinh tế - cả lĩnh vực kinh doanh và kinh tế học, phải cần đến phương pháp hồi quy đa biến Chẳng hạn như phân tích những nhân tố ảnh hưởng đến thu nhập quốc dân, sự biến động của tỷ giá ngoại hối; xét doanh thu trong trường hợp có nhiều mặt hàng; phân tích tổng chi phí với nhiều nhân tố tác động; phân tích giá thành chi tiết; những nguyên nhân ảnh hưởng đến khối lượng tiêu thụ…

Một chỉ tiêu kinh tế chịu sự tác động cùng lúc của rất nhiều nhân tố thuận chiều hoặc trái chiều nhau Chẳng hạn như doanh thu lệ thuộc và giá cả, thu nhập bình quân xã hội, lãi suất tiền gửi, mùa vụ, thời tiết, quảng cáo tiếp thị… Mặt khác, giữa những nhân

tố lại cũng có sự tương quan tuyến tính nội tại với nhau Phân tích hồi quy giúp ta vừa kiểm định lại giả thiết về những nhân tố tác động và mức độ ảnh hưởng, vừa định lượng được các quan hệ kinh tế giữa chúng Từ đó, làm nền tảng cho phân tích dự báo và có những quyết sách phù hợp, hiệu quả, thúc đẩy tăng trưởng

Mô hình hồi quy tuyến tính k biến (PRF):

E(Y/X2i,…,Xki) = β1+ β2X2i +…+ βkXki

Yi = β1+ β2X2i + …+ βkXki + Ui Trong đó :

Y - biến phụ thuộc

X2,…,Xk - các biến độc lập

Ui: Sai số ngẫu nhiên

β1 là hệ số tự do

Trang 2

βj cho biết khi Xj tăng 1 đơn vị thì trung bình của Y sẽ thay đổi βj đơn vị trong trường hợp các yếu tố khác không đổi (j=2,…,k)

Khi k=3 ta sẽ có mô hình hồi quy tuyến tính 3 biến

E(Y/X2, X3) = β1+ β2X2 + β3X3 (PRF)

Yi = β1+ β2X2i + β3X3i + Ui (PRM)

1.1 Mối Liên hệ giữ mô hình hồi quy đơn biến va hồi quy bội

Báng so sánh về dạng hàm của mô hình hồi quy đa biến so với trường hợp đơn biến

Hồi quy đơn biến Hồi quy đa biến

Ví Dụ CONS =β1+β2INCINV =β1 +β2T +β3G+β4INT

Dạng mô Hình Y =β1+β2XY =β1+β2X2 +β3X3 +β4X4 +ε

Với mỗi quan sat Y n =β1+β2X nn Y n =β1 +β2X n2 +β3X n3 +β4X n4 +εn

Như vậy hồi quy đa biến là sự mở rộng tự nhiên của trường hợp đơn biến ,khi số biến giải thích lớn hơn 2, kể cả hằng sô

1.2 Thực hiện mô hình hồi quy 3 biến

a Ứớc lượng các tham số cho mô hình hồi quy ba biến E(Y/X2, X3) = β1+ β2X2 + β3X3 (PRF)

Yi = β1+ β2X2i + β3X3i + Ui (PRM)

Hồi quy mẫuGiả sử có một mẫu gồm n quan sát các giá trị (Yi, X2i, X3i) Theo phương pháp OLS,

Tìm (j= 1,2,3) phải thoả mãn :

Q= ( ˆ ˆ ˆ )2 min

3 3 2 2 1

i i

i Y e X X e

j

βˆ

Trang 3

Giải hệ ta có:

x i = X iX

y i =Y iY

=> yˆi =βˆ2x2 +βˆ3x3 →Hàm hồi quy mẫu đi qua gốc tọa độ

b Phương sai của các ước lượng là:

Trong đó : Trong đó : σ2 = Var(Ui) (σ2 là phương sai của Ui )

σ2 chưa biết nên trong thực tế người ta dùng ước lượng không chệch của nó

1 2 1 2

Mô hình hồi quy 3 biến

3 3 2 2 1

3 2

ˆˆ

ˆˆˆ

X X

βββ

2 3i

2 2i

i 2i 3i 2i

2 2i i 3i

2 3i 2i

2 3i

2 2i

i 3i 3i 2i

2 3i i 2i

) x x ( x x

y x x x x

y x

) x x ( x x

y x x x x

y x

2 3

2 2

2

2 3 2

1

)ˆ(

)ˆ(

1)ˆ(

σβ

σβ

σβ

2 3i

2 2i

2 2i

2 3i 2i

2 3i

2 2i

2 3i

2 3i 2i

2 3i

2 2i

2i 3i

) x x ( x x

x

) x x ( x x

x

) x x ( x x

x x

Var Var

X X

n Var

3

)1(3ˆ

2 2 2

σ

Yi−Y 2 = Y iYˆi 2 + YˆiY 2

Trang 4

R2= ˆ2 2 2ˆ3 3

i

i i i

i

y

x y x

)(

2

2 2

n y

k n

e R

i i

Với k là tham số của môi hình kể cả hệ số tự do

Mối quan hệ giữa R và R

k n

n R R

d Khoảng tin cậy của tham số

Khoảng tin cậy của tham sô βi với mức ý nghĩa α hay độ tin cậy 1-α

2()ˆ(

ˆ

2 / 2

)2(ˆ)

2(

)2(ˆ

2 2 / 1

2 2

2 /

n

a

σσ

χσ

2( 2) 2

2( 2)ˆ

σχ

n a

n

2( 2)

2 / 1

f Kiểm định giả thiết

Kiểm định giả thiết H0 β =i βi*

)ˆ(

i

i i i

Trang 5

2

2

R

n R

445791214202124

-17-13-11-9-513111723

-12-8-6-4-2046814

-8-8-7-5-3028912

Trang 6

14464361640163664196

646449259046481144956

1 −

x yx2y−900 ∑x1x2 −524 ∑x12 −576 ∑x22 −504Thực hiện trên ta được

445791214202124

40.3242.9245.3348.8552.3757.0061.8269.7872.1979.42

-0.321.080.67-0.85-0.371.00-1.82-1.781.810.58

0.10241.16640.44890.72250.13691.00003.31243.16843.27610.3364

289169121802519121289529

e=0 ∑e2 =13.6740 ∑y2 =1634

và với α =0.05 ta tính Fα

1.3 Mô hình hồi quy k biến

a Mô hình :Mô hình hồi quy trog đó biến phụ thuộc Y phụ thuộc vào k-1 biến giải thích

,098,31

%)1,99(991

,

0

2 =

Trang 7

(i = 1,…, n)Hàm hồi quy mẫu

Với i=1 n ta có dạng ma trận sau

1 1 21

2 1

ˆ

ˆˆ

ˆ

3 3 2 2 1 1

X Y

i n

i i

n

e

β β

β β β

1 2

i n

i i

n i i

X X X

X Y

e

β β

β β β

1 1

i n

i i k

n i

i

X X X

X Y

e

β β

β β β

c Các tham số dưới dạng ước lượng

Kỳ vọng :E(β =) β

Phương sai

i ki k i

i i

i Y e X X e

Trang 8

Với σ2 được ước lượng bởi

k n

e e

ˆ2σ

d Hàm số xác định bội và bội hiệu chỉnh

Tính chất này dùng đẻ đánh giá mức độ thích hợp của hàm hồi quy

+ Giá trị của R2 đồng biến với số biến giải thích của mô hình Tuy nhiên không thể lấy điều đó xem xét việc đã thêm biến giải thischvaof mô hình

 Hệ số xác định bội hiệu chỉnh

hay

R2 có các tính chất sau :

- R2có thể âm, trong trường hợp âm, ta coi giá trị của nó bằng 0

- Khi số biến giải thích của mô hình tăng lên thì R2 tăng chậm hơnR2

1

2

2 ≤R

R

Tính chất này được dùng làm căn cứ xem sét việc đã thêm biến giải thích vào mô hình

 Các sử dụng R2 để quyết định đưa thêm biến vào mô hình

ESS R

y

)/(

i

2 2

n

k n e

k n

n R R

Trang 9

Nếu thì chọn mô hình (1) tức là không cần thêm biến X3 vào ngược lại hì chọn

mô hình (2)

e Khoảng tin cậu của tham số kiểm định các giả thiết hồi quy

 Khoảng tin cậy của tham số

βi∈(βˆi −εi;βˆi +ε)

Khoảng tin cậy của tham sô βi với mức ý nghĩa α hay độ tin cậy 1-α

2()ˆ(

ˆ

2 / 2

)2(ˆ)

2(

)2(ˆ

2 2 / 1

2 2

2 /

n

a

σσ

χσ

2 ( 2 ) 2

2( 2)ˆ

σχ

n a

n

2 ( 2 )

2 / 1

εi =SE(βˆi)t(nk,α/ 2 )

g Kiểm định giả tiết

Kiểm định giả thiết H0 : *

i

i β

β =

)ˆ(

i

i i i

2 2

i X

2 1

R

2 1

R

) 2 ( ˆ

ˆ ˆ

ˆ

3 3 2 2

Y = β + β + β

2 2

R

2 2

R

2 2

2

R >

Trang 10

Nếu t i >t(nk, α / 2 ) hoặc t i <t(nk,α/2): bác bỏ H0

Nếu −t(nk, α / 2 ) ≤t it(nk, α / 2 ) : chấp nhận H0

h Xác định sự phù hợp của mô hình

2 3 3

2

i

ki i k i

i i

i

y

X Y X

Y X

Y R

∑++

∑+

k n

n R R

1(

)(

k n R F

Nguyên tắc quyết định

Nếu F > Fα(k−1,nk) :Bác bỏ H0 mô hình phù hợp

Nếu FFα(k−1,nk) : Chấp nhận H0 : mô hình không phù hợp

1.4 Hướng dẫn phân tích hồi quy 3 biến băng phần mềm SPSS

Giả sử ta có tập dữ liệu như sau :

Y:tổng doanh thu

X2:doanh thu bình quân

Trang 12

Tổng bình phương hồi quy :0.918

Tổng bình phương phần dư là:13.544

Trung bình bình phương hồi qui: 1.836/ 2 (bậc tự do)=0.918

Trung bình bình phương phần dư: 13.544/ 7(bậc tự do=n-2)=1.935

F=0.474

Bảng 4 :Đánh giá ý nghĩa của các hệ số hồi quy

phương trình hồi quy: i=6.046-0.518X2+0.252X3

Câu 2: Phân tích xu thế chuỗi thời gian.

Từ xu hướng phát triển của hiện tượng nghiên cứu ta xác định được phương trình hồi quy lý thuyết , đó là phương trình phù hợp với xu hướng và đặc điểm biến động của hiện tượng nghiên cứu , từ đó có thể ngoại suy hàm su thế để xác định mức độ phát triển trong tương lai

2.1 Mô hình phân tích chuỗi thời gian

Phân tích chuỗi thời gian được chia làm hai phương pháp

Trang 13

Phân tích xu thế : Đây là một phân tích liên quan đến chuỗi nhiều năm, do đó ta sẽ sử dụng số liệu hàng năm để phân tích một cách tổng quát ta cần phải một chuỗi dài ít là 10->15 năm

 Để đánh giá yếu tố xu thế, phương pháp sử dụng phổ biến là phương pháp bình phương tối thiểu (BPTT)

 Đấy là phương pháp cho phép xác định được đường cong (thẳng) hoặc mặt phẳng biểu thị xu thế số liệu ,giới thiệu tốt nhất số liệu trong quá khứ

 Trong trường hợp cá biệt khi nhận thấy xu thế của biến khảo sát trong thời gian dài là tuyến tính ,.Phương trình sẽ được xác định bởi

Y=a+bt

t: biểu thị thời gian

a,b:là những tham số quy định vị trí của đường hồi quy

Từ phương trình này,bằng phương pháp bình phương nhỏ nhất hoặc thông qua việc đặt thứ tự thời gian (t) trong dãy số để tính tham số a,b

Yi: Quan sát a: Xu thế

Đây là một hàm hai biến a và b, để cho D cực trị (với ý nghĩa vật lý của bài toán ta biết đó là cực tiểu) ta phải có

=0

a D

Trang 14

Từ đó :

[1] ∑2[ −( + i)].i =0

i i

t bt a

t N t

y t N y t

.)(

a= y ib t i

N

t N

t

N i

i

+ +

1

Chú ý trong trường hợp xu thế không phải tuyến tính ta có thể xét đến dạng đường cong hàm

mũ y=abt hoặc dạng parabol y=a+bt+ct2 Các tham số a,b,c vẫn xác định dựa vào khái niệm bình phương tối thiểu mà ta vừa nghiên cứu trên

b Đánh giá sự biến đổi theo mùa

Để nhận biết ảnh hưởng của thành phần mùa lên chuỗi thời gian khảo sát ta dùng thông số gọi

là chỉ số mùa

- Nếu số liệu theo tháng, ta có 12 tháng giá trị is

- Nếu số liệu theo quý ,ta có 12 giá trị is.

- Nếu giá trị tính theo 6 tháng ,ta có 2 giá trị is

Tính chỉ số mùa

Từ số liệu quan trắc chỉ số mùa được tính từ is,t như sau:

is,t=[giá trị quan trắc]/[giá trị cho bởi y=[a+bt]t

Chú ý: Có bao nhiêu số liệu quan trắc → có bấy nhiêu is,t và giá trị is,t thay đổi quanh giá trị 1

Từ các giá trị đại biểu is,t , các giá trị đại biểu is được tính bằng giá trị trung bình của các tháng (quý) tương ứng :

Theo tháng

is,k=

12,1

;

k N

i

n k t s

Theo quý

0)]

([

Trang 15

is,k=∑1 ,= ; =1,4

k N

i

n k t s

Với N (số tháng ,quý,…) có trong chuỗi số liệu phân tích

Giá trị chỉ số mùa hiệu chỉnh

Ta phải có :

)(12

12

1 ,

tháng i

1 ,

i

i i s

k s

1 ,

i

i i s

k s

=

=

Chuỗi CVS(loại bỏ ảnh hưởng mùa trong chuỗi giá trị quan sát)

Sự hiệu chỉnh mùa này cho phép chúng ta muốn so sánh kết quả của các tháng khác nhau trog một mùa nhằm để biết nếu có sự tăng hay giảm đã xảy ra so với giá trị bình thường Giá trị hiệu chỉnh mùa sẽ được tính như sau

= → * →

, ,

*

k s

t k

i

y

k=1,12 (số liệu tháng) hay 1,4( số liệu quý)

Dự báo với mô hình phân rã

Giá trị dự báo tại thời điểm t của biến nghiên cứu *

t

y được xác định như sau:

y t* =[a+bt]*i s,k

][a+bt : giá trị cho bởi đường xu thế

k:ứng với tháng (mùa) tại thời điểm t

Trang 16

a Xác định xu thế biểu diễn bởi đường thảng bằng phương pháp bình phương tối thiểu Từ đó xác định hệ số biến đổi mùa đại biểu cho 4 quý.

b Xác định doanh thu tính từ mô hình (quý 1/năm 1 đến quý 2/ năm 6)

c Hãy dự báo doanh thu cho quý 3 và 4 của năm cuối cùng và quý 1,2 của năm kế tiếpBài làm :

Trang 17

Áp dụng phương pháp bình phương tối thiểu :

ta thu được kết quả :

a= 33.49 , b=1.347 và mô hình dự báo

2.2.Thực hiện phân tích chuỗi thời gian trong phần mềm SPSS

Giả sử ta có bảng dữ liệu như sau:

Trang 18

Ban đầu bạn chọn chế độ hiển thị cho biểu đồ chuỗi thời gian

Bạn chon Graphs-Legacy Dialogs –Line (chọn kiểu khung hiển thị ví dụ :Line(đường dây) Bar (hình cột ) hoặc 3-D Bar …) tiếp đó cửa sổ Line Chart hiện ra bạn chọn (Simple cho thể hiện 1 đường ,Multiple cho 2 đường hoặc Drop-Line): Simple và trong

ô Data in Are là Values of individual cases để hiển thị giá trị

Bấm Define cửa cổ mới xuất hiện bạn điền thông tin trong ô Line Represents (đường dây thuộc tính muốn thể hiện ):CA và Variable (sự biến thiên theo giá trị ví dụ: thời gian) chọn :DATE_ thì ta đã có biêu đồ dạng như sau:

Trang 19

Bây giờ tiến hành phân tích chuỗi thời gian

Bắt đầu chon :Analyze –Forecasting-Create model

Trong hộp thoại Time series Modeler:

 Tab Valiables đưa biến cần dự báo (biến CA) ,và chọn Exponential smoothing ở

khung Methord,chọn Criteria để khai báo là mô hình nhân tính hay công tính

 Tab Statistics ,đánh dấu Root mean square để tính RMSE của mô hình.Đánh dấu Display forecasts để thể hiện kết quả dự báo trên mà hình Viewer

 Chọn Tab Plots,và đánh dấu Forecasts,Fit Values để vẽ đường biểu diễn cả giá trị

dự báo và giá trị thực tế lên cùng một đồ thị để nhằm đánh giá độ chính xác

 Tab Options, Nhấp chọn First case after end of estimation period through a special date , và nhập vào ô Year ,và ô Qarter, gồm thông tin dự báo tháng nào ?

năm bao nhiêu…?.Nếu bạn muốn lưu các giá trị dự báo về File dữ liệu thì bấm vào Tab Save

Click Ok ta có kết quả dự báo như sau

Trang 21

Câu 3 : Thực hiện tập dữ liệu trên SPSS

Tìm tập dữ liệu (trong các tạp chí quốc tế hoặc Việt Nam) áp dụng phương pháp phân tích

dữ liệu thích hợp cho tập dữ liệu đó

Bài làm :Tập dữ liệuTrong các loại cây lương thực lấy hạt ở Việt Nam thì lúa và ngô và khoai là ba loại cây lương thực chính, song so với tổng sản lượng của ba loại cây này thì sản lượng ngô chỉ vào khoảng trên dưới 10% Sản lượng ba loại cây này tăng liên tục trong những năm qua Nguyên nhân tăng năng suất và sản lượng lúa, ngô ,khoai là do những thay đổi về cơ chế chính sách đầu tư vốn và sự kết hợp đẩy mạnh ứng dụng các tiến bộ kỹ thuật mới vào sản xuất như giống mới,

Đây là kết quả mối quan hệ về sản lượng nông nghiệp với sản lượng thóc ,sản lượng khoai lang và sản lượng ngô năm 2001

Nguồn dữ liệu trang Wed : http://www.gso.gov.vn

Trang 22

X4:Sản lượng ngô

Bài làm

3.1 Hàm hồi quy bội

Ta có tập dữ liệu 4 biến nên dùng phương pháp hồi quy bội có hàm như sau:

3.2.Ước lượng hồi

Ước lượng hồi quy tổng khối lượng hàng hóa vận chuyển theo khối lượng hàng hóa vận

chuyển bằng đường sắt và đường biển

Bằng việc sử dụng phần mềm SPSS ta thực hiện tập dữ liệu sau:

Thực hiện phân tích hồi quy đa biến Click Analyze –Regression – Linear

Trang 23

Với Y:là biến phụ thuộc và X2, X3 là biến độc lập ta thu được kết quả như sau

Trang 24

Bảng có các thông tin cho ta: β∧1=50.245 β∧2= 1.058 β∧3= 0.497 βˆ4=0.944

Từ kết quả ước lượng nêu trên ta thu được hàm hồi quy mẫu như sau:

i =50.245 + 1.058*X2 +0.497 *X3 + 0.944*X4

Và kết quả ước lượng:

R2=0.997 (tương ứng 99.7% sự thay đổi vốn đầu tư là sự thay đổi của các sản lượng)

1

β βˆ2,βˆ3,βˆ4> 0 ⇒phù hợp với lý thuyết thống kê

Ý nghĩa của các hệ số trong mô hình :

Trang 25

Tiêu chuẩn kiểm định

Kiểm định giả thiết H0 β =i βi*

T =

)ˆ(

2

β

Se

∼ T(n-3).Miền bác bỏ :: Wα = {T/ T > Tα(n/−23)}

Theo kết quả báo cáo mức 1(mức ý nghĩa α = 0 05 ta có:

3

4

β

Se

∼ T(n-3) Miền bác bỏ : Wα = {T/ T > Tα(n/−23)}

Theo kết quả báo cáo mức 1(mức ý nghĩa α = 0 05 ta có:

Tqs =2.073< T0.025(8) = 2.306

Tqs∉ Wα=> Chưa đủ cơ sở để bác bỏ H0

Vậy biến X4 của mô hinh phù hợp

Trang 26

3.3.Kiểm định sự phù hợp của mô hình hồi quy

Ramsey RESET Test:

F-statistic 0.940047 Prob F(1,6) 0.369710

Log likelihood ratio 1.601040 Prob Chi-Square(1) 0.205756

Kiểm định cặp giả thuyết :

H0 : mô hình (1) không phù hợp

H1 : mô hình (1) phù hợp

+) Sử dụng tiêu chuẩn kiểm định F = ~ F ( k-1, n-k )

Trong đó k là số biến có mặt trong (1) , R12 là hệ số xác định bội của (1) , n là số quan sát Miền bác bỏ : Wα = { Fq/s / Fq/s > Fα ( k-1 , n-k ) }

Với α = 0,05, n = 11 thì F0,05(1,6) =5,99

Theo báo cáo : Fqs = 0,940047

Ta có Fqs< F0,05(1,6) nên chưa đủ cơ sở để bác bỏ H0

Vậy mô hình đã cho phù hợp

3.4.Phân tích dựa vào kết quả ước lượng (Khoảng tin cậy )

3.4.1.Với biến độc lập X 2

Khi một biến độc lập thay đổi một đơn vị thì biến phụ thuộc thay đổi như thế nào?

 Khi sản lượng thóc thay đổi 1 nghìn tấn với điều kiện sản lượng khoai lang và sản lượng ngô không thay đổi thì tổng sản lượng nông nghiệp thay đổi trong khoảng:

) 1 (

) 1 /(

2 1

2 1

k n R

k R

Ngày đăng: 21/11/2015, 21:00

HÌNH ẢNH LIÊN QUAN

Bảng 2 : Bảng đánh giá sự phù hợp của mô hình mẫu - Phân tích thống kê số lượng
Bảng 2 Bảng đánh giá sự phù hợp của mô hình mẫu (Trang 11)
Bảng 3: Bảng đánh giá sự phù hợp của mô hình hồi quy tổng thể(Anova b ) - Phân tích thống kê số lượng
Bảng 3 Bảng đánh giá sự phù hợp của mô hình hồi quy tổng thể(Anova b ) (Trang 11)
Bảng 4 :Đánh giá ý nghĩa của các hệ số hồi quy - Phân tích thống kê số lượng
Bảng 4 Đánh giá ý nghĩa của các hệ số hồi quy (Trang 12)
Bảng có các thông tin cho ta:  β ∧ 1 =50.245  β ∧ 2 = 1.058 β ∧ 3 = 0.497 β ˆ 4 =0.944 - Phân tích thống kê số lượng
Bảng c ó các thông tin cho ta: β ∧ 1 =50.245 β ∧ 2 = 1.058 β ∧ 3 = 0.497 β ˆ 4 =0.944 (Trang 24)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w