Phương pháp phân tích hồi quy và tương quan là một trong những phương pháp thường được sử dụng để nghiên cứu mối liên hệ phụ thuộc đó.. Phương pháp phân tích hồi quy và tương quan là một
Trang 1TRƯỜNG ĐH CÔNG NGHIỆP THỰC PHẨM TPHCM
KHOA KHOA HỌC CƠ BẢN
BỘ MÔN QUY HOẠCH THỰC NGHIỆM
Trang 3T Nội dung công việc Người thực hiện hoàn thành Thời gian
1 Hoạch định nội dung, phân
chia nhiệm vụ Chủ trì (Hoài Tâm)Cả nhóm 29.3 – 30.3.2014
1 Tài liệu tham khảo Quang Hải, Thanh Hoa,
Ngọc Anh
Suốt quá trình làm chuyên đề.
2 Đặt vấn đề, Kết luận Trinh, Huyền, Linh 1.4 – 8.4.2014
3 Tương quan và hồi qui tuyến
tính (1 nhân tố) Bích Vân, Mến, Vân Công 9.4 – 16.4.14
4 Tương quan và hồi qui phi
tuyến tính (1 nhân tố) Ánh Xuân, Ngọc Hoa, Thu Sương 9.4 – 16.4.14
6 Thao tác trên excel, ví dụ Hoài Tâm, Quang Hải 9.4 – 16.4.14
Trang 4Để xem xét mối quan hệ
(hàm số) giữa hai chỉ tiêu
nghiên cứu trên cùng đám
đông ta phải sử dụng hồi
qui.
Để xem xét mối quan hệ
(hàm số) giữa hai chỉ tiêu
nghiên cứu trên cùng đám
đông ta phải sử dụng hồi
qui.
Trong nhiều trường hợp đường hồi qui tuyến tính không phù hợp với số liệu nghiên cứu, khi đó ta cần xây dựng đường hồi qui phi tuyến.
Trong nhiều trường hợp đường hồi qui tuyến tính không phù hợp với số liệu nghiên cứu, khi đó ta cần xây dựng đường hồi qui phi tuyến.
TƯƠNG QUAN VÀ HỒI QUY PHI TUYẾN TÍNH (1 NHÂN TỐ)
Đặt vấn
đề
Chủ nghĩa duy vật biện chứng khẳng định: các hiện tượng tồn tại trong mối liên hệ phụ thuộc lẫn nhau Phương pháp phân tích hồi quy và tương quan là một trong những phương pháp thường được sử dụng để nghiên cứu mối liên hệ phụ thuộc đó.
Chủ nghĩa duy vật biện chứng khẳng định: các hiện tượng tồn tại trong mối liên hệ phụ thuộc lẫn nhau Phương pháp phân tích hồi quy và tương quan là một trong những phương pháp thường được sử dụng để nghiên cứu mối liên hệ phụ thuộc đó.
Trang 6www.themegallery.com Company Logo
Qua đó, đề ra các phương án hữu dụng và
thiết thực nhất,…đưa lý thuyết tương quan và hồi quy phi tuyến tính vào việc dự báo các hoạch định, kế hoạch, trong hiện tại và tương lai
Để làm sáng tỏ vấn đề này, chúng ta sẽ lần lượt giải quyết các nội dung sau:
1 Tương quan và hồi quy tuyến tính (1 nhân tố)
2 Tương quan và hồi quy phi tuyến tính (1 nhân tố)
3 Thao tác trên Excel.
Các hiện tượng KT – XH chẳng những có mối liên hệ tương quan tuyến tính (dạng đường
thẳng) mà còn có mối liên hệ tương quan phi tuyến tính (dạng đường cong).
Đặ t
Trang 7VẤN ĐỀ TƯƠNG QUAN
a Tương quan:
- Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ giữa tiêu thức nguyên nhân và tiêu thức kết quả Theo đó, cứ mỗi giá trị của tiêu thức nguyên nhân,
sẽ có một (hay nhiều) giá trị tương ứng của tiêu thức kết quả
Ví dụ:
+ Quan hệ giữa chiều cao & trọng lượng của 1 thanh niên.
+ Quan hệ giữa hàm lượng acid lactic và trị số pH của
cơ đùi heo.
+ Quan hệ giữa chỉ số peroxit và thời gian bảo quản lạp xưởng,
Trang 8a Tương quan tuyến tính.
Xét ví dụ: Trong chăn nuôi, người ta quan tâm số lượng
và cân nặng của trứng gà, 2 tính trạng này không độc lập với nhau Nhưng trứng sinh ra do gà đẻ nhiều sẽ có khối lượng thấp hơn
Mối liên hệ tương quan.
Phân tích tương quan là đo lường cường độ của sự quan
hệ giữa 2 biến ngẫu nhiên X và Y nhưng không phân biệt biến nào độc lập hay phụ thuộc.
Tương quan tuyến tính giữa 2 biến X và Y là thể hiện mức độ quan hệ giữa X và Y theo dạng của một đường thẳng.
Trang 9Cách nhận xét trực quan sự phụ thuộc tương quan tuyến
+ Mi tập trung vào 1 vùng nhất định có dạng bầu dục:
* Nếu bầu dục hướng nghiêng lên X và Y đồng biến và có tương
quan thuận (dương).(Biểu đồ 5.3)
* Nếu bầu dục hướng nghiêng xuống X và Y nghịch biến và có
tương quan nghịch (âm).(Biểu đồ 5.4)
* Nếu bầu dục càng dẹt tương quan càng chặt (BĐ 5.5)
* Nếu bầu dục gần giống tròn tương quan yếu hoặc không tương
quan (biểu đồ 5.6)
Trang 10Cách nhận xét trực quan sự phụ thuộc tương quan tuyến tính bằng đồ thị phân phối
Trang 11Hệ số tương quan tuyến tính
Là HSTQ có giá trị trong khoảng -1 đến +1 Giá trị dương 2 tính trạng có mối TQ cùng chiều Giá trị âm
2 tính trạng có mối TQ ngược chiều
Ước lượng r của H (hệ số tương quan của mẫu)
Có (%) là nguyên nhân cơ bản để X gây ra hậu quảY
X,Y TQ phi tuyến hoặc có xu hướng độc lập.
> 0 X, Y tương quan thuận và ngược lại.
•
= (%)
Trang 12VD: X 13 18 9 25 36 19
a.Tính hệ số tương quan giữa 2 biến X,Y.
b Kiểm định giả thuyết cho rằng X,Y không tương quan với Giải:
Trang 13VD: Xác định hệ số tương quan giữa giới hạn bền uốn vào khối lượng riêng vật liệu gỗ nhân tạo Kết quả thực nghiệm cho bảng sau:
= 0.675 = 27.75 166.5 4.7125 0.04375 510.875
0.55 15 -0.125 -12.75 1.59375 0.015625 162.5625 0.6 20 -0.075 -7.75 0.58125 0.005625 60.0625 0.65 24 -0.025 -3.75 0.09375 0.000625 14.0625 0.7 29.5 0.025 1.75 0.04375 0.000625 3.0625 0.75 36 0.075 8.25 0.61875 0.005625 68.0625 0.8 42 0.125 14.25 1.78125 0.015625 203.0625
4.7125 0.04375 510.875
Trang 14Khi đó:
= 0,99679
Vì r cho nên sự phụ thuộc giữa hạn bền khi uốn vào khối lượng riêng là phụ thuộc tuyến tính.
khối lượng riêng càng lớn thì hạn bền khi uốn càng cao.
Trang 15VD: Cho mẫu quan sát sau đây của cặp BNN (X;Y)
a Tương quan phi tuyến tính.
Như đã đề cập bên trên, khi = 0 X,Y có thể xảy ra quan hệ phi tuyến tính
Trang 16Ta có F= 3,63
Tra bảng Fisher phân vị và (2,20) bậc tự do, ta được 3,493
Vì F > 3,493 nên bác bỏ
Vậy ta khẳng định mối tương quan phi tuyến
tính của Y đối với X Xác suất sai của khẳng định này là 5%.
Trang 17VẤN ĐỀ HỒI QUI VÀ ĐƯỜNG HỒI QUI TUYẾN TÍNH
- Là loại hồi qui biểu thị mối quan hệ giữa 2 tính trạng X và Y theo một dạng đường thẳng.
- Quan hệ giữa 2 tính trạng là quan hệ phụ thuộc 2 chiều
Vd: giữa chỉ số pH và lượng acid lactic ở cơ đùi heo, có thể
nói pH phụ thuộc hàm lượng acid và ngược lại đều được.
- Quan hệ giữa 2 tính trạng là QH phụ thuộc 1 chiều
Vd: giữa chất lượng nguyên liệu và chất lượng sản phẩm
chế biến, ta chỉ có thể nói, chất lượng sản phẩm biến đổi theo chất lượng nguyên liệu, chứ không thể nói ngược lại Vì thế, nguyên liệu gọi là biến số độc lập, còn chất lượng sp được gọi là biến số phụ thuộc.
Trang 18Quan hệ hồi qui tuyến tính thường được biểu diễn bằng đường phương trình hồi qui.
Khi 2 xảy ra trường hợp: một biến số tăng (giảm) mà một biến số khác lại tăng (giảm) theo 1 tỉ lệ nhất định, thì 2 biến số đó có sự quan hệ hồi qui theo dạng đường thẳng
và ta sẽ chọn phương trình: y = ax + b hoặc y = ax – b
Trong đó: b: hệ số hồi qui tuyến tính (độ nghiên) a: hằng số, cắt trục y khi x = 0, còn gọi là hệ số tự do
Trang 19Muốn xác định được PTHQ đơn tuyến tính y= ax + b , cần phải xác định hệ số hồi qui b và hằng số a
Trang 20Biến độc lập (nguyên nhân)
e :Sai số ngẫu nhiên
Trang 21 Phương trình hồi quy lý thuyết:
Các hệ số của phương trình hồi quy tuyến tính được
xác định theo phương pháp bình phương cực tiểu
Trang 25Vd: Cho chiều cao của cha mẹ và con cái trong 10 gia đình Xác định mối tương quan và đường hồi quy tuyến tính giữa chiều cao trung bình của con cái và cha mẹ.
Trung bình chiều cao của cha
Trang 26Để thuận tiện cho việc tính toán, ta đặt chiều cao của cha me là
x , chiều cao của con cái là y và lập bảng tương quan sau:
Trang 27Ta có:
Trang 28130 140 150 160 170 180 190 200 0
50 100 150 200 250
Trung bình chiều cao của con (cm)
Bi u đ t ểu đồ tương quan tuyến tính ồ tương quan tuyến tính ương quan tuyến tính ng quan tuy n tính ến tính
Kết luận: Cha me và con cái có tương quan thuận chặt về chiều cao trung bình
Kết luận: Cha me và con cái có tương quan thuận chặt về chiều cao trung bình
Trang 29MỘT SỐ ĐƯỜNG HỒI QUI
PHI TUYẾN TÍNH
Khi mối quan hệ giữa biến phụ thuộc Y và một biến độc lập không tuân theo dạng hồi qui đơn tuyến tính, chúng
sẽ có dạng hồi qui đơn phi tuyến tính:
- Khi biến số Y và X có mối quan hệ với đồ thị phân phối
với dạng cong theo dạng parabol nên chọn pt hồi qui theo hàm số: y = ax 2 + bx + c.
- Khi biến số Y và biến số X có mối quan hệ với đồ thị
phân phối dạng cong lõm theo 1 hướng theo dạng hyperbol, nên chọn ptrinh dạng: y=1/(ax +b).
- Khi biến số X tăng dần mà biến số Y tăng lên rất nhanh
thì chọn pt hồi qui theo hàm số mũ y = ba x.
Trang 30Đường hồi quy dạng parabol
- Phương trình hồi quy parabol có dạng:
-Đây là trường hợp khi khởi đầu X tăng thì Y tăng, nếu X tiếp tục tăng, Y tăng hơi nhanh hơn và đạt cực đại sau đó X vẫn tiếp tục tăng và Y bắt đầu giảm, nên
dự đoán rằng X và Y có sự hồi quy theo dạng parabol bậc 2 theo phương trình này.
Áp dụng phương pháp bình phương cực tiểu sẽ có
hệ p/t sau đây để tìm giá trị các hệ số
Trang 31Có thể viết dưới dạng ma trận:
Từ đó suy ra ma trận xác định các hệ số
Trang 32
Ví dụ 1: Viết p/t hồi quy phi tuyến tính
Trang 34Cu i cùng ta thu đ ối cùng ta thu được: ược: c:
=
V y ph ậy phương trình hồi quy có dạng: ương quan tuyến tính ng trình h i quy có d ng: ồ tương quan tuyến tính ạng:
•
Trang 35VÍ dụ 2:
Xác định mối quan hệ giữa các trị số pH của nem chua (Y) Với kết quả số liệu bảng 1 và các kết quả tính toán qua bảng số liệu bảng 2.
Trang 37Với n=10, thế các số liệu từ bảng 2 vào ệ thống phương trình trên, ta có:
60 = 10a + 45b + 285c
276 = 45a + 285b + 2025c 1804,8 = 285a + 2025b + 15333c
Sau khi giải hệ phương trình này ta được:
A= 6,847; b = -0,726x c = 0,086
Vậy phương trình hồi quy diễn tả mối quan
hệ giữa 2 tính trạng trên sẽ là :
Y = 6,847 – 0,726x + 0,086x2 + [31][h]
Trang 38Đường hồi quy dạng hyperbol:
• Phương trình hồi quy hyperbol có dạng:
• Đây là trường hợp Y bắt đầu giảm nhanh chóng khi biến
X tăng, sau đó biến X tiếp tục tăng nhưng biến Y có tốc
độ giảm chậm dần, thì nên dự đoán rằng X và Y có sự hồi quy theo dạng hyperbol theo phương trình này.
• Áp dụng phương pháp bình phương cực tiểu sẽ có hệ p/t sau đây để tính được giá trị hệ số a và b :
•
Trang 39Có dạng: y = bax
Khi số thực nghiệm N bé, nếu tăng bậc của đa thức có thể dẫn dến việc tăng phương sai dư Lúc này dể giảm số các hệ số không xác định, ta dùng hồi quy hàm số mũ.
Việc xác định các hệ số phương trình hồi quy
có thể rất khó khăn do phải giải hệ phương trình phi tuyến Việc tính toán sẽ trở nên đơn giản hơn nếu tiến hành thay thế các biến số và hạ bậc đa thức.
Đường hồi quy dạng mũ
Trang 40Được logaric hóa:
Trang 41- Để tính hệ số tương quan thông thường ta sử dụng các hàm:
SQRT, CORREL và RSQ,
B1: Nhập dữ liệu B2: Sử dụng các hàm tương ứng.
trên tác
ỨNG DỤNG EXCEL TRONG HỒI QUY TƯƠNG QUAN
Cần bổ sung cung cụ phân tích dữ liệu Data Analysis vào Excel:
+ Khởi động Excel.
+ Vào thực đơn Tools, chọn Add-Ins Hộp thoại Add-Ins xuất hiện tích vào mục Analysis ToolPak và Analysis ToolPak VBA.
Trang 42*Quy trình dự báo sử dụng trình cài
thêm Moving Average
+ Nhập số liệu thu thập được vào bảng
+ Nh n OK đ đ a ra ấn OK để đưa ra ể đưa ra ưa ra
k t qu d báo ết quả dự báo ả dự báo ự báo.
Hình: Hộp thoại Moving Average
Hình: Hộp thoại Moving Average
Hình: Hộp thoại chứa các công cụ phân tích
dữ liệu
Hình: Hộp thoại chứa các công cụ phân tích
dữ liệu
Trang 43Một số thuật ngữ
* Interval: là n kỳ trước kỳ dự báo.
* Output Option: Khai báo vùng kết xuất kết quả.
* Output Range: Nhập vào vùng địa chỉ chứa kết quả hoặc địa
chỉ ô đầu tiên phía trên bên trái của vùng chứa kết quả.
* NewWworksheet Ply: Kết quả được xuất ra trên một sheet mới.
* New Workbook: Kết quả được xuất ra trên một file Excel mới.
* Chart Output: Tích vào mục này để đưa ra đồ thị kết quả dự
báo.
* Standard Errors: Đưa ra các sai số chuẩn của các dự báo.
* Input Range: Vùng địa chỉ chứa
các quan sát đã biết
* Labels in First Row: Tích vào
đây để khẳng định ô đầu tiên được chọnkhông chứa dữ liệu.
Trang 44VÍ DỤ: Cho bảng số liệu sau Hãy dự báo bằng phương Cho bảng số liệu sau Hãy dự báo bằng phương pháp sử dụng trình cài thêm Moving Average. pháp sử dụng trình cài thêm Moving Average.
Các bước thực hiện như
sau:
- Tools\ Data Analysis\
Moving Average, OK Bảng
hộp thoại xuất hiện ta điền
các thông tin vào như hình
sau:
Các bước thực hiện như
sau:
- Tools\ Data Analysis\
Moving Average, OK Bảng
hộp thoại xuất hiện ta điền
các thông tin vào như hình
sau:
Hình: Nhập các thông số cho mô hình
dự báo
Hình: Nhập các thông số cho mô hình
dự báo
Trang 45- Nhấn OK ta được bảng kết quả sau:
Trang 46Một số nhóm hàm hồi quy và tuyến tính sử dụng phổ biến trong excel
Một số nhóm hàm hồi quy và tuyến tính sử dụng phổ biến trong excel
CORREL (array1, array2) : Tính hệ số tương quan giữa
hai mảng để xác định mối quan hệ của hai đặc tính.
COVAR (array1, array2) : Tính tích số các độ lệch của
mỗi cặp điểm dữ liệu, rồi tính trung bình các tích số đó.
FORECAST (x, known_y's, known_x's) : Tính toán hay
dự đoán một giá trị tương lai bằng cách sử dụng các giá trị hiện có, bằng phương pháp hồi quy tuyến tính.
GROWTH (known_y's, known_x's, new_x's,
const) : Tính toán sự tăng trưởng dự kiến theo hàm mũ, bằng
INTERCEPT (known_y's, known_x's) : Tìm điểm giao
nhau của một đường thẳng với trục y bằng cách sử dụng các trị x và y cho trước.
Trang 47 LINEST (known_y's, known_x's, const, stats) : Tính thống
kê cho một đường bằng cách dùng phương pháp bình phương tối thiểu (least squares) để tính đường thẳng thích hợp nhất với dữ liệu, rồi trả về mảng mô tả đường thẳng đó Luôn dùng hàm này
ở dạng công thức mảng.
LOGEST (known_y's, known_x's, const, stats) : Dùng
trong phân tích hồi quy Hàm sẽ tính đường cong hàm mũ phù hợp với dữ liệu được cung cấp, rồi trả về mảng gía trị mô tả đường cong đó Luôn dùng hàm này ở dạng công thức mảng.
PEARSON (array1, array2) : Tính hệ số tương quan momen
tích pearson (r), một chỉ mục không thứ nguyên, trong khoảng từ -1 đến 1, phản ánh sự mở rộng quan hệ tuyến tính giữa hai tập
số liệu.
Trang 48 RSQ (known_y's, known_x's) : Tính bình phương hệ
số tương quan momen tích Pearson (r), thông qua các điểm dữ liệu trong known_y's và known_x's.
SLOPE (known_y's, known_x's) : Tính hệ số góc của
đường hồi quy tuyến tính thông qua các điềm dữ liệu.
STEYX (known_y's, known_x's) : Trả về sai số chuẩn
của trị dự đoán y đối với mỗi trị x trong hồi quy.
TREND (known_y's, known_x's, new_x's, const) : Trả
về các trị theo xu thế tuyến tính.
Trang 49Áp d ng: Cho b ng s li u sau, nh công c ụng: Cho bảng số liệu sau, nhờ công cụ ả thực nghiệm ta tính ối cùng ta thu được: ệm ta tính ờ công cụ ụng: Cho bảng số liệu sau, nhờ công cụ excel, tính h s t ệm ta tính ối cùng ta thu được: ương quan tuyến tính ng quan, d báo và vẽ đ ực nghiệm ta tính ồ tương quan tuyến tính
th bi u di n ị biểu diễn ểu đồ tương quan tuyến tính ễn
Tên Chiều cao nam Cân nặng nam Chiều dài sải tay nam
Trang 50- C.cao và cdài s i tay nam có m i t ải tay nam có mối tương quan rất chặt ối tương quan rất chặt ương quan rất chặt ng quan r t ch t ất chặt ặt chẽ(0.87)
- Chi u cao và cân n ng c a nam có m i t ều cao và cân nặng của nam có mối tương quan yếu ặt ủa nam có mối tương quan yếu ối tương quan rất chặt ương quan rất chặt ng quan y u ếu (0.58)
- Cân n ng và cdài s i tay có m i t ặt ải tay nam có mối tương quan rất chặt ối tương quan rất chặt ương quan rất chặt ng quan r t m nh, ất chặt ạnh,
- Trong t ương quan rất chặt ng lai, cdài s i tay, cân n ng và ccao c a nam có ải tay nam có mối tương quan rất chặt ặt ủa nam có mối tương quan yếu
xu h ướng đều tăng mạnh ng đ u tăng m nh ều cao và cân nặng của nam có mối tương quan yếu ạnh,
Chiều cao nam Cân nặng nam Chiều dài sải tay nam