Trong khi những nguyên nhân đầu tiên là những nguyên nhân hànhtinh, thì nguyên nhân cuối cùng lại có sự tác động rất lớn của conngười mà chúng ta gọi đó là sự làm nóng bầu khí quyển
Trang 1Chương I: Mở đầu
1.1 Đặt vấn đề
Khí hậu là trạng thái khí quyển ở nơi nào đó, được đặc trưng bởi cáctrị số trung bình nhiều năm về nhiệt độ, độ ẩm, lượng mưa, lượngbốc thoát hơi nước, mây, gió Như vậy, khí hậu phản ánh giá trịtrung bình nhiều năm của thời tiết và nó thường có tính chất ổnđịnh, ít thay đổi
Trong lịch sử địa chất của trái đất chúng ta, sự biến đổi khí hậu đãtừng nhiều lần xẩy ra với những thời kỳ lạnh và nóng kéo dài hàngvạn năm mà chúng ta gọi là thời kỳ băng hà hay thời kỳ gian băng.Thời kỳ băng hà cuối cùng đã xãy ra cách đây 10.000 năm và hiệnnay là giai đoạn ấm lên của thời kỳ gian băng Xét về nguyên nhângây nên sự thay đổi khí hậu này, chúng ta có thể thấy đó là do sựtiến động và thay đổi độ nghiêng trục quay trái đất, sự thay đổi quỹđạo quay của trái đất quanh mặt trời, vị trí các lục địa và đại dương
và đặc biệt là sự thay đổi trong thành phần khí quyển
Trong khi những nguyên nhân đầu tiên là những nguyên nhân hànhtinh, thì nguyên nhân cuối cùng lại có sự tác động rất lớn của conngười mà chúng ta gọi đó là sự làm nóng bầu khí quyển hay hiệuứng nhà kính.Có thể hiểu sơ lược là: nhiệt độ trung bình của bề mặttrái đất được quyết định bởi sự cân bằng giữa hấp thụ năng lượngmặt trời và lượng nhiệt trả vào vũ trụ Khi lượng nhiệt bị giữ lại nhiềutrong bầu khí quyển thì sẽ làm nhiệt độ trái đất tăng lên Chínhlượng khí CO2 chứa nhiều trong khí quyển sẽ tác dụng như một lớpkính giữ nhiệt lượng tỏa ngược vào vũ trụ của trái đất Cùng với khíCO2 còn có một số khí khác cũng được gọi chung là khí nhà kính nhưNOx, CH4, CFC Với những gia tăng mạnh mẽ của nền sản xuất côngnghiệp và việc sử dụng các nhiên liệu hoá thạch (dầu mỏ, than đá ),nghiên cứu của các nhà khoa học cho thấy nhiệt độ toàn cầu sẽ giatăng từ 1,4 oC đến 5,8 oC từ 1990 đến 2100 và vì vậy sẽ kéo theonhững nguy cơ ngày càng sâu sắc đối với chất lượng sống của conngười
Sự biến đổi khí hậu toàn cầu đang diễn ra ngày càng nghiêm trọng.Biểu hiện rõ nhất là sự nóng lên của trái đất, là băng tan, nước biểndâng cao; là các hiện tượng thời tiết bất thường, bão lũ, sóng thần,động đất, hạn hán và giá rét kéo dài… dẫn đến thiếu lương thực,thực phẩm và xuất hiện hàng loạt dịch bệnh trên người, gia súc, giacầm…
Trang 2Đứng trước tình hình đó, nhiều công trình khoa học đã nghiên cứu
về ảnh hưởng của các tác nhân con người đến sự biến đổi khíhậu.Mà lượng khí thải mà con người thải ra trong quá trình sinh hoạt,sản xuất nắm một vai trò rất lớn.Qua các số liệu thu thập được từcác nhà khoa học đi trước, nhóm 22 lớp Hệ thống thông tin trườngĐại học Công Nghiệp Hà Nội sẽ nghiên cứu sự ảnh hưởng của lượngkhí CO2 do con người thải ra đến nhiệt độ trung bình của trái đất vàdiện tích băng ở bắc cực
1.2 Mục đích và mục tiêu nghiên cứu.
- Mục đích nghiên cứu của đề tài là tổng hợp một chuỗi dữ liệu vềlượng khí thải CO2, nhiệt độ trung bình của trái đất và diệt tích bang
ở bắc cực.Xác định ảnh hưởng giữa lượng khí CO2 do còn người thải
ra đến nhiệt độ trung bình của trái đất và qua đó biểu hiện lên ởdiện tích băng ở vùng bắc cực.Từ kết quả nghiên cứu, đưa là sự cảnhbáo đối với sự nóng lên cảu trái đất và đưa ra lời kêu gọi hành động
để chống lại sự biến đổi khí hậu
- Mục tiêu của dự án là nêu ra được các yếu tố lượng chất thải CO2
do con người thải ra ảnh có ảnh hưởng đến sự nóng lên của trái đất
và hiện tượng băng tan ở hai cực hay không và nếu ảnh hưởng thìảnh hưởng như thế nào.Qua đó đưa ra được các số liệu cụ thể và lờicảnh báo về vấn đề nóng lên của trái đất
1.3 Ý nghĩa của đề tài
Vấn đề khí hậu đang là một vấn đề rất đáng quan tâm đối với tất
cả các quốc gia trên thế giới Do hoạt động sinh hoạt và sản xuấtcủa con người đa thải ra bầu khí quyển môt lượng lớn khí CO2, mộttác nhân chính gây nên hiện tượng hiệu ứng nhà kính và làm trái đấtnóng dần lên Đứng trước vấn đề đó nhóm 22 lớp Hệ thống thông tintrường Đại học công nghiệp hà nội đã tiến hành nghiên cứu , phântích ảnh hưởng của lượng khí thải CO2 đến môi trường trái đất, qua
đó hiểu rõ hơn tầm quan trong của việc bảo vệ môi trường nói chungcũng như vấn đề cắt giảm lượng khí CO2 nói riêng
-Về lý luận, kết quả của đề tài cung cấp số liệu về sự biến độngcủa nhiệt độ trung bình trái đất, diện tích băng ở Bắc cực cũng nhưlượng khí thải CO2 mà con người thải ra từ năm 1979 đến năm 2010
Trang 3-Về thực tiễn, kết quả của đề tài cung cấp những căn cứ khoahọc để dự đoán tác động của lượng khí thải CO2 đến khí hậu trái đấtqua đó đưa ra lời cảnh báo đến các nước có lượng khí thải lớn.
CHƯƠNG II
ĐỐI TƯỢNG, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu của đề tài là lượng khí thải CO2, nhiệt độtrung bình trái đất và diện tích băng tại bắc cực Các số liệu được lấy
từ Compiled by Earth Policy Institute from F Fetterer, K Knowles, W.Meier, and M Savoie, "Sea Ice Index," (Boulder, CO: National Snow
and Ice Data Center) và CO 2 Emissions from Fuel Combustion (2012
Edition), IEA, Paris.Thời gian nghiên cứu bắt đầu từ 1/2013, kết thúcvào 5/2013
2.2 Nội dung nghiên cứu
Nội dung nghiên cứu bao gồm:
1 Lượng khí thải CO2 trên thế giới từ 1979 đến 2010
2 Nhiệt độ trung bình trái đất từ 1979 đến 2010
3 Diện tích băng trung bình hằng năm ở Bắc cực
4 Mối liên hệ giữa lượng khí thải CO2 đến nhiệt độ trung bình tráiđất
Trang 45 Ảnh hưởng của lượng khí thải CO2 và nhiệt độ trung bình tráiđất đến diện tích băng trung bìn hằng năm ở Bắc cực.
6 Đưa ra một số nhận xét và đề xuất
2.3 Phương pháp nghiên cứu
2.3.1 Cơ sở khoa học
Cơ sở khoa học của phương pháp là dựa trên những số liệuthống kê đáng tin cậy của các nhà khoa học trên thế giới qua cácphương pháp phân tích đánh giá để đưa ra kết luận cuối cùng.Cácnhà khoa học trên thế giới đã chứng minh rằng lượng khí thải CO2
do con người tạo ra là nguyên nhân chính gây ra hiện tượng nhàkính làm cho trái đất nóng lên.Nhiệt độ bề mặt trái đất được tạo nên
do sự cân bằng giữa năng lượng mặt trời đến bề mặt trái đất, vànăng lượng bức xạ của trái đất vào khoảng không gian giữa cáchành tinh Trong khi đó, bức xạ của trái đất với nhiệt độ bề mặttrung bình +16°C là sóng dài có năng lượng thấp, dễ dàng bị khíquyển giữ lại Các tác nhân gây ra sự hấp thụ bức xạ sóng dài trongkhí quyển là khí CO2, bụi, hơi nước, khí mêtan, khí CFC v.v Kết quảcủa sự của sự trao đổi không cân bằng về năng lượng giữa trái đấtvới không gian xung quanh, dẫn đến sự gia tăng nhiệt độ của khíquyển trái đất Hiện tượng này diễn ra theo cơ chế tương tự như nhàkính trồng cây và được gọi là Hiệu ứng nhà kính
Trang 5H2.1 khí thải CO2 từ quá trình sản xuất
Hiệu ứng nhà kính làm cho nhiên độ kề mặt của trái đất tăng lên
và do đó sẽ làm băng tan chảy và mực nước biển dâng cao Điềunày có thể khiến nhiều vùng sản xuất lương thực trù phú, các khuđông dân cư, các đồng bằng lớn, nhiều đảo thấp sẽ bị chìm dưới lòngđại dương
H2.2 Nhiệt độ trái đất
Sự nóng lên của trái đất sẽ làm thay đổi điều kiện sống bình thườngcủa các sinh vật, nhiều loai vật có thể bị tiêu diệt Trái đất nóng lêncũng khiến cho hoạt động sản xuất bị ảnh hưởng, nhiều loại bệnh tậtmới sẽ xuất hiện, dịch bệnh lan tràn, sức khỏe con người bị suy giảm
Trang 6H2.3 Hiện tượng băng tan do trái đất nóng lên
2.3.2 Thu thập và xử lý số liệu
- Dữ liệu về nhiệt độ cà diện tích băng ở bắc cực được lấy từnsidc.org, National Snow and Ice Data Center là một trung tâm hỗtrợ nghiên cứu địa cực và nghiên cứu sự phát triển của các sinh vật ởnhiệt độ thấp NSIDC lưu trữ và phân phối dữ liệu băng và các thôngtin về tuyết phủ, lở tuyết, song băng….NSIDC là một phần của việnnghiên cứu khoa học môi trường thuộc Đại học Colorado Hoa Kỳ, vàliên kết hợp tác với Quản lý khí quyển quốc gia trung tâm dữ liệu địavật lý đại dương
- Dữ liệu về lượng khí thải CO2 được lấy từ www.iea.org International Energy Agency (cơ quan năng lượng quốc tế), là một tổchức đa chính phủ được thành lập trong cuộc khủng hoảng dầu năm1973-1974 nhắm cố vấn chính sách năng lượng cho các quốc giathành viên để đảm bảo năng lượng đáng tin cậy, giá cả phải chăng
và sạch cho công dân của họ
Trang 7được ghi nhận tuần tự theo thời gian.
3.1.1.2.Các thành phần của chuỗi tuần tự theo thời gian
Các nhà thống kê thường chia chuỗi tuần tựtheo thời gian ra làm 4thành phần:
- Thành phần xu hướng dài hạn (long-term trendcomponent)
- Thành phần mùa (Seasonal component)
- Thành phần chu kỳ(Cyclical component)
- Thành phần bất thường (irregular component)
Trang 9phần này so với thành phần mùa là chu kỳ của nó dài hơn một năm.
Xt: Giá trị của đại lượng X ở thời điểm t
Tt: Giá trị của thành phần xu hướng ở thời điểm t Tt có cùng đơn vịvới Xt
St, Ct, It: là các hệ số đánh giá ảnh hưởng của các thành phần mùa,thành phần
chu kỳ và thành phần bất kỳ đến gía trị của X ở thời điểm t
Trong thực tế việc xác định It rất khó khăn nên thường được bỏ qua,khi đó:
Trang 10
3.1.1.3.2 Mô hình cộng(Additive model)
Xt: giá trị của đại lượng X ở thời điểm t
Tt, St, Ct, It: Giá trị của thành phần xu hướng, mùa, chu kỳ và bấtthường ở thời
a Khái niệm chung:
Dự báo là khả năng nhận thức được sự vận động của các đối tượngnghiên cứu
trong tương lai dựa trên sự phân tích chuỗi thông tin quá khứ và hiệntại Cho đến nay,
nhu cầu dự báo đã trở nên hết sức cần thiết ởmỗi lĩnh vực
b.Bản chất và các khái niệm liên quan đến dự báo:
-Tiên đoán(Predicting) là đoán trước sự vận động của đối tượngnghiên cứu trong tương lai Đó là kết quả nhận thức chủ quan củacon người dựa trên một số cơ sở nhất định Có thể nêu mức độ tiênđoán ở 3 khía cạnh
+) Tiên đoán không tưởng:
Đó là những tiên đoán không có cơ sở khoa học, chỉ dựa trên nhữngmối liên hệ
không tưởng thiếu căn cứ
+) Tiên đoán kinh nghiệm:
Đó là những tiên đoán dựa trên chuỗi thông tin lịch sử Mức độ ítnhiều có cơ sở
khách quan, tuy nhiên có nhược điểm là loại tiên đoán này khônggiải thích được xu thế vận động của đối tượng nghiên cứu và đa sốdừng lại ở bước định tính
Trang 11+) Tiên đoán khoa học:
Đó là tiên đoán dựa trên phân tích mối liên hệqua lại giữa các đốitượng nghiên
cứu và phương pháp xửlý thông tin khoa học nhằm phát hiện tínhquy luật của đối tượng
-Dự báo(Forecasting) là tiên đoán khoa học mang tính xác suất
và tính phương án trong khoảng thời gian hữu hạn về tương lai pháttriển của đối tượng nghiên cứu
định tính, dạng định lượng, dạng khoảng, dạng điểm, …)
+) Tính chất thời gian hữu hạn:
Sự chênh lệch giữa thời điểm dự báo và thời điểm hiện tại được gọi
là khoảng
cách dự báo(tầm xa dự báo l), khoảng cách này không thể tùy tiện
mà nó phụ thuộc vào mức độ ổn định của đối tượng nghiên cứutrong quá trình phát triển Vì vậy dự báo được tiến hành với khoảngcách dự báo thích hợp tương ứng một khoảng thời gian hữu hạn nàođó
c Phân loại dự báo:
+) Dựa vào thời gian :
Căn cứ vào khoảng cách dự báo, người ta chia dự báo thành 2 loạichính:
- Dự báo ngắn hạn :Khoảng cách dự đoán ngắn hạn dùng chocấp quản lý trung
bình và thấp, cho chiến lược tức thời
Trang 12- Dự báo dài hạn : Khoảng cách dự báo dài dùng cho quản lý cấpcao, cho các
đối tượng nghiên cứu mang tầm cỡ chiến lược
+) Dựa theo kết quả:
- Dự báo điểm :Kết quả dự báo được thể hiện bằng một giá trị duynhất
Ft+l : giá trị dự báo thời điểm t+l
- Dự báo khoảng : Kết quả dự báo được thể hiện dưới dạng khoảngtin cậy với
xác suất xảy ra được chủ định
+) Dựa theo đối tượng nghiên cứu:
- Dự báo tài nguyên
- Dự báo khoa học kỹ thuật
- Dự báo dân số lao động
- Dự báo xã hội
- Dự báo thị trường…
d.Các bước dự báo:
Công tác dự báo gồm 4 bước:
- Bỏ những số liệu không cần thiết, không chính xác
- Bổ sung những số liệu còn thiếu
Trang 13- Chia tập số liệu thành 2 nhóm : nhóm đầu và nhóm kiểm tra.
B3: Lựa chọn phương pháp và xây dựng mô hình dự báo
- Phương pháp dự báo được chọn sao cho phù hợp với số liệu thuộcnhóm đầu
và với đối tượng nghiên cứu
- Lập mô hình dự báo sao cho sai số dự báo là nhỏ nhất Sai số dựbáo được
kiểm định bởi nhóm số liệu kiểm tra
B4: Dự báo:
- Từ mô hình dự báo xác định giá trị dự báo
- Phân tích kết quả nhận được
3.1.2 Phân tích hồi quy đơn biến
3.1.2.1 Khái niệm
-Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến(biếnphụ thuộc hay còn gọi là biến được giải thích) vào một hay nhiềubiến khác(biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơbản là ước lượng(hay dự đoán) giá trị trung bình của biến phụ thuộctrên cơ sở các giá trị đã biết của biến độc lập
3.1.2.2 Lý thuyết chung
Mô hình hồi qui tuyến tính (từ nay sẽ viết tắt là HQTT) phát biểu
rằng: Gọi là đo lường của đối tượng i (i = 1, 2, 3, …, n) của một biến
phụ thuộc, và là đo lường của một biến độc lập cũng của đối
tượng i, mối liên hệ tuyến tính giữa hai biến có thể mô tả bằng phương trình với hai thông số α và β như sau:
Trong đó, α và β là hai tham số của mô hình hồi qui tuyến tính cần
ước tính từ số liệu quan sát được, và ε1 là phần dư, tức phần khôngthể tiên lượng bằng đo lường của biến số độc lập Mô hình trên chỉhợp lí khi các giả định sau đây đúng:
(i) Giá trị của x không chịu ảnh hưởng sai số đo lường (random
error);
(ii) ε1 tuân theo luật phân phối chuẩn với trung bình 0 vàphương sai;
Trang 14(iii) ε1 không có tương quan gì với x; và
(iv) các giá trị nối tiếp của ε1 (chẳng hạn như ε1 và ε2) độc lậpvới nhau
Với các giả định trên, và bởi vì hai tham số α và β là bất biến, cho nên, cho một đo lường của x chúng ta có thể ước tính trị số kì vọng (hay nói rõ hơn là số trung bình) của y như sau:
Vấn đề đặt ra là cho một loạt số liệu (x1,y1) , (x2,y2), , (xn,yn), hai
tham số α và β nên ước tính như thế nào Phương pháp Phương pháp bình phương nhỏ nhất (còn gọi là least squares method) là
phương pháp tốt nhất để ước tính hai tham số đó Theo phương
pháp này, chúng ta cần tìm hai ước số a và b (tương đương với α và
β ) sao cho tổng số bình phương giữa giá trị quan sát (yi) và giá trịtiên đoán ( ) là thấp nhất, nói cách khác, chúng ta tối thiểu hóa:
Hóa ra, muốn tối thiểu hóa Q chúng ta chỉ cần giải hệ phương trình
đơn giản sau đây:
Trang 15Chú ý rằng, trong các phương trình trên, là số trung bình
của biến số x và y Xin nhắc lại rằng chúng ta không biết được giá trị của a và b, mà chỉ có thể ước tính chúng, và ước số của hai tham số
này chính là α và β Thuật ngữ thống kê gọi a là intercept,
và b là gradient hay slope Như chúng ta thấy qua phương trình
trên, intercept chính là giá trị của y khi x = 0.
Công thức [4] cho thấy ước số b chỉ đơn giản bằng hiệp biến của x và y chia cho phương sai của y Tuy các công thức này mới
nhìn qua có vẻ rắc rối, nhưng trong thực tế thì rất đơn giản, bạn đọcchỉ cần một máy tính cầm tay (calculator) hay tốt hơn nữa phầnmềm Excel cũng có thể tính rất dễ dàng
3.1.2.3 Kiểm định giả thuyết về a và b
Quay lại với mô hình y1= α + βx1 + ε1 , chúng ta có thể rút ra vài
nhận xét như sau: Nếu β=0, thì phương trình đơn giản thành y1= α +
ε1, tức là không có mới tương quan nào giữa x và y; nhưng nếu β≠0 (tức có thể âm hay dương) thì mối liên hệ giữa x và y hiện
hữu Do đó, kiểm định mô hình hồi qui tuyến tính tập trung vàokiểm định giá thuyết β=0 Để kiểm định giả thuyết này, chúng ta
cần tính toán phương sai của b (vì nên nhớ rằng b là ước số của β).
Chúng ta biết rằng là số trung bình của vòng eo, và phương saicủa vòng eo, trước khi biết cân nặng, có thể ước tính như sau:
Công thức trên còn được gọi là phương sai vô điều kiện, Nhưng
trong mô hình [1], như vừa đề cập trên, chính là vòng
eo trung bình với điều kiện x i Chính vì thế mà phương sai
của y (kí hiệu s2) với điều kiện biết cân nặng được ước tính bằngcách thay thế :
Trang 16
Trong thuật ngữ thống kê học, ei còn được gọi là “residual”
Phương sai trong phương trình [6] có thể viết lại như sau:
s2 chính là ước số của trong mô hình [1]
Sau vài thao tác đại số, có thể chứng minh rằng phương sai
của b và a có thể viết như sau:
và:
Khi n (số đối tượng tương đối lớn), b tuân theo luật phân phối chuẩn
với số trung bình là và phương sai như trình bày trong [8] Do đó,
kiểm định giả thuyết β = 0 có thể dựa vào tỉ số T b sau đây:
Trang 173.1.2.4 Phân tích phương sai
Một trong những mục đích của phân tích hồi qui tuyến tính là tìmhiểu xem biến độc lập có thể giải thích bao nhiêu phần trăm độ biếnthiên của biến phụ thuộc Trong ví dụ này, cụ thể là chúng ta muốnbiết bao nhiêu phần trăm của độ biến thiên (hay khác biệt) giữa các
cá nhân về vòng eo có thể giải thích bằng cân nặng Cụm từ căn
bản ở đây là “biến thiên” (thuật ngữ thống kê học là variation)
Chú ý rằng mỗi cá nhân có 3 giá trị: vòng eo thực tế yi, vòng eo tiên
đoán bằng cân nặng , và vòng eo trung bình của quần thể Mốiliên hệ giữa ba giá trị này có thể mô tả như sau:
Nói cách khác, độ khác biệt giữa vòng eo của một cá nhân và sốtrung bình là tổng số khác biệt của: (a) giữa giá trị tiên đoán và sốtrung bình ( ), và (b) giữa giá trị thực tế và giá trị tiên
Trong mô hình [1], chúng ta có là giá trị tiên đoán của yi sau khi
“điều chỉnh” cho cân nặng (xi), cho nên, cùng một logic như trên, cóthể nói rằng tổng biến thiên của vòng eo mà mô hình [1] có thể giải
thích được là (kí hiệu SSR):
Và phần còn lại, tức phần biến thiên của vòng eo không thể giải
thích bằng mô hình [1] là (kí hiệu SSE):
Trang 18là MST = SST / (n –1) Để tính SSE, chúng ta phải cần đến hai tham
số (a và b), cho nên bậc tự do của SSE là n – 2; do đó, số trung bình bình phương là MSE = SSE / (n – 2) Các chỉ số này có thể tóm lược
trong một bảng phân tích phương sai (analysis of variance) như sau:
Bảng 4 Phân tích phương sai cho mô hình hồi qui tuyến tính
Nguồn biến thiên Bậc tự do
(degrees offreedom)
phương (sum ofsquares)
Trung bình bìnhphương (meansquares)
Phần dư (residual) n – 2 MSE = SSE / (n
– 2)
Tổng số biến thiên n – 1
Kiểm định F
Để kiểm định ý nghĩa thống kê của giả thuyết = 0, chúng ta đã
làm quen với tỉ số T b Nhưng còn một kiểm định tương đương khác
là kiểm định F, với công thức sau đây:
Trang 19ta có thể ước tính số phần trăm mà mô hình có thể giải thích tổng
biến thiên của y Hệ số này được gọi là hệ số xác định và kí hiệu là
R2:
Nhìn qua mối liên hệ [13], chúng ta dễ dàng thấy R2 có giá trị từ 0đến 1 Nếu R2 = 0, mô hình hồi qui tuyến tính coi như vô dụng, vì
không giải thích phần trăm nào biến thiên của y Nếu R2= 1 hay gần
1, mô hình hồi qui tuyến tính có thể tiên đoán chính xác giá trị
của y.
Tuy nhiên cần phải nhấn mạnh rằng một mô hình với R2 cao không
có nghĩa là rằng mô hình tốt Thật vậy, R2có thể cao nếu b cao hay
biến độc lập có range (dãy số) lớn Ngoài ra, R2 có thể cao khi môhình tuyến tính được áp dụng cho một mối liên hệ phi tuyến tính
3.1.2.5 Phân tích phần dư và kiểm tra giả định
Như đề cập trên, phần dư (residual) là độ khác biệt giữa giá trị thực
tế và giá trị tiên đoán của biếnphụ thuộc: Phần dư rấtquan trọng cho việc thẩm định tính hợp lí và độ chính xác của môhình tiên đoán Xin nhắc lại rằng mô hình hồi qui tuyến tính mà
chúng ta áp dụng trong Ví dụ 1 chỉ có giá trị khoa học nếu mô hình
này đáp ứng những giả định sau đây:
1 Mối liên hệ giữa cân nặng và vòng eo (biến độc lập và biến phụ
thuộc, hay x và y) phải là mối liên hệ tuyến tính, tức tuân thủ theo
một đường thẳng;
2 Phương sai của y không thay đổi tùy theo giá trị của x; hay nói
cách khác, phần dư ei không biến chuyển một cách có hệ thống với
xi;
Trang 203 Biến phụ thuộc y (hay ei) tuân theo luật phân phối chuẩn; hay mộtcách tương đương;
4 Các giá trị của ei không liên quan nhau
Để kiểm định những giả định trên, một số biểu đồ sau đây có thể ápdụng:
o Biểu đồ ei và để tìm xem có các giá trị “outlier” (tức nhữnggiá trị mà mô hình không tiên đoán chính xác), và xem mô hình
có vi phạm giả định 1 và 2 hay không
o Biểu đồ so sánh giá trị quan sát của ei và giá trị kì vọng (dựavào luật phân phối chuẩn) của ei để kiểm tra xem giả định 3 cóđáp ứng hay không
o Biểu đồ ei và x để kiểm tra xem có cần hoán chuyển x hay
không
Tuy nhiên, phương sai của ei không cố định Do đó, các nhà nghiên
cứu khuyến cáo chúng ta nên sử dụngphần dư chuẩn hóa (thuật ngữ thống kê là standardised residuals) Phần dư chuẩn hóa (kí
hiệu ri) được định nghĩa như sau: lấy phần dư ei chia cho độ lệchchuẩn của mô hình:
Trang 213.1.3 Hồi quy đa biến
3.1.3.1 Khái niệm
Hồi qui bội là mô hình mở rộng của hồi qui đơn, mô hình có nhiềuhơn một biến Trong mô hình hồi qui bội ta nghiên cứu mối quan hệgiữa biến phụ thuộc Y và một số biến giải thích X1, X2,…, Xn Môhình hồi quy tuyến tính đa biến có công thức tổng quát như sau:
Xt1 được đặt bằng 1 để có được “tung độ gốc” Chữ t nhỏ biểu thị sốlần quan sát và có giá trị từ 1 đến n
Trang 223.1.3.2 Phương trình chuẩn.
Mỗi X cho trước sao cho với mỗi i từ 1 đến k vàmỗi s, t từ 1 đến n Vì vậy, mỗi biến độc lập được giả định là khôngliên hệ với tất cả các số hạng sai số Trong trường hợp của thủ tụcbình phương tối thiểu thông thường (OLS), chúng ta định nghĩa tổngcủa bình phương sai số là:
(2) Số quan sát n phải lớn hơn số tham số cần ước lượng k
(3) Biến độc lập Xi phải có sự biến thiên từ quan sát này qua quan sát khác hayVar(Xi)>0
3.1.3.4 Ước lượng tham số mô hình hồi quy bội
-Từ số liệu mẫu chúng ta ước lượng hồi quy tổng thể
Hàm hồi quy mẫu
Trang 23Yˆ
Nhắc lại các giả định
(1) Kỳ vọng của sai số hồi quy bằng 0: E ( ei| X2 ,i, X3 ,i) =0
(2) Không tự tương quan: cov(e i ,e j)=0 , i≠j
(3) Phương sai đồng nhất: var(e i)=σ2
(4) Không có tương quan giữa sai số và từng Xm: covei, X2i, covei, X3i, 0
(5) Không có sự đa cộng tuyến hoàn hảo giữa X2 và X3
(6) Dạng hàm của mô hình được xác định một cách đúng đắn
Với các giả định này, dùng phương pháp bình phương tối thiểu ta nhận được ướclượng các hệ số như sau
x 2 ,i x 3 ,i)2