Một số khái niệm Trong tự nhiên và xã hội nói chung, trong lâm nghiệp nói riêng các đại lượng thường có mối quan hệ với nhau, các mối quan hệ này có thể phân ra 2 dạng: Quan hệ hàm số
Trang 1Bài giảng chương 5
Chương 5 Phân tích mối quan hệ giữa các đại lượng
trong lâm nghiệp 5.1 ý nghĩa và một số khái niệm
5.1.1 Một số khái niệm
Trong tự nhiên và xã hội nói chung, trong lâm nghiệp nói riêng các đại lượng thường có mối quan hệ với nhau, các mối quan hệ này có thể phân ra 2 dạng:
Quan hệ hàm số (sự phụ thuộc hàm):
- Giả sử có hai đại lượng X và Y, nếu ứng với mỗi giá trị của X, hoàn toàn xác định được giá trị của đại lượng Y thì ta nói rằng Y là hàm số của X
- Ví dụ: Diện tích hình tròn S là hàm số của bán kính R Hàm số đó được biểu diễn bằng công thức: S=.R2
- Ví dụ: Trong vật lý dao động cơ điều hoà sơ cấp, tại cùng một vị trí thì tần số góc (W) là hàm số của chiều dài sợi dây (l) Hàm số được biểu diễn bằng
công thức:
l
g
W
Quan hệ tương quan (sự phụ thuộc tương quan):
- Giả sử có hai đại lượng X, Y có phụ thuộc vào nhau nhưng ứng với mỗi giá trị của đại lượng X, không hoàn toàn xác định được giá trị của đại lượng Y, quan hệ như vậy người ta gọi là quan hệ tương quan
- Ví dụ: Quan hệ giữa năng suất cây trồng và lượng phân bón
Một điều chắc chắn là, phân bón có ảnh hưởng đến năng suất cây trồng (có thể là tích cực, cũng có thể là tiêu cực nếu bón quá liều lượng cần thiết), nhưng không thể khẳng định được rằng, khi bón một lượng phân X xác định nào
đó thì năng suất cây trồng Y sẽ đạt một số xác định là bao nhiêu, mà thường dao
động trong một khoảng xác định nào đó Vì vậy, X là một đại lượng không ngẫu nhiên còn Y là một đại lượng ngẫu nhiên Y là hàm số của X Sự phụ thuộc này
có thể biểu diễn bằng biểu thức: Y=f(X)
Với Y là biến phụ thuộc, còn X là biến độc lập
- Một trong những nhiệm vụ trọng tâm của người làm công tác thống kê khi phân tích mối liên hệ giữa các đại lượng là xác định mức độ liên hệ giữa chúng và lập phương trình hồi quy biểu thị cho mối quan hệ đó
5.1.2 ý nghĩa
Trang 2Bài giảng chương 5
- Việc nghiên cứu mối liên hệ giữa các đại lượng còn có ý nghĩa rất lớn trong khí tượng thuỷ văn, trong y học, trong quản lý bảo vệ rừng bởi lẽ chúng
ta có thể dựa vào những đại lượng dễ đo đếm, trực quan để có thể dự báo cho các
đại lượng trong tương lai, cho các đại lượng khó đo đếm
-Ví dụ: Trong quản lý bảo vệ tài nguyên rừng để dự tính dự báo sâu hại, dịch bệnh, trong điều tra rừng bằng ảnh máy bay để xác định trữ lượng lâm phần, trong chế biến lâm sản để xác định đồ bền uốn tĩnh của ván ghép thanh trong mối quan hệ giữa nó với kích thước của thanh ghép thành phần
5.2 Xác định mức độ liên hệ giữa các đại lượng
5.2.1 Tỷ tương quan
- Khái niệm: Tỷ tương quan là chỉ tiêu thuyết minh mức độ liên hệ giữa
các đại lượng trong trường hợp chung nhất mà không cần biết trước dạng liên hệ
- Tỷ tương quan chỉ thuyết minh cường độ của sự liên hệ mà không nói lên chiều hướng của sự liên hệ đó là nghịch biến hay đồng biến
j ij y
i
y y Q
j
i ij x
y
i
x y y Q
1 1
2
Trong đó: yij là các trị số quan sát của biến phụ thuộc Y
ylà trị số trung bình của n trị số quan sát của biến phụ thuộc Y
Nếu =0 thì 2 đại lượng độc lập tuyến tính
Nếu =1 thì 2 đại lượng có quan hệ hàm số
Nếu 00.3 thì 2 đại lượng có tương quan yếu
Nếu 0.30.5 thì 2 đại lượng có tương quan vừa
Nếu 0.50.7 thì 2 đại lượng có tương quan tương đối chặt
Nếu 0.70.9 thì 2 đại lượng có tương quan chặt
Nếu 0.9<1 thì 2 đại lượng có tương quan rất chặt
Trang 3Bài giảng chương 5
Bựi Mạnh Hưng
5.2.2 Hệ số tương quan
- Khái niệm: Hệ số tương quan là chỉ tiêu thuyết minh mức độ liên hệ
giữa hai đại lượng X và Y trong liên hệ đường thẳng (tuyến tính 1 lớp) (Y=A+B.X)
- Ký hiệu và công thức lý thuyết:
Công thức định nghĩa hệ số tương quan như sau:
5 9ˆ
y
y y
Q
Q Q
n
i i y
y y Q
y y Q
1
2 ˆ
1
2
ˆ
Trong đó: y là trị số trung bình của n trị số quan sát của biến phụ thuộc Y
yˆ là trị số lý luận của phương trình hồi quy tuyến tính 1 lớp
bx a
0</r/0.3 thì 2 đại lượng X và Y có quan hệ yếu
0.3</r/0.5 thì 2 đại lượng X và Y có quan hệ vừa
0.5</r/0.7 thì 2 đại lượng X và Y có quan hệ tương đối chặt
0.7</r/0.9 thì 2 đại lượng X và Y có quan hệ chặt
0.9</r/1 thì 2 đại lượng X và Y có quan hệ rất chặt
- r ngoài cho biết sự liên hệ, cường độ liên hệ còn cho biết chiều hướng của liên hệ Vì hệ số tương quan r có thể âm hoặc dương:
- Nếu r > 0 thì quan hệ giữa X và Y là đồng biến
- Nếu r < 0 thì quan hệ giữa X và Y là nghịch biến
Y
bx a
yˆ
Y
bx a
yˆ
Trang 4Bài giảng chương 5
Hình 5.1 Quan hệ giữa X và Y dạng tuyến tính đồng biến và nghịch biến
5.2.3 Chỉ số tương quan
- Khái niệm: Chỉ số tương quan (i) là chỉ tiêu đánh giá mức độ liên hệ
giữa hai biến X và Y trong liên hệ phi tuyến tính, thực chất là thuyết minh mức
độ biến động giữa các trị số quna sát của biến Y với trị số lý luận của phương trình phi tuyến
- Ký hiệu và công thức lý thuyết:
5 18ˆ
y
y y
Q
Q Q
ˆ y yˆ
Q y i trong đó yˆ là trị số lý luận của hàm hồi quy phi tuyến
5.2.4 Hệ số tương quan kép (Hệ số tương quan tuyến tính hai lớp)
- Khái niệm: Là chỉ tiêu thuyết minh mức độ liên hệ giữa Y với X1 và X2trong liên hệ tuyến tính hai lớp
- Ký hiệu và công thức lý thuyết:
5 19ˆ
y
y y
Q
Q Q
Với Q yˆ y i ˆy2
Trong đó yˆ là trị số lý luận của hàm hồi quy tuyến tính 2 lớp:
2 2 1 1 0
ˆ a a x a x
5.3 Chọn giả thuyết về dạng liên hệ (dạng hồi quy)
Sau khi xác định mức độ liên hệ giữa các đại lượng, nếu hai đại lượng X
và Y thực sự tồn tại mối liên hệ ở mức độ nào đó thì bước tiếp theo là chọn giả thuyết về dạng liên hệ (dạng hàm hồi quy), nghĩa là mô phỏng dạng liên hệ bằng một biểu thức toán học (phương trình hồi quy) với một số hữu hạn các tham số, sao cho thoả mãn 3 điều kiện cơ bản sau:
1 Phản ánh đúng bản chất của các quy luật sinh học, các quy luật của tự nhiên và xã hội
2 Có mức độ liên hệ giữa các đại lượng cao, sai số của phương trình nhỏ
3 Dễ thực hiện, tính toán
Để dễ dạng cho việc chọn giả thuyết về dạng liên hệ giữa 2 đại lượng trên cơ sở đã khẳng định sự tồn tại của tỷ tương quan, bước tiếp theo là chấm các cặp giá trị của 2 đại lượng X và Y lên biểu đồ, căn cứ vào chiều hướng của đám mấy
Trang 5x y
bx a
x y
bx a
x y
ˆ
ˆ 2
cx bx a
x y
) log(
a
Hình 5.2 Các dạng liên hệ phi tuyến cơ bản giữa X và Y
5.4 Kiểm tra giả thuyết về dạng liên hệ
Trong nhiều trường hợp, khi phân tích mối liên hệ giữa các đại lượng, nhiều khi không biết trước dạng liên hệ giữa chúng, mà phải dựa vào biểu đồ thực nghiệm để chọn giả thuyết về dạng liên hệ Vì vậy sau khi đã xác định được
tỷ tương quan (), hệ số tương quan (r), cần căn cứ vào trị số tuyệt đối của
2 ˆ
ˆ
x
c x
b a y
x
b a y
yˆ
2 ˆ
x
c x
b a
Trang 6Trong đó: a được gọi là hệ số tự do
b được gọi là hệ số hồi quy (hệ số góc)
5.5.1 Xác định các tham số của liên hệ tuyến tính 1 lớp trường hợp mẫu nhỏ
Tính các biến động:
n
x x
n
y y
Trong đó: n là số cặp x, y
Trang 7Bài giảng chương 5
- Bước 2: Xác định mức độ liên hệ
y x
xy
Q Q
Q
r
.
- Bước 3: Kiểm tra sự tồn tại của hệ số tương quan
Trong thực tiễn, người ta chỉ tiến hành kiểm tra sự tồn tại của hệ số tương quan, nếu trị số tuyệt đối của nó nhỏ thua 0.3 và mẫu nhỏ
- Nếu /t/ tính theo công thức trên t05 tra bảng với K=n-2 bậc tự do thì
H0+, nghĩa là trong tổng thể thực sự tồn tại mối quan hệ đường thẳng giữa X và
Kiểm tra sự tồn tại của các tham số:
Sau khi xác định được các tham số a và b của phương trình hồi quy tuyến tính một lớp, cần phải tiến hành kiểm tra sự tồn tại của nó, cũng tức là kiểm tra xem các tham số A và B trong tổng thể có thực sự khác không hay không Có 2 trường hợp kiểm tra như sau:
- Kiểm tra giả thuyết: H0: A = 0 và B = 0
H1: A 0 và B 0
- Giả thuyết H0 được kiểm tra theo tiêu chuẩn t của Student sau đây:
Với tham số a:
a a
S
a t
Với tham số b:
b b
S
b t
Trong đó: Sa là sai tiêu chuẩn của hệ số tự do a
Trang 8Bài giảng chương 5
x a
Q n
x S S
ˆ 2
Sb là sai tiêu chuẩn của hệ số hồi quy b
x b
Q S
Sˆ là phương sai thừa hay phương sai hồi quy
2
ˆ
2 2
- Bước 5: Ước lượng khoảng các tham số A và B trong tổng thể
Nếu tham số a và b thực sự tồn tại qua việc kiểm tra ở trên, thì cần tiến hành ước lượng các tham số A và B trong tổng thể
* Với tham số A, công thức ước lượng khoảng như sau:
ˆ
2
) ( 2 / 2
) ( 2 /
x K
x K
Q n
x S t a A Q n
x S t a
* Với tham số B công thức ước lượng khoảng như sau:
P (b - t/2(K).Sb < B < b + t/2(K).Sb) = 1 - Hay:
K
Q S t b B Q S t b P
Ví dụ 5.3 Biết rằng quan hệ giữa đường kính tán (Dt) và đường kính ngang ngực (D1.3) cây rừng có dạng: Dt = a + b D1.3 Hãy xác định mức độ liên hệ (r), các tham số của phương trình hồi quy (a, b) và vẽ biểu đồ tương quan theo tài liệu điều tra sau:
Bảng 5.2 Bảng tính tương quan D t /D 1.3
Trang 9n
y x y x
Q xy
017 , 15
) 9 , 101 ( 49 , 1060
2 2
) 7 , 39 ( 13 , 168
2 2
017 , 15
x Q
Q
Q r
y x xy
Vì r = 0,98 nên quan hệ giữa Dt và D1.3 là rất chặt chẽ, hơn nữa vì hệ số tương quan rất cao nên không cần phải kiểm tra sự tồn tại của nó
* Xác định các tham số a và b của phương trình hồi quy
áp dụng các công thức (5.34) và (5.35)
6786 , 0 129 , 22
017 , 15
n
x b n
y x b y
Trang 10Bài giảng chương 5
= 0 , 6786 2 , 945
10
9 , 101 10
7 , 39
6786 , 0 945 ,
a
2
2 10
129 , 22 6786 , 0 521 ,
49 , 1060 2033
945 , 2
S
a t
Với tham số b:
b b
S
b
x b
Q S
043 , 0 129 , 22
1 2033 ,
6786 , 0
b S
b
t b
Vì /ta/ = 6,6 và /tb/ = 15,781 đều lớn hơn t05 tra bảng vớiK = n - 2 = 8 bậc
tự do bằng 2,31 nên giả thuyết H0 bị bác bỏ, nghĩa là các tham số A và B trong tổng thể thực sự tồn tại
* Ước lượng các tham số A và B trong tổng thể
Với tham số A:
at /2(K).S a at /2(K).S a 1 P
Trang 11Bài giảng chương 5
Thay số:
P (-2,945 - 2,31 x 0,4462 < A < 2,945 + 2,31 x 0,4462) = 0,95
P (-3,9758 < A < -1,9142) = 0,95 Chúng ta tin tới mức 95% rằng tham số A trong tổng thể nằm trong khoảng từ -3,9758 đến -1,9142
Với tham số B: P (b - ta/2/(K).Sb < B < b + t/2(K).Sb) = 1 -
Thay số:
P (0,6786 - 2,31 x 0,043 < B < 0,6786 + 2,31 x 0,043) = 0,95
P (0,5793 < B 0,7779) = 0,95 Chúng ta tin tới mức 95% rằng tham số B tổng thể nằm trong khoảng 0,5793 đến 0,7779
* Tính trị số lý luận của phương trình và vẽ biểu đồ tương quan:
Từ phương trình hồi quy Dt = -2,945 + 0,6786 D1.3 đã thiết lập, thay các trị
D1.3 thực nghiệm vào phương trình sẽ nhận được các trị số Dt tương ứng, các trị
số này gọi là trị số lý luận
Kết quả Dt lý luận được cho ở bảng 5.3
Trình tự bài toán phân tích mối liên hệ giữa 2 đại lượng gồm các bước sau:
- Bước 1: Chỉnh lý tài liệu quan sát, lập bảng tính 2 chiều
1.5 2.5 3.5 4.5 5.5 6.5
Dt Dtl
Trang 12BiÕn x ký hiÖu cho diÖn tÝch gç xÎ (m2), ®îc chia ra 6 tæ
BiÕn y ký hiÖu cho diÖn tÝch gç xÎ (gi©y), ®îc chia ra 5 tæ
Kx lµ cù ly tæ theo biÕn x, Kx = 0,2m2
Ky lµ cù ly tæ theo biÕn y, Ky = 6 gi©y
fx lµ tæng tÇn sè quan s¸t øng víi mçi tæ cña biÕn x
fy lµ tæng tÇn sè quan s¸t øng víi mçi tæ cña biÕn y
n lµ tæng tÇn sè quan s¸t toµn thÝ nghiÖm (n = 100)
Tõ b¶ng 5.6 lËp b¶ng tÝnh (5.7)
Trang 13Bài giảng chương 5
Trang 15n
x f x
2
n
y f y
.
n
y f x f y x f
100
3270 1 , 109472
.
.
2 2
2 2
2 2
f
n
y f f
y f
y y
y x
xy
75 , 0 57
, 0 0 , 4491
1 ,
15 , 2
58 , 53 1 6
6 100 57 , 0 1
57 , 0 1
94 5 05
2 1
K K
F =4,40 nên giả thuyết H0 bị bác, trong tổng thể thực sự tồn tại liên hệ giữa 2 đại lượng thời gian xẻ và diện tích xẻ
Tính hệ số tương quan
71 , 0 393 , 186
94 , 131 0
, 4491 736 , 7
94 , 131
x Q
Q
Q r
y x xy
Sự tồn tại của hệ số tương quan được kiểm tra theo tiêu chuẩn t của Student với giả thuyết H0: = 0
H1: 0
98 , 9 2 100 71
, 0 1
71 , 0 2
Vì t = 9,98 > t05 (K=98) = 1,98 nên giả thuyết H0 bị bác bỏ, thực sự tồn tại mối liên hệ đường thẳng giữa 2 đại lượng thời gian xẻ và diện tích xẻ
Kiểm tra sự tồn tại của dạng liên hệ tuyến tính 1 lớp
Với giả thuyết H0: Y = A + BX, theo tiêu chuẩn F của Fisher:
Trang 16204 , 6 2 6
6 100 57 , 0 1
504 , 0 57 , 0
2 1
K K
F = 5,66 nên giả thuyết H0 được chấp nhận, nghĩa là thực sự tồn tại mối liên hệ đường thẳng giữa 2 đại lượng thời gian xẻ và diện tích
xẻ
Xác định các tham số của phương trình hồi quy và phương sai thừa
Hệ số hồi quy b:
06 , 17 736 , 7
94 , 131
Hệ số tự do a:
n
x f b n
y f x y
.
708 , 17 70 , 32 100
8 , 103 06 , 17 100
y = 14,992 + 17,06.x Phương sai thừa đối với đường hồi quy tính được như sau:
48 , 44 2
100
736 , 7 06 , 17 4491 2
.
2 2
67 , 6 48 , 44
Kiểm tra sự tồn tại của các tham số a và b
Đặt giả thuyết: H0: A = 0 và B = 0
H1: A 0 và B 0 Với tham số a:
a a
S
a
t trong đó
736 , 7 100
48 , 115 67 , 6
2
^
x Q
n
x S S
992 , 14
Trang 17Bài giảng chương 5
b b
Q S S
11 , 7 398 , 2
06 , 17
Với tham số B:
P(b-t /2(K) Sb < B < b + t /2(K) Sb) = 1 - P(17,06 - 1,98 x 2,398 < B < 17,06 + 1,98 x 2,398) = 0,95 P(12,312 < B < 21,808) = 0,95
Chúng ta tin tới mức 95% rằng tham số A trong tổng thể nằm trong khoảng từ 9,89 đến 20,09 và tham số B trong tổng thể nằm trong khoảng từ 12,312 đến 21,808
Tính trị số lý luận thời gian xẻ trong sự phục thuộc vào diện tích gỗ xẻ
Từ phương trình hồi quy đã thiết lậ:
^
y= 14,992 + 17,06x thay các giá trị của x (diện tích gỗ xẻ) vào phương trình hồi quy sẽ xác
định được giá trị tương ứng của biến y^ (thời gian xẻ), chẳng hạn:
Bảng 5.7 Bảng tính trị số lý luận thời gian xẻ gỗ
Trang 18Hình 5.5 Biểu đồ tương quan giữa thời gian xẻ và diện tích gỗ xẻ
5.6.4 Kiểm tra sự thuần nhất nhiều hệ số hồi quy
Giả sử có m phương trình hồi quy tuyến tính đơn:
x b a
y
x b a
y
x b a
y
m m
ˆ
ˆ
ˆ
2 2
2
1 1
Giả thuyết H0 đặt ra là: B1= B2= Bm và đối thuyết H1 là ít nhất 1 hệ số hồi quy Bi khác với các hệ số hồi quy còn lại
Để kiểm tra giả thuyết H0, có thể vận dụng tiêu chuẩn n2 của Pearson:
m
i i b i
m
i b b
i
i i
W
b W b
W
1
2
1 2
1 2
.
Với W b ilà trọng số của hệ số hồi quy bi
2 1
i i b b
S
W trong đó 2
i b
S là phương sai của hệ số hồi quy b
15 20 25 30 35 40 45
0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
ytt yll
Trang 19Bài giảng chương 5
i i x
i b
Q
S S
2 2
trong đó 2
i
S là phương sai thừa đối với đường hồi quy
Nếu n2 tính theo (5.49) 052 tra bảng với k=m-1 bậc tự do thì các hệ s hồi quy bi là thuần nhất với nhau Ngược lại nếu n2 tính theo (5.49)> 052 tra bảng với k=m-1 bậc tự do thì giả thuyết H0 bị bác, các hệ số hồi quy bi là không thuần nhất với nhau
Trường hợp nếu giả thuyết H0 được chấp nhận, các hệ số hồi quy bi là thuần nhất với nhau, khi đó các phương trình hồi quy tuyến tính đơn ở các mẫu
được gộp chung với hệ số hồi quy mới là:
m
i i b
i
i
W
b W b
m
i
i a
i
i
W
a W a
a
S
i i
x
i i a
Q n
x S S
.
2 2
Phương trình gộp có dạng:
x b a
Ví dụ 5.5: GS.TS Đồng Sỹ Hiền đã nghiên cứu mối quan hệ giữa hình cao
bình quân (H f ) với chiều cao loài dẻ ở 5 địa phương khác nhau dạng:
f
H =a+bh Ông đã xác lập phương trình hồi quy cho loài dẻ ở từng địa phương
và tiến hành kiểm tra thuần nhất các hệ số hồi quy bi, kết quả kiểm tra được cho
. i
b b W
i a
i.
Cầu hai 0.3714 0.0010 1000.0 371.4 137.9 10.031 20.634 1.986 0.0180 55.56 110.33
Đại Từ 0.3987 0.0002 5000.0 1993.5 794.8 9.276 20.182 1.407 0.0134 74.63 105.0