Khái niệm về mẫu Mẫu là một bộ phận của tổng thể,trên đó người ta tiến hành điều tra, đo đếm và tiến hành thu thập số liệu, số phần tử của mẫu gọi là dung lượng mẫu kí hiệu là n; dung lư
Trang 1ĐỀ CƯƠNG TOÁN SINH THÁI Câu 1: Trình bày khái niệm về tổng thể, mẫu và phần tử cho ví dụ
1 Khái niệm về tổng thể
Tổng thể là toàn bộ đối tượng ta cần nghiên cứu, đối tượng trong tổng thể được gọi là một phần tử, số phần tử của tổng thể được coi là dung lượng của tổng thể (KH là N), dung lượng của tổng thể có thể là một số hữu hạn hoặc vô hạn
VD: Một lô hạt giống là tổng thể trong đó các hạt giống là phần tử; Tập hợp các con sâu gây hại là tổng thể trong đó mỗi loài sâu hại là 1 phần tử.
2 Khái niệm về mẫu
Mẫu là một bộ phận của tổng thể,trên đó người ta tiến hành điều tra, đo đếm và tiến hành thu thập số liệu, số phần tử của mẫu gọi là dung lượng mẫu kí hiệu là n; dung lượng mẫu là 1 số hữu hạn
VD: Đường kính của 30 cây keo trong lô keo 6 tuổi thì trong đó: lô keo 6 tuổi là tổng thể; 30 cây keo là mẫu và cây keo là phần tử Dung lượng mẫu n=30
Câu 2: Các loại phương pháp lấy mẫu từ tổng thể cho ví dụ
1 Phương pháp rút trực tiếp từ tổng thể
Là cách chọn mẫu ngẫu nhiên có hoàn lại hoặc không hoàn lại
VD: Trong một lô hạt giống ta chọn ngẫu nhiên 50 hạt để gây đột biến.
2 Phương pháp rút từ tổng thể được chia thành nhiều phần
a Chọn mẫu điển hình: Tức là chọn các phần tử điển hình từ tổng thể
VD: Trong một lô gà con vừa nở ta chọn những con gà trống nhanh nhẹn khỏe mạnh
b Chọn mẫu theo quy tắc: Tức là chia tổng thể ra thành những phần theo một quy tắc nào đó, sau đó
trong mỗi phần lấy ra các phần tử để điều tra, đo đếm để tạo thành mẫu
Ứng dụng: được sử dụng trong nghiên cứu động, thực vật ngoài tự nhiên
+ Phương pháp chọn mẫu theo tuyến: Toàn bộ diện tích điều tra được chia theo các tuyến (song song
hoặc cách đều nhau) và trên các tuyến chọn các mẫu điều tra Nếu trong diện tích điều tra S và các mẫu
có diện tích là S0 thì dung lượng của tổng thể N=S/ S0.
VD: Trong quá trình điều tra loài ve giáp ở Hải Phòng thì được chia làm các tuyến nhỏ như: Ao ếch, rừng kim giao, rừng ngập mặn cây bụi, đất trồng cây canh tác, rừng xanh trên núi đá vôi.
+ Phương pháp chọn mẫu theo mắt lưới: Toàn bộ diện tích điều tra được chia theo các tuyến song song
hoặc cách đều nhau theo 2 hướng và trên các điểm giao nhau chọn các mẫu điều tra
VD: Trong quá trình điều tra động vật đất cỡ trung bình ở Mê Linh- Vĩnh Phúc thì 2 khu rừng được chọn để điều tra đó là rừng tự nhiên và rừng keo Ở mỗi rừng lấy 4 điểm điều tra mỗi điểm cách nhau 1km Ở môi điểm đoàn nghiên cứu thực hiện đo đạc để ở mỗi điểm lấy 3 lô thí nghiệm trong mỗi lô đặt 4 bẫy cốc theo vị trí giao điểm của dây đo.
+ Phương pháp chọn mẫu có phân khối: Tổng thể được chia ra theo các khối thuần nhất, trong các
khối chọn các mẫu đại diện chung cho khối
Câu 3: Liệt kê các thuật ngữ thống kê của mẫu và cho biết ý nghĩa của hệ số tương quan R
1 Giá trị trung bình cộng (Xtb- Mean): Số trung bình cộng của mẫu là giá trị trung bình của một dãy
hữu hạn các số liệu quan sát được tính theo công thức sau:
n
xi
X
n
i
tb
∑
=
= 1 (trong đó xi: Số liệu quan sát; n: Dung lượng mẫu)
2 Số trung vị mẫu (M-Median)
Số trung vị mẫu là giá trị của số liệu quan sát ở khoảng giữa của mẫu
+ Nếu tập hợp mẫu có dung lượng mẫu là lẻ thì số trung vị là giá trị trung tâm
VD: (2.9; 2.6; 2.4; 2.3; 2.2) n=5 lẻ nên số trung vị M=2,4
+ Nếu tập hợp mẫu là chẵn thì số trung vị là giá trị trung bình của 2 giá trị phần tử trung tâm
VD: (2.9; 2.6; 2.3; 2.2) n=4 chẵn nên số trung vị M=(2,6+2,3)/2=2,45
3 Phương sai (S 2 ) và sai tiêu chuẩn S
a Phương sai (S 2 - Sample Variance): Là một đại lượng biểu thị tổng của bình phương các độ lệch
riêng rẽ so với giá trị trung bình của các phần tử mẫu trong cùng một điều kiện như nhau và được tính theo công thức sau:
Trang 2) (
1
2 2
−
−
∑
=
n
X
xi
S
n
i tb Trong đó xi: Số liệu quan sát; n: Dung lượng mẫu; Xtb: Giá trị trung bình cộng
b Sai tiêu chuẩn (S-Standard error) của mẫu có khi còn gọi là độ lệch chuẩn (Standard deviation) là
đại lượng để đo độ chính xác của kết quả thực nghiệm, độ lệch chuẩn càng lớn thì độ chính xác càng kém được tính bởi công thức như sau:
1
) (
1
2 2
−
−
=
=
n
Xtb Xi S
S
n i
4 Hệ số biến động và phạm vi biến động
+ Hệ số biến động (S%) của mẫu hay còn gọi là độ lệch chuẩn tương đối (relative standard deviation) biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát được tính bởi biểu thức
100
Xtb
S
S
+ Phạm vi biến động của mẫu (R) là hiệu số của trị số quan sát lớn nhất và trị số quan sát nhỏ nhất và được tính bởi biểu thức
R= Max(Xi) - Min(Xi)
5 Độ lệch (Sk) và độ nhọn K
+ Độ lệch (Sk- Skewness): Là chỉ tiêu cho thấy mức độ chênh lệch của đỉnh đường cong so với trị số
trung bình mẫu và được tính bằng
3 1
3
) (
) 2 )(
1
Xtb Xi n
n
n
S
n
i k
∑
=
−
×
−
−
=
- nếu Sk=0 thì phân bố là đối xứng
Sk>0 thì đường cong lệch lệch trái so với giá trị trung bình
Sk<0 thì đường cong lệch lệch phải so với giá trị trung bình
+ Độ nhọn (K- kurtosis)là chỉ tiêu cho thấy mức độ biến động của trị số quan sát so với trị số trung bình mẫu và được tính bằng
) 3 )(
2 (
) 1 ( 3 )
( ) 3 )(
2 )(
1
(
) 1
4 1
4
−
−
−
−
−
×
−
−
−
+
=
n n
n S
Xtb Xi n
n
n
n
n
K
n i
Nếu K=0 thì đường cong thực nghiệm tiệm cận chuẩn
K>0 thì đường cong có dạng bẹt so với tiệm cận chuẩn
K<0 thì đường cong có dạng nhọn so với tiệm cận chuẩn
6 Hệ số tương quan (R-Correlation)
Hệ số tương quan (R) là chỉ tiêu thuyết minh mức độ liên hệ giữa các đại lượng với nhau được tính theo công thức sau
y
x
xy
Q
Q
Q
n
Yi Xi XiYi
Q
n i
n i n
i xy
∑ ∑
=
−
1
và
n
Yi Y
Qy n
Xi X
Qx
n i n
i i
n i n
i i
2 1 1
2
2 1 1
2
) (
;
)
∑
∑
=
=
=
−
=
−
=
Trong đó R=0 nghĩa là hai đại lượng X, Y độc lập với nhau
R=1 nghĩa là hai đại lượng X, Y có quan hệ hàm số
3
,
0
0<R≤ hai đại lượng X và Y có quan hệ yếu
5
,
0
3
,
0 <R≤ hai đại lượng X và Y có quan hệ vừa
7
,
0
5
,
0 < R≤ hai đại lượng X và Y có quan hệ tương đối chặt
9
,
0
7
,
0 <R≤ hai đại lượng X và Y có quan hệ chặt
1
9
,
0 <R≤ hai đại lượng X và Y có quan hệ rất chặt
Câu 4: Trình bày một số loại phân bố thường gặp Phân tích và cho ví dụ về phân bố tần số thực nghiệm 1 chiều
Trang 31 một số loại phân bố thường gặp là:
a Phân bố tần số thực nghiệm 1 chiều b Phân bố chuẩn Gauss
c Phân bố Student T d Phân bố chuẩn F
e Phân bố X 2 f Phân bố mũ
g Phân bố Weibull h Phân bố khoảng cách
2 Phân tích và cho ví dụ về phân bố tần số thực nghiệm 1 chiều
Việc biểu diễn các kết quả quan sát theo tần số xuất hiện của nó là rất quan trọng Chúng được trình bày dưới các điểm riêng biệt trên một trục số đã chia tuyến tính (một chiều) sau đó đánh giá về mật độ xuất hiện Sự phân bố này được gọi là phân bố thực nghiệm một chiều Để xây dựng biểu đồ này, ta sẽ tập hợp các giá trị thành k cấp có độ rộng là d theo các công thức sau:
k=√n trong đó: n là dung lượng của mẫu quan sát và 5<k<20 hay ta phải có dung lượng mẫu ≥25
độ rộng
) ( 322 , 3 1
min max
n Log
X X
d
+
−
=
VD1: Giả sử ta có 60 kết quả quan sát với giá trị quan sát Max=42 và giá trị Min=16 khi đó ta có
k=√60≈8 và d=(42-16)/(1+3,322log(60)=3,76≈4
Để xác định các giá trị ứng với mỗi tần số ta lấy giá trị nhỏ nhất cộng với giá trị d và tăng dần hay lấy giá trị lớn nhất trừ đi d và giảm dần Khi đó ta xác định được các lớp giá trị với k=8 Kết quả thu được theo bảng sau
k Lớp Giá trị ứng với mỗi tần số Tần số
VD2: Giả sử có một dãy số quan sát với dung lượng
là:
n=100 hay k=1 và d=(29,8-19,6)/1 +
3,322log(100)=1,33≈1
Khi đó để xác định giá trị ta chia lớp bằng cách: lấy giá trị trung bình của lớp nhỏ nhất cộng với giá trị d
và tăng dần hay lấy giá trị của lớp lớn nhất trừ đi giá trị d và giảm dần
Bảng giá trị của các lớp (k=10 và d=1)
Câu 5: Trình bày phương pháp ước lượng điểm và phương pháp ước lượng khoảng
1 Phương pháp ước lượng điểm
a Ước lượng điểm trung bình của tổng thể µ
Trang 4Giả sử có một tổng thể có dung lượng N Từ 1 tổng thể rút ra mẫu ngẫu nhiên một mẫu có dung lượng n với x1, x2, x3,…xn phân tử người ta chứng minh được rằng số trung bình mẫu Xtb=(1/n)*
SUM(x1,x2,x3,…,xn) là một hàm ước lượng hiệu nghiệm nhất đối với số trung bình tổng thể với
phương sai D(x)=δ2/n
Ngoài ra số trung bình mẫu còn là hàm ước lượng không chênh lệch và tụ đối với tham số µ của tổng thể
Do vậy công thức µ của tổng thể là: µ=Xtb±SQRT(D(x))
Với SQRT(D(x)) là sai tiêu chuẩn số trung bình mẫu kí hiệu là δ(x)= SQRT(D(x))
Vì phương sai tổng thể hầu như không biết nên chúng ta dùng phương sai mẫu nghĩa là:
δ(x)≈Sx=S/SQRT(n)
Do vậy công thức tính µ là µ=Xtb± S/SQRT(n)
Trong đó : Sx=S/SQRT(n) đgl sai số trung bình mẫu
Hệ số biến động (S%): S%=S/Xtb 100
Hệ số chính xác (P%):P%=S%/ SQRT(n)
Từ đây ta có được dung lượng mẫu cần thiết Nct cần điều tra nếu cho trước hệ số chính xác (P%) Nct=(S
%/P%)2
Nếu qua điều tra sơ bộ chúng ta có thể biết được hệ số biến động S% và cho trước hệ số chính xác thì dung lượng cần điều tra là Nct=(S%/P%)2
Quy trình 8:
Bước 1:Lập bảng số liệu
Bước 2: Tính số trung bình Xtb bằng hàm= AVERAGE(…)
Bước 3: Tính phương sai S2 bằng hàm=VAR(…)
Bước 4: Tính sai số tiêu chuẩn S bằng hàm=STDEV(…)
Như vậy: Ta có thể ước lượng trung bình tổng thể: µ=Xtb ± S/SQRT(n)
Hệ số biến động (S%): S%= S/Xtb 100 Nếu cho trước hệ số chính xác P% khi đó dung lượng mẫu cần thiết Nct=(S%/P%)2
VD: Giả sử có số liệu đo đường kính của 30 cây trồng thuần Bài toán đặt ra là: nếu muốn hệ số chính xác không vượt quá 5%(tức là P%≤5%) thì dung lượng mẫu quan sát phải là bao nhiêu cây?
Giải:
Theo quy trình 8 ta có:
Xtb=Average 9,82
S 2 =VAR 13,06
µ=9,82±3,67/SQRT(30)=9,82±0,67125
s%=(3,67/9,82) 100=37,44
Như vậy dung lượng mẫu quan sát cần thiết nếu P%=5% sẽ là: Nct>(S%/P%) 2 =(37,44/5) 2 =56 cây Điều đó có nghĩa là dung lượng mẫu quan sát cần thiết nếu p%=5% là 56 cây và số cây quan sát thêm
là 56-30=26 cây.
b Phương pháp ước lượng điểm thành số tổng thể Pt
Giả sử ta có 1 tổng thể có dung lượng N phần tử được phân biệt nhau bởi dấu hiệu nào đó (như sống, chết, tốt, xấu) trong đó có m phần tử mang đặc điểm A và N-M phần tử mang đặc điểm khác A (đặc điểm B)
Tỷ số Pt=M/N đgl thành số tổng thể của những phần tử mang đặc điểm A Nếu từ tổng thể ta rút ngẫu nhiên hoàn lại 1 mẫu có dung lượng n, trong đó có m phần tử mang đặc điểm A thì tỉ lệ Pm=m/n đgl
Trang 5thành số mẫu của những phần tử mang đặc điểm A Do vậy công thức ước lượng điểm đối với thành số tổng thể là: Pt=Pm±SQRT(Pm.(1-Pm))/n
Nếu muốn sai số trung bình giữa thành số mẫu và thành số tổng thể không vượt quá giới hạn cho phép Ɛc
thì dung lượng cần quan sát sẽ là: nct≥(Pm.(1-Pm))/ Ɛc
Quy trình 9:
B1 Xác định Pm=m/n
B2 Xđ δ pm =SQRT(Pm.(1-Pm))/n.
B3 Pt=Pm± δ pm
B4 Xđ Nct= (Pm.(1-Pm))/ Ɛc
VD: Kiểm nghiệm tỉ lệ nảy mầm của lô hạt giống Lấy ngẫu nhiên 200 hạt đi gieo thử có 140 hạt nảy mầm Hãy ước lượng tỉ lệ nảy mầm của toàn bộ lô Nếu sai số không vượt quá 0,05 (Ɛc≤ 0,05)thì cần quan sát bao nhiêu hạt.
Ta có Pm=140/200=0,7 và δ pm =SQRT(Pm.(1-Pm))/n=0,0324
Vậy Pt=Pm± δ pm =0,7±0,0324
Nếu muốn sai số không vượt quá 0,05 thì dung lượng cần là
Nct= (Pm.(1-Pm))/ Ɛc=84 hạt
Có nghĩa là nếu muốn sai số của ước lượng không vượt quá 0,05 thì dung lượng quan sát cần thiết là 84 hạt Hay nói cách khác là ta đã thực hiện quan sát thừa 200-84=116 hạt
2 Phương pháp ước lượng khoảng
a Ước lượng khoảng số trung bình của tổng thể µ có phân bố chuẩn
Theo lí thuyết, nếu tổng thể µ có phân bố chuẩn tì khoảng số trung bình của tổng thể sẽ là:
Xtb-196 (S/SQRT(n))<µ<Xtb+1,96.(S/SQRT(n)) với sai số = 0,05
Trong đó: ±1.96*(S/SQRT(n): là sai số cực đại của ước lượng
Quy trình 10
B1.Xđ giá trị trung bình Xtb= AVERAGE
B2 XĐ sai số tiêu chuẩn S= STDEV
B3 XĐ = 1,96.(S/SQRT(n)) và %=(/Xtb) 100
B4 Xđ Nct≥(4 10 4 S 2 )/(Xtb 2 % 2 )
VD: Giả sử phân bố cây keo thuần loại theo đường kính, cùng tuổi theo phân bố chuẩn Người ta đo đường kính ngang ngực của tất cả các cây trong ô tiêu chuẩn (500m 2 ).
Hãy ước lượng đường kính bình quân của tổng thể cây keo
Muốn sai số không vượt quá 5% thì cần quan sát bao nhiêu cây
Bài giải trong exel
b Ước lượng khoảng thành số tổng thể Pt
Như chúng ta đã biết công thức ước lượng điểm đối với thành tổng số tổng thể là: Pt=Pm±SQRT(Pm.(1-Pm))/n Giả sử một tổng thể N được rút ngẫu nhiên một mẫu có dung lượng n đủ lớn thì công thức ước lượng khoảng thành số tổng thể pt sẽ là:
Pm-U SQRT(Pm.(1-Pm))/n≤Pt≤Pm+U SQRT (Pm.(1-Pm))/n
Trong đó =0,05 thì U=1,96; 0,01 thì U=2,58; ),001 thì U=3,29
Pm=m/n là thành số mẫu; Sai số cực hạn của ước lượng = ±U SQRT (Pm.(1-Pm))/n
Dung lượng quan sát cần thiết tính theo công thức là: nct≥U2 Pm.(1-Pm))/n2
Quy trình 11
B1: Xác định Pm=m/n
B2 Xđ δ pm = SQRT (Pm.(1-Pm))/n
B3 Xđ U δ pm
B4 Pt=Pm±U δ pm
B5 Xđ nct≥U2 Pm.(1-Pm))/n2
Câu 6: Nội dung của tiêu chuẩn U của Mann và Whitney với 2 mẫu độc lập và tiêu chuẩn phi tham số của Kruskal và Wallis trong trường hợp có nhiều mẫu độc lập
1 Tiêu chuẩn U của Mann và Whitney với 2 mẫu độc lập
Kiểm định U là một loại kiểm định bằng cách xếp hạng các mẫu độc lập với mục đích kiểm định sự bằng nhau của các tổng thể có phân phối bất kỳ
Quy trình 16
Trang 6B1: Cột 2: Dùng lệnh Copy để đưa số liệu vào cùng 1 cột
B2 Cột 1 Ghi thứ tự của mẫu nhờ lệnh Fill Handle
B3 Cột 3 Dùng lệnh Sort để xếp thứ tự có trong cột 2
B4 Cột 4 Dùng lệnh Fill- Handle để ghi số thứ tự từ 1…n, tức là xếp theo thứ tự từ nhỏ đến lớn
B5 Cột 5 Ghi số hạng mới ứng với từng mẫu quan sát sau khi dùng lệnh Sort cho cột số 1
B6 Sử dụng lệnh tính giá trị trung bình= Average () của số hạng cho các số hạng trùng nhau có trong cột
số 3
B7 Dùng lệnh Cut để đưa mẫu ở trong cột 5 trở về theo từng mẫu ban đầu
B8 Dùng hàm số =Sum() để cộng các cột đã xếp hạng trong số liệu ban đầu
2 Tiêu chuẩn phi tham số của Kruskal và Wallis trong trường hợp có nhiều mẫu độc lập
Áp dụng trong trường hợp số mẫu ≥3 và các đại lượng quan sát là các đại lượng liên tục Phương pháp này được tiến hành giống như cho hai mẫu độc lập bao gồm:
+ Phương pháp xếp hạng các số liệu quan sát ở các mẫu (phương pháp áp dụng như của hai mẫu) nhưng kết quả xếp hạng chúng ta sẽ có R1; R2; R3…Rn
+ Cuối cùng dùng tổng hạng H được tính
H=(12/(n.(n+1))) Sum(Ri2/ni)-3(n+1) (i: 1→n)
Trong đó n= Sum(ni) (i: 1→n) là tổng dung lượng mẫu quan sát
H có phân bố χ2 với bậc tự do K=1-n
Để kiểm tra χ2 ta sử dụng hàm CHIINV
- Nếu H> χ2
(0,05.k) thì các mẫu không thuần nhất
- Nếu H≤ χ2
(0,05.k) thì các mẫu thuần nhất tức là tổng thể
Câu 7: Các tiêu chuẩn kiểm tra trong trường hợp có 2 mẫu liên hệ và tiêu chuẩn Fied man trong trường hợp có nhiều mẫu liên hệ.
1 Các tiêu chuẩn kiểm tra trong trường hợp có 2 mẫu liên hệ
a Tiêu chuẩn Student T
Nếu kết quả P<0,05 thì sự sai khác nhau của 2 giá trị trung bình tổng thể là có ý nghĩa (H1 chấp nhận, H0 không chấp nhận) ngược lại thì sự sai khác không có ý nghĩa (H0 chấp nhận, H1 không chấp nhận)
b Tiêu chuẩn tổng hạng theo dấu của Wilcoxon
Quy trình 17
B1 Cột 5 Chọn hàm giá trị tuyệt đối ABS
B2 Cột 6 Chọn lệnh Sort theo ABS
B3 Cột 7 Tính số hạng
B4 Cột 8 Chọn lệnh Sort theo d
B5 Cột 9 Tính tổng hạng
B6 Tính R= Sum (Số hạng âm) và R’=Sum (Số hạng dương)
Tiêu chuẩn tổng hạng theo dấu của Wilcoxon được tính qua giá trị tuyệt đối của U
U=(R*-E(R))/SQRT(D(R))
Trong đó: E(R)=r.(r+1)/4; D(R) = r.(r+1) (2r+1)/24
R= n-n0 (n0 là dung lượng mẫu có d=0)
Nếu U>1,96 thì giả thuyết H0 bị bác bỏ, ngược lại U≤1,96 thì H1 bị bác bỏ
2 Tiêu chuẩn Fied man trong trường hợp có nhiều mẫu liên hệ.
Nếu trong trường hợp so sánh nhiều mẫu liên hệ với nhau thì chúng ta sử dụng tiêu chuẩn Fiedman như sau
+ Xếp các số hạng của các trị số quan sát
+ Tính tổng hạng cho mỗi mẫu thí nghiệm (có R1, R2, R3…Rn)
+ Kiểm tra giả thuyết H0 theo công thức: χ2(a)= (12/(b.a.(a+1))) SUM (Ri2)-3.b.(a+1)
Trong đó: b: là số lần lặp lại thí nghiệm; a là số mẫu so sánh; Ri là tổng hạng cho mỗi mẫu thí nghiệm Nếu χ2
(a)> χ2
(0,05, k=a-1) thì giả thuyết H0 sẽ bị bác bỏ, ngược lại thì H1 sẽ bị bác bỏ
Câu 8: Các phương trình và tham số của hồi quy tuyến tính 1 lớp và hồi quy tuyến tính nhiều lớp
Mô tả quy trình xác định hồi quy tuyến tính 1 lớp bằng ma trận
1 Các phương trình và tham số của hồi quy tuyến tính 1 lớp
Phương trình Y=A+ BX, ở mẫu có dạng y=a+bx
Các tham số của phương trình hồi quy tuyến tính được tính theo quy trình 21
Trang 7Quy trình 21
B1 Chon menu Tools trên thanh công cụ chuẩn
B2 Chọn Data Analysis
B3 Chọn Regression và bấm Ok
B4 Trong hộp Regression chọn
+ Input Y Range: chọn khối dữ liệu cho biến phụ thuộc Y
+ Input X Range: chọn khối dữ liệu cho biến độc lập X
+ Output Range: Khai miền xuất kết quả của tương quan
B5 Chọn OK
2 Các phương trình và tham số của hồi quy tuyến tính nhiều lớp
Phương trình hồi quy tuyến tính nhiều lớp trong tổng thể có dạng Y=A0+A1X1+A2X2+A3X3+…+AnXn ở mẫu có dạng y= a0+a1x1+a2x2+a3x3+…+anxn
Các tham số của phương trình hồi quy tuyến tính (a0; a1;a2; a3; an) được tính theo quy trình 23
Quy trình 23
B1 Chon menu Tools trên thanh công cụ chuẩn
B2 Chọn Data Analysis
B3 Chọn Regression và bấm Ok
B4 Trong hộp Regression chọn
+ Input Y Range: chọn khối dữ liệu cho biến phụ thuộc Y
+ Input X Range: chọn khối dữ liệu cho biến độc lập X1; X2; X3;…;Xn
+ Output Range: Khai miền xuất kết quả của tương quan
B5 Chọn Ok
3 Mô tả quy trình xác định hồi quy tuyến tính 1 lớp bằng ma trận
B1 Nạp số liệu vào bảng tính theo từng cặp (x,y)
B2 Tính bình phương các trị số quan sát: x2, Y2; và x.y
B3 Tính các tổng ∑x; ∑y, ∑x2; ∑y2; ∑x.y
B4 Xác lập các ma trận bao gồm
=
=
∑
∑
∑
∑
∑
2
2
;
1
x
x x
n D y x
y D
B5 Đảo ngược chiều ma trận D2 bằng lệnh ‘=Minverse’, nhận được ma trận nghịch đảo D2
Trình tự đảo ngược chiều ma trận D2’ làm như sau
+ Khai báo vùng Output kết quả của ma trận nghịch đảo D2’
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Minverse
+ Bấm Next chọn Array (fx); Khai địa chỉ ma trận nguồn D2
+ Bấm Ctrl+shift+enter
B6 Nhân ma trận D2’ với ma trận D1 sẽ được a, b
Trình tự làm như sau
+ Khai báo vùng Output kết quả của nhân ma trận D2’.D1
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Mmult
+ Bấm Next chọn Array 1 (fx); Khai địa chỉ hàng thứ nhất của ma trận D2’ và chọn Array 2 (fx): Khai địa chỉ cột ma trận nguồn D1
+ Bấm Ctrl+shift+enter để cho giá trị a
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Mmult
+ Bấm Next chọn Array 1 (fx); Khai địa chỉ hàng thứ 2 của ma trận D2’ và chọn Array 2 (fx): Khai địa chỉ cột ma trận nguồn D1
+ Bấm Ctrl+shift+enter để cho giá trị b
Câu 9: Hãy chuyển 3 liên hệ phi tuyến tính (phi tuyến hàm mũ Y=kX b ; Y=kX b Z c và dạng hàm mũ kép Y=m.exp(-c 1 X -c2 ) về dạng liên hệ tuyến tính.
1 Chuyển Phi tuyến hàm mũ Y=kX b về dạng liên hệ tuyến tính.
Y=kXb logarit hóa 2 vế ta có
Log Y= logk+ b.logX
Đặt log Y=y; logk=a; log X=x khi đó ta có y=a+bx
Trang 82 Chuyển Phi tuyến hàm mũ Y=kXb Z c về dạng liên hệ tuyến tính.
Y=kXbZc logarit hóa 2 vế ta có
Log Y= logk+ b.logX+c.logZ
Đặt log Y=y; logk=a; log X=x1; logZ=x2 khi đó ta có y=a+bx1+cx2
3 Chuyển Phi tuyến hàm mũ kép Y=m.exp(-c1 X -c2)về dạng liên hệ tuyến tính.
Y=m.exp(-c1.X-c2) →ln 2 vế ta được: lnY=ln m-c1Xc2 tiếp tục ln 2 vế ta được: ln(ln(m/Y))=lnc1-c2lnX Đặt ln(ln(m/Y))=y; lnc1=a; -lnX=x khi đó ta có y=a+c2x
Câu 10: Trình bày quan hệ giữa hiệu quả với chuỗi các biến tương quan (04 biến số)
Giả sử ta có một tổng thể Y do 4 biến số A,B,C,D ảnh hưởng,trong 4 biến số này lại có tương quan mật thiết với nhau Căn cứ vào các quy tắc ta có thể lập những phương trình sau
RYA=PYA+RAB.PYB+RAC.PYC+RAD.PYD
RYB=PYB+RAB.PYA+RBC.PYC+RBD.PYD
RYC=PYC+RAC.PYA+RBC.PYB+RCD.PYD
RYD=PYD+RAD.PYA+RBD.PYB+RCD.PYC
Sử dụng phương pháp ma trận giải phương trình này để xác định các hệ số trong phương trình ảnh hưởng với hàm Y(A,B,C,D)
Y=PYA.A+PYB.B+PYC.C+PYD.D
Trong đó: Bx là cường độ ảnh hưởng trực tiếp hay gián tiếp hay hệ số xác thực
Bx= PYA2 +PYB2+PYC2+PYD2+2 RAB.PYA PYB+2 RBD.PYD PYB+2 RBC.PYC PYB+2 RAD.PYD PYA+2 RAC.PYA
PYC+2 RCD.PYD PYC=1
- Nếu Bx=1 chứng tỏ các nguyên nhân trên ảnh hưởng trực tiếp đến kết quả
- Nếu Bx<1 chứng tỏ còn những nguyên nhân khác ảnh hưởng đến kết quả mà ta chưa xét đến
Quy trình 24
B1 Nạp số liệu vào bảng tính theo thứ tự A,B,C,D và Y
B2 Tính hệ số tương quan RAB; RBD; RBC; RAD; RAC; RCD; RYA; RYB; RYC; RYD (Sử dụng hệ số tương quan=CORREL(array1, array2))
B3 Xác lập các ma trận nguồn bao gồm
−
−
−
−
=
=
1 1
1
1 2
;
1
CD BD AD
CD
BC AC
BD AB AB
AD AC AB
YD
YC
YB
YA
R R R
R
R R
R R R
R R
R D
R
R
R
R
D
B4 Đảo ngược chiều ma trận D2 bằng lệnh=Minverse, nhận được ma trận nghịch đảo D2’
Trình tự làm như sau
+ Khai báo vùng Output kết quả của ma trận nghịch đảo D2’
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Minverse
+ Bấm Next chọn Array (fx); Khai địa chỉ ma trận nguồn D2
+ Bấm Ctrl+shift+enter
B5 Nhân ma trận D2’ với ma trận D1 sẽ được PXA, PXB, PXC, PXD
Trang 9
=
−
−
−
−
×
XD XC XB XA
CD BD AD
CD
BC AC
BD AB AB
AD
AC
AB
YD
YC
YB
YA
P P P P R
R R
R
R R
R R R
R
R
R
R
R
R
1 1
1 1
Trình tự làm như sau
+ Khai báo vùng Output kết quả của nhân ma trận D2’.D1
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Mmult
+ Bấm Next chọn Array 1 (fx); Khai địa chỉ hàng thứ nhất của ma trận D2’ và chọn Array 2 (fx): Khai địa chỉ cột ma trận nguồn D1
+ Bấm Ctrl+shift+enter để cho giá trị PXA
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Mmult
+ Bấm Next chọn Array 1 (fx); Khai địa chỉ hàng thứ 2 của ma trận D2’ và chọn Array 2 (fx): Khai địa chỉ cột ma trận nguồn D1
+ Bấm Ctrl+shift+enter để cho giá trị PXB
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Mmult
+ Bấm Next chọn Array 1 (fx); Khai địa chỉ hàng thứ 3 của ma trận D2’ và chọn Array 2 (fx): Khai địa chỉ cột ma trận nguồn D1
+ Bấm Ctrl+shift+enter để cho giá trị PXC
+ Chọn hàm f(x), trong hộp thoại chọn Math & Trig chọn Mmult
+ Bấm Next chọn Array 1 (fx); Khai địa chỉ hàng thứ 4 của ma trận D2’ và chọn Array 2 (fx): Khai địa chỉ cột ma trận nguồn D1
+ Bấm Ctrl+shift+enter để cho giá trị PXD
Câu 11: Trình bày mô hình đa dạng sinh học K quần thể và các chỉ số
1 Mô hình đa dạng sinh học K quần thể
Giả sử ta có 1 không gian trong đó các quần thể chính là các loài Khi đó không gian trên chính là quần
xã Với điều tra N đơn vị ngẫu nhiên và ta giả sư [Fịj]là sự có mặt của loài j trong mẫu i Như vậy ta có
ma trận Fij như sau
F11 F12 F13 F14… F1k
F21 F22 F23 F24… F2k
Fij= …
…
F1k F2k F3k F4k Fnk
Trong đó ta có: Sj= ( 1 )& ( 1 )
1 1
N j
F S
k j F
j ij i
k j ij
=
=
Ta đặt Pj=Sj/N= Tổng các mẫu có loài i/ tổng mẫu điều tra
Khi đó (1/ ) ( 1 )
1
k j p k
j
)
1 ( ) (
)
/
(
)
(
1
P P k
l
P
j
=
V(P)- Phương sai mẫu Gọi S là tổng số loài có trong mẫu đơn vị ta có tập S={Si i=1…N}
Nếu K loài độc lập với nhau thì: Var (S)≈k.P.(1-P)-k.V(P)
Nếu ta xét một quần xã có nhiều loài trong đó: S là số lượng loài có trong mẫu; N là số lượng cá thể có trong mẫu; ni là số lượng cá thể của loài thứ I; pi=ni/N là tỉ lệ cá thể của loài I so với số lượng cá thể của toàn mẫu
Khi đó chỉ số đa dạng sinh học trong không gian k quần thể sẽ được tính bằng các chỉ số đa dạng sinh học sau
2 Các chỉ số
a Chỉ số đa dạng sinh học Fisher
Trang 10Trên cơ sở phân tích một số lượng lớn các số liệu về số lượng loài và số lượng cá thể ở trong các quần
xã khác nhau Fisher đưa ra chỉ số đa dạng sinh học ∆ sẽ tính theo công thức sau: S=∆.ln(1+N/□)
Sử dụng phương pháp tính gần đúng ta tìm x từ hệ phương trình (1): S/N=((1-x)/x).(-ln(1-x))
Trong đó: S là số lượng loài có trong mẫu, N là số lượng cá thể có trong mẫu, x là số thực nghiệm<1 được tìm từ phương trình (1) sao cho kết quả vế phải gần bằng vế trái
Sauk hi tìm được x thay vào phương trình sau để tính chỉ số đa dạng sinh học Fisher (∆): ∆=N(1-x)/x Nếu chỉ số đa dạng sinh học Fisher thấp thì khi đó tính đa dạng loài thấp và ngược lại
b Chỉ số phong phú của loài Margalef (d)
Chỉ số phong phú của loài Margalef (d) được tính theo công thức d=(S-1)/ln(N)
Trong đó S là số lượng loài có trong mẫu, N là số lượng cá thể có trong mẫu
c Chỉ số đa dạng loài Shannon-Weiner (H’)
Chỉ số đa dạng loài Shannon-Weiner (H’) được tính theo công thức : ' log ( )
1
2 pi pi
i
∑
=
−
Pi=ni/N là tỉ lệ cá thể của loài I so với số lượng cá thể của toàn mẫu
Chỉ số đa dạng loài Shannon-Weiner (H’) cho phép so sánh các quần xã theo sự giàu có về loài Như vậy, số loài càng cao thì chỉ số H’ càng cao và ngược lại
d Chỉ số loài ưu thế và chỉ số đa dạng Simpson
Chỉ số loài ưu thế của Simpson (C) được tính theo công thức
)
1 ( ) 1 (
) 1 (
1
k i N
N
ni ni
ni
i
=
−
−
=
chỉ số đa dạng loài của Simpson (D) được tính theo công thức sau
)
1 ( ) 1 (
) 1
(
1
k i ni
ni
N
N
i
=
−
−
=
∑
=
trong đó D biến thiên từ 0 đến (1-1/S); N là số lượng cá thể có trong mẫu và
ni là số lượng cá thể của loài thứ i
Câu 12: Trình bày 02 loại thước đo trong mô hình phân loại trong mô hình cấu trúc
1 Mectric 1- Chỉ số Sorensen (CC)
Nếu số liệu điều tra mang tính chất định tính thì khi đó chúng ta dùng chỉ số Sorensen (CC) được tính theo công thức sau: CC=2a/(2a+b+c); 0≤CC≤1
Trong đó a: số loài chung cho cả 2 quần xã; b: số loài chỉ có ở quần xã 1; c: số loài chỉ có ở quần xã 2
Rõ ràng 0≤CC≤1
2 Mectric 2
Nếu số liệu điều tra mang tính chất định lượng thì khi đó chúng ta dùng chỉ số Mectric 2 được tính theo công thức sau: 2 min ; ( 1 )
1
s v z
x z
x
v
=
và 0≤ PSij <1 Trong đó: Xiv; Xjv là số lượng cá thể của loài v trong quần xã i,j; s là số loài có trong 2 quần xã i và j (v=1…s); Z là tổng số các cá thể trong 2 quần xã hay
)
1 (
; ) (
1
s v X X
v
jv
=