TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN ============ Báo cáo bài tập lớn PHÂN TÍCH THÔNG KÊ SỐ LIỆU ĐỀ TÀI Phân tích sản lượng và diện tích của lúa, ngô, mía, và diện tích lúa, ngô, khoai lang phân theo địa phương qua các năm từ 2010 2019 Hà Nội 2021 Mục lục CHƯƠNG 1 CƠ SỞ LÍ THUYẾT 4 1 Các khái niệm về đặc trưng cơ bản của số liệu 4 1 1 Các đặc trưng cề sự tập trung của tập số liệu 4 1 2 Các tham số đặc trưng cho sự phân tán của tập số liệu 8 2 1 Bài toán 1 nhân tố 12 2 2.
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
======***======
Báo cáo bài tập lớn PHÂN TÍCH THÔNG KÊ SỐ LIỆU
ĐỀ TÀI: Phân tích sản lượng và diện tích của lúa, ngô, mía, và diện tích lúa, ngô, khoai lang phân theo địa phương qua các năm từ 2010 - 2019
Hà Nội _ 2021
Trang 2Mục lục
Trang 3CHƯƠNG 1: CƠ SỞ LÍ THUYẾT
1 Các khái niệm về đặc trưng cơ bản của số liệu
1.1 Các đặc trưng cề sự tập trung của tập số liệu.
1.1.1 Tần suất
Tần suất (): Giả thiết có một tập số liệu kết quả nghiên cứu gồm có N số liệu, trong đó có giá trị có (xuất hiện lần) gọi là tần số của giá trị khi đó, tần suất của giá trị được tính như sau:
là tần xuất xuất hiện của , khi N- >∞ thì -> ( là xác xuất xuất hiện của )
Vd 1: Cho tập số liệu về diện tích mía (nghìn ha) từ 2010-2019
Trang 5Khoảng cách của tập số (R) khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của tập số liệu và kết quả thực nghiệm.
= trùng với số trung vị Med
-Đối với các số liệu không nhóm lại:
+ Sô trung vị của tập N số lẻ được tính:Med=
+ Số trung vị của tập N số chẵn được tính:Med=[+]
+ Số tứ phân vị của tập N giá trị chia hết cho 4
Trang 6=>Sô trung vị của tập N số chẵn được tính: Med= = = (281+282.2)/2 = 281.6
Ví dụ : Cho tập số liệu về diện tích mía (nghìn ha) từ năm 2010-2019 Tính
Trang 72019 233.7
Ví dụ: Từ bảng trên
=280.44
1.2. Các tham số đặc trưng cho sự phân tán của tập số liệu:
1.2.1 Phương sai (² hay S² )
Phương sai là trung bình của tổng bình phương sai khác giữa các giá trị của tập
số liệu so với giá trị trung bình của tập số liệu kết quả thực nghiệm:
Phương sai còn biểu diễn độ phân tán của tập số liệu kết quả thực nghiệm đối với giá trị trung bình Phương sai càng lớn độ phân tán xung quanh giá trị trung bình càng lớn và ngược lại
VD: Cho tập số liệu về chỉ số phát triển sản lượng lúa từ 2009-2016 Tính
Trang 9Ví dụ 8: Cho tập số liệu về chỉ số phát triển sản lượng lúa từ 2009-2016 Tính
Trang 101.2.5 Mối quan hệ giữa độ lệch chuẩn và hệ số biến thiên.
Độ lệch chuẩn càng lớn (tức sai biệt càng lớn) thì Cv càng lớn
2 Phân tích phương sai cho các bài toán một nhân tố, 2 nhân tố ảnh hưởng đến kết quả thí nghiệm
2.1 Bài toán 1 nhân tố
Phát biểu: Bài toán 1 nhân tố, có k mức nghiên cứu, mỗi mức thực nghiệm làm lại n lần
So sánh sự sai khác giữa các giá trị kết quả thực nghiệm (yij) do thay đổi các
- Cần so sánh phương sai của sự thay đổi các mức thực nghiệm với phương sai của sai số thực nghiệm có khác nhau đáng tin cậy hay không
- Nếu khác nhau không đáng tin cậy, nhân tố A k ảnh hưởng lên kết quả thực nghiệm, nếu khác nhau đáng tin cậy thì nhân tố A đã ảnh hưởng đến kết quả thực nghiệm
Trang 112 : Đặc trưng cho sai số thực nghiệm nói chung, (làm thực nghiệm bao giờcũng mắc sai số)
Nếu Ftính > Fbảng thì Ftính đáng tin cậy, tức là S12 S22 đáng tin cậy => Nhân tố
A khi thay đổi đã tác động đến kết quả thí nghiệm
- Bảng công đoạn để tính phương sai nhằm so sánh cho bài toán 1 nhân tố kmức thực nghiệm và n lần lặp: Phương sai:
Trang 12F tính==2,45< F bảng =>F tính không đáng tin cậy
=>giống nhau -> A không có tác dụng lên kết quả thực nghiệm
2.2 Bài toán 2 nhân tố
Phát biểu: Bài toán 2 nhân tố, nhân tố A có k mức thực nghiệm, nhân tố B có mmức thực nghiệm Mỗi mức thực nghiệm lặp lại n lần
A
Trang 13STN2 : Đặc trưng cho sai số nghiên cứu
Các bước tính phương sai theo bảng:
Yij =iju
(Với u: nghiên cứu lặp thứ u, i:mức đối với A, j: mức đối với B)
Trang 14Bước 2: Tính bình phương tổng giá trị trong 1 ô
Bước 3: Tính tổng số đối với các cột
Bước 4: Tính tổng số đối với các hàng
Bước 5: Tổng tất cả các kết quả
Bước 6: Tìm tổng bình phương của tổng các cột chia cho (số hàng*số lần lặp)Bước 7: Tìm tổng bình phương của tổng các hàng chia (số cột*số lần lặp)
Bước 8: Tìm số hạng bổ chính được định nghĩa như là phép chia của bình
phương của tổng tất cả các kết quả cho tổng số kết quả
Bước 9: Tìm tổng bình phương của sự sai khác của A và B
Bước 10: Tìm tổng bình phương của phương sai sai số
Bước 11: Tìm tổng của tổng bình phương
Bước 12: Tìm tổng bình phương của số hạng tương tác
Bước 13: Tìm phương sai tương ứng
Ví dụ:
Trang 15Đề bài : Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái trong 2 mùa (khô và mưa : trong mỗi mùa lấy mẫu 3 lần – đầu mùa, giữa mùa, cuối mùa) và từ 3 miền (Nam, Trung, Bắc) thu được kết quả sau :
Bước 2: Tính bình phương Bước 1
Trang 16Bước 8: Tìm số hạng bổ chính được định nghĩa như là phép chia của bình
phương của tổng tất cả các kết quả cho tổng số kết quả
Trang 173 Mô hình hồi quy
3.1 Mô hình hồi quy đơn biến
Giả sử ta có x là biến độc lập, y là biến phụ thuộc Điều ta quan tâm là sự ảnhhưởng của x đến y?
Xét trường hợp đơn giản nhất: y = f(x) có dạng tuyến tính
Trang 18Để làm khớp một mô hình hồi quy tuyến tính đơn giản với một tập dữ liệu, ta phảitìm ước lượng cho biết các tham số A và B của đường trung bình y = A + Bx
Ta cần đưa ra các giả định cụ thể về tính chất của nó
Các giả định cần thiết cho một mô hình hồi quy tuyến tính:
1 Các trung bình của phân bố sai số ngẫu nhiên là 0, E (e) = 0 Khi đó giá trịtrung bình của y, E (y), với một giá trị nhất định x, là y = A + B x
2 Các phương sai của sai số ngẫu nhiên bằng một hằng số, , cho mọi x
3 Sự phân bố xác suất của sai số ngẫu nhiên là phân bố chuẩn
4 Các lỗi liên kết với hai quan sát khác nhau bất kỳ là độc lập
Phương pháp bình phương cực tiểu
Vấn đề đầu tiên của phân tích hồi quy đơn giản là tìm ước lượng của A và B của
mô hình hồi quy dựa trên một dữ liệu mẫu Giả sử chúng ta có một mẫu của nđiểm dữ liệu (x1, y1), (x2, y2), , (xn, yn) Mô hình đường thẳng cho các y tươngứng với x là: y = A + B x + e
Đường thẳng của các trung bình là E (y) = A + B x và đường được làm khớp với
dữ liệu mẫu
Như vậy, là một ước lượng của các giá trị trung bình của y, và a, b là ước lượngcủa A và B, tương ứng Đối với một điểm số liệu, nói rằng các điểm (xi, yi), giá trịquan sát của y là yi và các giá trị dự đoán của y sẽ là:
SSE = 2
Các giá trị của a và b làm cho tối thiểu SSE được gọi là các ước tính theo phươngpháp bình phương cực tiểu của các tham số quần thể A và B và phương trình dựbáo được gọi là đường bình phương cực tiểu
Trong đó:
SSxy = , SSxx = 2
, n = kích thước mẫu
Trang 19Đánh giá phương sai 2
t = Vùng bác bỏ
t < -t or t > t , Trong đó t dựa trên bậc tự do df=(n - 2)
Ví dụ : Cho bảng số liệu về lượng phân bón và năng suất lúa bình quân theo cácnăm từ 1996 – 2010
Trang 20a Hãy dựng đường hồi qui tuyến tính giữa x và y (quan hệ hàm giữa chúng).
Trang 213.2 Mô hình hồi quy đa biến
Giả sử thời gian trung bình E (y) yêu cầu để thực hiện một công việc xử lý dữ liệutăng nếu tăng việc sử dụng máy tính và các mối quan hệ đó là đường cong Thay vì
sử dụng mô hình đường thẳng E(y) = A +B để mô hình hóa mối quan hệ, chúng ta
Nếu, ngoài ra, ta nghĩ rằng thời gian là cần thiết để xử lý một công việc cũng liên
dụ, mô hình đầu tiên trong trường hợp này là
Trang 22E (y) = + +
Do vậy, trong tương lai chúng ta chỉ xem xét mô hình hồi quy bậc nhất đa biến
Mô hình tuyến tính đa biến tổng quát:
y = + + + + e,
trong đó
y = biến phụ thuộc (biến được mô hình hóa – sometimes called the responsevariable)
, , , = Biến độc lập ( variable used as a predictor of y)
e = Lỗi ngẫu nhiên
xác định sự đóng góp của các biến độc lập
Các giả định cần thiết cho một mô hình hồi quy tuyến tính đa biến
vớicácgiá
kỳ
của , , , , lỗi ngẫu nhiên e có phân bố chuẩn với trung bình bằng 0 và phương saibằng 2
3 Các lỗi ngẫu nhiên là độc lập
4 Ví dụ: Cho bảng số liệu về lượng phân bón, năng suất lúa bình quân và sản lượnlúa các năm 1996-2010 như sau :
t = vùng loại bỏ
t < - t or t > t, trong đó tdựa trên [ n- (k+1)]=df,
n = số các quan sát, k= số các biến độc lập trong môhình
Trang 23Năm Lượng Phân Bón (kg/ha) Năng suất lúa bình quân (tạ/ha) Sản lượng
Trang 244 Mô hình tương quan
Phân tích tương quan là công cụ thống kê có thể sử dụng để mô tả mức độ các biếnquan hệ tuyến tính liên quan Thường thường, phân tích mối tương quan được sửdụng kết hợp với phân tích hồi quy để đánh giá mô hình tìm theo bình phương cựctiểu là phù hợp với những dữ liệu hay không Phân tích tương quan cũng có thểđược sử dụng để đo lường mức độ liên kết giữa hai biến Trong phần này chúng tôi
trình bày hai phương pháp để mô tả sự tương quan giữa hai biến: Dùng Hệ số xác
Trang 254.2 Một số tính chất của hệ số tương quan
-1 R 1 (theo bất đẳng thức Cauchy-Bunhiacopskij)
r và b (độ dốc của đường hồi qui bình phương cực tiểu) có cùng dấu
Một giá trị của r gần hoặc bằng 0 có nghĩa là ít hoặc không có mối quan hệ tuyếntính giữa x và y Các r gần 1 hoặc -1, thì mối quan hệ tuyến tính giữa x và y làmạnh mẽ
Hệ số tương quan r do sự tương quan giữa giá trị x và giá trị y trong mẫu, và tương
tự hồi qui tuyến tính, hệ số tương quan tồn tại cho quần thể từ đó các điểm dữ liệuđược lựa chọn Các hệ số tương quan quần thể được kí hiệu là (rho) được tính từcác số liệu thống kê mẫu tương ứng r Thay vì tính , ta có thể kiểm định giả thuyếtH0: = 0 hoặc Ha: 0, nghĩa là, kiểm tra giả thuyết rằng x không góp phần thông tincho dự đoán y sử dụng mô hình đường thẳng, hoặc ngược lại, hai biến ít nhất cóliên quan tuyến tính Nhưng đã chứng minh được giả thuyết H0: r = 0 tương đươngvới giả thuyết H0: B = 0 Vì vậy, chúng ta bỏ qua kiểm tra giả thuyết cho sự tươngquan tuyến tính
- Các hệ số xác định
Một cách khác để đo sự đóng góp của x trong việc dự đoán y là xem xét có baonhiêu sai số trong dự đoán về y có thể được giảm bằng cách sử dụng các thông tinđược cung cấp bởi x
Các hệ số xác định từ tập mẫu được khai triển từ mối quan hệ giữa hai kiểu củaphương sai: Phương sai của các giá trị y trong một tập dữ liệu so với:
1 Đường hồi quy được “làm khớp”
2 Trung bình của chúng
Các biểu thức phương sai trong cả hai trường hợp được sử dụng theo ý nghĩathống kê của nó là "sự tổng hợp của một nhóm các bình phương độ lệch "
SSE = SSyy
-Phương sai đầu tiên là phương sai của các giá trị y xung quanh đường hồi quy, tức
là xung quanh các giá trị dự đoán của chúng
Phương sai này là tổng bình phương các lỗi (SSE) của mô hình hồi quy.Phương sai thứ hai là tổng hợp sự biến động của giá trị y so với trung bình của nó
SSyy = 2
Hệ số xác định là
, r2 = = 1-
Trong đó r là hệ số tương quan
Vì vậy, thông thường ta gọi , r2 là hệ số xác định
Trang 26Khoảng 100(r2) % cuả tổng các bình phương của độ lệch giữa các gía trị y trongtập mẫu với trung bình của chúng có thể được giải thích bởi sử dụng x để dự báo ytrong mô hình đường thẳng
5 Chuỗi thời gian
5.1 Khái niệm
Các hiện tượng kinh tế - xã hội luôn luôn biến động qua thời gian Để nghiên cứu
sự biến động này người ta dùng phương pháp dãy số thời gian Dãy số thời gian làdãy các giá trị của chỉ tiêu kinh tế - xã hội biến động theo thời gian
5.3 Ý nghĩa của việc nghiên cứu dãy số thời gian
Phương pháp phân tích một dãy số thời gian dựa trên một giá trị căn bản là: sựbiến động trong tương lai của hiện tượng nói chung sẽ giống với sự biến động củahiện tượng trong quá khứ và hiện tượng xét về mặt đặc điểm và cường độ biếnđộng Nói một cách khác đã ảnh hưởng đến biến động của hiện tượng trong quákhứ và hiện tượng được giả định trong tương lai sẽ tiếp tục tác động đến hiệntượng theo xu hướng và cường độ giống hoặc gần giống như trước
Do vậy, mục tiêu chính của phân tích dãy số thời gian là chia ra và tách biệt cácyếu tố đã ảnh hưởng tới dãy số thời gian Điều đó có nghĩa trong việc dự đoáncũng như nghiên cứu quy luật biến động của hiện tượng Tất nhiên, giả định nóitrên có nhược điểm, nó thường bị phê bình là quá ngây thơ và máy móc vì đãkhông xem xét đến sự thay đổi về kỹ thuật, thói quen, nhu cầu hoặc sự tích lũy
Trang 27kinh nghiệm trong kinh doanh… Vì vậy phương pháp phân tích dãy số thời giancung cấp những thông tin hữu ích các nhà quản lý trong việc dự đoán và xem xétchu kỳ biến động của hiện tượng Đây là công cụ đắc lực cho họ trong việc raquyết định.
5.4 Các yếu tố ảnh hưởng đến dãy số thời gian
kết quả hợp thành của các yếu tố sau đây:
-Tính xu hướng: Quan sát số liệu thực tế của hiện tượng trong một thời gian dài(thường là nhiều năm), ta thấy biến động của hiện tượng theo một chiều hướng(tăng hoặc) giảm rõ rệt Nguyên nhân của ² loại biến động này là sự biến đổi trongcông nghệ sản xuất, gia tăng dân số, biến động về tài sản
-Tính chu kỳ: biến động của hiện tượng được lặp lại với một chu kỳ nhất định,thường kéo dài 2-10 năm, trải qua 4 giai đoạn: phục hồi, phát triển, thịnh vượng,suy thoái và đình trệ Biến động theo chu kỳ là do biến động tổng hợp của nhiềuyếu tố khác nhau Chẳng hạn như trong kỳ kinh doanh thì chu kỳ đời sống sảnphẩm ảnh hưởng rất lớn đến doanh thu của công ty qua 4 giai đoạn đó
-Tính thời vụ: biến động của một số hiện tượng kinh tế - xã hội mang tính thời vụnghĩa là hằng năm, vào thời điểm nhất định (tháng hoặc quý) biến động của hiệntượng lặp đi lặp lại Nguyên nhân của biến động hiện tượng là do các điều kiệnthời tiết khí hậu tập quán xã hội, tín ngưỡng của dân cư
-Tính ngẫu nhiên hay bất thường: là những biến động không có quy luật và hầunhư không thể dự đoán được Loại biến động này thường xảy ra trong một thờigian ngắn và không lặp lại Nguyên nhân là do ảnh hưởng của các biến cố chínhtrị, thiên tai, chiến tranh…
Giá trị X trong dãy số X1, X2, , Xn có thể được diễn tả bằng công thức sau:
=
: Giá trị thứ i trong dãy số thời gian
: Giá trị của yếu tố xu hướng
: Giá trị của yếu tố chu kỳ
: Giá trị của yếu tố thời vụ
: Giá trị của yếu tố ngẫu nhiên(bất thường)
Trang 285.5 Các chỉ tiêu cơ bản dùng để phân tích biến động dãy số thời gian
5.5.1 Mức độ trung bình theo thời gian
Là số trung bình của các mức độ trong dãy số Chỉ tiêu này biểu hiện mức độchung nhất của hiện tượng trong thời kỳ nghiên cứu
Ký hiệu: , ,…, : Dãy số thời gian
: Mức độ trung bìnhMức độ trung bình của dãy số thời kỳ
= =
Mức độ trung bình của dãy số thời điểm
Khoảng cách thời gian giữa các thời điểm bằng nhau
5.5.2 Lượng tăng (giảm) tuyệt đối
Là chỉ tiêu biểu hiện sự thay đổi về giá trị tuyệt đối của hiện tượng giữa 2 thời kỳhoặc thời điểm nghiên cứu
Tùy theo mục đích nghiên cứu, ta có:
- Lượng tăng giảm tuyệt đối từng kỳ (liên hoàn): biểu hiện lượng tăng giảmtuyệt đối giữa 2 thời kỳ kế tiếp nhau
Trang 29Giữa lượng tăng (giảm) tuyệt đối từng kỳ và định gốc có mối liên hệ sau Tổng đại
số các lượng tăng (giảm) tuyệt đối từng kỳ bằng lượng tăng (giảm) tuyệt đối địnhgốc, nghĩa là:
=
Lượng tăng giảm tuyệt đối trung bình: Chỉ tiêu này biểu hiện một cách chung nhấtlượng tăng (giảm) tuyệt đối, tính trung bình cho cả thời kỳ nghiên cứu
= Chỉ tiêu này có ý nghĩa khi các lượng tăng (giảm) tuyệt đối từng kỳ xấp xỉ nhau.5.5.3 Tốc độ phát triển (lần, %)
Là chỉ tiêu biểu hiện sự biến động của hiện tượng xét về mặt tỷ lệ
Tùy theo mục đích nghiên cứu, ta có các loại tốc độ phát triển sau:
- Tốc độ phát triển từng kỳ (liên hoàn): Biểu hiện sự biến động về mặt tỷ lệcủa hiện tượng giữa 2 kỳ liền nhau
Thực chất tốc độ tăng (giảm) bằng tốc độ tăng trừ đi 1(hoặc trừ 100 nếu tính bằng
%) Nó phản ánh mức độ của hiện tượng nghiên cứu giữa hai thời kỳ tăng lên haygiảm đi bao nhiêu lần (hoặc %), nói lên nhịp điệu của sự tăng theo thời gian
Trang 30- Tốc độ tăng(giảm) từng kỳ (hay liên hoàn)
5.5.5 Giá trị tuyệt đối của 1% tăng (giảm)
Là chỉ tiêu này biểu hiện mối quan hệ giữa chỉ tiêu lượng tăng (giảm) tuyệt đốitrong công thức với chỉ tiêu tốc độ tăng(giảm), nghĩa là tính xem 1% tăng(giảm)của chúng tương ứng với một lượng giá trị tuyệt đối tăng giảm là bao nhiêu
Có nhiều phương thức dự đoán khác nhau Tuy vậy nội dung cơ bản của dự đoánthống kê là dựa trên các giá trị đã biết () Dự đoán dựa vào dãy số thời gian đểphân tích các yếu tố ảnh hưởng đến sự biến động của hiện tượng
5.5.6 Dự đoán bằng hàm suy đoán
Trang 31Tùy theo hiện tượng nghiên cứu hoặc kết hợp với kinh nghiệm ta có thể xây dựnghoặc chọn một số hàm phù hợp biểu hiện sự biến động của hiện tượng qua thờigian.
Trang 32Lấy log hai vế hàm mũ ta được: = + b1t
Áp dụng hàm xu hướng dưới dạng đường thẳng ta được:
Trang 33b1 =
Hàm xu hướng dạng hàm lũy thừa
Giả sử đường dữ liệu được biểu diễn dưới dạng:
5.5.6.2 Dự đoán dựa vào tốc độ phát triển trung bình
Phương pháp này thường được sử dụng khi hiện tượng bất động với một nhịp độtương đối ổn định, nghĩa là tốc độ phát triển từng kì xấp xỉa nhau
Công thức dự đoán:
n+L= yn
n+L: Giá trị dự đoán ở thời điểm n+L
yn.:Giá trị thực tế tại thời điểm n
: Tốc độ phát triển trung bình ;=n-1
L: Tầm xa dự đoán
Trang 34CHƯƠNG 2: THU THẬP DỮ LIỆU ĐỂ PHÂN TÍCH DỮ LIỆU
1 Dữ liệu thu thập
Thu thập dữ liệu để phân tích và đánh giá diện tích và sản lượng lúa cả năm và diện tích lúa, ngô, khoai lang phân theo địa phương từ năm 2010-2019 và dự báocác năm tiếp theo
Tập dữ liệu thu thập được lấy từ Tồng cục thống kê
Tổng diện tích , diện tích lúa,diện tích ngô, diện tích mía (nghìn ha) qua các năm 2010-2019
Năm
Diện tíchTổng
diệntích(nghìnha)
Diệntíchlúa(nghìnha)
Diệntíchngô(nghìnha)
Diệntíchmía(nghì
n ha)
2010
8920
5
7470
Trang 35Tổng sản lượng , sản lượng lúa, sản lượng ngô, sản lượng mía (nghìn tấn) qua các năm 2010-2019
Năm
Sản lượngTồng
sảnlượng(nghìntấn)
Tồngsảnlượnglúa(nghìntấn)
Tồngsảnlượngngô(nghì
n tấn)
Tồngsảnlượngmía(nghìntấn)
2010
Trung du vàmiền núi phía Bắc
Bắc Trung
Bộ và Duyênhải miền Trung
Đồng bằng sông CửuLong
Trang 36Trung du vàmiền núi phía Bắc
Bắc Trung
Bộ và Duyênhải miền Trung
Đồng bằng sông CửuLong
Trung du vàmiền núi phía Bắc
Bắc Trung
Bộ và Duyênhải miền Trung
Đồng bằng sông CửuLong
Trang 372017 121.8 17.4 31.4 30.2 23.6
2 Chọn phương pháp phân tích dữ liệu
- Lựa chọn phương pháp phân tích bài toán
+ Phương pháp phân tích đặc trưng
+ Phân tích hồi quy tuyến tính đơn, đa biến
a) Phương pháp phân tích đặc trưng
Chúng ta tiến hành phân tích từng thành phần số liệu riêng của từng sản
lượng của từng yếu tố và rút ra các bảng kết quả sau:
Phân tích đặc trưng của bảng Tổng diện tích , diện tích lúa,diện tích ngô, diện tích mía (nghìn ha) qua các năm 2010-2019
Năm
Diện tíchTổng
diệntích(nghìnha)
Diệntíchlúa(nghìnha)
Diệntíchngô(nghìnha)
Diệntíchmía(nghì
n ha)
2010
Trang 388920
5
7470
o Diện tích lúa (nghìn ha)
Số liệu sau khi sắp xếp:
Trang 39• Range = Xmax - Xmin = 432.4
Q1 = = = 7570.9
Q3 = = = 7816.2
o Diện tích ngô (nghìn ha)
Số liệu sau khi sắp xếp:
Trang 40• Range = Xmax - Xmin = 188.2
Q1 = = = 1099.5
Q3 = = = 1170.4
o Diện tích mía (nghìn ha)
Số liệu sau khi sắp xếp tăng dần: