Việt nam là một nước có trên 72% dân số làm nông nghiệp, vì vậy ứng dụng tin học và công nghệ thông tin có một vai trò to lớn trong công cuộc công nghiệp hoá - hiện đại hoá nông nghiệp v
Trang 1PGS TS NGUYEN HAI THANH
Trang 2PGS.TS NGUYEN HAI THANH
(CHU BIEN)
TIN HOC UNG DUNG
TRONG NGANH NONG NGHIEP
NHA XUAT BAN KHOA HOC VA KY THUAT
HA NOI 2005
Trang 3THS PHAM VAN HUNG
THS MAN QUANG HUY THS DO THI MO
TS NGUYEN HONG NGUYEN
THS TRAN QUOC VINH
CFPARA
RYDE
Trang 4LOI NOI DAU
Vấn đê đào tạo, nghiên cứu và ứng dụng tin học có một tâm quan trọng đặc biệt cho việc phát triển nhân lực, khoa học — kĩ thuật và kinh tế —
xã hội Việt nam là một nước có trên 72% dân số làm nông nghiệp, vì vậy ứng dụng tin học và công nghệ thông tin có một vai trò to lớn trong công cuộc công nghiệp hoá - hiện đại hoá nông nghiệp và nông thôn Các lĩnh vực
iu tién phát triển trong giai đoạn hiện nay bao gâm nông nghiệp, công nghệ sinh hoc, tự động hoá và tin học - công nghệ thông tin Tất cả các lĩnh vực này liên quan với nhan rất chặt chế trong sự phát triển của đất nước ta và đặc biệt là trong sự nghiệp xây dựng một nên nông nghiệp phát triển bên vững, một nông thôn Việt nam giàu có và tươi đẹp Chỉ thị 58-CTITW của
Ban chấp hành Trung ương về đẩy mạnh và phát triển công nghệ thông tin
phục vụ sự nghiệp công nghiệp hoá, hiện đại hoá đất nước khẳng định: "Cân
khẩn trương xây dựng các chương trình ứng dụng và phát triển công nghệ
thông tin, kết hợp công nghệ thông tin với công nghệ sinh học để phục vụ công nghiệp hoá, hiện đại hoá nông nghiệp và nông thôn, đặc biệt góp phần
xoá đói giảm nghèo và thúc đẩy phát triển vùng sâu, vàng xa”, tiếp tục “đẩy
mạnh việc đào tạo và sử dụng nguồn nhân lực cho ứng dung và phát triển
Với vai trò một trường đại học được thành lập sớm nhất trong các trường đại học khối nông - lâm - ngư nghiệp, với sự nhận thức những tiêm năng to lớn mà tin học và công nghệ thông tin có thể mang lại, Trường Đại học Nông nghiệp I Hà Nội đang phẩn đấu dat chất lượng đào tạo tin hoc dai cương và tín học chuyên ngành ngày càng cao hơn, tăng cường ứng dung tin học và công nghệ thông tin trong giảng dạy, triển khai các để tài nghiên cứu khoa học ứng dụng toán — tin và công nghệ thông tin trong lĩnh vực nông nghiệp Khi điểm lại một số nét về ứng dụng tin học trong đào tạo và nghiên cứu khoa học nông nghiệp tại Trường Đại học Nông nghiệp Ì Hà Nội, có thể ghỉ nhận một sự kiện đặc biệt: đây chính là nơi tiếp nhận chiếc máy tính thứ
ba trên miễn Bắc (do Cuba trao tặng năm 1981), là một trong các địa điểm được trang bị trung tâm máy tính hiện đại sớm nhất trên miên Bắc (tháng 8
năm 1982)
Trong giai đoạn hiện nay, cùng với các trường đại học và cao đẳng,
Trang 5các viện nghiên cứu khoa học trong lĩnh vực nông — lảm — ngư nghiệp, Trường Đại học Nông nghiệp I Hà Nội đang triển khai nhiều ứng dụng của
tin học trong đào tạo và nghiên cứu khoa học nh:
- Ứng dụng các phần mêm thống kê sẵn có, từ những phân môm thông
dụng nhữr Excel đến chương trình tính toán thống kê lớn và ứng dụng chuyên
sâu, vào thống kê sinh học - noéng nghiép nhit SPSS, Minitab, Genstat, Irristat, Statgraf
- Sit dung cdc phan mém Frontier, Limdep, Lingo phuc vu phan tich
các số liệu kinh tế nông nghiệp và khuyến nông và nhiều phần mềm chuyên
dụng khác cho các lĩnh vực chọn tạo giống, sinh thái môi trường,
- Thiết lập mô hình, xây dựng quy trình tính toán, thiết kế và cài đặt hệ chương trình máy tính cho các mô hình tối im trợ giúp quyết định, các mô hình điên khiển nhằm giải quyết các vấn đề phải sinh trong quy hoạch sử đụng đất, quy hoạch vùng kinh tế nông nghiệp và kinh tế nông hộ, tự động hoá và thiết kế máy nông nghiệp
- Ung dung céng nghé GIS (Geographical Information System), mét
công nghệ kết hợp giữa công nghệ thông tin và công nghệ viễn thám, trong
xây dựng hệ cơ sở dữ liệu và quản lý tài nguyên nông nghiệp
- Bước đầu nghiên cứu ấp dụng công nghệ tin sink hoc trong chon tao
giống, di truyền học vào lĩnh vực trồng trọt, chăn nuôi
- Khai thác mạng thông tín nội bộ, thư viện điện tử và Internet nhằm xây dựng và quản lý hệ thống cơ sở dữ liệu về thông tin khoa học nông nghiệp phục vụ đào tạo và nghiên cứu, triển khai các để tài nghiên cứu và ting dung tin học trong đổi mới phương pháp dạy và học
- Đẩy mạnh chất lượng đào tạo sinh viên ngành Tin hoc thông qua việc từng bước xây dựng hệ giáo trình chuẩn chuyên ngành định hướng vào cdc dé tai ứng dụng tin học trong nông nghiệp, xây dựng các giáo trình tin
học chuyên ngành cho các chuyên ngành nông nghiệp ở tất cả các bậc học
Cuốn sách này được viết ra với những mục đích cụ thể Cuốn sách bao gồm một số công trình và dé tai nghiên cứa khoa học ở nhiều mức độ khác nhau được tiến hành trong thời gian gần đây trong việc giảng dạy và ứng dụng tin học trong lĩnh vực nông nghiệp Tuy chưa thể nào bao quát hết các vấn đề ứng dụng tin học trong nông nghiệp, nhưng đây có thể là một số hướng nghiên cứu cân được tiếp tục được đẩy mạnh trong thời gian tới trong
4
Trang 6các trường dại học, cao đẳng, các viện nghiên cứu khoa học và ứng dụng trong các lĩnh vực nông nghiệp
Cuốn sách này trước hết hướng tới đối tượng là cán bộ giảng dạy, sinh
viên các trường đại học và cao đẳng nông nghiệp ở những năm cuối, học
viên cao học và tiến sỹ, những người có thể tìm thấy ở đây các phương pháp,
công cụ cho việc thực hiện các để têi nghiên cứu khoa học hay các đề tài
luận văn tốt nghiệp của mình Một số chương trong cuốn sách có thể dưa
vào giảng dạy trong các môn về tin học ứng dụng cho các chuyên ngành nông nghiệp khác nhau Sinh viên ngành Tìm học của các trường đại học và
cao đẳng nông nghiệp trong cả nước cũng có thể tìm được trong cuốn sách những kiến thức cơ bản, những gợi ý quan trọng, một mặt có tính chất định
hướng, mặt khác lai rất cụ thể cho công việc học tập và thực tập nghiên cứu khoa học của mình Tuy nhiên, đối tượng bạn đọc này hoàn toàn có thể nhận
e cẩn phải hết sức cố gắng mới có thể trả lời được câu hỏi "tại
sao” (đấy chính là một trong những muịc tiên ngành học của các bạn) cũng
như phải hết sức kiên trì để biết cách “làm thế nào”,
Tập thể tác giả cuốn sách này được phân công biên soạn nh sai:
- Chương L Xử lý số liệu trong thống kê xinh học và nông nghiệp, gồm
ba phần Phân | va I do TRS D6 Thi Mo va PGS TS Nguyén Hai Thanh biên soạn TS Nguyễn Quốc Chỉnh và Thể, Phạm Văn Hing viéi phan Ill
- Chương II Một số mô hình và phần mm tối tt ứng dụng trong nông
nghiệp, do PGS.TS Nguyễn Hải Thanh biên soạn
- Chương HI Hệ thống thông tin địa lý trong quản lệ và đánh giá tài nguyên đất nông nghiệp, được viết bởi ThS Mẫn Quang Huy
- Chương IV Viễn thám trong nông nghiệp, do Thể Trần Quốc Vừnh
và Thể Lê Thị Giang cùng chung viết
- Chương V Ứng dụng tin học trong tự động hoá một quá trÌnh nông nghiệp, do Ths Ngô Trí Dương đảm nhiệm
- Chương VI Tin sinh học cải thiện đi truyền nông nghiệp, do TS Nguyễn Hồng Nguyên viết
- Chuong VI Internet va các dịch vụ thông tin nông nghiệp,
do KS Đặng Xuân Hà biên soạn
Khi nhận phân công biên soạn, các tác giả đã rất nỗ lực để hoàn
Trang 7thành nhiệm vụ của mình và đạt được mục dích chung của cuốn sách, cố gắng viết một cách dễ hiểu, ngắn gọn những vấn đề mình đã từng làm trong
công tác nghiên cứu khoa học và dạy học của mình Với quan niệm “công việc đào tạo và nghiên cứu khoa học là công việc của cả một đội ngũ ” và với mong muốn “phát triển các ứng dụng của tin học Irong nông nghiệp”,
tập thể tác giả luôn coi trọng việc trao đối ý kiến với người đọc trực tiếp hoặc qua e-mail và chia sẻ những tài liệu chuyên ngành Những vấn đề đặt
ra trong cuốn sách mới chỉ là phân nổi lên của một tảng băng và chắc ai cũng muốn nhìn rõ nó hơn
Tuy nhiên, lần đâu tiên các vấn dé ứng dụng tin học trong nông nghiệp được viết một cách tổng hợp, chắc cuốn sách còn có khiếm khuyết Chúng tôi rất mong nhận được sự đóng góp ý kiển của bạn đọc, của các đồng nghiệp, các nhà nghiên cứu, các thày cô giáo và các sinh viên để nâng cao hơn nữa chất lượng của cuốn sách này
Tập thể tác giả xin trân trọng cám ơn Nhà xuất bản Khoa học và Kỹ thuật đã cho xuất bản đề tài này Đặc biệt, chúng tôi xin chân thành cám ơn ông Nguyễn Kim Long, biên tập viên, về sự cộng tác quỷ báu trong việc biên tập cuốn sách
Trang 8MUC LUC
LOI NOI DAU
MUC LUC
CHUONG L XU LY SO LIEU TRONG THONG KE
SINH HỌC VÀ NÔNG NGHIỆP
I XỬLÝ SỐ LIỆU THỐNG KÊ SINH HỌC TRONG EXCEL
3.2 Tìm phương trình hồi quy
4 Phân tích phương sai
4.1 Phân tích phương sai mội nhân tố
4.2 Phân tích phương sai hai nhân tố không tương tác
4.3 Phân tích phương sai hai nhân tố tương tác
5 So sánh hai mẫu
5.1 So sánh hai mẫn độc lập khi biết phương sai } và
kì
5.2 So sánh hai mẫu kiểu cặp đôi
5.3 So sánh hai mẫu độc lập với giả thuyết hai phương
sai bằng nhau
5.4 So sánh hai mẫu độc lập với giả thuyết hai phương
sai khác nhau
II THIẾT KẾ THÍ NGHIỆM VÀ PHÂN TÍCH THỐNG KÊ
NHIÊU CHIỀU TRONG MINITAB
1 Giới thiệu phần mẻm Minitab
1.1 Các cửa sổ của Miutab
1.2 Các điểm đặc trưng của Minitab
Trang 92.1 Mô hình hoàn toàn ngẫu nhiên
2.2 Mô hình khối hoàn toàn ngẫu nhiên
IM UNG DUNG PHAN MEM FRONTIER 4.LVÀ LIMDEP
TRONG PHÂN TÍCH DỮLIỆU KINH TẾ NÔNG NGHIỆP
1 Hàm cực biên và ứng dụng trong phân tích kinh tế
1.1 Sơ lược về hàm cực biên
1.2 Phân tích hiệu quả kinh tế và đường c cực biên
1.3 Các loại hàm cực biên
2 Các mô bình hàm sản xuất cực biên
2.1 Mô hình hàm cực biên xác định
2.2 Mô hình hàm cực biên ngẫu nhiên
2.3 Mô hình hàm cực biên dựa trên số liệu Kết hợp
TỔI ƯU ỨNG DỤNG TRONG NÔNG NGHIỆP
1 MO HINH QUY HOẠCH ĐƠN MỤC TIÊU
1 Mô hình tối ưu một mực tiêu (tuyến tính và phi tuyến)
2 Các ví dụ minh hoạ bài toán tối ưu một mục tiêu
2.1, Bài toán quy hoạch sử dụng đất
2.2 Bài toán tối wi hod giá trị sản xuất
2.3 Bài toán tối wu thông số sàng phân loại
II MÔ HÌNH QUY HOẠCH ĐA MỤC TIÊU TUYẾN TÍNH
Trang 102 Các khái niệm cơ bản của bài toán tối ưu đa mục tiêu 123
3 Mô hình quy hoạch đa mục tiêu trong môi trường 124 mờ/ngẫu nhiên
4 Các ví dụ minh hoạ bài toán quy hoạch đa mục tiêu 126
4.1 Bài toán xác định cơ cấu cây trồng 126
4.2 Bài toán đánh giá hiệu quả sử dụng đất và lao 137
4.4 Tối tụ hoá kết quả và hiệu quả kinh tế chẩn miôi ~*~ 141
cá
II HƯỚNG DẪN SỬ DỰNG MỘT SỐ PHẦN MỀM TỐI ƯU 145
1 Giải bài toán quy hoạch tuyến tính đơn mục tiêu trong 145 Excel
2 Giải bài toán quy hoạch tuyến tính va phi tuyến đơn mục 149
31, Giới thiệu phương pháp giải quyết bài toắn quy 169
5.3 Xây dung j phần mềm PRELIME_ Viên 183
IV ĐỀ XUẤT MỘT SỐ HƯỚNG NGHIÊN CÚU °' ' 190
Trang 111 Áp dụng các mô hình tối ưu trong nông nghiệp
2 Nghiên cứu áp đụng và đề xuất các phương pháp tối ưu
3 Xây dựng các phần mềm tối ưu
4 Xây dựng hệ hỗ trợ ra quyết định cài đặt trên mạng máy
TÀI LIỆU THAM KHẢO CHƯƠNG II
CHƯƠNG II HỆ THONG THONG TIN DIA LY VA UNG
DUNG TRONG DANH GIA TAI NGUYEN DAT
NONG NGHIEP
1 HỆ THỐNG THONG TIN DIA LY
1 Khái niệm về hệ thống thông tin địa lý
2 Hệ thống thông tin địa lý và các hệ thống tương tự
2.1 Hệ vẽ bản độ tự động AMS
2.2 Hệ quản trị cơ sở dữ liệu
3 Sự phát triển của hệ thống thông tin địa lý
3.1 Ảnh hướng của các công nghệ đến sự phái triển
1 Vai trò của cơ sở dữ liệu trong hệ thống thông tin dia ly
2 Đặc trưng của cơ sở đữ liệu không gian và cấu trúc dữ
liệu trong GIS
2.1 Đặc trưng của dữ liệu không gian
2.2 Cấu trúc dữ liệu trong GIS
2.3 Mô hình chông ghép bản đồ trong GIS `
2.4 Cấu trúc dữ liệu và đặc tính của bản đồ trong GIS
3 Mô hình cơ sở dữ liệu của hệ thống thông tin tài nguyên
đất
3.1 Thông tin đâu vào
3.2 Xử lý dữ liệu
3.3 Thông tin đâu ra
3.4 Kỹ thuật GIS trong phân tích và xử lý dữ liệu
4 Nghiên cứu ứng dụng GIS trong đánh giá tài nguyên đất
Trang 124.1 Trên thế giới và trong khu vực
4.2 Nghiên cứu ứng dụng GIS trong đánh giá tài
nguyên đất ở Việt Nam
4.3 Ứng dụng GIS va kha nding tiép can
II GIGI THIEU MOT SỐ PHẦN MEM GIS
1 MicroStation GeoGraphics
2 Phan mém ArcInfo/MapInf
3 Phần mềm Arcview
IV XÂY DỤNG QUY ` TRÌNH CÔNG NGHỆ UNG DUNG GIS
QUAN LY DULIEU TÀI NGUYÊN ĐẤT
1 Xây dựng hệ thông tin quản lý tài nguyên đất
2 Mô hình áp dụng xây dựng bản đồ đơn vị đất đai huyện
Yén Chau
3 Xay dựng cơ sở dữ liệu thông tin bảng đồ chuyên đề
3.1, Cơ sở dữ liệu thông tin bản dé đất
3.2 Cơ sở dữ liệu thông tin bản đồ độ dốc
3.3 Cơ sở dữ liệu thông tin bản đô độ dày tầng đất
3.4 Cơ sở dữ liệu thông tin bản đồ thành phần cơ giới
3.5 Cơ sở dữ liệu thông tin bản đồ chế độ tưới
4 Mô hình chồng xếp cơ sở dữ liệu bản đồ don tinh trên
1 TỔNG QUAN TÀI LIỆU VÀ PHƯƠNG PHÁP NGHIÊN NCứU
1 Định nghĩa và phân loại viễn thám ;
Trang 133 Các vệ tỉnh viễn thám thông dụng trong nông nghiệp ở Việt
4.3 Đặc điểm phản xạ phổ của các đối tượng tự nhiên
5 Giải đoán ảnh viễn thám
5.1 Hiệu chỉnh ảnh
5.2 Tăng cường chất lượng ảnh và chiết tách đặc tính
5.3, Giải đoán ảnh viễn thắm
5.4 Đánh giá độ chính xác bản đồ sau giải đoán
II MỘT SỐ MÔ HÌNH VIỄN THÁM ỨNG DỰNG
1 Viễn thám trong nghiên cứu sử dụng đất và lớp phủ bể
mặt
2 Viễn thám trong điều tra và thành lập bản đồ đất
3 Nghiên cứu viễn thầm trong khí tượng thuỷ văn
4 Viễn thám trong quản lý cây trồng
5 Viễn thám trong nghiên cứu môi trường
6 Viễn thám trong nghiên cứu cảnh quàn
Ul GNG DUNG CONG NGHE VIEN THAM TRONG VIEC
TIM HIỂU SUTHAY ĐỔI SUDUNG DAT
1 Dùng phương pháp giải đoán ảnh số tìm hiểu sự thay đổi
sử dụng đất
1.1, Phương pháp nghiên cứu
1,2 Kết quả nghiên cứu
2 Ding phuong pháp giải đoán ảnh bằng mắt thường để tìm
hiểu sự thay đổi sử dụng đất
Trang 14CHUONG V, UNG DUNG TIN HỌC TRONG TỰ ĐỘNG
HOÁ MỘT QUÁ TRÌNH SẢN XUẤT NÔNG NGHIỆP
I VAI TRO CUA TUDONG HOA TRONG SAN XUAT NONG
NGHIEP
1 Mối quan hệ giữa tin học và tự động hoá
2 Vai trò của tự động hoá trong sản xuất và đời sống
3 Ứng dụng tự động hoá trong một số lĩnh vực sản xuất
II XÂY DỰNG CẤU TRÚC HỆ THỐNG TUOI TUDONG
1 Chế độ tưới nước cho cây rau sạch
1,1 Đất, nước và cây trông
1.2 Điều kiện để sản xuất cây rau sạch
1.3 Xác định nhụ cầu nước tưới
1.4 Xác định thời gian tưới nước
2 Phương pháp và kỹ thuật tưới nước cho cây rau sạch
2.1 Khdi niém chung
2.2 Kỹ thuật tuoi phun mua
II XÂY DỰNG THUẬT TOÁN TƯỚI TỰ ĐỘNG MÔ HÌNH
IV THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN TƯỚI TỰĐỘNG
QUA TRINH SAN XUAT RAU SACH
1 Lựa chọn thiết bị cho hệ thống tưới tự động
1.1 Chọn các loại thiết bị đo
1.2 Chọn thiết bị cho hệ thống tưới phun mưa
1.3 Chọn thiết bị điển khiển
1.4 Sơ đồ tổng thể của hệ thống tưới phun mưa
2 Cấu trúc chương trình điều khiển hệ thống tưới tự động
2.1 Cấu trúc bộ nhớ của CPU,
Trang 153 Lập trình có cấu trúc chương trình điều khiển hệ thống
tưới tự động
3.1 Sơ đồ cấu trúc
3.2 Viết chương trình điệu khiển chế độ tưới tự động
TÀI LIỆU THAM KHẢO CHƯƠNG V
CHƯƠNG VI TIN SINH HỌC CẢI THIỆN
DI TRUYỂN NÔNG NGHIỆP
1 VAI TRÒ CỦA TIN SINH HỌC TRONG NGHIÊN CỨU
GENE VÀ CẤU TRÚC PROTEIN
1 Giới thiệu về công nghệ tin sinh học và sinh học phân tử
1.1 Một số vấn đê của công nghệ tin sinh học
1⁄2 Sơ lược về sinh học phân tử
2 Sự sắp xếp so sánh gene
2.1 Sắp xếp trình tị từng CẶP gene
2.2 Sắp xếp so sánh các hệ gene
2.3 Sắp xếp trình tự Äa gene
3 Nối kết và phân tích gene
3.1 Nối kết đoạn DNA
3.2 Thiết kế DNA môi
3.3 Sự đa dạng nhcÌleotide đơn
3.4 Phát hiện sự lặp lại trình tự đơn
3.5 Phân tích biểu hiện gene
II KHAI THÁC CƠ SỞ DỮLIỆU GENE VA UNG DỰNG
TRONG NÔNG NGHIỆP
1 Một số nguyên tắc xây dựng và khai thác cơ sở dữ liệu
1.1 Nguyên tắc xây dung
1.2 Khai thác dữ liệu từ các nguồn khác nhau
2 Một số hệ thống dữ liệu genc ứng dụng trong nông
nghiệp
2.1 Hệ thống dữ liệu gene các cây trông chính
2.2: Các hệ thống cơ sở dữ liệu hệ gene động vật
TL TIN SINH HỌC TRONG DI TRUYỀN NÔNG NGHIỆP
1 Xây dựng bản đồ di truyền liên kết
Trang 161.1 Gene đánh đấu di truyền
1.2 Phả hệ
1.3 Khoảng cách di truyén
1.4 Phát hiện liên kết
1.5 Phân tích marker
2 Các phương pháp tin sinh học tìm kiếm gene
2.1 Phương pháp so sánh giải mã gene
2.2 Phân tích mất cân bằng liên kết
2.3 Mô hình thành phần phương sai
2.4 Kết hợp phân tích liên kết và mất cân bằng liên kết
(LDLA)
2.5 Thiết kế thí nghiệm LDLA
3 Xây dựng các hệ thống đánh giá di truyền
3.1 Giới thiệu
3.2 Tóm lược di truyền số lượng
3.3 Ước tính các thông số di truyền
3.4 Ước tính giá trị giống (giá trị di truyền)
IV KẾT LUẬN VÀ HƯỚNG NGHIÊN CÚU
TÀI LIỆU THAM KHẢO CHƯƠNG VI CHƯƠNG VII INTERNET VÀ CÁC DỊCH VỤ
THÔNG TIN NÔNG NGHIỆP
I INTERNET VA CÁC DỊCH VỤ INTERNET
1 Internet
2 World Wide Web và thư điện tử
2.1 World Wide Web
2.2 Thư diện tử
3 Dịch vụ thông tin trên Internet
IL THONG TIN, DẠNG THUC VA NGUON THONG TIN
1 Thông tin và trị thức
2 Sự bùng nổ thông tin
3 Các dạng thức và nguồn thông tin
4 Báo chí định kỳ
5 Các nguồn tham khảo
6 Cách thức tổ chức tư liệu trong thư viện
Trang 17Ill KHAI THAC DICH VU CUNG CAP THONG TIN
1 Cơ sở đữ liệu tham khảo
2 Danh mục tra cứu thư viện trực tuyến
3 Chỉ mục báo chí tóm tắt
4 Các kỹ năng tìm kiếm nâng cao
5 Mô-tơ tìm kiếm và đánh bạ Web
5.1 Mô-tơ tìm kiếm
5.2 Danh bạ Web
6 Đánh giá nguồn tài liệu trên Internet
6.1 Đánh giá bên ngoài
6.2 Đánh giá bên trong
IV MỘT SỐ DỊCH VỤ THONG TIN NONG NGHIEP
1 Co sé dit ligu AGRICOLA
2 Một số dịch vụ thông tin của tổ chức FAO
3 Các cơ sở dữ liện khác
v XAY DUNG DICH VU THONG TIN NONG NGHIỆP
1 Ngôn ngữ HTML
2 Cơ sở dữ liệu
3 Sơ lược vẻ thiết kế và lập trình Web
4 Triển khai dịch vụ thông tin nông nghiệp
TÀI LIỆU THAM KHẢO CHƯƠNG VI
Trang 18CHUONG I
XU LY SO LIU TRONG THONG KE SINH HỌC
VA NONG NGHIEP
1 XỨ LÝ SỐ LIỆU THỐNG KÊ SINH HỌC TRONG EXCEL
Phần mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu sinh học và nông nghiệp nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools> Data Analysis (nếu không có mục này thì chọn Tools> Add-in
> Analysis ToolPak để cài đặt thêm) Sau đây là một số công cụ xử lý số liệu thống kê mà Excel cung cấp
1 Thống kê mô tả
Thống kê mô tả cho phép tính các số đặc trưng mẫu/ các giá trị thống
kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode Số liệu tính toán được bố trí theo cột hoặc theo dòng
a Các bước thực hiện trong Excel
Chọn Tools>Data Analysis>Descriptive Statistics, và khai báo các
mục sau trong hộp thoại:
~ Input range: miễn dữ liệu kể cả nhãn
- Grouped by: Column (số liệu theo cột)
- Labels in Rrst row : Đánh dấu Ý vao 6 nay nếu có nhãn ở dòng đầu
- Confidence level for mean: 95% (độ tin cậy 95%)
- K-th largest: 1 (1 Số lớn nhất, 2 số lớn nhì )
- K-th smallest: 1 (1 Số nhỏ nhất, 2 số nhỏ nhì )
- Output range: mién ra
- Summary Statistics: Danh dấu 3 nếu muốn hiện các thống kê cơ bản
17
Trang 19Ví dụ 1 Khảo sát về các đặc tính của lúa ta thu được bốn cột số liệu: đài bông (cm), P1000 (trọng lượng 1000 hạt), số bông, năng suất Số liệu được bố trí như trong hình I.1
Chọn Tools>ÖDaia Analysis>Descriptive Statistics, sau đó khai báo
hộp thoại (xem hinh 1.1)
138) 5 166] 33
16s 4
ló4 43)
Wed} 37 Iss 4
166 42
6| 39| Ít senaygasea wal a2
165 4s 158) 36 159) 33
1g 4
Hinh 1.1 Bang số liệu khảo sát về lúa và khai báo hộp thoại
Kết quả thu được cho trong hình I.2
9 Dai beng P1000 —_ %bòng,— Nâng sất
1
[21 Mean ( tung bình) 164 Mem 244Mem l616Mmn 41
29 |Sandrd Enor (gi số chuẩn) 0.25 Sandan 0.49 Sandard 2.571 Standard 0.094
123 Median (tring vi) 26 Median 25 Medan 165 Medan 4
24 Mode (aoe) 26 Mode 25Mode lGMak 4
125 Standard Devation (d6 éch chuain) 089 Sandạp 1.88 Strdard 9.956 Standand 0.364
26 Sampk Variasee (thương sỉ mẫu) 081 §mpk 354§ampkEV 911 §ampk ` 0133
21 Kumosi (độ aes 0.81 Kuntosh -1 Kumosis 0569 Kurtosis 1.507
006 Skewne -0.3 Skewnes: 1.346 Skewnes 1,042 3Range 6 Range 3lRang — 14
3; IMrimum ( gi trị nhỏ nhất) 35Miim: ?iMimimu !3?Mimmu 36
31 Maximum (gif wi on nba) 28 Maxim =27Maximun 188 Maximu 5
32 ‘Sum (ng) 396 Sum 366 Sum 2514Sun 615
33 Count (66 quan sit) Coun — 15 Count 15 Count 1§
| 34: Largese(1) (gá trị lớn nhấ) 28 Lagen 27 Layges(t 188 Langen( §
3ð Smalks(1) ( gi trị nhỏ nhất) 25 Smales ?lãmales{ ]ð?§malbi 36
36 Confidence Level(95.0%) (nin khodng tin chy) 0.55 Confide }04Confiden 5513 Confider 0202
21
Hinh 1.2, Két quả thống kê mô tả về các đặc tính của lúa
18
Trang 20b Phân tích các kết quả thụ được
Một số nhận xét sơ bộ trên các thống kê thu được như sau:
- Mean cho ta giá trị trung bình của dãy số
- Median cho giá trị điểm giữa của dãy số
Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân đối Trong ví dụ ! các cột số liệu là cân đối trừ cột “số bông” hơi bị lệch
- Phương sai mẫu hay độ lệch chuẩn mẫu cho ta biết độ phân tán của
số liệu quanh giá trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng tập trung
- Kurtosis đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn Nếu trong khoảng từ -2 đến 2 thì có thể
coi số liệu xấp xỉ chuẩn
- Skewness đánh giá đường phân phối lệch trái hay lệch phải Nếu trong khoảng từ -2 đến 2 thì có thể coi số liệu cân đối gần như số liệu trong
phân phối chuẩn
- Confidence level được hiểu là nửa độ dài khoảng tin cậy Giả sử Confidence level là m thì khoảng tin cậy của trung bình tổng thể là: (mean-
m, mean+m) Trong ví dụ 1, hình I.2, ta có khoảng tin cậy 95% của “dài
bông” la: (26.4- 0.55 , 26.4 +0.55), tức là (25.85 , 26.95)
2 Tổ chức đỏ
“Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác hoạ biểu đồ tần số, còn gọi là tổ chức đỏ Để vẽ tổ chức đồ cần phải tiến hành phân tổ / nhóm số liệu
3.1 Tạo miễn phân tổ
Để tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau:
- Dùng các hàm Min, Max để xác định giá trị nhỏ nhất và giá trị lớn nhất
- Định ra giá trị cận dưới và giá trị cận trên của miền phân tổ
- Ghi giá trị cận dưới vào ô đầu của miễn phân tổ và bôi đen toàn miễn này
19
Trang 21-Chon Edit > Fill > Series để khai báo các mục:
+ Trong muc Series in chon Columns (dit liéu theo cột)
+ Trong muc Type chon Linear (dit ligu tang theo cap s6 cOng) + Trong Step value: nhap gid trị bước tăng
+ Trong Stop value: nhap giá trị cận trên
Chọn Tools> Data Analysis> Histogram để khai báo các mục:
- Input range: mién dit liéu
- Input Bin: mién phân tổ
- Labels : nhan 6 dong đầu nếu có
- Output range: mién két qua
- Pareto: tân số sắp xếp giảm dần
- Cumutlative percentage: lan suat cong dén %
20
Trang 22- Chart output: biéu đồ
- OK
Trong vi du 2 chon Tools> Data Analysis> Histogram va khai báo
nhu trong hinh [.4
Histogram
Ki
| Input Range: Baga SCHIZ =] Lio]
Bin Range: $D$3:‡D$12 =] carcel_|
Output Range: ‡E$2 Xi
T New Workeheet Ply: j ;
Trang 23c Phan tich két qua
- Tan sé sé liéu rơi vào từng khoảng được ghi ở cận trên của khoảng (Chẳng hạn, có 2 số liệu thuộc vào khoảng (10,15], vì vậy số 2 được ghi tương ứng với số 15 là cận trên)
- Nhìn vào hình L5 ta có thể thấy trong khoảng nào số liệu xuất hiện nhiều nhất Ngoài ra, hình dạng của tổ chức đổ còn cho biết: dãy số liệu khảo sát được về chiều dài của cá có thể coi là tuân theo luật chuẩn
3 Tính hệ số tương quan và tìm phương trình hồi qui
3.1 Tính hệ số tương quan
Excel cho phép tính hệ số tương quan đơn giữa các biến sắp xếp thành một bảng gồm n hàng, n cột (mỗi cột là I biến)
a Các bước thực hiện
Chọn Toois>Data Analysis>Correlation và khai báo các mục:
~ Input range: mién dé liéu ké cả nhãn
- Grouped by: Column (sé liéu theo cét)
- Labels in first row : Dinh dau V vao 6 này nếu có nhãn ở dòng đầu
- Output range: mién ra
- OK
Ví dụ 3 Để nghiên cứu mối tương quan giữa các đặc tính dài bông, số hạt, số bông với năng suất lúa, cần thực hiện các bước sau:
- Chon Toots>Data Analysis>Correlation
- Khai báo các mục (xem hình [.6)
2 Ba L:Nghin cite Jia
2 (Carros [pico Taseg [lewgg
Trang 24- Kết quả thu duoc trén bang I.1
Bảng I.1 Kết quả tính hệ số tương quan
- Hệ số tương quan của dòng và cột ghi ở ô giao giữa dòng và cột
- Hệ số tương quan âm (< 0) thể hiện mối tương quan nghịch biến (chẳng hạn tương quan giữa “dài bông” và “số bông” là nghịch biến)
- Các hệ số tương quan có giá trị tuyệt đối xấp xỉ 0.75 trở lên thể hiện mối tương quan tuyến tính mạnh giữa hai biến (tương quan giữa “năng suất”
và “P1000” có thể tạm coi là tương quan tuyến tính mạnh)
3.2 Tìm phương trình hồi quy
Excel cho phép tìm phương trình hồi quy tuyén tinh don y= at bx và hồi quy tuyến tinh bOI y= ay + A,X, + aX) + + ALK, Các biến độc lập chứa trong n cột, biến phụ thuộc y để trong một cột, các giá trị tương ứng giữa biến độc lập và biến phụ thuộc được xếp trên cùng một hàng
a Các bước thực hiện
Chọn Tools>Data Analysis>Regression và khai báo các mục:
- Input y range: mién dit ligu bién y
- Input x range: mién dữ liệu các biến x
- Label: Đánh dấu Ý vào ô này nếu có nhãn ở dòng đầu
- Confidence leve:: 95% (độ tin cậy 95%)
- Constanl in zero: Đánh đấu Ý nếu hệ số tự do a, = 0
- Ouiput range: miễn xuất kết quả
- Residuals: Đánh đấu 4| vào 6 nay dé hiện phần dư hay sai lệch giữa y
thực nghiệm và y theo hồi quy
- Standardized residuals: Danh dau 3 đề hiện phân dư đã chuẩn hoá
~ Residuals plot: Đánh dấu +| để hiện đồ thị phân dư
23
Trang 25- Line fit plots; Danh dau V dé hien dé thị các đường dự báo
- Normal probability plot: Danh dau V dé hiện đồ thị phần dư đã
chuẩn hố
- OK
Vi du 4 Tim phuong trình hồi quy y= a + 4,X, + @X,+ a;X; của nang suất lúa y phụ thuộc tuyến tính vào độ dài bơng (x,), trọng lượng 1000 hạt (x;) và số bơng (x;) với các số liệu cho trong hình L7
Hình 1.7 Khai báo để tìm phương trình hồi quy
Chọn Tools>Dạa Analysis>Regression và khai báo các mục như trên hình I.7 để thu được kết quả như trên hình L8
Trang 26b Phân tích kết quả
- Nếu hệ số tương quan bội (Multiple R) xấp xỉ 0.75 hoac lớn hơn thì
mô hình hồi quy tuyến tính là thích hợp (ngược lại nên tìm mô hình khác)
Trong ví du 4 hệ số tương quan bội là 0.8589 nên mô hình tuyến tính được
coi là thích hợp
- Hệ số tương quan bình phương (R square) trong ví dụ 4 là 0.7377 cho
biết 73.77% sự biến động của y là do các yếu tỐ xị, X;, X; gây nên
- Hệ số tương quan hiệu chỉnh bình phương (Adjusted R square) là 66.62% không sát gần với R square chứng tỏ không phải tất cả các biến đưa vào là thực sự cần thiết
- F thực nghiệm là 10.31281 ứng với xác suất 0.00158 nhỏ hơn mức xác suất ý nghĩa 0.05 nên phương trình hồi quy tuyến tính được chấp nhận
- Nhìn vào các hệ số của các biến ta viết được đường hồi quy dự báo Trong ví dụ 4 phương trình hồi quy là: y = — 4.06364 + 0.111608x, + 0.075684x, + 0.02011x; Tuy nhiên căn cứ vào các xác suất cho ở cột P- value thì hệ số của x, là không đáng tin cay, vì xác suất tương ứng > 0.05 (mức ý nghĩa đã chọn) Trong trường hợp này, cần tiến hành lọc bớt bién x,
để được đường hồi quy với các hệ số đều có ý nghĩa
4 Phân tích phương sai
Phân tích phương sai là công cụ chủ yếu để phân tích các số liệu khi
théo đõi ảnh hưởng của các nhân té (factor) va ảnh hưởng tương tác của
chúng Để thu thập số liệu, thí nghiệm cần được thiết kế phù hợp với mục đích nghiên cứu và điều kiện cụ thể nơi tiến hành thí nghiệm Để phân tích
một nhân tố, thí nghiệm thường được thiết kế theo kiểu hoàn toàn ngẫu nhiên, kiểu khối hoàn toàn ngẫu nhiên, hay ô vuông La tính Để phân tích hai nhân tố, thí nghiệm được bố trí theo kiểu trực giao, kiểu chia ö lớn, ô
vừa, ô nhỏ, hoặc kết hợp vừa chia băng vừa chia 6 Tir ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức hay mỗi nhân tố có ba mitic
4.1 Phan tich phuong sai một nhân tố
Phân tích phương sai một nhân tố được sử dụng để phân tích số liệu
25
Trang 27khi theo đối ảnh hưởng của các mức của nhân tố tới kết quả, như ảnh hưởng của các công thức cho ăn đến năng suất thịt lợn, ảnh hưởng của các công thức phun thuốc sâu đến tỷ lệ sâu bệnh
Để phân tích phương sai một nhân tố cần thiết kế thí nghiệm kiểu hoàn toàn ngẫu nhiên, mỗi mức lập lại một số lần, số lần lặp của các mức của nhân tố không cần phải bằng nhau Số liệu được điển theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng với một mức của nhân tố), ô đầu tiên ghi tên mức, các ô tiếp theo ghi số liệu
a Các bước thực hiện
Chon Tools> Data Analysis > Anova: Single Factor và khai báo:
- Input range: Khai bdo miền dữ liệu vào (một chữ nhật bao trùm toàn
bộ các ô chứa tên mức và toàn bộ các số liệu)
- Grouped by: Column (số liệu theo cột) hoặc row (số liệu theo hàng)
- Label in first column : nhan dong đầu
công thức không có khác biệt đáng kể
- Nếu kết luận các công thức có tác động khác nhau tới kết quả thì phải tiến hành bước tiếp theo là so sánh các công thức để rút ra công thức nào tốt nhất
Vi du 5, Thí nghiệm ảnh hưởng của các loại thuốc đến năng suất lúa (11 loại thuốc là T1 đến TII, 4 cột số liệu là năng suất thu được), số liệu thu được cho trong bảng I2, các lệnh thực hiện trong Excel được minh hoạ trong hình L9, còn kết quả cho trong bang 1.3
26
Trang 28Bảng I.2 Ảnh hưởng của các loại thuốc đến năng suất (ns) lúa
;ÄÑMlCFošóoft Ekcel> Book†
ps] Eile Edit View Insert Format Tools Data Window Help ViekeyO2.1
Trang 29Bảng I.3 Kết quả phân tích phương sai
Groups Count | Sum Average Variance T1 4 14.576 3.644 0.443686 T2 3 9.04 3.013333 0.108908 T3 4 11.793 294825 0,171874 T4 4 11.638 2.9095 0.253934 T5 3 7.703 2.567667 0.084065 T6 3 7,694 2.564667 0.122321 T7 4 9.934 2.4835 0.296198 T8 3 6.6 2.2 0.044469 T8 4 8.164 2.041 0.037706 T10 4 11,192 2.798 0.184963 T11 4 4.949 1.23725 0.081114
ANOVA
Source of Variation ss af MS F P-value F crit
Between Groups 15.1039 10 1.51039 8.54171 2.66E-06 2.1768
Bang 1.4 So sánh trung bình giữa các nhóm
TS 3 7.703 2.5677 1.0763
T7 4 9.934 2.4835 1.1605 T8 3 6.600 2.2000 4.4440 T9 4 8.164 2.0410 1.6030 T11 4 4.949 12373 2.4068
28
Trang 30Phần mềm Excel không cho phép so sánh các trung bình của các nhóm ứng với các mức của nhân tố (các công thức) Tuy nhiên, nếu cần so sánh trung bình m, (với r, lần lặp) với trung bình mị (r, lần lặp) người dùng có thể
tự tính them LSD (Least Significance Difference) theo céng thttc LSD = ta;
x SQRT(Ÿ(1/, + l/r)), trong đó s° là phương sai chung được ước lượng bởi
trung bình sai số bình phương trong nội bộ nhóm (MS within groups), a = }-
p, và tụ,;là giá trị t của bảng Student ứng với mức ý nghĩa œ và f bậc tự do
tạ, có thể tìm được bằng cách tra bảng số hay bang ham TINV trong Excel Trong ví dụ 5, để so sánh ảnh hưởng của thuốc T1, T2 đến năng suất lúa, trước hết cần tính trị tuyệt đối của hiệu các năng suất trung bình m,, m; Im,- mại khi sử dụng 2 loại thuốc trên (chính bằng 0.6307, xem bảng 1.4)
Ứng với t = t(0.05, 29) =2.045 (tra từ bằng Student); s’= 0.17682, LSD duge
tính cho các trường hợp r,, r; bằng 3 hoặc 4 như sau:
Các kết quả tính toán tương tự được ghi trong bang 1.3 cho thấy công
thức T1 và T2 là không khác nhau rõ rệt, công thức T1 khác các công thức từ T3 đến TI1 Tương tự có thể so sánh công thức T2 với các công thức từ T3
đến TI1 Công thức T1 cho năng suất cao nhất là tốt nhất, công thức TI1 cho năng suất nhỏ nhất là kém nhất
42 Phân tích phương sai hai nhân tố không tương lác
Khi phân tích phương sai hai nhân tố A và B thì có thể xảy ra các hai trường hợp: trường hợp A và B không tương tác (biến động gây nên bởi tác động đồng thời của A và B gần sát 0) và trường hợp A và B tương tác (nếu trái lại) Phân tích phương sai một nhân tố bố trí kiểu khối hoàn toàn ngẫu nhiên được coi là trường hợp riêng của phân tích phương sai hai nhân tố không tương tác (nhân tố khối là nhân tố thứ hai không tương tác với nhân tố thứ nhất) Khi phân tích phương sai hai nhân tố không tương tác, số liệu cần được sắp xếp theo cách sau: hàng là các mức của nhân tố thứ nhất, cột là các
29
Trang 31mức của nhân tố thứ hai (trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì hàng là các mức của nhân tố, cột là các khối ngẫu nhiên)
a Các bước thực hiện
Chon Tools >Data Analysis >Anova: Two Factor Without Replication
sau đó khai báo tiếp các thông tin trong hình I.!0 và kích OK
7 |Anova: Two-Factor Without Replication §
3,BUMWARY_ oun — Sum Average _Vanance
Hình I.10 Hộp thoại khai báo để phân tích phương sai không tương tác
Vi du 6 Bố trí thí nghiệm phân tích nhân tố 1 (có bốn mức) theo khối hoàn toàn ngẫu nhiên (nhân tố 2 có bốn khối), ta thu được các số liệu như
Trang 32Kết quả thu được khi phân tích phương sai cho ở bảng L6
4.3 Phan tich phuong sai hai nhân tố tương tác
Trong trường hợp này khi phân tích phương sai ta phải tính đến sự tác động đồng thời của nhân tố 1 và nhân tố 2 Số liệu sắp xếp như sau:
- Nhân tố 1 đánh theo hàng với các mức khác nhau, nhân tố 2 đánh
theo cột với các mức khác nhau
- Mỗi mức của nhân tố 1 (thường gọi là nhân tố A) được dành k hàng
31
Trang 33(cho k lần lặp) còn mỗi mức của nhân tố 2 (thường gọi là nhân tố B) là 1
cột
- Tên mỗi mức của nhân tố A chỉ viết một lần trong k ô ở cột đầu, còn
tên các mức của nhân tố B thì ghỉ đầu ở mỗi cột trên dòng đầu, kể từ cột thứ
2 Các ô từ hàng 2 cột 2 trở đi ghi kết quả của các lần lặp của các tổ hợp
mic
- Bảng phân tích phương sai có 5 hàng: Hàng cho nhân tố A, hàng đành cho nhân tố B, hàng cho tương tác Ax B, hàng cho sai số và hàng Total Giá trị F lý thuyết được tính ở cột cuối, ta có thể kiểm tra qua hàm FINV(trong Excel) Cét P — value là xác suất tương ứng với giá trị E thực nghiệm, nếu giá trị này nhỏ hơn alpha thì ta kết luận nhân tố (hoặc tương tác) tương ứng có ảnh hưởng đến kết quả thí nghiệm
Muốn so sánh các trung bình ta làm như phân tích 1 nhân tố sau khi tìm giá trị t bằng hàm TINV với số bậc tự do của sai số và căn cứ vào số lần lặp của các trung bình mà ta muốn so sánh
a Các bước thực hiện
Chon Tools >Data Analysis >Anova: Two Factor With Replication,
sau đó khai báo các thông tin như trong hình Ï.!1 và kích OK
Ví dụ 7: Nghiên cứu ảnh hưởng của việc bón phân khoáng (nhân tố A) theo bốn công thức và mật độ trồng (nhân tố B) gồm ba mức tới sản lượng bông ta có bảng số liệu (bảng I.7),
Bảng 1.7, Năng suất bông (tạ/ha)
€ thức †
C.thức 2
€.thức 3
C.thức 4
Trang 34Thực hiện các lệnh phân tích phương sai hai nhân tổ tương tác như minh hoa trén hinh Lt 1
23|Anova Two-Factor With Replication
Hình 1.11 Hộp thoại khai báo khi phân tích phương sai hai nhâp tố tương tác
Kết quả phân tích phương sai cho 6 bang 1.8
Bảng 1.8 Kết quả phân tích phương sai hai nhân tế tương tác
Trang 35Total 261.9167 |47
b Phân tích kết quả: Theo kết quả xử lý, ta rút ra kết luận:
- F,=14.9898 > F,s,= 2.86627, do đó các công thức phân bón ảnh hưởng rõ rệt đến năng suất bông
- Fạ= 3.22194 < Fysy = 3.25944, nén tang mat do cay khong hy vong lầm tăng năng suất bông
- Ea, = 1.46684 < Fạsap = 2.36375, nên ảnh hưởng đồng thời của cả hai
nhân tố không tác động đáng kể tới năng suất bông
- Bảng SUMMARY cho kết quả tính toán từng cấp của nhân tố A (viết theo dòng) và chung cho toàn bộ mẫu, bao gồm: số quan sát (count), tổng
giá trị quan sát (sum), trị số trung bình (average) và phuong sai (variance)
- Bảng phân tích phương sai ANOVA: Cột đầu tiên là các nguồn gây
Ta biến động (source of variation) gồm có: mẫu (sample) là các biến động do
“nhân tố viết theo hàng gây ra, biến động của nhân tố B - viết theo cột
(columns), biến động do tác động tương tác của các nhân tố A và B
34
Trang 36(nteraction), biến động ngẫu nhiên (within) và của tất cả các yếu tố trên (total) Các cột khác gồm: tổng sai số bình phương (SS), số bac tu do (df), tổng sai số bình phương trung bình (MS =ss/d0, giá trị F thực nghiệm (F), giá trị xác suất P và giá trị F lý thuyết tương ứng với các yếu tố trong cột thứ nhất
5 So sánh hai mẫu
Bài toán ở đây là cần so sánh hai mẫu thông qua việc kiểm định giả thuyết Hụ : m, = mạ (kỳ vọng của biến X bằng kỳ vọng của biến Y) với đối thuyết H,: m, # m; ở mức ý nghĩa œ trong trường hợp kiểm định hai phía
Nếu kiểm định một phía thì đối thuyết H, là m, > m; (khi x > y) hoặc m, <
m, (khi x < y)
5.1 So sánh hai mẫu độc lập khi biết phương sai oj va 0}
Rút mẫu độc lập từ hai tổng thể phân phối chuẩn, trong một số tình
huống nào đó chúng ta có thể ước lượng được phương sai (thường xảy ra khi
điều tra lại một tổng thể sau một thời gian chưa lâu, nên phương sai chưa
thay đổi, đo đó lấy phương sai của lần điều tra trước làm ø; và ơ, chẳng
hạn khi xem %ét các kết quả phân tích của hai phòng thí nghiệm mà độ chính
xác đã ổn định, từ đó có các ước lượng về phương sai)
a Các bước thực hiện
Chọn Toois >DatalAnalysis > z-Test: Two Sample Jor Means, sau đó lần lượt trả lời:
- Input variable I range: miễn vào của biến 1 tức là miền chứa số liệu,
kể cả tên dòng đầu của mẫu quan sắt
- Input variable 2 range: miễn vào của mẫu quan sát thứ hai kể cả tên đồng đầu của mẫu quan sát
- Labels: nếu cần thêm dòng đầu về tên biến thì chọn mục này
- Hypothesized means difference: gia thuyét vé hiéu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hụ: m,=m; thì ghỉ 0 Nếu lấy giả thuyết H,;: m,=m,+d (d là 1 số nào đó) thì ghi d
- Variable 1 variance: phuong sai của biến 1(nhập 63)
- Variable 2 variance: phuong sai của biến 2 (nhập 63)
35
Trang 37- Output range: Chon mién trong dé dua ra kết qua
Vi du 8 Thuc hién thi nghiém véi mau 1 cé 10 quan sat, mau 2 cé 12 quan sắt ta có bảng số liệu sau, biết phương sai của biến 1 là 007, của biến 2
Kết quả so sánh hai mẫu cho ở bảng 1.9,
Bảng 1.9 Kết quả so sánh hai mẫu độc lập
Bảng kết quả I.9 có hai cột, một cột cho mẫu quan sát Ì, cột kia cho
mẫu 2 (tính tới hàng thứ ba) Bảng này gồm có:
- Trung bình của mẫu a,và a;
- Phương sai da cho (07, 03)
- Số quan sát n,và nạ
- Giá trị z thực nghiệm
- Giá trị P một phía và giá trị P hai phía
- Giá trị z lý thuyết (tới hạn) một phía và hai phía
- Giá trị z thực nghiệm tính theo công thức sau;
z= | ay-a, | /Sqrt( oF fn, + 03 /n,)
36
Trang 38Chú ý rằng, có thể dùng một số hàm trong Excel để tính một số kết quả:
- Giá trị P một phía tính bằng hàm 1-Normsdist(z)
- Giá trị P hai phía tinh bang ham (1-Normsdist(z))*2
- Giá trị tới hạn của hàm phân phối chuẩn tác z một phía tính bằng
hàm Normsinv(0.95)
- Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975)
Trong ví dụ 8 ta thấy: giá trị z thực nghiệm 2.88675 lớn hơn z lý thuyết (tới hạn) một phía 1.64485 cũng như z lý thuyết hai phía 1.95996 (gid trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05) Kết luận: kỳ vọng của hai biến khác nhau
5.2 So sánh hai mẫu kiểu cặp đôi
Ta xét thí dụ: lấy một ổ chim và cân trọng lượng chim cái, trọng lượng chim duc ta được hai mẫu quan sát của hai tổng thể chim cái và chim đực Nếu lấy một số chim đực ngẫu nhiên trong nhiều chỉm đực và lấy một số chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sát: độc lập Trường hợp khác, nếu ta đem 10 mẫu đất, mỗi mẫu chia đôi, một nửa
giao cho phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B
thì thu được số liệu cặp đôi để so sánh kết quả của hai phòng phân tích; hoặc nếu ta đem hai giống lúa cấy trên một số ruộng, mỗi ruộng chia đôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cập đôi để so sánh, hay nếu đo một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và đo lại chỉ số đó sau một thời gian điều trị thì có hai mẫu quan sát cặp đôi để đánh giá hiệu quả điều trí
Chú ý rằng, khi rút hai mẫu cặp đôi ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp thành cặp đứng ở hai cột cạnh nhau
a Các bước thực hiện
Chon Tools >Data Analysis > LTest: Paired Two Sample for Means, sau đó lần lượt trả lời:
- Input variable | range: mién vao cia bién | tic 1a miền chứa số liệu
của biến 1, kể cả tên dòng đầu của mẫu quan sắt
37
Trang 39- Input variable 2 range: Mién vao cha mau quan sét thứ hai kể cả tên đồng đầu của mẫu quan sát
- Labels: Néu can thém dong dau về tên biến thì chọn mục này
- Hypothesized means difference: Gia thiét về hiệu hai trung bình của
bai tổng thể Nếu lấy giả thuyết Hạ: m,=m; thì ghi 0 Nếu lấy giả thuyết H,:
m,=m;+d (d là một số nào đó) thì ghi d
- Output range: Chon mién trống để đặt ra kết quả
Ví dụ 9 Có 8 cặp số liệu của hai mẫu x và y cho trong bảng sau
x 396 32.4 33.1 27 36 32 25.9 32.4
y 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2
Thực hiện phân tích trong Excel ta được bảng kết qua (bang I-10)
Bảng I.10 Kết quả so sánh hai mẫu cặp đôi
Variance 19.54 † 23.451 |Phương sai mẫu
Pearson Correlation 0.96187 Hệ số tương quan R
Hypothesized Mean a Giả thuyết về hiệu số trung bình
Difference
t Stat 3.31065 Gia trị t thuc nghiém
P(T<=t) one-tail 0,00647 Gia tri P mét phia
t Critica! one-tail 1,89458 Gia tri tty thuyết khi kiểm định một phía
P(T<=t) two-tail 0.01293 Giá trị P hai phía
t Critical two-tail 2.36462 Gia tri tly thuyết khi kiểm định hai phía
b Phân tích kết quả
Bảng kết quả có hai cột cho hai mẫu quan sát Bảng này có các hàng:
- Trung bình mẫu a,, a)
- Phương sai mẫu s7, s?
- Số quan sát n, và n, (bằng nhau và bằng số cặp số liệu n)
- Hệ số tương quan r của 2 mẫu (coi như 2 biến)
38
Trang 40- Bac tu do f dé kiểm định giả thuyết H,, f bing s6 cap (n-1)
- Giá trị t thực nghiệm (giá trị tuyệt đối) : 3.31055
- Giá trị P một phía: 0.00647
- Giá trị t một phía: 1.894577508
- Giá trị P hai phía: 0.01293
~ Giá trị t hai phía: 2.36462256
Do t thực nghiệm lớn hơn t lý thuyết một phía cũng như hai phía (giá trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05), nên trong ví
dụ trên ta chấp nhận giả thuyết H;
5.3 Sơ sánh hai mẫu độc lập với giả thuyết hai phương sai bằng nhau Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể được tiến hành một cách độc lập thì chúng ta có hai mẫu độc lập Nếu dung lượng của cả hai mẫu đều lớn (thường quy ước là n, > 30, n, > 30) ta có thể tiến hành z-test nhưng thay bai phương sai của tổng thé oj va o} bang
phương sai mẫu s7 và s; Trường hợp mẫu bé (n,n; nhỏ hơn 30) thì ta gặp
bài toán khó, gọi tên là bài toán Berens — Fisher Trong trường hợp này, nếu coi hai phương sai của hai tổng thể bằng nhau (cân kiểm định giả thuyết
phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính toán như sau:
a Các bước thực hiện:
Chon Tools >Data Analysis > t-Test: Two-Sample Assuming Equal
Variances, sau đó lần lượt trả lời:
- Inpit variable ] rang: miễn vào của biến L tức là miền chứa số liệu,
kể cả tên dòng đầu của mẫu quan sắt
- Input variable 2 range: mién vao cia mẫu quan sắt thứ hai kể cả tên dong dau cha mau quan sắt
- Labels: Néu đưa thêm dong đầu về tên biến thì chọn mục này
- Hypothesised means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hạ: m;=m; thì ghi 0 Nếu lấy giả thuyết
39