Tài liệu " Tin học ứng dụng trong ngành nông nghiệp " được biên soạn để hướng tới trước hết là cán bộ giảng dạy, sinh viên các trường đại học và cao đằng nông nghiệp những năm cuối, học viên cao học và tiến sỹ, những người có thể tìm tháy ở đây các phương pháp, công cụ cho việc thực hiện các đề tài nghiên cứu khoa học, hay các đề tài luận văn tốt nghiệp cho mình
Trang 1PGS TS NGUYEN HAI THANH
(Chủ biên)
Tin hoc
UNG DUNG TRONG
Trang 2PGS.TS NGUYỄN HẢI THANH
Trang 4LOI NOI DAU
Vấn đê đào tạo, nghiên cứu và ứng dụng tin học có một tâm quan trọng đặc biệt cho việc phát triển nhân lực, khoa học — kĩ thuật và kinh tế~—
xã hội Việt nam là một nước có trên 72% dân số làm nông nghiệp, vì vậy ứng dụng tin học và công nghệ thông tin có một vai trò to lớn trong công cuộc công nghiệp hoá - hiện đại hoá nông nghiệp và nông thôn Các lĩnh vực
wu tién phát triển trong giai đoạn hiện nay bao gâm nông nghiệp, công nghệ sinh hoc, tự động hoá và tin học - công nghệ thông tin Tất cả các lĩnh vực này liên quan với nhau rất chặt chế trong sự phát triển của đất nước ta và đặc biệt là trong sự nghiệp xây dựng một nên nông nghiệp phái triển bên vững, một nông thôn Việt nam giầu có và tươi đẹp Chỉ thị 58-CT/TW của Ban chấp hành Trung tương về đẩy mạnh và phát triển công nghệ thông tin phục vụ sự nghiệp công nghiệp hoá, hiện đại hoá đất nước khẳng định: "Cần khẩn trương xây dựng các chương trình ứng dụng và phát triển công nghệ thông tin, kết hợp công nghệ thông tin với công nghệ sinh học để phục vụ công nghiệp hoá, hiện đại hoá nông nghiệp và nông thôn, đặc biệt góp phần xoá đói giảm nghèo và thúc đẩy phát triển vùng sâu, vùng xa”, tiếp tục “đẩy mạnh việc đào tạo và sử dụng nguồn nhân lực cho ứng dụng và phát triển công nghệ thông tin” `
Với vai trò một trường đại học được thành lập sớm nhất trong các trường đại học khối nông - lâm - ngư nghiệp, với sự nhận thức những tiêm năng to lớn mà tin học và công nghệ thong tin có thể mang lại, Trường Đại học Nông nghiệp I Hà Nội đang phấn đấu dạt chất lượng đào tạo tin học đại cương và tín học chuyên ngành ngày càng cao hơn, tăng cường ứng dụng tin học và công nghệ thông tin trong giảng dạy, triển khai các dé tài nghiên cứu khoa học ứng dụng toán — tin và công nghệ thông tìn trong lĩnh vực nông nghiệp Khi điểm lại một số nết về ứng dụng tin hoc trong đào tạo và nghiên cứu khoa học nông nghiệp tại Trường Đại học Nông nghiệp I Hà Nội, có thể ghỉ nhận một sự kiện đặc biệt: đây chính là nơi tiếp nhận chiếc máy tính thứ
ba trên miễn Bắc (do Cuba trao tặng năm 1981), là một trong các địa điểm được trang bị trung tâm máy tính hiện dại sớm nhất trên miễn Bắc (tháng 8 năm 1982)
Trong giai đoạn hiện nay, cùng với các trường đại học và cao đẳng,
Trang 5các viện nghiên cứu khoa học trong lĩnh vực nông — lam — ng nghiệp, Trường Đại học Nông nghiệp | Ha Noi đang triển khai nhiễu ứng dụng của tin học trong đào tạo và nghiên cứu khoa học như:
- Ứng dụng các phần mêm thống kê sẵn có, từ những phân mém thong dụng như Excel đến chương trình tính toán thống kê lớn và ứng dụng chuyên sân, vào thống kê sinh học — nông nghiệp như SPSS, Minitab, Genstat, Irristat, Statgraf
- Sử dung cde phan mém Frontier, Limdep, Lingo phục vụ phân tích các số liệu kinh tế nông nghiệp và khuyến nông và nhiều phần mềm chuyên dụng khác cho các lĩnh vực chọn tạo giống, sinh thái môi trường
- Thiết lập mô hình, xây dựng quy trình tính toán, thiết kế và cài đặt hệ chương trình máy tính cho các mô hình tối ưu trợ giúp quyết định, các mô hình điều khiển nhằm giải quyết các vấn đề phát sinh trong quy hoạch sử dụng đất, quy hoạch vùng kinh tế nông nghiệp và kinh tế nông hộ tự động hoá và thiết kế máy nông nghiệp
- Ung dung công nghé GIS (Geographical Information System), mét công nghệ kết hợp giữa công nghệ thông tít và công nghệ viễn thám, trong xây dựng hệ cơ sở dữ liệu và quản lý tài nguyên nông nghiệp
- Bước đâu nghiên cứu áp dụng công nghệ tìn sinh học trong chọn tạo giống, di truyền học vào lĩnh vực trồng trọt, chăn nuôi
- Khai thắc mạng thông tìn nội bộ, thư viện điện tử và lmernet nhằm xây dựng và quản lý hệ thống cơ sở đữ liệu về thông tin khoa học nông nghiệp phục vụ đào tạo và nghiên cứu, Ir' jển khai các đề tài nghiên cứu và ứng dụng tin học trong đổi mới phương pháp dạy và học
- Đẩy mạnh chất lượng đào tạo sinh viên ngành Tin học thông qua việc từng bước xây dựng hệ giáo trình chuẩn chuyên ngành định hướng vào các để tài ứng dung tin hoc trong nông nghiệp, xây dựng các giáo trình tim học chuyên ngành cho các chuyên ngành nông nghiệp ở tất cả các bậc học Cuốn sách này được viết ra với những mục đích cụ thể Cuốn sách bao gồm một số công trình và đề tài nghiên cửa khoa học ở nhiêu mức độ khác nhan được tiến hành trong thời gian gân đây trong việc giảng dạy và ứng dụng tin học trong lĩnh vực nông nghiệp Tuy chưa thể nào bao quát hết các vấn đề ứng dụng tin học trong nông nghiệp, nhưng đây có thể là một số hướng nghiên cứu cân được tiếp tục được đẩy mạnh trong thời gian tới trong
4
Trang 6các trường đại học, cao đẳng, các viện nghiên cứu khoa học và ứng dụng trong các lĩnh vực nông nghiệp
Cuốn sách này trước hết hướng tới đối tượng là cần bộ giảng dạy, sinh viên các trường dại học và cao đẳng nông nghiệp ở những năm cuối, học viên cao học và tiến sỹ, những người có thể tìm thấy ở đây các phương pháp, công cụ cho việc thực hiện các đê tải nghiên cứu khoa học hay các để tài luận văn tốt nghiệp của mình Một số chương trong cuốn sách có thé dua vào giảng dạy trong các môn về tin học ứng dụng cho các chuyên ngành nông nghiệp khác nhau Sinh viên ngành Tin học của các trường dại học và cao đẳng nông nghiệp trong cá nước cũng có thể tìm được trong cuốn sách những kiến thức cơ bản, những gợi ý quan trọng, một mặt có tính chất định hướng, mặt khác lại rất cụ thể cho công việc học tập và thực tập nghiên cứu khoa học của mình Tuy nhiên, đối tượng bạn đọc này hoàn toàn có thể nhận thấy rằng cần phải hết sức cố gắng mới có thể trả lời được câu hỏi “tại sao ” (đấy chính là một trong những mục tiêu ngành học của các bạn) cũng
nh phải hết sức kiên trì để biết cách “làm thế nào ”,
Tập thể tác giả cuốn sách này được phân công bién soan nhu sau:
- Chương I Xử lý số liện trong thống kê sinh học và nông nghiệp, gầm
ba phan Phan I va II do ThS Dé Thi Mo va PGS TS Nguyễn Hải Thanh biên soạn TS Nguyễn Quốc Chỉnh va ThS Phạm Văn Hùng viết phdn Il
- Chương ÏI Một số mô hình và phần mêm tối wu ứng dụng trong nông nghiệp, do PGS.TS Nguyễn Hải Thanh biên soạn,
- Chương HI Hệ thống thong tin dia lý trong quản lý và đánh giá tài nguyên dat nông nghiệp, được viết bởi ThS Mẫn Quang Huy
- Chương IV Viễn thám trong nông nghiệp, do ThS Trần Quốc Vinh
và Thế Lê Thị Giang cùng chung viết
- Chương V, Ứng dung tin hoc trong tự động hoá một quá trình nông nghiệp, do ThŠ Ngô Trí Dương đảm nhiệm
Chương VI, Tìn sinh học cải thiện di truyền nông nghiệp, do TS Nguyễn Hồng Nguyên viết
- Chuong VII Internet va cde dich vu thông tin nông nghiệp,
do KS Đặng Xuân Hà biên soạn
Khi nhận phân công biên soạn, các tác giả đã rất nỗ lực để hoàn
Trang 7thành nhiệm vụ của mình và đạt được mục dich chung của cuốn sách, cế gắng viết một cách dễ hiểu, ngắn gọn những vấn đê mình đã từng làm trong công tác nghiên cứu khoa học và dạy học của mình Với quan niệm “công việc đào tạo và nghiên cứu khoa học là công việc của cả một đột ngũ ” và với mong muốn “phát triển các ứng dụng của tín học trong nông nghiệp”, tập thể tác giả luôn coi trọng việc trao đổi ý kiến với người đọc trực tiếp hoặc qua e-mail va chia sé nhiing tai liệu chuyên ngành Những vấn dé dat
ra trong cuốn sách mới chỉ là phần nổi lên của một ting bang và chắc ai cũng muốn nhìn rõ nó hơn
Tuy nhiên, lần đâu tiên các vấn dé img dung tin học trong nông nghiệp được viết một cách tổng hợp, chắc cuốn sách còn có khiếm khuyết Chúng tôi rất mong nhận được sự đóng góp Ý kiến của bạn đọc, của các đông nghiệp, các nhà nghiên cứu, các thày cô giáo và các sinh viên để nâng cao hơn nữa chất lượng của cuốn sách này
Tập thể tác giả xin trân trọng cám ơn Nhà xuất bản Khoa học và Kỹ thuật đã cho xuất bản để tài này Đặc biệt, chúng tôi xin chân thành cám ơn ông Nguyễn Kim Long, biên lập viên, về sự cộng tác quý báu trong việc biên tập cuốn sách
Hà Nội, ngày 2 tháng 9 năm 2004 Thay mặt tập thể tác giả Chủ biên: PGS.TS Nguyễn Hải Thanh
Trang 8MUC LUC
LOI NOI DAU
MUC LUC
CHƯƠNG L XU LY SO LIEU TRONG THONG KE
SINH HOC VA NONG NGHIEP
L XULY 86 LIEU THONG KE SINH HOC TRONG EXCEL
3.2 Tìm phương trình hôi q4wy
4 Phân tích phương sai
4.1 Phân tích phương sai một nhân tố
4.2 Phân tích phương sai hai nhân tố không tương tác
4.3 Phân tích phương sai hai nhân tố tương tác
5 So sánh hai mẫu
5.1 So sánh hai mẫu độc lập khi biết phương sai ơi và
ki
5.2 So sánh hai mẫu kiểu cặp đôi
5.3 So sánh hai mẫu độc lập với giả thuyết hai phương
sai bằng nhau
5.4, So sánh hai mẫu độc lập với giả thuyết hai phương
sai khác nhau
1L THIẾT KẾ THÍ NGHIỆM VÀ PHÂN TÍCH THỐNG KÊ
NHIỀU CHIỀU TRONG MINITAB
1 Giới thiệu phần mềm Minitab
1.1 Các cửa sổ của Minitab
1.2 Các điểm đặc trưng của Minitab
Trang 92.1 M6 hinh hoan todn ngdéu nhién
2.2 Mô hình khối hoàn toàn ngẫu nhiên
Ul UNG DUNG PHAN MEM FRONTIER 4.1 VÀ LIMDEP
TRONG PHAN TICH DULIBU KINH TE NONG NGHIEP
1 Hàm cực biên và ứng dụng trong phân tích kinh tế
1.1 Sơ lược về hàm cực biên
1⁄2 Phân tích hiệu quả kinh tế và đường cực biên
1.3 Các loại hàm cực biên
2 Các mô hình hàm sản xuất cực biên
2.1 Mô hình hàm cực biên xác định
2.2 Mô hình hàm cực biên ngẫu nhiên
2.3 Mô hình hàm cực biên dựa trên số liệu kết hợp
2.4 Một số dạng hàm sản xuất cơ bản
3 Một số phần mềm chạy hàm cực biên
3.1 Phdn mém Frontier 4.1
3.2 Chuong trinh Limdep
TÀI LIỆU THAM KHẢO CHUONG I
CHƯƠNG II MỘT SỐ MÔ HÌNH VÀ PHẦN MỀM
TOI UU UNG DUNG TRONG NONG NGHIEP
I MO HINH QUY HOACH DON MUC TIEU
1 Mô hình tối ưu một mục tiêu (tuyến tính và phi tuyến)
2 Các ví dụ minh hoạ bài toán tối ưu một mục tiêu
2.1 Bài toán quy hoạch sử dụng đất
2.2 Bài toán tối ưu hod gid tri sdn xuất
2.3 Bài toán tối ưu thông số sàng phân loại
II MÔ HÌNH QUY HOẠCH ĐA MỤC TIÊU TUYẾN TÍNH
Trang 102 Các khái niệm cơ bản của bài toán tối ưu đa mục tiêu 123
3 Mô hình quy hoạch đa mục tiêu trong môi trường 124 mờ/ngẫu nhiên
4 Các ví dụ minh hoạ bài toán quy hoạch đa mục tiêu 126 4.1 Bài toán xác định cơ cấu cây trồng 126 4.2 Bài toán đánh giá hiệu quả sử dụng đất và lao 137 động
4.4 Tối tì hoá kết quả và hiệu quả kinh tế chân nuôi 141
cá
II HƯỚNG DẪN SỬ DỤNG MỘT S6 PHAN MEM TOI UU 145
1 Giải bài toán quy hoạch tuyến tính đơn mục tiêu trong 145 Excel
2 Giải bài toán quy hoạch tuyến tính và phi tuyến đơn mục 149 tiêu bằng phần mém Lingo
3 Giải,bài toán quy hoạch phi tuyến đơn mục tiêu bằng 151 phần mềm RST2NAU
3.1, Giới thiệu phân mêm RST2ANU 15!
4.1 Giới thiệu phương pháp giải bài toán tối uu da 162
muc tiêu tuyên tỉnh
5.3 Xây dung phdn mém PRELIME 183
Trang 111 Áp dụng các mô hình tối ưu trong nông nghiệp
2 Nghiên cứu áp dụng và đề xuất các phương pháp tối ưu
3 Xây dựng các phần mềm tối tru
4 Xây dựng hệ hỗ trợ ra quyết định cài đặt trên mạng máy
1 HE THONG THONG TIN DIA LY
1 Khái niệm về hệ thống thông tin địa ly
2 Hệ thống thông tin địa lý và các hệ thống tương tự
2.1 Hệ về bản đô tự động AMS
2.2 Hệ quản trị cơ sở đữ liệu
3 Sự phát triển của hệ thống thông tin địa lý
3.1 Ảnh hưởng của các công nghệ đến sự phát triển
1 Vai trò của cơ sở dữ liệu trong hệ thống thông tin địa lý
2 Đặc trưng của cơ sở dữ liệu không gian và cấu trúc dữ
liệu trong GIS
2.1 Đặc trưng của dữ liệu không gian
2.2 Cấu trúc dữ liệu trong GIS
2.3 Mô hình chông ghép bản đồ trong GIS
2.4 Cấn trúc dữ liệu và đặc tinh cla ban dé trong GIS
3 Mô hình cơ sở dữ liệu của hệ thống thông tin tài nguyên
đất
3.1 Thông tin đâu vào
3.2 Xử lý dữ liệu
3.3 Thông tin đầu ra
3.4 Kỹ thuật GIS trong phan tích và xử lý dữ liệu
4 Nghiên cứu ứng dụng GIS trong đánh giá tài nguyên đất
Trang 124.1 Trên thế giới và trong khu vực
4.2 Nghiên cứu ứng dụng GIS trong danh giá tài
nguyên đất ở Việt Nam
4.3 Ứng dụng GIS và khả năng tiếp cận
II GIỚI THIỆU MỘT SỐ PHẦN MỀM GIS
1, MicroStation GeoGraphics
2 Phân mềm ArcInfo/Maplnf
3 Phần mềm Arcview
Iv XAY DUNG QUY TRINH CONG NGHE UNG DUNG GIS
QUANLY DU LIEU TAI NGUYEN DAT
1, Xây dựng hệ thông tin quan ly tài nguyên đất
2 Mô hình áp dụng xây dựng bản đồ đơn vị đất dai huyện
Yên Chau
3 Xây dựng cơ sở dữ liệu thông tin bảng đồ chuyên để
3.1 Cơ sở đữ liệu thông tin bản đô đất
3.2 Cơ sở dữ liệu thông tin bản đô độ đốc
3.3 Cơ sở đữ liệu thông tin bản đồ độ dày tầng đất
3.4 Cơ sở đữ liệu thông tin bản dé thành phân cơ giới
3.5 Cơ sở dữ liệu thông tin bản dé chế độ tưới
4 Mô hình chồng xếp cơ sở dữ liệu bản đồ đơn tính trên
I.TỔNG QUAN TÀI LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1 Định nghĩa và phân loại viễn thám
Trang 133 Các vệ tinh viễn thám thông dụng trong nông nghiệp ở Việt
4.3 Đặc điểm phản xạ phổ của các đối tượng tự nhiên
5, Giải đoán ảnh viễn thám
5.1 Hiệu chỉnh ảnh
5.2 Tăng cường chất lượng ảnh và chiết tách đặc tính
5.3 Giải đoán ảnh viễn thám
5.4 Đánh giá độ chính xác bản đồ sau giải doán
II MỘT SỐ MÔ HÌNH VIỄN THÁM ỨNG DỰNG
1, Viễn thám trong nghiên cứu sử dụng đất và lớp phủ bể
mặt
2 Viễn thám trong điều tra và thành lập bản đồ đất
3, Nghiên cứu viễn thám trong khí tượng thuỷ văn
4 Viễn thám trong quản lý cây trồng
5 Viễn thám trong nghiên cứu môi trường
6 Viễn thám trong nghiên cứu cảnh quan
Ill UNG DUNG CÔNG NGHỆ VIỄN THÁM TRONG VIỆC
TÌM HIỂU SỰ THAY ĐỔI SỬ DỤNG ĐẤT
1 Dùng phương pháp giải đoán ảnh số tìm hiểu sự thay đổi
sử dụng đất
1.1, Phương pháp nghiên cứu
1.2 Kết quả nghiên cứu
1.3 Kết luận
2 Dùng phương pháp giải đoán ảnh bằng mắt thường để tìm
hiểu sự thay đổi sử dụng đất
Trang 14CHUONG V UNG DUNG TIN HOC TRONG TU DONG
HOA MOT QUA TRINH SAN XUẤT NÔNG NGHIỆP
1 VAL TRÒ CỦA TỰ ĐỘNG HOÁ TRONG SẢN XUẤT NÔNG
NGHIỆP
1 Mối quan hệ giữa tin học và tự động hoá
2 Vai trò của tự động hoá trong sản xuất và đời sống
3 Ứng dụng tự động hoá trong một số lĩnh vực sản xuất
nông nghiệp
IL XÂY DỰNG CẤU TRÚC HỆ THỐNG TƯỚI TỰ ĐỘNG
1 Chế độ tưới nước cho cây rau sạch
1.1, Đất, nước và cây trồng
12 Điều kiện để sản xuất cây rat sạch
1.3 Xác định nhu cdu HƯỚC tưới
1.4 Xác định thời gian tưới nước
2 Phương pháp và kỹ thuật tưới nước cho cây rau sạch
2.1 Khái niệm chung
2.2 Kỹ thuật tưới phún mua
HL XÂY DỰNG THUẬT TOÁN TƯỚI TỰ ĐỘNG MÔ HÌNH
Iv THIẾT KẾ HỆ THỐNG ĐIỂU KHIỂN TƯỚI TỰ ĐỘNG
QUÁ TRÌNH SẢN XUẤT RAU SẠCH
1 Lựa chọn thiết bị cho hệ thống tưới tự động
1.1 Chọn các loại thiết bị đo 1.2 Chọn thiết bị cho hệ thống tưới phun mua 1.3 Chọn thiết bị điều khiển
14 Sơ đô tổng thể của hệ thống tưới phun mua
2 Cấu trúc chương trình điêu khiển hệ thống tưới tự động
2.1 Cấu trúc bộ nhớ của CPU 2.2 Vòng quét chương trình
Trang 153 Lập trình có cấu trúc chương trình điều khiển hệ thống
tưới tự động,
3.1 Sơ đồ cấu trúc
3.2 Viết chương trình điều khiển chế độ tới tự động
TÀI LIỆU THAM KHẢO CHƯƠNG V
CHUONG VI TIN SINH HỌC CẢI THIỆN
DI TRUYỀN NÔNG NGHIỆP
I VAI TRÒ CỦA TIN SINH HỌC TRONG NGHIÊN CỨU
GENE VÀ CẤU TRÚC PROTEIN
1 Giới thiệu về công nghệ tin sinh học và sinh học phân tử
1.1 Một số vấn để của công nghệ tin sinh học
1.2 Sơ lược về sinh học phân tử
2 Sự sắp xép so sanh gene
2.1 Sắp xếp trình tự từng cắp gene
2.2 Sắp xếp so sánh các hé gene
2.3 Sắp xếp trình tự Ẳa gene
3 Nối kết và phân tich gene
3.1 Nối kết đoạn DNA
3.2 Thiết kế DNA môi
3.3 Sự đa dạng nucleotide đơn
3.4 Phát hiện sự lặp lại trình tự đơn
3.5 Phân tích biểu hiện gene
IL KHÁI THÁC CƠ SỞ DỮ LIỆU GENE VÀ ỨNG DỤNG
TRONG NÔNG NGHIỆP
1 Một số nguyên tắc xây đựng và khai thác cơ sở đữ liệu
gene
1.1 Nguyên tắc xây dưng
1.2 Khai thác dữ liệu từ các nguồn khác nhau
2 Một số hệ thống dữ liệu gene ứng dụng trong nông
nghiệp
2.1 Hệ thống đữ liệu gene các cây trồng chính
2.2 Các hệ thống cơ sở dữ liệu hệ gene động vật
II TIN SINH HỌC TRONG DI TRUYỀN NÔNG NGHIỆP
1 Xây dựng bản đồ di truyền liên kết
Trang 161.1 Gene đánh đấu di truyền
1.2 Phả hệ
1.3 Khoảng cách đi truyền
1.4 Phát hiện liên kết
1.5 Phân tích marker
2 Các phương pháp tin sinh học tìm kiếm gene
2.1 Phương pháp so sánh giải mã gene
2.2 Phân tích mất cân bằng liên kết
2.3 Mô hình thành phần phương sai
2.4 Kết hợp phân tích liên kết và mất cân bằng liên kết
(LDLA)
2.5 Thiết kế thí nghiệm LDLA
3 Xây dựng các hệ thống đánh giá di truyền
3.1 Giới thiệu
3.2 Tóm lược di truyền số lượng
3.3 Ước tính các thông số di truyền
3.4 Ước tính giá trị giống (giá trị di truyền)
IV KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU
TÀI LIỆU THAM KHẢO CHƯƠNG VI
CHƯƠNG VỊI INTERNET VÀ CÁC DỊCH VỤ
THÔNG TIN NÔNG NGHIỆP
1.INTERNET VÀ CÁC DỊCH VỤ INTERNET
1 Internet
2 World Wide Web va thu dién tir
2.1 World Wide Web
2.2 Thư điện tử
3 Dịch vụ thông tin trên Internet
Il THÔNG TIN, DẠNG THỨC VÀ NGUỒN THÔNG TIN
1 Thông tin và tri thức
2 Sự bùng nổ thông tin
3 Các dạng thức và nguồn thông tin
4 Báo chí định kỳ
5: Các nguồn tham khảo
6 Cách thức tổ chức tư liệu trong thư viện
Trang 17Ill KHAI THAC DỊCH VỤ CUNG CAP THONG TIN 463
1 Cơ sở đữ liệu tham khảo 463
2 Danh mục tra cứu thư viện trực tuyến 466
3 Mô-tơ tìm kiếm và danh bạ Web 424
6 Đánh giá nguồn tài liệu trên Internet 478
IV MOT SO DICH VU THONG TIN NONG NGHIEP 481
2 Một số dịch vụ thông tin của tổ chức FAO 485
V XÂY DỰNG DỊCH VỤ THÔNG TIN NÔNG NGHIỆP 494
3 Sơ lược về thiết kế và lập trình Web 498
4 Triển khai dịch vụ thông tin nông nghiệp 500
16
Trang 18CHUONG I
XỬ LÝ SỐ LIỆU TRONG THỐNG KÊ SINH HỌC
VÀ NÔNG NGHIỆP
1 XỦ LÝ SỐ LIÊU THỐNG KÊ SINH HỌC TRONG EXCEL
Phân mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu sinh học và nông nghiệp nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools> Data Analysis (nếu không có mục này thì chon Tools> Add-in
> Analysis ToolPak dé cài đặt thêm) Sau đây là một số công cụ xử lý số liệu thống kê mà Excel cung cấp
1 Thống kê mô tả
Thống kê mô tả cho phép tính các số đặc trưng mẫu/ các giá trị thống
kê mẫu như trung bình, độ lệch chuẩn, sai số chuẩn, trung vị, mode Số liệu tính toán được bố trí theo cột hoặc theo dòng
4 Các bước thực hiện trong Excel
Chọn Tools>Data Analysis>Descriptive Statistics, va khai báo các mục sau trong hộp thoại:
- Input range: mién dit liéu kể cả nhãn
- Grouped by: Column (sé6 ligu theo cét)
- Labels in first row ; Đánh đấu Ý vào ô này nếu có nhãn ở dòng đầu
- Confidence level for mean: 95% (d6 tin cay 95%)
- K-th largest: 1 (1 Số lớn nhất, 2 số lớn nhì )
- K-th smallest: 1 (1 Số nhỏ nhất, 2 số nhỏ nhì )
- Output range: mién ra
- Summary Statistics: Danh dau Ý nếu muốn hiện các thống kê cơ bản
17
Trang 19Ví dụ 1 Khảo sát về các đặc tính của lúa ta thu được bốn cột số liệu: dài bông (cm), P1000 (trọng lượng 1000 hạt), số bông, năng suất Số liệu được bố trí như trong hình I.I
Chon Tools>Data Analysis>Descriptive Statistics, sau dé khai béo hộp thoại (xem hình I.1)
Hình I.1 Bảng số liệu khảo sát về lúa và khai báo hộp thoại
Kết quả thu được cho trong hình 1.2
‘Mean (rung binh) 264 Mean 244Mean l6l6Man 41
šanarl Eror (gi số chu) 0.25 Standan 0.49 Standard 2.571 Sandard 0.094
123 | Median (rung ¥) 26Medin 25Medan 165 Medan 4
{Mode (mode) 2% Mode 25Mode «16S Mode 4
‘Standard Deviation (do lic chun) 0.99 Standan 1.88 Standard 9.956 Standard 0.364
Sampb Varance (phương sai miu) 0.97 Sample 3.54 Semple V 99.11 Sample 0.133
mosis (49 nhon) 081Kurosit -1Kmods 0.569 Kunosis 1.307
[52!Sum (og) 96S %6§m 2514Sum 6l9
Coun (65 quan st) SCom | Com | Com 15
0.06 Skewne -0.3 Skewness 1.346 Skewnes 1042 3Range 6 Range 3lRang 14
25 21Minimur 157 Minimn 36
28 Maxim 27 Maximun I88Maximu 5
WBlagest 2 Lages(l 188 largest 5
25 Smalls 21§maleg( 157 Smalest 36
055 ConBde 104 ConEden_ 5 513 ConBdet 0202
Hình I.2 Kết quả thống kê mô tả về các đặc tính của lúa
Trang 20b Phân tích các kết quả thu được
Một số nhận xét sơ bộ trên các thống kê thu được như sau:
~ Mean cho ta giá trị trung bình của dãy số
~ Median cho giá trị điểm giữa của đãy số
Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân đối Trong ví dụ 1 các cột số liệu là cân đối trừ cột “số bông” hơi bị lệch
- Phương sai mẫu hay độ lệch chuẩn mẫu cho ta biết độ phân tần của
số liệu quanh giá trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng tập trung
- Kurtosis đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay tù hơn đường mật độ chuẩn Nếu trong khoảng từ -2 đến 2 thì có thể coi số liệu xấp xỉ chuẩn
- Skewness đánh giá đường phân phối lệch trái hay lệch phải Nếu trong khoảng từ -2 đến 2 thì có thể coi số liệu cân đối gần như số liệu trong
phân phối chuẩn
- Confidence level được hiểu là nửa độ dài khoảng tin cậy Giả sử Confidence level là m thì khoảng tin cậy của trung bình tổng thể là: (mean-
m , mean+m) Trong ví dụ 1, hình L2, ta có khoảng tin cậy 95% của “dài bông” là: (26.4- 0.55 , 26.4 +0.55), tức là (25.85, 26.95)
2 Tổ chức đồ
Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác hoạ biểu đỏ tân số, còn gọi là tổ chức đồ Để vẽ tổ chức đồ cần phải tiến hành phân tổ / nhóm số liệu
2.1 Tạo miên phân tổ
Để tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau:
- Dùng các hàm Min, Max để xác định giá trị nhỏ nhất và giá trị lớn nhất
- Định ra giá trị cận đưới và giá trị cận trên của miền phân tổ
- Ghi giá trị cận dưới vào 6 đầu của miền phân tổ và bôi đen toàn miền này
19
Trang 21- Chon Edit > Fill > Series để khai báo các mục:
+ Trong muc Series in chon Columns (dit liéu theo cột)
+ Trong muc Type chon Linear (dit liéu tang theo cap s6 céng) + Trong Step value: nhap giá trị bước tăng
+ Trong Sfop value: nhập giá trị cận trên
+OK
Vi du 2 Dựa trên 30 số liệu về chiều đài cá ta tạo miền phân tổ (Bin) như trên hình I.3 với miễn phân tổ từ ô D2 tới ô D12 (kể cả nhãn), giá trị cận dưới là 10, cận trên là 55, giá trị bước tăng 5
Chọn 7ools> Dara Analysis> Histogram để khai báo các mục:
- Input range: mién dit liéu
- Input Bin: mien phân tổ
~ Labels : nhãn ở dòng đầu nếu có
- Output range: mién két qua
- Pareto: tin s6 sap xép giảm dân
- Cumulative percentage: tan suat cong dén %
20
Trang 22- Chart output: biéu d6
Trang 23c Phân tích kết quả
, ~ Tân số số liệu rơi vào từng khoảng được ghỉ ở cận trên của khoảng (Chẳng hạn, có 2 số liệu thuộc vào khoảng (10,15], vì vậy số 2 được ghi tương ứng với số 15 là cận trên)
- ~ Nhìn vào hình L5 ta có thể thấy trong khoảng nào số liệu xuất hiện nhiều nhất Ngoài ra, hình dạng của tổ chức đồ còn cho biết: dãy số liệu khảo sát được về chiều dài của cá có thể coi là tuân theo luật chuẩn
3 Tính hệ số tương quan và tìm phương trình hồi qui
3.1 Tính hệ số tương quan
Excel cho phép tính hệ số tương quan đơn giữa các biến sắp xếp thành một bảng gồm n hàng, n cột (mỗi cột là 1 biến)
a Các bước thực hiện
Chon Tools>Data Analysis>Correlation va khai báo các mục:
- Input range: mién dữ liệu kể cả nhãn
- Grouped by: Column (số liệu theo cột)
- Labels in first row : Đánh dấu vào ô này nếu có nhãn ở đồng đầu
- Output range: mién ra
- OK
Ví dụ 3 Để nghiên cứu mối tương quan giữa các đặc tính dài bông, số hạt, số bông với năng suất lúa, cần thực hiện các bước sau:
- Chon Tools>Data Analysis>Correlation
- Khai báo các mục (xem hình I.6)
ST Tui thie civ in AT đế ÔN, C [epee bE Pel eo we ee 1
2 uheg [PO noag [weg sat
Trang 24- Kết quả thu được trên bảng II
Bảng I.1 Kết quả tính hệ số tương quan
- Hệ số tương quan của dòng và cột ghi ở ô giao giữa dòng và cột
- Hệ số tương quan âm (< 0) thể hiện mối tương quan nghịch biến (chẳng hạn tương quan giữa “đài bông” và “số bông” là nghịch biến)
- Các hệ số tương quan có giá trị tuyệt đối xấp xỉ 0.75 trở lên thể hiện mối tương quan tuyến tính mạnh giữa hai biến (tương quan giữa “năng suất”
và “P1000” có thể tạm coi là tương quan tuyến tính mạnh)
3.2 Tìm phương trình hồi quy
Excel cho phép tìm phương trình hồi quy tuyến tính đơn y= a+ bx và hổi quy tuyén tinh boi y= a, + a,x, + ä;X; + + a,x„ Các biến độc lập chứa trong n cột, biến phụ thuộc y để trong một cột, các giá trị tương ứng giữa biến độc lập và biến phụ thuộc được xếp trên cùng một hàng
a Các bước thực hiện
Chọn Tools>Data Analysis>Regression và khai báo các mục:
- Input y range: miễn đữ liệu biến y
- Input x range: miễn đữ liệu các biến x
- Label: Đánh dấu Ý vào 6 nay nếu có nhãn ở dong dau
- Conftdence leve:: 95% (độ tin cậy 95%)
- Constant in zero: Đánh dấu Ý nếu hệ số tự do a, = 0
- Output range: mién xuất kết quả
- Residuats: Đánh dau ¥ vao 6 nay dé hién phén du hay sai léch gitta y thực nghiệm va y theo hồi quy
- Standardized residuals: Đánh dấu + để hiện phần dư đã chuẩn hoá
~ Residuals plor: Đánh dấu 3 để hiện đồ thị phần dư
23
Trang 25- Line fit plots: Danh dấu A để hiện đồ thị các đường dự báo
- Normal probability plot: Panh dau V dé hién d6 thị phan du da chuẩn hoá
-OK
Ví dụ 4 Tìm phương trình hồi quy y= a + aX + 2X2 + a,x, cha năng suất lúa y phụ thuộc tuyến tính vào độ dai bông (x,), trong lượng 1000 hat (x,) va số bông (x;) với các số liệu cho trong hình L7
QRREBRYRRRRS
Hình I.7 Khai báo để tìm phương trình hổi quy
Chon Tools>Data Analysis>Regression và khai báo các mục như trên
hình 1.7 để thu được kết quả như trên hình 1.8
Z 6i 1844196 :220346 0049/62 8 1228852" 72
0111608 0060312 1835297 0093621 -0022238268 0.245454 Đ07g694 0033788 2239972 0048/04 001317267 02011 0006123 3294208 0.007279 — 0066632992 5 0.15005
Hình I.8 Kết quả tìm phương trình hồi quy
24
Trang 26b Phân tích kết quả
- Nếu hệ số tương quan bội (Muluple R) xấp xÏ 0.75 hoặc lớn hơn thì
mô hình hồi quy tuyến tính là thích hợp (ngược lại nên tìm mô hình khác) Trong ví dụ 4 hệ số tương quan bội là 0.8589 nên mô hình tuyến tính được coi là thích hợp
~ Hệ số tương quan bình phương (R square) trong ví dụ 4 là 0.7377 cho biết 73.77% sự biến động của y là do các yếu tố X., X;, X gây nên
- Hệ số tương quan hiệu chỉnh bình phương (Adjusted R square) là 66.62% không sát gần với R square chứng tỏ không phải tất cả các biến đưa vào là thực sự cần thiết
- F thực nghiệm là 10.3128! ứng với xác suất 0.00158 nhỏ hơn mức xác suất ý nghĩa 0.05 nên phương trình hồi quy tuyến tính được chấp nhận
~ Nhìn vào các hệ số của các biến ta viết được đường hồi quy dự báo Trong ví dụ 4 phương trình hồi quy là: y = - 4.06364 + 0.111608x, + 0.075684x; + 0.02011x, Tuy nhiên căn cứ vào các xác suất cho ở cột P- value thì hệ số của x, là không đáng tin cậy, vì xác suất tương ứng > 0.05 (mức ý nghĩa đã chọn) Trong trường hợp này, cần tiến hành lọc bớt biến x,
để được đường hồi quy với các hệ số đều có ý nghĩa
4 Phân tích phương sai
Phân tích phương sai là công cụ chủ yếu để phân tích các số liệu khi théo dõi ảnh hưởng của các nhân tố (factor) và ảnh hưởng tương tác của chúng Để thu thập số liệu, thí nghiệm cần được thiết kế phù hợp với mục đích nghiên cứu và điều kiện cụ thể nơi tiến hành thí nghiệm Để phân tích một nhân tố, thí nghiệm thường được thiết kế theo kiểu hoàn toàn ngẫu nhiên, kiểu khối hoàn toàn ngẫu nhiên, hay ô vuông La tỉnh Để phân tích hai nhân tố, thí nghiệm được bố trí theo kiểu trực giao, kiểu chia ô lớn, ô vừa, ô nhỏ, hoặc kết hợp vừa chia băng vừa chia ô Từ ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức hay mỗi nhân tố có ba mức
4.1 Phân tích phương sai một nhân tố
Phân tích phương sai một nhân tố được sử dụng để phân tích số liệu
25
Trang 27khi theo doi ảnh hưởng của các mức của nhân tố tới kết quả, như ảnh hưởng của các công thức cho ăn đến năng suất thịt lợn, ảnh hưởng của các công thức phun thuốc sâu đến tỷ lệ sâu bệnh
Để phân tích phương sai một nhân tố cần thiết kế thí nghiệm kiểu hoàn toàn ngẫu nhiên, mỗi mức lặp lại một số lần, số lần lặp của các mức của nhân tố không cẩn phải bằng nhau Số liệu được điển theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng với một mức của nhân tố), ô đầu tiên ghi tên mức, các ô tiếp theo ghi số liệu
a, Các bước thực hiện
Chon Tools> Data Analysis > Anova: Single Factor và khai báo:
- Input range: Khai báo miễn đữ liệu vào {một chữ nhật bao trùm toàn
bộ các ô chứa tên mức và toàn bộ các số liệu)
- Gronped by: Column (số liệu theo cột) hoặc row (số liệu theo hàng)
- kabel im frst column : nhãn dòng đầu
- Nếu kết luận các công thức có tác động khác nhau tới kết quả thì phải tiến hành bước tiếp theo là so sánh các công thức để rút ra công thức nào tốt nhất
Ví dụ 5 Thí nghiệm ảnh hưởng của các loại thuốc đến năng suất lúa (11 loại thuốc là T1 đến T11, 4 cột số liệu là năng suất thu được), số liệu thu được cho trong bảng L2, các lệnh thực hiện trong Excel được minh hoạ trong hình 1.9, còn kết quả cho trong bảng 1.3
26
Trang 28Bảng I.2 Ảnh hưởng của các loại thuốc đến năng suất (ns) lúa
TI 3.187 4.61 3.562 3.217 T2 3.39 2.875 2.775
T3 2.797 3.001 2.505 3.49 T4 2.832 3.103 3.448 2.255 T§ 223 2.743 2.727
Trang 29Bang 1.3 Két quả phân tích phương sai
TẾ 3 7.694 2.564667 0.122321 T7 4 9.934 2.4835 0.296198
T8 3 66 2.2 0.044469
T 10 4 14.192 2.798 0.184963 T11 4 4.949 1.23725 0.081114
ANOVA
Source of Variation ss of MS F P-value F crit Between Groups 15.1039 10 1.51039 8.54171 2.66E-06 2.1768 Within Groups 5.1279 29 0.17682
Total 20,2319 39
Từ bảng L3 ta kết luận các công thức có tác động khác nhau tới năng
suất lúa Ngoài rä có thể nhận xét rằng công thức T1 cho năng suất cao nhất
Tuy nhiên, để kết luận chính xác hơn về điều này cần so sánh trung bình
Bảng 1.4 So sanh trung binh giita cac nhom
Trang 30
Phần mềm Excel không cho phép so sánh các trung bình của các nhóm ứng với các mức của nhân tố (các công thức) Tuy nhiên, nếu cần so sánh trung bình m, (với r, lần lặp) với trung bình m, (r, lần lặp) người dùng có thể
tự tinh thém LSD (Least Significance Difference) theo cong thitc LSD = tạ;
x SQRT((1/r, + U/r)), trong đó s” là phương sai chung được ước lượng bởi trung bình sai số bình phương trong nội bộ nhóm (MS within groups), œ = 1-
p và tạ.,là giá trị t của bảng Student ứng với mức ý nghĩa œ và f bậc tự do
tạ có thể tìm được bằng cách tra bảng số hay bang ham TINV trong Excel Trong ví dụ 5, để so sánh ảnh hưởng của thuốc T1, T2 đến năng suất lúa, trước hết cần tính trị tuyệt đối của hiệu các năng suất trung bình m,, m;
| m,- my! khi str dung 2 loại thuốc trên (chính bằng 0.6307, xem bảng 1.4) Ứng véi t= (0.05 , 29) =2.045 (tra tir bang Student), s*= 0.17682, LSD được tính cho các trường hợp r,, r, bằng 3 hoặc 4 như sau:
4.2 Phân tích phương sai hai nhân tố không tương tác
Khi phân tích phương sai hai nhân tố A và B thì có thể xảy ra các hai trường hợp: trường hợp A va B không tương tác (biến động gây nên bởi tác động đồng thời của A và B gần sát 0) và trường hợp A và B tương tác (nếu trái lại) Phân tích phương sai một nhân tố bố trí kiểu khối hoàn toàn ngẫu nhiên được coi là trường hợp riêng của phân tích phương sai hai nhân tố không tương tác (nhân tố khối là nhân tố thứ hai không tương tác với nhân tố thứ nhất) Khi phân tích phương sai hai nhân tố không tương tác, số liệu cần được sắp xếp theo cách sau: hàng là các mức của nhân tố thứ nhất, cột là các
2
Trang 31mức của nhân tố thứ hai (trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì hàng là các mức của nhân tố, cột là các khối ngẫu nhiên)
a Các bước thực hiện
Chon Tools >Data Analysis >Anova: Two Factor Without Replication sau đó khai báo tiếp các thông tin trong hình I.10 và kích OK
Hình I.10 Hộp thoại khai báo để phân tích phương sai không tương tác
Vi du 6 Bố trí thí nghiệm phân tích nhân tố 1 (có bốn mức) theo khối hoàn toàn ngẫu nhiên (nhân tố 2 có bốn khối), ta thu được các số liệu như trong bảng L5
Bảng L.5 Số liệu phân tích một nhân tố theo khối ngẫu nhiên
Trang 32
Kết qua thu được khi phân tích phương sai cho ở bảng 1.6
Bảng 1.6 Két qua phân tích phương sai hai nhân tố không tương tác
4.3 Phân tích phương sai hai nhân tố tương tác
Trong trường hợp này khi phân tích phương sai ta phải tính đến sự tác động đồng thời của nhân tố 1 và nhân tố 2 Số liệu sắp xếp như sau:
- Nhân tố I đánh theo hàng với các mức khác nhau, nhân tố 2 đánh theo cột với các mức khác nhau
- Mỗi mức của nhân tố 1 (thường gọi là nhân tế A) được dành k hàng
31
Trang 33(cho k lần lap) con méi mức của nhân tố 2 (thường gọi là nhãn tố B) là 1
Muốn so sánh các trung bình ta làm như phân tích I nhân tố sau khi tìm giá trị t bằng hàm TINV với số bậc tự do của sai số và căn cứ vào số lần lập của các trung bình mà ta muốn so sánh
Bảng I.7 Năng suất bông (ta/ha) Mức 1
14
C.thức 3
32
Trang 34Thực hiện các lệnh phân tích phương sai hai nhân tố tương tác như minh hoạ trên hình L.11
Hình I.11 Hộp thoại khai báo khi phân tích phương sai hai nhân tố tương tác
Kết quả phân tích phương sai cho ở bảng L8
Bang I.8 Kết quả phân tích phương sai hai nhân tố tương tác
Trang 35
Totat 261.9167 |47
b Phân tích kết quả: Theo kết quả xử lý, ta rút ra kết luận:
- Fa=l4.9898 > F¿„u= 2.86627, do đó các công thức phân bón ảnh hưởng rõ rệt đến năng suất bông
- F,= 3.22194 < Fạ¿ụ = 3.25944, nên tăng mật độ cây không hy vọng làm tăng năng suất bông
~ Fxg = 1.46684 < Fysqy = 2.36375, nên ảnh hưởng đồng thời của cả hai nhân tố không tác động đáng kể tới năng suất bông
- Bang SUMMARY cho két qua tính toán từng cấp của nhân tố A (viết theo dòng) và chung cho toàn bộ mẫu, bao gồm: số quan sát (count), tổng giá trị quan sát (sum), trị số trung bình (average) va phuong sai (variance)
- Bảng phân tích phương sai ANOVA: Cột đầu tiên là các nguồn gây
ra biến động (source of variation) gồm có: mẫu (sample) là các biến động do -nhân tố viết theo hàng gây ra, biến động của nhân tố B - viết theo cột (columns), biến động do tác động tương tác của các nhân tố A và B
34
Trang 36(interaction), bién động ngẫu nhiên (within) và của tất cả các yếu tố trên (total) Các cột khác gồm: tổng sai số bình phương (SS), sé bac tr do (df), tổng sai số bình phương trung binh (MS =ss/df), gid tri F thuc nghiém (F), giá trị xác suất P và giá trị F lý thuyết tương ứng với các yếu tố trong cột thứ nhất
5 So sénh hai mau
Bài toán ở đây là cần so sánh hai mẫu thông qua việc kiểm định giả thuyết Hạ : m; = m; (kỳ vọng của biến X bằng kỳ vọng của biến Y) với đối thuyết H,: m, # m, ở mức ý nghĩa œ trong trường hợp kiểm định hai phía Nếu kiểm định một phía thì đối thuyết H, là m, > m; (khi x > y) hoặc m, < m; (khi x < y)
3.1 So sánh hai mẫu độc lập khi biết phương sai a} va ơ
Rút mẫu độc lập từ hai tổng thể phân phối chuẩn, trong một số tình huống nào đó chúng ta có thể ước lượng được phương sai (thường xảy ra khi điều tra lại một tổng thể sau một thời gian chưa lâu, nên phương sai chưa thay đổi, do đó lấy phương sai của lần điều tra trước làm ơj và ơ?, chẳng hạn khi xem Äét các kết quả phân tích của hai phòng thí nghiệm mà độ chính xác đã ồn định, từ đó có các ước lượng về phương sai)
a Các bước thực hiện
Chọn Tools >DatalAnalysis > z-Test: Two Sample for Means, sau đó lần lượt trả lời:
- lnpMl variable Ì range: miền vào của biến 1 tức là miễn chứa số liệu,
kể cả tên đồng đầu của mẫu quan sắt
- Input variable 2 range: miễn vào của mẫu quan sát thứ hai kể cả tên đồng đầu của mẫu quan sát
~ Labels: nếu cân thêm dòng đâu vẻ tên biến thì chọn mục này
- Hypothesized means difference: giả thuyết về hiệu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hụ: m,=m, thì ghi 0 Nếu lấy giả thuyết H;: m,=m;+d (d là ! số nào đó) thì ghi d
- Variable 1 variance: phuong sai cha biến 1(nhập gỉ)
- Variable 2 variance: phuong sai của biến 2 (nhập g )
35
Trang 37- Output range: Chon miễn trống để đưa ra kết quả
Ví dụ 8 Thực hiện thí nghiệm với mẫu 1 có 10 quan sát, mấu 2 có 12 quan sát ta có bằng số liệu sau, biết phương sai của biến 1 là 007, của biến 2
là 006
x |34 | 44 | 35 | 35 | 36 | 37 | 37 | 37 | 37 | 39
y | 32] 32 | 34 | 34 | 36) 36 | 36 | 36 | 36 | 36 | 36 | 36
Kết quả so sánh hai mẫu cho ở bang 1.9
Bảng 1.9 Kết quả so sánh hai mẫu độc lập
1z-Test: Two Sample for Means
- Trung bình của mẫu â;Và a)
- Phương sai đã cho (đ†, Ø2)
- Số quan sat n,và n;
~ Giá trị z thực nghiêm
- Giá trị P một phía và giá trị P hai phía
- Giá trị z lý thuyết (tới hạn) một phía và tai phía
- Giá trị z thực nghiệm tính theo công thức sau;
„-a; |/Sqrt(ø} /n+ 2 ín)
36
Trang 38Chú ý rằng, có thể dùng một số hàm trong Excel để tính một số kết quả:
- Giá trị P một phía tính bằng hàm 1-Normsdist(z)
- Giá trị P hai phía tính bằng hàm (1-Normsdist(z))*2
- Giá trị tới hạn của hàm phân phối chuẩn tắc z một phía tính bằng
hàm Normsinv(0.95)
- Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975)
Trong ví dụ 8 ta thấy: giá trị z thực nghiệm 2.88675 lớn hơn z lý thuyết (tới hạn) một phía I.64485 cũng như z lý thuyết hai phía 1.95996 (gid trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05) Kết luận: kỳ vọng của hai biến khác nhau
5.2 So sánh hai mẫu kiểu cặp đôi
Ta xét thí dụ: lấy một ổ chim và cân trọng lượng chim cái, trọng lượng chim đực ta được hai mẫu quan sát của hai tổng thể chim cái và chim đực Nếu lấy một số chim đực ngẫu nhiên trong nhiều chim đực và lấy một số chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sá: độc lập Trường hợp khác, nếu ta đem 10 mẫu đất, mỗi mẫu chia đôi, một nửa giao cho phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B thì thu được số liệu cặp đôi để so sánh kết quả của hai phòng phân tích; hoặc nếu ta đem hai giống lúa cấy trên một số ruộng, mỗi ruộng chia đôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cặp đôi để so sánh; hay nếu đo một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và đo lại chỉ số đó sau một thời gian điều trị thì có hai mẫu quan sát cặp đôi để đánh giá hiệu quả điều trị
Chú ý rằng, khi rút hai mẫu cặp đôi ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp thành cặp đứng ở hai cột cạnh nhau
Trang 39- Input variable 2 range: Mién vao cha m4u quan sat thit hai ké cả tên dong dau cha mau quan sat
- Labels: Nếu cần thêm dòng đầu vẻ tên biến thì chọn mục này
- Hypothesized means difference: Gia thiét vé hiéu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hạ: m,=m; thì ghi 0 Nếu lấy gia thuyết Hạ: m,=m;+d (d là một số nào đó) thì ghi d
- Output range: Chon mién tréng dé dat ra két quả
Ví dụ 9 Có 8 cặp số liệu của hai mẫu x và y cho trong bang sau
Thuc hién phan tich trong Excel ta được bảng kết quả (bảng I.10)
Bảng 1.10 Kết quả so sánh hai mẫu cặp đôi
x y Giải thích
Variance 19.54 | 23.451 |Phương sai mẫu
Pearson Correlation 0.96187 Hệ số tương quan R
Hypothesized Mean 0 Giả thuyết về hiệu số trung bình
Difference
It Stat 3.31055 Giá trị t thực nghiệm
P(T<=t) one-tail 0.00647 Gia tri P mat phia
It Critical one-tail 1.89458 Gia tri t lý thuyết khi kiểm định một phía P(T<=t) two-tait 0.01293 Giá trị P hai phía
† Critical two-tail 2.36462 Giá trị t lý thuyết khi kiểm định hai phía
b Phân tích kết quả
Bảng kết quả có hai cột cho hai mẫu quan sát Bảng này có các hàng:
- Trung binh miu a,, a,
- Phương sai mẫu s;, sĩ
- Số quan sát n, và n; (bằng nhau và bằng số cặp số liệu n)
- Hệ số tương quan r của 2 mẫu (coi như 2 biến)
38
Trang 40~ Bac ty do f dé kiém dinh gia thuyet H,, f bang số cap (n-1)
- Giá trị t thực nghiệm (giá trị tuyệt đối) : 3.31055,
- Giá trị P một phía: 0.0647
- Giá trị t một phía: 1.894577508
- Giá trị P hai phía: 0.01293
- Giá trị t hai phía: 2.36462256
Do t thực nghiệm lớn hơn t lý thuyết một phía cũng như hai phía (giá trị P một phía và hai phía đều nhỏ hơn mức ý nghĩa œ = 0.05), nên trong ví
đụ trên ta chấp nhận giả thuyết Hị
3.3 So sánh hai mẫu độc lập với giả thuyết hai phương sai bằng nhau Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể được tiến hành một cách độc lập thì chúng ta có hai mẫu độc lập Nếu dung lượng của cả hai mẫu đều lớn (thường quy ước là n, > 30, n; > 30) ta có thé tiến hành z-test nhưng thay hai phương sai của tổng thể co? va ø? bằng phương sai mẫu s? va s? Trường hợp mẫu bé (n,,n; nhỏ hon 30) thi ta gặp bài toán khó, gọi tên là bài toán Berens — Fisher, Trong trường hợp này, nếu coi hai phương sai của hai tổng thể bằng nhau (cần kiểm định giả thuyết phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính toán như Sau:
a Các bước thực hiện:
Chon Tools >Data Analysis > t-Test: Two-Sample Assuming Equal Yariances, sau đó lần lượt trả lời:
- Input variable J range: mién vao của biến 1 tức là miền chứa số liệu,
kể cả tên dòng đầu của mẫu quan sát
~ Input variable 2 range: miễn vào của mẫu quan sát thứ hai kể cả tên dòng đầu của mẫu quan sat
~ Labels: Nếu đưa thêm dong đầu về tên biến thì chọn mục này
- Hypothesized means diference: Giả thuyết về hiệu hai trung bình của hai tổng thể Nếu lấy giả thuyết Hạ; m,=m; thì ghi 0 Nếu lấy giả thuyết
39