1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phương pháp thí nghiệm và phân tích số liệu trong nghiên cứu khoa học

66 400 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 66
Dung lượng 1,32 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Cho dù là thiết kế thu mẫu dạng nào việc người nghiên cứu cần xây dựng cho mình một mô hình giả thuyết, giải thích mối tương tác giữa các yếu tố mình nghiên cứu với các yếu tố khác trong

Trang 1

1

CHƯƠNG 1 VỊ TRÍ PHƯƠNG PHÁP THÍ NGHIỆM VÀ PHÂN TÍCH SỐ LIỆU

TRONG NGHIÊN CỨU KHOA HỌC 1.1 Các bước trong tiến trình nghiên cứu khoa học

Có thể tóm tắt tiến trình của một nghiên cứu khoa học và khoa học ứng dụng trong nuôi trồng thủy sản nói riêng thông qua các bước chung như sau:

(1) Xác định đề tài nghiên cứu (2) Xây dựng đề cương – Lựa chọn phương pháp nghiên cứu (3) Triển khai nghiên cứu – Thu thập và xử lý số liệu

(4) Công bố kết quả nghiên cứu 1.2 Vị trí của học phần phương pháp thí nghiệm và phân tích số liệu

Vị trí của học phần phương pháp thí nghiệm và phân tích số liệu trong tiến trình nghiên cứu khoa học tập trung vào bước (2) và (3) của tiến trình nghiên cứu Học phần chủ yếu tập trung vào việc bố trí, hoạch định cho các thí nghiệm, định hướng xử lý số liệu (ở bước 2) và sau đó tập trung vào các bước triển khai, thu tập và xử lý số liệu (ở bước 3)

1.3 Thống kê sinh học với công tác thiết kế thí nghiệm và xử lý số liệu

1.3.1 Mục đích của công tác thống kê

Hoạt động nghiên cứu khoa học bao gồm việc “quan sát” các hiện tượng, sự kiện

tự xãy ra trong tự nhiên hoặc do chúng ta chủ động bố trí và “suy luận” để giải thích hoặc giải quyết vấn đề Qua việc theo giỏi, quan sát các hiện tượng, sự kiện ta tìm ra qui luật của các hiện tượng, sự kiện đó Từ việc nắm bắt qui luật của các hiện tượng,

sự kiện để quay trở lại phục vụ cho lợi ích của con người Mục đích của công tác thống

kê chính là tìm ra qui luật của các hiện tượng, sự kiện mà ta quan tâm nghiên cứu 1.3.2 Thống kê sinh học (Bio-Statistics)

Thống kê sinh học là môn khoa học thực nghiệm ứng dụng các phương pháp và kết quả của lý thuyết thống kê trong lĩnh vực sinh học nhằm tìm hiểu các qui luật và bản chất của các qui trình sinh học

1.3.3 Sự cần thiết phải sử dụng thống kê sinh học trong thiết kế thí nghiệm và xử lý số liệu Trong thiết kế thí nghiệm và xử lý số liệu ở các lĩnh vực sinh học, sinh thái học, nông - lâm nghiệp và nuôi trồng thuỷ sản, việc sử dụng thống kê sinh học là việc làm cần thiết và là yêu cầu bắt buộc đối với các đề tài nghiên cứu khoa học

Để mô tả các thuộc tính của đối tượng nghiên cứu, ví dụ như sức sinh sản trung

bình ± độ lệch chuẩn của cá Hồng Bạc Lutjanus argentimacus người làm nghiên cứu

cần dùng đến thống kê mô tả (descriptive statistics) Để so sánh các nhóm đối tượng hay tìm mối quan hệ giữa các biến nghiên cứu (ví dụ như so sánh sức sinh sản của cá Hồng Bạc nuôi theo ba chế độ dinh dưỡng khác nhau hay xác định tương quan giữa khối lượng thân và sức sinh sản của chúng) hoặc để phân tích các kết quả thu được người làm nghiên cứu cần dùng đến thống kê suy luận (inferential statistics) Trong luận văn tốt nghiệp đại học, luận văn cao học, luận án nghiên cứu sinh và các đề tài nghiên cứu khác, người làm nghiên cứu nhất thiết phải sử dụng thống kê (statistical analysis) để phân tích các kết quả mình thu được Các tạp chí khoa học khi xét đăng

Trang 2

tính hợp lý của các kết luận, ví dụ như trường hợp sau: “Xác xuất bắt gặp cá hồng tuổi

1 + trong vịnh Nha Trang cao hơn so với cá tuổi 2 + trở lên, 2=4,2; df=1, P<0,05”

Nghiên cứu khoa học do con người thực hiện Vì thế, các kết luận rút ra từ nghiên cứu có thể bị ảnh hưởng bởi cảm tính của người thực hiện Sử dụng thống kê sinh học trong thiết kế thí nghiệm và xử lý số liệu sẽ giúp đảm bảo tính khách quan của nghiên cứu, loại bỏ các kết luận hoặc nhận định chủ quan, cảm tính của người làm nghiên cứu [Hoàng Tùng, 2006]

Quan trọng nhất là khả năng của thống kê trong việc xử lý các biến động của sinh vật, môi trường, sai số khi thu mẫu Ta thường phải xác định các thuộc tính, đặc điểm của tổng thể nghiên cứu để mô tả hoặc kiểm chứng giả thuyết đặt ra Trong lĩnh vực Nuôi trồng Thuỷ sản đó có thể là kích thước thành thục của cá niên, nhu cầu protein của mực nang vân hổ, độ béo của sò huyết hay tốc độ tăng trưởng của cá bớp Tuy nhiên, các nghiên cứu phải dựa trên mẫu bởi khó có đủ thời gian, kinh phí và khả năng

để xem xét từng đơn vị một của tổng thể (chẳng hạn như tất cả các con cá niên đang sống ở vùng núi Việt Nam) Từ các thông số thống kê thu được được qua mẫu, người nghiên cứu sẽ ước lượng các thuộc tính của tổng thể Các thông tin này lại phụ thuộc vào mức độ biến động giữa các đơn vị trong tổng thể nghiên cứu và phương pháp thu mẫu Đặc điểm của sinh vật và môi trường sống của chúng là đa dạng và thường xuyên biến động Chính vì thế mà các kết luận rút ra được từ nghiên cứu không phải là hoàn toàn chắc chắn và được trình bày dưới dạng xác xuất Nhờ vậy, người đọc biết nếu mình lặp lại nghiên cứu này, xác xuất để có được kết quả tương tự là bao nhiêu % (thông qua việc tính toán hiệu lực thống kê chứ không phải là xác suất p tính được qua kiểm định thống kê) Nên nhớ thống kê không chứng mình điều gì cả Thống kê chỉ giúp người nghiên cứu xác định xác suất của hiện tượng quan sát được để ủng hộ hay phản bác một giả thuyết cụ thể [Hoàng Tùng, 2006]

1.3.4 Chức năng của thống kê

Trong nghiên cứu thực nghiệm thống kê được coi là một công cụ của nghiên cứu khoa học Dù là ở trong lĩnh vực khoa học nào thì thống kê đều thể hiện chức năng của mình là thu thập số liệu nếu chỉ hiểu theo nghĩa hẹp Còn nếu ta hiểu theo nghĩa rộng thì chức năng của thống kê bao gồm:

- Bố trí, hoạch định các quan sát và thí nghiệm

- Thu thập, tổng hợp và trình bày số liệu

- Tính toán các đặc trưng của đối tượng nghiên cứu

- Phân tích, suy diễn, dự đoán để đưa ra các qui luật của sự kiện 1.4 Một số phần mềm thống kê ứng dụng

Trang 3

3

Thống kê đã ra đời từ rất lâu Sau đó là sự xuất hiện của máy tính năm 1946, cho đến nay với sự hổ trợ của nhiều phần mềm chuyên dụng khác nhau như SPSS, GenStat, Minitab, SAS hay Statistica thì việc xử lý thống kê các kiểm định phức tạp đã trở nên dễ dàng hơn Trong khuôn khổ tài liệu này xin được đề cập một vài ứng dụng của phần mềm MS-Excel trong việc xử lý số liệu thống kê trong lĩnh vực sinh học, nông - lâm - thuỷ sản Hai công cụ trong phần mềm này được đề cập đến đó là hàm thống kê (Statistics) và bộ chương trình xữ lý số liệu (Data Analysis)

Trang 4

4

CHƯƠNG 2 PHƯƠNG PHÁP THU MẪU VÀ THIẾT KẾ THÍ NGHIỆM 2.1 Phương pháp thu mẫu

2.1.1 Một số khái niệm

Tổng thể nghiên cứu (Target population)

Là tập hợp chứa mọi phần tử thuần nhất theo một tiêu chuẩn nào đó mà ta cần nghiên cứu Hay tổng thể nghiên cứu là tập hợp các đơn vị cấu thành với các biến quan tâm nghiên cứu Ví dụ sức sinh sản của cá hồng bạc ở Nha Trang hay kích thước thành thục lần đầu của gà lai F1 giữa gà kiến mái với trống tam hoàng

Tổng thể thu mẫu (Sample population)

Là một phần của tổng thể nghiên cứu, phần mà ta có thể tiếp cận Ví dụ cá hồng bạc do người dân câu được hay số trại giống gà lai F1 nghiên cứu trong tổng số trại gà lai của vùng ta nghiên cứu

Mẫu (Sample)

Là một phần của tổng thể nghiên cứu có được nhờ hoạt động thu mẫu Kết quả thu được từ mẫu được dùng để suy diễn cho toàn bộ tổng thể Do vậy hoạt động thu mẫu cần đảm bảo được các nguyên tắc của nó

Đơn vị thu mẫu (Sampling unit)

Là một phần của tổng thể thu mẫu Đơn vị thu mẫu có thể là một cá thể hay một nhóm cá thể Trong nghiên cứu các tiêu chuẩn của đơn vị thu mẫu cần phải được xác định cụ thể và mô tả một cách rõ ràng Ví dụ cá hồng bạc có kích thước từ 0,5 – 8 kg hay có tuổi từ 1+

– 8+ Phương thức đo đạc (Measurement protocol)

Đó là phương thức cụ thể nhằm quan sát, đo đạc hoặc phân tích để xác định các đặc điểm cần nghiên cứu của đơn vị thu mẫu Dung lượng mẫu sẽ thu tính theo diện tích, thể tích hay khối lượng đều phải có đơn vị cụ thể Phương thức đo đạc phải bao gồm mọi công đoạn từ khi thu mẫu, bảo quản (nếu cần) đến phân tích trong phòng thí nghiệm, ghi nhận kết quả phân tích Phương thức đo đạc cần phải chỉ rõ số lượng đơn

vị thu mẫu, chủng loại, địa điểm, thời gian thu mẫu

2.1.2 Thiết kế thu mẫu

Ta có thể thiết kế thu mẫu dựa trên xác suất (probability – based design) hay thiết

kế thu mẫu có chủ ý

Đối với thiết kế thu mẫu theo xác suất thì địa điểm thu mẫu và đơn vị thu mẫu được chọn một cách ngẫu nhiên Thiết kế theo kiểu này cho ta xác suất để thu được từng đơn vị cấu thành nên tổng thể thu mẫu là như nhau

Người làm nghiên cứu có thể dùng các công cụ thống kê để đưa ra các kết luận

về tổng thể thu mẫu Thống kê sẽ giúp ta đưa ra kết luận về tổng thể nghiên cứu từ các

số liệu thu được thông qua các đơn vị thu mẫu Dựa trên kết quả phân tích thống kê người nghiên cứu sẽ đưa ra các nhận định chuyên môn

Ngược lại, thiết kế thu mẫu dựa vào phán đoán lại được xây dựng trên cơ sở hiểu biết về đối tượng nghiên cứu Trong trường hợp này người nghiên cứu không thể kiểm nghiệm thống kê để đưa ra kết luận Tính hữu ích của thiết kế dạng này phụ thuộc vào

Trang 5

5

mục tiêu, qui mô của nghiên cứu và lượng thông tin mà người nghiên cứu có về tổng thể nghiên cứu để đưa ra các phán đoán Thiết kế dạng này không cho phép lượng hóa mức tin cậy

Cho dù là thiết kế thu mẫu dạng nào việc người nghiên cứu cần xây dựng cho mình một mô hình giả thuyết, giải thích mối tương tác giữa các yếu tố mình nghiên cứu với các yếu tố khác trong môi trường và sự thay đổi của tương tác này theo không gian và thời gian là việc làm rất cần thiết khi thiết kế thu mẫu

Để thiết kế thu mẫu người nghiên cứu cần xây dựng được các yêu cầu cụ thể và chỉ ra được trình tự tiến hành thu mẫu hay nói một cách ngắn gọn là quy trình thiết kế thu mẫu:

- Xác định mục tiêu:

Mục tiêu của thu mẫu có thể là tìm hiểu về tổng thể nghiên cứu, xác định thông

số của các yếu tố quan tâm, so sánh hai tổng thể, thực hiện quan trắc định kỳ hoặc xác định các điểm bất lợi cho hoạt động Nuôi trồng thủy sản, hoạt động chăn nuôi, … Ngoài các mục tiêu kỹ thuật người làm nghiên cứu cần cân nắc đến các mục tiêu về thời gian, kinh phí và nhân lực Thiết kế thu mẫu làm sao để giúp đem lại số liệu với tính đại diện cao giúp người nghiên cứu trả lời được câu hỏi nghiên cứu đặt ra

- Xác định các yêu cầu thu mẫu:

Phạm vi của nghiên cứu về không gian và thời gian

Ước tính ban đầu về kích thước mẫu thu

Các thông số thống kê ta quan tâm nghiên cứu: Giá trị trung bình, phần trăm, xu thế, độ phân tán, …

Các tiêu chuẩn qui định chất lượng của thông số đo đạc như: Mức tin cậy α=0,05;

hiệu lực thống kê P>80%; 95% khoảng tin cậy chỉ bằng 10% của giá trị trung bình

- Xác định các yếu tố có thể ảnh hưởng đến việc thu mẫu:

Thu mẫu/ phân tích: Độ chính xác của thiết bị sử dụng, yêu cầu sử dụng thiết bị chuyên dụng, điều kiện thời tiết

Thời gian/ kế hoạch: Có những thời điểm không thu mẫu được (mùa sinh sản) Địa mạo: Rào cản của điều kiện tự nhiên không cho phép thu mẫu ví dụ như độ sâu, tốc độ của dòng chảy vào mùa mưa lũ, khoảng cách giữa các điểm thu mẫu quá

Trang 6

6

Xây dựng các phương án thu mẫu khác nhau và quyết định sử dụng phương án thu mẫu theo kế hoạch hoặc theo kiểu tùy cơ ứng biến Thu mẫu theo hoạch định là tuân thủ nghiêm ngặt thiết kế thu mẫu Thu mẫu theo kiểu tùy cơ ứng biến là xây dựng quy trình thu mẫu trước, đơn vị thu mẫu sẽ được xác định khi triển khai trong thực tế

và có thể được điều chỉnh căn cứ vào kết quả của lần thu năm trước Bất cứ thiết kế nào được xây dựng củng phải đảm bảo được mục tiêu nghiên cứu đã được đề ra Đánh giá được ưu nhược điểm của từng kiểu thiết kế và dự tính trước những trường hợp cụ thể nào gặp phải trong thực tế thì sẽ thay đổi thiết kế thu mẫu

Xác lập công thức tính toán hiệu quả và chi phí cho từng giãi pháp thiết kế thu mẫu Với mỗi giãi pháp thiết kế xây dựng mô hình thống kê hoặc công thức toán học

để xác định hiệu quả của nó khi xét đến hiệu lực thống kê hoặc độ rộng của khoảng tin cậy Thường để làm việc này cần xây dựng mô hình bao gồm các hợp phần của phương sai và ước lượng phương sai của tổng thể Tương tự, cho mỗi giãi pháp tính thử chi phí cố định (chuẩn bị cho nghiên cứu) và chi phí vận hành (công thu mẫu/ mẫu hoặc chi phí phân tích mẫu) Nếu ta thiết kế thu mẫu theo chủ ý sẽ không có bước này Xác định kích thước mẫu đáp ứng yêu cầu về chất lượng và các hạn chế khi thu mẫu với kích thước này Tính toán kích thước mẫu tối ưu (và phân bổ mẫu nếu thu mẫu nếu thu mẫu theo kiểu phân tầng hoặc phức tạp hơn) Thông thường nếu biện pháp sử dụng có độ chính xác không cao lắm, ít tốn kém thì ta thu được nhiều mẫu Ngược lại phương pháp có độ chính xác cao thường tốn kém và vì thế hạn chế số lượng mẫu thu Người làm nghiên cứu phải lựa chọn và đưa ra quyết định Kiểm tra xem các hạn chế (về hiệu quả, thời gian biểu, chi phí, thiết bị, cơ sở vật chất và nhân lực) đã được khắc phục chưa? Nếu không có phương án thiết kế nào đạt yêu cầu thì ta

có thể chọn một trong những cách sau: Xây dựng lại phương án thu mẫu, giảm bớt yêu cầu về chất lượng thông tin sẽ thu thập, tăng độ rộng của khoảng tin cậy, khắc phục các hạn chế, thay đổi hoặc điều chỉnh lại mục tiêu nghiên cứu (giảm bớt tham vọng hơn)

Lựa chọn phương án thu mẫu tiết kiệm nhất Xem xét những ưu điểm và sự chọn lựa giữa hiệu quả và chi phí của các phương án thu mẫu tốt nhất (đáp ứng được yêu cầu của số liệu và khắc phục được những hạn chế về thời gian, kinh phí, thiết bị, nhân lực, …) Tiếp tục xem xét các vấn đề mang tính thực tế hơn ví dụ như an toàn của người nghiên cứu, ảnh hưởng có thể của việc thu mẫu đến xã hội, môi trường, nguy cơ phát sinh chi phí, … Sau đó thống nhất để lựa chọn một phương án tối ưu nhất

Mô tả chi tiết phương án thu mẫu với kế hoạch dự phòng (contingency plans) khi

có tình huống không lường trước xảy ra khi thu mẫu ngoài thực địa, các biện pháp đảm bảo chất lượng, liệt kê giả định làm cơ sở cho phương án thu mẫu (đặc biệt là các giả định sẽ được kiểm chứng trong quá trình thu mẫu và đánh giá sau này)

2.1.3 Các kiểu thu mẫu

Thu mẫu theo chủ ý (Judmental sampling)

Như đã trình bày ở trên thì đây là kiểu thu mẫu dựa vào các hiểu biết về đối tượng hoặc điều kiện thu mẫu kết hợp với kinh nghiệm, phán đoán chuyên môn của người nghiên cứu để xác định vị trí thu mẫu, kích thước mẫu sẽ thu tại mỗi điểm Kết luận có thể rút ra được từ số liệu về tổng thể nghiên cứu bị hạn chế bởi tầm hiểu biết của người làm nghiên cứu, không cho phép khái quát dựa trên các nguyên lý thống kê

Trang 7

- Số lượng mẫu có thể thu được không nhiều và mẫu chỉ để xác định một vài thông số

- Thời gian và kinh phí dành cho thu mẫu rất hạn chế

- Người thiết kế thu mẫu có đầy đủ thông tin về đối tượng hoặc vùng nghiên cứu

- Mục tiêu thu mẫu là nhằm cung cấp các số liệu ban đầu hoặc để phát hiện một

số thông số quan tâm (để xây dụng một chương trình thu mẫu chi tiết hơn)

Các thông tin phải biết tùy thuộc vào lĩnh vực nghiên cứu Ví dụ muốn thu mẫu

để xác định dư lượng thuốc trừ sâu phải biết loại thuốc trừ sâu đang sử dụng trong vùng nghiên cứu, điểm xuất phát của chúng, chế độ thủy triều, dòng chảy của sông, chu trình chuyển hóa và tích tụ thuốc trừ sâu qua chuổi thức ăn, vào bùn đáy, thời gian phân hủy, ước tính lượng thuốc trừ sâu sử dụng trong lưu vực, …

Thu mẫu ngẫu nhiên (Random sampling)

Đây là kiểu thu mẫu đơn giản nhất Các đơn vị thu mẫu thuộc tổng thể nghiên cứu đều có xác suất được lựa chọn như nhau Thường sử dụng cách đánh số để chọn ngẫu nhiên Kiểu thu mẫu này phù hợp với những tổng thể nghiên cứu nhỏ hoặc độ tương đồng giữa các đơn vị của tổng thể nghiên cứu cao

Ưu điểm của phương pháp thu mẫu này là khả năng xác định các thông số thống kê một cách khách quan, dễ hiểu, dễ thực hiện và việc tính toán kích thước thước mẫu cũng như kích thước thống kê đơn giản

Nhược điểm của phương pháp này là có thể do ngẫu nhiên mà các điểm thu mẫu gần nhau quá, như vậy sẽ không đảm bảo được tính đại diện của mẫu Thu mẫu theo kiểu này sẽ không tận dụng được những hiểu biết đã có về đối tượng hoặc vùng nghiên cứu

Theo phương pháp này trước hết phải xác định kích thước của mẫu Muốn làm được việc này trước hết hết ta phải ước tính phương sai của tổng thể nghiên cứu Các thông tin sử dụng để ước tính tổng thể nghiên cứu có thể lấy từ kết quả nghiên cứu thí điểm hoặc nghiên cứu được thực hiện trên tổng thể gần giống với tổng thể nghiên cứu hoặc dựa vào mô hình toán Nếu không có thông tin gì về tổng thể thì sử dụng phép ước đơn giản sau: Độ lệch chuẩn = (Max - Min)/6 Giá trị Max và Min do người nghiên cứu ước đoán

Tiếp theo ta lựa chọn địa điểm và đơn vị thu mẫu Với một số nghiên cứu, đơn

vị nghiên cứu rất cụ thể như là trại nuôi, ao nuôi, hoặc con cá Tuy nhiên khi nghiên cứu trong môi trường đất và nước thì khó hơn nhiều Người nghiên cứu phải xác định được đơn vị nghiên cứu là gì Kích thước của từng đơn vị thu mẫu càng nhỏ thì sự biến động giữa các đơn vị thu mẫu càng lớn Sau khi đã liệt kê hết các thành phần của tổng thể nghiên cứu theo thứ tự từ 1 đến n, dùng bảng số ngẫu nhiên để chọn ngẫu nhiên các đơn vị thu mẫu cho đủ kích thước mẫu đã xác định

Trang 8

8

Hướng thu mẫu có thể là một, hai hoặc ba chiều Khi thu mẫu theo không gian

ba chiều, việc chọn điểm thu mẫu trên bản đồ không khó Nhưng việc xác định điểm thu mẫu, thu được đúng kích thước mẫu cần thiết lại không phải dễ trong thực tế Cũng có thể dụng một kỹ thuật khác là quasi – random sampling Dãy số ngẫu nhiên quasi – random sampling tạo ra theo một trình tự ngẫu nhiên và vì thế không có điểm nào trùng Điều này giúp hạn chế tối đa việc các mẫu thu có thể “dính chùm” với nhau khi chọn hoàn toàn ngẫu nhiên Sử dụng thu mẫu ngẫu nhiên kết hợp với các kiểu thu mẫu khác như phân tầng, phân bậc hay gộp có điều chỉnh

Thu mẫu phân nhóm (Stratified sampling)

Kiểu thu mẫu này thích hợp với các tổng thể nghiên cứu mà ở đó có sự khác biệt đáng kể giữa các đơn vị cấu thành Ta có thể chia tổng thể ra làm nhiều nhóm không

có khoảng trùng lặp dựa trên những đặc điểm đã biết về tổng thể hoặc những suy luận mang tính logic, có cơ sở (kết hợp với kiểu thu theo chủ ý) Việc phân chia này có thể dựa vào đặc điểm cả đối tượng nghiên cứu theo thời gian hoặc không gian Tính đồng nhất trong từng nhóm sẽ cao hơn nhiều so với tính đồng nhất của cả tổng thể và như thế cho phép người nghiên cứu ước lượng chính xác hơn về các thuộc tính của tổng thể

vì tính đại diện của mẫu thu được đảm bảo Thêm vào đó cho phép người nghiên cứu tìm hiểu sâu hơn và có thể so sánh các nhóm này với nhau

Thu mẫu hệ thống và phân ô (Systematic and grid sampling)

Với kiểu thu mẫu này, hoạt động thu mẫu được thực hiện một cách máy móc theo trình tự thời gian hoặc khoảng cách không gian đã được định trước Thời điểm bắt đầu hoặc điểm thu đầu tiên được lựa chọn một cách ngẫu nhiên Các thời điểm hoặc điểm thu còn lại sẽ được xác định dựa trên khoảng cách đã thiết kế (nếu theo không gian thì phải chia ô) Ô có thể là hình vuông, hình chử nhật, hình tam giác hoặc rẻ quạt) Kiểu thu mẫu này sẽ cho ta phát hiện xu hướng biến động theo thời gian hoặc không gian Nếu kích thước mẫu lớn, tần suất thu mẫu ngắn, khả năng khái quát các diễn biến của tổng thể nghiên cứu sẽ rất cao Kiểu thu mẫu này đơn giản và dễ thực hiện cho phép thực hiện dễ dàng các điểm thu mẫu theo nguyên tắc “ngẫu nhiên có hệ thống”

Thu mẫu gộp thích ứng (adaptive cluster sampling)

Với kiểu thu mẫu này, n mẫu được thu một cách ngẫu nhiên từ tổng thể nghiên cứu Sau đó tiến hành thu thêm tại những điểm mà kết quả phân tích cho thấy cần được quan tâm hơn (ví dụ những điểm phát hiện ra ô nhiễm hoặc có hiện tượng lạ) Vì thế phải phân tích làm nhiều vòng Kiểu thu này nhằm đảm bảo số liệu thu được là khách quan mặc dù người nghiên cứu có khi phải thu quá nhiều mẫu tại một địa điểm Kiểu thu mẫu này rất hiệu quả nếu mục tiêu thu mẫu là phác thảo vùng phân bố của sinh vật hay một yếu tố nào đó (ví dụ chất gây độc hại đến môi trường) Điều kiện để thực hiện

là phương pháp phân tích biến nghiên cứu để thu kết quả phải nhanh và lý tưởng nhất

là không tốn kém Khả năng phân tán của đối tượng nghiên cứu phải hạn chế Ví dụ để xác định các bãi giống sò huyết, đầu tiên vùng nghiên cứu được chia ô, sau đó chọn ngẫu nhiên 10 ô Dựa vào kết quả phân tích ban đầu này, nếu ô nào cho kết quả phân tích mật độ sò cao thì tiếp tục thu mẫu các ô lân cạnh quanh nó

Thu mẫu kết hợp (Composit sampling)

Kiểu thu mẫu này được áp dụng khi chi phí phân tích mẫu cao rong khi đó chi phí thu mẫu lại thấp và phương pháp thu đơn giản Người nghiên cứu sẽ tiến hành thu

Trang 9

9

nhiều đơn vị thu mẫu, trộn lẫn chúng với nhau để chỉ tạo ra một mẫu Có thể tiến hành như vậy với điều kiện việc trộn mẫu không ảnh hưởng đến kết quả (ví dụ như hàm lượng khí hòa tan) và sức khỏe của người nghiên cứu Kiểu thu mẫu này chỉ có giá trị khi người nghiên cứu chỉ quan tâm đến giá trị trung bình mà không quan tâm đến sự biến động của biến nghiên cứu theo không gian hoặc thời gian hoặc mức độ biến động của biến nghiên cứu trong tự nhiên là quá lớn (khó khăn cho việc phân tích số liệu) 2.1.4 Nguyên tắc thu mẫu

Nguyên tắc ngẫu nhiên

Đây là nguyên tắc đầu tiên của thu mẫu Bởi vì thu mẫu một cách ngẫu nhiên sẽ hạn chế đến mức tối đa các yếu tố làm sai lệch kết quả có thể do cố ý hoặc vô tình Giả

sử bạn hướng dẫn một lớp sinh viên đi khảo sát vùng triều vào một ngày mưa lạnh Mỗi sinh viên được giao nhiệm vụ thu toàn bộ các sinh vật (có thể gồm rất nhiều loài động, thực vật khác nhau) tìm được trong một khung quadrat có diện tích 1 m2

(1,0 x 1,0 m) phân loại chúng Cách thu là quăng khung quadrat đi một cách ngẫu nhiên, di chuyển lại chỗ khung rơi xuống và tiến hành thu mẫu Các sinh viên ngại mưa gió muốn xong việc cho nhanh sẽ chủ ý quăng khung vào các khu vực ít sinh vật phân bố,

có thể nhìn thấy bằng mắt (ví dụ như rong biển, rạn san hô trên đó có nhiều sinh vật sống) hoặc đoán qua kiến thức đã được học (ví dụ nền cát sẽ ít sinh vật hơn trên rạn) Như thế thông tin thu được sẽ không phản ánh chính xác các thuộc tính của quần xã sinh vật được nghiên cứu Cũng có khi vô tình mà thu mẫu tưởng là ngẫu nhiên lại trở thành chọn lọc Trong một bể nuôi tôm 6 m3

có 100 con, bạn dùng vợt nhỏ để bắt 10 con (10% của tổng thể) nhằm kiểm tra mức độ cảm nhiễm virus MBV (biết chắc chắn

là có) Kết quả là phần lớn những con bạn sẽ bắt được những cá thể yếu ớt, lờ đờ có khả năng bơi lội, búng nhảy kém Những cá thể này đa phần bị nhiễm mầm bệnh Vì thế tỉ lệ cảm nhiễm mà bạn xác định sẽ cao hơn mức thực của nó Trong trường hợp này cần thiết phải đánh số từng con một rồi chọn lựa ngẫu nhiên 10 con số hoặc rút mực nước bể, bắt toàn bộ ra cho vào một cái xô nhỏ chứa lấp xấp nước rồi bắt ngẫu nhiên 10 con (trên cạn, chúng đều nằm một chỗ hết cả, nếu có búng nhảy thì cũng chỉ trong xô - trong tầm kiểm soát của bạn)

Khi số lượng các cá thể của tổng thể không lớn lắm, ta có thể đánh số rồi dùng bảng số ngẫu nhiên để chọn Ví dụ như 63 con cá Chẽm bố mẹ trong lồng nuôi có thể được đánh số bằng thẻ từ Hay khu vực cửa sông nơi tiến hành khảo sát khu hệ thuỷ sinh có thể chia thành nhiều ô nhỏ trên bản đồ rồi chọn ngẫu nhiên Nhưng nếu số lượng các cá thể của tổng thể quá lớn, ví dụ như ở cảng cá có đến hàng nghìn con cá Chẽm được ngư dân bày bán, ta phải dùng một thủ thuật gọi là “thu mẫu 2 giai đoạn” Chia số cá này ra làm n nhóm kích thước (tuỳ ý người thu mẫu, ví dụ 100 con một nhóm Từ những nhóm này ta chọn ngẫu nhiên 1 hoặc một vài con để được số lượng mẫu cần thiết

Chỉ thu mẫu theo kiểu ngẫu nhiên nếu ta không có đủ thông tin về tổng thể nghiên cứu (ví dụ như vùng nước nào trong vịnh bị ảnh hưởng bởi nước ngọt từ sông

đổ vào hay ốc mượn hồn phân bố tập trung trên các rạn san hô chết ở vùng trung triều) hoặc biết chắc chắn đối tượng nghiên cứu phân bố đều Nói cách khác, phải sử dụng tối đa mọi thông tin đã biết về tổng thể nghiên cứu để đảm bảo mẫu thu sẽ mang tính đại diện cao nhất

Nguyên tắc đại diện cao cho tổng thể nghiên cứu

Trang 10

10

Mỗi cá thể là một phần tử của tổng thể nghiên cứu Ta thường ký hiệu số cá thể của tổng thể nghiên cứu là N và thường không xác định được chính xác các thuộc tính của N Ta ước lượng các thuộc tính của N thông qua mẫu đại diện cho tổng thể nghiên cứu Tính đại diện thể hiện mức độ tương đồng giữa kết quả đo đạc phân tích được trên mẫu với giá trị thực của các thông số hay biến cần đo đạc trong tự nhiên Không phải trong trường hợp nào thu mẫu một cách ngẫu nhiên cũng đảm bảo tính đại diện cho tổng thể từ đó mẫu được thu Tuy nhiên, việc thu mẫu một cách ngẫu nhiên sẽ giúp cho số liệu thu được khách quan và đảm bảo tính độc lập, rất cần thiết cho các kiểm nghiệm thống kê (Underwood 2005) Về nguyên tắc, nếu số lượng mẫu thu đủ lớn thì các thông số thống kê của mẫu sẽ gần với các thuộc tính của tổng thể Trong thực tế thu nhiều mẫu sẽ tốn kém và trong nhiều trường hợp không có khả năng thực hiện được Vì thế cần phải có phương pháp thu mẫu hợp lý Chẳng hạn trong tự nhiên,

ốc mượn hồn phân bố tập trung trên các rạn san hô chết gần bờ Mật độ ốc ở các khoảng trống giữa các rạn rất thấp Người nghiên cứu, mặc dù lựa chọn các điểm thu một cách ngẫu nhiên, có thể không xác định được chính xác mật độ trung bình của quần thể ốc trên một khu vực cụ thể Nếu phương pháp thu mẫu không đảm bảo được tính đại diện thì số liệu thu được sẽ không phản ánh chính xác (cao hơn hoặc thấp hơn) các thuộc tính của tổng thể nghiên cứu Chính vì thế cần phải làm mọi cách có thể để đảm bảo tính đại diện

Nguyên tắc lựa chọn kích thước mẫu

Kích thước mẫu (n) phụ thuộc vào kích thước của tổng thể nghiên cứu, yêu cầu

về số liệu (hiệu lực thống kê, mức ý nghĩa, mức độ sai khác cần phát hiện khi cần so sánh) và khả năng của người nghiên cứu (kinh phí, thời gian, trang thiết bị và nhân lực) Với yếu tố thứ 3, nguyên tắc là tối đa kích thước mẫu trong khả năng của mình Như đã đề cập, thu mẫu tức là nhằm thu thập số liệu cần thiết từ mẫu để qua các thông số thống kê tính toán được ước lượng tổng thể nghiên cứu Kết quả sẽ chính xác nếu tất cả các đơn vị cấu thành tổng thể đều được thu Tuy nhiên, điều này hiếm khi khả thi trong thực tế Chính vì thế, kích thước của mẫu phải được xem xét trong mối tương quan với kích thước của tổng thể Giả sử ta có một đàn Cua Scylla paramamosain mẹ gồm 262 con sẽ sử dụng để thực hiện một chương trình chọn giống Nếu muốn ước tính sức sinh sản trung bình của mỗi cá thể trong đàn này để chuẩn bị

cơ sở vật chất như bể ấp, bể đẻ, bể ương và ao nuôi khi tiến hành chọn giống ta có thể tiến hành thu mẫu từ đàn này và cho đẻ thử theo một qui trình đã lựa chọn Giả sử ta chọn ngẫu nhiên 35 con Như vậy ta đã sử dụng 13,4% số đơn vị của tổng thể nghiên cứu Nhưng một người làm nghiên cứu khác, muốn ước tính sức sinh sản trung bình của loài cua này ở rừng ngập mặn Cần Giờ nếu chỉ sử dụng cùng một kích thước mẫu (n = 35) cho nghiên cứu của mình thì chưa chắc số liệu đã đủ độ tin cậy, đặc biệt khi tính ngẫu nhiên khi thu mẫu không được bảo đảm Ví dụ như ngay tại điểm thu mẫu đầu tiên ở Long Thạnh (một trong nhiều xã ở Cần Giờ) đã bắt được hơn 35 con rồi Trong thực tế, rất khó có thể biết được kích thước của tổng thể mặc dù cũng có các phương pháp ước đoán, ví dụ như chỉ số Lincoln

Chỉ số Lincoln (Lincoln Index - LI) dùng để ước đoán số lượng các cá thể có trong một quần thể nhất định Mẫu được thu 2 lần, đều hoàn toàn ngẫu nhiên Lần thứ

1, đánh dấu toàn bộ các cá thể thu được, sau đó đem thả lại vào môi trường Lần thứ 2, sau một khoảng một thời gian nhất định, thu lại và căn cứ trên số lượng các cá thể bị đánh dấu có trong đợt này mà qui ra tổng số cá thể của quần thể

Trang 11

11

Trong đó:

n: tổng số cá thể thu lần 1 N: tổng số cá thể thu lần 2 r: số cá thể đã được đánh dấu có trong lần thu 2

Ta cũng có thể ứng dụng nguyên tắc này để tiến hành nghiên cứu hoạt động khai thác các đối tượng trên một khu vực xác định với điều kiện đối tượng nghiên cứu không phải là loại có khả năng di chuyển rộng hoặc có vùng phân bố tương đối tập trung

Nếu ta có thể thu được ngẫu nhiên khoảng 10% tổng thể, kết quả nghiên cứu sẽ

có độ tin cậy cao Khi không thể ước đoán được kích thước của tổng thể, phải dựa vào phương sai và yêu cầu về số liệu để tính kích thước mẫu cần thiết để đảm bảo ước lượng ta sẽ thực hiện là chính xác (95% độ tin cậy) Phương sai thể hiện mức độ khác biệt giữa các đơn vị cấu thành tổng thể và có thể lấy được từ các nghiên cứu trước trên cùng đối tượng hoặc qua một nghiên cứu sơ bộ mang tính thí điểm Công thức tính kích thước mẫu như sau:

2

2 2

2.2.1 Tầm quan trọng của thiết kế thí nghiệm

Chất lượng của một thí nghiệm phụ thuộc vào chất lượng thông tin thu được từ thí nghiệm Chất lượng của thông tin phụ thuộc vào cách thức mà nó được thu thập Thí nghiệm, nếu không được thiết kế, chuẩn bị một cách kỹ lưỡng thường đem lại rất ít thông tin hữu ích Với nhiều người, thiết kế thí nghiệm thường đi kèm với các yêu cầu hiểu biết về thống kê và những thuật ngữ toán học rắc rối, tốn thời gian Thực tế không phải như vậy Người làm nghiên cứu về NTTS hay sinh học chính là những nhà sinh học chứ không phải nhà thống kê hay toán học Thiết kế thí nghiệm đòi hỏi phải có sự hiểu biết nhất định về đối tượng hoặc hệ thống nghiên cứu, tư duy logic và sự cẩn trọng Tiết kiệm thời gian cho thiết kế thí nghiệm sẽ không dành được nhiều thời gian hơn cho công việc thu thập số liệu Ngược lại, dành thêm thời gian cho thiết kế thí nghiệm sẽ giúp tiết kiệm thời gian và đảm bảo hiệu quả nghiên cứu của mình Dưới đây là hai suy nghĩ nên tuyệt đối tránh:

r

n N

Trang 12

12

- Cách thức thu thập số liệu không quan trọng bởi thế nào ta cũng sẽ tìm được cách xử lý chúng Nhận định này sai Mặc dù có rất nhiều kiểm định thống kê nhưng mỗi một kiểm định lại có yêu cầu cụ thể về số liệu Nếu số liệu không đáp ứng được các giả định của thống kê, kết quả của kiểm định không có giá trị Đôi khi ta có thể tìm được một kiểm định khác mà số liệu thu được đáp ứng các giả định của nó Nhưng kết quả của kiểm định lại không trả lời được câu hỏi nghiên cứu đặt ra Ví dụ: kiểm định phi tham số so sánh trung vị chứ không so sánh giá trị trung bình Đa số các kiểm định thống kê đều có yêu cầu chung về tính ngẫu nhiên và độc lập của số liệu Nếu không đáp ứng được yêu cầu này thì số liệu không có giá trị

- Cố gắng thu thật nhiều số liệu Thế nào ta cũng sẽ tìm được trong số đó những

số liệu tốt, giúp ta phát hiện ra những điều lý thú?! Nhận định này cũng sai Số lượng không đồng nghĩa với chất lượng Nhiều số liệu chỉ giúp người làm nghiên cứu chứng

tỏ mình vất vả (đôi khi không cần thiết) mà thôi Nếu số liệu thu được không giúp người nghiên cứu trả lời một cách rõ ràng câu hỏi nghiên cứu, không đem lại sự tự tin khi đưa ra những kết luận thì việc thu thập những số liệu này là hoàn toàn vô ích Chưa nói đến sự lãng phí thời gian, công sức và tiền bạc

Trong thực tế, có khá nhiều nghiên cứu trong lĩnh vực NTTS thu thập số liệu nhiều hơn mức cần thiết - điển hình là các đề tài điều tra Trong các báo cáo này, phần phụ lục rất dài với các số liệu thu được Nhưng kết quả được trình bày ở phần kết quả nghiên cứu và thảo luận lại không nhiều Một số tác giả đề cập trong phần phương pháp nghiên cứu các thông số cần phải đo đạc mà không hề được sử dụng khi phân tích chỉ vì “các tác giả khác cũng làm như thế” Nên nhớ quan tâm của các tác giả khác không nhất thiết phải giống của bạn Cần xem xét đề tài họ thực hiện khác gì so với đề tài của bạn? Cơ sở nào khiến người ta chọn thông số A để đo đạc mà không phải thông

số B? Liệu có thông số nào tốt hơn thông số A để ta chọn không? Liệu tác giả mà ta tham khảo có sai lầm không khi chọn thông số A? Ở một khía cạnh khác, trong một số nghiên cứu, người nghiên cứu viện lý do thời gian và chi phí để giảm bớt số lượng mẫu cần thu, giảm bớt số lần lặp lại của các nghiệm thức hay thu hẹp qui mô thí nghiệm Nếu bạn cũng có ý định tương tự với nghiên cứu của mình hãy tự hỏi liệu các

số liệu thu được có đủ để đưa ra các nhận định, kết luận không? Bạn nên đặt câu hỏi này khi lập kế hoạch nghiên cứu chứ không phải sau khi đã thu thập hoặc thậm chí xử

lý xong số liệu

Ngày nay, xã hội quan tâm nhiều đến tác động của NTTS lên môi trường và nguồn lợi Không phải chỉ có các hoạt động ngành nghề thực tế mới có thể gây ra các tác động này Thí nghiệm, nghiên cứu cũng có thể có ảnh hưởng tương tự Thí nghiệm trong NTTS sử dụng sinh vật hoặc tài nguyên (đất, nước, năng lượng,…) hoặc cả hai Thiết kế một thí nghiệm không hợp lý bạn sẽ phải làm lại thí nghiệm đó Như thế bạn

đã tác động vào nguồn lợi và môi trường hơn mức cần thiết Muốn hiểu rõ hơn điều này, hãy thử tưởng tượng bạn đang nghiên cứu một đối tượng quí hiếm đang có nguy

cơ tuyệt chủng hoặc nghiên cứu ảnh hưởng của một loại hoá chất độc hại nào đó đến môi trường thủy sinh Mỗi lần bạn phải làm lại thí nghiệm là một lần bạn đẩy đối tượng nghiên cứu này đến gần bờ vực của sự diệt vong hoặc tiếp tục hủy hoại môi trường trong trường hợp thứ 2

Có 2 lý do nữa khiến thiết kế thí nghiệm quan trọng đó là sự biến động thường thấy trong sinh học và “yếu tố gây nhiễu” (confounding factor) Trong tự nhiên luôn hiện hữu sự khác biệt giữa các cá thể trong cùng một quần thể, giữa các quần thể với

Trang 13

có Khối lượng thân của cá còn bị ảnh hưởng bởi lượng thức ăn có trong ruột, tốc độ tiêu hoá và hoạt động bài tiết Như vậy thời điểm cân cá phải đồng nhất giữa các nghiệm thức Nếu không con còn nhiều thức ăn trong ruột sẽ được hiểu là con mau lớn Người nghiên cứu phải hạn chế tối đa không để các “yếu tố gây nhiễu” làm ảnh hưởng đến kết quả

2.2.2 Các khái niệm trong thiết kế thí nghiệm

- Yếu tố (factor): là biến độc lập, do người làm nghiên cứu kiểm soát Số lượng các yếu tố trong một thí nghiệm có thể nhiều hơn 1 Thí nghiệm nghiên cứu ảnh hưởng của nhiều yếu tố gọi là Factorial Càng nhiều yếu tố, thí nghiệm càng phức tạp, cả trong việc thực hiện lẫn xử lý số liệu Yếu tố nghiên cứu có thể là biến định lượng (ví dụ: liều lượng hóc môn, hàm lượng protein) hoặc định tính (ví dụ: giới tính, màu sắc, hình dạng); có thể là biến liên tục (ví dụ: chiều dài thân, khối lượng) hoặc gián đoạn (số lần đẻ của tôm Sú, số ao nuôi của mỗi trại nuôi tôm)

- Mức (level): là một loại hình hoặc một trị số của yếu tố nghiên cứu Chẳng hạn yếu tố nghiên cứu là giới tính có 2 mức: đực và cái; yếu tố nghiên cứu là hàm lượng protein trong thức ăn có thể gồm 4 mức: 20, 24, 27 và 30% Trong các thí nghiệm nghiên cứu ảnh hưởng của một yếu tố thì mỗi mức sẽ là một nghiệm thức

- Nghiệm thức (treatment): là tổ hợp giữa các mức của các yếu tố nghiên cứu Nếu thí nghiệm nghiên cứu ảnh hưởng của nhiệt độ và độ mặn đến cường độ hô hấp của cá Trắm cỏ với 3 mức nhiệt độ (25, 28 và 31oC) và 4 mức độ mặn (0, 2, 4 và 8 ppt) thì tổng cộng có 12 nghiệm thức Tức là 12 cách tổ hợp các mức nhiệt độ và độ mặn vừa nêu Nếu thiếu bất cứ một nghiệm thức nào thì thiết kế thí nghiệm được coi là không đầy đủ (incomplete design) Việc xử lý số liệu của các thí nghiệm dạng này sẽ khó khăn hơn và độ chính xác của kiểm định giảm

- Đơn vị thí nghiệm (experimental unit): là một lần lặp lại của nghiệm thức theo không gian (ao, bể, ruộng lúa) hoặc thời gian (các lần đo đạc cách nhau) Tổng số đơn

vị thí nghiệm sẽ bằng số nghiệm thức Số lần lặp lại trong thí nghiệm được thiết kế cân đối (balanced design) Nếu số lượng các đơn vị thí nghiệm không bằng nhau giữa các nghiệm thức, kiểm định thống kê vẫn thực hiện được nhưng hiệu lực thống kê sẽ giảm

và giả định về đồng nhất phương sai có thể bị vi phạm nếu sự chênh lệch là quá lớn

- Số liệu bị thiếu/mất (missing value): đôi khi trong quá trình làm thí nghiệm do những trục trặc không lường trước được mà một vài đơn vị thí nghiệm có thể sẽ không

Trang 14

14

còn nữa khi kết thúc thí nghiệm Vì thế mà người nghiên cứu không thu thập đủ số liệu Tất nhiên phải hết sức hạn chế trường hợp này

2.2.3 Các bước cần thiết để thiết kế thí nghiệm

Trước hết phải xác định rõ giả thuyết nghiên cứu Không có giả thuyết rõ ràng, không thể thiết kế thí nghiệm được Sau đó, tiến hành thiết kế thí nghiệm giúp ta có thể kiểm chứng được giả thuyết đã xác định một cách thuyết phục và dễ dàng nhất Thí nghiệm phải được thiết kế sao cho ngay cả người hoài nghi nhất cũng đồng ý với những kết luận của bạn Các kết luận dạng như “Nhiệt độ là yếu tố ảnh hưởng chính đến cường độ trao đổi chất của cá (P<0.05) Tuy nhiên còn có một số yếu tố ảnh hưởng khác như độ mặn hoặc độ pH mặc dù ảnh hưởng của chúng không được thể hiện rõ trong thí nghiệm này (P<0.05)” Kết luận dạng “nước đôi” như thế này sẽ bị bác bỏ bởi phản biện, là những người có trình độ và rất cẩn trọng trong việc đưa ra kết luận

Với các đề tài lớn, cần phải triển khai thí nghiệm sơ bộ (hay gọi là thí điểm) trước khi tiến hành thí nghiệm lớn Triển khai một thí nghiệm thí điểm sẽ giúp người nghiên cứu hoàn thiện kỹ thuật thu mẫu, thu thập thêm các thông tin cần thiết về đối tượng và phát hiện các điểm bất hợp lý hoặc sai sót trong thiết kế ban đầu Không nên vội vã làm ngay thí nghiệm lớn và dùng sức ép về thời gian để biện hộ cho mình Thí nghiệm sơ bộ còn giúp người nghiên cứu kiểm chứng tính hợp lý của giả thuyết nghiên cứu, đặc biệt khi ý tưởng nghiên cứu là do người khác gợi ý Quan sát kỹ đối tượng nghiên cứu còn giúp ta nảy sinh ra các ý tưởng nghiên cứu mới Cuối cùng, đề tài nghiên cứu là của bạn, do bạn làm Nếu không có kết quả, bạn không thể đổ lỗi cho người khác Làm thí nghiệm sơ bộ còn giúp ta kiểm tra các kỹ thuật thu mẫu hay điều chỉnh cách thức, thời gian, qui mô của thí nghiệm

Một người làm nghiên cứu thiết kế thí nghiệm của mình có 6 nghiệm thức, mỗi nghiệm thức lặp lại 3 lần, tổng cộng có 18 đơn vị thí nghiệm Tuy nhiên, chỉ để dọn vệ sinh cho 18 bể nuôi thôi, đã hết buổi sáng không đủ thời gian để thực hiện các công việc khác Một người khác nghiên cứu chu kỳ lột xác của tôm Mũ ni ở cỡ thương phẩm trong thời gian 2 tháng Trong suốt 2 tháng chẳng có con nào lột xác cả vì khoảng thời gian giữa hai lần lột xác của tôm Mũ Ni rất dài Tương tự, tôm Bạc thẻ nuôi trong bể không chết vì yếu tố gây ảnh hưởng mà do tranh thức ăn rồi nhảy ra ngoài, rơi xuống đất mà chết Hoặc lưới sử dụng để chặn trứng trong bể đẻ của tôm bị bịt kín khi tôm đẻ, nước tràn hết ra ngoài khiến cho việc ước lượng sức sinh sản thiếu chính xác Nếu chưa có kinh nghiệm nghiên cứu và không làm thí nghiệm sơ bộ, rất khó lường trước các chi tiết này Làm thí nghiệm sơ bộ còn có lợi ở chỗ ta kiểm tra kích thước mẫu, thiết kế thí nghiệm của mình có phù hợp chưa khi thử phân tích kết quả theo hướng đã chọn và có các điều chỉnh thích hợp

2.2.4 Các loại thí nghiệm

Có hai loại thí nghiệm: mô tả (measurative) và điều khiển (manipulative) hoặc kết hợp cả hai

Thí nghiệm xác định tương quan (correlational) thuộc loại thứ nhất Quan sát, mô

tả trong tự nhiên thường dễ thực hiện và ít tốn kém hơn về kinh phí lẫn công sức Ngoài ra, nó giúp hạn chế các thí nghiệm “phi thực tế” ví dụ như nghiên cứu về khả năng thích ứng với nhiệt độ mà tốc độ tăng hay giảm nhiệt độ lại cao đến 1oC/3 phút hay 3oC/9 phút Trong thực tế, nhiệt độ nước ở các thủy vực hay trong ao nuôi không

Trang 15

15

tăng giảm với tốc độ như thế được Tuy nhiên, thí nghiệm dạng mô tả khi thực hiện ngoài tự nhiên lại gặp rắc rối với các yếu tố gây nhiễu (confounding factor) hoặc “tác dụng ngược” Người làm nghiên cứu cho rằng biến A tác động lên biến B nhưng thực

ra chính thay đổi của B kéo theo thay đổi của A Tương tự, ta khó biết A tác động trực tiếp lên B hay thông qua một biến khác là C Có thể lấy ví dụ về lập luận rất nổi tiếng của Ronald Fisher rằng không phải thuốc là gây ra bệnh mà chính là stress gây bệnh và người bị stress thường hay hút thuốc Có tương quan không có nghĩa là tồn tại quan hệ nhân quả Các nghiên cứu về bệnh ký sinh trùng trên cá Tuyết ở Na Uy cho thấy một

sự trùng hợp ngẫu nhiên Mức độ cảm nhiễm của cá tăng trong các tháng có chữ “r” Vào các tháng 5, 6, 7 và 8 bệnh không xuất hiện Yếu tố qui định tất nhiên không phải là chữ “r”

Trong một số trường hợp, người ta không thể làm thí nghiệm điều khiển được Ví

dụ ta không thể thay đổi được màu sắc của con cá theo ý muốn Cũng không thể làm thí nghiệm xem ảnh hưởng của hoá chất gây ung thư Treflan lên công nhân kỹ thuật ở trại sản xuất tôm giống Thông thường thì kết hợp hai dạng nghiên cứu trên sẽ đem lại hiệu quả cao hơn Đặc biệt khi ta muốn đi sâu vào nghiên cứu bản chất của hiện tượng

mà còn có quá nhiều phân vân khi suy đoán yếu tố nào là quan trọng hơn và yếu tố nào ảnh hưởng đến yếu tố nào Như thế, tốt nhất là làm một nghiên cứu mô tả - tìm tương quan, sau đó hãy nghiên cứu sâu vào bản chất dựa trên những kết quả đã thu thập được

Người làm nghiên cứu sẽ phải quyết định sẽ tiến hành thí nghiệm trong phòng (hoặc ao, bể với khả năng kiểm soát tốt) hay là ngoài thực tế Mỗi lựa chọn đều có những ưu và nhược điểm nhất định Nơi đều có cái lợi và bất lợi riêng Làm thí nghiệm trong phòng ta có thể khống chế những điều kiện quan trọng, tách riêng các yếu tố để quan sát ảnh hưởng của chúng và thuận tiện trong việc thu số liệu Tuy nhiên cần phải xem xét sinh vật ta định làm thí nghiệm có thích ứng được với điều kiện nuôi giữ không Ví dụ nếu muốn làm thí nghiệm về chế độ dinh dưỡng cho mực Nang vân

hổ ta phải chắc chắn mực có thể đẻ trứng trong điều kiện nuôi nhốt nếu sử dụng khả năng sinh sản làm tiêu chuẩn đánh giá Điều này rất khó xảy ra đối với cá Chẽm bố mẹ bắt từ tự nhiên về

Làm thí nghiệm trong điều kiện nhân tạo có thể không phản ảnh hết các mối quan hệ phức tạp trong thực tế Chẳng hạn một nghiên cứu trong phòng thí nghiệm kết luận rằng tôm Sú đực có thể tạo tinh nang mới (có khả năng thụ tinh cho trứng) trong vòng 20 ngày chỉ đúng với điều kiện thí nghiệm mà tác giả đã tiến hành thôi Nếu điều kiện thí nghiệm giống như qui trình nuôi tôm bố mẹ phổ biến trong sản xuất thì tính ứng dụng sẽ cao Trong tự nhiên, khi điều kiện dinh dưỡng không đủ, môi trường không thuận lợi, bị địch hại rượt đuổi có thể tôm đực sẽ phải mất nhiều thời gian hơn

để phục hồi lại tinh nang của mình sau khi giao vĩ Tuy nhiên, phải khẳng định một điều là kết quả thí nghiệm là các thông tin quan trọng giúp ta tìm hiểu và phỏng đoán các hiện tượng trong tự nhiên Làm thí nghiệm trong thực tế thường tốn kém và khó khống chế được điều kiện thí nghiệm Vì vậy, nếu có thể được nên làm cả 2 bước, trước hết trong phòng thí nghiệm, sau đó ra thực tế

2.2.5 Nguyên tắc thiết kế thí nghiệm

Mục tiêu của thiết kế thí nghiệm là tối ưu hoá hiệu lực thống kê (statistical power hoặc power of test), tức là khả năng phát hiện khác biệt giữa các nghiệm thức Hiệu lực thống kê phụ thuộc vào:

Trang 16

16

- Mức độ ảnh hưởng (effective size) của yếu tố nghiên cứu

- Mức độ sai khác tự nhiên giữa các đơn vị thí nghiệm (random variation)

- Số lần lặp lại

Nếu ta thử nghiệm đưa Mazzal vào bể ương và kiểm tra sự khác biệt về chất lượng nước (ví dụ qua hàm lượng NH3-N) thì sự khác biệt về hàm lượng NH3-N giữa nghiệm thức có sử dụng và không sử dụng Mazzal chính là mức độ ảnh hưởng Yếu tố ảnh hưởng càng mạnh thì khác biệt này càng lớn, vì thế càng dễ phát hiện và ngược lại Nếu khác biệt tự nhiên giữa các đơn vị thí nghiệm lớn thì khả năng phát hiện khác biệt giữa các nghiệm thức càng nhỏ Số lần lặp lớn sẽ hạn chế được khác biệt tự nhiên và nhờ đó gia tăng xác suất phát hiện được ảnh hưởng của yếu tố nghiên cứu Như vậy hiệu lực thống kê phụ thuộc một phần vào bản chất của đối tượng nghiên cứu và yếu tố ảnh hưởng, và một phần vào cách thức làm thí nghiệm (số lần lặp, thiết kế thí nghiệm) Người làm nghiên cứu không thể thay đổi được tự nhiên nhưng có thể thay đổi được thiết kế thí nghiệm Vì thế cần phải có phỏng đoán tốt về 2 yếu tố ban đầu để có thể thiết kế thí nghiệm phù hợp

Thiết kế thí nghiệm cần tuân thủ nghiêm ngặt 5 nguyên tắc, đó là: lặp lại, có đối chứng, ngẫu nhiên, độc lập và hạn chế các sai khác không giải thích được giữa các nghiệm thức Để áp dụng các nguyên tắc này một cách có hiệu quả, người nghiên cứu cần có hiểu biết nhất định về đối tượng nghiên cứu Đối tượng nghiên cứu và câu hỏi nghiên cứu không giống nhau giữa các thí nghiệm Vì thế thiết kế thí nghiệm này có thể khác hoàn toàn so với thiết kế thí nghiệm kia nhưng 5 nguyên tắc trên phải được bảo đảm

- Lặp lại (replication): khi nghiên cứu về một tổng thể, phép đo đạc nếu chỉ thực hiện một lần sẽ không đại diện được cho giá trị trung bình của tổng thể vì các đơn vị cấu thành lên tổng thể không giống nhau Người làm nghiên cứu hạn chế sai số này bằng cách thực hiện phép đo đạc nhiều lần, mỗi lần trên một hoặc một nhóm đơn vị cấu thành lên tổng thể Nếu là thí nghiệm dạng mô tả thì tiến hành mô tả đối tượng nghiên cứu dựa trên nhiều quan sát Nếu là thí nghiệm dạng điều khiển thì điều kiện thí nghiệm được lặp lại nhiều lần để đo lường phản ứng của đối tượng nghiên cứu

Về nguyên tắc, số lần lặp lại càng nhiều, kết quả càng chính xác Tuy nhiên, lặp lại nhiều lần sẽ tốn thời gian, kinh phí và vật liệu dùng làm thí nghiệm Câu hỏi mà mọi người nghiên cứu đều quan tâm là “bao nhiều lần lặp là đủ để có thể đưa ra được kết luận chính xác?” Việc quyết định số lần lặp lại phụ thuộc vào kinh nghiệm nghiên cứu trên đối tượng và nếu có đủ thông tin về đối tượng ta có thể ước tính được Thông thường khi làm thí nghiệm, mỗi nghiệm thức phải được lặp lại tối thiểu là 3 lần

- Có đối chứng (concurent controls): so sánh nếu không có đối chứng thì sẽ khập khiễng Ví dụ: nếu so sánh kết quả học tập môn Kỹ thuật Nuôi Hải sản của sinh viên khoá K35 được dạy bằng phương pháp mới với kết quả học tập của sinh viên K34 là không hợp lý Khả năng tiếp thu của hai nhóm sinh viên khác nhau, điều kiện học tập không giống nhau khiến cho phép so sánh không thuyết phục Đối chứng tốt nhất là một nửa sinh viên K35 học theo phương pháp cũ Giữa đối chứng và nghiệm thức chỉ khác biệt về yếu tố nghiên cứu Ví dụ nếu ta tiêm cá với hóc môn, thì đối chứng dù không tiêm hóc môn cũng sẽ phải tiêm nước cất Nếu tỉ lệ sống không phải là yếu tố quan tâm nghiên cứu (ví dụ sức sinh sản) thì tôm cắt mắt và không cắt mắt cũng sẽ phải chịu tác động của người làm nghiên cứu như nhau

Trang 17

17

Có 2 kiểu đối chứng: âm và dương Đối chứng âm so sánh việc can thiệp với không can thiệp để biết can thiệp vào hệ thống có đem lại hiệu quả gì không Đối chứng dương so sánh các biện pháp mới với biện pháp đang sử dụng Tức là đều tác động để biết cái nào tốt hơn Xét về thời gian có 2 kiểu đối chứng: lịch sử (historical )

và đồng thời (concurrent) Đối chứng theo kiểu lịch sử là so sánh với số liệu đã công

bố Đối chứng đồng thời là so với số liệu thu được cùng một lúc Chọn đối chứng theo kiểu lịch sử sẽ khiến thí nghiệm đơn giản hơn Tuy nhiên kết luận lại thiếu tính thuyết phục vì sự khác biệt về điều kiện thí nghiệm và các yếu tố ảnh hưởng khác mà ta không biết được Đối chứng kiểu đồng thời tốt hơn nhiều vì nó đảm bảo điều kiện thí nghiệm tương đồng ngoại trừ yếu tố nghiên cứu

- Ngẫu nhiên hóa (randomization): có nghĩa là thu mẫu một cách ngẫu nhiên, phân bổ nghiệm thức vào các đơn vị thí nghiệm một cách ngẫu nhiên Tại sao phải vậy? Giả sử ta so sánh tốc độ tăng trưởng của cá chọn giống và cá tự nhiên Mỗi nhóm

400 con nuôi trong 8 bể, mật độ là 50 con/bể Cho 8 bể vào trong nhà Nếu sắp xếp không khéo thì có thể có bể sẽ chịu tác động của một yếu tố khác (cường độ chiếu sáng) và như thế sẽ ảnh hưởng đến kết quả nghiên cứu Cá thả vào từng bể nếu ta thả theo thứ thự của nghiệm thức thì có thể sẽ gặp trường hợp con khoẻ vào hết một nghiệm thức Nhắm mắt bắt cá không phải là ngẫu nhiên, con khoẻ chạy mất, con to dễ bắt hơn Lựa chọn vô tình cũng là một vấn đề nữa, đặc biệt cho các đề tài điều tra Ví

dụ xem trình độ học vấn của người NTTS, phát ra 300 phiếu, thu về 180 Trong số 180 phiếu này có 150 phiếu của người tốt nghiệp trung học trở lên Kết luận 83,3% người nuôi tôm có trình độ học vấn trên trung học? Chưa chắc, 120 người không trả lời có thể

họ không biết chữ, có thể họ không có đủ trình độ để trả lời các câu hỏi khác trong phiếu điều tra Hay điều tra trên mạng internet tự nó đã sàng lọc đối tượng tham dự điều tra rồi

- Các đơn vị thí nghiệm phải độc lập (independence): có nghĩa là giá trị đo được trên đơn vị thí nghiệm này không ảnh hưởng hoặc bị ảnh hưởng bởi giá trị đo được trên các đơn vị thí nghiệm khác Ví dụ để xác định tỉ lệ đực cái của tôm Sú nói chung, nghiên cứu viên A bắt 5.000 con tôm từ một ao nuôi, kiểm tra giới tính để biết số lượng con đực và con cái Thiết kế này sẽ sai nếu 5.000 con tôm này đều từ một con tôm mẹ vì các đơn vị thí nghiệm (cá thể tôm) có quan hệ huyết thống với nhau Tỉ lệ đực cái thường là 1:1 cho toàn bộ tổng thể nhưng cho một gia đình tôm duy nhất thì không nhất thiết phải là như vậy Lấy một ví dụ khác: nghiên cứu viên B có 12 con cá Bớp mẹ và muốn nghiên cứu ảnh hưởng của các yếu tố môi trường đến khả năng thành thục của chúng trong bể nuôi Người này tiến hành 3 thí nghiệm Lần 1 xem xét ảnh hưởng của nhiệt độ, lần 2 xem xét ảnh hưởng của độ mặn và lần 3 xem ảnh hưởng của chu kỳ quang Mỗi lần thí nghiệm đều lặp lại 12 lần, sử dụng 12 con cá, mỗi con nuôi trong một bể Số liệu thu được không độc lập bởi vì cá sử dụng cho thí nghiệm sau đã chịu ảnh hưởng khác nhau của thí nghiệm trước Khi thí nghiệm tác dụng của kháng sinh ta không thể lấy khuẩn lạp (trên cùng một đĩa cấy) làm đơn vị thí nghiệm lặp lại được (đĩa này ngoài kháng sinh ra còn có thể có những yếu tố khác ảnh hưởng đến sự phát triển của vi khuẩn mà chúng ta không biết) Đơn vị thí nghiệm phải là đĩa petri có cấy vi khuẩn theo cùng một phương pháp, sử dụng cùng môi trường và điều kiện cấy ủ

Để đảm bảo nguyên tắc này, người làm nghiên cứu nên chọn đơn vị thí nghiệm là đơn vị chịu tác động trực tiếp của yếu tố nghiên cứu Ví dụ nếu ta thay đổi nhiệt độ nước trong bể ương thì đơn vị thí nghiệm phải là bể (trong đó có nhiều ấu trùng)

Trang 18

18

Nhưng nếu ta tiêm hóc môn cho cá đã thành thục để dục đẻ thì có thể dùng cá thể làm đơn vị thí nghiệm Tuy nhiên, phải đảm bảo rằng hoạt động đẻ trứng của con này không ảnh hưởng đến những con khác và ngược lại Trong NTTS, chọn đơn vị thí nghiệm là bể hoặc một nhóm sinh vật bao giờ cũng an toàn hơn và giúp hạn chế các rủi

ro như vật thí nghiệm chết (nếu đơn vị thí nghiệm là cá thể thì sẽ mất số liệu này) hoặc khác biệt tự nhiên giữa các cá thể quá lớn

- Hạn chế tối đa các sai khác không giải thích được (unexplained variance): khi thiết kế thí nghiệm, người làm nghiên cứu phải đảm bảo loại trừ khả năng các yếu tố không thuộc quan tâm của nghiên cứu có thể làm sai lệch kết quả Chẳng hạn nếu thí nghiệm nghiên cứu ảnh hưởng của nhiệt độ thì các yếu tố khác phải được chuẩn hoá giữa các nghiệm thức Nếu nghiên cứu là để đánh giá hiệu quả của một số loại thức ăn công nghiệp thì thức ăn tự nhiên hoặc phải được loại bỏ ra khỏi hệ thống nuôi hoặc bằng cách nào đó đồng nhất giữa các nghiệm thức Trong nghiên cứu về NTTS, cần chú ý nhiều đến nguồn gốc của sinh vật sử dụng làm thí nghiệm Không dùng một nhóm sinh vật cho một nghiệm thức và một nhóm khác biệt về nguồn gốc cho các nghiệm thức còn lại Như thế ảnh hưởng của yếu tố nghiên cứu sẽ bị pha trộn với ảnh hưởng của yếu tố gây nhiễu là di truyền hoặc điều kiện sống của sinh vật trước khi đưa vào thí nghiệm

Không có thiết kế thí nghiệm nào là hoàn hảo một cách tuyệt đối Nếu không thể tránh được một số hạn chế, ta cứ làm thí nghiệm Vấn đề quan trọng là ở chỗ phải hết sức cẩn thận khi đưa ra kết luận Khi so sánh 2 loài thì chỉ kết luận cho 2 loài, đừng

mở rộng kết luận ra cho tất cả các loài Tránh các kết luận phiến diện, ví dụ như “hầu sống ở vùng ven biển chậm lớn hơn ở vùng của sông do ảnh hưởng của độ mặn” Nên nhớ ngoài độ mặn ra còn có nhiều yếu tố ảnh hưởng khác như nhiệt độ, dòng chảy, lượng và chủng loại thức ăn Kết luận đúng phải là “độ mặn ảnh hưởng đến tốc độ tăng trưởng của hầu”

2.2.6 Một số kiểu thiết kế thí nghiệm

Ngẫu nhiên Hoàn toàn (Complete Randomized Design)

Là kiểu thiết kế thí nghiệm đơn giản nhất Các đơn vị thí nghiệm được phân bổ một cách hoàn toàn ngẫu nhiên vào các nghiệm thức Nếu ta chỉ nghiên cứu ảnh hưởng của một yếu tố (ví dụ như nhiệt độ) thì kiểm nghiệm thống kê sẽ sử dụng là t-test nếu chỉ có 2 nghiệm thức hoặc phân tích phương sai 1 yếu tố (one-way ANOVA) nếu có từ

3 nghiệm thức trở nên Đây gọi là thí nghiệm 1 yếu tố Nếu ta nghiên cứu ảnh hưởng của 2 yếu tố (ví dụ thêm số lần cho ăn hoặc độ mặn) thì là sẽ sử dụng phân tích phương sai 2 yếu tố Tuy nhiên nên giới hạn số yếu tố nghiên cứu

Điều kiện để chọn kiểu thiết kế ngẫu nhiên hoàn toàn là khác biệt giữa các đơn vị thí nghiệm không có hoặc không đáng kể Điều này thường chỉ khả dĩ trong phòng thí nghiệm, chứ ít khi đạt được ngoài thực tế Chẳng hạn, ta làm một thí nghiệm nghiên cứu ảnh hưởng của việc xử lý nước bằng ozone và sử dụng thức ăn nhân tạo của Biomar thay thế Artemia nauplii khi ương nuôi ấu trùng cua biển Scylla paramamosain

ở giai đoạn Z4 - Z5 với mật độ ương là 40 con/L Đây là thí nghiệm nghiên cứu ảnh hưởng của 2 yếu tố: chất lượng nước và điều kiện dinh dưỡng Theo người thiết kế thí nghiệm, yếu tố thứ nhất có 2 mức: nước có xử lý và không xử lý ozone sau khi đã lọc qua bộ lọc cát Yếu tố thứ 2 có 3 mức: cho ăn hoàn toàn bằng Artemia nauplii (đối chứng) với mật độ 5 nauplii/mL, cho ăn kết hợp 5 g thức ăn Biomar/ngày/m3

với duy

Trang 19

19

trì mật độ 2 nauppli/mL và cho ăn hoàn toàn bằng thức ăn Biomar với liều lượng là 7 g/ngày/m3 Như vậy, thí nghiệm có tất cả là 6 nghiệm thức Nếu người làm nghiên cứu quyết định chọn số lần lặp lại của các nghiệm thức là 3 thì tổng cộng cần có 18 đơn vị thí nghiệm Mỗi đơn vị thí nghiệm là một bể ương có dung tích 100 L Các bể ương này phải tương đồng nhau về mọi mặt Người làm nghiên cứu có thể phân bổ ngẫu nhiên 6 nghiệm thức vào 18 đơn vị thí nghiệm bằng cách làm 18 lá thăm Mỗi lá đại diện cho 1 đơn vị thí nghiệm (bể ương) rồi bắt ngẫu nhiên 3 lá cho 1 nghiệm thức

Thiết kế dạng khối (Block Design)

Khi có một yếu tố nào đó có thể làm ảnh hưởng đến kết quả nghiên cứu (i.e làm tăng mức độ biến động của biến nghiên cứu giữa các đơn vị thí nghiệm, hoặc giữa những cá thể của tổng thể nghiên cứu), ta có thể hạn chế ảnh hưởng của yếu tố này bằng cách phân khối Người nghiên cứu sẽ chia các đơn vị thí nghiệm thành nhiều khối Các đơn vị trong cùng một khối có chung giá trị của yếu tố bị phân khối Sau đó

từ mỗi khối này, ta sẽ chọn ngẫu nhiên các đơn vị thí nghiệm để phân bổ vào các nghiệm thức Ví dụ: so sánh tỉ lệ thành thục của cá với 2 phương pháp khác nhau: dùng hóc môn và kích thích sinh thái (bằng dòng chảy, nhiệt độ) Cá đưa vào làm thí nghiệm có con già con non, con lớn con bé Nếu ta so sánh một cách đơn thuần, thì giữa 2 nhóm lúc này ngoài sự khác biệt về cách thức chúng được kích dục còn có ít nhất là một điểm khác biệt khác chưa được kiểm soát Tỉ lệ thành thục của cá khi đó không chỉ phụ thuộc vào yếu tố nghiên cứu (phương pháp kích dục) mà có thể phụ thuộc vào tuổi của cá (thông tin đã được công bố hoặc kinh nghiệm cho biết điều này) Như vậy tuổi của cá phải được phân khối Ta sẽ xếp cá thành nhiều nhóm tuổi Khi đó

ta sẽ so sánh tỉ lệ thành thục của cá trong từng nhóm tuổi hơn là so sánh chung (đây là kiểu bố trí thí nghiệm gần giống như thí nghiệm 2 yếu tố) và sẽ khai báo dùng “block” khi dùng kiểm định ANOVA một yếu tố Nếu trong mỗi block đều có đại diện của mỗi nghiệm thức và số nghiệm thức trong từng block là như nhau thì gọi là thiết kế theo kiểu khối ngẫu nhiên hoàn toàn (completely randomized block design) Có thể bố trí thí nghiệm theo kiểu khối ngẫu nhiên không hoàn toàn nhưng xử lý số liệu sẽ khó khăn Nếu bạn định bố trí thí nghiệm theo dạng này, nên tham khảo chuyên gia thống

kê để được tư vấn về phương pháp xử lý số liệu trước khi tiến hành nghiên cứu

Nguyên tắc của việc phân khối là để so sánh ảnh hưởng của yếu tố nghiên cứu trong từng khối nơi mà sự khác biệt giữa các đơn vị thí nghiệm là nhỏ nhất, chứ không

so sánh chung giữa các nghiệm thức vì sự khác biệt sẽ lớn hơn rất nhiều Có 3 kiểu phân khối: đơn vị thí nghiệm, không gian (giữa các ao, giữa các trại, giữa các vùng) hoặc thời gian (lặp lại thí nghiệm giữa các tháng, hay khi không đủ bể làm thí nghiệm) Lưu ý là phân khối chỉ có hiệu quả nếu yếu tố bị phân khối (blocked) thực sự

có ảnh hưởng đến kết quả của yếu tố ta nghiên cứu lên biến nghiên cứu, ví dụ như tuổi của cá khi nghiên cứu khả năng dục đẻ bằng các loại hóc môn khác nhau Nếu yếu tố này không có ảnh hưởng gì đến biến nghiên cứu thì phân khối sẽ làm cho hiệu lực thống kê của thí nghiệm yếu đi Hơn nữa, hiệu quả của phân khối sẽ thấp khi số đơn vị thí nghiệm không lớn Trong trường hợp hao hụt khi tiến hành làm thí nghiệm quá lớn (có thể dẫn đến sự xoá sổ của một vài đơn vị thí nghiệm trong một nghiệm thức) thì phân khối cũng không có hiệu quả Lúc này từ kiểu phân khối ngẫu nhiên hoàn toàn (khi bắt đầu thí nghiệm) đã bị chuyển sang kiểu khối ngẫu nhiên không hoàn toàn (khi kết thúc thí nghiệm) và sẽ gặp khó khăn khi xử lý số liệu

Trang 20

20

Vì thế ta không áp dụng phân khối cho các yếu tố mà khả năng ảnh hưởng của nó được xác định theo nhận định chủ quan của người nghiên cứu Ví dụ như phân chia cá làm thí nghiệm theo tình trạng sức khoẻ bằng cách đánh giá qua cảm quan Nếu yếu tố

bị phân khối có khả năng tương tác với yếu tố nghiên cứu, ta nên giới hạn số lượng khối trong thí nghiệm Thay vì phân khối, trong một số trường hợp ta có thể phân tích đồng biến (ANCOVA) để thấy được ảnh hưởng của yếu tố định dùng để phân khối Thiết kế phân cặp (paired design) là một dạng đặc biệt của phân khối Ví dụ như trong thí nghiệm chỉ có 2 nghiệm thức ta sử dụng các cá thể sinh đôi để chia ra mỗi cá thể chịu một tác động Lúc này có thể dùng kiểm định t-test hoặc z-test một cách dễ dàng Tuy nhiên cách này có hạn chế là kết quả chỉ ứng dụng được cho những cặp sinh đôi thôi, chưa chắc đã đúng cho những cá thể sinh đơn

Thiết kế thí nghiệm chéo (Cross-over Design hoặc Repeated Measurement)

Theo kiểu thiết kế này các đơn vị thí nghiệm được dùng cho các nghiệm thức khác nhau theo trình tự thời gian Ví dụ nghiên cứu cường độ hô hấp của cá ở nhiệt độ

30oC trong 2 ngày, sau đó chuyển sang nhiệt độ 28oC 2 ngày tiếp theo, hoặc ngược lại Người làm nghiên cứu phải hết sức cẩn thận khi sử dụng kiểu thiết kế này vì rất dễ vi phạm giả định quan trọng của thống kê là “mẫu thu phải độc lập”

Khi thiết kế, cần chú 4 điểm sau:

(i) Sử dụng nhiều nhóm mẫu để tránh ảnh hưởng của thời gian

(ii) Dư động của yếu tố trước khi nghiên cứu ảnh hưởng của yếu tố sau

(iii) Sinh vật làm thí nghiệm không được chết hoặc vật thí nghiệm không bị hủy hoại khi chịu tác động của yếu tố nghiên cứu Nếu không thì không sử dụng được nữa cho nghiệm thức tiếp theo

(iv) Phải có thời gian “làm sạch” (washout time) giữa 2 nghiệm thức để đảm bảo không bị ảnh hưởng của dư động

Thí nghiệm dạng này tiết kiệm được kinh phí, tốt khi số lượng đơn vị thí nghiệm quá ít Nhưng phải cẩn thận, nếu không thì “tiết kiệm sẽ thành không tiết kiệm” nếu số liệu thu được ít có giá trị về mặt sinh học Hơn nữa, thí nghiệm theo kiểu này rất mất thời gian

Thiết kế thí nghiệm dạng Split-plot

Kiểu thiết kế này áp dụng cho thí nghiệm nghiên cứu ảnh hưởng của 2 yếu tố Với yếu tố thứ nhất, ta phân bổ một cách ngẫu nhiên các đơn vị thí nghiệm theo các mức (nghiệm thức) của yếu tố này Sau đó, trong mỗi một nghiệm thức của yếu tố 1, ta phân bổ một cách ngẫu nhiên các đơn vị thí nghiệm theo các mức của yếu tố thứ 2 Hoàng Tùng (2002) nghiên cứu ảnh hưởng của cường độ chiếu sáng đến sự phát triển buồng trứng của tôm Bạc thẻ (Penaeus merguiensis) trong mối liên quan với giai đoạn thành thục buồng trứng của tôm Thí nghiệm gồm có 6 bể nuôi vỗ tôm mẹ: 3 bể có cường độ chiếu sáng yếu (2 lux) và 3 bể có cường độ chiếu sáng mạnh (1.100 lux) Trong mỗi bể có 4 con tôm mẹ có buồng trứng phát triển ở 4 giai đoạn khác nhau là II, III, IV và V Ở nghiên cứu này ảnh hưởng của cường độ chiếu sáng đã được tìm hiểu ở nghiên cứu trước Người làm nghiên cứu quan tâm nhiều đến tương tác giữa cường độ chiếu sáng và giai đoạn phát triển của buồng trứng tôm khi bắt đầu đưa vào thí nghiệm

Trang 21

21

Người làm nghiên cứu nên sử dụng kiểu thiết kế này nếu yếu tố thứ nhất có ảnh hưởng mạnh, dễ phát hiện hoặc ta đã biết ảnh hưởng của nó rồi, không cần thiết lắm phải thu thêm số liệu Điều này cũng có nghĩa là ảnh hưởng của yếu tố thứ 2 (ở từng mức của yếu tố thứ 1) và tương tác của nó với yếu tố thứ 1 đối với người nghiên cứu quan trọng hơn nhiều Khi thiết kế thí nghiệm phải có lặp lại

Kết luận cho các kiểu thiết kế thí nghiệm

- Rất nhiều thí nghiệm (so sánh) cần đối chứng Cần phải chọn đối chứng sao cho

- Thiết kế dạng chéo tức là lặp lại phép đo nhiều lần trên một đơn vị thí nghiệm tại các thời điểm khác nhau, chứ không tiến hành đo đạc trên nhiều đơn vị thí nghiệm tại cùng một thời điểm

2.2.7 Một số lưu ý

Người làm nghiên cứu cần phải dự đoán mình sẽ diễn giải kết quả thu được như thế nào trong mối tương quan với giả thuyết đã thiết lập cho mỗi khả năng có thể xảy

ra khi tiến hành nghiên cứu

Tránh làm những thí nghiệm mà ta không có khả năng diễn giải kết quả thu được Ngay cả khi kết quả thí nghiệm bác bỏ giả thuyết của mình đưa ra, kết quả đó cũng phải hữu ích cho khoa học Ví dụ như kiểm chứng giả thuyết “hàm lượng probiotic A

sử dụng có liên quan đến năng suất tôm nuôi” Nếu kết quả phản bác lại giả thuyết, người nghiên cứu có thể khuyến cáo cho người nuôi tôm không nên sử dụng probiotic

A Nếu kết quả ủng hộ giả thuyết, thì các thông tin về khả năng cải thiện năng suất nuôi của probiotic A sẽ được ứng dụng trong sản xuất khi xây dựng chế độ sử dụng, liều lượng cần thiết Trong ví dụ sau, giả thuyết nghiên cứu là “thả cá bằng tay trái sẽ đem lại một mùa vụ thành công” Nếu giả thuyết này bị phản bác bởi kết quả, điều đó không có nghĩa là thả cá bằng tay phải sẽ đem lại thành công Trong trường hợp này, thông tin ta tìm được không có giá trị, kể cả nếu số liệu ủng hộ giả thuyết vì ta không giải thích được vì sao thả bằng tay trái lại thành công

Thiết kế thí nghiệm là nghệ thuật sử dụng nguồn nhân vật lực nhất định để tối đa hoá lượng và chất lượng thông tin cần thiết phải thu thập Nếu điều kiện thí nghiệm không cho phép chúng ta thu được tất cả những gì theo mong muốn thì đành phải chấp nhận bởi vì “có còn hơn không” Nhưng nếu thực sự ta có thể làm tốt hơn được thì cần phải suy tính lại

(Tham khảo thêm nội dung Chương 2 ở tài liệu: Hoàng Tùng (2006), Phương pháp nghiên cứu khoa học trong nuôi trồng thủy sản, Tài liệu dự án nâng cao năng lực

nghiên cứu và đào tạo SRV2701 – NORAD, Trường Đại học thủy sản, Nha Trang.)

Trang 22

đề là ta cần phải xác định nguyên nhân dẫn đến sai số để có để có quyết định đối với

đo đạc hoặc phân tích để xác định các đặc điểm của đơn vị nghiên cứu Phương pháp

đo đạc ở đây phải bao gồm cả công đoạn từ khi thu mẫu hay thiết kế thí nghiệm đến bảo quản, phân tích và ghi nhận kết quả phân tích trên Các số liệu thuộc sai số hệ thống cần phải được tính toán lại

- Sai số ngẫu nhiên là sai số không thể tiên đoán được cụ thể với trình độ khoa học dương thời do nhiều nhân tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng (loại trừ sai số hệ thống và sai số thô) Đây là sai số mà người làm thí nghiệm không thể loại bỏ được và loại sai số này được chấp nhận trong nghiên cứu

Do đó, khi thu thập số liệu cần phải chú ý hiệu chỉnh thiết bị, loại trừ các nguy cơ thực hiện phép đo thiếu chính xác, hạn chế tối đa sai số do người đo đạc và tác động của người nghiên cứu

Hiệu chỉnh thiết bị (như máy đo pH, đo hàm lượng oxy hòa tan, máy đo quang phổ, cân điện tử …) là rất cần thiết để đảm bảo độ chính xác và phải kiểm tra trong quá trình nghiên cứu thường xuyên vì có thể có những sự cố xãy ra mà người làm nghiên cứu không biết ví dụ như người khác làm rơi, hỏng thiết bị

Khi thực hiện một phép đo có thể thực hiện nhiều lần để xem xét kết quả có giống nhau hay không Đặc biệt nên kiểm tra với những biến cần có sự đánh giá của người đo hoặc người đo đang tập sự ta không tin tưởng lắm

3.2 Sắp xếp và trình bày số liệu

3.2.1 Phân nhóm số liệu

Trong các nghiên cứu chúng ta thường thu thập và làm việc với một số lượng lớn

số liệu đủ lớn để đảm bảo độ tin cậy cho kết quả nghiên cứu Sẽ đơn giản hơn trong việc thu thập và xử lý số liệu sau này nếu như ngay từ bước đầu ta có phương pháp sắp xếp và trình bày số liệu hợp lý Nếu không thì nó sẽ làm cho số liệu ta thu thập được là một mớ lộn xộn và rất khó hiểu

Trang 23

Trình tự các bước tiến hành phân nhóm như sau:

Ví dụ với dãy số liệu 2; 2; 4; 5; 5; 6; 7; 7; 8; 9 ta lập thành bảng sau:

Nhóm Giá trị biên Tần số Tần suất Tần số tích lũy Tần suất tích lũy

Tần suất tích lũy là tần suất cộng dồn từ nhóm 1 đến nhóm đang tính

Để có được các giá trị điền vào bảng phân bố tần số ta phải trải qua các bước tính toán Đối với số lượng số liệu nhỏ ta có thể tính nhanh bằng phương pháp thủ công nhưng đối với một lượng số liệu lớn thì ta phải nhờ đến công cụ xử lý trong MS-Excel

để cho việc tính toán được thuận lợi, nhanh chóng hơn và chính xác

Trang 24

24

Ta có thể dùng hàm tính phân bố tần số Frequency bằng cách gõ hàm hoặc gọi

hàm trong Insert Function bằng cách nhấn nút fx trên thanh Standar, sau đó chọn hàm

thống kê (Statistical) trong danh sách các nhóm hàm

Cấu trúc của hàm là: =Frequency(Data Array, Bin Array) Tức là tính giá trị tần

số của các nhóm số liệu trong vùng Data Array dựa vào giá trị biên khai báo trong vùng Bin Array Dãy kết quả được kết xuất theo chiều đứng (cột)

Để dùng hàm bằng cách gõ hàm ta gõ tại cell đầu tiên của vùng kết xuất Bước tiếp theo là bôi đen vùng kết xuất Sau đó nhấn phím chức năng F2 Cuối cùng ta nhấn

tổ hợp phím Shift + Control + Enter để đọc kết quả

Một công cụ khác trong MS-Excel sử dụng để tính phân bố tần số là chương trình tính phân bố tần số (Histogram) Bằng cách vào thực đơn Tool chọn Data Analysis rồi chọn chương trình ứng dụng như đã nói ở trên Khi thấy cửa sổ chương trình xuất hiện

ta nhập địa chỉ vùng cell chứa số liệu (Input Range) và vùng cell chứa biên nhóm (Bin Range) đã được nhập vào bảng tính trước đó Cuối cùng ta chọn địa chỉ kết xuất kết quả ngay trong bảng tính (Output Range) rồi nhấn OK để hiển thị kết quả (nếu như muốn kết xuất tần suất tích lũy thì ta chọn Cumulative Percentage)

Cửa sổ chương trình tính phân bố tần số Kết xuất của chương trình có dạng

3.2.3 Biểu đồ

Có nhiều dạng biểu đồ khác nhau như biểu đồ hình cột, biểu đồ dạng đường nối điểm, biểu đồ dạng hình quạt, biểu đồ dạng hình tròn Tuy nhiên, ta thường dùng biểu

đồ dạng cột để biểu diễn tần số, biểu đồ dạng hình tròn để biểu diễn tần suất

Bin Frequency Cumulative %

Trang 25

 n

1 i i

X n

1 XTrong đó: Xlà trung bình của mẫu

i

X là các số liệu thu được từ mẫu

n là số mẫu

Ví dụ: Tính trung bình của các số liệu sau: 1, 1, 2, 2, 2, 3, 3, 3, 3, 4 Đây là dãy

số liệu với số lượng số liệu ít, đơn giản nên ta có thể tính nhẫm hoặc bằng cách tính áp dụng công thức thì ta có ngay kết quả: n = 10,  = 24, X = 2 , 4

Khi số lượng số liệu lớn, thường thì quá trình thu thập số liệu ta sắp xếp theo các nhóm khác nhau Gọi trị số nhóm là Xi với tần số nhóm tương ứng là fi Khi đó dãy số liệu của ta được trình bày dưới dạng bảng như sau:

1 i

i f X n

1

Với ví dụ trên ta có bảng kết quả như sau:

Trang 26

26

19 10

190

X  4.1.2 Số trung vị (Median)

Số trung vị (Me) là số đứng giữa của dãy số liệu đã xếp thứ tự

Cách tìm số trung vị như sau:

- Xếp dãy số liệu theo thứ tự

- Nếu n là 1 số lẽ thì trung vị là số đứng giữa

- Nếu n là 1 số chẵn thì lấy trung bình cộng của hai số đứng giữa làm trung vị

Ví dụ 1: Tìm số trung vị của dãy số liệu gồm 11 số: 3, 9, 8, 3, 2, 6, 4, 3, 5, 1, 8

- Ta sắp xếp dãy số liệu theo thứ tự như sau: 1, 2, 3, 3, 3, 4, 5, 6, 8, 8, 9

- Số trung vị là số ở vị trí thứ 5 có giá trị là 4

Ví dụ 2: Tìm số trung vị của dãy số gồm 10 số: 3, 9, 3, 2, 6, 4, 3, 5, 1, 8

- Thứ tự sắp xếp dãy số liệu như sau: 1, 2, 3, 3, 3, 4, 5, 6, 8, 9

- Số trung vị là trung bình cộng số ở vị trí thứ 5 và thứ 6 có giá trị là 3,5

* Trường hợp số liệu đã phân nhóm ta tính số trung vị như sau:

liệu

Trang 27

f

fc n

d b Me

1 1

i

f

fc n

d b Me

4.1.3 Số trội (Mode)

Số trội (Mo) là giá trị có tần số lớn nhất trong dãy số liệu hay là số được gặp

nhiều nhất trong dãy số liệu

* Cách tìm số trội như sau:

- Xếp dãy số liệu theo thứ tự

- Tính tần số của mỗi giá trị số liệu

- Số trội là số có tần số lớn nhất

Ví dụ: Tìm số trội của dãy số liệu sau: 1, 3, 2, 3, 2, 4, 1, 3, 2, 3

Sắp xếp dãy số liệu theo thứ tự : 1, 1, 2, 2, 2, 3, 3, 3, 3, 4 Số liệu dạng bảng:

i

i i i

i

f f f

f

f f d

b Mo

Trong đó: b i-1 là biên dưới của nhóm i (có tần số lớn nhất)

d là độ dài của nhóm i

Trang 28

Độ lệch trung bình (ΔX) là trung bình cộng của độ lệch giữa các số liệu (Xi) so với số liệu trung bình (X)

X n

1 ΔXTrường hợp số liệu ở dạng bảng

fi(X n

1 ΔX

Ví dụ, xét dãy số liệu: 1, 3, 2, 3, 2, 4, 1, 3, 2, 3 Giá trị trung bình: X = 2,4

Trang 29

Công thức tính phương sai:

- Công thức phương sai chưa hiệu chỉnh:   

 n

1 i

2 i 2

X X n

1 S

- Công thức phương sai hiệu chỉnh:   

2 i 2

X X 1 n

1 S

Vấn đề đặt ra là ta sử dụng công thức tính phương sai nào? Ta xét hai ví dụ sau:

Ví dụ thứ nhất ta xét độ đồng đều của 80 con điểm lớp NTTSK49 - Đại học Quảng Bình Ví dụ thứ hai ta xét độ đồng đều về kích thước của một loài cá dữ A nào

đó ở các thời điểm 10 ngày tuổi, 15 ngày tuổi, 20 ngày tuổi trong quá trình sản xuất giống hay sau 1 tháng trong điều kiện nuôi bằng cách chọn ra 200 con trong tổng số cá của trại nuôi

Câu trả lời là: Ví dụ 1 ta sử dụng công thức phương sai chưa hiệu chỉnh, còn ví

dụ 2 ta sử dụng công thức phương sai hiệu chỉnh Như vậy, khi tính phương sai cho toàn bộ số liệu ta sử dụng phương sai chưa hiệu chỉnh, còn khi tính phương sai cho mẫu thì ta sử dụng công thức phương sai hiệu chỉnh

Thường trong thống kê sinh học ta chỉ sử dụng công thức phương sai hiệu chỉnh 4.2.4 Độ lệch chuẩn (Standard Deviation)

Độ lệch chuẩn (S) là căn bậc hai của phương sai

Tương tự, ta cũng có hai công thức tính độ lệch chuẩn như sau:

- Độ lệch chuẩn chưa hiệu chỉnh:   

1 i

2

Xn

1S

Trang 30

30

Trong chương trình thống kê sinh học ta chỉ dùng công thức tính độ lệch chuẩn hiệu chỉnh

4.2.5 Đặc trưng về hệ số phân tán (Coefficient of Variation)

Hệ số phân tán (Cv) được sử dụng để so sánh mức độ phân tán của các giá trị xung quanh giá trị trung bình khi các mẫu khác nhau về thứ nguyên hay khác nhau về giá trị trung bình

Hệ số phân tán được tính theo công thức:

X

S (%)

4.2.6 Sai số chuẩn (Standard Error)

Sai số chuẩn (S e) là độ lệch trung bình của mẫu so với trung bình của tổng thể Công thức tính:

n

S

Se4.3 Ứng dụng Excel trong mô tả thống kê

4.3.1 Các hàm mô tả thống kê

* Công cụ hàm trong Excel:

Hàm là công cụ tự động đã được cài đặt sẵn trong bảng tính để tính toán giá trị của một biểu thức toán học hay kết quả thực hiện một công việc

Hàm luôn trả về kết quả là một hay nhiều giá trị thuộc một kiểu dữ liệu xác định

Để có kết quả thực hiện hàm, ta phải cung cấp cho nó một số dữ liệu đầu vào, gọi là các tham số của hàm Tuỳ theo từng hàm mà số lượng tham số là nhiều hay ít, kiểu dữ liệu của các tham số như thế nào

Trong cú pháp hàm, các tham số được viết dưới các ký hiệu: range là vùng cell, number là số, text là chuổi ký tự,…

Khi sử dụng hàm, phải cung cấp giá trị cho các tham số với kiểu dữ liệu của chúng phải đúng như trong cú pháp hàm quy định cho tham số tương ứng, công việc này được gọi là truyền tham số

* Quy tắc sử dụng hàm:

Nhập hàm từ bàn phím

Công thức tổng quát của hàm:

= Tên hàm (danh sách các tham số)

Trang 31

31

Dấu = : bắt đầu một hàm luôn luôn là dấu = Tên hàm: phải gõ đúng chính tả, chữ thường và chữ in hoa có giá trị như nhau Danh sách các tham số:

- Đặt trong cặp dấu ngoặc đơn

- Thứ tự các tham số là xác định

- Khi truyền dữ liệu cho tham số phải chú ý đến kiểu dữ liệu của tham số được truyền

- Tham số có thể là giá trị, địa chỉ ô chứa giá trị, địa chỉ vùng cell hay một hàm khác (nhưng phải trả về giá trị những kiểu dữ liệu quy định cho tham số đó)

- Giữa các tham số cách nhau bởi dấu phẩy (nếu máy quy định hệ America) hoặc dấu chấm (nếu máy quy định hệ France)

Lưu ý: Công thức hàm được thể hiện trên thanh công thức, còn giá trị của hàm

được thể hiện ở ô chứa hàm

Sử dụng Function Wrzard (nút fx trên thanh Standard)

Đây là chức năng gọi hàm nhanh và tiện lợi, vì nếu bạn không nhớ tên hàm và cú pháp của hàm thì bạn không thể gõ hàm từ bàn phím Nhấp vào nút Function trên thanh công cụ, sẽ có một hộp thoại mở ra gồm hai cột danh mục:

Function category: danh sách các nhóm hàm Function name: danh sách hàm trong các nhóm tương ứng gồm: nhóm hàm tài chính (financial), nhóm hàm về ngày giờ (Date & Time), nhóm hàm thống kê (Statisticial: nhóm hàm chúng ta đang quan tâm), nhóm hàm toán học và lượng giác (Math & Trig), nhóm hàm tìm kiếm và tham chiếu (Lookup & Reference), nhóm hàm

về cơ sở dữ liệu (Database), nhóm hàm về chuổi ký tự (Text), nhóm hàm luân lý (Logical), nhóm hàm thông tin (Information) và nhóm hàm kỹ thuật (Engineering) Bạn chọn hàm trong danh sách các hàm, bấm OK, một cửa sổ khác hiện ra sẽ hướng dẫn bạn thực hiện việc nhập giá trị vào các tham số cho hàm

* Các hàm mô tả thống kê

-Hàm tính giá trị trung bình: AVERAGE (Data Range) Data range là vùng cell chứa số liệu (có thể là 1 cột trong bảng tính) Hàm chỉ sử dụng với các số liệu chưa phân nhóm

- Hàm tìm số trung vị: MEDIAN (Data Range) Data range là vùng cell chứa số liệu (có thể là 1 cột trong bảng tính) Hàm chỉ sử dụng với các số liệu chưa phân nhóm

- Hàm tính số trội: MODE (Data Range) Data range là vùng cell chứa số liệu (phải khai báo đúng địa chỉ vùng cell) Hàm chỉ sử dụng với các số liệu chưa phân nhóm

- Hàm tìm số lớn nhất và số bé nhất: MAX (Data Range) và MIN (Data Range) Data range là vùng cell chứa số liệu (có thể là 1 cột trong bảng tính) Hàm chỉ sử dụng với các số liệu chưa phân nhóm

Trang 32

32

-Hàm tính độ lệch trung bình: AVEDEV (Data Range) Data range là vùng cell chứa số liệu (có thể là 1 cột trong bảng tính) Hàm chỉ sử dụng với các số liệu chưa phân nhóm

-Hàm tính phương sai: VAR (Data Range) Data range là vùng cell chứa số liệu (có thể là 1 cột trong bảng tính) Hàm chỉ sử dụng với các số liệu chưa phân nhóm -Hàm tính độ lệch chuẩn: STDEV (Data Range) Data range là vùng cell chứa

số liệu (có thể là 1 cột trong bảng tính) Hàm chỉ sử dụng với các số li ệu chưa phân nhóm

4.3.2 Chương trình mô tả thống kê Descriptive Statistics

Vào thực đơn Tools, chọn Data Analyis, một hộp thoại danh mục các chương trình xữ lý số liệu mở ra, bạn chọn chương trình mô tả thống kê (Descriptive Statistics), nhấn OK, một cửa sổ khác xuất hiện sẽ hướng dẫn bạn nhập các giá trị và chọn kiểu kết xuất cho chương trình xữ lý số liệu Đối với Microsoft Excell phiên bản

2010 trở lên ta vào Data để chọn Data Analysis Cụ thể, ta nhập các thông tin sau đây trong cửa sổ của chương trình:

- Input Range: chọn địa chỉ vùng cell chứa số liệu

- Labels in first Row: tên cột chứa số liệu (chỉ đánh dấu nếu ô đầu tiên chứa tên cột số liệu)

- Output Range: chọn vùng kết xuất ngay trong bảng tính

- Summary Statistics: đánh dấu để chọn kết xuất các đặc trưng của thống kê

- Confidence Level for Mean: đánh dấu nếu muốn chọn kết xuất ε trong ước lượng trung bình tổng thể

Cửa sổ chương trình mô tả thống kê Descriptive Statistics:

Trang 33

33

Kết xuất của chương trình cho ta dạng kết quả như sau:

Standard Error 2.28 Sai số chuẩn

Ngày đăng: 02/11/2017, 15:49

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w