1. Trang chủ
  2. » Giáo án - Bài giảng

Tin sinh hoc (ỨNG DỤNG TIN HỌC TRONG SH)

93 419 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 93
Dung lượng 4,74 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các chức năng chính của Excel Là một ứng dụng bảng tính, mỗi cửa sổ văn bản của Excel là một WorkBook, trong đó gồm nhiều Sheet – mỗi Sheet có thể là bảng tính, biểu đồ hoặc macro bảng t

Trang 1

PHẦN I XỬ LÝ SỐ LIỆU THỐNG KÊ SINH HỌC

CHƯƠNG I GIỚI THIỆU VỀ EXCEL

1.1 Giới thiệu về Excel

1.1.1 Giới thiệu

Excel là chương trình ứng dụng bảng tính trong Windows, thuộc bộ công cụ văn phòng Microsoft Office Excel là ứng dụng đa văn bản – nghĩa là có thể mở đồng thời nhiều hơn một cửa sổ văn bản Các thao tác trong Excel tuân theo tiêu chuẩn của Windows, như: làm việc với cửa sổ, các hộp đối thoại, hệ thống menu,

sử dụng mouse, các biểu tượng lệnh Excel có thể được cài đặt một cách độc lập, nhưng thông thường là qua bộ cài đặt Microsoft Office

1.1.2 Các chức năng chính của Excel

Là một ứng dụng bảng tính, mỗi cửa sổ văn bản của Excel là một WorkBook, trong đó gồm nhiều Sheet – mỗi Sheet có thể là bảng tính, biểu đồ hoặc macro bảng tính Các Sheet có thể độc lập hoặc phụ thuộc nhau tùy vào sự tổ chức của người sử dụng Khi lưu (save) WorkBook, Excel tự động thêm phần mở rộng là XLS

Chức năng chính của Excel bao gồm:

- Tính toán, phân tích, tạo biểu đồ, lập báo cáo trên các dữ liệu được tổ chức theo dạng bảng 2 chiều (mô hình quan hệ)

- Chia sẻ dữ liệu với các ứng dụng khác

Các chức năng này một phần được thực hiện thông qua các hàm đã được thiết kế sẵn hoặc hàm do người sử dụng tự tạo; phần khác thông qua các công cụ được tổ chức trong hệ thống menu hoặc biểu tượng lệnh

Là ứng dụng trong bộ Microsoft Office nên Excel được tối ưu hóa để sử dụng các tính năng bổ sung, như nhập văn bản từ Word, tạo chữ nghệ thuật từ WordArt, chèn văn bản toán học từ Equation, bổ sung hình ảnh từ ClipArt Gallery Ngược lại, Excel cũng cung cấp các phương thức để các ứng dụng khác có thể sử dụng được các chức năng mạnh của nó

1.1.3 Khởi động và kết thúc Excel

a Khởi động

Trang 2

Có nhiều cách khởi động chương trình Excel, dưới đây là một số cách thông dụng:+ Chọn biểu tượng Excel từ thanh Shortcut Bar hoặc thanh Quick Launch (nếu có)+ Từ nút Start : [START]\Programs\(Microsoft Office)\Microsoft Office Excel+ Hoặc khởi động từ biểu tượng Excel trong cửa sổ Windows Explorer

b Kết thúc

Sau khi hoàn tất phiên làm việc trong Excel, ta kết thúc nó bằng một trong cáccách sau:

+ Chọn lệnh từ menu: [FILE]\Exit

+ Nhấn vào nút đóng cửa sổ [X] ở góc trên phải, hoặc nhấn Alt–F4

Nếu các WorkBook có sửa đổi và chưa ghi lại sự thay đổi, thì Excel sẽ yêu cầu ta xác nhận việc có ghi hay không trước khi kết thúc Chọn [Yes] để ghi, [No] để kết thúc và không ghi, nhấn [Cancel] để hủy lệnh và tiếp tục làm việc với Excel

1.1.4 Các thành phần và khái niệm cơ bản

a Cửa sổ ứng dụng

Cửa sổ chính của Excel là vùng màn hình chứa chương trình Excel khi nó được khởi động, tương tự như các cửa sổ ứng dụng khác trong Windows Gồm các thành phần như: các đường viền giới hạn kích thước cửa sổ; thanh tiêu đề chứa tiêu đề chương trình và tên WorkBook đang làm việc; thanh menu ngang, các thanh công

cụ (Toolbar) chứa các biểu tượng lệnh; các nút lệnh của cửa sổ (hộp điều khiển, nút Minimize, Maximize/Restore, Close); thanh công thức; vùng làm việc (desktop) và cuối cùng là dòng trạng thái chứa thông báo và trạng thái làm việc

Thanh công thức Thanh công cụ Thanh tiêu đề Thanh thực đơn

Vùng làm việc

Trang 3

b Cửa sổ workbook (văn bản)

Ngay sau khi khởi động, thông thường Excel đưa ra một workbook mới để người

sử dụng có thể bắt đầu làm việc WorkBook này được đặt trong một cửa sổ văn bản nằm trong vùng desktop của cửa sổ ứng dụng

Khi được maximize (cực đại hóa), tiêu đề của cửa sổ workbook nằm chung với tiêu

đề của chương trình Mỗi Workbook bao gồm nhiều Sheet Mỗi Sheet là một lưới các ô (cell) được tổ chức thành hàng (row) và cột (column).

Ngay phía trên vùng bảng tính có 2 thành phần: một là hộp tên (Name Box) chứa tên của ô (hoặc dãy các ô) hiện thời đang được chọn; hai là thanh công thức

(Formula Bar) chứa nội dung hoặc cho phép nhập nội dung của ô đang chọn Phía dưới là thanh chứa tên các sheet trong workbook và thanh cuốn ngang, bên phải là thanh cuốn dọc

c Tổ chức bảng tính (sheet) trong Excel

* Đánh địa chỉ hàng, cột và ô

Trong Excel, hàng được đánh số (gán nhãn) từ 1, 2, đến 16384 (hoặc 65536); cột được đánh thứ tự từ A, B, , Z, AA, , IV (256 cột) Giao của cột và hàng là ô

(cell) với địa chỉ xác định là: [nhãn cột][nhãn dòng], ví dụ: ô F15 là giao của cột F

và dòng 15, hoặc được xác định theo cách R[số hiệu dòng]C[số hiệu cột], như

R5C8 là ô tại dòng 5 cột 8 (tức cột H)

Miền (Vùng, Khoảng các ô) là tập hợp các ô có dạng: một dãy liên tục các ô (giới

hạn trong một khung hình chữ nhật) và/hoặc các ô rời rạc Trong đó các ô liên tục

(khoảng các ô) được viết theo dạng ô đầu tiên trên trái:ô cuối cùng dưới phải, ví

dụ: A4:C7 là khoảng liên tục 12 ô giới hạn bởi 3 cột (A, B, C) và 4 hàng (4, 5, 6, 7); các ô rời rạc cách nhau bởi dấu phân cách (thông thường là dấu phẩy), ví dụ: C5, E9, F12 là dãy 3 ô rời nhau

* Nội dung của các ô

Mỗi ô có thể chứa dữ liệu hoặc công thức tính toán

Trang 4

- Giờ (time) 8:15:25

- Kiểu logic

Công thức tính toán có dạng: ký tự đầu tiên là dấu bằng (=) tiếp theo là một biểu

thức Ví dụ: tại ô A3 nếu ta nhập =5+3 thì sau khi nhấn Enter, nội dung của A3 sẽ

là 8

+ Biểu thức tính toán được định nghĩa là một tập hợp các toán tử và toán hạng

được viết theo quy tắc (cú pháp) do Excel quy định

Trong đó:

- Toán tử là các phép toán số học: + (cộng), - (trừ), * (nhân), / (chia), % (phần

trăm), ^ (lũy thừa); hoặc các toán tử so sánh: < (nhỏ hơn: less than), > (lớn hơn:

greater than), = (bằng: equal to), <= (nhỏ hơn hoặc bằng: less than or equal to), >= (lớn hơn hoặc bằng: greater than or equal to), <> (không bằng: not equal to), và toán tử nối chuỗi & (ví dụ: “HO”&“TEN”)

- Toán hạng có thể là giá trị hằng (constant), một tham chiếu ô, một nhãn (label),

tên (name) hoặc là một hàm (function) của workbook Các hằng chuỗi được bao

trong cặp nháy kép “ ”

Hàm (function) có dạng: Tên hàm(danh sách đối số – nếu có), trong đó cặp ngoặc

đơn là bắt buộc Do hàm thực hiện một quá trình xử lý hay tính toán và trả về một kết quả nên nó có thể xuất hiện bất kỳ ở đâu trong một biểu thức mà ở đó có thể có một toán hạng Ngoài ra, Excel còn cho phép khả năng các hàm lồng nhau, nghĩa là một hàm có thể xuất hiện trong danh sách đối số của một hàm khác Ví dụ: SUM(A1, SUM(C5:F7))

Ví dụ về công thức: = 15 + (4 * A6) – SUM(B2:B4)

Trong đó: 5, 4 là các hằng; A6, B2:B4 là các tham chiếu ô; SUM là tên hàm; + * –

là các toán tử

Giá trị của công thức được Excel tự động cập nhật khi có sự thay đổi liên quan đến mỗi một giá trị của toán hạng trong đó

* Tham chiếu (địa chỉ ô) tương đối và tuyệt đối

Để tham chiếu đến các ô, có hai cách: tham chiếu tương đối và tham chiếu tuyệt đối

Trang 5

Tham chiếu tương đối xác định vị trí tương đối từ ô chứa tham chiếu đến ô được

tham chiếu Ví dụ: trong công thức tại ô C3 có chứa tham chiếu đến ô A2 được hiểu như là: xuất phát tại ô hiện thời (C3) sang trái 2 cột (từ C sang A) và di chuyển lên 1 hàng (từ hàng thứ 3 lên 2) để lấy dữ liệu tại đó

- Với tham chiếu tương đối, khi người sử dụng sao chép công thức từ ô này sang ô

khác thì giá trị tham chiếu tự động thay đổi Ví dụ, nếu sao chép công thức trong C3 ở trên sang K5 thì tham chiếu đến A2 sẽ đổi lại là I4 (giữ nguyên sự tương đối

từ K5 đến I4: sang trái 2 và lên 1)

- Từ đây suy ra, nếu sao chép công thức theo chiều dọc thì số hiệu hàng sẽ bị thay đổi, số hiệu cột được giữ nguyên Tương tự, nếu sao chép theo chiều ngang thì giá trị cột bị thay đổi, giữ lại số hiệu dòng

Tham chiếu tuyệt đối xác định sự tuyệt đối trong cách tham chiếu, nghĩa là luôn

hướng đến các vị trí cố định (theo hàng và/hoặc theo cột) nào đó của bảng tính khi sao chép công thức Vì ô được xác định bởi hàng và cột, nên sự tuyệt đối ở đây có thể chỉ tác động đến hàng, đến cột hoặc cả hai Excel dùng ký tự $ đặt trước tên hàng hoặc tên cột để chỉ sự tuyệt đối Ví dụ, E1 chứa công thức = $A$1 + $B1 + C$1 + D1, bao gồm tuyệt đối ở A1, tuyệt đối theo hàng ở B1, theo cột ở C1 và tương đối ở D1 Khi đó nếu sao chép công thức này đến ô H5 thì sẽ tự động đổi lại là: = $A$1 + $B5 + F$1 + G5

Tên của một khoảng các ô được xem là một tham chiếu tuyệt đối

Trong thực hành, sau khi nhập tham chiếu ô ta dùng phím F4 để chuyển đổi giữa các loại tham chiếu

Trang 6

1.2 Các thao các cơ bản

1.2.1 Chọn các ô, hàng, cột

- Chọn 1 ô: click vào ô muốn chọn

- Chọn nhiều ô liên tục: chọn ô đầu tiên (góc trên trái) của khoảng cần chọn, sau đó drag (kéo lê) mouse (hoặc shift-click) đến vị trí cuối (góc dưới phải)

- Để chọn thêm các ô rời rạc nhấn giữ phím Ctrl trong khi click vào các ô.

Ngoài ra, còn có thể chọn nhanh bằng cách nhập khoảng cần chọn vào hộp tên

- Việc chọn hàng hoặc cột tương tự như chọn ô Thay cho click vào ô, ta click vào nhãn cột hoặc số hiệu hàng để chọn 1 cột hoặc 1 hàng Chọn nhiều liên tục bằng kỹ thuật drag hoặc shift-click Chọn rời rạc bằng Ctrl-click

Clear contents để xóa nội dung các ô (hoặc nhấn phím Del)

Có thể dùng menu thay cho việc nhấn R-click Menu [Edit]\Del hoặc [Edit]\Clear

để xóa Menu [Insert]\Cells, Rows hoặc Columns để chèn thêm

Số đối tượng chèn thêm vào hoặc xóa đi bằng với số đối tượng đã chọn (ví dụ, nếu đang chọn 3 hàng thì lệnh Insert sẽ chèn 3 hàng)

1.2.3 Nhập và sửa chữa nội dung của ô

Nhập: Chọn ô, sau đó nhập nội dung Kết thúc việc nhập nội dung bằng phía Enter

Nếu không muốn thay đổi nội dung đã có trước đó thì nhấn Esc

Sửa: Nhấn Double-click (D-click) hoặc F2 vào một ô đang chọn để sửa chữa nội

dung, nếu chỉ click vào ô thì dữ liệu nhập vào sẽ thay dữ liệu đã có trước đó Trong chế độ sửa chữa có thể dùng các phím Home, End để di chuyển Dùng dấu bằng (=)

để bắt đầu nhập công thức Nếu trong công thức cần tham chiếu ô thì hoặc là tự nhập tên các ô cần tham chiếu, hoặc là dùng mouse để chọn.

Trang 7

Tạo dạng ô (Format Cells): Excel cung cấp nhiều khả năng trong việc thay đổi

dạng thức của một ô Ví dụ: đối với 1 con số có thể được biểu diễn bằng nhiều dạng: nó có thể là số, là ngày, giờ, biểu diễn phần trăm, tiền tệ với ký hiệu $, đ

Để tạo dạng một hoặc nhiều ô, đầu tiên ta chọn chúng, sau đó dùng menu

[Format]Cells hoặc nhấn phím phải và chọn Format Cells.

Trong hộp thoại có chứa nhiều mục phục vụ cho việc tạo dạng Chúng bao gồm:

- Mục [Number] dùng để tạo dạng số, gồm: Number tạo dạng các con số,

Currency tạo dạng tiền tệ; Date, Time tạo dạng ngày giờ; Percentage tạo dạng phần trăm; Fraction tạo dạng phân số; Text tạo dạng văn bản

- Mục [Alignment] dùng để chỉnh sắp dữ liệu theo 2 hướng: ngang (Horizontal),

đứng (Vertical); và điều khiển việc cho phép văn bản xuống dòng (Wrap text) hay trải lấp sang các ô bên cạnh Ngoài ra còn cho phép quay văn bản theo các góc quay khác nhau

- Mục [Font] dùng để tạo dạng về font chữ.

- Mục [Border] dùng cho việc thiết lập đường viền của các ô với rất nhiều lựa

chọn

1.2.4 Tạo dãy tự động

Một dãy số liệu liên tục (ví dụ: a1, a2, ) có thể được tạo ra một cách tự động bằng cách nhập 2 số liệu đầu tiên, sau đó bôi đen và đưa chuột xuống góc dưới phía bên

phải đến khi xuất hiện một nút vuông nhỏ, di chuyển mouse đến vị trí này (mouse

có hình dấu cộng) kéo lê nút vuông đến ô cuối của dãy số liệu sẽ tạo ra một dãy liên tục Nếu dãy là dãy số (ví dụ: 1, 2, ) thì phải nhấn thêm phím Ctrl để tạo dãy liên tục Nếu ô đầu tiên là công thức thì việc kéo nút điều khiển sẽ sao chép công thức đến các ô, khi đó các tham chiếu sẽ được điều chỉnh tự động

1.3 Các thành phần của biểu đồ

+ Vùng dữ liệu: một khoảng liên tục hoặc rời rạc các ô bảng tính được chọn để

dùng làm dữ liệu cho biểu đồ, có thể tổ chức theo hàng hay cột gọi là dãy (series)

dữ liệu Mỗi ô tạo thành một điểm dữ liệu trên biểu đồ và được đánh dấu (markers) bởi các kí hiệu khác nhau Vùng dữ liệu có thể bao gồm một hàng (hoặc cột) chứa các nhãn (label)

Trang 8

+ Trục tọa độ: hệ thống các đường thẳng đứng hoặc ngang xác định tỉ lệ biểu diễn

các điểm dữ liệu, trên các trục có chứa các vạch đánh dấu tỉ lệ (tick mark) Các trục thường có hai loại: trục chủ đề (category) và trục giá trị (value)

+ Hộp ghi chú (legend): chứa các dấu hiệu biểu diễn các dãy số liệu có mặt trong

biểu đồ Có thể đặt legend tại một vị trí tùy ý trong biểu đồ

+ Tiêu đề (title): dòng văn bản tạo nhãn cho biểu đồ (chart title) và các trục.

1.4 Sử dụng Chart Wizard

Bước 1: Nhập dữ liệu vào bảng tính

Bước 2: Click vào biểu tượng Chart Wizard hoặc chọn [Insert]\Chart.

Bước 3: Thực hiện 4 bước đã được chỉ ra là:

Step 1 of 4 (chọn kiểu đồ thị)

Nhấn Next để thực tiện tiếp

Step 2 of 4 (quét dữ liệu vào data range)

Trang 9

Nhấn Next để thực tiện tiếp

Step 3 of 4 (ghi tên đồ thị và tên trục)

Nhấn Next để thực tiện tiếp

Step 4 of 4 (ghi vị trí lưu đồ thị)

Nhấn nút Finish

Trang 10

Bước 4: Chỉnh sửa lại đồ thị (nếu cần)

1.5 Định dạng trang: [File]→ Page Setup

Trong mục này có các chức năng giống với Word như khai báo giấy (Page), thiết lập các lề (Margins), tạo các dòng tiêu đề đầu và chân trang (Header/Footer)

Ngoài ra, trong Excel có bổ sung một tính năng đặc thù của bảng biểu, đó là cho phép tạo ra các hàng lặp lại ở đỉnh (Rows to repeat at top) và các cột lặp lại ở bên trái (Columns to repeat at left) khi sang trang mới Nghĩa là có thể tạo các hàng/cột thống nhất trên các trang

Để chọn các hàng/cột sẽ lặp lại khi sang trang, ta chọn hộp thích hợp sau đó dùng mouse chọn các hàng trong bảng tính

Ngoài ra, nếu bảng tính có nhiều trang thì ta có thể chỉ định hướng in: in xuống rồi

sang phải (Down, then over) hay ngược lại (Over, then down).

1.6 Xem trước khi in: [File]→Print Preview

Chức năng này cho phép kiểm tra bảng tính một cách tổng thể trước khi quyết định

in chính thức Ở đây, ta có thể tiến hành nhiều phép hiệu chỉnh, như: thay đổi lề, cột để bảng tính có thể vừa khít trên một trang Nhấn ESC hoặc [Close] để kết thúc xem

1.7 Chức năng in: [File]→Print

Các thông số in trong Excel hầu hết đều sử dụng theo chuẩn của Windows, như chọn loại máy in, có muốn in ra file để sau đó đưa đi in ở một máy khác hay không ([] Print to file), chọn khoảng trang sẽ in (All: in toàn bộ, From To để chỉ định các

trang sẽ in) Các mục trong vùng Print what (In cái gì?) có chứa một số mục

riêng của Excel Nếu muốn in chỉ một vùng bảng tính thì chọn vùng này trước khi

thực hiện lệnh in, sau đó đánh dấu vào mục Selection Để in bảng tính ở Sheet đang làm việc thì chọn mục Active sheet(s) và chọn mục Entire workbook để in toàn bộ

file (gồm tất cả các sheet)

Ngoài ra có thể chọn số bản sao trên một trang (Number of copies) và cách sắp khi

in (Collate)

a Thiết đặt trang in: Chọn File→Page Setup

Portrait: in dọc; Landscape: in ngang

Margins: căn lề

Trang 11

Header/Footer: tiêu đề trang in

Trang 12

Tùy theo mục đích, ta chọn kiểu bảo vệ (Protection) phù hợp Trong các kiểu, người sử dụng đều nhập một mật khẩu bảo vệ và thiết lập các tùy chọn về quyền của người dùng trên các đối tượng được bảo vệ.

Cách 1:

Chọn Tools→Protection→Protect Sheet→Nhập password

Cách 2: File→Save as→Tools→General Options→Nhập password

Trang 13

CHƯƠNG II XỬ LÝ SỐ LIỆU TRONG NGHIÊN CỨU SINH HỌC

2.1 MỘT SỐ KHÁI NIỆM

2.1.1 Tổng thể nghiên cứu

a Định nghĩa: Tổng thể nghiên cứu là toàn bộ tập hợp các phần tử đồng nhất theo

một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó

Số lượng các phần tử của tổng thể được gọi là kích thước của tổng thể, ký hiệu là n Với mỗi tổng thể, ta không nghiên cứu trực tiếp tổng thể đó mà thông qua một hay nhiều dấu hiệu đặc trưng cho tổng thể đó, chúng được gọi là dấu hiệu nghiên cứu

và được ký hiệu χ

b Các phương pháp mô tả tổng thể

• Mô tả tổng thể theo bảng phân phối tần số:

Giả sử trong tổng thể dấu hiệu nghiên cứu định lượng χ nhận các giá trị x1, x2, xk với các tần số tương ứng n1, n2, .nk Lúc đó, tổng thể được mô tả như sau:

Giá trị của χ x1 x2 xi xkTần số n1 n2 ni nk

ni là số phần tử của tổng thể có chung giá trị xi

• Mô tả tổng thể theo bảng phân phối tần suất

Nếu kí hiệu pi (i=1,k) là tần suất của xi , tức là tỷ số giữa tần số của xi và kích

thước của tổng thể thì pi = n

ni

; i=1,kLúc đó, tổng thể được mô tả như sau:

Giá trị của χ x1 x2 xi xkTần số p1 p2 pi pk

• Mô tả tổng thể theo tần suất tích lũy:

Trang 14

Nếu kí hiệu wi (i=1,k) là tần số tích lũy của xi, tức là tổng số các phần tử có giá

trị nhỏ hơn xi thì wi = ∑

<xi xj

wi xi

+ Mỗi phần tử được lấy vào mẫu một cách hoàn toàn ngẫu nhiên tức là mọi phần

tử của tổng thể đều có thể được lấy vào mẫu với khả năng như nhau

+ Các phần tử được lấy vào mẫu theo phương thức hoàn lại, tức là trước khi lấy một phần tử thứ k thì trả lại phần tử thứ (k-1) mà đã nghiên cứu xong (k=2,n)

Trong thực tế, nếu kích thước của tổng thể khá lớn còn mẫu chỉ chiếm một phần nhỏ của tổng thể thì phương thức lấy mẫu hoàn lại và không hoàn lại cho ta kết quả sai lệch không đáng kể

2.1.3 Mẫu ngẫu nhiên hai chiều

Trên cùng một tổng thể nghiên cứu đồng thời hai dấu hiệu định tính hoặc định lượng, trong đó dấu hiệu nghiên cứu thứ nhất có thể xem như đại lượng ngẫu nhiên

X, còn dấu hiệu nghiên cứu thứ hai có thể xem như đại lượng ngẫu nhiên Y Như vậy, nghiên cứu đồng thời hai dấu hiệu trong tổng thể tương tự như nghiên cứu một đại lượng ngẫu nhiên hai chiều

a Định nghĩa: Mẫu ngẫu nhiên hai chiều kích thước n là tập hợp của n đại

lượng ngẫu nhiên độc lập (X1, Y1), (X2, Y2), (Xn, Yn), được thành lập từ đại lượng ngẫu nhiên hai chiều (X,Y) và có cùng quy luật phân phối xác suất với (X, Y)

Trang 15

b Phương pháp mô tả mẫu ngẫu nhiên hai chiều:

Giả sử từ tổng thể rút ra một mẫu kích thước n, trong đó thành phần X nhận các giá trị x1, x2 , xi , xh còn thành phần Y nhận các giá trị y1, y2 , ,yj , yk Trong đó, giá trị (xi, yj) xuất hiện với tần số nij (i=1,h; j=1,k) Các giá trị của xi và yj được sắp xếp theo thứ tự tăng dần thì giá trị cụ thể của mẫu được mô tả theo bảng sau:

YX

y1 y2 yj yk ni

x1x2 .xi .xh

n11 n12 n1j n1kn21 n22 n2j n2kni1 ni2 nij nik

nh1 nh2 nhj nhk

n1n2ninh

mj m1 m2 mj mk ∑ = n

Trong đó, ni là ký hiệu tổng các tần số mẫu mang giá trị xi của thành phần X, mj ký hiệu tổng các tần số của mẫu mang giá trị yj của thành phần Y

2.2 HÀM THỐNG KÊ VÀ CÁCH SỬ DỤNG

2.2.1 Một số hàm thống kê thường dùng trong sinh học

AVERAGE (n1, n2, ): tính trung bình cộng của các số n1, n2,

COUNT (dc): đếm số các ô có dữ liệu loại số trong vùng dc

COUNTA (dc): đếm các ô không rỗng trong vùng dc

FTEST (mẫu 1, mẫu 2): so sánh phương sai của mẫu 1 và mẫu 2

LARGE (dc,k): phần tử lớn thứ k của vùng dc

MAX (n1,n2, ): giá trị lớn nhất của các số n1, n2,

MIN (n1,n2, ): giá trị nhỏ nhất của các số n1, n2,

MEDIAN (n1,n2, ): cho ra số gần với giá trị trung bình của dãy số n1, n2,

MODE (dc): lấy giá trị hay gặp nhất trong vùng dc

SMALL (dc,k): phần tử nhỏ thứ k trong vùng dc

Trang 16

STDEV (n1,n2, ): độ lệch tiêu chuẩn của dãy số n1, n2,

VAR (n1,n2, ): phương sai của dãy số n1, n2,

IF (Biểu thức logic, biểu thức 1, biểu thức 2): Hàm điều kiện, nếu biểu thức logic đúng thì thực hiện biểu thức 1, nếu biểu thức logic sai thì thực hiện biểu thức 2SUM (n1,n2, ): cho giá trị tổng của dãy n1, n2,

2.2.2 Cách sử dụng hàm

a Nhập hàm thông qua bảng chọn

Các bước thực hiện:

- Chọn f(x) trên thanh công cụ hoặc chọn Insert / Function

- Trong hộp thoại Insert Function chọn hàm cần dùng

- Trong hộp thoại Function Arguments, quét dữ liệu cần xử lý

- Nhấn OK

Ví dụ:

Giả sử cần tính phương sai của các số trong vùng A2:A20 cần thực hiện như

sau:

- Chọn f(x) trên thanh công cụ hoặc chọn Insert / Function

- Trong hộp thoại Insert Function chọn hàm VAR

- Trong hộp thoại Function Arguments, quét dữ liệu trong vùng A2:A20

- Nhập dấu = và ghi tên hàm

- Quét dữ liệu vào sau tên hàm

- Nhấn ENTER

Ví dụ:

Giả sử cần tính giá trị trung bình của các số trong vùng A2:A20 cần thực hiện như sau: Nhấn chuột vào ô A21, nhập dấu = AVERAGE(A2:A20) và nhấn ENTER, kết quả sẽ hiện ở ô A21

c Sử dụng tên hàm trong biểu thức

Trang 17

Có thể sử dụng tên hàm trong các biểu thức

Ví dụ:

Cột dữ liệu Lương ghi từ ô E2:E9 Để tính chênh lệch lương cao nhất với lương

thấp nhất, ta thực hiện: Tại ô E10 nhập =MAX(E2:E9)-MIN(E2:E9)

2.3 PHƯƠNG PHÁP SO SÁNH

2.3.1 Trường hợp các mẫu độc lập

Mẫu độc lập hoặc thí nghiệm độc lập nếu một quá trình thí nghiệm được tiến hành một cách độc lập với những thí nghiệm khác, các thí nghiệm được bố trí khác nhau về không gian, thời gian để có thể loại bỏ những tác dụng giống nhau như điều kiện môi trường, thổ nhưỡng, khí hậu,

2.3.1.1 Trường hợp hai mẫu độc lập

Trong nghiên cứu sinh học, chúng ta thường so sánh hai môi trường nuôi cấy khác nhau, hai chế độ dinh dưỡng khác nhau, vì vậy cần phải chọn một trong hai giả thuyết Để kiểm tra và so sánh hai giả thuyết này cần đặt giả thiết H0: μ1=μ2 và đối thiết H1: μ1≠μ2

Phương pháp kiểm tra phương sai:

Các bước thực hiện:

- Nhập số liệu của hai mẫu vào bảng tính

- Chọn hàm fx trên thanh công cụ hoặc chọn Insert → Function

- Chọn hàm FTEST

- Chọn OK và có 2 dãy khai báo

+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1

Trang 18

+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2

) 2 / ( ) 1 / (

2 1

2

2c n S c n S

X X t

Trong đó: X−1 X−2 là hai trung bình của hai mẫu quan sát 1 và 2

n1 và n2 là kích thước của hai mẫu quan sát 1 và 2

2 2 1

) (

) (

1 1

2 1

2 2 2 1

1 2

− +

− +

x x x

x c

S

n i

n

i

Đại lượng t được xác định theo quy luật phân bố t với bậc tự do k=n1+n2-2

* Nếu hai phương sai bằng nhau thì sử dụng phương pháp tính sau:

Cách 1:

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn hàm fx trên thanh công cụ hoặc chọn Insert → Function

- Chọn hàm TTEST

- Chọn OK và có 4 dãy khai báo

Trang 19

+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1

+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2

+ Dãy 3 (Tail): ghi 2 (với ý nghĩa kiểm tra 2 chiều)

+ Dãy 4 (Type): ghi 2

- Chọn OK

Nếu kết quả cho P<0,05, bác bỏ giả thiết Ho, chấp nhận đối thiết H1

Nếu P>0,05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho

Cách 2:

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn Tools → Data analysis

- Chọn t-test: Two sample assuming equal variances trong bảng Data analysis

- Nhấn OK và khai báo vào hộp thoại

Trang 20

+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range

+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range

+ Ghi 0 vào khung Hypothesized Mean Difference

+ Nếu quét cả tiêu đề thì nhấn vào ô Label

+ Alpha: ghi mức ý nghĩa

+ Chọn 1 ô trống để ghi kết quả vào Output Range

Nếu P(T<=t) two-tail<0.05 thì bác bỏ giả thiết Ho, chấp nhận đối thiết H1

Nếu P(T<=t) two-tail>0.05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho

Bài tập ví dụ:

Để so sánh hai loại phân bón khác nhau, người ta trồng lúa tại hai ruộng, ruộng

1 bón phân A, ruộng 2 bón phân B Lúa được trồng cùng thời gian, cùng mật độ, cùng điều kiện nông hóa thổ nhưỡng, chỉ khác nhau về phân bón Kết quả thu hoạch lúa như sau:

Năng suất ruộng 1

Trang 21

Đặt giả thiết H0: Năng suất lúa trên 2 ruộng là như nhau

Đối thiết H1: Năng suất lúa trên 2 ruộng thực sự khác nhau

Kiểm tra phương sai bằng hàm F-TEST kết quả cho P=0,5239

Vì P>0,05 nên chấp nhận sự bằng nhau của 2 phương sai

Vậy cần so sánh năng suất lúa trên hai ruộng với trường hợp hai phương sai bằng nhau

Sử dụng t-test: Two sample assuming equal variances trong Data analysis

kết quả ở bảng dưới đây:

t-Test: Two-Sample Assuming Equal Variances

Năng suất ruộng 1 (tạ/ha)

Năng suất ruộng 2 (tạ /ha)

* Nếu hai phương sai khác nhau thì sử dụng phương pháp tính sau:

Cách 1:

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn hàm fx trên thanh công cụ hoặc chọn Insert → Function

- Chọn hàm TTEST

Trang 22

- Chọn OK và có 4 dãy khai báo

+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1

+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2

+ Dãy 3 (Tail): ghi 2 (với ý nghĩa kiểm tra 2 chiều)

+ Dãy 4 (Type): ghi 3

- Chọn OK

Nếu kết quả cho P<0,05, bác bỏ giả thiết Ho, chấp nhận đối thiết H1

Nếu P>0,05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho

Cách 2:

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn Tools → Data analysis

- Chọn t-test: Two sample assuming unequal variances trong bảng Data analysis

Trang 23

- Nhấn OK và khai báo vào hộp thoại

+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range

+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range

+ Ghi 0 vào khung Hypothesized Mean Difference

+ Nếu quét cả tiêu đề thì nhấn vào ô Label

+ Alpha: ghi mức ý nghĩa

+ Chọn 1 ô trống để ghi kết quả vào Output Range

Nếu P(T<=t) two-tail<0.05 thì bác bỏ giả thiết Ho, chấp nhận đối thiết H1Nếu P(T<=t) two-tail>0.05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho

b Số mẫu n>30: Để so sánh trung bình 2 mẫu với số mẫu lớn hơn 30 thì kiểm

tra theo tiêu chuẩn U của hàm phân bố chuẩn

Trang 24

2 1

n

S n

S

S d = +

1

x x−2 là hai trung bình của hai mẫu quan sát 1 và 2

n1 và n2 là kích thước của hai mẫu quan sát 1 và 2

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn f(x)→VAR để tính phương sai cho 2 mẫu cần so sánh

- Chọn Tools → Data analysis

- Chọn z-Test: Two Sample for Means trong bảng Data analysis

- Nhấn OK và khai báo vào hộp thoại

Trang 25

+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range

+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range

+ Ghi 0 vào khung Hypothesized Mean Difference

+ Variable 1 Variance(known): khai báo phương sai của mẫu 1 + Variable 2 Variance(known): khai báo phương sai của mẫu 2 + Nếu quét cả tiêu đề thì nhấn vào ô Label

+ Alpha: ghi mức ý nghĩa

+ Chọn 1 ô trống để ghi kết quả vào Output Range

Trang 28

Dùng hàm VAR tính phương sai của 2 mẫu kết quả được:

Phương sai mẫu đối chứng bằng 0,0629

Phương sai mẫu thí nghiệm bằng 0,00508

Sử dụng z-Test: Two Sample for Means cho kết quả trong bảng sau:

z-Test: Two Sample for Means

2.3.1.2 Trường hợp nhiều mẫu độc lập

So sánh nhiều mẫu độc lập theo tiêu chuẩn phi tham số của Kruskal và Wallis

- Điều kiện áp dụng: số mẫu n≥3, các đại lượng quan sát ở các mẫu là đại

lượng liên tục

- Các bước thực hiện:

+ Nhập dữ liệu vào bảng tính

+ Dùng lệnh Copy để copy dữ liệu của các mẫu cần so sánh vào một cột

+ Sử dụng lệnh Data/Sort Ascending cho cột dữ liệu vừa copy ở trên

+ Xếp hạng cho cột vừa sắp xếp theo lệnh Sort bằng cách điền số thứ tự từ 1 đến n bằng Fill handle vào một cột XH bên cạnh.

+ Nếu giá trị của cột dữ liệu trùng nhau thì giá trị xếp hạng sẽ bằng giá trị trung bình của của cột XH ở các các giá trị trùng nhau

+ Ghi hạng cho từng mẫu thí nghiệm của bảng tạo ở bước 1

Trang 29

+ Tính tổng hạng Ri cho mỗi thí nghiệm bằng hàm SUM

+ Tính H theo công thức:

) 1 ( 3 )

1 (

=

n n

Ri n

Trang 30

Fill handle vào một cột XH bên cạnh Các dữ liệu trùng nhau thì giá trị xếp

hạng sẽ bằng giá trị trung bình của của cột XH ở các các giá trị trùng nhau Ghi hạng cho từng mẫu thí nghiệm Kết quả xếp hạng cho từng mẫu thí nghiệm ở bảng dưới đây:

Thay các giá trị trên vào công thức tính H ta được H=10,33951

Bậc tự do k=2 nên χ20 , 05= 5,99

Vì H> χ2

05 ,

0 nên giả thiết Ho bị bác bỏ, chấp nhận đối thiết H1, tức là hàm lượng mùn ở 3 khu rừng thực sự khác nhau

2.3.2 Trường hợp các mẫu liên hệ

Cách bố trí thí nghiệm kiểu cặp đôi được gọi là mẫu liên hệ Những kết quả quan sát ở phương pháp thứ nhất và thứ hai có liên hệ với nhau

2.3.2.1 Trường hợp hai mẫu liên hệ

Đặt giả thiết Ho: μ1=μ2 và đối thiết H1: μ1≠μ2

Để kiểm tra giả thiết Ho trong trường hợp này có 2 phương pháp

Cách 1:

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn hàm fx trên thanh công cụ hoặc chọn Insert →Function

- Chọn hàm TTEST

Trang 31

- Chọn OK và có 4 dãy khai báo

+ Dãy 1 (Array1): Quét vùng dữ liệu của mẫu 1

+ Dãy 2 (Array2): Quét vùng dữ liệu của mẫu 2

+ Dãy 3 (Tail): ghi 2 (với ý nghĩa kiểm tra 2 chiều)

+ Dãy 4 (Type): ghi 1

- Chọn OK

Nếu kết quả cho P<0,05, bác bỏ giả thiết Ho, chấp nhận đối thiết H1Nếu P>0,05 thì bác bỏ đối thiết H1, chấp nhận giả thiết Ho

Cách 2:

- Nhập dữ liệu của hai mẫu vào bảng tính

- Chọn Tools → Data analysis

- Chọn t-test: Paired Two Sample for Means trong bảng Data analysis

- Nhấn OK và khai báo vào hộp thoại

Trang 32

+ Khai báo dữ liệu mẫu 1 vào khung Variable 1 Range

+ Khai báo dữ liệu mẫu 2 vào khung Variable 2 Range

+ Ghi 0 vào khung Hypothesized Mean Difference

+ Nếu quét cả tiêu đề thì nhấn vào ô Label

+ Alpha: ghi mức ý nghĩa

+ Chọn 1 ô trống để ghi kết quả vào Output Range

1 2 3 4 5 6 7 8 9 10Thức ăn A 2.1 2.2 2.1 2.0 1.8 1.9 1.7 1.6 2.3 2.4

Thức ăn B 2.3 2.4 2.5 2.0 1.4 1.5 1.3 1.4 1.5 1.7

Hãy cho biết loại thức ăn nào tốt hơn, hai loại thức ăn này có thực sự khác nhau hay không? Nên chọn thức ăn nào để nuôi gà

Bài giải:

Sử dụng t-test: Paired Two Sample for Means trong bảng Data analysis

Kết quả thu được trong bảng dưới đây:

Trang 33

t-Test: Paired Two Sample for Means

2.3.2.2 Trường hợp nhiều mẫu liên hệ

So sánh theo tiêu chuẩn Friedman

- Điều kiện áp dụng: Cho thí nghiệm bố trí theo khối ngẫu nhiên hoàn toàn và

a ba

a

i n

0 thì giả thiết Ho bị bác bỏ, chấp nhận đối thiết H1

Trang 34

Nếu χ2

n≤ χ2 05 ,

0 thì chấp nhận giả thiết Ho, bác bỏ đối thiết H1

Bài tập ví dụ:

Để nghiên cứu mức sinh trưởng về chiều cao của cây quế được trồng trong các điều kiện che bóng khác nhau, người ta đo chiều cao của các cây quế ở các lô thí nghiệm, kết quả thu được ở bảng sau:

I 9.92 9.93 11.28 11.04 10.31

II 9.18 10.15 10.56 10.95 9.31 III 11.4

10.9 3

0 =9,49

)1(

a ba

2.3.3 Trường hợp so sánh kết quả nghiên cứu định tính

2.3.3.1 Kiểm tra bằng tiêu chuẩn χ 2

- Điều kiện áp dụng: kết quả quan sát mẫu được chia ra làm nhiều cấp chất

lượng khác nhau, ví dụ như tốt, xấu, trung bình, kém,…

- Các bước thực hiện:

+ Nhập dữ liệu vào bảng tính

Trang 35

+ Tính tổng cho từng mẫu thí nghiệm (Tai)

+ Tính tổng cho từng cấp độ chất lượng (Tbj)

+ Chọn 1 cột bất kỳ ghi lần lượt Ta1, Ta2,…lặp lại đủ m lần bằng lệnh Copy+ Chọn 1 cột bất kỳ ghi n lần Tb1, n lần Tb2,… bằng lệnh Copy

+ Chọn 1 cột ghi lần lượt các số liệu quan sát ft ở mỗi cấp chất lượng

+ Chọn một cột tính tần số lý thuyết fl theo công thức:

Ts

Tbj Tai

f l = *

+ Chọn một cột ghi giá trị

l

l t

0 thì giả thiết Ho bị bác bỏ, chấp nhận đối thiết H1

Nếu χ2

n≤ χ2

05

,

0 thì chấp nhận giả thiết Ho, bác bỏ đối thiết H1

2.3.3.2 Kiểm tra bằng tiêu chuẩn Q của Cochran

- Điều kiện áp dụng: kiểm tra sự thuần nhất của các mẫu liên hệ dựa vào kết

quả thí nghiệm chia thành 2 cấp tốt và xấu

- Các bước thực hiện:

+ Nhập dữ liệu vào bảng tính

+ Tính tổng Gi của m thí nghiệm được lặp lại n lần bằng hàm SUM

+ Tính tổng lo là tổng của m thí nghiệm ở từng lần lặp lại

1 (

n

i i

lo lo m

G G

m m Q

Trang 36

0 =7,815.

Vậy Q≤ χ20 , 05 nên chấp nhận giả thiết Ho, bác bỏ đối thiết H1 tức 4 công thức thí nghiệm trên là như nhau khi nuôi 3 chủng vi sinh vật phân lập ở 4 môi trường khác nhau

Trang 37

So sánh tỉ lệ thuốc với giả dược

2.4 PHÂN TÍCH PHƯƠNG SAI

Phân tích phương sai là xác định ảnh hưởng của các nhân tố đến kết quả thí nghiệm Ví dụ: nghiên cứu ảnh hưởng của phân bón, mật độ, thổ nhưỡng, … đến năng suất cây trồng

Phân tích phương sai được phân chia thành 2 mô hình:

- Mô hình 1: là mô hình phân tích các nhân tố thí nghiệm được chia ra từng cấp xác định

- Mô hình 2: là mô hình phân tích các nhân tố thí nghiệm được chọn một cách ngẫu nhiên

Trang 38

2.4.1 Phân tích phương sai một nhân tố

Giả sử A là nhân tố thí nghiệm, A được chia làm a cấp một cách xác định hoặc ngẫu nhiên

Các bước thực hiện:

- Nhập dữ liệu vào bảng tính dưới dạng:

Các cấp của nhân tố A Kết quả quan sát

Đặt giả thiết: H0A là nhân tố A không ảnh hưởng đến kết quả thí nghiệm.Đối thiết H1A là nhân tố A có ảnh hưởng đến kết quả thí nghiệm

- Chọn Tools/Data analysis

- Chọn Anova: Single Factor trong hộp thoại Data analysis

- Nhấn OK và khai báo vào hộp thoại

Trang 39

+ Khai báo dữ liệu vào Input Range

+ Nếu số liệu các cấp của nhân tố phân tích cho theo hàng thì chọn Rows

+ Nếu số liệu các cấp của nhân tố phân tích cho theo cột thì chọn Columns

+ Nếu quét cả nhãn thì khai báo nhãn

+ Alpha: ghi mức ý nghĩa

+ Khai báo vùng ra vào Output Range

Nếu FA>F0,05 thì bác bỏ giả thiết H0A, nhân tố A đã tác động một cách khác nhau đến kết quả thí nghiệm Nhân tố A có ảnh hưởng đến kết quả thí nghiệm

Nếu FA≤F0,05 thì chấp nhận giả thiết H0A Nhân tố A không ảnh hưởng đến kết quả thí nghiệm

Bài tập ví dụ:

Khảo sát năng suất 4 giống đậu xanh, mỗi giống được lặp lại thí nghiệm 4 lần một cách ngẫu nhiên hoàn toàn Kết quả được ghi trong bảng 1 Từ kết quả này hãy kiểm tra xem năng suất các giống đậu xanh có phụ thuộc vào phẩm chất giống hay không ?

Trang 40

Đặt giả thiết: H0A là nhân tố giống không ảnh hưởng đến kết quả thí nghiệm.Đối thiết H1A là nhân tố giống có ảnh hưởng đến kết quả thí nghiệm.

Thực hiện các bước đã chỉ ra như ở trên ta được kết quả chỉ ra ở bảng dưới đây:Anova: Single

P-value: xác suất của FA

F crit: F0,05 kiểm tra với bậc tự do k1=a-1, k2=n-a, α=0,05

Giá trị F: Tính theo công thức 2

Ngày đăng: 19/12/2016, 22:43

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w