1. Trang chủ
  2. » Giáo án - Bài giảng

Bài tập Thống kê sinh học

24 4K 15

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 633 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong các cột C1, C2 và C3 hãy tạo ra 25 hàng của các số ngẫu nhiên tuân theo phân bố Poisson với trung bình là 25.. Tìm trung vị của mỗi hàng và lưu kết quả trong C6.. Mức flouride của

Trang 1

BÀI TẬP CÓ HƯỚNG DẪN GIẢI

Bài 1

1 Trong các cột C1, C2 và C3 hãy tạo ra 25 hàng của các số ngẫu nhiên tuân theo phân bố Poisson với trung bình là 25

2 Tính căn bậc hai của các giá trị trong C1 và lưu các giá trị mới tính trong C4

3 Tính tổng các cột C1, C2, C3 và lưu trữ kết quả trong C5

4 Tìm trung vị của mỗi hàng và lưu kết quả trong C6

5 Tìm tất cả các ô trong cột C1 có giá trị lớn hơn giá trị của ô cùng hàng trong C2 Lưu kết quả trong C7

6 Tìm tổng giá trị của tất cả các ô trong C1 và lưu kết quả trong C8

Hướng dẫn

1 Tạo các số ngẫu nhiên

– Mở một bảng tính (worksheet) mới

– Từ thanh menu chọn Calc > Random Data > Poisson

Trong cửa sổ Poisson Distribution, điền vào các hộp

– Number of row of data to generate:

Trang 2

2 Tính căn bậc 2 của C1 và lưu kết quả trong C4

Từ thanh menu chọn Calc > Calculator

Cửa sổ Calculator xuất hiện

– Trong hộp “Store result in variable:” gỏ C4.

– Chọn “Arithmetic” từ phần xổ xuống của “Functions”

– Chọn “Square root” từ hộp liệt kê các hàm “SQRT(number)” xuất hiện trong hộp

“Expression” , gỏ “C1” vào vị trí thay cho number

– Nhấp nút “OK”

Các giá trị căn bậc 2 của cột C1 bây giờ sẽ xuất hiện trong cột C4

3 Tính tổng của 3 cột và lưu kết quả trong C5

– Chọn “Row Statistics” từ hộp “Functions”

– Chọn “Sum” từ hộp danh sách các hàm “RSUM(number, number, )” sẽ xuất

hiện trong hộp “Expression” , thay number bằng C1, C2, C3 Nhấp chọn “OK”.

Trang 3

4 Tìm trung vị cho mỗi hàng và lưu kết quả trong C6

Cần lưu ý rằng chúng ta không tìm trung vị của từng cột mà là của từng hàng ngangqua cả 3 cột

– Chọn “Row Statistics” từ hộp “Functions”

– Chọn “Median” từ hộp danh sách các hàm “RMEDIA(number, number, )” sẽ

xuất hiện trong hộp “Expression” , thay number bằng C1, C2, C3 Nhấp chọn “OK”.

5 Chọn tất cả các ô trong cột C1 có giá trị lớn hơn giá trị trong cột C2 cùng

hàng.

– Trong hộp “Store result in variable:” gỏ “C7

– Trong hộp “Expression” , gỏ “C1 > C2,” nhấp chọn “OK”

Cột C7 sẽ liệt kê các giá trị 0 và 1 Số 1 cho biết các giá trị của C1 lớn hơn của C2 cùng hàng

6 Tìm tổngcủa tất cả các ô trong C1 và lưu kết quả trong C8

– Trong hộp “Store result in variable:” gỏ “C8.”

– Chọn “Statistics” từ hộp “Functions”

– Chọn “Sum” từ hộp danh sách các hàm “SUM(number)” sẽ xuất hiện trong hộp

Bài 2 Hãy tạo 1000 số ngẫu nhiên có giá trị từ 0 đến 9 và lưu kết quả trong các cột

từ 1 đến 50

Hướng dẫn

– Chọn Calc > Random Data > Integer… Trong hộp thoại Integer Distribution:

– Number of rows of data to generate: gỏ 20

– Store in column(s): C1– C50

Trang 4

Bài 3 Một giống cỏ mới được chọn lọc để trồng ở mặt sân golf với yêu cầu phải đạt

là tỉ lệ nẩy mầm 85% Để đánh giá giống cỏ mới này, người ta đã gieo trồng 20 hạttrong nhà kính Nếu tỉ lệ nảy mầm đạt 85% thì xác xuất để có từ 18 hạt trở lên nảymầm là bao nhiêu?

Cal > Probability Distribution > Binomial

Tính xác xuất (P x ≤ 17) Lưu dưới dạng hằng số k

Trang 5

Tính xác xuất (P ≥ 18): Cal > Calculator

Bài 4 Tính P (X ≤ 18) khi X có phân bố chuẩn với  = 23 và  = 5

Hướng dẫn:

– Chọn Calc > Probability > Normal

– Chọn Cumulative probability.

– Chọn Input constant Nhập giá trị của x: 18 → OK

Trang 6

Bài 5 Từ một tổng thể có phân bố chuẩn với  = 60 và  = 5, hãy tạo một phân bố

Hướng dẫn

– Chọn Calc > Random Data > Normal

– Nhập số mẫu: Generate 500 rows

– Nhập cở mẫu: Storre in column(s): C1 – C16

– Nhập các giá trị của  và  : Mean: 60, Standard devation: 5

– OK

Trang 7

Kết quả là các số ngẫu nhiên được tạo ra trong worksheet, từ cột C1 đến C16, mỗi cột có 500 hàng (mỗi hàng đại diện cho một mẫu, 16 cột là cở mẫu).

– Tính trung bình của từng mẫu cho cả 500 mẫu

+ Chọn Calc > Row Statistics > mean

+ Nhập vị trí của dữ liệu: Input Variables: C1 – C16

+ Nhập tên cột để lưu 500 giá trị trung bình: Store Results in: C17

+ Graph > Histogram Trong Graph box gỏ C17 → OK

Trang 8

– Tính trung bình của 500 x:

+ Calc > Column Statistics > mean

+ Nhập vị trí của 500 trung bình: Input Variable C17

+ OK

Nếu không chọn store results in thì kết quả sẽ hiển thị trong cửa số Session

+ Calc > Column Statistics > standard deviation

+ Nhập vị trí của 500 trung bình: Input Variable C17

61 60

59 58

Trang 9

BÀI TẬP THỰC HÀNHChương 2

Bài 1.

a) Hãy tạo 100 số ngẫu nhiên có phân bố chuẩn với giá trị trung bình là 10 và độlệch chuẩn là 0.5 Tính các giá trị thống kê mô tả cơ bản

b) Tóm tắt các dữ liệu thống kê bằng biểu đồ (graphical summary)

c) Lập biểu đồ cột và biểu đồ stem and leaf

d) Từ 100 biến trên, hãy chọn ngẫu nhiên một mẫu gồm 30 biến số Copy sangworksheet mới Thực hiện các công việc a, b, c với mẫu

Bài 2 Dựa vào số liệu trong bảng 2.1 hãy dùng cách tóm tắt biểu đồ để phân tích

xem dữ liệu có phân bố chuẩn hay không Biểu diễn dữ liệu bằng biểu đồ thích hợp

Bảng 2.1 Trọng lượng gà (g) sau 8 tuần nuôi bằng khẩu phần có bổ sung kháng

sinh

Bài 3 Trong bài báo "Viral load and heterosexual transmission of human

immunodeficiency virus type 1" [New England Journal of Medicine (2000)342:921-929], nghiên cứu về khả năng lây nhiễm HIV-1ghi nhận số liệu về mứcHIV-1 RNA trong nhóm người ban đầu không bị lây nhiễm trở thành HIV dươngtính trong quá trình nghiên cứu (đơn vị tính là RNA copies / mL)

79725 12862 18022 76712 256440 14013 46083 6808 85781 1251

6081 50397 11020 13633 1064 496433 25308 6616 11210 13900a) Xác định trung bình, trung vị, và độ lệch chuẩn

b) Tìm các giá trị Q1, Q2, Q3

c) Vẽ biểu đồ boxplot và histogram

d) Mô tả hình dạng của phân bố

Bài 4 Theo tiêu chuẩn của cơ quan y tế thì mức độ flouride không được vượt quá

1.5 parts per million (ppm) Bảng 2.2 dưới đây ghi nhận mức độ flouride của mộtmẫu đo được trong 25 ngày

4.44.24.24.04.34.14.53.84.84.3

4.44.44.84.54.34.04.34.54.14.4

4.34.64.54.43.94.63.84.04.34.4

4.23.93.64.13.84.44.14.24.74.3

4.44.34.14.04.74.64.34.14.24.6

4.84.54.34.03.94.44.24.04.14.5

4.94.83.93.84.04.94.54.74.44.6

4.43.94.24.64.24.44.44.14.84.0

Trang 10

Bảng 2.2 Mức flouride của một mẫu đo trong 25 ngày

a) Tóm tắt số liệu dưới dạng số và biểu đồ

b) Chọn biểu đồ thích hợp để biểu diễn số liệu trên

Bài 5 Trong bài báo "Posidonia oceanica: A biological indicator of past and present

mercury contamination in the Mediterranean Sea" các nhà nghiên cứu đã báo cáonồng độ của Hg trong thời kỳ 20 năm ở hai vị trí khác nhau của Địa Trung hải Ởmỗi vị trí, 45 mẫu của loài P oceanica được thu thập ở độ sâu 10m và mang vềphòng thí nghiệm để xác định nồng độ Hg Nồng độ Hg trung bình (ng/ g trọnglượng khô) của các mẫu ở mỗi vị trí được ghi nhận theo từng năm như trong bảng2.3

Bảng 2.3 Nồng độ thuỷ ngân đo ở 2 vị trí trong 20 năm

Nồng độ thủy ngân (ng/g trọng lượng khô)

70.20160.50102.80100.30103.10129.00156.20117.60170.60139.60147.80197.70

198019791978197719761975197419731972197119701969

25.8011.0016.5028.1050.5060.1096.70100.40

vì sao nó thích hợp hơn dung độ lệch chuẩn)

b) Biểu diễn nồng độ trung bình của Hg tại mỗi vị trí trên từng biểu đồ riêng Nhậnxét về xu hướng biến đổi nồng độ Hg theo thời gian ở từng vị trí

c) Biểu diễn nồng độ trung bình của Hg tại mỗi vị trí trong cùng một biểu đồ Biểu

đồ với hai trục Y có gì khác so với biểu đồ có một trục Y?

d) Khi so sánh các số đo định tâm và độ biến động của hai vị trí, có nên dùng các số

đo từ 1969 – 1972 ở vị trí 2 hay không? Giải thích

Trang 11

Bài 6 Các nhà nghiên cứu về giáo dục của một trường đại học đã tiến hành tổng kết

điểm (theo thang điểm SAT) của các thí sinh nam và nữ đạt được qua các kỳ thi văn

và toán trong 10 năm , kết quả ghi nhận trong bảng 2.4

Bảng 2.4 Kết quả các kỳ thi văn và toán từ 1967 – 1996

Giới

Môn

Năm

1967 1970 1975 1980 1985 1990 1993 1994 1995 1996Nam/Văn

Nữ/Văn

Nam/Toán

Nữ/Toán

540545535495

536538531493

515509518479

506498515473

514503522480

505496521483

504497524484

501497523487

505502525490

507503527492

GiớiMôn

Năm

2000 2001 2002Nam/Văn

Nữ/VănNam/ToánNữ/Toán

507504533498

509502533498

507502534500a) Hãy trình bày kết quả điểm theo từng giới/môn trên bốn biểu đồ riêng Qua đónhận xét về xu hướng của kết quả ở nam và nữ

b) Hãy trình bày kết quả điểm theo từng giới/môn chung trong một biểu đồ Chobiết sự khác biệt về kết quả giữa hai giới theo môn học

Bài 7 S ng ư i tình nguy n hi n máu t i m t b nh vi n trung tâm ện hiến máu tại một bệnh viện trung tâm được ghi nhận sau ến máu tại một bệnh viện trung tâm được ghi nhận sau ại một bệnh viện trung tâm được ghi nhận sau ột bệnh viện trung tâm được ghi nhận sau ện hiến máu tại một bệnh viện trung tâm được ghi nhận sau ện hiến máu tại một bệnh viện trung tâm được ghi nhận sau được ghi nhận sau c ghi nh n sau ận sau

20 ng y Th Sáu liên ti p: ày Thứ Sáu liên tiếp: ứ Sáu liên tiếp: ến máu tại một bệnh viện trung tâm được ghi nhận sau

a) Xây dựng biểu đồ stem-and-leaf từ dữ liệu trên.

b) Vẽ biểu đồ boxplot Dựa vào biểu đồ hãy mô tả hình dạng của phân bố.

Chương 3.

Trang 12

Bài 8 Xét một phân bố chuẩn

1 Tính xác suất để nhận được một giá trị z:

2 Tìm một giá trị z để xác suất nhận được lớn hơn:

Bài 9 Giả sử rằng điểm kiểm tra trong một lớp đông sinh viên có phân bố chuẩn

với trung bình là 74 và độ lệch chuẩn là 10

a) Giả sử điểm kiểm tra của bạn là 88 Tỉ lệ sinh viên trong lớp có điểm cao hơnđiểm của bạn là bao nhiêu?

b) Giả sử giáo viên muốn giới hạn số đạt điểm A trong lớp không quá 20% Ngườiđạt điểm A có điểm thấp nhất là bao nhiêu?

Bài 10 Các nghiên cứu cho thấy mức cholesterol huyết thanh cao có liên quan đến

sự gia tăng của bệnh mạch vành Biết rằng logarit tự nhiên của mức cholesterolhuyết thanh ở nam giới trong một độ tuổi xác định có phân bố chuẩn với trung bình5,35 và độ lệch chuẩn của 0,12

a) Hãy dự đoán xem bao nhiêu phần trăm nam giới trong độ tuổi trên có thể có mứccholesterol huyết thanh lớn hơn 250 mg / ml (giới hạn trên của mức bình thường)?b) Bao nhiêu phần trăm nam giới có thể có mức cholesterol huyết thanhtrong giới hạn bình thường là 150 – 250 mg / ml?

c) Bao nhiêu phần trăm nam giới có mức cholesterol huyết thanh cao hơn 300 mg /ml?

Bài 11 Các mẫu nước được lấy (cở mẫu bằng nhau) từ một con sông bị nghi ngờ ô

nhiễm do rác thải Khi đếm số lượng các trực khuẩn gây bệnh trong các mẫu thì sốlượng trung bình của trực khuẩn trên mỗi mẫu là 15 Giả sử rằng số lượng trựckhuẩn có phân bố Poisson, tìm xác suất để:

a) Mẫu kế tiếp có ít nhất 20 trực khuẩn

b) Mẫu kế tiếp có không nhiều hơn 5 trực khuẩn

Bài 12 Qua kiểm tra, xác suất để một linh kiện điện tử đạt chuẩn là 0.98 Các mẫu

dùng để kiểm tra được lấy ngẫu nhiên trong quá trình sản xuất hàng loạt Trong mộtmẫu có 5 linh kiện, tính xác suất số mẫu không đạt chuẩn là:

Bài 13 Một công ty nhận khoan 4 giếng dầu Xác suất thành công khi khoan một

giếng là 0.4, độc lập với kết quả khoan của các giếng khác Chi phí cho mỗi giếngkhoan là 200.000 $ Mỗi giếng khoan thành công sẽ thu được 600.000$

a) Xác suất khoan thành công một hoặc nhiều hơn 1 giếng?

Trang 13

b) Số giếng khoan được kỳ vọng sẽ thành công là bao nhiêu?

c) Lãi ròng hy vọng thu được là bao nhiêu?

d) Nếu chỉ khoan được một giếng thì thu nhập sẽ như thế nào?

Bài 14 Trong một cuộc kiểm tra xe ô tô tại Los Angeles, 60% các xe ô tô có lượng

khí thải không đáp ứng được tiêu chuẩn quy định Với một mẫu ngẫu nhiên gồm 10

xe ô tô, hãy tính xác suất:

Chương 4.

Trang 14

Bài 15 Vào ngày 7/1/1992, một ống dẫn dầu dưới mặt đất bị vỡ và dầu tràn ra đã

làm ô nhiễm một vùng đầm lầy dọc theo bờ sông Chitipin, Texas Chính quyền đã

xử lý bằng cách cho đốt vùng bị ô nhiễm ở đầm lầy này Một năm sau, để đánh giáï

ảnh hưởng của sự tràn dầu lên hệ thực vật, các nhà nghiên cứu đã tiến hành trồng

cây (Distichlis spicata) ở vùng ô nhiễm và một vùng đối chứng (không ô nhiễm) tại

40 điểm/vùng với kích thước bằng nhau Mật độ của cây tại mỗi điểm được ghi

31 24 22 26 32 35 26 22

50 17 25 33 27 9 17 25

23 14 31 38 19 22 4 27

31 29 19 24 52 34 24 34Hãy so sánh mật độ trung bình của cây ở hai vùng, tính hệ số tin cậy 95% Rút ra

nhận xét và kết luận

Bài 16 Thí nghiệm được tiến hành nhằm đánh giá hiệu quả của loại thuốc trị sán

dây kí sinh trong ruột cừu Một mẫu gồm 24 cừu non bị nhiễm sán có cùng độ tuổi

và sức khỏe được phân bố ngẫu nhiên thành hai nhóm Một nhóm được tiêm thuốc

còn một nhóm không tiêm Sau 6 tháng, các con cừu bị mổ thịt và số lượng sán

được ghi nhận trong bảng 4.2

Bảng 4.2 S l ược ghi nhận sau ng sán dây trong 2 nhóm c u có v không có tiêm thu c ừu có và không có tiêm thuốc ày Thứ Sáu liên tiếp:

Hãy kiểm tra xem lượng sán trung bình trong ruột của cừu có tiêm thuốc có ít hơn

so với trong cừu không tiêm thuốc hay không Mức ý nghĩa của kiểm tra này là bao

nhiêu %? Xác định khoảng tin cậy 95%

Bài 17 Bảng 4.3 là số đo chiều ngang xương càm (cm) của 15 bé gái lúc 5 tuổi và 6

tuổi Hãy xác định xem giá trị trung bình của các số đo có thay đổi theo độ tuổi

không

Bảng 4.3 Chi u ngang x ều ngang xương càm (cm) của 15 bé gái ở độ tuổi 5 và 6 ương càm (cm) của 15 bé gái ở độ tuổi 5 và 6 ng c m (cm) c a 15 bé gái ày Thứ Sáu liên tiếp: ủa 15 bé gái ở độ tuổi 5 và 6 ở độ tuổi 5 và 6 đột bệnh viện trung tâm được ghi nhận sau tu i 5 v 6 ổi 5 và 6 ày Thứ Sáu liên tiếp:

5T 7.33 7.49 7.27 7.93 7.56 7.81 7.46 6.94 7.49 7.44 7.95 7.47 7.04 7.1 7.646T 7.53 7.7 7.46 8.21 7.81 8.01 7.72 7.13 7.68 7.66 8.11 7.66 7.20 7.25 7.79

Bài 18 Một thanh tra viên môi trường nghi ngờ rằng các hộ dân sống hai bên bờ

Trang 15

ta đã thu ngẫu nhiên 15 mẫu ở đầu và 15 mẫu ở cuối con sông trong tỉnh đem vềphòng thí nghiệm Lượng oxy hòa tan (ppm) được ghi nhận trong bảng 4.4.

Bảng 4.4 Lượng oxy hòa tan trong n ước sông ở hai vị trí thu mẫu c sông hai v trí thu m u ở độ tuổi 5 và 6 ị trí thu mẫu ẫu

Đầu sông 5.2 4.8 5.1 5.0 4.9 4.8 5.0 4.7 4.7 5.0 4.7 5.1 5.0 4.9 4.9Cuối sông 4.2 4.4 4.7 4.9 4.6 4.8 4.9 4.6 5.1 4.3 5.5 4.7 4.9 4.8 4.7

Dữ liệu có cung cấp đủ bằng chứng cho thấy sự sai khác về hàm lượng oxy hòa tantrung bình của hai điểm thu mẫu hay không?

Bài 19 Nhằm tìm ra mối liên hệ giữa nhiệt độ môi trường và bệnh tăng huyết áp ở

người, một thí nghiệm đã được tiến hành trên chuột 12 con chuột được phân bố

Bảng 4.5 Huyết áp của chuột nuôi ở hai môi trường có nhiệt độ khác nhau

152157179182176149

789101112

384369354375366423

Dữ liệu trong bảng trên có cung cấp đủ bằng chứng cho thấy chuột nuôi ở môi

khoảng tin cậy 95% cho sự sai khác giữa huyết áp trung bình của hai quần thể

Bài 20 Một nhà nông học muốn so sánh năng suất trung bình của 2 giống lúa Vì

ông cho rằng năng suất lúa cũng thay đổi tùy nơi canh tác nên cả hai giống đềuđược bố trí ngẫu nhiên vào 7 ruộng khác nhau, mỗi ruộng đều rộng 1 công Lúađược thu hoạch lúc chín và kết quả (giạ/công) được ghi nhận trong bảng 4.6 Hãykiểm tra xem năng suất trung bình của 2 giống lúa có khác nhau hay không

Bảng 4.6 Năng suất 2 giống lúa trên 7 ruộng khác nhau

Trang 16

Khu vực C 60 xấu 150 trung bình 80 tốt

Hãy xác định xem chất lượng cây trồng trong trường hợp này có phụ thuộc vào khuvực canh tác hay không

Bài 22 Một nhà sinh thái thực vật nghiên cứu một mẫu gồm 100 cây của một loài

quí hiếm trên một vùng có diện tích 400 dặm Ở mỗi cây ông ghi nhận đặc điểm của

lá (lá có lông tơ hoặc không có) và đặc điểm của đất nơi cây mọc (có khoáng chấtserpentine hoặc không có) Kết quả như sau:

Có serpentineKhông có

1216

2250Hãy kiểm tra xem đặc điểm của lá có phụ thuộc vào đặc điểm của loại đất nơi câymọc hay không

Bài 23 Hãy dùng kết quả ghi nhận trong bảng dưới đây để kiểm tra xem màu sắc

của loài bọ Cicindela fulgida có thay đổi tùy theo mùa không.

Đầu mùaxuânCuối mùa xuânĐầu mùa hèCuối mùa hè

29273864

111913164

Bài 24 Khi nghiên cứu về mức độ nhiễm bệnh của đàn heo nhập nội tại hai cơ sở

chăn nuôi, người ta ghi nhận được kết quả như sau: trại A không bị nhiễm 86 con,

bị nhiễm 15 con và trại B có 32 heo không bị nhiễm, 12 heo bị nhiễm Sự khác nhau

về mức độ nhiễm bệnh giữa hai trại có ý nghĩa về mặt thống kê hay không?

Chương 5.

Bài 25 Hàm lượng Oxygen trong nước là một chỉ tiêu để xem xét mức độ ô nhiễm

môi trường Trong một lần khảo sát người ta lấy ngẫu nhiên 24 mẫu ở 4 khu vực

Ngày đăng: 06/10/2016, 23:30

TỪ KHÓA LIÊN QUAN

w