Giải chi tiết bài tập xác suất thống kê lớp Đại Học Khoa Học Tự Nhiên. Bao gồm nhiều dạng khác nhau đa dạng về cách giải chi tiết xác suất thống kê, Giải bài tập xác suất thống kê nhóm các bạn đại học tự biên soạn, mang tính chất tham khảo....
Trang 1Dạng 1: Ước lượng trung bình của tổng thể
Bài tập giáo trình: Từ bài 4.14 – 4.54
Bài tập thêm:
1 The yield of a chemical process is being studied From previous experience, yield is known
to be normally distributed and 𝜎 = 3 The past five days of plant operation have resulted in the following percent yields: 91.6, 88.75, 90.8, 89.95, and 91.3 Find a 95% two-sided confidence interval on the true mean yield
(Sản lượng của một quá trình hóa học đang được nghiên cứu Theo kinh nghiệm trước đây, năng suất có phân phối chuẩn với σ = 3 Sau 5 ngày vận hành, sản lượng thu được có phần trăm như sau: 91,6, 88,75, 90,8, 89,95 và 91,3 Tìm khoảng tin cậy 95% cho năng suất trung bình của quá trình hóa học trên.)
Bài làm Gọi X là năng suất của quá trình hóa học trên
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 90.48 − 2.63 < 𝜇 < 90.48 + 2.63
⇔ 87.85 < 𝜇 < 93.11
Trang 2Vậy: Khoảng tin cậy 95% cho năng suất trung bình của quá trình hóa học là (87.85; 93.11)%
2 The life in hours of a 75-watt light bulb is known to be normally distributed with 𝜎 = 25 hours A random sample of 20 bulbs has a mean life of 𝑥̅ = 1014 hours
(a) Construct a 95% two-sided confidence interval on the mean life
(b) Suppose that you wanted the total width of the two-sided confidence interval on mean life
to be six hours at 95% confidence What sample size should be used?
(Tuổi thọ của một bóng đèn 75W được biết là có phân phối chuẩn với 𝜎 = 25 giờ Một mẫu gồm 20 bóng đèn có tuổi thọ trung bình 𝑥̅ = 1014 giờ
a) Hãy tìm khoảng tin cậy 95% cho trung bình tuổi thọ của các bóng đèn 75W
b) Giả sử rằng sai số ước lượng là 6 giờ thì phải số bóng đèn cần phải sử dụng là bao nhiêu?)
Bài làm a) Gọi X là tuổi thọ của các bóng đèn
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 1014 − 10.96 < 𝜇 < 1014 + 10.96
⇔ 1003.04 < 𝜇 < 1024.96 Vậy: Khoảng tin cậy 95% cho tuổi thọ trung bình của các bóng đèn 75W là (1003.04; 1024.96) giờ
Trang 3b) Sai số ước lượng bằng 6 giờ với độ tin cậy 95% nghĩa là:
3 A civil engineer is analyzing the compressive strength of concrete Compressive strength is normally distributed with 𝜎2 = 1000 (𝑝𝑠𝑖)2 A random sample of 12 specimens has a mean compressive strength of 𝑥 ̅ = 3250 psi
(a) Construct a 95% two-sided confidence interval on mean compressive strength
(b) Suppose that it is desired to estimate the compressive strength with an error that is less than
15 psi at 99% confidence What sample size is required?
(Một kỹ sư công trình đang phân tích cường độ nén của bê tông Cường độ có phân phối chuẩn với 𝜎2 = 1000 (𝑝𝑠𝑖)2 Một mẫu ngẫu nhiên gồm 12 mẫu thử có cường độ nén trung bình là
𝑥 ̅ = 3250 psi
(a) Xây dựng khoảng tin cậy hai phía 95% về cường độ nén trung bình
(b) Giả sử trong, người ta muốn ước tính cường độ nén với sai số nhỏ hơn 15 psi với độ tin cậy 99% thì cần phân tích bao nhiêu mẫu?)
Bài làm a) Gọi X là cường độ nén của bê tông
Trang 4Sai số ước lượng: 𝜖 = 𝑧1−𝛼
2
× 𝜎
√𝑛= 2.575 ×10√10
√12 = 23.51 Khoảng tin cậy 99% cho trung bình 𝜇 là:
𝑥 ̅ − 𝜖 < 𝜇 < 𝑥 ̅ + 𝜖
⇔ 3250 − 23.51 < 𝜇 < 3250 + 23.51
⇔ 3226.49 < 𝜇 < 3273.51 Vậy: Khoảng tin cậy 99% cho cường độ nén bê tông trung bình là (3226.49; 3273.51) psi b) Sai số nhỏ hơn 15 với khoảng tin cậy 99% nghĩa là:
4 A healthcare provider monitors the number of CAT scans performed each month in each of its clinics The most recent year of data for a particular clinic follows (the reported variable is the number of CAT scans each month expressed as the number of CAT scans per thousand members of the health plan):
2.31, 2.09, 2.36, 1.95, 1.98, 2.25, 2.16, 2.07, 1.88, 1.94, 1.97, 2.02
(a) Find a 95% two-sided CI on the mean number of CAT scans performed each month at this clinic
(b) Historically, the mean number of scans performed by all clinics in the system has been 1.95
If there any evidence that this clinic performs more CAT scans on average than the overall system average?
(Một nhà cung cấp dịch vụ chăm sóc sức khỏe giám sát số lần quét CAT được thực hiện mỗi tháng tại mỗi phòng khám của họ Dữ liệu năm gần đây nhất cho một phòng khám cụ thể theo sau (biến được báo cáo là số lần quét CAT mỗi tháng được biểu thị bằng số lần quét CAT trên một nghìn thành viên của kế hoạch sức khỏe):2,31, 2,09, 2,36, 1,95, 1,98, 2,25, 2,16, 2,07, 1,88, 1,94, 1,97, 2,02
(a) Tìm khoảng tin cậy 95% trên số lần quét CAT trung bình được thực hiện mỗi tháng tại phòng khám này
(b) Trước đây, số lần quét trung bình được thực hiện bởi tất cả các phòng khám trong hệ thống
là 1,95 Có bất kỳ bằng chứng nào cho thấy phòng khám cụ thể này thực hiện nhiều lần quét CAT hơn mức trung bình của toàn hệ thống?)
Trang 5Bài làm Gọi X là số lần quét CAT mỗi tháng
Theo dữ kiện đề bài, ta tính được:
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 2.082 − 0.099 < 𝜇 < 2.082 + 0.099
⇔ 1.983 < 𝜇 < 2.181 Vậy: Khoảng tin cậy 95% cho số lần quét CAT trung bình của dịch vụ chăm sóc sức khỏe là (1.983; 2.181) lần
(Độ dày thành của 25 chai thủy tinh 2 lít được đo bởi một kỹ sư quản lý chất lượng Giá trị trung bình của mẫu là 𝑥̅ = 4.05 mm và độ lệch chuẩn của mẫu là s = 0.08 mm Tìm khoảng tin cậy 95% cho độ dày trung bình của thành chai.)
Bài làm Gọi X là độ dày của thành chai
Theo đề bài, ta có:
𝑛 = 25 (𝑛 < 30)
Trang 6𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 4.05 − 0.033 < 𝜇 < 4.05 + 0.033
⇔ 4.017 < 𝜇 < 4.083 Vậy: Khoảng tin cậy 99% cho độ dày trung bình của chai là (4.017; 4.083) 𝑚𝑚
6 An article in Medicine and Science in Sports and Exercise [“Maximal Leg-Strength Training Improves Cycling conomy in Previously Untrained Men” (2005, Vol 37, pp 131–136)] studied cycling performance before and after eight weeks of egstrength training Seven previously untrained males performed leg-strength training three days per week for eight weeks (with four sets of five replications at 85% of one repetition maximum) Peak power during incremental cycling increased to a mean of 315 watts with a standard deviation of 16 watts Construct a 95% confidence interval for the mean peak power after training
(Một bài báo trên Tạp chí Y học và Khoa học trong Thể dục thể thao đã nghiên cứu thành tích đạp xe trước và sau 8 tuần tập luyện sức bền Bảy nam giới chưa được đào tạo trước đây đã thực hiện bài tập sức mạnh chân ba ngày mỗi tuần trong tám tuần (với bốn hiệp năm lần lặp lại với tỷ lệ 85% của một lần lặp lại tối đa) Công suất trong quá trình đạp xe tăng dần lên mức trung bình là 315 W với độ lệch tiêu chuẩn là 16 W Xây
Bài làm Gọi X là công suất trong quá trình đạp xe
Trang 7Thống kê: 𝑇 = 𝑋̅−𝜇𝑆
√𝑛
∼ 𝑇𝑛−1 (với 𝑛 = 7) Với độ tin cậy 95%, ta có: 𝛼 = 0.05
𝑥̅ − 𝜖 < 𝜇 < 𝑥̅ + 𝜖
⇔ 315 − 14.797 < 𝜇 < 315 + 14.797
⇔ 300.203 < 𝜇 < 329.797 Vậy: Khoảng tin cậy 95% cho công suất trung bình trong quá trình đạp xe là (300.203; 329.797) 𝑊
(a) Calculate a 95% two-sided confidence interval on the true proportion of rats that would show underweight from the experiment
(b) Using the point estimate of p obtained from the preliminary sample, what sample size is needed to be 95% confident that the error in estimating the true value of p is less than 0.02?
(c) How large must the sample be if you wish to be at least 95% confident that the error in
estimating p is less than 0.02, regardless of the true value of p?
(Một bài báo trên Tạp chí của Hiệp hội Thống kê Hoa Kỳ (1990, Tập 85, trang 972–985) đã
đo trọng lượng của 30 con chuột được kiểm soát bằng thí nghiệm Giả sử rằng 12 con chuột
Trang 8a) Gọi Y là những con chuột bị nhẹ cân (Đơn vị: con)
𝑝 là tỉ lệ những con chuột bị nhẹ cân
𝑝̂ là tỉ lệ những con chuột bị nhẹ cân trong thí nghiệm trên
𝑝̂ − 𝜖 < 𝑝 < 𝑝̂ + 𝜖
⇔ 0.4 − 0.1753 < 𝑝 < 0.4 + 0.1753
⇔ 0.2247 < 𝑝 < 0.5753 Vậy: Với khoảng tin cậy 95%, tỉ lệ những con chuột có biểu hiện nhẹ cân thuộc khoảng (0.2247; 0.5753)
b) Với độ tin cậy 95% và 𝑝̂ = 0.4, sai số ước lượng nhỏ hơn 0.02 nghĩa là:
2305 con chuột
c) Vì 𝑝̂ chưa biết, do đó 𝑝̂(1 − 𝑝̂) đạt giá trị cực đại khi 𝑝̂ = 1 − 𝑝̂
⇒ 𝑝̂ = 0.5
⇔ 𝑝̂(1 − 𝑝̂) = 0.25
Trang 9Sai số ước lượng nhỏ hơn 0.02 với độ tin cậy 95% với bất kể 𝑝̂ nào nghĩa là:
1.96 × √0.25
𝑛 < 0.02
⇔ 𝑛 > 2401 Vậy: Để sai số ước lượng nhỏ hơn 0.02 với độ tin cậy 95% với bất kể giá trị thực của p thì phải khảo sát ít nhất 2402 con chuột
2 The Arizona Department of Transportation wishes to survey state residents to determine what proportion of the population would like to increase statewide highway speed limits from
65 mph to 75 mph How many residents does the department need to survey if it wants to be at least 99% confident that the sample proportion is within 0.05 of the true proportion?
(Bộ Giao thông vận tải Arizona muốn khảo sát cư dân tiểu bang để xác định tỷ lệ dân số muốn tăng giới hạn tốc độ đường cao tốc trên toàn tiểu bang từ 65 dặm một giờ lên 75 dặm một giờ
Bộ cần khảo sát bao nhiêu cư dân nếu muốn chắc chắn ít nhất 99% rằng tỷ lệ dân số muốn tăng giới hạn tốc độ là 0.05?)
Bài làm Gọi Y là số dân bang Arizona muốn tăng giới hạn tốc độ đường cao tốc trên toàn tiểu bang từ
65 dặm một giờ lên 75 dặm một giờ
Với độ tin cậy 99%, ta có: 𝛼 = 0.01
Trang 103 A study is to be conducted of the percentage of homeowners who own at least two television sets How large a sample is required if we wish to be 99% confident that the error in estimating this quantity is less than 0.017?
(Một nghiên cứu về tỷ lệ phần trăm chủ nhà sở hữu ít nhất hai ti vi Cỡ mẫu là bao nhiêu nếu muốn chắc chắn 99% rằng lỗi trong ước tính đại lượng này nhỏ hơn 0,017?)
Gọi Y là số lượng nhà có ti vi
Với độ tin cậy 99%, ta có: 𝛼 = 0.01
Dạng 3: Kiểm định một mẫu: So sánh trung bình với một số
Bài tập giáo trình: Từ bài 5.19 – 5.62
Bài tập thêm:
1 Medical researchers have developed a new artificial heart constructed primarily of titanium and plastic The heart will last and operate almost indefinitely once it is implanted in the patient’s body, but the battery pack needs to be recharged about every four hours A random sample of 50 battery packs is selected and subjected to a life test The average life of these batteries is 4.05 hours Assume that battery life is normally distributed with standard deviation
𝜎 = 0.2 hour
(a) Is there evidence to support the claim that mean battery life exceeds 4 hours?
Trang 11Use 𝛼 = 0.05
(b) What is the P-value for the test in part (a)?
(Các nhà nghiên cứu y học đã phát triển một trái tim nhân tạo mới được cấu tạo chủ yếu bằng titan và nhựa Trái tim sẽ tồn tại và hoạt động gần như vô thời hạn sau khi nó được cấy vào cơ thể bệnh nhân, nhưng bộ pin cần được sạc lại khoảng bốn giờ một lần Một mẫu ngẫu nhiên gồm 50 bộ pin được chọn và trải qua bài kiểm tra tuổi thọ Tuổi thọ trung bình của những viên pin này là 4,05 giờ Giả sử rằng thời lượng pin có phân phối chuẩn với độ lệch chuẩn σ = 0,2 giờ
(a) Có bằng chứng nào chứng minh cho tuyên bố rằng thời lượng pin có nghĩa là vượt quá 4 giờ không? Sử dụng α = 0,05
(b) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị cho phép thử trong phần (a) là bao nhiêu?)
Bài làm a) Gọi X là thời lượng pin của trái tim nhân tạo
Ta thấy: 𝑧 = 1.77 > 𝑧1−𝛼 = 1.645
Do đó ta có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 5%
Vậy: Thời lượng pin trung bình là không vượt quá 4 giờ
b) 𝑝𝑔𝑖á 𝑡𝑟ị= 1 − 𝜙(𝑧) = 1 − 𝜙(1.77) = 1 − 0.9616 = 0.0384
2 Humans are known to have a mean gestation period of 280 days (from last menstruation) with a standard deviation of about 9 days A hospital wondered whether there was any evidence
Trang 12that their patients were at risk for giving birth prematurely In a random sample of 70 women, the average gestation time was 274.3 days
(a) Is the alternative hypothesis one- or two-sided?
(b) Test the null hypothesis at 𝛼 = 0.05
(c) What is the P-value of the test statistic?
(Phụ nữ được biết là có thời gian mang thai trung bình là 280 ngày (kể từ lần hành kinh cuối cùng) với độ lệch chuẩn khoảng 9 ngày Một bệnh viện tự hỏi liệu có bằng chứng nào cho thấy bệnh nhân của họ có nguy cơ sinh non hay không Trong một mẫu ngẫu nhiên gồm 70 phụ nữ, thời gian mang thai trung bình là 274,3 ngày
(a) Giả thuyết thay thế là một hay hai phía?
(b) Kiểm định giả thuyết rỗng tại α = 0,05
(c) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị của thống kê thử nghiệm là bao nhiêu?)
Bài làm Gọi X là thời gian phụ nữ mang thai
Theo đề bài, ta có:
𝑛 = 70 (𝑛 > 30)
𝑥̅ = 274.3
𝜎 = 9
Gọi 𝜇 là thời gian trung bình phụ nữ mang thai
a) Đây là kiểm định hai phía
b) Giả thuyết: {𝐻0: 𝜇 = 𝜇0 = 280
𝐻1: 𝜇 ≠ 𝜇0Khi 𝐻0 đúng thì ta có thống kê 𝑍 = 𝑋̅−𝜇𝜎
Do đó: Ta có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Thời gian mang thai trung bình của phụ nữ khác 280 ngày
c) 𝑝𝑔𝑖á 𝑡𝑟ị= 1 − 2𝜙(|𝑧|) = 1 − 2𝜙(|−5.30|) = 1 − 2 × 1 = −1
Trang 133 The bacterial strain Acinetobacter has been tested for its adhesion properties A sample of
five measurements gave readings of 2.69, 5.76, 2.67, 1.62 and 4.12 dyne-cm2 Assume that the standard deviation is known to be 0.66 dyne-cm2 and that the scientists are interested in high adhesion (at least 2.5 dyne-cm2)
(a) Should the alternative hypothesis be one-sided or two-sided?
(b) Test the hypothesis that the mean adhesion is 2.5 dyne-cm2
(c) What is the P-value of the test statistic?
(Chủng vi khuẩn Acinetobacter đã được thử nghiệm về đặc tính bám dính của nó Một mẫu gồm năm phép đo cho kết quả là 2,69, 5,76, 2,67, 1,62 và 4,12 dyn/cm 2 Giả sử rằng độ lệch chuẩn được biết là 0,66 dyn/cm 2 và các nhà khoa học quan tâm đến độ kết dính cao (ít nhất là 2,5 dyn/cm 2 )
(a) Giả thuyết thay thế là một phía hay hai phía?
(b) Kiểm tra giả thuyết rằng độ kết dính trung bình là 2,5 dyne-cm2
(c) Giá trị 𝑃𝑔𝑖á 𝑡𝑟ị của thống kê thử nghiệm là bao nhiêu?)
Bài làm Gọi X là độ kết dính của chủng vi khuẩn Acinetobacter
Gọi 𝜇 là độ kết dính trung bình của chủng vi khuẩn Acinetobacter
a) Kiểm định này là kiểm định một phía bên trái
b) Giả thuyết: {𝐻0: 𝜇 = 𝜇0 = 2.5
𝐻1: 𝜇 < 𝜇0Khi 𝐻0 đúng thì ta có thống kê 𝑍 = 𝑋̅−𝜇𝜎
Ta thấy: −𝑧1−𝛼 = −1.645 < 𝑧 = 2.95
Do đó ta không có đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.05
Vậy: Độ kết dính trung bình của chủng vi khuẩn Acinetobacter có giá trị ít nhất là 2.5
𝑑𝑦𝑛/𝑐𝑚2
Trang 14c) 𝑝𝑔𝑖á 𝑡𝑟ị= 𝜙(𝑧) = 𝜙(2.95) = 0.9984
4 Cloud seeding has been studied for many decades as a weather modification procedure (for
an interesting study of this subject, see the article in Technometrics, “A Bayesian Analysis of
a Multiplicative Treatment Effect in Weather Modification,” Vol 17, pp 161–166) The rainfall in acre-feet from 20 clouds that were selected at random and seeded with silver nitrate follows: 18.0, 30.7, 19.8, 27.1, 22.3, 18.8, 31.8, 23.4, 21.2, 27.9, 31.9, 27.1, 25.0, 24.7, 26.9, 21.8, 29.2, 34.8, 26.7, and 31.6 Can you support a claim that mean rainfall from seeded clouds exceeds 25 acre-feet? Use 𝛼 = 0.01 Find the P-value
(Việc gieo hạt vào đám mây đã được nghiên cứu trong nhiều thập kỷ như một quy trình điều chỉnh thời tiết (để có một nghiên cứu thú vị về chủ đề này, hãy xem bài báo trong tạp chí Technometrics, “A Bayesian Analysis of a Multiplicative Treatment Effect in Weather
Modification,”, Tập 17, trang 161– 166) Lượng mưa tính bằng mẫu Anh từ 20 đám mây được chọn ngẫu nhiên và được gieo bằng bạc nitrat như sau: 18,0, 30,7, 19,8, 27,1, 22,3, 18,8, 31,8, 23,4, 21,2, 27,9, 31,9, 27,1, 25,0, 24,7, 26,9, 21,8, 29,2, 34,8, 26,7 và 31,6 Có thể ủng hộ một tuyên bố rằng lượng mưa từ những đám mây có hạt vượt quá 25 mẫu Anh không?
Sử dụng α = 0,01 Tìm giá trị P
Bài làm Gọi X là lượng mưa từ những đám mây
Dựa vào dữ kiện đề bài, ta có:
Ta thấy: 𝑡 = 0.968 < 𝑡1−𝛼𝑛−1 = 2.5395
Do đó: không đủ cơ sở để bác bỏ giả thuyết 𝐻0 với mức ý nghĩa 𝛼 = 0.01
Vậy: Lượng mưa trung bình từ những đám mây không vượt quá 25 mẫu Anh