BTL Xac Suat docx Bài 1 Trong một thí nghiệm nghiên cứu ung thư, 162 con chuột được ghép khối u và chia thành 4 nhóm Mỗi nhóm được chiếu xạ với cường độ khác nhau Bảng sau đây cho kết quả thí nghiệm M.
Trang 1Bài 1: Trong một thí nghiệm nghiên cứu ung thư, 162 con chuột được ghép khối u
và chia thành 4 nhóm Mỗi nhóm được chiếu xạ với cường độ khác nhau Bảng sau đây cho kết quả thí nghiệm
Mức
Với mức = 1%, hãy so sánh tỷ lệ chữa khỏi ung thư của 4 nhóm nói trên
Bài làm
Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ
Giả thiết Ho: Tỷ lệ chữa khỏi ung thư trong các nhóm là như nhau
Thực hiện bài toán bằng Excel với α = 1%
Nhập giá trị vào bảng tính:
* Tính các tổng số :
∙ Tổng hàng:
Chọn F4 và nhập =SUM(B4:E4), dùng con trỏ kéo nút tự điền từ F4 đến F5.
∙ Tổng cột:
Chọn B6 và nhập =SUM(B4:B5), dùng con trỏ kéo nút tự điền từ B6 đến E6
∙ Tổng cộng:
Chọn F8 và nhập =SUM(F4:F5).
* Tính các tần số lý thuyết:
∙ Hết khối u:
Chọn B12 và nhập =B6*$F$4/$F$8, dùng con trỏ kéo nút tự điền từ B12 đến E12.
∙ Không hết:
Chọn B13 và nhập =B6*$F$5/$F$8, dùng con trỏ kéo nút tự điền từ B13 đến E13 *
Áp dụng hàm số CHITEST :
∙ Chọn B15 và nhập =CHITEST(B4:E5,B12:E13).
∙ Ta s có được kết quả của P(X>X²).
Trang 2- Biện luận: P(X>X²) = 4,995e-12 < α = 0,01.
=> Bác bỏ giả thiết Ho
- Kết luận: Tỉ lệ chữa khỏi ung thư của 4 nhóm là khác nhau
Bài 2: Một cơ quan khí tượng tiến hành so sánh nhiệt độ cao nhất trong ngày ở hai
lục địa châu Âu và châu Á Các thành phố lớn trong mỗi lục địa được chọn ngẫu nhiên và nhiệt độ cao nhất trong ngày 1/7/1996 được ghi lại như sau (đo bằng độ Fahrenheit): Châu Âu: Athens: 95, Geneva: 72 , London : 77, Moscow: 86, Rome 88
Châu Á: Bắc kinh: 91, Jerusalem : 88, New Delhi: 94 , Tokyo : 77, Hongkong: 90
Với độ tin cậy 95%, hãy ước lượng nhiệt độ trung bình cao nhất trong ngày của châu
Âu và của châu Á Hãy so sánh nhiệt độ trung bình cao nhất trong ngày của hai châu lục nói trên với mức ý nghĩa 5% Giả thiết nhiệt độ là biến ngẫu nhiên phân phối chuẩn
Bài làm
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố
Mục đích của sựphân tích phương sai một yếu tố là đánh giá sựảnh hưởng của một yếu
tố (nhân tạo hay tựnhiên) nào đó trên các giá trị quan sát
* Giả thiết:
H0: µ1= µ2=…µk <=> ”Các giá trị trung bình bằng nhau”
H1: µ1≠ µ2 <=> ”Có ít nhất hai giá trị trung bình khác nhau”
* Giá trị thống kê: F = (MSF/MSE)
* Biện luận :
Nếu F < Fα (k -1; N-k) => Chấp nhận giả thiết H0
Nhập giá trị vào bảng tính :
Trang 3Vào Data Analysis, chọn Anova: Single Factor.
Cách tạo Data Analysis:
Bước 1: Vào File >> Options
Bước 2: Tiếp theo bạn chọn Add-Ins >> Analysis ToolPak và nhấn Go.
Bước 3: Một hộp thoại hiện ra bạn check Analysis ToolPak và nhấn OK.
Bước 4: Như vậy là Data Analysis đã được thêm vào trong mục Data của bạn, bạn có thể click Datavà sẽ thấy Data Analysis bên góc phải.
Trên màn hình sẽ hiện lên hộp thoại của Anova: Single Factor.
Ta nhận các thông số như hình bên dưới:
-Phạm vi các biến số Y(Input Range):ta kéo chuột từ A3 tới ô B8.
-Alpha: 0.05
-Group by: columns
-Tọa độ đầu ra (Output Range):kích chuột vào A9.
Trang 4Ta được kết quả sau:
Biện luận:
Ta thấy F = 0769475 < F0,05= F crit = 5,317655
⇨ Chấp nhận giả thuyết H0 ở mức 5%
Bài 3: Tính tỉ số tương quan của Y đối với X, hệ số tương quan, hệ số xác định của tập số liệu sau đây Với mức ý nghĩa 5%, hãy kết luận v mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không?) Tìm đường hồi quy của Y đối với X
Trang 5x 1,32 0,95 1,45 1,3 1,32 1,2 0,95 1,45 1,3
y 0,37 -0,70 0,55 0,35 0,3 0,32 -1,70 0,75 1,3
Bài làm
Nhận xét: Đây là bài toán phân tích tương quan
(i) Phân tích tương quan tuyến tính
Nhập giá trị vào bảng tính:
● Thiết lập bảng Correlation.
Vào Data /Data analysis , chọn Correlation.
Trang 6Trong hộp thoại Correlation lần lượt ấn định:
● Phạm vi đầu vào: Input Range, quét vùng (A3:B12).
● Cách nhóm theo hang hay cột: Group By, chọn Columns (nhóm theo cột).
● Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).
● Phạm vi đầu ra: Output Range, chọn ô D6.
Nhấn OK, ta có bảng kết quả sau:
Ta tìm được hệ số tương quan: r = 0,84043
Và hệ số xác định: r2 = 0,70632
* Giả thiết Ho: X và Y không có tương quan tuyến tính.
Ta có: T = 4,10307 với
Mà: c = 2,365
Trang 7(c là phân vị mức α/ = 0.025 của phân bố Student với n – 2 = 7 bậc tự do).
Vì |T| > c nên có cơ sở bác bỏ giả thiết Ho
Vậy: Kết luận được X và Y có tương quan tuyến tính
(i) Phân tích tương quan phi tuyến
(ii) Phân tich hồi quy tuyến tính
Giả thiết Ho: X và Y hồi quy tuyến tính
Vào Data /Data analysis, chọn Regression.
Trong hộp thoại Regression lần lượt ấn định:
● Phạm vi đầu vào: Input Y Range, quét vùng (B3:B12).
Input X Range, quét vùng (A3:A12).
● Chọn Labels (thêm nhãn dữ liệu).
● Phạm vi đầu ra: Output Range, chọn ô I3.
● Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.
Trang 8Sau đó nhấn OK ta có kết quả :
Kết luận : Đường hồi quy của Y đối với X là : Y=3,949351X-4,761189
Sai số tiêu chuẩn của đường hồi quy : 0,51
Ta thấy: F = 16,8 > c = 5,59
(tra bảng phân tố Fisher với bậc tự do (1,7) ở mức α = 0,05)
Vậy: có hồi quy tuyến tính giữa Y với X
Trang 9Bài 4: Trên cơ sở tập số liệu sau đây hãy phân tích xem tỷ lệ đỗ loại giỏi có phụ
thuộc vào trường phổ thông và ban hay không với α = 0,05 Ở đây z là tỷ lệ đỗ loại giỏi
(%); f là trường phổ thông số 1, 2, 3,4; g là ban (1 = ban A, 2 = Ban B)
Bài làm
Nhận xét: Đây là bài toán phân tích phương sai hai yếu tố có lặp
S phân tích này nhằm đánh giá s ảnh hưởng của hai yếu tố trên các giá trị quan
sát Yij(i=1, 2…r: yếu tố A; j= 1 ,2…c: yếu tố B)
* Giả thiết:
H0: µ1= µ2=…µk <=> ”Các giá trị trung bình bằng nhau” H1: µ1≠ µ2 <=> ”ít nhất
hai giá trị trung bình khác nhau”
* Giá trị thống kê:
FR = (MSB)/(MSE) và FC = (MSF)/(MSE)
* Biện luận:
Nếu FR < Fα[b-1,(k-1)(b-1)] => chấp nhận H0(yếu tố A)
Nếu FC < Fα[b-1,(k-1)(b-1)] => chấp nhận H0(yếu tố B)
Ta giả thiết H01: yếu tố Ban không ảnh hưởng đến tỷ lệ đỗ loại giỏi của trường
Ta giả thiết H02: yếu tố trường phổ thông không ảnh hưởng đến tỷ lệ đỗ loại giỏi của trường đó
Nhập giá trị vào bảng tính:
Trang 10Vào Data Analysis
Chọn Anova: Two-Factor With Replication => sẽ hiện lên hộp thoại
Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor With Replication
Ta nhập vào các thông số như hình bên dưới
-Phạm vi của biến số Y(Input Range):ta kéo chuột từ ô A3 tới ô E7
-Tọa độ đầu ra (Output Range):kích chuột vào ô G3
Ta được kết quả như sau:
Trang 11Biện luận:
Ta thấy FR = 11,571429 > F0.05 = 5,317655 => Bác bỏ giả thiết H01
FC = 55,380952 > F0.05 =4,066181=> Bác bỏ giả thiết H02
Vậy cả 2 yếu tố Ban và trường phổ thông đều ảnh hưởng đến tỷ lệ đỗ loại giỏi của các trường