Bài 1 Trong một thí nghiệm nghiên cứu ung thư, 162 con chuột được ghép khối u và chia thành 4 nhóm Mỗi nhóm được chiếu xạ với cường độ khác nhau Bảng sau đây cho kết quả thí nghiệm Mức Kết quả 1 2 3 4[.]
Trang 1Bài 1: Trong một thí nghiệm nghiên cứu ung thư, 162 con chuột được ghép khối u
và chia thành 4 nhóm Mỗi nhóm được chiếu xạ với cường độ khác nhau Bảng sau đây cho kết quả thí nghiệm
Mức
Với mức = 1%, hãy so sánh tỷ lệ chữa khỏi ung thư của 4 nhóm nói trên
Bài làm
Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ
Giả thiết Ho: Tỷ lệ chữa khỏi ung thư trong các nhóm là như nhau
Th c hi n bài toán b ngự ệ ằ Excel v i = 1%.ớ α
Nhập giá trị vào bảng tính:
* Tính các t ng s ổ ố :
T ng hàngổ :
Ch n ọ F4 và nh p ậ =SUM(B4:E4), dùng con tr kéo nút t đi n ỏ ự ề t ừ F4 đ n ế F5.
T ng c tổ ộ :
Ch n ọ B6 và nh p ậ =SUM(B4:B5), dùng con tr kéo nút t đi n ỏ ự ề t ừ B6 đ n ế E6
T ng c ngổ ộ :
Ch n ọ F8 và nh p ậ =SUM(F4:F5)
* Tính các t n s lý thuy tầ ố ế :
H t kh i ế ố u:
Ch n ọ B12 và nh p ậ =B6*$F$4/$F$8, dùng con tr kéo nút t đi n ỏ ự ề từ B12 đ n ế E12.
Không h tế :
Ch n ọ B13 và nh p ậ =B6*$F$5/$F$8, dùng con tr kéo nút t đi n ỏ ự ề từ B13 đ n ế E13 *
Áp d ng hàm s CHITESTụ ố :
Ch n ọ B15 và nh p ậ =CHITEST(B4:E5,B12:E13).
Ta s có đ c k t qu c a ượ ế ả ủ P(X>X²).
Trang 2- Biện luận: P(X>X²) = 4,995e-12 < α = 0,01.
=> Bác bỏ giả thiết Ho
- Kết luận: Tỉ lệ chữa khỏi ung thư của 4 nhóm là khác nhau
Bài 2: Một cơ quan khí tượng tiến hành so sánh nhiệt độ cao nhất trong ngày ở
hai lục địa châu Âu và châu Á Các thành phố lớn trong mỗi lục địa được chọn ngẫu nhiên và nhiệt độ cao nhất trong ngày 1/7/1996 được ghi lại như sau (đo bằng độ Fahrenheit):
Châu Âu: Athens: 95, Geneva: 72 , London : 77, Moscow: 86, Rome 88
Châu Á: Bắc kinh: 91, Jerusalem : 88, New Delhi: 94 , Tokyo : 77, Hongkong: 90
V i đ tin c y 95%, hãy c l ng nhi t đ trung bình cao nh t trong ngày c a ớ ộ ậ ướ ượ ệ ộ ấ ủ châu Âu và c a châu Á.ủ Hãy so sánh nhiệt độ trung bình cao nhất trong ngày của hai châu lục nói trên với mức ý nghĩa 5% Giả thiết nhiệt độ là biến ngẫu nhiên phân phối chuẩn
Bài làm
Nh n xét: Đây là bài toán ậ phân tích ph ng sai m t y uươ ộ ế t ố
Mục đích c aủ sự phân tích phươ sai m tng ộ y uế tố là đánh giá sự nhả hưở c ang ủ
m t y uộ ế t (nhânố t oạ hay tự nhiên) nào đó trên các giá trị quan sát
* Giả thi t:ế
H0: µ1= µ2=…µk <=> ”Các giá tr trung bình b ng nhau” ị ằ
H1: µ1≠ µ2 <=> ”Có ít nh t hai giá tr trung bình khácấ ị nhau”
* Giá tr th ng kêị ố : F = (MSF/MSE)
* Biện luận :
Nếu F < F α (k -1; N-k) => Chấp nhận gi ả thiết H0
Trang 3Nh p giá tr vào b ng tínhậ ị ả :
Vào Data Analysis, ch n ọ Anova: Single Factor.
Cách t o ạ Data Analysis:
B c 1: ướ Vào File >> Options
B c 2ướ : Ti p theo b n ch nế ạ ọ Add-Ins >> Analysis ToolPak và nh n ấ Go.
B c 3:ướ M t h p thoộ ộ ại hi n ra b n checkệ ạ Analysis ToolPak và nh n ấ OK.
B c 4ướ : Nh v y làư ậ Data Analysis đã đ c thêm vào trong m cượ ụ Data c a b n, b n có ủ ạ ạ
th clickể Datavà sẽ th y ấ Data Analysis bên góc ph i.ả
Trên màn hình sẽ hiện lên hộp thoại của Anova: Single Factor.
Ta nhận các thông số như hình bên dưới:
-Phạm vi các biến số Y(Input Range):ta kéo chuột từ A3 tới ô B8.
-Alpha: 0.05
-Group by: columns
-Tọa độ đầu ra (Output Range):kích chuột vào A9.
Trang 4Ta
đ c k t qu sau:ượ ế ả
Biện luận:
Ta thấy F = 0769475 < F0,05 = F crit = 5,317655
Chấp nhận giả thuyết H0 ở mức 5%
Bài 3: Tính tỉ số tương quan của Y đối với X, hệ số tương quan, hệ số xác định
của tập số liệu sau đây Với mức ý nghĩa 5%, hãy kết luận v mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không?) Tìm đường hồi quy của Y đối với X
y 0,37 -0,70 0,55 0,35 0,3 0,32 -1,70 0,75 1,3
Trang 5Bài làm
Nhận xét: Đây là bài toán phân tích tương quan
(i) Phân tích t ng quan tuy nươ ế tính
Nhập giá trị vào bảng tính:
Thiết lập bảng Correlation.
Vào Data /Data analysis , chọn Correlation.
Trang 6Trong hộp thoại Correlation lần lượt ấn định:
Phạm vi đầu vào: Input Range, quét vùng (A3:B12).
Cách nhóm theo hang hay cột: Group By, chọn Columns (nhóm theo cột).
Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).
Phạm vi đầu ra: Output Range, chọn ô D6.
Nhấn OK, ta có bảng kết quả sau:
Ta tìm được hệ số tương quan: r = 0,84043
Và hệ số xác định: r2 = 0,70632
* Giả thiết Ho : X và Y không có tương quan tuyến tính.
Ta có: T = 4,10307 với
1 r2
T r
Trang 7(c là phân vị mức α/ = 0.025 của phân bố Student với n – 2 = 7 bậc tự do).
Vì |T| > c nên có cơ sở bác bỏ giả thiết Ho
Vậy: Kết luận được X và Y có tương quan tuyến tính
(i) Phân tích tương quan phi tuyến
(ii) Phân tich hồi quy tuyến tính.
Giả thiết Ho : X và Y hồi quy tuyến tính
Vào Data /Data analysis, chọn Regression.
Trong hộp thoại Regression lần lượt ấn định:
Phạm vi đầu vào: Input Y Range, quét vùng (B3:B12).
Input X Range, quét vùng (A3:A12).
Chọn Labels (thêm nhãn dữ liệu).
Phạm vi đầu ra: Output Range, chọn ô I3.
Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.
Trang 8Sau đó nhấn OK ta có kết quả :
Kết luận : Đường hồi quy của Y đối với X là : Y=3,949351X-4,761189
Sai số tiêu chuẩn của đường hồi quy : 0,51
Ta thấy: F = 16,8 > c = 5,59
(tra bảng phân tố Fisher với bậc tự do (1,7) ở mức α = 0,05)
Vậy: có hồi quy tuyến tính giữa Y với X
X
-1 -2
Y Predicted Y 1.32 0.95 1.45 1.3 1.32 1.2 0.95 1.45 1.3
2 1 0
X Line Fit Plot
Trang 9Bài 4: Trên cơ sở tập số liệu sau đây hãy phân tích xem tỷ lệ đỗ loại giỏi có phụ
thuộc vào trường phổ thông và ban hay không với α = 0,05 Ở đây z là tỷ lệ đỗ loại giỏi
(%); f là trường phổ thông số 1, 2, 3,4; g là ban (1 = ban A, 2 = Ban B)
Bài làm
Nh n xét: Đây là bài toán ậ phân tích ph ng sai hai y u t cóươ ế ố l p.ặ
S phân tích này nh m đánh giá ằ s nh h ng c a hai y u t trên các giá tr ả ưở ủ ế ố ị
quan sát Yij(i=1, 2…r: y u t ế ố A; j= 1 ,2…c: y u tế ố B)
* Giả thi t:ế
H0: µ1= µ2=…µk <=> ”Các giá tr trung bình b ng nhau” ị ằ H1: µ1≠ µ2 <=> ”ít
nh t hai giá tr trung bình khácấ ị nhau”
* Giá tr th ngị ố kê:
FR = (MSB)/(MSE) và FC = (MSF)/(MSE)
* Bi nệ lu n:ậ
N u Fế R < Fα[b-1,(k-1)(b-1)] => ch p nh n Hấ ậ 0(y u t A)ế ố
N u Fế C < Fα[b-1,(k-1)(b-1)] => ch p nh n Hấ ậ 0(y u tế ố B)
Ta gi thi t Hả ế 01: y u t Ban không nh h ng đ n t l đ lo i gi i c aế ố ả ưở ế ỷ ệ ỗ ạ ỏ ủ tr ng.ườ
Ta gi thi t Hả ế 02: y u t tr ng ph thông không nh h ng đ n t l đ lo i gi i c a tr ngế ố ườ ổ ả ưở ế ỷ ệ ỗ ạ ỏ ủ ườ đó
Nh p giá tr vào b ngậ ị ả tính:
Trang 10Vào Data Analysis
Ch n ọ Anova: Two-Factor With Replication => sẽ hi n lên h pệ ộ tho iạ
Trên màn hình sẽ hi n lên h p tho i c a ệ ộ ạ ủ Anova: Two-Factor With Replication
Ta nh p vào các thông s nh hình bênậ ố ư d iướ
-Ph m vi c a bi n s Yạ ủ ế ố (Input Range):ta kéo chu t t ô ộ ừ A3 t i ô ớ E7
-T a đ đ u ra ọ ộ ầ (Output Range):kích chu t vào ôộ G3
Ta đ c k t qu nhượ ế ả ư sau:
Trang 11Bi nệ lu n:ậ
Ta th y Fấ R = 11,571429 > F0.05 = 5,317655 => Bác b gi thi t Hỏ ả ế 01
FC = 55,380952 > F0.05 =4,066181=> Bác b gi thi tỏ ả ế H02
V y c 2 y u t Ban và tr ng ph thông đ u nh h ng đ n t l đ lo i ậ ả ế ố ườ ổ ề ả ưở ế ỷ ệ ỗ ạ
gi i c a các tr ng.ỏ ủ ườ