Bài 3 Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành Ngày khảo sát Các quận nội thành Quận 1 Quận 2 Quận 3 Quận 4 Quận 5 Thứ hai 254 236 267 223 245 Thứ ba 245 212 256 213 234 Thứ[.]
Trang 1Bài 3: Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành:
Ngày khảo sát Các quận nội thành
Quận 1 Quận 2 Quận 3 Quận 4 Quận 5
Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5 %
1.Cơ sở lý thuyết:
Đây là dạng toán phân tích phương sai hai yếu tố (không lặp):
2.Tính toán trên máy tính:
Giả thiết: H0 – các giá trị trung bình là bằng nhau
Đối giả thiết: H1 – các giá trị trung bình là không bằng nhau
Nhập dữ liệu vào máy tính:
Các bước thực hiện:
Sử dụng công cụ “Anova: Two – Factor without Replication”:
a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication”
b)Trong hộp thoại Anova:Two – Factor without Replication, lần lượt ấn định các giá trị:
Trang 2- Phạm vi đầu vào (input range): chọn bảng tính ta vừa tạo -Nhãn dữ liệu (labels in first row/column)
-Ngưỡng tin cậy: Alpha = 5% = 0.05
-Phạm vi đầu ra (output Range)
Sau khi click Ok thì kết quả được hiện trong wooksheet mới:
Trang 3Nhận xét: Ta thấy FA > F5 (4.305483 > 2.71089) -> Lượng báo bán ra chịu yếu tố tác động trực tiếp của các ngày trong tuần
Tương tự, FB > F4 -> Lượng báo bán ra ở 5 quận có sự khác nhau
Trang 4Bài 4: Ba loại vật liệu được thử sức bền dưới ảnh hưởng của việc thay đổi nhiệt độ vô cùng lớn,
chúng ta có số liệu:
Hãy kiểm định xem có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi nhiệt độ không? Sử dụng mức ý nghĩa 2%
BÀI LÀM:
Dạng bài: Kiểm định giả thiết về tỉ lệ
Phương pháp giải: Áp dụng Kiểm định chi bình phương 2
Công cụ giải: hàm CHITEST trên Excel
Cơ sở lý thuyết:
- Trong thống kê, kiểm định chi bình phương hay kiểm tra 2 (đôi khi đọc là "khi bình phương") là một họ các phương pháp kiểm định giả thiết thống kê trong đó thống kê kiểm
định tuân theo phân bố 2 nếu giả thuyết không là đúng Chúng gồm:
Kiểm định chi bình phương Pearson
Kiểm định chi bình phương Yates
Kiểm định chi bình phương Mantel-Haenszel
- Dạng thống kê kiểm định thông dụng nhất là:
γ2=(o−e)2
e
Với o là dữ liệu đo đạc, e là giá trị dự đoán chính xác
Xét một bộ A gồm r tính trạng, A = (A1, A2, Ar), trong đó mỗi cá thể của tập hợp chính
H có và chỉ có một trong các tính trạng (hay phạm trù) Ai Gọi pi (i = 1, 2, r) là tỷ lệ cá thể tính trạng Ai trong tập hợp chính H Khi đó véctơ =(p1
, p2, pr) được gọi là phân bố của A trong tập hợp chính H
Giả sử (p1, p2, pr) là phân bố của (A1, A2, Ar) trong tập hợp chính H và (q1, q2, qr) là phân bố của A = (A1, A2, Ar) trong tập hợp chính Y Ta nói (A1, A2, Ar) có phân bố như
nhau trong X và Y nếu (p1, p2, pr) = (q1, q2, qr) p1 = q1, pr = qr Chúng ta muốn kiểm định xem A = (A1, A2, Ar) có cùng phân số trong X và Y hay không
dựa trên các mẫu ngẫu nhiên rút từ X và Y
Tổng quát hơn, giả sử ta có k tập hợp chính H1, H2, Hk Gọi π i =(p1i , p2 i ,…, p r i) là phân bố
của A = (A1, A2, Ar) trong tập hợp chính Hi
Ta muốn kiểm định giả thuyết sau:
Trang 5H0:π1=π2=…=π k (Các phân bố này là như nhau trên các tập hợp chính Hi).
Chú ý rằng H0 tương đương với hệ đẳng thức sau:
{p11= p12=…= p1k
p21= p22=…= p2k
p i1= p i2=…= p i k
p r1= p r2=…= p r k
Từ mỗi tập hợp chính chúng ta chọn ra một mẫu ngẫu nhiên Mẫu ngẫu nhiên chọn từ tập hợp chính Hi được gọi là mẫu ngẫu nhiên thứ i (i = 1, 2, k)
Giả sử trong mẫu ngẫu nhiên thứ i:
Có n1i cá thể có tính trạng A1
n2i cá thể có tính trạng A2
nri cá thể có tính trạng Ar
Ký hiệu: n io=∑
j=1
k
n ij ;n oj=∑
i=1
r
n ij
Như vậy n0j là kích thước của mẫu thứ j, còn nio là tổng số cá thể có tính trạng Ai trong
toàn bộ k mẫu đang xét:
n io=∑
i=1
r
n io=∑
j=1
k
n oj là tổng số tất cả các cá thể của k mẫu đang xét
Nếu giả thiết H0 là đúng nghĩa là:
{ p11= p12=…= p1k = p1
p21= p22=…= p2k = p2
−−−−−−−−−−−¿p i1= p i2=…= p i k =p i
−−−−−−−−−−−¿p r1= p r2=…= p r k = p r
thì các tỷ lệ chung p1, p2, pr được ước lượng bởi:
^p i=n io
n
Đó ước lượng cho xác suất để một cá thể có mang tính trạng Ai Khi đó số cá thể có tính trạng Ai trong mẫu thứ j sẽ xấp xỉ bằng:
^
n ij =n oj ^p i=n oj n io
n
Các số n^ij (i = 1,2, r; j = 1,2, k)được gọi là các tần số lý thuyết (TSLT), các số nij
được gọi là các tần số quan sát (TSQS)
Ta quyết định bác bỏ Ho khi các TSLT cách xa TSQS một cách bất thường Khoảng cách
giữa TSQS và TSLT được đo bằng test thống kê sau đây:
f =1
k
∑
i=1
r (n ij−^n ij)2
^
n ij =∑(TSQS−TSLT) TSLT 2
Trang 6Người ta chứng minh được rằng nếu H0 đúng và các TSLT không nhỏ hơn 5 thì T sẽ có phân bố xấp xỉ phân bố với (k-1)(r-1) bậc tự do Thành thử miền bác bỏ có dạng {T > c} ở
đó c được tìm từ điều kiện P{T > c} = Vậy c là phân vị mức của phân bố 2 với (k-1)(r-1) bậc tự do
Đối với thí nghiệm có các kết quả, để so sánh các tỉ số của các kết quả đó, ta dùng kiểm
định 2 (chi-quared):
γ2=∑
i=1
r
∑
j=1
c (n ij−^n ij)2
^
n nij: tần số thực nghiệm;
npij: tần số lý thuyết của ô (i,j);
r: số hàng;
c: số cột
Dùng hàm CHITEST (actual_range,expected_range)
Tính giá trị: P(X > χ2) = CHITEST
Nếu: P(X > χ2) > ∝thì chấp nhận H0 và ngược lại
Thực hiện bài toán bằng excel:
Nhập dữ liệu vào bảng tính và tính tổng các hàng các cột:
Tính các tần số lý thuyết:
tần số lý thuyết = (Tổng hàng × Tổng cột)/(Tổng cộng):
Trang 7Sử dụng hàm CHITEST tính xác suất P(X> 2 ):
Kết quả và biện luận:
Giả thiết H0: có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi nhiệt độ
H1: Không có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi nhiệt độ
Ta có: P(X> 2 ) = 0.026580894 > α=0.02
Bác bỏ giả thiết H1, chấp nhận giả thiết H0 Vậy: có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi nhiệt độ