Ba bước cơ bản trong bất kỳ thủ tục kiểm định giả thuyết nào gồm: 1 hình thành hai giả thuyết đối lập nhau, 2 tính trị thống kê kiểm định và xác định phân phối mẫu của nó, và 3 đưa ra qu
Trang 1> 1,753) = 0,10, tức là, diện tích của cả hai nhánh gấp đôi diện tích của một nhánh đơn
Trong kiểm định giả thuyết phân phối-t là phân phối được sử dụng rộng rãi nhất
Phân Phối F
Một phân phối khác nữa đáng quan tâm trong kinh tế lượng là Phân phối F của Fisher
Đó là tỉ lệ giữa hai chi-bình phương độc lập Đặt U ∼ 2
m
χ và V ∼ 2
n
χ độc lập với nhau
Thì phân phối của F = (U/m) ÷(V/n) được gọi là phân phối-F với m và n bậc tự do d.f., và được viết dưới dạng F ∼ F m,n Số đầu tiên là bậc tự do của tử số và số thứ hai là bậc tự do
của mẫu số Bảng A.4a, A.4b, và A.4c có các giá trị F của một vài kết hợp giữa m, n, và
các xác suất 0,01, 0,05, và 0,10 Bảng A.4a và A.4b cũng là bảng được in lại trong bìa
sau của quyển sách Một vài tính chất của phân phối-F được đưa ra trong Tính Chất 2.14
Tính chất 2.14 Phân phối-F với m và n bậc tự do d.f có những tính chất sau
a Phân phối-F có hình dạng tương tự như trong phân phối chi-bình phương
b Nếu biến ngẫu nhiên t có phân phối-t Student với bậc tự do d.f n thì t2 có phân
phối-F với bậc tự do d.f là 1 và n Do vậy, 2
n
t ∼ F1, n
Ví dụ, từ Bảng A.4b, với 3 bậc tự do d.f cho tử số (ký hiệu là m) và d.f là 15 cho mẫu số (ký hiệu là n), P(F > 3,29) = 0,05, và từ bảng A.4a, P(F > 5,42) = 0,10
Phân Phối Của Phương Sai Mẫu
Trong trường hợp một mẫu ngẫu nhiên từ một phân phối chuẩn, phân phối của phương
sai mẫu s2 định nghĩa trong Phương Trình (2.9) đáng phải xem xét Lưu ý rằng (n – 1)s2
= ∑(x i – x )2 là tổng bình phương các độ lệch của một quan sát cụ thể từ trung bình mẫu
Chúng ta biết rằng x i – x có phân phối chuẩn bởi vì đó là một kết hợp tuyến tính các giá trị x, mà chúng là chuẩn Chúng ta đã thấy trong phần trước, chi-bình phương được định
nghĩa là tổng bình phương của các biến ngẫu nhiên chuẩn chuẩn hóa Trong Tính Chất
2.12c, chúng ta phát biểu rằng ∑(xi - µi) 2/σ2 được phân phối giống như 2
n
χ Chúng ta có
thể kết luận từ phát biểu này là ∑(x i – x )2/σ2 cũng tuân theo phân phối chi-bình phương hay không? Câu trả lời là được, nhưng với một thay đổi nhỏ Mặc dù tổng bình phương
này cũng có phân phối chi-bình phương, nhưng bậc tự do của nó là n – 1 chứ không phải là n Bằng cách thay thế µ bằng x , chúng ta “mất bậc tự do” Đó là bởi vì các độ lệch (xi
- µi) không độc lập, mặc dù các xi độc lập Tổng độ lệch ∑(x i – x ) luôn bằng không, và
do đó chúng ta có thể định rõ chỉ có n – 1 độ lệch giữa chúng là độc lập Độ lệch thứ n phải được cộng vào để bằng không Do đó (n – 1)s2/σ2 có phân phối chi-bình phương với
bậc tự do d.f n – 1 Tính chất này và những tính chất khác liên quan được tóm tắt trong
Tính Chất 2.15
Trang 2Tính chất 2.15
a Nếu một mẫu ngẫu nhiên độc lập x1, x2,…, xn được lấy ra từ một tổng thể chuẩn với trị
trung bình µ và phương sai σ2, thì phương sai mẫu s2 =
1
1
−
n ∑(xi – x )
2 có tính chất
mà (n – 1)s2/σ2 = ∑(x i – x )2/σ2 ∼ 2
1
−
n
χ
b Bởi vì trung bình của một χ2 là bậc tự do d.f của chính nó – tức là, E( 2
m
χ ) = m –
−
2
2
1
σ
s
n = n – 1 Nó dẫn đến E(s2) = σ2 và do đó s2 là một giá trị ước lượng không
thiên lệch của σ2 Bây giờ chúng ta tìm hiểu lý do của việc chia ∑(x i – x )2 cho n – 1 Nếu chúng ta sử dụng n, giá trị kỳ vọng sẽ không bằng σ2, dẫn đến một giá trị thiên lệch
c Từ Tính Chất 2.10b chúng ta biết rằng Z = n ( x - µ)/σ ∼ N(0,1) Cũng từ Tính Chất 2.15a, U = (n – 1)s2/σ2 ∼ 2
1
−
n
χ Có thể chỉ ra rằng Z độc lập với U Chúng ta ghi nhận từ định nghĩa của phân phối-t đó là nó được rút ra từ tỉ lệ giữa một giá trị chuẩn chuẩn hóa và căn bậc hai của chi-bình phương Do vậy, t = Z/ U/(n−1) Thay Z và U trong phương trình trên và đơn giản hóa các số hạng, chúng ta có kết quả t = n ( x - µ)/s ∼
t n-1 So sánh kết quả này với Tính Chất 2.10b, chúng ta lưu ý rằng nếu σ được thay thế
bằng s, thì sẽ dẫn đến kết quả phân phối sẽ không còn chuẩn nữa nhưng là một phân phối-t
} 2.8 Kiểm Định Các Giả Thuyết
Bên cạnh việc ước lượng các thông số chưa biết, kiểm định giả thuyết về các thông số này là một khía cạnh quan trọng nhất của điều tra thực nghiệm Ơû chương 1, chúng ta đã liệt kê một loạt các giả thuyết đáng quan tâm Thủ tục kiểm định giả thuyết cũng đòi hỏi các khái niệm và phương pháp chính thống Chương này sẽ duyệt lại ngắn gọn những chủ đề này Ba bước cơ bản trong bất kỳ thủ tục kiểm định giả thuyết nào gồm: (1) hình thành hai giả thuyết đối lập nhau, (2) tính trị thống kê kiểm định và xác định phân phối mẫu của nó, và (3) đưa ra quy tắc ra quyết định và chọn một trong hai giả thuyết
} Bảng 2.9 Các Giả Thuyết Không Và Giả Thuyết Ngược Lại
H 0
H 1
µ = µ0
µ = µ1
µ = µ0
µ≠µ0
µ≤µ0
µ > µ0
µ≥µ0
µ < µ0
Trang 3Giả Thuyết Không và Giả Thuyết Ngược Lại
Bước đầu tiên là hình thành hai giả thuyết đối lập nhau: giả thuyết không (ký hiệu là
H0) và giả thuyết ngược lại (ký hiệu H1) Bảng 2.9 trình bày các ví dụ về giả thuyết không và giả thuyết ngược lại về trị trung bình của tập hợp chính (µ)
Kiểm Định Thống Kê
Một quy tắc ra quyết định chọn lựa một trong các phép quy nạp “bác bỏ giả thuyết không” hoặc “không bác bỏ giả thuyết không” cho mọi kết quả của một thí nghiệm được
gọi là kiểm định thống kê Thông thường thủ tục bao gồm đầu tiên tính một trị kiểm
định T(x1, x2, … , xn) từ mẫu các quan sát Bước kế tiếp là xác định phân phối mẫu của T theo giả thuyết không Bước cuối cùng là đề ra một quy tắc ra quyết định dựa trên giá trị quan sát được của T Phạm vi giá trị của T dựa trên đó thủ tục kiểm định đề nghị bác bỏ
giả thuyết không được gọi là vùng tới hạn, và phạm vi kiểm định đề nghị không bác bỏ giả thuyết không được gọi là vùng chấp nhận, một cách chính xác hơn, gọi là vùng
không bác bỏ
Sai Lầm Loại I và Loại II
Đối với bất kỳ một thủ tục kiểm định nào, có thể xảy ra ba kết quả sau: (1) quyết định đúng được thực hiện (nghĩa là, thủ tục chấp nhận giả thuyết đúng và bác bỏ giả thuyết sai), (2) một giả thuyết đúng bị bác bỏ, (3) một giả thuyết sai được chấp nhận Sai lầm bác bỏ H0 khi nó đúng được gọi là sai lầm loại I Sai lầm không bác bỏ H0 khi nó sai
được gọi là sai lầm loại II Tương ứng với mỗi loại sai lầm này là một giá trị xác suất
Chúng được gọi là các xác suất sai lầm loại I và loại II và được ký hiệu là P(I) và P(II) Những khái niệm này sẽ dễ hiểu hơn thông qua ví dụ lấy từ hệ thống luật pháp được Kohler trình bày (1985) Xem xét một bị cáo trong phiên xử hình sự Giả thuyết không là bị cáo “vô tội” và giả thuyết ngược lại và bị cáo “có tội” Giả định là bên bị đơn là vô tội và bên nguyên đơn phải chứng minh được rằng bên bị đơn là có tội, nghĩa là, thuyết phục ban bồi thẩm bác bỏ giả thuyết không Nếu ban bồi thẩm tuyên bố một người vô tội “không có tội” hoặc một người phạm tội “có tội”, một quyết định đúng đã được thực hiện Nếu một người vô tội bị tuyên bố có tội, ta phạm phải sai lầm loại I vì giả thuyết đúng đã bị bác bỏ Sai lầm loại II xảy ra khi một người có tội được tuyên bố trắng án
Ví dụ thứ hai, giả sử một công ty dược phẩm tuyên bố đã tìm được cách chữa trị cho một căn bệnh hiểm nghèo Giả thuyết không sẽ là viên thuốc không hiệu quả trong việc loại trừ căn bệnh, và công ty dược phẩm phải chứng minh là thuốc có hiệu quả Sai lầm loại một sẽ xảy ra nếu một viên thuốc không hiệu quả (nghĩa là, giả thuyết H0 đúng) được chấp nhận là có hiệu quả (nghĩa là, H0 bị bác bỏ) Sai lầm loại II xảy ra khi một loại thuốc thực sự có hiệu quả lại bị bác bỏ vì cho rằng không có hiệu quả
Trang 4Một cách lý tưởng, chúng ta muốn giữ cho cả P(I) và P(II) càng nhỏ càng tốt bất chấp giá trị của thông số không biết có giá trị là bao nhiêu Rủi thay, nỗ lực giảm P(I) sẽ tự động kéo theo sự gia tăng trị P(II) Chẳng hạn, trong ví dụ về phiên tòa hình sự, giả sử chúng ta không muốn một người phạm tội nào được tuyên bố trắng án Các duy nhất để thực hiện được điều này là tuyên bố mọi người có tội Trong trường hợp này, P(II) =
0, nhưng P(I) = 1 vì chúng ta cũng kết án tất cả những người vô tội Tương tự như trên, cách duy nhất để tránh kết án một người vô tội là tuyên bố mọi người vô tội Trong trường hợp này, chúng ta cũng thả tự do cho tất cả những kẻ phạm tội hay P(II) = 1 và P(I) = 0.1 Trong thực tế, sự đánh đổi giữa các sai lầm không đến nỗi cực đoan như vậy, tuy nhiên một quy tắc ra quyết định cụ thể sẽ tốt hơn cho một số giá trị của thông số và
không tốt cho những giá trị khác Thủ tục kiểm định giả thuyết cổ điển là chọn giá trị cực đại cho sai lầm loại I chấp nhận được với người phân tích và sau đó đưa ra quy tắc quyết định sao cho sai lầm loại II là thấp nhất Trong ví dụ về phiên tòa hình sự, điều này có
nghĩa là chọn quy tắc ra quyết định sao cho số lần người vô tội bị kết tội không vượt qua một số phần trăm số lần nào đó (chẳng hạn, 1%) và cực tiểu xác suất người có tội được thả tự do
Trong ví dụ về công ty dược phẩm, chúng ta chọn xác suất chấp nhận một loại thuốc không hiệu quả ở mức lớn nhất và cực tiểu xác suất bác bỏ một loại thuốc hiệu quả
Mức Ý nghĩa và Năng lực Kiểm định
Xác suất sai lầm loại I lớn nhất khi H0 đúng được gọi là mức ý nghĩa (còn được gọi là
kích thước của kiểm định) Trong ví dụ phiên tòa hình sự, đó chính là xác suất lớn nhất của việc kết án một người vô tội Xác suất bác bỏ một giả thuyết khi nó sai là 1 – P(II)
và được gọi là năng lực của kiểm định Trong ví dụ của chúng ta, đó là xác suất kết án
kẻ có tội Thủ tục kiểm định chuẩn là tìm ra một quy tắc ra quyết định sao cho P(II) là nhỏ nhất (hay, một cách tương đương, năng lực của kiểm định là lớn nhất), với rằng buộc là P(I) ≤ α, trong đó α là một hằng số cho trước (0 < α < 1) Một thủ tục kiểm định như vậy được gọi là kiểm định mạnh nhất với kích thước α Các mức ý nghĩa thường dùng nhất là 0,01; 0,05; và 0,10
Bây giờ chúng ta sẽ trình bày một số kiểm định giả thuyết hay được sử dụng trong các quyết định về kinh doanh và kinh tế Ơû đây chúng ta chỉ xem xét đến các biến ngẫu nhiên tuân theo phân phối chuẩn Độc giả nên tìm đọc các bài tham khảo được đề cập ở cuối chương này để biết thêm chi tiết về những kiểm định này và các kiểm định khác
1 Cần hết sức lưu ý rằng mặc dù trong ví dụ này P(I) + P(II) = 1, nói chung tổng này không nhất thiết như vậy
Trang 5Kiểm định Trị trung bình của một Phân phối chuẩn
Xét một biến ngẫu nhiên X tuân theo phân phối chuẩn với trị trung bình µ và phương sai
σ2 Giả thuyết không thường gặp nhất có dạng H0: µ = µ0 Giả thuyết ngược lại H1 có
thể là một phía, như là H1: µ > µ0, hoặc hai phía, như H1: µ ≠ µ0 Mỗi trường hợp trên
sẽ được trình bày chi tiết sau đây
Hình 2.12 Kiểm định một phía µ = µ 0 so với µ > µ 0 trong phân phối chuẩn
K IỂM ĐỊNH MỘT PHÍA Trong nhiều trường hợp, người phân tích sẽ biết trước phía nào của giả thuyết ngược lại mà thông số sẽ có thể rơi vào Chẳng hạn, chúng ta biết rằng xu hướng tiêu dùng cận biên (lượng tiêu dùng tăng thêm trên một đơn vị thu nhập tăng thêm) là số dương Để kiểm định xem xu hướng tiêu dùng cận biên (µ) có bằng không hay không, giả thuyết ngược lại khả dĩ là µ > µ0 ( = 0 trong ví dụ của chúng ta)
Bằng phương pháp mômen, trị trung bình mẫu x là một ước lượng không thiên lệch của µ Nếu giá trị quan sát x lớn hơn đáng kể so với µ0 được định ra ở giả thuyết không, chúng ta sẽ nghi ngờ rằng giá trị thực µ sẽ rất có thể lớn hơn µ0 Như vậy, nếu x
- µ0 có giá trị “lớn” chúng ta sẽ bác bỏ giả thuyết H0 rằng µ = µ0 Để có thể tính được các xác suất trong phân phối của x với giá trị σ2 không biết, trị thống kê kiểm định thực tế được sử dụng là tc = n(x−µ0)/s, trong đó s là độ lệch chuẩn của mẫu được định nghĩa trong Phương trình (2.9) Các bước kiểm định được tóm tắt trong danh sách sau và được minh họa ở hình 2.12
Vùng A
t* n-1(α) tn-1 0
f(tn-1)
Không bác bỏ H0 Bác bỏ H0
Trang 6Thủ tục kiểm định H 0 so với H 1
Bước 1 H0: µ = µ0; H1: µ > µ0
Bước 2 Trị thống kê kiểm định là tc = n(x−µ0)/s Theo giả thuyết H0, trị này tuân
theo phân phối Student t với n – 1 bậc tự do
Bước 3 Trong bảng t (Bảng A.2), tra giá trị tương ứng với n – 1 bậc tự do và mức ý
nghĩa α cho trước, và nhận được điểm t* n-1(α) sao cho P(t > t*) = α, mức ý nghĩa được chọn trước t* được gọi là giá trị tới hạn
Bước 4 Bác bỏ H0 nếu giá trị quan sát tc > t* Nếu giả thuyết ngược lại là µ < µ0, bác H0
nếu tc < - t* Một cách tương đương, bác bỏ nếu | tc| > t*
Kiểm định này được gọi là kiểm định một phía vì giả thuyết ngược lại nằm về một
trong hai phía của µ0 và vì giá trị của t* được xác định sao cho vùng diện tích ở một phía của phân phối t bằng với α (xem Hình 2.12) Kiểm định này còn được gọi là kiểm định
một đầu
} Ví duÏ 2.10
Nhãn hiệu trên vỏ hộp carton đựng bóng đèn tròn có dòng chữ bóng đèn tròn “siêu bền” với tuổi thọ trung bình là 935 giờ Một khách hàng bất mãn phàn nàn với Phòng Thương Mại rằng tuyên bố trên vỏ hộp như vậy là sai sự thật và tuổi thọ của bóng đèn thấp hơn
935 giờ rất nhiều Một nhà phân tích thuộc phòng Thương Mại kiểm định một mẫu ngẫu nhiên gồm 25 bóng đèn tròn và tính được tuổi thọ trung bình là 917 giờ với độ lệch chuẩn 54 giờ Nhà phân tích có thể bác bỏ tuyên bố của nhà sản xuất hay không? Giả sử rằng tuổi thọ bóng đèn tuân theo phân phối chuẩn với trị trung bình µ và phương sai
σ2
Bước 1 Giả thuyết không và giả thuyết ngược lại là H0: µ = 935 và H1: µ < 935
Bước 2 x = 917, s = 54, và n = 25 Trị thống kê kiểm định là tc = n(x−µ0)/s =
67 1 54 935 917
25( − )/ =− , Theo giả thuyết H0, trị này tuân theo phân phối Student t với n – 1 (=24) bậc tự do
Bước 3 Từ bảng t, t* 24(0,05) = 1,711
Bước 4 Vì | tc| < t*, chúng ta không thể bác bỏ giả thuyết không và vì vậy kết luận
rằng, tại mức ý nghĩa 5%, không có bằng chứng thống kê cho thấy tuổi thọ trung bình của bóng đèn nhỏ hơn đáng kể so với giá trị tuyên bố của công ty là
935 giờ, mặc dù trị trung bình quan sát thấp hơn 935
Trang 7K IỂM ĐỊNH HAI PHÍA Cho H0: µ = µ0; H1: µ ≠ µ0 Lưu ý rằng giả thuyết ngược lại là một giả thuyết hai phía, nghĩa là, µ có thể nằm về hai phía của µ0 Nhiều quyết định trong kinh doanh và kinh tế đòi hỏi phải lập các giả thuyết hai phía Chẳng hạn, một nhà sản xuất lốp xe có thể muốn kiểm định xem tuổi thọ trung bình của lốp xe có bằng 30.000 dặm không Có thể nhà sản xuất không biết trước được thông tin liệu tuổi thọ có lớn hay hay bé hơn 30.000 dặm Trong trường hợp này, đầu tiên phải lấy một mẫu ngẫu nhiên các quan sát x1, x2, …, xn Chúng ta đã phát biểu trong tính chất 2.11c rằng trị thống kê mẫu t = (x µ− )/(s/ n), trong đó x là trung bình mẫu và s là độ lệch chuẩn mẫu như được định nghĩa trong Phương trình (2.9), tuân theo phân phối tn-1 Nếu giả thuyết không là đúng, µ = µ0 Theo giả thuyết này, giá trị t được tính từ mẫu như sau
) / /(
)
tc = −µ0 ~ tn-1 Nếu trị trung bình quan sát được x khác biệt đáng kể so với giả thuyết không µ = µ0, trị tính toán tc sẽ hoặc quá lớn hay quá nhỏ Trong trường hợp này, chúng ta bác bỏ H0 Từ bảng t ở Phụ lục A (Bảng A.2), tìm t* n-1(α/2), trong đó t* là giá trị trong phân phối t với n – 1 bậc tự do sao cho P(t > t*) = α/2 và α là mức ý nghĩa (thông thường là 0,01; 0,05; hoặc 0,10) Lưu ý rằng vì tính đối xứng của phân phối t, P(t
< - t*) cũng bằng α/2 Thủ tục kiểm định H0 so với H1: µ ≠ µ0 là bác bỏ H0 nếu tc > t* hoặc tc < - t* Các bước kiểm định được tóm tắt trong danh sách sau và được minh họa ở hình 2.13
} Hình 2.13 Kiểm định hai phía µ = µ 0 so với µ ≠ µ 0 trong phân phối chuẩn
Thủ tục kiểm định H 0 so với H 1
Bước 1 H0: µ = µ0; H1: µ ≠ µ0
Bác bỏ H0
Vùng α/2
t* n-1(α/2) tn-1
0 f(tn-1)
Không bác bỏ H0
Vùng α/2
- t* n-1(α/2)
Bác bỏ H0
Trang 8Bước 2 Trị thống kê kiểm định là tc = n(x−µ0)/s Theo giả thuyết H0, trị này tuân
theo phân phối Student t với n – 1 bậc tự do
Bước 3 Trong bảng t (Bảng A.2), tra giá trị tương ứng với n – 1 bậc tự do và mức ý
nghĩa α cho trước, và nhận được điểm t* n-1(α/2) sao cho P(t > t*) = α/2, tức là P(t < - t* hay t > t*) = α, mức ý nghĩa được chọn trước
Bước 4 Bác bỏ H0 nếu giá trị quan sát tc > t* hoặc t < - t* Một cách tương đương, bác
bỏ nếu |tc| > t*
Kiểm định này được gọi là kiểm định hai phía (hoặc thường được gọi hơn là kiểm
định hai đầu) vì giả thuyết ngược lại có thể nằm về hai phía của µ0 và vì giá trị của t* được xác định sao cho vùng diện tích ở mỗi phía của phân phối t bằng với α/2 (xem Hình 2.13)
} Ví dụ 2.11
Trong ví dụ về bóng đèn, giả sử rằng giả thuyết ngược lại là µ ≠ 935 Giá trị t tính toán vẫn là -1,67, và t* n-1(α/2) = t* 24(0,025) = 2,064 Vì |tc| < t * chúng ta không bác bỏ giả thuyết không µ = 935 và kết luận rằng tuổi thọ trung bình không khác 935 một cách đáng kể
Làm bài 2.20 và dò lại với các kết quả trong Phụ lục B
Kiểm định Hệ số Tương quan giữa hai biến
Với hai biến, giả thuyết không là H0: ρxy = 0; nghĩa là, hệ số tương quan giữa hai biến X và Y bằng 0 Giả thuyết ngược lại H1: ρxy ≠ 0 Nếu giả thuyết H0 không bị bác bỏ, chúng ta kết luận rằng X và Y không tương quan Trị thống kê kiểm định là Fc = [(n – 2)r2]/(1 – r2), trong đó r2 là bình phương của hệ số tương quan mẫu được tính theo Phương trình (2.11) Theo giả thuyết không, giá trị này tuân theo phân phối F với hai bậc tự do 1 và n – 2 Từ bảng F, tìm F* 1, n – 2(α), điểm trên phân phối F sao cho vùng diện tích về phía phải từ điểm đó có giá trị α, mức ý nghĩa Bác bỏ H0 nếu trị tính toán
Fc > F*
Kiểm định này cũng có thể được thực hiện bằng kiểm định t Từ tính chất 2.14b, chúng ta lưu ý rằng trị thống kê F với 1 bậc tự do ở tử số tương đương với phân phối t2 Kiểm định t tương đương là tính t* n-2(α/2) và bác bỏ H0 nếu tc = F > tc *
} VÍ DỤ 2.12
Trang 9Giả sử hệ số tương quan giữa điểm SAT về toán và điểm lập luận đối với một mẫu gồm
427 sinh viên là r = 0,42 Do đó, r2 = 0,1764, và trị thống kê F là
Fc = 425x0,1764/(1 – 0,1764) = 91,027 ~ F(1, 425)
Từ bảng A.4a chúng ta thấy rằng với mức ý nghĩa 1%, giá trị tới hạn F* nằm giữa 6,63 và 6,85 Có thể dễ dàng nhận thấy từ giá trị F* là Fc cực kỳ có ý nghĩa, nghĩa là chúng ta bác bỏ giả thuyết không ρxy = 0 Nghĩa là hai cột điểm tương quan với nhau một cách có ý nghĩa
Những kiểm định khác như sự khác biệt về các trị trung bình và phương sai không được trình bày ở đây Tham khảo Ramanathan (1993, trang 225-227) về những kiểm định này
(Ứng dụng của các khái niệm kiểm định giả thuyết trong phân tích hồi quy có thể được tìm thấy ở Phần 3.5 và sau đó tiếp tục phần 2.9)
} 2.9 Ước Lượng Khoảng
Các thủ tục ước lượng được thảo luận trong phần trước đây cho biết một giá trị ước lượng đơn của các thông số chưa biết của một phân phối Những giá trị này được gọi là các
ước lượng điểm Trị trung bình mẫu và phương sai mẫu là các ví dụ về ước lượng điểm Mặc dù ước lượng điểm cung cấp những thông tin hữu ích, chúng chứa đựng những sai số Phương sai của các ước lượng đo lường tính bất định này và cho biết độ chính xác mà
ước lượng được thực hiện Ước lượng khoảng là một cách trực tiếp xét đến tính bất định
này Thay vì cung cấp một ước lượng đơn, ước lượng khoảng sẽ cung cấp một khoảng các giá trị có thể có Ví dụ, thay vì nói chỉ số lạm phát năm tới được kỳ vọng là 3,3%, chúng ta sẽ nói với một xác suất nào đó lạm phát sẽ dao động trong khoảng từ 3 đến
3,5% Khoảng này được gọi là khoảng tin cậy; nó sẽ được minh họa trong phần thảo
luận sau thông qua một ví dụ về trị trung bình của phân phối chuẩn
Khoảng Tin Cậy Của Trị Trung Bình Trong Phân Phối Chuẩn
Tính chất 2.10a cho biết nếu một biến ngẫu nhiên X tuân theo phân phối chuẩn N(µ, σ2), thì trị trung bình mẫu x sẽ tuân theo phân phối chuẩn N(µ, σ2/n) Hơn nữa, từ tính chất 2.15c ta có biến (x µ− )/(s/ n)tuân theo phân phối Student t với n – 1 bậc tự do (s là độ lệch chuẩn của mẫu) Nói cách khác, t = (x µ− )/(s/ n)~ tn-1 Gọi t* là điểm nằm trên phân phối t sao cho vùng diện tích bên phải của t* là 0,025 (nghĩa là 2 ½ %) Vì phân phối t đối xứng qua 0, cho nên vùng diện tích phía trái của – t* cũng là 0,025 Vì vậy,
Trang 10P(– t* ≤ t ≤ t*) = 0,95 Thay t ở dạng trị trung bình mẫu và độ lệch chuẩn mẫu vào, chúng
ta có biểu thức xác suất sau:
P(– t* ≤
n s
x /
µ
− ≤ t*) = 0,95 Nhân các vế với s / nvà sắp xếp lại các số hạng ta có
P[x - (s / n)t* ≤ µ ≤ x + (s / n)t*] = 0,95
Điều này có nghĩa là giá trị thực của thông số µ nằm trong khoảng x ± (s / n )t* với xác suất 95% Khoảng này được gọi là khoảng tin cậy 95% của µ Nên lưu ý rằng khoảng tin cậy là một khoảng ngẫu nhiên vì các điểm mút của khoảng bản thân cũng là các biến ngẫu nhiên Diễn dịch của khoảng tin cậy như sau Nếu chúng ta lập lại thí nghiệm lấy một mẫu ngẫu nhiên và tính khoảng tin cậy nhiều lần, thì 95% số khoảng tin cậy sẽ chứa giá trị thực của µ Sự chọn lựa mức tin cậy nằm trong phạm vi quyết định của người phân tích Nếu các dự báo rất chính xác là không nhất thiết, chúng ta có thể chọn khoảng tin cậy 90% Nên lưu ý rằng khi kích thước mẫu n tăng, độ rộng của khoảng tin cậy nhỏ lại Tương tự, khi sai số chuẩn ước lượng (s) giảm, khoảng tin cậy
giảm độ rộng Nói cách khác, với một mức tin cậy cho trước, kích thước mẫu càng lớn hoặc sai số chuẩn càng nhỏ, khoảng tin cậy càng hẹp và do đó độ chính xác củaiá trị ước lượng càng lớn
} VÍ DỤ 2.13
Giả sử rằng tuổi thọ trung bình của bóng đèn tròn được ước lượng là 450 giờ và độ lệch chuẩn ước lượng là 25 giờ Ở đây, x = 450 và s = 25 Cho cỡ mẫu (n) là 25 Từ bảng t trong Phụ lục A (Bảng A.2), chúng ta thấy rằng với 24 bậc tự do (tức là n –1) t* = 2,064 với vùng diện tích 2.5% về phía phải của nó Vì vậy, khoảng ước lượng 95% bằng 450 ± (25/ 25 )2,064, hay khoảng (439,68; 460,32)
Quan Hệ giữa Kiểm Định Giả Thuyết và Khoảng Tin Cậy
Tồn tại một quan hệ chặt chẽ giữa kiểm định hai phía và khoảng tin cậy Trong ví dụ bóng đèn (2.10), chúng ta có thể tính khoảng tin cậy cho tuổi thọ của bóng đèn Chúng
ta lưu ý rằng khoảng tin cậy đối với µ là [ x - (s / n)t* , x + (s / n )t*], trở thành [917 ± (54/5)2,064] hoặc (895; 939) Đây là khoảng tin cậy 95% của trị trung bình của tuổi thọ bóng đèn Chúng ta có nhận xét rằng khoảng này chứa µ0 = 935 Trong trường hợp này, chúng ta không bác bỏ giả thuyết không Ví dụ này cho thấy rằng kiểm định giả thuyết