Giáo trình xác suất thống kê.trong tài liệu này các bạn sẽ được tiếp xúc với các công thức cơ bản.Tài liệu về bài tập trắc nghiệm xác suất thống kê giúp các bạn sinh viên rèn luyện kỹ năng làm bài tập. Lý thuyết xác suất thống kê là một bộ phận của toán học, nghiên cứu các hiện tượng ngẫu ... Giáo trình gồm 6 chương tương ứng với 4 đơn vị học trình
Trang 1KHOA KHOA HỌC CƠ BẢN
HUỲNH HỮU DINH
BÀI GIẢNG TOÁN THỐNG KÊ
MSSV:
Họ tên:
TPHCM - Ngày 8 tháng 3 năm 2015
Trang 3ƯỚC LƯỢNG THAM SỐ
Xét một tập hợp chính Ω và giả sử ta quan tâm tới biến lượng X đo
lường một dấu hiệu gì đó của cá thể trong tập hợp chính Về mặt Toán
học, X được coi là một BNN (giá trị của nó thay đổi từ cá thể này sang
cá thể khác) Phân bố xác suất của X rất khó nắm bắt, và thông thường
ta giới hạn ở việc xác định một số tham số đặc trưng của X như giá trị
trung bình (kỳ vọng), phương sai, trung vị (median), mode, Các tham
số này không thể xác định chính xác được, mà phải ước lượng từ giá trị
của X trên một mẫu chọn ngẫu nhiên Như vậy bài toán ước lượng tham
số được phát biểu như sau:
Giả sử X là một BNN có tham số đặc trưng θ nào đó (chưa biết) mà
ta đang quan tâm Vấn đề đặt ra là: Căn cứ trên n giá trị x1, x2, , x n của X đo được trên một mẫu kích thước n lấy ra từ tập hơp chính, cần tìm giá trị gần đúng θ ∗ của θ.
Định nghĩa 1.1 Một hàm θ ∗ = S n (x1, x2, , x n) của n giá trị
x1, x2, , x n được gọi là một ước lượng điểm cho θ.
Để cho gọn ta sẽ gọi tắt ước lượng điểm là ước lượng Để khảo sát
về mặt Toán học, ta sẽ coi x1, x2, , x n là giá trị quan sát được (hay giá
trị thực nghiệm) của mẫu tổng quát X1, X2, , X n, trong đó các BNN
X1, X2, , X n độc lập với nhau và có cùng phân bố với X.
Như vậy ước lượng θ ∗ = S n là một hàm của n BNN X1, X2, , X n và
do đó nó cũng là một BNN Giá trị của θ ∗ cũng thay đổi từ mẫu quansát này sang mẫu quan sát khác
Việc lựa chọn một ước lượng nào là “tốt” được căn cứ trên các tiêuchuẩn dưới đây
Trang 4Định nghĩa 1.2 Ước lượng S n được gọi là ước lượng không chệch cho θ nếu ES n = θ
Ước lượng S n được gọi là ước lượng vững nếu với mọi ϵ > 0 ta có
lim
n →∞ P ( |S n − θ| ≤ ϵ) = 1.
Ước lượng S n được gọi là hiệu quả nếu S n là ước lượng không chệch và phương sai DS n là nhỏ nhất trong lớp tất cả các ước lượng không chệch.
Tính chất không chệch có nghĩa là ước lượng S n không có sai số hệthống
Tính chất vững đảm bảo cho ước lượng S n gần θ tùy ý với xác suất
cao khi kích thước mẫu đủ lớn
1.1.1 Ước lượng giá trị trung bình µ
Giả sử X là BNN với EX = µ (chưa biết) µ được gọi là giá trị trung
sẽ được dùng làm ước lượng cho µ.
Định lý 1.1 Trung bình mẫu là ước lượng không chệch và vững cho
Trang 51.1.2 Ước lượng phương sai σ2
Giả sử X là BNN với DX = σ2 (chưa biết) σ2 được gọi là phương sai
của tập hợp chính Nếu ta có một mẫu gồm n giá trị x1, x2, , x n của X
thì một cách hợp lí phương sai mẫu chưa hiệu chỉnh
Trang 6Kết quả trên chứng tỏ cS2 là một ước lượng chệch.
Do đó, nếu ta xét phương sai mẫu đã hiệu chỉnh
một mặt hàng được nhập khẩu, tỉ lệ sinh viên đến từ Miền Tây trongtrường Đại học Công Nghiệp TP.HCM, v.v
Xét biến lượng X xác định như sau:
Nếu x1, x2, , x n là một mẫu gồm n giá trị quan sát của X thì x1 +
x2+ + x n là số cá thể mang đặc tính A của mẫu và
f = x1+ x2+· · · + x n
n
chính là tần suất xuất hiện đặc tính A trong mẫu.
Ta thấy f là giá trị quan sát của BNN
F = X1+ X2+· · · + X n
n
trong đó X1, X2, , X nlà các BNN độc lập với nhau và có cùng phân bố
với X Vì EX = p nên ta dễ dàng chứng minh được f là một ước lượng không chệch và vững cho p.
Chú ý 1.1 Từ đây trở về sau, để tiện cho việc trình bày phần lí thuyết,
các mẫu được xem xét mà mẫu tổng quát
Trang 71.2 Ước lượng khoảng
Bài toán tìm ước lượng khoảng đặt ra như sau: Căn cứ trên mẫu quan
sát X1, X2, , X n , hãy xác định một khoảng (a; b) để khoảng đó chứa tham số θ với xác suất 1 − α cho trước (1 − α thường được chọn là 0, 95 hay 0, 99) Một cách chính xác hơn, khoảng ước lượng được định nghĩa
như sau:
Định nghĩa 1.3 Khoảng có hai đầu mút a = a(X1, X2, , X n) và
b = b(X1, X2, , X n)được gọi là khoảng ước lượng với độ tin cậy 1 −α nếu P (a ≤ θ ≤ b) = 1 − α.
Chú ý 1.2 Hai đầu mút a, b của khoảng ước lượng là hai BNN Chúng
là hàm của X1, X2, , X nnên thay đổi từ mẫu này cụ thể này sang mẫu
cụ thể khác
Khoảng ước lượng chỉ cho ta biết với một xác suất cao khoảng này
chứa θ chứ ta không chắc chắn θ có nằm trong khoảng ước lượng hay
không (trừ khi chúng ta xác định toàn bộ tập chính, mà điều này khôngthể thực hiện trong thực tế)
1.2.1 Ước lượng khoảng cho kỳ vọng
Phương sai σ2 đã biết
Định lý 1.2 Giả sử X ∼ N(µ, σ2)trong đó σ2 đã biết Với độ tin cậy
1− α, gọi z α là giá trị thỏa mãn φ(z α) = 1− α
Trang 8Chứng minh Vì các BNN X i , i = 1, n độc lập và có cùng phân bố với
X ∼ N(µ, σ2)nên X ∼ N(µ, σ2
n), suy ra Z = (X −µ) σ √ n ∼ N(0, 1) Khi đó P
Ví dụ 1.1 Đo chiều cao (đơn vị cm) 100 sinh viên trường Đại học Công
Nghiệp TP HCM ta được trung bình mẫu x = 160cm Giả sử độ lệch chuẩn σ của chiều cao người trưởng thành là 8cm, hãy xác định khoảng
ước lượng chiều cao trung bình của sinh viên trường ĐHCN trong cáctrường hợp sau:
1) Độ tin cậy 95%
2) Độ tin cậy 99%
3) Độ tin cậy 98%
Giải Từ đề bài ta có n = 100; x = 160cm; σ = 8cm.
1) Với đô tin cậy 95% ta được z α = 1, 96 Vậy khoảng ước lượng chiều
cao trung bình của sinh viên trường ĐHCN là
)
= (158, 43; 161, 57)
2) Với đô tin cậy 99% ta được z α = 2, 58 Vậy khoảng ước lượng chiều
cao trung bình của sinh viên trường ĐHCN là
)
= (157, 94; 162, 06)
Trang 9Phương sai σ2 chưa biết và kích thước mẫu n ≥ 30
Trong nhiều trường hợp, ta không biết được phương sai của tập hợp
chính Nếu kích thước mẫu n > 30 thì ta có thể xấp xỉ σ2 bằng phương
sai đã hiệu chỉnh s2 của mẫu
Khi đó, khoảng ước lượng trung bình với độ tin cậy 1− α sẽ là
)
.
Ví dụ 1.2 Một mẫu ngẫu nhiên gồm 100 sinh viên của trường ĐHCN
TP.HCM được hỏi về quãng đường họ đi từ nhà tới trường Giá trị trung
bình và độ lệch chuẩn đã hiệu chỉnh của mẫu này tương ứng là 5km và
0, 8km Với độ tin cậy 95%, hãy xác định khoảng ước lượng quãng đường
trung bình đi học của tất cả sinh viên trường ĐHCN TP.HCM
Giải Từ đề bài ta tính được n = 100; x = 5km; s = 0, 8km; z α = 1, 96.
Do đó, khoảng ước lượng quãng đường trung bình đi học của tất cả sinhviên trường ĐHCN là
Ví dụ 1.3 Trường ĐHCN TP.HCM tiến hành một cuộc điều tra xem
trung bình một sinh viên của trường tiêu hết bao nhiêu tiền gọi điệnthoại trong một học kỳ Một mẫu ngẫu nhiên gồm 49 sinh viên được
chọn và số tiền chi cho việc gọi điện thoại của họ như sau (đơn vị nghìn
Ví dụ 1.4 Để xác định chiều cao trung bình (đơn vị m) của các cây bạch
đàn trong một khu rừng bạch đàn rất lớn, người ta chọn ngẫu nhiên 64cây để đo Kết quả thu được như sau:
Trang 10Khoảng chiều cao Số cây
Giải Để dễ tính toán, mỗi khoảng chiều cao ta sẽ lấy trung điểm của
khoảng làm đại diện Từ đây, ta tính được n = 64; x = 8, 09; s = 1, 2 và
Phương sai σ2 chưa biết và n < 30
Cơ sở cho việc xây dựng khoảng ước lượng cho trường hợp này dựa vàođịnh lý sau:
Định lý 1.3 Giả sử X ∼ N(µ, σ2)và X1, X2, , X n là các BNN độc lập với nhau và có cùng phân bố với X Khi đó, BNN T = (X −µ) S √ n sẽ
có phân bố Student với bậc tự do n − 1, tức T ∼ t n −1 , trong đó
Ví dụ 1.5 Một phương pháp điều trị bệnh mới đang được xem xét
nghiệm thu Một chỉ tiêu để đánh giá hiệu quả của phương pháp là
số ngày trung bình µ từ lúc điều trị cho đến khi bệnh nhân khỏi bệnh.
Một mẫu ngẫu nhiên gồm 16 bệnh nhân được theo dõi và số ngày điềutrị cho tới khi bệnh nhân khỏi bệnh được ghi lại như sau:
Trang 114 4 5 8 6 10 3 9
2 6 4 7 9 11 6 8Với độ tin cậy 95%, hãy xác định khoảng ước lượng trung bình sốngày cần thiết để bệnh nhân được điều trị hết bệnh
Giải Từ đề bài ta tính được n = 16; x = 6, 375; s = 2, 630; t15
Ví dụ 1.6 Khảo sát một mẫu gồm 12 người ở một địa phương A cho
thấy số lần họ đi xem phim trong 1 năm như sau:
14 16 17 17 24 20 32 18 29 31 15 35
Với độ tin cậy 95%, xác định khoảng ước lượng trung bình số lần một
người ở địa phương A đi xem phim trong thời gian 1 năm.
Giải Từ đề bài ta tính được n = 12; x = 22, 333; s = 7, 512; t11
α = 2, 201.
Khi đó, khoảng ước lượng trung bình số lần một người ở địa phương
A đi xem phim trong thời gian 1 năm là (17, 560; 27, 106).
1.2.2 Ước lượng khoảng cho tỉ lệ
Giả sử trong tập hợp chính, mỗi cá thể của nó mang hay không mang
một đặc tính A nào đó Gọi p là tỉ lệ cá thể mang đặc tính A trong toàn
bộ tập chính (p chưa biết) Ta muốn ước lượng tham số p này dựa trên
mẫu điều tra
Giả sử trong một mẫu kích thước n có k cá thể mang đặc tính A Chúng ta đã biết tần xuất mẫu f = k
n là một ước lượng không chệch và
vững cho p Bài toán đặt ra là xây dựng khoảng ước lượng cho p với độ
tin cậy 1− α Để thực hiện điều này ta tìm hiểu kết quả sau:
Định lý 1.4 Cho X i , i = 1, n là các BNN Becnulli độc lập với nhau
Trang 12Vì F ∼ N(p, p(1 −p)
n ) nên (F √ −p) √ n
p(1 −p) ∼ N(0, 1) Do đó, khoảng ước lượng
cho p với độ tin cậy 1 − α là
)
.
Ví dụ 1.7 Trước ngày bầu cử tổng thống, một cuộc thăm dò dư luận đã
được tiến hành Người ta chọn ngẫu nhiên 400 người để hỏi ý kiến thì
có 240 người nói rằng họ sẽ bỏ phiếu cho ông A Tìm khoảng ước lượng cho tỉ lệ cử tri bỏ phiếu cho ông A với độ tin cậy 95%.
Giải Từ đề bài ta tính được n = 400; f = 240
)
= (55, 2%; 64, 8%)
Ví dụ 1.8 Ở cây ngọc trâm thì đặc tính lá phẳng hay lá nhăn là do một
gen có hai alen, A trội và a lặn, quyết định Các đồng hợp tử AA và dịhợp tử Aa có lá phẳng, còn đồng hợp tử aa có lá nhăn Trong số 560 cây
có được khi lai hai dị hợp tử thì có 110 cây lá nhăn Tìm khoảng ước
lượng cho xác suất p để có cây lá nhăn khi lai hai dị hợp tử với độ tin
cậy 95% Số liệu trên có phù hợp với lí thuyết của Mendel hay không (lí
thuyết của Mendel cho rằng p = 14)?
Giải Từ đề bài ta tính được n = 560; f = 110
)
= (16, 35%; 22, 93%)
Vì p = 1
4 không thuộc khoảng (16, 35%; 22, 93%) nên số liệu trên
không phù hợp với lí thuyết của Mendel
Trang 131.2.3 Ước lượng khoảng cho phương sai
Giả sử X ∼ N(µ, σ2) Tập hợp chính ở đây là tập hợp tất cả các giá trị
của X Một mẫu có kích thước n bao gồm các giá trị X1, X2, , X n thu
được từ n quan sát độc lập từ X Với mẫu được lấy, ta muốn tìm khoảng ước lượng cho σ2 với độ tin cậy 1− α.
Trước hết, ta tìm hiểu kết quả quan trọng sau:
Ví dụ 1.9 Đường kính của một chi tiết máy do Xí nghiệp A sản xuất là
một BNN có phân phối chuẩn Chọn ngẫu nhiên 9 chi tiết máy ta tính
được độ lệch chuẩn đã hiểu chỉnh là s = 0, 1 Với độ tin cậy 95%, xác
định khoảng ước lượng cho phương sai của toàn bộ chi tiết máy do Xínghiệp A sản xuất
Giải Từ giả thiết đề bài ta có
Trang 141.3 Xác định kích thước mẫu
Với độ tin cậy 1− α đã cho, ta thấy có mối quan hệ giữa kích thước mẫu
n và độ dài khoảng ước lượng Kích thước mẫu n càng lớn thì độ dài
khoảng ước lượng càng nhỏ, nghĩa là độ chính xác của ước lượng của
ta càng cao Tuy nhiên, kích thước mẫu lớn thì đòi hỏi nhà nghiên cứuphải tốn nhiều thời gian, tiền bạc và công sức để khảo sát Vậy bài toánđặt ra là: Cần chọn kích thước mẫu tối thiểu là bao nhiêu để đạt được
độ chính xác mong muốn
1.3.1 Trường hợp ước lượng cho trung bình
Giả sử ta muốn ước lượng µ với sai số không quá ϵ cho trước và độ tin
cậy 1− α Ta biết rằng với xác suất 1 − α thì
Công thức trên chỉ áp dụng được khi biết σ Nhưng thông thường σ
không được biết Để khắc phục điều này, ta lấy sơ bộ một mẫu có kích
thước m > 30 để tính x và s Sau đó, trong công thức (1.1), ta sẽ thay σ bằng s Khi đó, n =⌈(z α s
)2⌉
≥ 30.
được thỏa mãn
Ví dụ 1.10 Ta muốn xây dựng một khoảng ước lượng cho khối lượng
trung bình của các gói đường được đóng bằng máy tự động với độ tin
cậy 99% Điều tra sơ bộ một mẫu cho ta x = 11, 8kg, độ lệch chuẩn đã hiệu chỉnh s = 0, 9kg Hỏi cần phải lấy kích thước mẫu tối thiểu là bao nhiêu để đạt được sai số không vượt quá 0, 1kg ?
Giải Từ giả thiết ta có x = 11, 8kg; s = 0, 9kg; ϵ = 0, 1kg; z α = 2, 58 Cỡ mẫu nhỏ nhất thỏa yêu cầu đề bài là n =⌈(z α s
ϵ
)2⌉
Trang 15Ví dụ 1.11 Một cuộc nghiên cứu được tiến hành nhằm xác định lương
trung bình các luật sư giỏi ở Mỹ dựa trên một mẫu điều tra Hỏi cần lấymẫu với kích thước tối thiểu là bao nhiêu để sai số không vượt quá 100USD, với độ tin cậy được ấn định là 95% ? Biết rằng độ lệch tiêu chuẩn
1.3.2 Trường hợp ước lượng cho tỉ lệ
Giả sử ta muốn ước lượng tỉ lệ p với sai số không quá ϵ cho trước và độ
tin cậy 1− α Ta biết rằng với xác suất 1 − α thì
|F − p| ≤ z α
√
p (1 − p) n
Ví dụ 1.12 Một nhà nông học muốn ước lượng tỉ lệ nảy mầm của một
loại hạt giống
1) Với 1000 hạt đem gieo thì có 640 hạt nảy mầm Tìm khoảng ướclượng tỉ lệ hạt nảy mầm với độ tin cậy 90% Sai số ở đây là bao nhiêu ?2) Nếu muốn có khoảng ước lượng tỉ lệ hạt nảy mầm với độ tin cậy90% và sai số không vượt quá 0, 02 thì cần lấy mẫu với kích thước tối
thiểu là bao nhiêu ?
Giải 1) Từ giả thiết ta có n = 1000; f = 1000640 = 0, 64; z α = 1, 64 Vì
)
= (59, 98%; 68, 02%)
Trang 17KIỂM ĐỊNH GIẢ THIẾT
THỐNG KÊ
Trong chương này chúng ta sẽ đề cập đến một vấn đề rất quan trọngtrong Thống kê: Đó là vấn đề kiểm định giả thiết thống kê Nội dungcủa bài toán như sau:
Căn cứ trên các số liệu thu được, hãy cho kết luận về một giả thiếtthống kê nào đó mà ta quan tâm
Một giả thiết thống kê là một giả thiết về sự phân bố của tập hợpchính đang xét
Nếu phân bố đó được đặc trưng bởi các tham số (như giá trị trungbình, phương sai, ) thì giả thiết thống kê là giả thiết về tham số củaphân bố nó Một số thí dụ về giả thiết thống kê:
• Tập hợp chính có phân bố chuẩn với kỳ vọng là 3.
• Phương pháp điều trị A chữa khỏi 90% bệnh nhân.
• Tuổi thọ trung bình của hai loại bóng đèn A và B là như nhau.
Từ nay trở đi một giả thiết sẽ được hiểu là một giả thiết thống kê.Một qui tắc hay một thủ tục dẫn đến việc chấp nhận hay bác bỏ giảthiết đã nêu gọi là kiểm định (test) thống kê
Giả thiết được đưa ra kiểm nghiệm được kí hiệu là H0 và được gọi là
giả thiết không Đó là giả thiết là ta nghi ngờ và muốn bác bỏ Thường
đi kèm với giả thiết H0 là một đối thiết, ký hiệu H1 H1 sẽ được chấp
Trang 18Như vậy, chúng ta sẽ quyết định bác bỏ giả thiết H0 nếu xác suất
xuất hiện một sự kiện quan sát được, tính trong điều kiện giả thiết H0
đúng, là “nhỏ”
Sau đây ta sẽ trình bày một số ví dụ để minh họa ý này
Ví dụ 2.1 Gieo một đồng tiền 1000 lần ta thấy xuất hiện mặt sấp 700
lần Ta nghi ngờ xác suất xuất hiện mặt sấp cao hơn mặt ngữa và nhiệm
vụ của ta là kiểm tra điều đó Gọi p là xác suất xuất hiện mặt sấp Như vậy, giả thiết H0 là p = 0, 5 và đối thiết H1 là p > 0, 5 Nếu giả thiết H0đúng, tức p = 0, 5, thì xác suất gieo 1000 lần đồng xu được 700 lần mặt sấp là C700
1000
1
2 1000 = 5, 067 × 10 −38 Giá trị xác suất này quá nhỏ nên ta có
thể bác bỏ H0 và chấp nhận H1
Ví dụ 2.2 Mọi cuộc nghiên cứu ở Mỹ cho biết trẻ em Mỹ ở độ tuổi đến
trường tiêu thụ trung bình 19,4 OZ sữa 1 ngày (OZ: chữ viết tắt củaounce, đơn vị đo lường Anh: 1 OZ = 28,35g)
Trong một mẫu ngẫu nhiên gồm 140 trẻ em, người ta tính đượclượng sữa trung bình chúng uống là 18,5 OZ với độ lệch tiêu chuẩn là6,8 OZ Điều này có cho phép ta kết luận là trung bình lượng sữa tiêuthụ ít hơn 19,4 OZ hay không ?
Giải Gọi µ là lượng sữa tiêu thụ trung bình của một đứa trẻ trong một
ngày Như vậy, giả thiết H0 là µ = 19, 4 và đối thiết H1 là µ < 19, 4 Nếu giả thiết H0 đúng, ta sẽ tính xác suất để trung bình mẫu X bé hơn hay bằng 18, 5.
Như đã biết, BBN X có phân bố chuẩn (hoặc xấp xỉ chuẩn) với kỳ
2 = 0, 0582.
Xác suất này không nhỏ lắm (thông thường xác suất bé hơn 0,05 mới
được xem là nhỏ) Do đó, ta chưa có cơ sở để bác bỏ H0 Nói cách khác,chúng ta chưa thể khẳng định lượng sữa tiêu thụ trung bình của trẻ ít
Trong khi đưa ra quyết định cho các tình huống tương tự như trên,
phải lựa chọn giữa hai giả thiết H0 và H1, ta có thể phạm hai loại sailầm:
• Bác bỏ H0 trong khi H0 đúng, mà ta gọi là sai lầm loại I.
• Chấp nhận H0 trong khi H0 sai, mà ta gọi là sai lầm loại II.
Sai lầm loại I tương tự như sai lầm của quan tòa khi kết án nhầmngười vô tội, còn sai lầm loại II tương tự như tha bổng người có tội.Một kiểm định thống kê được gọi là lý tưởng nếu làm cực tiểu cả sailầm loại I và sai lầm loại II Tiếc thay không tồn tại một kiểm định lý
Trang 19tưởng như vậy Nếu ta làm giảm sai lầm loại I thì làm tăng sai lầm loại
II và ngược lại
Trong một xã hội văn minh, người ta có xu hướng thừa nhận việc kết
án nhầm người vô tội là một sai lầm nghiêm trọng hơn nhiều so với sailầm tha bổng kẻ có tội Trong bài toán kiểm định giả thiết cũng vậy Tacoi sai lầm loại I là nghiêm trọng hơn sai lầm loại II Thành thử người
ta cố định trước xác suất sai lầm loại I Xác suất của việc mắc sai lầm
loại I còn gọi là mức ý nghĩa, ký hiệu α Xác suất mắc sai lầm loại II được ký hiệu là β Con số 1 − β được gọi là lực lượng của kiểm định Lực
lượng của kiểm định là xác suất bác bỏ H0 khi H0 sai Thông thường α được lấy là 0, 05; 0, 02 và 0, 01 Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa α, thống kê nào có β nhỏ nhất được xem là tốt nhất.
Các kiểm định được sử dụng trong chương này đều đã được chứng minhmột cách chặt chẽ là các kiểm định tốt nhất
Cần lưu ý rằng khi kiểm định thống kê dẫn tới việc chấp nhận H0
thì β bằng bao nhiêu thì ta không biết Thành thử, việc chấp nhận H0được hiểu là các chứng cứ và số liệu đã có chưa đủ cơ sở để bác bỏ H0,cần phải được nghiên cứu tiếp
Các bước cần thiết trong việc tiến hành một kiểm định giả thiếtthống kê:
1 Phát biểu giả thiết H0 và đối thiết H1
2 Định rõ mức ý nghĩa α (xác suất mắc sai lầm loại I).
3 Chọn test thống kê
4 Chọn miền bác bỏ H0
5 Tính giá trị của test thống kê từ mẫu quan sát được
6 Kết luận bác bỏ hay chấp nhận H0 tùy theo giá trị của test thống
kê có rơi vào miền bác bỏ giả thiết hay không
2.2 Kiểm định giả thiết về giá trị trung bình
Giả sử X ∼ N(µ, σ2) Tập hợp chính ở đây là tập hợp tất cả các giá trị
của X Một mẫu có kích thước n bao gồm các giá trị X1, X2, , X n thu
được từ n quan sát độc lập từ X Ta muốn kiểm định giả thiết về µ.
2.2.1 Phương sai σ2 đã biết
Bài toán 2.1 Ta muốn kiểm định giả thiết H0với đối thiết H1như sau:
H0 : µ = µ0
H1 : µ ̸= µ0
ở đây µ0 là giá trị cho trước