Hiện nay có rất nhiều phần mềm ứng dụng để phân tích, xử lý số liệu thống kê như SPSS, SATISTICA, EVIEWS, MINITAB…Tuy nhiên, Minitab là một phần mềm máy tính có thể giải các bài toán kiể
Trang 1TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC -
VŨ QUỲNH PHƯƠNG
ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ
GIẢI BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
CHUYÊN NGÀNH TOÁN - TIN HỌC ỨNG DỤNG
Vinh, năm 2012
Trang 2TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC -
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ
GIẢI BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Người hướng dẫn : ThS Nguyễn Thị Thanh Hiền Người thực hiện : Vũ Quỳnh Phương
Lớp : 49B - Toán - Tin học ứng dụng
Năm 2012
Trang 3MỤC LỤC
MỞ ĐẦU 1
Chương 1 BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ 3
1.1 Các khái niệm 3
1.2 Quy trình tổng quát trong kiểm định giả thiết 6
1.3 Bài toán kiểm định giả thiết 8
Chương 2 PHẦN MỀM MINITAB 16
2.1 Cài đặt phần mềm Minitab 16
2.2 Khởi động phần mềm Minitab 17
2.3 Bảng tính Minitab 21
2.4 Nhập dữ liệu vào bảng tính Minitab 26
2.5 Các đại lượng thống kê cơ bản trong Minitab 27
Chương 3 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ TRÊN MINITAB 28
3.1 Kiểm định giả thiết về giá trị trung bình với phương sai đã biết 28
3.2 Kiểm định giả thiết về giá trị trung bình với phương sai chưa biết 30 3.3 Kiểm định giả thiết về giá trị của xác suất 32
KẾT LUẬN 41
TÀI LIỆU THAM KHẢO 42
Trang 4MỞ ĐẦU
Thống kê ra đời, phát triển từ nhu cầu thực tiễn của xã hội và là một trong những môn khoa học xã hội có lịch sử lâu dài Đó là một quá trình phát triển không ngừng từ đơn giản đến phức tạp, được đúc rút dần thành lý luận khoa học và ngày nay đã trở thành một môn khoa học độc lập
Kể từ khi ra đời, thống kê đóng vai trò ngày càng quan trọng trong đời sống xã hội Thông qua việc phát hiện, phản ánh những quy luật về lượng của các hiện tượng, các con số thống kê giúp cho việc kiểm tra, giám sát, đánh giá các chương trình, kế hoạch và định hướng sự phát triển kinh tế - xã hội trong
tương lai V.L.Lê-nin đã khẳng định rằng “thống kê kinh tế - xã hội là một
trong những công cụ mạnh mẽ nhất để nhận thức xã hội”
Ngày nay, thống kê được coi là một trong những công cụ quản lý vĩ mô quan trọng, có vai trò cung cấp các thông tin trung thực, khách quan, chính xác, đầy đủ, kịp thời, phục vụ trong viêc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách để phát triển kinh tế - xã hội Đồng thời, các con
số thống kê cũng là cơ sở quan trọng nhất để kiểm tra, đánh giá tình hình thực hiện các kế hoạch, chính sách đó
Các hoạt động thống kê đều phải trải qua một quá trình gồm nhiều giai
đoạn kế tiếp nhau, có liên quan chặt chẽ với nhau Kiểm định giả thiết thống
kê là một phương pháp thường dùng nhằm đưa ra những quyết định quan
trọng trong quản lý và điều hành kinh doanh cũng như trong mọi mặt của cuộc sống
Hiện nay có rất nhiều phần mềm ứng dụng để phân tích, xử lý số liệu thống kê như SPSS, SATISTICA, EVIEWS, MINITAB…Tuy nhiên, Minitab
là một phần mềm máy tính có thể giải các bài toán kiểm định giả thiết thống
kê một cách nhanh chóng và tiết kiệm thời gian Phần mềm này đã trở thành
công cụ phân tích và trình bày dữ liệu rất hữu hiệu Minitab là một chương
trình toàn diện và khá dễ sử dụng Với chương trình này có thể giải những bài
Trang 5toán từ đơn giản nhất chỉ yêu cầu các tham số thống kê, tới các bài toán phức tạp hơn như việc xác định ảnh hưởng của các yếu tố khác nhau đến các tính trạng bằng các phương pháp phân tích hồi qui, phương sai Ngoài ra cũng có thể xây dựng cho các thí nghiệm hữu hiệu Minitab cũng cho chúng ta hàng loại cách vẽ đồ thị mang tính phân tích khoa học Để hiểu rõ hơn về phương pháp cũng như cách thức giải một bài toán kiểm định giả thiết thống kê trên
Minitab, tôi lựa chọn đề tài luận văn Ứng dụng phần mềm Minitab để giải
bài toán kiểm định giả thiết thống kê
Nội dung khoá luận được trình bày thành ba chương:
Chương 1 Trình bày bài toán kiểm định giả thiết thống kê
Chương 2 Trình bày về phần mềm Minitab
Chương 3 Trình bày cách giải bài toán kiểm định giả thiết thống kê trên Minitab
Khoá luận này được thực hiện và hoàn thành tại Khoa Toán – Trường Đại Học Vinh và được viết dựa trên những tài liệu cơ sở của Lý thuyết thống
kê, những website về phần mềm Minitab trên Internet, dưới sự hướng dẫn của
cô giáo ThS Nguyễn Thị Thanh Hiền.Tác giả bày tỏ lời cảm ơn sâu sắc đến
cô đã giành nhiều thời gian và sự quan tâm nhiệt tình hướng dẫn giúp đỡ tác giả trong quá trình học tập và nghiên cứu
Nhân dịp này tác giả cũng xin được cảm ơn các thầy cô giáo trong khoa Toán đã tạo điều kiện giúp đỡ tác giả hoàn thành khoá luận này
Mặc dù đã có nhiều cố gắng nhưng vì năng lực và thời gian còn nhiều hạn chế nên khoá luận không thể tránh khỏi những thiếu sót về cả nội dung và hình thức Vì vậy, tác giả rất mong nhận được sự chỉ bảo và lời nhận xét của quý thầy cô cùng bạn đọc để hoàn chỉnh để sản phẩm này có ứng dụng trong thực tiễn
Vinh, tháng 04 năm 2012 Tác giả
Trang 6Chương 1 BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
1.1 Các khái niệm
1.1.1 Giả thiết thống kê
Khi nghiên cứu lĩnh vực nào đó trong thực tế ta thường đưa ra các nhận xét khác nhau về đối tượng quan tâm Những nhận xét như vậy thường được coi là các giả thiết, chúng cũng có thể đúng và cũng có thể sai.Việc định nghĩa tính đúng sai của một giả thiết được gọi là kiểm định
Sự đúng hay sai của một giả thiết thống kê không thể biết một cách chắc chắn, trừ khi ta khảo sát được toàn bộ tập hợp Điều này là không khả thi trong đa số các trường hợp Thay vào đó ta ta lấy một mẫu ngẫu nhiên từ tập hợp đang nghiên cứu và sử dụng dữ liệu có trong mẫu để đưa ra bằng chứng
mà qua đó ta chấp nhận hay không chấp nhận giả thiết Bằng chứng từ mẫu và mẫu thuẫn với giả thiết sẽ đưa đến việc bác bỏ giả thiết, ngược lại bằng chứng phù hợp với giả thiết sẽ đưa lại việc chấp nhận nó
Thủ tục mà qua những thông tin về mẫu ta có thể đưa ra những bằng
chứng để chấp nhận hoặc bác bỏ giả thiết thống kê được gọi là kiểm định giả
thiết ( hay là kiểm định thống kê, test thống kê )
Nội dung của bài toán kiểm định giả thiết thống kê đó là căn cứ trên số liệu thu được, hãy cho một kết luận về một giả thiết thống kê nào đó mà ta đang quan tâm
Một giả thiết thống kê là một giả thiết về phân bố của tập hợp chính đang xét
Nếu phân bố đó được đặc trưng bởi các tham số ( như giá trị trung bình, phương sai, …) thì giả thiết thống kê là giả thiết về tham số của phân bố
đó Giả thiết được đưa ra kiểm nghiệm được kí hiệu là H0 và được gọi là “giả
thiết không” Đó là giả thiết ta nghi ngờ và muốn bác bỏ Ngoài giả thiết H0
ra, ta còn phải định rõ một giả thiết cạnh tranh với H0 ( còn gọi là đối thiết )
Đối thiết được kí hiệu là H1 H1 sẽ được chấp nhận khi H0 bị bác bỏ
Trang 7Giả sử cần nghiên cứu tham số θ của đại lượng ngẫu nhiên X người ta đưa ra giả thiết cần kiểm định: H0: µ = µ0
Gọi H1 là đối thiết của H0 thì: H1: µ ≠ µ0
Từ mẫu ngẫu nhiên WX= (X1, X2,….,Xn) ta chọn thống kê θ = θ (x1,
x2,…,xn) sao cho nếu H0 đúng thì θ có phân phối hoàn toàn xác định và với
mẫu cụ thể thì giá trị của θ sẽ tính được θ được gọi là tiêu chuẩn kiểm định
giả thiết H
1.1.2 Kiểm định 1 phía
Nếu xảy ra một trong các trường hợp sau:
- Giả thiết H0 đưa ra kiểm định có dạng : µ = µ0 còn đối thiết H1 có dạng µ < µ0 (hoặc µ > µ0)
- Giả thiết H0 đưa ra kiểm định có dạng : µ ≤ µ0 hoặc (µ ≥ µ0) còn đối thiết H1 tương ứng có dạng µ > µ0 ( hoặc µ < µ0)
1.1.3 Kiểm định 2 phía
Nếu giả thiết H0 đưa ra kiểm định có dạng : µ = µ0 còn đối thiết H1 có dạng µ ≠ µ0
1.1.4 Miền bác bỏ, miền chấp nhận
- Sau khi đã chọn tiêu chuẩn kiểm định, với α bé cho trước, thông thường α
0.01; 0.05 và với điều kiện H0 là đúng ta có thể tìm được miền Wα sao cho α nhận giá trị trong miền Wα với xác suất bằng α, tức là P(θ Wα) = α Khi đó Wαđược gọi là miền bác bỏ giả thiết H0, α được gọi là mức ý nghĩa của kiểm
định( hay cỡ của miền bác bỏ)
- Miền còn lại được gọi là miền chấp nhận của giả thiết H0
- Miền nằm giữa miền chấp nhận và miền bác bỏ được gọi là giá trị tới hạn
Trang 8- Nếu θ0 Wα thì chấp nhận giả thiết H0
Như vậy, chúng ta quyết định bác bỏ giả thiết H0 nếu xác suất xuất hiện của một sự kiện quan sát được, tính trong điều kiện giả thiết H0 đúng, là
“nhỏ”
1.1.6 Tiêu chuẩn kiểm định giả thiết thống kê
Giả sử ta cần nghiên cứu tham số θ của BNN X, người ta cần đưa ra
giả thiết cần kiểm định H0: θ = θ0 Từ BNN gốc của tổng thể, lập mẫu ngẫu
nhiên cỡ n :
Wx = { X1, X2,…,Xn } ta chọn thống kê wx=( x1,x2,…,xn) Nếu H0 đúng thì thống kê wx sẽ có phân phối hoàn toàn xác định Khi đó thống kê wx được
gọi là tiêu chuẩn kiểm định giả thiết H0
1.1.7 Quy tắc kiểm định
Chúng ta bác bỏ hay chấp nhận một giả thiết dựa trên nguyên lí 2 sau đây:
- Nguyên lý xác suất nhỏ: “ Nếu một biến cố có xác suất rất nhỏ thì
trong một phép thử hay một vài phép thử , biến cố đó sẽ không xảy ra”
- Phương pháp phản chứng: “Để bác bỏ giả thiết A ta giả sử rằng giả
thiết A là đúng và sau đó dẫn tới điều vô lý”
1.1.8 Sai lầm loại 1 và sai lầm loại 2
Trong khi đưa ra quyết định trong các tình huống, phải đứng trước lựa chọn giữa hai giả thiết H0 và H1, ta có thể phạm hai loại sai lầm:
- Sai lầm loại 1: là sai lầm mắc phải khi ta bác bỏ giả thiết H0 trong khi
H0 là đúng
- Sai lầm loại 2: Chấp nhận H0 trong khi thực ra H0 là sai
Có 4 khả năng có thể xảy ra thể hiện trong bảng dưới đây:
Kết luận
Thực tế
Chấp nhận H 0 Chấp nhận H 1
H0 đúng Kết luận đúng Sai lầm loại 1
H0 sai Sai lầm loại 2 Kết luận đúng
Trang 9Sai lầm loại 1 tương tự như sai lầm của quan tòa khi kết án nhầm người
vô tội, còn sai lầm loại 2 thì tương tự như sai lầm khi “tha bổng kẻ có tội”
Một kiểm định thống kê lý tưởng là kiểm định làm cực tiểu cả sai lầm loại 1 và sai lầm loại 2 Tiếc rằng không tồn tại kiểm định lý tưởng như vậy Nếu chúng ta làm giảm sai lầm loại 1 thì sẽ làm tăng sai lầm loại 2 và ngược lại
Trong một xã hội văn minh, người ta có xu hướng thừa nhận rằng việc kết án nhầm người vô tội là sai lầm nghiêm trọng hơn nhiều so với sai lầm tha bổng kẻ có tội Trong bài toán kiểm định giả thiết cũng vậy, ta coi sai lầm loại
1 là sai lầm nghiêm trọng hơn sai lầm loại 2 Do vậy người ta cố định trước
xác suất mắc sai lầm loại 1 Xác suất mắc sai lầm loại 1 là mức ý nghĩa , được
kí hiệu là α Xác suất sai lầm loại 2 được kí hiệu là β Con số 1-β được gọi là
lực lượng của kiểm định Lực lượng kiểm định là xác suất bác bỏ H0 khi H0
sai Thông thường α được lấy là 5%, 2% hoặc 1% Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa α, ( tức là có xác suất mắc sai lầm loại 1 như nhau), kiểm định mức nào có xác suất mắc sai lầm loại 2 nhỏ nhất sẽ được xem là “ tốt nhất” Vì vậy, sau khi chọn mức ý nghĩa của kiểm định ,việc tiếp theo là lựa chọn dạng phân phối thích hợp Tùy thuộc vào giả thiết thống kê cần kiểm định mà người ta có thể sử dụng một số quy luật phân phối thông dụng như : Quy luật phân phối chuẩn, phân phối T-Student, phân phối
χ2
, phân phối Fisher…
Tuy nhiên, cần phải lưu ý rằng khi kiểm định thống kê dẫn tới việc chấp nhận H0 thì xác suất mắc sai lầm loại 2 là bao nhiêu ta không biết (thường là khó biết) và có thể là lớn Do vậy, việc chấp nhận H0 là một quyết định dè dặt: Khi chấp nhận H0 ta không nên hiểu rằng H0 đúng mà chỉ nên hiểu rằng các chứng cứ và số liệu đã có chưa đủ cơ sở để bác bỏ H0 cần phải nghiên cứu tiếp
1.2 Quy trình tổng quát trong kiểm định giả thiết
Bước 1 Xây dựng giả thiết
Ta bắt đầu kiểm định giả thiết với một giả định về một vài tham số tổng thể và sử dụng dữ liệu mẫu để kiểm tra tính logic của giả định đó Nói cách
Trang 10định bác bỏ hay không bác bỏ giả định đó theo các số liệu mẫu Việc thiết lập giả thiết tuỳ thuộc vào bản chất của tình huống có định hướng hay không định hướng Nếu tình huống không có định hướng khác biệt, thì giả thiết là 2 phía, nếu có tính định hướng thì ta có giả thiết 1 phía Để xác định 1 phái trái hay 1 phía phải ta dựa vào nguyên tắc tránh sai lầm loại Tuy nhiên, sự thất bại trong việc loại H0 không đồng nghĩa với việc chứng minh được H0 là đúng,
mà chỉ là không đủ bằng chứng thống kê để loại bỏ mà thôi.Ở bước này chúng ta phát biểu giả thiết H0 và đối thiết H1
Bước 2 Chọn mức ý nghĩa mong muốn
Khả năng phạm sai lầm loại 1 được gọi là mức ý nghĩa và kí hiệu là α
Ở bước này xác định rõ mức ý nghĩa α (xác suất sai lầm loại 1) Trên thực tế
có 3 mức ý nghĩa thường dùng nhất là 0,1, 0,05 và 0,01 tương ứng với độ tin cậy là 90%, 95% và 99% Việc lựa chọn mức α bằng bao nhiêu phụ thuộc vào tính chủ quan của người nghiên cứu chấp nhận rủi ro ở mức nào
- Nếu nội dung nghiên cứu đòi hỏi độ chính xác cao thì nên chọn mức α nhỏ, thông thường là 1% (hay α = 0,01)
- Nếu nội dung nghiên cứu có biến động lớn, thu thập thông tin khó chính xác thì nên chọn mức α lớn, tuy nhiên không nên tăng mức ý nghĩa α quá lớn vì như thế sẽ bị tăng sai lầm loại 2 Thông thường theo sự thống nhất chung của các nhà thống kê mức ý nghĩa tối đa là 10%
- Nếu không quan tâm quá nhiều đến mức ý nghĩa thì chọn mức thống
kê thông thường là 5%
Bước 3 Tính trị số thống kê hay giá trị thực tế của kiểm định
Chọn Test thống kê dựa vào các lý thuyết thống kê mà lựa chọn công
thức phù hợp để qui phân phối mẫu về phân phối nào đó Giá trị thực tế của kiểm định là cơ sở để quyết định chấp nhận hay bác bỏ giả thiết
Bước 4 Chọn miền bác bỏ giả thiết H 0
Tương ứng với mức ý nghĩa α và giá trị test thống kê tìm ra giá trị lý thuyết của kiểm định So sánh giá trị thực tế và giá trị lý thuyết của kiểm định
để đưa ra kết luận hợp lí
Trang 11Bước 5 Kết luận
Bác bỏ H0 hay chấp nhận H0 tùy theo giá trị của test thống kê có rơi
vào miền bác bỏ giả thiết hay không
1.3 Bài toán kiểm định giả thiết
1.3.1 Kiểm định giả thiết về giá trị trung bình
Giả sử X là ĐLNN có phân phối chuẩn X~ N (µ, σ2) Tập hợp chính ở đây là tập hợp tất cả các giá trị có thể có của X Một mẫu kích thước n là một tập hợp gồm n giá trị x1, x2, , xn thu được từ n quan sát độc lập về X Ta
muốn kiểm định giả thiết về µ
1.3.1.1 Phương sai σ 2 đã biết
Bài toán 1 Ta muốn kiểm định cặp giả thiết :
H0: µ = µ0
Với đối thiết:
H1: µ ≠ µ0Trong đó µ0 là giá trị cho trước
Test thống kê được chọn là:
P { |T| >c } = α P { |T| ≤ c } = 1-α Nếu gọi là hàm phân bố của ĐLNN chuẩn tắc N(0,1) thì
P{|T|< c } = Ф (c) –Ф (-c) = 2Ф(c) – 1 = 1 – α
( ) 1
2
Trang 12Như vậy c tìm được bằng cách tra ngược bảng hàm Ф Nói cách khác c
0
1 ( )
2
x t
H1: µ > µ0
Ta nói đây là bài toán kiểm định một phía
Test thống kê được chọn là 2 :
P { T > c } = α Ф (c) = 1-α
Nói cách khác, c là phân vị mức α của phân bố chuẩn tắc Nếu ta dùng hàm Laplace Ф0 thì hằng số c sẽ được tìm từ điều kiện :
0
1
c 2
Trang 131.3.1.2 Phương sai σ 2 chưa biết và mẫu lớn (n ≥ 30)
Trong trường hợp này ta vẫn dùng test thống kê như trên Trong đó độ lệch tiêu chuẩn σ được thay bằng độ lệch tiêu chuẩn mẫu.Vì theo định lý giới hạn trung tâm test thống kê T có phân bố xấp xỉ chuẩn cho dù tập hợp chính
có phân bố như thế nào, không nhất thiết là phân bố chuẩn
1.3.1.3 Phương sai σ 2 chưa biết, mẫu nhỏ (n<30)
Bài toán: Ta muốn kiểm định giả thiết:
Trong đó c là hằng số phụ thuộc vào mức ý nghĩa α
Người ta chứng minh được rằng nếu H0 đúng thì T sẽ có phân bố
student với n-1 bậc tự do Vậy hằng số c được tìm từ điều kiện :
P { |T| > c } = α P{ T > c } + P { T < -c } = α
Vì phân bố student là đối xứng nếu
Trang 14Sau khi tìm được c nếu |T| > c ta bác bỏ H0 Trong trường hợp ngược lại ta chấp nhận H0
1.3.2 Kiểm định giả thiết về giá trị của xác suất
Bài toán Xét một phép thử ngẫu nhiên G và một biến cố A liên kết với
G Xác suất xuất hiện của A khi phép thử được thực hiện là p (p chưa biết)
Ta muốn kiểm định giả thiết p = p 0 trong đó p 0 là một số đã cho trước
Giả thiết
H0: p = p0
Với đối thiết hai phía
H 1 : p ≠ p0
Ta tiến hành phép thử G n lần một cách độc lập và ta quan sát thấy biến
cố A xuất hiện k lần Tần suất xuất hiện của A là:
k f n
Khi đó T sẽ có phân bố chuẩn tắc
N(0,1) Vậy hằng số c được tìm từ điều kiện:
Trang 15Trong đó Ф là hàm phân bố của ĐLNN chuẩn tắc hay c là phân vị mức
Các số liệu mẫu cho ta giá trị của n, X x0 và s Ta muốn kiểm định số
liệu đã cho có cho phép bác bỏ H0 hay không?
Giả sử H0 là đúng Ta sẽ tính xác suất để trung bình mẫu bé hơn hay bằng giá trị quan sát được x0 là bao nhiêu Nếu xác suất này “nhỏ” theo một nghĩa nào đó ta sẽ bác bỏ H0 theo nguyên lí xác suất nhỏ, biến cố đó rất ít xảy
ra trong một phép thử Nếu xác suất đó khá “lớn” thì ta không có cơ sở để bác bỏ H0
Giá trị của xác suất này P = { (X ) ≤ x0 } gọi là p – giá trị kết hợp với
số liệu mẫu quan sát được
Tương tự với bài toán kiểm định một phía phải
Đối với bài toán kiểm định hai phía
H0: µ = µ0 Với đối thiết:
H1: µ ≠ µ0
Thì p – giá trị trong trường hợp này là p = 2P {X ≤ x0 }
P – giá trị được các nhà thống kê sử dụng theo hai cách
Một là:
- Nếu P > 0,05, ta không có đủ cơ sở để bác bỏ H0
- Nếu 0,01 < P < 0,05, ta có đủ cơ sở để bác bỏ H0
- Nếu P < 0,01, ta có một cơ sở rất mạnh, hùng hồn để bác bỏ H0
Trang 16Một cách thứ hai là sử dụng P – giá trị kết hợp với mức ý nghĩa α đã cho Ta tính P – giá trị và so sánh nó với α :
- Nếu P ≤ α , ta bác bỏ H0
- Nếu P > α , ta chưa có cơ sở bác bỏ H0 Nói cách khác, P – giá trị chính là mức ý nghĩa thấp nhất mà ta có thể bác bỏ H0
1.3.4 Kiểm định giá trị giả thiết về giá trị của nhiều xác suất
Xét một phép thử ngẫu nhiên G và một hệ đầy đủ các biến cố
B1,B2,…,B k liên kết với G Có ngĩa là với mỗi kết quả của G, dù là kết quả gì
đi chăng nữa, luôn luôn có một và chỉ một biến cố trong các biến cố
B 1, B 2 ,…,B k xảy ra Giả sử rằng ta quan tâm tới các xác suất của biến cố B i
Khi đó giả thiết cần kiểm định là:
H0: P(B1) = p1; P(B2) = p2; …
Các số nˆ np i,i 1,n được gọi là các tần số lý thuyết Nếu giả thiết H0
đúng theo luật số lớn n i và ni xấp xỉ như nhau
Trang 17Người ta đã chứng minh được rằng nếu giả thiết H0 đúng và nếu các tần
số lý thuyết n i≥ 5 thì T sẽ có phân bố xấp xỉ phân bố 2 với ( n-1) bậc tự do
là phân vị mức α của phân bố 2
1.3.5 Khoảng tin cậy và kiểm định giả thiết về phương sai
Giả sử X là ĐLNN có phân bố chuẩn 2~ N (µ, σ2
) Tập hợp chính ở đây
là tập hợp tất cả các giá trị có thể có của X Xét một mẫu ngẫu nhiên có kích thước n Phương sai mẫu s 2
là một ước lượng không chệch cho phương sai σ2
của tập hợp chính Việc tìm khoảng tin cậy cho σ2 được dựa trên định lý:
Định lí Nếu tập hợp chính có phân bố chuẩn thì ĐLNN
2 2 0
sẽ có phân bố 2với (n-1) bậc tự do
Để kiểm định giả thiết về phương sai ta xét bài toán:
(n 1)s T
Một cách hợp lí ta sẽ bác bỏ H0 nếu T lớn một cách có ý nghĩa Miền bác
bỏ H0 có dạng {T > c} với c là hằng số được chọn từ điều kiện P{T> c} =α
Trang 18Vì T có phân bố 2 với (n-1) bậc tự do nên ta suy ra 2
(n 1)s T
Ta sẽ chọn H0 khi T nhỏ một cách có ý nghĩa Miền bác bỏ H0 có dạng
{ T < c }, với c là hằng số được chọn từ điều kiện :
(n 1)s T
Trang 19Chương 2 PHẦN MỀM MINITAB 2.1 Cài đặt phần mềm Minitab
Bước 1: Lắp đĩa nguồn cài đặt Minitab gốc vào ổ CD- ROM hoặc ổ DVD Bước 2: Nhấp đúp chuột vào file mtben1610su.exe
Xuất hiện hộp thoại
Hình 2.1: Cửa sổ setup
Nhấn Next cho đến khi xuất hiện hộp thoại yêu cầu nhập CD-Key
Trang 20
Nhập CD-Key vào rồi ấn Next cho đến khi xuất hiện hộp thoại Finish
là quá trình cài đặt hoàn thành
2.2 Khởi động phần mềm Minitab
Có nhiều cách để khởi động Minitab for Windows:
Cách 1: Nhấp đúp chuột vào biểu tượng Minitabtrên màn hình Desktop
Cách 2: Vào Start\All Program\Minitab\Minitab 16 Statistical Software
Giao diện Minitab cho phép gõ các câu lệnh trong cửa sổ thao tác
(Session Window ) và thực thi chương trình bằng cách chọn lệnh từ Menu và
điền đầy đủ yêu cầu vào các hộp hội thoại Các câu lệnh và kết quả sẽ được
thể hiện ở cửa sổ thao tác Ngoài ra, có thể sao chép (copy), sửa chữa (edit)
và thực hiện các lệnh trước
Màn hình chính của Minitab thể hiện trên hình 2.3 bao gồm các phần: Menu Bar, Standard Toolbar, Title, Session Window, Data Window, Status Bar
Menu Bar Standard Toolbar Title Session Window
Data Window Status Bar
Hình 2.3: Màn hình chính của Minitab for Windows
Trang 212.2.1.Menu bar: Giúp mở các menu và chọn các câu lệnh
Trong đó:
- Menu Edit: Cũng giống hầu hết các ứng dụng khác trên windows gồm các chức năng như sao chép (copy), dán (paste), xóa (delete), chọn lựa (select)…
- Menu Editor : Chứa các chức năng chuyển dịch và định dạng bảng
tính đặc thù của Minitab
- Menu Stat: Cung cấp một số công cụ để phân tích thống kê
- Menu Graph : Cung cấp các công cụ để hỗ trợ vẽ các loại đồ thị khác
nhau
Hình 2.4: Menu và Sub Menu
2.2.2.Dialog Box: Trong một số trường hợp các lệnh của Minitab, hộp
hội thoại sẽ hiện ra để lựa chọn chức năng cần thực hiện Một hộp thoại thông thường có những chức năng để người dùng lựa chọn cho những lệnh kế tiếp, giải thích biến hoặc gán các lựa chọn khác trong từng nút lệnh
Trang 22Hộp lựa chọn Hộp kí tự Nút lệnh
Hình 2.5: DialogBox của Minitab
2.2.3 Project Manager: Đây là thanh công cụ giúp tổ chức và quản lý công việc tốt hơn Project Manager bao gồm các danh mục: Session, History, Chart, Reportpad, Related Document, Worksheet
Hình 2.6: Project Manager Toolbar
- Session: Dùng danh mục này để sao chép, xóa hoặc in kết quả và các
đồ thị từ Session Windows Ngoài ra có thể bổ sung nội dung của Session Windows vào ReportPad