TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC --- NGÔ THỊ NGỌC DIỆP ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ GIẢI BÀI TOÁN ƯỚC LƯỢNG THAM SỐ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHUYÊN NGÀNH TOÁN - TIN HỌC ỨNG DỤNG
Trang 1TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC
-
NGÔ THỊ NGỌC DIỆP ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ GIẢI BÀI TOÁN ƯỚC LƯỢNG THAM SỐ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC CHUYÊN NGÀNH TOÁN - TIN HỌC ỨNG DỤNG
Vinh, năm 2012
Trang 2TRƯỜNG ĐẠI HỌC VINH KHOA TOÁN HỌC
-
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ GIẢI BÀI TOÁN ƯỚC LƯỢNG THAM SỐ
Người hướng dẫn : ThS Nguyễn Thị Thanh Hiền Người thực hiện : Ngô Thị Ngọc Diệp
Lớp : 49B - Toán - Tin học ứng dụng
Năm 2012
Trang 3MỤC LỤC
MỞ ĐẦU 1
Chương 1 BÀI TOÁN ƯỚC LƯỢNG THAM SỐ 3
1.1 Lý thuyết mẫu 3
1.1.1 Một vài khái niệm cơ bản 3
1.1.2 Mẫu ngẫu nhiên 3
1.1.4 Bảng phân bố tần số, tần suất 4
1.1.5 Các đặc trưng của một mẫu 5
1.1.6 Cách tính X , s 72 1.2 Bài toán ước lượng tham số 8
1.2.1 Ước lượng điểm cho kì vọng, phương sai và xác suất 9
1.2.2 Ước lượng khoảng 10
Chương 2 ỨNG DỤNG PHẦN MỀM MINITAB ĐỂ GIẢI BÀI TOÁN ƯỚC LƯỢNG THAM SỐ 18
2.1 Phần mềm thống kê Minitab 18
2.1.1 Cài đặt 18
2.1.2 Sử dụng Minitab 19
2.2 Ứng dụng phần mềm Minitab 28
2.2.1 Tìm khoảng ước lượng của kì vọng 28
2.2.2 Tìm khoảng ước lượng của tỉ lệ 36
KẾT LUẬN 41
TÀI LIỆU THAM KHẢO 42
Trang 4MỞ ĐẦU
Cuộc sống quanh ta luôn tràn ngập các thông tin dưới dạng số liệu Khoa học thống kê là môn khoa học nhằm nghiên cứu các phương pháp thu thập, tổ chức và phân tích dữ liệu một cách khách quan, đáng tin cậy, để từ đó phát hiện ra các tri thức, thông tin ẩn náu trong đó Thống kê đã biến những con số khô khan, câm lặng thành những con số biết nói
Hiện nay thống kê đã được ứng dụng rộng rãi trong hầu hết các hoạt động của con người, từ khoa học tự nhiên, kinh tế, nông nghiệp, y học cho tới khoa học xã hội và nhân văn
Ước lượng tham số là một trong những bài toán cơ bản của thống kê toán học Bài toán ước lượng tham số giúp ta đưa ra các đánh giá cũng như các dự đoán về sự biến động của tổng thể nghiên cứu
Tuy nhiên, trong thực tế việc phân tích, tính toán này lại khá phức tạp, gây không ít khó khăn cho những người quan tâm Để giải quyết vấn đề này,
ta có thể sử dụng các phần mềm thống kê như SPSS, SAS, Eviews, Minitab Minitab là một phần mềm máy tính giúp hiểu biết thêm về thống kê và tiết kiệm thời gian tính toán Cấu trúc của Minitab khá đơn giản và dễ sử dụng Để hiểu biết rõ hơn về phương pháp cũng như cách thức giải một bài toán ước
lượng trong Minitab, tôi lựa chọn đề tài khóa luận Ứng dụng phần mềm Minitab để giải bài toán ước lượng tham số
Nội dung của khóa luận được trình bày thành hai chương
Chương 1 trình bày bài toán ước lượng tham số
Chương 2 trình bày việc giải bài toán ước lượng tham số trên phần mềm Minitab
Khóa luận này được thực hiện và hoàn thành tại Khoa Toán – Trường Đại học Vinh và được viết dựa trên những tài liệu cơ sở của Thống kê, những website về phần mềm Minitab trên internet, dưới sự hướng dẫn của cô giáo Ths Nguyễn Thị Thanh Hiền Tác giả xin bày tỏ lời cảm ơn sâu sắc tới cô đã
Trang 5giúp đỡ tác giả hoàn thành khóa luận này Nhân dịp này tác giả cũng xin được cảm ơn các thầy cô giáo trong Khoa Toán đã tạo điều kiện giúp đỡ tác giả trong quá trình học tập và nghiên cứu
Mặc dù đã có nhiều cố gắng nhưng vì năng lực và thời gian hạn chế nên khóa luận không thể tránh khỏi những thiếu sót cả về nội dung và hình thức
Vì vậy tác giả rất mong nhận được sự phê bình, góp ý của quý thầy cô và bạn đọc để sản phẩm này được hoàn thiện hơn và có ứng dụng trong thực tiễn
Vinh, tháng 04 năm 2012
Tác giả
Trang 6Chương 1 BÀI TOÁN ƯỚC LƯỢNG THAM SỐ
1.1 Lý thuyết mẫu
1.1.1 Một vài khái niệm cơ bản
a Tổng thể là tập hợp tất cả các đối tượng có chung một tính chất nào đó
mà chúng ta đang quan tâm
Ví dụ: Điều tra kết quả học tập của sinh viên Trường Đại học Vinh Tập
hợp toàn bộ các sinh viên của Trường Đại học Vinh được gọi là một tổng thể
b Mỗi phần tử của tổng thể được gọi là một cá thể
Ví dụ: Mỗi sinh viên được điều tra được gọi là một cá thể của tổng thể
c Việc chọn ra từ tập hợp chính một tập hợp con nào đó gọi là phép lấy
mẫu Tập hợp con này được gọi là một mẫu
Ví dụ: Vì số sinh viên của trường Đại học Vinh là lớn nên ta không thể
điều tra hết được mà chỉ chọn ra một tập hợp con (chẳng hạn 500 sinh viên) để điều tra Tập hợp con được chọn ra đó được gọi là một mẫu
1.1.2 Mẫu ngẫu nhiên
Tiến hành n quan sát độc lập về biến ngẫu nhiên X nào đó Gọi i là việc
quan sát lần thứ i về biến ngẫu nhiên X Khi đó ( X X1, 2, ,X n) được gọi là
mẫu ngẫu nhiên, n được gọi là cỡ mẫu
Gọi x i là kết quả quan sát được ở lần thứ i Khi đó ( ,x x1 2, ,x n) được gọi
là một giá trị cụ thể mà mẫu ngẫu nhiên ( X X1, 2, ,X ) nhận n
1.1.3 Các phương pháp lấy mẫu đơn giản
Thông tin mà chúng ta dựa vào để nghiên cứu, phân tích chính là các kết quả quan sát được, vì vậy các kết quả này phải đảm bảo tính chính xác, tính ngẫu nhiên, phải là các đại diện một cách trung thực cho hiện tượng hoặc cho đại lượng mà chúng ta đang nghiên cứu Do vậy, trước tiên ta quan tâm đến việc thu thập thông tin ban đầu
Trang 7Các phép thử độc lập: Các phép thử được tiến hành một cách độc lập với
nhau, kết quả của phép thử này không phụ thuộc vào kết quả của phép thử khác
và cũng không ảnh hưởng đến khả năng xảy ra kết quả của phép thử khác
Các phép thử lặp: Các phép thử được tiến hành trong các điều kiện hoàn
toàn như nhau
Lấy mẫu ngẫu nhiên có hoàn lại: Rút ngẫu nhiên từ một từ một tập nào
đó ra một phần tử Ghi lại các số đặc trưng cần thiết từ phần tử đó, sau đó trả
nó trở lại tập ban đầu trước khi rút tiếp ngẫu nhiên lần sau
Lấy mẫu ngẫu nhiên không hoàn lại: Tương tự như trên chỉ khác ở chỗ
các phần tử được rút ra sẽ không được trả lại tập ban đầu
1.1.4 Bảng phân bố tần số, tần suất
a Bảng phân bố tần số
Giả sử trong một mẫu kích thước n các giá trị của đại lượng ngẫu nhiên X
có k giá trị khác nhau x1 x2 x k Giả sử giá trị x có số lần lặp lại là i n i
Khi đó ta gọi n là tần số của i x i
Bảng sau được gọi là bảng phân bố tần số:
n f n
f
Trang 8Ví dụ Bảng phân bố thực nghiệm của biến ngẫu nhiên X (là số điểm môn
Toán trong kì thi học kì vừa qua) của 200 học sinh:
1.1.5 Các đặc trưng của một mẫu
Để có thể cô đọng và nhanh chóng nắm bắt được những thông tin quan trọng chứa đựng trong mẫu, ta đưa ra một vài chỉ số gọi là các số đặc trưng (hay giá trị đặc trưng) của mẫu
Có hai nhóm lớn các số đặc trưng:
i) Các số đặc trưng cho chúng ta một hình ảnh về vị trí trung tâm của mẫu, tức là về xu thế các số liệu trong mẫu tụ tập xung quanh những con số
nào đó, bao gồm: Kì vọng mẫu, trung vị và mode
ii) Các số đặc trưng cho chúng ta một hình ảnh về mức độ phân tán của
các số liệu, độ biến động của các số liệu, bao gồm: Biên độ, độ lệch trung
bình, độ lệch tiêu chuẩn và phương sai
Cho mẫu quan sát
(X X1, 2, ,X ) n
Trang 9vọng mẫu là một biến ngẫu nhiên Do đó:
1
n i i
b Phương sai mẫu
Phương sai của mẫu số liệu, kí hiệu 2
s , được định nghĩa bởi công thức :
1
1( - )
n i i
Trang 10s s được gọi là độ lệch tiêu chuẩn
c Phương sai mẫu hiệu chỉnh
Phương sai mẫu hiệu chỉnh, kí hiệu bởi ˆs , được tính theo công thức : 2
Trang 11c Trong trường hợp đại lượng ngẫu nhiên X là đại lượng ngẫu nhiên liên
tục hoặc số các giá trị của nó rất lớn thì người ta thường chia khoảng các giá
trị của X và ta có cặp công thức sau:
0 0
i i
x x u
1.2 Bài toán ước lượng tham số
Xét một tổng thể bất kì và giả sử ta quan tâm tới đại lượng ngẫu nhiên X
đo lường một dấu hiệu nào đó của cá thể trong tổng thể Phân phối xác suất
của X thường rất khó nắm bắt, và thông thường ta giới hạn ở việc xác định một số các tham số đặc trưng của X như giá trị trung bình (kì vọng), phương
sai, trung vị, Các tham số này không thể xác định chính xác được (nếu
không biết phân phối của X), mà phải ước lượng từ các giá trị của X trên một mẫu chọn ngẫu nhiên Như vậy bài toán ước lượng tham số được phát biểu
như sau:
Giả sử X là một đại lượng ngẫu nhiên có tham số đặc trưng nào đó
(chưa biết) mà ta đang quan tâm Vấn đề đặt ra là: Căn cứ trên n giá trị
1, 2, ., n
X X X của X đo được trên một mẫu kích thước n lấy ra từ tổng thể,
cần tìm một giá trị gần đúng * của
Trang 121.2.1 Ước lượng điểm cho kì vọng, phương sai và xác suất
1.2.1.1 Ước lượng điểm
Giả sử là tham số cần ước lượng Trong tay chúng ta chỉ có một mẫu ngẫu nhiên (X1, X2, ., X n) Vì vậy để ước lượng cho không thể không dựa vào mẫu ngẫu nhiên
Ta sẽ dùng một hàm nào đó của mẫu để làm ước lượng cho Kí hiệu
nhận một giá trị cụ thể khi mẫu (X1, X2, ., X n)
nhận một giá trị cụ thể ( ,x x1 2, ,x nên n) * gọi là ước lượng điểm
1.2.1.2 Ước lượng không chệch
Trang 131.2.1.3 Ước lượng điểm cho kì vọng
là ước lượng không chệch của kì vọng của biến ngẫu nhiên bất kì Cụ thể là ước lượng không chệch cho tham ẩn của phân phối chuẩn, cho tham ẩn của phân phối Poisson, cho tham ẩn 1
của phân phối mũ
1.2.1.4 Ước lượng điểm cho phương sai
1.2.1.5 Ước lượng điểm cho xác suất
Ước lượng cho xác suất p của biến cố A nào đó ( hay ước lượng cho tỉ lệ
nào đó ) là:
p n
cũng là ước lượng không chệch cho xác suất p
1.2.2 Ước lượng khoảng
Bài toán tìm khoảng tin cậy đặt ra như sau: Căn cứ trên mẫu quan sát
(X X, , ,X n), hãy xác định một khoảng * *
( , ) để khoảng đó chứa tham số
với xác suất cho trước
Định nghĩa Một khoảng với hai đầu mút ngẫu nhiên ( *
gọi là độ chính xác của ước
lượng
Trang 141.2.2.1 Ước lượng khoảng đối với kì vọng của biến ngẫu nhiên
Ví dụ 1: Để ước lượng chiều cao trung bình của thanh niên trong một
vùng A nào đó , tiến hành đo chiều cao của 16 thanh niên và thu được kết quả sau (đơn vị cm):
Trang 15Ví dụ 2: Trọng lượng của một loại sản phẩm là đại lượng ngẫu nhiên tuân
theo luật phân phối chuẩn với 1 gam Người ta cân thử 25 sản phẩm loại này và thu được kết quả sau:
i i i
X N , (X1, X2, ., X n) được rút ra từ X Khi đó ước
lượng khoảng cho kì vọng với độ tin cậy (1) là:
Ví dụ 3 Một trường đại học tiến hành một nghiên cứ xem trung bình một
sinh viên tiêu hết bao nhiêu tiền gọi điện thoại trong một tháng Một mẫu ngẫu nhiên gồm 20 sinh viên được chọn và có kết quả như sau:
14, 18, 22, 30, 36, 28, 42, 79, 36, 52, 15, 47, 95, 16, 27, 111, 37, 63, 127, 23
Trang 16Hãy xây dựng khoảng tin cậy 95% cho số tiền gọi điện thoại trung bình hàng tháng của một sinh viên
Ví dụ 4: Để xác định chiều cao trung bình của loài cây A trong một khu
rừng, do không có điều kiện đo tất cả, người ta tiến hành đo ngẫu nhiên 35 cây
Trang 17X N ), phương sai cũng chưa biết, nhưng nếu n đủ lớn (n > 30) ta có
thể thay phương sai chưa biết 2 bởi ˆs và đưa về áp dụng cho trường hợp 2
phương sai đã biết Khi đó khoảng tin cậy xấp xỉ cho kì vọng với độ tin cậy (1) là:
Trang 181.2.2.2 Ước lượng khoảng đối với phương sai của biến ngẫu nhiên chuẩn
Giả sử đại lượng ngẫu nhiên X tuân theo luật phân phối chuẩn Khi đó
ước lượng khoảng cho phương sai với độ tin cậy (1) là:
n
( bảng IV, phụ lục, xem [1], tr 243)
Ví dụ 5: Trở lại ví dụ 4, hãy chỉ ra ước lượng khoảng của 2 với độ tin cậy 95%
Giải Theo ví dụ 4 ta tính được 2
1.2.2.3 Ước lượng khoảng đối với tỷ lệ hay xác suất
Giả sử trong tổng thể, mỗi cá thể của nó có thể mang hay không mang
một đặc tính A nào đó Gọi p là tỉ lệ cá thể có đặc tính A trong toàn bộ tổng thể (p chưa biết) Những người nghiên cứu muốn ước lượng tham số p này căn cứ
Trang 19trên một mẫu điều tra Giả sử trong một mẫu kích thước n có m cá thể mang đặc tính A
Chúng ta đã thấy tần suất mẫu f m
n
là một ước lượng không chệch và
vững cho p Bài toán đặt ra ở đây là xây dựng khoảng tin cậy cho p
a Nếu n lớn và p không quá gần 0 và 1
Vì n lớn ta có thể xấp xỉ p bởi f, do đó ước lượng khoảng của p với độ tin
Ví dụ 6: Trong một mẫu ngẫu nhiên gồm 200 người dùng xe máy, có 162
người dùng xe 100 phân khối trở lên Tìm khoảng tin cậy với mức tin cậy 95% cho tỉ lệ những người dùng xe trên 100 phân khối
m f
Vì p gần 0 hoặc gần 1 nên ta không thể xấp xỉ phân phối nhị thức của p
bằng phân phối chuẩn mà ta xấp xỉ bằng phân phối Poisson với tham ẩn
np
Trên cơ sở đó ta lập được các giá trị trong bảng V (xem [1], tr 245)
Tương ứng với giá trị m, tra bảng ta tìm được giá trị np và 1 np với độ tin cậy 2
95% Từ đó khoảng tin cậy 95% của xác suất p là ( ,p p 1 2)
Trang 20Ví dụ 7: Kiểm tra ngẫu nhiên 300 người tại một thành phố, người ta thấy
có 6 người mắc bệnh A Hãy chỉ ra ước lượng khoảng cho cho tỷ lệ người mắc bệnh A ở thành phố trên với độ tin cậy 95%
Giải Ta có ước lượng điểm * 6 0,02
c Nếu n bé nhưng p không quá gần 0 hoặc 1
Giả sử 4 10 n , m là số lần xuất hiện biến cố A.Với độ tin cậy 95%
tương ứng với giá trị m đã cho, tra bảng VI (xem [1], tr 246) ta tìm được ước
lượng khoảng là ( ,p p 1 2)
Trang 21Chương 2 ỨNG DỤNG PHẦN MỀM MINITAB
ĐỂ GIẢI BÀI TOÁN ƯỚC LƯỢNG THAM SỐ 2.1 Phần mềm thống kê Minitab
Hình 2.1 Hộp thoại cài đặt Minitab
Nhấn Next cho đến khi xuất hiện hộp thoại yêu cầu nhập CD – Key
Hình 2.2 Hộp thoại yêu cầu nhập CD - Key
Trang 22Nhập CD – Key vào rồi ấn Next cho đến khi xuất hiện hộp thoại Finish
là quá trình cài đặt hoàn thành
2.1.2 Sử dụng Minitab
2.1.2.1 Minitab Windows
Minintab là một phần mềm máy tính giúp hiểu biết thêm về thống kê và tiết kiệm thời gian tính toán
Để vào Minitab, bạn nhấp chuột 2 lần vào biểu tượng Minitab trên
desktop hoặc Start > Program > Minitab > Minitab 16 Statistical Software Màn hình chính của Minitab thể hiện trên hình 1.1 gồm các phần
chính: Menu Bar, Standard Toolbar, Project Manager Toolbar, Session
Windows, Data Windows
Hình 2.3 Màn hình chính của Minitab
Session Windows: giúp tạo chương trình bằng cách gõ các câu lệnh
Thông thường các lệnh và kết quả sẽ được thể hiện trên cửa sổ này khi thực thi
Data Windows: cho phép bạn nhập dữ liệu vào bảng tính bằng cách gõ
hoặc xuất nhập các file dữ liệu từ bên ngoài
Menu Bar Standard Toolbar Project Manager Toolbar
Session Windows
Data Windows
Trang 23Menu Bar: giúp mở các menu và chọn các câu lệnh, nhấp chuột vào các
lệnh trên thanh menu, sau đó nhấp chuột vào các mục phụ thuộc để thực hiện lệnh hoặc mở các hộp hội thoại Khi các chức năng này không sử dụng được các hạng mục sẽ mờ đi
Hình 2.4 Menu và submenu
Menu Edit, Editor, Stat và Graph: hỗ trợ những lựa chọn để xử lí dữ
liệu trong Minitab
Menu Edit: cũng giống như hầu hết các ứng dụng khác trên Windows
menu edit gồm các chức năng như sao chép (Copy), dán (Paste), xóa (Delete)
và lựa chọn (Select)
Menu Editor: chứa các chức năng chuyển dịch và định dạng bảng tính
đặc thù của Minitab
Menu Stat: cung cấp một số công cụ dể phân tích thống kê
Menu Graph: hỗ trợ các công cụ để vẽ các loại đồ thị khác nhau
Dialog Box: Trong một số trường hợp vận hành các lệnh của Minitab,
hộp thoại sẽ hiện ra để lựa chọn chức năng cần thực hiện Một hộp thoại thông thường có những chức năng để người dùng lựa chọn cho những lệnh kế tiếp, giải thích biến hoặc gán các lựa chọn khác trong từng nút lệnh