Chương 4 T HỐNG KÊ MÔ TẢ Thống kê là gì Có thể nghiên cứu dân số theo các dấu hiệu Tuổi Trình độ văn hóa Địa bàn cư trú Nghề nghiệp... Tuổi và trình độ văn hóa được biểu thị bởi con
Trang 1Tài Liệu Giáo án điện tử môn
Xác suất thống kê - Tuần 5
Trang 2TRẦN AN HẢI
HÀ NỘI - 2009
Trang 3Chương 4
T HỐNG KÊ MÔ TẢ
Thống kê là gì
Có thể nghiên cứu dân số theo các dấu hiệu
Tuổi Trình độ văn hóa
Địa bàn cư trú Nghề nghiệp
Trang 4Tuổi và trình độ văn hóa được biểu thị bởi con số nên thuộc về dấu hiệu định lượng
Địa bàn cư trú và nghề nghiệp thuộc về dấu hiệu định tính
Trang 5Việc nghiên cứu này có thể làm theo kiểu tổng điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ
đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số nước đó
Làm như vậy có nhiều khó khăn như: đòi hỏi nhiều chi phí vật chất và thời gian, điều tra có thể bị lặp hoặc sót,
…
Trang 6Người ta thường dùng phương pháp nghiên cứu như sau: Chọn ngẫu nhiên ra một số người (gọi là lấy mẫu) rồi điều tra và xử lí số liệu bằng phương pháp xác suất để từ
đó suy ra những kết luận về các dấu hiệu Làm như vậy
có ưu điểm: Thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà vẫn đảm bảo được độ chính xác cần thiết
Trang 7Cơ sở của phương pháp này là khoa học Thống kê
Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lí số liệu Nó biến những con số khô khan câm lặng trong dữ liệu thu thập thành những con số biết nói Trên cơ sở này, chúng ta mới có thể đưa ra được những dự báo và quyết định đúng đắn Vì thế, thống kê cần thiết cho mọi lực lượng lao động, đặc biệt rất cần cho các nhà quản lí, hoạch định chính sách
Trang 8Năm 1920, nhà văn người Anh, H.G.Wells đã dự báo:
“Trong một tương lai không xa, kiến thức thống kê và tư duy thống kê sẽ trở thành một yếu tố không thể thiếu
được trong học vấn phổ thông của mỗi công dân, giống như là khả năng biết đọc, biết viết vậy”
Năm 1973, khi tổng kết về công tác cải cách giáo dục, UNESCO đã khẳng định rằng Xác suất – Thống kê là một trong 9 quan điểm chủ chốt để xây dựng học vấn trong thời đại ngày nay
Trang 9Ngày nay Thống kê đã được ứng dụng rộng rãi trong hầu hết các hoạt động của con người, từ khoa học tự nhiên, kinh tế, nông nghiệp, y học cho tới các khoa học xã hội và nhân văn
Trang 10Thống kê mô tả là bước đầu tiên của Thống kê, có mục đích thu thập và hệ thống hóa số liệu, tính các số đặc trưng thực nghiệm và tìm qui luật phân phối thực nghiệm của hiện tượng cần nghiên cứu
Trang 11§1 TỔNG THỂ VÀ MẪU
Tập hợp gồm tất cả các phần tử là đối tượng nghiên cứu của ta gọi là tổng thể
Số phần tử của tổng thể gọi là kích thước của nó n
phần tử lấy ra từ tổng thể được gọi là một mẫu kích thước n
Một mẫu được gọi là mẫu ngẫu nhiên nếu các phần
tử của nó được lấy một cách ngẫu nhiên
Trang 13Mối quan hệ giữa Xác suất và Thống kê
Xác suất nghiên cứu tổng thể và nhờ đó mà ta hiểu về mẫu Còn thống kê nghiên cứu về mẫu và nhờ đó mà
ta hiểu về tổng thể
Trang 14Mẫu có 2 loại:
Mẫu định tính là mẫu mà ta quan tâm đến các phần
tử của nó có một tính chất A hay không
Trang 15Mẫu định lượng là mẫu mà ta quan tâm đến một yếu tố về lượng của các phần tử trong mẫu
Một mẫu định lượng kích thước n có dạng
Trang 16(X1, X2, …, X n) là mẫu ngẫu nhiên tổng quát,
(x1, x2, …, x n) là mẫu ngẫu nhiên cụ thể
Trang 17§2 HỆ THỐNG HÓA SỐ LIỆU TRONG TRƯỜNG HỢP MẪU ĐỊNH LƯỢNG
Tổng quát
Sắp xếp số liệu thành dãy
(x1, x2, …, x n),
sao cho x1 ≤ x2 ≤ … ≤ x n
Trang 19Từ bảng này ta có bảng phân bố tần suất sau
Trang 20Ví dụ
Giá của mặt hàng A sau Tết tại 8 cửa hiệu là
(95, 109, 99, 98, 105, 99, 109, 102) Thu gọn mẫu, ta có
Giá hàng A 95 98 99 102 105 109
số cửa hàng 1 1 2 1 1 2
Trang 21Trường hợp mẫu (x1, x2,…, x n ) có nhiều các x i
khác nhau
Ta chọn k khoảng [a i-1 ; a i ) (i = 1,…, k) sao cho
chứa tất cả các x j
Trang 22Ta thu gọn mẫu thành bảng phân bố tần số ghép lớp
X a0 - a1 a1- a2 … a k-1 - a k
Tần số n1 n2 … n k
với a i-1 - a i là [a i-1 ; a i ), n i = số các x j thuộc [a i-1 ; a i)
Từ bảng này ta có bảng phân bố tần suất ghép lớp sau
X a0 - a1 a1- a2 … a k-1 - a k
Tần suất f1 f2 … f k
trong đó f i = n i /n
Trang 24Biểu đồ tần số hình cột
Trang 25Ta cũng có thể ghép các số liệu trong mẫu vào các đoạn rời nhau
Ví dụ
Chiều cao [160;162] [163;165] [166;168] [169;171] [172;174]
Trang 26Biểu đồ tần số hình cột
Trang 27Ở mẫu ghép lớp, trong mỗi khoảng thứ i ta chọn một số
làm đại diện (Thường lấy là trung điểm của 2 đầu mút của khoảng), ta lại có bảng phân bố tần số như ở trường hợp trên
Trang 28Ví dụ
Đường gấp khúc tần số
Trang 29Biểu đồ hình quạt rất thích hợp cho việc thể hiện bảng phân bố tần suất ghép lớp
Ví dụ
Chiều cao [160;162] [163;165] [166;168] [169;171] [172;174]
Tần suất
Trang 31 Trung bình mẫu và phương sai mẫu
Cho mẫu định lượng thu gọn
Trung bình mẫu
Trang 32Phương sai mẫu
Có thể chứng minh
là độ lệch bình phương trung bình
Trang 33Phương sai mẫu điều chỉnh
Trang 34Độ lệch mẫu
Độ lệch mẫu điều chỉnh
Trang 35Đối với mẫu ngẫu nhiên tổng quát (X1, X2, …, X n)
Trung bình mẫu
Phương sai mẫu
Trang 36Phương sai mẫu điều chỉnh
Độ lệch mẫu
Độ lệch mẫu điều chỉnh
Trang 38Các công thức sau đây cho phép giảm bớt sự cồng kềnh khi tính toán:
Với x 0 và h 0 tùy ý, ta có các công thức
Ta chọn x0 trùng với với x j có n j lớn nhất
Nếu các x j không cách đều, chọn h = 1 Nếu các x j cách
đều, chọn h = x2 – x1
Trang 40Cách dùng máy tính CASIO fx – 500MS trong thống kê
Đầu tiên, để vào chế độ tính toán thống kê, ta ấn
MODE 2
Trang 41Muốn nhập số liệu từ mẫu (x1, x2, …, x n), ta ấn
x1 SHIFT n1 DT x2 SHIFT n2 DT… x k SHIFT n k DT
Sau khi nhập xong dữ liệu:
Trang 43Chú ý
Muốn chỉnh dữ liệu cũ, ấn hoặc Tiếp theo:
Nếu muốn thay thế dữ liệu đó, ta nhập giá trị mới và
ấn , giá trị mới sẽ thay thế giá trị cũ
Nếu muốn xóa dữ liệu đó,ấn SHIFT CL (các dữ liệu còn lại sẽ tự động dồn số thứ tự lại)
Trang 44Chương 5
Ư ỚC LƯỢNG THAM SỐ
_
§1 ĐẶT VẤN ĐỀ
Biết chiều dài một sản phẩm do một xưởng sản xuất ra là
bnn X Hãy ước lượng giá trị của
Trang 45là một tham số cần ước lượng Muốn ước lượng nó, ta phải dựa vào mẫu gồm một số sản phẩm do xưởng này sản xuất Ta có thể ước đoán bởi một giá trị hoặc
ước đoán thuộc khoảng (a; b) nào đấy
Trong thống kê, gọi là ước lượng điểm của , còn
(a; b) là ước lượng khoảng của
Trang 46§2 ƯỚC LƯỢNG ĐIỂM
Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng
chưa biết tham số nào đó Ta ước đoán bởi một con
số * như sau: Ta xây dựng hàm của mẫu ngẫu nhiên tổng quát là
Với mỗi mẫu ngẫu nhiên cụ thể (x1, x2, …, x n),
ta lấy
Trang 47làm ước lượng cho
Gọi
hay
là ước lượng điểm của
Để đánh giá chất lượng * xem “tốt” hay không ta không thể mong muốn nó thật gần bởi vì ta chưa biết Vì vậy, dưới đây người ta đưa ra các tiêu chuẩn để dựa vào
đó kết luận về chất lượng của *
Trang 48 Ước lượng không chệch (ưlkc)
của , nếu
= , Ngược lại, nếu
thì gọi là ước lượng chệch của
Trang 49 Ước lượng hiệu quả (ưlhq)
Gọi là ước lượng hiệu quả của ,
nhất so với phương sai của mọi ưlkc khác của
Trang 50 Ước lượng vững (ưlv)
Gọi là ước lượng vững của , nếu
Ý nghĩa của công thức này
không nhiều miễn là n đủ lớn
Trang 51Các kết quả về ước lượng điểm
là ưlkc, ưlhq, ưlv của E(X)
, là ưlkc, ưlv của D(X)
là ưlkc, ưlhq, ưlv của P(A)
, là ước lượng chệch của D(X)
Trang 52§3 ƯỚC LƯỢNG KHOẢNG
Phương pháp ước lượng điểm có nhược điểm là khi kích thước mẫu nhỏ thì ước lượng điểm tìm được có thể sai lệch rất nhiều so với tham số cần ước lượng Ngoài ra không thể đánh giá được khả năng mắc sai lầm khi ước lượng Để khắc phục các nhược điểm này, ta thường dùng phương pháp ước lượng bằng khoảng tin cậy
Trang 53Giả sử bnn X đã biết được dạng của quy luật ppxs nhưng
chưa biết tham số nào đó Ta đi tìm một khoảng
để nó chứa với xác suất bằng như sau: Ta xây dựng như là các hàm của mẫu ngẫu nhiên tổng quát
sao cho
Trang 54
Khi ấy ta gọi
rơi vào khoảng này, nên người ta thường chọn nó gần 1
Trang 56I – Tìm khoảng tin cậy cho kì vọng
a) Trường hợp X
Nếu đã biết, ta dùng công thức
trong đó n = kích thước mẫu, còn ,
Trang 57Như vậy, khoảng tin cậy của E(X) với độ tin cậy là
Đặc biệt:
Nếu chọn , thì ta có khoảng tin
Trang 58
Nếu chọn , thì ta có khoảng tin cậy bên