Ví dụ 1: Tổng thể Dấu hiệu chung cần nghiên cứu Phần tử của tập được nghiên cứu Dấu hiệu nghiên cứu trên từng phần tử Kho chứa gạo Trọng lượng hàng Sản phẩm có đạt tiêu chuẩn khôn
Trang 2nào đó được gọi là một tổng thể (kí hiệu χ - chi)
Trang 3Ví dụ 1:
Tổng thể
Dấu hiệu chung cần nghiên cứu
Phần tử của tập được nghiên cứu
Dấu hiệu nghiên cứu trên từng phần tử
Kho chứa gạo Trọng lượng
hàng
Sản phẩm có đạt tiêu chuẩn không Tất cả các gia
đình sống
trên địa bàn
Hà Nội
Số nhân khẩu trong một hộ gia đình
Mỗi gia đình
cư trú tại Hà
Nội
Số nhân khẩu trong một gia
đình
Nhận xét: Việc nghiên cứu tổng thể thực chất là nghiên cứu biến ngẫu nhiên 𝑋 (tìm luật phân phối xác suất hay các tham số đặc trưng của 𝑋)
Trang 42 Các phương pháp mô tả tổng thể
a) Giả sử trong tổng thể dấu hiệu nghiên cứu định lượng χ nhận các giá trị 𝑥1, 𝑥2, … , 𝑥𝑘 với các tần số tương ứng
𝑁1, 𝑁2, … , 𝑁𝑘 (𝑁𝑖 là số phần tử trong tổng thể có chung giá trị 𝑥𝑖, 𝑖 = 1, … , 𝑘)
Khi đó tổng thể có thể được mô tả bằng bảng phân phối tần số như sau:
Trang 5b) Tổng thể còn có thể mô tả bằng bảng phân phối tần suất như sau:
= 1
Trang 7
3 Các tham số đặc trưng của tổng thể
, ( 𝑁𝑖 là tần số của 𝑥𝑖)
Trang 8𝒙𝒊𝟐 − 𝒎𝟐
Trang 9c) Tần suất của tổng thể
Giả sử trong tổng thể kích thước 𝑁 có 𝑀 phần tử
mang dấu hiệu nghiên cứu Khi đó, tần suất của
𝒑 = 𝑴
𝑵
Trang 10
Ví dụ 2: Tổng thể nghiên cứu là một xí nghiệp có 𝑁 = 40 công nhân với dấu hiệu nghiên cứu là năng suất lao động (sản phẩm/đơn vị thời gian) Số liệu của tổng thể theo dấu hiệu nghiên cứu được cho trong bảng sau:
Tính m, 𝜎2, và tỉ lệ công nhân có năng suất lao động trên
60 sản phẩm/đơn vị thời gian
Trang 11− 𝑚2 = 160500
40 − 632 = 43,5
• Tỉ lệ công nhân có năng suất lao động trên 60 sản
phẩm/đơn vị thời gian:
𝑝 = 22
40 = 0,55
Trang 12§2 Mẫu ngẫu nhiên
Thực tế do nhiều nguyên nhân, chẳng hạn số phần tử của tổng thể rất lớn nhưng khi chi phí và thời gian điều tra các phần tử của tổng thể có hạn, không thể biết hết các phần tử của tổng thể do
đó việc điều tra toàn bộ các phần tử của tổng thể
để tìm luật phân phối xác suất của nó là không thể
Trong các tình huống như vậy thay vì nghiên cứu toàn bộ tổng thể người ta sử dụng phương pháp mẫu
Trang 131 Phương pháp mẫu
Là phương pháp chọn ra n phần tử đại diện cho tổng
thể (hay còn gọi là chọn ra một mẫu kích thước n) Sử dụng các công cụ của thống kê nghiên cứu mẫu này và dựa vào đó cho kết luận về tổng thể
Trang 142 Các phương pháp chọn mẫu
Tùy thuộc và đặc điểm của từng tổng thể nghiên cứu mà mẫu có thể được chọn theo nhiều phương pháp khác nhau để đảm bảo yêu cầu về tính đại diện của mẫu
Trang 15a) Chọn mẫu ngẫu nhiên đơn giản
Là phương pháp chọn mẫu thỏa mãn điều kiện: mỗi lần chỉ được chọn một phần tử vào mẫu, mỗi phần tử của tổng thể đều có thể được chọn vào mẫu với cùng khả năng như nhau
Việc chọn mẫu kiểu này có thể tiến hành theo cách bốc thăm hay dùng bảng số
Trang 16b) Chọn mẫu hệ thống
Là phương pháp chọn mẫu trong đó chỉ có phần tử đầu tiên được chọn ngẫu nhiên, sau đó dựa trên danh sách đã được đánh số của tổng thể để chọn ra các phần tử tiếp theo vào mẫu theo một thủ tục nào đó
Trang 193 Định nghĩa mẫu ngẫu nhiên
Định nghĩa: Mẫu ngẫu nhiên kích thước 𝑛 là tập hợp của 𝑛 biến ngẫu nhiên độc lập 𝑋1, 𝑋2, … , 𝑋𝑛 được thành lập từ biến ngẫu nhiên 𝑋 trong tổng thể nghiên cứu và có cùng quy luật phân phối xác suất với X
Kí hiệu là:
𝑾 = (𝑿𝟏, 𝑿𝟐, … , 𝑿𝒏)
Trang 20Giả sử 𝑋1 nhận giá trị 𝑥1, 𝑋2 nhận giá trị 𝑥2, ,
𝑋𝑛 nhận giá trị 𝑥𝑛
Tập hợp các giá trị 𝑥1, 𝑥2, … , 𝑥𝑛 tạo thành một giá trị của mẫu ngẫu nhiên, hay còn gọi là một mẫu cụ thể, kí hiệu:
𝒘 = (𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏)
Trang 21Ví dụ 1: Gọi X là số chấm xuất hiện khi tung một con xúc xắc, X là biến ngẫu nhiên với bảng phân phối xác
suất như sau:
Tung con xúc xắc 3 lần và gọi 𝑋𝑖, (𝑖 = 1,2,3) là số chấm xuất hiện ở lần tung thứ 𝑖 thì ta có 3 biến ngẫu nhiên độc lập tạo nên một mẫu ngẫu nhiên kích thước 𝑛 = 3
1 6
1 6
1 6
1 6
Trang 224 Các phương pháp mô tả số liệu mẫu
Giả sử tử có mẫu cụ thể 𝒘 = (𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏) Các bảng mô tả số liệu sau đây được gọi là bảng phân phối thực nghiệm
Bảng phân phối tần số thực nghiệm
Trang 24Ví dụ 2: Để điều tra thời gian đợi phục vụ của khách hàng tại một ngân hàng (đơn vị: phút) người
ta chọn ngẫu nhiên 10 người, kết quả thu được như sau: 9, 8, 10, 12, 6, 8, 11, 10, 12, 8
Lập các bảng phân phối thực nghiệm thời gian đợi của khách hàng
Trang 25Khi kích thước mẫu lớn, các giá trị của mẫu khá gần nhau người ta chia các giá trị mẫu thành các lớp và lập bảng phân phối thực nghiệm ghép lớp
Ví dụ 3: Phân phối thực nghiệm tỉ lệ (%) lãi của 49 cửa hàng
Trang 26Qui ước: Hai lớp liền nhau 𝑥𝑖;1 − 𝑥𝑖, 𝑥𝑖 − 𝑥𝑖:1 thì 𝑥𝑖thuộc lớp 𝑥𝑖;1 − 𝑥𝑖
Chú ý: Người ta có thể lấy số lớp là k sao cho nó là số
nhỏ nhất để 2𝑘 > 𝑛
Ở ví dụ trên: 25 = 32 < 𝑛 = 49 < 26, lấy k = 6
Trang 27§3 Các đặc trưng mẫu
1 Thống kê
Mỗi hàm của mẫu ngẫu nhiên 𝑮 = 𝒇 𝑿𝟏, 𝑿𝟐, … , 𝑿𝒏
được gọi là một thống kê
Chú ý:
- Mỗi thống kê 𝑮 cũng là một biến ngẫu nhiên, do đó cũng có phân phối xác suất và các tham số đặc trưng của nó
- Khi mẫu nhận giá trị cụ thể 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛) thì
thống kê 𝐺 nhận giá trị cụ thể là 𝐠 = 𝒇(𝒙𝟏, 𝒙𝟐, … , 𝒙𝒏)
Trang 282 Một số thống kê đặc trưng mẫu
a) Các đặc trưng tương ứng của mẫu
Trung bình mẫu là một thống kê, kí hiệu 𝑿, được xác định như sau:
𝑋 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑛Khi mẫu nhận giá trị cụ thể 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛) thì trung bình mẫu nhận giá trị cụ thể là:
𝑥 = 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑛hoặc:
𝒙 = 𝟏
𝒏 𝒏𝒊𝒙𝒊
𝒌 𝒊<𝟏
(𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛)
Trang 29 Phương sai mẫu (phương sai mẫu hiệu chỉnh) là thống
kê, kí hiệu 𝑺𝟐, xác định như sau:
𝒏
𝒊<𝟏
Khi mẫu nhận giá trị cụ thể 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛) thì
phương sai mẫu hiệu chỉnh nhận giá trị cụ thể là:
− 𝒙 𝟐
Trang 30− 𝒙 𝟐
Trang 31 Phương sai mẫu 𝑺∗𝟐 là thống kê được xác định như sau:
Trang 32b) Các số đặc trưng của các đặc trưng mẫu
Giả sử biễn ngẫu nhiên gốc trong tổng thể 𝑋 có
Trang 333 Cách tính các đặc trưng mẫu cụ thể
bảng phân phối thực nghiệm hay phân phối ghép lớp, tính 𝑥 , 𝑠2
Tính trung bình, phương sai, độ lệch tiêu chuẩn mẫu?
Trang 35Ví dụ 2: Lượng xăng hao phí của một ôtô đi từ A đến B sau
30 lần chạy, kết quả cho trong bảng:
Trang 37Sử dụng máy tính để tính 𝑥 , 𝑠 (minh họa bằng ví dụ 1)
Máy fx 500 – 570 MS
• Xóa bộ nhớ: SHIFT MODE 𝟑 =
• Chọn chế độ thống kê:
MODE 𝟐 (đối với fx 500MS)
MODE MODE 𝟏 (đối với fx 570MS)