Khái niêm lý thuyết mẫuMột doanh nghiệp muốn nghiên cứu các khách hàng của mình về dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh ngh
Trang 1Chu Bình Minh
Bài giảng
Xác suất thống kê
Nam Dinh,Februay, 2008
Trang 3Nhiều bài toán trong thực tế dẫn đến nghiên cứu một hay nhiều dấu hiệu định tính hoặc địnhlượng đặc trưng cho các phần tử của một tập hợp nào đó
Chẳng hạn nếu muốn điều tra thu nhập bình quân của các gia đình ở Hà Nội thì tập hợp cần nghiên cứu là các hộ gia đình ở Hà Nội, dấu hiệu nghiên cứu là thu nhập của từng mỗi gia đình
Trang 4I Khái niêm lý thuyết mẫu
Một doanh nghiệp muốn nghiên cứu các khách hàng của mình về dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, còn dấu hiệu định lượng là số lượng sản phẩm của doanh nghiệp mà khách hàng có nhu cầu được đáp ứng
Khi khảo sát một tín hiệu là quá trình ngẫu nhiên người
ta tiến hành lấy mẫu tại những thời điểm nào đó và thu được các tín hiệu mẫu
Trang 5Để xử lý dấu hiệu cần nghiên cứu đôi khi người ta sử dung phương pháp nghiên cứu toàn bộ, đó là điều tra toàn bộ các phần tử của tập hợp theo dấu hiệu cần nghiên cứu để rút ra các kết luận cần thiết Tuy nhiên trong thực tế việc áp dụng phương pháp này gặp phải những khó khăn sau:
- Do qui mô của tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí về vật chất và thời gian, có thể không kiểm soát được dẫn đến bị chồng chéo hoặc bỏ sót
Trang 6I Khái niêm lý thuyết mẫu
- Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên cứu, do đó không thể tiến hành toàn bộ được
- Có thể trong quá trình điều tra sẽ phá hủy đối tượng nghiên cứu …
Vì thế trong thực tế phương pháp nghiên cứu toàn bộ thường chỉ áp dụng đối với các tập hợp có qui mô nhỏ, còn chủ yếu người ta sử dụng phương pháp không toàn bộ mà đặc biệt là phương pháp nghiên cứu chọn mẫu
Trang 7Toàn bộ các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hay định lượng nào đó là một tổng thể Số lượng phần tử của tổng thể gọi là kích thước của tổng thể
Dấu hiệu nghiên cứu của tổng thể được mô tả bằng biến ngẫu nhiên X gọi là biến ngẫu nhiên gốc Do đó, ta
có thể áp dung các công thức xác suất để áp dụng vào việc nghiên cứu tổng thể
Trang 8II Tổng thể.
Ví dụ 1
Nghiên cứu thời gian tự học của sinh viên một trường đại học thì tổng thể là toàn bộ các sinh viên của trường này Do trường đại học này có 5000 sinh viên nên tổng thể có kích thước 5000
Dấu hiệu nghiên cứu là thời gian tự học trong ngày của mỗi sinh viên trường này (Dấu hiệu nghiên cứu định lượng)
Trang 9Ta có thể mô hình hóa dấu hiệu nghiên cứu bằng cách Chọn ngẫu nhiên 1 sinh viên của trường và gọi X là thời gian tự học của sinh viên này, X gọi là biến ngẫu nhiên gốc Do vậy thay vì nghiên cứu thời gian tự học trong ngày của mỗi sinh viên ta sẽ sử dung các kiến thức về xác suất nghiên cứu biến ngẫu nhiên gốc X ví dụ như muốn biết thời gian tự học trung bình trong ngày của mỗi sinh viên ta cần tìm EX (trung bình tổng thể), cần biết tỉ lệ sinh viên có thời gian tự học trong ngày lớn hơn
5 giờ ta cần tìm P(X>5), …
Trang 10II Tổng thể.
Ví dụ 2
Nghiên cứu tỉ lệ khách hàng không hài lòng với sản phẩm A thì tổng thể là toàn bộ khách hàng dùng sản phẩn A Trường hợp này thường khó xác định được kích thước chính xác của tổng thể
Dấu hiệu nghiên cứu ở đây là mỗi khách hàng dùng sản phẩm
A có hài lòng hay không (dấu hiệu nghiên cứu định tính) Ta
mô hình hóa dấu hiệu trên bằng cách chọn ngẫu nhiên 1 khách hàng dùng sản phẩm A và gọi X là số khách hàng không hài lòng chọn được X chỉ nhận hai giá trị 0 và 1 và (X=1) chính là biến cố chọn được khách hàng không hài lòng nên P(X=1) = p
là tỉ lệ khách không hài lòng với sản phẩm A Vậy biến ngẫu nhiên X có quy luật A(p)
Trang 11Ta gọi một mẫu là ngẫu nhiên nếu trong phép lấy mẫu đó mỗi phần tử được chọn một cách độc lập và có xac suất như nhau Do đó tá khái niệm:
Trang 12III Mẫu ngẫu nhiên
Định nghĩa:
Mẫu ngẫu nhiên kích thước n là tập hợp gồm n biến ngẫu nhiên độc lập 𝑋1, 𝑋2, … , 𝑋𝑛 được thành lập từ biến ngẫu nhiên gốc X trong tổng thể và có cùng quy luật phân phối xác suất với X
Ký hiệu:
𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
Tức là các biến ngẫu nhiên 𝑋1, 𝑋2, … , 𝑋𝑛 độc lập và 𝑋𝑖~𝑋
Trang 13Khi 𝑋𝑖 nhận giá trị cụ thể 𝑥𝑖 thì ta có mẫu cụ thể:
Trang 14III Mẫu ngẫu nhiên
Trang 15Khi đó một bộ gồm 100 biến ngẫu nhiên độc lập và có cùng quy luật phân phối với biến ngẫu nhiên gốc X :
𝑊 = (𝑋1, 𝑋2, … , 𝑋100) Gọi là mẫu ngẫu nhiên kích thước 100
Giả sử trong trường hợp chọn cụ thể ta được:
Lần 1 chọn được sinh viên tự học 2 giờ/1 ngày nên 𝑥1 = 2 Lần 2 chọn được sinh viên tự học 6 giờ/1 ngày nên 𝑥2 = 6
…
Lần 100 chọn được sinh viên tự học 5 giờ/1 ngày nên
𝑥100 = 5
Trang 16III Mẫu ngẫu nhiên
Khi đó ta có một mẫu cụ thể
𝑤 = (2; 6; … ; 5)
Do khi liệt kê 100 phần tử trên một hàng gây cảm giác giắc rối mà ta lại nhận thấy nhiều phần tử trên hàng đó có giá trị bằng nhau (chẳng hạn có 10 phần tử bằng 2, 15 phần tử bằng 6,… 5 phần tử bằng 5) ta có thể biểu diễn mẫu cụ thể trên dạng:
𝑥𝑖 2 6 … 5
𝑛𝑖 10 15 … 5
Thì bảng trên gọi là bản phân phối tần số của mẫu
Hoặc ta có thể lập bảng phân phối tần suất của mẫu với
𝑓𝑖 = 𝑛𝑖
𝑛
𝑥𝑖 2 6 … 5
𝑓𝑖 10/100 15/100 … 5/100
Trang 17Ví dụ 2
Do không xác định được toàn bộ các khách hàng nên công
ti sẽ không thể hỏi ý kiến của toàn bộ khách hàng về sản phẩm A được nên công ti tiến hành thăm dò bằng cách hỏi
ý kiến của 50 khách hàng dùng sản phẩn A (Ngay cả khi xác định được nhưng do số lượng quá nhiều cũng làm như trên) và gọi:
𝑋1 là là số khách hàng không hài lòng chọn được lần 1 nên
𝑋1~𝐴(𝑝)
𝑋2 là là số khách hàng không hài lòng chọn được lần 2 nên
𝑋2~𝐴(𝑝) và 𝑋1, 𝑋2 độc lập
Trang 18III Mẫu ngẫu nhiên
Trang 19Giả sử trong trường hợp chọn cụ thể ta được:
Lần 1 chọn được khách hàng hài lòng với sản phẩm A nên
Trang 20III Mẫu ngẫu nhiên
Trang 21Mẫu có thể cho dưới dạng khoảng
Trang 25Chú ý: Khi mẫu cụ thể cho dưới dạng tần số ta có thể rút gọn:
Trang 27𝑠2 = 1
69 32 5 + 42 10 + 52 15 + 62 20 + 72 15+ 82 5 − 70
69 (5,643)2 = 1,3522
Trang 29Hoặc ta sử dụng máy tính CASIOfx500 để tính
Thực hiện theo các bước :
1 Vào chế độ thống kê (SD) : mode 2
2 Nhập mẫu : Lặp lại quá trình 𝑥𝑖 shift ; 𝑛𝑖 DT Cu thể đối với mẫu đã cho là
3 shift ; 5 DT
4 shift ; 10 DT
…
8 shift ; 5 DT
Trang 30IV Thống kê
3 Xem kết quả
Xem 𝑥 : shift S-var 1 = Xem 𝑠 : shift S-var 2 = Xem 𝑠 : shift S-var 3 =
Trang 31Từ tổng thể ta rút ra mẫu
𝑊𝑛 = (𝑋1, 𝑋2, … , 𝑋𝑛) thì các biến ngẫu nhiên 𝑋1, 𝑋2, … , 𝑋𝑛 độc lập và có cùng quy luật phân phối với 𝑋~𝑁(𝜇, 𝜎2)
( 𝑡ứ𝑐 𝑙à 𝑋𝑖~𝑁 𝜇, 𝜎2 , 𝑖 = 1, 𝑛 ) Do 𝑋 là tổ hợp tuyến tính của 𝑋1, 𝑋2, … , 𝑋𝑛 nên nó cũng có quy luật phân phối chuẩn
Trang 32V Phân phối xác suất của một số thống kê đặc trưng.
1 Trường hợp biến ngẫu nhiên gốc có quy luật chuẩn
Trang 34V Phân phối xác suất của một số thống kê đặc trưng.
2 Trường hợp có hai biến ngẫu nhiên gốc có cùng phân phối chuẩn
Giả sử ta xét một lúc hai tổng thể Ở tổng thể thứ nhất ta xét biến ngẫu nhiên gốc 𝑋~𝑁(𝜇1, 𝜎12), ở tổng thể thứ hai
ta xét biến ngẫu nhiên gốc 𝑌~𝑁(𝜇2, 𝜎22) Từ hai tổng thể nói trên rút ra hai mẫu ngẫu nhiên độc lập có kích thước tương ứng 𝑛1 và 𝑛2:
𝑊𝑋 = (𝑋1, 𝑋2, … , 𝑋𝑛1)
𝑊𝑌 = (𝑌1, 𝑌2, … , 𝑌𝑛2)
Trang 36V Phân phối xác suất của một số thống kê đặc trưng.
2 Trường hợp có hai biến ngẫu nhiên gốc có cùng phân phối chuẩn
Trang 38V Phân phối xác suất của một số thống kê đặc trưng.
2 Trường hợp có hai biến ngẫu nhiên gốc có cùng phân phối chuẩn
Trang 39Ở trong những trường hợp này ta thường xử dụng định lý giới hạn trung tâm là : Khi 𝑛 ≫ 0, thì
Trang 40V Phân phối xác suất của một số thống kê đặc trưng.
2 Trường hợp biến ngẫu nhiên gốc tuân theo quy luận phân phối không - một
Giả sử trong tổng thể, biến ngẫu nhiên gốc X tuân theo
quy luật không-một
Trang 42V Phân phối xác suất của một số thống kê đặc trưng.
2 Trường hợp 2 biến ngẫu nhiên gốc tuân theo quy luận phân phối không - một
Giả sử ta xét một lúc hai tổng thể Ở tổng thể thứ nhất ta xét biến ngẫu nhiên gốc 𝑋 tuân theo quy luật không-một với
𝑃 𝑋 = 1 = 𝑝1, 𝑃 𝑋 = 0 = 1 − 𝑝1 = 𝑞1
ở tổng thể thứ hai ta xét biến ngẫu nhiên gốc 𝑌 tuân theo
quy luật không-một với