1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tài liệu giảng dạy môn thống kê và phân tích dữ liệu

105 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 105
Dung lượng 0,96 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • Chương I: Sơ lược về xác suất và biến ngẫu nhiên 2 (2)
    • I: Định nghĩa, công thức tính xác suất 2 (2)
    • II: Biến ngẫu nhiên, quy luật phân phối xác suất 10 (10)
  • Chương II: Dữ liệu thống kê và các đại lượng thống kê mô tả 23 (23)
    • I: Thu thập dữ liệu và lưu trữ dữ liệu 23 (23)
    • II: Các đại lượng thống kê mô tả 27 (27)
  • Chương III: Ước lượng tham số tổng 31 (31)
    • I. Ước lượng điểm 31 (31)
    • II. Khoảng ước lượng điểm 32 (32)
  • Chương IV: Kiểm định giả thiết thống kê và phân tích phương sai 41 (41)
    • I: Kiểm định giả thiết tham số 41 (41)
    • II: Kiểm định giả thiết phi tham số 71 (71)
  • Chương V: Phân tích hồi quy và tương quan 82 (82)
    • I: Hệ số tương quan và phương trình hồi quy 82 (82)
    • II: Phân Kiểm định hệ số tương quan, sự phù hợp của phương trình hồi quy 84 (0)

Nội dung

Sơ lược về xác suất và biến ngẫu nhiên 2

Định nghĩa, công thức tính xác suất 2

1 Biến cố ngẫu nhiên và các phép toán trên biến cố ngẫu nhiên

Trong thực tế, nhiều thí nghiệm được thực hiện nhiều lần trong cùng một điều kiện ban đầu nhưng không luôn dẫn đến kết quả giống nhau Ví dụ, khi tung một con xúc xắc, không thể đoán chắc chắn kết quả sẽ là mặt nào Những hiện tượng mà mặc dù biết trước các điều kiện ban đầu nhưng không thể xác định chắc chắn kết quả xảy ra được gọi là hiện tượng ngẫu nhiên hay phép thử ngẫu nhiên.

Lượng mưa hàng năm, đầu tư vào dự án, tham gia kỳ thi tuyển sinh và kinh doanh mặt hàng cụ thể đều là những hiện tượng ngẫu nhiên.

1.2 Biến cố ngẫu nhiên, Không gian biến cố sơ cấp a Biến cố sơ cấp

Khi thực hiện một phép thử ngẫu nhiên, mỗi kết quả có thể xảy ra của nó được gọi là biến cố sơ cấp

Tập hợp tất cả các biến cố cố sơ cấp của phép thử gọi là không gian các biến cố sơ cấp Kí hiệu : 

Khi gieo một con xúc xắc Gọi ei là kết quả xuất hiện mặt i chấm(i=1;2;3;4;5;6)

Khi đó: + Phép thử này có 6 biến cố sơ cấp : e1; e2; e3; e4; e5;e6

+ Không gian các biến cố sơ cấp ={e 1 ; e 2 ; e 3 ; e 4 ; e 5 ;e 6 }

Khi gieo một hạt giống Gọi N là kết quả nảy mầm; K là kết quả không nảy mầm

Khi đó: + Phép thử này có 2 biến cố sơ cấp : N; K

+ Không gian các biến cố sơ cấp ={N; K} b Biến cố ngẫu nhiên(gọi tắt là biến ngẫu nhiên)

Khi thực hiện một phép thử ngẫu nhiên, kết quả có thể xảy ra hoặc không xảy ra, được gọi là biến cố ngẫu nhiên Các biến cố này thường được ký hiệu bằng các chữ cái như A, B, C, D, v.v.

Khi gieo một con xúc xắc, có ba kết cục có thể xảy ra: A là kết cục mặt chẵn xuất hiện, B là kết cục mặt lẻ xuất hiện, và C là kết cục mặt chia hết cho 3 xuất hiện.

Khi đó: + A, B, C, … là các biến cố ngẫu nhiên

* Biến cố ngẫu nhiên A là tập hợp gồm một số biến cố sơ cấp Do đó biến cố ngẫu nhiên A là tập hợp con của 

Biến cố ngẫu nhiên là kết cục có thể xảy ra trong phép thử ngẫu nhiên, trong khi phép thử ngẫu nhiên không phải là biến cố ngẫu nhiên Biến cố sơ cấp được xác định là một loại biến cố ngẫu nhiên.

Khi tung đồng thời ba đồng tiền có hai mặt S và N, ta cần xác định không gian mẫu  Từ không gian mẫu này, có thể xác định ba biến cố ngẫu nhiên không phải là biến cố sơ cấp Bên cạnh đó, trong quá trình phân tích, cần làm rõ khái niệm về biến cố chắc chắn và biến cố không thể xảy ra.

Trong lý thuyết xác suất, biến cố chắc chắn, ký hiệu là , là một sự kiện luôn xảy ra trong một phép thử, trong khi biến cố không thể, ký hiệu là , là sự kiện không bao giờ xảy ra.

1.3 Các phép toán trên biến cố

1.3.1 quan hệ giữa các biến cố

* Biến cố A được gọi là kéo theo biến cố B, kí hiệu AB nếu A xảy ra thì kéo theo B cũng xảy ra

* Biến cố A và biến cố B được gọi là bằng nhau, kí hiệu AB nếu A kéo theo B và B kéo theo

Tung một con xúc xắc một lần, với ={e1; e2; e3; e4; e5;e6}

Gọi A là biến cố mặt chẵn xuất hiện; B là biến cố mặt lẻ xuất hiện; C là biến cố mặt chia hết cho 3 xuất hiện

* Các kết quả sau kết quả nào đúng : a) {e1}A b) {e2}A c) A={e2; e4; e6} d) AB e) CA f) {e2;e5}B g) A{e1; e2; e4; e6} h) AB= 

* Xác định các phần tử cho các biến cố A, B, C, AB, AC, BC, AB, AC, BC và mô tả bằng lời các biến cố ngẫu nhiên này

Trong lý thuyết xác suất, A và B là hai biến cố ngẫu nhiên từ cùng một phép thử Phép cộng của hai biến cố, ký hiệu A∪B, xảy ra khi ít nhất một trong hai biến cố A hoặc B xảy ra Ngược lại, phép nhân, ký hiệu A∩B, xảy ra khi cả hai biến cố A và B cùng xảy ra Cuối cùng, phép trừ, ký hiệu A\B, xảy ra khi biến cố A xảy ra mà không có biến cố B.

A xảy ra mà biến cố B không xảy ra Định nghĩa :

+ Ta gọi A = \ A là biến cố đối lập của biến cố A

+ Hai biến cố A, B được gọi là xung khắc nếu AB= 

Những tính chất của phép cộng, nhân và trừ giống như các tính chất của phép hợp, giao và hiệu của các tập hợp

Xét không gian biến cố sơ cấp  = {e1,e2,e4,e6}

Gọi A là biến cố xuất hện mặt chẵn

B là biến cố xuất hiện mặt lẻ

C là biến cố xuất hiện mặt chia hết cho 3 Đáp án a) B = A là sai Đáp án b) A, B xung khắc là đúng Đáp án c) C = AB là đúng Đáp án d) A \ B là biến cố xuất hiện mặt chẵn là đúng Đáp án e) A \ C là biến cố xuất hiện mặt hai chấm hoặc bốn chấm là sai Đáp án f) A \ C là biến cố xuất hiện mặt hai chấm là sai Đáp án g) AC là biến cố xuất hiện mặt chẵn hoặc ba chấm là đúng Đáp án h) B = {e2}  {e3}  {e5} là đúng.

2 Hệ đầy đủ các biến cố: Định nghĩa:

Dãy n biến cố B1,B2,…, Bn lập thành một hệ đầy đủ các biến cố nếu nó thỏa mãn các điều kiện sau: a) B1 B2 … Bn =  b) B i B j =  ,  i  j

Các đáp án sau đâu đúng, đâu sai:

1) Cho  = {e 1 ,e 2 ,…e n }, khi đó hệ e 1 ,e 2 ,…e n lập thành hệ đầy đủ

2) Gieo đồng thời 2 đồng tiền gồm hai mặt S, N

Gọi NN là biến cố hai đồng tiền xuất hiện mặt ngữa

SS là biến cố hai đồng tiền xuất hiện mặt sấp

SN là biến cố đồng tiền thứ nhất xuất hiện mặt sấp, đồng tiền thứ 2 xuất hiện mặt ngữa

NS là biến cố đồng tiền thứ nhất xuất hiện mặt ngữa, đồng tiền thứ 2 xuất hiện mặt sấp.

Trong phép thử của việc tung một đồng tiền, có bốn biến cố sơ cấp được xác định là NN, NS, SN và SS Hệ biến cố này tạo thành một hệ đầy đủ Xét biến cố A bao gồm các kết quả NS và SN, thì hệ biến cố NN, A và SS cũng lập thành một hệ đầy đủ Do đó, A có thể được biểu diễn dưới dạng hợp của hai biến cố NS và SN.

3 Các định nghĩa xác suất

3.1 Định nghĩa xác suất cổ điển Định nghĩa

Trong không gian biến cố sơ cấp  với số lượng phần tử hữu hạn, các biến cố sơ cấp được xem là đồng khả năng Khi A là một biến cố trong không gian , xác suất xảy ra của biến cố A được xác định theo công thức cụ thể.

Trong đó: + n(A) là số biến cố sơ cấp (kết quả) có trong A( hay là số kết quả thuận lợi cho A xảy ra)

+ n() là số biến cố sơ cấp (kết quả) của không gian ( hay là số kết quả có thể xảy ra)

Ví d ụ: Tung một con xúc xắc cân đối và đồng chất

Gọi ei là biến cố xuất hiện mặt i chấm(i=1,2,…, 6)

A là biến cố xuất hiện mặt chẵn

B là biến cố xuất hiện mặt chia hết cho 3

Ta thấy: + Các ei đồng khả năng vì P(ei)6

1 i1,2, ,6 + A={e2, e4, e6}: có 3 kết quả (biến cố sơ cấp) thuận lợi cho A xảy ra

+ B={e3, e6}: có 2 kết quả (biến cố sơ cấp) thuận lợi cho B xảy ra

+ ={e1; e2; e3; e4; e5;e6}: Có 6 kết quả (biến cố sơ cấp) có thể xảy ra

1) Một đợt xổ số phát hành 10 6 vé số, trong đó có 1 giải đặc biệt (6 số); 10 giải nhất(5 số), 10 giải nhì(5 số), 20 giải ba(5 số); 70 giải tư(5 số); 100 giải năm(4 số); 300 giải sáu(4 số); 1000 Giải bảy(3 số); 10000 giải tám(2 số); 9 giải phụ đặc biết và 45 giải khuyến khích Một người mua ngẫu nhiên một tờ vé số Tìm xác suất để người đó: a) Trúng giải đặc biệt; giải nhất; giải tư; giải tám b) trúng số

2) Khi lai hai cây đậu có kiểu gen Aa Tính xác suất để thế hệ con mang kiểu gen: a) aa b) AA c) Dị hợp tử d) đồng hợp tử

3) Một hộp gồm 5 bi trắng, 4 bi đỏ Từ hộp đó lấy ngẫu nhiên cùng ra 2 bi a) Không gian biến cố sơ cấp có bao nhiêu phần tử b) Gọi B là biến cố lấy được hai bi đỏ Tìm P(B) c) Gọi C là biến cố lấy được hai bi khác màu Tìm P(C) d) Gọi D là biến cố lấy được hai bi cùng màu Tìm P(D)

3.2 Định nghĩa xác suất tần suất

Theo định nghĩa tại mục 3.1, không gian biến cố sơ cấp \( \Omega \) cần có số lượng phần tử hữu hạn và đồng khả năng Để khắc phục những nhược điểm này, ta sẽ xem xét một định nghĩa mới.

Trong một phép thử lặp lại n lần độc lập, nếu biến cố A xuất hiện m lần, ta định nghĩa f(n, m) là tần suất xuất hiện của biến cố A Khi số lần lặp n tăng lên, tỉ số m/n sẽ tiến gần đến một giá trị cố định p.

Ví d ụ : Nhà toán học Pearson và Buffon đã làm thực nghiệm gieo nhiều lần một đồng tiền cân đối và đồng chất kết quả được ghi lại như sau:

Người làm thí nghiệm Số lần gieo Số lần xuất hiện mặt ngữa f n m

Với bảng thực nghiệm trên cho thấy xác suất để mặt ngữa xuất hiện là p = 0.5 Định nghĩa

Biến ngẫu nhiên, quy luật phân phối xác suất 10

1 Khái niệm biến ngẫu nhiên và hàm phân phối

1 1 Khái niệm biến ngẫu nhiên:

Ví d ụ : Tung 3 lần một đồng tiền cân đối và đồng chất Khi đó ta có  = { NNN, NNS, NSN, SNN, NSS, SSN, SSS}

Trong đó: N là biến cố xuất hiện mặt ngửa trong mỗi lần tung

S là biến cố xuất hiện mặt sấp trong mỗi lần tung

Trên không gian  ta xác định một hàm X lấy giá trị trên R như sau:

  X () : số lần xuất hiện mặt ngửa

Như vậy tập giá trị của X () : { 0, 1, 2, 3}

Trong ví dụ trên X được gọi là bến ngẫu nhiên và ta cũng thấy rằng: xR luôn tồn tại biến cố A = {: X () < x}

+ 2 < x  3  A = { SSS, SNS, NSS, SSN, SNN, NSN, NNS}

Dựa vào đặc điểm trên, ta có định nghĩa biến ngẫu nhiên như sau: Định nghĩa

Biến ngẫu nhiên X là một hàm xác định trên không gian biến cố sơ cấp  và nhận giá trị trong R sao cho xR tồn tại biến ngẫu nhiên A = {: X () < x}

+ Biến ngẫu nhiên thường kí hiệu: X, Y, Z,…

+ Giá trị của biến ngẫu nhiên kí hiệu: x, y, z, …

+ Nếu không có gì nhầm lẫn thì X () = x, đôi khi ta viết X = x

Ta có thể hiểu biến ngẫu nhiên là đại lượng nhận giá trị trong tập số thựcR, phụ thuộc vào kết quả của phép thử

Biến ngẫu nhiên X được định nghĩa là rời rạc nếu tập giá trị của nó là hữu hạn hoặc vô hạn đếm được, trong khi đó, nếu tập giá trị của X nằm trong khoảng (a, b) với a có thể là -∞ và b có thể là +∞, thì X được gọi là biến ngẫu nhiên liên tục Ví dụ, khi X (SSS) = 0, ta có thể viết X = 0 và A = {ω: X(ω) < x}, từ đó A có thể được biểu diễn dưới dạng A = (X < x).

Để xác định các biến ngẫu nhiên trong các ví dụ sau, trước tiên, chúng ta cần phân tích từng tình huống a) Trong trường hợp bắn không hạn chế vào mục tiêu cho đến khi có viên đạn trúng, biến ngẫu nhiên là số lần bắn trước khi trúng, với miền giá trị từ 1 đến vô hạn Xác suất cho mỗi giá trị có thể được tính bằng công thức xác suất của phân phối hình học b) Đối với việc lấy 4 viên bi từ hộp có 7 bi đỏ, 3 bi xanh và 10 bi vàng, biến ngẫu nhiên là số viên bi đỏ, xanh, và vàng được lấy ra Miền giá trị cho mỗi màu bi sẽ từ 0 đến số lượng bi tương ứng trong hộp Xác suất ứng với từng giá trị có thể được tính bằng cách sử dụng quy tắc xác suất cho phép lấy có hoàn lại.

1.2 Hàm phân phối của biến ngẫu nhiên: Định nghĩa

Cho X là biến ngẫu nhiên, khi đó luôn tồn tại P ( {: X () < x}) x và ta gọi

F(x) =P(X < x) : là hàm phân phối xác suất của biến ngẫu nhiên X

Ví dụ: Bắn 3 viên đạn độc lập vào mục tiêu Gọi X là số vên đạn trúng đích Xác suất bắn trúng mỗi viên là 0,6

+ X là biến ngẫu nhiên, tập giá trị: {0,1,2,3}

+ Không gian biến cố sơ cấp  =  A A A , A A A , A A A , A A A , A AA , A A A , AA A ,

Trong đó A là biến cố bắn trúng đích

Ta có hàm phân phối:

2 Các tính chất hàm phân phối: i) Hàm phân phối là hàm đơn điệu tăng ii) Hàm phân phối F(x) liên tục trái, nghĩa là x a lim F(x) = F(a) iii) x lim F(x) = 0 ,  

1) Giả sử X có hàm phân phối

0 , 0 x x x x a) Vẽ đồ thị hàm F(x) b) Tính P( -1 x <

2) Giả sử X có hàm phân phối:

0 , 0 x e x ax a) Tìm a và vẽ đồ thị hàm F(x) b) Tính P( -1 x < 1)

3) Phân phối rời rạc và phân phối liên tục:

3.1.1 Bảng phân phối xác suất

Cho X là biến ngẫu nhiên rời rạc nhận các giá trị: x 1 ,x 2 , ,x n , với xác suất tương ứng như sau:

+ Bảng trên được gọi là bảng phân phối xác suất của X

+ Nếu x1< x2 z) đối với cỡ mẫu lớn, sử dụng bảng phân phối chuẩn N(0;1) Ngược lại, đối với cỡ mẫu nhỏ, P giá trị được tính theo công thức P giá trị = P(T > t) dựa trên bảng phân phối chuẩn Student T(n).

Ta có bảng tổng hợp các bước kiểm định như sau:

Tính giá trị thống kê Quy tắc bác bỏ giả thiết H

(ngược lại thì chấp nhận H)

(Thống kê dùng để kiểm định trong các mô hình kiểm định tương ứng)

Một tổ kiểm tra đã tiến hành nghiên cứu để xác định thời gian trung bình từ khi công ty A nhận được đơn khiếu kiện của khách hàng cho đến khi giải quyết Họ đã chọn ngẫu nhiên 15 trường hợp khiếu kiện trong năm qua để thu thập dữ liệu và phân tích kết quả.

Với mức ý nghĩa 1%, có thể kết luận rằng thời gian trung bình để một khiếu kiện được giải quyết bởi công ty A vượt quá 90 ngày hay không? Để xác định điều này, chúng ta sẽ sử dụng giá trị P và giả định rằng thời gian giải quyết khiếu kiện tuân theo phân phối chuẩn Phân tích sẽ được thực hiện thông qua phần mềm SPSS.

Ví dụ: Phân tích số liệu trong ví dụ trên bằng SPSS

- Bước 1: Nhập số liệu vào bảng tính của SPSS

- Bước 2: Phân tích dữ liệu: Data view/Analyze/Compare means/One-Samples T Test…

- Bước 3: Trong hộp thoại One-Samples T Test…ấn định các chi tiết cần thiết, có được bảng kết quả:

N Mean Std Deviation Std Error Mean khieukien 15 99.53 19.744 5.098

Difference t df Sig (2-tailed) Mean Difference Lower Upper khieukien 1.870 14 083 9.533 -1.40 20.47

Với bảng kết quả trên ta thấy:

+ Giá trị thống kê dùng để kiểm định: z = 1,870 > 0

Vậy ta chưa có cơ sở bác bỏ giả thiết H(= 90 ngày) Thời gian giải quyết khiếu kiện của công ty không vượt quá 90 ngày

2.2 Dạng 2: So sánh hai trung bình của hai tổng thể độc lập

* Tiêu chuẩn được sử dụng để kiểm định trung bình  là: Phân phối chuẩn tắc N(0; 1) và phân phối Student T(n)

Kiểm định giả thiết phi tham số 71

1 Kiểm định sự phù hợp của quy luật phân phối

* Tiêu chuẩn được sử dụng để kiểm định: Phân phối khi bình phương  2 (n)

Xét X là đặc tính có hàm mật độ xác suất f(x) chưa biết Để kiểm định những thông tin về dạng của f(x) ta tiến hành khảo sát mẫu được số liệu quan sát: (điều kiện n50)

* Cặp giả thiết, đối thiết có thể được kiểm định:

+ Giả thiết H: f(x)= f * (x) Đối thiết K: f(x)  f * (x) , f * (x) là hàm mật độ của luật phân phối đã biết

* Đại lượng dùng để kiểm định: 

Trong đó: + n i là tần số của giá trị x i (điều kiện n i >4); 

* Tương tự như kiểm định tham số, dựa vào quy luật Khi bình phương, người ta xác định được mô hình kiểm định như sau:

Bảng tóm tắt các bước kiểm định giả thiết H: f(x)= f * (x)

Xác định GT/ĐT Xác định TK kiểm định

Quy tắc bác bỏ giả thiết H (ngược lại thì chấp nhận H)

 (  0 2    2 ; k  r  1 r là số tham số của phân phối cần kiểm định

+ Chấp nhận H + Chấp nhận K (Bác bỏ H)

Quan sát một chất phóng xạ trong 2608 khoảng thời gian bằng nhau, mỗi khoảng 7,5 giây, ta thu được số liệu về số hạt rơi vào máy đếm trong mỗi khoảng thời gian Kết quả cho thấy sự phân bố số hạt rơi vào máy đếm trong các khoảng thời gian khác nhau, với số lần xuất hiện của mỗi số hạt như sau: 0 hạt xuất hiện 57 lần, 1 hạt xuất hiện 203 lần, 2 hạt xuất hiện 383 lần, 3 hạt xuất hiện 525 lần, 4 hạt xuất hiện 532 lần, 5 hạt xuất hiện 408 lần, 6 hạt xuất hiện 273 lần, 7 hạt xuất hiện 139 lần, 8 hạt xuất hiện 45 lần, 9 hạt xuất hiện 27 lần và 10 hạt xuất hiện 16 lần.

Nói rằng số hạt phóng xạ được phóng ra trong mỗi khoảng thời gian có phân phối Poisson, chấp nhận được không/ với mức ý nghĩa 5%

2 Kiểm định sự độc lập của hai đặc tính

* Tiêu chuẩn được sử dụng để kiểm định: Phân phối khi bình phương  2 (n)

Để kiểm định tính độc lập của hai biến ngẫu nhiên X và Y, chúng ta xem xét hai đặc tính X và Y trên cùng một tổng thể Quá trình này bao gồm việc thu thập mẫu dữ liệu, với các quan sát cho biến X là (x1, x2,…, xn) và cho biến Y là (y1, y2,…, ym), từ đó tạo ra bảng số liệu để phân tích.

ym nm1 nm2 … nmn rm

* Cặp giả thiết, đối thiết có thể được kiểm định:

+ Giả thiết H: X, Y độc lập Đối thiết K: X, Y không độc lập

* Đại lượng dùng để kiểm định:  

* Tương tự như các mô hình kiểm định trên, dựa vào quy luật Khi bình phương, ta xác định được mô hình kiểm định như sau:

Bảng tóm tắt các bước kiểm định giả thiết H: X, Y độc lập

Xác định GT/ĐT Xác định TK kiểmđịnh Quy tắc bác bỏ giả thiết H

(ngược lại thì chấp nhận H)

Giả thiết H: X, Y độc lập Đối thiết K: X, Y không độc lập 

Một nghiên cứu đã được thực hiện với 200 người làm cùng một loại công việc để xác định mối quan hệ giữa chất lượng hoàn thành công việc và trình độ văn hóa Kết quả khảo sát cho thấy có sự phụ thuộc giữa hai yếu tố này.

PTTH cơ sở PTTH Cao đẳng

Với mức ý nghĩa 5% hỏi chất lượng hoàn thành công việc có phụ thuộc vào trình độ văn hóa hay không? Ứng dụng phần mềm SPSS

Phân tích số liệu trong ví dụ trên bằng SPSS

- Bước 1: Nhập số liệu vào bảng tính của SPSS

- Bước 2: Phân tích dữ liệu: Data view/Analyze/Dasriptive Statistics/Crosstabs…

- Bước 3: Trong hộp thoại Crosstabs…ấn định các chi tiết cần thiết, được bảng kết quả:

N Percent N Percent N Percent loai * Trinhdo 176 95.1% 9 4.9% 185 100.0% loai * Trinhdo Crosstabulation

Value df Asymp Sig (2-sided)

N of Valid Cases 176 a 0 cells (.0%) have expected count less than 5 The minimum expected count is 10.45

Từ bảng kết quả trên, ta thấy:

KL: Bác bỏ giả thiết H, tức là trình độ và năng lực làm việc có tương quan với nhau

3 Kiểm định sự thuần nhất của luật phân phối

Để kiểm tra sự đồng nhất của đặc tính X giữa hai tổng thể, chúng ta cần tiến hành quan sát mẫu từ cả hai tổng thể này Giả sử n1 là kích thước mẫu của đặc tính X trong tổng thể 1, và n2 là kích thước mẫu của đặc tính X trong tổng thể 2.

* Cặp giả thiết, đối thiết có thể được kiểm định:

+ Giả thiết H: đồng nhất phân phối Đối thiết K: không đồng nhất phân phối

* Đại lượng dùng để kiểm định:

R n z , R 1 là tổng hạng của mẫu 1

Dựa trên quy luật chuẩn, các mô hình kiểm định được xác định và kết quả được mô tả một cách rõ ràng, tương tự như các mô hình kiểm định đã được trình bày trước đó.

Xác định GT/ĐT Xác định TK kiểmđịnh Quy tắc bác bỏ giả thiết H

(ngược lại thì chấp nhận H)

Giả thiết H: Thuần nhất PP Đối thiết K: Không thuần nhất PP

R 1 là tổng hạng của mẫu 1

Yêu cầu SV: Để so sánh phản ứng của hai loại vắcxin BCG là X và Y, người ta tiêm cho 348 trẻ được chia làm hai nhóm, kết quả:

Nhẹ Trung bình loét ápxe(năng)

Hãy cho kết luận? với mức ý nghĩa 5%

Bài tập củng cố chương IV

1 Lô hàng là đủ tiêu chuẩn xuất khẩu nếu tỉ lệ phế phẩm của nó không vượt quá 3% Kiểm tra ngẫu nhiên 400 sản phẩm của lô hàng thấy có 14 phế phẩm Với mức ý nghĩa 5% lô hàng có được phép xuất khẩu không?

2 Nếu áp dụng phương pháp công nghệ thứ nhất thì tỉ lệ phế phẩm là 6%, còn áp dụng phương pháp công nghệ thứ hai thì trong 100 sản phẩm có 5 phế phẩm Với mức ý nghĩa 5% có thể cho rằng áp dụng phương pháp công nghệ thứ hai cho tỉ lệ phế phẩm thấp hơn không?

3 Một máy đóng hộp đựng một loại sản phẩm được gọi là làm việc bình thường nếu trọng lượng trung bình mỗi hộp được đóng là 368 gam Giả sử trọng lượng của các hộp được sản xuất có phân phối chuẩn với độ lệch tiêu chuẩn 30 gam Người ta sẽ dừng máy khi trọng lượng trung bình của hộp nhỏ hơn 368 gam a) Tính xác suất sai lầm loại 2 () nếu người phụ trách máy quyết định dừng máy khi điều tra 25 hộp có trọng lượng trung bình là x với mức ý nghĩa = 5% Xét x = 360 gam; x 355 gam b) Nếu người phụ trách máy muốn lực lượng của kiểm định ( 1 - ) là 90% và mức ý nghĩa  = 5%, bết trọng lượng trung bình thực hộp giảm nằm trong khoảng 360 gam, 368 gam thì kích thước mẫu điều tra cần là bao nhiêu? c) Giải bài toán trong câu a,b khi  = 0,1% và so sánh kết quả có được khi = 5%

4 Thời gian trước số tiền gửi tiết kiệm bằng ngoại tệ trung bình của mỗi khách hàng là 1000 USD Để đánh giá xem xu hướng này còn giữ nguyên hay không, người ta kiểm tra ngẫu nhiên 64 sổ tiết kiệm và tìm được số tiền gửi trung bình là 990 USD, độ lệch tiêu chuẩn 100 USD a) Với mức ý nghĩa 5% hãy xem số tiền gửi tiết kiệm có thay đổi không? b) Hãy kiểm định vấn đề trên bằng cách dùng P – giá trị c) Tìm xác suất sai lầm loại 2 nếu số tiền tiết kiệm trung bình của mỗi khách hàng thực sự bằng 1050 USD d) Tìm lực lượng của kiểm định e) Nếu đòi hỏi  ,  đều bằng 0,05 sai lệch giữa trung bình thực sự và giá trị giả thuyết không quá 30 USD thì cần mẫu kích thước tối thiểu là bao nhiêu?

5 Giám đốc chất lượng của một nhà máy sản xuất bóng đèn muốn xác định có sự khác nhau hay không về tuổi thọ của bóng đèn được sản xuất ra bởi hai kiểu máy Biết rằng độ lệch tiêu chuẩn tuổi thọ của bóng đèn do kiểu máy thứ nhất, thứ hai sản xuất ra tương ứng là 110 giờ, 125 giờ tương ứng là 375 giờ; 362 giờ Với mức ý nghĩa 1% hãy cho biết kết luận về sự khác nhau của tuổi thọ trung bình của bóng đèn do hai kiểu máy sản xuất

6 Để so sánh thời gian sản xuất ra 1 sản phẩm của hai máy ( đơn vị là giây) người ta điều tra và ghi lại kết quả như sau:

Với mức ý nghĩa 5%, có thể kết luận rằng máy 2 hoạt động tốt hơn máy 1 Giả sử rằng độ lệch tiêu chuẩn của thời gian sản xuất mỗi sản phẩm giữa hai máy là giống nhau và phân phối của chúng tuân theo phân phối chuẩn.

7 Kiểm tra chất lượng sản phẩm của cùng một loại do hai nhà máy A và B sản xuất ra kết quả trong bảng:

Nhà máy Số sản phẩm được kiểm tra Số phế phẩm

B 1200 30 Với mức ý nghĩa 5% có thể cho rằng hai máy có độ chính xác như nhau không? Biết kích thước chi tiết có phân phối chuẩn?

8 Hai máy cùng gia công cùng một loại chi tiết Để kiểm tra độ chính xác của hai máy người ta lấy ngẫu nhiên từ mỗi máy 7 chi tiết đem đo và kết quả:

Với mức ý nghĩa 5% có thể cho rằng hai máy có độ chính xác như nhau không? Biết kích thước chi tiết có phân phối chuẩn

9 Một nhà kinh tế cho rằng độ phân tán của thị phần trong các công ty hoạt động có cạnh tranh về giá cả cao hơn trong các công ty độc quyền Để kết luận về điếu đó người ta đã điều tra thị phần của một công ty cạnh tranh về giá cả trong 4 năm và tìm thấy phương sai mẫu s 2 = 85,576 Đồng thời kiểm tra thị phần của một công ty độc quyền trong 7 năm thì tìm được phương sai mẫu 13,78 Với mức ý nghĩa 5% hãy kết luận về ý kiến trên Giả sử thị phần của các công ty là các biến ngẫu nhiên có phân phối chuẩn

10 để so sánh phản ứng của hai loại vắcxin BCG là X và Y, người ta tiêm cho 348 trẻ được chia làm hai nhóm, kết quả như sau:

Nhẹ Trung bình loét A1pxe(nặng)

Với mức ý nghĩa 5%, cho kết luận về phản ứng của hai loại Vắcxin

11 Quan sát 124 người về màu mắt và màu tóc, ta có kết quả:

Vàng hoe Nâu Đen Vàng đỏ Xanh 25 9 3 7

Với mức ý nghĩa 5%, hãy cho biết có sự phụ thuộc giữa màu tóc và màu mắt của con người không?

12 Quan sát trọng lượng của một nhóm 108 người ở độ tuổi từ 30-50 ta có kết quả:

Với mức ý nghĩa 5%, hãy cho biết đặc tính X có phân phối chuẩn không?

13 Làm sinh thiết gan trên 22 bệnh nhân đã d7u7o75c chẩn đoán bệnh A, B, C, D, E để đo hàm lượng GGTP gọi là X, đv mg), được kết quả :

Hàm lượng GGTP trung bình trong năm bệnh có sự khác biệt đáng kể hay không? Nếu có, hãy xác định các cặp bệnh khác nhau với mức ý nghĩa 5%.

Phân tích hồi quy và tương quan 82

Ngày đăng: 28/06/2021, 10:51

🧩 Sản phẩm bạn có thể quan tâm