1. Trang chủ
  2. » Khoa Học Tự Nhiên

Bài giảng Lý thuyết xác suất và thống kê toán ĐH Sư Phạm Kỹ Thuật Nam Định

162 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 162
Dung lượng 2,3 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • Chương 1: Khái niệm cơ bả n v ề xác su ấ t (6)
    • 1.1. Gi ả i tích t ổ h ợ p (6)
      • 1.1.1. Quy t ắc đế m (6)
      • 1.1.2. Hoán v ị (7)
      • 1.1.3. Chỉnh hợp (7)
      • 1.1.4. Ch ỉ nh h ợ p l ặ p (7)
      • 1.1.5. T ổ h ợ p (8)
    • 1.2. Phép th ử và bi ế n c ố (8)
      • 1.2.1. Khái ni ệ m (8)
      • 1.2.2. Các phép toán và mối quan hệ giữa các biến cố (9)
      • 1.2.3. Nhóm đầy đủ các bi ế n c ố (12)
    • 1.2. Xác su ấ t (12)
      • 1.3.1. Khái niệm xác suất (12)
      • 1.3.2. Các định nghĩa xác suấ t (12)
      • 1.3.3. Tính chất của xác suất (14)
      • 1.3.4. Các công th ứ c tính xác su ấ t (14)
  • Chương 2: Biế n ng ẫ u nhiên (34)
    • 2.1. Khái ni ệ m v ề bi ế n ng ẫ u nhiên (34)
      • 2.1.1. Định nghĩa (34)
      • 2.1.2. Phân lo ạ i bi ế n ng ẫ u nhiên (34)
    • 2.2. Các phân phối xác suất của biến ngẫu nhiên (34)
      • 2.2.1. B ả ng phân ph ố i xác su ấ t (34)
      • 2.2.2. Hàm phân ph ố i xác su ấ t (37)
      • 2.2.3. Hàm mật độ xác suất (39)
    • 2.3. Các đặc trưng số c ủ a bi ế n ng ẫ u nhiên (0)
      • 2.3.1. Kỳ vọng (42)
      • 2.3.2. Phương sai (43)
      • 2.3.3. Mode (45)
      • 2.3.4. Median (46)
    • 2.4. Các phân ph ố i xác su ất thườ ng dùng (46)
      • 2.4.1. Phân phối nhị thức (46)
      • 2.4.2. Phân ph ố i Poisson (48)
      • 2.4.3. Phân ph ố i chu ẩ n (49)
      • 2.4.4. Phân phối khi bình phương (56)
      • 2.4.5. Phân ph ố i Student (56)
      • 2.4.6. Phân phối Fisher – Sendecor (57)
  • Chương 3: Lý thuy ết ước lượ ng (71)
    • 3.1. Lý thuy ế t m ẫ u (71)
      • 3.1.1. Khái ni ệ m v ề m ẫ u ng ẫ u nhiên (71)
      • 3.1.2. Các phương pháp lấy mẫu (72)
      • 3.1.3. B ả ng phân ph ố i th ự c nghi ệ m (73)
      • 3.1.4. Các đặc trưng mẫ u (74)
      • 3.1.5. Cách tính các đặc trưng mẫ u (76)
    • 3.2. Ước lượng điể m (80)
      • 3.2.1. Khái niệm ước lượng điểm (80)
      • 3.2.2. Các tính ch ấ t c ủa ước lượng điể m (81)
    • 3.3. Ước lượ ng kho ả ng (82)
      • 3.3.1. Khái ni ệm ước lượ ng kho ả ng (82)
      • 3.3.2. Kho ả ng tin c ậ y cho k ỳ v ọ ng (83)
      • 3.3.3. Khoảng tin cậy cho phương sai (90)
      • 3.3.4. Kho ả ng tin c ậ y cho t ỷ l ệ (94)
  • Chương 4: Ki ểm đị nh gi ả thuy ế t th ố ng kê (105)
    • 4.1. Gi ả thuy ế t th ố ng kê (105)
    • 4.2. Quy tắc kiểm định (105)
      • 4.2.1. Tiêu chu ẩ n ki ểm đị nh (105)
      • 4.2.2. Quy t ắ c ki ểm đị nh (106)
    • 4.3. Các dạng miền tới hạn (106)
      • 4.3.1. Ki ểm định đố i x ứ ng (106)
      • 4.3.2. Kiểm định trái (107)
      • 4.3.3. Ki ểm đị nh ph ả i (107)
    • 4.4. Ki ểm đị nh v ề k ỳ v ọ ng (107)
      • 4.4.1. Bài toán 1: Phương sai VX = σ 2 đã biế t (108)
      • 4.4.2. Bài toán 2: Phương sai VX = σ 2 chưa biế t (110)
    • 4.5. Kiểm định phương sai (113)
      • 4.5.1. Bài toán 1: K ỳ v ọng EX đã biế t (113)
      • 4.5.2. Bài toán 1: Kỳ vọng EX chưa biết (114)
    • 4.6. Ki ểm đị nh v ề t ỷ l ệ (115)
      • 4.6.1. Ki ểm đị nh hai phía (115)
      • 4.6.2. Kiểm định phía trái (116)
      • 4.6.3. Ki ểm đị nh phía ph ả i (116)
    • 4.7. Kiểm định về sự bằng nhau của hai kỳ vọng (118)
      • 4.7.1 Bài toán 1: Trường hợp biết VX   1 2 và VY   2 2 (118)
      • 4.7.2. Bài toán 2: Trườ ng h ợp chưa biế t VX   1 2 và VY   2 2 (119)
    • 4.8. Kiểm định sự bằng nhau của 2 tỷ lệ (121)
      • 4.8.1. Ki ểm đị nh hai phía (121)
      • 4.8.2. Kiểm định phía trái (122)
      • 4.8.3. Kiểm định phía phải (122)
  • Chương 5: Phân tích hồ i quy (131)
    • 5.1. Bi ế n ng ẫ u nhiên nhi ề u chi ề u (131)
      • 5.1.1. Khái niệm về biến ngẫu nhiên 2 chiều (131)
      • 5.1.2. Phân ph ố i xác su ấ t c ủ a bi ế n ng ẫ u nhiên 2 chi ề u r ờ i r ạ c (131)
      • 5.1.3. Phân ph ố i xác su ấ t c ủ a bi ế n ng ẫ u nhiên 2 chi ề u liên t ụ c (133)
    • 5.2. Các số đặc trưng của biến ngẫu nhiên 2 chiều (0)
      • 5.2.1. Các s ố đặc trưng củ a các bi ế n thành ph ầ n (135)
      • 5.2.2. Hệ số tương quan (135)
      • 5.2.3. H ệ s ố tương quan mẫ u (137)
      • 5.2.4. Tiêu chuẩn độc lập của hai biến ngẫu nhiên (138)
      • 5.2.5. Ki ểm đị nh gi ả thuy ế t v ề h ệ s ố tương quan (139)
    • 5.3. Hồi quy (140)
      • 5.3.1. Mô hình tuy ế n tính (140)
      • 5.3.2. Công th ức ước lượ ng h ệ s ố c ủa đườ ng h ồ i quy tuy ế n tính (141)

Nội dung

Chương 1: Khái niệm cơ bản về xác suất Chương 2: Biến ngẫu nhiên Chương 3: Lý thuyết ước lượng Chương 4: Lý thuyết kiểm định Chương 5: Phân tích hồi quy Tập bài giảng được trình bày một

Khái niệm cơ bả n v ề xác su ấ t

Gi ả i tích t ổ h ợ p

Từ lâu, con người đã gặp và giải quyết các bài toán tổ hợp, một nhánh quan trọng của toán học Kiến thức về tổ hợp có nhiều ứng dụng trong khoa học và thực tiễn, đặc biệt là các ứng dụng trong máy tính, vi mạch, quy hoạch toán học và toán kinh tế.

Trong phần này, chúng tôi giới thiệu một số kiến thức cơ bản nhất của giải tích tổ hợp có ứng dụng trong lý thuyết xác suất

1.1.1 Quy tắc đếm a Quy tắc cộng

Công việc A có thể thực hiện bằng m phương án khác nhau hoặc A 1 , hoặc A 2 ,… , hoặc A m Mỗi phương án A i có n i cách thực hiện Số cách để thực hiện công việc A là

Ví dụ 1.1: Một nhóm có 15 sinh viên, trong đó có 5 nam và 10 nữ Ta chọn ngẫu nhiên một sinh viên từ nhóm làm nhóm trưởng Số cách để thực hiện việc chọn này là 15, tương ứng với số lượng thành viên trong nhóm, vì mỗi sinh viên có cơ hội được chọn như nhau.

Công việc của ta là chọn 1 sinh viên làm nhóm trưởng, công việc này có 2 phương án thực hiện:

- Phương án 1: Nhóm trưởng là sinh viên nam – có 5 cách chọn

- Phương án 2: Nhóm trưởng là sinh viên nữ – có 10 cách chọn

Vậy sốcách để chọn một sinh viên là nhóm trưởng là: n = 5 + 10 = 15 (cách) b Quy tắc nhân

Công việc A được chia thành m công đoạn A , , , 1 A 2 A m Ứng với mỗi cách thực hiện công đoạn A i có n i + 1 cách thực hiện công đoạn A i+ 1 Số cách để thực hiện công việc A là

Ví dụ 1.2 mô tả một doanh nhân dự định đi từ Kiên Giang tới Hà Nội qua Thành phố Hồ Chí Minh và đặt vấn đề là ông ta có bao nhiêu cách đi Bài toán cho biết từ Kiên Giang tới Thành phố Hồ Chí Minh có một số lựa chọn di chuyển và từ Thành phố Hồ Chí Minh tới Hà Nội cũng có một số cách đi, và mục tiêu là đếm tất cả các tuyến đường phù hợp để tính tổng số cách đi từ Kiên Giang đến Hà Nội qua TP Hồ Chí Minh.

Chí Minh có thể dùng một trong ba phương tiện: ô tô, tàu thủy, máy bay; từ Thành phố

Hồ Chí Minh tới Hà Nội có thể dùng một trong bốn phương tiện: ô tô, tàu hỏa, tàu thủy, máy bay

Công việc A: đi từ Kiên Giang tới Hà Nội được chia thành 2 công đoạn

- Công đoạn 1: đi từ Kiên Giang Thành phố Hồ Chí Minh, có 3 cách thực hiện.

- Công đoạn 2: đi từ Thành phố Hồ Chí Minh tới Hà Nội , có 4 cách thực hiện

Vậy số cách đi từ Kiên Giang tới Hà Nội là: 3.4 12 = (cách)

1.1.2 Hoán vị Định nghĩa: Cho một tập có n phần tử Mỗi cách sắp đặt các phần tử của tập hợp đó theo một thứ tự nhất định gọi là một hoán vị của n phần tửđó.

Số các hoán vị của n phần tử, kí hiệu là P n :

Ví dụ 1.3.Sắp chỗ ngổi cho 3 học sinh A, B, C trên một bàn, ta có số cách sắp xếp là 3! 6= cách như sau: ABC, ACB, BAC, BCA, CAB, CBA.

1.1.3 Chỉnh hợp Định nghĩa: Lấy ngẫu nhiên ra k phần tử từ một tập có n phần tử, hai cách lấy gọi là khác nhau nếu chúng có ít nhất một phần tử khác nhau hoặc thứ tự lấy ra của các phần tử khác nhau Số cách lấy ra k phần tử như vậy gọi là chỉnh hợp chập k của n phần tử, ký hiệu là: A n k , xác định bởi công thức : k

Ví dụ 1.4: Chọn ngẫu nhiên 2 người trong 5 người đi làm nhiệm vụ, người nào được chọntrước sẽ làm nhóm trưởng Hỏi có bao nhiêu cách chọn

Số cách chọn là A 5 2 = 20 cách

1.1.4 Chỉnh hợp lặp Định nghĩa: Chỉnh hợp lặp chập k của n phần tử là một nhóm có thứ tự gồm k phần tử và mỗi phần tử có thể lặp lại lấy từ n phần tử đã cho Số các chỉnh hợp lặp chập k của n phần tử, kí hiệu là k n

Ví dụ 1.5: Với các chữ số 1, 2, 3, 4 có thể viết được bao nhiêu số có 3 chữ số?

Số các số có 3 chữ số là chỉnh hợp lặp chập 3 của 4

1.1.5 Tổ hợp Định nghĩa: Lấy ngẫu nhiên ra k phần tử từ một tập có n phần tử, hai cách lấy gọi là khác nhau nếu chúng có ít nhất một phần tử khác nhau Số cách lấy ra k phần tửnhư vậy gọi là tổ hợp chập k của n phần tử, ký hiệu là:C n k , xác định bởi công thức : k

Ví dụ 1.6 Có bao nhiêu cách lập hội đồng gồm 3 người trong tổng số8 người?

Hội đồng là nhóm 3 người lấy ngẫu nhiên từ 8 người, do đó số cách lập hội đồng là

Phép th ử và bi ế n c ố

Trong tự nhiên và xã hội, mọi hiện tượng luôn gắn với một tập hợp các điều kiện cơ bản Chỉ khi nhóm điều kiện cơ bản này được thực hiện đầy đủ thì hiện tượng mới xảy ra Vì vậy, để nghiên cứu một hiện tượng, cần xác định và đảm bảo thực hiện đúng nhóm điều kiện cơ bản liên quan.

Ví dụ, để đánh giá chất lượng của một lô sản phẩm, ta lấy ngẫu nhiên một hoặc một số sản phẩm từ lô đó để kiểm tra Việc thực hiện các điều kiện cơ bản nhằm quan sát xem một hiện tượng nào đó có xảy ra hay không được gọi là thực hiện một phép thử, và hiện tượng đó có thể xuất hiện trong kết quả của phép thử được gọi là biến cố (sự kiện).

Trong thực tế ta có thể gặp các loại biến cố sau đây:

- Biến cố chắc chắn:là biến cố nhất định sẽ xảy ra khi thực hiện phép thử

Biến cố chắc chắn được ký hiệu là: 

- Biến cố không:là biến cố không thể xảy ra khi thực hiện phép thử

Biếncố không được ký hiệu là: 

- Biến cố ngẫu nhiên: là biến cố có thể xảy ra hoặc không xảy ra khi thực hiện phép thử

Các biến cố ngẫu nhiên thường được ký hiệu bởi các chữ cái: A, B, C

Ví dụ 1.7 Tung một đồng tiền xu xuống đất là một phép thử, còn việc xuất hiện mặt nào đó là biến cố Ta có hai biến cố:

Ví dụ 1.8.Gieo một son súc sắc là một phép thử

- Gọi A là biến cố “xúc xắc xuất hiện mặt có số chấm nhỏ hơn hoặc bằng sáu” thì A là biến cố chắc chắn.

- Gọi B là biến cố “ xuất hiện mặt 7 chấm” thì B là biến cố không

- Gọi A k = “Xuất hiện mặt k chấm” Khi đó: A1, A 2 , A 6 là các biến cố ngẫu nhiên

1.2.2 Các phép toán và mối quan hệ giữa các biến cố a Quan hệ kéo theo

Biến cố A gọi là kéo theo biến cố B khi và chỉ khi A xảy ra thì B cũng xảy ra

Mô tả hình học của quan hệ kéo theo có thể hình dung A là tập con của tập B

Hình 1.1: Minh họa hình học quan hệ kéo theo b Quan hệtương đương

Hai biến cố A và B gọi là tương đương khi và chỉ khi A xảy ra thì B cũng xảy ra và ngược lại

Ký hiệu: A = B c Biến cố tổng

Biến cố C gọi là biến cố tổng của hai biến cố A, B nếu C xảy ra khi có ít nhất

A hoặc B xảy ra Ký hiệu C= A+ B

- Biến cố sơ cấp là biến cố không thể phân tích thành tổng của các biến cố khác

Mọi biến cố ngẫu nhiên A có thể biểu diễn dưới dạng tổng (hợp) của các biến cố sơ cấp Các biến cố sơ cấp nằm trong tổng này được gọi là các biến cố thuận lợi cho biến cố A Việc biểu diễn A dưới dạng hợp các biến cố thuận lợi cho A cho phép ta suy xét xác suất của A dựa trên xác suất của các biến cố sơ cấp; nếu các biến cố thuận lợi này là rời nhau, xác suất của A bằng tổng xác suất của chúng, là nền tảng cho phân tích xác suất và các ứng dụng thống kê liên quan.

Biến cố chắc chắn Ω là tổng của mọi biến cố sơ cấp có thể có, tức là mỗi biến cố sơ cấp có thể xảy ra đều thuộc về Ω Vì vậy, Ω được xem là không gian mẫu (không gian các biến cố sơ cấp) của thí nghiệm, đại diện cho tập hợp tất cả các kết quả có thể xảy ra.

Ví dụ 1.9 minh họa cách gieo đồng thời hai con súc sắc C được định nghĩa là tổng số chấm hiển thị trên hai con sau khi gieo A là biến ngẫu nhiên cho biết con súc sắc thứ nhất xuất hiện mặt 1 chấm, B là biến ngẫu nhiên cho biết con súc sắc thứ hai xuất hiện mặt 1 chấm Khi đó C = A + B.

Mô tả hình học của biến cố tổng có thể hình dung C là hợp của hai tập hợp A và B

Hình 1.2: Minh họa hình học biến cố tổng d Biến cố hiệu

Biến cố C gọi là hiệu của hai biến cố A và B nếu C xảy ra khi và chỉ khi A xảy ra còn B không xảy ra Ký hiệu C= A B\

Chú ý: Hai biến cố A B \ và B A\ nói chung thường khác nhau

Mô tả hình học của biến cố hiệu có thể hình dung C là hiệu của hai tập hợp A và B

Hình 1.3: Minh họa hình học biến cố hiệu e Biến cố tích

Biến cố C gọi là tích của hai biến cố A và B nếu C xảy ra khi và chỉ khi A, B đồng thời xảy ra Ký hiệu C = AB

Ví dụ 1.10 Hai xạ thủ cùng bắn vào mục tiêu, mỗi người bắn một viên đạn

Gọi C = “mục tiêu bị trúng 2 viên đạn”,

A = “xạ thủ thứ nhất bắn trúng mục tiêu”,

B = “xạ thủ thứ hai bắn trúng mục tiêu”

Mô tả hình học của biến cố tích có thể hình dung C là giao của hai tập hợp A và B

Hình 1.4: Minh họa hình học giao của hai biến cố f Biến cố xung khắc

Hai biến cố A và B gọi là xung khắc nếu A và B không đồng thời xảy ra,tức là: A.B = 

Nhóm n biến cố A1, A 2 , A n được gọi là xung khắc từng đôi nếu hai biến cố bất kỳ trong n biến cố này đều xung khắc với nhau.

Ví dụ 1.11 Gieo một con súc sắc Gọi A i (i = 1 6) là biến cố: “xúc xắc xuất hiện mặt i chấm“ Nhóm 6 biến cố A 1 , A 2 , A 6 là xung khắc từng đôi. g Biến cố độc lập

Hai biến cố A và B được gọi là độc lập khi sự xảy ra hay không xảy ra của biến cố này không làm ảnh hưởng tới sự xảy ra hay không xảy ra của biến cố kia, và ngược lại Nói cách khác, việc A xảy ra không cung cấp bất kỳ thông tin nào về xác suất xảy ra của B, và tương tự đối với B Trong trường hợp độc lập, xác suất giao của A và B bằng tích xác suất của A và B: P(A∩B)=P(A)P(B).

Ví dụ 1.12 minh họa tính độc lập của các biến cố trong xác suất: trong một cơ quan có 3 ô tô, gọi Ai là biến cố "ô tô thứ i bị hỏng" (i = 1, 2, 3) Rõ ràng, ô tô bị hỏng ở xe này không ảnh hưởng tới các xe kia và ngược lại, cho thấy các biến cố Ai là độc lập với nhau và có thể được xem xét riêng lẻ khi phân tích xác suất.

Vậy: A1, A 2 , A 3 là các biến cố độc lập h Biến cốđối

Biến cố A được gọi là biến cốđối của biến cố A nếu nó xảy ra khi và chỉ khi

A không xảy ra và ngược lại

Ví dụ 1.13.Khi gieo một con xúc xắc Gọi

A là biến cố “xuất hiện mặt chẵn“,

B là biến cố “xuất hiện mặt lẻ”

Rõ ràng A và B là hai biến cố đối lập nhau.

Nếu A và B là hai biến cốđối lập thì A và B xung khắc nhau i Quy tắc đối ngẫu De Morgan:

1.2.3 Nhóm đầy đủ các biến cố

Một nhóm các biến cố A1, A2, , An (n ≥ 2) của một phép thử được gọi là nhóm đầy đủ khi thỏa mãn hai điều kiện: i) các biến cố xung khắc với nhau từng đôi một, tức là Ai ∩ Aj = ∅ với mọi i ≠ j; ii) tổng của chúng A1 ∪ A2 ∪ ∪ An là một biến cố chắc chắn, nghĩa là P(A1 ∪ A2 ∪ ∪ An) = 1 Nhóm đầy đủ cho biết mọi kết quả của phép thử thuộc vào một biến cố trong nhóm và các biến cố này không trùng lặp với nhau.

Ví dụ 1.14 Gieo một con xúc xắc a) A i = “Xuất hiện mặt i chấm” , i = 1 , 6

{A 1 , A 2 , A 3 , A 4 , A 5 , A 6 } là một hệđầy đủ b) A = “Xuất hiện mặt 1 chấm”

A , A là m ột hệđầy đủ c) A = “Xuất hiện mặt chẵn”; B = “Xuất hiện mặt lẻ”

Xác su ấ t

Như ta đã thấy, việc biến cố ngẫu nhiên xảy ra hay không xảy ra trong kết quả của phép thử là điều không thể đoán trước được Tuy nhiên bằng trực quan ta có thể nhận thấy các biến cố ngẫu nhiên khác nhau có những khảnăng xảy ra khác nhau

Chẳng hạn: biến cố “Xuất hiện mặt sấp” khi tung một đồng xu sẽ có khả năng xảy ra lớn hơn nhiều so với biến cố “ Xuất hiện mặt có 2 chấm” khi tung một con xúc xắc

Việc lặp đi lặp lại một phép thử ở cùng điều kiện cho thấy tính ngẫu nhiên của biến cố dần trở nên được mô tả bởi những quy luật xác suất nhất định Xác suất xảy ra của biến cố sẽ phản ánh các quy luật này và cho phép ta định lượng một cách khách quan sự xuất hiện của biến cố đó Nhờ sự định lượng này, dữ liệu thí nghiệm biến thành thông tin có giá trị để dự đoán và đánh giá các biến cố trong các tình huống tương tự.

Xác suất của một biến cố là một con sốđặc trưng khả năng khách quan xuất hiện biến cốđó khi thực hiện phép thử

1.3.2 Các định nghĩa xác suất a Định nghĩa cổ điển về xác suất

Xác suất của biến cố A là 1 số không âm, kí hiệu P(A), biểu thị khảnăng xảy ra của biến cốA và được xác định như sau:

Trong đó m : là số trường hợp thuận lợi cho A n: Số trường hợp của phép thử

Ví dụ 1.15: Một lô sản phẩm có 10 sản phẩm, trong đó 8 chính phẩm và 2 phế phẩm Lấy ngẫu nhiên từ lô sản phẩm đó 3 sản phẩm Tìm xác suất cho các trường hợp liên quan, ví dụ xác suất rút được đúng 3 chính phẩm hoặc có ít nhất một phế phẩm Bài toán này thường được giải bằng phân phối hypergeometric để xác định xác suất khi rút không thay thế từ một tập hợp gồm 8 chính phẩm và 2 phế phẩm.

13 a) Cả 3 sản phẩm lấy ra đều là chính phẩm. b) Trong 3 sản phẩm lấy ra có 2 chính phẩm.

Tổng số kết quả cùng khả năng có thể xảy ra trong phép thử là: n = C 10 3 = 120 a) Gọi A là biến cố “lấy được 3 chính phẩm”.

Số kết quả thuận lợi cho biến cố A xảy ra là m = C 3 8V

Do đó: P(A) = 56/120 = 7/15 b) Gọi B là biến cố “trong ba sản phẩm lấy ra có 2 chính phẩm”

Số kết quả thuận lợi cho B xảy ra là: m = C C8 2 1 2 = 56

Do đó: P(B) = 56/120 = 7/15 b Định nghĩa thống kê về xác suất

Nếu số kết quả có thể của một phép thử là vô hạn hoặc hữu hạn nhưng không đồng khả năng, cách tính xác suất cổ điển như đã trình bày sẽ không còn đúng đắn nữa Trong trường hợp này, khi các kết quả không có xác suất bằng nhau, ta không thể áp dụng các công thức dựa trên giả định đồng nhất mà phải dùng các mô hình xác suất phức tạp hơn, như phân phối xác suất không đồng đều, xác suất có điều kiện hoặc các phương pháp ước lượng dựa trên dữ liệu thực tế Vì vậy, để đánh giá xác suất một cách chính xác, cần tiếp cận lý thuyết xác suất hiện đại và các công cụ thống kê phù hợp với phân phối của hệ thống, nhằm mô tả đúng các sự kiện và các kết quả có thể xảy ra.

Giả sử số phép thử có thểđược lặp đi lặp lại rất nhiều lần trong những điều kiện giống hệt nhau

Nếu trong n lần thực hiện phép thử đó, biến cố A xuất hiện k lần thì tỷ số: f n (A) n k được gọi là tần suất xuất hiện của biến cố A trong n phép thửđó.

Bằng thực nghiệm, người ta chứng tỏ được khi số phép thử n tăng ra vô hạn thì tần suất f n (A) luôn dần tới 1 giới hạn nhất định

Ta gọi giới hạn đó là xác suất của biến cốA theo nghĩa thống kê

Ví dụ 1.16 mô tả cách nghiên cứu khả năng xuất hiện mặt sấp khi tung một đồng tiền Để ước lượng xác suất mặt sấp, người ta tiến hành tung đồng tiền nhiều lần và ghi nhận kết quả cho mỗi lần, từ đó tính tỉ lệ mặt sấp xuất hiện trên tổng số lượt tung Kết quả thực nghiệm cho phép so sánh với xác suất lý thuyết, đánh giá mức độ ngẫu nhiên của hiện tượng và nhận diện tác động của kích thước mẫu đến ước lượng xác suất Phương pháp này minh hoạ cách thu thập dữ liệu thực nghiệm về xác suất và đóng vai trò nền tảng cho các phân tích thống kê về biến cố hai khả năng.

Sốlần được mặt sấp (k) Tần suất f n (A) n k

Qua ví dụ trên, khi số phép thử tăng lên, tần suất xuất hiện mặt sấp dao động ngày càng ít quanh giá trị không đổi là 0,5 Đây là minh chứng cho định lý số lớn trong xác suất: với số lần lật càng lớn, xác suất quan sát được của mặt sấp tiến gần đến 0,5 và tỷ lệ xuất hiện của mặt sấp trong mẫu sẽ dần hội tụ về 0,5. -**Support Pollinations.AI:** -🌸 **Ad** 🌸Powered by Pollinations.AI free text APIs [Support our mission](https://pollinations.ai/redirect/kofi) to keep AI accessible for everyone.

Định nghĩa thống kê về xác suất có ưu điểm nổi bật là không đòi hỏi các điều kiện áp dụng như ở các định nghĩa cổ điển Thay vì dựa vào các giả thiết lý thuyết phức tạp, nó hoàn toàn dựa trên các quan sát thực tế để làm cơ sở kết luận về xác suất xảy ra của một biến cố.

Trong thực tế, không thể tiến hành vô hạn phép thử Tuy nhiên, với một số lượng phép thử đủ lớn, ta có thể xem xác suất thực nghiệm xấp xỉ bằng tần suất quan sát được, từ đó ước lượng xác suất một cách tin cậy dựa trên dữ liệu thực nghiệm.

1.3.3 Tính chất của xác suất a) 0  P(A)  1 b) P() = 0 ; P() = 1 c) P(A) = 1 – P(A)

1.3.4 Các công thức tính xác suất a Xác suất có điều kiện

Cho 2 biến cố A và B Xác suất có điều kiện của A với điều kiện B, kí hiệu

P B , là xác suất của biến cốA được tính trong điều kiện biến cốB đã xả ra.

B m m trong đó: m AB là số các khảnăng thuận lợi cho biến cố AB m B là số các khảnăng thuận lợi cho biến cố B

- Nếu A, B là 2 biến cốđộc lập thì P   AB P   AB = P(A)

Ví dụ 1.17: Trong hộp có 5 bi đỏ và 3 bi xanh, ta rút hai viên bi liên tiếp và biết viên đầu tiên là bi xanh; xác suất viên thứ hai cũng là bi xanh bằng 2/7, vì sau khi đã lấy đi một viên xanh còn lại 5 bi đỏ và 2 bi xanh, tổng số viên là 7.

Gọi A = “viên thứ nhất lấy ra là bi xanh”

B = “viên thứ hai lấy ra là bi xanh”

Sau khi lấy ra viên thứ nhất là bi xanh, trong hộp còn 5 bi đỏ và 2 bi xanh suy ra ( / ) 2

Trong ví dụ này, một hộp kín chứa 6 thẻ ATM của ACB và 4 thẻ ATM của Vietcombank được rút hai thẻ liên tiếp không hoàn lại Nếu thẻ đầu tiên rút được là thẻ của ACB, thì sau khi rút còn lại 5 thẻ ACB và 4 thẻ Vietcombank, tổng cộng 9 thẻ Vì vậy xác suất để thẻ thứ hai rút được là Vietcombank là 4/9.

Gọi A là biến cố “lần thứ hai lấy được thẻ ATM Vietcombank”

B là biến cố “lần thứ nhất lấy được thẻ ATM của ACB“

Ta thấy, sau khi lấy lần thứ nhất (biến cố B đã xảy ra) trong hộp còn lại 9 thẻ (trong đó 4 thẻ Vietcombank) nên : P(A/B) = 4/9 b Công thức nhân xác suất

Theo công thức xác suất có điều kiện:

P(A.B) = P(A).P(B/A) = P(B).P(A/B) Bằng quy nạp có thể chứng minh:

P(A.B.C) = P(A) P(B/A) P(C/AB) P(A 1 A 2 A 3 A n ) = P(A 1 ) P(A 2 /A 1 ) P(A 3 /A 1 A 2 ) P(A n /A 1 A 2 …An-1) Chú ý: Nếu các biến cố A 1 , A 2 , A n đôi một độc lập thì

Ví dụ 1.19: Một thủ kho có một chùm 9 chìa khóa bề ngoài giống nhau, trong đó chỉ có 2 chiếc mở được cửa kho Anh ta thử ngẫu nhiên lần lượt từng chìa khóa và loại bỏ những chìa khóa không mở được cho tới khi mở được cửa kho Xác suất mở được cửa kho đúng ở lần thử thứ ba (tức mở lần thứ ba) là bằng cách hai lần thử đầu tiên đều sai và lần thử thứ ba là chìa khóa đúng Tính toán: hai lần đầu tiên sai có xác suất (7/9) × (6/8) = 7/12; sau đó còn lại 7 chìa khóa, trong đó có 2 chìa khóa mở cửa, nên xác suất chìa khóa thứ ba mở được cửa là 2/7 Do đó xác suất mở cửa kho đúng ở lần thử thứ ba là (7/12) × (2/7) = 1/6 Như vậy, xác suất mở cửa kho sau đúng 3 lần thử chìa là 1/6 (tương đương khoảng 16,7%).

Gọi A i là biến cố“mở được cửa kho ở lần thử thứi”, i = 1 8

A là biến cố “mở được cửa kho sau 3 lần thử chìa”

 A = A A A 1 2 3 Áp dụng công thức nhân xác suất, ta có:

Ví dụ 1.20 kể về một thùng đựng n sản phẩm, trong đó có m phế phẩm (m < n) Ta rút ngẫu nhiên một sản phẩm và sau đó rút tiếp một sản phẩm thứ hai, với điều kiện sản phẩm rút lần đầu không được bỏ trở lại thùng Mục tiêu là tính xác suất sao cho sản phẩm rút đầu tiên là phế phẩm và sản phẩm rút thứ hai là chính phẩm.

Gọi A là biến cố“sản phẩm rút đầu là phế phẩm”

B là biến cố “sản phẩm rút sau là chính phẩm”

Khi đó xác suất cần tìm là

Ví dụ 1.21 mô tả một công nhân vận hành 3 máy, các máy hoạt động độc lập với nhau Xác suất để mỗi máy không bị hỏng trong thời gian T lần lượt là 0.9, 0.8 và 0.7 Với tính độc lập giữa các máy, xác suất cả 3 máy cùng không bị hỏng là 0.9 × 0.8 × 0.7 = 0.504, do đó xác suất có ít nhất một máy bị hỏng trong thời gian T bằng 1 − 0.504 = 0.496 (tức 49,6%).

Gọi A là biến cố“máy 1 không bị hỏng trong thời gian T”

B là biến cố “máy 2 không bị hỏng trong thời gian T”

C là biến cố “máy 3 không bị hỏng trong thời gian T”

Dễ thấy, 3 biến cốA, B, C là độc lập với nhau

Xác suất để cả ba máy không bị hỏng trong thời gian T là

Sự kiện có ít nhất 1 máy hỏng đối lập với sự kiện A.B.C

Vậy xác suất cần tìm là:

Ví dụ 1.22 cho thấy áo sơ mi của công ty phải qua hai lần kiểm tra để xuất khẩu sang Mỹ; để đạt chuẩn, áo phải vượt qua cả hai lần kiểm tra Xác suất áo qua lần kiểm tra thứ nhất là 98%, và với áo đã vượt qua lần kiểm tra thứ nhất, xác suất qua lần kiểm tra thứ hai là 95% Vì hai lần kiểm tra độc lập, xác suất một chiếc áo đạt tiêu chuẩn xuất khẩu là 0.98 × 0.95 = 0.931, tức 93.1%.

Gọi A là biến cố “qua được lần kiểm trađầu tiên”

B là biên cố “qua được lần kiểm tra thứ 2”

C là biến cố “đủ tiêu chuẩn xuất khẩu”

Ta có: P(C) = P(AB) = P(A) P(B/A) = 0,98.0,95 = 0,931 c Công thức cộng xác suất

Chú ý: Nếu A, B là 2 biến cố xung khắc thì P(A + B ) = P(A) + P(B)

Biế n ng ẫ u nhiên

Khái ni ệ m v ề bi ế n ng ẫ u nhiên

Biến ngẫu nhiên hay đại lượng ngẫu nhiên (ĐLNN) là một đại lượng phụ thuộc vào kết quả của một phép thử, mang giá trị ngẫu nhiên và không thể dự đoán trước được ĐLNN gán cho mỗi kết quả của thí nghiệm một số lượng cụ thể và cho phép mô hình hóa các hiện tượng ngẫu nhiên trong xác suất và thống kê Việc nắm rõ định nghĩa và đặc tính của ĐLNN giúp phân tích phân bố xác suất, kỳ vọng và biến thiên của các biến trong các bài toán thực tế.

Các biến ngẫu nhiên thường được ký hiệu là X , Y , Z … hoặc X1 , X 2 … còn các giá trị có thể của nó được ký hiệu là x , y , z hoặc x 1 , x 2 …

Biến X được coi là ngẫu nhiên vì trước khi tiến hành phép thử ta không thể xác định chắc chắn X sẽ nhận giá trị nào mà chỉ có thể ước lượng với một xác suất nhất định Nói cách khác, X nhận một giá trị nào đó (X = x1), (X = x2), , (X = xn) về căn bản là các biến cố ngẫu nhiên Hơn nữa, trong kết quả của phép thử biến X sẽ nhận đúng một trong các giá trị có thể của nó, nên các biến cố (X = x1), (X = x2), , (X = xn) hình thành một tập hợp đầy đủ các biến cố.

Ví dụ 2.1: Gieo một con súc sắc Gọi X là số chấm xuất hiện sau lượt gieo X là biến ngẫu nhiên vì kết quả của phép thử có thể nhận một trong sáu giá trị: 1, 2, 3, 4, 5 hoặc 6.

2.1.2 Phân loạ i biến ngẫu nhiên

- Biến ngẫu nhiên được gọi là rời rạc nếu tập giá trị của nó là 1 tập hữu hạn hoặc vô hạn đếm được các phần tử

- Biến ngẫu nhiên được gọi là liên tục nếu các giá trị của nó có thể lấp đầy một khoảng trên trục số

Ví dụ 2.2 Biến cố X trong ví dụ 2.1 là biến ngẫu nhiên rời rạc

Ví dụ 2.3 Tuổi thọ hoặc chiều cao của con người là biến ngẫu nhiên liên tục.

Các phân phối xác suất của biến ngẫu nhiên

2.2.1 Bảng phân phối xác suất

Bảng phân phối xác suất chỉ dùng để mô tả quy luật phân phối xác suất của các biến ngẫu nhiên rời rạc

Giả sử biến ngẫu nhiên rời rạc X có thể nhận một trong các giá trị x1, x2, …, xn với xác suất tương ứng là p1, p2, …, pn Bảng phân phối xác suất của X cho biết các giá trị xi và xác suất đi kèm p(xi) = pi, tức p(x1) = p1, p(x2) = p2, …, p(xn) = pn Tổng các xác suất p1 + p2 + … + pn bằng 1 và mỗi xi có xác suất riêng, tạo thành bảng phân phối xác suất đầy đủ cho biến ngẫu nhiên rời rạc X.

Chú ý: Để tạo nên một quy luật phân phối xác suất thì các xác suất p i phải thoả mãn điều kiện:

Ví dụ 2.4 mô tả một xạ thủ có 3 viên đạn được yêu cầu bắn lần lượt cho đến khi trúng thì dừng Xác suất trúng ở mỗi lần bắn là 0,6, nên bảng phân phối xác suất của số đạn đã bắn được xác định như sau: N=1 với xác suất 0,6; N=2 với xác suất 0,24; N=3 với xác suất 0,16 Nguyên nhân: nếu trúng ở lượt đầu tiên thì số đạn đã bắn là 1; nếu bỏ lỡ lượt đầu và trúng ở lượt thứ hai thì số đạn đã bắn là 2; còn nếu hai lượt đầu tiên đều trượt thì sẽ bắn lượt thứ ba và số đạn đã bắn là 3 bất kể kết quả lượt cuối, nên xác suất N=3 bằng 0,4×0,4=0,16.

Giải: Đặt: A i = “Bắn trúng mục tiêu ở lần bắn thứi”, i = 1 3

Các biến cố Ai, A i là độc lập và P(Ai) = 0,6; P( A i ) = 0,4

Gọi X là “sốviên đạn bắn ra”  X = {1, 2, 3}

Suy ra: bảng phân phối xác suất của biến ngẫu nhiên X là:

X 1 2 3 p(x) 0,6 0,24 0,16 a Các phép toán đối với biến ngẫu nhiên rời rạc

- Phép cộng: Giả sửX và Y là các đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất như sau :

Khi đó X + Y là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là

Trong đó zk là các giá trị khác nhau của các tổng x i + y j và p’’k i j k

Phép nhân của hai đại lượng ngẫu nhiên rời rạc X và Y cho ra một đại lượng rời rạc X·Y Bảng phân phối xác suất của X·Y được xác định từ bảng phân phối của X và Y bằng: P(XY = z) = ∑ P(X = x, Y = y) với mọi cặp (x, y) sao cho x·y = z Nếu X và Y độc lập, công thức trên giản lược thành P(XY = z) = ∑_{x} P(X = x) P(Y = z/x) với điều kiện z/x là một giá trị thuộc miền hỗ trợ của Y; nếu không, xác suất sẽ bằng 0 Dạng tổng quát này cho phép xác định mọi khả năng của tích X·Y dựa trên thông tin phân phối của X và Y.

Trong đó zk là các giá trị khác nhau của các tích x i y j và i j k

Ví dụ 2.5 Cho hai đại lượng ngẫu nhiên X và Y có bảng phân phối xác suất lần lượt là:

Hãy lập bảng phân phối xác suất của các đại lượng X+Y, XY

Ta có hai bảng sau đây. Ở bảng thứ nhất (xem Bảng 1)

- dòng 1 ghi các giá trị của X,

- cột 1 ghi các giá trị của Y,

Trong bảng đầu tiên, các ô giữa ghi giá trị tương ứng của X+Y Kết quả ở mỗi ô là tổng các giá trị thuộc dòng 1 lần lượt với các giá trị thuộc cột 1, cho thấy rõ cách cộng X và Y tại từng vị trí Ở bảng thứ hai (xem Bảng 2) nguyên tắc này được lặp lại với dữ liệu khác để người đọc có thể đối chiếu nhanh chóng và nắm vững quy luật tính tổng X+Y cho từng ô.

- dòng 1 ghi xác suất ứng với mỗi giá trị của X,

- cột 1 ghi xác suất ứng với mỗi giá trị của Y,

- các ô giữa ghi xác suất ứng với mỗi giá trị của X+Y

Kết quả ở mỗi ô là tích các giá trị thuộc dòng 1 lần lượt với các giá trị thuộc cột 1

Từ Bảng 1 và Bảng 2 suy ra

Vậy bảng phân phối xác suất của X+Y là:

Để lập lại bảng giá trị của tích XY, ta làm theo mô hình của Bảng 1, nhưng ô giữa trong bảng mới sẽ là tích của các giá trị thuộc dòng 1 với các giá trị thuộc cột 1; nói cách khác, mỗi ô trong bảng mới là tích của một phần tử ở dòng đầu tiên với một phần tử ở cột đầu tiên, xem Bảng 3 để hình dung cấu trúc.

Từ Bảng 3 và Bảng 2 suy ra

Vậy, bảng phân phối xác suất của XY là:

2.2.2 Hàm phân phối xác suất

Khái niệm hàm phân phối xác suất áp dụng được đối với cả biến ngẫu nhiên rời rạc và liên tục

Giả sử X là một biến ngẫu nhiên bất kỳ và x là một số thực; ta xem xét sự kiện X nhận giá trị nhỏ hơn x, ký hiệu (X < x) Khi x thay đổi, xác suất P(X < x) cũng thay đổi theo, nên đây là một hàm của x Do đó, Hàm phân phối xác suất của biến ngẫu nhiên X được định nghĩa là F(x) = P(X < x), là xác suất để X nhận giá trị nhỏ hơn x với mọi x ∈ R.

F(x) = P(X < x) Tính chất: Hàm phân phối xác suất có các tính chất sau

(2) F(x) không giảm, tức là nếu x1 < x 2 thì F(x 1 ) ≤ F(x 2 )

Với X là biến ngẫu nhiên liên tục, P(X = x0) = 0 và F(x) là một hàm liên tục Ngược lại, nếu F(x) được xác định trên ℝ và có các tính chất (1)–(3) thì F(x) là hàm phân phối xác suất của một đại lượng ngẫu nhiên nào đó.

Chú ý: Nếu X là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất:

Với x 1 < x 2 < … < xn, thì hàm phân phối xác suất của X là:

,neáu ,neáu Ý nghĩa: Hàm phân phối xác suất phản ánh mức độ tập trung xác suất ở về phía bên trái số thực x nào đó.

Ví dụ 2.6: Một sinh viên thi ba môn Toán, Lý, Hóa với xác suất đỗ lần lượt là 0,6; 0,7; 0,8 Gọi X là số môn đỗ trong ba môn (đỗ nếu điểm thi ≥ 5) Giả sử các kỳ thi độc lập, hàm phân phối xác suất của X được cho bởi: P(X=0) = (1−0,6)(1−0,7)(1−0,8) = 0,024; P(X=1) = 0,6(1−0,7)(1−0,8) + (1−0,6)0,7(1−0,8) + (1−0,6)(1−0,7)0,8 = 0,188; P(X=2) = 0,6·0,7·(1−0,8) + 0,6·(1−0,7)·0,8 + (1−0,6)·0,7·0,8 = 0,452; P(X=3) = 0,6·0,7·0,8 = 0,336.

Gọi X là “số môn đỗ của sinh viên đó”  X 0,1, 2,3

Gọi T, L, H lần lượt là các biến cố sinh viên đó đậu Toán, Lý, Hóa Khi đó

Vậy, bảng phân phối xác suất của X là:

Từđó, ta có hàm phân phối xác suất của X là :

= ùù ớù ùùù ùùù ùùù ùùùợ

1 nếu x > 2 Đồ thị của hàm phân phối như sau:

Hình 2.1: Đồ thị hàm phân phối xác suất Chú ý: Khi lập hàm phân phối xác suất của biến ngẫu nhiên rời rạc cần lưu ý tới dấu

2.2.3 Hàm mật độ xác suất Định nghĩa: Nếu biến ngẫu nhiên liên tục X có hàm phân phối xác suất F(x) khả vi thì đạo hàm bậc nhất của hàm phân phối xác suất của biến ngẫu nhiên đó được gọi là hàm mật độ xác suất của X, ký hiệu là f(x) f(x) = F’(x) Chú ý: khái niệm hàm mật độ chỉ áp dụng được đối với biến ngẫu nhiên liên tục mà không áp dụng được đối với biến ngẫu nhiên rời rạc

Tính chất: Hàm mật độ xác suất có các tính chất sau

Ngược lại, một hàm số f(x) có các tính chất (1) – (2) phải là hàm mật độ xác suất của một đại lượng ngẫu nhiên nào đó.

Tìm k để f x ( )là hàm mật độ của biến ngẫu nhiên X?

Dễ thấy f x ( )³ 0," x , f x ( )là hàm mật độ khi và chỉ khi

Cho a, b ∈ ℝ với a < b và X là điểm ngẫu nhiên được chọn trong đoạn [a, b] Giả thiết xác suất X rơi vào các khoảng con bằng nhau trên [a, b] là như nhau nên X có phân phối đồng đều trên [a, b] Hàm mật độ xác suất của X là f_X(x) = 1/(b − a) khi x ∈ [a, b], và f_X(x) = 0 khi ngoài [a, b] Vì vậy ∫_a^b f_X(x) dx = 1, khẳng định X có phân phối đồng đều trên đoạn [a, b].

Vì xác suất P(a< X ≤ b) = 1, ta có

Vậy hàm phân phối của X là

Suy ra: hàm mật độ f(x) của X:

 Đồ thị của hàm phân phối và hàm mật độnhư sau:

Hình 2.2: Đồ thị hàm phân phối xác suất và hàm mật độ xác suất

Biến ngẫu nhiên X ở trên gọi là tuân theo luật phân phối đều trên [a, b], ký hiệu

Ví dụ 2.9 Biến ngẫu nhiên X có hàm mật độ k.cos x khi x

 a) Tìm k b) Tìm hàm phân phối F(x) c) Tính xác suất P(0 < X < π/4)

 tdt k k.2 = 1 k = 1/2 b) Tìm hàm phân phối F(x)

Suy ra: hàm phân phối xác suất là:

1 1/b-a a b a b hàm phân phối F(x) hàm mật độ f(x)

Các đặc trưng số c ủ a bi ế n ng ẫ u nhiên

2.3 Các đặc trƣng số của biến ngẫu nhiên

2.3.1 Kỳ vọng Định nghĩa: Kỳ vọng của biến ngẫu nhiên X, ký hiệu là EX và được xác định như sau:

- Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất là: thì E(X) = k i i i 1 x p

- Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f(x) thì EX =  

(4) Nếu X và Y là 2 biến ngẫu nhiên độc lập thì E(X.Y) = EX EY

(5) Nếu X là biến ngẫu nhiên rời rạc thì Y = g(X) cũng là biến ngẫu nhiên rời rạc có kỳ vọng: EY = k i i i 1 g(x ) p

(6) Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f(x) thì Y = g(X) cũng là biến ngẫu nhiên liên tục có kỳ vọng: EY = g(x)f(x)dx

Kỳ vọng của biến ngẫu nhiên, hay giá trị kỳ vọng, là giá trị trung bình mà biến ngẫu nhiên nhận được khi thí nghiệm được lặp đi lặp lại nhiều lần Nó phản ánh giá trị trung tâm của phân phối xác suất của biến ngẫu nhiên và đại diện cho điểm giữa của phân bố, là thước đo căn bản cho sự phân bố của biến ngẫu nhiên.

Ví dụ 2.10 Gieo một đồng xu 2 lần Gọi X = “số lần xuất hiện mặt sấp” Ta có bảng phân phối xác suất của X là: x i 0 1 2 p i 1/4 1/2 1/4

Ví dụ 2.11 Cho X là biến ngẫu nhiên có hàm mật độ

2.3.2 Phương sai Định nghĩa:Phương sai của biến ngẫu nhiên X, ký hiệu là VX và được xác định như sau:

Ta dễ dàng chứng minh được:

- Nếu X là biến ngẫu nhiên rời rạc thì E(X 2 ) = 

- Nếu X là biến ngẫu nhiên liên tục thì E(X 2 ) =  

Thật vậy: VX = E[(X – EX) 2 ] = E[(X 2 – 2(EX).X + (EX) 2 ]

(3) Nếu X, Y độc lập thì V(X + Y) = VX + VY Ý nghĩa:

Phương sai của biến ngẫu nhiên X, ký hiệu VX = E[(X − EX)^2], là trung bình bình phương độ lệch của X khỏi giá trị kỳ vọng EX Đây là một đại lượng không âm dùng để đo mức độ phân tán của các giá trị X quanh tâm EX Khi VX nhỏ, mức độ phân tán thấp và phân bổ tập trung quanh giá trị kỳ vọng; khi VX tăng, độ biến động và phân tán tăng lên Trong sản xuất và kinh doanh, phương sai thể hiện mức độ rủi ro hoặc sự bất ổn của quá trình và kết quả, cho biết mức độ dao động và nguy cơ thất bại của hệ thống.

(i) Trong thực hành tính toán phương sai VX, ta nên sử dụng công thức

Đơn vị của phương sai là bình phương của đơn vị đo của đại lượng ngẫu nhiên Khi cần đánh giá mức độ phân tán của các giá trị của đại lượng ngẫu nhiên theo đúng đơn vị đo của nó, người ta dùng một thước đo mới có cùng đơn vị với đại lượng ấy — độ lệch chuẩn.

Căn bậc hai của VX được gọi là độ lệch chuẩn của biến ngẫu nhiên X và được ký hiệu là (X):

Ví dụ 2.12 Cho đại lượng ngẫu nhiên X có bảng phân phối xác suất như sau

Hãy tính kì vọng, phương sai, độ lệch của X

E(X) = 0.0,1 + 1.0,2 + 2.0,3 + 3.0,25 + 4.0,15 = 2,15 Để tính phương sai, ta có hai cách sau

Cách 1: (Áp dụng công thức (2.1))

Cách 2: (Áp dụng công thức (2.2))

E(X 2 ) = 0 2 0,1 + 1 2 0,2 + 2 2 0,3 + 3 2 0,25 + 4 2 0,15 = 6,05 ; V(X) = E(X 2 ) – E 2 (X) = 6,05 – 2,15 2 = 1,4275 Độ lệch chuẩn của X là

Ví dụ 2.13 mô tả một xạ thủ có 5 viên đạn, anh ta bắn lần lượt từng viên và dừng bắn khi có hai viên liên tiếp trúng đích Xác suất trúng của mỗi viên là như nhau và bằng 0,9.

Gọi X là sốviên đạn còn lại a) Lập bảng phân phối xác suất của X b) Tính EX, VX

X = “Sốviên đạn còn lại” a) Bảng phân phối xác xuất của X là:

Ví dụ 2.14 Cho đại lượng ngẫu nhiên X có hàm mật độ xác suất f(x) ,

Tìm kì vọng, phương sai, độ lệch của X nếu x  (- a , a ) nếu x  (- a , a )

E(X) = 0 x a xodx xdx x a xodx xdx dx

(vì hàm số lấy tích phân là hàm lẻ) Phương sai của X là

2 π Đổi biến số x = asint, ta có

Ví dụ 2.15 Cho ĐLNN X có hàm mật độ

0 nếu trái lại a) Tìm hằng số a b) Tính EX VX,

Mode của biến ngẫu nhiên X, ký hiệu ModX, là giá trị tại đó biến X có xác suất lớn nhất (trường hợp rời rạc) hoặc có mật độ xác suất lớn nhất (trường hợp liên tục) Do đó, biến ngẫu nhiên X có thể có nhiều ModX khi nhiều giá trị chia sẻ cùng xác suất tối đa hoặc cùng mật độ xác suất tối đa.

Ví dụ 2.16 Cho biến ngẫu nhiên X có bảng phân phối xác suất là:

Trung vị của biến ngẫu nhiên X, ký hiệu MedX, là giá trị m sao cho:

Trung vị của biến ngẫu nhiên X là giá trị m sao cho P(X < m) = P(X ≥ m) = 0,5, nghĩa là phân phối được chia thành hai phần có xác suất bằng nhau Vì vậy trung vị là đặc trưng vị trí của X đáng tin cậy và thường hiệu quả hơn kỳ vọng trong nhiều ứng dụng, đặc biệt khi dữ liệu có ngoại lệ hoặc sai lệch quá mức.

Nếu X là biến ngẫu nhiên liên tục thì m là trung vị khi

Đối với biến ngẫu nhiên rời rạc X, giá trị trung vị không được xác định một cách duy nhất vì nhiều khi không tồn tại m sao cho F(m) bằng đúng 0,5 Vì vậy, người ta thường định nghĩa giá trị trung vị của X là một x_i thuộc tập hỗ trợ của X sao cho P(X ≤ x_i) ≥ 0,5 và P(X ≥ x_i) ≥ 0,5 Trong thực tế có thể chọn x_i nhỏ nhất thỏa mãn F(x_i) ≥ 0,5 hoặc chọn bất kỳ x_i nào thoả mãn hai điều kiện trên Cách định nghĩa này giúp xác định giá trị trung vị cho biến ngẫu nhiên rời rạc một cách hợp lý khi phân phối có nhiều điểm tích lũy ở ngưỡng 0,5.

Ví dụ 2.17 Cho X là biến ngẫu nhiên có hàm mật độ là:

Međian cần tìm từđiều kiện   1

          Trong 4 nghiệm này ta phải chọn sao cho m 0;2 do đó m  4  8 Vậy MedX 4 8

Các phân ph ố i xác su ất thườ ng dùng

2.4.1 Phân phối nhị thức a Bài toán

Xét một dãy n phép thử độc lập giống nhau, trong mỗi phép thử chỉ có 2 kết cục

47 hoặc xảy ra A hoặc không xảy ra A, và P(A) = p , P(A) = 1 - p = q không phụ thuộc vào số thứ tự của mỗi phép thử

Xác suất để trong dãy n phép thử độc lập nói trên, sự kiện A xuất hiện đúng k lần, ký hiệu P k và được xác định bởi công thức:

P k = C k n p k q n  k (2.3) Công thức (2.3) được gọi là công thức Becnulli

Gọi X là “Số lần xuất hiện biến cố A trong n phép thử độc lập” nói trên Ta thấy

X là biến ngẫu nhiên rời rạc với miền giá trị là: 0,1, 2, ,n 

Theo công thức Bernoulli: P X  k  = P k = C k n p k q n  k (2.4) b Định nghĩa

Biến ngẫu nhiên rời rạc X được gọi là có phân phối nhị thức với tham số n và p và ký hiệu X ~ B(n, p) (n ∈ N và 0 ≤ p ≤ 1) nếu X nhận một trong các giá trị từ 0 đến n, với xác suất tương ứng được tính bằng P(X = k) = C(n, k) p^k (1 − p)^{n − k} cho mọi k = 0, 1, , n Phân phối nhị thức mô tả số lần thành công trong n lần thử độc lập, mỗi lần thử có xác suất thành công là p, và là khuôn mẫu quan trọng cho các bài toán xác suất và thống kê liên quan đến biến cố nhị thức.

Xác suất thành công mỗi thí nghiệm là 40%, và 9 thí nghiệm được thực hiện độc lập, nên X ~ Binomial(n=9, p=0.4) a) Có đúng 6 thí nghiệm thành công: P(X=6)=C(9,6)(0.4)^6(0.6)^3=84×0.4^6×0.6^3≈0.07432 b) Có ít nhất 1 thí nghiệm thành công: P(X≥1)=1−(0.6)^9≈0.98992 c) Có ít nhất 8 thí nghiệm thành công: P(X≥8)=P(X=8)+P(X=9)=9×0.4^8×0.6+0.4^9≈0.00380.

Gọi X = “số thí nghiệm thành công“

X có phân phối nhị thức với tham số n = 9, p = 0.4 a) P X  6C 9 6 0, 4 0,6 6 4 0,04459 b) P X    1 1 P X  0 1 C 9 0 0,4 0,6 0 9 0,9899 c) P X  8P X   8 P X  9C 9 8 0,4 0,6 8 1 C 9 9 0,4 0,6 9 0 0,0038 c Định lý Nếu X ~ B(n , p) thì

(3) modX = [(n + 1)p] ([a] chỉ phần nguyên của a)

Ví dụ 2.19: Một xạ thủ bắn 40 viên đạn, mỗi viên có xác suất trúng mục tiêu là 0,7, do đó số viên trúng tuân theo phân phối nhị thức với n=40 và p=0,7 Kỳ vọng của số viên trúng là E[X]=np=40×0,7=28; phương sai là Var(X)=np(1−p)=40×0,7×0,3=8,4; độ lệch chuẩn là σ=√Var(X)=√8,4≈2,90 Như vậy, trung bình có khoảng 28 viên trúng mục tiêu, với độ biến thiên khoảng ±2,9 viên.

Ta có X  B (40 ; 0,7), tức là X có phân phối nhị thức với n = 40, p = 0,7 Do đó

Ví dụ 2.20 cho thấy X theo phân phối nhị phân với n = 20 và p = 0,6, tức là có 20 cử tri được chọn ngẫu nhiên và xác suất ủng hộ ông A là 0,6 Giá trị trung bình của X là μ = np = 12 và độ lệch chuẩn là σ = sqrt(np(1 − p)) = sqrt(4,8) ≈ 2,19; mốc (mode) của X là 12 (vì floor((n + 1)p) = floor(12,6) = 12, phân phối nhị phân có một chế độ tại k = 12) Xác suất P{X ≤ 1} bằng P(X = 0) + P(X = 1) = (0,4)^{20} + 20·(0,6)·(0,4)^{19} ≈ 3,31 × 10^{-7}.

Dễ thấy X có phân phối nhị thức với tham số n ; p =0,6; q = 0,4

Suy ra: EX = np = 12; VX = npq = 4,8; σX ≈ 2,19; modX = [12,6] = 12

2.4.2 Phân phối Poisson a Định nghĩa

Biến ngẫu nhiên rời rạc X có phân phối Poisson với tham số λ, ký hiệu X ~ Poisson(λ) X nhận các giá trị không âm 0, 1, 2, … và xác suất tương ứng được xác định bởi công thức P(X = k) = e^{-λ} λ^k / k!, với λ > 0. -**Support Pollinations.AI:** -🌸 **Ad** 🌸Powered by Pollinations.AI free text APIs [Support our mission](https://pollinations.ai/redirect/kofi) to keep AI accessible for everyone.

Chú ý: mối quan hệ giữa phân phối nhị thức và phân phối Poisson

Cho X  B (n, p) Nếu p khá bé và n khá lớn có thể xem X  P (np) Khi đó

X ∼ Poisson(λ = 2) với 4 chiếc ô tô trong gara a) P(X ≤ 3) = e^{-2}(1 + 2 + 2^2/2! + 2^3/3!) ≈ 0.8571 b) P(X ≥ 4) = 1 − P(X ≤ 3) ≈ 0.1429 c) Gara không đáp ứng được yêu cầu khi X > 4, nên P(X ≥ 5) = 1 − P(X ≤ 4) ≈ 0.0527 d) Để P(X > N) < 0.02, tối thiểu N = 5, vì P(X > 5) ≈ 0.0166 (< 0.02) còn với N = 4 thì P(X > 4) ≈ 0.0527 (> 0.02). -**Support Pollinations.AI:** -🌸 **Ad** 🌸Powered by Pollinations.AI free text APIs [Support our mission](https://pollinations.ai/redirect/kofi) to keep AI accessible for everyone.

Giải: a) P{Không phải tất cả 4 chiếc đều được thêu} = P{X ≤ 3} = 0,857 b) P{Tất cả 4 ô tô đều được thuê} = P{X  4} = 1 – P{X ≤ 3}

= 1 – 0,857 = 0,143 c) P{Gara không đáp ứng được yêu cầu} = P{X > 4}

49 d) Gọi n là số xe ô tô gara cần có Ta cần tìm n sao cho:

Trong lô cây giống gồm 10.000 cây, mỗi cây không ra hoa với xác suất p = 0,001 và các cây độc lập với nhau Biến ngẫu nhiên X là số cây không ra hoa và theo phân bố nhị thức Binomial(N = 10.000, p = 0,001) Xác suất có đúng 3 cây không ra hoa là P(X = 3) = C(10.000, 3) (0,001)^3 (0,999)^{9.997} ≈ 0,00757 Xác suất có nhiều nhất 5 cây không ra hoa là P(X ≤ 5) = Σ_{k=0}^5 C(10.000, k) (0,001)^k (0,999)^{10.000−k} ≈ 0,06725.

Ta thấy: p = 0,001 là khá bé và n = 10000 là khá lớn, cho nên có thể thay phân phối Nhi ̣ thức bằng phân phối Poisson với np = 10

Xác suất để trong lô cây giống có 3 cây không ra hoa là:

Xác suất để trong lô cây giống có nhiều nhất 5 cây không ra hoa là:

  b Định lý Giả sử X ~ P() Khi đó:

Ví dụ 2.23 Trong 1 cuốn sách có 1000 trang có 100 lỗi in sai Tính xác suất để: a) Khi mở ngẫu nhiên 1 trang không có lỗi nào, b) Khi mở ngẫu nhiên 3 trang có đúng 2 lỗi in sai

Giải a) Gọi X = “số lỗi in sai trong 1 trang”

X có phân phối Poisson với tham số 100 0,1

1000 Suy ra P X   0   e  0,1  0,9048 b) Gọi Y = “số lỗi in sai trong 3 trang”

Y có phân phối Poisson với tham số 3100 0,3

Phân phối chuẩn có một vai trò, vị trí rất quan trọng trong lý thuyết xác suất và trong thống kê cũng như ứng dụng trong thực tế, trong các lĩnh vực khoa học đời sống khác nhau

Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với tham số  và  2 ( >0) nếu hàm mật độ xác suất của nó có dạng: f(x)   2

Trong Hình 2.3 trình bày phân phối chuẩn, X được định nghĩa bởi hai tham số μ (trung bình) và σ^2 (phương sai) Trong trường hợp đặc biệt μ = 0 và σ^2 = 1, X được gọi là phân phối chuẩn tắc, ký hiệu N(0,1) Lúc đó hàm mật độ xác suất và hàm phân phối tương ứng có dạng f(x) = (1/√(2π)) e^{−x^2/2} và F(x) = ∫_{−∞}^{x} f(t) dt Việc chuẩn hóa X bằng Z = (X − μ)/σ giúp so sánh với phân phối chuẩn và dễ dàng tra cứu xác suất trên các khoảng bằng bảng chuẩn.

  còn đượ c g ọi là hàm Laplace

1) Ta công nhận tích phân: 2 2

(tích phân này gọi là tích phân Euler)

2) Từ phân phối chuẩn da ̣ng tổng quát chuyển về da ̣ng phân phối ch uẩn tắc bằng cách đổi biến: Y = X 

3) Mối quan hệ giữa phân phối nhị thức và phân phối chuẩn: Cho X  B (n, p) Khi n khá lớn, p không quá lớn và không quá bé, ta có:

       trong đó f là hàm mật độ Gauss, Φ là hàm Laplace

Do đó, khi n khá lớn và p không quá lớn và không quá bé thì X có xấp xỉ phân phối chuẩn, tức là X  N(,  2 ), trong đó

4) Cách tra bảng Laplace (bảng 3) như sau:

− Nếu x0  bảng sao cho x = x0 , thì ta có ngay (x) = (x 0 )

− Nếu x không có trong bảng, thì ta tìm cận x 1 , x 2 trong bảng gần x nhất: x 1 < x

Theo trên ta tra bảng tìm (−x) Sau đó ta có (x) = 1 − (−x).

Bài toán 2: Cho y  (0, 1), tra bảng tìm x thoả (x) = y

− Nếu x0  Bảng, (x0) = y, thì ta có ngay x = x 0

− Nếu y không có trong bảng, thì ta tìm cận y 1 , y 2 trong bảng gần y nhất: y 1 < y

Tra bảng tính z =  −1 (1 − y) như trên, sau đó đặt x = −z

Tra bảng 3: muốn tính (0.74) dóng hàng “0.7” và cột “4” ta gặp 0.7704 nên:

Ta có: 0.746 không có trong bảng nhưng |0.746 – 0.74| = 0.006 > |0.746 – 0.75| = 0.004 nên ta lấy gần đúng: (0.746) = 0.7734 b) Tính  −1 (0.9128);  −1 (0.9115);  −1 (0.9131);

Ta có: |0.9128 – 0.9115| = 0.0013 > |0.9128 – 0.9131| = 0.0003 nên lấy gần đúng:

 −1 (0.9128) ≈  −1 (0.9131) = 1.36 b Định lý Cho X là biến ngẫu nhiên có luật phân phối chuẩn N(μ, 2 ) thì:

Hình 2.4: Hàm mật độ của phân phối chuẩn

Hình 2.5: Độ lệch tiêu chuẩn

53 c Mệnh đề Cho X là biến ngẫu nhiên có luật phân phối chuẩn N(μ, 2 ) Với α > 0, ta có xác suất:

Ví dụ 2.25: Cho một loại chi tiết có độ dài μ, X tuân theo phân phối chuẩn N(μ, σ) với σ = 0.2 cm a) Xác suất để độ dài không lệch quá μ với dung sai 0.3 cm là P(|X−μ| ≤ 0.3) = P(|Z| ≤ 0.3/0.2) = 2Φ(1.5) − 1 ≈ 0.866, tức 86.6% b) Để tỉ lệ phế phẩm không vượt quá 5%, cần dung sai α sao cho P(|X−μ| ≤ α) ≥ 0.95, tức α = z0.975 · σ ≈ 1.96 × 0.2 ≈ 0.392 cm.

Giải a) Xác suất cần tính là:

= 2 0,9332 = 0.8664 Như vậy tỉ lệ phế phẩm là 1 – 0,8664 = 13% b) Dung sai α phải thoả mãn:

Qui tắc 3: Trong công thức

P(|X − μ | < α) = 2.(α/) − 1 nếu chọn α = 3 thì ta có

P(|X − μ | < 3) = 2.(3) - 1 = 2.0,9987 – 1 = 0,9973 Xác suất này rất gần 1 nên có thể coi sự kiện |X − μ | < 3. là hầu như chắc chắn

Vậy ta có qui tắc 3: “Nếu X có phân phối chuẩn N(a,) thì hầu như chắc chắn

X lấy trị số trong khoảng (μ − 3, μ + 3)

Trọng lượng của một loại sản phẩm do một nhà máy sản xuất là ngẫu nhiên tuân theo phân phối chuẩn với kì vọng μ = 250 gam và phương sai σ^2 = 25 (σ = 5) Sản phẩm được gọi là loại một nếu trọng lượng từ 245 gam đến 260 gam Tỉ lệ sản phẩm loại một của nhà máy đó là P(245 ≤ X ≤ 260) = P(-1 ≤ Z ≤ 2) với Z ~ N(0,1) = Φ(2) − Φ(-1) ≈ 0.97725 − 0.15866 ≈ 0.81859 Vậy khoảng 81.86% sản phẩm là loại một.

Gọi X là trọng lượng của loại sản phẩm đó

Theo bài ra, ta có: a = 245, b = 260 ,  = 250,  = 25 = 5

Tra bảng hàm sốLaplace, ta được  (1) = 0,8413,  (2) = 0,8772

Vậy, tỉ lệ sản phẩm loại một của nhà máy là

Ví dụ 2.27 xem xét quy trình đóng gói tại một nhà máy: mỗi hộp chứa 10 sản phẩm Gọi X là số sản phẩm loại một có mặt trong một hộp, và X tuân theo một phân phối xác suất được cho trước như sau:

Chúng tôi tiến hành kiểm tra 300 hộp theo quy trình kiểm tra chất lượng: mỗi hộp được chọn ngẫu nhiên 3 sản phẩm để kiểm tra, và nếu trong số đó có ít nhất 2 sản phẩm loại một thì hộp đó được nhận.

55 a) Tìm xác suất để có ít nhất 240 hộp được nhận, b) Tìm số hộp được nhận có khảnăng lớn nhất

Xem phép thử là kiểm tra một hộp, ta có n = 300 phép thử độc lập

Gọi N là biến cố nhận hộp Ta tính P(N) = p.

Gọi N i là biến cố có i sản phẩm loại một trong 3 sản phẩm được kiểm tra ở mỗi hộp, i= 0 , 3

Ta có: N = N 2 + N 3 và N 2 , N 3 xung khắc

Gọi M_k là biến cố có đúng k sản phẩm loại một trong số 10 sản phẩm của hộp, k = 0,1, ,10 Theo đề bài, M7, M8, M9 và M10 tạo thành một nhóm đầy đủ vì chúng không giao nhau và tổng xác suất của chúng bằng 1 Áp dụng công thức xác suất đầy đủ, ta có P(M7) + P(M8) + P(M9) + P(M10) = 1.

Các xác suất P(Mk), k = 7,10, đã được cho trong bảng phân phối xác suất của X; bằng định nghĩa ta tính được:

Vậy: P(N) = 0,335 + 0,41 = 0,745 a) Gọi Y là số hộp được nhận trong 300 hộp đã kiểm tra

Ta có Y  B(300 ; 0,745), vì n khá lớn , p không quá lớn, không quá bé nên có thể xem Y có xấp xỉ phân phối chuẩn Y  N(,  2 ), với  = np = 223,5 ;

 2 = np(1 – p) = 56,9925,  = 7,5493 Áp dụng hàm số Laplace, ta được

Vậy, số hộp được nhận có khả năng lớn nhất là 224 hộp

Lý thuy ết ước lượ ng

Ki ểm đị nh gi ả thuy ế t th ố ng kê

Phân tích hồ i quy

Ngày đăng: 21/02/2022, 12:36

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm