q Khi hai dãy số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau hoặc xấp xỉ nhau thì việc đánh giá hai nhóm được dựa vào phương sai và độ lệch chuẩn. q Nếu phương sa[r]
Trang 1Giáo Viên: Trịnh Mỹ Ái
Trang 2Ví dụ mở đầu: Khi điều tra “Năng suất lúa hè thu năm 1998” của 31 tỉnh, người ta thu
thập được các số liệu ghi trong bảng dưới đây
Bảng 1: Năng suất lúa hè thu (tạ/ha) năm 1998 của 31 tỉnh
Ø Dấu hiệu điều tra: là năng suất lúa hè thu năm 1998 của 31 ở mỗi tỉnh.
Ø Số thiệu thống kê: là các số liệu trong bản số liệu, còn được gọi là giá trị của dấu hiệu
Có 5 giá trị khác nhau: 25, 30, 35, 40, 45 Kí hiệu: x i ! = #, %, &, ',
Trang 3Bảng 1: Năng suất lúa hè thu (tạ/ha) năm 1998 của 31 tỉnh
1 Tần số: của một giá trị là số lần xuất hiện của giá trị đó trong bảng số liệu
Trang 4+ Giá trị x 1 =25 có số lần xuất hiện là 4 nên ta nói giá trị x 1 =25 có tần số bằng 4 hay n 1 =4 + Tương tự: n 2 =7; n 3 =9; n 4 =6; n 5 =5 lần lượt là tần số của các giá trị !" = 25; !' = 30; !* = 35;
+ Tần suất của giá trị x1 =25 là: ." = *"+ ≈ 12,9%
+ Tương tự: .' ≈ 22,6%; * ≈ 29%; + ≈ 19,4%; - ≈ 16,1% lần lượt là tần suất của các giá trị
!" = 25; !' = 30; !* = 35; !+ = 40; !- = 45
Lưu ý: Tổng các tần suất bằng 100%
Trang 6Năng suất lúa
Trang 8Lớp số đo chiều cao
Trang 95 Số trung bình cộng
a) Sử dụng số liệu từ bảng phân bố tần số, tần suất:
̅" = $%"% + $'"'+ +$)")
$ = *%"% + *'"'+ +*)")Trong đó $+; *+ lần lượt là tần số, tần suất của giá trị "+; $ là số các số liệu thống kê
Trang 10b) Sử dụng số liệu từ bảng phân bố tần số và tần suất ghép lớp
̅" = $%&% + $(&(+ +$*&*
$ = +%&% + +(&(+ ++*&*Trong đó &,; $,; +, lần lượt là giá trị đại diện, tần số, tần suất của lớp thứ ; $ là số các số liệu thống kê ($ = $%+$( + ⋯ + $*)
Ví dụ 2: Tính chiều cao trung bình của 36 học sinh
Lớp số đo chiều cao
Trang 116 Số trung vị: xem sách giáo khoa trang 120-121
7 Mốt: của một bảng phân bố tần số là giá trị có tần số lớn nhất Kí hiệu: !"
Năng suất lúa
Trang 121 Ví dụ mở đầu: Giá trị thành phẩm quy ra tiền (nghìn đồng) trong một tuần lao động của
7 công nhân tổ 1 là: 180, 190, 190, 200, 210, 210, 220 (1)
7 công nhân tổ 2 là: 150, 170, 170, 200, 230, 230, 250 (2)
- Số trung bình cộng của dãy (1) và dãy (2) lần lượt là: ̅" = $% = 200
- Các độ lệch của mỗi số liệu thống kê ở dãy (1) đối với số trung bình cộng là:
Trang 13a) Định nghĩa: Phương sai !" và độ lệch chuẩn s đều được dùng để đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình cộng) Nhưng khi cần chú ý đến đơn vị đo thì ta dùng s, vì s có cùng đơn vị đo với dấu hiệu được nghiên cứu.
2 Phương sai và độ lệch chuẩn
b) Công thức tính phương sai
*Trường hợp bảng phân bố tần số, tần suất
!" = %$ ['$ ($ − ̅( " + '" (" − ̅( "+…+', (, − ̅( "]
=.$ ($ − ̅( " + " (" − ̅( "+…+., (, − ̅( "
Trong đó: '/, / lần lượt là tần số, tần suất của giá trị (/
n là các số liệu thống kê (n = '$ + '"+ …+',)
Trang 14*Trường hợp bảng phân bố tần số, tần suất ghép lớp
!" = $
% ['$ ($ − ̅+ " + '" (" − ̅+ "+…+'- (- − ̅+ "]
=/$ ($ − ̅+ " + /" (" − ̅+ "+…+/- (- − ̅+ "
Trong đó: (0 '0, /0 lần lượt là giá trị đại diện, tần số, tần suất của lớp thứ i, n là các
số liệu thống kê (n = '$ + '"+ …+'-) ̅+ là số TBC của các số liệu đã cho
c) Công thức tính độ lệch chuẩn
! = !"
Trang 15Năng suất lúa (tạ/ha) Tần số Tần suất (%)
Ví dụ 1: Tính phương sai !" và độ lệch chuẩn ! của các số liệu thống kê ở bảng 2 SGK T111
!"= #("%&'%,")*+,('-&'%,")*+.('%&'%,")*+/(#-&'%,")*+%(#%&'%,")*
Trang 165 Số trung bình cộng
a) Sử dụng số liệu từ bảng phân bố tần số, tần suất:
̅" = $%"% + $'"'+ +$)")
$ = *%"% + *'"'+ +*)")Trong đó $+; *+ lần lượt là tần số, tần suất của giá trị "+; $ là số các số liệu thống kê
Trang 17Ví dụ 2: Tính phương sai !" và độ lệch chuẩn ! của các số liệu thống kê ở bảng 4 SGK T112
Trang 18b) Sử dụng số liệu từ bảng phân bố tần số và tần suất ghép lớp
̅" = $%&% + $(&(+ +$*&*
$ = +%&% + +(&(+ ++*&*Trong đó &,; $,; +, lần lượt là giá trị đại diện, tần số, tần suất của lớp thứ ; $ là số các số liệu thống kê ($ = $%+$( + ⋯ + $*)
Ví dụ 2: Tính chiều cao trung bình của 36 học sinh
Lớp số đo chiều cao
Trang 193 Ý nghĩa
q Khi hai dãy số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau hoặc
xấp xỉ nhau thì việc đánh giá hai nhóm được dựa vào phương sai và độ lệch chuẩn.
q Nếu phương sai (độ lệch chuẩn) của dãy nào nhỏ hơn thì dãy đó có mức độ phân tán so với
số trung bình cộng ít hơn