CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG1.1 Trung bình cộng Arithmetic mean Trong đó: : trung bình cộng đơn giản n : số quan sát hay cỡ mẫu xi: giá trị trên quan sát thứ i Trung bình c
Trang 1L/O/G/O TRƯỜNG ĐẠI HỌC NÔNG LÂM TPHCM
MÔN: XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC
GVHD: Thầy Võ Văn Việt
Nhóm 4
CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC
ĐẠI LƯỢNG SỐ
Trang 27 Nguyễn Lê Bảo Lộc 13132039
8 Lê Tuấn Anh 13132095
Trang 4• CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ
Trang 5I.1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG
1.1 Trung bình cộng ( Arithmetic mean )
Trong đó:
: trung bình cộng đơn giản
n : số quan sát hay cỡ mẫu xi: giá trị trên quan sát thứ i
Trung bình cộng đơn giản
(mean)Trung bình cộng đơn giản
(mean)
Trang 71 Trung bình cộng có một nhược điểm lớn nhất là rất
nhạy cảm với giá trị ngoại lệ
2 Không tính dữ liệu trung bình cho dữ liệu
định danh
3 Có nên tính trị trung bình cho dữ liệu định lượng
đo lường bằng thang đo khoảng hay không?
Lưu ý
Trang 91 Tránh nhầm lẫn giữa vị trí và giá trị của trung vị
2 Trung vị không bị ảnh hưởng bởi giá trị ngoại lệ
Trang 10Một mode: 1 2 3 3 3 4 4 5 6
Nhiều mode: 1 2 2 2 3 4 4 4 5
Không mode: 1 2 3 4 5 6 7 8 9
Trang 11Có bản chất và cách tính khác hẳn trung bình cộng
Tổng quát:
Nếu có n giá trị có quan hệ tích số kiểu:
* * … * thì số trung bình nhân của n giá trị này được xác định theo công thức:
1.4 Trung bình nhân ( Geometric mean)
Trang 12I.2 Sử dụng Excel để tính toán các đại lượng thống
kê mô tả độ tập trung
Chọn tập dữ liệu cần tính toán bằng Excel, sau đó vào Menu Tool
Data Analysis Descriptive Statistics Mở cửa sổ Descriptive
Statistics
Trang 13I.3 Nhóm các đại lượng khác mô tả sự phân bố
của tập dữ liệu
3.1 Tứ phân vị (Quartiles)
Chức năng
Dùng để tính khoảng tứ phân vị ( độ trải giữa – RQ )
Có công dụng như phân vị
Trang 15I.4 Hình dáng của phân phối
Mean < Me Mean = Me Mean > Me
Trang 17II CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ
PHÂN TÁN
Trang 18II.1 Khoảng biến thiên
bố bên trong 2 giá trị min, max
Chỉ phụ thuộc vào giá trị min, max rất nhạy cảm với giá trị ngoại lệ
Trang 192 Độ trải giữa ( khoảng tứ phân vị - R Q )
RQ = Q3– Q1
Trang 20II.3 Phương sai và độ lệch chuẩn
Trang 21Lưu ý: khi sử dụng tính toán bằng Excel
• Sample Variance: Phương sai
• Standard Deviation: Độ lệch chuẩn
• Standard Error: s/ ( sẽ được nghiên cứu ở chương sau )
Trang 22
III CÁC ĐẠI LƯỢNG THỐNG KÊ
MÔ TẢ CHO BẢNG TẦN SỐ.
Trang 23III.1 Trung bình cộng
1 Với bảng tần số không phân tổ
2 Với bảng tần số có phân tổ
Trang 24Công thức Trung bình cộng trong mô tả với bảng tần số
f i: là tần số của tổ thứ i
Trang 26Me: là giá trị trung vị (xấp xỉ) đang cần tính
x Me(min): là giá trị cận dưới của tổ chứa trung vị
h Me: là khoảng cách tổ của tổ chứa trung vị
là tổng các tần số của các tổ trong bảng tần số, nguyên tắc = n
: là tổng các tần số của tổ đứng trước tổ chứa trung vị
: là tần số của tổ chứa trung vị
Trang 27
III.3 Số Mode
1 Với bảng tần số không phân tổ
Số Mode là giá trị có tần số lớn nhất
Trang 282 Với bảng tần số có phân tổ
Bước 1: Xác định tổ chứa tần số lớn nhất Bước 2: Tính giá trị gần đúng của số mode theo công thức:
Mo = xMo(min) + hMo
Trong đó:
Mo: là giá trị số mode (xấp xỉ) đang cần tính
x Mo(min): là giá trị cận dưới của tổ chứa chứa mode
h Mo: là khoảng cách tổ của tổ chứa mode
: là tần số của tổ chứa mode
là tần số của tổ đứng sát trước tổ chứa mode
: là tần số của tổ đứng sát sau tổ chứa mode
Trang 29
III.4 Phương sai và độ lệch chuẩn
Trang 30fi: là tần số của các tổ tương
ứng,
s 2: là phương sai
s=
Công thức Độ lệch chuẩn
Trang 31IV CÁC ĐẠI LƯỢNG THỐNG KÊ
• N: là số quan sát hay qui mô tổng thể
• : là giá trị trên quan sát thứ i
•
N
X i
N i
1
i
X
Trang 322 Phương sai và độ lệch chuẩn
- Phương sai tổng thể được kí hiệu bằng chữ
- Công thức:
=
Trong đó:
N : là quan sát hay qui mô tổng thể.
: là giá trị trên quan sát thứ i
N
X i
N i
2 1
) (
Trang 33- Độ lệch chuẩn tổng thể được kí hiệu là =
- Khác biệt giữa công thức phương sai tổng thể và
công thức phương sai mẫu:
)
n x
Trang 34V KHÁM PHÁ DỮ LIỆU QUA BIỂU ĐỒ HỘP
VÀ RÂU ( BOX PLOT)
1 Biểu đồ hộp và râu là gì ?
- Là một công cụ thống kê đặc biệt hay được dùng để khám phá một tập dữ liệu
- Gọi là biểu đồ nhưng thật ra đây là một đối tượng
bằng hình ảnh có khả năng thể hiện đồng thời các thông tin là: giá trị cực đại, giá trị cực tiểu, 3 tứ phân vị và đôi khi cả các quan sát ngoại lệ
- Các yếu tố này kết hợp lại sẽ tạo nên hình dáng của
một biểu đồ và ngược lại nhìn qua hình dáng của biểu
đồ ta có thể hình dung được mối quan hệ tương đối
giữa các yếu tố này
Trang 352 Hình ảnh của biểu đồ hộp và râu
25% 25% 25% 25%
Cực tiểu Q1 Me Q3 cực đại
Trang 36+ nếu 2 tập dữ liệu có giá trị trung bình khác nhau=>không thể kết luận khi so sánh trực tiếp 2 độ lệch chuẩn=>hệ số biến thiên được sử dụng để đo lường mức độ biến động tương đối của những tập
dữ liệu đó
Trang 37CV =
Trang 38 Khi so sánh hệ số biến thiên của hai tập dữ
liệu với nhau, hệ số biến thiên của tập nào lớn hơn thì tập đó biến động nhiều hơn.VD: Trong ngành tài chính, hệ số biến thiên hay được sử dụng để đo mức độ rủi ro tương đối của các danh mục vốn đầu tư
Hệ số biến thiên độc lập với đơn vị đo lường và được tính bằng % => dùng hệ số biến thiên khi
so sánh hai tập dữ liệu có đơn vị đo khác nhau
Trang 392 Quy tắc thực nghiệm
Sau khi nghiên cứu mối quan hệ giữa biểu đồ hộp và râu và đa giác tần số ta nhận thấy:
- Nếu một tập dữ liệu phân phối tạo thành đa giác tần
số cân đối hình chuông ( trung bình hay trung vị trùng nhau) thì các quan sát có xu hướng tập trung dày hơn quanh khu vực trung tâm nên mới tạo nên hình chuông
Trang 40 Nếu dữ liệu có phân phối hình chuông cân đối thì có
Trang 41 Quy tắc thực nghiệm giúp chúng ta có cơ sở để nhận diện những quan sát bất thường trong một tập dữ liệu.
Áp dụng quy tắc này, nếu một tập dữ liệu có phân phối hình chuông cân đối:
Có 5% số quan sát nằm ngoài phạm vi hai lần độ lệch chuẩn tính từ trung bình
Có 5% số quan sát nằm ngoài phạm vi hai lần độ lệch chuẩn tính từ trung bình
Chú ý: Những tập dữ liệu mà phân phối không phải là hình chuông cân đối thì không sử dụng quy tắc thực nghiệm mà dùng quy tắc Chebyshev
Trang 43– Ít nhất (1-1/k^2)100% giá trị nằm trong khoảng +/-
k độ lệch chuẩn so với giá trị trung bình, với k>1
Trang 454 Chuẩn hóa dữ liệu
Là khi chúng ta cần biến đổi dữ liệu số lượng
thành dữ liệu ở một thang đo chuẩn
Ví dụ khi muốn so sánh các đối tượng được đo lường bằng những phương pháp đo hay đơn vị đo khác nhau
=> Việc làm này gọi là chuẩn hóa dữ liệu
Trang 464 Chuẩn hóa dữ liệu
Giá trị dữ liệu đã chuẩn hóa sẽ cho biết một giá trị quan sát trong tập dữ liệu gốc, lệch khỏi trung bình của nó mấy lần độ lệch chuẩn.
Công thức tính giá trị chuẩn hóa z cho dữ liệu tổng thể:
Trang 474 Chuẩn hóa dữ liệu
Công thức tính giá trị chuẩn hóa z cho dữ liệu mẫu:
Trong đó:
+ x là giá trị dữ liệu gốc
+ là trị trung bình mẫu
+ s là độ lệch chuẩn của mẫu
+ z = điểm số chuẩn hóa cho biết x cách xa trung bình một khoảng bằng mấy lần độ lệch chuẩn.
Trang 484 Chuẩn hóa dữ liệu
Giá trị z tiến gần đến 0 nghĩa là quan sát đó ở vị trí rất gần trung bình
Giá trị z = (-1) có nghĩa là quan sát thực tế đó ở vị trí lệch 1 độ lệch chuẩn so với trung bình về phía trái
Giá trị z = (-1) có nghĩa là quan sát thực tế đó ở vị trí lệch 1 độ lệch chuẩn so với trung bình về phía phải
Trang 49VII PHÂN BIỆT MỘT SỐ CẶP KHÁI NIỆM
Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của mẫu từ tổng thể chung
Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của mẫu từ tổng thể chung
Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của toàn bộ tổng thể
Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của toàn bộ tổng thể
Trang 50Ví dụ Cho một tập dữ liệu có tổng thể bao gồm các
giá trị quan sát như sau Chọn 1 mẫu ngẫu nhiên
trong hình ta tiến hành tính toán các đại lượng tham
số mẫu
97
59
43
Trung bình của mẫu 5+6+7+8+9+9+10
Độ lệch chuẩn của mẫu
2
s = s = 1.79947678
Trang 51Dựa vào ví dụ trong hình, tiến hành tính toán các tham số tổng
Trang 52Giá trị các đại
lượng thay đổi
tùy theo mẫu
được chọn
Giá trị các đại
lượng thay đổi
tùy theo mẫu
được chọn Giá trị các đơn vị
đại lượng không thay đổi là một con số xác định
Giá trị các đơn vị đại lượng không thay đổi là một con số xác định
Tham
số mẫu
Tham số tổng thể
Trang 53Phân biệt biến thiên và độ lệch chuẩn
Biến thiên
Diễn tả sự chênh lệch
giữa các quan sát riêng
lẻ với giá trị trung bình
của tập dữ liệu
Diễn tả sự chênh lệch
giữa các quan sát riêng
lẻ với giá trị trung bình
của tập dữ liệu
Độ lệch chuẩn
Thước đo tổng hợp mức
độ biến thiên trong đó có
sự tham gia tính toán các tất cả các giá trị quan sát.
Diễn tả khá đầy đủ mức
độ biến thiên nhiều hay ít của dữ liệu chỉ với một con số thống kê duy nhất.
Thước đo tổng hợp mức
độ biến thiên trong đó có
sự tham gia tính toán các tất cả các giá trị quan sát.
Diễn tả khá đầy đủ mức
độ biến thiên nhiều hay ít của dữ liệu chỉ với một con số thống kê duy nhất.
Trang 54TÀI LIỆU THAM KHẢO
https://vi.wikipedia.org
http://
tailieu.vn/doc/bai-giang-xac-suat-thong-ke-ung-dung-trong-kinh-te-xa-hoi-chuong-4-duong-thi-huong-dh-thang-lo-1827699.html
http://
tailieu.vn/doc/bai-giang-xac-suat-thong-ke-ung-dung-trong-kinh-te-xa-hoi-chuong-4-dh-thang-long-1827738.html
http://
tailieu.vn/doc/bai-giang-xac-suat-thong-ke-ung-dung-trong-kinh-te-xa-hoi-chuong-4-ngo-thi-thanh-nga-dh-thang-lo-1827725.html
http://www.fetp.edu.vn/cache/MPP05-521-L01V.pdfhttp://hfs1.duytan.edu.vn/upload/ebooks/2555.pdf
Trang 55Cảm ơn thầy và các
bạn đã lắng nghe