1. Trang chủ
  2. » Luận Văn - Báo Cáo

XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ

55 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 55
Dung lượng 1,79 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG1.1 Trung bình cộng Arithmetic mean Trong đó: : trung bình cộng đơn giản n : số quan sát hay cỡ mẫu xi: giá trị trên quan sát thứ i Trung bình c

Trang 1

L/O/G/O TRƯỜNG ĐẠI HỌC NÔNG LÂM TPHCM

MÔN: XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC

GVHD: Thầy Võ Văn Việt

Nhóm 4

CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC

ĐẠI LƯỢNG SỐ

Trang 2

7 Nguyễn Lê Bảo Lộc 13132039

8 Lê Tuấn Anh 13132095

Trang 4

• CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ

Trang 5

I.1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG

1.1 Trung bình cộng ( Arithmetic mean )

 

Trong đó:

: trung bình cộng đơn giản

n : số quan sát hay cỡ mẫu xi: giá trị trên quan sát thứ i

 

Trung bình cộng đơn giản

(mean)Trung bình cộng đơn giản

(mean)

Trang 7

1 Trung bình cộng có một nhược điểm lớn nhất là rất

nhạy cảm với giá trị ngoại lệ

2 Không tính dữ liệu trung bình cho dữ liệu

định danh

3 Có nên tính trị trung bình cho dữ liệu định lượng

đo lường bằng thang đo khoảng hay không?

Lưu ý

Trang 9

1 Tránh nhầm lẫn giữa vị trí và giá trị của trung vị

2 Trung vị không bị ảnh hưởng bởi giá trị ngoại lệ

Trang 10

Một mode:  1   2   3   3   3   4   4   5   6 

Nhiều mode:  1   2   2   2   3   4   4   4   5

Không mode: 1   2   3   4   5   6   7   8   9 

Trang 11

Có bản chất và cách tính khác hẳn trung bình cộng

Tổng quát:

Nếu có n giá trị có quan hệ tích số kiểu:

* * … * thì số trung bình nhân của n giá trị này được xác định theo công thức:

 

1.4 Trung bình nhân ( Geometric mean)

Trang 12

I.2 Sử dụng Excel để tính toán các đại lượng thống

kê mô tả độ tập trung

Chọn tập dữ liệu cần tính toán bằng Excel, sau đó vào Menu Tool 

Data Analysis  Descriptive Statistics  Mở cửa sổ Descriptive

Statistics

Trang 13

I.3 Nhóm các đại lượng khác mô tả sự phân bố

của tập dữ liệu

3.1 Tứ phân vị (Quartiles)

Chức năng

Dùng để tính khoảng tứ phân vị ( độ trải giữa – RQ )

Có công dụng như phân vị

Trang 15

I.4 Hình dáng của phân phối

Mean < Me Mean = Me Mean > Me

Trang 17

II CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ

PHÂN TÁN

Trang 18

II.1 Khoảng biến thiên

bố bên trong 2 giá trị min, max

Chỉ phụ thuộc vào giá trị min, max  rất nhạy cảm với giá trị ngoại lệ

Trang 19

2 Độ trải giữa ( khoảng tứ phân vị - R Q )

RQ = Q3– Q1

Trang 20

II.3 Phương sai và độ lệch chuẩn

Trang 21

Lưu ý: khi sử dụng tính toán bằng Excel

• Sample Variance: Phương sai

• Standard Deviation: Độ lệch chuẩn

• Standard Error: s/ ( sẽ được nghiên cứu ở chương sau )

 

Trang 22

III CÁC ĐẠI LƯỢNG THỐNG KÊ

MÔ TẢ CHO BẢNG TẦN SỐ.

Trang 23

III.1 Trung bình cộng

1 Với bảng tần số không phân tổ

2 Với bảng tần số có phân tổ

Trang 24

Công thức Trung bình cộng trong mô tả với bảng tần số

f i: là tần số của tổ thứ i

Trang 26

Me: là giá trị trung vị (xấp xỉ) đang cần tính

x Me(min): là giá trị cận dưới của tổ chứa trung vị

h Me: là khoảng cách tổ của tổ chứa trung vị

là tổng các tần số của các tổ trong bảng tần số, nguyên tắc = n

: là tổng các tần số của tổ đứng trước tổ chứa trung vị

: là tần số của tổ chứa trung vị

 

Trang 27

III.3 Số Mode

1 Với bảng tần số không phân tổ

Số Mode là giá trị có tần số lớn nhất

Trang 28

2 Với bảng tần số có phân tổ

Bước 1: Xác định tổ chứa tần số lớn nhất Bước 2: Tính giá trị gần đúng của số mode theo công thức:

Mo = xMo(min) + hMo

 

Trong đó:

Mo: là giá trị số mode (xấp xỉ) đang cần tính

x Mo(min): là giá trị cận dưới của tổ chứa chứa mode

h Mo: là khoảng cách tổ của tổ chứa mode

: là tần số của tổ chứa mode

là tần số của tổ đứng sát trước tổ chứa mode

: là tần số của tổ đứng sát sau tổ chứa mode

 

Trang 29

III.4 Phương sai và độ lệch chuẩn

Trang 30

fi: là tần số của các tổ tương

ứng,

s 2: là phương sai  

s=

 

Công thức Độ lệch chuẩn

Trang 31

IV CÁC ĐẠI LƯỢNG THỐNG KÊ

• N: là số quan sát hay qui mô tổng thể

• : là giá trị trên quan sát thứ i

•  

N

X i

N i

 1

i

X

Trang 32

2 Phương sai và độ lệch chuẩn

- Phương sai tổng thể được kí hiệu bằng chữ

- Công thức:

=

Trong đó:

N : là quan sát hay qui mô tổng thể.

: là giá trị trên quan sát thứ i

N

X i

N i

2 1

) (  

Trang 33

- Độ lệch chuẩn tổng thể được kí hiệu là =

- Khác biệt giữa công thức phương sai tổng thể và

công thức phương sai mẫu:

)

n x

Trang 34

V KHÁM PHÁ DỮ LIỆU QUA BIỂU ĐỒ HỘP

VÀ RÂU ( BOX PLOT)

1 Biểu đồ hộp và râu là gì ?

- Là một công cụ thống kê đặc biệt hay được dùng để khám phá một tập dữ liệu

- Gọi là biểu đồ nhưng thật ra đây là một đối tượng

bằng hình ảnh có khả năng thể hiện đồng thời các thông tin là: giá trị cực đại, giá trị cực tiểu, 3 tứ phân vị và đôi khi cả các quan sát ngoại lệ

- Các yếu tố này kết hợp lại sẽ tạo nên hình dáng của

một biểu đồ và ngược lại nhìn qua hình dáng của biểu

đồ ta có thể hình dung được mối quan hệ tương đối

giữa các yếu tố này

Trang 35

2 Hình ảnh của biểu đồ hộp và râu

25% 25% 25% 25%

Cực tiểu Q1 Me Q3 cực đại

Trang 36

+ nếu 2 tập dữ liệu có giá trị trung bình khác nhau=>không thể kết luận khi so sánh trực tiếp 2 độ lệch chuẩn=>hệ số biến thiên được sử dụng để đo lường mức độ biến động tương đối của những tập

dữ liệu đó

Trang 37

CV =

Trang 38

 Khi so sánh hệ số biến thiên của hai tập dữ

liệu với nhau, hệ số biến thiên của tập nào lớn hơn thì tập đó biến động nhiều hơn.VD: Trong ngành tài chính, hệ số biến thiên hay được sử dụng để đo mức độ rủi ro tương đối của các danh mục vốn đầu tư

 Hệ số biến thiên độc lập với đơn vị đo lường và được tính bằng % => dùng hệ số biến thiên khi

so sánh hai tập dữ liệu có đơn vị đo khác nhau

Trang 39

2 Quy tắc thực nghiệm

 Sau khi nghiên cứu mối quan hệ giữa biểu đồ hộp và râu và đa giác tần số ta nhận thấy:

- Nếu một tập dữ liệu phân phối tạo thành đa giác tần

số cân đối hình chuông ( trung bình hay trung vị trùng nhau) thì các quan sát có xu hướng tập trung dày hơn quanh khu vực trung tâm nên mới tạo nên hình chuông

Trang 40

 Nếu dữ liệu có phân phối hình chuông cân đối thì có

Trang 41

 Quy tắc thực nghiệm giúp chúng ta có cơ sở để nhận diện những quan sát bất thường trong một tập dữ liệu.

 Áp dụng quy tắc này, nếu một tập dữ liệu có phân phối hình chuông cân đối:

Có 5% số quan sát nằm ngoài phạm vi hai lần độ lệch chuẩn tính từ trung bình

Có 5% số quan sát nằm ngoài phạm vi hai lần độ lệch chuẩn tính từ trung bình

Chú ý: Những tập dữ liệu mà phân phối không phải là hình chuông cân đối thì không sử dụng quy tắc thực nghiệm mà dùng quy tắc Chebyshev

Trang 43

– Ít nhất (1-1/k^2)100% giá trị nằm trong khoảng +/-

k độ lệch chuẩn so với giá trị trung bình, với k>1

Trang 45

4 Chuẩn hóa dữ liệu

 Là khi chúng ta cần biến đổi dữ liệu số lượng

thành dữ liệu ở một thang đo chuẩn

 Ví dụ khi muốn so sánh các đối tượng được đo lường bằng những phương pháp đo hay đơn vị đo khác nhau

=> Việc làm này gọi là chuẩn hóa dữ liệu

Trang 46

4 Chuẩn hóa dữ liệu

 Giá trị dữ liệu đã chuẩn hóa sẽ cho biết một giá trị quan sát trong tập dữ liệu gốc, lệch khỏi trung bình của nó mấy lần độ lệch chuẩn.

 Công thức tính giá trị chuẩn hóa z cho dữ liệu tổng thể:

Trang 47

4 Chuẩn hóa dữ liệu

 Công thức tính giá trị chuẩn hóa z cho dữ liệu mẫu:

Trong đó:

+ x là giá trị dữ liệu gốc

+ là trị trung bình mẫu

+ s là độ lệch chuẩn của mẫu

+ z = điểm số chuẩn hóa cho biết x cách xa trung bình một khoảng bằng mấy lần độ lệch chuẩn.

Trang 48

4 Chuẩn hóa dữ liệu

 Giá trị z tiến gần đến 0 nghĩa là quan sát đó ở vị trí rất gần trung bình

 Giá trị z = (-1) có nghĩa là quan sát thực tế đó ở vị trí lệch 1 độ lệch chuẩn so với trung bình về phía trái

 Giá trị z = (-1) có nghĩa là quan sát thực tế đó ở vị trí lệch 1 độ lệch chuẩn so với trung bình về phía phải

Trang 49

VII PHÂN BIỆT MỘT SỐ CẶP KHÁI NIỆM

Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của mẫu từ tổng thể chung

Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của mẫu từ tổng thể chung

Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của toàn bộ tổng thể

Tên gọi chung cho các đại lượng (trung bình, tỉ lệ phương sai, độ lệch chuẩn….) tính được trên tập dữ liệu của toàn bộ tổng thể

Trang 50

Ví dụ Cho một tập dữ liệu có tổng thể bao gồm các

giá trị quan sát như sau Chọn 1 mẫu ngẫu nhiên

trong hình ta tiến hành tính toán các đại lượng tham

số mẫu

97

59

43

Trung bình của mẫu 5+6+7+8+9+9+10

Độ lệch chuẩn của mẫu

2

s = s = 1.79947678

Trang 51

Dựa vào ví dụ trong hình, tiến hành tính toán các tham số tổng

Trang 52

Giá trị các đại

lượng thay đổi

tùy theo mẫu

được chọn

Giá trị các đại

lượng thay đổi

tùy theo mẫu

được chọn Giá trị các đơn vị

đại lượng không thay đổi là một con số xác định

Giá trị các đơn vị đại lượng không thay đổi là một con số xác định

Tham

số mẫu

Tham số tổng thể

Trang 53

Phân biệt biến thiên và độ lệch chuẩn

Biến thiên

Diễn tả sự chênh lệch

giữa các quan sát riêng

lẻ với giá trị trung bình

của tập dữ liệu

Diễn tả sự chênh lệch

giữa các quan sát riêng

lẻ với giá trị trung bình

của tập dữ liệu

Độ lệch chuẩn

 Thước đo tổng hợp mức

độ biến thiên trong đó có

sự tham gia tính toán các tất cả các giá trị quan sát.

 Diễn tả khá đầy đủ mức

độ biến thiên nhiều hay ít của dữ liệu chỉ với một con số thống kê duy nhất.

 Thước đo tổng hợp mức

độ biến thiên trong đó có

sự tham gia tính toán các tất cả các giá trị quan sát.

 Diễn tả khá đầy đủ mức

độ biến thiên nhiều hay ít của dữ liệu chỉ với một con số thống kê duy nhất.

Trang 54

TÀI LIỆU THAM KHẢO

https://vi.wikipedia.org

http://

tailieu.vn/doc/bai-giang-xac-suat-thong-ke-ung-dung-trong-kinh-te-xa-hoi-chuong-4-duong-thi-huong-dh-thang-lo-1827699.html

http://

tailieu.vn/doc/bai-giang-xac-suat-thong-ke-ung-dung-trong-kinh-te-xa-hoi-chuong-4-dh-thang-long-1827738.html

http://

tailieu.vn/doc/bai-giang-xac-suat-thong-ke-ung-dung-trong-kinh-te-xa-hoi-chuong-4-ngo-thi-thanh-nga-dh-thang-lo-1827725.html

http://www.fetp.edu.vn/cache/MPP05-521-L01V.pdfhttp://hfs1.duytan.edu.vn/upload/ebooks/2555.pdf

Trang 55

Cảm ơn thầy và các

bạn đã lắng nghe

Ngày đăng: 18/08/2022, 12:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w