1. Trang chủ
  2. » Giáo Dục - Đào Tạo

CHƯƠNG 2 PHƯƠNG PHÁP TRÌNH BÀY VÀ MÔ TẢ DỮ LiỆU

24 168 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 5,07 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CHƯƠNG II: PHƯƠNG PHÁP TRÌNH BÀY Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ hoặc tiểu tổ có t

Trang 1

CHƯƠNG II: PHƯƠNG PHÁP TRÌNH BÀY

Phân tổ thống kê là căn cứ vào một hay một

số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc tiểu tổ) có tính chất khác nhau.

Căn cứ vào một hay một số tiêu thức:

-Căn cứ để lựa chọn

- Số lượng tiêu thức lựa chọn

Kết quả là hình thành các tổ có tính chất khác nhau Các đơn vị trong phạm vi mỗi

tổ có tính chât giống nhau (hoặc gần giống nhau)

Trang 2

TổngTổng hợphợp thốngthống kêkê

PhânPhân tíchtích thốngthống kêkê

- Phân tổ có khoảng cách tổ (khoảng cách

tổ bằng nhau và khoảng cách tổ không bằng nhau.

Trường hợp 2: Phân tổ theo tiêu thức số lượng

- Số lượng lượng biến ít;

- Số lượng lượng biến nhiều.

Trang 3

Phân tổ có khoảng cách tổ

Khái niệm tổ có khoảng cách tổ:

Mỗi tổ bao gồm một phạm vi lượng biến với 2 giới hạn Giới hạn

dưới là lượng biến nhỏ nhất để hình thành tổ Giới hạn trên là lượng

biến lớn nhất mà nếu quá nó thì chất đổi, dẫn đến hình thành một tổ

mới.

Khoảng cách tổ:

Là chênh lệch giữa giới hạn trên và giới hạn dưới.

h = Giới hạn trên – Giới hạn dưới

Phân tổ có khoảng cách tổ

Trường hợp 1: Khoảng cách tổ bằng nhau

h = (x max – x min )/n

Trường hợp 2: Khoảng cách tổ không bằng nhau

Dựa vào ý nghĩa KTXH của hiện tượng để xác định nội dung

và phạm vi của tổ

Câu hỏi thảo luận

• Những trường hợp nào có thể là phân tổ không

có khoảng cách tổ?

Ví dụ

Trong 1 doanh nghiệp có 100 công nhân, chia thành 6 tổ,khoảng cách tổ bằng nhau theo tiêu thức tiền lương Biết côngnhân có lương cao nhất là 3.200.000 đồng, công nhân có lươngthấp nhất là 2.000.000

Trang 4

Dr pepper Sprite Coke classic Diet coke Pepsi Diet coke Pepsi Coke classic Pepsi Pepsi Coke classic Pepsi Coke classic Coke classic Pepsi

Dr Pepper Pepsi Pepsi Sprite Coke classic Coke classic Coke classic Sprite Dr Pepper Diet coke Dr Pepper Pepsi Coke classic Pepsi Sprite Coke classic Diet Coke

Bảng phân phối tần số, tần suất

• Từ số liệu trên, hình thành bảng phân phối tần số, tần suất sau:

Soft drink Tần số Tần suất

Bar graphs (Biểu đồ dạng thanh)

• Là công cụ đồ thị cho phép biểu diễn dữ liệu định tính đượctổng hợp theo phân phối tần số, tần suất (lần và %)

Trang 5

Pie chart (biểu đồ dạng bánh)

• Là công cụ đồ thị cho phép biểu diễn dữ liệu định tính được

tổng hợp theo tần suất (lần và phần trăm)

Dr Pepper Pepsi Sprite

của các nhà đầu tư A, B, C

( Đơn vị tính: %)

20

Nhà đầu tư Danh mục

Cổ phiếu 42.27 37.41 41.04 39.81Trái phiếu 29.09 29.93 28.36 29.32Tín phiếu 14.09 13.61 20.15 15.12Tiết kiệm 14.55 19.05 10.45 15.74

Trang 6

Biểu đồ hình cột biểu diễn kết cấu vốn theo danh mục đầu tư

Tiết kiệm Tín phiếu Trái phiếu

Tìm khoảng biến thiên: 58 - 12 = 46

Chọn số tổ: 5 (thường trong khoảng 5 đến 15)

Tính khoảng cách tổ (độ rộng): 10 (lấy 46/5 sau đó làm tròn lên)

Xác định giới hạn tổ: 10, 20, 30, 40, 50, 60

Tính trị số giữa của tổ: 15, 25, 35, 45, 55

Đếm số quan sát và đưa vào các tổ

24Lập bảng dữ liệu định lượng

Bảng phân bố tần số

Trang 7

Lập bảng dữ liệu định lượng

Tần số tích luỹ

Bài 2Trị số giữa của tổ

03

4200

510

Vẽ đồ thị phân bố dữ liệu định lượng

Ogive

Giới hạn tổ

Vẽ đồ thị phân bố dữ liệu định lượng

Đường cong Ogive

Trang 8

Biểu đồ thân lá (Stem and Leaf Display)

• Có 50 ứng viên phỏng vấn cho vị trí quản lý tại công ty Haskens Số liệu

dưới đây thể hiện số câu trả lời đúng trong tổng số 150 câu hỏi của các

ứng viên.

126 128 118 127 124

Biểu đồ thân lá (Stem and Leaf Display)

6 8 9

7 2 3 3 5 6 6

8 0 1 1 2 3 4 5 6

9 1 2 2 2 4 5 5 6 7 8 8 10 0 0 2 4 6 6 6 7 8

11 2 3 5 5 8 9 9

12 4 6 7 8

13 2 4

14 1

6 8 9

7 2 3 3 5 6 6

8 0 1 1 2 3 4 5 6

9 1 2 2 2 4 5 5 6 7 8 8 10 0 0 2 4 6 6 6 7 8

11 2 3 5 5 8 9 9

12 4 6 7 8

13 2 4

14 1

2.1 Số tuyệt đối và số tương đối trong TK

2.2 Các tham số đo độ trung tâm 2.

Mô tả tả dữ dữ liệu liệu 2.3 Các tham số đo độ phân tán

2.4 Phân vị

2.5 Hình dáng của phân phối

2.1 Số tuyệt đối và số tương đối trong thống kê

2.1.1 Số tuyệt đối

Khái niệm Đặc điểm

Ý nghĩa Đơn vị tính

Các loại số tuyệt đối

Trang 9

Ví dụ

Ví dụ 1: Dân số Việt Nam vào thời điểm 0h ngày

1/4/2009 là 85.543.947 người

Ví dụ 2: GDP của Việt Nam tính theo giá thực tế

năm 2010 đạt khoảng 105 tỷ USD.

Khái niệm

Số tuyệt đối trong thống kê là mức độ biểu hiện quy

mô, khối lượng của hiện tượng kinh tế xã hội trong điều kiện thời gian và địa điểm cụ thể

Biểu hiện quy mô: Nói lên quy mô của hiện tượng

Biểu hiện khối lượng:

Là trị số của 1 tiêu thức

3Đơn vị tiền tệ:

Thường dùng Việt Nam đồng và Đô la

Mỹ để biểu hiện

Các loại số tuyệt đối

Số tuyệt đối thời kỳ: phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong 1 khoảng thời gian nhất định Đặc điểm về số tuyệt đối thời kỳ là có sự tích lũy về lượng theo thời gian.

Số tuyệt đối thời điểm: phản ánh quy mô, khối lượng của hiện tượng nghiên cứu tại một thời điểm nhất định Đặc điểm của số tuyệt đối thời điểm là không có sự tích lũy về lượng qua thời gian

Trang 10

2.1.2 Số tương đối

Khái niệm Đặc điểm Tác dụng

Các loại số tương đối

Ví dụ: Tổng kim ngạch xuất khẩu của Việt Nam 4 tháng đầu

năm 2010 so với cùng kỳ năm trước là 108,9% Con số108,9% là con số tương đối, để tính có được con số này taphải có 2 mức độ là tổng kim ngạch xuất khẩu của Việt Nam

4 tháng đầu năm 2010 và tổng kim ngạch xuất khẩu 4 thángđầu năm 2009, sau đó so sánh 2 mức độ này với nhau

Khái niệm

Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa

hai mức độ nào đó của hiện tượng nghiên cứu

7 7 8% 8%

8 8 9% 9%

Trang 11

Tác dụng

1

Được dùng trong

phân tích thống

kê, giúp nêu lên

kết cấu, quan hê

so sánh, trình độ

phát triển, trình

độ phổ biến

2Dùng số tương đối để biểu hiện tình hình thực tế trong trường hợp cần giữ bí mật số tuyệt đối

3

Có tác dụng trong công tác lập và kiểm tra tình hình thực hiện kế hoạch

Các loại số tương đối

Số tương đối động thái

Số tương đối động thái

Biểu hiện sự biến

động về mức độ

của hiện tượng

nghiên cứu qua

một thời gian nào

và tốc độ phát triển của hiện tượng qua thời gian hay là biểu hiện xu hướng của hiện tượng

Số tương đối kế hoạch

Số tương đối nhiệm vụ kế hoạch

Là tỷ lệ so sánh giữa mức độ của

1 chỉ tiêu cần đạt tới và mức

độ thực tế ở kỳ gốc

Dùng để lập

kế hoạch

(lần, %) 0

k nyy

K 

Trang 12

Số tương đối kế hoạch

Số tương đối thực hiện kế hoạch

(lần, %) k

1 t

y

y

K 

Ví dụ: Ở xí nghiệp A, tổng số sản phẩm được sản xuất ra năm 2008

là 1000 sản phẩm Lãnh đạo xí nghiệp đặt mục tiêu cho năm 2009

là 1200 sản phẩm Trong thực tế năm 2009, số sản phẩm sản xuất ra

là 1250 sản phẩm.

Như vậy ta có:

yo = 1000 (sản phẩm)

yk = 1200 (sản phẩm) y1 = 1250 (sản phẩm)

Từ đó ta tính được:

Số tương đối nhiệm vụ kế hoạch: = x 100 = 120 (%)

Số tương đối thực hiện kế hoạch: = x 100 = 104,17 (%)

cả các bộ phận là

1 hoặc 100%.

(lần, %)

tt

bpy

y

d 

Số tương đối không gian

Là kết quả so sánh giữa 2 mức độ cùng loại nhưng khác nhau về không gian hoặc so sánh giữa các bộ phận trong 1

tổng thể.

So sánh giữa 2 mức độ cùng loại nhưng khác nhau về không gian

So sánh giữa hai bộ phận trong 1 tổng thể:

2 không gian khác nhau cùng tồn tại trong

1 tổng thể.

Trang 13

Số tương đối cường độ

Nói lên trình độ phổ biến của hiện tượng trong điều kiện

lịch sử nhất định, là kết quả so sánh 2 mức độ khác loại

nhưng có mối liên hệ với nhau.

Số tương đối cường độ

có đơn vị kép.

2.1.3 Điều kiện vận dụng

Khi sử dụng số tương đối

và tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho đúng

Phải vận dụng kết hợp số tương đối và số tuyệt đối vì:

+ Các số tương đối được tính ra từ số tuyệt đối.

+ Ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối mà nó phản ánh.

Ví dụ: Năm 2010, tốc độ tăng trưởng GDP của Việt Nam là

6,78%, trong khi tốc độ tăng trưởng GDP của Mỹ chỉ có 2,9%

Nhưng khi xem xét các số tuyệt đối, qui mô GDP của Việt

Nam năm 2010 là 105 tỷ USD, trong khi đó, qui mô GDP của

Mỹ là 14.000 tỷ USD Như vậy, 1% tăng trưởng của Mỹ đã

lớn hơn cả nền kinh tế của Việt Nam

Ví dụ:

Một doanh nghiệp ngày 5/1 tuyển thêm 10% số công nhân, ngày 25/1 sa thải 10% số công nhân Hỏi số công nhân cuối tháng và đầu tháng tăng, giảm hay bằng nhau?

Trang 14

- Số bình quân cộng giản đơn:

- Số bình quân cộng gia quyền:

- Số bình quân cộng điều hòa:

n

x n

x x x x

n i i

n i i n

n n

f

f x f

f f

f x f x f x x

1

1 2

1 2 2 1 1

x M

M x

1 1

2.2.1 Số bình quân

• Số bình quân nhân

- Số bình quân nhân giản đơn:

- Số bình quân nhân gia quyền:

n n

i i n

x x x

i

f i f

f

n f

Trang 15

MỘT SỐ DẠNG BÀI TẬP VỀ SỐ TRUNG BÌNH

Dạng 1: Đã cho sẵn dữ liệu

Có số liệu của 5 phân xưởng sản xuất:

Yêu cầu:

- Tính %HTKH về doanh thu bình quân chung 5 phân xưởng sản xuất 6 tháng

đầu năm, 6 tháng cuối năm và cả năm.

% HTKH

về doanh thu

Doanh thu thực tế (triệu đồng)

% HTKH

về doanh thu

Dạng 2: Không cho quyền số

Có số liệu về 4 phân xưởng sản xuất như sau:

Giá thành đơn vị sản phẩm (1000đ)

Dạng 3: Số trung bình điều hòa

Một nhóm gồm 3 người công nhân cùng sản xuất 1 loại sản

phẩm trong thời gian như nhau:

Người công nhân 1 sản xuất 1 sản phẩm hết 30 phút

Người công nhân 2 sản xuất 1 sản phẩm hết 38 phút

Người công nhân 3 sản xuất 1 sản phẩm hết 35 phút

Yêu cầu:

Tính thời gian hao phí trung bình để sản xuất 1 sản phẩm của 3

người công nhân nói trên

Trang 16

2.2 Mốt

Khái niệm:

Là biểu hiện của 1 tiêu thức được gặp nhiều nhất trong một

tổng thể hay trong 1 dãy số phân phối

Cách tính mốt:

-Áp dụng cho dãy số không có khoảng cách tổ

-Áp dụng cho dãy số có khoảng cách tổ bằng nhau

- Áp dụng cho dãy số có khoảng cách tổ không bằng nhau

Cách tính Mốt Trường hợp 1: Dãy số không có khoảng cách tổ

Mốt được tính theo 2 bước

δ   

1 M M

δ   

2 1

1 min

Trang 17

Cách tính Mốt

• Trường hợp dãy số không có khoảng cách tổ không bằng nhau: việc xác

định Mốt phải căn cứ vào mật độ phân phối

i

i i

h

f

m 

Vì các khoảng cách tổ khác nhau nên tổ chứa Mốt sẽ là tổ có m i max Cần

phải thêm cột vào bảng tính để xác định tổ chứa Mốt và tìm δ1, δ2 theo

0

M

m … Công thức tính tương tự như ở trên

Ví dụ

Có số liệu về tuổi ở 1 địa phương như sau:

Yêu cầu:

1.Tính tuổi trung bình của nhóm người trên?

2 Tính Mod về tuổi của nhóm người trên?

có lượng biến đột xuất

vụ đám đông

Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số

2.2.3 Trung vị (Me)

Khái niệm

Cách tính

Tác dụng

Trang 18

2.2.3 Trung vị

Khái niệm:

Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa

trong dãy số lượng biến, chia dãy số thành hai phần bằng nhau

Cách tính trung vị:

-Áp dụng cho dãy số không có khoảng cách tổ

-Áp dụng cho dãy số có khoảng cách tổ

e

M

1 M i M min M e

f

S 2 f h x

số nêu lên đặc trưng phân phối của dãy số

Thay thế số trung bình cộng trong trường hợp việc tính số trung bình cộng gặp khó khăn

Ứng dụng trong công tác kỹ thuật

và phục vụ công cộng

Trang 19

Tool/Data Analysis/Descriptive Statistics

Kết quả sẽ cho số bình quân, trung vị, Mod, số

lớn nhất, số nhỏ nhất, tổng cộng và số lượng biến.

Tuy nhiên phải tính trên dữ liệu gốc chưa phân

tổ, chưa lập bảng tần số.

Ngoài ra Excel chỉ nhận được 1 giá trị Mod nếu

tập dữ liệu có nhiều Mod.

• Tool/Data Analysis/Descriptive Statistics, kết quả sẽ cho số bình quân, trung vị, Mod, số lớn nhất, số nhỏ nhất, tổng cộng và số lượng biến.

• Tuy nhiên phải tính trên dữ liệu gốc chưa phân tổ, chưa lập bảng tần số.

• Ngoài ra Excel chỉ nhận được 1 giá trị Mod nếu tập

dữ liệu có nhiều Mod.

• Excel còn cho biết đại lượng Skewness: Nếu

• - Phân phối chuẩn: Skewness = 0

• - Phân phố lệch phải: Skewness > 0

• - Phân phối lệch trái: Skewness < 0

Một số lưu ý

• Mo và Me không thay đổi với lượng biến đột xuất

• Mo được tính cả với dãy số phân phối thuộc tính và số lượng

• Me chỉ được tính ở dãy số phân phối số lượng

• Số trung bình có đặc điểm san bằng các chênh lệch của từng

lượng biến

• Mo và Me không san bằng chênh lệch của từng lượng biến

• Số trung bình chịu ảnh hưởng của lượng biến đột xuất

2.3.1 Khoảng biến thiên

2.3.2 Độ lệch tuyệt đối bình quân 2.3.

Các Các tham tham số số đo

đo độ độ biến biến thiên thiên của của tiêu thức

2.3.3 Phương sai

2.3.4 Độ lệch tiêu chuẩn

2.3.5 Hệ số biến thiên

Trang 20

3Được sử dụng nhiều trong nhiều trường hợp nghiên cứu thống

kê như phân tích biến động, mối liên hệ trong điều tra, dự đoán

2.3.1 Khoảng biến thiên

Khái niệm

Là chênh lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu

Ưu điểm: Dễ tính Hạn chế: Chỉ nói lên chênh lệch giữa lượng biến lớn và nhỏ nhất

Công thức Ưu, nhược điểmƯ

lệch tuyệt đối giữa

các lượng biến với

số bình quân của

các lượng biến đó.

Ưu điểm: Đo được tất cả các độ lệch bên trong lượng biến, có ý nghĩa khi dùng phân tích chất lượng sản phẩm để xét độ đồng đều Hạn chế: Chỉ tính giá trị tuyệt đối của

độ lệch

Công thức Ưu, nhược điểmƯ

n

x x

f f x x d

2.3.3 Phương sai

Khái niệm: Phương sai là trung bình cộng của bình phương các độ lệch

giữa các lượng biến với số trung bình của các lượng biến đó

Công thức:

nx

xn

f f x x

=

2 i i i

i 2 i

f f x f f x

Ưu điểm: Khắc phục được sự khác nhau về dấu của độ lệch.

• Hạn chế: vì là bình phương các độ lệch nên trị số bị khuếch đại và không

có đơn vị tính phù hợp.

Trang 21

Công thức Ưu, nhược điểmƯ

Độ lệch chuẩn của tổng thể mẫu

Đối với tổng thể mẫu: sử dụng n - 1 ở

) 16 24 ( ) 16 18 ( 2 ) 16 17 ( ) 16 15 ( ) 16 14 ( ) 16 12 ( ) 16 10

) x x ( s

2 i

So sánh các độ lệch chuẩn

5,15

x 

5,15

x 

5,15

x 

Nhận xét: Cả 4 chỉ tiêu trên đều chỉ dùng để so sánh biến

thiên của các hiện tượng cùng loại

Sử dụng Excel:

Tool/Data Analysis/Descriptive Statistics

Có chứa giá trị phương sai: Sample Variance, lấy căn bậc 2 sẽ được độ lệch tiêu chuẩn (có sẵn) là standard deviation.

Trang 22

ra còn được dùng trong trường hợp hai hiện tượng có đơn vị tính khác nhau

• Tứ phân vị:

86

2.5 Hình dáng của phân phối

Trang 23

Hình dáng của phân phối

Tác dụng của đồ thị hộp ria mèo

• Nhận biết vị trí của bộ dữ liệu trên cơ sở Me

• Nhận biết sự dàn trải của dữ liệu trên cơ sở

độ dài của hộp (khoảng tứ phân vị IQR) và

độ dài của hộp ria mèo

• Nhận biết độ lệch phân phối của dữ liệu

• Nhận biết lượng biến đột xuất và nghi ngờ là đột xuất

• So sánh 2 hay nhiều bộ dữ liệu với cùng 1 thước đo

90

Nhận biết lượng biến đột xuất

IQR 1.5 IQR 1.5 IQR

Giới hạn trong Giới hạn ngoài

Q1 Me Q3

Nghi ngờ là lượng biến đột xuất

Nghi ngờ là

lượng biến

đột xuất

Lượng biến đột xuất Lượng biến

Bài tập

• Làm bài tập tại lớp

• Làm bài tập về nhà

Trang 24

Ôn tập cuối chương

• Đọc:

• Bài tập SGK:

Ngày đăng: 10/11/2018, 12:12

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm