Tính các đại lượng thống kê mô t

Một phần của tài liệu Bai ging hng dn thc hanh SPSS (Trang 39 - 44)

Trong một tập dữ liệu ta có thể tính các đại lượng thống kê mô t của tập dữ liệu như

• Các đại lượng đo độ tập trung: trung bình cộng, trung vị, mode;

• Các đại lượng đo độ phân bố: tứ phân vị và phân vị thứ p;

• Các đại lượng đo độ phân tán: kho ng biến thiên, độ tr i giữa, phương sai, độ lệch chuẩn;

• Các đại lượng mô t hình dáng của tập dữ liệu: hệ số b t đối xứng Skewness, hệ số đo đọ nhọn Kurtosis.

Trước hết ta nhắc lại định nghĩa và công thức tính toán những đại lượng này.

• Trung bình cộng đơn gi n được tính bằng cách cộng t t c các giá trị quan sát của tập dữ liệu rồi chia cho số quan sát của tập dữ liệu đó;

• Trung vị là giá trị đứng giữa của tập dữ liệu đã được sắp thứ tự. Như vậy, không kể trung vị sẽ có50% số quan sát của tập dữ liệu có giá trị lớn hơn trung vị và50% số quan sát của tập dữ liệu có giá trị nhỏ hơn trung vị;

• Mode của một tập dữ liệu là giá trị xu t hiện nhiều nh t trong tập dữ liệu.

• Tứ phân vị chia tập dữ liệu đã sắp xếp theo trật tự tăng dần thành bốn phần có số quan sát bằng nhau. Tứ phân vị bao gồm ba tứ phân vị: tứ phân vị thứ nh tQ1, tứ phân vị thứ hai Q2 (chính là trung vị) và tứ phân vị thứ baQ3. Trong tập dữ liệu có25% số quan sát của tập dữ liệu nhỏ hơn hoặc bằngQ1,50% số quan sát của tập dữ liệu nhỏ hơn hoặc bằngQ2

và có75% số quan sát của tập dữ liệu nhỏ hơn hoặc bằngQ3.

• Phân vị thứ p của một tập dữ liệu đã được sắp thứ tự là giá trị chia tập dữ liệu thành hai phần, một phần gồmp% số quan sát có giá trị nhỏ hơn hoặc bằng phân vị thứ p, phần còn lại có(100p)% số quan sát lớn hơn hoặc bằng phân vị thứ p.

• Kho ng biến thiên của một tập dữ liệu là hiệu giữa giá trị lớn nh t và giá trị nhỏ nh t của tập dữ liệu.

• Độ tr i giữa của một tập dữ liệu là hiệu độ chênh lệch giữa tứ phân vị thứ ba và tứ phân vị thứ nh t của tập dữ liệu.

• Phương sai của một tập dữ liệu tổng thể, kí hiệu là σ2, được xác định b i công thức:

σ2 =

°N

i=1(xià)2

N , đõyàlà trung bỡnh của tổng thể và N là số quan sỏt trong tổng thể.

• Phương sai của một tập dữ liệu mẫu, kí hiệu là°n s2, được xác định b i công thức: s2 =

i=1(xix)2

n1 , đâyxlà trung bình của mẫu và n là số quan sát trong mẫu.

• Độ lệch chuẩn của một tập dữ liệu tổng thể, kí hiệu làσ, là căn bậc hai của phương sai của tổng thể:

σ=

d°N

i=1(xià)2

N .

• Độ lệch chuẩn của một tập dữ liệu mẫu, kí hiệu làs, là căn bậc hai của phương sai mẫu:

s = d°n

i=1(xix)2 n1 .

Chẳng hạn, để tính những đại lượng thống kê mô t như: trung bình, trung vị, phương sai, độ lệch chuẩn của biến Tuoi:

Bước 1: VàoAnalyzeDescriptive StatisticsDescriptive... và khi màn hỡnh sẽ hiện ra hộp thoại sau thì ta chọn biến Tuoi để đưa vào khungVariable(s) bên ph i:

Bước 2: n tiếp vào nútOptionsđể chọn tính những đại lượng thống kê mô t cho biến tuổi và màn hình hiện ra hộp thoại:

Ta muốn tính đại lượng nào thì chọn vào đại lượng đó để hiện kết qu ra cửa sổ Output sau đó nContinuevà khi màn hình hiện ra hội thoại cũ thì nOK

Mean Trung bình cộng

Sum Tổng các giá trị của biến Std.Deviation Độ lệch chuẩn

Minimum Giá trị nhỏ nh t Maximum Giá trị lớn nh t Variance Phương sai

Range Kho ng biến thiên

SE mean độ lệch chuẩn của trung bình mẫu Kurtosis Hệ số đo độ nhọn

Skewness Hệ số b t đối xứng

Cửa sổ Output sẽ cho ta kết qu sau:

Tính tứ phân vị hay phân vị thứ p tùy ý của tập dữ liệu, chẳng hạn cho biến Tuoi:

Bước 1: Vào AnalyzeDescriptive StatisticsFrequencies... và màn hỡnh hiện ra hộp thoại:

Bước 2: Chọn các biến định lượng cần tính bên trái đưa vào khung Variable bên ph i, n Statisticsvà nếu ta không muốn đưa b ng tần số thì không chọn ôDisplay frequency tables.

Bước 3: Khi màn hình hiện ra hộp thoại:

ta chọn những đại lượng cần tính, nContinuetr về hộp thoại trước nOK.

Median Trung vị

Mode Mode

Quartiles Đưa tứ phân vị

Cut points for k equal groups Đưa ra các điểm chia tập dữ liệu thành k phần bằng nhau Percentiles k Đưa ra phân vị thứ k của tập dữ liệu

Chẳng hạn, hộp thoại trên ta tính trung vị, mode, tứ phân vị và phân vị thứ 10 với 90 của dữ liệu Tuoi. Kết qu trong cửa số Output như sau:

Kết qu tính toán này trên SPSS cho ta th y:

• Trung vị của tuổi là 21, mode của tuổi là 23;

• Ba tứ phân vị là: Q1 = 17.25, Q2 = 21, Q3 = 26.15;

• Phân vị thứ 10 là 15.10, phân vị thứ 90 là 45.90.

Bài tập ôn luyện

M tập dữ liệuDuLieuFastFood.savvào trong cửa sổData Editorcủa SPSS và thực hiện các yêu cầu sau:

1. Mã hóa lại biến GioiTinh và NgheNghiep với những giá trị mã hóa tương ứng như sau:

Nam được mã hóa là 1, Nữ là 0; HSSV được mã hóa là 1, CNVC là 2, NVVP là 3, Khac là 4 và thay đổi khai báo lại về kiểu giá trị của hai biến này là dạng số, không có chữ số thập phân nào sau d u ph y. Lưu lại file dữ liệu sau khi đã mã hóa với tên là DuLieuFastFood MaHoaLai.sav.

Các yêu cầu sau được thực hiện trên fileDuLieuFastFood MaHoaLai.sav:

2. Mã hóa biến tuổi thành biến khác có tên là TuoiMoi với các mã hóa tương ứng như sau:

Những ngư i có tuổi không vượt quá 14 được mã hóa là 1, từ 14 đến 24 mã hóa là 2, từ 24 đến 45 mã hóa là 3, từ 45 đến 60 mã hóa là 4 và trên 60 mã hóa là 5. Tính tỉ lệ những ngư i có độ tuổi trên 60 trong nhóm được điều tra.

3. Đưa thông tin về những nữ nhân viên văn phòng trong mẫu.

4. Trong những ngư i làm nhân viên văn phòng, hãy tính số ngư i có thu nhập từ 3 đến 5 triệu.

5. Trong số những ngư i mua su t ăn FastFood với giá trên 40 nghìn, hãy tính tỉ lệ những ngư i là học sinh và sinh viên.

6. Trong những nữ nhân viên văn phòng hãy tính tỉ lệ những ngư i có thu nhập trên 5 triệu một tháng.

7. Tính tuổi trung bình của nam trong nhóm điều tra, tuổi trung bình của nữ trong nhóm điều tra và đưa ra nhận xét.

8. Một nửa số những ngư i điều tra có độ tuổi không vượt quá bao nhiêu? Tính tuổi nhỏ nh t trong nhóm10% số ngư i có tuổi cao nh t trong nhóm được điều tra.

9. 75% số nam được điều tra có tuổi không vượt quá bao nhiêu? 25% số nữ có độ tuổi ít nh t là bao nhiêu?

Bài 3

Biểu đồ

Một phần của tài liệu Bai ging hng dn thc hanh SPSS (Trang 39 - 44)

Tải bản đầy đủ (PDF)

(74 trang)