1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Làm sạch số liệu ở các biến cân nặng, chiều cao, vòng đầu, vòng ngực (đo lần 1), vòng ngực (đo lần 2), vòng cánh tay, hồng cầu, hemoglobin.

25 72 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Làm Sạch Số Liệu Ở Các Biến Cân Nặng, Chiều Cao, Vòng Đầu, Vòng Ngực (Đo Lần 1), Vòng Ngực (Đo Lần 2), Vòng Cánh Tay, Hồng Cầu, Hemoglobin
Tác giả Ngô Minh Khang
Trường học unknown
Chuyên ngành unknown
Thể loại bài tập
Năm xuất bản Y23
Thành phố unknown
Định dạng
Số trang 25
Dung lượng 823,25 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Cách 1: Dùng bảng tần số (Frequency). B1: Vào Analyze, chọn Descriptive statistics. B2: Chọn Frequencies. B3: Chọn biến cần kiểm tra, tích chọn ô Display frequency tables. B4: Bảng Frequency sẽ xuất hiện ở trang output của spss. Ta thấy: khi chạy Frequency thì ở bảng Statistics sẽ hiển thị 2 giá trị là Valid và Missing. + Valid tức là các giá trị hợp lệ. + Missing là giá trị không có trong bảng (được để trống). Ở biến cân nặng, giá trị valid hiển thị là 600, missing hiển thị là 0, đồng thời, bảng hiển thị các giá trị của biến cũng không xuất hiện các giá trị khác thường. ð Tất cả các số liệu ở biến cân nặng đều là hợp lệ. Statistics Can nang N Valid 600 Missing 0 Can nang Frequency Percent Valid Percent Cumulative Percent Valid 5,0 1 ,2 ,2 ,2 6,0 4 ,7 ,7 ,8 6,3 1 ,2 ,2 1,0 6,4 1 ,2 ,2 1,2 6,5 3 ,5 ,5 1,7 6,8 1 ,2 ,2 1,8 6,9 1 ,2 ,2 2,0 7,0 5 ,8 ,8 2,8 7,2 1 ,2 ,2 3,0 7,4 1 ,2 ,2 3,2 7,5 9 1,5 1,5 4,7 7,6 2 ,3 ,3 5,0 7,7 1 ,2 ,2 5,2

Trang 1

Họ và tên: Ngô Minh Khang – Y23A.

B3: Chọn biến cần kiểm tra, tích chọn ô Display frequency tables

B4: Bảng Frequency sẽ xuất hiện ở trang output của spss

- Ta thấy: khi chạy Frequency thì ở bảng Statistics sẽ hiển thị 2 giá trị là Valid và Missing.+ Valid tức là các giá trị hợp lệ

+ Missing là giá trị không có trong bảng (được để trống)

- Ở biến cân nặng, giá trị valid hiển thị là 600, missing hiển thị là 0, đồng thời, bảng hiển thị các giá trị của biến cũng không xuất hiện các giá trị khác thường

ð Tất cả các số liệu ở biến cân nặng đều là hợp lệ

Trang 4

- Ở biến chiều cao, vòng cánh tay cũng như cân nặng, không xuất hiện giá trị missing.

- Ở biến vòng đầu, vòng ngực (đo lần 1), vòng ngực (đo lần 2), hồng cầu, hemoglobin ta thấy giá trị missing ≠ 0 => ở các biến này có các giá trị không hợp lệ

+ Ở biến vòng đầu, missing = 1

+ Ở biến vòng ngực (đo lần 1), missing = 1

Vong nguc (do lan 1) cm

Frequency Percent Valid Percent

Cumulative Percent

Trang 6

Vong nguc (do lan 2) cm

Frequency Percent Valid Percent

Cumulative Percent

Trang 7

+ Ở biến hồng cầu, missing = 1.

Hong cau (M/ul)

Frequency Percent Valid Percent

Cumulative Percent

Trang 15

B3: Chọn Ascending (tăng dần) hoặc Descending (giảm dần) => chọn Ok.

B4: Sau khi nhấn ok thì giá trị missing sẽ hiện lên đầu tiên (nếu chọn ascending) hoặc giá trị missing sẽ

ở cuối cùng (nếu chọn descending)

Cách 3: Sử dụng lệnh descriptives

B1: Vào Analyze => Descriptives statistics => Descriptives

B2: Chọn biến cần mô tả => chọn Ok

B3: Biến mô tả được hiển thị ở trang Output:

- Xét giá trị N, ở đây ta lấy biến vòng đầu, ta thấy: giá trị valid = 599, mà tổng số các trường hợp

là 600 => có 1 trường hợp ta chưa nhập dữ liệu (missing)

- Dùng lệnh find để tìm giá trị missing đó => sửa lại giá trị đó

2.2 Sử dụng các kĩ thuật làm sạch số liệu để tìm lỗi sai ở các biến: nguồn thu nhập, các triệu chứng thiếu máu (da xanh xao, niêm mạc mắt nhợt nhạt, lòng bàn tay nhợt nhạt, lưỡi, móng tay nhợt nhạt, gan to)

Trang 16

Cách 1: Sử dụng lệnh sort cases.

B1: Vào Data => Sort cases

B2: Chọn biến cần sắp xếp vào ô Sort by => chọn Ascending hoặc Descending => Ok

- Ở biến “thu nhập”, khi sử dụng lệnh thì không thấy giá trị missing xuất hiện ở đầu (nếu dùng ascending) => biến này không lỗi

- Ở biến “da xanh xao”, khi sử dụng lệnh thì không thấy giá trị missing xuất hiện ở đầu (nếu dùng ascending) => biến này không lỗi

- Ở biến “long ban tay nhot nhat, khi sử dụng lệnh thì ta không thấy giá trị missing xuất hiện ở đầunhưng ở cuối lại xuất hiện giá trị “3” => biến lỗi => sửa lỗi

- Ở biến “luoi mat gai”, khi sử dụng lệnh thì ta không thấy giá trị missing xuất hiện ở đầu nhưng ở cuối lại xuất hiện giá trị “4” => biến lỗi => sửa lỗi

- Ở biến “mong tay nhot nhat”, khi sử dụng lệnh thì ta không thấy giá trị missing xuất hiện ở đầu (nếu dùng ascending) => biến này không lỗi

- Ở biến “gan to”, khi sử dụng lệnh thì ta thấy xuất hiện giá trị missing ở đầu (dùng lệnh

ascending) => biến lỗi => sửa lỗi

Cách 2: Sử dụng lệnh Frequencies

B1: Vào Analyze => Descriptive statistics => Frequencies

B2: Chọn các biến “nguồn thu nhập”, “da xanh xao”, “niêm mạc mắt nhợt nhạt”, “lòng bàn tay nhợt nhạt”, “lưỡi”, “móng tay nhợt nhạt”, “gan to” và đưa vào ô variable

B3: Nháy chọn Display frequency tables

Trang 17

- Ở bảng “niem mac nhot nhat”, chỉ xuất hiện các giá trị “khong” và “co”, ngoài ra không có giátrị nào khác hay hiển thị giá trị missing => không lỗi.

- Ở bảng “long ban tay nhot nhat”, ngoài xuất hiện các giá trị “khong” và “co” còn xuất hiện giátrị “3” => lỗi => dùng lệnh find để tìm lỗi và sửa

- Ở bảng “luoi mat gai”, ngoài xuất hiện các giá trị “khong” và “co” còn xuất hiện giá trị “4” => lỗi => dùng lệnh find để tìm lỗi và sửa

Trang 18

- Ở bảng “mong tay nhot nhat”, chỉ xuất hiện các giá trị “khong” và “co”, ngoài ra không có giá trị nào khác hay hiển thị giá trị missing => không lỗi.

- Ở bảng “gan to”, ngoài xuất hiện các giá trị “khong” và “co” còn xuất hiện thêm giá trị missing với frequency = 1 => lỗi => dùng lệnh find để tìm lỗi và sửa

Sử dụng crosstabs:

B1: Vào Analyze => Descriptive statistics => Crosstabs

B2: Chọn biến “nghe” vào ô Row, chọn biến “tdhv” vào ô Column => chọn Ok

B3:

- Ở trang Output, ta xét bảng “Nghe nghiep me * Trinh do hoc van Crosstabulation”

+ Ở cột “mu chu”, ta thấy có 1 giá trị = 1 ở hàng “can bo cong chuc” => phi logic

ð Biến số “Nghe nghiep me” chứa lỗi sai trong 2 biến ta xét tính logic

2.3 Kiểm tra tính logic của số liệu giữa 2 biến: trình độ học vấn và nghề nghiệp mẹ

1 Biến số nào chứa lỗi sai trong các biến trên

2 Mã số phiếu chứa lỗi sai trong các trường hợp trên

Trang 19

- Mã số phiếu chứa lỗi sai trên là mã số 20.

Bài tập 3

Chia 5 nhóm cân nặng từ biến cân nặng:

B1: Vào Transform => Recode into same variables

B2: Ở mục Numeric variables, ta chọn biến “cannang” => Old and new values => xuất hiện hộp thoại

Old and new values

B3:

- Nhóm 1: < 10kg:

+ Chọn Range, lowest through value, nhập giá trị 10

+ Ở ô new value, ta nhập số 1 tương ứng với nhóm 1

+ Nháy add

- Nhóm 2: 10 - < 20kg:

+ Chọn Range, nhập 10 vào ô

+ Chọn Through, nhập 20 vào ô

+ Ở ô new value, ta nhập số 2 tương ứng với nhóm 2

+ Nháy add

- Nhóm 3: 20 - < 30kg:

+ Chọn Range, nhập 20 vào ô

+ Chọn Through, nhập 30 vào ô

+ Ở ô new value, ta nhập số 3 tương ứng với nhóm 3

+ Nháy add

- Nhóm 4: 30 - < 40kg:

+ Chọn Range, nhập 30 vào ô

Chia 5 nhóm cân nặng từ biến cân nặng:

Trang 20

+ Chọn Through, nhập 40 vào ô.

+ Ở ô new value, ta nhập số 4 tương ứng với nhóm 4

+ Nháy add

- Nhóm 5: ≥ 40kg

+ Cách 1:

1 Chọn Range, value through highest, nhập 40 vào ô

2 Ở ô new value, ta nhập số 5 tương ứng với nhom 5

3 Nháy add

+ Cách 2: Vì tất cả các giá trị cân nặng đều được xếp vào các nhóm 1, 2, 3, 4 => tất cả các giá trị cân nặng ≥ 40kg sẽ thuộc về nhóm ≥ 40kg

1 Chọn mục all other values

2 Ở ô new value, ta nhập số 5 tương ứng với nhóm 5

3 Nháy add

- Nháy Continue => nháy Ok

Số lượng và tỉ lệ mỗi nhóm khi mã hóa:

B1: Vào Analyze => Descriptive statistics => Frequencies

B2: Chọn Display frequency tables => Ok

B3:

- Ở trang Output, xét bảng cân nặng, ở cột frequency cho thấy số lượng của các nhóm cân nặng, cột valid percent cho thấy tỉ lệ của mỗi nhóm cân nặng:

+ Nhóm 1: có 161 trường hợp có cân nặng thuộc nhóm này, chiếm tỉ lệ 26,8%

+ Nhóm 2: có 296 trường hợp có cân nặng thuộc nhóm này, chiếm tỉ lệ 49,3%

+ Nhóm 3: có 91 trường hợp có cân nặng thuộc nhóm này, chiếm tỉ lệ 15,2%

+ Nhóm 4: có 42 trường hợp có cân nặng thuộc nhóm này, chiếm tỉ lệ 7%

+ Nhóm 5: có 10 trường hợp có cân nặng thuộc nhóm này, chiếm tỉ lệ 1,7%

Trang 21

Chia trình độ học vấn mẹ thành 3 nhóm:

B1: Vào Transform => Recode into different variables

B2: Ở mục Numeric variables, ta chọn biến “trình độ học vấn” => Old and new values => xuất hiện hộp thoại Old and new values

+ Mục old value, ta chọn ô value, nhập 4; ở ô new value, ta nhập 2 tượng trưng cho nhóm 2 => add

Trang 22

Số lượng và tỉ lệ mỗi nhóm khi mã hóa:

B1: Vào Analyze => Descriptive statistics => Frequencies

B2: Chọn Display frequency tables => Ok

B3: Ở trang Output, xét bảng “trình độ học vấn”, ở cột Frequency cho thấy số lượng người mẹ có trình

độ học vấn thuộc 3 nhóm:

+ Nhóm 1: có 270 người có trình độ học vấn thuộc nhóm này, chiếm tỉ lệ 45%

+ Nhóm 2: có 235 người có trình độ học vấn thuộc nhóm này, chiếm tỉ lệ 39,2%

+ Nhóm 3: có 95 người có trình độ học vấn thuộc nhóm này, chiếm tỉ lệ 15,8%

Trang 23

Chia nghề nghiệp mẹ làm 3 nhóm:

B1: Vào Transform => Recode into different variables

B2: Ở mục Numeric variables, ta chọn biến => Old and new values => xuất hiện hộp thoại Old and new values

B3:

- Nhóm 1: lao động chân tay, công nhân, nội trợ:

+ Theo values ở trong trang variable view, nội trợ được gán = 1, nông dân được gán bằng 2, công nhân được gán bằng 4

+ Mục old value, ta chọn ô value, nhập 1; ở ô new value, ta nhập 1 tượng trưng cho nhóm 1 => add

+ Mục old value, ta chọn ô value, nhập 2; ở ô new value, ta nhập 1 tượng trưng cho nhóm 1 => add

+ Mục old value, ta chọn ô value, nhập 4; ở ô new value, ta nhập 1 tượng trưng cho nhóm 1 => add

- Nhóm 2: buôn bán + lao động tri óc (cán bộ công chức):

+ Theo values ở trong trang variable view, buôn bán được gán bằng 3, cán bộ công chức được gán bằng 5

+ Mục old value, ta chọn ô value, nhập 3; ở ô new value, ta nhập 2 tượng trưng cho nhóm 2 => add

+ Mục old value, ta chọn ô value, nhập 5; ở ô new value, ta nhập 2 tượng trưng cho nhóm 2 => add

- Nhóm 3: nghề khác:

+ Vì sau khi ta gán các nghề vào các nhóm 1 và 2 => chỉ còn lại “nghề khác” sẽ được đưa vào nhóm 3

+ Chọn mục all other values => ở ô new value, ta nhập 3 tượng trưng cho nhóm 3 => add

Chia nghề nghiệp mẹ làm 3 nhóm: lao động chân tay, công nhân, nội trợ, buôn bán, lao động trí óc (CBVC), nghề khác

Cho biết số lượng và tỉ lệ mỗi nhóm sau khi mã hóa

Trang 24

Số lượng và tỉ lệ mỗi nhóm khi mã hóa:

B1: Vào Analyze => Descriptive statistics => Frequencies

B2: Chọn Display frequency tables => Ok

B3: Ở trang Output, ta xét bảng “Nghề”, ta thấy:

- Số người lao động ở nhóm 1 là 586 người, chiếm 97,7%

- Số người lao động ở nhóm 2 là 14 người, chiếm 2,3%

- Số người lao động ở nhóm 3 là 0 người , chiếm 0%

Ngày đăng: 16/12/2023, 18:36

HÌNH ẢNH LIÊN QUAN

B4: Bảng Frequency sẽ xuất hiện ở trang output của spss. - Làm sạch số liệu ở các biến cân nặng, chiều cao, vòng đầu, vòng ngực (đo lần 1), vòng ngực (đo lần 2), vòng cánh tay, hồng cầu, hemoglobin.
4 Bảng Frequency sẽ xuất hiện ở trang output của spss (Trang 1)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w