Pham Thi Tam, CTUMP - 7 - -Thanh công cụ: Ý nghĩa của các biểu tượng trên thanh công cụ: Open Mở tập tin Save/ save as Lưu tập tin số liệu Log ghi kết quả phân tích Editor Nhập và sửa
Trang 1TRƯỜNG ĐẠI HỌC Y DƯỢC CẦN THƠ
KHOA Y TẾ CÔNG CỘNG
Giáo trình Môn tin học nâng cao
Đối tượng: Chuyên khoa cấp II
PHÂN TÍCH SỐ LIỆU BẰNG STATA
Người biên sọan: PGS TS PHẠM THỊ TÂM
Cần Thơ, 2020
Trang 2MỤC LỤC
I Giới thiệu về STATA 1
1.1 Cài đặt Stata 1
1.2 Khởi động chương trình 3
1.3 Mô tả giao điện của chương trình Stata 4
1.4 Sắp xếp các cửa sổ và chọn font chữ 6
II Tạo cơ sở liệu 7
2.1 Mã hóa dữ liệu 7
2.2 Tạo biến số .8
2.3 Lưu file dữ liệu .9
2.4 Mở file dữ liệu có sẵn 9
2.5 Đổi tên biến số 10
2.6 Thêm biến số 10
2.7 Bỏ biến số 10
Bài tập 1 11
III Quản lý số liệu 13
3.1 Mô tả bộ số liệu 13
3.2 Sắp xếp thứ tự các quan sát 14
3.3 Liệt kê giá trị biến số 15
3.4 Mô tả dữ liệu 16
3.5 Copy kết quả dán vào Microsoft word 17
3.6 Copy đồ thị ra word 18
3.7 Save lại kết quả phân tích (file log) 18
3.8 Lựa chọn tập hợp các bản ghi theo các điều kiện: mệnh đề if 20
3.9 Các phím thường sử dụng trong stata 21
3.10 Giải mã số liệu (Gán nhãn vào mã số liệu) 22
3.11 Mã hóa lại số liệu (Recoding) 23
Bài tập 2 26
Bài tập 3 27
IV Phân tích số liệu định lượng 28
Trang 3Composed by PGs Ts Pham Thi Tam, CTUMP - 3 -
I Giới thiệu về STATA
Stata là một phần mềm thống kê để quản lý, phân tích và vẽ đồ thị của số liệu STATA thực hịên các câu lệnh thông qua hệ thống trình đơn để tạo sự dễ dàng cho người sử dụng Đây còn là một chương trình chủ yếu dùng câu lệnh gõ trực tiếp từ bàn phím có đủ sự linh hoạt để đáp ứng được nhu cầu của những người sử dụng khác nhau Trong phạm vi lớp học này chúng tôi cũng sẽ giới thiệu cách sử dụng chương trình STATA phương pháp thực hịên các câu lệnh thông qua hệ thống thực đơn để tạo sự dễ dàng cho người sử dụng
Mục đích chính của khoá học này là giúp bạn làm quen với các thao tác cơ bản của Stata và làm thế nào để sử dụng và kết hợp một số lệnh cơ bản Sau khi kết thúc khoá học, bạn có thể sử dụng Stata 8 như là một công cụ cho các phân tích định lượng cơ bản (summary statistics, regression analysis, graphs)
1.1 Cài đặt Stata 8.0
Dưới đây trình bày các cài đặt Stata 8.0 từ tập tin Stata.zip:
Bước 1 Copy tập tin stata.zip vào ổ đĩa D của máy tính
Nhấp đôi chuột lên tập tin stata.zip để giải nén Trong file stata.zip có 4 tập tin:
Tập tin cài đặt stata: stata8.0.zip
Tập tin số liệu: IVF.dta và CODE.dta
Tập tin số series: serial number.doc
Bước 2: Nhấp đôi chuột lên tập tin stata8.0.zip để giải nén
Bước 3 Nhấp đôi chuột ở folder stata8.0, tìm tập tin setup.exe
Màn hình hiển thị như sau, Nhấp vào nút lệnh Next để sang cửa sổ tiếp theo
Setup.exe
Trang 4- Tiếp tục nhấp vào nút lệnh Next cho cửa sổ tiếp theo
- Chọn kiểu Stata intercooled để tiến hành cài đặt (cho phép làm việc với tập tin
dữ liệu lớn hơn và nhanh hơn):
Sau khi cài đặt, của sổ Finished sẽ hiện ra Lúc này có thể nhấp vào nút lệnh Close
để kết thúc việc cài đặt
Sau khi cài đặt xong, khởi động Stata
Trang 5Composed by PGs Ts Pham Thi Tam, CTUMP - 5 -
1.2 Khởi động chương trình
- Nhấp đôi chuột lên biểu tượng Stata trên desktop của máy tính
Hoặc
- Nhấp chuột vào Start
->Nhấp chuột vào All program
->Di chuyễn chuột đến thự mục Stata 8
-> Nhấp đôi chuột lên biểu tượng Intercooled Stata 8
Khởi động chương trình lần đầu tiên, hộp thoại màn hình stata sẽ xuất hiện yêu cầu cung cấp các thông tin ở cột bên trái của bảng dưới đây Người dùng điền thông tin dưới đây vào hộp thoại Để tránh ghi sai số series, code và authorization key, người dùng nên mở file serial number.doc để copy số serial, code và authorization key dán vào hộp thoại
Organization Tên cơ quan (không bỏ dấu tiếng Việt) Name Tên cá nhân (không bỏ dấu tiếng Việt)
Trang 61.3 Mô tả giao điện của chương trình Stata
Sau khi khởi động, giao diện của stata sẽ hiện ra gồm 3 thanh và 4 cửa sổ:
-Thanh tiêu đề; với dòng chữ Intercooled stata 8.0
-Thanh trình đơn: Ý nghĩa của thanh trình đơn:
Trang 7Composed by PGs Ts Pham Thi Tam, CTUMP - 7 -
-Thanh công cụ: Ý nghĩa của các biểu tượng trên thanh công cụ:
Open (Mở tập tin)
Save/ save as (Lưu tập tin số liệu)
Log (ghi kết quả phân tích)
Editor (Nhập và sửa số liệu) Exit (thóat khỏi stata)
*Trình đơn File: Bạn có thể dùng trình đơn File như dưới đây, để:
Mở tập tin (open)
Lưu tập tin số liệu (Save/ Save as)
Ghi kết quả phân tích (Log)
Ngưng tập tin và thoát khỏi stata (exit)
– Cửa sổ xem lại Review, nằm ở phía trên trái màn hình, liệt kê tất cả các câu lệnh đã
được thực hiện (cả đúng và sai) Nhấn chuột lên câu lệnh được liệt kê, nó sẽ xuât hiện ở cửa sổ Command và bạn có thể thực hiện lại câu lệnh hay chỉnh sửa
– Cửa sổ biến số Variables, nằm ở bên trái phía dưới màn hình, hiển thị tất cả các biến
của bộ số liệu
Trang 8– Cửa sổ kết quả Stata Results, nằm ở phía bên phải màn hình, hiển thị các kết quả từ
câu lệnh của bạn Trong trường hợp có sai xót trong câu lệnh, một gợi ý ở dạng chữ đỏ
sẽ xuất hiện
– Cửa sổ lệnh Stata Command, nằm ở phía dưới bên phải màn hình, là nơi bạn sẽ nhập
và sửa chữa, thông qua bàn phím, các câu lệnh của Stata Khi câu lệnh thích hợp đã được đánh vào, bạn phải nhấn phím enter để thực hiện lệnh
Lưu ý: Trong trường hợp các của sổ xem lại và cửa sổ biến số không hiển thị trên màn
hình, bạn có thể cho hiển thị lại bằng cách vào trình đơn window, chọn review hoặc variables
1.5 Thóat khỏi stata
Để thoát chương trình, vào File/ bấm save để lưu dữ liệu Nhấp vào nút close nằm trên phải của cửa sổ Stata, hoặc chọn File từ thực đơn chính, rồi chọn Exit Trong trường hợp dữ liệu có thay đổi, bạn cố gắng thoát chương trình mà không lưu những số liệu đã bị thay đổi, hộp thoại sau sẽ xuất hiện.khi nhấp vào nút đóng, máy tính sẽ hỏi bạn có muốn
thóat mà không lưu dữ liệu hay không (Data have changed without being save
Do you really want to exit?)
+ Nếu bạn không muốn lưu dữ liệu,bấm YES thì Stata sẽ thóat mà không lưu dữ liệu + Nếu muốn lưu dữ liệu, bấm NO để trở lại Stata và lưu số liệu bằng cách vào Menu File
Trang 9Composed by PGs Ts Pham Thi Tam, CTUMP - 9 -
II TẠO CƠ SỞ DỮ LIỆU & QUẢN LÝ SỐ LIỆU
2.1 Mã hóa số liệu
Để thuận tiện cho việc nhập số liệu, tất cả các biến số trong phiếu điều tra đều được
mã hóa dưới dạng số Phần mềm Stata sẽ cho phép bạn tạo các nhãn (label) tương ứng với
các giá trị của biến số Ví dụ, mã hóa các giá trị của biến số nhóm tuổi và học vấn như sau:
Học vấn của mẹ Cấp I trở xuống
Cấp II Cấp III trở lên
1
2
3 Giới tính của đứa trẻ Nam
Nữ
0
1
Mẫu phiếu điều tra cân nặng sơ sinh có dạng như sau:
Bộ câu hỏi nghiên cứu các yếu tố liên quan cân nặng lúc sinh của trẻ sơ sinh
( Điều tra viên điền vào khoảng trống hoặc khoanh tròn câu trả lời thích hợp)
Số thứ tự phiếu điều tra:
1 Chị bao nhiêu tuổi? (tính tròn năm)
6 Nhóm tuổi của người mẹ
( ĐTV xác định dựa theo tuổi của người mẹ)
8 Tình trạng sơ sinh nhẹ cân
( ĐTV xác định dựa theo trọng lượng lúc sinh của đứa bé)
0 không (> 2500 gram)
1 có (dưới 2500 gram)
33 37,7
2410
Trang 102.2 Tạo biến số để nhập số liệu
Khởi động Stata, sau đó click lên biểu tượng Data Editor cửa sổ số liệu của Stata xuất hiện Cửa sổ số liệu stata kiểu bảng số trống, mỗi cột biểu diễn một biến số (tuổi, học vấn, nghề nghiệp,…), mỗi hàng biểu diễn dữ liệu của một đối tượng nghiên cứu
Ví dụ muốn tạo biến số tuổi, các bước tạo biến số:
-> Nhấp chuột tại ô đầu tiên của cột trống đầu tiên
-> Nhấp chuột tại hộp var[1]
->Gõ số tuổi của mẹ vào hộp var[1]: 33
-> nhấn phím enter
Kết quả: số 33 sẽ xuất hiện tại ô đầu tiên của bảng tính:
- Đặt tên biến số:
Nhấp 2 lần vào cột đầu tiên, hộp thọai stata variable information xuất hiện
-> Gõ vào hộp name tên của biến số: tuoime
-> Gõ vào thẻ label nhãn biến số: tuoi cua nguoi me
-> Clich OK
Trang 11Composed by PGs Ts Pham Thi Tam, CTUMP - 11 -
Một số đặc điểm cần lưu ý khi xác định tên biến số:
- Tên biến có chứa tối đa 32 ký tự
- Từ đơn (viết liên tục, Ví dụ: tuoime), không dấu
- Tên kiểu chữ thường khác với tên kiểu chữ hoa (Tuoime khác với tuoime)
- Tên biến có thể chứa chữ, số và dấu gạch dưới
- Tên biến không thể bắt đầu bằng số và không nên bắt đầu bằng dấu gạch dưới 2.3 Lưu file dữ liệu
- Vào menu File,
-> Save as
-> Chọn thư mục,
-> Gõ tên tập tin, phần mở rộng “.dta” Ví dụ filename.dta
2.4 Mở tập tin dữ liệu có sẵn
Nhấp chuột vào nút công cụ mở file hoặc từ menu File, chọn open
Hộp thoại Use New Data sẽ xuất hiện
Nhấp vào mũi tên bên phải hộp Look in để chọn ổ đĩa thích hợp và dùng con chuột nhấp vào thư mục để chọn thư mục có chứa file số liệu Khi gặp tập tin muốn mở, bạn nhấp đúp vào tập tin này để mở tập tin
Trang 122.5 Đổi tên biến số
Từ cửa sổ số liệu,
-> Nhấp 2 lần vào cột chứa biến số muốn đổi tên
-> Gõ vào thẻ name tên mới vào thay thế tên cũ
Hoặc dùng trình đơn: Data /Variable utilities/ Rename variable
2.6 Thêm biến số vào trước một biến số khác
Từ cửa sổ số liệu,
-> Nhấp chuột tại cột trống cuối trang màn hình để tạo biến số mới
-> Click chuột vào thẻ << để đưa biến số mới tạo về vị trí đầu tiên
-> Nhấp chuột vào các biến số đứng kế tiếp và click thẻ << cho đến khi biến số mới
được đặt tại vị trí mong muốn
2.7 Bỏ biến số
Ví dụ muốn bỏ biến số hocvan Các bước thực hiện như sau:
Từ cửa sổ số liệu,
->Nhấp chuột tại cột có chứa biến số muốn bỏ
->Nhấn nút delete, hộp thọai sau đây xuất hiện
-> Chọn delete variable hocvan,
Trang 13Composed by PGs Ts Pham Thi Tam, CTUMP - 13 -
Bài tập 1:
1)Tạo file nhập số liệu cho phiếu điều tra sau:
Bộ câu hỏi nghiên cứu các yếu tố liên quan cân nặng lúc sinh của trẻ sơ sinh
( Điều tra viên điền vào khoảng trống hoặc khoanh tròn câu trả lời thích hợp)
Số thứ tự phiếu điều tra:
1 Chị bao nhiêu tuổi? (tính tròn năm)
6 Nhóm tuổi của người mẹ
( ĐTV xác định dựa theo tuổi của người mẹ)
8 Tình trạng sơ sinh nhẹ cân
( ĐTV xác định dựa theo trọng lượng lúc sinh của đứa bé)
0 Không (> 2500 gram)
1 Có (dưới 2500 gram)
Trang 142) Nhập số liệu của cho 30 phiếu điều tra dưới đây
3) Lưu file vào ổ đĩa D, tên file nghien cuu so sinh nhe can.dta
4) Thoát khỏi Stata, mở lại file nghien cuu so sinh nhe can.dta, nhập thêm số liệu 10 phiếu
sau đây Lưu dữ liệu và thoát khỏi Stata
Trang 15Composed by PGs Ts Pham Thi Tam, CTUMP - 15 -
III- QUẢN LÝ SỐ LIỆU
3.1 Mô tả bộ số liệu
Là xem bộ số liệu có bao nhiêu bản ghi (phiếu điều tra), có bao nhiêu biến số, là bước đầu tiên trước khi bắt đầu phân tích số liệu
Bạn có thể yêu cầu Stata mô tả bộ số liệu bằng lệnh describe, viết tắt là des bằng cách
Gõ vào cửa sổ lệnh: des
Hoặc Trình đơn: Data
-> chọn Describe
-> chọn Describe variable in memory
-> click OK
Ví dụ: Bạn hảy mở tập tin ivf.dta Đây là bộ số liệu bao gồm những biến số về những đứa
trẻ sơ sinh Tập tin này gồm 641 đứa trẻ với những biến số như sau:
stt : Số thứ tự phiếu điều tra
tuoime : Tuổi của người mẹ
tuanthai : Tuổi thai tính theo tuần
huyetap : Cao huyết áp thai kỳ
gioitinh : Giới tính của đứa trẻ
cnss : trong lượng lúc sinh của đứa trẻ tính theo gram
Trang 16Bạn hảy gỏ des vào cửa sổ lệnh
Kết quả: Cửa sổ kết quả hiển thị như sau:
Contains data from G:\8-STATA-TAPHUAN\STATA-CAOHOC_2010\ivf_crude.dta
obs: 641
vars: 6 30 Sep 2010 16:11
size: 17,948 (98.3% of memory free)
- storage display value
variable name type format label variable label
- stt float %9.0g so thu tu phieu
tuoime float %9.0g tuoi cua nguoi me
tuanthai float %9.0g so tuan tuoi thai
huyetap float %9.0g huyet ap cua nguoi me
gioitinh float %9.0g gioi tinh cua dua tre
cnss float %9.0g trong luong luc sinh cua dua be - Sorted by: stt
Obs / vars Bộ số liệu của chúng ta có 641 quan sát và 6 biến số
Size: Thông báo cho bạn biết độ lớn của bộ số liệu đang sử dụng (bằng bytes) và số bộ
nhớ bạn cần để tải file dữ liệu này Stata mặc định phân bổ 1 MB cho dữ liệu
Storage type: cho biết kiểu biến trong đó số liệu được lưu trữ Có 2 kiểu số liệu chính:
+ Kiểu chữ : ký hiệu lưu trữ là str#
+ Kiểu số : ký hiệu lưu trữ là byte, int, long hoặc float, double
Display format : dạng hiển thị của các biến trong bộ số liệu %#s dữ liệu kiểu chữ và %#g
cho dữ liệu số
Value label : cho biết nhãn giá trị
Variable label : cho biết nhãn của biến
Dòng chữ ở dưới cùng: “ Sorted by:” chobiết trật tự sắp xếp của bộ số liệu
+ Sorted by: cho biết bộ số liệu hiện không sắp xếp theo trình tự nào cả
+ Sorted by: varname Stata sắp xếp các quan sát của số liệu theo trật tự tăng dần
của biến số varname
3.2 Sắp xếp thứ tự các quan sát
Thực hiện sắp xếp số liệu bằng lệnh sort
Hoặc dùng trình đơn: Data
-> Chọn sort varname
Trang 17Composed by PGs Ts Pham Thi Tam, CTUMP - 17 -
3.3 Xem số liệu
Bạn không thể in bộ số liệu từ màn hình số liệu, mà bạn phải cho số liệu hiển thị
trong cửa sổ kết quả Thực hiện sắp xếp số liệu bằng lệnh list bằng cách:
Hoặc Trình đơn Data, ->Chọn Describe data -> Chọn List data
Nhấp chuột vào thẻ varibles để xác định vị trí của biến sô và dùng chuột nhấp vào danh sách biến số để chọn biến số muốn liệt kê để đưa tên biến số vào thẻ
Cửa sổ kết quả xuất hiện như sau:
list stt tuoime tuanthai huyetap gioitinh cnss, separator(5)
Bạn có thể mở cửa sổ bảng tính để sửa số liệu bằng cách click vào nút công cụ hoặc
từ trình đơn Data, chọn Data editor Kết quả: Màn hình số liệu xuất hiện như sau:
Trang 18Số liệu của stata được mô tả dưới dạng là một bảng với các hàng là các đối tượng và các cột
là các biến số
Bạn có thể sửa số liệu, bấm nút close sau khi sửa xong
Khi nhấp nút close, hộp thọai Exit editor xuất hiện, bạn click OK
3.4 Mô tả dữ liệu
a) Mô tả biến số định lượng
Các biến số định lượng được trình bày dưới dạng giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất và giá trị lớn nhất Đối với các biến số định lượng có phân bố lệch, trình
bày kết quả giá trị trung vị, khoảng tứ vị, giá trị nhỏ nhất và giá trị lớn nhất
Các biến số định lượng: Tuổi mẹ, tuần mang thai, trọng lượng lúc sinh
Thực hiện bằng lệnh su
Hoặc trình đơn statistics/
-> chọn summaries, tables, & tests
Trọng lượng lúc sinh của trẻ sơ sinh
- Gõ vào cửa sổ lệnh: su varname hoặc su varname , detail
- Nhấp chuột lên biến số tuoime
Kết quả :
Variable | Obs Mean Std Dev Min Max -+ - tuoime | 641 33.97192 3.87046 23 43
Trang 19Composed by PGs Ts Pham Thi Tam, CTUMP - 19 -
b) Mô tả biến số định tính
Các biến số định được trình bày dưới dạng bảng tần số và tỉ lệ % Các biến số định
tính: giới tính, cao huyết áp, nhóm tuổi mẹ, sanh non tháng, sơ sinh nhẹ cân
Ví dụ: Bảng tần số và tỉ lệ % giới tính của đứa trẻ Giới tính của đứa trẻ Tần số Tỉ lệ %
Nam
Nữ
Tổng
- Thực hiện bằng lệnh tab
- Hoặc trình đơn statistics/
-> chọn summaries, tables, & tests
-> chọn tables
-> chọn multiple one-way tables
3.5 Copy kết quả Stata dán vào microsoft word
Bạn sẽ học cách chọn lựa và copy kết quả hiển thị trong cửa sổ Stata Results và dán chúng vào tài liệu Word Dùng chuột kéo qua cửa sổ kết quả và đánh dấu khu vực bạn
muốn copy Sau đó chọn Edit, rồi Copy Text hoặc bấm tổ hợp Ctrl-C Mở một tài liệu rỗng trong Microsoft Word, Click vào biểu tượng Paste hoặc vào Edit/ chọn Paste hoặc
Ctrl-V Chọn Font chữ courier new để dóng thẳng hàng
3.6 Copy đồ thị ra word
tab1 gioitinh -> tabulation of gioitinh gioi tinh |
cua dua tre | Freq Percent Cum -+ -
0 | 315 49.14 49.14
1 | 326 50.86 100.00 -+ - Total | 641 100.00
Trang 20Sau khi tạo ra một đồ thị trong Stata bạn có thể dễ dàng copy và dán nó vào một tài liệu Word Trước tiên bạn phải tạo ra một đồ thị Ví dụ tạo biểu đồ cột liên tục của CNSS Các bước tiến hành:
- Gõ lệnh histogram bweight, width(200) start(400)
rồi gõ enter Biểu đồ cột liên tục xuất hiện trên cửa sổ stata result
- Sau đó chọn Edit, rồi Copy Graph, hoặc Bấm tổ hợp Ctrl - C
- Mở một tài liệu rỗng trong Microsoft Word
- Click vào biểu tượng Paste hoặc vào Edit/ chọn Paste hoặc Ctrl-V
3.7 Save lại kết quả phân tích
Kết quả phân tích được thể hiện trên cửa sổ Stata result Cửa sổ này có thanh trượt dọc cho phép xem lại kết quả phân tích cũ Tuy nhiên cửa số này chỉ lưu lại những kết quả gần nhất Chúng ta có thể copy kết quả phân tích và dán vào document Nếu muốn lưu lại toàn bộ kết quả phân tích chúng ta cần mở cửa sổ log và tạo file log
a) Tạo tập tin.log để lưu kết quả phân tích
Để tạo file log, nhấp chuột lên biểu tượng Log trên thanh công cụ
Hoặc Trình đơn File, -> chọn log
Hộp thoại Begin Logging Stata Output mở ra, bạn nhập tên của tập tin lưu trữ vào hộp văn bản file name
-> chọn lọai văn bản có phần mở rộng *.log(Ch ọn save as type: Log *.log )
-> nhấp nút Save
Trang 21Composed by PGs Ts Pham Thi Tam, CTUMP - 21 -
Giả sử chúng ta muốn tập tin này là baitap.log, hãy gỏ baitap vào hộp thọai file name và chon save as Log (*.log) Kết quả phân tích sau đó sẽ được tự động lưu vào file baitap.log
b) Đóng file log khi muốn kết thúc việc ghi lại kết quả phân tích
Từ Menu File, chọn close hoặc nhấp vào nút công cụ log , để hiện cửa số stata log options Nhấp nút close log file, nhấp OK
c) Xem lại kết quả lưu trong file log :
Khi muốn xem lại kết quả phân tích, nhấp chuột lần nữa vào biểu tượng Log
hộp thoại Stata Log Options với ba tuỳ chọn sẽ xuất hiện, Chọn View snapshot
of log file / OK để xem
Nếu muốn tạm ngưng lưu kết quả, chọn Suspend log file
Trang 223.8 Lựa chọn tập hộp các bản ghi theo các điều kiện: mệnh đề if
Nếu bạn chỉ muốn xem kết quả một phần số liệu chứ không xem tòan bộ nhằm mục đích kiểm tra số liệu, bạn dùng điều kiện if Ví dụ, xem các bản ghi có trọng lượng lúc sinh của đứa bé từ 1000 gram trở xuống, thực hiện các bước sau:
Từ trình đơn Data
Describe -> List data
-> Click vao thẻ by/if/in
Trang 23Composed by PGs Ts Pham Thi Tam, CTUMP - 23 -
3.9 Các phím thường sử dụng trong Stata
Khi kết quả thực hiện lệnh của Stata dài hơn 1 trang màn hình, bạn sẽ thấy xuất hiện chữ -more - ở góc dưới trái của màn hình kết quả Khi đó bạn có thể:
Phím “trắng” : xem câu trả lời ở màn hình kế tiếp
Phím Q : ngưng hiển thị câu trả lời
Phím Enter (hoặc phím l): xem dòng kế tiếp
Phím Pgup : xem lệnh trước đó
Phím PgDn : xem lệnh tiếp theo
Phím delete: xóa ký tự ngay dấu chấm nhắc,
Phím backspace: xóa ký tự trước dấu chấm nhắc
Phím mũi tên trái “”và phím mũi tên phải “”: di chuyễn giữa các ký tự
Một số ký hiệu sử dụng trong Stata:
Trang 243.10 Giải mã số liệu (Tạo nhãn và gán nhãn)
Thông thường, bạn nhập số liệu dưới mã hóa Ví dụ biến số gioitinh có hai trạng
thái là 0 và 1, 0 là mã số của giới tính là nam, 1 là mã giá trị của giới tính là nữ Bạn sẽ tạo
ra một nhãn giá trị để gán những trạng thái này Gán nhãn vào mã số liêu được thực hiện qua 2 bước: Tạo nhãn (value define) và gán nhãn (value assign)
a) Tạo nhãn:
Bước 1 Từ trình đơn Data,
-> Chọn Labels & notes, -> Chọn Define values label,
Bước 3 Nhấp chuột lên nhãn gioitinh, -> Click nút add
Hộp thọai add value xuất hiện:
-> Gõ: 1 vào thẻ value,
-> gõ nu vào thẻ text,
Trang 25Composed by PGs Ts Pham Thi Tam, CTUMP - 25 -
b) Gán nhãn
Để gán nhãn gioitinh vào mã số số liệu của biến số gioitinh,
Từ trình đơn Data/ Labels & notes
Chọn: Assign values label to variable
Nhấp chuột chọn biến số gioitinh đưa vào thẻ variable, click OK
3.11 Mã hóa lại số liệu (Recoding)
Từ biến số định lượng như tuổi mẹ, bạn có thể tạo ra các biến số phân lọai như nhóm tuổi mẹ có 3 lọai: dưới 25 tuổi, 25 – 35 tuổi, và trên 35 tuổi Ví dụ bạn đặt tên biến số
nhóm tuổi mẹ là nhomtuoime và mã số các giá trị như sau:
1 = dưới 25 tuổi
2 = 25 – 35 tuổi
3 = trên 35 tuổi
Bạn thực hiện qua 2 bước:
Bước 1 Tạo biến số mới
Bước 2 Recode
a) Tạo biến số mới: nhomtuoi = tuoime
Trình đơn: Data/Create or change variables/Create variable
-> Gõ vào thẻ Generate variable: nhomtuoi
->Nhấp chuột vào biến số tuoime để đưa tên biến số vào thẻ contents
->Click OK
Trang 26b) Mã hóa nhóm các giá trị của nhomtuoime:
Trình đơn:
Data \ other variable transformation commands \ recode categirical variable
- Nhấp chuột lên biến số nhomtuoime để đưa vào thẻ variables
- Gõ vào thẻ required : (min/24= 1) (25/35=2) (36/max= 3)
- Click OK
Trang 27Composed by PGs Ts Pham Thi Tam, CTUMP - 27 -
Trang 28Bài tập 2a: Mô tả đặc điểm đối tượng nghiên cứu
Mở tập tin nghien cuu so sinh nhe can dta (bài tập 1)
Thực hiện mô tả đặc điểm của đối tượng nghiên cứu và ghi kết quả cho bảng 3.1 và 3.2
Bảng 3.1 Giá trị trung bình của tuổi mẹ, tuần thai và trọng lượng lúc sinh của đứa trẻ
Đặc điểm n Trung bình Độ lệch chuẩn Nhỏ nhất-Lớn nhất Tuổi của người mẹ
Tuần thai
Trọng lượng lúc sinh của trẻ sơ sinh
Bảng 3.2 Đặc điểm của đối tượng nghiên cứu
Dưới 30 tuổi
30 – 34 tuổi
35 – 39 tuổi Nhóm tuổi của người mẹ
Từ 40 tuổi trở lên Bình thường Tình trạng huyết áp của
người mẹ lúc mang thai Tăng huyết áp
Nam Giới tính của đứa bé
Nữ
Có (<37 tuần ) Sanh non tháng
Không (> 37 tuần)
Có (<2500 gram) Sanh nhẹ cân
3) Hảy tạo nhản và gán nhãn giá trị cho biến số groupage
4) Từ biến số tuanthai, hảy tạo biến số nonthang có 2 giá: 0 và 1
0 = > 37 tuần
1 = < 37 tuần
5) Hảy tạo nhãn và gán nhãn giá trị cho biến số nonthang
6) Lưu file dữ liệu mới sửa vào ổ đĩa D: tên tập tin ivfupdate.dta
7) Tạo file log lưu kết quả phân tích sau và cho biết kết quả:
Trang 29Composed by PGs Ts Pham Thi Tam, CTUMP - 29 -
Bài tập 3: Tạo file nhập số liệu
1/Tạo biến số để nhập số liệu cho phiếu điều tra hộ gia đình như sau:
CODEBOOK BCH ĐIỀU TRA HỘ GIA ĐÌNH
C1_gioi Câu 1 Giới Nhập số: 1 = nam 2 = nữ
C2_tuoi Câu 2 Tuổi Nhập số tuổi: từ 5, 6,…
C3_nghe Câu 3 Nghề nghiệp 1=Nông dân 5= Nội trợ
2=Công nhân 6= Mất sức LĐ 3=CBVC 7= Nghề khác 4=Buôn bán
2=Đọc viết 5=Cấp III 3=Cấp I 6=Trên cấp III
qua
0= không 1= có
C9_htl Câu 8 Hút thuốc lá 0= không 1= có
benhmt Trình trạng bệnh mạn tính 0= không 1= có
caohap Tăng huyết áp 0= không 1= có
2) Nhập vào máy tính số liệu của cho 30 phiếu tra (số liệu do người học tự tạo)
3)Tạo biến số nhomtuoi:
3) Từ cân nặng và chiều cao, tạo biến số BMI = cân nặng / (chiều cao tính = mét)2
4) Tạo biến số nhombmi :
0 = bmi < 25
1 = bmi >= 25
5) Lập bảng tần số nhombmi và tạo file log để lưu kết quả bảng tần số nhombmi