Giới thiệu về STATA
Cài đặt Stata
Dưới đây trình bày các cài đặt Stata 8.0 từ tập tin Stata.zip:
Bước 1 Copy tập tin stata.zip vào ổ đĩa D của máy tính
Nhấp đôi chuột lên tập tin stata.zip để giải nén Trong file stata.zip có 4 tập tin:
Tập tin cài đặt stata: stata8.0.zip
Tập tin số liệu: IVF.dta và CODE.dta
Tập tin số series: serial number.doc
Bước 2: Nhấp đôi chuột lên tập tin stata8.0.zip để giải nén
Bước 3 Nhấp đôi chuột ở folder stata8.0, tìm tập tin setup.exe
Màn hình hiển thị như sau, Nhấp vào nút lệnh Next để sang cửa sổ tiếp theo
- Tiếp tục nhấp vào nút lệnh Next cho cửa sổ tiếp theo
- Chọn kiểu Stata intercooled để tiến hành cài đặt (cho phép làm việc với tập tin dữ liệu lớn hơn và nhanh hơn):
Sau khi cài đặt, của sổ Finished sẽ hiện ra Lúc này có thể nhấp vào nút lệnh Close để kết thúc việc cài đặt
Sau khi cài đặt xong, khởi động Stata
Composed by PGs Ts Pham Thi Tam, CTUMP - 5 -
Khởi động chương trình
- Nhấp đôi chuột lên biểu tượng Stata trên desktop của máy tính
->Nhấp chuột vào All program
->Di chuyễn chuột đến thự mục Stata 8
-> Nhấp đôi chuột lên biểu tượng Intercooled Stata 8
Khi khởi động chương trình lần đầu tiên, hộp thoại màn hình Stata sẽ yêu cầu người dùng cung cấp thông tin từ cột bên trái của bảng dưới đây Để tránh sai sót trong việc nhập số series, code và authorization key, người dùng nên mở file serial number.doc để sao chép và dán các thông tin này vào hộp thoại.
Organization Tên cơ quan (không bỏ dấu tiếng Việt)
Name Tên cá nhân (không bỏ dấu tiếng Việt)
Code ju$3 4xm9 yevc Lv$5 agpz i7
Khởi động Stata từ lần thứ 2 trở đi, màn hình Stata xuất hiện như sau:
Mô tả giao điện của chương trình Stata
Sau khi khởi động, giao diện của stata sẽ hiện ra gồm 3 thanh và 4 cửa sổ:
-Thanh tiêu đề; với dòng chữ Intercooled stata 8.0
-Thanh trình đơn: Ý nghĩa của thanh trình đơn:
- Window: mở ra các cửa sổ
- File : đóng mở tập tin
Cửa sổ xem lại các thao tác đã thực hiện
Composed by PGs Ts Pham Thi Tam, CTUMP - 7 -
-Thanh công cụ: Ý nghĩa của các biểu tượng trên thanh công cụ:
Save/ save as (Lưu tập tin số liệu)
Log (ghi kết quả phân tích)
Editor (Nhập và sửa số liệu)
*Trình đơ n File: Bạn có thể dùng trình đơn File như dưới đây, để:
Lưu tập tin số liệu (Save/ Save as)
Ghi kết quả phân tích (Log)
Ngưng tập tin và thoát khỏi stata (exit)
Cửa sổ xem lại Review nằm ở góc trên bên trái màn hình, hiển thị tất cả các câu lệnh đã thực hiện, bao gồm cả những câu lệnh đúng và sai Bằng cách nhấn chuột vào câu lệnh trong danh sách, bạn có thể xem lại nó trong cửa sổ Command để thực hiện lại hoặc chỉnh sửa câu lệnh đó.
– Cửa sổ biến số Variables , nằm ở bên trái phía dưới màn hình, hiển thị tất cả các biến của bộ số liệu
Cửa sổ kết quả Stata nằm bên phải màn hình và hiển thị kết quả từ câu lệnh của bạn Nếu có sai sót trong câu lệnh, một gợi ý sẽ xuất hiện dưới dạng chữ đỏ.
Cửa sổ lệnh Stata Command, nằm ở góc dưới bên phải màn hình, cho phép người dùng nhập và chỉnh sửa các câu lệnh Stata bằng bàn phím Để thực thi lệnh, bạn cần nhấn phím enter sau khi nhập câu lệnh thích hợp.
Nếu cửa sổ xem lại và cửa sổ biến số không hiển thị trên màn hình, bạn có thể khôi phục chúng bằng cách vào trình đơn "Window" và chọn "Review" hoặc "Variables".
Sắp xếp các cửa sổ và chọn font chữ
Người dùng có thể tùy chỉnh kích thước và vị trí của các cửa sổ màn hình theo ý thích bằng cách kéo thả cửa sổ hoặc thanh bên phải của cửa sổ.
Để chọn font cho mỗi cửa sổ hiển thị, bạn chỉ cần nhấp vào hộp thực đơn điều khiển ở góc trên trái của cửa sổ Sau đó, chọn font mà bạn mong muốn từ hộp thoại font xuất hiện và nhấn OK để xác nhận.
1.5 Thóat khỏi stata Để thoát chương trình, vào File/ bấm save để lưu dữ liệu Nhấp vào nút close nằm trên phải của cửa sổ Stata, hoặc chọn File từ thực đơn chính, rồi chọn Exit Trong trường hợp dữ liệu có thay đổi, bạn cố gắng thoát chương trình mà không lưu những số liệu đã bị thay đổi, hộp thoại sau sẽ xuất hiện.khi nhấp vào nút đóng, máy tính sẽ hỏi bạn có muốn thóat mà không lưu dữ liệu hay không (Data have changed without being save
Do you really want to exit?)
Nếu bạn không muốn lưu dữ liệu, hãy nhấn YES để Stata thoát mà không lưu Ngược lại, nếu bạn muốn lưu dữ liệu, hãy nhấn NO để quay lại Stata và lưu số liệu qua Menu File.
Composed by PGs Ts Pham Thi Tam, CTUMP - 9 -
II TẠO CƠ SỞ DỮ LIỆU & QUẢN LÝ SỐ LIỆU
2.1 Mã hóa số liệu Để thuận tiện cho việc nhập số liệu, tất cả các biến số trong phiếu điều tra đều được mã hóa dưới dạng số Phần mềm Stata sẽ cho phép bạn tạo các nhãn (label) tương ứng với các giá trị của biến số Ví dụ, mã hóa các giá trị của biến số nhóm tuổi và học vấn như sau:
Tên biến số Giá trị Mã hóa
Học vấn của mẹ Cấp I trở xuống
Cấp II Cấp III trở lên
3 Giới tính của đứa trẻ Nam
1 Mẫu phiếu điều tra cân nặng sơ sinh có dạng như sau:
Bộ câu hỏi nghiên cứu các yếu tố liên quan cân nặng lúc sinh của trẻ sơ sinh
(Điều tra viên điền vào khoảng trống hoặc khoanh tròn câu trả lời thích hợp)
Số thứ tự phiếu điều tra:
STT Câu hỏi Trả lời
1 Chị bao nhiêu tuổi? (tính tròn năm)
2 Lúc sinh thai được bao nhiêu tuần?
3 Chị có cao huyết áp lúc có thai không? 0 không
4 Con chị (trẻ sơ sinh) là nữ hay nam? 0 nam
5 Lúc sinh đứa bé được mấy kí (gram)
6 Nhóm tuổi của người mẹ
(ĐTV xác định dựa theo tuổi của người mẹ)
7 Tình trạng sanh non tháng
(ĐTV xác định dựa theo số tuần mang thai lúc sinh)
8 Tình trạng sơ sinh nhẹ cân
(ĐTV xác định dựa theo trọng lượng lúc sinh của đứa bé)
2.2 Tạo biến số để nhập số liệu
Khởi động Stata và nhấp vào biểu tượng Data Editor để mở cửa sổ số liệu Cửa sổ này hiển thị bảng số trống, trong đó mỗi cột đại diện cho một biến số như tuổi, học vấn, nghề nghiệp, và mỗi hàng chứa dữ liệu của một đối tượng nghiên cứu.
Ví dụ muốn tạo biến số tuổi, các bước tạo biến số:
-> Nhấp chuột tại ô đầu tiên của cột trống đầu tiên
-> Nhấp chuột tại hộp var[1]
->Gõ số tuổi của mẹ vào hộp var[1]: 33
Kết quả: số 33 sẽ xuất hiện tại ô đầu tiên của bảng tính:
Nhấp 2 lần vào cột đầu tiên, hộp thọai stata variable information xuất hiện
-> Gõ vào hộp name tên của biến số: tuoime
-> Gõ vào thẻ label nhãn biến số: tuoi cua nguoi me
Composed by PGs Ts Pham Thi Tam, CTUMP - 11 -
Một số đặc điểm cần lưu ý khi xác định tên biến số:
- Tên biến có chứa tối đa 32 ký tự
- Từ đơn (viết liên tục, Ví dụ: tuoime), không dấu
- Tên kiểu chữ thường khác với tên kiểu chữ hoa (Tuoime khác với tuoime)
- Tên biến có thể chứa chữ, số và dấu gạch dưới
- Tên biến không thể bắt đầu bằng số và không nên bắt đầu bằng dấu gạch dưới
-> Gõ tên tập tin, phần mở rộng “.dta” Ví dụ filename.dta
2.4 Mở tập tin dữ liệu có sẵn
Nhấp chuột vào nút công cụ mở file hoặc từ menu File, chọn open
Hộp thoại Use New Data sẽ xuất hiện
Để mở file số liệu, hãy nhấp vào mũi tên bên phải hộp "Look in" để chọn ổ đĩa phù hợp, sau đó dùng chuột nhấp vào thư mục chứa file Khi tìm thấy tập tin cần mở, chỉ cần nhấp đúp vào nó.
Từ cửa sổ số liệu,
-> Nhấp 2 lần vào cột chứa biến số muốn đổi tên
-> Gõ vào thẻ name tên mới vào thay thế tên cũ
Hoặc dùng trình đơn: Data /Variable utilities/ Rename variable
2.6 Thêm biến số vào trước một biến số khác
Từ cửa sổ số liệu,
-> Nhấp chuột tại cột trống cuối trang màn hình để tạo biến số mới
-> Click chuột vào thẻ Nhấp chuột vào các biến số đứng kế tiếp và click thẻ Nhấp chuột tại cột có chứa biến số muốn bỏ
->Nhấn nút delete, hộp thọai sau đây xuất hiện
Hoặc dùng Trình đơn: Data/ Variables utilities/ Eliminate variables or observations
-> Nhấp chọn các biến muốn bỏ đưa vào thẻ variables
Composed by PGs Ts Pham Thi Tam, CTUMP - 13 -
1)Tạo file nhập số liệu cho phiếu điều tra sau:
Bộ câu hỏi nghiên cứu các yếu tố liên quan cân nặng lúc sinh của trẻ sơ sinh
(Điều tra viên điền vào khoảng trống hoặc khoanh tròn câu trả lời thích hợp)
Số thứ tự phiếu điều tra:
TT Câu hỏi Trả lời
1 Chị bao nhiêu tuổi? (tính tròn năm)
2 Lúc sinh thai được bao nhiêu tuần (lấy 1 số lẻ)?
3 Chị có cao huyết áp lúc có thai không? 0 Không
4 Con chị (trẻ sơ sinh) là nữ hay nam? 0 Nữ
5 Lúc sinh đứa bé được mấy kí (gram)
6 Nhóm tuổi của người mẹ
(ĐTV xác định dựa theo tuổi của người mẹ)
7 Tình trạng sanh non tháng
(ĐTV xác định dựa theo số tuần mang thai lúc sinh)
8 Tình trạng sơ sinh nhẹ cân
(ĐTV xác định dựa theo trọng lượng lúc sinh của đứa bé)
2) Nhập số liệu của cho 30 phiếu điều tra dưới đây
| stt tuoime tuanthai huyetap gioitinh cnss nhomtuoi sanhnon nhecan |
3) Lưu file vào ổ đĩa D, tên file nghien cuu so sinh nhe can.dta
4) Thoát khỏi Stata, mở lại file nghien cuu so sinh nhe can.dta, nhập thêm số liệu 10 phiếu sau đây Lưu dữ liệu và thoát khỏi Stata
| stt tuoime tuanthai huyetap gioitinh cnss nhomtuoi sanhnon nhecan |
Composed by PGs Ts Pham Thi Tam, CTUMP - 15 -
III- QUẢN LÝ SỐ LIỆU
3.1 Mô tả bộ số liệu
Trước khi tiến hành phân tích số liệu, bước đầu tiên là kiểm tra bộ số liệu để xác định số lượng bản ghi (phiếu điều tra) và số lượng biến số có trong đó.
Bạn có thể yêu cầu Stata mô tả bộ số liệu bằng lệnh describe, viết tắt là des bằng cách
Gõ vào cửa sổ lệnh: des
-> chọn Describe variable in memory
Tập tin ivf.dta chứa dữ liệu về 641 trẻ sơ sinh với các biến số quan trọng như số thứ tự phiếu điều tra (stt), tuổi của người mẹ (tuoime), tuổi thai tính theo tuần (tuanthai), huyết áp thai kỳ (huyetap), giới tính của đứa trẻ (gioitinh) và cân nặng lúc sinh tính theo gram (cnss).
Bạn hảy gỏ des vào cửa sổ lệnh
Kết quả: Cửa sổ kết quả hiển thị như sau:
Contains data from G:\8-STATA-TAPHUAN\STATA-CAOHOC_2010\ivf_crude.dta obs: 641 vars: 6 30 Sep 2010 16:11 size: 17,948 (98.3% of memory free)
- storage display value variable name type format label variable label
The article presents key data related to maternal and infant health metrics, including the mother's age, gestational weeks, blood pressure, child's gender, and birth weight Each parameter is crucial for assessing the health of both the mother and the newborn.
Obs / vars Bộ số liệu của chúng ta có 641 quan sát và 6 biến số
Kích thước: Thông tin về kích thước bộ số liệu hiện tại (tính bằng bytes) và dung lượng bộ nhớ cần thiết để tải tệp dữ liệu Mặc định, Stata cấp phát 1 MB cho dữ liệu.
Storage type: cho biết kiểu biến trong đó số liệu được lưu trữ Có 2 kiểu số liệu chính:
+ Kiểu chữ : ký hiệu lưu trữ là str#
+ Kiểu số : ký hiệu lưu trữ là byte, int, long hoặc float, double
Display format : dạng hiển thị của các biến trong bộ số liệu %#s dữ liệu kiểu chữ và %#g cho dữ liệu số
Value label : cho biết nhãn giá trị
Variable label : cho biết nhãn của biến
Dòng chữ ở dưới cùng: “Sorted by:” cho biết trật tự sắp xếp của bộ số liệu
+ Sorted by: cho biết bộ số liệu hiện không sắp xếp theo trình tự nào cả
+ Sorted by: varname Stata sắp xếp các quan sát của số liệu theo trật tự tăng dần của biến số varname
3.2 Sắp xếp thứ tự các quan sát
Thực hiện sắp xếp số liệu bằng lệnh sort
Hoặc dùng trình đơn: Data
Composed by PGs Ts Pham Thi Tam, CTUMP - 17 -
Để in bộ số liệu, bạn cần hiển thị số liệu trong cửa sổ kết quả thay vì từ màn hình số liệu Để thực hiện việc này, hãy sắp xếp số liệu bằng lệnh list.
Hoặc Trình đơn Data, ->Chọn Describe data -> Chọn List data
Nhấp vào thẻ biến để xác định vị trí của biến số, sau đó chọn biến số cần liệt kê từ danh sách bằng cách nhấp chuột.
Cửa sổ kết quả xuất hiện như sau:
list stt tuoime tuanthai huyetap gioitinh cnss, separator(5)
| stt tuoime tuanthai huyetap gioitinh cnss |
Để sửa số liệu trong bảng tính, bạn chỉ cần nhấn vào nút công cụ hoặc chọn "Data editor" từ trình đơn "Data" Khi thực hiện, màn hình số liệu sẽ hiện ra.
Số liệu của stata được mô tả dưới dạng là một bảng với các hàng là các đối tượng và các cột là các biến số
Bạn có thể sửa số liệu, bấm nút close sau khi sửa xong
Khi nhấp nút close, hộp thọai Exit editor xuất hiện, bạn click OK
3.4 Mô tả dữ liệu a) Mô tả biến số định lượng
Các biến số định lượng được trình bày với giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất và lớn nhất Đối với các biến số có phân bố lệch, kết quả được trình bày dưới dạng giá trị trung vị, khoảng tứ vị, cùng giá trị nhỏ nhất và lớn nhất.
Các biến số định lượng: Tuổi mẹ, tuần mang thai, trọng lượng lúc sinh
Thực hiện bằng lệnh su
-> chọn summary statistics Đặc điểm n Trung bình Độ lệch chuẩn Nhỏ nhất-Lớn nhất Tuổi của người mẹ
Trọng lượng lúc sinh của trẻ sơ sinh
- Gõ vào cửa sổ lệnh: su varname hoặc su varname , detail
- Nhấp chuột lên biến số tuoime
Variable | Obs Mean Std Dev Min Max -+ - tuoime | 641 33.97192 3.87046 23 43
Composed by PGs Ts Pham Thi Tam, CTUMP - 19 - b) Mô tả biến số định tính
Tạo cơ sở liệu
Tạo biến số
Khởi động Stata và nhấp vào biểu tượng Data Editor để mở cửa sổ số liệu Cửa sổ này hiển thị bảng số trống, trong đó mỗi cột đại diện cho một biến số như tuổi, học vấn, và nghề nghiệp, trong khi mỗi hàng chứa dữ liệu của một đối tượng nghiên cứu.
Ví dụ muốn tạo biến số tuổi, các bước tạo biến số:
-> Nhấp chuột tại ô đầu tiên của cột trống đầu tiên
-> Nhấp chuột tại hộp var[1]
->Gõ số tuổi của mẹ vào hộp var[1]: 33
Kết quả: số 33 sẽ xuất hiện tại ô đầu tiên của bảng tính:
Nhấp 2 lần vào cột đầu tiên, hộp thọai stata variable information xuất hiện
-> Gõ vào hộp name tên của biến số: tuoime
-> Gõ vào thẻ label nhãn biến số: tuoi cua nguoi me
Composed by PGs Ts Pham Thi Tam, CTUMP - 11 -
Một số đặc điểm cần lưu ý khi xác định tên biến số:
- Tên biến có chứa tối đa 32 ký tự
- Từ đơn (viết liên tục, Ví dụ: tuoime), không dấu
- Tên kiểu chữ thường khác với tên kiểu chữ hoa (Tuoime khác với tuoime)
- Tên biến có thể chứa chữ, số và dấu gạch dưới
- Tên biến không thể bắt đầu bằng số và không nên bắt đầu bằng dấu gạch dưới.
Lưu file dữ liệu
-> Gõ tên tập tin, phần mở rộng “.dta” Ví dụ filename.dta
2.4 Mở tập tin dữ liệu có sẵn
Nhấp chuột vào nút công cụ mở file hoặc từ menu File, chọn open
Hộp thoại Use New Data sẽ xuất hiện
Để mở file số liệu, hãy nhấp vào mũi tên bên phải hộp "Look in" để chọn ổ đĩa phù hợp, sau đó dùng chuột để chọn thư mục chứa file Khi tìm thấy tập tin cần mở, bạn chỉ cần nhấp đúp vào tập tin đó.
Từ cửa sổ số liệu,
-> Nhấp 2 lần vào cột chứa biến số muốn đổi tên
-> Gõ vào thẻ name tên mới vào thay thế tên cũ
Hoặc dùng trình đơn: Data /Variable utilities/ Rename variable
2.6 Thêm biến số vào trước một biến số khác
Từ cửa sổ số liệu,
-> Nhấp chuột tại cột trống cuối trang màn hình để tạo biến số mới
-> Click chuột vào thẻ Nhấp chuột vào các biến số đứng kế tiếp và click thẻ Nhấp chuột tại cột có chứa biến số muốn bỏ
->Nhấn nút delete, hộp thọai sau đây xuất hiện
Hoặc dùng Trình đơn: Data/ Variables utilities/ Eliminate variables or observations
-> Nhấp chọn các biến muốn bỏ đưa vào thẻ variables
Composed by PGs Ts Pham Thi Tam, CTUMP - 13 -
1)Tạo file nhập số liệu cho phiếu điều tra sau:
Bộ câu hỏi nghiên cứu các yếu tố liên quan cân nặng lúc sinh của trẻ sơ sinh
(Điều tra viên điền vào khoảng trống hoặc khoanh tròn câu trả lời thích hợp)
Số thứ tự phiếu điều tra:
TT Câu hỏi Trả lời
1 Chị bao nhiêu tuổi? (tính tròn năm)
2 Lúc sinh thai được bao nhiêu tuần (lấy 1 số lẻ)?
3 Chị có cao huyết áp lúc có thai không? 0 Không
4 Con chị (trẻ sơ sinh) là nữ hay nam? 0 Nữ
5 Lúc sinh đứa bé được mấy kí (gram)
6 Nhóm tuổi của người mẹ
(ĐTV xác định dựa theo tuổi của người mẹ)
7 Tình trạng sanh non tháng
(ĐTV xác định dựa theo số tuần mang thai lúc sinh)
8 Tình trạng sơ sinh nhẹ cân
(ĐTV xác định dựa theo trọng lượng lúc sinh của đứa bé)
2) Nhập số liệu của cho 30 phiếu điều tra dưới đây
| stt tuoime tuanthai huyetap gioitinh cnss nhomtuoi sanhnon nhecan |
3) Lưu file vào ổ đĩa D, tên file nghien cuu so sinh nhe can.dta
4) Thoát khỏi Stata, mở lại file nghien cuu so sinh nhe can.dta, nhập thêm số liệu 10 phiếu sau đây Lưu dữ liệu và thoát khỏi Stata
| stt tuoime tuanthai huyetap gioitinh cnss nhomtuoi sanhnon nhecan |
Đổi tên biến số
Từ cửa sổ số liệu,
-> Nhấp 2 lần vào cột chứa biến số muốn đổi tên
-> Gõ vào thẻ name tên mới vào thay thế tên cũ
Hoặc dùng trình đơn: Data /Variable utilities/ Rename variable
Thêm biến số
Từ cửa sổ số liệu,
-> Nhấp chuột tại cột trống cuối trang màn hình để tạo biến số mới
-> Click chuột vào thẻ Nhấp chuột vào các biến số đứng kế tiếp và click thẻ Nhấp chuột tại cột có chứa biến số muốn bỏ
->Nhấn nút delete, hộp thọai sau đây xuất hiện
Hoặc dùng Trình đơn: Data/ Variables utilities/ Eliminate variables or observations
-> Nhấp chọn các biến muốn bỏ đưa vào thẻ variables
Composed by PGs Ts Pham Thi Tam, CTUMP - 13 -
1)Tạo file nhập số liệu cho phiếu điều tra sau:
Bộ câu hỏi nghiên cứu các yếu tố liên quan cân nặng lúc sinh của trẻ sơ sinh
(Điều tra viên điền vào khoảng trống hoặc khoanh tròn câu trả lời thích hợp)
Số thứ tự phiếu điều tra:
TT Câu hỏi Trả lời
1 Chị bao nhiêu tuổi? (tính tròn năm)
2 Lúc sinh thai được bao nhiêu tuần (lấy 1 số lẻ)?
3 Chị có cao huyết áp lúc có thai không? 0 Không
4 Con chị (trẻ sơ sinh) là nữ hay nam? 0 Nữ
5 Lúc sinh đứa bé được mấy kí (gram)
6 Nhóm tuổi của người mẹ
(ĐTV xác định dựa theo tuổi của người mẹ)
7 Tình trạng sanh non tháng
(ĐTV xác định dựa theo số tuần mang thai lúc sinh)
8 Tình trạng sơ sinh nhẹ cân
(ĐTV xác định dựa theo trọng lượng lúc sinh của đứa bé)
2) Nhập số liệu của cho 30 phiếu điều tra dưới đây
| stt tuoime tuanthai huyetap gioitinh cnss nhomtuoi sanhnon nhecan |
3) Lưu file vào ổ đĩa D, tên file nghien cuu so sinh nhe can.dta
4) Thoát khỏi Stata, mở lại file nghien cuu so sinh nhe can.dta, nhập thêm số liệu 10 phiếu sau đây Lưu dữ liệu và thoát khỏi Stata
| stt tuoime tuanthai huyetap gioitinh cnss nhomtuoi sanhnon nhecan |
Composed by PGs Ts Pham Thi Tam, CTUMP - 15 -