1. Trang chủ
  2. » Giáo án - Bài giảng

Hướng dẫn sử dụng Stata 8.0 UMP

173 5K 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 173
Dung lượng 2,24 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các bước phân tích số liệu• Chuẩn bị: – Mở tập tin số liệu ivf_v– Log để lưu giữ kết quả – Xem số bản ghi số đối tượng và các biến số – Xác định mục tiêu nghiên cứu, các biến số và phân

Trang 1

Hướng dẫn sử dụng

Stata 8.0

Trang 4

• Sắp xếp các cửa sổ sao cho tiện việc sử dụng và lưu các cửa sổ này với menu

Prefs :: Save Windows Preferences

• Nhật kí kết quả (lưu giữ kết quả): log

cần thực hiện trước khi thực hiện bất kì phân tích thống kê nào với Stata

Trang 5

• Quan sát (observation) và biến (variable)

• Tên biến (name) và nhãn biến (label)

• Format: string, general và date

• Biến định tính và biến định lượng

Trang 6

• Hãy tính tần suất của giới tính, giá trị đường

huyết trung bình, và giá trị đường huyết trung bình phân tầng theo giới

Trang 9

• Stata phân biệt chữ hoa và chữ thường; cần lưu

ý để gõ đúng lệnh của Stata (thường là chữ

• Lưu ý: do Stata không hiển thị được font tiếng

Trang 10

• Biến số: đặc tính hay đại lượng của đối

tượng

– Đặc tính: biến số định tính

– Đại lượng: biến số định lượng

• Thống kê mô tả: sum (định lượng) và tab1

(định tính)

• Để mô tả phân tầng sử dụng lệnh bysort

Trang 12

• Đặc điểm của cửa sổ Variable: Khi nhấp vào một variable, tên biến sẽ xuất hiện ở cửa sổ lệnh

• Đặc điểm của cửa sổ Review: Khi nhấp vào một lệnh cũ, lệnh này sẽ xuất hiện ở cửa sổ lệnh

Trang 13

• Obs: (observation) Quan sát

• Mean: trung bình

• Std Dev (Standard deviation) độ lệch chuẩn

• Min: số tối thiểu

• Max: số tối đa

• Freq: (Frequency) tần suất

• Percent: phần trăm

• Cum: cummulative Percent: Phần trăm cộng dồn

Trang 14

– Cắt (Cut), Sao chép (Copy), Dán (Paste), Bỏ

hành động (Undo), Làm lại (Redo)

• Pref

– Sắp xếp các cửa sổ, màu sắc và font của

chương trình Stata

Trang 17

Các bước phân tích số liệu

• Chuẩn bị:

– Mở tập tin số liệu (ivf_v)– Log để lưu giữ kết quả

– Xem số bản ghi (số đối tượng) và các biến số

– Xác định mục tiêu nghiên cứu, các biến số và phân loại biến số,

kế hoạch phân tích

• Thao tác số liệu:

– Giúp số liệu dễ nhìn dễ hiểu

– Rà soát các số liệu sai

– Tạo biến số mới

– Lưu tập tin với tin mới (ivf_v2)

• Thống kê mô tả

Trang 18

Log (lưu kết quả)

• Đặt một tên mới: một tập tin mới sẽ được tạo ra để lưu kết quả phân tích

• Chọn một tên cũ: chương trình sẽ hỏi

chúng ta muốn

– View existing file (chỉ muốn xem lại kết quả) – Append to existing file (lưu kết quả tiếp theo kết quả cũ)

– Overwriting existing file (bỏ kết quả cũ và viết kết quả mới từ đầu)

Trang 19

Các bước phân tích số liệu

• Mục tiêu:

Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng thai

Trang 20

Các bước phân tích số liệu

• Mục tiêu:

Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng thai

• Biến số

Biến số phụ thuộc: trọng lượng thai

Biến số độc lập: tuổi thai và cao huyết áp

Biến số gây nhiễu: tuổi mẹ, giới tính

ID: identification mã số nhận dạng cá nhân

• Thống kê: kiểm định t và hồi quy

Trang 21

Các bước phân tích số liệu

• Thao tác số liệu (data processing)

– Dễ nhìn, dễ hiểu (thay đổi định dạng số liệu, value labels) không cần thiết nếu nhập liệu bằng

EpiData

– Phát hiện sai sót bằng rà soát (browsing) hay

thống kê mô tả

• bảng tần suất của biến số định tính (tab1)

• trung bình, ĐLC của biến số định lượng (sum)

– Tạo biến số mới theo yêu cầu phân tích

Trang 22

Rút gọn biến định lượng thành định tính

tuổi thai (gestwks)-> sinh non hay không(gescat)

• Tạo biến mới (create new variable)

• Phân nhóm cho biến số mới (recode

Trang 23

Các bước phân tích số liệu

• Phân tích số liệu: thống kê mô tả

– bảng tần suất của biến số định tính

– trung bình, ĐLC của biến số định lượng

– Vẽ biểu đồ, đồ thị

• Phân tích số liệu:

– Phân loại biến số

– Rút gọn biến số

– Chọn phương pháp đo lường tác động

– Phân tích đơn biến

– Kiểm soát yếu tố gây nhiễu

Trang 24

Những trở ngại khi phân tích

• Thử nghiệm ngẫu nhiêu

– Cân bằng giữa 2 nhóm can thiệp

– Không cân bằng: khử nhiễu

• Nhiều so sánh

• Phân tích nhóm nhỏ

• So sánh được chỉ định bởi kết quả phân tích

Trang 25

• log: lưu giữ kết quả

• cmdlog: lưu giữ câu lệnh

• save: Lưu giữ số liệu

• save graph: lưu giữ đồ thị

Save: đã có kết quả rồi mới lưu (Thực hiện – Save)

Log: chỉ định sẽ ghi lại kết quả, do đó phải ra lệnh log trước khi thực hiện các lệnh phân tích (Log –Thực hiện)

Trang 26

Các bước phân tích số liệu

• Nhấn nút công cụ mở file ( vị trí đầu tiên trên thanh công cụ)

• Chọn menu File :: Open

Trang 27

Các bước phân tích số liệu

• Xem số bản ghi (số đối tượng) và các biến số

• Xác định mục tiêu nghiên cứu, các biến số

và phân loại biến số, kế hoạch phân tích

Trang 28

• Data :: Describe data :: Describe variable in memory

để xem các biến số của số liệu

• Hay đơn giản hơn, nhấn phím chức năng F3

• 4 gestwks float %9.0g Gestational age

• 5 sex float %9.0g Sex of infant

• 6 bweight float %9.0g Birthweight

-• Sorted by:

Trang 29

Bài tập lưu giữ kết quả phân tích

1 Mở tập tin số liệu ivf – nhấn F3 (để xem số bản ghi – xem

các biến số)

2 Menu: File :: log :: begin (hay Nhấp vào toolbar log)

3 Nhập tin tập tin lưu kết quả (thí dụ: phân tích.smcl) – Lưu ý

thanh trạng thái có hiện chữ log(smcl)

4 Tiến hành phân tích thống kê(kết quả được tự động lưu

giữ)

– Thực hiện phân tích cho các biến số định lượng

– Thực hiện các lệnh thống kê khác v.v

5 Thoát khỏi chương trình Stata

6 Vào lại chương trình Stata; sử dụng menu File::log::View

Trang 30

Bài tập

• Mở tập tin ivf_v2

• Đây là tập tin của 641 trẻ được thụ thai trong ống

nghiệm và mục tiêu nghiên cứu là xác định tăng huyết

áp (của mẹ trong thai kì) và tuổi thai ảnh hưởng gì lên trọng lượng thai

1 Hãy cho biết tỉ lệ trẻ nam, tỉ lệ mẹ bị cao huyết áp, tỉ lệ

sinh non, tỉ lệ nghề nghiệp, tỉ lệ các nhóm tuổi của mẹ

2 Hãy cho trung bình tuổi mẹ, trung bình tuổi thai và

trung bình cân nặng sơ sinh

3 Cho biết cân nặng trung bình phân tầng theo giới,

phân tầng theo mẹ cao huyết áp

4 Cho biết tỉ lệ nhẹ cân phân tầng theo giới, phân tầng

theo mẹ cao huyết áp

Trang 31

use "D:\DATA\ivf_v2.dta", clear

describe

tab1 gioi tang_ha sinhnon nghenghiep nhomtuoi sum tuoime tuoithai tlsosinh

bysort gioi: sum tlsosinh

bysort tang_ha: sum tlsosinh

gen nhecan= tlsosinh<2500

bysort gioi: tab1 nhecan

bysort tang_ha: tab1 nhecan

Trang 32

Lưu giữ

• Lưu số liệu: File :: Save

• Lưu đồ thị: File :: Save Graph

• Lưu kết quả: log

• Lưu câu lệnh: cmdlog

Lưu ý

• Save: thực hiện sau khi thao tác

• Log: thực hiện trước khi thao tác – người làm Stata có kinh nghiệm luôn luôn thực hiện 2 lệnh log ngay sau khi khởi động Stata

Trang 33

Lưu Mở lại

Kết quả File::log::begin File::log::view

Trang 34

Xem kết quả cũ

Chép tiếp tục kết quả phân tích mới vào sau kết quả đã lưu

Xem như kết quả cũ là nháp và bỏ đi, chép lại

kết quả mới

Trang 38

Thống kê mô tả cho biến số định lượng Statistics :: Summaries, tables, & tests :: Summary Statistics

Trang 39

2 Chọn tên biến muốn mô tả

1 Đưa con trỏ vào hộp văn bản Variables

Trang 40

sum matage gestwks bweight

Variable | Obs Mean Std Dev Min Max -+ - matage | 641 33.97192 3.87046 23 43 gestwks | 641 38.68725 2.329931 24.69 42.35 bweight | 641 3129.137 652.7827 630 4650

Trang 41

Cửa sổ Histogram – Histogram for continous and categorical variable

Nút chọn (Radio button)

Hộp Combo (Combo box)

Hộp kiểm (Check box)

Thẻ Bar labels (Bar labels) Hộp văn bản – Hộp

(Text box)

Trang 43

Biến số định tính

• Đối với biến sex - giới tính của trẻ (là biến định tính) 1 không có nghĩa là 1 mà là giới tính nam; 2 không có nghĩa là 2 mà có

nghĩa là giới tính nữ

• Đối với biến định tính

– cần chú thích cho giá trị biến số (value labels) – Không thể tính trung bình và độ lệch chuẩn

– Mô tả bằng bảng phân phối tần suất

Trang 48

• Dán nhãn giá trị (Assign value label)

cho các biến sex, ht, gestcat và

matagegp

– Data :: Labels & Notes :: Assign value

label to variable

Trang 51

Thống kê mô tả cho biến số định tính Statistics :: Summaries, tables, & tests :: Tables ::

Trang 53

1 Đưa con trỏ vào hộp Categorical variables

3 Nhấp OK để hoàn tất

Trang 55

Bài tập

• Hãy tạo chú thích cho các biến số: id,

bweight, sex, ht, gestwks, matage bằng tiếng Việt

• Hãy tạo chú thích cho các giá trị của biến định tính (sex, ht)

• Hãy tính trung bình và độ lệch chuẩn của biến định lượng (gestwks, bweigth,

matage)

• Hãy lập bảng phân phối tần suất của biến

Trang 58

Phân nhóm biến số định lượng

• Tạo biến mới bằng giá trị của biến định lượng

• Mã hóa biến định lượng thành biến định tính

– Create or change variables :: Other variable

transformation commands :: Recode categorical

variable

• Tạo nhãn (Chú thích) cho biến định tính

– Data :: Labels & Notes :: Define value label.

– Data :: Labels & Notes :: Assign value label to variable

• Lập bảng phân phối tần suất

– Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.

Trang 59

Mã hóa biến định lượng thành biến định tính

Trang 60

Vẽ Tổ chức đồ (Histogram)

• Graphics ::

Histogram

Trang 61

3 Chiều rộng cột

5 Phân phối tần suất

Trang 62

• Frequency: Tần suất (muốn biết có bao nhiêu trẻ có trọng lượng từ 500 đến 1000 gram)

• Fraction: tỉ lệ (muốn biết tỉ lệ trẻ có trọng lượng từ 500 đến 1000 gram)

• Density: mật độ (bằng tỉ lệ chia cho độ

rộng của khoảng) – Density không có ý nghĩa thực tế nên không cần quan tâm

Trang 63

Thẻ Main: Width of bins=600; Lower limit of first bin = 600 Y-axis = Fraction Thẻ Y-Axis: Title=ti le; Rule = 0(0.1)0.5

Thẻ X-Axis: Title=Trong luong tre; Rule = 600(600)4800

Trang 65

Biểu đồ thanh

Trang 67

Đếm số đối tượng Chuyển thẻ Over

Đối tượng được đếm

Trang 68

Biến được vẽ biểu đồ

Trang 70

Nguyên tắc xây dựng biểu đồ - đồ thị

• Đối với biến số định lượng

– histogram matagegp, discrete frequency gap(50)

xlabel(, valuelabel)

• Đối với biến số định tính

– Biểu đồ thanh (sử dụng lệnh histogram)

– Biểu đồ bánh (sử dụng lệnh graph pie)

• Khi dùng lệnh pie: bỏ trống biến variable

• Biến cần mô tả đặt ở distinct value of variable

• Lệnh bar (và Biểu đồ bánh có biến variable): chỉ nên dùng khi mô tả giá trị thống kê (như trung bình, trung vị, độ lệch chuẩn) theo từng nhóm

Trang 74

Các bước phân tích số liệu

với Stata 8.0

Trang 75

Các bước phân tích số liệu

• Mở tập tin

– File :: Open

• Liệt kê các biến số và xác định số bản ghi (số đối tượng) bằng F3

• Xác định mục tiêu nghiên cứu, các biến số

và phân loại biến số, kế hoạch phân tích

Trang 76

Các bước phân tích số liệu

• Mục tiêu:

Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng thai

• Biến số

Biến số phụ thuộc: trọng lượng thai

Biến số độc lập: tuổi thai và cao huyết áp

Biến số gây nhiễu: tuổi mẹ, giới tính

• Thống kê: kiểm định t và hồi quy

Trang 77

Các bước phân tích số liệu

• Thao tác số liệu (data processing)

– Dễ nhìn, dễ hiểu (thay đổi định dạng số liệu, value labels)

– Phát hiện sai sót bằng rà soát (browsing)

– Tạo biến số mới theo yêu cầu phân tích

– Phát hiện sai sót bằng thống kê mô tả

bảng tần suất của biến số định tính

trung bình, ĐLC của biến số định lượng

Trang 78

Các bước phân tích số liệu

• (Cần sử dụng log và cmdlog)

• Phân tích số liệu: thống kê mô tả

– bảng tần suất của biến số định tính

– trung bình, ĐLC của biến số định lượng – Vẽ biểu đồ, đồ thị

• Phân tích số liệu: kiểm định, thống kê phân tích

– Theo các mục tiêu nghiên cứu

Trang 79

Chọn lựa kiểm định phù hợp

Biến phụ thuộc Biến độc lập

Đa biến Định lượng có

Hồi quy logistic Hồi quy Poisson

Trang 80

Không đồng nhất

Trang 82

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group variance comparison test

Trang 83

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 84

sdtest bweight, by(sex)

Variance ratio test

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - trai | 326 3211.279 36.88521 665.9798 3138.715 3283.843 gai | 315 3044.127 35.421 628.6603 2974.434 3113.819 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 - Ho: sd(trai) = sd(gai)

F(325,314) observed = F_obs = 1.122

F(325,314) lower tail = F_L = 1/F_obs = 0.891

F(325,314) upper tail = F_U = F_obs = 1.122

Ha: sd(trai) < sd(gai) Ha: sd(trai) ~= sd(gai) Ha: sd(trai) > sd(gai)

P < F_obs = 0.8482 P < F_L + P > F_U = 0.3032 P > F_obs = 0.1518

Trang 85

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group mean comparison test

Trang 86

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 88

ttest bweight, by(sex)

Two-sample t test with equal variances

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - nam | 326 3211.279 36.88521 665.9798 3138.715 3283.843

nu | 315 3044.127 35.421 628.6603 2974.434 3113.819 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 -+ - diff | 167.1522 51.18935 66.63249 267.6718 - Degrees of freedom: 639

Ho: mean(nam) - mean(nu) = diff = 0

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

t = 3.2654 t = 3.2654 t = 3.2654

P < t = 0.9994 P > |t| = 0.0012 P > t = 0.0006

Trang 89

Phép kiểm t (giả định phương sai bằng nhau)

• Bước 1: Xây dựng giả thuyết Ho:

– Ho: Trọng lượng TB ở trẻ trai = Trọng lượng TB ở trẻ gái

• Bước 2: Chọn kiểm định phù hợp (độ lệch chuẩn 2 nhóm bằng nhau)

– Kiểm định t với (n1 + n2 - 2) = 641-2=639 độ tự do

• Bước 3:

9 ,

648 )

1 (

) 1 (

) 1 (

) 1 (

2 1

2 2 2

2 1

s n

s

n

sp

265 ,

19 , 51 /

1 /

Trang 90

• Bước 1: Xây dựng giả thuyết Ho:

– Ho: Trọng lượng TB ở trẻ có mẹ CHA = Trọng lượng TB ở trẻ với mẹ không CHA

• Bước 2: Chọn kiểm định phù hợp (độ lệch chuẩn 2 nhóm không bằng nhau)

– Kiểm định t (PS không bằng nhau) với 104,07 độ tự do

• Bước 3:

Bước 4: p<0,001

Bước 5: Kết luận: Bác bỏ Ho

999 ,

89 ,

89 552

1 ,

601 89

95 ,

2

221

s se

Phép kiểm t (giả định phương sai không bằng nhau)

Trang 92

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group variance comparison test

Trang 93

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 94

sdtest bweight, by( ht )

Variance ratio test

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - cao huye | 89 2742.157 86.17222 812.9471 2570.908 2913.406 khong CH | 552 3191.531 25.58435 601.0962 3141.276 3241.786 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 - Ho: sd(cao huye) = sd(khong CH)

F(88,551) observed = F_obs = 1.829

F(88,551) lower tail = F_L = 1/F_obs = 0.547

F(88,551) upper tail = F_U = F_obs = 1.829

Ha: sd(1) < sd(2) Ha: sd(1) != sd(2) Ha: sd(1) > sd(2)

P < F_obs = 1.0000 P < F_L + P > F_U = 0.0003 P > F_obs = 0.0000

Trang 95

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group mean comparison test

Trang 96

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 97

ttest bweight, by(ht) unequal

Two-sample t test with unequal variances

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - cao huye | 89 2742.157 86.17222 812.9471 2570.908 2913.406 khong CH | 552 3191.531 25.58435 601.0962 3141.276 3241.786 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 -+ - diff | -449.3735 89.88999 -627.6273 -271.1197 - Satterthwaite's degrees of freedom: 104.069

Ho: mean(cao huye) - mean(khong CH) = diff = 0

Ngày đăng: 02/10/2014, 20:18

HÌNH ẢNH LIÊN QUAN

Đồ thị File:: Save Graph File:: Open Graph Kết quả File::log::begin  File::log::view - Hướng dẫn sử dụng Stata 8.0 UMP
th ị File:: Save Graph File:: Open Graph Kết quả File::log::begin File::log::view (Trang 33)
Bảng tần suất của biến số định tính - Hướng dẫn sử dụng Stata 8.0 UMP
Bảng t ần suất của biến số định tính (Trang 77)

TỪ KHÓA LIÊN QUAN

w