1. Trang chủ
  2. » Giáo án - Bài giảng

Hướng dẫn sử dụng Stata 8.0

239 2,1K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 239
Dung lượng 3,63 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài tập• Mở tập tin cân nặng sơ sinh • Xem số liệu browse và tóm tắt số liệu F3 • Mô tả cho 3 biến định lượng sum • Mô tả cho 4 biến định tính tab1 • Vẽ tổ chức đồ cho một biến định lượn

Trang 1

Hướng dẫn sử dụng

Stata 8.0

“Đừng bao giờ xem học tập là một nghĩa

vụ, mà là cơ hội đáng mong muốn để học tập để hiểu biết cách giải phóng cái đẹp trong lãnh vực tinh thần cho niềm vui cá nhân của bạn và để làm lợi cho cộng đồng

mà những công trình của bạn đóng góp”

Trang 2

Đặt vấn đề

“Nếu tôi có một giờ để giải quyết một vấn đề và cuộc đời của tôi phụ

thuộc vào việc giải quyết vấn đề đó Tôi sẽ dành 55 phút đầu tiên để đặt câu hỏi đúng, và một khi tôi biết câu hỏi đúng, tôi có thể giải quyết vấn đề trong vòng dưới 5 phút”

Trang 4

Cài đặt

• Xem tài liệu trang 90

• Vào thư mục Statistic softwares ở đĩa CD hay USB flash

• Cài đặt tập tin Stata8setup

• Cài đặt tập tin StataData

• Cài đặt tập tin StatTranser7

Trang 6

Thanh tiêu đề

Thanh menu

Thanh công cụ

Lệnh Biến số

Xem lại

Kết quả

Trang 7

• Sắp xếp các cửa sổ sao cho tiện việc sử dụng và lưu các cửa sổ này với menu

Prefs :: Save Windows Preferences

• Nhật kí kết quả (lưu giữ kết quả): log

cần thực hiện trước khi thực hiện bất kì phân tích thống kê nào với Stata

Trang 8

– Cắt (Cut), Sao chép (Copy), Dán (Paste), Bỏ

hành động (Undo), Làm lại (Redo)

• Pref

Trang 11

Bài tập

• Mở tập tin cân nặng sơ sinh

• Xem số liệu (browse) và tóm tắt số liệu (F3)

• Mô tả cho 3 biến định lượng (sum)

• Mô tả cho 4 biến định tính (tab1)

• Vẽ tổ chức đồ cho một biến định lượng – tlsosinh

(histogram)

• Vẽ biểu đồ bar cho 1 biến định tính – nghề nghiệp

• Lưu lại đồ thị để đưa vào tập tin Word

• Xuất kết quả hoặc bảng phân phối tần suất để vẽ đồ thị với Excel

• Thực hiện thống kê mô tả cho từng nhóm nghề nghiệp của mẹ

• Lưu lại tập tin do-file

Trang 12

Nhập liệu với Stata

• Khởi động Stata

• Nhấn

Trang 13

Nhập số liệu của 5 đối tượng

Trang 14

Thống kê mô tả

• Sử dụng lệnh tab1 cho biến định tính

• Sử dụng lệnh sum cho biến định lượng

• Thực hiện thống kê mô tả cho từng nhóm (thí dụ như ở nhóm trẻ nam và trẻ nữ):

– Sử dụng by để phân tầng

– Sử dụng if để hạn chế

Trang 15

Mô tả cho biến số định lượng (tính trung bình và

độ lệch chuẩn)

Trang 16

Tính trung bình và độ lệch chuẩn cho biến trọng lượng sơ sinh ở

nhóm trẻ trai

Trang 17

Xác định trung bình tuổi mẹ và trung bình trọng lượng sơ sinh ở 2 nhóm có tăng huyết áp và không tăng huyết áp

Trang 18

Mô tả cho biến

số định tính (tính tỉ lệ)

Trang 19

Trọng số

- Hệ số

Trang 20

-Tỉ lệ cho từng giá trị nếu

là biến thứ tự hay danh định

- Tỉ lệ cho giá trị tiêu biểu nếu là biến nhị giá

Trang 24

t u d o c o n g n h a n

v i e n c h u c

Trang 27

Tạo nhãn và dán nhãn

• Tạo nhãn sex

– Để tạo nhãn sử dụng menu Data :: Labels & Notes :: Define value label Cửa sổ Define value label sẽ được hiện ra

• Dán nhãn giá trị (Assign value label)

cho các biến sex, ht, gestcat và

matagegp

– Data :: Labels & Notes :: Assign value

label to variable

Trang 31

• Dán nhãn giá trị (Assign value label)

cho các biến sex, ht, gestcat và

matagegp

– Data :: Labels & Notes :: Assign value label to variable

Trang 34

• Tạo nhãn (define label)

• Dán nhãn (assign label)

Trang 35

Ngày làm việc thứ 2

Trang 36

Các bước phân tích số liệu

• Mở tập tin số liệu – log để lưu giữ kết quả

• Xem số bản ghi (số đối tượng) và các biến số

• Xác định mục tiêu nghiên cứu, các biến số

và phân loại biến số, kế hoạch phân tích

Trang 37

Các bước phân tích số liệu

• Mục tiêu:

Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng thai

• Biến số

Biến số phụ thuộc: trọng lượng thai

Biến số độc lập: tuổi thai và cao huyết áp

Biến số gây nhiễu: tuổi mẹ, giới tính

ID: identification mã số nhận dạng cá nhân

• Thống kê: kiểm định t và hồi quy

Trang 38

Các bước phân tích số liệu

• Thao tác số liệu (data processing)

– Dễ nhìn, dễ hiểu (thay đổi định dạng số liệu, value labels) không cần thiết nếu nhập liệu bằng

EpiData

– Tạo biến số mới theo yêu cầu phân tích

– Phát hiện sai sót bằng rà soát (browsing)

– Phát hiện sai sót bằng thống kê mô tả

bảng tần suất của biến số định tính (tab1)

trung bình, ĐLC của biến số định lượng (sum)

• Lưu (Save as) số liệu với một tên mới

Trang 39

Không linh động, dễ sai sót

nhưng không phải phân

nhóm bằng Stata

Tuổi người mẹ: (năm)

Phải phân nhóm bằng Stata nhưng linh động và giảm công sức ĐTV

Trang 40

Sau hàm số phải có dấu ngoặc tròn nằm ngay sau tên hàm số (không có khoảng trắng)

Trang 41

• Có bao nhiêu bà mẹ từ 29 tuổi hay trẻ hơn

và số bà mẹ này chiếm tỉ lệ bao nhiêu

phần trăm?

Trang 42

Tạo biến số sinhnon (nhị giá)

Có giá trị 1 nếu gestwks( tuổi thai) <37 tuần

Trang 44

Rút gọn biến định lượng thành định tính

tuổi thai (gestwks)-> sinh non hay không(gescat)

• Tạo biến mới (create new variable)

• Phân nhóm cho biến số mới (recode

nếu không số liệu bị sai

• Tạo nhãn (define label)

• Dán nhãn (assign label)

Trang 45

Các bước phân tích số liệu

• Phân tích số liệu: thống kê mô tả

– bảng tần suất của biến số định tính

– trung bình, ĐLC của biến số định lượng

– Vẽ biểu đồ, đồ thị

• Phân tích số liệu:

– Phân loại biến số

– Rút gọn biến số

– Chọn phương pháp đo lường tác động

– Phân tích đơn biến

– Kiểm soát yếu tố gây nhiễu

Trang 46

Những trở ngại khi phân tích

• Thử nghiệm ngẫu nhiêu

– Cân bằng giữa 2 nhóm can thiệp

– Không cân bằng: khử nhiễu

• Nhiều so sánh

• Phân tích nhóm nhỏ

• So sánh được chỉ định bởi kết quả phân tích

Trang 47

• log: lưu giữ kết quả (.smcl)

• Cmdlog (save review): lưu giữ câu lệnh

(.do)

• save : Lưu giữ số liệu (.dta)

• save graph: lưu giữ đồ thị (.gph)

Save: đã có kết quả rồi mới lưu (Thực hiện – Save)

Log: chỉ định sẽ ghi lại kết quả, do đó phải ra lệnh log trước khi thực hiện các lệnh phân tích (Log –Thực hiện)

Trang 48

Các bước phân tích số liệu

• Nhấn nút công cụ mở file ( vị trí đầu tiên trên thanh công cụ)

• Chọn menu File :: Open

Trang 49

Các bước phân tích số liệu

• Xem số bản ghi (số đối tượng) và các biến số

• Xác định mục tiêu nghiên cứu, các biến số

và phân loại biến số, kế hoạch phân tích

Trang 50

• Data :: Describe data :: Describe variable in memory

để xem các biến số của số liệu

• Hay đơn giản hơn, nhấn phím chức năng F3

• 4 gestwks float %9.0g Gestational age

• 5 sex float %9.0g Sex of infant

• 6 bweight float %9.0g Birthweight

-• Sorted by:

Trang 51

<30 30/34 35/39 40+

Trang 52

Bài tập lưu giữ kết quả phân tích

1 Mở tập tin số liệu ivf – nhấn F3 (để xem số bản ghi – xem

các biến số)

2 Menu: File :: log :: begin (hay Nhấp vào toolbar log)

3 Nhập tin tập tin lưu kết quả (thí dụ: phân tích.smcl) – Lưu ý

thanh trạng thái có hiện chữ log(smcl)

4 Tiến hành phân tích thống kê(kết quả được tự động lưu

giữ)

– Thực hiện phân tích cho các biến số định lượng

– Thực hiện các lệnh thống kê khác v.v

5 Thoát khỏi chương trình Stata

6 Vào lại chương trình Stata; sử dụng menu File::log::View

để xem kết quả phân tích được thực hiện ở bước 4

Trang 53

Lưu giữ

• Lưu số liệu: File :: Save

• Lưu đồ thị: File :: Save Graph

• Lưu kết quả: log

• Lưu câu lệnh: cmdlog

Lưu ý

• Save: thực hiện sau khi thao tác

• Log: thực hiện trước khi thao tác – người làm Stata có kinh nghiệm luôn luôn thực hiện 2 lệnh log ngay sau khi khởi động Stata

Trang 54

Lưu Mở lại

trực tiếp) (Mở trong cửa sổ Do-file Editor)

Trang 55

Xem kết quả cũ

Chép tiếp tục kết quả phân tích mới vào sau kết quả đã lưu

Xem như kết quả cũ là nháp và bỏ đi, chép lại

kết quả mới

Trang 59

Thống kê mô tả cho biến số định lượng Statistics :: Summaries, tables, & tests :: Summary Statistics

Trang 60

2 Chọn tên biến muốn mô tả

1 Đưa con trỏ vào hộp văn bản Variables

3 Click vào OK để hoàn tất

Trang 61

sum matage gestwks bweight

Variable | Obs Mean Std Dev Min Max -+ - matage | 641 33.97192 3.87046 23 43 gestwks | 641 38.68725 2.329931 24.69 42.35 bweight | 641 3129.137 652.7827 630 4650

Trang 62

Cửa sổ Histogram – Histogram for continous and categorical variable

Nút chọn (Radio button)

Hộp Combo (Combo box)

Hộp kiểm (Check box)

Thẻ Bar labels (Bar labels)

Hộp văn bản – Hộp (Text box)

Nút lệnh (Command button)

Trang 64

Biến số định tính

• Đối với biến sex - giới tính của trẻ (là biến định tính) 1 không có nghĩa là 1 mà là giới tính nam; 2 không có nghĩa là 2 mà có

nghĩa là giới tính nữ

• Đối với biến định tính

– cần chú thích cho giá trị biến số (value labels) – Không thể tính trung bình và độ lệch chuẩn

– Mô tả bằng bảng phân phối tần suất

Trang 69

• Dán nhãn giá trị (Assign value label)

cho các biến sex, ht, gestcat và

matagegp

– Data :: Labels & Notes :: Assign value label to variable

Trang 72

Thống kê mô tả cho biến số định tính Statistics :: Summaries, tables, & tests :: Tables ::

Onewaytables

Trang 74

2 Chọn Variable View

1 Đưa con trỏ vào hộp Categorical variables

3 Nhấp OK để hoàn tất

Trang 76

Bài tập

• Hãy tạo chú thích cho các biến số: id,

bweight, sex, ht, gestwks, matage bằng tiếng Việt

• Hãy tạo chú thích cho các giá trị của biến định tính (sex, ht)

• Hãy tính trung bình và độ lệch chuẩn của biến định lượng (gestwks, bweigth,

matage)

• Hãy lập bảng phân phối tần suất của biến định tính (sex, ht)

Trang 77

Phân nhóm biến số định lượng

• Tạo biến mới bằng giá trị của biến định lượng

• Mã hóa biến định lượng thành biến định tính

– Create or change variables :: Other variable

transformation commands :: Recode categorical

variable

• Tạo nhãn (Chú thích) cho biến định tính

– Data :: Labels & Notes :: Define value label.

– Data :: Labels & Notes :: Assign value label to variable

• Lập bảng phân phối tần suất

– Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.

Trang 78

Mã hóa biến định lượng thành biến định tính

Trang 79

Vẽ Tổ chức đồ (Histogram)

• Graphics ::

Histogram

Trang 80

3 Chiều rộng cột

5 Phân phối tần suất

3 Nhấp OK

Trang 81

• Frequency: Tần suất (muốn biết có bao nhiêu trẻ có trọng lượng từ 500 đến 1000 gram)

• Fraction: tỉ lệ (muốn biết tỉ lệ trẻ có trọng lượng từ 500 đến 1000 gram)

• Density: mật độ (bằng tỉ lệ chia cho độ

rộng của khoảng) – Density không có ý nghĩa thực tế nên không cần quan tâm

Trang 82

Thẻ Main: Width of bins=600; Lower limit of first bin = 600 Y-axis = Fraction Thẻ Y-Axis: Title=ti le; Rule = 0(0.1)0.5

Thẻ X-Axis: Title=Trong luong tre; Rule = 600(600)4800

Trang 86

Biểu đồ thanh

• Graphics :: Easy graphs :: Bar chart

Trang 88

Đếm số đối tượng Chuyển thẻ Over

3 Nhấp OK Đối tượng được đếm

Trang 89

Biến được vẽ biểu đồ

Trang 91

Nguyên tắc xây dựng biểu đồ - đồ thị

• Đối với biến số định lượng

– histogram matagegp, discrete frequency gap(50)

xlabel(, valuelabel)

• Đối với biến số định tính

– Biểu đồ thanh (sử dụng lệnh histogram)

– Biểu đồ bánh (sử dụng lệnh graph pie)

• Khi dùng lệnh pie: bỏ trống biến variable

• Biến cần mô tả đặt ở distinct value of variable

• Lệnh bar (và Biểu đồ bánh có biến variable): chỉ nên dùng khi mô tả giá trị thống kê (như trung bình, trung vị, độ lệch chuẩn) theo từng nhóm

Trang 94

Line graph

gen bwtgp=round( bweight/500)*500

egen freq2=count(id), by(bwtgp)

twoway (line freq2 bwtgp, sort), xlabel(500(500)4500)

gen bwtgp=round( bweight/500)*500

egen freqnam=count(id) if sex==1, by(bwtgp) egen freqnu=count(id) if sex==2, by(bwtgp) twoway (line freqnam bwtgp, sort) (line freqnu bwtgp, sort)

Trang 97

Các bước phân tích số liệu

với Stata 8.0

Trang 98

Các bước phân tích số liệu

• Mở tập tin

– File :: Open

• Liệt kê các biến số và xác định số bản ghi (số đối tượng) bằng F3

• Xác định mục tiêu nghiên cứu, các biến số

và phân loại biến số, kế hoạch phân tích

Trang 99

Các bước phân tích số liệu

• Mục tiêu:

Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng thai

• Biến số

Biến số phụ thuộc: trọng lượng thai

Biến số độc lập: tuổi thai và cao huyết áp

Biến số gây nhiễu: tuổi mẹ, giới tính

• Thống kê: kiểm định t và hồi quy

Trang 100

Các bước phân tích số liệu

• Thao tác số liệu (data processing)

– Dễ nhìn, dễ hiểu (thay đổi định dạng số liệu, value labels)

– Phát hiện sai sót bằng rà soát (browsing)

– Tạo biến số mới theo yêu cầu phân tích

– Phát hiện sai sót bằng thống kê mô tả

bảng tần suất của biến số định tính

trung bình, ĐLC của biến số định lượng

• Lưu (Save) số liệu với một tên mới

Trang 101

Các bước phân tích số liệu

• (Cần sử dụng log và cmdlog)

• Phân tích số liệu: thống kê mô tả

– bảng tần suất của biến số định tính

– trung bình, ĐLC của biến số định lượng – Vẽ biểu đồ, đồ thị

• Phân tích số liệu: kiểm định, thống kê phân tích

– Theo các mục tiêu nghiên cứu

Trang 102

• Trong 10 phút đầu tiên của buổi chiều các anh chị thực tập lại:

– Tạo biến số mới và tạo, dán nhãn cho biến số định tính

– Kiểm định t so sánh trọng lượng sơ sinh của

2 nhóm trẻ trai và gái (sử dụng tập tin số liệu cannangsosinh)

Trang 103

Chọn lựa kiểm định phù hợp

Biến phụ thuộc Biến độc lập

Nhị giá Danh định Thứ tự -Định lượng

Đa biến Định lượng có

Hồi quy logistic Hồi quy Poisson

Sống còn Wilcoxon

tổng quát Logrank

Wilcoxon tổng quát

Logrank

Hồi quy Cox

Trang 104

Không đồng nhất

Trang 105

thai ở nhóm giới tính nam và giới tính nữ

– So sánh phương sai 2 nhóm

– So sánh trung bình 2 nhóm

Trang 106

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group variance comparison test

Trang 107

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 108

sdtest bweight, by(sex)

Variance ratio test

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - trai | 326 3211.279 36.88521 665.9798 3138.715 3283.843 gai | 315 3044.127 35.421 628.6603 2974.434 3113.819 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 - Ho: sd(trai) = sd(gai)

F(325,314) observed = F_obs = 1.122

F(325,314) lower tail = F_L = 1/F_obs = 0.891

F(325,314) upper tail = F_U = F_obs = 1.122

Ha: sd(trai) < sd(gai) Ha: sd(trai) ~= sd(gai) Ha: sd(trai) > sd(gai)

P < F_obs = 0.8482 P < F_L + P > F_U = 0.3032 P > F_obs = 0.1518

Trang 109

2 1

2 1

2 1

1 1

) (

) (

n n

s

x

x se

x

x t

2 1

2 1

s

x

x se

x

x t

Trang 110

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group mean comparison test

Trang 111

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 113

ttest bweight, by(sex)

Two-sample t test with equal variances

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - nam | 326 3211.279 36.88521 665.9798 3138.715 3283.843

nu | 315 3044.127 35.421 628.6603 2974.434 3113.819 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 -+ - diff | 167.1522 51.18935 66.63249 267.6718 - Degrees of freedom: 639

Ho: mean(nam) - mean(nu) = diff = 0

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

t = 3.2654 t = 3.2654 t = 3.2654

P < t = 0.9994 P > |t| = 0.0012 P > t = 0.0006

Trang 114

Phép kiểm t (giả định phương sai bằng nhau)

• Bước 1: Xây dựng giả thuyết Ho:

– Ho: Trọng lượng TB ở trẻ trai = Trọng lượng TB ở trẻ gái

• Bước 2: Chọn kiểm định phù hợp (độ lệch chuẩn 2 nhóm bằng nhau)

648 )

1 (

) 1 (

) 1 (

) 1 (

2 1

2 2 2

2 1

s n

s

n

s p

265 ,

19 , 51 /

1 /

1 1  2 

Trang 116

Statistics :: Summaries, tables, & tests ::

Classical tests of hypothesis :: Group variance comparison test

Trang 117

Biến định lượng cần được kiểm định

Biến định tính chỉ định 2 nhóm cần được so sánh

Trang 118

sdtest bweight, by( ht )

Variance ratio test

Group | Obs Mean Std Err Std Dev [95% Conf Interval] -+ - cao huye | 89 2742.157 86.17222 812.9471 2570.908 2913.406 khong CH | 552 3191.531 25.58435 601.0962 3141.276 3241.786 -+ - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 - Ho: sd(cao huye) = sd(khong CH)

F(88,551) observed = F_obs = 1.829

F(88,551) lower tail = F_L = 1/F_obs = 0.547

F(88,551) upper tail = F_U = F_obs = 1.829

Ha: sd(1) < sd(2) Ha: sd(1) != sd(2) Ha: sd(1) > sd(2)

P < F_obs = 1.0000 P < F_L + P > F_U = 0.0003 P > F_obs = 0.0000

Ngày đăng: 02/10/2014, 20:19

HÌNH ẢNH LIÊN QUAN

Bảng tần suất của biến số định tính (tab1) - Hướng dẫn sử dụng Stata 8.0
Bảng t ần suất của biến số định tính (tab1) (Trang 38)
Đồ thị File:: Save Graph File:: Open Graph Kết quả File::log::begin  File::log::view - Hướng dẫn sử dụng Stata 8.0
th ị File:: Save Graph File:: Open Graph Kết quả File::log::begin File::log::view (Trang 54)
Bảng tần suất của biến số định tính - Hướng dẫn sử dụng Stata 8.0
Bảng t ần suất của biến số định tính (Trang 100)
Bảng 2x2 phân tầng - Hướng dẫn sử dụng Stata 8.0
Bảng 2x2 phân tầng (Trang 225)

TỪ KHÓA LIÊN QUAN

w