Bài giảng Phương pháp nghiên cứu kinh tế: Chương 4 trình bày về Xử lý và phân tích thông tin. Nội dung cụ thể của chương này gồm có: Xử lý dữ liệu, các phương pháp phân tích thông tin, trình bày kết quả xử lý và phân tích thông tin. Mời các bạn cùng tham khảo!
Trang 31 X lý d li u ử ữ ệ
1 X lý d li u ử ữ ệ
1.1.Hi u ch nh và mã hóa d li u ệ ỉ ữ ệ
1.2. Đánh giá ch t l ấ ượ ng s li u ố ệ
1.3. Xác đinh các m i liên h ố ệ
Trang 41.1. Hi u ch nh và ệ ỉ
Trang 5a) Khái ni m và l i ích hi u ch nh và mã hóa d li u ệ ợ ệ ỉ ữ ệ
Trang 6• L a ch n mó húa, thang o g n cho t ng d ự ọ đ ắ ừ ữ
li u ệ
* Các loại thang đo
+ Thang đo định danh (Norminal
+ Thang đo thứ bậc (Ordinal): là thang đo định danh nhưng
có phân ra thứ bậc cao thấp Ví dụ Huân chương hạng 1,
2, 3.
+ Thang đo khoảng (interval): Là thang đo thứ bậc có khoảng
cách đều nhau, có thể đánh giá sự khác biệt giữa các
biến.
+ Thang đo tỷ lệ (Ratio- Scale): Để đo lường các biểu hiện
của tiêu thức như các đơn vị vật lý thông thường
* Cỏc mó s : ỏnh d u, ký hi u, cho i m ố Đ ấ ệ đ ể
* L a ch n s lự ọ ố ượng và gi i h n c a t ng hành vi c a ớ ạ ủ ừ ủ
thụng tin
b) K thu t mó húa d li u ỹ ậ ữ ệ
Trang 7c) Nh ng chú ý khi mã hóa d li u ữ ữ ệ
• Ngườ ử ụi s d ng c n ph i bi t mã c a d li uầ ả ế ủ ữ ệ
– N u ngế ườ ử ụi s d ng không bi t mã c a s li u thì không ế ủ ố ệ
th phân tích ể đượ c – Thí d Mã hóa thông tin v gi i: 1 là nam; 2 là nụ ề ớ ữ
• M c ứ độ chính xác c a d li u mã hóaủ ữ ệ
– Ví d : Mã hóa thông tin v m c ụ ề ứ độ kinh tế
H giàu: thu nh p/1 ng ộ ậ ườ i >500 ngàn /tháng; H nghèo: đ ộ
<100 ngàn /tháng đ
• Mã hóa thường th hi n b ng s ể ệ ằ ố
• Ví d : “Anh có thích phim này không?” – có th ụ ể được
mã t 1 ừ đến 4
Trang 81.2 ánh giá ch t l Đ ấ ượ ng
Trang 9a) Th nào là ánh giá ch t l ế đ ấ ượ ng s li u ố ệ
• T i sao? M i s li u ph i ÁNG TIN C Y và s li u ạ ọ ố ệ ả Đ Ậ ố ệ
ph i TH C.ả Ự
• Có th bi t ể ế được thông qua ki m nh s li uể đị ố ệ
• Đánh giá ch t lấ ượng s li u giúp ngố ệ ườ ử ụi s d ng và
Trang 10c ho phï
hî p kh«ng
Trang 11* Các lỗi thường gặp khi thu thập thông tin sơ cấp
Lỗi khi chọn mẫu Lỗi trả lời Lỗi không trả lời
Đặt câu hỏi
Mệt mỏi
Không hiểu
Không hiểu
muốn
Trang 12Ph ươ ng pháp ánh giá ch t l đ ấ ượ ng s li u s li u s ố ệ ố ệ ơ
M i ng ọ ườ i và v i các ph ớ ươ ng pháp khác nhau, ki m tra ế
th ươ ng xuyên theo các tiêu chí để ạ h n ch t i m c th p ế ớ ứ ấ
nh t các sai s ấ ố
Trang 131.3 Xác nh các đ ị
Trang 14a) Thông tin Đ ị nh tính a) Thông tin Đ ị nh tính
• Liên h nô i ti p / Liên h song songLiên h nô i ti p / Liên h song songệ ệ ́ ́ ế ế ệ ệ
• Liên h hình cây / Liên h m ng lLiên h hình cây / Liên h m ng lệ ệ ệ ạ ệ ạ ướ ướ ii
• Liên h trong h th ng có i u khi nLiên h trong h th ng có i u khi nệ ệ ệ ố ệ ố đ ề đ ề ể ể
• Liên h hô n h pLiên h hô n h pệ ệ ̃ ̃ ợ ợ
a2) Các liên h vô hình ệ
a2) Các liên h vô hình ệ không th trình bày b ng s không th trình bày b ng s ể ể ằ ằ ơ đồ ơ đồ
Trang 15a3) Liên hê hô n h p trong h ̃ ợ ệ
a3) Liên hê hô n h p trong h ̃ ợ ệ
Trang 16b) Thông tin nh l đị ượ ng
b) Thông tin nh l đị ượ ng
• Xác nh các quan h nh lXác nh các quan h nh l đị đị ệ đị ệ đị ượ ượ ng gi a các s ki n (bi n)ng gi a các s ki n (bi n)ữ ữ ự ệ ự ệ ế ế
* 4 câ p ́ độ th hi n m i quan h nh l ể ệ ố ệ đị ượ ng:
* 4 câ p ́ độ th hi n m i quan h nh l ể ệ ố ệ đị ượ ng:
• Sô li u Sô li u ́ ́ ệ độ ệ độ c l p (không phân t ch li t kê)c l p (không phân t ch li t kê)ậ ậ ổ ổ ỉ ệ ỉ ệ
• Phân t theo 1 tiêu th c (phân t gi n Phân t theo 1 tiêu th c (phân t gi n ổ ổ ứ ứ ổ ả đơ ổ ả đơ n)n)
• Phân t t 2 tiêu th c tr lên (phân t k t h p)Phân t t 2 tiêu th c tr lên (phân t k t h p)ổ ừ ổ ừ ứ ứ ở ở ổ ế ợ ổ ế ợ
• Danh m c phân lo iDanh m c phân lo iụ ụ ạ ạ
* Chú ý: Các lo i sai sô th ạ ́ ườ ng xu t hi n ấ ệ
* Chú ý: Các lo i sai sô th ạ ́ ườ ng xu t hi n ấ ệ
• Sai sô ngâ u nhiênSai sô ngâ u nhiêń ́ ̃ ̃
• Sai sô ky thu tSai sô ky thu t́ ́ ̃ ̃ ậ ậ
• Sai sô h thô ngSai sô h thô nǵ ́ ệ ệ ́ ́
* Các lô i phô bi n khi x lý sai sô :̃ ̉ ế ử ́
* Các lô i phô bi n khi x lý sai sô :̃ ̉ ế ử ́
• H thô ng s li u l n sai sô nh và ngH thô ng s li u l n sai sô nh và ngệ ệ ́ ́ ố ệ ớ ố ệ ớ ́ ́ ỏ ỏ ượ ượ c l ic l iạ ạ
Trang 172 Phân Tích Thông tin
2.1 Ph ươ ng pháp lu n trong phân tích ậ
2.2. Phân tích thông tin đ nh tính ị
2.3. Phân tích thông tin đ nh l ị ượ ng
2.4. Phân tích thông tin th c p ứ ấ
Trang 182.1 Ph ươ ng pháp lu n trong phân ậ
2.1 Ph ươ ng pháp lu n trong phân ậ
tích thông tin
DI N D CH Ễ Ị từ cái chung đến riêng
QUY N P Ạ từ cái riêng đến chung
LO I SUY Ạ từ cái riêng đến riêng
Trang 20a) Nghiên c u tình hu ng ứ ố
* Th nào là nghiên c u tình hu ng? ( ế ứ ố Murray (1938)
Nghiên c u tình hu ng là nghiên c u k m t ng ứ ố ứ ỹ ộ ườ i nh ư m t ộ
Nghiên c u tình hu ng là ứ ố nghiên c u sâu hay r t k ứ ấ ỹ v m t ề ộ đơ ị n v
Trang 21Ví d : nghiên c u tình hu ng ụ ứ ố
Hộp 5: Có kinh phí Plan đầu tư thì sẽ bị giảm
nguồn hỗ trợ ngân sách
“Địa phương chúng tôi hiện đang được tổ chức Plan
hỗ trợ nhiều Do vậy, với nguồn ngân sách của
Nhà nước còn hạn hẹp, cấp trên có ý phân bổ
giảm với chúng tôi để nhường ưu tiên cho các địa phương khác Như vậy cũng là hợp lý thôi”
(Ý kiến trao đổi với BĐH Plan xã Dương Đức -
Lạng Giang, ngày16.6.2005)
Trang 22b) T ng quan l ch s ổ ị ử
T ng quan l ch s hay t ng quan tài li u nghiên c uổ ị ử ổ ệ ứ
• Là tóm t t nh ng hi u bi t v nh ng v n ắ ữ ể ế ề ữ ấ đề, nh ng ữ
l nh v c có liên quan ĩ ự đế đền tài hay n i dung NCộ
• Nêu m u thu n, u nhẫ ẫ ư ượ đ ểc i m c a các quan i m NCủ đ ể
• Xem l i chạ ương 2 ph n phầ ương pháp thu th p thông tin ậ
b ng phằ ương pháp nghiên c u tài li u theo trình t :ứ ệ ự
1 L a ch n câu h i NCự ọ ỏ
2 L a ch n các c s d li u, bài báo, tài li u ự ọ ơ ở ữ ệ ệ để
tìm
3 L a ch n n i dung, t khóa ự ọ ộ ừ để tìm
4 Nghiên c u tài li uứ ệ và Th c hi n t ng quanự ệ ổ
5 Khái quát hóa k t quế ả
Trang 23Chú ý khi đọ c và trích d n danh sách tài li u ẫ ệ
ABI, EconLit, )
Trang 24c) Phân tích
i m m nh, y u,
Trang 25• Là phân tích m t hi n t ng d i quan đi m h th ng ộ ệ ượ ướ ể ệ ố
t ừ bên trong (S, W) ra bên ngoài (O, T) hay đ ng th i ồ ờ
k t h p c trong và ngoàiế ợ ả
• Đây là công c s d ng nhi u trong phân tích các hi n ụ ử ụ ề ệ
tượng dướ ại d ng đ nh tính – xã h i, chính sáchị ộ
• Có th s d ng c trong th o lu n ho c cá nhân t ể ử ụ ả ả ậ ặ ự
nghiên c uứ
Trang 26– Nh ng đi m tích c c t hoàn c nh bên ngoài ữ ể ự ừ ả
– Chúng ta có th nh n để ậ ược cái gì?
• Thách th c (T)ứ
– Nh ng đi m tieu c c t hoàn c nh bên ngoài ữ ể ự ừ ả
– Chúng ta có th m t cái gì?ể ấ
Trang 328 b ướ c xây d ng ma tr n SWOT ự ậ
Trang 338 b ướ c xây d ng ma tr n SWOT ự ậ
trong kinh doanh
5 K t h p S-O và ế ợ đề xu t ph ấ ươ ng án chi n l ế ượ c phát huy
7 K t h p W-T và ế ợ đề xu t ph ấ ươ ng án chi n l ế ượ c nh m ằ
t i thi u hoá tác d ng c a i m y u và phòng th tr ố ể ụ ủ đ ể ế ủ ướ c
các m i e do t bên ngoài ố đ ạ ừ
8 K t h p S-T và ế ợ đề xu t ph ấ ươ ng án chi n l ế ượ c l i d ng ợ ụ
th m nh c a mình ế ạ ủ để đố i phó v i nguy c e do t ớ ơ đ ạ ừ
bên ngoài.
Trang 342.3 CÁC PH Ư Ơ NG PHÁP
PHÂN TÍCH THÔNG TIN
Trang 35•Phân tích tươ ng quan
•Phân tích h i qui tuy n tínhồ ế
•H
i qui phi tuy n (KTL)
3 Mô hình hóa
Trang 36a) Th ng kê ố
Trang 37Các ch tiêu phân tích th ng kê mô t ỉ ố ả
Trang 38– Phươ ng sai (mô-men b c 2)ậ
– Độ nghiêng (skewness, mô-men b c 3)ậ
Trang 391
1
n i
i X
X n
s
1
2 2
1 1
n i
i X
X n
1
Trang 40X X
n n
n
2 2
2 2
2 2
2 1
x
n
x
2 2
n
x
n
X n
X n
X n
X 1 1 1 2 1
2
2 2
X 2X n( 1 2 ) 1 ( 2 )
Trang 41Kho ng tin c y (CI) ả ậ
5
1
x
S
X Z
)%
1 (
* 100
X
X
X
96
1 1 96 X
X
X 1 96 X 1 96 X
Trang 42Kho ng tin c y cho 2 s bình quân ả ậ ố
• Gi s X và Y ả ử độ c l p, v i ậ ớ
• Thì
) ,
(
x x
u N X
) ,
(
~ N u x u y 2x 2y
Y X
) ,
(
y y
u N Y
) ,
(
y x
y
x u u
N Y
X
y
Y x
X
n n
Z Y
Trang 43X
5 13
B
X
0 2
A
S
5 1
B
Y x
X
n n
Z Y
30
5
1 30
0
2 96 1 5 10 5
.
Trang 44b) Ki m nh ể đị
Trang 451 Kiểm định giả thuyết về sự khác nhau giữa 2 số
X-Giả sử tổng thể các sai lệch giữa X
và Y (X-Y) có phân phối chuẩn Ta cần kiểm định giả thuyết sau:
Ho: x - y = Do (Do là giá trị cho trư
ớc Do=0) H1: x - y Do
Trang 46Nguyên tắc kiểm định
Trong đó: D o : giá trị cụ thể cho trước
Ď ư D o
T = ưưưưưưưưưưưư Ď: là trung bình của tổ ng thể s ai lệch X ư Y
- So sánh T thực nghiệm với T lý thuyết”
Nếu T T (n-1, /2) ta chấp nhận giả thuyết Ho,
Nếu T > T (n-1, /2) ta bác bỏ giả thuyết Ho và khi đó:
Ho : x - y = Do
H1 : x - y Do
T> Tn-1, /2 hoặc T< - T(n-1, /2)
Hay T > T(n-1 , /2)
Trang 47+ Thí dụ: Công ty VINAMILK áp dụng công nghệ mới trong chế biến sữa chua Hãy kiểm định xem năng suất lao động của công nhân sau khi sử dụng công nghệ mới với công nghệ
cũ có khác nhau không với mức ý nghĩa là 5% ?
x Trung binh của 10 công nhân theo công nghệ cũ = 56,30
y Trung binh của 10 công nhân theo công nghệ mới = 61,20
Ď là trung binh của tổng thể sai lệch X – Y = - 4,9
Sd là độ lệch chuẩn của tổng thể
X-Y = 4,4833
Ta cần kiểm định gia thuyết s au:
Trang 48Tính T kiểm định
Ď - Do 4,9 - 0 4,9
T = - = - = - = 3,456
Như vậy, T kiểm định = 3,456 >T lý thuyết = 2,262 ta
bác bỏ Ho, nghĩa là năng suất lao động của công nhân sau khi áp dụng công nghệ mới khác với công nghệ cũ.
Vi Ď = 4,9 > Do nên x ư y > 0, nghĩa là ở mức ý nghĩa 5% áp dụng công nghệ mới đ∙ làm tăng năng s uất s o với
Trang 49Với mức ý nghĩa Ta cần kiểm định gia thuyết sau: Ho: x - y = Do (Do là giá trị cho trước Do=0)
Trang 50+ Nguyên tắc kiểm định: có 2 trường hợp xảy ra
Trong đó: Do : giá trị cụ thể cho trước (Do =0)
x 2y X và Y - + - nx ,ny : số đơn vị mẫu quan sát của tỏng
Tìm Z /2 bằng cách tra bảng hoặc dùng hàm NORMSINV với /2 trong EXCEL
+ Nếu Z Z /2 ta chấp nhận giả thuyết Ho, coi x - y = Do
+ Nếu Z > Z /2 ta bác bỏ giả thuyết Ho, coi x - y Do và khi đó :
Trang 51Thí dụ: Một trại chan nuôi gà tiến hành thí nghiệm sử dụng 2 loại thức ăn A và B trên cùng một giống Sau một thời gian thử
nghiệm cho ăn, người ta điều tra 50 con nuôi bằng thức ăn A và
40 con nuôi bằng thức ăn B thu được các số liệu sau:
Bang : Một số chỉ tiêu của 2 mẫu thí nghiệm cho ăn 2 loại
thức ăn A và B
Diễn giai ĐVT Thức an A Thức an B
1 Số đơn vị mẫu quan sát con 50 40
2 Khối lượng trung binh 1 con Kg/con 2,2 1,2
3 Độ lệch chuẩn Kg/con 1,25 1,02
Yêu cầu: Anh chi hãy cho biết khối lượng trung bình 1 con sử dụng ở 2 loại thức ăn sau thời gian nuôi có khác nhau không với mức ý nghĩa là 5%?
Trang 532). Nếu nx ,ny < 30 với X ; Y đều tuân
Trang 54-Tìm T lý thuyết: Từ cho trước, tra bảng phân phối student với bậc tự do là (nx + ny –2) để tìm T nx + ny –2; /2 , hoặc tra hàm
TINV (nx + ny –2; ) trong EXCEL
- So sánh T thực nghiệm với T lý thuyết:
Nếu T T nx + ny –2; /2 ta chấp nhận giả
Thí dụ: (Lấy lại ví dụ trên)
Một trại chăn nuôi gà tiến hành thí nghiệm sử dụng 2 loại thức ăn A và B trên cùng một giống Sau một thời gian thử nghiệm cho ăn, người ta điều
Trang 55Diễn giai DVT Thức an A Thức an B
Yêu cầu: Anh chi hãy cho biết khối lượng trung bình 1 con sử dụng ở 2 loại thức ăn sau thời gian nuôi có khác nhau không với mức ý nghĩa là 5%?
Giải:
- Gọi x và y là khối lượng trung bình 1 con sau khi nuôi sử dụng thức ăn A và B;
- Đặt giả thuyết: Ho : x ư y = 0
Trang 56- Tìm T lý thuyết : Tra hàm TINV với bậc tự do là 33; = 0.05 ta được T lý thuyết = 2,03
Như vậy T = 6,39 > T nx + ny –2; /2 = 2,03 ta bác bỏ giả thuyết Ho,
Vì x =2,2 kg/con > ŷ = 1,2 kg/con nên ta xem x >
y, chứng tỏ khối lượng trung bình 1 con nuôi bằng thức ăn A lớn hơn nuôi bằng thức ăn B
Trang 57Gia sử ta có nx và ny là số đơn vị mẫu được chọn ngẫu nhiên,
độc lập từ hai tổng thể X và Y có phân phối chuẩn , thể
hiện ở bang sau:
s 2
x và s 2
y là phương sai của 2 mẫu nx và ny
Với mức ý nghĩa ta cần kiểm định giả thuyết s au:
Phương sai 2 2
1.2. Kiểm định giả thuyết về s ự bằng nhau giữa 2 phương
s ai của 2 tổ ng thể
Trang 58( F nx-1; ny-1; /2); hoặc tim hàm FINV (nx-1 ; ny-1; /2)
- So sánh F thực nghiệm với F lý thuyết:
Nếu F > F nx-1; ny-1; /2 ta bác bỏ giả thuyết Ho,
Nếu F F nx-1; ny-1; /2 ta chấp nhận giả thuyết Ho Trong trường hợp bác bỏ giả thuyết Ho:
Trang 59- Tính tiêu chuẩn kiểm định F :
- Tìm F lý thuyết: ta tìm hàm FINV (nx-1 ; ny-1; /2) = FINV (14,19,0.025) = 2,65
- Do F = 1,529 F nx-1; ny-1; /2 = 2,65 ta chấp nhận giả thuyết Ho, nghĩa là mức độ chính xác của 2 máy đóng
Trang 60c) Phân tích phương
sai
Trang 61c. Phân tích phương s ai
-Mục tiêu: so sánh trung bình của nhiều nhóm dựa trên các số trung bình mẫu, thông qua kiểm định giả thuyết để kết luận về sự bằng nhau của các số trung bình này.
-là một công cụ để xem xét ảnh hưởng của một hay một số yếu tố nguyên nhân (định tính) đến một yếu tố kết quả kia (định lượng).
-Thí dụ: PP chấm điểm đến Kết quả; Loại lò đến chi phí chất đốt…
-Có 2 dạng: phân tích phương sai 1 yếu tố và nhiều yếu tố -Các bước:
1) Lấy mẫu, tính các số TB mẫu, TB chung của các mẫu
2) Tính tổng các độ lệch bình phương
3) Tính các phương sai
4) Kiểm định giả thuyết
Để kiểm định ta đưa ra 2 giả thiết s au:
Trang 62SS1= 1
1
1 (
n j
Xj -x1 ) 2 SS2= 2
1
2 (
n j
Trang 63- Tổng các độ lệch bình phương giữa các nhóm SSB đượ c tính như sau:
- Tổng các độ lệch bình phương của toàn bộ tổng thể (SST) bằng tổng các độ lệch bình phương trong nội bộ nhóm (nội bộ từng mẫu) SSW cộng vớ i tổng các độ lệch bình phương giữa các nhóm SSB
Cụ thể theo công thức sau:
Trang 64Bảng phân tích phương sai tổng quát dịch ra tiếng việt – ANOVA
- Tìm F lý thuyết (F tiêu chuẩn = F (k-1; n-k; )): là giá trị giớ i hạn tra từ bảng phân phối F
vớ i k-1 bậc tự do của phương sai ở tử số và ; n-k bậc tự do của phương sai ở mẫu số vớ i mức
- Nếu F thực nghiệm > F lý thuyết, bác bỏ Ho, nghĩa là các số trung bình của k tổng thể
Trang 66Anova: Single Factor
Trang 68Phản á nh biến động của yếu tố kết quả do
ảnh hư ởng của yếu tố nguyê n nhân thứ hai
Phản á nh biến động của yếu tố kết quả do
ảnh hư ởng của yếu tố nguyê n nhân khá c
SSE = SST- SSK- SSH
Trang 69Bảng phân tích phương sai tổng quát dịch ra tiếng việt – ANOVA
Nguồn biến động Tổng độ lệch bình
phương (SS) Bậc tự do (df) Phương sai (MS) Fư Tỷ số
Giữa các hàng SSH (h-1) MSH F1Giữa các cột SSK (k -1) MSK F2Phần dư SSE (k -1) (h-1) MSE
Trang 72d) Phân tích t ươ ng
quan
Trang 73Quan h t ệ ươ ng quan
– Là quan h tuy n tính gi a 2 bi n ệ ế ữ ế độ c l pậ
– Có th d báo giá tr 1 bi n khi bi t giá tr c a ể ự ị ế ế ị ủ
bi n kiaế
– H s tệ ố ươ ng quan n m trong kho ng -1 ằ ả đế n 1
– Giá tr -1 và 1 là tị ươ ng quan hoàn h o, r t ả ấ
ch t, tuy n tính gi a 2 bi nặ ế ữ ế
– Giá tr 0 là không có tị ươ ng quan, không có
m i quan hố ệ
Trang 74T ươ ng quan – m c ứ độ và xu h ướ ng
Trang 75Xóm Giói tính Trình độTổng diện Tuổi Số khẩu lao động tổng vốn thu nhập 1 năm
Trang 77e) Phân tích h i qui ồ
Trang 79Số lao động 4.095244 1.410569 2.903257 0.009894 1.119204 7.071285
Trang 82Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Trang 831 Mô hình hóa (k t h p KTL + Toán + các môn ế ợ
Xem l i các môn h c liên quan và s v n d ng ạ ọ ẽ ậ ụ ở
Các ph ươ ng pháp phân tích nh l đị ượ ng
khác
Trang 84S dung s li u hay ử ố ệ
phân tích
Trang 85S li u th c p ố ệ ứ ấ
• S li u ố ệ đượ c thu th p không ph i cho m c ích ậ ả ụ đ
c a NC hi n t iủ ệ ạ
• Phân tích s li u thông tin ã cóố ệ đ
• S li u thu th p cho s d ng chungố ệ ậ ử ụ
• Nhà NC có nh hả ưở ng nh ỏ đế n d ng s li u (làm ạ ố ệ
th nào i u tra, )ế đ ề
• Không nên nh m v i : ầ ớ Phân tích “th c p” ứ ấ – là
phân tích m t phân tích khác – nh ki m tra tính ộ ư ể
chính xác