mạnh (ưu điểm), các điểm yếu (nhược điểm) và đồng thời tìm ra các cơ hội và thách thức mà chúng ta có thể có được hoặc phải đối mặt (với vấn đề nghiên cứu) • Là phân tích một hiện tượng [r]
Trang 1HỌC VIỆN NÔNG NGHIỆP VIỆT NAM
BỘ MÔN KẾ HOẠCH VÀ ĐẦU TƯ
CHƯƠNG IV
XỬ LÝ VÀ PHÂN TÍCH
THÔNG TIN
Phạm Văn HùngNguyễn Thị Dương Nga
Hồ Ngọc Ninh
2
Nội dung
1 Xử lý thông tin (số liệu)
2 Các phương pháp phân tích thông tin (số
liệu)
3 Trình bày kết quả xử lý và phân tích
thông tin
1 Xử lý thông tin
1.1.Hiệu chỉnh và mã hóa dữ liệu
1.2 Đánh giá chất lượng số liệu
1.3 Xác định các mối liên hệ
Trang 21.1 Hiệu chỉnh và
mã hóa dữ liệu
5 5
Hiệu chỉnh và mã hóa dữ liệu là gì?
Tại sao phải hiệu chỉnh và mã hoá dữ liệu?
6
a) Khái niệm và lợi ích hiệu chỉnh và mã hóa dữ liệu
• Tại sao?
• Hiệu chỉnh: Kiểm tra dữ liệu và thông tin theo 3 yêu cầu
• Mã hóa: là thay đổi số liệu ‘nguyên thủy’ về một dạng
ngắn gọn hơn để có thể lưu trong máy tính và xử lý
được dễ dàng bằng các mã số hoặc ký hiệu thích hợp
(Xây dựng bộ mã hóa)
• Các lợi ích của mã hóa dữ liệu
- Giảm công suất, không gian lưu trữ
- So sánh giảm nhẹ và như vậy sẽ nhanh hơn
- Nếu mã hóa số lượng vừa phải có thể giúp nâng cao giá
trị của số liệu
- Giúp cho các phương pháp phân tích định lượng
Trang 3• Lựa chọn mó húa, thang đo gắn cho từng dữ liệu
* Các loại thang đo
+ Thang đo định danh (Norminal
+ Thang đo thứ bậc (Ordinal): là thang đo định danh nhng có phân
ra thứ bậc cao thấp Ví dụ Huân chơng hạng 1, 2, 3.
+ Thang đo khoảng (interval): Là thang đo thứ bậc có khoảng cách
đều nhau, có thể đánh giá sự khác biệt giữa các biến.
+ Thang đo tỷ lệ (Ratio- Scale): Để đo lờng các biểu hiện của tiêu
thức nh các đơn vị vật lý thông thƯờng
* Cỏc mó số: Đỏnh dấu, ký hiệu, cho điểm
* Lựa chọn số lượng và giới hạn của từng hành vi của
thụng tin
Thớ dụ: Cỏc nguyờn nhõn, Cỏc khú khăn, …
* Gắn thang đo, mó số cho từng hành vi của thụng tin
b) Kỹ thuật mó húa dữ liệu
8
c) Những chỳ ý khi mó húa dữ liệu
• Người sử dụng cần phải biết mó của dữ liệu
– Nếu người sử dụng khụng biết mó của số liệu thỡ khụng thể
phõn tớch được
– Thớ dụ Mó húa thụng tin về giới: 1 là nam; 2 là nữ
• Mức độ chớnh xỏc của dữ liệu mó húa
– Vớ dụ: Mó húa thụng tin về mức độ kinh tế
Hộ giàu: thu nhập/1 người > 2.500 ngàn đ/thỏng; Hộ nghốo: <
500 ngàn đ/thỏng
• Mó húa thường thể hiện bằng số
• Vớ dụ: “Anh cú thớch phim này khụng?” – cú thể được
mó từ 1 đến 4
1.2 Đỏnh giỏ chất lượng
SỐ LIỆU
Trang 4a) Thế nào là đánh giá chất lượng số liệu
• Tại sao? Mọi số liệu phải ĐÁNG TIN CẬY và số liệu
phải THỰC
• Có thể biết được thông qua kiểm định số liệu
• Đánh giá chất lượng số liệu giúp người sử dụng và nhà
quản lý chắc chắn rằng số liệu “tốt” có thể sử dụng cho
Đánh giá chất lượng thông tin thứ cấp
Phương pháp đánh giá chất lượng số liệu
12
* C¸c lçi thưêng gÆp khi thu thËp th«ng tin s¬ cÊp
Lçi khi chän mÉu Lçi tr¶ lêi Lçi kh«ng tr¶ lêi
Tõ chèi Kh«ng
muèn
Trang 5Phương pháp đánh giá chất lượng số liệu sơ cấp
• Tình trạng bình thường
– Kiểm tra số liệu có thể sử dụng trong điều kiện bình
thường với những số liệu “bình thường”
• Tình trạng “cực đoan”
– Kiểm tra mức độ chính xác của số liệu nhưng ở mức
thấp hơn hoặc cao hơn trong khoảng số liệu cần
• Tình trạng “sai”
– Kiểm tra với số liệu sai
• Kiểm tra số liệu trong mọi tình trạng
Mọi người và với các phương pháp khác nhau, kiếm tra
thường xuyên theo các tiêu chí để hạn chế tới mức thấp
nhất các sai số
14 14
1.3 Xác định các
mối liên hệ
a) Thông tin định tính
a1) Xác định các liên hệ định tính có thể vẽ thành sơ đồ
• Liên hệ nối tiếp / Liên hệ song song
• Liên hệ hình cây / Liên hệ mạng lưới
• Liên hệ trong hệ thống có điều khiển
• Liên hệ hỗn hợp
a2) Các liên hệ vô hình không thể trình bày bằng sơ đồ
hoặc biểu thức toán học như:
• Chức năng của hệ thống
• Quan hệ tình cảm
• Trạng thái tâm lý
• Thái độ chính trị
Trang 6- Các công cụ cho sản xuất rau
- Năng suất một số loại rau vụ đông của các nhóm hộ
- GO, IC, VA, V
- GO/IC, GO/V, VA/IC, VA/V
- So sánh ĐKSX thực tế với tiêu chuẩn VietGAP
- Về hiểu biết và nhận thức
- Về sử dụng các yếu tố đầu vào: Giống, Phân bón, Thuốc BVTV
- Về thu hoạch, bảo quản
Sản xuất rau vụ đông theo VietGAP chưa được
các hộ nông dân hưởng ứng nhiều
Yếu tố
tích cực
Yếu tố cản trở
QT tổ chức, quản lý
- Vốn
- CSHT
- Tác động đến nhận thức
- Hỗ trợ sản xuất
18 18
Trang 719 19
b) Thông tin định lượng
• Xác định các quan hệ định lượng giữa các sự kiện (biến)
* 4 cấp độ thể hiện mối quan hệ định lượng:
• Số liệu độc lập (không phân tổ chỉ liệt kê)
• Phân tổ theo 1 tiêu thức (phân tổ giản đơn)
• Phân tổ từ 2 tiêu thức trở lên (phân tổ kết hợp)
• Danh mục phân loại
* Chú ý: Các loại sai số thường xuất hiện
• Sai số ngẫu nhiên
• Sai số kỹ thuật
• Sai số hệ thống
* Các lỗi phổ biến khi xử lý sai số:
• Hệ thống số liệu lớn sai số nhỏ và ngược lại
• Lấy sai số khác nhau trong cùng một hệ thống số liệu
20 20
Trang 8Tổng hợp thông tin trên EXCEL
Mã hoá các biến trên EXCEL
Bài tập về nhà
• 1 Anh chị hãy thiết kế 1 phiếu điều tra chọn
mẫu phục vụ cho đề tài nghiên cứu của nhóm
mình?
• 2 Anh chị hãy sử dụng các thang đo để mã
hoá các thông tin của phiếu điều tra?
• Thiết kế mẫu nhập cơ sở dữ liệu trong EXCEL
để tổng hợp thông tin
Trang 925 25
2 Phân tích thông tin
2.1 Phân tích thông tin định tính
2.2 Phân tích thông tin định lượng
2.3 Phân tích thông tin thứ cấp
• Phân tích điểm mạnh yếu (SWOT)
• Phân tích thông tin thứ cấp
a) Nghiên cứu tình huống
* Thế nào là nghiên cứu tình huống? (Murray, 1938)
Nghiên cứu tình huống là nghiên cứu kỹ một người như một “chủ
thể” thống nhất – chứ không phải là một phần trong dân số
Nghiên cứu tình huống là nghiên cứu sâu hay rất kỹ về một đơn vị
nhằm làm rõ hơn những vấn đề nghiên cứu
* Điểm mạnh
– Sâu và chi tiết
– Bao quát cả những sự việc phức tạp
* Điểm yếu
– Vấn đề khái quát: Có ý kiến chủ quan
– Kết quả có thể bị chệch và có ấn tượng chủ quan
– Làm cho mối quan hệ phức tạp giữa các biến số
Kỹ thuật thể hiện: Viết, hộp
Trang 10b) Tổng quan lịch sử
Tổng quan lịch sử hay tổng quan tài liệu nghiên cứu
• Là tóm tắt những hiểu biết về những vấn đề, những lĩnh
vực có liên quan đến đề tài hay nội dung NC
• Nêu mẫu thuẫn, ưu nhược điểm của các quan điểm NC
• Xem lại chương 3 phần phương pháp thu thập thông tin
bằng phương pháp nghiên cứu tài liệu theo trình tự:
1 Lựa chọn câu hỏi NC
2 Lựa chọn các cơ sở dữ liệu, bài báo, tài liệu để
tìm
3 Lựa chọn nội dung, từ khóa để tìm
4 Nghiên cứu tài liệu và Thực hiện tổng quan
5 Khái quát hóa kết quả
29
c) Phân tích điểm mạnh, yếu,
cơ hội, thách thức
30
Phân tích điểm mạnh, yếu, cơ hội, thách thức là gì?
• Strengths (mạnh), Weaknesses (yếu), Opportunities (cơ
hội), Threats (thách thức) - SWOT - Phân tích SWOT
• Phân tích SWOT là phương pháp xác định các điểm
mạnh (ưu điểm), các điểm yếu (nhược điểm) và đồng
thời tìm ra các cơ hội và thách thức mà chúng ta có thể
có được hoặc phải đối mặt (với vấn đề nghiên cứu)
• Là phân tích một hiện tượng dưới quan điểm hệ thống từ
bên trong (S, W) ra bên ngoài (O, T) hay đồng thời kết
hợp cả trong và ngoài
• Đây là công cụ sử dụng nhiều trong phân tích các hiện
tượng dưới dạng định tính – xã hội, chính sách
• Có thể sử dụng cả trong thảo luận hoặc cá nhân tự nghiên
cứu
Trang 11• Cơ hội (O)
– Những điểm tích cực từ hoàn cảnh bên ngoài
Chuyển Chuyển
Trang 12Tận dụng mặt mạnh để giảm thiểu nguy cơ (S/T)
Mặt yếu (W)
Nắm bắt cơ hội
để khắc phục mặt yếu (O/W)
Giảm thiểu mặt yếu để ngăn chặn nguy cơ (W/T)
Tận dụng mặt mạnh để giảm thiểu nguy cơ (S/T)
Mặt yếu (W)
Nắm bắt cơ hội
để khắc phục mặt yếu (O/W)
Giảm thiểu mặt yếu để ngăn chặn nguy cơ (W/T)
Tận dụng mặt mạnh để giảm thiểu nguy cơ (S/T)
Mặt yếu (W)
Nắm bắt cơ hội
để khắc phục mặt yếu (O/W)
Giảm thiểu mặt yếu để ngăn chặn nguy cơ (W/T)
Trang 138 bước xây dựng ma trận SWOT
1 Liệt kê các điểm mạnh chủ yếu
2 Liệt kê những điểm yếu cơ bản (tiêu biểu)
bên trong
3 Liệt kê các cơ hội chính
4 Liệt kê các mối đe doạ chủ yếu bên ngoài
38
8 bước xây dựng ma trận SWOT
trong kinh doanh
5 Kết hợp S-O và đề xuất phương án chiến lược phát huy
điểm mạnh để nắm bắt cơ hội.
6 Kết hợp W-O để đề ra phương án chiến lược khắc phục
điểm yếu bằng cách tận dụng cơ hội.
7 Kết hợp W-T và đề xuất phương án chiến lược nhằm tối
thiểu hoá tác dụng của điểm yếu và phòng thủ trước các
mối đe doạ từ bên ngoài.
8 Kết hợp S-T và đề xuất phương án chiến lược lợi dụng thế
mạnh của mình để đối phó với nguy cơ đe doạ từ bên
Trang 14• Phân tích phương sai
• Phân tích tương quan
• Phân tích hồi qui tuyến tính
• Hồi qui phi tuyến (KTL)
Trang 15– Phương sai (mô-men bậc 2)
– Độ nghiêng (skewness, mô-men bậc 3)
– Căn bậc2 của phương sai
Phân phối của trung bình mẫu
• Mẫu được chọn từ tổng thể
– Sử dụng phân phối của trung bình mẫu
• Phân phối của trung bình mẫu có
• Chứng minh
Trang 16b) Thống kờ so sỏnh
( Kiểm định giả thuyết)
1 Kiểm định giả thuyết về sự khác nhau giữa 2 số
định giả thuyết sau:
Ho: x - y = Do (Do là giá trị cho trớc Do=0)
H1: x - y Do Hay:
n T: Tiêu chuẩn kiểm định (T thực nghiệm)
- Tìm T lý thuyết với bậc tự do là n-1; /2 Ta có thể tra bảng phân phối
Student với n-1 và /2; hoặc tìm hàm TINV(n-1, )
- So sánh T thực nghiệm với T lý thuyết”
Nếu T T (n-1, /2) ta chấp nhận giả thuyết Ho,
Nếu T > T (n-1, /2) ta bác bỏ giả thuyết Ho và khi đó:
Trang 17+ Thí dụ: Công ty VINAMILK áp dụng công nghệ mới trong
chế biến sữa chua Hãy kiểm định xem năng suất lao động
của công nhân sau khi sử dụng công nghệ mới với công
nghệ cũ có khác nhau không với mức ý nghĩa là 5% ?
x Trung binh của 10 công nhân theo công nghệ cũ = 56,30
y Trung binh của 10 công nhân theo công nghệ mới = 61,20
Ď là trung binh của tổng thể sai lệch X – Y = - 4,9
Sd là độ lệch chuẩn của tổng thể X-Y = 4,4833
Ta cần kiểm định gia thuyết sau:
Ho: x - y = Do =0 H1: x - y Do 0
Nh vậy, T kiểm định = 3,456 >T lý thuyết = 2,262 ta bác
bỏ Ho, nghĩa là năng suất lao động của công nhân sau khi
áp dụng công nghệ mới khác với công nghệ cũ.
Gia sử ta có nxvà ny là số đơn vị mẫu đợc chọn ngẫu nhiên, độc lập từ
hai tổng thể X và Y có phân phối chuẩn, thể hiện ở bang sau:
Trang 18+ Nguyên tắc kiểm định: có 2 trờng hợp xảy ra
Trong đó: D o : giá trị cụ thể cho trớc (Do =0)
Z: Tiêu chuẩn kiểm định (Z thực nghiệm)
1) Nếu nx,ny 30 , với X, Y tuân theo phân phối chuẩn và
2
x 2
Tính tiêu chuẩn kiểm định Z (Z thực nghiệm)
-Tìm Z lý thuyết:
Tìm Z/2 bằng cách tra bảng hoặc dùng hàm NORMSINV với /2 trong EXCEL
+ Nếu Z Z/2 ta chấp nhận giả thuyết Ho, coi x - y = Do
+ Nếu Z > Z/2 ta bác bỏ giả thuyết Ho, coi x - y Do và khi đó :
Nếu x > ŷ ta xem x > y
Nếu x < ŷ ta xem x < y
Thí dụ: Một trại chan nuôi gà tiến hành thí nghiệm sử dụng 2
loại thức ănA và B trên cùng một giống Sau một thời gian
thử nghiệm cho ăn, ngời ta điều tra 50 con nuôi bằng thức ăn
A và 40 con nuôi bằng thức ăn B thu đợc các số liệu sau:
Bang : Một số chỉ tiêu của 2 mẫu thí nghiệm cho ăn 2 loại
thức ăn A và B
Yêu cầu: Anh chi hãy cho biết khối lợng trung bỡnh 1 con sử
dụng ở 2 loại thức ăn sau thời gian nuôi có khác nhau không
- Tính tiêu chuẩn kiểm định Z
- Tim Z lý thuyết qua hàm NORMSINV với = 0,025 trong EXCEL ta đợc Z
lý thuyết = 1,96.
- Z = 4,179 > Z/2= 1,96 ta bác bỏ gia thuyết Ho, coi x - y 0.
Vì x =2,2 kg/con > ŷ = 1,2 kg/con nên ta xem x > y, chứng tỏ khối
l-ợng trung bình 1 con nuôi bằng thức an A lớn hơn nuôi bằng thức an B.
Trang 19c) Phân tích tương
quan
56
Quan hệ tương quan
– Là quan hệ tuyến tính giữa 2 biến độc lập
– Có thể dự báo giá trị 1 biến khi biết giá trị của
biến kia
– Hệ số tương quan nằm trong khoảng -1 đến 1
– Giá trị -1 và 1 là tương quan hoàn hảo, rất chặt,
tuyến tính giữa 2 biến
– Giá trị 0 là không có tương quan, không có mối
quan hệ
Tương quan – mức độ và xu hướng
Trang 20Phân tích tương quan
59
Ưu và nhược điểm của tương quan
– Có thể đo được mối quan hệ giữa các biến mà
Trang 21Các phương pháp phân tích định lượng khác
Sử dung số liệu hay
thông tin thứ cấp trong
phân tích
Trang 22Số liệu thứ cấp
• Số liệu được thu thập không phải cho mục đích của
NC hiện tại
• Phân tích số liệu thông tin đã có
• Số liệu thu thập cho sử dụng chung
• Nhà NC có ảnh hưởng nhỏ đến dạng số liệu (làm
thế nào điều tra, )
• Không nên nhầm với : Phân tích “thứ cấp” – là
phân tích một phân tích khác – như kiểm tra tính
Trang 23Tất cả các kiểu trình bày đều nhằm mục đích giúp người
đọc dễ hiểu kết quả phân tích
Đây chỉ là cách khác nhau – mục đích như nhau
Trình bày tài liệu thống kê
Trang 24Nguồn: Ph òng kế hoạch - Tổng hợp công ty A
* Chưa tính thuế thu nhập đặc biệt
3.9203.300
3.9003.600
Lợi nhuận
9.860*
9.7509.600
8.400
Chi phí
13.78013.050
13.50012.000
Doanh thu
20122011
20102009
Chỉ tiêu
Kết quả sản xuất kinh doanh công ty A giai đoạn 2009-2012
đơn vị: triệu VND
Trang 25- Về nội dung : Gồm 2 phần
+ Phần chủ đề (chủ từ) : Trình bày các bộ phận của
hiện tượng nghiên cứu…hay có thể là không
gian hoặc thời gian nghiên cứu của hiện tượng
đó
+ Phần giải thích (tân từ) : gồm các chỉ tiêu giải
thích các đặc điểm của đối tượng nghiên cứu,
giải thích cho phần chủ từ
74
c- Yêu cầu khi xây dụng bảng TK
- Qui mô bảng không nên quá lớn
- Các tiêu đề, tiêu mục ghi chính xác, gọn, đầy đủ,
dễ hiểu
- Các chỉ tiêu giải thích cần sắp xếp hợp lý, phù hợp
với mục tiêu nghiên cứu Các chỉ tiêu có liên hệ
với nhau nên sắp xếp gần nhau
- Có đơn vị tính cụ thể cho từng chỉ tiêu
BảngTiêu đề bảng:
• Xác định một nội dung cụ thể
• Sử dụng tên trong tiêu đề và các tiêu đề cột
trong bảng cũng giống như trong phân tích
• Cố gắng ngắn gọn
Trang 26BảngGhi chú:
• Sử dụng các chỉ số trên cho ghi chú:
• Ví dụ: *, †,‡,¶,#,**,††, v.v
• Sử dụng ghi chú cho mức ý nghĩa thống kê
• ví dụ: *** cho mức < 0,01 trong các kiểm định
(T và F)
• Sử dụng ghi chú giải thích cách tính chi tiết trong
bảng, các mức số liệu khác nhau
77
- Cách ghi số liệu : Các ô trong bảng dùng để ghi số
liệu, nhưng nếu không có số liệu thì dùng các kí
hiệu qui ước sau:
+ Dấu gạch ngang (-) : Hiện tượng không có số
liệu
+ Dấu ba chấm (…) : Số liệu còn thiếu, sau này có
thể bổ sung
+ Dấu gạch chéo (x ) : Hiện tượng không liên
quan đến chỉ tiêu, nếu viết số liệu vào ô đó sẽ
không có ý nghĩa
78
VD: Giá trị xuất khẩu một số MH của VN tháng 2/2013
8300
5 Than đá
2921340
4 Dầu thô
2635
3 Cao su
3650
Lượng XK(1000 tấn)Mặt hàng
Nguồn: bản tin XNK – BTM số … tháng 3 năm 2013
Trang 27Bảng phân phối tần suất
(Frequency)
10 - 20 3 .15 15
20 - 30 6 .30 30
30 - 40 5 .25 25
40 - 50 4 .20 20
50 - 60 2 .10 10
Tổng số 20 1 100
Tần suất Phần trăm (%) Sắp xếp số liệu theo thứ tự: 12, 13, 17, 21, 24, 24, 26, 27, 27, 31, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 80 Bảng tần số tích lũy Tần số Tần suất Tổ tích lũy tích lũy 10 - 20 3 15
20 - 30 9 45
30 - 40 14 70
40 - 50 18 90
50 - 60 20 100
Sắp xếp số liệu theo trật tự:
12, 13, 17, 21, 24, 24, 26, 27, 27, 31, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
a - KN :
Là các hình vẽ hoặc
đường nét hình học
dùng để miêu tả có
tính chất qui ước các
thông tin thống kê
(3) - Đồ thị thống kê
Trang 28Yêu cầu khi trình bày két quả xử lý và
phân tích thông tin
Mỗi hình thức trình bày đều có:
• Bao gồm tiêu đề mô tả
• Tên của tất cả các biến và đơn vị đo
• Các biến độc lập ở trục hoành
• Biến phụ thuộc ở trục tung
• Nguồn số liệu trong ghi chú
• Chỉ rõ kiểm định thống kê ở cuối bảng
• Luôn có số quan sát, số mẫu
• Chỉ rõ nếu dùng phần trăm
83
b – Tác dụng :
Ứng dụng rộng rãi trong mọi công tác nhằm hình
tượng hoá về hiện tượng nghiên cứu, cụ thể biểu
hiện:
+ Sự phát triển của hiện tượng qua thời gian
+ Kết cấu và biến động kết cấu của hiện tượng