1. Trang chủ
  2. » Thể loại khác

Thu thập và xử lí số liệu

35 1,1K 5
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Thu Thập Và Xử Lí Số Liệu
Trường học Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành Kinh Tế
Thể loại bài luận
Năm xuất bản 2007
Thành phố Hà Nội
Định dạng
Số trang 35
Dung lượng 213 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Thu thập và xử lí số liệu

Trang 2

 Số liệu sơ cấp và số liệu thứ cấp

 Số liệu sơ cấp : Những số liệu được quan sát hay thu thập lần

đầu tiên bởi nhà nghiên cứu Số liệu dạng này thường các nhà nghiên cứu tự thu thập từ: bản câu hỏi, phỏng vấn, quan sát, nghiên cứu tình huống, …

 Số liệu thứ cấp: Những số liệu đã được công bố hay thu thập trong quá khứ hay do một nhóm thứ ba thu thập Số liệu này thường được thu thập từ các cơ quan có liên quan, các nghiên cứu trước đó, cơ

quan thống kê của chính phủ, Internet, …

nguồn số liệu thứ cấp trước khi quyết định

sử dụng số liệu sơ cấp do chi phí thấp hơn

 Số liệu thứ cấp thường được thu thập theo mục

đích của người khác nên đôi khi không phù hợp với mục tiêu đang

nghiên cứu.

Các loại số liệu

Trang 3

Số liệu chuổi thời gian, cắt ngang,

và hỗn hợp

• Số liệu chuổi thời gian (Time-series

data): Số liệu chuổi thời gian là một

tập hợp của những quan sát về những giá trị mà một biến số nhận được tại

những thời điểm khác nhau Số liệu này

có thể được thu thập hàng ngày, tuần,

tháng, quý, năm, 5 năm, …

• Số liệu chuổi thời gian thường được sử

dụng trong phân tích kinh tế vĩ mô để thấy

Trang 4

Tốc độ tăng trưởng và lạm phát của Việt Nam 1989-2007

Năm Tốc độ tăng trưởng (%) Tỷ lệ lạm phát (%)

Trang 5

Số liệu cắt ngang (Cross

section data)

 Là số liệu về một hay nhiều biến số

 Ví dụ: như tổng điều tra dân số được Cục Tổng điều tra thực hiện mỗi 5

năm, Điều tra về chi tiêu tiêu dùng

Trang 6

Sản lượng trứng của các tiểu bang

Hoa Kỳ

Trang 7

Số liệu hỗn hợp (Panel

data)

 là số liệu được kết hợp bởi cả số liệu chuổi thời gian và cắt ngang: cùng một đơn vị cắt ngang (chẳng hạn,

một gia đình hay một công ty) được quan sát theo thời gian

Trang 8

Ví dụ về số liệu hỗn hợp

Trang 9

Các phương pháp chọn mẫu

1. Chọn mẫu phi xác suất: Chọn mẫu

theo ý định chủ quan của người NC.

2. Chọn mẫu xác suất: Dựa vào lý

thuyết xác suất để lấy mẫu ngẫu

nhiên

Trang 11

Chọn mẫu thuận tiện

 Các đơn vị mẫu được chọn ở tại một địa điểm và vào một thời gian nhất định

 Vd: chọn mẫu những người đi mua sắm ở Metro

CT và tiếp cận họ khi họ bước vào sthị hoặc khi họ mua sắm món hàng mà ta muốn khảo sát.

 Ưu điểm: dễ dàng tập hợp các đơn vị mẫu

 Nhược điểm: không đạt được độ xác thực cao

 Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện”

Trang 12

Chọn mẫu phán đoán

 Các đơn vị mẫu được chọn dựa vào sự phán đoán của người nghiên cứu mà họ nghĩ rằng những mẫu này có thể đại diện cho tổng thể

 Vd: Chọn mẫu một số ít liên doanh lớn có thể

chiếm phần lớn tổng sản lượng ngành công nghiệp

Trang 13

Chọn mẫu chỉ định

 Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện

trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhóm

 Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để

so sánh kết quả thống kê về thái độ khách hàng Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đó 600 c.ty vừa và nhỏ,

300 trung bình và 100 qui mô lớn Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 c.ty vừa và nhỏ, 30 trung bình

 Ưu điểm: đảm bảo được số mẫu cần thiết cho từng nhóm

trong tổng thể phục vụ khách hàng

Trang 14

Chọn mẫu theo mạng quan hệ

lời đầu tiên để tiếp cận những người trả lời

F

Trang 15

Chọn mẫu theo mạng quan hệ

 Các mẫu đầu tiên được chọn theo

phương pháp xác suất

 Các mẫu tiếp theo được chọn ra từ việc cung cấp thông tin qua hình

thức nhờ giới thiệu

 Áp dụng cho các nội dung NC khá

đặc biệt, không phổ biến

 Ưu điểm: Giúp cho người NC chọn

được các mẫu mà họ cần NC.

Trang 17

Chọn mẫu ngẫu nhiên đơn giản

Là cách chọn mẫu mà mỗi phần tử trong tổng thể có cùng cơ hội được chọn với xác suất như nhau Để chọn được mẫu, người NC phải có danh sách tổng thể NC

 Vd: Chọn ngẫu nhiên 100 mẫu sinh

viên trong tổng số 4.000 sinh viên

Khoa Kinh Tế & QTKD.

Trang 18

Chọn mẫu có hệ thống

 Chọn ngẫu nhiên mẫu đầu tiên.

 Sau đó dùng bước nhảy (lặp đi lặp lại)

 Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu nhiên (giảm sai lệch

do tuần hoàn bước nhảy)

 Vd: PV các hộ gia đình vùng nông

thôn

Trang 19

Chọn mẫu ngẫu nhiên phân tầng

 Là phân chia các đối tượng nghiên cứu thành các nhóm, tầng theo các đặc tính, sau đó lấy mẫu

theo tầng, nhóm.

 Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, TĐHV, nhân khẩu,…).

 Chọn ngẫu nhiên hay hệ thống trong từng nhóm phân tầng theo tỷ lệ với nhóm.

Trang 20

SO SÁNH CHỌN MẪU XÁC

SUẤT VÀ PHI XÁC SUẤT

Xác suất Phi xác suât

Ưu điểm Tính đại diện cao.

Khái quát hóa cho tổng thể.

Tiết kiệm thời gian

và chi phí.

Nhược điểm Tốn kém thời gian và

chi phí. Tính đại diện thấp.Phạm vi sử dụng Nghiên cứu mô tả,

nhân quả và khám phá. Nghiên cứu thăm dò, thử nghiệm.

Trang 21

Thiết kế bảng câu hỏi

Trang 22

2 Nội dung BCH

Phần giới thiệu

 Giới thiệu bản thân phỏng vấn viên.

 Giới thiệu lý do, mục đích nghiên cứu.

 Khoảng thời gian cần thiết để hoàn thành Phần sàng lọc

 Chọn đúng đối tượng để thu dữ liệu.

 Thường dùng BCH phân đôi.

Phần nội dung chính

 Đa số câu hỏi liên quan đến nội dung NC.

Phần quản lý: xác nhận, lời cam đoan, mẫu số.

Trang 23

Ví dụ

Phần giới thiệu

Xin chào, tôi là thuộc nhóm

nghiên cứu Chúng tôi đang thực hiện

đề tài Anh (chị) vui lòng dành chút thời gian khoảng để giúp chúng tôi trả lời một

số câu hỏi dưới đây

Chúng tôi rất hoan nghênh sự cộng tác và giúp đỡ của anh (chị) Các ý kiến trả lời

của anh (chị) sẽ được đảm bảo giữ bí mật tuyệt đối

Trang 25

Những việc cần làm khi thiết kế

BCH

1 Xác định thông tin cần thiết

Dự án nghiên cứu Bảng câu hỏi Nhóm người trả lời

Danh mục các

thông tin cần có Các câu hỏi cần được chi tiết Các dữ liệu cần thu thập

Vd: năng suất lúa Sản lượng từng vụ

Diện tích từng vụ Sản lượng đã thu hoạch

Diện tích gieo trồng

Trang 26

2 Xác định hình thức phỏng vấn

 Thư tín: tiện lợi, chi phí thấp nhưng

tỷ lệ trả lời thấp, khó xác định độ tin cậy của thông tin được thu thập.

 Điện thoại: tốn kém, chỉ áp dụng khi thu thập ít thông tin và thời gian

phỏng vấn ngắn; thông tin tương đối tin cậy

 Trực tiếp: thông tin tin cậy, tỷ lệ trả lời cao nhưng tốn kém

Trang 27

3 Lựa chọn cấu trúc câu hỏi

Câu hỏi mở:

 Phần trả lời không định trước, đáp viên tự trả lời theo suy nghĩ

 Khai thác ý kiến mới

 Tạo quan hệ mật thiết khi trả lời

 Khó khăn khi đáp viên trả lời dài dòng, lạc

đề

Trang 29

4 Từ ngữ sử dụng trong BCH

 Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ: Who, What, Where, When, Why, How.

 Sử dụng từ ngữ đơn giản, thông dụng.

 Tránh dùng từ ngữ trừu tượng (Vd: đi sthị có

thường không?)

 Tránh dùng câu hỏi có 2 vế song song (vừa - vừa).

 Cẩn thận câu hỏi liên quan đến tự ái cá nhân (hỏi

Trang 31

6 Nhập số liệu

nhập,

để phục vụ cho việc đọc số liệu trong tập tin dữ liệu

xử lý bảng tính: Excel, SPSS, Stata,

Limdep, …

sánh ngẫu nhiên một số mẫu; tổ chức

nhiều người nhập liệu song song, …

Trang 32

XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

i Phân tích thống kê mô tả

dãy biến động, hệ số biến động

ii Phân tích tần số: đếm tần số xuất hiện,

Trang 33

Các bước trong phân tích số liệu và viết

báo cáo

Những câu hỏi

cần trả lời

Các bước cần thực hiện

Các công việc chính trong

mỗi bước

Các số liệu đã được thu

thập cho mỗi mục tiêu

NC là gì?

Số liệu có hoàn chỉnh

và chính xác không?

Chuẩn bị số liệu cho phân tích

-Xem xét lại việc thu thập tại thực địa,

-Lập bảng kiểm kê các số liệu cho mỗi mục tiêu,

-Xếp thứ tự các số liệu và kiểm tra chất lượng,

-Kiểm tra output của máy tính

Các số liệu trông như thế

nào?

Các số liệu có thể được

tóm tắt như thế nào cho

phân tích đơn giản?

Tóm tắt số liệu và

mô tả các biến/xác định biến mới

B ảng tần suất, biểu đồ, biểu đồ phát triển, tỷ trọng, tần suất chéo, hệ số tương quan, các thống kê

Trang 34

-B ảng tần suất chéo, -Đo lường sự tương quan, -Xử lý các biến nhiễu.

C ó đo lường sự chênh

lệch hay tương quan

giữa các biến không ?

Chu ẩn bị cho phân tích thống kê

- C ác đo lường sự phân tán, phân phối chuẩn và sự biến động mẫu

X ác định loại của phân tích thống kê

T-test, chi-square test paired t-test

Mc-Nemar’s chi-square test

L àm thế nào sự tương

quan giữa các biến có

thể được xác định ?

Th ực hiện các đo lường về sự tương quan

Bi ểu đồ phân tán, Đường hồi quy, và

H ệ số tương quan

Trang 35

B áo cáo nên được

viết như thế nào ? Viết báo cáo và xây

dựng các kiến nghị

-Chu ẩn bị dàn ý của báo cáo,

-Trình bày và diễn dịch số liệu,

-Bản nháp và bản nháp lần 2.

-Thảo luận và tóm tắt kết luận

Thảo luận những tóm tắt

và kế hoạch thực hiện đối với những người liên quan

Ngày đăng: 12/03/2013, 10:14

HÌNH ẢNH LIÊN QUAN

Bảng câu hỏi Phỏng vấn viên Phỏng vấn viên - Thu thập và xử lí số liệu
Bảng c âu hỏi Phỏng vấn viên Phỏng vấn viên (Trang 24)
Đồ thị phân phối tần số. - Thu thập và xử lí số liệu
th ị phân phối tần số (Trang 32)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w