“Thống kê là một phương phâp nghiên cứu các đặc tính của một nhóm dựa trên một bộ phận của nhóm” ĐẶC ĐIỂM -> Tham số NHÓM -> tổng thể Bộ phận của NHÓM -> mẫu Dữ liệu... suy diễn thống kê
Trang 1Phương pháp thống kê trong kinh tế và quản trị
Vấn đề 1 Tổng quan về
phân tích thống kê
Trang 2I Tổng quan
Thống kê là gì?
“Thống kê là một phương phâp nghiên cứu các đặc tính của một nhóm dựa trên một bộ phận của nhóm”
ĐẶC ĐIỂM -> Tham số NHÓM -> tổng thể
Bộ phận của NHÓM -> mẫu Dữ liệu
Trang 3suy diễn thống kê (tiếp)
| |
Tham số < (suy diễn) thống kê
tổng thể : tất cả quan sát
mẫu: một bộ phận của tổng thể
tham số: đăc điểm tóm tắt của tổng thể
thống kê: đăc điểm tóm tắt của mẫu
Trang 4suy diễn thống kê (tiếp)
Ví dụ (Một biến)
“Ở Hoa Kỳ trung bình thu nhập của các luật sư hằng năm là bao nhiêu?”
tổng thể: các luật sư ở Hoa Kỳ
mẫu: 1000 quan sát được chọn một cách ngẫu nhiên
tham số: thu nhập trung bình hằng năm
thống kê mẫu: mẫu trung bình về thu
Trang 5Suy diễn thống kê (tiếp)
Suy diễn
Giả thiết phải kiểm định
quyết định
Trang 6Suy diễn thống kê (tiếp)
Ví dụ khác (hai biến)
“Nếu tăng tỷ suất lãi vay ngân hàng lên 1% thì nhu cầu tậu nhà sẽ thế nào?”
Trong trường hợp này ta xác định tham số thế nào?
hai BIẾN có liên quan (tỷ suất lãi vay ngân hàng và nhu cầu tậu nhà)
Tham số là sự thay đổi nhu cầu nhà ở tương ứng với 1% thay đổi của tỷ suất lãi vay.
Như vậy mô hình hồi quy được thành lập
Trang 7Suy diễn thống kê (tiếp)
Sử dụng mẫu dữ liệu, ta kiểm tra ảnh
hưởng của biến thay đổi.
Mẫu dữ liệu: Dữ liệu chuỗi thời gian thường được sử dụng.
Dữ liệu hàng tháng của tỷ suất lãi vay và nhu cầu mua bán nhà
Tổng thể: số người mua nhà ở cả nước
Thống kê mẫu: hệ số hồi quy được ước
lượng
Giả thiết để kiểm định
Nếu không có ảnh hưởng? Vậy thì, b = 0 hoặc b khâc không.
Trang 8Suy diễn thống kê (tiếp)
Tại sao phải dùng phương pháp suy diễn?
toàn bộ tổng thể thì quá đắt
hoặc không thể thực hiện được
để suy ra tổng thể
Trang 9Từ mẫu đến tổng thể
(tiếp.)
Ví dụ
Trang 10Từ mẫu đến tổng thể
(cont.)
Ví dụ
Tổng thể
a Chúng ta muốn biết số lượng
người xem chương trình TV nào vào thứ Ba lúc 9 P.M
chương trình được các gia đình xem trong thời điểm này ở VN
Trang 11Dữ liệu
Kiểu của Dữ liệu
Định lượng và định tính
Xem tivi hoặc không xem
Nam, nữ
Phiếu bỏ cho Clinton hay Bush
Dữ liệu chuỗi thời gian
Trang 12Thu thập dữ liệu
Định nghĩa
Kết quả -> tổng thể -> câu hỏi nghiên cứu
Câu hỏi liên quan đến kết quả chủ yếu;
Câu hỏi thêm về dân chủng học (tuổi đời, thu
nhập, giới tính )
Các câu hỏi thêm khác
Điều tra trước
Kích thước và phương pháp lấy mẫu
Phỏng vấn (điều tra)
Phỏng vấn có cấu trúc và không có cấu trúc
Trang 13Kỹ thuật lấy mẫu
Lấy mẫu ngẫu nhiên đơn giản
Kỹ thuật lấy mẫu khác
Lấy mẫu ngđ̃u nhiín nhiều tđ̀ng
Random lấy mẫu within Strata (Subgroup
, eg Race)
Mẫu đối xứng ngẫu nhiên
quan sát thứ k trong mỗi hàng
Lấy mẫu theo nhóm
Phđn nhóm theo câc tiíu thức
Trang 14II Mô tả thống kê
Hai cách thức để tóm tắt dữ liệu
Mô tả thống kê
Đo lường tóm tắt bộ Dữ liệu
Các số liệu này được sử dụng để suy diễn thống kê.
Trang 15Thống kê mô tả
Giá trị trung tâm và độ phân tán.
Giá trị trung tâm
trung bình (average):
trung vị (nằm giữa của phân bố)
Mode (giá trị có tần số lớn nhất)
Trang 16 Dữ liệu trung tâm chưa đủ thông tin cần thiết
Ví dụ: luồng tiền trung bình của hai dự án đầu tư
Trang 17 Độ phân tán
biến gần với giá trị trung bình
“Variance” - Phương sai
Trang 18 Phương sai (bình phương của độ
lệch chuẩn)
trị cao nhất và giá trị thấp nhất
của dữ liệu)
Trang 19Ví dụ Độ lệch chuẩn
Thu nhập trung bình hàng năm của 2 phương án đầu tư
A: 6%, 4%, 4%, 6% trung bình = 5%
Độ lệch chuẩn = 1.00%
B: 1%, 12%, 3%, 4% trung bình = 5% Độ lệch chuẩn = 4.83%
Gợi cho ta suy nghĩ gì?
Trang 20phân bố của dữ liệu kéo dài bên phải
(trái).
Trang 21 Skewness dương (trung bình > trung vị)
Phân bố dữ liệu kéo dài bên phải (long right tail)
Skewness > 0
mode, trung vị < trung bình
Trang 22phân bố.
Excess Kurtosis = Kurtosis - 3
bố là nhọn so với phân phối
phân bố là dẹt hơn so với phân
Trang 24Trường hợp của hai biến
giữa chúng
về:
do vậy đối với hai đại lượng có đơn vị
đo khác nhau cần chuẩn hoá đẻ có thể
so sánh được.
Trang 25Phân tích tương quan
hệ số tương quan (r) để đo
lường mối liên kết giữa hai
biến liên tục
Trang 26 Thống kê r được gọi là hệ số tương quan
r có thể biến thiên từ:
Trang 27 Ví dụ
1 Mối quan hệ giữa điểm học tập và thời gian làm việc ở nhà của học viêntương quan = 0.84
Giá trị trung bình này có nghĩa gì?
2 Mối quan hệ giữa số lượng người xem truyền hình với chất lượng
chương trình
tương quan = - 0.67
Giá trị trung bình này có nghĩa gì?
Trang 28Table 1 A Typical Frequency Distribution
Table
Lớp Tần số Tần số tương đối Tần số tích luỹ
Trang 29B Đồ thị tần số
Trang 300 5 10 15
Trang 31IV Đồ thị tương quan
vẽ giá trị của 2 biến trong cùng một đồ thị.
Gợi ý cho ta
nếu có quan hệ tuyến tính
hướng của mối liên quan
Dương hoặc âm
Trang 321 đường thăóng chạy từ trái sang phải hai
biến có mối quan hệ tương quan dương (Ví dụ: tuổi và chiều cao của trẻ em)
Waist
Size
Age
Trang 332 đường thăóng chạy từ phải sang trái hai
biến có mối quan hệ tương quan âm (Ví dụ: tỷ suất lãi vay và nhu cầu mua sắm nhà)
Housing
sales
Interest rate
Trang 343 đường thăóng song song với trục hoành
hoặc trục tung hai biến không có mối quan hệ tương quan (Ví dụ: )
4 nếu ta không thể vẻ một đường thăóng
biểu hiện hai biến có nghĩa là chúng không tương quan nhau