Các ph ương pháp thống kê được mô tả nh ư việc định nghĩa các ph ương pháp sử d ụng trong việc thu th ậ p sốliệu, biểu diễn, phân tích và làm sáng tỏ dữ liệu Weinberg and Schumaker 1962.
Trang 1Giới thiệu về thống kê
DEPOCEN
Chương 1
Giới thiệu chung và cách thu thập số liệu
Trang 2• Các phương pháp thống kê là gì?
• Tại sao chúng ta lại cần
các phương pháp thống kê?
Trang 3Các ph ương pháp thống kê được mô
tả nh ư việc định nghĩa các ph ương pháp sử d ụng trong việc thu th ậ p sốliệu, biểu diễn, phân tích và làm sáng
tỏ dữ liệu (Weinberg and Schumaker 1962)
Trang 4Để hiểu việc biểu diễn các tính chất và mô tả
các thông tin như thế nào?
Để biết việc vẽ minh họa về một tổng thể lớn
mà chỉ dựa trên thông tin thu được từ các mẫu rasao?
Để biết các dự báo thu được chắc chắn đến
mức độ nào?
Để biết bằng cách nào cải tiến quy trình
Trang 5Một công ty có kế hoạch giới thiệu một sản
phẩm mới
Lợi tức của một sản phẩm trong công ty giảm
xuống nghiêm trọng trong sáu tháng gần đây
Công ty muốn thay đổi mẫu mã của sản phẩm đã
có Giám đốc Marketing muốn kiểm tra xem mẫu
mã mới ảnh hưởng đến thái độ của khách hàng với sản phẩm mới như thế nào?
Trang 6Cổ điển và Bayesian
Cổ điển: Fisher and Pearson
Bayesian: Thomas Bayes
Tham số và phi tham số (nửa
tham số) Nguyên nhân (causal) vàtương quan
Trang 7Bước 1: Xác định bài toán
Bước 2: Thiết lập các đối tượng nghiên cứu Bước 3: Xác định dạng dữ liệu cần thu thập Bước 4: Xác định nguồn lấy thông tin.
Bước 5: Xác định cỡ mẫu và cách lấy mẫu.
Bước 6: Xác định phương pháp thu thập số liệu Bước 7: Tiến hành thu thập số liệu.
Bước 8: Mô tả số liệu.
Bước 9: Phân tích số liệu.
Bước 10: Chuẩn bị và diễn giải báo cáo kết quả.
Trang 8Phân loại Thống kê
Trang 9Thống kê mô tả
•Thu thập số liệu (khảo sát)
•Biểu diễn số liệu (bảng, đồ thị)
•Đặc trưng của số liệu: mức ý nghĩa åx i n
Một đặc trưng:
tổng thể: là một tham số Mẫu: là một thống kê
Trang 10Các bước xác định bài toán:
Trang 11Để thu được thông tin cơ bản, xác định giới hạn, làm rõ bài toán và giả thuyết, xác định nguyên nhân và tạo các câu “nếu … thì…”.
Các loại kế hoạch nghiên cứu:
- Thăm dò
- Mô tả
- Nguyên nhân
Trang 12Thiết kế cấu trúc số liệu thu thập được dựa trên các đối tượng nghiên cứu.
Trang 13Bước 4: Các số liệu gốc
Bản in hoặc điện tử Khảo sát
Quan sát
Thí nghiệm
Trang 14Tổng thể: là tất cả các đối tượng được quan sát.
Mẫu: là một phần của tổng thể được chọn
để phân tích
Trang 15Các phương pháp lấy mẫu
Trang 17Mẫu ngẫu nhiên đơn giản
• Mọi đối tượng có khả năng được chọn
Trang 18Mẫu hệ thống
N = 64
n = 8 Nhóm 1 k = 8
Trang 20Mẫu chùm
• tổng thể được chia thành một vài “chùm”,
mỗi chùm biểu diễn lại tổng thể.
• Mẫu ngẫu nhiên đơn giản được chọn từ các chùm.
• Các mẫu đơn giản được kết nối làm một.
tổng thể chia làm 4
“chùm”.
Trang 21Phương pháp định tính Phương pháp định lượng
Trang 22Quan sát
Nhóm trọng tâmPhân tích ban đầuXác định kỹ thuật
Trang 23Được sử dụng với cỡ mẫu lớn
Các câu hỏi được xây dựng với các câu trả lời
đã có từ trước
Trang 26Phương pháp suy luận
Trang 27Bước 10: Báo cáo
kết quả
Trang 28Giới thiệu về thống kê
DEPOCEN
Chương 2
Biểu diễn số liệu bằng bảng
và biểu đồ
Trang 29Các chủ đề
•Tổ chức số liệu:
theo thứ tự mảng và hiển thị bằng biểu đồ hình cây-lá
•Bảng và đồ thị số liệu:
•Phân phối tần xuất : bảng, biểu đồ, đường gấp khúc
•Phân phối tích lũy: bảng, biểu đồ, hình cung
Trang 31Biểu diễn hình cây-lá : là một
một
tập s ố liệu Mỗi giá trị s ố liệu được chia thành hai ph ần:
phần
Trang 32chính là cây và phần phụ
là lá cây.
Trang 34Một phân phối tần xuất là vi
ệc nhóm các số liệu thành các mục riêng biệt để chỉ ra
số quan sát trong mỗi lớp.
Trang 35Bảng số liệu: Phân phối tần xuất
Trang 36Tỉ lệ tần xuất: Là phần trăm của các quan sát trong mỗi lớp trong tổng thể Ta lấy
số l ượng
trong mỗi lớp chia cho tổng số quan sát
Note: Tác dụng củ a bi ểu diễn cây-lá với một bảng phân phối tần xuất là không làm mất đi tính đồng nhất của mỗi quan sát
Trang 37Có ba dạng đồ thị thường
được sử dụng là: biểu đồ, đ ường gấp khúc, và phân ph
ối tần xuất tích lũy (dạng
đường cong).
Trang 38Biểu đồ: tạo nên bằng cách các lớp nằm
trên trục ngang và tần xu ất n ằm trên tr
ục th ẳng đứng, tần xu ất c ủa mỗi lớp bi
ểu di ễn độ cao của hình cột và mỗi cột được vẽ cạnh nhau
Trang 39Một đườ ng gấp khúc gồm các đoạn thẳng nối các
điểm nằm chính giữa các lớp và tần xuất của lớp
đó.
Trang 40Đượ c sử dụng để xác định tỉ l
ệ của các giá tr ị số liệu là n
ằm trên hay dưới một giá trị chắc chắn nào đó là bao
nhiêu.
Trang 42Đồ thị số liệu : Đường gấp khúc
Trang 45Tổ chức số liệu định tính
Số liệu định tính
Đồ thị số liệu Bảng số liệu
Tổng kết thành bảng
Hình quạt
Dạng khác Dạng cột
Trang 46Ví dụ: Tổng kết số liệu
bằng bảng 1 chiều
(với một nhà đầu tư)
Danh mục đầu tư Số lượng %
Trang 47Rất hữu ích trong việc thể
hiện
mối quan hệ của một phân phối tần: một hình tròn đ
ược chia tỉ l ệ với các tần
xuất của số liệu.
Trang 48Dạng hình quạt
Tiết kiệm 15%
Dự trữ
CP K 42% 14%
Cổ phần
29%
Trang 49Tổ chức số liệu định tính dạng
bảng 2 chiều
•Bảng ngẫu nhiên
•Dạng cột
Trang 50Tổ chức số liệu định tính dạng
bảng 2 chiều
Bảng ngẫu nhiên
:Danh mục Nhà đầu tư A Nhà đầu tư B Nhà đầu tư C Tổng
Trang 51Biể u diễ n số liệ u đượ c thiế t kế t ố t nếu:
Trang 53Biểu diễn sai
Minimum Wage
1960: $1.00
1970: $1.60
1990: $3.80
Trang 54n sai
Trang 55FR = Freshmen, SO =
Sophomore, JR = Junior, SR = Senior
Trang 56Biểu diễn sai Biểu diễn đúng
Trang 57Biểu diễn sai
0
J F M A M J
Graphing the first six months of sales.