Bài giảng THỐNG KÊ KINH DOANH Chương 3 NGUYÊN LÝ THỐNG KÊ Bài giảng THỐNG KÊ KINH DOANH Chương 3 NGUYÊN LÝ THỐNG KÊ Thạc sĩ Nguyễn Công Nhựt Khoa KHCB Trường Đại học Văn Lang Ngày 23 tháng 9 năm 2022. 1. Tổng thể thống kê và đơn vị tổng thể, và mẫu 2. Tiêu thức 3. Lượng biến 4. Tham số 5. Thiết kế thang đo và bảng câu hỏi (phần đọc thêm)
Trang 1Bài giảng
THỐNG KÊ KINH DOANH
Chương 3 NGUYÊN LÝ THỐNG KÊ
Thạc sĩ Nguyễn Công Nhựt
Khoa KHCB Trường Đại học Văn LangNgày 23 tháng 9 năm 2022
Trang 2THỐNG KÊ KINH DOANH
⋆ Hướng dẫn cách học - chi tiết cách đánh giá môn học
Tài liệu, video bài giảng được đưa lên elearning hàng tuần Sinh viên tải về, in ra và mangtheo khi học Điểm tổng kết môn học được đánh giá xuyên suốt quá trình học
Trang 31 BIẾN NGẪU NHIÊN
Trang 41 BIẾN NGẪU NHIÊN
2 MỘT SỐ PHÂN PHỐI XÁC SUẤT THÔNG DỤNG
Trang 51 BIẾN NGẪU NHIÊN
3 NGUYÊN LÝ THỐNG KÊ
Trang 6NGUYÊN LÝ THỐNG KÊ
NỘI DUNG
3-1 Một số khái niệm dùng trong thống kê
3-2 Thu thập và trình bày dữ liệu thống kê
Trang 73.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ
Trang 83.1.1 TỔNG THỂ THỐNG KÊ VÀ ĐƠN VỊ TỔNG THỂ, VÀ MẪU
Hình:
Trang 93.1.1 TỔNG THỂ THỐNG KÊ VÀ ĐƠN VỊ TỔNG THỂ, VÀ MẪU
Trang 103.1.1 TỔNG THỂ THỐNG KÊ VÀ ĐƠN VỊ TỔNG THỂ, VÀ MẪU
Định nghĩa (Tổng thể thống kê - Mẫu)
⋆ Tổng thể thống kê: là tập hợp các đơn vị cá biệt (hay phần tử) thuộc hiện tượngnghiên cứu, cần quan sát, thu thập và phân tích mặt lượng của chúng theo một haymột số đặc điểm nào đó
⋆ Mẫu: là một nhóm các đơn vị tổng thể được chọn một cách ngẫu nhiên từ tổng thểtheo các tiêu chí, hay thuộc tính cho trước
Trang 113.1.2 TIÊU THỨC
Định nghĩa (Tiêu thức)
Tiêu thức là đặc tính của đơn vị tổng thể Phân loại tiêu thức như sau:
⋆ Tiêu thức bất biến – tiêu thức biến động
⋆ Tiêu thức số lượng – tiêu thức thuộc tính
thể.
Trang 123.1.3 LƯỢNG BIẾN
Định nghĩa (Lượng biến)
Lượng biến là biểu hiện cụ thể của tiêu thức số lượng Có 2 loại lượng biến: lượng biến rờirạc và lượng biến liên tục
⋆ Lượng biến rời rạc: là lượng biến nhận giá trị hữu hạn hoặc vô hạn đếm được
⋆ Lượng biến liên tục: là lượng biến nhận giá trị phủ lấp một khoảng của trục số
Trang 133.1.4 THAMSỐ
Định nghĩa (Tham số)
Tham số là các giá trị phản ánh trực tiếp tính chất, đặc điểm của dữ liệu
Có 2 loại tham số: tham số mẫu và tham số tổng thể
⋆ Tham số tổng thể: là tham số lý thuyết, dùng để phản ánh đặc trưng cho tổng thể
⋆ Tham số mẫu: là tham số tính toán dựa trên dữ liệu thu thập được và tính toán dựa trêntham số tổng thể
Trang 143.1.5 THANG ĐO
Định nghĩa (Thang đo)
Thang đo là quy định về giá trị cho dữ liệu thu thập Phân loại thang đo dựa trên tiêuthức và lượng biến
Có 4 cấp thang đo, theo mức độ thông tin tăng dần, gồm : thang đo định danh, thang đo thứbậc, thang đo khoảng, thang đo tỷ lệ
Thang đo định danh (Nominal Scale): dùng cho tiêu thức thuộc tính, mang tính chất phânloại theo thuộc tính của dữ liệu, không mang tính so sánh giữa các thuộc tính với nhau
Trang 153.1.5 THANG ĐO
Thang đo định danh (Nominal Scale): dùng cho tiêu thức thuộc tính, mang tính chất phânloại theo thuộc tính của dữ liệu, không mang tính so sánh giữa các thuộc tính với nhau
Ví dụ 1
Một cuộc khảo sát về dân số, bạn được hỏi
như sau: “Vui lòng cho biết tình trạng hôn
nhân của bạn hiện nay?”
Một cuộc khảo sát, bạn được hỏi một câu về
trình độ học vấn: “vui lòng cho biết trình độ
học vấn cao nhất của bạn hiện nay?”
Trung học cơ sở □1Trung học phổ thông □2
Sau đại học □4
Trang 163.1.5 THANG ĐO
Thang đo thứ bậc (Ordinal Scale): dùng cho tiêu thức thuộc tính Dùng để phân dữ liệutheo thứ bậc hơn kém, nhưng không nhất thiết chênh lệch bằng nhau
Ví dụ 3
Một cuộc khảo sát về chất lượng trường ĐH
Văn Lang: “Bạn hài lòng như thế nào về cơ sở
vật chất của trường đại học Văn Lang?”
Rất hài lòng □1
Bình thường □3Không hài lòng □4Rất không hài lòng □5
Ví dụ 4
Một cuộc khảo sát về nhu cầu người tiêu dùng
về 1 sản phẩm điện tử, bạn được hỏi :“ Vui
lòng cho biết thu nhập hàng tháng của
Trang 173.1.5 THANG ĐO
Định nghĩa (Thang đo khoảng)
Thang đo khoảng là thang đo thứ bậc có khoảng cách đều nhau Dùng cho tiêu thức thuộctính(sau khi quy giá trị thành lượng biến) và tiêu thức số lượng Cho phép đo lường chínhxác sự khác nhau giữa các đơn vị và không có điểm gốc 0
Ví dụ 5
Một bảng khảo sát như sau: “theo anh, chị tầm quan trọng của các yếu tố sau đây như thếnào với cuộc sống của một người (Mức đánh giá từ 1 (không quan trọng) cho đến 7 (rất quantrọng))”
Trang 183.1.5 THANG ĐO
Định nghĩa (Thang đo tỷ lệ)
Thang đo tỷ lệ là thang đo thứ bậc có khoảng cách đều nhau và có điễm gốc 0 Nhờ điểmgốc và một tiêu chuẩn đo cụ thể, ta có thể sử dụng được mọi công cụ toán - thống kê đểphân tích dữ liệu, so sánh được tỷ lệ giữa các trị số đo
Trang 193.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ
NỘI DUNG
1 Xác định dữ liệu và phương pháp thu thập dữ liệu
2 Các kỹ thuật lấy mẫu
3 Xác định quy mô mẫu
4 Phân tổ
5 Lập bảng cho dữ liệu định tính
6 Lập bảng cho dữ liệu định lượng
7 Lập bảng cho dữ liệu kết hợp hai biến
Trang 203.2.1 XÁC ĐỊNH DỮ LIỆU VÀ PHƯƠNG PHÁP THU THẬP DỮ LIỆU
Định nghĩa (Dữ liệu thứ cấp)
Dữ liệu thứ cấp là nguồn dữ liệu đã được thu thập một cách chính xác, thông qua các tổchức, cơ quan (có liên quan tới vấn đề nghiên cứu) Dữ liệu thứ cấp thường là những dữliệu đã qua tổng hợp, xử lý Việc thu thập dữ liệu thứ cấp có ưu điểm là thu thập nhanh,
ít tốn kém chi phí Nhưng đôi khi không đáp ứng đủ mục đích nghiên cứu
Ví dụ 6
Các nguồn dữ liệu thứ cấp đáng tin cậy (lấy từ www.rces.info)
Trang 213.2.1 XÁC ĐỊNH DỮ LIỆU VÀ PHƯƠNG PHÁP THU THẬP DỮ LIỆU
Trang 223.2.1 XÁC ĐỊNH DỮ LIỆU VÀ PHƯƠNG PHÁP THU THẬP DỮ LIỆU
Định nghĩa (Dữ liệu sơ cấp)
Dữ liệu sơ cấp: Là nguồn dữ liệu mà người làm nghiên cứu thu thập theo một quy trìnhbài bản tùy theo mục đích nghiên cứu Dữ liệu sơ cấp là dữ liệu chưa qua tổng hợp và xử
lý số liệu Việc thu thập dữ liệu sơ cấp thường tốn nhiều thời gian và tiền bạc, nhưng đápứng đúng mục tiêu nghiên cứu đặt ra
Nghiên cứu thực nghiệm
Nghiên cứu quan sát
Trang 233.2.2 Các kỹ thuật lấy mẫu
⋆ Kỹ thuật lấy mẫu theo xác suất (Probability Sampling)
⋆ Kỹ thuật lấy mẫu phi xác suất (non-probability sampling)
Trang 243.2.2 Các kỹ thuật lấy mẫu
Lấy mẫu ngẫu nhiên hệ thống (Systematic sampling)
⋆ Bước 1: Lập danh sách tổng thể gồm Nphần tử đánh thứ tự ngẫu nhiên
⋆ Bước 2: Tính toán cỡ mẫun sẽ khảo sát Tính khoảng cách giữa các phần tử mẫu:
h = Nn
⋆ Bước 3: Chọn giá trị khởi đầu ngẫu nhiêna∈ [1; h]
⋆ Bước 4: Lập danh sách lấy mẫu theo danh sách tổng thể ban đầu theo thứ tự
{a; a+h; a+2h; ; a+nh} (cho tới khi đạt cỡ mẫun)
Trang 253.2.2 Các kỹ thuật lấy mẫu
Lấy mẫu ngẫu nhiên hệ thống (Systematic sampling)
Lưu ý: Nếu khoảng cách giữa các lần lấy mẫu là h là số thập phân Trong một số trườnghợp ta không thể chọn đủ được cỡ mẫun
Nguyên tắc chọn vòng xoay: nếu a+nk >N ⇒a+nk−N: thứ tự chọn mẫu kế tiếp
Trang 263.2.2 Các kỹ thuật lấy mẫu ==>Lấy mẫu theo khối/cụm (Cluster sampling)
Một tổng thể trên một khu vực rộng, chia thành các nhóm (cụm) nghiên cứu có sẵn chungmột đặc điểm thống kê Việc chọn mẫu từ tổng thể theo quy trình chọn cụm và chọn mẫu theocụm
⋆ Bước 1: Lập danh sách cụm và danh sách trong từng cụm
⋆ Bước 2: Tổng hợp danh sách theo thứ tự cộng dồn theo từng cụm
⋆ Bước 3: Tính toán cỡ cụm (k) và cỡ mẫu cần lấy (n) Tính khoảng cách giữa các cụm:
h = Nk
⋆ Bước 4: Chọn ngẫu nhiên giá trị bắt đầu ( a) với(a∈ [1; h]) Chọn cụm có phần tửđánh dấu cộng dồn tương ứng (a ), và các cụm kế lần lượt chứa{a; a+h; a+2h; }
(cho tới khi đủ số cụm)
⋆ Bước 5: Gọi N′ là số lượng tổng thể của các cụm được chọn
⋆ Bước 6: Số lượng mẫu trong mỗi cụm:ni =nNi
N ′ Lập danh sách lấy mẫu trong từng cụm
Trang 273.2.2 Các kỹ thuật lấy mẫu
Lấy mẫu theo khối/cụm (Cluster sampling)
Hình:
Trang 283.2.2 Các kỹ thuật lấy mẫu
Lấy mẫu theo khối/cụm (Cluster sampling)
Ví dụ 7
Khảo sát về sức khỏe tổng quát của học sinh tiểu học khu vực quận Gò Vấp Trên khu vực có
9000 em, phân bố 10 trường Cần chọn một mẫu gồm 4 trường và 300 em
Trang 293.2.2 Các kỹ thuật lấy mẫu
Lấy mẫu theo khối/cụm (Cluster sampling)
Cụm Số lượng Ni Cộng dồn Tham số Chọn cụm Chọn mẫu
Trang 303.2.3 Xác định quy mô mẫu
1 Mức độ chính xác do chọn mẫu mang lại Mức độ chính xác do việc chọn mẫu mang lại
tỷ lệ thuận với bình phương của quy mô mẫu Khi tăng quy mô mẫu lên k lần thì mức độchính xác sẽ tăng√
Trang 31Một số trường hợp về việc xác định cỡ mẫu cho ước lượng tham số
• Trường hợp 1: Xác định cỡ mẫu theo tính toán cho tham số tuyệt đối
phương sai mẫu khảo sát từmẫu lớn hơn 30
• Trường hợp 2: Xác định cỡ mẫu theo tính tóan cho tham số tương đối
α/2p ( − p )
Trong đó : ( −α)là độ tin cậy, (ε)là độ chính xác,(p) là tỷ lệ phần tử loại A khảosát từ một mẫu có cỡ mẫu lớn hơn 30
Trang 323.2.3 Xác định quy mô mẫu
Ví dụ 8
Quận Gò Vấp tiến hành khảo sát về sức khỏe mắt của sinh viên tiểu học Biết trên một mẫu
đã khảo sát thì tỷ lệ em bị bệnh về mắt là 10Với số liệu như trong bảng, cần khảo sát baonhiêu em để độ chính xác trong việc ước lượng tỷ lệ em bị bệnh về mắt là 3%, với độ tin cậy95% Lập kế hoạch lấy mẫu như tính toán cho từng cụm trong khu vực Chọn 1 cụm và lậpdanh sách lấy mẫu cho cụm đó
Trang 333.2.4 Phân tổ
Định nghĩa (Phân tổ)
Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chiacác đơn vị của hiện tượng nghiên cứu thành các tổ có tính chất khác nhau
Trang 343.2.4 Phân tổ
1 Phân tổ theo thuộc tính
⋆ Ít thuộc tính: Phân tổ theo thuộc tính
⋆ Nhiều thuộc tính: Ghép các thuộc tính cùng kiểu thành thuộc tính chung và phân tổ theothuộc tính chung
2 Phân tổ theo lượng biến
⋆ Ít giá trị: Phân tổ theo các giá trị
⋆ Nhiều giá trị: Phân tổ theo các khoảng giá trị, trị số của chặn trên và chặn dưới khoảnggọi là khoảng cách tổ
Trang 353.2.4 Phân tổ
2 Phân tổ theo lượng biến
- Khoảng cách giữa các tổ đều nhau, khoảng cách tổ tính theo:
Nếu lượng biến liên tục:h= xmax − x min
kNếu lượng biến rời rạc:h = ( max − x min )−( k − 1
Trang 383.2.4 Phân tổ
Phân tổ liên hệ Giữa các tiêu thức mà thống kê nghiên cứu thường có mối quan hệ vớinhau Mối liên hệ này thể hiên sự thay đổi trị số tiêu thức này sẽ dẫn đến sự thay đổi của tiêuthức kia theo một qui luật nhất định
Mức đầu tư Số Mức bình Tăng trọng
thức ăn cơ quân tổ bình quân
(kg/con/ngày) sở (kg/con/ngày) (g/con/ngày)
Trang 403.2.6 Lập bảng cho dữ liệu định lượng
Đại lượng thống kê Tần số Tần suất Tần suất tích lũy
Biểu hiện lượng biến 1 n1 f1= n1
Trang 413.2.7 Lập bảng cho dữ liệu kết hợp hai biến
Thông tin mẫu điều tra
Biến thứ nhất
Tổ (1) . Tổ (m)Tần số Tần suất . Tần số Tần suấtBiến thứ hai
Trang 423.2.7 Lập bảng cho dữ liệu kết hợp hai biến
Ví dụ 10
lượng cấu lượng cấu lượng cấu(Người) (%) (Người) (%) (Người) (%)
Trung học phổ thông 200 20,0 220 19,0 250 19,0
Trang 43Xem bài giảng tại kênh Youtube
Trang 441 BIẾN NGẪU NHIÊN
4 NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN
Trang 451 BIẾN NGẪU NHIÊN
5 TÓM TẮT DỮ LIỆU BẰNG ĐẠI LƯỢNG SỐ
Trang 461 BIẾN NGẪU NHIÊN
6 ƯỚC LƯỢNG THAM SỐ THỐNG KÊ
Trang 471 BIẾN NGẪU NHIÊN
7 KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT THAM SỐ THỐNG KÊ
Trang 481 BIẾN NGẪU NHIÊN
8 DỰ BÁO CHUỖI THỜI GIAN