1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Thống kê cho khoa học xã hội: Bài 3 - ThS. Nguyễn Thị Xuân Mai

31 61 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 1,08 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giảng Thống kê cho khoa học xã hội - Bài 3: Ước lượng và kiểm định giả thuyết thống kê thông tin đến các bạn những kiến thức về điều tra chọn mẫu; ước lượng số trung bình và tỷ lệ từ kết quả điều tra chọn mẫu; kiểm định giả thuyết thống kê.

Trang 1

GIỚI THIỆU MÔN HỌC

THỐNG KÊ CHO KHOA HỌC XÃ HỘI

Giảng viên: ThS Nguyễn Thị Xuân Mai

Trang 2

BÀI 3 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH

GIẢ THUYẾT THỐNG KÊ

Giảng viên: ThS Nguyễn Thị Xuân Mai

Trang 3

MỤC TIÊU BÀI HỌC

• Trình bày một số vấn đề cơ bản về điều tra chọn mẫu

• Trình bày các yếu tố của ước lượng

• Trình bày phương pháp ước lượng số trung bình của

tổng thể chung

• Trình bày phương pháp ước lượng tỷ lệ của tổng

thể chung

• Trình bày công thức xác định cỡ mẫu cần điều tra

• Giới thiệu một số vấn đề về kiểm định giả thuyết thống kê và các khái niệm cóliên quan

• Trình bày phương pháp kiểm định giả thuyết thống kê về giá trị trung bình của mộttổng thể chung

• Trình bày phương pháp kiểm định giả thuyết thống kê về tỷ lệ của một tổngthể chung

Trang 4

CÁC KIẾN THỨC CẦN CÓ

Kiến thức chung về kinh tế - xã hội

Trang 5

• Đọc tài liệu tham khảo.

• Thảo luận với giáo viên và các sinh viên khác vềnhững vấn đề chưa hiểu rõ

• Trả lời các câu hỏi của bài học

• Đọc và tìm hiểu thêm về điều tra thống kê, điều trachọn mẫu và phương pháp thống kê suy luận

HƯỚNG DẪN HỌC

Trang 6

CẤU TRÚC NỘI DUNG

Ước lượng số trung bình và tỷ lệ từ kết quả điều trachọn mẫu

Trang 7

3.1 ĐIỀU TRA CHỌN MẪU

3.1.1 Khái niệm điều tra

Trang 8

3.1.1 KHÁI NIỆM ĐIỀU TRA CHỌN MẪU

• Điều tra chọn mẫu là một loại điều tra không toàn bộ trong đó người ta chỉ chọn ramột số đơn vị thuộc đối tượng nghiên cứu để tiến hành điều tra thực tế Các đơn vịnày được chọn theo những quy tắc nhất định để đảm bảo tính đại biểu Kết quả củađiều tra chọn mẫu được dùng để suy rộng cho tổng thể chung

• Các khái niệm liên quan:

Chọn mẫu ngẫu nhiên: Là phương pháp tổ chức chọn mẫu một cách hoàn toàn

ngẫu nhiên không qua một sự sắp xếp nào Ví dụ: bốc thăm, quay số hoặc chọntheo bảng số ngẫu nhiên hay chọn bất kỳ

Có nhiều phương pháp chọn mẫu ngẫu nhiên: chọn ngẫu nhiên giản đơn, chọnmẫu hệ thống, chọn mẫu chùm, chọn mẫu phân tầng, chọn mẫu phân tổ

Chọn mẫu phi ngẫu nhiên: là phương pháp chọn đơn vị điều tra phụ thuộc vào

ý muốn chủ quan của người chọn, dựa trên những thông tin đã biết về tổng thể

Ví dụ: chọn đơn vị trung bình, chọn chuyên gia

i

X N

Trang 9

3.1.1 KHÁI NIỆM ĐIỀU TRA CHỌN MẪU

• Tổng thể chung là một tập hợp bao gồm toàn bộ các đối tượng nghiên cứu

→ Xác định đúng tổng thể nghiên cứu rất quan trọng Việc xác định sai sẽ dẫn đếnkết quả tính toán trên mẫu bị chệch và dẫn đến sai số phi chọn mẫu

• Tổng thể mẫu (còn gọi là mẫu) là một tập hợp con được rút ra từ tổng thể nghiên cứu

→ Điều tra chọn mẫu là thu thập thông tin từ các đơn vị trong mẫu

• Suy rộng (ước lượng) từ các tham số (mức độ) tính toán được trên các đơn vị điềutra (TTM) suy ra các tham số tương ứng của toàn bộ hiện tượng (TTC)

Trang 10

3.1.2 ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU

Ưu điểm:

 Tiết kiệm hơn về mặt thời gian và chi phí so với điều tra toàn bộ

 Do điều tra ít đơn vị nên có thể mở rộng nội dung điều tra đi sâu nghiên cứu chitiết nhiều mặt của hiện tượng

 Tài liệu thu được trong điều tra chọn mẫu có độ chính xác cao hơn do giảm đượcsai số phi chọn mẫu

 Tiến hành nhanh gọn, bảo đảm tính kịp thời của số liệu thống kê Mặt khác, điềutra chọn mẫu không đòi hỏi phải có tổ chức lớn, chỉ cần một cơ quan hoặc mộtnhóm người cũng có thể tiến hành điều tra được

Trang 11

3.1.2 ƯU NHƯỢC ĐIỂM CỦA ĐIỀU TRA CHỌN MẪU

• Trường hợp vận dụng điều tra chọn mẫu:

 Sử dụng để thay thế cho điều tra toàn bộ trong trường hợp đối tượng nghiên cứucho phép vừa có thể điều tra toàn bộ vừa có thể điều tra chọn mẫu hoặc vớinhững trường hợp không cho phép điều tra toàn bộ, hoặc do quy mô điều tratoàn bộ quá lớn, cần thu thập nhiều chỉ tiêu nhưng không đủ kinh phí và nhân lực

để tiến hành điều tra toàn bộ

 Kết hợp với điều tra toàn bộ để mở rộng nội dung điều tra và đánh giá kết quảcủa điều tra toàn bộ

 Sử dụng để tổng hợp nhanh tài liệu của điều tra toàn bộ phục vụ kịp thời yêu cầuthông tin cho các đối tượng sử dụng

 Sử dụng trong trường hợp muốn so sánh các hiện tượng với nhau hoặc muốnđưa ra một nhận định nào đó mà chưa có tài liệu cụ thể (để kiểm tra giả thuyếtthống kê)

Trang 12

3.1.3 SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU

Sai số trong điều tra thống kê là chênh lệch giữa giá trị thu được qua điều tra và

giá trị thực tế của nó

→ là vấn đề không thể tránh khỏi trong các cuộc điều tra

→ gây ảnh hưởng đến độ tin cậy của kết quả điều tra

• Có hai loại sai số trong điều tra thống kê:

Sai số phi chọn mẫu, xảy ra ở tất cả các cuộc điều tra Nguyên nhân: xác định

sai mục đích, xác định đối tượng điều tra không phù hợp, đơn vị điều tra khôngtrả lời hoặc trả lời sai, lỗi trong bảng hỏi, điều tra viên…

→ Nếu sai số là ngẫu nhiên thì khi điều tra một số lớn đơn vị, các sai số sẽ bù trừcho nhau Nếu sai số có hệ thống thì càng điều tra nhiều đơn vị, sai số càng lớn

Sai số chọn mẫu, chỉ xảy ra trong điều tra chọn mẫu Đó là sự khác biệt giữa giá

trị ước lượng của mẫu và giá trị của tổng thể chung Sai số chọn mẫu còn gọi là sai

số do tính đại biểu, xảy ra do mẫu điều tra không đại diện cho tổng thể chung

→ Do sai số phi chọn mẫu không tính được nên phần dưới đây chỉ đề cập tới sai

số chọn mẫu

Trang 13

3.1.3 SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU

• Các nhân tố tác động đến sai số chọn mẫu, gồm có:

 Số đơn vị tổng thể mẫu n: Khi số đơn vị điều tra tăng lên, tổng thể mẫu sẽ gầnvới tổng thể chung, sai số chọn mẫu sẽ giảm

 Phương pháp tổ chức chọn mẫu: Các phương pháp chọn mẫu khác nhau, tính đạidiện của mẫu chọn ra khác nhau sẽ dẫn đến những sai số chọn mẫu khác nhau

 Độ đồng đều của tổng thể chung: nếu tổng thể có độ đồng đều cao tức phươngsai tổng thể 2 tương đối nhỏ thì sai số chọn mẫu sẽ nhỏ

• Sai số chọn mẫu không phải là một trị số cố định Với cùng một hiện tượng nhưngnếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổngthể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau

• Giá trị của sai số chọn mẫu ảnh hưởng rất nhiều đến ước lượng khoảng tin cậy củacác tham số

Trang 14

3.2 ƯỚC LƯỢNG SỐ TRUNG BÌNH VÀ TỶ LỆ TỪ KẾT QUẢ ĐIỀU TRA CHỌN MẪU

Trang 15

3.2.1 CÁC YẾU TỐ CỦA ƯỚC LƯỢNG

Ước lượng khoảng tin cậy là xác định một khoảng giá trị mà tham số của tổng thể

chung rơi vào đó với xác suất nhất định

• Khoảng giá trị này gọi là khoảng tin cậy, được xác định bởi hai giới hạn: giới hạn tincậy dưới và giới hạn tin cậy trên

• Độ tin cậy là xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy

đó, được ký hiệu là (1-α) %, chẳng hạn 90%, 95%, 99%

→ α chính là xác suất để tham số của tổng thể chung không rơi vào trong khoảngtin cậy

Giới hạn tin cậy dưới Giới hạn tin cậy trên

Trang 16

• Trường hợp đã biết phương sai của tổng thể chung (2)

 Điều kiện: tổng thể chung phân phối chuẩn Trong trường hợp không phân phốichuẩn, phải sử dụng mẫu lớn

 Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là:

Trong đó: là sai số chọn mẫu (sampling error) khi ước lượng số trung bình củatổng thể chung

3.2.2 ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG

• Trường hợp chưa biết phương sai của tổng thể chung (2)

 Điều kiện: áp dụng khi tổng thể chung phân bố chuẩn và sử dụng phân

vị Student

 Khoảng tin cậy ước lượng cho số trung bình của tổng thể chung là:

Trong đó: là sai số chọn mẫu khi ước lượng số trung bình của tổng thể chung

x

x       

st

Trang 17

3.2.2 ƯỚC LƯỢNG SỐ TRUNG BÌNH CỦA TỔNG THỂ CHUNG

Ví dụ: Một mẫu gồm 20 nhân viên được tiến hành điều tra nhằm thu thập thông tin liên

quan đến một chương trình đào tạo Người ta tính được thời gian trung bình để hoàn tấtchương trình của 20 nhân viên này là 51,5 ngày với độ lệch tiêu chuẩn là 6,84 ngày.Hãy ước lượng thời gian trung bình để hoàn tất chương trình với độ tin cậy 95%

• Do chưa biết phương sai của tổng thể chung nên sẽ dùng phương sai của tổng thểmẫu để ước lượng

• Tra bảng t-Student với mức ý nghĩa 0,05 và 19 bậc tự do, t0,025;19 = 2,093

• Công thức ước lượng:

• Kết luận: Với mẫu đã cho, khoảng tin cậy 95% cho thời gian trung bình để hoàn tấtchương trình là:

Trang 18

3.2.3 ƯỚC LƯỢNG TỶ LỆ CỦA TỔNG THỂ CHUNG

• Theo tiêu thức nghiên cứu, tổng thể chỉ có 2 loại biểu hiện Khi đó tổng thể chung cóphân phối nhị thức Phân phối xấp xỉ chuẩn được sử dụng

• Với mẫu đủ lớn (n.p  5 và n(1-p)  5), công thức ước lượng khoảng tin cậy cho tỷ lệcủa tổng thể chung như sau:

Trong đó:

 f là sai số chọn mẫu khi ước lượng tỷ lệ của tổng thể chung

 z/2 là giá trị tới hạn của phân phối chuẩn

Trang 19

3.2.4 XÁC ĐỊNH CỠ MẪU ĐIỀU TRA

Cơ sở xác định cỡ mẫu:

• Sai số chọn mẫu là nhỏ nhất

• Chi phí điều tra là thấp nhất

→ Đây là hai yêu cầu đối lập nhau

→ Khi xác định cỡ mẫu thường dựa vào độ chính xác trong ước lượng

• Cỡ mẫu được xác định khi ước lượng số trung bình là:

Ví dụ: Cỡ mẫu là bao nhiêu để khoảng tin cậy 90% khi ước lượng số trung bình nằmtrong phạm vi  5 Một nghiên cứu đã cho rằng độ lệch chuẩn là 45

Cỡ mẫu được xác định khi ước lượng tỷ lệ là:

Lưu ý: Cỡ mẫu luôn làm tròn lên.

2 2 /2 2

Trang 20

3.2.4 XÁC ĐỊNH CỠ MẪU ĐIỀU TRA

Để xác định cỡ mẫu, cần phải biết 3 yếu tố:

• Độ tin cậy mong muốn, được xác định bằng giá trị z/2

• Sai số chọn mẫu có thể chấp nhận được, 

• Độ lệch tiêu chuẩn của tổng thể, , là yếu tố thường không biết trong đa phần cáctrường hợp Có một số cách để xác định giá trị  này như sau:

 Lấy phương sai lớn nhất trong các lần điều tra trước (nếu có)

 Lấy phương sai của các hiện tượng khác tương tự (nếu có)

 Điều tra thí điểm để tính phương sai

 Có thể ước lượng độ lệch tiêu chuẩn qua khoảng biến thiên tùy theo phân phốicủa tổng thể Cụ thể, nếu tổng thể có phân phối chuẩn thì:

Trang 21

3.3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

3.3.1 Một số vấn đềchung về kiểm định giả

thuyết thống kê

3.3.2 Kiểm định giảthuyết về giá trị trungbình của tổng thể chung

3.3.3 Kiểm định giả thuyết về tỷ lệ của tổng

thể chung

Trang 22

3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

• Giả thuyết thống kê là giả thuyết về một vấn đề nào đó của tổng thể chung

Cặp giả thuyết thống kê gồm:

 Giả thuyết không (H0) là giả thuyết mà ta muốn kiểm định

 Giả thuyết đối (H1) là giả thuyết đối lập với H0

• Kiểm định thống kê là tìm ra kết luận về việc thừa nhận hay bác bỏ giả thuyết đó dựavào thông tin thực nghiệm của mẫu

Các loại kiểm định:

 Kiểm định hai phía;

 Kiểm định phía trái;

 Kiểm định phía phải

Trang 23

3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Kiểm định 2 phía là bác bỏ giả thuyết H0

khi tham số đặc trưng của mẫu cao hơnhoặc thấp hơn so với giá trị của giả thuyết

về tổng thể chung Kiểm định 2 phía có 2miền bác bỏ

Kiểm định phía trái là bác bỏ giả thuyết

H0 khi tham số đặc trưng của mẫu nhỏ hơnmột cách đáng kể so với giá trị của giảthuyết H0 Miền bác bỏ nằm ở phía trái củađường phân phối

Kiểm định phía phải là bác bỏ giả thuyết

H0 khi tham số đặc trưng của mẫu lớn hơnmột cách đáng kể so với giá trị của giảthuyết H0 Miền bác bỏ nằm ở phía phảicủa đường phân phối

Trang 24

3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo)

• Sai lầm và mức ý nghĩa trong kiểm định

Khi phải lựa chọn giữa hai giả thuyết H0 và H1, có thể mắc phải:

 Sai lầm loại 1 là bác bỏ giả thuyết H0 khi nó đúng

 Sai lầm loại 2 là thừa nhận H0 khi nó sai

 Xác suất mắc sai lầm loại 1 gọi là mức ý nghĩa, được ký hiệu là 

 Xác suất mắc sai lầm loại 2 gọi là β; 1- β được gọi là lực của kiểm định

• Tiêu chuẩn kiểm định

Tiêu chuẩn kiểm định là một thống kê nào đó tuân theo quy luật phân phối xác suấtxác định (quy luật phân phối chuẩn, phân phối T-Student, phân phối 2, phân phốiFisher ) khi giả thuyết không đúng

 Trong tập hợp các kiểm định thống kê có cùng mức ý nghĩa , kiểm định nào có

Kết luận

H0 đúng Kết luận đúng Sai lầm loại 1

H0 sai Sai lầm loại 2 Kết luận đúng

Trang 25

3.3.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (tiếp theo)

• Các bước tiến hành một kiểm định giả thiết thống kế

 Phát biểu giả thuyết H0 và giả thuyết đối H1

 Định rõ mức ý nghĩa 

 Chọn tiêu chuẩn kiểm định

 Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát

Trang 26

• Giả sử lượng biến của tiêu thức X trong tổng thể chung phân phối theo quy luậtchuẩn với trung bình là  và phương sai là 2 Ký hiệu: N(, 2) Ta chưa biết ,nhưng nếu có cơ sở để cho rằng nó bằng 0 Vậy giả thuyết thống kê H0:  = 0

• Để kiểm định giả thuyết này, từ tổng thể ta tiến hành điều tra chọn mẫu ngẫu nhiên nđơn vị và tính được trung bình mẫu là

• Phương sai của tổng thể chung σ2 đã biết

 Tiêu chuẩn kiểm định là thống kê z:

 H0 đúng, z phân phối theo quy luật chuẩn hóa N(0,1)

3.3.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG

Kiểm định phía phải: H0:  = 0

H1:  > 0 Nếu z > Z, bác bỏ giả thuyết H0.

Kiểm định phía trái: H0:  = 0

H1:  < 0 Nếu z < -Z, bác bỏ giả thuyết H0.

Kiểm định hai phía: H0:  = 0

H1:  ≠ 0 Nếu |z| > Z/2, bác bỏ giả thuyết H0.

n

x z

x t

Trang 27

3.3.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG

• Phương sai của tổng thể σ2 chưa biết

 Tiêu chuẩn kiểm định là thống kê t:

 H0 đúng, t sẽ phân phối theo quy luật Student với (n - 1) bậc tự do

Kiểm định phía phải: H0:  = 0

H1:  > 0 Nếu t > t,(n-1), bác bỏ giả thuyết H0.

Kiểm định phía trái: H0:  = 0

H1:  < 0 Nếu t < -t,(n-1), bác bỏ giả thuyết H0.

Kiểm định hai phía: H0:  = 0

H1:  ≠ 0 Nếu |t| > t/2,(n-1), bác bỏ giả thuyết H0.

Lưu ý: trong thực tế, với quy mô mẫu lớn (n ≥30), thống kê t phân phối xấp xỉ chuẩn, nên cũng có thể so sánh tiêu chuẩn kiểm định với giá trị Z.

Trang 28

3.3.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ CHUNG

Ví dụ: Theo công bố của một nghiên cứu về chi tiêu hộ gia đình ở thành thị, năm 2012,

trung bình mỗi hộ đã phải trả 1123 nghìn đồng một tháng cho tiêu dùng năng lượng

Để kiểm tra thông tin này, người ta chọn 15 hộ gia đình và tính được chi tiêu dùngnăng lượng trung bình mỗi hộ là 1344,27 nghìn đồng một tháng với độ lệch tiêu chuẩn

là 231 nghìn đồng Ở mức ý nghĩa 5%, liệu kết luận của nghiên cứu có thấp hơn thực

tế hay không?

• Gọi  là mức chi cho tiêu dùng năng lượng trung bình của mỗi hộ một tháng

• Ta cần kiểm định giả thuyết:

H0:  = 1123

H1:  > 1123

• Do chưa biết phương sai của tổng thể chung nên tiêu chuẩn kiểm định là thống kê t

• Tra bảng phân phối Student với 14 bậc tự do ta tìm được t0,05;14 = 1,761

• Kết luận: vì t > t,(n-1) do đó với mẫu đã nghiên cứu, bác bỏ H0 Các hộ gia đình chitiêu dùng năng lượng nhiều hơn mức công bố của nghiên cứu

Trang 29

3.3.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ CỦA TỔNG THỂ CHUNG

• Giả sử ở tổng thể chung, tỷ lệ theo một tiêu thức A nào đó là p Nếu p chưa biết,song có cơ sở cho rằng giá trị của nó bằng p0, ta đưa ra giả thuyết: H0: p = p0

• Để kiểm định giả thuyết đó, lấy mẫu ngẫu nhiên kích thước n và thấy có nA đơn vị

có biểu hiện nghiên cứu của tiêu thức A Như vậy ta có tỷ lệ mẫu: f = nA/n

• Với n đủ lớn (n.p0 ≥ 5 và n(1 – p0) ≥ 5), tiêu chuẩn kiểm định là thống kê Z:

• H0 đúng, thì z phân phối theo quy luật chuẩn hóa N(0,1)

Kiểm định phía phải: H0: p = p0

H1: p > p0 Nếu z > Z, bác bỏ giả thuyết H0.

Kiểm định phía trái: H0: p = p0

H1: p < p0 Nếu z < -Z, bác bỏ giả thuyết H0.

Kiểm định hai phía: H0: p = p0

H1: p ≠ p0 Nếu |z| > Z/2, bác bỏ giả thuyết H0.

n

p p

p f z

)1

Trang 30

3.3.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ CỦA TỔNG THỂ CHUNG

Ví dụ: Trong một nghiên cứu của công ty AZ, người ta thực hiện phỏng vấn 758 khách

du lịch đến HL có sử dụng tour du lịch biển xem liệu họ có hài lòng hay không 394người trong số được hỏi đã trả lời là có Với mức ý nghĩa 5%, hãy kiểm định xem liệu cóđúng là đa số (>50%) những người đến HL có sử dụng tour du lịch biển là hài lòng vớitour này hay không?

• Gọi p là tỷ lệ khách du lịch đến HL có sử dụng tour du lịch biển và hài lòng vớitour này

• Giả thuyết cần kiểm định là:

Ngày đăng: 17/12/2020, 09:59

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w