1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng THỐNG KÊ KINH DOANH VÀ SPSS :: Bài 4

44 1,1K 7
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Kiểm Định Thống Kê
Trường học Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành Thống Kê Kinh Doanh
Thể loại Bài giảng
Năm xuất bản 2025
Thành phố Hà Nội
Định dạng
Số trang 44
Dung lượng 1,34 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Kiểm định t-một mẫuPhương pháp kiểm nghiệp một mẫu được dùng để kiểm định có hay không sự khác biệt của giá trị trung bình của một biến đơn với một giá trị cụ thể, với giả thuyết ban đầu

Trang 1

Bài 4 KIỂM ĐỊNH THỐNG KÊ

1 Kiểm định trung bình

2 Kiểm định phi tham số

3 Kiểm định Khi bình phương

Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại

http://www.mediafire.com/?1j5bcyb3asc8n

Trang 2

1.1 Kiểm định t-một mẫu

Phương pháp kiểm nghiệp một mẫu được dùng để kiểm định có hay không sự khác biệt của giá trị trung bình của một biến đơn với một giá trị cụ thể, với giả thuyết ban đầu cho rằng giá trị trung bình cần kiểm nghiệm thì bằng với một con số cụ thể nào

đó

Phương pháp kiểm nghiệm này dùng cho biến dạng thang đo khoảng cách hay tỉ lệ Ta sẽ loại bỏ giả thuyết ban đầu khi kiểm

nghiệm chó ta chỉ số Sig nhỏ hơn mức tinh cậy (0.05).

Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại

http://www.mediafire.com/?1j5bcyb3asc8n

Trang 3

Compare Mean\One-Sample T Test…

Lựa chọn biến cần so sánh bằng

cách di chuyển vệt đen và

chuyển đến vào hộp thoại Test

Variable(s), nhập giá trị cần so

sánh vào hộp thoại Test Value

Options để xác định độ tin cậy

cho kiểm nghiệm, mặc định là

95% và cách xữ lý đối với các

giá trị khuyết

Exclude cases analysis by analysis

Mỗi kiểm nghiệm T sử dụng toàn bộ

các trường hợp (cases) chứa đựng giá

trị có ý nghĩa đối với biến được kiểm

nghiệm Đặc điểm là kích thước mẫu

luôn thay đổi

Exclude cases listwise Mỗi kiểm

nghiệm T sử dụng chỉ những trường

hợp có giá trị đối với toàn bộ tất cả các

biến được sử dụng trong bất kỳ kiểm

nghiệm T test nào Kích thước mẫu

luôn không đổi

Trang 4

1.2 Kiểm định t hai mẫu độc lập

Kiểm định này dùng cho hai mẫu độc lập, dạng dữ liệu là dạng thang đo khoảng cách hoặc tỷ lệ

Đối với dạng kiểm định này, các chủ thể cần kiểm định phải được ấn định một cách ngẫu nhiên cho hai nhóm dữ liệu cần nghiên cứu sao cho bất kỳ một khác biệt nào từ kết quả nghiên cứu là do sự tác động của chính nhóm thử đó, chứ không phải do các yếu tố khác

Các dữ liệu cần so sánh nằm trong cùng một biến định lượng

Để so sánh ta tiến hành nhóm các giá trị thành hai nhóm để tiến hành so sánh Giả thuyết ban đầu cần kiểm định là giá trị trung bình của một biến nào đó thì bằng nhau giữa hai nhóm

mẫu và chúng ta sẽ từ chối giả thuyết này khi mà chỉ số Sig

nhỏ hơn mức ý nghĩa (thường là 0.05)

Trang 5

Compare means\Independent

sample t-test….

Chuyển biến định lượng cần so

sánh trung bình vào hộp thoại Test

variable(s) Ta có thể chọn nhiều

biến định lượng để so sánh

Định ra các nhóm cần so sánh với

nhau (thường là biến định danh) di

chuyển vào hộp thoại Gouping

Trang 6

Independent sample t-test

Có hai cánh định nhóm so sánh:

 Sử dụng con số cụ thể, nhập hai giá trị đại diện cho hai nhóm

cần so sánh trong biến vào ô group 1 và group 2

Cách thứ hai sử dụng Cut point, nhập giá tri phân cách các giá

trị trong biến thành hai nhóm Toàn bộ các trường hợp có giá trị

(con số mã hóa) nhỏ hơn giá trị được nhập vào trong cut point

sẽ định ra một nhóm, và toàn bộ các trường hợp có giá trị mã hóa

lớn hơn hoặc bằng giá trị trong Cut point sẽ tạo ra một nhóm

khác.

Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là

95% và cách xữ lý đối với các giá trị khuyết

Trang 7

1.3 Kiểm định t theo

từng cặp mẫu

Đây là dạng kiểm định dùng cho hai biến trong cùng một mẫu

có liên hệ với nhau, dữ liệu dạng thang đó khoảng cách hoặc

tỷ lệ Nó tính toán sự khác biệt giữa các giá trị của hai biến cho mỗi trường hợp và kiểm định xem giá trị trung bình các khác biệt có khác 0 hay không Giả thuyết ban đầu được đưa

ra là giá trị trung bình của các khác biệt là bằng 0 Và ta sẽ loại bỏ giả thuyết này trong trường hợp kiểm định cho kết quả

Sig nhỏ hơn mức ý nghĩa (0.05)

Điều kiện yêu cầu cho loại kiểm định này là kích cở hai mẫu

so sánh phải bằng nhau Các quan sát cho mỗi bên so sánh phải được thực hiện trong cùng những điều kiện giống nhau Các khác biệt từ giá trị trung bình của hai mẫu phải là phân phối chuẩn hoặc số lượng mẫu đủ lớn để xấp xỉ là phân phối chuẩn

Trang 8

Bài toán tổng quát

Bài toán tổng quát như sau: Giả sử có hai tổng thể chung: Tổng thể

chung thứ nhất có các lượng biến của tiêu thức X1 phân phối theo quy luật chuẩn N (1, ) và tổng thể chung thứ hai có các lượng biến của tiêu thức X2 phân phối theo quy luật chuẩn N (2, ) Muốn so sánh sự khác nhau giữa 1 và 2 ta xét độ lệch trung bình d Ta chưa biết d nhưng nếu có cơ sở để giả thiết rằng giá trị của nó bằng 0 , ta đua ra giả thiết thống kê H0 : d = 0

Để kiểm định giả thiết trên, từ hai tổng thể chung người ta rút ra hai mẫu phụ thuộc được hình thành bởi các cặp n quan sát độc lập của hai mẫu, từ đó tính là trung bình của các độ lệch giữa các cặp giá trị của hai mẫu di Như vậy ta đưa bài toán so sánh về bài toán kiểm định giả thiết về giá trị trung bình đã xét ở phần I Tuy nhiên ở đây thường không biết phương sai của các độ lệch của tổng thể chung nên thay bằng phương sai của các độ lệch của tổng thể mẫu , và dùng tiêu chuẩn kiểm định t :  

d

S

n d

t    0

Trang 9

Nhận xét

Phương pháp so sánh từng cặp như trên có ưu điểm hơn phương pháp

so sánh hai mẫu độc lập ở chỗ:

- Nó không cần giả thiết gì về phương sai của hai tổng thể chung

- Nó thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố ngoại lai ảnh hưởng đến giá trị trung bình Tuy nhiên nhược điểm của

nó là việc bố trí thí nghiệm (điều tra) phức tạp hơn, chẳng hạn trong

ví dụ trên phương pháp so sánh từng cặp đòi hỏi phải trồng lúa thí nghiệm trên hai mảnh của cùng một thửa ruộng với hai loại giống khác nhau

Trang 10

Compare

means\Paired-samples t-test

Chọn hai biến ta cần so sánh di

chuyển vào hộp thoại Paired

Variables bằng nút mũi tên

Paired-samples t test còn cho

ta kết quả về mối tương quan

giữa hai biến đang quan sát Cho

biết liệu hai biến này có tương

quan với nhau hay không, độ

tương quan và chiều tương quan

(thể hiện ở bảng Paired

samples correlation).

Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại

http://www.mediafire.com/?1j5bcyb3asc8n

Trang 11

1.4 Phân tích phương sai một

chiều (One way ANOVA)

Phương pháp kiểm định sẽ mở rộng cho trường hợp so sánh trung bình của nhiều tổng thể được xây dựng trên việc xem xét các biến thiên (phương sai) của các giá trị quan sát trong nội bộ từng nhóm (mẫu) và giữa các nhóm (mẫu) với nhau Ở đây đề cập đến phân tích phương sai một yếu tố là trường hợp chỉ có một yếu tố (biến kiểm soát) được xem xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác Yếu tố được xem xét ảnh hưởng được dùng

để phân loại các quan sát thành các nhóm nhỏ khác nhau.

Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại

http://www.mediafire.com/?1j5bcyb3asc8n

Trang 12

Bài toán tổng quát

Giả sử ta có k tổng thể chung X1, X2, ., Xk có phân phối chuẩn, trong đó Xi ~ N( i , ) Các giá trị trung bình i chưa biết song có cơ

sở giả thiết rằng là chúng bằng nhau, ta có giả thiết cần kiểm định là H0: 1 = 2 = = k

Trong thống kê vấn đề trên thường được xem xét dưới góc độ sau đây: Giả sử chúng ta quan tâm tới một nhân tố X nào đó Nhân tố

X có thể xem xét ở k mức độ khác nhau Ký hiệu Xi là hiệu quả của việc tác động của nhân tố X ở mức i Như vậy i là hiệu quả trung bình của nhân tố X ở mức i Chúng ta muốn biết khi cho nhân tố X thay đổi ở các mức khác nhau thì điều đó có ảnh hương hay không tới hiệu quả trung bình Chẳng hạn, chúng ta muốn nghiên cứu ảnh hưởng của giống tới năng suất cây trồng Nhân tố ở đây là giống, các loại giống khác nhau là các mức của nhân tố Hiệu quả của giống lên năng suất cây trồng được đo bằng sản lượng của cây trồng Như vậy

Xi chính là sản lượng của giống i và i là sản lượng trung bình của giống i

Trang 13

Trình bày số liệu tổng quát

k 1 j j

n n

k 1 j j

T T

Trang 14

i i

n

x n

T x

T n

T x

k 1 j

n

1 i ij k

1 j

Trang 15

Các bước kiểm định

Bước 2: Tính các tổng bình phương độ lệch.

+ Tổng bình phương chung, ký hiệu là SST (Total Sum of Squares):

+ Tổng bình phương do ảnh hưởng của nhân tố, ký hiệu là SSF

(Sum of Squares for Factor):

+ Tổng bình phương do sai số, ký hiệu là SSE (Sum of Squares for Error):

Từ các công thức trên, ta thấy:

ij 2

i j

ij

n

T x

x x

SST

 

n

Tn

Tn

.xx

SSF

2 k

1

j j

2 j j

2 k

1 j

ij 2

T x

x x

SSE

Trang 16

Các bước kiểm định

Bước 3: Tính các phương sai tương ứng.

+ Phương sai do ảnh hưởng của nhân tố (hay phương sai giữa các mẫu), ký hiệu là MSF (Mean Square for Factor):

trong đó (k - 1) được gọi là bậc tự do của nhân tố

+ Phương sai do sai số (hay phương sai trong các mẫu), ký hiệu là MSE (Mean Square for Error):

trong đó (n - k) được gọi là bậc tự do của sai số

1 k

SSF MSF

k n

SSE MSE

Trang 17

Các bước kiểm định

Bước 4: Kiểm định giả thiết.

Giả thiết H0: 1 = 2 = = k H1: Tồn tại ít nhất 1 cặp j  j với j  j’ Các kết quả nói trên được trình bày trong bảng sau đây và được gọi là bảng ANOVA (Analysis of Variance : Phân tích phương sai)

Người ta chứng minh được rằng nếu giả thiết H0 đúng thì tỷ số

sẽ có phân phối Fisher với bậc tự do là (k - 1, n - k) Giả thiết H0

sẽ bị bác bỏ ở mức ý nghĩa , nếu F > F, (k-1),( n-k)

Trang 18

Comapre

means\One-Way ANOVA

Chuyển các biến định lượng cần so

sánh sang hộp thoại Dependent List

Lựa biến kiểm soát tức là biến độc lập

(yêu cầu phải có ba giá trị trở lên trong

biến kiểm soát này) chuyển biến kiểm

soát vào hộp thoại Factor, Biến kiểm

soát này cho phép ta phân các giá trị

trung bình theo từng nhóm để kiểm

định Thao tác đến đây cho phép ta đưa

ra kết luận liệu các trung bình của các

nhóm có bằng nhau hay không

Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại

http://www.mediafire.com/?1j5bcyb3asc8n

Trang 19

Để tiến hành kiểm định so sánh sự khác biệt giữa các nhóm với

nhau ta lựa chọn công cụ Post Hoc và lựa chọn các phương pháp

kiểm định thích hợp

Đối với trường hợp giả thuyết về sự cân bằng phương sai giữa các mẫu không được chấp nhận ta sẽ sử dụng các phương pháp kiểm định sau để

tiến hành so sánh giá trị trung bình giữa các nhóm:Tamhane’s T2,

Dunnett’s T3, Games-Howell, Dunnett’s C

Trang 20

phương pháp kiểm định thống kê

so sánh các trung bình mẫu

The least significant difference (LSD) là phép kiểm định

tương đương với việc sử dụng phương pháp kiểm định t riêng biệt cho toàn bộ các cặp trong biến Yếu điểm của phương pháp này là

nó không chỉnh lý độ tin cậy cho tương thich với việc kiểm định cho nhiều so sánh cùng một lúc Do đó dẫn đến độ tin cậy không cao

Phương pháp kiểm định Bonferroni và Tukey’s honestly

significant difference thì được sử dụng cho hầu hết các kiểm

định so sánh đa bội Kiểm định Sidak’s t test cũng được sử dụng tương tư như phương pháp Bonferroni tuy nhiên nó cung cấp

những giới hạn chặt chẻ hơn Khi tiến hành kiểm định một số

lượng lớn các cặp trung bình Tukey’s honestly significant

difference test sẽ có tác động mạnh hơn là Bonferroni test Và

ngược lại Bonferroni thì thích hợp hơn cho các kiểm định có số

lượng cặp so sánh ít.

Trang 21

phương pháp kiểm định thống kê

so sánh các trung bình mẫu

Hochberg’s GT2 thì giống như Tukey’s honestly significant difference test nhưng thông thường Tukey’s test có tác dụng

tốt hơn Gabriel’s pairwise comparisons test thì giống như

Hochberg’s GT2 nhưng nó thường được sử dụng hơn khi kích cở

giữa các mẫu kiểm định có sự sai biệt lớn

Phương pháp kiểm định Dunnett’s pairwise được dùng để so

sánh các giá trị trung bình của các mẫu với một gía trị trung bình

cụ thể được lấy từ trong tập các mẫu so sánh

Trang 22

phương pháp kiểm định thống kê

so sánh các trung bình mẫu

Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa ra hai

bước kiểm định Đầu tiên tiến hành kiểm định có hay không toàn

bộ các giá trị trung bình là ngang bằng nhau hay không Nếu toàn

bộ các giá trị trung bình là không ngang bằng nhau sau đó bước thứ hai sẽ kiểm định sự khác biệt giữa các nhóm nhỏ với nhau, để tìm ra những nhóm nào thật sự khác biệt và không khác biệt về giá trị trung bình Tuy nhiên việc kiểm định này không nên thực hiện đối với trường hợp kích cở mẫu trong các nhóm không ngang bằng nhau

 Thông thường khi kích thước mẫu không ngang bằng giữa các

nhóm Bonferroni và Scheffé là hai phương pháp kiểm định được lựa chọn hơn là phương pháp Tukey

Trang 23

phương pháp kiểm định thống kê

so sánh các trung bình mẫu

Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b cũng tương tự tuy nhiên nó ít khi được

sử dụng như các phương pháp trên

Kiểm định Waller-Duncan t được sử dụng khi kích thước mẫu

là không bằng nhau

Phương pháp kiểm định Scheffé cho phép sự kết hợp tuyến

tính của những giá trị trung bình sẽ được kiểm định, không chỉ là

so sánh giữa các cặp Chính vì vậy kết quả của kiểm định

Scheffé thì thường thận trọng hơn các phương pháp kiểm định

khác, nó đòi hỏi một sự khác biệt lớn giữa các giá trị trung bình quan sát được để bảo đảm tính thật sự khác biệt của phép kiểm định

Trang 24

One-Way ANOVA: Option

công cụ Options để xác định loại loại thông kê

mô tả (Descriptive) và tính đồng nhất của

phương sai, công cụ để tính hệ số thống kê

Levene để kiểm định sự ngang bằng về phương

sai giữa các nhóm (việc tính toán này quyết

định đến sự lưa chon phương pháp kiểm định

trong phần Post Hoc

Công cụ Means Plot dùng để hiển thị đồ thị về giá tri trung bình của các nhóm Công cụ Missing Values dùng để kiểm soát giá trị khuyết.

Exclude cases analysis by analysis: Những trường hợp có giá trị

khuyết ở trong biến phụ thuộc và cả biến kiểm soát sẽ không được đưa vào trong kiểm định Ngoài ra những trường hợp có giá trị quan sát nằm bên ngoài chuổi đã xác định cho biến kiểm soát cũng không được sử

dụng

Exclude cases listwise Những trường hợp có giá trị khuyết Cases trong

biến điều khiển hoặc bất kỳ biến phụ thuộc nào được đưa ra hoặc không đưa

ra kiểm định đều bị loại trừ ra khỏi quá trình kiểm định phân tích

Trang 25

2 Kiểm định phi tham số

Các tiêu chuẩn thống kê để kiểm định sự khác nhau giữa hai trung bình của hai tổng thể chung được trình bày ở trên gọi là kiểm định có tham số Khi tiến hành các kiểm định này thường phải dựa trên giả thiết quan trọng là tổng thể chung đang xét có phân phối chuẩn và hoặc kích thước mẫu khá lớn Nếu một trong các điều kiện trên bị vi phạm thì các tiêu chuẩn đó không thể thực hiện được Trong tình huống như vậy ta phải sử dụng các tiêu chuẩn phi tham số Tiêu chuẩn này không đòi hỏi phải có các giả thiết về các dạng phân phối của tổng thể chung và dùng trong các phương pháp kiểm định tự do

(đối với dạng phân phối), đó là các phương pháp kiểm định phi

tham số.

Trang 26

Kiểm định 2 mẫu độc lập

(Mann-Whitney U)

Kiểm định Mann - Whitney được sử dụng khi chỉ có hai tổng thể nghiên

cứu Kiểm định này cho phép ta xác định xem có phải các mẫu độc lập

được lấy ra từ cùng một tổng thể chung hoặc từ các tổng thể khác nhau nhưng có chung một phân phối hay không

Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại

http://www.mediafire.com/?1j5bcyb3asc8n

Ngày đăng: 03/12/2013, 12:11

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w