Kiểm định t-một mẫuPhương pháp kiểm nghiệp một mẫu được dùng để kiểm định có hay không sự khác biệt của giá trị trung bình của một biến đơn với một giá trị cụ thể, với giả thuyết ban đầu
Trang 1Bài 4 KIỂM ĐỊNH THỐNG KÊ
1 Kiểm định trung bình
2 Kiểm định phi tham số
3 Kiểm định Khi bình phương
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
http://www.mediafire.com/?1j5bcyb3asc8n
Trang 21.1 Kiểm định t-một mẫu
Phương pháp kiểm nghiệp một mẫu được dùng để kiểm định có hay không sự khác biệt của giá trị trung bình của một biến đơn với một giá trị cụ thể, với giả thuyết ban đầu cho rằng giá trị trung bình cần kiểm nghiệm thì bằng với một con số cụ thể nào
đó
Phương pháp kiểm nghiệm này dùng cho biến dạng thang đo khoảng cách hay tỉ lệ Ta sẽ loại bỏ giả thuyết ban đầu khi kiểm
nghiệm chó ta chỉ số Sig nhỏ hơn mức tinh cậy (0.05).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
http://www.mediafire.com/?1j5bcyb3asc8n
Trang 3Compare Mean\One-Sample T Test…
Lựa chọn biến cần so sánh bằng
cách di chuyển vệt đen và
chuyển đến vào hộp thoại Test
Variable(s), nhập giá trị cần so
sánh vào hộp thoại Test Value
Options để xác định độ tin cậy
cho kiểm nghiệm, mặc định là
95% và cách xữ lý đối với các
giá trị khuyết
Exclude cases analysis by analysis
Mỗi kiểm nghiệm T sử dụng toàn bộ
các trường hợp (cases) chứa đựng giá
trị có ý nghĩa đối với biến được kiểm
nghiệm Đặc điểm là kích thước mẫu
luôn thay đổi
Exclude cases listwise Mỗi kiểm
nghiệm T sử dụng chỉ những trường
hợp có giá trị đối với toàn bộ tất cả các
biến được sử dụng trong bất kỳ kiểm
nghiệm T test nào Kích thước mẫu
luôn không đổi
Trang 41.2 Kiểm định t hai mẫu độc lập
Kiểm định này dùng cho hai mẫu độc lập, dạng dữ liệu là dạng thang đo khoảng cách hoặc tỷ lệ
Đối với dạng kiểm định này, các chủ thể cần kiểm định phải được ấn định một cách ngẫu nhiên cho hai nhóm dữ liệu cần nghiên cứu sao cho bất kỳ một khác biệt nào từ kết quả nghiên cứu là do sự tác động của chính nhóm thử đó, chứ không phải do các yếu tố khác
Các dữ liệu cần so sánh nằm trong cùng một biến định lượng
Để so sánh ta tiến hành nhóm các giá trị thành hai nhóm để tiến hành so sánh Giả thuyết ban đầu cần kiểm định là giá trị trung bình của một biến nào đó thì bằng nhau giữa hai nhóm
mẫu và chúng ta sẽ từ chối giả thuyết này khi mà chỉ số Sig
nhỏ hơn mức ý nghĩa (thường là 0.05)
Trang 5Compare means\Independent
sample t-test….
Chuyển biến định lượng cần so
sánh trung bình vào hộp thoại Test
variable(s) Ta có thể chọn nhiều
biến định lượng để so sánh
Định ra các nhóm cần so sánh với
nhau (thường là biến định danh) di
chuyển vào hộp thoại Gouping
Trang 6Independent sample t-test
Có hai cánh định nhóm so sánh:
Sử dụng con số cụ thể, nhập hai giá trị đại diện cho hai nhóm
cần so sánh trong biến vào ô group 1 và group 2
Cách thứ hai sử dụng Cut point, nhập giá tri phân cách các giá
trị trong biến thành hai nhóm Toàn bộ các trường hợp có giá trị
(con số mã hóa) nhỏ hơn giá trị được nhập vào trong cut point
sẽ định ra một nhóm, và toàn bộ các trường hợp có giá trị mã hóa
lớn hơn hoặc bằng giá trị trong Cut point sẽ tạo ra một nhóm
khác.
Options để xác định độ tin cậy cho kiểm nghiệm, mặc định là
95% và cách xữ lý đối với các giá trị khuyết
Trang 71.3 Kiểm định t theo
từng cặp mẫu
Đây là dạng kiểm định dùng cho hai biến trong cùng một mẫu
có liên hệ với nhau, dữ liệu dạng thang đó khoảng cách hoặc
tỷ lệ Nó tính toán sự khác biệt giữa các giá trị của hai biến cho mỗi trường hợp và kiểm định xem giá trị trung bình các khác biệt có khác 0 hay không Giả thuyết ban đầu được đưa
ra là giá trị trung bình của các khác biệt là bằng 0 Và ta sẽ loại bỏ giả thuyết này trong trường hợp kiểm định cho kết quả
Sig nhỏ hơn mức ý nghĩa (0.05)
Điều kiện yêu cầu cho loại kiểm định này là kích cở hai mẫu
so sánh phải bằng nhau Các quan sát cho mỗi bên so sánh phải được thực hiện trong cùng những điều kiện giống nhau Các khác biệt từ giá trị trung bình của hai mẫu phải là phân phối chuẩn hoặc số lượng mẫu đủ lớn để xấp xỉ là phân phối chuẩn
Trang 8Bài toán tổng quát
Bài toán tổng quát như sau: Giả sử có hai tổng thể chung: Tổng thể
chung thứ nhất có các lượng biến của tiêu thức X1 phân phối theo quy luật chuẩn N (1, ) và tổng thể chung thứ hai có các lượng biến của tiêu thức X2 phân phối theo quy luật chuẩn N (2, ) Muốn so sánh sự khác nhau giữa 1 và 2 ta xét độ lệch trung bình d Ta chưa biết d nhưng nếu có cơ sở để giả thiết rằng giá trị của nó bằng 0 , ta đua ra giả thiết thống kê H0 : d = 0
Để kiểm định giả thiết trên, từ hai tổng thể chung người ta rút ra hai mẫu phụ thuộc được hình thành bởi các cặp n quan sát độc lập của hai mẫu, từ đó tính là trung bình của các độ lệch giữa các cặp giá trị của hai mẫu di Như vậy ta đưa bài toán so sánh về bài toán kiểm định giả thiết về giá trị trung bình đã xét ở phần I Tuy nhiên ở đây thường không biết phương sai của các độ lệch của tổng thể chung nên thay bằng phương sai của các độ lệch của tổng thể mẫu , và dùng tiêu chuẩn kiểm định t :
d
S
n d
t 0
Trang 9Nhận xét
Phương pháp so sánh từng cặp như trên có ưu điểm hơn phương pháp
so sánh hai mẫu độc lập ở chỗ:
- Nó không cần giả thiết gì về phương sai của hai tổng thể chung
- Nó thường cho kết quả chính xác hơn vì đã bỏ được các nhân tố ngoại lai ảnh hưởng đến giá trị trung bình Tuy nhiên nhược điểm của
nó là việc bố trí thí nghiệm (điều tra) phức tạp hơn, chẳng hạn trong
ví dụ trên phương pháp so sánh từng cặp đòi hỏi phải trồng lúa thí nghiệm trên hai mảnh của cùng một thửa ruộng với hai loại giống khác nhau
Trang 10Compare
means\Paired-samples t-test
Chọn hai biến ta cần so sánh di
chuyển vào hộp thoại Paired
Variables bằng nút mũi tên
Paired-samples t test còn cho
ta kết quả về mối tương quan
giữa hai biến đang quan sát Cho
biết liệu hai biến này có tương
quan với nhau hay không, độ
tương quan và chiều tương quan
(thể hiện ở bảng Paired
samples correlation).
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
http://www.mediafire.com/?1j5bcyb3asc8n
Trang 111.4 Phân tích phương sai một
chiều (One way ANOVA)
Phương pháp kiểm định sẽ mở rộng cho trường hợp so sánh trung bình của nhiều tổng thể được xây dựng trên việc xem xét các biến thiên (phương sai) của các giá trị quan sát trong nội bộ từng nhóm (mẫu) và giữa các nhóm (mẫu) với nhau Ở đây đề cập đến phân tích phương sai một yếu tố là trường hợp chỉ có một yếu tố (biến kiểm soát) được xem xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác Yếu tố được xem xét ảnh hưởng được dùng
để phân loại các quan sát thành các nhóm nhỏ khác nhau.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
http://www.mediafire.com/?1j5bcyb3asc8n
Trang 12Bài toán tổng quát
Giả sử ta có k tổng thể chung X1, X2, ., Xk có phân phối chuẩn, trong đó Xi ~ N( i , ) Các giá trị trung bình i chưa biết song có cơ
sở giả thiết rằng là chúng bằng nhau, ta có giả thiết cần kiểm định là H0: 1 = 2 = = k
Trong thống kê vấn đề trên thường được xem xét dưới góc độ sau đây: Giả sử chúng ta quan tâm tới một nhân tố X nào đó Nhân tố
X có thể xem xét ở k mức độ khác nhau Ký hiệu Xi là hiệu quả của việc tác động của nhân tố X ở mức i Như vậy i là hiệu quả trung bình của nhân tố X ở mức i Chúng ta muốn biết khi cho nhân tố X thay đổi ở các mức khác nhau thì điều đó có ảnh hương hay không tới hiệu quả trung bình Chẳng hạn, chúng ta muốn nghiên cứu ảnh hưởng của giống tới năng suất cây trồng Nhân tố ở đây là giống, các loại giống khác nhau là các mức của nhân tố Hiệu quả của giống lên năng suất cây trồng được đo bằng sản lượng của cây trồng Như vậy
Xi chính là sản lượng của giống i và i là sản lượng trung bình của giống i
Trang 13Trình bày số liệu tổng quát
k 1 j j
n n
k 1 j j
T T
Trang 14i i
n
x n
T x
T n
T x
k 1 j
n
1 i ij k
1 j
Trang 15Các bước kiểm định
Bước 2: Tính các tổng bình phương độ lệch.
+ Tổng bình phương chung, ký hiệu là SST (Total Sum of Squares):
+ Tổng bình phương do ảnh hưởng của nhân tố, ký hiệu là SSF
(Sum of Squares for Factor):
+ Tổng bình phương do sai số, ký hiệu là SSE (Sum of Squares for Error):
Từ các công thức trên, ta thấy:
ij 2
i j
ij
n
T x
x x
SST
n
Tn
Tn
.xx
SSF
2 k
1
j j
2 j j
2 k
1 j
ij 2
T x
x x
SSE
Trang 16Các bước kiểm định
Bước 3: Tính các phương sai tương ứng.
+ Phương sai do ảnh hưởng của nhân tố (hay phương sai giữa các mẫu), ký hiệu là MSF (Mean Square for Factor):
trong đó (k - 1) được gọi là bậc tự do của nhân tố
+ Phương sai do sai số (hay phương sai trong các mẫu), ký hiệu là MSE (Mean Square for Error):
trong đó (n - k) được gọi là bậc tự do của sai số
1 k
SSF MSF
k n
SSE MSE
Trang 17Các bước kiểm định
Bước 4: Kiểm định giả thiết.
Giả thiết H0: 1 = 2 = = k H1: Tồn tại ít nhất 1 cặp j j với j j’ Các kết quả nói trên được trình bày trong bảng sau đây và được gọi là bảng ANOVA (Analysis of Variance : Phân tích phương sai)
Người ta chứng minh được rằng nếu giả thiết H0 đúng thì tỷ số
sẽ có phân phối Fisher với bậc tự do là (k - 1, n - k) Giả thiết H0
sẽ bị bác bỏ ở mức ý nghĩa , nếu F > F, (k-1),( n-k)
Trang 18Comapre
means\One-Way ANOVA
Chuyển các biến định lượng cần so
sánh sang hộp thoại Dependent List
Lựa biến kiểm soát tức là biến độc lập
(yêu cầu phải có ba giá trị trở lên trong
biến kiểm soát này) chuyển biến kiểm
soát vào hộp thoại Factor, Biến kiểm
soát này cho phép ta phân các giá trị
trung bình theo từng nhóm để kiểm
định Thao tác đến đây cho phép ta đưa
ra kết luận liệu các trung bình của các
nhóm có bằng nhau hay không
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
http://www.mediafire.com/?1j5bcyb3asc8n
Trang 19Để tiến hành kiểm định so sánh sự khác biệt giữa các nhóm với
nhau ta lựa chọn công cụ Post Hoc và lựa chọn các phương pháp
kiểm định thích hợp
Đối với trường hợp giả thuyết về sự cân bằng phương sai giữa các mẫu không được chấp nhận ta sẽ sử dụng các phương pháp kiểm định sau để
tiến hành so sánh giá trị trung bình giữa các nhóm:Tamhane’s T2,
Dunnett’s T3, Games-Howell, Dunnett’s C
Trang 20phương pháp kiểm định thống kê
so sánh các trung bình mẫu
The least significant difference (LSD) là phép kiểm định
tương đương với việc sử dụng phương pháp kiểm định t riêng biệt cho toàn bộ các cặp trong biến Yếu điểm của phương pháp này là
nó không chỉnh lý độ tin cậy cho tương thich với việc kiểm định cho nhiều so sánh cùng một lúc Do đó dẫn đến độ tin cậy không cao
Phương pháp kiểm định Bonferroni và Tukey’s honestly
significant difference thì được sử dụng cho hầu hết các kiểm
định so sánh đa bội Kiểm định Sidak’s t test cũng được sử dụng tương tư như phương pháp Bonferroni tuy nhiên nó cung cấp
những giới hạn chặt chẻ hơn Khi tiến hành kiểm định một số
lượng lớn các cặp trung bình Tukey’s honestly significant
difference test sẽ có tác động mạnh hơn là Bonferroni test Và
ngược lại Bonferroni thì thích hợp hơn cho các kiểm định có số
lượng cặp so sánh ít.
Trang 21phương pháp kiểm định thống kê
so sánh các trung bình mẫu
Hochberg’s GT2 thì giống như Tukey’s honestly significant difference test nhưng thông thường Tukey’s test có tác dụng
tốt hơn Gabriel’s pairwise comparisons test thì giống như
Hochberg’s GT2 nhưng nó thường được sử dụng hơn khi kích cở
giữa các mẫu kiểm định có sự sai biệt lớn
Phương pháp kiểm định Dunnett’s pairwise được dùng để so
sánh các giá trị trung bình của các mẫu với một gía trị trung bình
cụ thể được lấy từ trong tập các mẫu so sánh
Trang 22phương pháp kiểm định thống kê
so sánh các trung bình mẫu
Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa ra hai
bước kiểm định Đầu tiên tiến hành kiểm định có hay không toàn
bộ các giá trị trung bình là ngang bằng nhau hay không Nếu toàn
bộ các giá trị trung bình là không ngang bằng nhau sau đó bước thứ hai sẽ kiểm định sự khác biệt giữa các nhóm nhỏ với nhau, để tìm ra những nhóm nào thật sự khác biệt và không khác biệt về giá trị trung bình Tuy nhiên việc kiểm định này không nên thực hiện đối với trường hợp kích cở mẫu trong các nhóm không ngang bằng nhau
Thông thường khi kích thước mẫu không ngang bằng giữa các
nhóm Bonferroni và Scheffé là hai phương pháp kiểm định được lựa chọn hơn là phương pháp Tukey
Trang 23phương pháp kiểm định thống kê
so sánh các trung bình mẫu
Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b cũng tương tự tuy nhiên nó ít khi được
sử dụng như các phương pháp trên
Kiểm định Waller-Duncan t được sử dụng khi kích thước mẫu
là không bằng nhau
Phương pháp kiểm định Scheffé cho phép sự kết hợp tuyến
tính của những giá trị trung bình sẽ được kiểm định, không chỉ là
so sánh giữa các cặp Chính vì vậy kết quả của kiểm định
Scheffé thì thường thận trọng hơn các phương pháp kiểm định
khác, nó đòi hỏi một sự khác biệt lớn giữa các giá trị trung bình quan sát được để bảo đảm tính thật sự khác biệt của phép kiểm định
Trang 24One-Way ANOVA: Option
công cụ Options để xác định loại loại thông kê
mô tả (Descriptive) và tính đồng nhất của
phương sai, công cụ để tính hệ số thống kê
Levene để kiểm định sự ngang bằng về phương
sai giữa các nhóm (việc tính toán này quyết
định đến sự lưa chon phương pháp kiểm định
trong phần Post Hoc
Công cụ Means Plot dùng để hiển thị đồ thị về giá tri trung bình của các nhóm Công cụ Missing Values dùng để kiểm soát giá trị khuyết.
Exclude cases analysis by analysis: Những trường hợp có giá trị
khuyết ở trong biến phụ thuộc và cả biến kiểm soát sẽ không được đưa vào trong kiểm định Ngoài ra những trường hợp có giá trị quan sát nằm bên ngoài chuổi đã xác định cho biến kiểm soát cũng không được sử
dụng
Exclude cases listwise Những trường hợp có giá trị khuyết Cases trong
biến điều khiển hoặc bất kỳ biến phụ thuộc nào được đưa ra hoặc không đưa
ra kiểm định đều bị loại trừ ra khỏi quá trình kiểm định phân tích
Trang 252 Kiểm định phi tham số
Các tiêu chuẩn thống kê để kiểm định sự khác nhau giữa hai trung bình của hai tổng thể chung được trình bày ở trên gọi là kiểm định có tham số Khi tiến hành các kiểm định này thường phải dựa trên giả thiết quan trọng là tổng thể chung đang xét có phân phối chuẩn và hoặc kích thước mẫu khá lớn Nếu một trong các điều kiện trên bị vi phạm thì các tiêu chuẩn đó không thể thực hiện được Trong tình huống như vậy ta phải sử dụng các tiêu chuẩn phi tham số Tiêu chuẩn này không đòi hỏi phải có các giả thiết về các dạng phân phối của tổng thể chung và dùng trong các phương pháp kiểm định tự do
(đối với dạng phân phối), đó là các phương pháp kiểm định phi
tham số.
Trang 26Kiểm định 2 mẫu độc lập
(Mann-Whitney U)
Kiểm định Mann - Whitney được sử dụng khi chỉ có hai tổng thể nghiên
cứu Kiểm định này cho phép ta xác định xem có phải các mẫu độc lập
được lấy ra từ cùng một tổng thể chung hoặc từ các tổng thể khác nhau nhưng có chung một phân phối hay không
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
http://www.mediafire.com/?1j5bcyb3asc8n