1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài khoa học: Nghiên cứu khai thác sử dụng một số phương pháp phân tích số liệu thống kê dựa trên phần mềm SPSS

17 221 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 17
Dung lượng 355,44 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nội dung chính của đề tài trình bày việc nghiên cứu khai thác sử dụng một số phương pháp phân tích số liệu thống kê dựa trên phần mềm SPSS. Mời các bạn tham khảo!

Trang 1

ĐỀ TÀI KHOA HỌC SỐ: 2.2.17-CS06

NGHIÊN CỨU KHAI THÁC SỬ DỤNG MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH SỐ LIỆU THỐNG KÊ DỰA TRÊN PHẦN MỀM SPSS

1 Cấp đề tài : Cơ sở

2 Thời gian nghiên cứu : 2006

3 Đơn vị chủ trì : Viện Khoa học Thống kê

4 Đơn vị quản lý : Viện Khoa học Thống kê

5 Chủ nhiệm đề tài : KS Lê Đỗ Mạch

6 Điểm đánh giá nghiệm thu đề tài: 9,05 / Xếp loại: Giỏi

Trang 2

I MỘT SỐ VẤN ĐỀ CƠ BẢN VỀ SỬ DỤNG VÀ QUẢN LÝ DỮ LIỆU TRONG SPSS

SPSS cho Windows là một phần mềm phân tích thống kê mạnh và là một hệ thống quản lý dữ liệu trong môi trường đồ họa, sử dụng các menu mô

tả và các hộp đối thoại đơn giản để vận hành hệ thống Người sử dụng thực hiện công việc quản lý, biến đổi dữ liệu, phân tích dữ liệu và vẽ đồ thị chỉ đơn giản bằng trỏ và kích chuột, không phải lập trình Quy trình thực hiện phân tích dữ liệu trên SPSS gồm 4 bước cơ bản:

Bước 1 Đưa dữ liệu vào SPSS Để có thể phân tích, trước hết cần phải

đưa dữ liệu vào SPSS qua cửa sổ Data Editor Lưu ý là tại một thời điểm, chỉ tồn tại một file dữ liệu duy nhất trong SPSS (thường gọi là file đang làm việc hay file đang hoạt động)

Bước 2 Chọn một thủ tục Chọn một thủ tục từ menu để tính toán các

thống kê hoặc tạo ra một đồ thị

Bước 3 Chọn các biến để phân tích Các biến trong file dữ liệu được

hiện trong hộp đối thoại của thủ tục (phần danh sách nguồn) Chúng ta có thể chọn các biến cần phân tích từ danh sách này Lưu ý là chỉ có các biến thích hợp với thủ tục phân tích mới được hiện trong danh sách nguồn

Bước 4 Thực hiện thủ tục và xem kết quả Khi đã chọn các biến phân

tích và các chọn lựa cần thiết trong hộp đối thoại, chúng ta có thể ra lệnh cho thủ tục thực hiện (bấm OK) Kết quả thực hiện thủ tục sẽ được đưa ra cửa sổ Viewer Từ đây có thể xem kết quả phân tích, kiểm tra tính đúng đắn, nếu kết quả đạt yêu cầu thì dùng tính năng soạn thảo của bộ Viewer để trình bày kết quả cho đẹp trước khi in ra hoặc ghi lại để dùng về sau, hoặc chuyển sang các phần mềm khác để tiếp tục sử dụng Nếu kết quả chưa đạt yêu cầu thì tiến hành hiệu chỉnh dữ liệu và thực hiện lại

Trong phần này nghiên cứu những đối tượng mà quy trình 4 bước cần phải sử dụng để hoàn tất công việc phân tích Đó là:

1 Hệ thống cửa sổ của SPSS Cửa sổ là các giao diện giúp ta trao đổi thông tin giữa người và máy trong quá trình phân tích dữ liệu Bao gồm Cửa

sổ soạn thảo dữ liệu Data Editor, cửa sổ xem kết quả Viewer, cửa sổ xem kết quả văn bản Draft Viewer, cửa sổ hiệu chỉnh bảng xoay Pivot Table Editor, cửa sổ hiệu chỉnh đồ thị Chart Editor, cửa sổ hiệu đính văn bản kết quả, cửa

sổ hiệu chỉnh cú pháp Text Output Editor Syntax, cửa sổ hiệu chỉnh các trình nhỏ Editor Script Editor

Trang 3

2 Hệ thống các Menu Mỗi cửa sổ SPSS có một chức năng riêng, vì vậy

nó có hệ thống các menu riêng thích hợp cho loại cửa sổ đó Riêng các menu Analyze và Graph là sẵn có trên tất cả các cửa sổ để dễ dàng thực hiện các thủ tục phân tích và vẽ các đồ thị mà không phải chuyển cửa sổ

3 Hệ thống các công cụ Trong một cửa sổ có một thanh công cụ bao gồm một số thủ tục thường sử dụng, thanh công cụ sẽ giúp ta chọn và truy nhập các thủ tục này nhanh hơn

4 Hộp đối thoại Đa số các lựa chọn trong menu đều mở ra một hộp đối thoại Ta sử dụng hộp đối thoại để chọn các biến và các tùy chọn cho phân tích Mỗi hộp đối thoại thường có một số thành phần cơ bản như sau: Danh sách các biến nguồn, danh sách các biến đích và các nút điều khiển

5 Cửa sổ soạn thảo dữ liệu Data Editor Đó là nơi mà chúng ta sẽ đưa

dữ liệu vào SPSS Ta có thể đọc các loại file dữ liệu khác nhau vào SPSS: file

dữ liệu SPSS, file dữ liệu Excel, file dữ liệu Dbase, file dữ liệu văn bản, file csdl, hoặc đưa dữ liệu trực tiếp bằng tay

6 Kết nối các file dữ liệu Vì mỗi thời điểm trong SPSS chỉ có một file dữ liệu làm việc (hoạt động), cho nên trước lúc phân tích nếu số liệu cần dùng nằm trên nhiều file khác nhau thì phải kết nối chúng về cùng một file để làm việc

7 Cửa sổ kết quả tính toán và đồ thị (Viewer) Kết quả thực hiện của các thủ tục và vẽ đồ thị đều được đưa ra cửa sổ Viewer Ta có thể sử dụng cửa sổ Viewer để: xem và hiệu đính các kết quả, hiện hoặc giấu các bảng và

sơ đồ/đồ thị, thay đổi trình tự xuất hiện các kết quả, trao đổi kết quả giữa SPSS và các ứng dụng khác

II PHÂN TÍCH SỐ LIỆU - THỐNG KÊ MÔ TẢ

1 Các thống kê mô tả cơ bản

Trong phần này sẽ trình bày các thủ tục tạo lập các bảng thống kê mô tả

Đó là những thống kê vẫn thường xuyên được sử dụng trong phân tích thống

kê Những thống kê mô tả tóm tắt tập dữ liệu của một biến về:

- Quy mô, độ lớn như tổng số quan sát (N), tổng số giá trị (Sum), phần trăm (%) giá trị được tính trên nhiều góc độ khác nhau

- Sự tập trung và phân tán của dữ liệu: Trung bình (Mean), trung vị (Median), Mod, phương sai (Variance), độ lệch chuẩn (std deviation), sai số chuẩn của trung bình (std error of mean), khoảng biến thiên (Range), giá trị nhỏ nhất (Minimum), giá trị lớn nhất (Maximum)…

Trang 4

- Về hình dạng của một phân phối: độ lệch của phân phối (Skewness),

độ nhọn của phân phối (Kurtosis), các phân vị (Percentile)…

2 Kiểm tra nhận dạng những giá trị ngoại biên và hình dạng của một phân phối

Trước khi tiến hành bất kỳ một phân tích nào, bước đầu tiên là cần phải kiểm tra dữ liệu Việc kiểm tra được tiến hành trên cả hai phương diện: nhận dạng những giá trị ngoại biên và những giá trị xấu làm sai lệch kết quả phân tích; dạng phân phối của dữ liệu có phù hợp với một thủ tục phân tích hay không, thí dụ như phân tích phương sai đòi hỏi các tổng thể phải có phân phối chuẩn và phương sai bằng nhau Qua kiểm tra ta có thể cân nhắc để loại

đi những giá trị xấu hoặc biến đổi dữ liệu để phân phối đỡ lệch hơn Các thủ tục thống kê mô tả có chức năng làm việc này

3 Thủ tục lập bản phân tích tần số đơn biến (Frequencies)

Thủ tục Frequencies cho một mô tả chi tiết về dữ liệu, cung cấp các thống kê và các đồ thị rất có ích cho việc mô tả dữ liệu của nhiều loại biến Đây là cái nhìn đầu tiên về dữ liệu qua đếm tần số của mỗi giá trị duy nhất và chúng ta dễ dàng phát hiện ra các số liệu ngoại lai và xử lý trước khi bắt đầu phân tích số liệu

4 Thủ tục lập bảng thống kê cơ bản trên các biến (Descriptives)

Thủ tục này tạo lập các thống kê mô tả cơ bản cho các biến trong một bảng riêng và tính các giá trị chuẩn hóa (tỉ số z)

5 Thủ tục khám phá số liệu (Explore) trên các nhóm

Thủ tục Explore sản xuất ra các thống kê mô tả và các đồ thị hoặc cho tất cả các quan sát hoặc riêng cho từng nhóm quan sát Mục đích của sử dụng thủ tục khám phá dữ liệu là để phát hiện ra sự ẩn dấu đằng sau của số liệu, nhận dạng các giá trị ngoại biên, mô tả số liệu, kiểm tra các giả thiết và phân biệt sự khác nhau giữa các nhóm

6 Thủ tục lập bảng phân tích tần số song biến (Crosstabs)

Thủ tục Crosstabs tạo lập các bảng tần số hai chiều hay nhiều chiều mô

tả chi tiết về số liệu, cung cấp nhiều kiểm định khác nhau và các độ đo về mỗi quan hệ của hai biến Các thống kê và các độ đo về mối quan hệ chỉ được tính cho bảng hai chiều Thí dụ:

- Kiểm định tính độc lập của hai biến bằng thống kê Pearson - χ2

Trang 5

- Đo lường cường độ mối quan hệ của hai biến bằng các thống kê: hệ số Phi, hệ số C ngẫu nhiên, hệ số V

- Đo lường sự giảm bớt sai lầm khi dự đoán bằng thống kê Lambda và τ

- Cảnh báo nguy cơ của một hiện tượng bằng Tỷ số Odd và hệ số Cohort trong bản 2*2

- Đo lường sự thống nhất ý kiến bằng hệ số Kppa

- …

III VẼ BIỂU ĐỒ VÀ ĐỒ THỊ

Các kết quả thống kê quan trọng nhất của một cuộc điều tra thường được trình bày thông qua các biểu đồ và đồ thị hấp dẫn Các biểu đồ được chuẩn bị kỹ lưỡng có sức hấp dẫn hơn nhiều so với các bảng biểu và người đọc dễ dàng hiểu được vấn đề Tuy nhiên phải thấy rằng các biểu đồ chỉ trình bày được một số lượng nhỏ dữ kiện, nếu chúng ta dựa vào quá nhiều sự kiện biểu đồ trở nên mất tính hiệu quả Mặt khác cũng thấy rằng biểu đồ chỉ đưa ra một cách tương đối độ lớn các sự kiện Các bảng biểu có thể đưa ra các con

số chi tiết và chính xác đến từng dấu phẩy Hơn nữa, đồ thị còn là phương pháp mô tả dữ liệu rất quan trọng trong quá trình xử lý và phân tích số liệu thống kê

Trong SPSS có nhiều loại đồ thị khác nhau, chất lượng đồ thị rất cao và chất lượng xuất bản cũng cao Một số đồ thị dùng vào việc mô tả và kiểm tra

sự phân bố của dữ liệu, kiểm tra các giá trị ngoại biên phục vụ cho quá trình

xử lý và phân tích như: đồ thị cành và lá, đồ thị hộp, đồ thị histogram, đồ thị phân tán Scatter, ma trận đồ thị phân tán, đồ thị P-P, Q-Q không được trình bày trong phần này Chúng được giới thiệu trong các thủ tục mô tả và phân tích dữ liệu

Trong phần này chúng tôi chỉ giới thiệu một số biểu đồ thông dụng thường dùng để trình bày kết quả thống kê: Biểu đồ thanh (Bar), biểu đồ bánh

xe (Pie), đồ thị dây (Line)

IV PHÂN TÍCH SỐ LIỆU - LẬP BẢNG TỔNG HỢP

Lập bảng tổng hợp số liệu và lập báo cáo thống kê là việc làm thường xuyên của cán bộ nghiệp vụ thống kê Khả năng lập các bảng số liệu tổng hợp, các báo cáo thống kê trong SPSS hết sức đa dạng và linh hoạt với nhiều chiều phân tổ khác nhau và dễ dàng thực hiện không phải lập trình Các bảng

Trang 6

tổng hợp, các báo cáo thống kê được trình bày đẹp và có chất lượng xuất bản cao, có thể tiếp tục được hiệu chỉnh, in ra hoặc chuyển sang các tài liệu khác Đây quả là một ưu điểm nổi bật của SPSS, vì ai cũng biết rằng để lập trình tạo ra một biểu bảng như ý là một công việc hết sức tỉ mẩn và nặng nhọc

Có thể nói kỹ thuật lập bảng tổng hợp số liệu trong SPSS đáp ứng được hầu như tất cả các yêu cầu lập bảng tổng hợp số liệu thường gặp trong thực

tế, có nội dung và kết cấu khác nhau Tính linh hoạt trong khi lập bảng biểu rất cao, có thể thêm bớt nội dung tổng hợp theo các chiều của biểu, có thể chuyển đổi chiều dòng thành chiều cột và ngược lại, có thể tạo các tổng nhóm

và các tổng toàn bộ và bố cục bảng sao cho sáng sủa và đẹp Tại mỗi chiều của bảng có thể sắp xếp không chỉ một tiêu thức mà có thể một vài tiêu thức nối tiếp nhau hoặc phân tổ hoặc vừa nối tiếp vừa phân tổ Lúc đó về mặt tin học, người ta gọi các tiêu thức đứng độc lập so với các tiêu thức trước đó (các biến) là xếp chồng (stacked) Còn tiêu thức dùng làm phân tổ cho một tiêu thức đứng ngay trước đó được gọi là tiêu thức xếp lồng (nested) Do có những kỹ thuật này mà ta có thể mở rộng thêm các chiều của biểu, chiều cột và/hoặc chiều dòng, giúp ta tổng hợp các bảng biểu có cấu trúc phức tạp và nội dung thông tin phong phú, đa dạng Trong SPSS một bảng thường có 3 chiều, chiều dòng, chiều cột và lớp

Trong phần này chúng tôi giới thiệu một số kỹ thuật lập bảng thường dùng nhất để phân tích dữ liệu thống kê, chúng có thể đáp ứng hầu như mọi nhu cầu lập bảng tổng hợp số liệu và lập báo cáo thống kê của người sử dụng Mỗi kỹ thuật có kèm theo thí dụ minh họa để nắm bắt phương pháp và dễ áp dụng

- Bảng tổng hợp cơ bản

- Bảng tổng hợp tổng quát

- Báo cáo tổng kết

- Báo cáo thống kê theo hàng

- Báo cáo thống kê theo cột

V MỘT SỐ KIỂM ĐỊNH THƯỜNG DÙNG TRONG PHÂN TÍCH THỐNG KÊ Trong phân tích thống kê mối quan hệ của các hiện tượng kinh tế xã hội, người ta thường sử dụng các kỹ thuật kiểm định số liệu để đưa ra các quyết định Một số kiểm định về giá trị trung bình rất hay được sử dụng sẽ được giới thiệu

Trang 7

1 Phương pháp chung để kiểm định số liệu thống kê bao gồm các bước sau:

- Lập giả thuyết H0 và căn cứ vào yêu cầu thực tế lập giả thuyết đối H1;

- Chọn mức ý nghĩa α;

- Lấy một mẫu số liệu kích thước N từ tổng thể nghiên cứu;

- Chọn tiêu chuẩn kiểm định G và xác định quy luật phân bố xác suất của nó với điều kiện giả thuyết H0 đúng;

- Xác định giá trị lý thuyết của thống kê G: Gcrit;

- Căn cứ vào mẫu số liệu đã thu thập, tính toán giá trị quan sát của tiêu chuẩn kiểm định G: Gqs;

- So sánh giá trị Gqs với Gcrit để rút ra kết luận

2 Kiểm định số trung bình của một tổng thể

Người ta dùng phương pháp kiểm định về số trung bình của một tổng thể nhằm so sánh giá trị trung bình của tổng thể với một giá trị cụ thể Tổng thể được giả thiết có phân phối chuẩn N( , 2)

Thí dụ: Ta cho rằng làm một luận án tiến sỹ thường mất 4 năm Dựa trên

số liệu cuộc điều tra tiến sỹ năm 2000, hãy kiểm định xem có phải như vậy không

Kết quả kiểm định (T = - 5.681, P-value =.000), ta bác bỏ giả thuyết không cho rằng thời gian làm một luận án tiến sỹ là 4 năm Đây là một kiểm định trái cho biết thời gian làm một luận án thực sự ít hơn 4 năm

3 Kiểm định về sự khác nhau của hai số trung bình: Trường hợp hai mẫu độc lập

Mục đích của kiểm định về sự khác nhau của hai số trung bình nhằm so sánh 2 giá trị trung bình của tổng thể Giả sử hai tổng thể đều có phân phối chuẩn N( 1, 12) và N( 2, 22)

Thí dụ: Điều kiện để làm một luận án tiến sỹ trong nước thường khó khăn về nhiều mặt so với ở nước ngoài Vì vậy thời gian để làm một luận án

có thể khác nhau Dùng số liệu cuộc điều tra tiến sỹ năm 2000 kiểm định Kết quả (T = 3.915, P-value =.000), ta bác bỏ giả thuyết không cho rằng thời gian làm một luận án tiến sỹ ở trong nước và nước ngoài là bằng nhau Đây

là một kiểm định phải cho biết thời gian làm trong nước là lâu hơn ngoài nước

Trang 8

4 Kiểm định về sự khác nhau của hai số trung bình: Trường hợp hai mẫu cặp nhau

Ta vẫn phải so sánh hai số trung bình, nhưng trong trường hợp hai mẫu rút ra từ hai tổng thể lại phụ thuộc nhau trên từng cặp giá trị và cùng có kích thước N Hai tổng thể đều có phân phối chuẩn N( 1, 12) và N( 2, 22)

Thí dụ: Nhiều tiến sỹ cho rằng họ quá bận với công tác quản lý, thời gian dành cho nghiên cứu không được nhiều Vậy thời gian sử dụng cho nghiên cứu có thực sự ít hơn cho quản lý hay không?

Thống kê T từ kiểm định (T = 8.420, P-value =.000) đã bác bỏ giả thuyết không về sự bằng nhau của hai thời gian Đây là một kiểm định phải thời gian quản lý thực sự nhiều hơn thời gian nghiên cứu

VI PHÂN TÍCH PHƯƠNG SAI

Phân tích phương sai là phương pháp nghiên cứu sự biến động của một tổng thể Sự biến động của một tổng thể (total) bao gồm sự biến động giữa các nhóm (between) và trong các nhóm (within) của nó Trung bình của tổng thể và trung bình của các nhóm là những thống kê dùng để nghiên cứu sự biến động của tổng thể Tác động của một nhân tố thể hiện trong so sánh sự biến động giữa các nhóm do nhân tố gây ra với sự biến động trong các nhóm Mục đích so sánh là để thấy được sự biến động của tổng thể chủ yếu là do sự khác biệt giữa các nhóm gây ra (đây là một phân loại tốt), hay là chỉ xảy ra trong các nhóm (đó chỉ là sai số ngẫu nhiên) Với giả thiết không cho rằng trung bình của các nhóm là bằng nhau, nếu sự biến động thực tế giữa các nhóm vượt trội sự biến động trong các nhóm thì chúng ta sẽ nghi ngờ về giả thiết không và có thể dẫn đến bác bỏ giả thiết này Tỷ số F là một thống kê giúp ta làm việc này

1 Phân tích phương sai một nhân tố

1.1 Mô hình phân tích

Ở Phần V, ta đã so sánh sự khác nhau của hai số trung bình Trong phần này thực hiện so sánh nhiều hơn 2 số trung bình Giả sử tổng thể nghiên cứu

X được phân thành p tổng thể khác (Xi, i 1 ,p) bởi một biến phân loại F, các tổng thể này đều có phân phối chuẩn và có phương sai bằng nhau N(μi, σ2

),

p

i 1 , , P do ngẫu nhiên độc lập được lấy ra từ p tổng thể này, kích thước của mẫu là Ni, i 1 ,p Để kiểm định giải thuyết không về các giá trị trung bình của tổng thể (các giá trị trung bình bằng nhau), tiêu chuẩn kiểm định là:

Trang 9

F = Biến động giữa các nhóm

Biến động trong các nhóm Phần tử số của tiêu chuẩn kiểm định đo lường mức độ ảnh hưởng của nhân tố F đối với tổng thể Phần mẫu số đo lường sai số gây ra bởi các yếu tố chưa kiểm soát được đối với tổng thể

Với mức ý nghĩa α, ta sẽ bác bỏ giả thuyết H0 khi F > Fα(p - 1, N – p) (giá trị F lý thuyết)

1.2 Thí dụ: Ta muốn biết thời gian trung bình để làm một luận án tốt nghiệp

tiến sỹ (biến tg_hoc) tại 5 thời kỳ khác nhau (biến thoi_ky) của nước ta có khác khau hay không

Sử dụng số liệu năm 2000 ta có kết quả (F = 4.008, P-value =.003) đã bác bỏ giả thuyết không và cho rằng thời gian làm luận án ở 5 thời kỳ là khác nhau Vậy các thời kỳ nào là khác nhau và các số trung bình này có tạo thành một dãy tuyến tính không Hai vấn đề này cũng đã được chỉ ra trong đề tài

2 Phân tích phương sai hai nhân tố

2.1 Mô hình phân tích

Giả sử ta có biến X (tổng thể) phân phối chuẩn và hai nhân tố F và G (các biến độc lập) cùng tác động lên tổng thể X (biến phụ thuộc) F và G là các biến phân loại, F có p mức, G có q mức Mọi sự kết hợp của hai biến F và

G phân tổng thể X thành pq nhóm hay pq tổng thể, các tổng thể này đều có phân phối chuẩn và phương sai bằng nhau Pq mẫu độc lập được lấy ra từ các tổng thể này, mỗi mẫu được lấy ra từ một tổng thể Kích thước mẫu được qui định là bằng nhau và bằng m (mẫu cân bằng)

Ba giả thuyết cần kiểm định trong mô hình phân tích phương sai hai nhân tố:

- Không có ảnh hưởng chính của nhân tố F;

- Không có ảnh hưởng chính nào của nhân tố G;

- Không có ảnh hưởng tương tác của hai nhân tố F và G

Ba thống kê kiểm định giả thuyết:

Frow =

Biến động giữa các dòng (nhân tố F) Biến động trong các nhóm

Fcolumn = Biến động giữa các cột (nhân tố G)

Biến động trong các nhóm

Trang 10

Finteration = Tương tác

Biến động trong các nhóm

So sánh các thống kê F tính được trên các mẫu (F quan sát) với F lý thuyết, nếu F quan sát > F lý thuyết, ta bác bỏ giả thuyết tương ứng, trường hợp ngược lại chấp nhận giả thuyết không

Thí dụ: Chủ hộ và vùng địa lý có ảnh hưởng đến chi tiêu trung bình đầu

người của hộ gia đình hay không Nguồn số liệu để phân tích lấy từ điều tra mức sống năm 1998 Các biến của mô hình gồm: biến phụ thuộc, rlpcex1 chi tiêu trung bình đầu người của hộ, các nhân tố: reg7 7 vùng địa lý, hhcat 10 chủ hộ

Mô hình là có ý nghĩa thống kê (F = 21.766, P-value =.000) và đã giải thích được 20% (R2

=.202) sự biến động của chi tiêu bình quân đầu người trên cả nước Các tác động chính reg7 và hhcat và tương tác reg7*hhcat đều

có ý nghĩa thống kê giúp ta kết luận: chủ hộ và vùng địa lý và tương tác giữa hai nhân tố này đều có ảnh hưởng đến chi tiêu bình quân đầu người của hộ Thủ tục phân tích phương sai trong SPSS rất đa dạng không những cho mẫu cân bằng mà cho cả mẫu không cân bằng, không những chỉ có hai nhân

tố tác động mà còn cho phép nhiều nhân tố tác động, không những các nhân

tố tác động là biến phân loại mà còn có cả biến liên tục và tương tác của nó với biến phân loại Một số thí dụ trong đề tài đã minh họa cho các vấn đề này VII PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUY

A Phân tích tương quan

1 Hệ số tương quan Pearson

Hệ số tương quan Pearson ký hiệu là r đo lường cường độ mối quan hệ tuyến tính giữa hai biến định lượng Hệ số tương quan không có tính nhân quả Giá trị của hệ số tương quan nằm trong khoảng - 1 ≤ r ≤ + 1 Nếu:

- r > 0: hai biến cố có mối quan hệ tương quan cùng chiều;

- r < 0: hai biến cố có mối quan hệ tương quan ngược chiều;

- r = 0: hai biến không có mối quan hệ nào, r càng gần 0 thì mối quan hệ giữa hai biến càng yếu;

- r = ±1: hai biến cố có mối quan hệ hàm số Nói chung r càng gần 1 hoặc -1 thì mối quan hệ giữa hai biến càng mạnh

Ngày đăng: 07/01/2020, 15:10

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm