1. Trang chủ
  2. » Luận Văn - Báo Cáo

Sử dụng spss để tìm hiểu về các hệ số tương quan giữa các cặp biến

54 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Sử dụng SPSS để tìm hiểu về các hệ số tương quan giữa các cặp biến
Tác giả Lê Thị Minh Nga
Người hướng dẫn TS. Nguyễn Trung Hòa
Trường học Trường Đại học Vinh
Chuyên ngành Lý thuyết xác suất và thống kê toán học
Thể loại Luận văn thạc sĩ
Năm xuất bản 2014
Thành phố Vinh
Định dạng
Số trang 54
Dung lượng 2,31 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • 1.1. BIẾN NGẪU NHIÊN (6)
    • 1.1.1. Định nghĩa (6)
    • 1.1.2. Phân loại biến ngẫu nhiên (6)
    • 1.1.3. Hàm phân phối xác suất (6)
    • 1.1.4. Các số đặc trƣng của biến ngẫu nhiên (7)
  • 1.2. VECTƠ NGẪU NHIÊN (9)
    • 1.2.1. Định nghĩa (9)
    • 1.2.2. Bảng phân phối xác suất của vectơ ngẫu nhiên rời rạc hai chiều (9)
    • 1.2.3. Hàm phân phối xác suất của vectơ ngẫu nhiên hai chiều (9)
    • 1.2.4. Hàm mật độ xác suất của vectơ ngẫu nhiên liên tục hai chiều (10)
  • 1.3. MẪU NGẪU NHIÊN VÀ MẪU QUAN SÁT (10)
    • 1.3.1. Định nghĩa (10)
    • 1.3.2. Trung bình mẫu ngẫu nhiên (11)
    • 1.3.3. Phương sai mẫu (11)
    • 1.3.4. Các phương pháp ch n mẫu quan sát (0)
    • 1.3.5. Các phương pháp mô tả số liệu thực nghiệm (12)
  • 1.4. HỆ SỐ TƯƠNG QUAN (13)
    • 1.4.1. Hệ số tương quan Pearson (13)
    • 1.4.2. Hệ số tương quan hạng Spearman (15)
  • CHƯƠNG II. SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ TƯƠNG QUAN (16)
    • 2.1. GIỚI THIỆU VỀ SPSS (16)
      • 2.1.1. SPSS là gì? (16)
      • 2.1.2. Các chức năng chính của SPSS (16)
      • 2.1.3. Những lĩnh vực ứng dụng của SPSS (16)
      • 2.1.4. Các thành phần chính của SPSS (17)
      • 2.1.5. Cài đặt SPSS 16.0 (17)
    • 2.2. SPSS VỚI PHÂN TÍCH TƯƠNG QUAN (29)
      • 2.2.1. SPSS với phân tích tương quan Pearson (29)
      • 2.2.2. SPSS với phân tích tương quan Spearman (36)
      • 2.2.3. SPSS với một vài bài toán thực tế (41)
  • KẾT LUẬN (37)
  • TÀI LIỆU THAM KHẢO (0)

Nội dung

BIẾN NGẪU NHIÊN

Định nghĩa

Biến ngẫu nhiên là biến sao cho mỗi giá trị mà nó nhận được tương ứng với một xác suất nào đó

Biến ngẫu nhiên là khái niệm quan trọng trong xác suất và thống kê, có thể nhận giá trị trong phạm trù đa dạng như màu sắc, hình dạng, phương hướng, thái độ hoặc trình độ học vấn Tuy nhiên, nhờ các ánh xạ toán học, chúng ta có thể chuyển đổi việc nghiên cứu các biến ngẫu nhiên phi số sang dạng biến ngẫu nhiên nhận giá trị là các số, giúp quá trình phân tích dễ dàng hơn Do đó, người ta thường nhấn mạnh đến biến ngẫu nhiên thực, được định nghĩa là biến ngẫu nhiên có giá trị nằm trong tập số thực, phù hợp với các phép toán và phân tích thống kê.

Giả sử (, F ,P) là không gian xác suất, G là  - đại số con của  - đại số

F Khi đó ánh xạ X :   đƣợc g i là biến ngẫu nhiên G -đo đƣợc nếu nó là ánh xạ G /B( ) đo đƣợc( tức là với m i B  B( ) thì X -1 (B)  G ) Đặc biệt, nếu X là biến ngẫu nhiên F - đo đƣợc thì X đƣợc g i một cách đơn giản là biến ngẫu nhiên.

Phân loại biến ngẫu nhiên

- Biến ngẫu nhiên g i là rời rạc nếu tập hợp các giá trị có thể có của nó là một tập hữu hạn hoặc đếm đƣợc

Ví dụ: Số chấm xuất hiện khi tung một con xúc sắc, số con trai trong số

100 trẻ sắp đƣợc sinh ra tại một bệnh viện phụ sản là các biến ngẫu nhiên rời rạc

- Biến ngẫu nhiên g i là liên tục nếu tập hợp các giá trị có thể có của nó lấp đầy một khoảng nào đó của trục số

Trong đo lường các đại lượng vật lý, sai số đo lường là một yếu tố không thể tránh khỏi và cần được xem xét kỹ lưỡng Ví dụ điển hình là khoảng cách từ điểm chạm của viên đạn tới tâm bia khi bắn súng, đây là một biến ngẫu nhiên liên tục ảnh hưởng đến độ chính xác của kết quả Hiểu rõ về các biến ngẫu nhiên liên tục giúp cải thiện độ chính xác trong các phép đo và nâng cao hiệu quả của các phương pháp đo lường trong thực tế.

Hàm phân phối xác suất

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Hàm phân phối X c suất của biến ngẫu nhiên X, ký hiệu là FX(x), thể hiện xác suất để biến ngẫu nhiên X nhận giá trị nhỏ hơn x, trong đó x là một số thực bất kỳ Hàm này giúp xác định xác suất phân bố của biến ngẫu nhiên X theo cách dễ hiểu và trực quan, đóng vai trò quan trọng trong phân tích thống kê và xác suất Việc hiểu rõ hàm phân phối giúp người dùng dự đoán các giá trị của X và thực hiện các phép tính xác suất một cách chính xác.

- Tính chất: Hàm phân phối xác suất F X (x) của một biến ngẫu nhiên X có các tính chất sau:

 F x X ( ) là hàm không giảm, nghĩa là với x 1 < x 2 thì F X (x 1 ) ≤ F X (x 2 )

 F x X ( ) là hàm liên tục trái

 Nếu X là biến ngẫu nhiên liên tục thì F X (x) liên tục trên toàn miền giá trị của biến ngẫu nhiên X và P(X = x o ) = 0 với m i x o

- Ý nghĩa: Hàm phân phối xác suất phản ánh mức độ tập trung xác suất ở về phía bên trái một số thực x nào đó.

Các số đặc trƣng của biến ngẫu nhiên

Nếu X là biến ngẫu nhiên rời rạc nhận một trong c c gi trị có thể có x 1 , x 2 , , x n với c c x c suất tương ứng p 1, p 2 , , p n thì kỳ vọng to n E(X) của biến ngẫu nhiên là E(X) = 

Nếu X là biến ngẫu nhiên liên tục với hàm mật độ x c suất f(x) thì kỳ vọng to n E(X) của biến ngẫu nhiên là E(X) =  

 Với C là hằng số thì E(C) = C, E(CX) = C.E(X).

 Nếu X và Y là các biến ngẫu nhiên độc lập thì

- Ý nghĩa: Kỳ v ng toán của biến ngẫu nhiên là giá trị trung bình số h c của các giá trị quan sát của biến ngẫu nhiên

Phương sai của biến ngẫu nhiên X ký hi u là D(X) là kỳ vọng to n của bình phương độ l ch giữa biến ngẫu nhiên X và kỳ vọng to n của nó

 DX 0 với m i biến ngẫu nhiên X

 DC = 0 nếu C là hằng số

 D(CX) = C 2 DX Với C là hằng số

 D(X + Y)=D(X - Y) = DX + DY nếu X,Y là hai biến ngẫu nhiên độc lập

- Ý nghĩa: Phương sai phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình của nó

1.1.4.3 Độ lệch chuẩn Độ lệch chuẩn của biến ngẫu nhiên X ký hiệu là  x là căn bậc hai của phương sai:  x = D ( X )

Trung vị ký hi u là m d là gi trị nằm ở chính giữa tập hợp c c gi trị có thể có của biến ngẫu nhiên X

Mốt ký hiệu là giá trị của biến ngẫu nhiên tương ứng với xác suất lớn nhất Đối với biến ngẫu nhiên rời rạc, mốt là giá trị của biến ngẫu nhiên tại đó hàm xác suất đạt cực đại Trong khi đó, với biến ngẫu nhiên liên tục, mốt là giá trị tại đó hàm mật độ xác suất đạt đỉnh cao nhất Mốt phản ánh giá trị phổ biến nhất xuất hiện trong phân phối của biến ngẫu nhiên Việc xác định mốt giúp hiểu rõ hơn về đặc điểm phân phối và xu hướng của dữ liệu.

1.1.4.6 Giá trị tới hạn mức 

Giả sử X là biến ngẫu nhiên gi trị tới hạn mức  của biến ngẫu nhiên X ký hi u là x  là gi trị của X thỏa mãn điều ki n: P(X > x  ) = 

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

VECTƠ NGẪU NHIÊN

Định nghĩa

Giả sử X 1 , X 2 , , X n là c c biến ngẫu nhiên khi đó X = ( X 1 , X 2 , , X n ) được gọi là một vectơ ngẫu nhiên n chiều

Trong nghiên cứu về chiều cao và cân nặng của học sinh nam tại trường A, biến ngẫu nhiên X biểu thị chiều cao còn biến ngẫu nhiên Y thể hiện cân nặng của các học sinh Vétơ ngẫu nhiên hai chiều (X, Y) mô tả mối quan hệ giữa chiều cao và cân nặng của học sinh, giúp phân tích và đưa ra các kết luận chính xác về đặc điểm thể chất của nhóm học sinh này.

Bảng phân phối xác suất của vectơ ngẫu nhiên rời rạc hai chiều

- Bảng phân phối xác suất đồng thời của vect ngẫu nhiên rời rạc hai chiều (X, Y):

- Bảng phân phối xác suất của X: p i = P( X = x i ) = 

- Bảng phân phối xác suất của Y: q j = P( Y = y j ) = 

Hàm phân phối xác suất của vectơ ngẫu nhiên hai chiều

Hàm phân phối c suất của vectơ ngẫu nhiên hai chiều (X, Y), ký hiệu là F(x, y), thể hiện xác suất để biến ngẫu nhiên X nhận giá trị nhỏ hơn x và biến ngẫu nhiên Y nhận giá trị nhỏ hơn y, với x và y là các số thực bất kỳ Hàm phân phối này giúp xác định xác suất của các tập hợp con trong không gian xác suất của vectơ (X, Y), góp phần phân tích và mô tả sự phụ thuộc giữa hai biến ngẫu nhiên Việc hiểu rõ hàm phân phối c suất là nền tảng quan trọng trong thống kê và xác suất, đặc biệt trong các bài toán mô hình hóa hai biến ngẫu nhiên liên quan.

 F(x, y) là một hàm không giảm theo từng biến

Hàm mật độ xác suất của vectơ ngẫu nhiên liên tục hai chiều

Hàm mật độ x c suất của vectơ ngẫu nhiên liên tục hai chiều (X,Y) ký hi u là f(x, y) là đạo hàm riêng hỗn hợp bậc hai của hàm phân phối x c suất: f(x, y) = y x y x

MẪU NGẪU NHIÊN VÀ MẪU QUAN SÁT

Định nghĩa

Mẫu ngẫu nhiên kích thước n cho một biến ngẫu nhiên X là tập hợp gồm n biến ngẫu nhiên độc lập, X₁, X₂, , Xₙ, được tạo ra từ biến ngẫu nhiên X và có cùng quy luật phân phối như X Đây là khái niệm quan trọng trong thống kê, giúp phân tích và mô phỏng các dữ liệu ngẫu nhiên một cách chính xác Mẫu ngẫu nhiên này đóng vai trò trung tâm trong các phương pháp suy luận thống kê và xác suất, đảm bảo tính đại diện và độ tin cậy của các ước lượng.

Mẫu ngẫu nhiên thường được ký hi u là W = (X 1 , X 2 , , X n )

Trong thử nghiệm thống kê, giả sử X₁ nhận giá trị x₁, X₂ nhận giá trị x₂, , Xₙ nhận giá trị xₙ, thì tập hợp các n giá trị này tạo thành một mẫu ngẫu nhiên cụ thể Mẫu này được gọi là mẫu quan sát và ký hiệu là w = (x₁, x₂, , xₙ), đóng vai trò quan trọng trong phân tích dữ liệu và đưa ra các kết luận thống kê.

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Tập hợp các số liệu quan sát cụ thể g i là các số liệu thực nghiệm

Mẫu ngẫu nhiên hai chiều là khái niệm quan trọng trong thống kê, đề cập đến việc nghiên cứu đồng thời hai dấu hiệu trên cùng một tổng thể Trong đó, dấu hiệu nghiên cứu thứ nhất được xem là biến ngẫu nhiên X, còn dấu hiệu thứ hai là biến ngẫu nhiên Y, giúp phản ánh mối quan hệ giữa hai yếu tố này Nghiên cứu hai dấu hiệu của tổng thể chính là phân tích biến ngẫu nhiên hai chiều (X, Y), mang lại cái nhìn toàn diện và chính xác hơn về các yếu tố tác động.

Mẫu ngẫu nhiên hai chiều kích thước n của dấu hiệu nghiên cứu (X, Y) là một dãy gồm n biến ngẫu nhiên hai chiều độc lập, có cùng quy luật phân phối xác suất với biến (X, Y) Khái niệm này giúp thúc đẩy phân tích thống kê và mô hình hóa dữ liệu hai chiều, hỗ trợ các nghiên cứu trong các lĩnh vực khoa học xã hội và kinh tế Việc hiểu rõ về mẫu ngẫu nhiên giúp đảm bảo tính khách quan và độ chính xác trong các kết luận thống kê dựa trên dữ liệu thu thập được.

Mẫu ngẫu nhiên hai chiều đƣợc kí hiệu là:

Khi đó giả sử thành phần (X i , Y i ) nhận giá trị (x i , y i ), i = 1, ,n ta thu đƣợc mẫu quan sát cụ thể w = [(x 1 , y 1 ), (x 2 , y 2 ), ,(x n , y n )]

Các giá trị x i (i = 1, , n) g i là thành phần X của mẫu, các giá trị y i (i = 1, ,n) g i là thành phần Y của mẫu.

Trung bình mẫu ngẫu nhiên

Giả sử (X 1 , X 2 , , X n ) là một mẫu ngẫu nhiên kích thước n khi đó trung bình mẫu ký hi u là X được x c định bởi:

Phương sai mẫu

Giả sử (X 1 , X 2 , , X n ) là một mẫu ngẫu nhiên kích thước n với trung bình mẫu

X , khi đó phương sai mẫu ký hi u là S 2 được x c định bởi:

1.3.4.Các phương pháp chọn mẫu quan sát

- Ch n mẫu đơn: lấy ngẫu nhiên theo danh sách

- Ch n mẫu hệ thống: ch n ngẫu nhiên phần tử đầu tiên, các phần tử tiếp theo đƣợc ch n cách đều hoặc theo một quy luật nào đó

- Ch n mẫu phân tầng: chia thành các nhóm, tầng theo một đặc tính nào đó rồi ch n mẫu từ các nhóm, các tầng đó

- Ch n mẫu chùm: ch n mẫu chỉ trong một tập con nào đó đƣợc xem là đại diện cho tổng thể

1.3.5 Các phương pháp mô tả số liệu thực nghiệm

- Bảng phân phối tần số thực nghiệm và tần suất thực nghiệm:

Nếu một mẫu ngẫu nhiên kích thước n của X nhận giá trị x i với tần số xuất hiện r i , f i = n r i g i là tần suất của x i trong đó i = 1, , k, x 1 < < x k , r 1 + + r k = n

Khi đó ta có thể mô tả mẫu ngẫu nhiên qua bảng phân phối tần số thực nghiệm và tần suất thực nghiệm của X nhƣ sau:

- Bảng phân phối tần số ghép lớp:

Trong những trường hợp mẫu có kích thước lớn hoặc các giá trị của biến X nhận các giá trị gần nhau, người ta thường phân chia dữ liệu thành các khoảng giá trị y₁, y₂, , y_k để dễ dàng phân tích Mỗi giá trị của X sẽ thuộc vào một trong các khoảng này, giúp xây dựng bảng phân phối tần số ghép lớp rõ ràng và dễ hiểu Bảng này thể hiện số lượng các phần tử n, n₁, n₂, , n_i, , n_k tương ứng với từng khoảng giá trị, giúp người nghiên cứu dễ dàng nhận diện và xử lý dữ liệu một cách hệ thống.

Trong đó : y i+1 - y i = h n i là số các giá trị quan sát thuộc nửa khoảng [y i - h/2; y i + h/2) k là số các khoảng n là kích thước mẫu

Việc chọn số khoảng và độ rộng các khoảng phụ thuộc vào vấn đề nghiên cứu và kinh nghiệm của người nghiên cứu Một gợi ý hữu ích để xác định số khoảng tối ưu là chọn số k nguyên nhỏ nhất sao cho 2^k ≥ n, trong đó n là kích thước mẫu Ví dụ, với kích thước mẫu từ 9 đến 16, số khoảng k là 4; từ 17 đến 32, số khoảng là 5; từ 33 đến 64, số khoảng là 6; từ 65 đến 128, số khoảng là 7; từ 129 đến 256, số khoảng là 8; và từ 257 đến 512, số khoảng là 9 Việc chọn đúng số khoảng giúp phân tích dữ liệu hiệu quả hơn, phù hợp với quy mô mẫu và tính chất nghiên cứu.

Các phương pháp mô tả số liệu thực nghiệm

- Bảng phân phối tần số thực nghiệm và tần suất thực nghiệm:

Nếu một mẫu ngẫu nhiên kích thước n của X nhận giá trị x i với tần số xuất hiện r i , f i = n r i g i là tần suất của x i trong đó i = 1, , k, x 1 < < x k , r 1 + + r k = n

Khi đó ta có thể mô tả mẫu ngẫu nhiên qua bảng phân phối tần số thực nghiệm và tần suất thực nghiệm của X nhƣ sau:

- Bảng phân phối tần số ghép lớp:

Khi mẫu có kích thước lớn hoặc các giá trị của biến X có giá trị gần nhau nhưng khác nhau, người ta thường phân chia thành các khoảng y₁, y₂, , y_k để dễ dàng xử lý dữ liệu Mỗi giá trị của X sẽ thuộc vào một trong các khoảng này, giúp xây dựng bảng phân phối tần số ghép lớp một cách rõ ràng và chính xác hơn Bảng phân phối tần số ghép lớp gồm các cột thể hiện các khoảng y₁, y₂, , y_k cùng với các tần số n₁, n₂, , n_k ứng với từng khoảng, giúp mô tả phân bố của dữ liệu một cách trực quan Phân chia dữ liệu thành các khoảng như vậy là kỹ thuật phổ biến trong thống kê để dễ dàng phân tích và trình bày các mẫu dữ liệu lớn hoặc có giá trị gần nhau.

Trong đó : y i+1 - y i = h n i là số các giá trị quan sát thuộc nửa khoảng [y i - h/2; y i + h/2) k là số các khoảng n là kích thước mẫu

Việc chọn số khoảng và độ rộng các khoảng phụ thuộc vào vấn đề nghiên cứu và kinh nghiệm của người nghiên cứu Một gợi ý hữu ích để xác định số khoảng tối ưu là chọn số k nguyên nhỏ nhất sao cho 2^k ≥ n, trong đó n là kích thước mẫu Các ví dụ về phạm vi số mẫu tương ứng với số khoảng k như sau: từ 9 đến 16 mẫu tương ứng với k = 3, từ 17 đến 32 mẫu tương ứng với k = 4, từ 33 đến 64 mẫu tương ứng với k = 5, từ 65 đến 128 mẫu tương ứng với k = 6, từ 129 đến 256 mẫu tương ứng với k = 7, và từ 257 đến 512 mẫu tương ứng với k = 8 Việc chọn số khoảng phù hợp giúp phân chia dữ liệu một cách hợp lý, nâng cao độ chính xác của phân tích.

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

- Mô tả mẫu ngẫu nhiên hai chiều:

Giả sử ta có mẫu ngẫu nhiên hai chiều W = [(X 1 , Y 1 ), (X 2 , Y 2 ), , (X n , Y n )] Khi đó ta sắp xếp các giá trị thành phần của X và Y theo thứ tự tăng dần: x 1 < x 2 < < x i < x h và y 1 < y 2 < < y j < < y k

Kí hiệu n ij là tần suất của cặp giá trị (x i , y j ), rõ ràng các tần suất n ij thỏa mãn hệ thức ij

 = 1 Lúc đó mẫu ngẫu nhiên hai chiều W = [(X 1 , Y 1 ), (X 2 , Y 2 ), , (X n , Y n )] đƣợc mô tả theo bảng sau:

HỆ SỐ TƯƠNG QUAN

Hệ số tương quan Pearson

Hệ số tương quan mẫu rXY đo lường mức độ liên hệ giữa hai biến X và Y trong một mẫu ngẫu nhiên hai chiều Khi quan sát vectơ ngẫu nhiên (X, Y), giả sử mẫu gồm n phần tử {(Xi, Yi), i = 1, , n}, thì công thức tính hệ số tương quan mẫu rXY giúp xác định mức độ phụ thuộc tuyến tính giữa X và Y trong dữ liệu mẫu Đây là chỉ số quan trọng trong thống kê mô tả mối liên hệ giữa hai biến, góp phần tối ưu hóa các mô hình dự báo và phân tích dữ liệu.

; X và Y là các biến ngẫu nhiên tuân theo quy luật phân phối chuẩn

Hệ số r còn được gọi là hệ số Pearson, là chỉ số đo lường mức độ tương quan giữa hai biến số Đây là công cụ quan trọng trong thống kê do nhà thống kê nổi tiếng Karl Pearson phát triển vào đầu thế kỷ XX Hệ số r giúp xác định mức độ mạnh yếu và hướng của mối quan hệ giữa các yếu tố trong nghiên cứu thống kê.

Hệ số tương quan r là chỉ số không có đơn vị, luôn nằm trong khoảng từ -1 đến 1 Khi hệ số r dương, điều này phản ánh rằng biến số X và Y biến động cùng chiều, tức là khi X tăng thì Y cũng tăng và ngược lại Ngược lại, nếu hệ số r âm, nó cho thấy X và Y thay đổi theo chiều ngược lại, tức là khi X tăng thì Y giảm Vì vậy, hệ số tương quan r giúp xác định mối liên hệ giữa hai biến một cách rõ ràng và chính xác.

- Ý nghĩa của hệ số tương quan:

Hệ số tương quan r Ý nghĩa

0,01 < r < 0,1 Mối tương quan quá thấp không đáng kể 0,2 < r < 0,3 Mối tương quan thấp

0,4 < r < 0,5 Mối tương quan trung bình 0,6 < r < 0,7 Mối tương quan cao r > 0,8 Mối tương quan rất cao

- Ví dụ: Ðể thấy được đặc tính của r, bốn trường hợp sau đây trình bày sự liên hệ tuyến tính giữa X và Y tương ứng với các giá trị của r

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Hệ số tương quan hạng Spearman

Hệ số tương quan tính được từ kỹ thuật Spearman là kết quả của việc xếp hạng các số liệu, mà không dùng giá trị thực của chúng

Giả sử ta có hai biến X và Y h số Spearman được tính như sau: Sắp xếp c c gi trị của X thành c c hạng theo thứ tự t ng hoặc giảm ta được c c hạng

R X sắp xếp c c gi trị của Y tương ứng ta được c c hạng R Y , d i là sự chênh l ch của hai hạng tương ứng khi đó h số Spearman được tính bằng:

- Ý nghĩa: Hệ số Spearman có khoảng giá trị biến thiên và cách diễn đạt giống nhƣ hệ số Pearson r.

SỬ DỤNG SPSS ĐỂ TÌM HIỂU VỀ TƯƠNG QUAN

GIỚI THIỆU VỀ SPSS

SPSS (viết tắt của Statistical Package for the Social Sciences) là phần mềm phân tích thống kê chuyên dụng, giúp người dùng xử lý và phân tích dữ liệu một cách dễ dàng và chính xác Ra đời từ năm 1968, thế hệ đầu tiên của SPSS ban đầu chủ yếu được sử dụng trên các máy chủ tại Mỹ, đáp ứng nhu cầu nghiên cứu trong lĩnh vực xã hội học.

SPSS là phần mềm cung cấp hệ thống quản lý dữ liệu và khả năng phân tích thống kê hiệu quả, phù hợp với người mới bắt đầu Với giao diện thân thiện, dễ sử dụng trong môi trường đồ họa, SPSS giúp người dùng thao tác dễ dàng qua các trình đơn mô tả và hộp thoại đơn giản Đây là công cụ lý tưởng để tiến hành phân tích dữ liệu một cách nhanh chóng và chính xác.

SPSS là phần mềm thống kê đƣợc sử dụng rộng rãi trong nhiều nghành khoa h c khác nhau nhƣ: Xã hội h c, Y h c, Nhân h c, Tâm lý h c, Kinh tế h c, Marketing

2.1.2 Các chức năng chính của SPSS

 Nhập và làm sạch dữ liệu

 Xử lý biến đổi và quản lý dữ liệu

 Tóm tắt, tổng hợp dữ liệu và trình bày dưới các dạng biểu bảng, đồ thị bản đồ

 Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả

2.1.3 Những lĩnh vực ứng dụng của SPSS

SPSS đƣợc các nhà khoa h c sử dụng rộng rãi cho các nghiên cứu trong nhiều lĩnh vực nhƣ:

 Ứng dụng SPSS trong nghiên cứu tâm lý h c: Tâm lý tội phạm, tâm lý h c sinh - sinh viên

 Ứng dụng SPSS trong nghiên cứu xã hội h c: đánh giá chất lƣợng dịch vụ công, xin ý kiến người dân trong việc xây lại khu chung cư,

 Ứng dụng SPSS trong nghiên cứu kinh doanh: nghiên cứu và định hướng phát triển sản phẩm, mở rộng thị trường, sự hài lòng của khách hàng,

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

 Ứng dụng SPSS trong nghiên cứu đa dạng sinh h c, phát triển nông lâm nghiệp

 Ứng dụng SPSS trong nghiên cứu y sinh

2.1.4 Các thành phần chính của SPSS

Môi trường làm việc của SPSS gồm hai phần:

The SPSS Data Editor is a powerful tool for preparing input data, featuring two main views: Data View and Variable View It allows users to define, input, and edit data directly or import datasets from existing files This functionality ensures efficient data management and accurate data entry for statistical analysis in SPSS.

 Phần kết quả đầu ra Output SPSS Viewer, Output SPSS Viewer chứa các kết quả sau khi chạy các phép toán

Cài đặt SPSS 16.0 sử dụng đĩa CD SPSS 16.0

Hình 1 Các Thƣ mục trong đĩa CD SPSS16

Bước 1: Nhấp chuột vào biểu tượng Keygen (Xem Hình 2)

→ Hình 3 xuất hiện Hình 2: Biểu tƣợng Keygen ở thƣ mục E:\KEYGEN

Hình 3: Hộp thoại SPSSv16.Keygen

Trong Hình 3, bấm vào nút Generate Keygen sẽ cung cấp :

- Serial Number và Authorization Code (Dãy số nhận đƣợc có thể khác với số trong Hình 3)

- Trong ví dụ này: Serial Number là 985015 và Authorization Code là 32AC429E342387705258

Tiếp theo bôi đen con số 9850150046 và bấm CTRL-C (để lát nữa dán vào nơi yêu cầu)

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Còn mã 32AC429E342387705258, lát nữa sẽ sử dụng đến nó

Bước 2: Ch n biểu tượng trong thư mục gốc của ổ đĩa E:\ (Xem Hình 1) Hình 4 xuất hiện

Ch n Single user license, và bấm Next → Hình 6

Ch n I accept the terms in the license agreement, bấm Next → Hình 7

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Hình 8 Trong hình 8, Vùng User Name, và Organization tự nhập

Vùng Serial Number: nhấp chuột vào đó và bấm CTRL-V để dán số Serial Number mà Keygen đã cung cấp ở Hình 3

Hình 11 Đợi vài phút để Install các thành phần của SPSS vào máy tính, khi nào nút Next đậm lên bấm Next

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Trong quá trình Install sẽ có Hộp thoại nhƣ Hình 12 xuất hiện, hãy bỏ dấu ch n ở mục Register with spss.com, rồi bấm OK → Hinh13

Hình 13 Khi hộp thoại Hình 13 xuất hiện, mặc định ch n License my product now

Khi Hình 15, xuất hiện, hãy Quay trở lại Keygen (Hình 1) và Copy mã Authorization Code là 32AC429E342387705258 và dán vào mục Enter Code, Ch n Next → Hình 16

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Hình 16 Trong Hình 16, ch n Telephone, rồi bấm Next → Hình 17

Hình 17 Trong hình này SPSS đã cung cấp Lock Code là 100-2138B( có thể là số khác), hãy bôi đen con số 2138B bấm CTRL-C và ch n Next → Hình 18

Hình 18 Hình 18 yêu cầu phải nhập License Code

Quay trở lại Hộp thoại Keygen

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

To generate your activation code, start by opening the Keygen dialog box, then locate the Lock Code and Product/Feature area The number 100 is pre-filled; simply press CTRL+V to paste the code 2138B into the blank field Next, click the Generate button below to produce a long, unique activation key This process ensures you receive a valid serial number for your software.

4PNUPQJ2PZHTK68SC4KDZHFOK58PDKGLSWWDTUADDLFNDY GYDQTJ4LHGR8XU6IUDM3GII8AANV3BYV6PZ7IR3H# Đánh dấu khối toàn bộ mã số này rồi Copy vào mục License Code của

Hình 19 Bây giờ ch n Next → Hình 20

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Ch n Finish Nhƣ vậy SPSS 16 đã cài đặt xong Để khởi động SPSS 16 có thể thao tác nhƣ Hình 22 hoặc đƣa biểu tƣợng ra ngoài destop cho tiện

SPSS VỚI PHÂN TÍCH TƯƠNG QUAN

2.2.1 SPSS với phân tích tương quan Pearson

Ví dụ 1: Sử dụn SPSS để tìm mố tươn quan ữa độ tuổ và hàm lượn cholesterol trong máu

Nhà nghiên cứu tiến hành đo lường hàm lượng cholesterol trong máu của

18 đối tượng nam Kết quả đo lường như sau: Độ tuổi Cholesterol(mg/dl)

- Khai báo tên biến : Ch n Variable View - khai báo tên biến theo hàng

- Khai báo dữ liệu của biến: Ch n Data View - Khai báo dữ liệu của biến theo cột

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Bướ 2: Sử dụng SPSS tính hệ số tương quan r

 Từ thực đơn d c ch n Analyse/Correlate/Bivariate

 Từ danh sách biến đƣa hai biến độ tuổi và cholesterol chuyển vào hộp Variable bằng cách nhấp chuột lên

 Kích vào Pearson để ch n hệ số tương quan r

 Kích vào OK cho ta kết quả theo bảng sau:

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Dựa trên kết quả phân tích, hệ số tương quan giữa độ tuổi và hàm lượng Cholesterol là r = 0.872, cho thấy có mối quan hệ tích cực cao giữa hai biến này Điều này có nghĩa là khi độ tuổi của đối tượng tăng, hàm lượng Cholesterol cũng có xu hướng tăng theo, phản ánh mối liên hệ rõ rệt giữa tuổi tác và mức Cholesterol trong nhóm nghiên cứu.

Nếu mối tương quan này lặp lại ở các nhóm đối tượng khác chúng ta có thể dựa vào độ tuổi để tiên đoán hàm lƣợng Cholesterol

Ví dụ 2 trình bày về một chiến dịch quảng cáo du lịch được đăng trên 17 tờ báo hoặc tạp chí Nội dung này liên quan đến hai biến liên hệ được thể hiện rõ trong bảng, giúp phân tích hiệu quả của chiến dịch tiếp thị này Quảng cáo đa dạng trên nhiều phương tiện truyền thông góp phần nâng cao nhận thức và thu hút khách hàng mục tiêu Việc sử dụng nhiều kênh truyền thông trong chiến dịch giúp mở rộng phạm vi tiếp cận và tăng khả năng thành công của quảng cáo du lịch.

Chi phí quảng cáo (Trăm nghìn đồng)

- Khai báo tên biến : Ch n Variable View - khai báo tên biến theo hàng

- Khai báo dữ liệu của biến: Ch n Data View - Khai báo dữ liệu của biến theo cột

Bướ 2: Sử dụng SPSS tính hệ số tương quan r

 Từ thực đơn d c ch n Analyse/Correlate/Bivariate

 Từ danh sách biến đƣa hai biến Chi phí quảng cáo và Tỉ suất lợi nhuận chuyển vào hộp Variable bằng cách nhấp chuột lên

 Kích vào Pearson để ch n hệ số tương quan r

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

 Kích vào OK cho ta kết quả theo bảng sau:

Kết quả phân tích cho thấy hệ số tương quan giữa Chi phí quảng cáo và lợi nhuận là r = -0.436, cho thấy hai biến có mối quan hệ nghịch chiều Tuy nhiên, mức độ tương quan này không mạnh, phản ánh rằng chi phí quảng cáo và lợi nhuận không có mối liên hệ chặt chẽ, ảnh hưởng lẫn nhau ở mức độ hạn chế.

2.2.2 SPSS với phân tích tương quan Spearman

Trong ví dụ về chi phí quảng cáo và tỉ suất lợi nhuận, chúng ta sử dụng bảng xếp hạng để tính hệ số tương quan Spearman theo định nghĩa Phương pháp này giúp đánh giá mức độ liên quan giữa hai biến số một cách chính xác và phù hợp trong phân tích dữ liệu thống kê Việc áp dụng hệ số tương quan Spearman là quan trọng để xác định mối liên hệ phi tuyến giữa chi phí quảng cáo và lợi nhuận, từ đó hỗ trợ các quyết định chiến lược kinh doanh hiệu quả hơn.

Bảng xếp hạng Chi phí quảng cáo (x i ) và Tỉ suất lợi nhuận (y i ) trên 17 tờ báo và tạp chí: x i hạng y i hạng x i hạng y i hạng

Sử dụng công thức tính hệ số tương quan hạng Spearman ta có:

Ứng dụng SPSS để tính hệ số tương quan hạng Spearman thực hiện các bước tương tự như khi tính hệ số tương quan Pearson, nhưng điểm khác biệt nằm ở bước xử lý dữ liệu Trong bước này, ta sẽ chuyển đổi dữ liệu thành các hạng vị trí xếp thứ tự trước khi tính hệ số tương quan Spearman Việc sử dụng SPSS giúp thực hiện quá trình tính toán dễ dàng, chính xác và nhanh chóng hơn, đồng thời phù hợp cho dữ liệu không tuân theo phân phối chuẩn Hệ số tương quan hạng Spearman đo lường mức độ mạnh mẽ của mối liên hệ giữa hai biến dựa trên thứ tự xếp hạng, thích hợp cho nghiên cứu có dữ liệu dạng thứ tự hoặc không đều.

2 ta tích vào Spearman để tính hệ số tương quan

Stt.010.Mssv.BKD002ac.email.ninhd 77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77.77.99.44.45.67.22.55.77.C.37.99.44.45.67.22.55.77t@edu.gmail.com.vn.bkc19134.hmu.edu.vn.Stt.010.Mssv.BKD002ac.email.ninhddtt@edu.gmail.com.vn.bkc19134.hmu.edu.vn

Ta có kết quả cho bởi bảng sau:

Ngày đăng: 21/08/2023, 01:11

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w