Thống Kê Kinh Doanh Và SPSS Giới thiệu chung về SPSS Khái niệm thống kê mô tả là gì? Kiểm định so sánh và trung bình mẫu Kiểm định và các mối quan hệ Kiểm soát quá trình sản xuất bằng thống kê Phân tích hồi quy tương quan Phân tích dãy số thời gian
Trang 1THỐNG KÊ KINH DOANH
VÀ SPSS
Trang 2lý dữ liệu
III
Khái quát
về phân tich dữ liệu Bài 1
GiỚI THIỆU CHUNG VỀ SPSS
Trang 31 Giới thiệu chung về SPSS
Là phần mềm chuyên dụng xử lý thông tin sơ cấp (thông tin được thu thập trực tiếp từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thông qua một bảng câu hỏi được thiết kế sẵn
Trang 5Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở
dữ liệu bao
hàng và các
ô giao nhau giữa cột và hàng
Cột (Column): Đại diện
cho biến quan sát
Trang 6Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở
dữ liệu bao
hàng và các
ô giao nhau giữa cột và hàng
Hàng (Row): Đại diện
cho một trường hợp quan sát (người trả lời),
Trang 7Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở
dữ liệu bao
hàng và các
ô giao nhau giữa cột và hàng
Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời
tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát) Ô là sự kết hợp của đối tượng và biến Các ô chỉ chứa các trị số biến
Trang 8Màn hình quản lý dữ liệu
(data view)
Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở
dữ liệu bao
hàng và các
ô giao nhau giữa cột và hàng
File dữ liệu có hình chữ nhật Hai hướng
của file dữ liệu được xác định bởi số lượng các
đối tượng và số lượng các biến Không có các
ô “trống rỗng” trong các đường biên của file
dữ liệu Đối với các biến dạng số, các ô rỗng
được chuyển thành trị số khuyết thiếu hệ
thống Đối với các biến dạng chuỗi, một dấu
cách vẫn được coi là một trị số
Trang 9Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Tên biến (name): Là tên đại
diện cho biến, tên biến này sẽ được hiễn thị trên đầu mỗi cột trong màn hình dữ liệu
Trang 10Màn hình quản lý biến
(variables view)
Các qui tắc dưới đây được áp dụng cho tên biến:
•Tên phải bắt đầu bằng một chữ Các ký tự còn lại có thể là bất kỳ chữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $.
•Tên biến không được kết thúc bằng một dấu chấm.
•Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (để tránh xung đột với các biến được tự động lập bởi một vài thủ tục)
•Độ dài của tên biến không vượt quá 8 ký tự.
•Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được
sử dụng
•Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp Không được dùng chữ hoa để đặt tên biến Các tên NEWVAR, NewVar, và newvar được xem là giống nhau.
Trang 11Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Loại biến (type): Thể hiện
dạng dữ liệu thể hiện trong biến Dạng số, và dạng chuỗi
Trang 12Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số hiễn thị cho giá trị (Width): Giá trị dạng
số được phép hiễn thị bao nhiêu con số
Trang 13Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Số lượng con số sau dấu
phẩy được hiễn thị
(Decimals
Trang 14Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Nhãn của biến (label): Tên
biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến
Trang 15Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Giá trị trong biến (Values):
Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)
Trang 16Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Giá trị khuyết (Missing): Do thiết
kế bảng câu hỏi có một số giá trị chỉ mang tính chất quản lý, không
có ý nghĩa phân tích, để loại bỏ các biến này ta cần khai báo nó như là giá trị khuyết (user missing) SPSS mặc định giá trị khuyết (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi các phân tích thống kê
Trang 17Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Kích thướt cột
(columns): Cho
phép khai báo độ
rộng của cột
Trang 18Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Trang 19Màn hình quản lý biến
(variables view)
Là nơi quản lý các biến cùng với các thông số liên quan đến biến Trong màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó
Dạng thang đo (measures): Hiễn thị
dạng thang đo của giá trị trong biến
Trang 20Màn hình hiện thị kết quả
(output)
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồ thị và các kết quả kiểm định…., các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đuôi
là SPO) Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích
Trang 21Màn hình cú pháp (syntax)
Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh phân tích Các
cú pháp được lưu trữ sẽ được
sử dụng lại mà không cần thao tác các lệnh phân tích lại
Trang 223 Khái quát về phân tích dữ liệu
• Kiểm tra dữ liệu
• Thống kê mô tả
• Kiểm định thống kê
• Kiểm soát quá trình sản xuất
• Phân tích hồi quy
• Dãy số thời gian
Trang 233.1 Kiểm tra dữ liệu (Data Screening)
Xác định những giá trị vượt trội (Outliers) và các giá trị lỗi (Roque values)
• Sử dụng công cụ bảng phân bổ tần xuất ngoài việc để đếm số lần xuất hiện của từng giá trị riêng biệt, nó còn giúp ta tìm ra các giá trị lỗi hoặc các giá trị mã hóa sai sót hoặc không mong đợi
• Khảo sát hai hay nhiều biến cùng một lúc Đối với các biến dạng định danh (nominal) hoặc thứ bậc (ordinal) sử dụng công cụ bảng chéo ta có thế xác định được những sự kết hợp phi lý giữa hai hoặc nhiều biến
Trang 243.2 Thống kê mô tả (Descriptive Statistics)
• Mô tả dữ liệu (đo lường độ tập trung hay phân tán, tỷ lệ %, mối quan hệ giữa các biến,…)
• Cần phải nắm được loại biến (loại thang đo của biến)
Trang 253.3 Kiểm định các so sánh trung bình
mẫu (Tests for Comparing Means)
Kiểm định t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập
• Sử dụng kiểm định t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T Test) so sánh giá trị trung bình của một biến riêng biệt theo một nhóm có khác biệt hay không đối với giá trị trung bình của biến riêng biệt đó theo một nhóm khác
• Công cụ kiểm định t cho cặp mẫu (Paired-Samples T Test) kiểm định có hay không giá trị trung bình của các khác biệt giữa các cặp quan sát là khác giá trị 0.
• Công cụ kiểm định t một mẫu (One-Sample T Test) kiểm định có hay không giá trị trung bình của một biến là khác biệt với một giá trị giả định từ trước.
Trang 263.3 Kiểm định các so sánh trung bình
mẫu (Tests for Comparing Means)
Phân tích phương sai một chiều (One-Way ANOVA)
• Là một dạng mở rộng của phương pháp kiểm định t hai mẫu ngẫu nhiên độc lập được sử dụng để kiểm định cho nhiều hơn hai nhóm Phương pháp phân tích này khảo sát
sự biến thiên giữa các trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi nhóm
Trang 273.4 Kiểm định các mối quan hệ
(Testing Relationships)
• Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chi-bình phương để kiểm định giả thuyết ban
đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột
và biến hàng) là không có mối quan hệ với nhau (độc lập với nhau).
• Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa
các biến đang khảo sát không có tương quan với nhau (hệ
số tương quan R = 0)
Trang 283.4 Kiểm định các mối quan hệ
(Testing Relationships)
• Trong kiểm định mối quan hệ giữa hai biến, ta sử dụng kiểm định Chi-bình phương để kiểm định giả thuyết ban
đầu cho rằng hai biến thể hiện trong bảng chéo (biến cột
và biến hàng) là không có mối quan hệ với nhau (độc lập với nhau).
• Trong kiểm định tương quan giữa các biến ta sử dụng kiểm định F kiểm định giả thuyết ban đầu cho rằng giữa
các biến đang khảo sát không có tương quan với nhau (hệ
số tương quan R = 0)
Trang 293.5 Kiểm soát quá trình sản xuất
Trang 303.6 Phân tích hồi quy tương quan
(Regression)
• Phân tích sự phụ thuộc của biến nghiên cứu với 1 hoặc nhiều biến độc lập.
Trang 313.7 Phân tích dãy số thời gian
(Time series)
• Phân tích xu hướng (quy luật) biến động của hiện tượng qua thời gian.