PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU Tên đề tài Phương pháp phân tích dữ liệu GVHD TS Trần Thị Út Nhóm thực hiện Nhóm hổ con PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU I PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG • Xác địn[.]
Trang 1PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU
I PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU ĐỊNH LƯỢNG
• Xác định những vấn đề chủ yếu bạn cần xem xét khi chuẩn bị dữ liệu định lượng cho phân tích và khi phân tích những dữ liệu này bằng máy tính
• Nhận ra những loại dữ liệu khác nhau và hiểu được hàm ý của mỗi loại dữ liệu cho những phân tích về sau
• Lập ma trận và mã hoá dữ liệu để phân tích bằng máy tính
• Lựa chọn những bảng dữ liệu và biểu đồ thích hợp nhất để thăm dò và minh họa cho những khía cạnh khác nhau của dữ liệu;
• Lựa chọn những số thống kê thích hợp nhất để mô tả từng biến số và để xem xét các quan hệ giữa những biến số và các xu hướng trong dữ liệu của bạn;
• Diễn dịch chính xác các bảng, biểu đồ và các số thống kê mà bạn sử dụng
1 Giới thiệu
Những dữ liệu định lượng ở dạng thô nghĩa là những dữ liệu trước khi được
xử lý và phân tích chuyển tải rất ít ý nghĩa với hầu hết mọi người Do đó những dữ liệu này cần phải được xử lý để làm chúng hữu dụng hơn, nghĩa là chúng chuyển thành thông tin
Các phân tích định lượng như biểu đồ, đồ thị và thống kê cho phép chúng ta thực hiện điều này; giúp thăm dò, trình bày, mô tả và xem xét các quan hệ và xu hướng trong dữ liệu
2 Chuẩn bị, nhập, và kiểm tra dữ liệu
Trang 2 Tác động của việc mã hoá dữ liệu trên những phân tích về sau (cho những loại dữ liệu khác nhau)
2.1 Các loại dữ liệu
định được bằng số như số lượng
Không Có
Dữ liệu có thể
được đo theo
số liệu
Thu thập dữ liệu cho một biến số
Dữ liệu phân loại được phân loại Dữ liệu có thể
vào hơn hai tập
dữ liệu?
Dữ liệu mô tả (lưỡng phân)
Dữ liệu định lượng
Các tập này có thể được xếp thứ
tự theo hạng?
Dữ liệu mô tả (chỉ danh )
Dữ liệu xếp hạng (thứ tự)
Dữ liệu khoảng
Về lý thuyết dữ liệu
có thể lấy bất kỳ giá trị trong một phạm vi nào đó?
Dữ liệu liên tục
Sự khác biệt tương đối giữa hai giá trị dữ liệu
có thể tính được
Dữ liệu dạng tỷ
lệ Dữ liệu rời rạc
Có Không
Không
Có
Không
Có
Trang 32.2 Trình bày dữ liệu
Hầu như mọi phần mền phân tích đều chấp nhận dữ liệu nếu chúng được nhập ở dạng bảng
Mỗi cột thường tượng trưng cho một biến số riêng biệt và thu thập dữ liệu cho biến số này Mỗi hàng trong ma trận chứa những biến số cho từng tình huống,
đó là một đơn vị thu thập dữ liệu
2.3 Mã hoá
Mã Hoá dự liệu có thể định lượng: các con số thực tế thường được sử dụng như mã số cho dữ liệu có thể định lượng, mặc dù có thể không đòi hỏi mức chính xác này
Mã hoá dữ liệu phân loại : thường được áp dụng cho dữ liệu kiểu phân loại với đôi chút cân nhắc, mặc dù bạn có thể thiết kế một chương trình mã hoá sẽ phân tích về sau trở nên đơn giản nhiều hơn Sử dụng các chương trình mã hoá :
– Tiết kiệm thời gian
– Thường đã được kiểm định tốt
– Cho phép so sánh đối chiếu kết quả của bạn với các khảo sát khác
Mã hoá khi thu thập dữ liệu
Mã hoá dữ liệu bị thiếu
2.4 Nhập dữ liệu
Sau khi dữ liệu được mã hoá có thể nhập chúng vào máy tính Phần mền phân tích dữ liệu ngày càng chứa các thuật toán để kiểm tra những sai sót về dữ liệu dễ thấy trong quá trình nhập Cần phải cẩn thận để đảm bảo rằng dữ liệu được nhập đúng
Trang 42.5 Kiểm tra các sai sót
• Tìm kiếm những mã không hợp lệ
• Tìm kiếm những quan hệ không logic
• Kiểm tra có tuân thủ nguyên tắt trong các câu hỏi lộc
• Với một sai lầm nào xảy ra cần xem xét nó xảy ra khi mã hoá hay khi nhập
dữ liệu để chỉnh sữa
• Viết số nhận dạng trên biểu thu thập dữ liệu và nhập nó cùng với các dữ liệu khác vào trong ma trận
2.6 Tính trọng số của các phân tử: (tình huống)
• Tính toán tỉ lệ phần trăm tổng thể hồi đáp cho mỗi tầng
• Xác định tầng nào có phần trăm tổng thể hồi đáp cao nhất
• Tính toán trọng số cho mỗi tầng bằng cách sử dụng công thức sau:
• Trọng số = Tỷ lệ tổng thể hồi đáp cao nhất cho mỗi tầng bất kỳ/ tỷ lệ tổng thể hồi đáp trong tầng tính toán trọng số
• Áp dụng trọng số thích hợp cho mỗi phần tử
3 Khám phá và trình bày dữ liệu
Phương pháp phân tích dữ liệu khám phá:
Nhấn mạnh việc sử dụng các biểu đồ để khám phá và hiểu các dữ liệu, nhấn mạnh tầm quan trọng của việc sử dụng dữ liệu để hướng dẫn lựa chọn các kỹ thuật phân tích
Cung cấp cho sự linh hoạt để đưa vào những phân tích chưa dự kiến trước nhằm đáp ứng các phát hiện mới
Xem xét từng biến và những thành phần của nó
Trang 5– Các giá trị cụ thể
– Giá trị thấp nhất và cao nhất
– Các xu hướng theo thời gian
– Các tỉ lệ
– Các phân bố
– Các điểm nối kết
– Các tổng số
– Sự phụ thuộc lẫn nhau và các quan hệ
3 1 Khám phá và trình bày từng biến
– Thể hiện các giá trị cụ thể
– Thể hiện các giá trị cao nhất và thấp nhất: thông qua biểu đồ hình ảnh
và biểu đồ thanh, biểu đồ tần số, biểu đồ đa giác tần số – Thể hiện xu hướng
– Thể hiện tỉ lệ: phần trăm xuất hiện dùng biểu đồ hình quạt
– Thể hiện sự phân bố của các giá trị
3 2 So sánh các biến:
– Thể hiện các giá trị cụ thể và sự phục thuộc lẫn nhau: Bảng dữ liệu ngẫu nhiên, bảng dữ liệu chéo
– So sánh giá trị cao nhất và giá trị thấp nhất: Biểu đồ nhiều thanh
– So sánh các tỉ lệ
– So sánh các xu hướng và các điểm giao nhau
– So sánh các tầng số
– So sánh các tỉ lệ và các tổng số
– So sánh sự phân bố các giá trị
– Thể hiện quan hệ giữa các phần tử của các biến
Trang 64 Mô tả dữ liệu thống kê:
4.1 Mô tả xu hướng trung tâm: cho các mẫu và các tổng thể cho ta ấn tượng chung về các giá trị phổ biến, như giá trị giữa hay trung bình.
– Giá trị xuất hiện thường xuyên nhất (mode): là giá trị có số lần xuất hiện nhiều nhất Đối với dữ liệu mô tả, số mode là số đo duy nhất của
xu hướng trung tâm có thể được diễn giải hợp lý nhất
– Giá trị nằm giữa hoặc điểm nằm giữa sau khi dữ liệu đã được xếp hạng tất cả các giá trị theo trật tự tăng dần rồi tìm điểm chính giữa trong phân bố
– Giá trị thường được gọi là trị trung bình bao gồm mọi giá trị khi tính toán
– Thể hiện giá trị xuất hiện thường xuyên nhất
4.2 Mô tả sự phân tán:
• Sự khác biệt trong 50% giá trị khoảng giữa (khoảng tứ phân vị)
• Mức độ khác biệt của các giá trị so với trị trung bình (độ lệch chuẩn)
5 Xem xét các quan hệ, các khác biệt và các xu hướng trong dữ liệu
• Kiểm định các quan hệ và sự khác biệt có ý nghĩa
• Những sai lầm loại I và loại II
• Kiển định hai biến có liên kết với nhau hay không?;
• Kiểm định hai nhóm có khác nhau không?;
• Kiểm định ba nhóm trở lên có khác biệt hay không?
• Đánh giá cường độ của quan hệ;
• Đánh giá cường độ của quan hệ giữa một cặp biến;
• Đánh giá cường độ của quan hệ nhân quả giữa các biến;
Trang 7• Dự báo giá trị của một biến từ một hay nhiều biến khác;
• Xem xét xu hướng
• So sánh các xu hướng
• Xác định các xu hướng và dự báo
II PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH
phương pháp khác nhau
1 Những khác biệt giữa dữ liệu định tính và dữ liệu định lượng:
Dựa trên những ý nghĩa bắt nguồn từ các
con số
Dựa trên ý nghĩa được diễn đạt qua từ ngữ
Việc thu thập đem lại những dữ liệu bắng
số và tiêu chuẩn hoá
Việc thu thập đem lại những dữ liệu phi tiêu chuẩn hoá đòi hỏi phải phân loại thành các loại
Việc phân tích được thực hiện thông qua
sử dụng các biểu đồ và các số thống kê
Việc phân tích được thực hiện thông qua
sử dụng việc khải niệm hoá
Trang 82 Chuẩn bị dữ liệu để phân tích
• Biên soạn dữ liệu định tính: vấn đề là phải đảm bảo rằng bản ghi chép là chính xác bằng cách chỉnh sửa các lỗi biên soạn quá trình này được biết với tên làm sạch dữ liệu
• Sử dụng dữ liệu văn bản điện tử bao gồm các tài liệu được soạn
– Được ẩn danh một cách thích hợp, chẳng hạn như sử dụng những mã riêng biệt cho bạn và những người tham dự khác nhau
– Được lưu trữ thích hợp để phân tích, chẳng hạn như mỗi file cho một cuộc phỏng vấn, mỗi biên bản hội nghị cho mỗi chính sách tổ chức;
3 Tổng quan về phân tích định tính
Những giai đoạn trong quá trình phân tích dữ liệu định tính và các phương pháp khác nhau
• Hiểu các đặc điểm của ngôn ngữ
• Khám phá những quy tắt
• Hiểu được ý nghĩa của văn bản hoặc hành động
• Tư duy phân tích
Hoạt động phân tích định tính:
– Phân loại
– “Hợp nhất “ dữ liệu
– Nhận biết các quan hệ và phát triển các loại
– Phát triển và kiểm định các giả thiết hoặc các mệnh đề
– Bản chất tương tác của quá trình
Trang 9– Phương tiện hỗ trợ phân tích
– Tóm tắt
– Bản tự ghi nhớ
– Nhật ký của người nghiên cứu
4 Các phương pháp phân tích định tính
Sử dụng mô hình lý thuyết hoặc mô tả: xác định những biến, thành phần, chủ đề và vấn đề chính trong dự án nghiên cứu, những quan hệ dự báo hay giải định giữa chúng
Khám phá dữ liệu không có mô hình lý thuyết hay mô tả xác định trước: khi chỉ đơn giản tiến hành thu thập dữ liệu, mà không nghiên cứu xem xét đánh giá những chủ đề nào nổi lên từ dữ liệu đó khi tiếp tục nghiên cứu
5 Các thủ tục phân tích trên cơ sở quy nạp, diễn dịch:
5.1 Phân tích trên cơ sở diễn dịch:
Tìm dạng thức tương xứng
Thiết lập giải thích
Tác động của phương pháp diễn dịch đến quá trình phân tích
5.2 Phân tích trên cơ sở Quy nạp:
Trình bày và phân tích dữ liệu
Phân tích dạng thức
Quy nạp phân tích
Lý thuyết nền tảng
Phân tích ngôn từ
Phân tích tường thuật
Lý thuyết nền tảng:
Trang 10Mã hoá mờ: việc phân tách dữ liệu thành những đơn vị
Mã hoá trục: Quá trình nhận biết các quan hệ giữa các loại dữ liệu
Mã hoá chọn lọc: là việc hợp nhất các loại dữ liệu để tạo ra lý thuyết
6 Định hướng hoá dữ liệu định tính
Là trường hợp khi bạn muốn tính toán tần số của các sự kiện nào đó, hoặc vì
những lý do đặc biệt nào đó, hoặc liên quan đến hiện tượng cụ thể
7 Sử dụng CAQDAS cho phân tích định tính
– Quản lý dự án và tổ chức dữ liệu
– Tính chặt chẽ đối với dữ liệu và sự tương tác
– Khám phá dữ liệu
– Mã hoá và truy xuất
– Tìm kiếm và thẩm định để xây dựng giả thuyết và lý thuyết
– Viết các bản ghi nhớ, những nhận xét ghi chú về ý tưởng của đề tài – Đầu ra