CÁC KỸ THUẬT, PHẦN MỀM XỬ LÝ SỐ LIỆU ( ĐỊNH LƯỢNG), DỮ LIỆU ( ĐỊNH TÍNH) NGHIÊN CỨU CÔNG CHÚNG PHỔ BIẾN HIỆN NAY Phương pháp nghiên cứu định lượng (Quantitative research) là phương pháp thu thập các thông tin và dữ liệu dưới dạng số học, số liệu có tính chất thống kê để có được những thông tin cơ bản, tổng quát về đối tượng nghiên cứu nhằm phục vụ mục đích thống kê, phân tích. Nghiên cứu định tính(Qualitative research) là phương pháp thu thập các thông tin và dữ liệu dưới dạng ‘phi số’ để có được các thông tin chi tiết về đối tượng nghiên cứu, khảo sát hoặc điều tra (dưới đây gọi chung là ‘đối tượng nghiên cứu’) nhằm phục vụ mục đích phân tích hoặc đánh giá chuyên sâu.
Trang 1CÁC KỸ THUẬT, PHẦN MỀM XỬ LÝ SỐ LIỆU ( ĐỊNH LƯỢNG), DỮ LIỆU ( ĐỊNH TÍNH) NGHIÊN CỨU CÔNG CHÚNG PHỔ BIẾN HIỆN NAY
I MỘT SỐ KHÁI NIỆM
1 Định lượng
- Phương pháp nghiên cứu định lượng (Quantitative research) là phương pháp
thu thập các thông tin và dữ liệu dưới dạng số học, số liệu có tính chất thống kê
để có được những thông tin cơ bản, tổng quát về đối tượng nghiên cứu nhằmphục vụ mục đích thống kê, phân tích
- Nghiên cứu định tính(Qualitative research) là phương pháp thu thập các
thông tin và dữ liệu dưới dạng ‘phi số’ để có được các thông tin chi tiết về đốitượng nghiên cứu, khảo sát hoặc điều tra (dưới đây gọi chung là ‘đối tượngnghiên cứu’) nhằm phục vụ mục đích phân tích hoặc đánh giá chuyên sâu.Nhóm các phương pháp định lượng:
+ Bảng hỏi trắc nghiệm ( anket)
+ Phân tích tài liệu định lượng
+ Quan sát định lượng
+ Đo lường bằng thiết bị điện tử ( box meters)
II CÁC PHẦN MỀM XỬ LÝ SỐ LIỆU THỐNG KÊ PHỔ BIẾN
PHẦN MỀM SPSS
1 Tổng quan về phần mềm
SPSS (Statistical Product and Services Solutions) là một phần mềm thống kê, thôngthường dùng trong nghiên cứu xã hội đặc biệt là trong tâm lý học, tiếp thị và xã hộihọc
- Nền tảng phần mềm SPSS® cung cấp khả năng phân tích thống kê nâng cao,thư viện thuật toán học rộng lớn, phân tích văn bản, khả năng mở rộng nguồn
mở, tích hợp với dữ liệu lớn và triển khai liền mạch vào các ứng dụng
- Tính dễ sử dụng, tính linh hoạt và khả năng mở rộng giúp SPSS có thể truy cậpđược đối với người dùng ở mọi cấp độ kỹ năng
Trang 2SPSS bao gồm những điểm nổi bật sau:
- Tùy chọn phân tích thống kê trong phần mềm cơ sở
- Phân tích để hiểu rõ số liệu thống kê, quản trị cơ sở dữ liệu
- Bảng điều khiển đơn giản thích hợp cho mọi trình độ
- Xuất dữ liệu dưới dạng bảng và đồ thị thuận tiện cho phân tích
- Xử lý dữ liệu cho các dự án lớn, đưa ra quyết định chính xác
- Được lưu trữ với nhiều định dạng: SQL, Excel sheets, SAS, PDF, HTML, MSWord, Stata
- Thích hợp phân tích, nghiên cứu học thuật
● SPSS có chức năng:
- Nhập và làm sạch dữ liệu;
- Xử lý biến đổi và quản lý dữ liệu;
- Tóm tắt, tổng hợp dữ liệu và trình bày dưới các dạng biểu bảng, đồ thị,bản đồ;
- Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả
Cùng trong ibm.com, IBM SPSS Statistics, 2023, <IBM SPSS Statistics | IBM>,
SPSS có những đặc điểm sau:
Cụ thể phần mềm có các tính năng phổ biến sau:
● Khảo sát AFT: ước tính các mô hình tồn tại thời gian thất bại được tăng tốctheo tham số
Trang 3● Thủ tục Bayes: ước tính các yếu tố Bayes và phân phối sau cho các tham số.
● Phương tiện cận biên ước tính: nhóm so sánh có nghĩa là sử dụng cách tiếp cận
mô hình tuyến tính tổng quát
● Mạng nhận thức đa lớp (MLP): dự đoán hoặc phân loại kết quả bằng cách sửdụng mô hình mạng lưới thần kinh
Đối tượng sử dụng:
- Sinh viên, học viên tại các trường đại học
- Những người chuyên nghiên cứu xã hội
- Các nhà kinh doanh đang cần phân tích, nghiên cứu thị trường
- Các nhà nghiên cứu khoa học,…
2 Quy trình làm việc của phần mềm SPSS:
● Bước 1: Mở các files dữ liệu
Bạn thực hiện mở các files dữ liệu cần sử dụng theo định dạng file của SPSS hoặc bất
kỳ định dạng nào
Trang 4● Bước 2: Sử dụng dữ liệu
Từ dữ liệu đã mở, bạn sẽ sử dụng chúng bằng cách tính tổng và trung bình các cộthoặc các hàng dữ liệu
● Bước 3: Tạo các bảng và biểu đồ hình ảnh hấp dẫn bao gồm đếm các phổ biến
hay các thống kê tổng hợp (nhóm) thông qua các trường hợp
● Bước 4: Chạy các thống kê suy diễn như ANOVA, hồi quy và phân tích hệ số.
● Bước 5: Lưu (save) dữ liệu và đầu ra theo nhiều định dạng file.
● Nghiên cứu đa dạng sinh học
● Nghiên cứu khoa học trong phát triển nông lâm nghiệp
● Nghiên cứu tâm lý học: tâm lý tội phạm, tâm lý học sinh - sinh viên, tâm lý trẻ em,…
● Nghiên cứu thực trạng, phân tích nguyên nhân, nhân tố tác động, ảnh hưởng và
dự đoán xu hướng xảy ra trong tương lai
4 Ưu điểm và nhược điểm của SPSS:
● Ưu điểm:
- Công cụ phân tích thống kê cho phép nhập và xuất các tệp dữ liệu từ cácchương trình khác Một số quy trình xử lý dữ liệu của nó rất xuất sắc, vì khảnăng hợp nhất các tệp của nó, bất kể đó là cùng một chủ đề và các biến khácnhau hay các chủ đề khác nhau và cùng một biến, đều rất ổn
- Trong SPSS, người dùng không bị buộc phải làm việc với cú pháp, mặc dù cáctệp cú pháp có thể được lưu và sửa đổi khi cần Khi có các tệp cú pháp đã lưu,
nó sẽ giúp ích rất nhiều cho việc ghi chép và cũng đưa ra ý tưởng về cách tínhtoán các biến mới cũng như cách xử lý các giá trị bị thiếu
- Nó cung cấp câu trả lời đáng tin cậy và nhanh chóng
- Nó năng động và có các bảng và biểu đồ hữu ích
- Vì nó cung cấp nhiều ngôn ngữ nên nhiều người có thể truy cập
Trang 5- Quản lý dữ liệu hiệu quả Không cần nhiều nỗ lực để bắt đầu sử dụng phần
mềm
- Hữu ích cho cả dữ liệu định lượng và định tính Khả năng xảy ra lỗi rất ít với
SPSS
- Một trong những công cụ thống kê dễ dàng nhất để phân tích dữ liệu
- Người dùng SPSS có thể chọn loại biểu đồ phù hợp với yêu cầu phân phối dữ
liệu của họ
- Dễ sử dụng: chuẩn bị và phân tích dữ liệu thông qua giao diện người dùng trực
quan mà không cần phải viết mã bằng cách kéo và thả
- Tích hợp với nguồn mở: nâng cao cú pháp SPSS với R và Python bằng cách
sử dụng thư viện tiện ích mở rộng hoặc bằng cách xây dựng cú pháp của riêngbạn
- Toàn diện: chạy thống kê mô tả và phân tích hồi quy, xem các mẫu dữ liệu bị
thiếu và tóm tắt các phân phối bằng giao diện tích hợp
● Nhược điểm của SPSS:
- Không thể sử dụng SPSS để phân tích tập dữ liệu lớn Có một số lĩnh vực nhấtđịnh có một kho dữ liệu khổng lồ Trong những ngành như vậy, sử dụng SPSS
có thể không phải là lựa chọn tốt nhất
- Nếu các nhà nghiên cứu thu thập dữ liệu bằng các phương pháp sai lệch hoặcsai lệch thì kết quả phân tích thống kê sẽ không đưa ra câu trả lời đúng
PHẦN MỀM SAS
1 Giới thiệu phần mềm
Dạng đầy đủ của SAS là phần mềm Phân tích Thống kê Nó được tạo ra vào năm 1960
và được sử dụng cho: kinh doanh thông minh, phân tích dự đoán, phân tích mô tả và
mô tả, quản lý dữ liệu, v.v Kể từ đó, nhiều thủ tục và thành phần thống kê mới đã được giới thiệu trong phần mềm
● Có 4 loại phần mềm SAS:
– SAS cho Windows
– SAS Enterprise Guide (EG): Một IDE giống GUI, với các trình hướng dẫn để
hỗ trợ viết code cho các quy trình khác nhau
– SAS Enterprise Miner (EM): Một công cụ khai thác dữ liệu phân tích nâng cao, nhằm giúp người dùng nhanh chóng phát triển các mô hình mô tả và đề
Trang 6xuất, thông qua quy trình khai thác dữ liệu.
– SAS STAT Software: Phần mềm SAS này được sử dụng riêng cho các quy trình thống kê và bao gồm một loạt các tính năng
2 Tính năng
Phần mềm SAS này được sử dụng riêng cho các quy trình thống kê và bao gồm một loạt các tính năng:
Phân tích phương sai
● Thiết kế cân bằng và không cân bằng
● Phân tích phương sai đa biến và các phép đo lặp lại
● Mô hình tuyến tính
● Phân tích thêm các khả năng của phương sai
Thống kê mô tả
● Âm mưu hộp và râu
● Tính toán các tỷ lệ và rủi ro được tiêu chuẩn hóa trực tiếp và gián tiếp cho các quần thể nghiên cứu
● Nhiều khả năng thống kê mô tả hơn
Phân tích phân phối
● Ước tính mật độ nhân đơn biến và nhị biến
● Nhiều khả năng phân tích phân phối hơn
Hồi quy
● Hồi quy bình phương tối thiểu
● Hồi quy các thành phần chính
● 18 phương pháp tiêu chuẩn hóa
● Hàng trăm biểu đồ thống kê có sẵn với các phân tích
● Tùy chỉnh được cung cấp
● Khả năng đồ họa thống kê
- Phân tích tài chính và kế toán
- Quản lý danh mục đầu tư
- Phân tích dữ liệu y tế và chăm sóc sức khỏe
- Phân tích chuỗi thời gian và dự báo
- Quản lý dữ liệu và khai thác dữ liệu lớn
5 Ưu nhược điểm
Ưu điểm:
- Sức mạnh phân tích: SAS cung cấp một loạt các tính năng phân tích, bao gồm phân tích chiều hướng, phân tích hồi quy, phân tích hồi quy logistic và phân tích tuyến tính đa biến
- Tính linh hoạt và tích hợp: SAS có thể tích hợp với nhiều loại dữ liệu và có thể kết nối với nhiều nguồn dữ liệu khác nhau
- Dễ sử dụng và tự động hóa: SAS có thể tự động hóa các quy trình phân tích và
Trang 7giúp người dùng tiết kiệm thời gian và công sức.
- Mạnh mẽ và bền bỉ: SAS được xây dựng với công nghệ tiên tiến và cung cấp một môi trường làm việc đáng tin cậy và bền bỉ
Giao diện của phần mềm R
- R là một phần mềm sử dụng cho phân tích thống kê và vẽ biểu đồ
- R là ngôn ngữ máy tính đa năng, có thể sử dụng cho nhiều mục tiêu khác nhau,
từ tính toán đơn giản, toán học giải trí (recreational mathematics), tính toán matrận (matrix), đến các phân tích thống kê phức tạp
- Sử dụng R để phát triển thành các phần mềm chuyên môn cho một vấn đề tínhtoán cá biệt
2 Chức năng của phần mềm R
R là một trong những công cụ được các nhà nghiên cứu, nhà phân tích dữ liệu, nhàthống kê và nhà tiếp thị sử dụng để truy xuất, làm sạch, phân tích, trực quan hóa vàtrình bày dữ liệu
Trang 8- Lĩnh vực chăm sóc sức khỏe
- Truyền thông xã hội
- Thương mại điện tử
- Sản xuất
5 Ưu, nhược điểm của phần mềm R
Ưu điểm
– R có lợi thế là khả năng phân tích biểu đồ tuyệt vời
– R gắn liền với giới học thuật, hầu hết những mô hình thống kê mới nhất đều được hỗtrợ bởi R
– Chạy được trên nhiều hệ điều hành
– Số 1 trong các phần mềm miễn phí
Nhược điểm
– R dùng lệnh chứ không dùng menu như Excel
– Phải có hiểu biết cao về kinh tế lượng, thống kê và khả năng lập trình vì trong phântích đòi hỏi người dùng phải dùng các mã code để thực hiện các bước ước lượng vàkiểm định hay phân tích các vấn đề cần thiết trong dữ liệu
2 Chức năng chính của Eviews
● Phân tích dữ liệu chuỗi thời gian, dữ liệu chéo, dữ liệu mảng
● Thống kê mô tả dữ liệu
● Phân tích sự tác động của các yếu tố này lên các yếu tố khác
Trang 9● Dự báo cho yếu tố cần nghiên cứu ( ví dụ như dự báo giá xăng dầu, nhu cầunăng lượng, giá vàng,…)
3 Cách sử dụng
1 Khởi động Eviews: Bắt đầu bằng cách mở phần mềm Eviews trên máy tính.
2 Tạo công việc mới (New Workfile): Tạo một "khung làm việc mới" để bạn có thể
làm việc với dữ liệu của mình Điều này giống như việc mở một cuốn sổ làm việcmới
3 Nhập dữ liệu (Data Entry):
- Đối với số liệu (số lượng tiền, số lượng sản phẩm), bạn có thể nhập chúng trực tiếp
từ các tệp như Excel hoặc CSV, hoặc bạn có thể ghi số liệu này thủ công vào Eviews
- Đối với dữ liệu (loại sản phẩm, màu sắc), bạn có thể tạo danh sách các loại sảnphẩm và màu sắc, sau đó nhập chúng vào Eviews
4 Chuẩn bị dữ liệu (Data Preparation):
- Đối với số liệu, nếu có dữ liệu không đúng hoặc không phù hợp (như dữ liệu saihoặc giá trị ngoại lai), bạn có thể chỉnh sửa hoặc xóa nó
- Đối với dữ liệu, bạn có thể tạo các danh sách chuyển đổi, ví dụ như "sản phẩm A"
có thể được thay thế bằng số 1 và "sản phẩm B" được thay thế bằng số 2
5 Phân tích số liệu (Quantitative Analysis):
- Đối với số liệu, bạn có thể sử dụng Eviews để tính toán và xem các con số thống
kê như tổng, trung bình, và vẽ biểu đồ để thấy xu hướng hoặc mối quan hệ
- Đối với dữ liệu, bạn có thể xem tỷ lệ phần trăm của từng loại sản phẩm hoặc màusắc, hoặc bạn có thể so sánh chúng để thấy xem cái nào phổ biến hơn
6 Hiển thị kết quả (Viewing Results): Bạn có thể xem các số liệu và biểu đồ để hiểu
kết quả phân tích của mình
7 Lưu công việc (Save Workfile): Đừng quên lưu lại công việc của bạn để có thể mở
lại và tiếp tục làm việc vào lần sau
Trang 10- Yêu cầu về tài nguyên hệ thống
PHẦN MỀM STATA
1 Giới thiệu phần mềm STATA
- STATA là phần mềm thống kê được phát triển từ năm 1985 bởi StataCorp
- STATA cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích thống kê với giao diện đồ hoạ thân thiện bao gồm trình đơn mô tả và các hộp thoại đơn giản
- Lưu và xuất kết quả
Để nhanh chóng hiểu rõ hơn về quy trình sử dụng stata, chúng ta có thể theo dõi clip sau: https://www.youtube.com/watch?v=p0CTLKKJ-
- Cho phép thực hiện thao tác về dữ liệu cách dễ dàng
- Có thế mạnh trong hồi quy, hồi quy logistic
- Cú pháp các lệnh đồ thị dễ sử dụng
- Đồ thị có chất lượng cao
Trang 11Nhược điểm:
- Tại mỗi thời điểm chỉ làm việc được một file
- Khả năng quản lý dữ liệu chưa tốt
- Khả năng phân tích phương sai, phân tích nhiều chiều không cao
B PHẦN MỀM PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH
PHẦN MỀM NVivo
1 Tổng quan về phần mềm
- NVivo là gói phần mềm máy tính phân tích dữ liệu định tính (QDA) được sản
xuất bởi Lumivero (trước đây là QSR International )
- NVivo được sử dụng trên nhiều lĩnh vực khác nhau, bao gồm khoa học xã hộinhư nhân chủng học, tâm lý học, truyền thông, xã hội học, cũng như các lĩnh
vực như pháp y, du lịch, tội phạm học và tiếp thị.
2 Đặc điểm
- NVivo giúp người dùng sắp xếp và phân tích dữ liệu phi số hoặc phi cấu trúc.Phần mềm giúp các nhà nghiên cứu định tính tổ chức, phân tích và tìm ranhững hiểu biết sâu sắc về dữ liệu phi cấu trúc hoặc định tính như các cuộcphỏng vấn, phản hồi khảo sát mở, bài báo, phương tiện truyền thông xã hội vànội dung web, trong đó mức độ phân tích sâu về khối lượng dữ liệu nhỏ hoặclớn được yêu cầu
- Phần mềm cho phép người dùng phân loại, sắp xếp thông tin; kiểm tra các mốiquan hệ trong dữ liệu; và kết hợp phân tích với liên kết , định hình, tìm kiếm và
mô hình hóa Phần mềm có thể xác định xu hướng và kiểm tra chéo thông tintheo nhiều cách khác nhau bằng cách sử dụng công cụ tìm kiếm và chức năngtruy vấn NVivo cung cấp nhiều phương pháp nghiên cứu, bao gồm phân tíchmạng lưới và tổ chức, nghiên cứu dựa trên bằng chứng hoặc hành động, phântích diễn ngôn, lý thuyết có căn cứ , phân tích hội thoại, dân tộc học, đánh giátài liệu, hiện tượng học, nghiên cứu theo các phương pháp hỗn hợp và phươngpháp khung
Trang 12Phần mềm phân tích dữ liệu định tính NViVo 12
3 Quy trình
4.1 Khởi đầu với Dự Án (Project)
Tạo Dự Án Mới: Bắt đầu bằng việc tạo một dự án mới trong NVivo để tổ chức tất cả
dữ liệu và tài liệu nghiên cứu của bạn
4.2 Thu Thập và Nhập Dữ Liệu
- Nhập Dữ Liệu Định Tính (Qualitative Data): Nếu bạn có dữ liệu định tính như bàiphỏng vấn, ghi chú, tài liệu văn bản, hình ảnh, hoặc video, bạn có thể nhập chúng vàoNVivo
- Nhập Dữ Liệu Định Lượng (Quantitative Data): Nếu bạn có dữ liệu định lượngnhư bảng tính Excel, SPSS, hoặc dữ liệu số học khác, bạn cũng có thể nhập chúng vàoNVivo
Trang 13(ANOVA), và nhiều phương pháp khác.
4.5 Hiển Thị Kết Quả
- Tạo Báo Cáo: Bạn có thể tạo báo cáo, biểu đồ, và biểu đồ để trình bày kết quả củabạn
- Tạo Đồ Thị: NVivo cho phép bạn tạo các biểu đồ và sơ đồ để hình dung mối quan
hệ giữa các biến hoặc các khái niệm
4.7 Lưu Trữ Dự Án và Xuất Dữ Liệu
- Lưu Trữ Dự Án: Đảm bảo lưu trữ tất cả dữ liệu và kết quả của bạn trong dự ánNVivo của bạn để có thể truy cập và sử dụng sau này
- Xuất Dữ Liệu: Bạn có thể xuất dữ liệu và báo cáo của mình từ NVivo để sử dụngtrong bài báo cáo hoặc tài liệu nghiên cứu
Quy trình này có thể thay đổi tùy thuộc vào mục tiêu cụ thể của nghiên cứu và loại dữliệu bạn đang làm việc NVivo cung cấp nhiều công cụ và tính năng để hỗ trợ nghiêncứu và phân tích đa dạng
4 Ứng dụng thực tế
- Nghiên cứu xã hội và nhân khẩu học: NVivo thường được sử dụng để phân tích
dữ liệu định tính từ các cuộc phỏng vấn, khảo sát, hoặc tài liệu văn bản như thư
từ, bài viết báo chí, và tài liệu lịch sử để trích xuất thông tin quan trọng, phânloại các chủ đề, và tạo các mô hình phân tích nội dung
- Nghiên cứu y tế và chăm sóc sức khỏe: NVivo có thể giúp phân tích các cuộc
phỏng vấn bệnh nhân, ghi chú y học, dữ liệu về chất lượng cuộc sống, và tàiliệu về chăm sóc sức khỏe để hiểu thêm về kinh nghiệm và quan điểm của bệnhnhân
- Nghiên cứu giáo dục: NVivo có thể được sử dụng để phân tích dữ liệu từ cuộc
phỏng vấn với giáo viên và học sinh, xem xét tài liệu về giảng dạy, và theo dõitiến trình giảng dạy
- Nghiên cứu tài chính và kinh tế: NVivo có thể giúp phân tích dữ liệu định tính
từ các tài liệu về chính sách tài chính, bài báo về kinh tế, hoặc cuộc phỏng vấnvới nhà quản lý tài chính để hiểu thêm về quá trình ra quyết định tài chính
5 Ưu, nhược điểm của NVIVO
● Ưu điểm
- Tích hợp dữ liệu đa nguồn: NVivo cho phép bạn nhập và phân tích hình ảnh,
video, email, bảng tính, khảo sát trực tuyến, dữ liệu web
- Mã hóa mối quan hệ biểu đồ, đám mây từ ngữ, cây từ ngữ, sơ đồ khám phá và
so sánh
- Làm việc hiệu quả hơn: Tiết kiệm thời gian sắp xếp, lưu trữ và truy xuất dữ
liệu nhanh chóng
- Phân tích nội dung: NVivo cung cấp nhiều công cụ mạnh mẽ để phân tích và
tìm hiểu nội dung của dữ liệu, bao gồm tìm kiếm, gắn thẻ, phân loại, và tạo các mối quan hệ giữa các yếu tố khác nhau