PowerPoint Presentation 16 1 Chương 16 THĂM DÒ, TRÌNH BÀY VÀ XEM XÉT DỮ LiỆU 16 2 Types of Data Analysis Các loại phân tích dữ liệu • Exploratory data analysis (Phân tích dữ liệu thăm dò) – the data g[.]
Trang 1Chương 16
THĂM DÒ, TRÌNH BÀY VÀ
XEM XÉT DỮ LiỆU
Trang 2Types of Data Analysis Các loại phân tích dữ liệu
• Exploratory data analysis (Phân tích dữ liệu thăm dò)
– the data guide the choice of analysis or a revision of the planned analysis (dữ liệu giúp chọn loại phân tích, hay xem xét lại kế hoạch phân tích dữ liệu)
• Confirmatory data analysis (Phân tích dữ liệu khẳng định)
– closer to classical statistical inference in its use of
significance and confidence (gần với suy diễn thống kê
cổ điển, đó là sử dụng mức ý nghĩa và độ tin cậy)
– may use information from a closely related data set or
by validating findings through the gathering and analyzing of new data (sử dụng thông tin từ tập dữ liệu
có liên quan gần nhất hay xác nhận kết quả qua việc thu thập và phân tích dữ liệu mới)
Trang 3Các kỹ thuật trình bày và xem xét
phân phối của dữ liệu
• Frequency Table (Bảng tần số)
• Visual Displays (trình bày bằng đồ họa)
– Histograms (biểu đồ phân phối tần số)
– Stem-and-leaf display (biểu đồ thân và lá)
– Box-plot (biểu đồ hộp)
• Crosstabulation of Variables (Bảng chéo)
Trang 4Các kỹ thuật trình bày và xem xét
phân phối của dữ liệu
• Histograms (biểu đồ phân phối tần số)
– Display all intervals in a distribution, even without observed values (thể hiện tất cả các khoảng cách trong phân phối)
– Examine the shape of the distribution for skewness, kurtosis, and the modal pattern (xem xét hình dạng của phân phối về độ lệch, độ nhọn, và hình mẫu phân phối)
See statistics, charts
Trang 5Các kỹ thuật trình bày và xem xét
phân phối của dữ liệu
• Box-plot (box and whisker-plot)- Biểu đồ hộp và râu
– Rectangular plot encompasses 50% of the data
values (hình hộp vuông thể hiện 50% giá trị quan
sát)
– Center line through the width of the box marks the median (đừng trung tâm của hộp vuông thể hiện số trung vị)
– Whiskers extend from the right and left hinges to the largest and smallest value (Các râu kéo dài ra hai phía phải và trái đến giá trị lớn nhất và giá trị nhỏ
nhất của mẫu quan sát)
See statistics, charts
Trang 6Crosstabulation
Bảng chéo
• A technique for comparing two classification variables (Một kỹ thuật so sánh 2 biến phân loại với nhau)
– Cells (ô)
– Marginals (các dòng hay cột biên)
– Contingency tables (bảng ngẫu nhiên)
Trang 7Use of percentage Cách sử dụng phần trăm
• Đơn giản hóa dữ liệu bằng cách giảm tất cả các con số xuống còn từ 0 đến 100.
• Chuyển các dữ liệu thành hình thức chuẩn nhằm mục đích so sánh tương đối.
Trang 8Percentaging Errors Các sai lầm khi tính phần trăm
• Averaging percentages without weighting (tính phần trăm trung bình mà không gia trọng)
• Using too-large percentages (>100%) (dùng số % quá lớn)
• Using percentage with very small sample (dùng số
% khi mẫu quan sát quá nhỏ)
• Citing percentage decrease exceeding 100 percent (% giảm vượt quá 100%)