1. giới thiệu về thống kê học2. Khám phá và tìm hiểu dữ liệu định lượng3. Khám phá mối quan hệ giữa các biến4. Thu thập dữ liệu5. Sự ngẫu nhiên và mô hình xác suất6. Mô hình phân phối mẫu và khoảng tin chắc cho các phần7. Kiểm nghiệm giả thiết về các phần8. So sánh hai phần9. Suy luận và so sánh các trị trung bình10. Suy luận khi các biến có liên hệ
Trang 1Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
©2010, Nguyễn Duy Long, Tiến Sỹ 1
Phần 01 Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
Trang 2 Giới thiệu về thống kê học
Giới thiệu về thống kê học
Trình bày dữ liệu định tính
©2010, Nguyễn Duy Long, Tiến Sỹ 3
©2010, Nguyễn Duy Long, Tiến Sỹ 4
Trang 3 Thời gian của dự án:
◦ Dự án hoàn thành khi tất cả các công việc của nó g
hoàn thành
◦ Thời gian hoàn thành các công việc là không chắc
chắn.
◦ Hiểu và giảm thiểu sự không chắc chắn này sẽ giúp
quản lý tiến độ thành công.
©2010, Nguyễn Duy Long, Tiến Sỹ 5
Nguồn: Glossary oi Statistical Terms, ASQ Quality Press
Phần ngầm Phần khung Hoàn thiện
Là một triết lý của việc học và hành động dựa
trên các nguyên lý cơ bản sau:g y ý
◦ Tất cả công việc đều xảy ra trong một hệ thống của
các qui trình kết nối nhau
◦ Sự biến thiên (variation) tồn tại trong tất cả các qui
trình
◦ Hiểu và giảm thiểu sự biến thiên là chìa khóa để
thành công
Trang 4Phương phápthống kê
©2010, Nguyễn Duy Long, Tiến Sỹ 8
Trang 5 Đánh giá các kết luận sau đây:
◦ “Những người có cha mẹ có bằng đại học thì có khả g g g
năng (likely) lấy bằng đại học hơn là những người
có cha mẹ không có bằng đại học.”
◦ “Lượng xe máy ở Sài Thành có liên hệ với lượng
nhà và đất ở ở Hà Thành.”
©2010, Nguyễn Duy Long, Tiến Sỹ 9
Trang 6Thống kê: Với
thông tin trong tay bạn, cái gì trong thùng?
Xác suất: Với
Nguồn: MIT OCW, dựa trên Gilbert, 1976
11
©2010, Nguyễn Duy Long, Tiến Sỹ
thông tin trong thùng, cái gì trong tay bạn?
Thống kê học (statistics, số ít): Một cách lý
luận, cùng với các công cụ và phương pháp điậ , g g ụ p g p p
kèm, được thiết kế để giúp chúng ta hiểu biết
về thế giới
Thống kê (satistics, số nhiều): các phép tính
cụ thể được thực hiện trên các dữ liệu (data)
12
©2010, Nguyễn Duy Long, Tiến Sỹ
Trang 8©2010, Nguyễn Duy Long, Tiến Sỹ 15
Trang 9 Thông số (parameter): một đại lượng mô tả
quần thể
q
◦ v.d doanh thu bình quân của tất các nhà thầu là
100 tỷ đồng.
Trị (tham) số thống kê (statistic): một đại
lượng mô tả mẫu
◦ v.d doanh thu bình quân của mẫu 75 nhà thầu là
Trang 10©2010, Nguyễn Duy Long, Tiến Sỹ 19
Phương pháp thông kê
Thống kê học mô tả Thông kê học suy luận
©2010, Nguyễn Duy Long, Tiến Sỹ 20 Thống kê học mô tả
(descriptive statistics) Thông kê học suy luận(inferential statistics)
Trang 11Xác định đặc điểm của dữ liệu
©2010, Nguyễn Duy Long, Tiến Sỹ 21
Xác định đặc điểm của dữ liệu
◦ v.d trung bình của mẫu =
n
xi
Quá trình tạo ra một ước lượng, dự đoán, hay
quyết định về quần thể dựa trên mẫu
MẫuSuy luận
Quần thể
Suy luận
Trang 12©2010, Nguyễn Duy Long, Tiến Sỹ 23
Dữ liệu (data): là các đại lượng cùng ngữ
cảnh đi kèm
Ngữ cảnh của dữ liệu: “Five W’s”: Who, What,
When, Where, and Why Có thể có cả “How.”
Dữ liệu không có ngữ cảnh đi kèm thì hầu
như vô nghĩa
24
©2010, Nguyễn Duy Long, Tiến Sỹ
Trang 13Họ Tên Tuổi Loại lao
động Lươngngày Đội ThiCông Bảo hiểmPhan Cam 18 Phổ thông 50,000 1 Không
liệu
Định tính (categorical)
Định lượng (quantitative) (quantitative)
Trang 14©2010, Nguyễn Duy Long, Tiến Sỹ
Biểu đồ số người mắc bệnh và tử vong do
cúm A/H1N1:
©2010, Nguyễn Duy Long, Tiến Sỹ 28
Nguồn: Báo Tuổi Trẻ, 28/09/2009
Trang 15 Ba qui tắc:
1 Vẽ/tạo hình ảnh — có thể lộ ra những điều mà
ấ chúng ta không thấy từ dữ liệu thô
2 Vẽ/tạo hình ảnh — những đặc điểm quan trọng của
dữ liệu sẽ được thể hiện Chúng ta có thể thấy
những điều chúng ta không mong đợi.
3 Vẽ/tạo hình ảnh — cách tốt nhất để nói với người
khác rằng dữ liệu của bạn có hình ảnh trình bày
được chọn lựa kỹ ỹ
29
©2010, Nguyễn Duy Long, Tiến Sỹ
Đếm số lượng của các giá trị dữ liệu cho mỗi
Trang 16nhưng thể hiện dạng phần trăm (thay vì số
Trang 17 Biểu đồ thanh tần suất tương đối mô tả sự phân phối
tương đối của số đếm cho mỗi loại.
Thủy thủ
Hạnn ba
Trang 18 Cho phép thể hiện các thành phần được phân phối như
thế nào theo mỗi biến và tùy thuộc vào giá trị của biến
Các cột và hàng lề bên phải và bên dưới cho ra tổng số
và các phân phối tần suất (frequency distributions) cho
mỗi một biến
mỗi một biến.
Mỗi phân phối tần suất gọi là phân phối lề (marginal
distribution) của biến tương ứng.
◦ Phân phối lề cho biến sống sót (survival) của tàu
Trang 19 Mỗi phần tử của bảng cho ra số đếm của sự kết hợp giá
trị của hai biến.
◦ Ví dụ phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra
◦ Ví dụ, phân tử thứ hai ở cột thủy thủ đoàn (crew) chỉ ra
673 thủy thủ chết khi tàu Titanic bị chìm.
Phân phối có điều kiện (conditional
distribution) cho ra phân phối của một biến) p p ộ
chỉ cho các thành phần thỏa mãn một điều
kiện nào đó của biến khác
◦ Phân phối có điều kiện của hạng vé với điều kiện
Trang 20©2010, Nguyễn Duy Long, Tiến Sỹ
Các phân phối có điều kiện cho thấy rằng có sự
Trang 21 Sự phân phối của hạng vé với người sống sót
và sự phân phối của hạng vé với người không
sống sót là khác nhau
Hạng vé và sự sống sót là có sự liện hệ, nhưng
chúng không độc lập
Các biến được coi là độc lập khi sự phân phối
của một biến trong bảng tùy thuộc là giốngộ g g y ộ g g
nhau cho mỗi loại của biến còn lại
41
©2010, Nguyễn Duy Long, Tiến Sỹ
Biểu đồ thanh phân đốt (segmented bar charts)
trình bày lượng thông tin giống với biểu đồ bánh.
Biểu đồ thanh phân đốt giữa hạng vé và tình trạng
Nhì Ba Thủy thủ
Hạng
Trang 22©2010, Nguyễn Duy Long, Tiến Sỹ
“Căn hộ giá trung bình bán chạy”:
©2010, Nguyễn Duy Long, Tiến Sỹ 44
Nguồn: Báo Tuổi Trẻ, 24/10/2009
Trang 23 Trình bày thành thật—đảm bảo biểu đồ nói ra
những gì đang thể hiện
◦ Có vấn đề gì trong biểu đồ trên?
45
©2010, Nguyễn Duy Long, Tiến Sỹ
Đừng cường điệu hóa Không kết luận những
điều chưa thể kết luậnậ
Đừng sử dụng trị trung bình không hợp lý—
mà có thể dẫn đến cái gọi là nghịch lý
Simpson (Simpson’s Paradox)
Trang 24 Thủy có điểm TBTL 7.50 ở trường ĐHBK
Thủy có điểm TBTL 7.50 ở trường ĐHBK
Ai có vẻ học tốt hơn trong các môn học ở
ĐHBK? Hương hay Thủy?
Theo bạn thì ai có khả năng đạt điểm cao hơn
trong môn học này?
47
©2010, Nguyễn Duy Long, Tiến Sỹ
Chất lượng thi công công trình của hai nhà thầu
A và B theo đánh giá của các chủ đầu tư
Chọn nhà thầu nào để thi công chất lượng hơn?
©2010, Nguyễn Duy Long, Tiến Sỹ 48
Nhà thầu B 5/8
(62.5%) 42/50(84.0%) 47/58(81.0%)
Trang 25©2010, Nguyễn Duy Long, Tiến Sỹ 49