1. Thống kê mô tả (ôn). Chương 1bis. Xác suất & phân phối thống kê (ôn).. Chương 2. Khoảng tin cậy. Chương 3. Kiểm định thống kê. Chương 4. Phân loại dữ liệu (Classification). Chương 5. Phân nhóm dữ liệu (Cluster). Chương 6. Phân tích thành phần chính (PCA). Chương 7. Phân tích chuỗi thời gian. Chương 8. Hồi quy tuyến tính. Chương 9. Xử lý số liệu thực nghiệm. Chương 10. Giới thiệu phần mềm SPSS or R
Trang 2 Hồi quy tương quan
Hồi quy đơn
Hồi quy bội
Hồi quy lọc
Phương pháp Chi2
Kiểm định một phân phối
Bảng tương liên
Trang 3Xử lý dữ liệu trong Excel
Trang 4Tổng thể và mẫuTổng thể và mẫu
x1, x2, , xn
Trang 5Dùng mẫu quan sát để làm gi?
Thường giả thiết số cá thể của tổng thể rất
lớn, không thể khảo sát hết được hoặc không
cần thiết phải khảo sát hết.
Khảo sát mẫu để đưa ra các kết luậnchung
đối với tổng thể, gọi là các kết luận thống kê.
Một kết luận thống kê cụ thể chỉ có thể
đúng hoặc sai TỶ lệ đúng (xác suất đúng)
của kết luận thống kê là mức tin cậy P, tỷ lệ
sai (xác suất sai) là mức ý nghĩa α
Thông thường lấy P = 0,95 hay α = 0,05
Trang 6Phân phối chuẩn 1 chiềuHàm mật độ chuẩn với μ = 10 σ= 2,5
Trang 7Hàm phân phối chuẩn
Trang 8Nhật đồ thống kê
Nhật đồ: Mục đích kiểm tra tính chuẩn của một biến sinh học
Lập cách chia mẫu Bin
Đếm số các số liệu rơi vào từng khoảng
Vẽ đồ thị để xem có phân phối chuẩn không?
Vào Data Analyisis: Khai báo miền dữ liệu, miền Bin, miền ra, chọn option đồ thị và Cumulative %
Chọn Min, Max, Range, số khoảng chia k, bề
rộng h
Trang 9Nhật đồ
Trang 10Nhật đồ
Trang 11Thèng kª
Trang 12Thèng kª
Trang 13So s¸nh hai x¸c suÊt
Trang 14NÕu abs(Ttn) <= t chÊp nhËn Ho
NÕu abs(Ttn) > t chÊp nhËn H1
Trang 15NÕu abs(Ztn) <= z chÊp nhËn Ho
NÕu abs(Ztn) > z chÊp nhËn H1
Trang 17So sánh hai trung bình
So sánh hai trung bình khi lấy mẫu theo cặp
So sánh hai trung bình khi lấy mẫu độc lập
- So sánh hai trung bình khi biết phương sai
- So sánh hai trung bình khi không biết phương sai
mẫu lớn nx >= 30 ny >= 30
- So sánh hai trung bình khi không biết phương sai
mẫu nhỏ
- So sánh hai phương sai
- So sánh hai trung bình khi ps bằng nhau
- So sánh hai trung bình khi ps khác nhau
Trang 18NÕu abs(Ttn) <= t th× chÊp nhËn H0: my = mx
NÕu abs(Ttn) > t th× chÊp nhËn h1: my <> mx
C¸ch 2: Vµo Data Analysis T-test paired two samples for
means
Trang 19So s¸nh cÆp
Trang 20So s¸nh cÆp
Trang 21So s¸nh cÆp
Trang 22So sánh độc lập biết phương sai
hay không biết phương sai nhưng mẫu
lớn
Trang 23So sánh độc lập biết phương sai
hay không biết phương sai nhưng mẫu
lớn
Trang 25Bước 2 So sánh hai trung bình nếu 2 Ps bằng nhau :
Tính phương sai chung s2c = ((nx-1)s2x + (ny-1)s2y)/(nx+ny-2)
Nếu Ttn <= t chấp nhận Ho Nếu Ttn > t chấp nhận H1
Trường hợp phương sai khỏc nhau sẽ xột ở phần sau
Trang 26So sánh độc lập, mẫu bé
Trang 27So sánh hai phương sai
Trang 28So s¸nh hai trung binh psai b»ng
nhau
Trang 2929
Trang 30NÕu abs(Ttn) <= Tlt th× chÊp nhËn Ho
NÕu abs(Ttn) > Tlt th× chÊp nhËn H1
Trang 31So sánh độc lập mẫu bé phương sai
khác nhau
Trang 32So sánh độc lập mẫu bé phương sai
khác nhau
Trang 33So sánh độc lập, mẫu bé, phương sai
khác nhau
Trang 34NÕu abs(Ztn) <= z th× chÊp nhËn Ho
NÕu abs(Ztn) > z th× chÊp nhËn H1
ThÝ dô: n1 = 100 m1=30 n2 = 150 m2 = 36 f1 = 30/100 = 0,3f2 = 36/150 = 0,24 f = 66/250 =0,264
Ztn = (0,24-0,3)/sqrt(0,264*0,736*(1/100+1/150)) = 1,054
z = z(0,025) = 1,96 KÕt luËn: ChÊp nhËn H0
Trang 36Kiểm định một phân phối
Các bước cần làm: Từ giả thiết H0 viết các tần suất fi
Tính tần số lý thuyết ti = n x fi Tính khoảng cách (mi – ti)^2/ti
Tổng các khoảng cách là Chi2tn So với Chi2lt = Chiinv(α,k-1)
Nếu Chi2tn <= Chi2lt thì chấp nhận H0
Trang 37Bảng tương liên
Các bước cần làm: Tính các tổng hàng THi, tổng cột TCj, tổng toàn bộ N
Tính tần số lý thuyết tij = THi x TCj / N Tính dij = (mij – tij)^2/tij
So sánh và kết luận
Trang 38Hồi quy tương quan
Hệ số tương quan
Hồi quy tuyến tính
Sơ qua về hồi quy bội tuyến tính
Sơ qua về hồi quy phi tuyến
H i quy l c ồ ọ
H i quy l c ồ ọ
Cỏc nhúm con t t nh t con t t nh t ố ố ấ ấ
Trang 39Hồi quy tương quan
Trang 40Hồi quy tương quan
Đồ thị:
Bôi đen 2 cột X, Y
Vào Graph chọn Scatter
Lần lượt tuân theo các bước
Sau khi vẽ đồ thị nháy chọn
điểm Add Trendline
Y Linear (Y)
Trang 41Hồi quy tương quan
Trang 42Hồi quy tương quan
kết quả đưa con trỏ lên đầu rồi Ctrl Shift Enter.
Trang 43Håi quy béi tuyÕn tÝnh
Trang 44Håi quy ®a thøc
Trang 45Xử lý dữ liệu trong MiniTab
Trang 46Nhật đồ thống kê
Mở Bgiang1M.xls
Vào Stat Basic Statistics chọn một trong 2 cách
Display Descriptive statistics, chọn biến, chọn các
thống kê cần thiết trong Statistics, kiểu đồ thị trong
Graph
Graphical summary chọn biến
Đánh giá tính chuẩn theo Anderson Darling
Trang 47Chọn tên biến mới để lưu kết quả, sử dụng các
hằng số, các hàm, các biến để tạo ra biến mới
trong mục Expression
Graphical summary kiểm tra lại tính chuẩn
Thí dụ biến oocysts không chuẩn tạo biến căn, biến bình phương đều không chuẩn, cuối cùng tạo biến log thì phân phối chuẩn
Trang 49Ước lượng kiểm định
Ước lượng và kiểm định giá trị m của biến chuẩn
Mở tệp Bgiang2M.xls Vào stat Basic Statistics sample Z-test hay 1 sample T- test
Chọn Thoigian (Thời gian mang thai của bò).
Test value (giá trị cần kiểm định) 285
Trang 52So sánh hai trung bình của hai biến chuẩn
1- So sánh cặp
Stat Basic statistics Paired t-test Chon Ration
A và Ration B
Trang 53
2- So sánh mẫu độc lập
Analyse Basic statistics 2 samples t-test
samples Log(cha), Subscripts Species
Chọn assume equal variances nếu 2 phương sai bằng
nhau, không chọn nếu phương sai khác nhau
Trang 543- So sánh nhiều giá trị trung bình của các biến chuẩn khi lấy mẫu độc lập
Khi có hơn 2 biến chuẩn thì có thể tính và so sánh các trung
bình theo Anova (kiểu thiết kế CRD)
Mở tệp Bgiang3M.xls Vào Anova one way hoặc One way
(unstacked)
Kiểm tra điều kiện các phương sai bằng nhau theo Levene
Kết luận về sự bằng nhau hay không của các trung bình dựa vào bảng Anova,
Trang 5555
Trang 59Điều kiện cần kiểm tra là sự bằng nhau của cácphương sai(Test of variance)
Trang 61Hồi quy tuyến tính đơn
Mở tệp Bgiang4M.xls
Vào Regression Regression
Chọn Tluong (trọng lượng của bê) vào Respone, chọn Tuoi1 (tuổicủa bê tính theo tháng) vào Factor
Trong plot không chọn gì
Trang 63
Muốn vẽ đường hồi quy thì vào Regression Fittedline plot
Trang 65Hồi quy phi tuyến
Regression Fitted line plot có thể tìm hồi quy bậchai, bậc ba
Trang 67Hồi quy bội tuyến tính
Mở tệp caythong.xls Regression Regression Response : X11 Factor: X1- X10
Trang 69Hồi quy lọc
Method Enter
Method Stepwise
Remove (Backward) Forward
Statistics chọn như hồi quy đơn
Options chọn tiêu chuẩn lọc theo F hoặc theo probability of F
Trang 74Kiểm định một phân phối và bảng tương liên
Mở tệp Bgiang5m.xls
Kiểm định một phân phối
Đậu với 2 tính trội gồm 4 nhóm
Stat Tables Chi square goodness of fit test
Khai báo như bảng sau
Trang 7575
Trang 77Bảng tương liên Mở tệp Bgiang5M.Xls
Stat Tables Cross tabulation and Chi Square
Trang 80Thí dụ về 3 loại văcxin, 3 kết quả.
Khai báo row : Vxin3, Column : Benh3, frequency : solg3
Trang 81Có thể viết lại thành bảng tương liên như trong Excel hàng làcác loạivắc xin, cột gồm Khg, Vua, Nang, trong bảng là tần sốVào Stat Tables Chi square test (two way table) đưa 3 cột vào
Trang 82Kết quả như làm theo Cross tabulation and chi square