Bài 1: Tìm một dữ liệu định lượng A và một dữ liệu định tính B thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1Thực hiện phương pháp phân tổ dữ liệu A.. giữa và cuối và từ ba
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Tp.HCM, Ngày 5 tháng 5 năm 2016
Trang 2Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp,
sử dụng các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A)
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A)
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% (A)
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không
Dạng bài: Thống kê mô tả
nhập các ô O1 => O5 lần lượt các giá trị:
Chọn chức năng Data/ Data Analysis/Histogram
+Input Range: địa chỉ tuyệt đối chứa dư liệu
Trang 3+Bin Range: địa chỉ chứa bảng phân nhóm.
+ Output options: vị trí xuất kết quả
+Confidence Level for Mean: độ tin cậy cho trung bình
+ Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉ tính tần số
Trang 4Khoảng điểm lý cuối kì
Khoảng điểm lý cuối kì
Trang 5khoảng điểm lý cuối kì
khoảng điểm lý cuối kì
Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% (A) Nhập dữ liệu vào bảng tính theo hàng:
Trang 6Chọn chức năng Data/Data Analysis/Descriptive Statistics.Input Range: địa chỉ tuyệt đối chứa dư liệu.
+Output options: vị trí xuất kết quả
+Confidence Level for Mean: độ tin cậy cho trung bình
Trang 7Cho ta kết quả
Column1
-9 độ nghiêng
khoảng biến thiên
Trang 8nâng chuyển
Tính tỉ lệ sinh viên cho các ngành
phân sinh viên khoa cơ khí
Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành
+Quét chọn cột Số sinh viên (G7=> G13)
+Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert
Vẽ biểu đồ đứng thể hiện số lượng sinh viên ở các chuyên ngành
+Quét chọn cột Số sinh viên (H7=> H13)
+Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert
Trang 9Kết quả thu được:
kết quả phân ngành
KSTN cơ điện tử KSTN cơ chế tạo
Trang 10Điểm đánh giá của người dùng thử về 2 loại sản phẩm đậu phộng trước và saucải tiến được thu thập trên thang điểm 10 như sau:
Hãy cho biết hiệu quả của việc cải tiến sản phẩm với mức ý nghĩa 6% Tìm thêmgiá trị P trong kiểm định
Bài làm
Cơ sở lý thuyết
Hai mẫu đã cho là mẫu nhỏ phụ thuộc và không giả định rằng phương sai khác nhau, chúng ta đưa về bài toán so sánh giá trị trung bình
Giả thuyết thống kê
Giả thiết kiểm định H0 : “Cải tiến không hiệu quả”
Giả thiết đối H1 : “Cải tiến hiệu quả”
Tiêu chuẩn kiểm định:
P=XS (|T| <= tqs)
Biện luận
Nếu t ≤ tα hay tα/2 thì chấp nhận giả thuyết H0
Nếu t ¿ tα hay tα/2 thì bác bỏ giả thuyết H0
Trang 12t Stat
2.15217118
-2P(T<=t) one-tail
Vì |t| = 2.1522 > t0,06 =2,00002 nên bác bỏ giả thuyết H0
Như vậy việc cải tiến có hiệu quả
Bài 3:
Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái mùa (khô vàmưa: trong mỗi mùa lấy mẫu ba lần - đầu giữa và cuối) và từ ba miền (nam.trung và bắc) được tóm tắt như sau:
MùaThời điểm
Hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền? Nếu cóthì hai yếu tố mùa và miền có sự tương tác với nhau hay không? Sử dụng mức ýnghĩa 2%
Bài làm:
Giả thuyết kiểm định: Ho: hàm lượng saponin không có sự khác nhau theo mùa hay miền
Trang 13H: hàm lượng saponin có sự khác nhau theo mùa hay miền
Chọn chương trình Anova: Two-Factor With Replication với số lần lặp là 3 và mức ý nghĩa 0,02
Ta thu được bảng số liệu sau:
Trang 14Count 3 3 3 9
3.266667
2.622222
ANOVA
Source of
Variation SS df MS F
value F crit
Columns 4.213333 2 2.106667 164.8696 1.87E-09 5.516299Interaction
0.0177
0.008889
0.695652
0.517786
5.516299Within
Trang 15(không tương tác)
Vậy hàm lượng saponin trong dược liệu khác nhau theo miền nhưng
không có sự khác nhau theo mùa và không có sự tương tác giữa mùa và
miền trên hàm lượng saponin
Bài 4:
Bệnh đau mắt hột được chia làm 4 thời kỳ T1, T2, T3 và T4 Một kết quả kiểm tracác bệnh nhân đau mắt hột được cho trong bảng sau:
Địaphương
Trang 16Trong đó: O ij là tần số thực nghiệm của hàng i, cột j
2 Thực hiện bài toán:
- Với bậc tự do là (4-1)(3-1)=6 và α=0,01 ta tra bảng VI suy ra được tiêu chuẩn cho phép là χ0,012 6=16,81
- Đầu tiên ta tính toán tổng hang tổng cột bằng các hàm SUM, ta tính toán bảng tần số lý thuyết Eij
- Ô C12 nhập =$C$7*G4/$G$7 kéo xuống để tính giá trị cho ô C13 vàC14
- Làm tương tự cho các ô còn lại
Trang 17Tính toán tiêu chuẩn kiểm định
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ 3) Tìm sai số chuẩn của ước lượng,
Trang 18 Nếu R > 0 thì X,Y tương quan thuận.
Nếu R < 0 thì X,Y tương quan nghịch.
Nếu R = 0 thì X,Y không tương quan.
Nếu |R| = 1 thì X,Y có quan hệ hàm bậc nhất.
Nếu |R| → 1 thì X, Y có tương quan chặt (tương quan mạnh).
Nếu |R| → 0 thì X, Y có tương quan không chặt (tương quan yếu).
Thực hiện trên Excel:
Nhập số liệu vào bảng tính:
Trang 19 Chọn chức năng Data/Data Analysis/Correlation.
Kết quả:
Thời gian
Lượng calo đốt cháy
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không?
Nếu có, hãy ước lượng đường hồi quy tuyến tính Y theo X.
Cơ sở lý thuyết:
Giả thiết H0: X và Y không có tương quan tuyến tính:
Thực hiện trên Excel:
Trang 20 Tính T : chọn ô F9 và nhập biểu thức =F8*SQRT(14-2)/SQRT(1-F8^2).
Tính c: chọn ô F10 và nhập biểu thức =TINV(0.05,12) (c là phân vị mức α/2=0.025 của phân bố Student với n-2=12 bậc tự do).
Vì |T| > c nên bác bỏ giả thiết H0.
Vậy: X và Y có tương quan tuyến tính.
Ước lượng đường hồi quy tuyến tính Y theo X Ước lượng đường hồi quy tuyến tính Y theo X.
Cơ sở lý thuyết:
Phương trình hồi quy tuyến tính:
Kiểm định hệ số a, b:
+ Giả thiết H0: Hệ số hồi quy không có ý nghĩa (=0).
+ H1: Hệ số hồi quy có ý nghĩa (≠0).
+ Trắc nghiệm t < t ,n-2: chấp nhận H0
Kiểm định phương trình hồi quy:
+ Giả thiết H0: “Phương trình hồi quy tuyến tính không thích hợp”.
H1: “Phương trình hồi quy tuyến tính thích hợp”.
+ Trắc nghiệm F < F ,1 ,n-2: chấp nhận H0
Thực hiện trên Excel:
Nhập số liệu vào bảng tính:
Trang 21 Dùng chức năng Data/Data Analysis/Regression:
Kết quả:
Trang 22 Biện luận:
Phương trình hồi quy: Y = −133,786 + 17.84676x
Hệ số hồi quy: 1,49E-05=1,49.10-5 < 0.05 Hệ số tự do không có ý nghĩa.
4,6E-12 = 4,6.10-12< 0.05 Hệ số của x không có ý nghĩa.
Phương trình hồi quy tuyến tính này không thích hợp vì 4,6E-12=4,6.10-12 < 0.05
3) Tìm sai số chuẩn của ước lượng:
Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được sai số chuẩn của ước lượng:
Trang 23- Đối với biến tự do: SE = 19,1892
- Đối với biến X: SE = 0,6675