Trình bày các phương pháp so sánh trong xử lý thống kê số liệu kiểm tra: I .PP SO SÁNH CÁC TẦN SỐ QUAN SÁT Nguyên tắc Các kết quả thực nghiệm hoặc các quan sát thu được từ các mẫu thực nghiệm có số lượng rất hạn chế nên không bao giờ phù hợp một cách chính xác tuyệt đối với dự kiến lý thuyết. Chính vì vậy điều quan trọng là nghiên cứu xem liệu sự khác nhau mà ta quan sát được là do các dao động ngẫu nhiên hay có sự khác nhau giữa các giá trị quan sát so với giá trị lý thuyết. A. KHI BIẾT CHÍNH XÁC TẦN SUẤT LÝ THUYẾT Cách làm + Bước 1: Giả thiết rằng trong một mẫu thí nghiệm người ta quan sát một số hiện tượng E1 ,E2 …Ek với các tần suất O1 ,O2, …Ok được gọi là tần suất quan sát và các e gọi là tần suất lý thuyết. Ta có bảng
Trang 1GVHD : Nguyễn Thị Mai Hương Lớp: DHTP6A.NĐ Nhóm 2:
Sinh viên thực hiên :
Trang 2Câu 2: Trình bày các phương pháp so sánh trong xử lý thống kê số liệu kiểm tra:
Phân tích phương sai đối với bảng số liệu phân tích cảm quan
Không biết chính xác tần suất lý thuyết
Trang 3I PP SO SÁNH CÁC TẦN SỐ QUAN SÁT
- Nguyên tắc
Các kết quả thực nghiệm hoặc các quan sát thu được từ các mẫu thực nghiệm có số lượng rất hạn chế nên không bao giờ phù hợp một cách chính xác tuyệt đối với dự kiến lý thuyết Chính vì vậy điều quan trọng là nghiên cứu xem liệu sự khác nhau mà ta quan sát được là do các dao động ngẫu nhiên hay có sự khác nhau giữa các giá trị quan sát so với giá trị lý thuyết
A KHI BIẾT CHÍNH XÁC TẦN SUẤT LÝ THUYẾT
- Cách làm
+ Bước 1: Giả thiết rằng trong một mẫu thí nghiệm người ta quan sát một số hiện tượng E1 ,E2 …Ek với các tần suất O1 ,O2, …Ok được gọi là
tần suất quan sát và các e gọi là tần suất lý thuyết Ta có bảng
Tần suất quan sát
…
OK Tần suất lý thuyết
e1
Trang 4
+ Bước 2: Muốn biết các tần xuất quan sát có khác các tần suất lý thuyết một cách có nghĩa không ta sử dụng chuẩn 2
2 =
• Nếu 2 = 0, các tần suất quan sát bằng các tần suất lý thuyết
• Nếu 2 > 0, các phân bố là khác nhau
Chuẩn 2 biểu thị độ lệch giữa các giá trị quan sát và giá trị lý thuyết
Khi 2 càng lớn thì sự khác nhau giữa tần suất quan sát và tần suất lý thuyết càng lớn ta sang bước 3
+ Bước 3: Khi 2 phải lớn đến giá trị nào đó thì sự khác nhau giửa các tần suất quan sát so với lý thuyết mới có ý nghĩa ở mức sai số nào đó Người
ta thường chọn mức sai số là 5% ,1% và 0,1% Các giá trị này được tra trong bảng 2 với số bậc tự do tương ứng - Phụ lục 17
- Ví dụ ứng dụng :
Ví dụ 1: Trong một hợp đồng buôn bán , người ta thỏa thuận lô hàng phải đạt được 96% sản phẩm tốt Khi kiểm tra độc lập 1000 đơn vị sản phẩm,
thấy có 50 đơn vị kém phẩm chất Hãy tính 2 Người mua chỉ chấp nhận lô hàng với ít nhất la 96% sản phẩm tốt,ở độ tin cậy 95% Vậy liệu sau khi kiểm tra trong 1000 đơn vị sản phẩm, có 50 đơn vị kém phẩm chất thì lô hàng có được chấp nhận không?
Giải
•
Trang 5Bước 1: Theo đề bài ra ta có bảng
Trang 6Ví dụ 2: Trong một nhà máy có ba dây truyền A, B, C cùng sản xuất một loại sản phẩm và được phép có 10% sản phẩm có khuyết tật nào đó Lần
lượt trong ba dây chuyền đó người ta lấy ra các số lượng đơn vị kiểm tra là 300, 600, 700 và nhận thấy số sản phẩm tốt tương ứng là 280, 520 và
610 đơn vị Liệu sản phẩm từ ba dây chuyền trên có được coi là đồng nhất không ?
Yếu tố x2
Trang 72 = 2A + 2 B + 2 C = 0.37 + 0.74 + 0.63 = 1.74
Bước 3: Ở đây có ba dây chuyền độc lập, vậy số bậc tự do bằng 2
Giá trị 2 tra trong Phụ lục 17 ở số bậc tự do bằng 2 và độ tin cậy 99% là 4,61 Giá trị tính toán 2 = 1.74 < 2 tra bảng = 4,61
Vậy sản phẩm ở ba dây chuyển được coi là đồng nhất ở độ tin cậy 99%
•
Trang 8B- KHI CHƯA BiẾT TẦN SUẤT LÝ THUYẾT:
- Cách làm:Việc tính toán �2 chỉ có thể dựa vào các tần suất quan sát Trong trường hợp này người ta đưa các số liệu quan sát được dưới dạng bảng
hội tụ khi ta muốn kiểm tra sự độc lập giữa các nghiên cứu Bảng 2*h chính là bảng số liệu với 2 hàng, h cột Tính �2 từ bảng 2*h.
Công thức có dạng:
�2 = ( + + ……+ ) + ( + +……+ ) – N
Trong đó: N= a1+ a2+ b1+ b2
N1= a1+ b1 ; N2= a2+ b2 ; NA= a1+ a2 ; NB= b1+ b2
Trang 9- Ví dụ ứng dụng: Bảng sau đây cho số các sản phẩm loại A và B trong ba nhóm sản phẩm I ,II, III Hãy kiểm tra xem các nhóm có cùng số sản phẩm
Trang 10=> 2 tính toán >2 tra bảng Nên ta loại bỏ giả thuyết H0 sản phẩm loại B ở các nhóm là khác nhau khi chấp nhận sai số 5%.
Từ bảng số liệu trên ADCT :
�2 = ( + + ……+ ) + ( + +……+ ) – N
= ( + + ) + ( + + ) - 150 = 10,57
Trang 11II PP SO SÁNH HAI TRUNG BÌNH.
1 Nguyên tắc
- Để kiểm tra sự ổn định trong các dây chuyền khác nhau của một nhà máy Người ta lấy ra từ mỗi dây chuyền một số lượng bán sản phẩm để xác định khối lượng trung bình sản phẩm của dây chuyền đó Bằng cách tính giá trị trung bình người ta quan sát thấy giữa các giá trị trung bình thu được có một độ lệch chuẩn nhất định Độ lệch này đơn giản là do ngẫu nhiên hay do các máy trong các dây chuyền làm việc không ổn định Người ta sử dụng chuẩn t- student ( Phụ lục 18) để kiểm tra sự đông nhất của 2 mẫu Chuẩn t sử dụng trong điều kiện các mẫu phải được nhận từ một tập hợp, các phép đo là đồng nhất, các sai số trên theo quy luật chuẩn
- Thông thường người ta so sánh trực tiếp các giá trị trung bình tính toán được mà không cần xác định khoảng tin cậy của các dẫy quan sát
2 Cách làm và ví dụ ứng dụng :
- Hai mẫu của sản phẩm A và B có nA và nB quan sát đối với một đại lượng x nào đó, ta muốn biết liệu giá trị khác nhau giữa mA , mB là do dao động ngẫu nhiên hay do sự khác nhau thật sự hai mẫu Người ta giả định rằng hai mẫu đó được lấy từ một tập hợp : các giá trị trung bình của chúng cho phép ước lượng giá trị trung bình của tập hợp và các phương sai của chúng cho phép ước lượng phương sai của tập hợp
- Chia làm 2 trường hợp :
Trang 12A TRƯỜNG HỢP 1: Trong trường hợp cỡ mẫu lớn : n >= 30
nA , nB lớn hơn 30 , phân bố của mẫu đó là phân bố chuẩn.
+ Bước 1: Tính sai số tiêu chuẩn
Ta có giá trị phương sai :
Trong đó: là phương sai của 2 mẫu đem so sánh.
S2 mA , S 2 m B là phương sai tiêu chuẩn của 2 trung bình mA , mB + Bước 2:
Trang 13Các giá trị phụ thuộc số bậc tự do và độ tin cậy mong muốn và được tra trong Phụ lục 18 Trên thực tế, người ta thường so sánh xem liệu nó có lớn hơn 2 ( ở độ tin cậy 95%) và lớn hơn 2,6 ( ở độ tin cậy 99%) không.
+ Bước 3: Kết luận.
- Ví dụ ứng dụng : So sánh hai trung bình trong trường hợp cỡ mẫu lớn Người ta đo khối lượng của 1078 bao sản phẩm từ dây chuyền sản xuất A và
1078 bao từ dây chuyền sản xuất B Kết quả thu được như sau:\
Khối lượng ở dây chuyền sản xuất A: mA = 67,71 ; = 7,4 ; nA = 1078
Khối lượng ở dây chuyền sản xuất B : mB = 68,67 ; = 7,6 ; nB = 1078
Liệu sự khác nhau giữa hay dây chuyền là ngẫu nhiên hay có nghĩa?
Trang 14Bước 2: Tỷ số quan sát giữa mA – mB so sánh với sai số tiêu chuẩn là:
Trang 15B TRƯỜNG HỢP 2: Trong trường hợp cỡ mẫu nhỏ n< 30
+ Bước 1: Phương sai của từng từng nhóm:
Trang 16Ví dụ ứng dụng : So sánh trong trường hợp cỡ mẫu nhỏ trường hợp hai nhóm công nhân A và B Nhóm A có nA = 6 , nhóm B có nB = 4 cùng làm
một công việc với số sản phẩm khác nhau.Người ta muốn biết sự khác nhau giữa hai giá trị trung bình sản phẩm của 2 nhóm có nghĩa không?
Trang 18III PP SO SÁNH NHIỀU TRUNG BÌNH
A PHÂN TÍCH PHƯƠNG SAI.
- Nguyên tắc: Phương pháp phân tích phương sai do Ficher đưa ra nhằm kiểm tra sự khác nhau giữa một tập hợp mẫu Phân tích phương sai cho phép
chấp nhận hay loại bỏ giả thuyết không Ho, đó là giả thuyết cho rằng các mẫu có thể được coi là đã lấy ra từ trong một tập hợp Có nghĩa là các mẫu không khác nhau Ngược lại là các mẫu có khác nhau tùy theo mức ý nghĩa lựa chọn
- Cách làm:
Các kí hiệu trong bài:
+ Xi: Tổng các sản phẩm
+ XA,….,XN, :Tổng sản phẩm A,B,C…N,,
+ nA, ….nN : Số lần quan sát được của các sản phẩm
+ x: là các giá trị của mẫu qua từng lần quan sát
+ Bước 1: Tính trung bình chung
M =
Trang 19+ Bước 2: Tính trung bình các mẫu
+ Bước 4 : Tính phân tán yếu tố (S2f ), phân tán sai số (S2r)
• Phân tán yếu tố: Tổng bình phương các độ lệch giữa các giá trị trung bình của các mẫu so với trung bình chung
Trang 20+ Bước 5: Lập tỉ số
Trong đó:
Uf = ( ) S2f (dựa vào phân tán yếu tố)
Ur = ( ).S2f ( dựa vào phân tán sai số)
Giá trị này được so sánh với các giá trị trong phụ lục 19 gọi là bảng Ficher hay Snecdecor
Trang 22Bước 1 : Trung bình chung
Trang 24B PHÂN TÍCH PHƯƠNG SAI ĐỐI VỚI BẢNG SỐ LIỆU PHÂN TÍCH CẢM QUAN.
- Nguyên tắc: Các số liệu phân tích cảm quan là do các thành viên đưa ra Sự dao động giữa các số liệu do các thành viên dưa ra thường rất lớn Đôi
khi chính những dao động này đã kéo theo dao động số liệu giữa các mẫu Điều đó dẫn đến các mẫu dù không khác nhau có nghĩa cũng trở thành khác nhau, tức là khi sự khác nhau giữa các thành viên lớn Một thí nghiệm cảm quan có nghĩa khi sự khác nhau giữa các thành viên là không lớn lắm Thêm vào đó các thàh viên lại đánh giá một cách không đồng nhất với các mẫu
- Cách làm:
Bước 1:: Yếu tố hiệu chỉnh HC=( tổng toàn phần)2/Tổng số câu trả lời
Bước 2: Tổng bình phương mẫu=( Tổng bình phương các tổng từng mẫu/ Số lần đánh giá một mẫu)- HC
B3: Tổng bình phương thành viên=(Tổng bình phương các tổng từng thành viên/ Số lần đánh giá của một thành viên)-HC
B4: Tổng bình phương toàn phần=Tổng bình phương từng lần đánh giá- HC
Trang 25B5: Tổng bình phương sai số=TBPtp-TBPm-TBPtv
B6: Số bậc tự docuar yếu tố nào đó bằng số quan sát trên yếu tố đó -1
B7: bình phương trung bình của yếu tố nào đó bằng tổng bình phương của yếu tố đó chia cho số bậc tự do của nó
B8: Hệ số F( hay chuẩn F) để kiểm tra sự khác nhau có nghĩa của các mẫu và của các thành viên bằng bình phương trung bình của mẫu chia cho bình phương trung bình của sai số
B9: Để biết mẫu nào khác mẫu nào ta dùng chuẩn Tukey:
Tính giá trị khác nhau nhỏ nhất có nghĩa KNCN=t
Trong đó: ta tra phụ lục 20 (chúng tôi giới hạn so sánh ở ngưỡng 5%)
+ So sánh các điểm trung bình giữa các mẫu:
+ Ta dùng bảng chũ cái trên số mũ của giá trị trung bình để mô tả sự khác nhau giữa các mẫu Nếu hai mẫu có cùng chữ cái ở mũ thì không khác nhau
và nếu mang hai chữ cái khác nhau thì khác nhau
Ghi chú: nếu các thành viên có khác nhau thì tính tương tự như trên bước 9, ta sẽ biết thành viên nào khác thành viên nào
Trang 29Ghi chú: chữ cái trên mũ của giá trị trung bình để mô tả sự khác nhau giữa các mẫu nếu hai mẫu có cùng mũ thì không khác nhau và nếu mang hai chữ khác nhau thì khác nhau.