Các nguyên tắc cơ bản trong đánh giá cảm quan Sự vô danh của các mẫu đánh giá: Người thử không bị ảnh hưởng bởi bất kì thông tin nào của sản phẩm ngoại trừ tính chất cảm quan.. Phép th
Trang 1MỤC LỤC
MỤC LỤC 1
I TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM QUAN 2
1 Sơ lược về đánh giá cảm quan 2
2 Phép thử phân biệt 2
II TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN 4
1.Nguồn gốc 4
2 Nội dung 4
3 Ý nghĩa 7
4 Ứng dụng 7
III CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ PHÂN BIỆT 7
1 Nguyên tắc chung 7
2 Các phương pháp xử lý số liệu trong phép thử phân biệt 9
3 Nhận xét 13
IV CÁCH XỬ LÝ SỐ LIỆU TRONG PHÉP THỬ PHÂN BIỆT BẰNG PHƯƠNG PHÁP THỐNG KÊ BAYESIAN 14
1 Phương pháp xử lý số liệu theo thống kê Bayesian 14
2 Các ví dụ 18
3 Các yếu tố ảnh hưởng đến kết quả của phương pháp kiểm định Bayesian 28
4 So sánh kết quả thí nghiệm giữa phương pháp kiểm định giả thiết thống kê cổ điển với phương pháp thống kê Bayesian 29
V SO SÁNH PHƯƠNG PHÁP THỐNG KÊ BAYESIAN VỚI PHƯƠNG PHÁP KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ CỔ ĐIỂN 30
VI KẾT LUẬN 31
PHỤ LỤC 32
TÀI LIỆU THAM KHẢO 35
Trang 2I TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM QUAN [1] [3]
1 Sơ lược về đánh giá cảm quan
1.1 Định nghĩa
“Đánh giá cảm quan là phương pháp khoa học được sử dụng để gợi lên, đo đạc,phân tích và giải thích cảm giác đối với các sản phẩm vốn được nhận biết thông qua cácgiác quan: thị giác, khứu giác, xúc giác, vị giác và thính giác.”
(Stone & Sidel – ASTM)
1.2 Các phương pháp đánh giá cảm quan
Nhìn chung, tất cả các phương pháp đều dựa trên phép xử lý thống kê các thông tinthu thập được từ người thử Mỗi phép thử là tập hợp các đánh giá riêng lẻ của mỗi ngườitham gia, được sắp xếp theo một phương thức đã định trước phù hợp với các phép toánthống kê
Phép thử phân biệt: Tìm hiểu xem các sản phẩm giống hay khác nhau.
Phép thử mô tả: Tìm hiểu xem cường độ của các tính chất cảm quan là bao nhiêu.
Phép thử thị hiếu: Tìm hiểu xem các sản phẩm có được ưa thích không, loại sản
phẩm nào hay tính chất cảm quan nào được ưa thích nhất
1.3 Các nguyên tắc cơ bản trong đánh giá cảm quan
Sự vô danh của các mẫu đánh giá: Người thử không bị ảnh hưởng bởi bất kì thông
tin nào của sản phẩm ngoại trừ tính chất cảm quan
Sự độc lập của các câu trả lời: Ý kiến của những người thử là độc lập với nhau.
Kiểm soát điều kiện thí nghiệm: Các điều kiện thí nghiệm khác nhau sẽ cho các kết
quả thí nghiệm khác nhau Các thí nghiệm cảm quan phải luôn được thực hiệntrong phòng thí nghiệm cảm quan, không thực hiện trong phân xưởng sản xuất haynhà máy
1.4 Vai trò của đánh giá cảm quan
Đánh giá cảm quan cho phép giải quyết những bận tâm của nhà sản xuất thựcphẩm trong các quá trình kiểm tra nguyên liệu, quá trình sản xuất, đánh giá ảnh hưởngcủa các yếu tố công nghệ và kỹ thuật đến sản phẩm cuối cùng, cũng như xác định mốiquan hệ giữa bao bì và chất lượng, xác định thời gian sống của sản phẩm và cuối cùng làphát triển sản phẩm mới
2 Phép thử phân biệt
2.1 Mục đích
Tìm hiểu xem liệu nhóm người thử có thực sự nhận ra sự sai khác giữa các sảnphẩm không hay đó chỉ là những câu trả lời được ra một cách ngẫu nhiên
2.2 Các phép thử phân biệt
2.2.1 Phép thử A – nonA và phép thử hai – ba (Duo – Trio)
Trang 3 Mục đích: Xác định liệu một sản phẩm có giống với một mẫu chuẩn hay không.
Phép thử này rất thích hợp trong tình huống muốn kiểm tra xem sản phẩm làm racó giống với một sản phẩm đang bán trên thị trường hay không
Nguyên tắc:
A - nonA:
Đầu tiên người thử học cách nhận biết mẫu kiểm chứng A Tiếp theo người thử sẽlần lượt thử một dãy các mẫu được mã hóa bao gồm cả mẫu A và notA, sau đó người thửphải xác định mẫu nào là A và notA
Trình bày mẫu: Cân bằng trật tự trình bày mẫu trên cả nhóm người thử, số mẫu A
và notA được người thử đánh giá là bằng nhau
Hai - ba (Duo - Trio):
Đầu tiên người thử học cách nhận biết mẫu kiểm chứng R Tiếp theo người thử sẽlần lượt thử hai mẫu khác và được cho biết một trong hai mẫu đó giống với mẫu R, ngườithử phải tìm ra mẫu giống với mẫu R
Trình bày mẫu: 4 tổ hợp R(A)AB, R(A)BA, R(B)AB, R(B)BA, số lần xuất hiện của
mỗi tổ hợp là như nhau cho cả nhóm người thử
2.2.2 Phép thử giống – khác và phép thử tam giác
Mục đích: Xác định sự khác nhau giữa hai sản phẩm mà không cần biết bản chất
của sự khác nhau đó Phép thử này được sử dụng trong trường hợp sự khác nhaugiữa hai sản phẩm là tương đối nhỏ
Nguyên tắc:
Giống - khác:
Có hai mẫu thử được giới thiệu, người thử phải xác định hai mẫu này giống haykhác nhau
Trình bày mẫu: 4 tổ hợp AA, BB, AB, BA, số lần xuất hiện của mỗi tổ hợp là như
nhau cho cả nhóm người thử
Tam giác:
Có ba mẫu thử được giới thiệu, hai mẫu là giống nhau (được chuẩn bị từ một loạisản phẩm), mẫu thứ ba được giả định là khác hai mẫu còn lại và được chuẩn bị từ một loạisản phẩm khác, người thử phải xác định mẫu không lặp lại trong số ba mẫu thử (mẫu khácvới hai mẫu còn lại)
Trình bày mẫu: 6 tổ hợp AAB, ABA, ABB, BAB, BBA, BAA, số lần xuất hiện của
mỗi tổ hợp là như nhau cho cả nhóm người thử
2.2.3 Phép thử 2-AFC (cặp đôi) và 3-AFC
Mục đích: Xác định sự khác nhau giữa hai sản phẩm về một tính chất cảm quan
xác định
Nguyên tắc:
2-AFC (cặp đôi):
Có hai mẫu thử được giới thiệu, người thử phải xác định mẫu nào có cường độ cảmgiác về một chỉ tiêu cụ thể lớn hơn hoặc bé hơn mẫu còn lại
Trang 4Trình bày mẫu: 2 tổ hợp AB, BA, số lần xuất hiện của mỗi tổ hợp là như nhau cho
cả nhóm người thử
3-AFC:
Có ba mẫu thử được giới thiệu, người thử phải xác định mẫu nào có cường độ cảmgiác về một chỉ tiêu cụ thể lớn hơn hoặc bé hơn hai mẫu còn lại
Trình bày mẫu: hai nhóm (AAB, ABA, BAA) và (ABB, BAB, BBA), trong phép
thử này chỉ có một trong hai nhóm (mỗi nhóm gồm 3 tổ hợp của hai mẫu) được giới thiệu,số lần xuất hiện của mỗi tổ hợp là như nhau cho cả nhóm người thử
2.3 Nhóm người đánh giá cảm quan (người thử)
Thường là người tiêu dùng bình thường đã qua sử dụng sản phẩm
Số lượng: Thường nhiều hơn 50 người
2.4 Ứng dụng
Giúp cho việc giải quyết các vấn đề:
Liệu có thể thay đổi nguyên liệu hoặc một bộ phận trong dây chuyền sản xuấtmà không dẫn tới thay đổi tính chất cảm quan có thể nhận thấy ở sản phẩm
Ảnh hưởng của bao bì đến mùi vị sản phẩm
Tuổi thọ của sản phẩm là bao lâu, sản phẩm có bị biến đổi chất lượng trongquá trình bảo quản
Bắt chước sản phẩm cạnh tranh
Đánh giá và quyết định lựa chọn một phương thức công nghệ mới
Định hướng cho các phép thử cảm quan và thị hiếu
Tuyển chọn và huấn luyện hội đồng cho đánh giá cảm quan
II TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN
2.1 Các khái niệm cơ bản
Mỗi kết quả của “phép thử” (test) gọi là “sự kiện” (survival)
Sự kiện được chia thành các loại sau:
Trang 5 Sự kiện trống (sự kiện không thể có): là sự kiện không bao giờ xảy ra khi thựchiện phép thử, ký hiệu là .
Sự kiện chắc chắn: là sự kiện luôn xảy ra khi thực hiện phép thử, ký hiệu là
Sự kiện ngẫu nhiên: là sự kiện có thể xảy ra hoặc không xảy ra tùy thuộc vàotừng phép thử
Hai sự kiện A và B gọi là “xung khắc” nếu A.B =
Các sự kiện A1, A2, … , An gọi là “đôi một xung khắc” nếu hai sự kiện khác nhaubất kỳ trong đó đều xung khắc, tức là: Ai.Aj = với mọi i j
Các sự kiện A1, A2, … , An gọi là “một nhóm đầy đủ các sự kiện” nếu chúng đôimột xung khắc và ít nhất một trong chúng chắc chắn xảy ra, tức là:
Ai.Aj = với mọi i j và A1 + A2 + … + An =
Hai sự kiện A và B gọi là “độc lập” nếu xác suất (probability) của sự kiện này
không phụ thuộc vào sự xảy ra hay không xảy ra của sự kiện kia
Theo định lí Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc vào 3 yếu tố:
Xác suất xảy ra A của riêng nó, không quan tâm đến B, ký hiệu là P(A) và đọc
là “xác suất của A” Đây được gọi là “xác suất biên duyên” hay “xác suất tiênnghiệm” (prior probability), nó là “tiên nghiệm” theo nghĩa rằng nó khôngquan tâm đến bất kỳ thông tin nào về B
Xác suất xảy ra B của riêng nó, không quan tâm đến A Kí hiệu là P(B) và đọc
là “xác suất của B”
Xác suất xảy ra B khi biết A đã xảy ra Kí hiệu là P(B/A) và đọc là “xác suất
của B nếu có A” Đại lượng này cũng được gọi “xác suất có điều kiện”
(conditional probability) hay “xác suất hậu nghiệm” (posterier probability) vì
nó được rút ra từ giá trị được cho của A
Từ đó ta thu được các công thức sau đây:
Công thức xác suất có điều kiện: ( / ) (( ))
B P
AB P B A
Công thức xác suất đầy đủ:
Cho A1, A2, … , An là một nhóm đầy đủ các sự kiện Với mọi sự kiện B ta có:
P(B) = P(A 1 ).P(B/A 1 ) + P(A 2 ).P(B/A 2 ) + … + P(A n ).P(B/A n ) (CT II.2.3)
Công thức Bayes:
Dạng đơn giản: ( / ) ( / ().) ( )
B P
A P A B P B A
Dạng tổng quát: Với mỗi k (k = 1 đến n), ta có:
Trang 6k k
k
A B P A P
A P A B
P B
P
A P A B P B A P
1
)/()
(
)()
/()
(
)()
/()/(
(CT II.2.5)
Tương tự, trong thực tế ta có thể đặt:
H: Giả thiết (hypothesis) được suy luận và cần được kiểm chứng trong thực tế
D hay E: Dữ kiện (data) hay bằng chứng (evidence) thu được bằng cách thực
hiện phép thử, dùng để kiểm định giả thiết H
P(H) được gọi là “xác suất tiên nghiệm” (prior probability) của H
P(D/H) hay P(E/H) được gọi là “xác suất có điều kiện” (conditional
probability) của việc quan sát thấy dữ kiện D hay bằng chứng E nếu biết rằng
giả thiết H là đúng
P(D) hay P(E) được gọi là “xác suất của D hay E”: xác suất của việc chứng
kiến dữ kiện mới D hay bằng chứng mới E dưới tất cả các giả thiết loại trừnhau đôi một (một nhóm đầy đủ các giả thiết)
P(H/D) hay P(H/E) được gọi là “xác suất hậu nghiệm” (posterior probability)của H nếu biết D hay E
Từ đó ta cũng thu được các công thức:
Công thức Bayes nhằm điều chỉnh xác suất của giả thiết theo các dữ kiện haybằng chứng mới:
) / ( ).
( ) / ( ).
(
) ( ) / ( )
(
) ( ) / ( ) /
(
notH D
P notH P H D P H P
H P H D P D
P
H P H D P D H
Tính độc lập của dữ kiện thể hiện qua:
P(D 1 , D 2 ) = P(D 1 ).P(D 2 ) P(D 1 , D 2 /H) = P(D 1 /H).P(D 2 /H) P(D 1 , D 2 /notH) = P(D 1 /notH).P(D 2 /notH)
Định lý Bayes được sử dụng lặp đi lặp lại hàm ý rằng:
)()
(
)()/()
/(),/(
2 1
2 1
2
H P H D P H D P D D H
Ví dụ:
Tỉ lệ người nghiện thuốc lá ở một vùng là 30% Tỉ lệ người bị viêm họng trong sốnhững người nghiện là 60%, còn tỉ lệ người bị viêm họng trong số những người khôngnghiện là 40%
Lấy ngẫu nhiên một người thấy rằng người ấy bị viêm họng Tính xác suất ngườiấy ngiện thuốc
Giải:
Gọi H: sự kiện nghiện thuốc và notH: sự kiện không nghiện thuốc
D: sự kiện viêm họng
Trang 7Ta có: P(H) = 0,3; P(notH) = 0,7; P(DH) = 0,6; P(DnotH) = 0,4
Suy ra xác suất người viêm họng bị nghiện thuốc: (CT II.2.6)
3913 0 4 0 7 0 6 0 3 0
3 0 6 0
, , , , ,
, , )
/ ( ).
( ) / ( ).
(
) ( ) / ( )
H P H D P D
Trong phương pháp thống kê Bayes, việc thu thập các dữ kiện hay bằng chứng cóthể nhất quán hoặc không nhất quán với một giả thiết nào đó Trong quá trình thu thập vàtích lũy bằng chứng, mức độ tin tưởng vào một giả thiết thay đổi Khi có đủ bằng chứng,mức độ tin tưởng này thường trở nên rất cao hoặc rất thấp Do đó, theo lý thuyết, đây cóthể được coi là một cơ sở logic thích hợp cho việc chọn lọc giữa các giả thiết mâu thuẫnnhau: các giả thiết với mức độ tin tưởng rất cao nên được chấp nhận là đúng, các giả thiếtvới độ tin tưởng rất thấp nên bị coi là sai và loại bỏ Các nhà thống kê Bayes lập luậnrằng ngay cả khi người ta có các xác suất chủ quan tiên nghiệm rất khác nhau, bằng chứngmới từ các quan sát lặp đi lặp lại sẽ có xu hướng đưa các xác suất hậu nghiệm của họ lạigần nhau hơn
Trong công thức Bayes, tỉ số P(D/H) / P(D) đại diện cho ảnh hưởng của dữ kiện
hay bằng chứng đối với mức độ tin tưởng vào giả thiết Nếu rất có khả năng quan sát đượcbằng chứng khi giả thiết đang xét là đúng, thì tỉ số này sẽ có giá trị lớn Khi nhân “xácsuất tiên nghiệm” của giả thiết với tỉ số này, ta được một xác suất hậu nghiệm lớn của giảthiết khi có bằng chứng Nhờ đó, trong suy luận Bayes, định lý Bayes đo được mức độ màdữ kiện hay bằng chứng mới sẽ làm thay đổi sự tin tưởng vào một giả thiết
1 Nguyên tắc chung
Nguyên tắc xử lý số liệu trong phép thử phân biệt thường được tiến hành theo cácbước sau:
Đề ra giả thiết chính H: “Hai sản phẩm khác nhau về tính chất cảm quan”
Trang 8(Giả thiết mà chúng ta tin là sự thật và muốn chứng minh bằng dữ kiện)
Từ giả thiết chính đề ra giả thiết đảo H0: “Hai sản phẩm không khác nhau vềtính chất cảm quan”
Chọn mức xác suất (probability level) hay mức ý nghĩa (significance level)
(thường là một phía) cho sai lầm loại 1 (bác bỏ H0, công nhận H trong khi H0
đúng) Chọn rủi ro beta (beta risk) hoặc độ tin cậy / lực kiểm định (power) 1 –
cho sai lầm loại 2 (công nhận H0, bác bỏ H trong khi H0 sai) nếu cần (hai sảnphẩm được dự đoán là không khác nhau về tính chất cảm quan)
Chọn độ lớn của hiệu ứng d – sự khác biệt giữa H và H0 mà chúng ta muốn pháthiện (ví dụ như chênh lệch về tỉ lệ trả lời đúng)
Chọn kích thước mẫu n theo , , d để đảm bảo xác suất tối đa cho phép mắcsai lầm loại 1 là và xác suất tối đa cho phép mắc sai lầm loại 2 là Hoặccũng có thể chọn mẫu theo điều kiện cơ sở vật chất cho phép để tiến hành thínghiệm, khi đó phải tính lại d theo , , n đã chọn, hoặc tính lại theo , d, nđã chọn nếu cần
Tiến hành thu thập dữ kiện D: Làm thí nghiệm để đánh giá sự giống hay khácnhau về tính chất cảm quan của hai sản phẩm
Phân tích dữ kiện: Sử dụng các phương pháp thống kê để tính toán xác suất xảy
ra D khi H0 là sự thật Nói theo ngôn ngữ toán xác suất, đây là bước tính toán trịsố P(DH0) hay các đại lượng đại diện cho trị số này
Ứng với mức ý nghĩa cho trước, kết quả thu được chia thành hai trường hợp:
P(DH0) < : Nếu giả thiết đảo H0 đúng thì dữ kiện D xem như không xảy
ra (xác suất xảy ra D nếu H0 đúng là rất thấp) Nhưng thực tế dữ kiện D đãxảy ra, nên ta loại bỏ giả thiết đảo H0, công nhận giả thiết chính H, nghĩa làcông nhận sự khác nhau về tính chất cảm quan của hai sản phẩm “có ý
nghĩa thống kê” (significant).
P(DH0) : Nếu giả thiết đảo H0 đúng thì dữ kiện D vẫn có khả năng xảy
ra Ta chưa có đủ bằng chứng để bác bỏ giả thiết đảo H0 cũng như côngnhận giả thiết chính H, nghĩa là chưa thể kết luận hai sản phẩm khác haygiống nhau về tính chất cảm quan Để kết luận hai sản phẩm giống nhau, ta
phải đánh giá độ rủi ro hay lực kiểm định (power) 1 - như đã nêu trên.
Theo Hình III.1.1, ta có:
0 và lần lượt là trị trung bình của giả thiết đảo H0 và giả thiết chính H
d = – 0 là độ lớn của hiệu ứng, trong một số trường hợp đây là chênh lệch tỉlệ trả lời đúng mà ta có thể phát hiện ứng với , và n đã biết
Ta thấy:
Nếu số người hay tỉ lệ trả lời đúng nhỏ hơn giá trị điểm dừng thì xác suất phạmsai lầm loại 1 sẽ tăng lên khi đưa ra quyết định là có sự phân biệt (loại bỏ H0),nhưng xác suất phạm sai lầm loại 2 giảm khi quyết định là không có sự phânbiệt (chấp nhận H0)
Nếu số người hay tỉ lệ trả lời đúng lớn hơn giá trị điểm dừng thì xác suất phạmsai lầm loại 1 sẽ giảm khi loại bỏ H0, nhưng xác suất phạm sai lầm loại 2 sẽtăng lên khi chấp nhận H0
Trang 9Hình III.1.1: Minh họa các đường cong phân phối của giả thiết H 0 và H theo nguyên tắc xử
lý số liệu trong phép thử phân biệt
Mối quan hệ giữa , , d và n:
Ứng với d và n không đổi, khi vị trí điểm dừng dịch sang trái thì tăng, giảmvà ngược lại
Ứng với d không đổi, khi n tăng thì , sẽ giảm, độ lệch chuẩn của các phânphối cũng giảm, các phân phối trở nên cao và hẹp hơn, khoảng tin cậy chungquanh các trị trung bình cũng co lại nên độ chính xác của phép kiểm định tăng
Trong nhiều trường hợp, các thí nghiệm được thực hiện chỉ với mối quan tâmban đầu là và kích thước mẫu n Khi đó, giữa và d có quan hệ đơn điệu, tacó thể quan sát sau khi thực hiện thí nghiệm để biết có thể kỳ vọng mức độ tincậy 1 – là bao nhiêu ứng với các độ lớn khác nhau của hiệu ứng
2 Các phương pháp xử lý số liệu trong phép thử phân biệt
2.1 Kiểm định Khi - bình phương 2
2.1.1 Nội dung
Ta có 2 quan sát:
T
T O
qs
2
Với O: Tần số quan sát
T: Tần số lý thuyết tính được với giả thiết H0 là đúng (hai sản phẩm khôngkhác nhau về tính chất cảm quan)
Trang 10 Ứng với bậc tự do và mức ý nghĩa cho trước, ta có Khi - bình phương lý thuyết
2lt Kết quả thu được chia thành hai trường hợp:
Ví dụ: Tiến hành thí nghiệm cảm quan với phép thử phân biệt A - nonA để kiểm
định sự khác nhau về tính chất cảm quan của sản phẩm mới nonA với sản phẩm đãcó trên thị trường A Xét trường hợp thí nghiệm không lặp, thực hiện 100 phép thửcho 100 người thử, ta thu được bảng kết quả sau:
Bảng III.2.1: Số câu trả lời thực tế của người thử
Xử lý kết quả bằng kiểm định 2 (CT III.2.1):
Ta có các tần số quan sát là số câu trả lời của người thử ứng với từng trườnghợp: O1 = 33; O2 = 18; O3 = 22; O4 = 27
Tần số lý thuyết được tính theo công thức:
T = (Tổng hàng Tổng cột)/Tổng chung (CT III.2.2)
Suy ra: T1 = 27,5; T2 = 22,5; T3 = 27,5; T4 = 22,5
Vậy:
4 5
22
5 22 27 5
22
5 22 18 5
27
5 27 22 5
27
5 27
2 2
Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan
Bảng II.2.2: Số câu trả lời thực tế và lý thuyết của người thử
Trang 112.1.2 Ý nghĩa:
Kiểm định 2 thực chất là kiểm định tính độc lập của hai đại lượng ngẫu nhiên:
Loại sản phẩm X = A, nonA
Câu trả lời của người thử Y = A, nonA
Khi này, giả thiết H0: “Hai sản phẩm không khác nhau về tính chất cảm quan” sẽtương đương với “X và Y độc lập” Bởi vì khi X và Y độc lập thì câu trả lời củangười thử sẽ là ngẫu nhiên và không phụ thuộc vào sản phẩm là A hay nonA, nóicách khác người thử không phân biệt được sự khác nhau về tính chất cảm quan củahai sản phẩm
Ứng với bậc tự do btd =1 và mức ý nghĩa cho trước, kết quả thu được ứng với haitrường hợp:
2qs > 2
lt: Ta bác bỏ giả thiết H0, nói cách khác X và Y phụ thuộc vào nhau,nghĩa là người thử phân biệt được sự khác nhau giữa hai sản phẩm Ta kết luậnhai sản phẩm khác nhau về tính chất cảm quan
2qs 2
lt: Câu trả lời của người thử có thể chỉ do ngẫu nhiên, ta chưa có đủbằng chứng để công nhận sự phụ thuộc của X và Y cũng như bác bỏ giả thiết
H0 Ta chưa thể kết luận hai sản phẩm khác nhau về tính chất cảm quan
2.2 Kiểm định nhị phân (binomial test)
2.2.1 Nội dung
Nếu giả thiết H0 đúng (Hai sản phẩm không khác nhau về tính chất cảm quan), gọixác suất người thử trả lời đúng trong mỗi phép thử là p Ta có trong phép thử:
A - nonA, hai - ba, giống - khác, 2-AFC: p = 1/2 = 0,5
Tam giác, 3-AFC: p = 1/3
Đặt X là đại lượng ngẫu nhiên đặt trưng cho số câu trả lời đúng của người thử, tacó:
Xác suất để có k câu trả lời đúng trong n câu trả lời: (Công thức Bernoulli)
P(X = k) = P(n, k, p) = k k n k
n p p
) (1 , k = 0 đến n (CT III.2.3)
Suy ra xác suất có từ k đến n câu trả lời đúng trong n câu trả lời:
11
i
i n i
i n n
k i
i n i
i
Ứng với mức ý nghĩa cho trước, kết quả thu được chia thành hai trường hợp:
P(X k) < (ứng với P(DH0) < ): Ta kết luận hai sản phẩm khác nhau vềtính chất cảm quan
P(X k) (ứng với P(DH0) ): Ta chưa thể kết luận hai sản phẩm khácnhau về tính chất cảm quan
Ví dụ: Ta xét lại Ví dụ ở phần II.2.1 với n = 100; k = 60; p = 0,5.
Xử lý kết quả bằng kiểm định nhị phân (CT III.2.4):
Xác suất để có từ 60 câu trả lời đúng trở lên trong 100 câu trả lời:
Trang 12100 100
100 60
100
i
i i
i i
i i
Ứng với mức ý nghĩa = 0,05, ta có P(X 60) < 0,0284 < 0,05
Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan
2.2.2 Ý nghĩa
Kiểm định nhị phân thực chất là kiểm định tính ngẫu nhiên trong các câu trả lờicủa người thử Khi này, giả thiết H0: “Hai sản phẩm không khác nhau về tính chấtcảm quan” sẽ tương đương với “Người thử không nhận biết được sự khác nhau giữahai sản phẩm”, nghĩa là câu trả lời người thử đưa ra là ngẫu nhiên với xác suất p
Ví dụ trong phép thử A - nonA, người thử phải chọn một trong hai câu trả lời A vànonA nên xác suất trả lời đúng trong mỗi lần thử sẽ là 0,5
Ứng với mức ý nghĩa , kết quả thu được chia thành hai trường hợp:
P(X k) < : Nếu H0 đúng, nghĩa là nếu câu trả lời của người thử chỉ là ngẫunhiên, thì xác suất có từ k câu trả lời đúng trở lên trong n câu trả lời là rất thấp
Ta bác bỏ giả thiết H0, nói cách khác câu trả lời của người thử không phải dongẫu nhiên Ta kết luận hai sản phẩm khác nhau về tính chất cảm quan
P(X k) : Câu trả lời của người thử có thể chỉ do ngẫu nhiên Ta chưa thểbác bỏ giả thiết H0, cũng như chưa thể kết luận hai sản phẩm khác nhau về tínhchất cảm quan
2.3 Kiểm định Z về tỉ lệ theo phân phối chuẩn (normal distribution)
2.3.1 Nội dung
Nếu giả thiết H0 đúng (Hai sản phẩm không khác nhau về tính chất cảm quan), ta
Với X: Đại lượng ngẫu nhiên đặt trưng cho số câu trả lời đúng của người thử
n: Tổng số câu trả lời
p: xác suất trả lời đúng ngẫu nhiên (phần III.2.2.1)
q = 1 – p0,5: Hệ số hiệu chỉnh liên tục
So sánh Z với Z là giá trị tra trong Bảng xác suất tích lũy của phân phối chuẩn
chuẩn tắc (standard normal distribution) ứng với mức ý nghĩa Kết quả thu được
chia thành hai trường hợp:
Z > Z (ứng với P(DH0) < ): Ta kết luận hai sản phẩm khác nhau về tính chấtcảm quan
Z ≤ Z (ứng với P(DH0) ): Ta chưa thể kết luận hai sản phẩm khác nhauvề tính chất cảm quan
Ví dụ: Ta xét lại Ví dụ ở phần II.2.1 với n = 100; X = 60; p = 0,5.
Xử lý kết quả bằng kiểm định Z (CT III.2.5):
Trang 13 Ta có: 1 9
5 0 5 0 100
5 0 5 0 100
, ,
, ,
Ứng với mức ý nghĩa một phía = 0,05, ta có Z > Z 1,9 > 1,645
Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan
Mục đích của các kiểm định thống kê trên là so sánh “xác suất dữ kiện D xảy ra
nếu giả thiết đảo H0 là sự thật” với mức ý nghĩa cho trước Vậy giá trị P(DH0) khôngtrực tiếp cho ta biết về sự tồn tại của giả thiết chính H, nó chỉ gián tiếp cung cấp bằngchứng để chúng ta bác bỏ giả thiết đảo H0 và chấp nhận giả thiết chính H mà thôi Nóicách khác, giá trị P(DH0) ước tính mức độ khả dĩ của dữ kiện chứ không cho ta biết mứcđộ khả dĩ của giả thiết Điều này đã dẫn đến những bất tiện trong việc xử lý kết quả củaphép thử phân biệt:
Trường hợp giả thiết chính H được công nhận, ta vẫn không ước lượng được cụthể xác suất tồn tại của giả thiết chính là bao nhiêu
Trường hợp chưa có đủ bằng chứng bác bỏ giả thiết đảo H0 và công nhận giảthiết chính H, ta cũng không biết xác suất tồn tại của giả thiết nào chiếm ưu thếhơn
Phương pháp này cũng gây khó khăn cho các nhà nghiên cứu và sản xuất khihọ muốn kiểm định tính tương tự giữa các sản phẩm, nghĩa là kỳ vọng các mẫuthử giống nhau thay vì khác nhau về tính chất cảm quan (giả thiết chính H thay
đổi) Bởi vì theo cách lập luận ở phần III.1, nếu ta thay giả thiết đảo H0 bằnggiả thiết H: “Hai sản phẩm không khác nhau về tính chất cảm quan” thì khi thuđược kết quả có P(DH) , ta sẽ không có đủ bằng chứng để công nhận giảthiết H cũng như kết luận về tính tương tự giữa hai sản phẩm nếu không xétđến rủi ro
Đây chính là khiếm khuyết quan trọng của các phương pháp trên Trong khoa họcthực nghiệm, điều mà nhà nghiên cứu muốn biết là với dữ kiện mà họ có được, xác suấtcủa giả thiết chính là bao nhiêu, chứ họ không muốn biết nếu giả thiết đảo là sự thật thìxác suất của dữ kiện là bao nhiêu Nói cách khác, nhà nghiên cứu muốn biết P(HD) chứkhông muốn biết P(DH0) hay P(DH)
Về các điều kiện ràng buộc:
Khả năng đưa ra câu trả lời đúng của mỗi người thử là như nhau và bằng:
pc = pd + (1 – pd)p0 (Jian Bi, 2001) (CT III.3.1)
Với pc: xác suất trả lời đúng của mỗi người thử
Trang 14pd: tỉ lệ những người thật sự phân biệt được hai sản phẩm (discriminator hay detector) trong tổng số người thử
p0: xác suất trả lời đúng ngẫu nhiên (phần III.2.2.1)
Tuy nhiên, điều kiện này mâu thuẫn với thực tế vì khả năng trả lời đúng củamỗi người thử thay đổi theo năng lực, kinh nghiệm cá nhân, điều kiện thí nghiệmcũng như độ khó của phép thử Ta không thể quy toàn bộ người thử về hai nhómngười: “những người phân biệt” thật sự nhìn thấy sự khác biệt nên đưa ra câu trảlời đúng với xác suất bằng 1, và “những người không phân biệt” chỉ đoán để trả lờivới xác suất trả lời đúng ngẫu nhiên p0
Các câu trả lời phải độc lập với nhau: Trong trường hợp phải thực hiện các thínghiệm lặp (do điều kiện thời gian, chi phí, … không cho phép tiến hành với quánhiều người thử), ta không dám chắc thu được các đánh giá hoàn toàn độc lập,
vì kết quả của câu trả lời sau có thể phụ thuộc vào câu trả lời trước đó đối vớitừng người thử
IV CÁCH XỬ LÝ SỐ LIỆU TRONG PHÉP THỬ PHÂN BIỆT BẰNG PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [6]
1 Phương pháp xử lý số liệu theo thống kê Bayesian
Khác với các phương pháp nêu trên xem xác suất đưa ra câu trả lời đúng của ngườithử hay tỉ lệ trả lời đúng (ký hiệu p) là hằng số chưa biết, thống kê Bayesian xem tham số
p chưa biết là biến ngẫu nhiên tuân theo phân phối beta (Beta distribution).
Phân phối beta được sử dụng vì tính linh hoạt và đa dụng của nó Nó có thể bao
gồm nhiều loại phân phối khác nhau, từ phân phối đều (uniform distribution) đến phân phối hình chữ U (U-shaped), hình chuông (bell-shaped), phân phối đối xứng (symetric distribution) cũng như không đối xứng (nonsymetric distribution).
1.1 Sơ lược về phân phối beta
Gọi X là đại lượng ngẫu nhiên liên tục nhận giá trị x [0; 1]
Theo phân phối beta, ta có:
Các tham số của phân phối beta: a > 0 và b > 0
Hàm mật độ xác suất: (probability density function)
1 1
1 1
x x
b a
b a b
a B
x x
b a x
) ( ) (
) ( )
, (
) ( )
, ,
Với : hàm gamma và B: hàm beta
Hàm phân phối tích lũy: (cumulative distribution function)
) , ( )
, (
) , ( )
, (
) ( )
, ,
b a B
b a B b
a B
dt t t
b a x
) ( )
ab X
Trang 15Hình IV.1.1: Các dạng đường cong phân phối beta
1.2 Các bước thực hiện
1.2.1 Xác định phân phối tiên nghiệm của tham số tỉ lệ p
Các đại lượng của phân phối tiên nghiệm đối với tham số p:
Trung bình (kỳ vọng) tiên nghiệm .
Phương sai tiên nghiệm 2 (hay độ lệch chuẩn tiên nghiệm ).
Các đại lượng này được xác định dựa trên các thông tin tiên nghiệm (prior information hay prior knowledge) tức là những hiểu biết hay kinh nghiệm trong việc đánh
giá các tính chất cảm quan của sản phẩm thu được từ những nghiên cứu đi trước
Nếu ta không có bất kỳ thông tin nào về sự giống – khác nhau của hai sản phẩm
thì ta xác định các đại lượng trên theo phân phối đều (uniform distribution) nghĩa là a = b
= 1
Áp dụng phân phối beta cho tham số p:
Xem p là đại lượng ngẫu nhiên liên tục nhận giá trị [0; 1], dựa trên kỳ vọng và
phương sai tiên nghiệm, ta tính được các tham số tiên nghiệm (hypo-parameter)
Trường hợp p tuân theo phân phối đều, khi đó xác suất P(p = pi) là như nhau với
Trang 16Các tham số: a = b = 1.
Trung bình: = 0,5 và phương sai: 2 = 1/12 = 0,0833 (CT IV.1.4) 1.2.2 Xác định phân phối hậu nghiệm của tham số tỉ lệ p
Phân phối hậu nghiệm đối với tỉ lệ p chính là sự tổng hợp của thông tin tiênnghiệm và dữ kiện quan sát trong thực tế
Giả sử thực hiện phép thử phân biệt trong thực tế thu được n câu trả lời trong đó có
x câu trả lời đúng
a x
1.2.3 Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm – Xác định khoảng tin cậy của tỉ lệ p ứng với mức ý nghĩa cho trước
Dựng đường cong phân phối beta:
Ta có thể dựng các đường cong phân phối beta tiên nghiệm và hậu nghiệm cũngnhư tính toán giá trị các hàm mật độ f(p), hàm xác suất tích lũy F(p), hàm định bậc p[F(p)]
bằng cách sử dụng phần mềm thống kê R Các đoạn code phục vụ cho quá trình tính toán sẽ được trình bày trong phần Phụ lục.
Đường cong phân phối hậu nghiệm có độ nhọn cao hơn ứng với phương sai nhỏ hơnphân phối tiên nghiệm (2* < 2), điều đó có nghĩa là mức độ chắc chắn đối với tham số pcủa phân phối hậu nghiệm cao hơn phân phối tiên nghiệm
Xác định khoảng tin cậy của p:
Tính gần đúng: (Jian Bi, 2001)
Ứng với mức ý nghĩa cho trước, khoảng tin cậy hai phía (p1; p2) của p theo phânphối hậu nghiệm được xác định như sau:
Trong đó Z là giá trị tra trong Bảng xác suất tích lũy của phân phối chuẩn chuẩn
tắc (standard normal distribution) [5] thỏa 1 2
và Hàm xác suất tích lũy: F(u) = (u) + 0,5
Dùng phần mềm thống kê R:
Ứng với mức ý nghĩa cho trước, ta dùng phần mềm thống kê R để tính hàm định
bậc p[F(p)], từ đó xác định được khoảng tin cậy hai phía (p1; p2) của p theo phân phối hậunghiệm dựa trên các điều kiện sau:
Trang 17p1 là giá trị của p ứng với hàm xác suất tích lũy F * (p) = /2
p2 là giá trị của p ứng với hàm xác suất tích lũy F * (p) = 1 – (/2)
1.2.4 Kiểm định giả thiết giả thiết chính H: (p H ) theo dữ kiện thực tế D: (n,x) bằng phương pháp thống kê Bayesian
Một cách tổng quát, từ đường cong phân phối beta hậu nghiệm, ta có thể tính cácxác suất ứng với giá trị pH bất kỳ:
P(p < pH) = F(pH) và P(p > pH) = 1 – F(pH) Với hàm xác suất tích lũy F(pH) được tính bằng phần mềm thống kê R.
Khi đó, giá trị pH để kiểm định giả thiết chính H được chọn dựa trên:
Mục đích của nhà sản xuất hay nghiên cứu: Mong muốn các sản phẩm là giốnghay khác nhau tùy theo chiến lược kinh doanh đối với người tiêu dùng Mộtcách gần đúng, có thể ước tính pH = pc theo tỉ lệ người phân biệt cho phép dựa
trên CT III.3.1(tỉ lệ pd cao nếu kỳ vọng hai sản phẩm khác nhau và thấp nếu kỳvọng hai sản phẩm giống nhau)
Nếu ta chỉ muốn xét xem hai sản phẩm giống hay khác nhau về tính chất cảmquan mà không kỳ vọng pH đạt một giá trị nào đó thì thường chọn pH = p ngẫu
nhiên theo phần III.2.2.1.
Từ đó, ta có:
Xác suất của giả thiết chính H:
P(H) = pH ứng với P(notH) = 1 – pH
hoặc P(H) = 1 – pH ứng với P(notH) = pH
Xác suất của giả thiết chính H theo dữ kiện thực tế:
P(HD) = P(p < pH) = F(pH) ứng với P(notHD) = P(p > pH) = 1 – F(pH)hoặc P(HD) = P(p > pH) = 1 – F(pH) ứng với P(notHD) = P(p < pH) = F(pH)
Theo (Carlin và Louis, 2000), ta có thể dùng thừa số (hệ số) Bayes (Bayes’ factor), ký hiệu B, để đi đến kết luận về giả thiết chính H Theo CT II.2.6, ta có:
) / ( ).
( ) / ( ).
(
) / ( ) ( )
(
) / ( ) ( ) /
(
notH D P notH P H D P H P
H D P H P D
P
H D P H P D H
)/(/)/()/(
)/()
/()(
)/()()/(
)/(
2 1
2 1
2
1 2
2
1 1
2
1
H P H P
D H P D H P H D P
H D P B H
D P H P
H D P H P D H
P
D H P
Suy ra BP P(D(D/notH/H)) P(H P/(H D))//P P((notH notH)/D) (CT IV.1.16)
Nếu 2lnB [2,2; 6] ứng với B [3; 20,09]: Ta nói giả thiết H có bằng chứng
xác thực / rõ ràng (positive evidence).
Nếu 2lnB > 6 ứng với B > 20,09: Ta nói giả thiết H có bằng chứng chắc chắn /
thuyết phục (strong evidence).
Trang 182 Các ví dụ
2.1 Ví dụ 1
Xét Ví dụ ở phần II.2.1: Thực hiện phép thử phân biệt A - nonA thu được n = 100
câu trả lời trong đó có x = 60 câu trả lời đúng Ta sẽ kiểm định sự giống/khác nhau của haisản phẩm theo phương pháp thống kê Bayesian
Gọi p [0; 1] là đại lượng ngẫu nhiên đặc trưng cho xác suất đưa ra câu trả lờiđúng của người thử hay tỉ lệ trả lời đúng Ta tiến hành các bước sau:
Xác định phân phối tiên nghiệm:
Do ta không có bất kỳ thông tin tiên nghiệm nào về hai sản phẩm, tức là khôngbiết hai sản phẩm có xu hướng giống hay khác nhau, nên ta xem tham số tỉ lệ p tuân theophân phối đều Ta có:
Các tham số: a = b =1
Trung bình tiên nghiệm: = 0,5
Phương sai tiên nghiệm: 2 = 1/12 = 0,0833
Độ lệch chuẩn = 0,2887
Xác định phân phối hậu nghiệm:
Các tham số:
1 60
a x
(CT IV.1.12)
Phương sai: 2* = *
0023 0 10 3339 2 5980 0 1 5980 0 1 1 1 100
Độ lệch chuẩn * = 0,0483
Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm
(dùng phần mềm R)
Xác định khoảng tin cậy (p 1 , p 2 ) của phân phối hậu nghiệm: Chọn = 0,05
Theo (Jian Bi, 2001):
Hoặc dùng phần mềm thống kê R, ta xác định được:
p1 = 0,5017 ứng với xác suất tích lũy F(p1) = 0,025
p2 = 0,6907 ứng với xác suất tích lũy F(p2) = 0,975
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5017; 0,6907),nghĩa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,5017; 0,6907)