Đây là kĩ thuật được con người dùng để đánh giá phân tích cho các nhóm sản phẩm từ đó đưa ra thông tin tốt nhất về sản phẩm, đánh giá sâu sắc về ảnh hưởng các tính chất đối với... Bảng d
Trang 1BÀI TẬP NHÓM MÔN:
XỬ LÍ SỐ LIỆU THỰC NGHIỆM NGÀNH CÔNG NGHỆ THỰC PHẨM
Đề tài : Thống kê mô tả về 6 loại Chocolates ở Pháp
GVHD: TS.Nguyễn Bá Thanh Lớp DHTP9 tiết 5-6
TP,HCM
MỤC LỤC
I.MỞ ĐẦU 2
Trang 21.Tính cấp thiết của đề tài 2
2.Mục đích nghiên cứu 2
3.Đối tượng nghiên cứu 3
4.Phạm vi nghiên cứu 3
5.Bố cục bài báo cáo 3
II.KẾT QUẢ NGHIÊN CỨU 4
1 Đối với dữ liệu hedochoc 4
2.Đối với dữ liệu sensochoc 8
3.Đồ thị Radar về Sensory profile của các loại chocolates 14
4.Ma trận tương quan về các tính chất cảm quan của sản phẩm 15
III KẾT LUẬN 18
PHẦN PHỤ LỤC(CODE LỆNH SỬ DỤNG) 19
TÀI LIỆU THAM KHẢO 27
I.MỞ ĐẦU 1.Tính cấp thiết của đề tài
Cùng với sự phát triển của công nghệ thực phẩm chế biến thì lĩnh vực đánh giá cảm quan đang phát triển nhanh chóng Đây là kĩ thuật được con người dùng để đánh giá phân tích cho các nhóm sản phẩm từ đó đưa ra thông tin tốt nhất về sản phẩm, đánh giá sâu sắc về ảnh hưởng các tính chất đối với
Trang 3sản phẩm mang lại thông tin bổ ích cho người sử dụng và cũng nghiên cứu sản phẩm dựa vào sự phản hồi của người tiêu dùng về sản phẩm.
Trong xu hướng nghiên cứu về dánh giá cảm quan hiện nay, những nghiên cứu về người tiêu dùng đang được chú trọng vì đây là đối tượng cuối cùng sử dụng sản phẩm và đưa ra phản hồi về sản phẩm cho nhà sản xuất Do vậy người tiêu dùng là yếu tố không thể thiếu trong tiến trình hình thành và phát triển sản phẩm.
Bài báo cáo này trình bày một cách tiếp cận mới, thể hiện vai trò không thể thiếu của đánh giá cảm quan trong nghiên cứu lựa chọn thực phẩm của người tiêu dùng.
2.Mục đích nghiên cứu
Giới thiệu đôi nét về phần mềm R:
Nói một cách ngắn gọn, R là một phần mềm sử dụng cho phân tích thống kê và vẽ biểu đồ Thật ra, về bảnchất, R là ngôn ngữ máy tính đa năng, có thể sử dụng cho nhiều mục tiêu khác nhau, từ tính toán đơn giản,toán học giải trí (recreational mathematics), tính toán ma trận (matrix), đến các phân tích thống kê phức tạp
Vì là một ngôn ngữ, cho nên người ta có thể sử dụng R để phát triển thành các phần mềm chuyên môn chomột vấn đề tính toán cá biệt
Từ số liệu thu nhận được ta nhập vào R sau đó thực hiện các thao tác tính toán Nhưng mỗi dữ liệu khácnhau có mục đích khác nhau, vì thế ta phải nhắm rõ mục đích nghiên cứu để từ đó sử dụng các phương pháptính toán trong R một cách hợp lý
Công việc đối với dữ liệu chocolates:
Là việc khảo sát về tính chất của 6 loại chocolates tại Pháp Mô tả về tính chất cảm quan của sản phẩm:mỗi loại chocolate được đánh giá bởi 29 bảng danh sách được sắp xếp theo 14 tính chất cảm quan Dữ liệumức độ ưa thích: mỗi loại chocolate được đánh giá theo cấu trúc từ 0 (thích) đến 10 (không thích) bởi 222người tiêu dùng
Hedochoc: Dữ liệu gồm 6 dòng và 222 cột, mỗi dòng tương ứng với một loại chocolate và mỗi cột là điểm số
ưa thích được cho bởi 222 người tiêu dùng tham gia nghiên cứu
Từ số liệu ta thấy được row.names là giá trị định tính, các giá trị khác là giá trị định lượng Bảng dữ liệu
là kết quả khảo sát mức độ thích của 222 người tiêu dùng về 6 sản phẩm chocolate, từ đó ta kiểm tra giữanhững người tiêu dùng có sự khác nhau hay không ở điều này chúng ta mong đợi là không có sự khác nhaugiữa các người thử; kiểm tra giữa các mẫu thử có sự khác nhau hay không, ở việc kiểm tra này chúng ta mongđợi phải có sự khác nhau và xem sản phẩm nào khác nhau nhiều nhất
Trang 4Sensochoc: dữ liệu gồm 348 dòng và 19 cột, 5 biến chất lượng (Panelist, Session, Rank, Product) và 14 tính chấtcảm quan
Từ bảng số liệu ta thấy ở 4 giá trị đầu (panelist, session, rank, product) là giá trị định tính còn các giá trị cònlại(cocaA, milkA, caramel, vanilla, )là giá trị định lượng Từ dữ liệu của sensochoc ta nêu lên xem có sự khácbiệt giữa tính chất trong chocolate như cocaA, milkA, caramel, vanilla, với panelist hay session, rank, product;
và so sánh các thành phần trong chocolates với từng nhóm yếu tố từ đó ta có thể biết với tính chất đó thì tậptrung có ở các sản phẩm nào; hay sản phẩm nào có tính chất trội hơn các sản phẩm khác xem
3.Đối tượng nghiên cứu
Việc xác định mục đích nghiên cứu rất quan trọng để phân tích một dữ liệu, bên cạnh đó ta phải xác địnhđược đối tượng nghiên cứu là phần cũng quan trọng không kém nó giúp cho ta biết cách đưa ra một kết quảhoàn chỉnh đúng theo yêu cầu
Đối với dữ liệu Choccolates này thì đối tượng nghiên cứu là người tiêu dùng và các chuyên gia nghiên cứutrong việc khảo sát 6 loại chocolates ở Pháp Đối với dữ liệu sensochoc thì đối tượng nghiên cứu là người có sựhiểu biết về mùi vị của chocolate, họ đánh giá 6 loại sản phẩm theo panelist, session, rank trên các yếu tốcocoaA, milkA, cocoaF, milkF, caramel, vanilla, sweetness(Độ ngọt), acidity(Độ chua), bitterness(độ đắng),astringency(Độ chát), crunchy(Độ giòn), melting(Tan chảy), sticky(Độ dính), granular(độ mịn) Đối vơi dữ liệuhedochoc thì đối tượng nghiên cứu là người tiêu dùng đánh giá 6 loại sản phẩm chocolate bằng cách cho điểmquen thuộc
4.Phạm vi nghiên cứu
- Trong lĩnh vực công nghệ thực phẩm
- Áp dụng cho người tham gia nghiên cứu và quan tâm đến sản phẩm Chocolates
Trang 55.Bố cục bài báo cáo
Bài báo cáo nghiên cứu về hai bảng khảo sát Hedochoc và Sensochoc
Gồm 4 phần:
1 Đối với dữ liệu hedochoc: Nhóm tiến hành vẽ đồ thị cột về điểm thị hiếu của 6 loại chocolate và phân tích phương sai liệu có sự khác nhau về điểm ưa thích trên nhóm đối tượng nghiên cứu.
2 Đối với dữ liệu sensochoc: sử dụng kiểm định phân tích phương sai để đánh giá sự khác nhau về 3 thuộc tính (tự chọn) trên nhóm sản phẩm nghiên cứu và xem xét liệu có sự ảnh hưởng của yếu tố nào? Mô hình phân tích phương sai
3 Sử dụng đồ thị radar để vẽ biểu đồ sensory profile của các loại Chocolate.
4 Xác định ma trận tương quan giữa các tính chất cảm quan và nhận xét kết quả này.
II.KẾT QUẢ NGHIÊN CỨU
1 Đối với dữ liệu hedochoc
Biểu đồ cảm quan về điểm thị hiếu của 6 loại chocolates
Trang 6Biểu đồ 1: Giá trị cảm quan về điểm thị hiếu cho từng loại chocolates
Qua biểu đồ cột đánh giá cảm quan về tùng chỉ tiêu cho mỗi sản phẩm cho thấy tỷ lệ yêu thích của
người tiêu dùng cho mỗi loại chocolates có điểm khác nhau, trục tung cho thấy số lượng người yêu
thích, trục hoành cho thấy thang điểm đánh giá cho từng loại chocolates:
-choc1, choc3, choc5 có đối tượng ưa thích và đánh giá sản phẩm tương đối cao.
Histogram of Hedo[, "choc1"]
Trang 7- Ở choc1 điểm trung bình là 5.329, được đánh giá là đối tượng khá được yêu thích so với sản phẩm khác,có khoảng 25% đối tượng nghiên cứu đánh giá sản dưới 3 điểm,75% đối tượng đánh giá sản phẩm dưới 7.750 điểm, 50% đối tượng đánh giá sản phẩm trên 5 điểm
-choc3 điểm trung bình là 5.766, có 50% đối tượng cho trên 6 điểm, 25% đối tượng nghiên cứu cho dưới 4 điểm, 75% đối tượng nghiên cứu cho dưới 8 điểm
-choc5 điểm trung bình là 5.626, có 50% đối tượng cho trên 6 điểm, 25% đối tượng nghiên cứu cho dưới 4 điểm, 75% đối tượng nghiên cứu cho dưới 7 điểm
- còn ở choc4 và choc6 thì không có gì khác biệt, điểm trung bình tương đối cao 5.766-5.905, số lượng người ua thích ở múc độ thấp, choc4 có khoảng 25% đối tượng thấp hơn 4 điểm, 75% đối tượng cho điểm thấp hơn 8, khoảng 50% đối tượng cho điểm trên 6 điểm Choc6 có 25% đối tượng cho dưới 5điểm, 75% đối tượng cho dưới 7 điểm, 50% đối tượng cho trên 5 điểm
Biểu đồ cột về điểm thị hiếu cho từng loại chocolates
Trang 8Biểu đồ 2: Đồ thị cột về điểm thị hiếu của người tiêu dùng về 6 loại Chocolates
Đánh giá nhận xét : trên là biểu đồ cột về điểm thị hiếu nói chung cho từng loại chocolates Dựa vào giá trị trung bình cho từng sản phẩm chocolates cho thấy điểm ưa thích của các sản phẩm không có điểm khác biệt lớn, tương tự biểu đồ cảm quan ta cũng thấy rằng choc1, choc5 cũng có sự khác biệt rõ hơn so với sản phẩm khác, đây là các sản phẩm được ưa thích nhiều.( Ở đây đánh giá theo thang điểm
0 đến 10, 0 điểm được coi là ưa thích nhất, điểm 10 là không thích)
Preference mapping of Chocolates
Trang 9Dựa trên biểu đồ cảm quan và biểu đồ cọt về điểm thị hiếu có thể thấy rằng mức độ ưa thích sản phẩm choc1, choc5, cao hơn so với choc2, choc4, choc6,choc3 nhưng ở mức độ không đáng kể.
Đây là biểu đồ Boxplot hỗ trợ cho quá trình phân tích điểm thị hiếu của người tiêu dùng cho từng loại chocolates Cho thấy chocolates được ưa thích nhiều nhất, choc6 có điểm cao nhất tức mức
độ ưa thích thấp nhất, còn ở các loại chocolates khác thì mức độ khác không đáng kể.
Biếu đồ 3: Biểu đồ hộp về điểm thị hiếu của người tiêu dùng về 6 loai chocolates
Trong biểu đồ này, chúng ta thấy:
+Ở choc1:số trung vị là 5,2%, có bách phân vị (Q1=25%), (Q3=75%) mức độ ưa thích dao động từ (3,1-7,9),trong đó mức ưa thích cao nhất là 3,1 và mức thấp nhất là 7,9 trong đó 0(thích) và 10(không thích ) khác biệt giữa Q1 và Q3 là IQR=Q3-Q1=4,8,hai thanh whiskers,thanh trên là 10%,thanh dưới 0%.Đây alf sản phẩm được ưa thích hơn
Trang 10nhìn chung ở các loại chocolates thì ta có thể chia ra làm 4 nhóm nhỏ:nhóm choc1 được
ưa thích nhiều nhất nằm trong khoảng (3,1-7,9).
+Tiếp theo nhóm choc2 và 5 trong đó choc2 có khoảng ngoại vi thể hiện mức ưa thích cao hơn nhưng nhìn chung có mức độ ưa thích tương đương nhau dao động trong khoảng (4-7,2), nhóm choc 3 và choc 4 cũng ngang nhau dao động trong khoảng (4- 7,9),cuối cùng nhóm choc 6 mức độ ưa thích dao động trong khoảng (5-7,2)
Phân tích phương sai
Để phân tích phương sai ta dùng kiểm định ANOVA để đánh giá.
Dựa trên kết quả phân tích cho thấy bậc từ do ở đây là 1(Df), từ kết quả phân tích phương sai cho thấy P-value=0.5403>0.05, điều này chứng tỏ sự khác nhau của các loai chocolates không có ý nghĩa thống
kê, nên ta chọn loại chocolates nào cũng được
2.Đối với dữ liệu sensochoc
Phân tích phương sai đánh giá sự khác biệt giữa các thuộc tính tự chọn
Ta chọn 3 thuộc tính:CocoaA, CocoaF, MilkA để đánh giá xem sự khác biệt và ảnh hưởng bởi yếu tố nào.
CocoaA
#Qua kết quả phân tích ta thấy ở đặc tính CocoaA chỉ có sự khác biệt giữa các sản phẩm (product),(pvalue<0.05) và sự khác biệt cụ thể là : sự khác biệt xuất phát từ choc3.Ta dùng kiểm định Tukey đẻ thấy rõ sự khácbiệt này
Hình ảnh về kết quả phân tích:
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = CocoaA ~ Panelist + Session + Rank + Product + Panelist:Session + Panelist:Rank +Panelist:Product + Session:Rank + Session:Product + Rank:Product)
Trang 11choc6-choc4 0.09870902 -0.9401832 1.1376012 0.9997962
choc6-choc5 -0.42313572 -1.4620279 0.6157565 0.8518869
Biểu đồ 4 Đồ
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = MilkA ~ Panelist + Session + Rank + Product +Panelist:Session+Panelist:Rank+Panelist:Product+ Session:Rank + Session:Product + Rank:Product)
Trang 13Tìm hiểu chung về PCA: Phân tích thành phần chính (PCA) là một phương pháp thống kê toán học trong đóthông tin giữa các biến và cá thể khảo sát được chiếu lên trong không gian đa chiều mà các chiều (trục) đầutiên có ý nghĩa quan trọng nhất (chứa nhiều thông tin nhất) Phân tích thành phần chính làm giảm đa chiều dữliệu bằng cách thực hiện một phân tích hiệp phương sai giữa các yếu tố Cách thức chính thức của phươngpháp này là mỗi trục kế tiếp sẽ được giảm lược các thành phần chứa ít thông tin nhất trong các biến và cá thể.Như vậy, nó phù hợp để sử dụng cho nhóm dữ liệu gồm nhiều khía cạnh, chẳng hạn như một điều tra so sánh
về những tính chất của nhiều sản phẩm cùng lúc
Mô hình phân tích thành phần chính đơn giản nhất là phân tích đa biến Nó có thể dùng để tìm ra cấu trúc bên trong của dữ liệu để giải thích các dữ liệu sai
Trang 14Phân tích thành phần chính là một công cụ mạnh để phân tích dữ liệu Việc sử dụng công cụ này phụ thuộc vàoloại thử nghiệm và loại câu hỏi mà bạn muốn có câu trả lời Trong hầu hết trường hợp, chỉ cần chạy một phântích này trên mỗi thử nghiệm của bạn
Phân tích thành phần chính được khuyến cáo sử dụng như là một công cụ thăm dò nhằm phát hiện ra xuhướng cần tìm hiểu trong các dữ liệu
Lưu ý rằng vì mục tiêu của phân tích thành phần chính là “tóm tắt” dữ liệu Nó không được coi là một công cụ
để “thu gom” dữ liệu
Kết quả của một phân tích thành phần chính thường thảo luận về các thành phần và những điểm trội(Shaw, 2003)
PCA ứng dụng trong lĩnh vực thực phẩm thường dùng để đưa ra cách thức để xác định những tính chấtnào chiếm ưu thế hơn trong một sản phẩm Nó cũng sẽ tìm hiểu mối tương quan giữa các sản phẩm và tínhchất của các sản phẩm đó
Kết quả phân tích:
Trang 15Biểu đồ 7:
Nhận xét:
+ Đây là mô hình phân tích phương sai tổng quan, nhìn vào nó ta có cái nhìn tổng quan về dữ liệu chocolatestrên từng nhóm sản phẩm Nhìn vào biểu đồ cho thấy Dim1 giải thích được 88.79%, Dim2 giải thích được7.58%, sự khác biệt trên nhóm sản phẩm choc3, nhóm sản phảm choc2,choc5,choc6 không có sự khác biệtnhiều nên nằm gần nhau, choc4 và choc1 có sự đánh giá gần giống nhau nên cũng nằm gần nhau
choc5
choc6
Trang 16+ Hai sản phẩm 1 và 3 lại ở khá xa nhóm này và ở rất xa nhau nên hai sản phẩm này gần như hoàn toàn khác nhau và khác với nhóm sản phẩm 2, 4, 6 và cũng khác so với sản phẩm 5.
Biểu đồ 8Nhận xét: Trên đây là biểu đồ đánh giá các thuộc tính có trong sản phẩm chocolates Dựa trên biểu đồ
ta thấy các thuộc tính Sticky, Vanila, CocoaF, Sweetness, Caramel, MilkA, MilkF, Melting không được ưa thíchtrên sản phẩm chocolates Còn các thuộc tính còn lại Acidity, Astringency,Bitterness, CocoaA, CocoaF,Granular, Crunchy được ưa thích trên sản phẩm chocolates, và các thuộc tính không được ưa thích kìm hãmcác thuộc tính được ưa thích trên sản phẩm chocolates Từ đó cho thấy mức độ ưa thích của các thuộc tínhtrên từng sản phẩm Các chấm màu cho thấy mức độ đạt chỉ tiêu cho từng thuộc tính trên sản phẩm, càng sátvới vong tròn thì mức độ ưa thích càng cao trên nhóm sản phẩm
Và dưới đây là bảng so sánh chất lượng và mức độ chênh lệch giữa các sản phẩm với nhau, lấy giá trị là 1 chocác sản phẩm, và tương quan giữ các sản phẩm dựa vào giá trị tra được trong bảng, nhóm sản phẩm choc2 vàchoc5 gần như giống nhau về các tính chất cảm quan
AcidityBitterness
Astringency
Crunchy
MeltingSticky
Trang 173.Đồ thị Radar về Sensory profile của các loại chocolates
P-values for the Hotelling T2 tests
2.213e-24 7.884e-17 1 1.912e-17 1.599e-16 1.934e-15
5.377e-07 0.0008818 1.912e-17 1 0.0007292 3.787e-07
2.319e-17 0.00759 1.934e-15 3.787e-07 0.06995 1
Trang 18Đây là đồ thị thể hiện Sensory profile của từng loại chocolates:
+ Choc1 thuộc tính Crunchy, CocoaF, và Acidity có nhiều trong loại chocolates này và được ưa thích trên nhóm đối tượng nghiên cứu choc1,còn các thuộc tính khác ở mức độ trung bình, không làm giảm giá trị của choc1.
Radar Chart
CocoaA MilkA
Sticky Granular
choc1 choc2 choc3 choc4 choc5 choc6 n
Trang 19+ Choc2 thuộc tính caramel không được ưa thích trên nhóm sản phẩm này, đặc tính CocoaF được chấm điểm thấp nhất và độ ngọt cũng không được chấm điểm cao ở loai choc2 này và dây là hai thuộc tính được ưa thích ở choc2, những thuộc tính khác cũng ở mức độ trung bình trong khi đánh giá + Choc3 thuộc tính CocoaF là thuộc tính được ưa thích nhất trên nhóm sản phẩm này, cá thuộc tính còn lại cũng được đánh giá ở mức độ trung bình,
+ Choc4 Melting, Granular, CocoaF là thuộc tính được ưa thích ở sản phẩm này, Sticky không được ưa thích trên nhóm đối tuogwj nghiên cứu choc4
+ Choc5 thuộc tính CocoaF được chấm điểm 0, mức độ ưa thích đạt điểm ưa thích nhất, Caramel, Bitterness và Granular không được ưa thích trên choc5
+ Choc6 có điểm tương quan so với choc1, thuộc tinh CocoaF cũng được ưa thích trên nhóm đối tượng này
Đánh giá chung: Thuộc tính CocoaF được ưa thích nhiều nhất trên mọi loại sản phẩm nghiên cứu, các yếu tố Melting, Granular cũng được ưa thích nhưng không cao so với CocoaF, và các thuộc tính còn lại ít ảnh hưởng đến sự đánh giá của các tham luận viên, người tieu dùng về các thuộc tính này
Và đây là cái nhìn tổng quan về các thuộc tính có trong đối tượng nghiên cứu:
Dựa vào đây có thể thấy tính chất CocoaF trong sản phẩm luôn được yêu thích, tiếp theo là Melting, Acidity, các thuoccj tính còn lại ưa thích ở múc độ trung bình
I001
CocoaA MilkA