Mục tiêu Giúp sinh viên độc lập trong nghiên cứu khoa học, có khả năng xử lý số liệuthường gặp trong điều tra, nghiên cứutrong công nghệ sinh học thực phẩm Trang bị cho sinh viên kỹ
Trang 1TIN HỌC ỨNG DỤNG TRONG CNSHTP
Trang 2Mục tiêu
Giúp sinh viên độc lập trong nghiên cứu
khoa học, có khả năng xử lý số liệuthường gặp trong điều tra, nghiên cứutrong công nghệ sinh học thực phẩm
Trang bị cho sinh viên kỹ năng sử dụng
phần mềm tin học trong việc giải quyết
xử lý, trình bày số liệu và giải quyết một
số bài toán trong công nghệ
Trang 3Tài liệu tham khảo
Nguyễn Ngọc Kiểng, Thống kê học trong
nghiên cứu khoa học, NXB Giáo dục, 1996.
Lê Đức Ngọc, Xử lý số liệu và kế hoạch hóa
thực nghiệm, Khoa Hóa, ĐHQGHN, 2001.
Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB
Đại học Quốc gia, 2004
Phan Hiếu Hiền, Phương pháp bố trí nghiệm
và xử lý số liệu, NXB Nông nghiệp, 2001
Trang 44. Bố trí thí nghiệm nghiên cứu thực phẩm
5. Xử lý số liệu thí nghiệm kiểu hoàn toàn
ngẫu nhiên bằng phần mềm Statgraphics
Trang 5Nội dung
6 Xử lý số liệu thí nghiệm kiểu khối ngẫu
nhiên đầy đủ bằng phần mềm Statgraphics
7 Xử lý số liệu thí nghiệm kiểu bình phương
Latin bằng phần mềm Statgraphics
8 Xử lý số liệu thí nghiệm đa yếu tố bằng phần
mềm Statgraphics
9 Xử lý số liệu thí nghiệm hồi quy và tương
quan tuyến tính bằng phần mềm Statgraphics
10 Giải một số bài tốn cơng nghệ bằng phần
mềm EXCEL
Trang 71.1 Tin học ứng dụng trong nghiên cứu thực phẩm
Trong mọi ngành khoa học thực nghiệm:
thực tế
thí nghiệm kết quả bằng số
Trang 8Kết quả bằng số:
là giá trị của một biến ngẫu nhiên
phụ thuộc vào nhiều yếu tố
ước lượng được qui luật phụ thuộc(nghiên cứu trên một tập hợp mẫu với độtin cậy nào đó)
Trang 101.2 Phần mềm ứng dụng trong bảng tính
Phần mềm bảng tính EXCEL
Tạo biểu bảng số liệu
Biễu diễn số liệu dưới dạng biểu đồ
Xử lý thống kê số liệu nghiên cứu
Trang 11Bảng phân phối tần số
Sắp xếp, trình bày dữ liệu một cách có hệthống
Phân chia dữ liệu thành từng nhóm khácnhau
Căn cứ để hình thành biểu đồ phân phốitần số
Trang 12Sơ đồ tổng quát của bảng phân phối tần số
Trị số của biến
(Xi)
Tần số (số lần xuất hiện của trị số - fi)
Trang 13Sơ đồ tổng quát của bảng phân phối tần số
Trang 14Sơ đồ tổng quát của bảng phân phối tần số
Năng
suất
Tần số
Tần số tương đối (%)
Tần số tích lũy
Tần số tương đối tích lũy
Trang 15Biểu đồ trong thống kê
Biểu diễn toàn bộ số liệu
Thể hiện nét đặc trưng của tập hợp số liệu
Biểu diễn mối quan hệ giữa tính trạngnghiên cứu và chỉ tiêu theo dõi
Trang 16Biểu đồ phân phối tần số
Biểu đồ cột
Trình bày số quan sát lớn
Có thể trình bày tần số tương đối, tần sốtích lũy, tần số tương đối tích lũy
Trang 17Biểu đồ phân phối tần số
Trang 20Biểu đồ tần số tương đối tích lũy
Trang 21Biểu đồ hộp
Khảo sát sơ lược dữ liệu
Tổng quát về phân phối của mẫu/ tổngthể
thể hiện ví trí tập trung, phân tán, bấtthường
Trang 22Biểu đồ hộp
Trang 23Biểu đồ hộp
Khối hộp ‘box’ kéo dài từ giá trị phân vị
¼ đến giá trị phân vị ¾ , khoảng 50% giátrị nẳm trong ‘box’
Đường thẳng đứng ở vị trí trung bị mẫu,chia dãy số liệu thành 2 phần bằng nhau,nếu mẫu phân bố đối xứng thì đường nàynằm gần trung tâm của khối hộp
Trang 24Biểu đồ hộp
Dấu + ở vị trí trung bình của mẫu
Sự khác biệt đáng kể giữa trung bình vàtrung vị cho thấy có một vài số liệu cókhả năng gây ra sai số làm phân bố củamẫu bị lệch
Đoạn thẳng hai đầu gọi là ‘whisker’ nối
từ giá trị cực tiểu đến điểm phân vị ¼ và
từ điểm phân vị ¾ đến giá trị cực đại
Trang 25Biểu đồ điểm
Trang 261.3 Phần mềm ứng dụng trong xử lý thống kê
Phần mềm xử lý thống kê Statgraphics
Thao tác cơ bản trong phần mềm
Xử lý thống kê số liệu nghiên cứu
Thao tác sao chép kết quả xử lý vào
phần mềm văn bản WORD
Trang 271.4 Phần mềm ứng dụng trong biểu diễn công thức hóa học
Phần mềm ChemWindow
Thao tác cơ bản trong phần mềm
Trang 282 Mô tả đại lượng thống kê bằng phần
mềm tin học
Phân tích thống kê
Đại lượng đo lường xu hướng trung bình
Đại lượng đo lường sự biến thiên
Xác định các đại lượng thống kê bằng
phần mềm tin học
Trang 292.1 Phân tích thống kê
Các con số tóm lược thông tin định lượng
Phương pháp tính toán để giúp chúng tatóm lược hoặc khái quát hoá thông tin
Kỹ thuật giúp quyết định vấn đề như phântích phương sai, tương quan hồi qui, trắcnghiệm, …
Trang 30Hạn chế của thống kê
Sử dụng thống kê phải biết rành về lĩnhvực chuyên môn của người nghiên cứu
Thống kê chỉ là phương tiện, công cụ
Thống kê trình bày những số liệu hoặchiện tượng rời rạc một cách hệ thống hơn,chứ không nói được bản chất của sự việc
Thống kê không thay thế được cho suynghĩ và kết luận của người nghiên cứu
Trang 31Thống kê mô tả
Là một trong những bước đầu tiên đểphân tích vấn đề và thực hiện một quyếtđịnh
Gồm các tính toán cơ bản mang tính chất
mô tả như trung bình, phương sai, độlệch chuẩn, … nhằm tổng kết về kết quảcủa thí nghiệm
Trang 32Thống kê mô tả
Phương pháp tóm lược thông tin để làmcho chúng trở nên dễ hiểu tức giảm một
số lớn các số liệu phức tạp thành một sốnhỏ hơn gồm các giá trị tóm tắt
Mô tả mối quan hệ giữa các biến số
Trang 33Thống kê suy diễn
Khái quát hoá thông tin của một mẫu chotoàn dân số của mẫu tức là chỉ đo đếmtrên một tiểu tập hợp rồi suy luận chotoàn bộ với một độ tin cậy nào đó
Cung cấp kỹ thuật để kiểm tra trên mộtmẫu và sử dụng thông tin này để suyrộng ra các đặc tính của toàn bộ dân số
Trang 342.2 Đại lượng đo lường xu hướng trung bình
Trang 36Mode: (Mo)
Biến số đơn thức là biến số khi gần nhưmọi trường hợp đều tập trung về một giátrị
Biến số nhị thức là biến số khi gần như cóhai hay nhiều trường hợp nhất và gần nhưtương đương nhau
Trang 38X
Trang 39Trung bình cộng
Đại diện cho cả một tập hợp lớn số liệu
Nêu lên đặc điểm chung nhất của hiệntượng
Dùng để so sánh các hiện tượng không cócùng qui mô
X
Trang 40Trung bình cộng số học
n
X X
Trang 41Trung bình có trọng số
Là trường hợp đặc biệt của trung bình sốhọc khi gía trị của biến xuất hiện nhiềulần
f
f
X X
1 1
Trang 42Trung bình của dữ liệu phân nhóm có khoảng cách
f
f
m X
1 1
Trang 43Trung bình nhân (trung bình hình học)
GM
Căn bậc n cho n giá trị
Thay cho trung bình cộng trong trườnghợp dãy số liệu có phân phối lệch (giá trịđột biến)
n
n
X X
X
Trang 452.3 Đại lượng đo lường sự biến thiên
Trang 46Phương sai (variance)
Phương sai là trung bình của các độ lệchbình phương giữa các giá trị so với giá trịtrung bình
Trang 47 Cộng các hiệu số được bình phương
Lấy tổng của các hiệu số bình phươngchia tổng giá trị
Trang 48Ý nghĩa của phương sai
Nếu các giá trị được phân phối một cáchdàn trãi trên diện rộng và cách xa trungbình thì độ lệch sẽ lớn và phương sai sẽrất lớn
Nếu các giá trị quần tụ gần giá trị trungbình thì độ lệch sẽ nhỏ và phương sai sẽnhỏ
Trang 49Độ lệch chuẩn (standard deviation)
Biểu thị mức độ phân tán (cùng bản chấtcủa tính trạng)
Độ lệch càng lớn mức độ phân tán càngcao, tính đại diện trung bình càng nhỏ
Trang 50
Trang 51Mô tả biến thiên
Mô tả biến thiên chính là đo lường sựkhác biệt của các giá trị với một giá trịchuẩn nào đó tức là điểm trung bình
Trang 52Mô tả biến thiên
Trang 53Mô tả biến thiên
Trang 54Mô tả biến thiên
Trang 55Mô tả biến thiên
Thông thường làm tròn giá trị của độ lệchchuẩn và phương sai ở chữ số thập phânthứ 2
Biến thiên càng lớn thì độ lệch chuẩn vàphương sai càng lớn
Khi viết báo cáo kết quả phân tích thống
kê, thường dùng độ lệch chuẩn
Trang 56Hệ số biến dị
So sánh mức độ phân tán của các tínhtrạng có bản chất khác nhau
%
100
X SD
CV
Trang 57 Độ lệch < 0 (các giá trị có xu hướng tậptrung về phía bên trái của đồ thị)
Trang 58 Độ nhọn < 0 (phân bố có đồ thị bẹt hơnphân bố chuẩn)
Trang 592.4 Xác định các đại lượng thống kê bằng phần mềm tin học
Phần mềm EXCEL
Phần mềm STATGRAPHICS
Trang 603 Mô tả dữ kiện thí nghiệm bằng phần
mềm tin học
Mô tả dữ kiện
Phương pháp xử lý số liệu ban đầu
Xử lý số liệu của thí nghiệm so sánh 2
mẫu bằng phần mềm STATGRAPHICS
Trang 613.1 Mô tả dữ kiện
Hai biến số có giá trị trung bình như
nhau nhưng độ phân tán không giống nhau
Độ phân tán cho biết thông tin để đánh
giá độ tin cậy của giá trị tập trung
Trang 62Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Các giá trị của một biến số có sự phân phối
là phân tán hay tập trung
Giá trị đồng nhất (các giá trị của một biến
số có xu hướng quần tụ)
Giá trị không đồng nhất (các giá trị củamột biến số có xu hướng phân tán)
Trang 63Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Trung bình mẫu ước lượng giá trị trungtâm của phân bố
Độ lệch chuẩn của mẫu liên quan đến sựphân tán của số liệu
Trang 64Các đặc trưng thống kê thường dùng trong mô tả dữ kiện
Trung bình mẫu và Độ lệch chuẩn chỉ cógiá trị đại diện cho mẫu khi mẫu có phânphối chuẩn
Độ lệch (skewness) và độ nhọn (kurtosis)dùng để kiểm tra mẫu có phân bố chuẩnhay không
Trang 66Mẫu (sample)
Được chọn ngẫu nhiên từ dân số
Mẫu là một phần và là đại diện của dânsố
Phân tích mẫu có thể suy ra các đặc tínhcủa dân số với một mức độ tin cậy xácđịnh nào đó
Trang 67Mẫu ngẫu nhiên
Mẫu lấy từ dân số mà các đơn vị đều có
cơ hội đồng đều nhau, nó mang tínhkhách quan trong thu thập dữ kiện
Trang 68Dân số (population)
Là tập hợp những thông tin về người, sự vật hoặc sự việc riêng biệt kết hợp với
nhau trên cơ sở một đặc điểm chung nào
đó mà người nghiên cứu đang quan tâm
Là tập hợp toàn bộ các đối tượng nghiên cứu, điều tra, khảo sát
Trang 69Dân số
Thường rất lớn và không thể kiểm tra hết
Muốn biết thông tin về dân số chỉ có thể
đo đếm trên một tiểu tập hợp gọi là mẫu
Trang 71Biến số liên tục
Là các số nguyên dương và thập phân
Các số đo về chiều dài, trọng lượng, thểtích,
Trang 72Biến số rời rạc
Là các số nguyên dương
Các biến biểu thị tính chất hay số đếm
Trang 73Đơn vị
đối tượng cụ thể để đo đếm và thu nhập
dữ kiện
Một mẫu thăm dò sẽ có nhiều đơn vị
Đơn vị thống kê là một phần tử của mộttập hợp mẫu thống kê điều tra khảo sát
Trang 74Phương sai của mẫu
Công thức đo lường biến thiên của mẫu(phương sai)
n-1 gọi là bậc tự do của phương sai
Trang 75Phương sai của mẫu
Đối với một phương sai, có n-1 các độlệch có thể biến đổi một cách tự do mộtkhi chúng đã được nhận biết, độ lệch saucùng chắc chắn sẽ được xác định
Vì vậy có n-1 bậc tự do
Trang 76S i
Trang 77Điểm số chuẩn hoá
Được dùng để đo lường độ lệch của mộtđiểm số nào đĩ khi được so sánh vớitrung bình bằng độ lệch chuẩn
Trang 78Điểm số chuẩn hoá
Chuyển một điểm số nào đĩ thành mộtđiểm số chuẩn hố theo cơng thức:
Trang 79Điểm số chuẩn hoá
Điểm của sinh
viên lớp A
= , 1 00
6
6 6
Trang 80Biến số chuẩn hoá
Là biến số mà các điểm số của nó đềuđược chuyển thành điểm số chuẩn hoá
Tổng các điểm số chuẩn hoá bằng 0
Tổng bình phương của các điểm số chuẩnhoá luôn bằng n là tổng số trường hợptrong mẫu
Trang 81Sai biệt chuẩn
độ lệch chuẩn của một phân phối mẫuquan trọng đến mức phải đặt cho nó mộttên gọi riêng là sai biệt chuẩn (standarderror) được viết là:
x
Trang 82Sai biệt chuẩn
Là sai số của số trung bình (sai số chọnmẫu)
Có đơn vị như số trung bình
Biểu thị mức độ đại diện của mẫu đối vớidân số
Trang 83Sai biệt chuẩn
SE lớn biểu thị mức độ đại diện của mẫuđối với dân số nhỏ và ngược lại
Biểu thị mức độ tin cậy của mẫu
Ước lượng số trung bình của tổng thể
Trang 84Sai biệt chuẩn
Sai biệt chuẩn của trung bình là toàn bộ
độ lệch chuẩn của phân phối mẫu của cáctrung bình của toàn bộ mẫu có kích cỡnhất định trong dân số, được tính bằngcông thức:
nx
Trang 85Khoảng tin cậy
Trung bình của một dân số có thể đượctìm ra ở phía dưới và hoặc phía trên củatrung bình mẫu, do đó bên cạnh biết đượctrị trung bình của mẫu cần phải biếtkhoảng tin cậy
Trang 86Khoảng tin cậy
Chính sai biệt chuẩn sẽ cho biết khoảngtin cậy
Khoảng tin cậy 95%
Khẳng định với độ chắc chắn rằng 95%trung bình của dân số sẽ nằm trongkhoảng này
) 96
, 1 ( X x
Trang 87Khoảng tin cậy
Tương tự 99%:
) 58
, 2
Trang 88Mô tả dữ kiện
Phân phối dân số
Phân phối mẫu
Phân phối chuẩn
Trang 89Phân phối dân số
là phân phối của những điểm số trong mộtdân số
Trang 90Phân phối mẫu
là phân phối của những điểm số trong mộtmẫu có kích cỡ nhất định
là phân phối của một thống kê nào đó củatất cả các mẫu có cùng một kích cỡ trongdân số
Trang 91Phân phối chuẩn
Khi vẽ biểu đồ tương quan giữa tần số vàkết quả thu nhận, hình dạng đường congthông thường có dạng hình chuông gọi làphân phối chuẩn
Trang 92Phân phối chuẩn
Là một phân phối đối xứng có dạng hìnhchuông, biểu diễn bằng phương trình:
2 / )
(
xe
Y
Trang 93 Hai phân phối chuẩn với độ lệch chuẩnkhác nhau:
độ lệch chuẩn nhỏ cho phép khái quát hoánhững kết quả của mẫu cho toàn dân sốvới độ tin cậy cao
Trang 94Phân phối chuẩn
Trang 95Phân phối chuẩn
Trong một phân phối chuẩn, khoảng:
68% số liệu trong khoảng X ±SD
95% số liệu trong khoảng X ±2SD
99% số liệu trong khoảng X ±3SD
Trang 96Phân phối chuẩn
Trong một phân phối chuẩn:
Có 95% số trường hợp nằm trong độ lệch chuẩn ±1,96 so với giá trị trung bình
Có 99% số trường hợp nằm trong độ lệchchuẩn ±2,58 so với giá trị trung bình
Trang 973.2 Phương pháp xử lý số liệu ban đầu
Gọi a là trị thực của đại lượng đo, X là
kết quả đo
Sai số tuyệt đối (X-a) có thể gồm 3
thành phần là sai số hệ thống, sai số thô, sai số ngẫu nhiên
Trang 98Sai số hệ thống
Sai số hệ thống là sai số không đổi hoặc
thay đổi theo một qui luật nhất định
Sai số hệ thống có thể hiệu chỉnh được
Trang 99Sai số thô
Sai số thô là sai số do bất cẩn, trục trặc
kỹ thuật, thay đổi điều kiện đột ngột,
…Đặc điểm đơn lẻ, có trị số tuyệt đối
lớn hoặc nhỏ một cách bất thường
Cần loại bỏ các số đo chứa sai số thô để
khỏi ảnh hưởng không trung thực đến
kết quả chung
Trang 100Sai số ngẫu nhiên
Sai số ngẫu nhiên là sai số không thể
tiên đoán được cụ thể, do rất nhiều nhân
tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng
Sai số ngẫu nhiên là sai số mà người làm
thí nghiệm không thể loại bỏ được, phải chấp nhận
Trang 1013.3 Xử lý số liệu của thí nghiệm so sánh 2 mẫu bằng phần mềm STATGRAPHICS
Bố trí thí nghiệm so sánh 2 mẫu
Xử lý số liệu của thí nghiệm so sánh 2
mẫu bằng phần mềm STATGRAPHICS
Trang 102 Giả thuyết không H o (Null Hypothesis)
giả thuyết được đặt ra từ đầu với mụcđích trắc nghiệm xem nó đúng hay saidựa vào kết quả thí nhgiệm
Giả thuyết chọn lựa H 1 (Alternative Hypothesis) Là giả thuyết ngược lại Ho
nghĩa là khi bác bỏ Ho thì chấp nhận H1
Bố trí thí nghiệm so sánh 2 mẫu
Trang 103Xử lý số liệu của thí nghiệm so sánh 2 mẫu bằng phần mềm STATGRAPHICS
Trang 1044 Bố trí thí nghiệm nghiên cứu thực phẩm
Khoa học thực phẩm
Các dạng nghiên cứu thực phẩm
Các bước trong nghiên cứu thực nghiệm
Khái quát về thí nghiệm nghiên cứu
Kiểu bố trí thí nghiệm trong nghiên cứu
thực nghiệm
Trang 1054.1 Khoa học thực phẩm
Nghiên cứu các tác động qua lại của các
yếu tố ảnh hưởng đến chất lượng thực
phẩm
Kỹ thuật thực phẩm liên quan đến qui
trình, thiết bị, con người, vi sinh vật…
Giải quyết vấn đề: Chất lượng, An toàn,
Kỹ thuật chế biến
Trang 1064.2 Các dạng nghiên cứu thực phẩm
Bố trí thí nghiệm bảo quản & chế biến
sản phẩm thực phẩm
Phân tích diễn biến chất lượng qua thời
gian bảo quản
Điều tra các yếu tố vật lý, hóa học, sinh
học ảnh hưởng đến chất lượng sản
phẩm, đánh giá hiệu quả của biện pháp
xử lý, khắc phục
Trang 1074.3 Các bước trong nghiên cứu thực
nghiệm
Xác định nhiệm vụ, đối tượng, dân số
Tính toán số lượng đơn vị cần thu thập
theo qui định thống kê
Thu thập dữ kiện
Lưu trữ và xử lý số liệu
Phân tích kết quả và viết báo cáo
Trang 108Xác định nhiệm vụ, đối tượng, dân số
Trước khi tiến hành thu thập dữ kiện,
phải hiểu mình muốn biết gì khi điều tra nghiên cứu
xác định nhiệm vụ là việc hàng đầu
trước khi thu thập dữ kiện
Trang 109Tính toán số lượng đơn vị cần thu thập theo qui định thống kê
Việc xác định dung lượng mẫu cần thiết
cho cuộc điều tra có ảnh hưởng đến kết quả đánh giá và suy diễn kết luận về
quần thể thông qua tập hợp mẫu
Thu thập không đủ số lượng đơn vị cho
mẫu điều tra sẽ làm lệch sự suy diễn, phi khoa học và dẫn đến sự ngộ nhận gây ra những hậu quả không lường được
Trang 110Thu thập dữ kiện
Khi điều tra nghiên cứu, phải thực hiện
việc thu thập dữ kiện
Trong khi thu thập dữ kiện phải thực
hiện việc ghi chép thông qua các bảng ghi số liệu khảo sát