Ứng dụng mạng neuron nhân tạo trong việc xây dựng mô hình dự báo sự mất năng suất lao động và một mô hình được xây dựng song song là mô hình hồi quy tuyến tính Regression Linear trên cùn
Trang 1Đại Học Quốc Gia Tp Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
-
NGUYỄN NAM CƯỜNG
XÂY DỰNG MÔ HÌNH DỰ BÁO SỰ MẤT NĂNG SUẤT LAO ĐỘNG Ở CÁC DỰ ÁN XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG SỬ DỤNG CÔNG CỤ MẠNG NEURON NHÂN TẠO (ANNs)
Chuyên Ngành : CÔNG NGHỆ VÀ QUẢN LÝ XÂY DỰNG
Mã Số Ngành : 60.58.90
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, Tháng 07 Năm 2007
Trang 2Đại Học Quốc Gia Tp Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
-
NGUYỄN NAM CƯỜNG
XÂY DỰNG MÔ HÌNH DỰ BÁO SỰ MẤT NĂNG SUẤT LAO ĐỘNG Ở CÁC DỰ ÁN XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG SỬ DỤNG CÔNG CỤ MẠNG NEURON NHÂN TẠO (ANNs)
Chuyên Ngành : CÔNG NGHỆ VÀ QUẢN LÝ XÂY DỰNG
Mã Số Ngành : 60.58.90
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, Tháng 07 Năm 2007
Trang 3CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học : ………
Cán bộ chấm nhận xét 1 : ….………
Cán bộ chấm nhận xét 2 : ………
Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN
THẠC SĨ
TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày………….tháng………năm 2007
Trang 4TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM PHÒNG ĐÀO TẠO SAU ĐẠI HỌC ĐỘC LẬP – TỰ DO – HẠNH PHÚC
Tp HCM, ngày tháng……… năm 2007
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên : NGUYỄN NAM CƯỜNG Phái : Nam
Chuyên ngành : Công nghệ và Quản lý Xây dựng MSHV : 00804193
I TÊN ĐỀ TÀI :
XÂY DỰNG MÔ HÌNH DỰ BÁO SỰ MẤT NĂNG SUẤT LAO ĐỘNG Ở CÁC DỰ ÁN XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG SỬ DỤNG CÔNG CỤ MẠNG NEURON
NHÂN TẠO (ANNs)
II NHIỆM VỤ VÀ NỘI DUNG :
Xác định các yếu tố ảnh hưởng lớn đến năng suất lao động ở các công trường thi công xây dựng Từ đó kết luận một cách khái quát tình hình chung về vấn đề mất năng suất lao động ở các công trường xây dựng tại Việt Nam
Xâây dựng mô hình dự báo sự mất năng suất lao động ở các dự án xây dựng trong giai đoạn thi công sử dụng công cụ mạng Neuron nhân tạo (ANNs)
Kiểm tra kết quả của mô hình bằng các dự án thực và so sánh kết quả với mô hình hồi quy (Regression model)
Xây dựng một chương trình dự báo dùng để dự báo cho khả năng xãy ra mất năng suất lao động ở các công trường xây dựng tại Việt Nam
III NGÀY GIAO NHIỆM VỤ: 05-02-2007
IV NGÀY HOÀN THÀNH NHIỆM VỤ : 05-07-2007
V CÁN BỘ HƯỚNG DẪN : Tiến sĩ NGÔ QUANG TƯỜNG
Thạc sĩ LÊ HOÀI LONG CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM NGÀNH CN BỘ MÔN
QL CHUYÊN NGÀNH
TS NGÔ QUANG TƯỜNG TS NGÔ QUANG TƯỜNG TS NGÔ QUANG TƯỜNG
Nội dung và đề cương luận văn thạc sĩ đã được Hội Đồng Chuyên Ngành thông qua Ngày tháng năm 2007
TRƯỞNG PHÒNG ĐT-SĐH TRƯỞNG KHOA QL NGÀNH
Trang 5LỜI CÁM ƠN
Trước tiên, xin gửi lời cám ơn sâu sắc đến TS Ngô Quang Tường, ThS Lê Hoài Long những người đã quan tâm, tận tình giúp đỡ và hướng dẫn tôi trong suốt quá trình thực hiện luận văn này Xin chân thành cám ơn các thầy cô trong Khoa Kỹ Thuật Xây Dựng, đặc biệt là các thầy cô giảng dạy thuộc chuyên ngành Công nghệ và Quản lý Xây dựng, các thầy cô trong Khoa Quản Lý Công Nghiệp trường Đại học Bách khoa Tp Hồ Chí Minh Tất cả những kiến thức, kinh nghiệm mà các thầy cô đã truyền đạt lại cho tôi trong suốt quá trình học cũng như những góp ý quý báu của các thầy cô về luận văn này sẽ mãi là hành trang quý giá cho tôi trong suốt quá trình học tập, nghiên cứu và công tác sau này
Xin chân thành cám ơn tất cả bạn bè cùng lớp, những người đã cùng tôi trải qua những ngày học tập thật vui, bổ ích và những thảo luận trong suốt thời gian học đã giúp tôi tự hoàn thiện mình và mở ra trong tôi nhiều sáng kiến mới
Xin cám ơn những người đồng nghiệp của tôi, đã hỗ trợ cho tôi rất nhiều trong suốt quá trình học tập và chính những kinh nghiệm thực tế trong quá trình công tác của họ đã đóng góp rất nhiều ý kiến cho tôi hoàn thành luận văn này Cuối cùng, xin cám ơn những người thân trong gia đình tôi, những người bạn thân của tôi đã luôn bên cạnh tôi, quan tâm, động viên và giúp đỡ tôi vượt qua những khó khăn, trở ngại để hoàn thành luận văn này
Tp Hồ Chí Minh, ngày 02 tháng 07 năm 2007
Trang 6Trang 5
TÓM TẮT
Năng suất lao động trong xây dựng là một trong những yếu tố quan trọng tạo nên sự thành công của một dự án xây dựng về mặt quản lý Vấn đề về mất năng suất lao động là một vấn đề luôn tồn tại trong các dự án xây dựng tại Việt Nam và nó tạo nên một sự lãng phí, làm gia tăng chi phí xây dựng công trình, làm giảm lợi nhuận của các doanh nghiệp xây dựng Vì vậy, việc định lượng, kiểm soát và tăng năng suất lao động trong xây dựng là một yêu cầu cấp bách, một câu hỏi đặt ra cho tất cả các doanh nghiệp xây dựng nói riêng, toàn ngành xây dựng nói chung nhằm tiết kiệm chi phí, giảm giá thành xây dựng nhằm nâng cao khả năng cạnh tranh của các doanh nghiệp xây dựng nhất là trong bối cảnh nền kinh tế Việt Nam như hiện nay
Chính từ yêu cầu thực tế đó, nội dung của luận văn này với mong muốn một phần nào giải quyết được việc đo lường sự mất năng suất lao động ở các dự án xây dựng trong giai đoạn thi công Xác định các nhân tố ảnh hưởng mạnh nhất đến năng suất lao động: khảo sát từ 47 nhân tố ảnh hưởng b ng b ng câu h i thu được 28 nhân tố ảnh hưởng mạnh nhất ( mean >= 3.5) Xây dựng một mô hình dự báo sự mất năng suất lao động cho các dự án cụ thể từ số liệu thu thập được từ 37 dự án xây dựng thuộc nhóm công trình xây dựng dân dụng
Mạng neuron nhân tạo (ANNs) đã được biết như một hệ thống có khả năng giải quyết được các vấn đề có mối quan hệ phức tạp và các tình huống không dự đoán được nhờ khả năng học trên dữ liệu của một tập mẫu xác định Ứng dụng mạng neuron nhân tạo trong việc xây dựng mô hình dự báo sự mất năng suất lao động và một mô hình được xây dựng song song là mô hình hồi quy tuyến tính (Regression Linear) trên cùng một tập mẫu nhằm mục đích để kiểm tra mô hình ANNs và nhận định được 03 nhân tố có mối tương quan lớn nhất với phần trăm mất năng suất lao động là: khả năng cung ứng vật tư, kế hoạch cung ứng và vận chuyển vật tư, điều kiện mặt bằng công trường với hệ số Adjusted R square = 0.736 cho thấy ba nhân tố này có thể giải thích được 73.6% phần trăm mất năng suất lao động trong dự án xây dựng Mô hình ANNs cho thấy kết quả khá chính xác trong việc dự báo sự mất năng suất lao động trong giai đoạn thi công xây dựng Một chương trình ứng dụng nhỏ được viết bằng ngôn ngữ lập trình Visual Basic nhằm giúp cho việc dự báo được thực hiện nhanh và minh hoạ sinh động hơn
Trang 7Trang 6
ABSTRACT
Productivity in construction is one of the most important factors to the success of a project in the aspect of management Loss of productivity is an issue that is always existing in Vietnam construction projects and it cause a waste, increasing the cost for construction and decreasing the profit of construction enterprises Thus, quantification, supervision and increasing the productivity in construction is a necessary requirement and it is also a question for all construction brand in general and for enterprises of construction in particular in order to economize the cost, decrease the market price in construction for raising the capability of competition among enterprises of construction, especially in Vietnam economic background at presents
From that actual demand, the content of this essay aims to solve to some extent of the measurement of the loss of productivity in construction under the period of construction Define the factors that strongly effect to the productivity:
28 out of 47 factors are considered as the most strong ones from the investigation
by questionaire ( mean >= 3.5) A model for forecasting the loss of productivity will be built from the collected date of 37 civil construction projects
The Artificial Neural Networks (ANNs) has been known as a system that can solve issues of all complicated relationships and unforeseen situations based
on learning the data of a definite file Application of ANNs in forming the model for forecasting the loss of productivity and parallelling with Regression Linear on the same file so as to check the ANNs model and to judge 03 factors of the most biggest interrelation with the percentage of loss of productivity, that is: capability
of material supply, schedule of supply and transportation of material, condition of site premise with coefficient Adjusted R square = 0.736 showing that 73.6% of the loss of productivity in construction projects can be explained by these three factors ANNs model can show the correct result in forecasting the loss of productivity under the period of construction A small application programme written by Visual Basic software in order to help the forecast more quickly and vivid
Trang 8Trang 7
MỤC LỤC
CHƯƠNG 1: TỔNG QUAN 8
1.1 Giới thiệu và đặt vấn đề nghiên cứu: 8
1.2 Mục tiêu nghiên cứu: 12
1.3 Giới hạn nghiên cứu: 12
1.4 Tình hình nghiên cứu trong nước và ngoài nước: 12
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 15
2.1 Giới thiệu mạng Neuron: 15
2.1.1 Lịch sử nghiên cứu và ứng dụng mạng Neuron 15
2.1.2 Bộ não và Neuron sinh học: 16
2.1.3 Mạng Neuron nhân tạo: 20
2.1.4 Mạng Neuron lan truyền ngược (Back-propagation neural network): 26
2.2 Giới thiệu bảng câu hỏi 36
2.2.1 Kích thước mẫu 37
2.2.2 Kiểm định thang đo 38
2.3 Giới thiệu về mô hình hồi quy (Regression model) 38
2.4 Giới thiệu năng suất lao động: 40
2.4.1 Năng suất lao động: 40
2.4.2 Năng suất lao động trong xây dựng: 41
CHƯƠNG 3: THU THẬP VÀ XỬ LÝ SỐ LIỆU 45
3.1 Xác định các nhân tố ảnh hưởng đến năng suất lao động: 45
3.2 Khảo sát thử nghiệm (pilot test): 47
3.3 Khảo sát các nhân tố ảnh hưởng (khảo sát lần 1): 50
3.4 Thu thập số liệu cho các công trình thực tế (khảo sát lần 2): 55
CHƯƠNG 4: XÂY DỰNG MÔ HÌNH DỰ BÁO 57
4.1 Xây dựng mô hình dự báo bằng Artificial Neuron Networks (ANNs): 57
4.1.1 Lựa chọn cấu trúc mạng ANNs: 57
4.1.2 Dữ liệu huấn luyện mạng: 58
4.1.3 Huấn luyện mạng bằng Matlab: 58
4.2 Xây dựng mô hình hồi quy tuyến tính bội (Regression linear): 65
4.2.1 Xem xét ma trận hệ số tương quan: 65
4.2.2 Đánh giá độ phù hợp của mô hình hồi quy: 67
4.2.3 Kiểm định độ phù hợp của mô hình hồi quy: 68
4.2.4 Phương trình hồi quy tuyến tính bội: 69
CHƯƠNG 5: KẾT QUẢ VÀ KIỂM TRA MÔ HÌNH 71
5.1 Kết quả mô hình dự báo bằng Artificial Neuron Networks (ANNs): 71
5.2 Kết quả mô hình hồi quy tuyến tính bội (Regression linear): 73
5.3 Chương trình dự báo sự mất năng suất lao động: 74
CHƯƠNG 6: KẾT LUẬN VÀ KIẾN NGHỊ 82
6.1 So sánh kết quả hai mô hình và kết luận: 82
6.2 Kiến nghị hướng phát triển của đề tài: 86
TÀI LIỆU THAM KHẢO 88
CÁC PHỤ LỤC KÈM THEO 90
LÝ LỊCH TRÍCH NGANG 137
Trang 9Trang 8
CHƯƠNG 1: TỔNG QUAN
1.1 Giới thiệu và đặt vấn đề nghiên cứu:
Trong những năm gần đây, Việt Nam là một trong những nước có tốc độ tăng
trưởng tổng sản phẩm quốc nội GDP cao nhất thế giới 8.4% năm 2005(Nguồn Tổng
cục Thống kê) Tăng trưởng kinh tế nước ta tiếp tục được duy trì với tốc độ khá cao
trong nhiều năm qua, trong năm 2006 “GDP cả năm ước tính tăng 8,2% (báo cáo của
Chính Phủ), còn kế hoạch năm 2007 “GDP tăng khoảng 8,2-8,5% Những con số ước
tính tăng trưởng cả năm 2006 và kế hoạch năm 2007 không phải là những con số
không có cơ sở, mà trong thực tế nước ta đã và từng đạt trong thời gian qua, thí dụ:
thời kỳ 1991-1995, tốc độ tăng GDP đã đạt mức 8,2%/năm, năm 1992 (tăng 8,7%),
1993 (8,1%), 1994 (8,8%), 1995 (9,5%), 1996 (9,3%), hay năm 2005 vừa qua cũng
tăng tới 8,4% góp phần quan trọng để đưa mức tăng trưởng bình quân một năm thời
kỳ 2001-2005 là 7,5%
Bảng 1.1 : Tăng trưởng GDP (%, giá năm 1994)
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
9.54 9.34 8.15 5.56 4.77 6.79 6.89 7.08 7.34 7.69 8.43
Nguồn : Tổng cục Thống kê ( TCTK)
Theo báo cáo có tựa đề Foresight 2020 của Economist Intelligence Unit (EIU)
của tạp chí The Economist và hãng Cisco dự báo giai đoạn 2006-2010 sẽ là thời kỳ
vàng son của kinh tế Việt Nam Trong giai đoạn này, GDP sẽ có tốc độ tăng hàng
năm khoảng 7%, cao thứ hai ở Châu Á và chỉ sau Trung Quốc
Cùng với sự tăng trưởng kinh tế nhanh là sự chuyển dịch thay đổi trong cơ cấu
của nền kinh t Sau 15 năm, tỷ trọng của ngành Công nghiệp – Xây dựng liên tục
tăng, từ tỉ trọng khá thấp trong tổng thể nền kinh tế, chỉ với tỷ trọng 22.67% vào năm
1990, thì đến năm 2002 ngành Công nghiệp – Xây dựng đã chiếm tỉ trọng 38.55%,
cao nhất trong nền kinh tế, và tiếp tục tăng trưởng đạt tỉ trọng 41.03 % trong năm
2005 Trong đó, ngành xây dựng chiếm 3-5% tỷ trọng của tổng thể nền kinh tế
Bảng 1.2 : Cơ cấu các ngành kinh tế ở Việt Nam
Tỷ trọng của các ngành Năm
Nông nghiệp Công nghiệp – Xây dựng Dịch vụ
Trang 10Nguồn : Kinh tế Việt Nam 2005-2006, Thời báo Kinh Tế Việt Nam
Cùng với sự phát triển đó, vẫn còn tồn tại một số vấn đề trong ngành như:
chậm tiến độ, vượt chi phí, kém chất lượng, thất thoát trong xây dựng… Với vai trò của
ngành xây dựng trong nền kinh tế quốc dân, năng suất lao động của ngành ảnh hưởng
đáng kể đến sự phát triển kinh tế chung của đất nước, cải tiến năng suất lao động
cũng là một vấn đề được đặt ra đối với ngành xây dựng, theo Naoum và Hackman
(1996) thì năng suất lao động trong ngành xây dựng tăng 10% có thể làm cho giá trị
tổng sản phẩm quốc nội tăng 2,5%
Tuy trong thời gian qua nền kinh tế nước ta liên tục tăng trưởng nhưng GDP
bình quân đầu người mới đạt 637.3 USD, tính theo sức mua tương đương (PPP) thì con
số này mới đạt trên 2700 USD Đó là chỉ số còn thấp xa so với mức bình quân chung
của khu vực, của châu Á cũng như toàn thế giới Nói cách khác, nước ta vẫn bị xem là
nước kém phát triển theo tiêu chuẩn của Liên hiệp quốc Theo ước tính của EIU thì
đến năm 2010 GDP của Việt Nam sẽ đạt 85,3 tỷ USD và thu nhập bình quân đầu
người ở mức 970 USD, tính theo PPP, GDP của Việt Nam sẽ là 415 tỷ USD và thu
nhập bình quân đầu người là 4.500 USD Bên cạnh đó, mặc dù đã có những đầu tư và
đổi mới, nhưng hiện tại trình độ khoa học – công nghệ của ngành công nghiệp của
nước ta vẫn còn rất thấp khi đem so sánh với các nước trong khu vực Tỷ trọng doanh
nghiệp có công nghệ cao của Việt Nam mới đạt khoảng 20.6%, thấp xa so với các con
số tương ứng 29.1% của Philiplines, 29.7% của Indonesia, 30.8% của Thái Lan, 51.1%
của Malaysia và 73% của Singapore
Xét về khía cạnh chất lượng tăng trưởng, chúng ta đã quá nghiêng về tăng
trưởng chiều rộng tức là tăng trưởng chủ yếu dựa vào tăng trưởng vốn, tăng số lao
động, tăng cường khai thác tài nguyên hơn là tăng trưởng theo chiều sâu, tăng trưởng
do tăng năng suất lao động, nâng cao hiệu quả sử dụng vốn – tức là nâng cao năng
suất các nhân tố tổng hợp Đây là một dạng tăng trưởng không bền vững, nếu không
nâng cao chất lượng tăng trưởng thì tăng trưởng không những không cao lên mà ngay
cả tăng trưởng với tốc độ cũ cũng không duy trì được và bị tụt hậu là điều không thể
tránh khỏi
Trong bối cảnh hội nhập vào nền kinh tế thế giới và gia nhập vào WTO, Việt
Nam đang đứng trước những cơ hội lớn để biến đổi mình nhưng kèm theo nó là hàng
loạt những nguy cơ và thách thức cho các doanh nghiệp trong nước, trao đổi thương
mại giữa các quốc gia ngày càng phát triển đã và đang là một trong những động lực
chính góp phần vào sự tăng trưởng kinh tế và phát triển xã hội Trước hoàn cảnh đó,
Trang 11Trang 10
doanh nghiệp ở các nước đang phát triển như Việt Nam nếu không bắt kịp xu hướng
mới sẽ bị loại ra khỏi thương trường cạnh tranh đầy quyết liệt này Việc thiếu cơ sở
hạ tầng về Năng suất Chất lượng và các kỹ năng quản lý cần thiết sẽ là những rào
cản đối với doanh nghiệp khi tiếp cận với các thị trường quốc tế, đồng thời sẽ cản trở
đối với doanh nghiệp hội nhập vào các chuỗi sản xuất và cung ứng quốc tế Để tồn tại
được trong môi trường này, các doanh nghiệp cần phải cung cấp những sản phẩm có
chất lượng, an toàn và tiết kiệm chi phí Các doanh nghiệp cũng cần không ngừng
nâng cao năng suất và tính cạnh tranh để tạo thêm giá trị trong sản xuất, duy trì hoặc
tăng cơ hội việc làm cho người lao động và gia tăng thị phần xuất khẩu cũng như thị
phần nội địa
Để đáp ứng những đòi hỏi bức xúc này, các doanh nghiệp Việt Nam đang ngày
càng nhận thức rõ được nhu cầu cần phải cải tiến chất lượng sản phẩm và năng suất
doanh nghiệp Con số các doanh nghiệp áp dụng chứng chỉ hệ thống quản lý theo tiêu
chuẩn chất lượng và môi trường như ISO 9000/ ISO 14000 và các tiêu chuẩn khác như
HACCP, GMP, SA 8000, OHSAS 18000 đang ngày càng tăng lên Bên cạnh đó,
nhiều doanh nghiệp cũng không ngừng cải tiến hệ thống quản lý bằng cách áp dụng
các công cụ, giải pháp/mô hình tiên tiến như: Chuẩn đối sánh (benchmarking); Thẻ
cân đối điểm (Balanced scorecard); Quản lý quan hệ khách hàng (CRM); Quản lý tri
thức doanh nghiệp (KM); … nhằm gia tăng giá trị và tăng cường khả năng cạnh tranh
cho doanh nghiệp Nhiều thương hiệu Việt Nam đã xây dựng được uy tín trong thị
trường trong nước và khu vực - đó là những dấu hiệu tích cực
Ngành xây dựng cũng không phải là ngoại lệ, môi trường kinh doanh trong xây
dựng ngày càng gặp phải một sự cạnh tranh rất lớn, nhất là khi có sự tham gia của các
doanh nghiệp xây dựng nước ngoài, họ hơn chúng ta về nhiều mặt: khoa học công
nghệ tiên tiến, đội ngũ kỹ thuật có tay nghề và trình độ quản lý cao Các doanh
nghiệp xây dựng muốn tồn tại và phát triển phải không ngừng nâng cao năng suất lao
động để tiết kiệm chi phí, nâng cao lợi nhuận; cũng tức là đồng nghĩa với việc nâng
cao khả năng cạnh tranh:
PdxIpr C
S x IQ
OQ IQxC
OQxS TC
C: Chi phí cho một đơn vị tài nguyên sử dụng Pd: Năng suất của quá trình sản xuất
Ipr (Price recovery factor): Hệ số phục hồi giá (prices / unit costs)
Mối liên hệ giữa lợi nhuận và năng suất có thể được biểu diễn như hình sau:
Trang 12Trang 11
Hình 1.1 : Mối quan hệ giữa năng suất và lợi nhuận (Uusi-Rauva và Hannula, 1996)
Ta xét một ví dụ sau đây, giả sử xét một dự án xây dựng với các thành phần
chi phí như sau:
Ta nhận thấy chi phí nhân công chiếm một tỷ trọng rất lớn, khi chi phí này tăng
từ 30% å 35% ta thấy đồng nghĩa với việc lợi nhuận giảm bằng zê rô
Theo kinh nghiệm và một số nghiên cứu trước đây đã đúc kết được rằng chi phí
nhân công chiếm một tỷ lệ đáng kể trong các thành phần chi phí của một dự án xây
dựng: chiếm khoảng 25~35% giá trị công trình, do vậy, việc nâng cao năng suất lao
động nhằm giảm chi phí nhân công, làm gia tăng lợi nhuận cho nhà thầu đang là một
vấn đề đang được quan tâm hiện nay
Vì vậy, việc chọn đề tài: “Xây dựng mô hình dự báo sự mất năng suất lao
động ở các dự án xây dựng trong giai đoạn thi công sử dụng công cụ mạng
Neuron nhân tạo (ANNs)” với mong muốn đóng góp một phần nào vào việc định
lượng, đo lường và từ đó làm cơ sở cho việc cải tiến năng suất lao động trong giai
đoạn thi công xây dựng của các công trình xây dựng ở Việt Nam
Trang 13Trang 12
1.2 Mục tiêu nghiên cứu:
Hiện nay mặc dù định mức về nhân công đã được thể hiện trong định mức xây
dựng cơ bản của nhà nước, nhưng những số liệu này vẫn chưa được cập nhật thường
xuyên và phản ánh được đúng với thực tế, thậm chí một số công việc còn chưa có
định mức và vẫn còn sử dụng đến Giá tạm tính hay Giá thực tế Từ những nghiên cứu
trước đây đã chỉ ra rằng năng suất thực tế đạt được là thấp hơn so với định mức, năng
suất thực tế bị tác động bởi nhiều nhân tố ảnh hưởng dẫn đến chi phí nhân công thực
tế thường cao hơn so với chi phí nhân công theo hợp đồng, do đó nghiên cứu này được
thực hiện với mục tiêu:
- Xác định các nhân tố chính ảnh hưởng đến năng suất lao động của các
dự án trong giai đoạn thi công xây dựng
- Sử dụng công cụ mạng Neuron nhân tạo (ANNs) để xây dựng một mô
hình dự báo về sự mất năng suất lao động ở các dự án xây dựng
- Dùng mô hình hồi quy tuyến tính (Regression Linear) để kiểm tra độ
chính xác mô hình ANNs
1.3 Giới hạn nghiên cứu:
Dữ liệu thu thập dùng cho việc huấn luyện mạng Neuron còn bị hạn chế như
sau:
- Công trình xây dựng dân dụng
- Thời gian thực hiện từ năm 2000 đến năm 2007 (ước lượng sử dụng dự
báo cho khoảng thời gian 05 năm trong tương lai 2000-2012)
- Số lượng mẫu dùng cho việc huấn luyện mạng là 33 mẫu chiếm
khoảng 90% (89.1%) so với tổng số thu thập được 37 mẫu
Vì vậy, xây dựng một mô hình dự báo sự mất năng suất lao động ở các dự án
xây dựng dân dụng trong giai đoạn thi công được thực hiện từ năm 2000 đến năm
2012
1.4 Tình hình nghiên cứu trong nước và ngoài nước:
Trên thế giới đã có rất nhiều những nghiên cứu về năng suất lao động mà ta có
thể điểm qua như sau: Mỹ [6]; Nigeria [7]; Anh [14], [15]; Mexico [10]; Canada [11],
Phần Lan [13],…
Năm 1986, Thomas and Mathews phát biểu rằng không có định nghĩa năng
suất chuẩn mực nào được thiết lập trong ngành công nghiệp xây dựng Thật khó để
định nghĩa một phương pháp đo lường năng suất chuẩn bởi vì các công ty xây dựng
đều sử dụng các hệ thống đo lường nội bộ chưa được chuẩn hoá.[Park, 21]
Mặc dù đã có một số nghiên cứu về năng suất lao động, nhưng vẫn chưa có sự
đồng ý, tán thành nào dựa trên định nghĩa về các hoạt động công việc cũng như một
hệ thống đo lường năng suất chuẩn Các nhà nghiên cứu đã kết luận rằng rất khó để
có được một phương pháp chuẩn để đo lường năng suất lao động trong xây dựng bởi
vì tính phức tạp của công trình và các đặc điểm độc nhất của các dự án xây dựng
(Oglesby et al 1989).[Park, 21]
Tính duy nhất và sự hoạt động không lặp lại của các dự án xây dựng tạo ra sự
khó khăn để phát triển một khái niệm và một biện pháp đo lường năng suất lao động
Trang 14Trang 13
chuẩn hoá (Sweis 2000) Một vài nghiên cứu đã thử phát triển những khái niệm chung
và hệ thống năng suất lao động chuẩn, tuy nhiên, những nghiên cứu này không dựa
trên sự nhất trí cao của giới chuyên gia.[Park, 21]
Viện nghiên cứu về xây dựng thế giới (Construction Industry Institute) (CII)
(1990) đã phát triển một hệ thống đo lường năng suất lao động bao gồm: một hệ
thống báo cáo, một hệ thống đo lường giá trị đầu ra và đầu vào, và một hệ thống đánh
giá sự thực hiện để đo lường năng suất ở mức độ công trường.[Park, 21]
Adrian và Boyer (1976) đã thiết lập mô hình giảm năng suất để đo lường, dự
báo và cải thiện năng suất của các biện pháp thi công xây dựng.[Park, 21]
Weber và Lippiatt (1983) xem xét các biện pháp đo lường các nhân tố năng
suất riêng lẽ và các nhân tố năng suất tổng thể trong xây dựng [Park, 21]
Thomas và Yiakoumis (1987) đã mô tả mô hình nhân tố liên quan đến môi
trường, điều kiện công trường, quản lý và các nhân tố về thiết kế kết cấu thép, các
công tác cốp pha, xây trát,… [Park, 21]
Sanders và Thomas (1993) xác định các nhân tố xa hơn như biện pháp thi công,
yêu cầu của thiết kế và thời tiết ảnh hưởng đến năng suất xây trát và khảo sát sự ảnh
hưởng của các nhân tố bằng cách sử dụng mô hình nhân tố với tập dữ liệu thu được từ
các quá trình thu thập đã chuẩn hoá.[Park, 21]
Một mô hình khác là mô hình tác động – hành vi (action – response) cũng đã
đưa ra một cách thức cho việc đánh giá những nguyên nhân làm mất năng suất lao
động trong các công trình để giảm bớt và loại trừ sự mất năng suất (Halligan et al
1994).[Park, 21]
Báo cáo nghiên cứu của CII cũng công bố các nhân tố ảnh hưởng đến năng
suất lao động của tổ đội công nhân như kỹ thuật/ thiết kế, điều kiện công trường, vật
tư, quản lý thi công xây dựng và các vấn đề về nhân công lao động (2001).[Park, 21]
Liou và Borcherding (1986) xác định rằng, đo lường năng suất không chỉ là
nhiệm vụ được thực hiện 1 lần ( one-time task), sự đo lường liên tục và so sánh với
các dự án khác hoặc công ty khác là một yếu tố quan trọng để cải thiện năng suất lao
động.[Park, 21]
Thomas và Yiakoumis (1987) đã nhấn mạnh tầm quan trọng của hệ thông thu
thập số liệu về năng suất lao động chuẩn để đưa ra các phân tích đáng tin cậy.[Park,
21]
Các nghiên cứu về việc đo lường năng suất lao động được đề cập ở trên đây
đều tập trung vào cách báo cáo, đo lường, kiểm soát, đánh giá và cải thiện năng suất
lao động trong xây dựng Tuy nhiên các nghiên cứu này vẫn còn thiếu sự định nghĩa
của các hoạt động và phương pháp thu thập số liệu chuẩn Hơn nữa, các hệ thống đo
lường năng suất hiện tại đều tập trung vào các hoạt động ở mức độ chi tiết để quản lý
năng suất lao đông theo ngày hoặc tháng trong suốt quá trình thi công và phải kết hợp
chặt chẽ với hệ thống kiểm soát chi phí, điều này là phức tạp để theo dõi và đánh giá
năng suất lao động
Trong nước, cũng có một vài nghiên cứu về năng suất lao động, như nghiên cứu
của Đỗ Thị Xuân Lan: “Các nhân tố ảnh hưởng đến năng suất lao động trong thi công
Trang 15Trang 14
xây dựng tại hiện trường”[3] đã chỉ ra có 04 nhân tố ảnh hưởng đến năng suất lao
động: (1) Mặt bằng công trường; (2) Quản lý vật tư; (3) Tiến độ thi công, (4) Động cơ
làm việc của công nhân
Đề tài “Nghiên cứu về mặt bằng sử dụng lao động trong ngành xây dựng tại
Tp HCM” [2] của Đỗ Thị Xuân Lan nghiên cứu đã góp phần đưa ra một cái nhìn tổng
thể về thực trạng của thị trường xây dựng tại Tp HCM, đưa ra những kết quả khảo sát
về công nhân xây dựng, phân tích những quan điểm và thái độ của họ về nghề nghiệp
để đánh giá những yếu tố ảnh hưởng đến tinh thần làm việc và lòng yêu nghề của họ
nhằm giúp cho nhà quản lý có cơ hội thay đổi môi trường làm việc để sử dụng lao
động có hiệu quả hơn, cải tiến năng suất lao động và tiết kiệm chi phí nhân công
Đề tài “Các vấn đề về an toàn lao động trong thi công xây dựng tại Tp HCM”
của Lưu Trường Văn, Đỗ Thị Xuân Lan đã nghiên cứu các yếu tố tác động chính gây
nên tai nạn lao động trong xây dựng, kết quả nghiên cứu cho thấy công nhân thiếu
nhận thức về tầm quan trọng của an toàn lao động, công nhân chưa được huấn luyện
đầy đủ và trang bị bảo hộ lao động, thang và dàn giáo không phù hợp, thiết bị hư cũ,
thao tác thiếu an toàn là những nguyên nhân chính gây nên tai nạn làm ảnh hưởng
đến năng suất lao động
Đề tài “Nghiên cứu động cơ, tinh thần làm việc của công nhân xây dựng và các
nhân tố ảnh hưởng đến năng suất của họ” [5] luận văn thạc sĩ của Dương Thị Bích
Huyền đã chỉ ra công nhân chỉ sử dụng hơn 2,5 giờ cho công việc trực tiếp làm ra sản
phẩm, gần 3 giờ để thực hiện những công việc phụ trợ, mất khoảng 2,5 giờ cho những
công việc không hữu ích hay không làm gì cả
Các nghiên cứu mới chỉ dừng ở mức nhận dạng các nhân tố ảnh hưởng đến
năng suất lao động của công nhân trong một vài lĩnh vực nhỏ trong một dự án như
điều kiện thi công mặt bằng trên công trường, vấn đề về công nhân xây dựng, các
điều kiện an toàn lao động…, và đề xuất các biện pháp nhằm nâng cao năng suất lao
động trong các lĩnh vực đó
Chưa xác định được các yếu tố ảnh hưởng đến năng suất lao động của cả một
dự án xây dựng, ví dụ các yếu tố về: thay đổi của nền kinh tế, sự thay đổi của chính
sách, mức độ lành nghề của công nhân, do các dự trù (dự toán) kém chính xác, do lập
kế hoạch kém …
Vẫn chưa có một mô hình nào có thể dự báo được sự mất năng suất lao động
của các dự án nói chung và dự án xây dựng nói riêng
Trang 16Trang 15
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Giới thiệu mạng Neuron:
2.1.1 Lịch sử nghiên cứu và ứng dụng mạng Neuron
Những năm 1940 có thể xem là mốc khởi đầu của các nghiên cứu về mạng
Neuron với đề xuất mô hình xử lý thông tin tại các Neuron và mạng Neuron của Mc
Culloch-Pitts và giải thuật huấn luyện mạng của Hebb [Phương, 8]
Những năm 50 và 60 là thời kỳ hưng thịnh của mạng Neuron với các công trình
của Rosenblatt (1960) về mạng Perceptron, giải thuật huấn luyện mạng ADALINE và
bài báo bình giải của Minsky và Papert về mạng Perceptron [Phương, 8]
Những năm 70 mạng Neuron rơi vào trạng thái im lặng cả về nghiên cứu và
ứng dụng Tuy vậy có thể kể đến các nghiên cứu về quá trình học của mạng nhiều
lớp, mạng tự tổ chức của Kohonen, mạng kiểu bộ nhớ kết hợp (BAM) của Anderson,
mạng ART (Adaptive Resonance Theory NN) của Capenter [Phương, 8]
Những năm 80 là thời kỳ phục hưng của các nghiên cứu và ứng dụng mạnh mẽ
của các mạng Neuron với các nghiên cứu về thuật giải học dựa trên lan truyền ngược
sai số (backpropagation of errors), mạng một lớp của Hopfield, mạng theo kiểu máy
Boltzmann và mạng Neocognitron của Fukushima [Phương, 8]
Từ những đầu năm 90 đến nay, đã tìm được và khẳng định được vị trí của mình
trong rất nhiều ứng dụng khác nhau trong công nghệ nhờ kết hợp chúng với các kỹ
thuật của trí tuệ nhân tạo: Giải thuật di truyền, logic mờ và suy diễn xấp xỉ, hệ
chuyên gia để phân tích dữ liệu và thu thập tri thức phục vụ cho việc xây dựng các hệ
thống thông minh lai [Phương, 8]
Lippman (1987) và gần đây Hush và Horne (1993) đã công bố cập nhật một vài
mô hình về ANN Barron (1989) và Levin et al (1990) đã đưa ra một sự giải thích
bằng thống kê của các phương pháp huấn luyện mạng ANN Nerrand et al đã chỉ ra
rằng ANN có thể được xem như một bộ lọc phi tuyến tổng quát mà sự thích hợp của
nó thông qua việc học.[Halim, 26]
Kamarthi et al (1992); Kohonen (1988) đã đưa ra một sự tổng kết rõ hơn về
mạng Neuron truyền thẳng (Feed-forward) và mạng lan truyền ngược sai số
(Back-propagation) bằng một ý tưởng rất đáng chú ý về ánh xạ các đặc trưng topo tự tổ chức
(theo nghĩa không cần mẫu học) nhằm bảo toàn trật tự sắp xếp các mẫu trong không
gian biểu diễn nhiều chiều sang một không gian mới (một chiều hoặc hai
chiều).[Halim, 26]
Rumelhart et al (1994) đã chứng minh rằng các vấn đề có những mối quan hệ
phi tuyến phức tạp sẽ được giải quyết bằng mạng Neuron tốt hơn là so với phương
pháp lý thuyết thông thường.[Halim, 26]
Những lĩnh vực sử dụng khá hiệu quả mạng Neuron dùng để kiểm soát, dự báo
và điều khiển là: thương mại, không gian vũ trụ, điều khiển tự động, Ngân hàng,
Trang 17Trang 16
phòng chống, điện tử, giải trí, công nghiệp, sản xuất, cơ khí, thông tin liên lạc, hoá
học, vật liệu, kinh tế, môi trường,… [12]
2.1.2 Bộ não và Neuron sinh học:
Từ lâu, hàng ngàn năm trước đây con người đã đổ công nghiên cứu phương
cách làm cho bộ não có khả năng tư duy Ngay năm 335 trước công nguyên, nhà triết
học Arixtot đã viết: “Trong số các động vật cao cấp, con người có bộ não lớn nhất so
với kích thước của mình” Tuy vậy, phải tới giữa thế kỷ 18 người ta mới xác nhận
được rằng bộ não thực sự đóng vai trò quan trọng bậc nhất trong nhận thức Cuối thế
kỷ thứ 19, các nhà khoa học còn khẳng định rằng hoạt dộng nhận thức của con người
còn gắn liền với hoạt động của các bộ phận cơ thể khác như: tim, lá lách, tuyến tùng
và tuỷ sống
Các nhà nghiên cứu sinh học cho thấy rằng Bộ não bao gồm nhiều Neuron (tế
bào thần kinh ), các Neuron là đơn vị cơ sở đảm nhiệm những chức năng xử lý nhất
định trong hệ thần kinh, bao gồm não, tuỷ sống và các dây thần kinh Các Neuron liên
kết với nhau bằng các dây thần kinh Sự hoạt động của hệ thần kinh được chia thành
3 giai đoạn :
X Con người nhận được kích thích từ bên ngoài thông qua các giác quan Sự kích
thích này được chuyển đổi thành xung điện và được chuyển đến não
X Bộ não liên tục thu nhận thông tin, xử lý, đánh giá và so sánh chúng với những
thông tin đang lưu trữ để tạo ra các quyết định thích đáng
X Những mệnh lệnh đưa ra sau khi bộ não xử lý được truyền đến các bộ phận
chấp hành như tay, chân cho hành động hay lưỡi cho tiếng nói … dưới dạng
xung điện Bộ phận thi hành biến đổi xung điện dẫn đến hình thành hành động
Neuron là phần tử cơ bản của não, có khả năng hoạt động tương tự một đơn vị
logic của máy tính, được chia làm 2 loại :
X Neuron vào ra cục bộ, cách nhau khoảng 100 micron (1 micron =10-3mm)
X Neuron ra kết nối với các vùng khác của não, như kết nối não với bắp thịt hay
kết nối các giác quan với não
Trong quá trình hoạt động, Neuron nhận được nhiều thông tin, và những thông
tin này được cộng lại với nhau theo một hình thức nào đó
Xét về hình dạng và kích thước khác nhau nhưng về căn bản, có thể chia thành
3 phần :
Hình 2.1 : Cấu trúc cơ bản một Neuron sinh học
Trang 18Trang 17
X Cell body: phần thân với nhân bên trong (gọi là soma)
X Dendrite: một hệ thống dạng cây các dây thần kinh vào, hoạt động như là cầu
nối với các Neuron, dùng làm kênh vào của Neuron
Axon: một đầu thần kinh ra (gọi là trục axon), axon có bản chất dẫn điện, được
dùng như kênh ra của Neuron, mỗi Neuron chỉ có một axon
Các dây thần kinh vào tạo thành một lưới dày đặc xung quanh thân tế bào,
chiếm diện tích khoảng 0,25 mm2, còn dây thần kinh ra tạo thành trục dài có thể từ 1
cm cho đến hàng mét Đường kính của nhân tế bào thường chỉ là 10-14m Trục dây
thần kinh ra cũng có thể phân nhánh theo dạng cây để nối với các dây thần kinh vào
hoặc trục tiếp với nhân tế bào các Neuron khác thông qua các khớp nối (gọi là
synapse) Thông thường, mỗi Neuron có thể gồm vài chục cho tới hàng trăm ngàn
khớp nối để nối với các Neuron khác Người ta ước lượng rằng lưới các dây thần kinh
ra cùng với các khớp nối bao phủ diện tích khoảng 90% bề mặt Neuron
Mỗi Neuron có một mức kích hoạt, nằm trong tầm giữa giá trị lớn nhất và giá
trị nhỏ nhất, trái với logic Boolean chỉ có tồn tại hai giá trị
Việc gia tăng hay giảm mức kích hoạt của Neuron này đối với Neuron khác
được thực hiện thông qua các synapse bám trên dendrite Nếu là synapse kích thích,
mức kích hoạt từ neron gửi làm gia tăng mức kích hoạt của Neuron nhận Còn nếu là
synapse hạn chế thì mức kích hoạt từ Neuron gửi sẽ lảm giảm mức kích hoạt của
Neuron nhận Mức kích hoạt tại Neuron nhận đạt đến một giá trị ngường nào đó sẽ
kích thích đầu ra, truyền trên axon đến các Neuron khác, cuối axon có khoảng 10000
synapse Các synapse không chỉ khác nhau ở tác dụng kích thích hay hạn chế mà còn
khác nhau ở mức kích hoạt
Các tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của các
Neuron là tín hiệu điện và được thực hiện thông qua các quá trình phản ứng và giải
phóng các chất hữu cơ Các chất này được phát ra từ các khớp nối dẫn tới các dây
thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào Khi điện thế này đạt
tới một ngưỡng nào đó, sẽ tạo ra một xung điện dẫn tới trục dây thần kinh ra Xung
này được truyền theo trục,tới các nhánh rẽ khi chạm tới các khớp nối với các Neuron
khác sẽ giải phóng các chất truyền điện Người ta chia làm hai loại khớp nối: khớp
nối kích thích (excitatory) hoặc khớp nối ức chế (inhibitory)
Phát hiện quan trọng nhất trong nghiên cứu về bộ não là các liên kết khớp thần
kinh khá mềm dẻo, có thể biến động và chỉnh đổi theo thời gian tuỳ thuộc vào các
dạng kích thích Hơn nữa, các Neuron có thể sản sinh các liên kết mới với các Neuron
khác và đôi khi, lưới các Neuron có thể di trú từ vùng này sang vùng khác trong bộ
não Các nhà khoa học cho rằng đây chính là cơ sở quan trọng để giải thích cơ chế
học của bộ não con người
Phần lớn các quá trình xử lý thông tin đều xãy ra trên vỏ não Toàn bộ võ não
được bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với đường kính
khoảng 0,5mm, độ cao 4mm Mỗi đơn vị cơ sở này chứa khoảng 2000 Neuron Người
ta chỉ ra rằng mỗi vùng não có những chức năng nhất định Năm 1861, Pierre Paul
Broca đã chỉ ra rằng phần võ não phía trước bên trái điều khiển khả năng nói và sự
Trang 19Trang 18
phát triển ngôn ngữ Bán cầu đại não trái chịu trách nhiệm các xử lý thông tin nhận
thức theo những quy trình thuật giải nhất định, còn bán cầu đại não phải gắn với các
xử lý thông tin tiềm thức phi thuật giải như linh cảm, linh tính, … Các nghiên cứu thực
nghiệm còn chứng tỏ rằng các liên kết giữa các vùng não với các bộ phận cơ thể có
thể thay đổi và đối với một số động vật cao cấp các liên kết kiểu này có thể ở dạng
kép Tuy vậy, các chuyên gia nghiên cứu cho đến nay vẫn chưa hiểu cặn kẽ cơ chế
thay thế chức năng của các vùng cho nhau khi có một vùng nào đó bị tổn thương
Điều rất đáng ngạc nhiên chính là các Neuron rất đơn giản trong cơ chế làm
việc, nhưng mạng các Neuron liên kết với nhau lại có khả năng tính toán, suy nghĩ,
ghi nhớ và điều khiển
Các chức năng cơ bản của bộ não:
X Bộ nhớ được tổ chức theo các bó thông tin và truy nhập theo nội dung (có thể
truy xuất thông tin dựa theo giá trị các thuộc tính của đối tượng) Bộ não tích
hợp và lưu trữ kinh nghiệm, có sự phân loại và liên kết với các dữ liệu vào
X Bộ não có khả năng tổng quát hoá, có thể truy xuất các tri thức hay các mối
liên kết chung của các đối tượng tương ứng với một khái niệm chung nào đó
Bộ não xem xét những kinh nghiệm mới trong hoàn cảnh những kinh nghiệm
đã được lưu trữ Bộ não có khả năng dự đoán chính xác những tình huống mới
dựa trên những kinh nghiệm đã có trước đây
X Bộ não có khả năng dung thứ lỗi theo nghĩa có thể điều chỉnh hoặc tiếp tục
thực hiện ngay khi có những sai lệch do thông tin bị thiếu hoặc không chính
xác Ngoài ra, bộ não còn có thể phát hiện và phục hồi các thông tin bị mất
dựa trên sự tương tự giữa các đối tượng Bộ não không cần thông tin hoàn hảo
và chấp nhận lỗi
X Bộ não có khả năng xuống cấp và thay thế dần Khi có những trục trặc tại các
vùng não (bệnh, chấn thương) hoặc bắt gặp những thông tin hoàn toàn mới lạ,
bộ não vẫn có thể tiếp tục làm việc
X Bộ não có khả năng học
So sánh khả năng làm việc của bộ não và máy tính:
Đơn vị tính toán 01 bộ xử lý trung tâm với 105
mạch logic cơ sở
Tốc độ truyền 109 bit/giây 1014 bit/giây
Cập nhật thông tin 105 bit/giây 1014 Neuron/giây
Và hiện nay khoa học đã phân tích được bộ não con người chứa khoảng 1010
-1012 Neuron Mỗi Neuron được kết nối với khoảng 104 các Neuron khác Các sự kiện
xảy ra trên các Neuron này khoảng 10-3s, trong khi các sự kiện xảy ra trên các Chip
silicon hay IC là 10-8s (Shepherd and Koch, 1990) Tuy nhiên, kết quả thực nghiệm
cho thấy bộ não người là một cấu trúc hiệu quả khổng lồ Hiệu suất của bộ não đạt
Trang 20Trang 19
đến 10-16s trên một hành động trong khi hiệu suất của máy tính khoảng 10-6s trên một
hành động(Faggin,1991) Bộ não người có thể xử lý các thông tin phức tạp, phi tuyến
và tính toán song song (information-processing-system ) Bộ não người có thể lưu giữ
nhiều thông tin hơn các máy tính hiện đại, tuy rằng điều này không phải đúng mãi
mãi, bởi lẽ bộ não tiến hoá chậm, trong khi đó nhờ những tiến bộ trong công nghệ vi
điện tử, bộ nhớ máy tính được nâng cấp rất nhanh Hơn nũa, sự hơn kém về bộ nhớ trở
nên hoàn toàn thứ yếu so với sự khác biệt về tính toán và khả năng xử lý song song
Các bộ vi xử lý có thể tính 108 lệnh trong một giây, trong khi đó mạng Neuron xử lý
chậm hơn, cần khoảng vài miligiây để kích hoạt Tuy nhiên, bộ não máy tính hiện đại
cũng chỉ có một số hạn chế các bộ vi xử lý song song Nếu chạy một mạng Neuron
nhân tạo trên máy tính, phải tốn hàng trăm lệnh máy để kiểm tra một Neuron có được
kích hoạt hay không (tiêu phí khoảng 10-8 * 102 giây/ Neuron ) Do đó, dầu bộ xử lý
có thể tính toán nhanh hơn hàng triệu lần so với các Neuron bộ não, nhưng xét tổng
thể bộ não lại tính toán nhanh hơn hàng tỷ lần
Cách tiếp cận mạng Neuron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo
ra các thiết bị có thể kết hợp khả năng song song cao của bộ não với tốc độ tính toán
cao của máy tính Tuy vậy, cần phải có một khoảng thời gian dài nữa để các mạng
Neuron nhân tạo có thể mô phỏng được các hành vi sáng tạo của bộ não con người
Chẳng hạn, bộ não có thể thực hiện một nhiệm vụ khá phức tạp như nhận ra khuôn
mặt người quen sau không quá một giây, trong khi đó một máy tính tuần tự phải thực
hiện hàng tỷ phép tính (khoảng 10 giây) để thực hiện cùng thao tác đó,nhưng với chất
lượng kém hơn nhiều, đặc biệt trong trường hợp thông tin không chính xác, không đầy
đủ
Từ những khả năng vô cùng to lớn của bộ não người mà ngày nay mạng
Neuron đã được nghiên cứu rộng rãi nhằm mục đích xây dựng một bộ não nhân tạo
cho máy móc hoặc robot để có thể hoạt động như con người nhằm vào mục đích tự
động hóa Hiện nay mạng Neuron đã được ứng dụng thử nghiệm và có một số thành
công trong các lĩnh vực:
X Nhận dạng mẫu: phân tích các thuộc tính đặc trưng của mẫu, phân tích và nhận
dạng giọng nói, nhận dạng dấu vân tay,
X Kỹ thuật chế tạo: giám sát quá trình gia công đúc khuôn mẫu, điều khiển tối ưu
chế độ cắt,…
X Xử lý ảnh và nhận biết bằng máy tính : trùng khớp ảnh, tiền xử lý ảnh, phân
tích ảnh và xử lý các hình ảnh thay đổi theo thời gian,…
X Xử lý tín hiệu: phân tích tín hiệu địa chấn và tín hiệu số để dự báo về các trận
động đất, phân tích các dấu hiệu của thời tiết: nhiệt độ, độ ẩm không khí, chế
độ gió, mực nước cường triều,… để đưa ra những dự đoán về các cơn bão, sóng
thần, …
X Hệ thống điện : dự báo trạng thái của hệ thống, sức tải và dự báo độ an toàn,…
X Y học : phân tích và nhận biết các tín hiệu điện tâm đồ, chẩn đoán bệnh,…
X Quân sự : phát hiện thủy lôi, phân loại luồng rada, nhận biết các máy bay địch
trên bầu trời,…
Trang 21Trang 20
X Kinh tế : phân tích thị trường chứng khoáng, định giá bất động sản, dự báo sự
biến động về giá cả các loại hàng hoá trên thị trường, …
X Xây dựng: mạng Neuron bắt đầu được ứng dụng rộng rãi trong những năm gần
đây trong các lĩnh vực như: các dạng bài toán mô phỏng, mô hình hoá,các dạng
bài toán phân tích, dự đoán, ước lượng, kiểm soát, đánh giá, các bài toán ra
quyết định, quản lý,…
2.1.3 Mạng Neuron nhân tạo:
Mạng Neuron nhân tạo là một mô hình toán học mô phỏng bộ não con người
và hệ thần kinh Nó là một hệ thống bao gồm nhiều phần tử xử lý đơn giản (Neuron)
hoạt động song song, được sắp xếp trong các lớp (Layer) và liên kết với nhau bởi các
liên kết Neuron Mỗi liên kết kèm theo một trọng số nào đó, đặc trưng cho đặc tính
kích hoạt/ức chế giữa các Neuron Trong mạng Neuron, các Neuron đón nhận tín hiệu
vào gọi là Neuron vào nằm trong lớp nhập (input layer) và các Neuron đưa thông tin
ra gọi là Neuron ra nằm trong lớp xuất (output layer)
Một ANN có cấu trúc như sau (minh hoạ theo hình 2.2):
X Một lớp nhập (input layer): là lớp chứa các Neuron nhận thông tin dữ liệu ban
đầu đưa vào mạng ANN
X Một lớp xuất (output layer): là một nhóm các Neuron xuất các kết quả đầu ra
của mạng ANN
X Một hay nhiều lớp xử lý hay còn gọi là lớp ẩn (hidden layer): Có nhiệm vụ
xử lý thông tin từ lớp nhập rồi chuyển kết quả ra lớp xuất
Hình 2.2 : Cấu trúc cơ bản một mạng Neuron nhân tạo Để thiết kế một mạng Neuron chúng ta cần phải xây dựng hai vấn đề:
X Xác định cấu trúc mạng: ứng với từng mục đích cụ thể mà người thiết kế mạng
sẽ xây dựng một cấu trúc ANN phù hợp từ các Neuron, các liên kết Neuron với
số lượng và cấu trúc phù hợp
X Huấn luyện mạng: cập nhật các thông số tuỳ theo các điều kiện để mạng có
thể xử lý các vấn đề khi đang hoạt động giúp mạng Neuron có khả năng như
bộ não
Có thể xem các trọng số là phương tiện để lưu trữ thông tin dài hạn trong mạng
Neuron và nhiệm vụ của quá trình huấn luyện (học) mạng là cập nhật các trọng số
khi có thêm các thông tin về các mẫu học, hay nói một cách khác, các trọng số được
điều chỉnh sao cho dáng điệu vào ra của nó mô phỏng hoàn toàn phù hợp môi trường
đang xét Tính năng của hệ thống này tuỳ thuộc vào cấu trúc của hệ, các trọng số liên
Trang 22Trang 21
kết Neuron và quá trình tính toán tại các Neuron đơn lẻ Mạng Neuron có thể học từ
dữ liệu mẫu và tổng quát hoá dựa trên các dữ liệu mẫu học Lưu trữ kiến thức thu
được như những kinh nghiệm và sử dụng những kinh nghiệm đó tùy mục đích sử dụng
Phân loại mạng Neuron:
Theo kiểu liên kết Neuron: mạng truyền thẳng (feed-forward network),
mạng hồi tiếp (feedback network), mạng hồi quy (Recurrent network)
X Mạng truyền thẳng (feed-forward network): các liên kết Neuron đi theo một
hướng nhất định, không tạo thành chu trình (Directed Acyclic Graph), đầu ra
của Neuron ở lớp đứng trước là đầu vào của các Neuron lớp đứng sau
Hình 2.3 : Mạng truyền thẳng nhiều lớp
X Mạng hồi tiếp (feedback network): Các đầu ra của Neuron của lớp được định
hướng lùi về làm đầu vào cho các Neuron ở lớp đứng trước nó
Hình 2.4 : Mạng hồi tiếp nhiều lớp
X Mạng hồi quy (Recurrent network): nếu mạng hồi tiếp mà các đầu ra của các
đầu ra của lớp Neuron đầu ra là các đầu vào của lớp Neuron đầu vào thì được
gọi là mạng hồi quy hay mạng hồi tiếp chu trình Ban đầu mạng nhận các đầu
vào từ môi trường ngoài, sau đó thông qua việc huấn luyện các đầu ra cũng là
chính là đầu vào của mạng
Hình 2.5: Mạng hồi quy nhiều lớp
Trang 23Trang 22
Theo số lớp: các Neuron có thể tổ chức lại thành các lớp sao cho mỗi
Neuron của lớp này chỉ được nối với các Neuron ở lớp tiếp theo, không cho
phép các liên kết giữa các Neuron trong cùng một lớp, hoặc từ Neuron lớp
dưới lên Neuron lớp trên Ơû đây cũng không cho phép các liên kết Neuron
nhảy qua 01 lớp Ta nhận thấy rằng các Neuron trong cùng một lớp nhận
được tín hiệu từ lớp trên cùng một lúc, do vậy về nguyên tắc chúng có thể
xử lý song song Thông thường thì lớp Neuron vào chỉ chịu trách nhiệm
truyền đưa tín hiệu vào, không thực hiện một tính toán nào nên khi tính số
lớp của mạng người ta không tính lớp vào Thí dụ: ở hình 2.3 trên đây mô tả
cấu trúc một ANN có 03 lớp: 02 lớp ẩn và 01 lớp xuất
Khi xem xét một mạng ANN, ta xem xét nó theo 02 khía cạnh:
Mạng ANN như một công cụ tính toán:
Giả sử mạng ANN có m Neuron vào và n Neuron ra, khi đó với mỗi vector tín
hiệu vào X=(x1,…xm), sau quá trình tính toán tại các Neuron ẩn, ta nhận được kết quả
ra Y=(y1,…,yn) Theo nghĩa nào đó mạng Neuron làm việc với tư cách một bảng tra,
mà không cần biết dạng phụ thuộc hàm tường minh giữa Y và X khi đó ta viết:
Y = Tính (X, ANN) Cần lưu ý thêm rằng các Neuron trên cùng một lớp có thể tính toán đồng thời,
do vậy độ phức tạp tính toán nói chung sẽ phụ thuộc vào số lớp mạng
Các thông số cấu trúc mạng ANN bao gồm:
X Số tín hiệu vào, số tín hiệu ra
X Số lớp Neuron
X Số Neuron trên mỗi lớp
X Số lượng liên kết của mỗi Neuron( liên kết đầy đủ, liên kết bộ phận và liên kết
ngẫu nhiên)
X Các trọng số liên kết Neuron
Mạng ANN như một hệ thống thích nghi có khả năng hoc:
Có hai cách học khác nhau trong mạng Neuron nhân tạo: Học tham số
(parameter learning): phương pháp học bằng cách cập nhật trọng số kết nối và học
cấu trúc (structure learning): điều chỉnh, sửa đổi của mạng bao gồm số lớp, số
Neuron, kiểu và các trọng số liên kết
Giả sử có n phần tử xử lý trong một mạng Neuron nhân tạo và mỗi phần tử xử
lý có chính xác m trọng số thích nghi Ma trận trọng số W được định nghĩa bằng:
T T
w
w
w
2 1
n
m m
w w
w
w w
w
w w
w
21
222
21
112
11
Trang 24Trang 23
Trong đó,
w i = (w i1 , w i2 , …, w im ), i = 1, 2 …n
n : là vectơ trọng số của phần tử xử lý thứ i
w ij : là trọng số để kết nối phần tử xử lý thứ j và phần tử xử lý thứ i
Giả sử ta đã có ma trận trọng số mong muốn W chứa tất cả các phần tử thích
nghi của mạng Vấn đề đặt ra là tìm cách nào để tìm ra một ma trận trọng số thực sự
của mạng xấp xỉ với ma trận W trong quá trình xử lý thông tin? Để làm được điều
này, luật học thông số tổng quát được phát triển nhằm cập nhật ma trận trọng số sao
cho có được một ma trận trọng số thực sự của mạng xấp xỉ với ma trận trọng số mong
muốn của mạng
Một cách tổng quát, người ta phân biệt ba loại kỹ thuật học: Học giám sát
(supervised learning), học tăng cường và học không có giám sát (unsupervised
learning)
Học giám sát
Trong cách học giám sát, mạng Neuron nhân tạo được cung cấp một dãy các
cặp đầu vào, đầu ra mong muốn : (x(1), d(1)), (x(2), d(2)), …, (x(k), d(k)) Khi mỗi đầu
vào x(k) được đặt vào mạng thì đầu ra mong muốn tương ứng d(k) và đầu ra mong
muốn d(k) được giám sát trong khâu phát sinh tín hiệu sai số Trọng số kết nối giữa
các Neuron trong mạng này sẽ được cập nhật sử dụng tín hiệu sai lệch này sao cho
đầu ra thật sự của mạng sẽ tiến đến đầu ra mong muốn của mạng
Hình 2.6 : Mô tả cách học giám sát của một mạng Neuron nhân tạo
Học tăng cường
Trong cách học giám sát ta giả định mỗi đầu ra mong muốn của mạng phải
được biết trước cho mỗi đầu vào của mạng Tuy nhiên, trong một vài tình huống nào
có thể thiếu thông tin chi tiết : mạng vẫn được cung cấp các mẫu đầu vào mong muốn
nhưng mạng không được cung cấp rõ ràng các mẫu đầu ra mong muốn Học dựa trên
cơ sở loại các thông tin đánh giá đúng hay sai từ thông tin hồi tiếp từ đầu ra của mạng
được gọi là học tăng cường và thống tin hồi tiếp được gọi là thông tin tăng cường
Mạng neural W
Khâu phát sinh tín hiệu sai số
Y (Đầu ra thực sự)
X (Đầu vào)
Trang 25Trang 24
Hình 2.7: Mô tả cách học tăng cường của một mạng Neuron nhân tạo
Học tăng cường là một dạng học có giám sát vì mạng vẫn nhận một vài thông
tin hồi tiếp từ môi trường của nó
Học không có giám sát
Trong cách học không có giám sát, không có bất kỳ một thông tin hồi tiếp nào
từ môi trường để xác nhận kết quả đầu ra đúng hay sai Trong cách học này, mạng chỉ
được cung cấp các mẫu đầu vào và mạng tự điều chỉnh các trọng số kết nối giữa các
Neuron trong mạng bằng cách sử dụng các mẫu đầu ra thực sự của mạng
Hình 2.8 : Mô tả cách học không có giám sát của một mạng Neuron nhân tạo
Trong các mô hình học trên, giá trị ngưỡng θ của Neuron thứ i có thể được đưa
vào việc học Nó được xem như là một trọng số Wim bằng cách gán cho vectơ đầu vào
xm giá trị cố định : xm = -1
Hình 2.9: Mô tả luật học thông số tổng quát cho một phần tử xử lí thứ i
Luật học trọng số tổng quát trong các mạng Neuron được định nghĩa như sau :
Trang 26Trang 25
Trong đó :
Δw i (t) là sự gia tăng của vectơ trọng số tại mỗi bước học
η: hằng số học (learning constant) để xác định tốc độ học trong mạng
Do vậy, tại bước học t+1 vectơ trọng số có thể cải tiến bằng công thức :
wi(t+1) = wi(t) + ηrX(t)
Nếu là chế độ học giám sát thì tín hiệu học r được biểu diễn bằng một hàm có
dạng tổng quát :
r = fr (wi, X, di) = di - yi Nếu là chế độ học củng cố thì tín hiệu học r được biểu diễn bằng một hàm có
dạng tổng quát :
r = fr (wi, X, di) = di Nếu là chế độ học không giám sát thì tín hiệu học r được biểu diễn bằng một
hàm có dạng tổng quát :
r = fr (wi, X, di) = yi Nếu việc học được thực hiện liên tục, phương trình dưới đây được dùng để cập
nhật vectơ trọng số tại thời điểm (t+1)
)()
(
t rX t
Neuron truyền thẳng chỉ đơn thuần tính toán các tín hiệu ra dựa trên các tín hiệu vào
và các trọng số liên kết Neuron đã được xác định sẵn trong mạng Do đó chúng không
có trạng thái bên trong nào khác ngoài vector trọng số W Đối với mạng quy hồi,
trạng thái bên trong của mạng được lưu giữ tại các ngưỡng của các Neuron Nói
chung, các mạng qui hồi có thể không ổn định, thậm chí rối loạn theo nghĩa, khi cho
vector giá trị đầu vào X nào đó, mạng cần phải tính toán rất lâu, thậm chí có thể bị
lặp vô hạn trước khi đưa ra được kết quả mong muốn Quá trình học của mạng quy hồi
cũng phức tạp hơn nhiều Tuy vậy, các mạng quy hồi có thể cho phép mô phỏng các
hệ thống tương đối phức tạp trong thực tế
Xác định cấu trúc mạng tối ưu:
Lựa chọn sai cấu trúc mạng có thể dẫn tới hoạt động mạng trở nên kém hiệu
quả Nếu ta chọn mạng quá nhỏ có thể chúng không biểu diễn được sự phụ thuộc dữ
liệu mong muốn Nếu chọn mạng quá lớn để có thể nhớ được tất cả các mẫu học dưới
dạng bảng tra, nhưng hoàn toàn không thể tổng quát hoá được cho những tín hiệu vào
chưa biết trước Nói cách khác, cũng giống như trong các mô hình thống kê, các mạng
Neuron có thể đưa tới tình trạng quá thừa tham số
Bài toán xác định cấu trúc mạng tốt có thể xem như bài toán tìm kiếm tối ưu
trong không gian tham số, có thể áp dụng các cơ chế tìm kiếm kinh điển theo gradient
hay các giải thuật di truyền, lập trình tiến hoá,… Tuy vậy, không gian tham số có thể
rất lớn và để xác định một trạng thái W trong không gian đòi hỏi phải huấn luyện
mạng, do vậy rất tốn thời gian Có thể áp dụng tư tưởng tìm kiếm leo đồi
Trang 27Trang 26
climbing) nhằm sửa đổi một cách có lựa chọn, mang tính địa phương cấu trúc hiện có
Có 02 cách làm:
X Hoặc bắt đầu vói một mạng lớn, sau đó giảm nhỏ xuống
X Hoặc bắt đầu với một mạng nhỏ, sau đó tăng dần lên Một kỹ thuật khác có thể áp dụng gọi là: “Tổng thương tối ưu” nhằm loại bỏ
một số liên kết trọng số trong mạng dựa trên cách tiếp cận lý thuyết thông tin Đơn
giản nhất là các liên kết có trọng số bằng 0 quá trình cứ tiếp tục như vậy Thực
nghiệm chỉ ra rằng, kỹ thuật này có thể loại trừ tới ¾ các liên kết, do đó nâng cao
đáng kể hiệu quả của mạng
Ngoài việc loại trừ các liên kết Neuron thừa, người ta có thể vứt bỏ những
Neuron không đóng góp vào quá trình thực hiện của mạng
Giải thuật “lợp ngói” là một biến thể của kỹ thuật tăng trưởng mạng xuất phát
từ cấu hình ban đầu tương đối nhỏ, ý tưởng ở đây là xác định một cấu hình mạng cho
phép tính đúng các mẫu học đã biết Sau đó mỗi khi thêm dần mẫu học mới, mạng
được phép thêm một số Neuron cho phép đoán đúng kết quả học hiện tại và quá trình
cứ như vậy tiếp tục
2.1.4 Mạng Neuron lan truyền ngược (Back-propagation neural network):
Mạng Neuron nhiều lớp lan truyền ngược là một giải pháp hữu hiệu cho việc
mô hình hoá, đặc biệt đối với các quá trình phức tạp hoặc các cơ chế chưa được biết
rõ ràng Nó không đòi hỏi bất kỳ sự hiểu biết trước về các dạng hàm cũng như các
tham số Thực tế nó hoạt động như một hộp đen, với một số đủ lớn các trọng số
(weight) mạng hoàn toàn có đủ độ tự do để biểu diễn mối quan hệ giữa các đại lượng
vào và ra Mạng sử dụng tập quá trình thực nghiệm cho quá trình học hay quá trình
điều chỉnh các trọng số Việc xác định mô hình đơn giản là lựa chọn một cấu trúc
mạng và cho mạng học số liệu Quá trình học có thể tốn thời gian song một khi đã ổn
định, việc dự báo trở nên rất nhanh
Mạng Neuron lan truyền ngược luôn có một lớp vào, một lớp ra và không có
hoặc có các lớp ẩn Các Neuron trên các lớp được xếp tuyến tính, số lượng neuron
của lớp vào bằng số biến của vectơ vào, số neuron của lớp ra bằng số biến của vectơ
ra, các lớp của mạng được nối với nhau một cách đầy đủ Ngoài ra, trên các lớp trừ
lớp ra có thêm một tham số điều khiển (bias) Số lớp cũng như số lượng các neuron
trên mỗi lớp tuỳ thuộc vào từng ứng dụng, trên thực tế việc xây dựng mạng dựa trên
việc thử và sai (trial and error) Các mạng được sử dụng trong thực tế thường chỉ gồm
03 lớp: lớp vào, lớp ra và một lớp ẩn
Cấu trúc mạng Neuron truyền thẳng nhiều lớp lan truyền ngược (the
back-propagation algorithm – the multilayer feedforward networks):
Trang 28Trang 27
Hình 2.10: Cấu trúc mạng Neuron truyền thẳng nhiều lớp lan truyền ngược
Mạng với R Neuron đầu vào p1, p2, …, pR , mỗi một Neuron đầu vào ứng với
một trọng số w: w1, w2, …, wR, tham số điều khiển b(bias) và hàm truyền f ( transfer
function)
Hàm truyền thường được sử dụng là hàm log-sigmoid (logsig):
Ngoài ra người ta còn các hàm sau:
Hàm truyền sigmoid sẽ xuất ra trị của mạng trong khoảng giới hạn nhỏ, còn khi
sử dụng hàm truyền tuyến tính (linear) sẽ cho giá trị bất kỳ
Phương Pháp Giảm Gradient:
Phương pháp giảm gradient là một trong những giải thuật dùng để cập nhật
trọng số trong mạng neuron lan truyền ngược Trong quá trình học các trọng số được
điều chỉnh theo thuật toán trượt theo hướng dốc nhất trong không gian tham số
(deepest descent)
Trang 29Trang 28
Khi hoàn thành một bước lặp qua toàn bộ tập mẫu, tất cả các trọng số của
mạng sẽ được cập nhật dựa vào các thông tin đạo hàm riêng theo từng trọng số tích
lu được Các trọng số sẽ được cập nhật theo hướng mà hàm sai số E tụt xuống dốc
nhất
Phương pháp giảm Gradient dựa trên tính chất của đạo hàm mà nền tảng là
phương thức giảm nên có thể dùng cho hàm truyền bất kỳ (sigmoid hay linear)
Hình 2.11: Định nghĩa đạo hàm hàm số Đạo hàm của hàm số f tại một điểm x thuộc miền xác định, ký hiệu là f’(x),
được cho bởi :
n
n x
x f x f x
( lim )
(
Nếu f’(x) > 0 thì ta nói rằng f tăng tại x, nếu f’(x) < 0 thì ta nói rằng f giảm tại
x, còn nếu f’(x) = 0 thì hàm f có một cực trị tại x
Phương trình đường thẳng d đi qua điểm (x0,f(x0)) được cho bởi :
)()(
0 0
0
x f x x
x f
−
−
)()()(x0 x x0 f x0f
Gọi x1 là giao điểm của d và trục hoành, thế thì x1 là nghiệm phương trình :
0
0 0
0)+( − ) ′( )=(x x x f x f
Hình 2.12: Mô tả phương thức giảm gradient
Trang 30Trang 29
0 0 0
0 0
x f
x f x
)(Tổng quát, ta có:
n n n
n n
x f
x f x
1
Quá trình trên được gọi là phương thức giảm độ dốc Aùp dụng điều này cho
trọng số w ta có: wk(n+1) = wk(n) + Δwk(n)
số góc của tiếp tuyến ) dịch chuyển về 0 khi đó giá trị sai số là nhỏ nhất Quá trình
dịch chuyển này còn phụ thuộc vào hằng số η do người sử dụng cài đặt, η là hệ số
học của mạng nó ảnh hưởng rất lớn đến tốc độ học của quá trình
Nếu η quá lớn tốc độ học của mạng sẽ nhanh nhưng quá trình học sẽ không
chính xác vì có thể bước nhảy Δwk(n) sẽ vượt qua giá trị mong muốn của quá trình
học
Hình 2.14: Bước điều chỉnh vượt qua Emin
Trang 31Trang 30
Ngược lại nếu η quá nhỏ thì bước nhảy sẽ nhỏ và khả năng nhận biết giá trị
trọng số mong muốn cao tuy nhiên vẫn có tình trạng không tốt xảy ra đó là giá trị
trọng số rơi vào những điểm có E
w
∂
∂ = 0 nhưng điểm đó không phải là điểm để E đạt giá trị nhỏ nhất
Hình 2.15: Bước điều chỉnh không mong muốn
Thuật học Back-Propagation
Thuật toán Back-propagation được sử dụng để điều chỉnh các trọng số kết nối
sao cho tổng sai số E nhỏ nhất
Trong đó: t(xi,w) : giá trị thực của tập mẫu
y(xi) : giá trị xuất ra của mạng
Mỗi Neuron đều có giá trị vào và ra, mỗi giá trị vào đều có một trọng số để
đánh giá mức độ ảnh hưởng của giá trị vào đó Thuật học back-propagation sẽ điều
chỉnh các trọng số đó để cho giá trị ej = tj – yj là nhỏ nhất
Các bước thực hiện của thuật học Back-propagation:
Ü Bước 1: Xác định giá trị các trọng số ban đầu cho tất cả các đầu vào
của từng Neuron Giá trị trọng số này không thực sự quan trọng lắm đối với quá trình học nhưng phải được gán bằng các số ngẫu nhiên, tuy nhỏ nhưng không đồng đều bằng 0
Ü Bước 2: Tính toán giá trị xuất ra của mạng
Ü Bước 3: Tính toán giá trị sai số E của mạng
Ü Bước 4: So sánh giá trị sai số E của mạng với giá trị sai số mong
muốn ε
Ü Bước 5: Cập nhật lại trọng số mới rồi trở lại bước 2 cho đến khi đạt
giá trị sai số mong muốn
Trang 32Trang 31
TRÌNH TỰ CÁC BƯỚC THỰC HIỆN HUẤN LUYỆN BACK-PROPAGATION
Hình 2.16: Sơ đồ thực hiện Training Back-propagation
Trước hết ta phải xác định vị trí của mỗi neuron Neuron nào là của lớp ẩn và
neuron nào là của lớp xuất Ta cần biết các ký hiệu:
wij : vector trọng số của neuron j số đầu vào i
uj : vector giá trị kết xuất của neuron trong lớp j
NHẬP TẬP MẪU
(inputs, Targets)
CHỌN THÔNG SỐ
Sai số ε
ĐIỀU CHỈNH TRỌNG SỐ
1
2
) ( ) , (
E <= e
E > ε
XUẤT TRỌÏNG SỐ
Trang 33Trang 32
Hình 2.17: Mô hình tính toán một neuron Giá trị sai số của neuron j tại vòng lặp thứ n:
ej(n) = tj(n) – yj(n) ; Tổng bình phương sai số của mạng neural :
E(n) = 2
1
1 ( ) 2
k j j
w x n
=
∑ ; Giá trị kết xuất của neuron j:
1 ( ) 2
( ) ( )
k j j
j j
j j
j j
j j
j ij
) ( (
n w
n x w
i ij
p
i i ij
=
∂
∂ ∑
Trang 34ij
E n w
Như vậy quá trình điều chỉnh trọng số có thể được xác định theo các công thức
trên, tuy nhiên ta cần phải xác định vị trí của neuron thuộc lớp nào (lớp ẩn hay lớp
xuất) Điều này rất quan trọng trong việc tính toán δj cho từng hệ số điều chỉnh trọng
số
Hình 2.18: Mô hình tính toán mạng neural tổng quát
Trường hợp 1: Nếu neuron j là nút xuất:
( ) ( ( )) ( ) ( ) ( ) ( )
( )
j j
=
Trang 35Trang 34
Khi đó:
2 1
q
k j
q
k j
Từ những công thức tính trên ta có thể tổng quát như sau:
Ü Nếu neuron j là nút xuất: δj =e n f u n j( ) ( ( ))j′ j ;
Ü Nếu neuron j là nút ẩn :
Tùy theo từng dạng hàm lan truyền ta có thể tính toán các giá trị điều chỉnh
trọng số cho từng trọng số tương ứng theo thuật học Back-propagation
Trang 36Trang 35
TRÌNH TỰ CÁC BƯỚC THỰC HIỆN XÂY DỰNG MẠNG ANNs
Hình 2.19: Trình tự các bước thực hiện xây dựng mạng ANN
Lựa chọn mô hình: kỹ thuật học, hàm truyền, kiểu liên kết,…
Lựa chọn cấu trúc ANNs
Số lượng lớp ẩn Bộ trọng số ban đầu
(Theo tự động)
Số lượng neuron trong mỗi
lớp
Thiết lập thông số học: tốc
độ, sai số,…
Cung cấp tập mẫu dùng cho việc huấn luyện ANNs
Huấn luyện mạng
Chấp nhận sai số học?
Lựa chọn dữ liệu để kiểm tra
Sai số chấp nhận?
Ứng dụng vào thực tế
Thêmdữ liệu kiểm
tra này vào mẫu học
Đúng Sai
Sai
Đúng
Trang 37Trang 36
2.2 Giới thiệu bảng câu hỏi
Bảng câu hỏi là một trong những phương pháp thường được dùng để khảo sát,
thu thập dữ liệu cho việc nghiên cứu Chính vì vậy, việc thiết kế bảng câu hỏi sẽ ảnh
hưởng rất đáng kể đến kết quả nghiên cứu; việc thiết kế bảng câu hỏi không tốt có
thể sẽ dẫn đến việc kết quả nghiên cứu bị sai lệch khác xa nhiều so với điều kiện
thực tế, đôi khi gây ra một hậu quả rất nghiêm trọng
Người nghiên cứu không nên áp đặt bất kỳ một ý kiến nào của riêng mình cho
người khác trả lời, mà phải cố gắng khích lệ người trả lời nói lên những suy nghĩ của
họ, bảng câu hỏi phải được thiết kế sao cho những người trả lời có quan tâm đến và
sẵn sàng chia sẻ thông tin, kết quả nghiên cứu với họ để khuyến khích họ trả lời một
cách tận tình và đầy đủ hơn
Bảng câu hỏi đòi hòi sự chính xác, rõ ràng, tránh tình trạng một câu được hiểu
theo nhiều nghĩa khác nhau đối với người trả lời để khỏi gây ra kết quả bị lệch lạc,
bóp méo Trong bảng câu hỏi mọi thứ phải được cấu trúc, người nghiên cứu ấn đinh
chính xác những câu trả lời là gì, người trả lời chỉ việc đánh dấu, khoanh tròn hay chỉ
định trong số những câu trả lời soạn sẵn có câu nào giống với ý kiến của họ nhất Vì
vậy, người nghiên cứu không thể thiết kế nên một bảng câu hỏi tốt nếu không biết
trước người trả lời suy nghĩ như thế nào Vì vậy, giai đoạn thí điểm ban đầu (hoặc là
những nghiên cứu trước đó) rất quan trọng, nếu không những hỏi đặt ra sẽ không phù
hợp và những câu trả lời có thể sẽ không ăn nhập gì với suy nghĩ của người trả lời
Ngoài ra, khi thiết kế bảng câu hỏi cần phải lưu ý những vấn đề sau:
X Cách tổ chức bảng câu hỏi: cách tổ chức có ảnh hưởng rất mạnh đến tỉ lệ trả lời
và tác động rất nhiều đến chất lượng thu thập thông tin (sự chính xác của các
câu trả lời)
X Cách sử dụng từ trong câu hỏi, cách đặt câu hỏi cũng có tác động rất mạnh đến
chất lượng thông tin
X Thang đo lường dùng trong câu hỏi, điều này ấn đinh dạng thông tin mà ta thu
thập
Các bước tiến hành xây dựng bảng câu hỏi:
X Nhận dạng các vấn đề cần khảo sát từ các nguồn thông tin: phỏng vấn các
chuyên gia trong ngành, kết quả của các nghiên cứu trước, tra cứu thông tin và
tài liệu tham khảo qua sách báo, phương tiện truyền thông, internet,…
X Lựa chọn hình thức câu hỏi và thang đo: với đề tài nghiên cứu này ta có thể
chọn thang đo năm (05) mức độ (five-scales)
(1) Không ảnh hưởng (2) Ảnh hưởng không đáng kể (3) Ảnh hưởng trung bình (4) Ảnh hưởng đáng kể (5) Ảnh hưởng rất đáng kể
X Xây dựng cấu trúc bảng câu hỏi, nội dung chủ yếu bám chặt theo các vấn đề
đã được nhận dạng ở bước trên
Trang 38Trang 37
X Tiến hành khảo sát thử nghiệm: bước này nhằm để hoàn thiện bảng câu hỏi,
chỉnh sữa các sai sót, đồng thời thăm dò ý kiến phản hồi từ phía người trả lời
X Thu thập thông tin, hoàn thiện bảng câu hỏi, và tiến hành phát bảng câu hỏi để
thu thập số liệu nghiên cứu
2.2.1 Kích thước mẫu
Ta có thể tăng độ chính xác (giảm độ rộng của khoảng tin cậy) bằng cách đơn
giản là tăng kích thước mẫu, tuy nhiên độ chính xác chỉ tăng lên theo tỉ lệ với căn bậc
hai của kích thước mẫu Nói cách khác, chi phí lấy mẫu tăng lên với tốc độ nhanh gấp
nhiều lần so với tốc độ tăng của độ chính xác Một trường hợp nghiên cứu đã chứng
minh rằng, để giảm khoảng tin cậy đi một nửa, từ ± 20% xuống ± 10%, ta cần phải
tăng kích thước mẫu lên 4 lần, từ 196 mẫu lên 784 mẫu [29]
Ta có thể suy ra công thức tính toán kích thước mẫu như sau:
E
S Z
N = X
Trong đó:
N : kích thước mẫu;
X
S : độ lệch chuẩn của trị trung bình của mẫu
SX : độ lệch chuẩn của mẫu
E : sai số cho phép, khoảng tin cậy;
Z : giá trị của phân phối chuẩn được xác định theo hệ số tin cậy
Kích thước mẫu là hàm số phụ thuộc vào mức độ chấp nhận rủi ro (biểu thị
bằng giá trị Z), độ biến thiên của đám đông (ước lượng bằng độ lệch chuẩn) và
khoảng tin cậy (sai số cho phép)
Trên thực tế, việc tính toán kích thước mẫu phức tạp hơn nhiều so với công
thức Trước hết, ta thường không biết độ lệch chuẩn khi chưa thực sự bắt tay vào lấy
mẫu Nhưng lại cần biết độ lệch chuẩn đó để quyết định kích thước mẫu trước khi tiến
hành khảo sát Thông thường, giá trị độ lệch chuẩn được sử dụng trong công thức trên
chỉ là một con số phỏng đoán, đôi khi sử dụng từ các nghiên cứu trước đó, hoặc từ
nghiên cứu thí điểm, hay từ việc phỏng vấn thử nghiệm bảng câu hỏi Hoặc có khi ta
bắt đầu bằng một kích thước mẫu thử nghiệm, sau khi thu được một số dữ liệu, ta tính
độ lệch chuẩn của mẫu ấy, thế giá trị này vào công thức tính ra kích thước mẫu
Nhìn chung, còn khá nhiều vướng mắc trong công thức tính kích thước mẫu, cho
nên người ta ít sử dụng chúng nếu như mục tiêu dự án không đòi hỏi quá cao về độ
chính xác cho các thông số dự đoán
Ü Quy luật phỏng đoán cho thấy bằng kinh nghiệm rằng cần ít nhất 30
phần tử trong một mẫu để giá trị thống kê có ý nghĩa
Trang 39Trang 38
Ü Theo Hoelter (1983), số lượng mẫu tới hạn là 200 mẫu
Ü Theo Bollen (1989), số lượng mẫu tối thiểu phải là 5 mẫu cho một tham
số cần ước lượng (tỷ lệ 5:1)
Thông thường, ta có thể xác đinh kích thước mẫu theo kiểu định tính Độ lớn
của mẫu tối đa là 1000, hoặc đơn giản hơn lấy 10% của đám đông, kích thước tối
thiểu của mẫu là 30, và tuỳ thuộc vào độ biến thiên của đám đông mà điều chỉnh cho
phù hợp Trong khoảng kích thước tối đa và tối thiểu đó, quyết định thường được suy
xét dựa vào ngân quỹ và thời gian
2.2.2 Kiểm định thang đo
Việc xây dựng và kiểm định thang đo có ý nghĩa rất quan trọng đến độ tin cậy
của các câu hỏi cũng như các kết quả phân tích sau này Kiểm định thang đo là chúng
ta kiểm tra xem các mục hỏi nào đã đóng góp vào việc đo lường một khái niêm lý
thuyết mà ta đang nghiên cứu, và những mục hỏi nào không Điều này liên quan đến
02 phép tính toán: tương quan giữa bản thân các mục hỏi và tương quan giữa các điểm
số của từng mục hỏi với điểm số toàn bộ các mục hỏi cho mỗi bảng câu hỏi
Hệ số Cronbach Alpha là một phép kiểm định thống kê về mức độ chặt chẽ mà
các mục hỏi trong thang đo tương quan với nhau, một trong những phương pháp kiểm
tra tính đơn khía cạnh của thang đo được gọi là kiểm định độ tin cậy chia đôi
Công thức tính hệ số Cronbach Alpha:
2
2 ) 1
(
* ) 1
i
S
S n
N : số lần đo;
Si2 : phương sai của lần đo thứ i;
St2 : phương sai của tổng các lần đo;
α : có giá trị 0<α<1; α càng lớn thì độ tin cậy càng cao
Theo qui ước, một tập hợp các mục hỏi dùng để đo lường được đánh giá tốt
phải có hệ số α >= 0.80 nhưng có giá trị nhỏ nhất chấp nhận được là 0.70 [30]
2.3 Giới thiệu về mô hình hồi quy (Regression model)
Hồi quy được dùng để xem xét mối liên hệ tuyến tính giữa biến phụ thuộc Y và
các biến độc lập X1, X2, …, Xn
Mục tiêu của phân tích hồi quy là mô hình hoá mối liên hệ, nghĩa là từ các dữ
liệu mẫu thu thập được ta cố gắng xây dựng mô hình toán học nhằm thể hiện một
cách tốt nhất mối liên hệ giữa Y và các biến độc lập X1, X2, …, Xn
Phân tích hồi quy là xác định sự liên quan định lượng giữa các biến ngẫu nhiên
Y và các biến độc lập X1, X2, …, Xn Kết quả của phân tích hồi quy được dùng cho dự
đoán
Trang 40Trang 39
Mô hình hồi quy tuyến tính bội
Giả sử ta có biến Y phụ thuộc vào n biến độc lập X1, X2, …, Xn
Nếu giá trị của n biến độc lập X1, X2, …, Xn lần lượt là x1, x2, …, xn thì giá trị
của biến phụ thuộc yi*, thể hiện qua mô hình hồi quy bội tuyến tính có dạng như sau :
yi* = 0 + 1 x1i + 2 x2i + … + n xni + ε
Trong đó:
0, i (i = 1:n) : là các hằng số
0 : là giá trị ước lượng của biến y khi n biến X có giá trị bằng 0
i (i = 1:n) : là các tham số chưa biết, gọi là các hệ số hồi quy riêng phần
(Partial regression coefficients), thể hiện mức thay đổi của biến Y khi biến Xi thay
đổi một đơn vị
ε : là sai số, chính là biến độc lập ngẫu nhiên có phân phối chuẩn, với trung
bình bằng 0, phương sai không đổi σ2
Mô hình này cho rằng biến phụ thuộc có phân phối chuẩn với bất kỳ kết hợp
nào của các biến độc lập trong mô hình
Phương trình hồi quy tuyến tính bội của mẫu
Trong thực tế ta không thể xác định một cách chính xác các hệ số 0, i (i =
1:n) của phương trình hồi quy bội của tổng thể mà ta chỉ có thể ước lượng chúng từ
các giá trị quan sát của mẫu thu thập được, giả sử ta có n mẫu quan sát được (i = 1:n)
Phương pháp bình phương cực tiểu được dùng để ước lượng cho 0, i (i = 1:n)
bằng cách xác định các hệ số a, b1, b2, …, bn Ta có n phương trình:
yi* = 0 + b1 x1i + b2 x2i + … + bn xni Trước khi xác định mô hình hồi quy bội cần xây dựng ma trận tương quan giữa
biến phụ thuộc với từng biến độc lập cũng như giữa các biến độc lập với nhau để
kiểm tra các mối liên hệ này Đại lượng được dùng để lượng hoá mức độ chặt chẽ của
mối liên hệ tuyến tính giữa hai biến là hệ số tương quan r
Y X
N
i
i i
S S N
Y Y X X r
)1(
))(
Trong đó N là số quan sát, Sx,Sy là độ lệch chuẩn của từng biến X và Y
Trị tuyệt đối của r cho biết mức độ chặt chẽ của mối liên hệ tuyến tính, giá trị
này tiến gần đến 1 khi hai biến có mối liên hệ tuyến tính chặt chẽ và bằng 0 chỉ ra
rằng hai biến không có mối liên hệ tuyến tính, có 02 trường hợp: hoặc là hai biến này
không hệ có mối liên hệ, hoặc có thể có mối liên hệ chặt chẽ với nhau nhưng hệ số
tương quan vẫn sẽ nhỏ bằng 0 nếu như dạng của mối liên hệ này phi tuyến
Để kiểm định giả thuyết về sự tồn tại của mối liên hệ tuyến tính giữa Y và các
biến độc lập X1, X2, …, Xn, người ta sử dụng kiểm định F Ở đây ta xem biến phụ