1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng mô hình dự báo sự mất năng suất lao động ở các dự án xây dựng trong giai đoạn thi công sử dụng công cụ mạng neuron nhân tạo

138 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 138
Dung lượng 3,03 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ứng dụng mạng neuron nhân tạo trong việc xây dựng mô hình dự báo sự mất năng suất lao động và một mô hình được xây dựng song song là mô hình hồi quy tuyến tính Regression Linear trên cùn

Trang 1

Đại Học Quốc Gia Tp Hồ Chí Minh

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-

NGUYỄN NAM CƯỜNG

XÂY DỰNG MÔ HÌNH DỰ BÁO SỰ MẤT NĂNG SUẤT LAO ĐỘNG Ở CÁC DỰ ÁN XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG SỬ DỤNG CÔNG CỤ MẠNG NEURON NHÂN TẠO (ANNs)

Chuyên Ngành : CÔNG NGHỆ VÀ QUẢN LÝ XÂY DỰNG

Mã Số Ngành : 60.58.90

LUẬN VĂN THẠC SĨ

TP HỒ CHÍ MINH, Tháng 07 Năm 2007

Trang 2

Đại Học Quốc Gia Tp Hồ Chí Minh

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-

NGUYỄN NAM CƯỜNG

XÂY DỰNG MÔ HÌNH DỰ BÁO SỰ MẤT NĂNG SUẤT LAO ĐỘNG Ở CÁC DỰ ÁN XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG SỬ DỤNG CÔNG CỤ MẠNG NEURON NHÂN TẠO (ANNs)

Chuyên Ngành : CÔNG NGHỆ VÀ QUẢN LÝ XÂY DỰNG

Mã Số Ngành : 60.58.90

LUẬN VĂN THẠC SĨ

TP HỒ CHÍ MINH, Tháng 07 Năm 2007

Trang 3

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học : ………

Cán bộ chấm nhận xét 1 : ….………

Cán bộ chấm nhận xét 2 : ………

Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN

THẠC SĨ

TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày………….tháng………năm 2007

Trang 4

TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM PHÒNG ĐÀO TẠO SAU ĐẠI HỌC ĐỘC LẬP – TỰ DO – HẠNH PHÚC

Tp HCM, ngày tháng……… năm 2007

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên : NGUYỄN NAM CƯỜNG Phái : Nam

Chuyên ngành : Công nghệ và Quản lý Xây dựng MSHV : 00804193

I TÊN ĐỀ TÀI :

XÂY DỰNG MÔ HÌNH DỰ BÁO SỰ MẤT NĂNG SUẤT LAO ĐỘNG Ở CÁC DỰ ÁN XÂY DỰNG TRONG GIAI ĐOẠN THI CÔNG SỬ DỤNG CÔNG CỤ MẠNG NEURON

NHÂN TẠO (ANNs)

II NHIỆM VỤ VÀ NỘI DUNG :

Xác định các yếu tố ảnh hưởng lớn đến năng suất lao động ở các công trường thi công xây dựng Từ đó kết luận một cách khái quát tình hình chung về vấn đề mất năng suất lao động ở các công trường xây dựng tại Việt Nam

Xâây dựng mô hình dự báo sự mất năng suất lao động ở các dự án xây dựng trong giai đoạn thi công sử dụng công cụ mạng Neuron nhân tạo (ANNs)

Kiểm tra kết quả của mô hình bằng các dự án thực và so sánh kết quả với mô hình hồi quy (Regression model)

Xây dựng một chương trình dự báo dùng để dự báo cho khả năng xãy ra mất năng suất lao động ở các công trường xây dựng tại Việt Nam

III NGÀY GIAO NHIỆM VỤ: 05-02-2007

IV NGÀY HOÀN THÀNH NHIỆM VỤ : 05-07-2007

V CÁN BỘ HƯỚNG DẪN : Tiến sĩ NGÔ QUANG TƯỜNG

Thạc sĩ LÊ HOÀI LONG CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM NGÀNH CN BỘ MÔN

QL CHUYÊN NGÀNH

TS NGÔ QUANG TƯỜNG TS NGÔ QUANG TƯỜNG TS NGÔ QUANG TƯỜNG

Nội dung và đề cương luận văn thạc sĩ đã được Hội Đồng Chuyên Ngành thông qua Ngày tháng năm 2007

TRƯỞNG PHÒNG ĐT-SĐH TRƯỞNG KHOA QL NGÀNH

Trang 5

LỜI CÁM ƠN

Trước tiên, xin gửi lời cám ơn sâu sắc đến TS Ngô Quang Tường, ThS Lê Hoài Long những người đã quan tâm, tận tình giúp đỡ và hướng dẫn tôi trong suốt quá trình thực hiện luận văn này Xin chân thành cám ơn các thầy cô trong Khoa Kỹ Thuật Xây Dựng, đặc biệt là các thầy cô giảng dạy thuộc chuyên ngành Công nghệ và Quản lý Xây dựng, các thầy cô trong Khoa Quản Lý Công Nghiệp trường Đại học Bách khoa Tp Hồ Chí Minh Tất cả những kiến thức, kinh nghiệm mà các thầy cô đã truyền đạt lại cho tôi trong suốt quá trình học cũng như những góp ý quý báu của các thầy cô về luận văn này sẽ mãi là hành trang quý giá cho tôi trong suốt quá trình học tập, nghiên cứu và công tác sau này

Xin chân thành cám ơn tất cả bạn bè cùng lớp, những người đã cùng tôi trải qua những ngày học tập thật vui, bổ ích và những thảo luận trong suốt thời gian học đã giúp tôi tự hoàn thiện mình và mở ra trong tôi nhiều sáng kiến mới

Xin cám ơn những người đồng nghiệp của tôi, đã hỗ trợ cho tôi rất nhiều trong suốt quá trình học tập và chính những kinh nghiệm thực tế trong quá trình công tác của họ đã đóng góp rất nhiều ý kiến cho tôi hoàn thành luận văn này Cuối cùng, xin cám ơn những người thân trong gia đình tôi, những người bạn thân của tôi đã luôn bên cạnh tôi, quan tâm, động viên và giúp đỡ tôi vượt qua những khó khăn, trở ngại để hoàn thành luận văn này

Tp Hồ Chí Minh, ngày 02 tháng 07 năm 2007

Trang 6

Trang 5

TÓM TẮT

Năng suất lao động trong xây dựng là một trong những yếu tố quan trọng tạo nên sự thành công của một dự án xây dựng về mặt quản lý Vấn đề về mất năng suất lao động là một vấn đề luôn tồn tại trong các dự án xây dựng tại Việt Nam và nó tạo nên một sự lãng phí, làm gia tăng chi phí xây dựng công trình, làm giảm lợi nhuận của các doanh nghiệp xây dựng Vì vậy, việc định lượng, kiểm soát và tăng năng suất lao động trong xây dựng là một yêu cầu cấp bách, một câu hỏi đặt ra cho tất cả các doanh nghiệp xây dựng nói riêng, toàn ngành xây dựng nói chung nhằm tiết kiệm chi phí, giảm giá thành xây dựng nhằm nâng cao khả năng cạnh tranh của các doanh nghiệp xây dựng nhất là trong bối cảnh nền kinh tế Việt Nam như hiện nay

Chính từ yêu cầu thực tế đó, nội dung của luận văn này với mong muốn một phần nào giải quyết được việc đo lường sự mất năng suất lao động ở các dự án xây dựng trong giai đoạn thi công Xác định các nhân tố ảnh hưởng mạnh nhất đến năng suất lao động: khảo sát từ 47 nhân tố ảnh hưởng b ng b ng câu h i thu được 28 nhân tố ảnh hưởng mạnh nhất ( mean >= 3.5) Xây dựng một mô hình dự báo sự mất năng suất lao động cho các dự án cụ thể từ số liệu thu thập được từ 37 dự án xây dựng thuộc nhóm công trình xây dựng dân dụng

Mạng neuron nhân tạo (ANNs) đã được biết như một hệ thống có khả năng giải quyết được các vấn đề có mối quan hệ phức tạp và các tình huống không dự đoán được nhờ khả năng học trên dữ liệu của một tập mẫu xác định Ứng dụng mạng neuron nhân tạo trong việc xây dựng mô hình dự báo sự mất năng suất lao động và một mô hình được xây dựng song song là mô hình hồi quy tuyến tính (Regression Linear) trên cùng một tập mẫu nhằm mục đích để kiểm tra mô hình ANNs và nhận định được 03 nhân tố có mối tương quan lớn nhất với phần trăm mất năng suất lao động là: khả năng cung ứng vật tư, kế hoạch cung ứng và vận chuyển vật tư, điều kiện mặt bằng công trường với hệ số Adjusted R square = 0.736 cho thấy ba nhân tố này có thể giải thích được 73.6% phần trăm mất năng suất lao động trong dự án xây dựng Mô hình ANNs cho thấy kết quả khá chính xác trong việc dự báo sự mất năng suất lao động trong giai đoạn thi công xây dựng Một chương trình ứng dụng nhỏ được viết bằng ngôn ngữ lập trình Visual Basic nhằm giúp cho việc dự báo được thực hiện nhanh và minh hoạ sinh động hơn

Trang 7

Trang 6

ABSTRACT

Productivity in construction is one of the most important factors to the success of a project in the aspect of management Loss of productivity is an issue that is always existing in Vietnam construction projects and it cause a waste, increasing the cost for construction and decreasing the profit of construction enterprises Thus, quantification, supervision and increasing the productivity in construction is a necessary requirement and it is also a question for all construction brand in general and for enterprises of construction in particular in order to economize the cost, decrease the market price in construction for raising the capability of competition among enterprises of construction, especially in Vietnam economic background at presents

From that actual demand, the content of this essay aims to solve to some extent of the measurement of the loss of productivity in construction under the period of construction Define the factors that strongly effect to the productivity:

28 out of 47 factors are considered as the most strong ones from the investigation

by questionaire ( mean >= 3.5) A model for forecasting the loss of productivity will be built from the collected date of 37 civil construction projects

The Artificial Neural Networks (ANNs) has been known as a system that can solve issues of all complicated relationships and unforeseen situations based

on learning the data of a definite file Application of ANNs in forming the model for forecasting the loss of productivity and parallelling with Regression Linear on the same file so as to check the ANNs model and to judge 03 factors of the most biggest interrelation with the percentage of loss of productivity, that is: capability

of material supply, schedule of supply and transportation of material, condition of site premise with coefficient Adjusted R square = 0.736 showing that 73.6% of the loss of productivity in construction projects can be explained by these three factors ANNs model can show the correct result in forecasting the loss of productivity under the period of construction A small application programme written by Visual Basic software in order to help the forecast more quickly and vivid

Trang 8

Trang 7

MỤC LỤC

CHƯƠNG 1: TỔNG QUAN 8

1.1 Giới thiệu và đặt vấn đề nghiên cứu: 8

1.2 Mục tiêu nghiên cứu: 12

1.3 Giới hạn nghiên cứu: 12

1.4 Tình hình nghiên cứu trong nước và ngoài nước: 12

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 15

2.1 Giới thiệu mạng Neuron: 15

2.1.1 Lịch sử nghiên cứu và ứng dụng mạng Neuron 15

2.1.2 Bộ não và Neuron sinh học: 16

2.1.3 Mạng Neuron nhân tạo: 20

2.1.4 Mạng Neuron lan truyền ngược (Back-propagation neural network): 26

2.2 Giới thiệu bảng câu hỏi 36

2.2.1 Kích thước mẫu 37

2.2.2 Kiểm định thang đo 38

2.3 Giới thiệu về mô hình hồi quy (Regression model) 38

2.4 Giới thiệu năng suất lao động: 40

2.4.1 Năng suất lao động: 40

2.4.2 Năng suất lao động trong xây dựng: 41

CHƯƠNG 3: THU THẬP VÀ XỬ LÝ SỐ LIỆU 45

3.1 Xác định các nhân tố ảnh hưởng đến năng suất lao động: 45

3.2 Khảo sát thử nghiệm (pilot test): 47

3.3 Khảo sát các nhân tố ảnh hưởng (khảo sát lần 1): 50

3.4 Thu thập số liệu cho các công trình thực tế (khảo sát lần 2): 55

CHƯƠNG 4: XÂY DỰNG MÔ HÌNH DỰ BÁO 57

4.1 Xây dựng mô hình dự báo bằng Artificial Neuron Networks (ANNs): 57

4.1.1 Lựa chọn cấu trúc mạng ANNs: 57

4.1.2 Dữ liệu huấn luyện mạng: 58

4.1.3 Huấn luyện mạng bằng Matlab: 58

4.2 Xây dựng mô hình hồi quy tuyến tính bội (Regression linear): 65

4.2.1 Xem xét ma trận hệ số tương quan: 65

4.2.2 Đánh giá độ phù hợp của mô hình hồi quy: 67

4.2.3 Kiểm định độ phù hợp của mô hình hồi quy: 68

4.2.4 Phương trình hồi quy tuyến tính bội: 69

CHƯƠNG 5: KẾT QUẢ VÀ KIỂM TRA MÔ HÌNH 71

5.1 Kết quả mô hình dự báo bằng Artificial Neuron Networks (ANNs): 71

5.2 Kết quả mô hình hồi quy tuyến tính bội (Regression linear): 73

5.3 Chương trình dự báo sự mất năng suất lao động: 74

CHƯƠNG 6: KẾT LUẬN VÀ KIẾN NGHỊ 82

6.1 So sánh kết quả hai mô hình và kết luận: 82

6.2 Kiến nghị hướng phát triển của đề tài: 86

TÀI LIỆU THAM KHẢO 88

CÁC PHỤ LỤC KÈM THEO 90

LÝ LỊCH TRÍCH NGANG 137

Trang 9

Trang 8

CHƯƠNG 1: TỔNG QUAN

1.1 Giới thiệu và đặt vấn đề nghiên cứu:

Trong những năm gần đây, Việt Nam là một trong những nước có tốc độ tăng

trưởng tổng sản phẩm quốc nội GDP cao nhất thế giới 8.4% năm 2005(Nguồn Tổng

cục Thống kê) Tăng trưởng kinh tế nước ta tiếp tục được duy trì với tốc độ khá cao

trong nhiều năm qua, trong năm 2006 “GDP cả năm ước tính tăng 8,2% (báo cáo của

Chính Phủ), còn kế hoạch năm 2007 “GDP tăng khoảng 8,2-8,5% Những con số ước

tính tăng trưởng cả năm 2006 và kế hoạch năm 2007 không phải là những con số

không có cơ sở, mà trong thực tế nước ta đã và từng đạt trong thời gian qua, thí dụ:

thời kỳ 1991-1995, tốc độ tăng GDP đã đạt mức 8,2%/năm, năm 1992 (tăng 8,7%),

1993 (8,1%), 1994 (8,8%), 1995 (9,5%), 1996 (9,3%), hay năm 2005 vừa qua cũng

tăng tới 8,4% góp phần quan trọng để đưa mức tăng trưởng bình quân một năm thời

kỳ 2001-2005 là 7,5%

Bảng 1.1 : Tăng trưởng GDP (%, giá năm 1994)

1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

9.54 9.34 8.15 5.56 4.77 6.79 6.89 7.08 7.34 7.69 8.43

Nguồn : Tổng cục Thống kê ( TCTK)

Theo báo cáo có tựa đề Foresight 2020 của Economist Intelligence Unit (EIU)

của tạp chí The Economist và hãng Cisco dự báo giai đoạn 2006-2010 sẽ là thời kỳ

vàng son của kinh tế Việt Nam Trong giai đoạn này, GDP sẽ có tốc độ tăng hàng

năm khoảng 7%, cao thứ hai ở Châu Á và chỉ sau Trung Quốc

Cùng với sự tăng trưởng kinh tế nhanh là sự chuyển dịch thay đổi trong cơ cấu

của nền kinh t Sau 15 năm, tỷ trọng của ngành Công nghiệp – Xây dựng liên tục

tăng, từ tỉ trọng khá thấp trong tổng thể nền kinh tế, chỉ với tỷ trọng 22.67% vào năm

1990, thì đến năm 2002 ngành Công nghiệp – Xây dựng đã chiếm tỉ trọng 38.55%,

cao nhất trong nền kinh tế, và tiếp tục tăng trưởng đạt tỉ trọng 41.03 % trong năm

2005 Trong đó, ngành xây dựng chiếm 3-5% tỷ trọng của tổng thể nền kinh tế

Bảng 1.2 : Cơ cấu các ngành kinh tế ở Việt Nam

Tỷ trọng của các ngành Năm

Nông nghiệp Công nghiệp – Xây dựng Dịch vụ

Trang 10

Nguồn : Kinh tế Việt Nam 2005-2006, Thời báo Kinh Tế Việt Nam

Cùng với sự phát triển đó, vẫn còn tồn tại một số vấn đề trong ngành như:

chậm tiến độ, vượt chi phí, kém chất lượng, thất thoát trong xây dựng… Với vai trò của

ngành xây dựng trong nền kinh tế quốc dân, năng suất lao động của ngành ảnh hưởng

đáng kể đến sự phát triển kinh tế chung của đất nước, cải tiến năng suất lao động

cũng là một vấn đề được đặt ra đối với ngành xây dựng, theo Naoum và Hackman

(1996) thì năng suất lao động trong ngành xây dựng tăng 10% có thể làm cho giá trị

tổng sản phẩm quốc nội tăng 2,5%

Tuy trong thời gian qua nền kinh tế nước ta liên tục tăng trưởng nhưng GDP

bình quân đầu người mới đạt 637.3 USD, tính theo sức mua tương đương (PPP) thì con

số này mới đạt trên 2700 USD Đó là chỉ số còn thấp xa so với mức bình quân chung

của khu vực, của châu Á cũng như toàn thế giới Nói cách khác, nước ta vẫn bị xem là

nước kém phát triển theo tiêu chuẩn của Liên hiệp quốc Theo ước tính của EIU thì

đến năm 2010 GDP của Việt Nam sẽ đạt 85,3 tỷ USD và thu nhập bình quân đầu

người ở mức 970 USD, tính theo PPP, GDP của Việt Nam sẽ là 415 tỷ USD và thu

nhập bình quân đầu người là 4.500 USD Bên cạnh đó, mặc dù đã có những đầu tư và

đổi mới, nhưng hiện tại trình độ khoa học – công nghệ của ngành công nghiệp của

nước ta vẫn còn rất thấp khi đem so sánh với các nước trong khu vực Tỷ trọng doanh

nghiệp có công nghệ cao của Việt Nam mới đạt khoảng 20.6%, thấp xa so với các con

số tương ứng 29.1% của Philiplines, 29.7% của Indonesia, 30.8% của Thái Lan, 51.1%

của Malaysia và 73% của Singapore

Xét về khía cạnh chất lượng tăng trưởng, chúng ta đã quá nghiêng về tăng

trưởng chiều rộng tức là tăng trưởng chủ yếu dựa vào tăng trưởng vốn, tăng số lao

động, tăng cường khai thác tài nguyên hơn là tăng trưởng theo chiều sâu, tăng trưởng

do tăng năng suất lao động, nâng cao hiệu quả sử dụng vốn – tức là nâng cao năng

suất các nhân tố tổng hợp Đây là một dạng tăng trưởng không bền vững, nếu không

nâng cao chất lượng tăng trưởng thì tăng trưởng không những không cao lên mà ngay

cả tăng trưởng với tốc độ cũ cũng không duy trì được và bị tụt hậu là điều không thể

tránh khỏi

Trong bối cảnh hội nhập vào nền kinh tế thế giới và gia nhập vào WTO, Việt

Nam đang đứng trước những cơ hội lớn để biến đổi mình nhưng kèm theo nó là hàng

loạt những nguy cơ và thách thức cho các doanh nghiệp trong nước, trao đổi thương

mại giữa các quốc gia ngày càng phát triển đã và đang là một trong những động lực

chính góp phần vào sự tăng trưởng kinh tế và phát triển xã hội Trước hoàn cảnh đó,

Trang 11

Trang 10

doanh nghiệp ở các nước đang phát triển như Việt Nam nếu không bắt kịp xu hướng

mới sẽ bị loại ra khỏi thương trường cạnh tranh đầy quyết liệt này Việc thiếu cơ sở

hạ tầng về Năng suất Chất lượng và các kỹ năng quản lý cần thiết sẽ là những rào

cản đối với doanh nghiệp khi tiếp cận với các thị trường quốc tế, đồng thời sẽ cản trở

đối với doanh nghiệp hội nhập vào các chuỗi sản xuất và cung ứng quốc tế Để tồn tại

được trong môi trường này, các doanh nghiệp cần phải cung cấp những sản phẩm có

chất lượng, an toàn và tiết kiệm chi phí Các doanh nghiệp cũng cần không ngừng

nâng cao năng suất và tính cạnh tranh để tạo thêm giá trị trong sản xuất, duy trì hoặc

tăng cơ hội việc làm cho người lao động và gia tăng thị phần xuất khẩu cũng như thị

phần nội địa

Để đáp ứng những đòi hỏi bức xúc này, các doanh nghiệp Việt Nam đang ngày

càng nhận thức rõ được nhu cầu cần phải cải tiến chất lượng sản phẩm và năng suất

doanh nghiệp Con số các doanh nghiệp áp dụng chứng chỉ hệ thống quản lý theo tiêu

chuẩn chất lượng và môi trường như ISO 9000/ ISO 14000 và các tiêu chuẩn khác như

HACCP, GMP, SA 8000, OHSAS 18000 đang ngày càng tăng lên Bên cạnh đó,

nhiều doanh nghiệp cũng không ngừng cải tiến hệ thống quản lý bằng cách áp dụng

các công cụ, giải pháp/mô hình tiên tiến như: Chuẩn đối sánh (benchmarking); Thẻ

cân đối điểm (Balanced scorecard); Quản lý quan hệ khách hàng (CRM); Quản lý tri

thức doanh nghiệp (KM); … nhằm gia tăng giá trị và tăng cường khả năng cạnh tranh

cho doanh nghiệp Nhiều thương hiệu Việt Nam đã xây dựng được uy tín trong thị

trường trong nước và khu vực - đó là những dấu hiệu tích cực

Ngành xây dựng cũng không phải là ngoại lệ, môi trường kinh doanh trong xây

dựng ngày càng gặp phải một sự cạnh tranh rất lớn, nhất là khi có sự tham gia của các

doanh nghiệp xây dựng nước ngoài, họ hơn chúng ta về nhiều mặt: khoa học công

nghệ tiên tiến, đội ngũ kỹ thuật có tay nghề và trình độ quản lý cao Các doanh

nghiệp xây dựng muốn tồn tại và phát triển phải không ngừng nâng cao năng suất lao

động để tiết kiệm chi phí, nâng cao lợi nhuận; cũng tức là đồng nghĩa với việc nâng

cao khả năng cạnh tranh:

PdxIpr C

S x IQ

OQ IQxC

OQxS TC

C: Chi phí cho một đơn vị tài nguyên sử dụng Pd: Năng suất của quá trình sản xuất

Ipr (Price recovery factor): Hệ số phục hồi giá (prices / unit costs)

Mối liên hệ giữa lợi nhuận và năng suất có thể được biểu diễn như hình sau:

Trang 12

Trang 11

Hình 1.1 : Mối quan hệ giữa năng suất và lợi nhuận (Uusi-Rauva và Hannula, 1996)

Ta xét một ví dụ sau đây, giả sử xét một dự án xây dựng với các thành phần

chi phí như sau:

Ta nhận thấy chi phí nhân công chiếm một tỷ trọng rất lớn, khi chi phí này tăng

từ 30% å 35% ta thấy đồng nghĩa với việc lợi nhuận giảm bằng zê rô

Theo kinh nghiệm và một số nghiên cứu trước đây đã đúc kết được rằng chi phí

nhân công chiếm một tỷ lệ đáng kể trong các thành phần chi phí của một dự án xây

dựng: chiếm khoảng 25~35% giá trị công trình, do vậy, việc nâng cao năng suất lao

động nhằm giảm chi phí nhân công, làm gia tăng lợi nhuận cho nhà thầu đang là một

vấn đề đang được quan tâm hiện nay

Vì vậy, việc chọn đề tài: “Xây dựng mô hình dự báo sự mất năng suất lao

động ở các dự án xây dựng trong giai đoạn thi công sử dụng công cụ mạng

Neuron nhân tạo (ANNs)” với mong muốn đóng góp một phần nào vào việc định

lượng, đo lường và từ đó làm cơ sở cho việc cải tiến năng suất lao động trong giai

đoạn thi công xây dựng của các công trình xây dựng ở Việt Nam

Trang 13

Trang 12

1.2 Mục tiêu nghiên cứu:

Hiện nay mặc dù định mức về nhân công đã được thể hiện trong định mức xây

dựng cơ bản của nhà nước, nhưng những số liệu này vẫn chưa được cập nhật thường

xuyên và phản ánh được đúng với thực tế, thậm chí một số công việc còn chưa có

định mức và vẫn còn sử dụng đến Giá tạm tính hay Giá thực tế Từ những nghiên cứu

trước đây đã chỉ ra rằng năng suất thực tế đạt được là thấp hơn so với định mức, năng

suất thực tế bị tác động bởi nhiều nhân tố ảnh hưởng dẫn đến chi phí nhân công thực

tế thường cao hơn so với chi phí nhân công theo hợp đồng, do đó nghiên cứu này được

thực hiện với mục tiêu:

- Xác định các nhân tố chính ảnh hưởng đến năng suất lao động của các

dự án trong giai đoạn thi công xây dựng

- Sử dụng công cụ mạng Neuron nhân tạo (ANNs) để xây dựng một mô

hình dự báo về sự mất năng suất lao động ở các dự án xây dựng

- Dùng mô hình hồi quy tuyến tính (Regression Linear) để kiểm tra độ

chính xác mô hình ANNs

1.3 Giới hạn nghiên cứu:

Dữ liệu thu thập dùng cho việc huấn luyện mạng Neuron còn bị hạn chế như

sau:

- Công trình xây dựng dân dụng

- Thời gian thực hiện từ năm 2000 đến năm 2007 (ước lượng sử dụng dự

báo cho khoảng thời gian 05 năm trong tương lai 2000-2012)

- Số lượng mẫu dùng cho việc huấn luyện mạng là 33 mẫu chiếm

khoảng 90% (89.1%) so với tổng số thu thập được 37 mẫu

Vì vậy, xây dựng một mô hình dự báo sự mất năng suất lao động ở các dự án

xây dựng dân dụng trong giai đoạn thi công được thực hiện từ năm 2000 đến năm

2012

1.4 Tình hình nghiên cứu trong nước và ngoài nước:

Trên thế giới đã có rất nhiều những nghiên cứu về năng suất lao động mà ta có

thể điểm qua như sau: Mỹ [6]; Nigeria [7]; Anh [14], [15]; Mexico [10]; Canada [11],

Phần Lan [13],…

Năm 1986, Thomas and Mathews phát biểu rằng không có định nghĩa năng

suất chuẩn mực nào được thiết lập trong ngành công nghiệp xây dựng Thật khó để

định nghĩa một phương pháp đo lường năng suất chuẩn bởi vì các công ty xây dựng

đều sử dụng các hệ thống đo lường nội bộ chưa được chuẩn hoá.[Park, 21]

Mặc dù đã có một số nghiên cứu về năng suất lao động, nhưng vẫn chưa có sự

đồng ý, tán thành nào dựa trên định nghĩa về các hoạt động công việc cũng như một

hệ thống đo lường năng suất chuẩn Các nhà nghiên cứu đã kết luận rằng rất khó để

có được một phương pháp chuẩn để đo lường năng suất lao động trong xây dựng bởi

vì tính phức tạp của công trình và các đặc điểm độc nhất của các dự án xây dựng

(Oglesby et al 1989).[Park, 21]

Tính duy nhất và sự hoạt động không lặp lại của các dự án xây dựng tạo ra sự

khó khăn để phát triển một khái niệm và một biện pháp đo lường năng suất lao động

Trang 14

Trang 13

chuẩn hoá (Sweis 2000) Một vài nghiên cứu đã thử phát triển những khái niệm chung

và hệ thống năng suất lao động chuẩn, tuy nhiên, những nghiên cứu này không dựa

trên sự nhất trí cao của giới chuyên gia.[Park, 21]

Viện nghiên cứu về xây dựng thế giới (Construction Industry Institute) (CII)

(1990) đã phát triển một hệ thống đo lường năng suất lao động bao gồm: một hệ

thống báo cáo, một hệ thống đo lường giá trị đầu ra và đầu vào, và một hệ thống đánh

giá sự thực hiện để đo lường năng suất ở mức độ công trường.[Park, 21]

Adrian và Boyer (1976) đã thiết lập mô hình giảm năng suất để đo lường, dự

báo và cải thiện năng suất của các biện pháp thi công xây dựng.[Park, 21]

Weber và Lippiatt (1983) xem xét các biện pháp đo lường các nhân tố năng

suất riêng lẽ và các nhân tố năng suất tổng thể trong xây dựng [Park, 21]

Thomas và Yiakoumis (1987) đã mô tả mô hình nhân tố liên quan đến môi

trường, điều kiện công trường, quản lý và các nhân tố về thiết kế kết cấu thép, các

công tác cốp pha, xây trát,… [Park, 21]

Sanders và Thomas (1993) xác định các nhân tố xa hơn như biện pháp thi công,

yêu cầu của thiết kế và thời tiết ảnh hưởng đến năng suất xây trát và khảo sát sự ảnh

hưởng của các nhân tố bằng cách sử dụng mô hình nhân tố với tập dữ liệu thu được từ

các quá trình thu thập đã chuẩn hoá.[Park, 21]

Một mô hình khác là mô hình tác động – hành vi (action – response) cũng đã

đưa ra một cách thức cho việc đánh giá những nguyên nhân làm mất năng suất lao

động trong các công trình để giảm bớt và loại trừ sự mất năng suất (Halligan et al

1994).[Park, 21]

Báo cáo nghiên cứu của CII cũng công bố các nhân tố ảnh hưởng đến năng

suất lao động của tổ đội công nhân như kỹ thuật/ thiết kế, điều kiện công trường, vật

tư, quản lý thi công xây dựng và các vấn đề về nhân công lao động (2001).[Park, 21]

Liou và Borcherding (1986) xác định rằng, đo lường năng suất không chỉ là

nhiệm vụ được thực hiện 1 lần ( one-time task), sự đo lường liên tục và so sánh với

các dự án khác hoặc công ty khác là một yếu tố quan trọng để cải thiện năng suất lao

động.[Park, 21]

Thomas và Yiakoumis (1987) đã nhấn mạnh tầm quan trọng của hệ thông thu

thập số liệu về năng suất lao động chuẩn để đưa ra các phân tích đáng tin cậy.[Park,

21]

Các nghiên cứu về việc đo lường năng suất lao động được đề cập ở trên đây

đều tập trung vào cách báo cáo, đo lường, kiểm soát, đánh giá và cải thiện năng suất

lao động trong xây dựng Tuy nhiên các nghiên cứu này vẫn còn thiếu sự định nghĩa

của các hoạt động và phương pháp thu thập số liệu chuẩn Hơn nữa, các hệ thống đo

lường năng suất hiện tại đều tập trung vào các hoạt động ở mức độ chi tiết để quản lý

năng suất lao đông theo ngày hoặc tháng trong suốt quá trình thi công và phải kết hợp

chặt chẽ với hệ thống kiểm soát chi phí, điều này là phức tạp để theo dõi và đánh giá

năng suất lao động

Trong nước, cũng có một vài nghiên cứu về năng suất lao động, như nghiên cứu

của Đỗ Thị Xuân Lan: “Các nhân tố ảnh hưởng đến năng suất lao động trong thi công

Trang 15

Trang 14

xây dựng tại hiện trường”[3] đã chỉ ra có 04 nhân tố ảnh hưởng đến năng suất lao

động: (1) Mặt bằng công trường; (2) Quản lý vật tư; (3) Tiến độ thi công, (4) Động cơ

làm việc của công nhân

Đề tài “Nghiên cứu về mặt bằng sử dụng lao động trong ngành xây dựng tại

Tp HCM” [2] của Đỗ Thị Xuân Lan nghiên cứu đã góp phần đưa ra một cái nhìn tổng

thể về thực trạng của thị trường xây dựng tại Tp HCM, đưa ra những kết quả khảo sát

về công nhân xây dựng, phân tích những quan điểm và thái độ của họ về nghề nghiệp

để đánh giá những yếu tố ảnh hưởng đến tinh thần làm việc và lòng yêu nghề của họ

nhằm giúp cho nhà quản lý có cơ hội thay đổi môi trường làm việc để sử dụng lao

động có hiệu quả hơn, cải tiến năng suất lao động và tiết kiệm chi phí nhân công

Đề tài “Các vấn đề về an toàn lao động trong thi công xây dựng tại Tp HCM”

của Lưu Trường Văn, Đỗ Thị Xuân Lan đã nghiên cứu các yếu tố tác động chính gây

nên tai nạn lao động trong xây dựng, kết quả nghiên cứu cho thấy công nhân thiếu

nhận thức về tầm quan trọng của an toàn lao động, công nhân chưa được huấn luyện

đầy đủ và trang bị bảo hộ lao động, thang và dàn giáo không phù hợp, thiết bị hư cũ,

thao tác thiếu an toàn là những nguyên nhân chính gây nên tai nạn làm ảnh hưởng

đến năng suất lao động

Đề tài “Nghiên cứu động cơ, tinh thần làm việc của công nhân xây dựng và các

nhân tố ảnh hưởng đến năng suất của họ” [5] luận văn thạc sĩ của Dương Thị Bích

Huyền đã chỉ ra công nhân chỉ sử dụng hơn 2,5 giờ cho công việc trực tiếp làm ra sản

phẩm, gần 3 giờ để thực hiện những công việc phụ trợ, mất khoảng 2,5 giờ cho những

công việc không hữu ích hay không làm gì cả

Các nghiên cứu mới chỉ dừng ở mức nhận dạng các nhân tố ảnh hưởng đến

năng suất lao động của công nhân trong một vài lĩnh vực nhỏ trong một dự án như

điều kiện thi công mặt bằng trên công trường, vấn đề về công nhân xây dựng, các

điều kiện an toàn lao động…, và đề xuất các biện pháp nhằm nâng cao năng suất lao

động trong các lĩnh vực đó

Chưa xác định được các yếu tố ảnh hưởng đến năng suất lao động của cả một

dự án xây dựng, ví dụ các yếu tố về: thay đổi của nền kinh tế, sự thay đổi của chính

sách, mức độ lành nghề của công nhân, do các dự trù (dự toán) kém chính xác, do lập

kế hoạch kém …

Vẫn chưa có một mô hình nào có thể dự báo được sự mất năng suất lao động

của các dự án nói chung và dự án xây dựng nói riêng

Trang 16

Trang 15

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1 Giới thiệu mạng Neuron:

2.1.1 Lịch sử nghiên cứu và ứng dụng mạng Neuron

Những năm 1940 có thể xem là mốc khởi đầu của các nghiên cứu về mạng

Neuron với đề xuất mô hình xử lý thông tin tại các Neuron và mạng Neuron của Mc

Culloch-Pitts và giải thuật huấn luyện mạng của Hebb [Phương, 8]

Những năm 50 và 60 là thời kỳ hưng thịnh của mạng Neuron với các công trình

của Rosenblatt (1960) về mạng Perceptron, giải thuật huấn luyện mạng ADALINE và

bài báo bình giải của Minsky và Papert về mạng Perceptron [Phương, 8]

Những năm 70 mạng Neuron rơi vào trạng thái im lặng cả về nghiên cứu và

ứng dụng Tuy vậy có thể kể đến các nghiên cứu về quá trình học của mạng nhiều

lớp, mạng tự tổ chức của Kohonen, mạng kiểu bộ nhớ kết hợp (BAM) của Anderson,

mạng ART (Adaptive Resonance Theory NN) của Capenter [Phương, 8]

Những năm 80 là thời kỳ phục hưng của các nghiên cứu và ứng dụng mạnh mẽ

của các mạng Neuron với các nghiên cứu về thuật giải học dựa trên lan truyền ngược

sai số (backpropagation of errors), mạng một lớp của Hopfield, mạng theo kiểu máy

Boltzmann và mạng Neocognitron của Fukushima [Phương, 8]

Từ những đầu năm 90 đến nay, đã tìm được và khẳng định được vị trí của mình

trong rất nhiều ứng dụng khác nhau trong công nghệ nhờ kết hợp chúng với các kỹ

thuật của trí tuệ nhân tạo: Giải thuật di truyền, logic mờ và suy diễn xấp xỉ, hệ

chuyên gia để phân tích dữ liệu và thu thập tri thức phục vụ cho việc xây dựng các hệ

thống thông minh lai [Phương, 8]

Lippman (1987) và gần đây Hush và Horne (1993) đã công bố cập nhật một vài

mô hình về ANN Barron (1989) và Levin et al (1990) đã đưa ra một sự giải thích

bằng thống kê của các phương pháp huấn luyện mạng ANN Nerrand et al đã chỉ ra

rằng ANN có thể được xem như một bộ lọc phi tuyến tổng quát mà sự thích hợp của

nó thông qua việc học.[Halim, 26]

Kamarthi et al (1992); Kohonen (1988) đã đưa ra một sự tổng kết rõ hơn về

mạng Neuron truyền thẳng (Feed-forward) và mạng lan truyền ngược sai số

(Back-propagation) bằng một ý tưởng rất đáng chú ý về ánh xạ các đặc trưng topo tự tổ chức

(theo nghĩa không cần mẫu học) nhằm bảo toàn trật tự sắp xếp các mẫu trong không

gian biểu diễn nhiều chiều sang một không gian mới (một chiều hoặc hai

chiều).[Halim, 26]

Rumelhart et al (1994) đã chứng minh rằng các vấn đề có những mối quan hệ

phi tuyến phức tạp sẽ được giải quyết bằng mạng Neuron tốt hơn là so với phương

pháp lý thuyết thông thường.[Halim, 26]

Những lĩnh vực sử dụng khá hiệu quả mạng Neuron dùng để kiểm soát, dự báo

và điều khiển là: thương mại, không gian vũ trụ, điều khiển tự động, Ngân hàng,

Trang 17

Trang 16

phòng chống, điện tử, giải trí, công nghiệp, sản xuất, cơ khí, thông tin liên lạc, hoá

học, vật liệu, kinh tế, môi trường,… [12]

2.1.2 Bộ não và Neuron sinh học:

Từ lâu, hàng ngàn năm trước đây con người đã đổ công nghiên cứu phương

cách làm cho bộ não có khả năng tư duy Ngay năm 335 trước công nguyên, nhà triết

học Arixtot đã viết: “Trong số các động vật cao cấp, con người có bộ não lớn nhất so

với kích thước của mình” Tuy vậy, phải tới giữa thế kỷ 18 người ta mới xác nhận

được rằng bộ não thực sự đóng vai trò quan trọng bậc nhất trong nhận thức Cuối thế

kỷ thứ 19, các nhà khoa học còn khẳng định rằng hoạt dộng nhận thức của con người

còn gắn liền với hoạt động của các bộ phận cơ thể khác như: tim, lá lách, tuyến tùng

và tuỷ sống

Các nhà nghiên cứu sinh học cho thấy rằng Bộ não bao gồm nhiều Neuron (tế

bào thần kinh ), các Neuron là đơn vị cơ sở đảm nhiệm những chức năng xử lý nhất

định trong hệ thần kinh, bao gồm não, tuỷ sống và các dây thần kinh Các Neuron liên

kết với nhau bằng các dây thần kinh Sự hoạt động của hệ thần kinh được chia thành

3 giai đoạn :

X Con người nhận được kích thích từ bên ngoài thông qua các giác quan Sự kích

thích này được chuyển đổi thành xung điện và được chuyển đến não

X Bộ não liên tục thu nhận thông tin, xử lý, đánh giá và so sánh chúng với những

thông tin đang lưu trữ để tạo ra các quyết định thích đáng

X Những mệnh lệnh đưa ra sau khi bộ não xử lý được truyền đến các bộ phận

chấp hành như tay, chân cho hành động hay lưỡi cho tiếng nói … dưới dạng

xung điện Bộ phận thi hành biến đổi xung điện dẫn đến hình thành hành động

Neuron là phần tử cơ bản của não, có khả năng hoạt động tương tự một đơn vị

logic của máy tính, được chia làm 2 loại :

X Neuron vào ra cục bộ, cách nhau khoảng 100 micron (1 micron =10-3mm)

X Neuron ra kết nối với các vùng khác của não, như kết nối não với bắp thịt hay

kết nối các giác quan với não

Trong quá trình hoạt động, Neuron nhận được nhiều thông tin, và những thông

tin này được cộng lại với nhau theo một hình thức nào đó

Xét về hình dạng và kích thước khác nhau nhưng về căn bản, có thể chia thành

3 phần :

Hình 2.1 : Cấu trúc cơ bản một Neuron sinh học

Trang 18

Trang 17

X Cell body: phần thân với nhân bên trong (gọi là soma)

X Dendrite: một hệ thống dạng cây các dây thần kinh vào, hoạt động như là cầu

nối với các Neuron, dùng làm kênh vào của Neuron

Axon: một đầu thần kinh ra (gọi là trục axon), axon có bản chất dẫn điện, được

dùng như kênh ra của Neuron, mỗi Neuron chỉ có một axon

Các dây thần kinh vào tạo thành một lưới dày đặc xung quanh thân tế bào,

chiếm diện tích khoảng 0,25 mm2, còn dây thần kinh ra tạo thành trục dài có thể từ 1

cm cho đến hàng mét Đường kính của nhân tế bào thường chỉ là 10-14m Trục dây

thần kinh ra cũng có thể phân nhánh theo dạng cây để nối với các dây thần kinh vào

hoặc trục tiếp với nhân tế bào các Neuron khác thông qua các khớp nối (gọi là

synapse) Thông thường, mỗi Neuron có thể gồm vài chục cho tới hàng trăm ngàn

khớp nối để nối với các Neuron khác Người ta ước lượng rằng lưới các dây thần kinh

ra cùng với các khớp nối bao phủ diện tích khoảng 90% bề mặt Neuron

Mỗi Neuron có một mức kích hoạt, nằm trong tầm giữa giá trị lớn nhất và giá

trị nhỏ nhất, trái với logic Boolean chỉ có tồn tại hai giá trị

Việc gia tăng hay giảm mức kích hoạt của Neuron này đối với Neuron khác

được thực hiện thông qua các synapse bám trên dendrite Nếu là synapse kích thích,

mức kích hoạt từ neron gửi làm gia tăng mức kích hoạt của Neuron nhận Còn nếu là

synapse hạn chế thì mức kích hoạt từ Neuron gửi sẽ lảm giảm mức kích hoạt của

Neuron nhận Mức kích hoạt tại Neuron nhận đạt đến một giá trị ngường nào đó sẽ

kích thích đầu ra, truyền trên axon đến các Neuron khác, cuối axon có khoảng 10000

synapse Các synapse không chỉ khác nhau ở tác dụng kích thích hay hạn chế mà còn

khác nhau ở mức kích hoạt

Các tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của các

Neuron là tín hiệu điện và được thực hiện thông qua các quá trình phản ứng và giải

phóng các chất hữu cơ Các chất này được phát ra từ các khớp nối dẫn tới các dây

thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào Khi điện thế này đạt

tới một ngưỡng nào đó, sẽ tạo ra một xung điện dẫn tới trục dây thần kinh ra Xung

này được truyền theo trục,tới các nhánh rẽ khi chạm tới các khớp nối với các Neuron

khác sẽ giải phóng các chất truyền điện Người ta chia làm hai loại khớp nối: khớp

nối kích thích (excitatory) hoặc khớp nối ức chế (inhibitory)

Phát hiện quan trọng nhất trong nghiên cứu về bộ não là các liên kết khớp thần

kinh khá mềm dẻo, có thể biến động và chỉnh đổi theo thời gian tuỳ thuộc vào các

dạng kích thích Hơn nữa, các Neuron có thể sản sinh các liên kết mới với các Neuron

khác và đôi khi, lưới các Neuron có thể di trú từ vùng này sang vùng khác trong bộ

não Các nhà khoa học cho rằng đây chính là cơ sở quan trọng để giải thích cơ chế

học của bộ não con người

Phần lớn các quá trình xử lý thông tin đều xãy ra trên vỏ não Toàn bộ võ não

được bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với đường kính

khoảng 0,5mm, độ cao 4mm Mỗi đơn vị cơ sở này chứa khoảng 2000 Neuron Người

ta chỉ ra rằng mỗi vùng não có những chức năng nhất định Năm 1861, Pierre Paul

Broca đã chỉ ra rằng phần võ não phía trước bên trái điều khiển khả năng nói và sự

Trang 19

Trang 18

phát triển ngôn ngữ Bán cầu đại não trái chịu trách nhiệm các xử lý thông tin nhận

thức theo những quy trình thuật giải nhất định, còn bán cầu đại não phải gắn với các

xử lý thông tin tiềm thức phi thuật giải như linh cảm, linh tính, … Các nghiên cứu thực

nghiệm còn chứng tỏ rằng các liên kết giữa các vùng não với các bộ phận cơ thể có

thể thay đổi và đối với một số động vật cao cấp các liên kết kiểu này có thể ở dạng

kép Tuy vậy, các chuyên gia nghiên cứu cho đến nay vẫn chưa hiểu cặn kẽ cơ chế

thay thế chức năng của các vùng cho nhau khi có một vùng nào đó bị tổn thương

Điều rất đáng ngạc nhiên chính là các Neuron rất đơn giản trong cơ chế làm

việc, nhưng mạng các Neuron liên kết với nhau lại có khả năng tính toán, suy nghĩ,

ghi nhớ và điều khiển

Các chức năng cơ bản của bộ não:

X Bộ nhớ được tổ chức theo các bó thông tin và truy nhập theo nội dung (có thể

truy xuất thông tin dựa theo giá trị các thuộc tính của đối tượng) Bộ não tích

hợp và lưu trữ kinh nghiệm, có sự phân loại và liên kết với các dữ liệu vào

X Bộ não có khả năng tổng quát hoá, có thể truy xuất các tri thức hay các mối

liên kết chung của các đối tượng tương ứng với một khái niệm chung nào đó

Bộ não xem xét những kinh nghiệm mới trong hoàn cảnh những kinh nghiệm

đã được lưu trữ Bộ não có khả năng dự đoán chính xác những tình huống mới

dựa trên những kinh nghiệm đã có trước đây

X Bộ não có khả năng dung thứ lỗi theo nghĩa có thể điều chỉnh hoặc tiếp tục

thực hiện ngay khi có những sai lệch do thông tin bị thiếu hoặc không chính

xác Ngoài ra, bộ não còn có thể phát hiện và phục hồi các thông tin bị mất

dựa trên sự tương tự giữa các đối tượng Bộ não không cần thông tin hoàn hảo

và chấp nhận lỗi

X Bộ não có khả năng xuống cấp và thay thế dần Khi có những trục trặc tại các

vùng não (bệnh, chấn thương) hoặc bắt gặp những thông tin hoàn toàn mới lạ,

bộ não vẫn có thể tiếp tục làm việc

X Bộ não có khả năng học

So sánh khả năng làm việc của bộ não và máy tính:

Đơn vị tính toán 01 bộ xử lý trung tâm với 105

mạch logic cơ sở

Tốc độ truyền 109 bit/giây 1014 bit/giây

Cập nhật thông tin 105 bit/giây 1014 Neuron/giây

Và hiện nay khoa học đã phân tích được bộ não con người chứa khoảng 1010

-1012 Neuron Mỗi Neuron được kết nối với khoảng 104 các Neuron khác Các sự kiện

xảy ra trên các Neuron này khoảng 10-3s, trong khi các sự kiện xảy ra trên các Chip

silicon hay IC là 10-8s (Shepherd and Koch, 1990) Tuy nhiên, kết quả thực nghiệm

cho thấy bộ não người là một cấu trúc hiệu quả khổng lồ Hiệu suất của bộ não đạt

Trang 20

Trang 19

đến 10-16s trên một hành động trong khi hiệu suất của máy tính khoảng 10-6s trên một

hành động(Faggin,1991) Bộ não người có thể xử lý các thông tin phức tạp, phi tuyến

và tính toán song song (information-processing-system ) Bộ não người có thể lưu giữ

nhiều thông tin hơn các máy tính hiện đại, tuy rằng điều này không phải đúng mãi

mãi, bởi lẽ bộ não tiến hoá chậm, trong khi đó nhờ những tiến bộ trong công nghệ vi

điện tử, bộ nhớ máy tính được nâng cấp rất nhanh Hơn nũa, sự hơn kém về bộ nhớ trở

nên hoàn toàn thứ yếu so với sự khác biệt về tính toán và khả năng xử lý song song

Các bộ vi xử lý có thể tính 108 lệnh trong một giây, trong khi đó mạng Neuron xử lý

chậm hơn, cần khoảng vài miligiây để kích hoạt Tuy nhiên, bộ não máy tính hiện đại

cũng chỉ có một số hạn chế các bộ vi xử lý song song Nếu chạy một mạng Neuron

nhân tạo trên máy tính, phải tốn hàng trăm lệnh máy để kiểm tra một Neuron có được

kích hoạt hay không (tiêu phí khoảng 10-8 * 102 giây/ Neuron ) Do đó, dầu bộ xử lý

có thể tính toán nhanh hơn hàng triệu lần so với các Neuron bộ não, nhưng xét tổng

thể bộ não lại tính toán nhanh hơn hàng tỷ lần

Cách tiếp cận mạng Neuron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo

ra các thiết bị có thể kết hợp khả năng song song cao của bộ não với tốc độ tính toán

cao của máy tính Tuy vậy, cần phải có một khoảng thời gian dài nữa để các mạng

Neuron nhân tạo có thể mô phỏng được các hành vi sáng tạo của bộ não con người

Chẳng hạn, bộ não có thể thực hiện một nhiệm vụ khá phức tạp như nhận ra khuôn

mặt người quen sau không quá một giây, trong khi đó một máy tính tuần tự phải thực

hiện hàng tỷ phép tính (khoảng 10 giây) để thực hiện cùng thao tác đó,nhưng với chất

lượng kém hơn nhiều, đặc biệt trong trường hợp thông tin không chính xác, không đầy

đủ

Từ những khả năng vô cùng to lớn của bộ não người mà ngày nay mạng

Neuron đã được nghiên cứu rộng rãi nhằm mục đích xây dựng một bộ não nhân tạo

cho máy móc hoặc robot để có thể hoạt động như con người nhằm vào mục đích tự

động hóa Hiện nay mạng Neuron đã được ứng dụng thử nghiệm và có một số thành

công trong các lĩnh vực:

X Nhận dạng mẫu: phân tích các thuộc tính đặc trưng của mẫu, phân tích và nhận

dạng giọng nói, nhận dạng dấu vân tay,

X Kỹ thuật chế tạo: giám sát quá trình gia công đúc khuôn mẫu, điều khiển tối ưu

chế độ cắt,…

X Xử lý ảnh và nhận biết bằng máy tính : trùng khớp ảnh, tiền xử lý ảnh, phân

tích ảnh và xử lý các hình ảnh thay đổi theo thời gian,…

X Xử lý tín hiệu: phân tích tín hiệu địa chấn và tín hiệu số để dự báo về các trận

động đất, phân tích các dấu hiệu của thời tiết: nhiệt độ, độ ẩm không khí, chế

độ gió, mực nước cường triều,… để đưa ra những dự đoán về các cơn bão, sóng

thần, …

X Hệ thống điện : dự báo trạng thái của hệ thống, sức tải và dự báo độ an toàn,…

X Y học : phân tích và nhận biết các tín hiệu điện tâm đồ, chẩn đoán bệnh,…

X Quân sự : phát hiện thủy lôi, phân loại luồng rada, nhận biết các máy bay địch

trên bầu trời,…

Trang 21

Trang 20

X Kinh tế : phân tích thị trường chứng khoáng, định giá bất động sản, dự báo sự

biến động về giá cả các loại hàng hoá trên thị trường, …

X Xây dựng: mạng Neuron bắt đầu được ứng dụng rộng rãi trong những năm gần

đây trong các lĩnh vực như: các dạng bài toán mô phỏng, mô hình hoá,các dạng

bài toán phân tích, dự đoán, ước lượng, kiểm soát, đánh giá, các bài toán ra

quyết định, quản lý,…

2.1.3 Mạng Neuron nhân tạo:

Mạng Neuron nhân tạo là một mô hình toán học mô phỏng bộ não con người

và hệ thần kinh Nó là một hệ thống bao gồm nhiều phần tử xử lý đơn giản (Neuron)

hoạt động song song, được sắp xếp trong các lớp (Layer) và liên kết với nhau bởi các

liên kết Neuron Mỗi liên kết kèm theo một trọng số nào đó, đặc trưng cho đặc tính

kích hoạt/ức chế giữa các Neuron Trong mạng Neuron, các Neuron đón nhận tín hiệu

vào gọi là Neuron vào nằm trong lớp nhập (input layer) và các Neuron đưa thông tin

ra gọi là Neuron ra nằm trong lớp xuất (output layer)

Một ANN có cấu trúc như sau (minh hoạ theo hình 2.2):

X Một lớp nhập (input layer): là lớp chứa các Neuron nhận thông tin dữ liệu ban

đầu đưa vào mạng ANN

X Một lớp xuất (output layer): là một nhóm các Neuron xuất các kết quả đầu ra

của mạng ANN

X Một hay nhiều lớp xử lý hay còn gọi là lớp ẩn (hidden layer): Có nhiệm vụ

xử lý thông tin từ lớp nhập rồi chuyển kết quả ra lớp xuất

Hình 2.2 : Cấu trúc cơ bản một mạng Neuron nhân tạo Để thiết kế một mạng Neuron chúng ta cần phải xây dựng hai vấn đề:

X Xác định cấu trúc mạng: ứng với từng mục đích cụ thể mà người thiết kế mạng

sẽ xây dựng một cấu trúc ANN phù hợp từ các Neuron, các liên kết Neuron với

số lượng và cấu trúc phù hợp

X Huấn luyện mạng: cập nhật các thông số tuỳ theo các điều kiện để mạng có

thể xử lý các vấn đề khi đang hoạt động giúp mạng Neuron có khả năng như

bộ não

Có thể xem các trọng số là phương tiện để lưu trữ thông tin dài hạn trong mạng

Neuron và nhiệm vụ của quá trình huấn luyện (học) mạng là cập nhật các trọng số

khi có thêm các thông tin về các mẫu học, hay nói một cách khác, các trọng số được

điều chỉnh sao cho dáng điệu vào ra của nó mô phỏng hoàn toàn phù hợp môi trường

đang xét Tính năng của hệ thống này tuỳ thuộc vào cấu trúc của hệ, các trọng số liên

Trang 22

Trang 21

kết Neuron và quá trình tính toán tại các Neuron đơn lẻ Mạng Neuron có thể học từ

dữ liệu mẫu và tổng quát hoá dựa trên các dữ liệu mẫu học Lưu trữ kiến thức thu

được như những kinh nghiệm và sử dụng những kinh nghiệm đó tùy mục đích sử dụng

Phân loại mạng Neuron:

Theo kiểu liên kết Neuron: mạng truyền thẳng (feed-forward network),

mạng hồi tiếp (feedback network), mạng hồi quy (Recurrent network)

X Mạng truyền thẳng (feed-forward network): các liên kết Neuron đi theo một

hướng nhất định, không tạo thành chu trình (Directed Acyclic Graph), đầu ra

của Neuron ở lớp đứng trước là đầu vào của các Neuron lớp đứng sau

Hình 2.3 : Mạng truyền thẳng nhiều lớp

X Mạng hồi tiếp (feedback network): Các đầu ra của Neuron của lớp được định

hướng lùi về làm đầu vào cho các Neuron ở lớp đứng trước nó

Hình 2.4 : Mạng hồi tiếp nhiều lớp

X Mạng hồi quy (Recurrent network): nếu mạng hồi tiếp mà các đầu ra của các

đầu ra của lớp Neuron đầu ra là các đầu vào của lớp Neuron đầu vào thì được

gọi là mạng hồi quy hay mạng hồi tiếp chu trình Ban đầu mạng nhận các đầu

vào từ môi trường ngoài, sau đó thông qua việc huấn luyện các đầu ra cũng là

chính là đầu vào của mạng

Hình 2.5: Mạng hồi quy nhiều lớp

Trang 23

Trang 22

Theo số lớp: các Neuron có thể tổ chức lại thành các lớp sao cho mỗi

Neuron của lớp này chỉ được nối với các Neuron ở lớp tiếp theo, không cho

phép các liên kết giữa các Neuron trong cùng một lớp, hoặc từ Neuron lớp

dưới lên Neuron lớp trên Ơû đây cũng không cho phép các liên kết Neuron

nhảy qua 01 lớp Ta nhận thấy rằng các Neuron trong cùng một lớp nhận

được tín hiệu từ lớp trên cùng một lúc, do vậy về nguyên tắc chúng có thể

xử lý song song Thông thường thì lớp Neuron vào chỉ chịu trách nhiệm

truyền đưa tín hiệu vào, không thực hiện một tính toán nào nên khi tính số

lớp của mạng người ta không tính lớp vào Thí dụ: ở hình 2.3 trên đây mô tả

cấu trúc một ANN có 03 lớp: 02 lớp ẩn và 01 lớp xuất

Khi xem xét một mạng ANN, ta xem xét nó theo 02 khía cạnh:

Mạng ANN như một công cụ tính toán:

Giả sử mạng ANN có m Neuron vào và n Neuron ra, khi đó với mỗi vector tín

hiệu vào X=(x1,…xm), sau quá trình tính toán tại các Neuron ẩn, ta nhận được kết quả

ra Y=(y1,…,yn) Theo nghĩa nào đó mạng Neuron làm việc với tư cách một bảng tra,

mà không cần biết dạng phụ thuộc hàm tường minh giữa Y và X khi đó ta viết:

Y = Tính (X, ANN) Cần lưu ý thêm rằng các Neuron trên cùng một lớp có thể tính toán đồng thời,

do vậy độ phức tạp tính toán nói chung sẽ phụ thuộc vào số lớp mạng

Các thông số cấu trúc mạng ANN bao gồm:

X Số tín hiệu vào, số tín hiệu ra

X Số lớp Neuron

X Số Neuron trên mỗi lớp

X Số lượng liên kết của mỗi Neuron( liên kết đầy đủ, liên kết bộ phận và liên kết

ngẫu nhiên)

X Các trọng số liên kết Neuron

Mạng ANN như một hệ thống thích nghi có khả năng hoc:

Có hai cách học khác nhau trong mạng Neuron nhân tạo: Học tham số

(parameter learning): phương pháp học bằng cách cập nhật trọng số kết nối và học

cấu trúc (structure learning): điều chỉnh, sửa đổi của mạng bao gồm số lớp, số

Neuron, kiểu và các trọng số liên kết

Giả sử có n phần tử xử lý trong một mạng Neuron nhân tạo và mỗi phần tử xử

lý có chính xác m trọng số thích nghi Ma trận trọng số W được định nghĩa bằng:

T T

w

w

w

2 1

n

m m

w w

w

w w

w

w w

w

21

222

21

112

11

Trang 24

Trang 23

Trong đó,

w i = (w i1 , w i2 , …, w im ), i = 1, 2 …n

n : là vectơ trọng số của phần tử xử lý thứ i

w ij : là trọng số để kết nối phần tử xử lý thứ j và phần tử xử lý thứ i

Giả sử ta đã có ma trận trọng số mong muốn W chứa tất cả các phần tử thích

nghi của mạng Vấn đề đặt ra là tìm cách nào để tìm ra một ma trận trọng số thực sự

của mạng xấp xỉ với ma trận W trong quá trình xử lý thông tin? Để làm được điều

này, luật học thông số tổng quát được phát triển nhằm cập nhật ma trận trọng số sao

cho có được một ma trận trọng số thực sự của mạng xấp xỉ với ma trận trọng số mong

muốn của mạng

Một cách tổng quát, người ta phân biệt ba loại kỹ thuật học: Học giám sát

(supervised learning), học tăng cường và học không có giám sát (unsupervised

learning)

Học giám sát

Trong cách học giám sát, mạng Neuron nhân tạo được cung cấp một dãy các

cặp đầu vào, đầu ra mong muốn : (x(1), d(1)), (x(2), d(2)), …, (x(k), d(k)) Khi mỗi đầu

vào x(k) được đặt vào mạng thì đầu ra mong muốn tương ứng d(k) và đầu ra mong

muốn d(k) được giám sát trong khâu phát sinh tín hiệu sai số Trọng số kết nối giữa

các Neuron trong mạng này sẽ được cập nhật sử dụng tín hiệu sai lệch này sao cho

đầu ra thật sự của mạng sẽ tiến đến đầu ra mong muốn của mạng

Hình 2.6 : Mô tả cách học giám sát của một mạng Neuron nhân tạo

Học tăng cường

Trong cách học giám sát ta giả định mỗi đầu ra mong muốn của mạng phải

được biết trước cho mỗi đầu vào của mạng Tuy nhiên, trong một vài tình huống nào

có thể thiếu thông tin chi tiết : mạng vẫn được cung cấp các mẫu đầu vào mong muốn

nhưng mạng không được cung cấp rõ ràng các mẫu đầu ra mong muốn Học dựa trên

cơ sở loại các thông tin đánh giá đúng hay sai từ thông tin hồi tiếp từ đầu ra của mạng

được gọi là học tăng cường và thống tin hồi tiếp được gọi là thông tin tăng cường

Mạng neural W

Khâu phát sinh tín hiệu sai số

Y (Đầu ra thực sự)

X (Đầu vào)

Trang 25

Trang 24

Hình 2.7: Mô tả cách học tăng cường của một mạng Neuron nhân tạo

Học tăng cường là một dạng học có giám sát vì mạng vẫn nhận một vài thông

tin hồi tiếp từ môi trường của nó

Học không có giám sát

Trong cách học không có giám sát, không có bất kỳ một thông tin hồi tiếp nào

từ môi trường để xác nhận kết quả đầu ra đúng hay sai Trong cách học này, mạng chỉ

được cung cấp các mẫu đầu vào và mạng tự điều chỉnh các trọng số kết nối giữa các

Neuron trong mạng bằng cách sử dụng các mẫu đầu ra thực sự của mạng

Hình 2.8 : Mô tả cách học không có giám sát của một mạng Neuron nhân tạo

Trong các mô hình học trên, giá trị ngưỡng θ của Neuron thứ i có thể được đưa

vào việc học Nó được xem như là một trọng số Wim bằng cách gán cho vectơ đầu vào

xm giá trị cố định : xm = -1

Hình 2.9: Mô tả luật học thông số tổng quát cho một phần tử xử lí thứ i

Luật học trọng số tổng quát trong các mạng Neuron được định nghĩa như sau :

Trang 26

Trang 25

Trong đó :

Δw i (t) là sự gia tăng của vectơ trọng số tại mỗi bước học

η: hằng số học (learning constant) để xác định tốc độ học trong mạng

Do vậy, tại bước học t+1 vectơ trọng số có thể cải tiến bằng công thức :

wi(t+1) = wi(t) + ηrX(t)

Nếu là chế độ học giám sát thì tín hiệu học r được biểu diễn bằng một hàm có

dạng tổng quát :

r = fr (wi, X, di) = di - yi Nếu là chế độ học củng cố thì tín hiệu học r được biểu diễn bằng một hàm có

dạng tổng quát :

r = fr (wi, X, di) = di Nếu là chế độ học không giám sát thì tín hiệu học r được biểu diễn bằng một

hàm có dạng tổng quát :

r = fr (wi, X, di) = yi Nếu việc học được thực hiện liên tục, phương trình dưới đây được dùng để cập

nhật vectơ trọng số tại thời điểm (t+1)

)()

(

t rX t

Neuron truyền thẳng chỉ đơn thuần tính toán các tín hiệu ra dựa trên các tín hiệu vào

và các trọng số liên kết Neuron đã được xác định sẵn trong mạng Do đó chúng không

có trạng thái bên trong nào khác ngoài vector trọng số W Đối với mạng quy hồi,

trạng thái bên trong của mạng được lưu giữ tại các ngưỡng của các Neuron Nói

chung, các mạng qui hồi có thể không ổn định, thậm chí rối loạn theo nghĩa, khi cho

vector giá trị đầu vào X nào đó, mạng cần phải tính toán rất lâu, thậm chí có thể bị

lặp vô hạn trước khi đưa ra được kết quả mong muốn Quá trình học của mạng quy hồi

cũng phức tạp hơn nhiều Tuy vậy, các mạng quy hồi có thể cho phép mô phỏng các

hệ thống tương đối phức tạp trong thực tế

Xác định cấu trúc mạng tối ưu:

Lựa chọn sai cấu trúc mạng có thể dẫn tới hoạt động mạng trở nên kém hiệu

quả Nếu ta chọn mạng quá nhỏ có thể chúng không biểu diễn được sự phụ thuộc dữ

liệu mong muốn Nếu chọn mạng quá lớn để có thể nhớ được tất cả các mẫu học dưới

dạng bảng tra, nhưng hoàn toàn không thể tổng quát hoá được cho những tín hiệu vào

chưa biết trước Nói cách khác, cũng giống như trong các mô hình thống kê, các mạng

Neuron có thể đưa tới tình trạng quá thừa tham số

Bài toán xác định cấu trúc mạng tốt có thể xem như bài toán tìm kiếm tối ưu

trong không gian tham số, có thể áp dụng các cơ chế tìm kiếm kinh điển theo gradient

hay các giải thuật di truyền, lập trình tiến hoá,… Tuy vậy, không gian tham số có thể

rất lớn và để xác định một trạng thái W trong không gian đòi hỏi phải huấn luyện

mạng, do vậy rất tốn thời gian Có thể áp dụng tư tưởng tìm kiếm leo đồi

Trang 27

Trang 26

climbing) nhằm sửa đổi một cách có lựa chọn, mang tính địa phương cấu trúc hiện có

Có 02 cách làm:

X Hoặc bắt đầu vói một mạng lớn, sau đó giảm nhỏ xuống

X Hoặc bắt đầu với một mạng nhỏ, sau đó tăng dần lên Một kỹ thuật khác có thể áp dụng gọi là: “Tổng thương tối ưu” nhằm loại bỏ

một số liên kết trọng số trong mạng dựa trên cách tiếp cận lý thuyết thông tin Đơn

giản nhất là các liên kết có trọng số bằng 0 quá trình cứ tiếp tục như vậy Thực

nghiệm chỉ ra rằng, kỹ thuật này có thể loại trừ tới ¾ các liên kết, do đó nâng cao

đáng kể hiệu quả của mạng

Ngoài việc loại trừ các liên kết Neuron thừa, người ta có thể vứt bỏ những

Neuron không đóng góp vào quá trình thực hiện của mạng

Giải thuật “lợp ngói” là một biến thể của kỹ thuật tăng trưởng mạng xuất phát

từ cấu hình ban đầu tương đối nhỏ, ý tưởng ở đây là xác định một cấu hình mạng cho

phép tính đúng các mẫu học đã biết Sau đó mỗi khi thêm dần mẫu học mới, mạng

được phép thêm một số Neuron cho phép đoán đúng kết quả học hiện tại và quá trình

cứ như vậy tiếp tục

2.1.4 Mạng Neuron lan truyền ngược (Back-propagation neural network):

Mạng Neuron nhiều lớp lan truyền ngược là một giải pháp hữu hiệu cho việc

mô hình hoá, đặc biệt đối với các quá trình phức tạp hoặc các cơ chế chưa được biết

rõ ràng Nó không đòi hỏi bất kỳ sự hiểu biết trước về các dạng hàm cũng như các

tham số Thực tế nó hoạt động như một hộp đen, với một số đủ lớn các trọng số

(weight) mạng hoàn toàn có đủ độ tự do để biểu diễn mối quan hệ giữa các đại lượng

vào và ra Mạng sử dụng tập quá trình thực nghiệm cho quá trình học hay quá trình

điều chỉnh các trọng số Việc xác định mô hình đơn giản là lựa chọn một cấu trúc

mạng và cho mạng học số liệu Quá trình học có thể tốn thời gian song một khi đã ổn

định, việc dự báo trở nên rất nhanh

Mạng Neuron lan truyền ngược luôn có một lớp vào, một lớp ra và không có

hoặc có các lớp ẩn Các Neuron trên các lớp được xếp tuyến tính, số lượng neuron

của lớp vào bằng số biến của vectơ vào, số neuron của lớp ra bằng số biến của vectơ

ra, các lớp của mạng được nối với nhau một cách đầy đủ Ngoài ra, trên các lớp trừ

lớp ra có thêm một tham số điều khiển (bias) Số lớp cũng như số lượng các neuron

trên mỗi lớp tuỳ thuộc vào từng ứng dụng, trên thực tế việc xây dựng mạng dựa trên

việc thử và sai (trial and error) Các mạng được sử dụng trong thực tế thường chỉ gồm

03 lớp: lớp vào, lớp ra và một lớp ẩn

Cấu trúc mạng Neuron truyền thẳng nhiều lớp lan truyền ngược (the

back-propagation algorithm – the multilayer feedforward networks):

Trang 28

Trang 27

Hình 2.10: Cấu trúc mạng Neuron truyền thẳng nhiều lớp lan truyền ngược

Mạng với R Neuron đầu vào p1, p2, …, pR , mỗi một Neuron đầu vào ứng với

một trọng số w: w1, w2, …, wR, tham số điều khiển b(bias) và hàm truyền f ( transfer

function)

Hàm truyền thường được sử dụng là hàm log-sigmoid (logsig):

Ngoài ra người ta còn các hàm sau:

Hàm truyền sigmoid sẽ xuất ra trị của mạng trong khoảng giới hạn nhỏ, còn khi

sử dụng hàm truyền tuyến tính (linear) sẽ cho giá trị bất kỳ

Phương Pháp Giảm Gradient:

Phương pháp giảm gradient là một trong những giải thuật dùng để cập nhật

trọng số trong mạng neuron lan truyền ngược Trong quá trình học các trọng số được

điều chỉnh theo thuật toán trượt theo hướng dốc nhất trong không gian tham số

(deepest descent)

Trang 29

Trang 28

Khi hoàn thành một bước lặp qua toàn bộ tập mẫu, tất cả các trọng số của

mạng sẽ được cập nhật dựa vào các thông tin đạo hàm riêng theo từng trọng số tích

lu được Các trọng số sẽ được cập nhật theo hướng mà hàm sai số E tụt xuống dốc

nhất

Phương pháp giảm Gradient dựa trên tính chất của đạo hàm mà nền tảng là

phương thức giảm nên có thể dùng cho hàm truyền bất kỳ (sigmoid hay linear)

Hình 2.11: Định nghĩa đạo hàm hàm số Đạo hàm của hàm số f tại một điểm x thuộc miền xác định, ký hiệu là f’(x),

được cho bởi :

n

n x

x f x f x

( lim )

(

Nếu f’(x) > 0 thì ta nói rằng f tăng tại x, nếu f’(x) < 0 thì ta nói rằng f giảm tại

x, còn nếu f’(x) = 0 thì hàm f có một cực trị tại x

Phương trình đường thẳng d đi qua điểm (x0,f(x0)) được cho bởi :

)()(

0 0

0

x f x x

x f

)()()(x0 x x0 f x0f

Gọi x1 là giao điểm của d và trục hoành, thế thì x1 là nghiệm phương trình :

0

0 0

0)+( − ) ′( )=(x x x f x f

Hình 2.12: Mô tả phương thức giảm gradient

Trang 30

Trang 29

0 0 0

0 0

x f

x f x

)(Tổng quát, ta có:

n n n

n n

x f

x f x

1

Quá trình trên được gọi là phương thức giảm độ dốc Aùp dụng điều này cho

trọng số w ta có: wk(n+1) = wk(n) + Δwk(n)

số góc của tiếp tuyến ) dịch chuyển về 0 khi đó giá trị sai số là nhỏ nhất Quá trình

dịch chuyển này còn phụ thuộc vào hằng số η do người sử dụng cài đặt, η là hệ số

học của mạng nó ảnh hưởng rất lớn đến tốc độ học của quá trình

Nếu η quá lớn tốc độ học của mạng sẽ nhanh nhưng quá trình học sẽ không

chính xác vì có thể bước nhảy Δwk(n) sẽ vượt qua giá trị mong muốn của quá trình

học

Hình 2.14: Bước điều chỉnh vượt qua Emin

Trang 31

Trang 30

Ngược lại nếu η quá nhỏ thì bước nhảy sẽ nhỏ và khả năng nhận biết giá trị

trọng số mong muốn cao tuy nhiên vẫn có tình trạng không tốt xảy ra đó là giá trị

trọng số rơi vào những điểm có E

w

∂ = 0 nhưng điểm đó không phải là điểm để E đạt giá trị nhỏ nhất

Hình 2.15: Bước điều chỉnh không mong muốn

Thuật học Back-Propagation

Thuật toán Back-propagation được sử dụng để điều chỉnh các trọng số kết nối

sao cho tổng sai số E nhỏ nhất

Trong đó: t(xi,w) : giá trị thực của tập mẫu

y(xi) : giá trị xuất ra của mạng

Mỗi Neuron đều có giá trị vào và ra, mỗi giá trị vào đều có một trọng số để

đánh giá mức độ ảnh hưởng của giá trị vào đó Thuật học back-propagation sẽ điều

chỉnh các trọng số đó để cho giá trị ej = tj – yj là nhỏ nhất

Các bước thực hiện của thuật học Back-propagation:

Ü Bước 1: Xác định giá trị các trọng số ban đầu cho tất cả các đầu vào

của từng Neuron Giá trị trọng số này không thực sự quan trọng lắm đối với quá trình học nhưng phải được gán bằng các số ngẫu nhiên, tuy nhỏ nhưng không đồng đều bằng 0

Ü Bước 2: Tính toán giá trị xuất ra của mạng

Ü Bước 3: Tính toán giá trị sai số E của mạng

Ü Bước 4: So sánh giá trị sai số E của mạng với giá trị sai số mong

muốn ε

Ü Bước 5: Cập nhật lại trọng số mới rồi trở lại bước 2 cho đến khi đạt

giá trị sai số mong muốn

Trang 32

Trang 31

TRÌNH TỰ CÁC BƯỚC THỰC HIỆN HUẤN LUYỆN BACK-PROPAGATION

Hình 2.16: Sơ đồ thực hiện Training Back-propagation

Trước hết ta phải xác định vị trí của mỗi neuron Neuron nào là của lớp ẩn và

neuron nào là của lớp xuất Ta cần biết các ký hiệu:

wij : vector trọng số của neuron j số đầu vào i

uj : vector giá trị kết xuất của neuron trong lớp j

NHẬP TẬP MẪU

(inputs, Targets)

CHỌN THÔNG SỐ

Sai số ε

ĐIỀU CHỈNH TRỌNG SỐ

1

2

) ( ) , (

E <= e

E > ε

XUẤT TRỌÏNG SỐ

Trang 33

Trang 32

Hình 2.17: Mô hình tính toán một neuron Giá trị sai số của neuron j tại vòng lặp thứ n:

ej(n) = tj(n) – yj(n) ; Tổng bình phương sai số của mạng neural :

E(n) = 2

1

1 ( ) 2

k j j

w x n

=

∑ ; Giá trị kết xuất của neuron j:

1 ( ) 2

( ) ( )

k j j

j j

j j

j j

j j

j ij

) ( (

n w

n x w

i ij

p

i i ij

=

∂ ∑

Trang 34

ij

E n w

Như vậy quá trình điều chỉnh trọng số có thể được xác định theo các công thức

trên, tuy nhiên ta cần phải xác định vị trí của neuron thuộc lớp nào (lớp ẩn hay lớp

xuất) Điều này rất quan trọng trong việc tính toán δj cho từng hệ số điều chỉnh trọng

số

Hình 2.18: Mô hình tính toán mạng neural tổng quát

Trường hợp 1: Nếu neuron j là nút xuất:

( ) ( ( )) ( ) ( ) ( ) ( )

( )

j j

=

Trang 35

Trang 34

Khi đó:

2 1

q

k j

q

k j

Từ những công thức tính trên ta có thể tổng quát như sau:

Ü Nếu neuron j là nút xuất: δj =e n f u n j( ) ( ( ))jj ;

Ü Nếu neuron j là nút ẩn :

Tùy theo từng dạng hàm lan truyền ta có thể tính toán các giá trị điều chỉnh

trọng số cho từng trọng số tương ứng theo thuật học Back-propagation

Trang 36

Trang 35

TRÌNH TỰ CÁC BƯỚC THỰC HIỆN XÂY DỰNG MẠNG ANNs

Hình 2.19: Trình tự các bước thực hiện xây dựng mạng ANN

Lựa chọn mô hình: kỹ thuật học, hàm truyền, kiểu liên kết,…

Lựa chọn cấu trúc ANNs

Số lượng lớp ẩn Bộ trọng số ban đầu

(Theo tự động)

Số lượng neuron trong mỗi

lớp

Thiết lập thông số học: tốc

độ, sai số,…

Cung cấp tập mẫu dùng cho việc huấn luyện ANNs

Huấn luyện mạng

Chấp nhận sai số học?

Lựa chọn dữ liệu để kiểm tra

Sai số chấp nhận?

Ứng dụng vào thực tế

Thêmdữ liệu kiểm

tra này vào mẫu học

Đúng Sai

Sai

Đúng

Trang 37

Trang 36

2.2 Giới thiệu bảng câu hỏi

Bảng câu hỏi là một trong những phương pháp thường được dùng để khảo sát,

thu thập dữ liệu cho việc nghiên cứu Chính vì vậy, việc thiết kế bảng câu hỏi sẽ ảnh

hưởng rất đáng kể đến kết quả nghiên cứu; việc thiết kế bảng câu hỏi không tốt có

thể sẽ dẫn đến việc kết quả nghiên cứu bị sai lệch khác xa nhiều so với điều kiện

thực tế, đôi khi gây ra một hậu quả rất nghiêm trọng

Người nghiên cứu không nên áp đặt bất kỳ một ý kiến nào của riêng mình cho

người khác trả lời, mà phải cố gắng khích lệ người trả lời nói lên những suy nghĩ của

họ, bảng câu hỏi phải được thiết kế sao cho những người trả lời có quan tâm đến và

sẵn sàng chia sẻ thông tin, kết quả nghiên cứu với họ để khuyến khích họ trả lời một

cách tận tình và đầy đủ hơn

Bảng câu hỏi đòi hòi sự chính xác, rõ ràng, tránh tình trạng một câu được hiểu

theo nhiều nghĩa khác nhau đối với người trả lời để khỏi gây ra kết quả bị lệch lạc,

bóp méo Trong bảng câu hỏi mọi thứ phải được cấu trúc, người nghiên cứu ấn đinh

chính xác những câu trả lời là gì, người trả lời chỉ việc đánh dấu, khoanh tròn hay chỉ

định trong số những câu trả lời soạn sẵn có câu nào giống với ý kiến của họ nhất Vì

vậy, người nghiên cứu không thể thiết kế nên một bảng câu hỏi tốt nếu không biết

trước người trả lời suy nghĩ như thế nào Vì vậy, giai đoạn thí điểm ban đầu (hoặc là

những nghiên cứu trước đó) rất quan trọng, nếu không những hỏi đặt ra sẽ không phù

hợp và những câu trả lời có thể sẽ không ăn nhập gì với suy nghĩ của người trả lời

Ngoài ra, khi thiết kế bảng câu hỏi cần phải lưu ý những vấn đề sau:

X Cách tổ chức bảng câu hỏi: cách tổ chức có ảnh hưởng rất mạnh đến tỉ lệ trả lời

và tác động rất nhiều đến chất lượng thu thập thông tin (sự chính xác của các

câu trả lời)

X Cách sử dụng từ trong câu hỏi, cách đặt câu hỏi cũng có tác động rất mạnh đến

chất lượng thông tin

X Thang đo lường dùng trong câu hỏi, điều này ấn đinh dạng thông tin mà ta thu

thập

Các bước tiến hành xây dựng bảng câu hỏi:

X Nhận dạng các vấn đề cần khảo sát từ các nguồn thông tin: phỏng vấn các

chuyên gia trong ngành, kết quả của các nghiên cứu trước, tra cứu thông tin và

tài liệu tham khảo qua sách báo, phương tiện truyền thông, internet,…

X Lựa chọn hình thức câu hỏi và thang đo: với đề tài nghiên cứu này ta có thể

chọn thang đo năm (05) mức độ (five-scales)

(1) Không ảnh hưởng (2) Ảnh hưởng không đáng kể (3) Ảnh hưởng trung bình (4) Ảnh hưởng đáng kể (5) Ảnh hưởng rất đáng kể

X Xây dựng cấu trúc bảng câu hỏi, nội dung chủ yếu bám chặt theo các vấn đề

đã được nhận dạng ở bước trên

Trang 38

Trang 37

X Tiến hành khảo sát thử nghiệm: bước này nhằm để hoàn thiện bảng câu hỏi,

chỉnh sữa các sai sót, đồng thời thăm dò ý kiến phản hồi từ phía người trả lời

X Thu thập thông tin, hoàn thiện bảng câu hỏi, và tiến hành phát bảng câu hỏi để

thu thập số liệu nghiên cứu

2.2.1 Kích thước mẫu

Ta có thể tăng độ chính xác (giảm độ rộng của khoảng tin cậy) bằng cách đơn

giản là tăng kích thước mẫu, tuy nhiên độ chính xác chỉ tăng lên theo tỉ lệ với căn bậc

hai của kích thước mẫu Nói cách khác, chi phí lấy mẫu tăng lên với tốc độ nhanh gấp

nhiều lần so với tốc độ tăng của độ chính xác Một trường hợp nghiên cứu đã chứng

minh rằng, để giảm khoảng tin cậy đi một nửa, từ ± 20% xuống ± 10%, ta cần phải

tăng kích thước mẫu lên 4 lần, từ 196 mẫu lên 784 mẫu [29]

Ta có thể suy ra công thức tính toán kích thước mẫu như sau:

E

S Z

N = X

Trong đó:

N : kích thước mẫu;

X

S : độ lệch chuẩn của trị trung bình của mẫu

SX : độ lệch chuẩn của mẫu

E : sai số cho phép, khoảng tin cậy;

Z : giá trị của phân phối chuẩn được xác định theo hệ số tin cậy

Kích thước mẫu là hàm số phụ thuộc vào mức độ chấp nhận rủi ro (biểu thị

bằng giá trị Z), độ biến thiên của đám đông (ước lượng bằng độ lệch chuẩn) và

khoảng tin cậy (sai số cho phép)

Trên thực tế, việc tính toán kích thước mẫu phức tạp hơn nhiều so với công

thức Trước hết, ta thường không biết độ lệch chuẩn khi chưa thực sự bắt tay vào lấy

mẫu Nhưng lại cần biết độ lệch chuẩn đó để quyết định kích thước mẫu trước khi tiến

hành khảo sát Thông thường, giá trị độ lệch chuẩn được sử dụng trong công thức trên

chỉ là một con số phỏng đoán, đôi khi sử dụng từ các nghiên cứu trước đó, hoặc từ

nghiên cứu thí điểm, hay từ việc phỏng vấn thử nghiệm bảng câu hỏi Hoặc có khi ta

bắt đầu bằng một kích thước mẫu thử nghiệm, sau khi thu được một số dữ liệu, ta tính

độ lệch chuẩn của mẫu ấy, thế giá trị này vào công thức tính ra kích thước mẫu

Nhìn chung, còn khá nhiều vướng mắc trong công thức tính kích thước mẫu, cho

nên người ta ít sử dụng chúng nếu như mục tiêu dự án không đòi hỏi quá cao về độ

chính xác cho các thông số dự đoán

Ü Quy luật phỏng đoán cho thấy bằng kinh nghiệm rằng cần ít nhất 30

phần tử trong một mẫu để giá trị thống kê có ý nghĩa

Trang 39

Trang 38

Ü Theo Hoelter (1983), số lượng mẫu tới hạn là 200 mẫu

Ü Theo Bollen (1989), số lượng mẫu tối thiểu phải là 5 mẫu cho một tham

số cần ước lượng (tỷ lệ 5:1)

Thông thường, ta có thể xác đinh kích thước mẫu theo kiểu định tính Độ lớn

của mẫu tối đa là 1000, hoặc đơn giản hơn lấy 10% của đám đông, kích thước tối

thiểu của mẫu là 30, và tuỳ thuộc vào độ biến thiên của đám đông mà điều chỉnh cho

phù hợp Trong khoảng kích thước tối đa và tối thiểu đó, quyết định thường được suy

xét dựa vào ngân quỹ và thời gian

2.2.2 Kiểm định thang đo

Việc xây dựng và kiểm định thang đo có ý nghĩa rất quan trọng đến độ tin cậy

của các câu hỏi cũng như các kết quả phân tích sau này Kiểm định thang đo là chúng

ta kiểm tra xem các mục hỏi nào đã đóng góp vào việc đo lường một khái niêm lý

thuyết mà ta đang nghiên cứu, và những mục hỏi nào không Điều này liên quan đến

02 phép tính toán: tương quan giữa bản thân các mục hỏi và tương quan giữa các điểm

số của từng mục hỏi với điểm số toàn bộ các mục hỏi cho mỗi bảng câu hỏi

Hệ số Cronbach Alpha là một phép kiểm định thống kê về mức độ chặt chẽ mà

các mục hỏi trong thang đo tương quan với nhau, một trong những phương pháp kiểm

tra tính đơn khía cạnh của thang đo được gọi là kiểm định độ tin cậy chia đôi

Công thức tính hệ số Cronbach Alpha:

2

2 ) 1

(

* ) 1

i

S

S n

N : số lần đo;

Si2 : phương sai của lần đo thứ i;

St2 : phương sai của tổng các lần đo;

α : có giá trị 0<α<1; α càng lớn thì độ tin cậy càng cao

Theo qui ước, một tập hợp các mục hỏi dùng để đo lường được đánh giá tốt

phải có hệ số α >= 0.80 nhưng có giá trị nhỏ nhất chấp nhận được là 0.70 [30]

2.3 Giới thiệu về mô hình hồi quy (Regression model)

Hồi quy được dùng để xem xét mối liên hệ tuyến tính giữa biến phụ thuộc Y và

các biến độc lập X1, X2, …, Xn

Mục tiêu của phân tích hồi quy là mô hình hoá mối liên hệ, nghĩa là từ các dữ

liệu mẫu thu thập được ta cố gắng xây dựng mô hình toán học nhằm thể hiện một

cách tốt nhất mối liên hệ giữa Y và các biến độc lập X1, X2, …, Xn

Phân tích hồi quy là xác định sự liên quan định lượng giữa các biến ngẫu nhiên

Y và các biến độc lập X1, X2, …, Xn Kết quả của phân tích hồi quy được dùng cho dự

đoán

Trang 40

Trang 39

Mô hình hồi quy tuyến tính bội

Giả sử ta có biến Y phụ thuộc vào n biến độc lập X1, X2, …, Xn

Nếu giá trị của n biến độc lập X1, X2, …, Xn lần lượt là x1, x2, …, xn thì giá trị

của biến phụ thuộc yi*, thể hiện qua mô hình hồi quy bội tuyến tính có dạng như sau :

yi* = 0 + 1 x1i + 2 x2i + … + n xni + ε

Trong đó:

0, i (i = 1:n) : là các hằng số

0 : là giá trị ước lượng của biến y khi n biến X có giá trị bằng 0

i (i = 1:n) : là các tham số chưa biết, gọi là các hệ số hồi quy riêng phần

(Partial regression coefficients), thể hiện mức thay đổi của biến Y khi biến Xi thay

đổi một đơn vị

ε : là sai số, chính là biến độc lập ngẫu nhiên có phân phối chuẩn, với trung

bình bằng 0, phương sai không đổi σ2

Mô hình này cho rằng biến phụ thuộc có phân phối chuẩn với bất kỳ kết hợp

nào của các biến độc lập trong mô hình

Phương trình hồi quy tuyến tính bội của mẫu

Trong thực tế ta không thể xác định một cách chính xác các hệ số 0, i (i =

1:n) của phương trình hồi quy bội của tổng thể mà ta chỉ có thể ước lượng chúng từ

các giá trị quan sát của mẫu thu thập được, giả sử ta có n mẫu quan sát được (i = 1:n)

Phương pháp bình phương cực tiểu được dùng để ước lượng cho 0, i (i = 1:n)

bằng cách xác định các hệ số a, b1, b2, …, bn Ta có n phương trình:

yi* = 0 + b1 x1i + b2 x2i + … + bn xni Trước khi xác định mô hình hồi quy bội cần xây dựng ma trận tương quan giữa

biến phụ thuộc với từng biến độc lập cũng như giữa các biến độc lập với nhau để

kiểm tra các mối liên hệ này Đại lượng được dùng để lượng hoá mức độ chặt chẽ của

mối liên hệ tuyến tính giữa hai biến là hệ số tương quan r

Y X

N

i

i i

S S N

Y Y X X r

)1(

))(

Trong đó N là số quan sát, Sx,Sy là độ lệch chuẩn của từng biến X và Y

Trị tuyệt đối của r cho biết mức độ chặt chẽ của mối liên hệ tuyến tính, giá trị

này tiến gần đến 1 khi hai biến có mối liên hệ tuyến tính chặt chẽ và bằng 0 chỉ ra

rằng hai biến không có mối liên hệ tuyến tính, có 02 trường hợp: hoặc là hai biến này

không hệ có mối liên hệ, hoặc có thể có mối liên hệ chặt chẽ với nhau nhưng hệ số

tương quan vẫn sẽ nhỏ bằng 0 nếu như dạng của mối liên hệ này phi tuyến

Để kiểm định giả thuyết về sự tồn tại của mối liên hệ tuyến tính giữa Y và các

biến độc lập X1, X2, …, Xn, người ta sử dụng kiểm định F Ở đây ta xem biến phụ

Ngày đăng: 11/02/2021, 23:10

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w