Kết quả là, có nhiều nghiên cứu khác nhau đã được thực hiện để điều tra khả năng ứng dụng và điều chỉnh các phương thức tiếp cận thựcnghiệm hiện có để dự tính khả năng c
Trang 1LỜI CẢM ƠN
Luận văn được hoàn thành với sự hướng dẫn tận tình, chu đáo của thầy
TS Hoàng Nhật Đức Tôi xin bày tỏ sự biết ơn chân thành đến Quý thầy vàkhoa Sau đại học - Trường Đại học Duy Tân đã tạo điều kiện học tập, nghiêncứu tốt nhất cho tôi
Xin cảm ơn đến cơ quan, bạn bè đồng nghiệp, gia đình và những ngườithân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi để tôihoàn thành nhiệm vụ học tập
Đà Nẵng, ngày 18 tháng 6 năm 2018
Học viên
Lê Công Hải
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi và được sựhướng dẫn khoa học của TS Hoàng Nhật Đức Các nội dung nghiên cứu, kếtquả trong đề tài này là trung thực và chưa công bố dưới bất kỳ hình thức nàotrước đây Những số liệu trong các bảng biểu phục vụ cho việc phân tích,nhận xét, đánh giá được chính tác giả thu thập từ các nguồn khác nhau có ghi
rõ trong phần tài liệu tham khảo Ngoài ra, trong luận văn còn sử dụng một sốnhận xét, đánh giá cũng như số liệu của các tác giả khác, cơ quan tổ chứckhác đều có trích dẫn và chú thích nguồn gốc Nếu phát hiện có bất kỳ sự gianlận nào tôi xin hoàn toàn chịu trách nhiệm về nội dung luận văn của mình
Trang 3MỤC LỤC
Trang 4DANH MỤC HÌNH VẼ
DANH MỤC BẢNG
Bảng 2.1: Một số hàm truyền thông dụng
Bảng 1 : Mô tả thống kê các biến
Bảng 2 Kết quả tính toán MAPE
Bảng 3 Kết quả tính toán RMSE
Bảng 4: So sánh sai số kết quả
DANH MỤC BIỂU ĐỒ
Biểu đồ 3.1 Phân phối của các biến số
Biểu đồ 3.2 Phân phối của biến đầu ra
Biểu đồ 3.3 Tương quan giữa các biến số đầu vào
Biểu đồ 3.4 Kết quả tính toán MAPE
Biểu đồ 3.5 Kết quả tính toán RMSE
Biểu đồ 3.6 Biểu đồ thể hiện mức độ tương quan, kết quả tính toán sau 20 lầnchạy
Biểu đồ 3.7 Kết quả tính toán sau 20 lần chạy (So sánh giữa thí nghiệm và
mô phỏng)
Trang 5MỞ ĐẦU
1 MỤC TIÊU NGHIÊN CỨU VÀ TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Trong xây dựng, sợi gia cường polyme (FRP) ngày càng được sử dụngnhiều do có độ bền và độ cứng, tính chất cơ nhiệt tốt, khả năng chống ăn mòn,trọng lượng nhẹ, và độ bền vượt trội, tính ăn mòn của cốt thép là yếu tố quantrọng ảnh hưởng đến sự suy giảm và rút ngắn tuổi thọ của kết cấu bê tông cốtthép Cốt FRP thay thế cho cốt thép truyền thống trong kết cấu chịu lực đã tạođiều kiện để nâng cao năng suất của quá trình xây dựng, cải thiện hiệu suấtcủa kết cấu bê tông, giảm chi phí bảo dưỡng và có thể kéo dài thời gian hoạtđộng của kết cấu
Sàn phẵng làm việc hai phương là một trong những loại kết cấu phổ biếngiúp đơn giản hóa kết cấu, tiết kiệm không gian kiến trúc, giảm chiều cao xâydựng và chịu lực lớn Việc tính toán khả năng chịu chọc thủng tại các cột đỡlà mối quan tâm lớn trong quá trình thiết kế kết cấu này, các kết nối cột đỡdạng tấm dễ bị ảnh hưởng bởi lực cắt lớn và điều này làm mất khả năng chịulực Đặc biệt là khi cốt thép bị ăn mòn do độ ẩm và các yếu tố phá hủy kháctrong môi trường hoạt động, tình trạng mất khả năng chịu lực cắt có thể xảy ra
ở những kết nối dạng tấm này, theo đó, chúng có thể dẫn đến toàn bộ kết cấu
bị sụp đổ
Vì lý do như vậy, thanh định hình FRP gần đây được xem là sản phẩmthay thế hiệu quả cho các loại thép thanh truyền thống trong các tấm bê tôngphẳng và tấm bê tông có trụ đỡ, vấn đề này đã được nghiên cứu rộng rãi trongnhiều tài liệu Kết quả là, có nhiều nghiên cứu khác nhau đã được thực hiện
để điều tra khả năng ứng dụng và điều chỉnh các phương thức tiếp cận thựcnghiệm hiện có để dự tính khả năng chịu cắt của tấm bê tông cốt FRP
Các phương pháp bằng công thức cũng như thực nghiệm theo tiêu chuẩncủa viện bê tông Hoa kỳ (ACI 31.811), tiêu chuẩn Anh Quốc (BS-97)và mộtsố tác giả như El-Ghandour và các cộng sự, Matthys và Taerwe , tuy nhiên
Trang 6qua tìm hiểu của tác giả nhận thấy các phương pháp trên khi thực hiện trêncùng một bài toán thiết kế cho ra kết quả rất khác biệt nhau, các sai số lớn,mặt khác công thức có nhiều thông số gây khó khăn khi thực hiện thiết nhiềubài toán thiết kế khác nhau
Cần có một giải pháp ứng dụng bằng phần mền mấy tính giúp việc tínhtoán dễ dàng hơn và cho độ chính xác tin cậy, giải pháp trí tuệ nhân tạo, mạng
nơ ron nhân tạo có thể là một lựa chọn đúng đắn
Trong nghiên cứu này, tác giả nghiên cứu ứng dụng mạng nơ ron thầnkinh nhân tạo trong mô phỏng khả năng chịu cắt của sàn bê tông cốt sợi pô-li-
me gia cường Mô hình mạng nơ ron thần kinh nhân tạo được sử dụng nhằmnâng cao khả năng dự báo khả năng chịu cắt của sàn bê tông, từ đó giúp íchcho việc thiết kế các kết cấu sàn bê tông cốt sợi Polyme
2 PHẠM VI NGHIÊN CỨU
Thu thập và nghiên cứu các phương pháp tính toán khả năng chiụ cắt củatấm bê tông cốt sợi gia cường polyme bằng công thức cũng như thực nghiệm,và nghiên cứu một phương pháp mới là phương pháp “ứng dụng mạng nơ ronthần kinh nhân tạo” để lập mô hình dự báo khả năng chịu cắt các tấm bê tôngcốt sợi gia cường Polyme
3 KHÁI QUÁT VỀ PHƯƠNG PHÁP NGHIÊN CỨU
- Nghiên cứu lý thuyết tính toán và mô phỏng số trên phần mềm máytính,
- Phân tích công thức ước tính khả năng chịu chọc thủng của các tấm bêtông cốt FRP
- Thiết lập bộ dữ liệu thu thập về các thử nghiệm chịu uốn, cắt
- Xây dựng Mạng lưới nơ-ron nhân tạo (ANN)
- Xây dựng mô hình hồi quy đề xuất dựa trên cân bằng thích nghi sửdụng để dự đoán khả năng chọc thủng của các khối bê tông cốt FRP
- Viết lập trình ứng dụng bằng ngôn ngữ Matlab
-Áp dụng mạng ANN phân tích khả năng chụ cắt của tấm bê tông cốtsợi FRP trên số liệu cụ thể và kiểm chứng kết quả
Trang 74 BỐ CỤC CỦA LUẬN VĂN
Nội dung chính của luận văn được tổ chức thành 5 chương có nội dungđược mô tả như dưới đây
Mở đầu: Chương này giới thiệu tổng quan về đề tài, mục tiêu, phạm vivà phương pháp nghiên cứu của đề tài
Chương 1: Chương này trình bày về các phương pháp tính toán khả năngchiụ cắt của tấm bê tông cốt gia cường bằng vật liệu cốt sợi polyme bằngcông thức cũng như thực nghiệm theo tiêu chuẩn của viện bê tông Hoa kỳ(ACI), tiêu chuẩn Anh Quốc (BS) và một số tác giả khác, đưa ra nhận định kếtluận chương
Chương 2: Chương này trình bày những lý thuyết cơ bản về mạng ron nhân tạo Cung cấp một cách nhìn tổng quát nhất, và những vấn đề về quátrình huấn luyện mạng và thuật toán học của mạng nơ ron thần kinh nhân tạo,trình bày việc ứng dụng các thuật toán của mạng Nơ ron thần kinh nhân tạođược lập trình bằng ngôn ngữ Matlab để xây dựng mô hình huấn luyện môphỏng khả năng chịu cắt của tấm bê tông cốt FRP
nơ-Chương 3: Áp dụng mạng ANN phân tích dữ liệu về tấm bê tông cốtFRP, so sánh kết quả với các phương pháp khác để kiểm chứng kết quả
Kết luận: Tổng kết những kết quả đã đạt được của luận văn và hướng phát triển nghiên cứu tiếp theo
Trang 8CHƯƠNG I: TỔNG QUAN VỀ KẾT CẤU BÊ TÔNG GIA CƯỜNG BỞI
CỐT SỢI POLYME
1.1 Tấm bê tông cốt sợi gia cường polyme
Độ bền lâu dài của kết cấu bê tông cốt thép luôn là mối quan tâm lớntrong ngành xây dựng Một trong những yếu tố chính làm giảm độ bền và rútngắn tuổi thọ của các kết cấu bê tông cốt thép là tính ăn mòn của cốt thép Do
đó, việc sử dụng vật liệu cốt sợi gia cường Polyme (FRP) để thay thế théptrong các kết cấu bê tông cốt thép, đặc biệt hiệu quả khi sử dụng thiết kế cáctấm sàn chịu lực cắt chọc thủng lớn, tấm sàn các công trình ngầm, sàn mặtcầu vượt biển, các kết cấu sàn chịu lực lớn làm việc trong môi trường ăn mòncao…
Vật liệu FRP ngày càng được sử dụng trong xây dựng vì có ưu điểm là
tỷ lệ độ cứng-trọng lượng và độ bền-trọng lượng cao, có đặc tính cơ nhiệt tốt,chống ăn mòn, trọng lượng nhẹ và độ bền cao Việc ứng dụng vật liệu mớinày đã tạo cơ hội tăng hiệu quả xây dựng, tăng cường hiệu suất kết cấu, giảmchi phí bảo trì và kéo dài tuổi thọ của kết cấu Nhược điểm của nó là khó giacông uốn tạo hình do độ cứng lớn
Vật liệu FRP có sẵn ở nhiều dạng, chẳng hạn như thanh, lưới, tấm vàsợi cuộn Ngoài ra, các vật liệu này có thể được ứng dụng trong nhiều kết cấu,bao gồm dầm, cột, tấm và mặt cầu Các nghiên cứu tổng quát đã được tiếnhành để điều tra và nắm bắt hoạt động của các thành phần của tấm bê tông cốtFRP
Trang 9Hình 1.1: Sản phẩm từ cốt thép FRP (nguồn: Internet)
Khi thiết kế các tấm sàn bê tông phẳng có cột đỡ, chịu lực lớn cần xemxét tới khả năng chịu cắt của tấm bê tông này Trong nhiều thập kỷ qua, khảnăng chịu cắt của các tấm bê tông gia cố bằng thép thông thường đã đượcnghiên cứu kỹ lưỡng và một số mô hình thiết kế khác nhau đã được đề xuất(Elshafey và các cộng sự, 2011)
Trang 101.2 Một số công trình sữ dụng vật liệu bê tông cốt FRP
Hình 1.2: Sử dụng Bê tông cốt FRP thi công Gara đổ xe ở Canada
(nguồn: Internet)
Trang 11Hình 1.3: Sử dụng Bê tông cốt FRP thi công Cầu ở Canada (nguồn:
Internet)
Trang 12Hình 1.4 Thi công mặt Cầu bằng Bê tông cốt FRP (nguồn: Internet)
Trang 131.3 Các phương pháp tính toán cường độ chịu cắt của các khối bê tông cốt FRP dựa trên công thức.
1.3.1 Phân tích công thức ước tính khả năng chịu uốn, cắt của các tấm bê tông cốt FRP.
Khả năng kháng cắt của bê tông có ảnh hưởng đến khả năng chịu cắtcủa các tấm bê tông gia cường phẳng làm việc hai phương, các phương trìnhthiết kế hiện có đã áp dụng cho các phần bê tông gia cường bằng FRP cónguồn gốc từ các mẫu đã từng áp dụng trước đây cho các dạng bê tông cốtthép tương ứng, với những điều chỉnh nhất định nhằm cân nhắc việc thay thếthép bằng FRP Phần nội dung dưới đây sẽ xem xét các phương pháp dựa trêncông thức để dự đoán khả năng chịu lực cắt của các tấm bê tông được giacường bằng FRP; Hệ thống các đơn vị sử dụng trong tất cả các công thức làSI
1.3.1 Viện bê tông Hoa Kỳ, theo Tiêu chuẩn (ACI 31.811):
Công thức thiết kế giải thích việc truyền lực cắt trong các tấm bê tôngcốt FRP ở hai phương:
d b f
vi của vùng chịu cắt của tấm bê tông quanh gối tựa, cách mặt cột khoảng
cách d/2, và d là chiều cao vùng chịu cắt trung bình của tấm bê tông.
1.3.2 Tiêu chuẩn Anh (BS 8110-97):
Đề xuất một công thức tính khả năng chịu cắt cho tấm bê tông cốt FRP nhưsau:
Trang 14
d b
f d
s
3 / 1 4 / 1 3 /
25 ( )
400 ( ) 100 ( 79
1.3.3 Phương pháp El-Ghandour và các cộng sự:
Dựa trên cơ sở các thí nghiệm, El-Ghandour và các cộng sự đã đề xuất điềuchỉnh phương trình của ACI bằng cách nhân phương trình này với (E ^ / Es)1/3 để giải thích việc sử dụng các thanh FRP như dưới đây:
d b E
E f
s
f c
3 / 1 ' ( ) 33
0
=
Trong đó: Ef và Es tương ứng là mô đun tấm bê tông gia cường bằng tấm
FRP Young và mô đun cố thép Young
El-Ghandour và các cộng sự đã điều chỉnh phương trình thiết kế của
BS 8110-97 và đề xuất một công thức thay thế để có được cường độ chịu cắtcủa tấm bê tông gia cường bằng FRP như sau:
d b
f d
3 / 1 4 / 1 3 /
25 ( )
400 ( )) ( 8 1 100 ( 79
=
1.3.4 Phương pháp Matthys và Taerwe:
Matthys và Taerwe đưa ra phương trình cải tiến của BS 8110-97 như sau:
Trang 15d b d
f E
E
c s
f s
'
)
100 ( 36 1
ρ
=
Ospina và các cộng sự giới thiệu một dạng phương trình cải tiến do Matthysvà Taerwe đề xuất; Đối với dạng phương trình này, căn bậc ba của hệ số mô-đun được thay thế bằng căn bậc hai Công thức thiết kế này được trình bày
như dưới đây:
d b E
E f
s
f c
s
3 / 1 ' ) ( 77
=
1.3.5 Phương pháp của Tiểu Ban ACI440H:
Một phương trình thiết kế do tiểu ban ACI440H đề xuất bởi để thực hiện cáctính toán đối với các tấm bê tông cốt thép hai phương Phương trình này đãxem xét ảnh hưởng của độ cứng cường lực để giải thích cho việc truyền lực
cắt trong các tấm bê tông hai phương như sau:
c b f
Trong đó: k được xác định trong phương trình dưới đây:
f f f
f f
) ( 2
Đối với phương trình, cần lưu ý rằng ρf = Ef/Ec biểu thị tỷ lệ mô-đun và
Trang 161.4 Khảo sát kết quả các phương pháp tính toán cường độ chịu cắt của các khối bê tông cốt FRP dựa trên công thức
Sữ dụng các công thức mục 1.3 tính toán bài toán kiểm tra chọc thủng với cáctấm bê tông cốt FRP trên cột đỡ hình tròn, chữ nhật và vuông, so sánh với kếtquả thực nghiệm để đánh giá kết quả
Dữ liệu đầu vào của bài toán: (xem phụ lục 1)
Trang 17Kết quả tính toán lực cắt theo công thức: (xem phụ lục 2)
Để đánh giá kết quả dựa vào các thong số sai số căn quân phương (RMSE),sai số tuyệt đối trung bình (MAPE), và hệ số xác định (R2) đã được tính toán
Bảng kết quả khảo sát sai số tính toán
Ghandour và các cộng sự
El-(1999)
Ghandour và các cộng sự
El-(2000)
Mytthys và
Taerwe (2000)
Ospina và các cộng sự
(2003)
ACI 440H
RMSE 196.61 158.38 188.94 151.27 201.58 117.51 342.52 MAPE 28.88 28.02 28.86 17.07 24.13 15.48 56.02
Công thức do Ospina và các cộng sự đề xuất là phương pháp dựa trêncông thức hiệu quả nhất, RMSE, MAPE, và R2 trong phương pháp này tương
ứng là 117.51, 15.48 và 0,91, các công tức khác đều cho kết quả sai số tương
đối lớn và sự chênh kết quả giữa các công thức cũng lớn (10%-300%)
1.5 Kết luận chương: Nghiên cứu các ứng dụng của vật liệu cốt sợi Polyme,
kết cấu bê tông cốt sợi gia cường FRP, các phương pháp tính toán chịu cắttheo công thức theo các tiêu chuẩn quốc tế và một số tác giả nhà khoa họcnổi tiếng đề xuất Khảo sát sai số kết quả tính toán trên dữ liệu thựcnghiệm nhận thấy các phương pháp tính toán theo công thức cho ra kết quảkhác nhau, chênh lệch kết quả ở mức lớn và các sai số kết quả so với thựcnghiệm cũng rất lớn, gây khó khăn cho nhà thiết kế trong lựa chọn cáchtính cũng như nghiên cứu ứng xữ kết cấu, từ đó đặt ra yêu cầu nghiên cứu
Trang 18cách thức tiếp cận mới bằng trí tuệ nhân tạo, mạng nơ ron thần kinh nhântạo, cho kết quả nhanh chống, chính xác và tiện lợi là rất cần thiết.
CHƯƠNG II: MẠNG NƠ RON THẦN KINH NHÂN TẠO
2.1 Giới thiệu Mạng nơron thân kinh nhân tạo
2.1.1 Mạng nơron nhân tạo là gì?
Định nghĩa: Mạng nơron nhân tạo (Artificial Neural Network) gọi tắt là
mạng nơron là một mô hình xử lý thông tin phỏng theo cách thức xử lý thôngtin của các hệ nơron sinh học (Tran T-H, Hoang N-D, 2016)
Nó được tạo lên từ một số lượng lớn các phần tử (gọi là phần tử xử lý hay nơron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết)
làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó Một mạng nơron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhận
dạng mẫu, phân loại dữ liệu, ) thông qua một quá trình học từ tập các mẫu
huấn luyện.Về bản chất học chính là quá trình hiệu chỉnh trọng số liên kếtgiữa các nơron
Trang 19Hình 2.1: Một mạng nơ-ron là một nhóm các nút nối với nhau, tương tự mạng các nơ-ron trong não người (nguồn: Internet).
2.1.2 Lịch sử phát triển mạng nơron
Những nghiên cứu về bộ não của con người đã được tiến hành từ rất lâuvà những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hìnhhóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suynghĩ đã trở thành hiện thực Nathanial Rochester sau nhiều năm làm việc tạicác phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để môphỏng một mạng nơron Trong thời kì này tính toán truyền thống đã đạt đượcnhững thành công rực rỡ trong khi đó những nghiên cứu về nơron còn ở giaiđoạn sơ khai Mặc dù vậy những người ủng hộ triết lý “thinking machines”(các máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình
Hình 2.2: Nơron than kinh não người(nguồn: Internet).
Trang 20Hình 2.3: Mô phỏng mạng nơron thần kinh não người(nguồn: Internet).
Hình 2 4: Sơ đồ tổ chức hệ mạng nơ ron thần kinh nhân tạo
Dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence)vào năm 1956 đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhântạo lẫn mạng nơron Tác động tích cực của nó là thúc đẩy hơn nữa sự quantâm của các nhà khoa học về trí tuệ nhân tạo và quá trình xử lý ở mức đơngiản của mạng nơron trong bộ não con người
MẠNG NƠ RON NHÂN TẠO
Truyền thẳng
Nhiều
lớp
ART Hop
-fiel d
Ánh xạ đặc trưng
Brain stare – in Box
Máy Boltz -mam
Một lớp
Cobeth Gross - berg
Cobeth Gross - berg
Trang 21Những năm tiếp theo nhà sinh học chuyên nghiên cứu về nơron Frank
Rosenblatt cũng bắt đầu nghiên cứu về Perceptron, sau thời gian nghiên cứu
này Perceptron đã được cài đặt trong phần cứng máy tính và được xem như làmạng nơron lâu đời nhất còn được sử dụng đến ngày nay Perceptron mộttầng rất hữu ích trong việc phân loại một tập các đầu vào có giá trị liên tụcvào một trong hai lớp, Perceptron tính tổng có trọng số các đầu vào, rồi trừtổng này cho một ngưỡng và cho ra một trong hai giá trị mong muốn có thể.Tuy nhiên Perceptron còn rất nhiều hạn chế, những hạn chế này đã được chỉ
ra trong cuốn sách về Perceptron của Marvin Minsky và Seymour Papert viếtnăm 1969
Năm 1974 Paul Werbos đã phát triển và ứng dụng phương pháp học lantruyền ngược (back-propagation) Tuy nhiên phải mất một vài năm thì phươngpháp này mới trở lên phổ biến Các mạng lan truyền ngược được biết đếnnhiều nhất và được áp dụng rộng dãi nhất nhất cho đến ngày nay
Thật không may, những thành công ban đầu này khiến cho con ngườinghĩ quá lên về khả năng của các mạng nơron Chính sự cường điệu quá mức
đã có những tác động không tốt đến sự phát triển của khoa học và kỹ thuậtthời bấy giờ khi người ta lo sợ rằng đã đến lúc máy móc có thể làm mọi việccủa con người Những lo lắng này khiến người ta bắt đầu phản đối các nghiêncứu về mạng neuron, thời kì tạm lắng này kéo dài đến năm 1981
Năm 1982 trong bài báo gửi tới viện khoa học quốc gia, John Hopfieldbằng sự phân tích toán học rõ ràng, mạch lạc, ông đã chỉ ra cách thức cácmạng nơron làm việc và những công việc chúng có thể thực hiện được Cốnghiến của Hopfield không chỉ ở giá trị của những nghiên cứu khoa học mà còn
ở sự thúc đẩy trở lại các nghiên cứu về mạng neuron
Trang 22Cũng trong thời gian này, một hội nghị với sự tham gia của Hoa Kỳ vàNhật Bản bàn về việc hợp tác/cạnh tranh trong lĩnh vực mạng nơron đã được
tổ chức tại Kyoto, Nhật Bản Sau hội nghị, Nhật Bản đã công bố những nỗ lựccủa họ trong việc tạo ra máy tính thế hệ thứ 5 Tiếp nhận điều đó, các tạp chíđịnh kỳ của Hoa Kỳ bày tỏ sự lo lắng rằng nước nhà có thể bị tụt hậu tronglĩnh vực này Vì thế, ngay sau đó, Hoa Kỳ nhanh chóng huy động quĩ tài trợcho các nghiên cứu và ứng dụng mạng neuron
Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức các cuộc họp hàng nămvề mạng neuron ứng dụng trong tin học (Neural Networks for Computing) Ngày nay, không chỉ dừng lại ở mức nghiên cứu lý thuyết, các nghiêncứu ứng dụng mạng nơron để giải quyết các bài toán thực tế được diễn ra ởkhắp mọi nơi Các ứng dụng mạng nơron ra đời ngày càng nhiều và ngàycàng hoàn thiện hơn Điển hình là các ứng dụng: xử lý ngôn ngữ (LanguageProcessing), nhận dạng kí tự (Character Recognition), nhận dạng tiếng nói(Voice Recognition), nhận dạng mẫu (Pattern Recognition), xử lý tín hiệu(Signal Processing), Lọc dữ liệu (Data Filtering)
2.1.3 So sánh mạng nơron với máy tính truyền thống
Mạng nơron có cách giải quyết các vấn đề khác so với máy tính truyềnthống Các máy tính truyền thống sử dụng cách tiếp cận theo hướng giải thuật,tức là máy tính thực hiện một tập các chỉ lệnh để giải quyết một vấn đề Vấnđề được giải quyết phải được biết và phát biểu dưới dạng một tập chỉ lệnhkhông nhập nhằng Những chỉ lệnh này sau đó phải được chuyển sang mộtchương trình ngôn ngữ bậc cao và chuyển sang mã máy để máy tính có thểhiểu được
Trừ khi các bước cụ thể mà máy tính cần tuân theo được chỉ ra rõ ràng,máy tính sẽ không làm được gì cả Điều đó giới hạn khả năng của các máytính truyền thống ở phạm vi giải quyết các vấn đề mà chúng ta đã hiểu và biết
Trang 23chính xác cách thực hiện Các máy tính sẽ trở lên hữu ích hơn nếu chúng cóthể thực hiện được những việc mà bản thân con người không biết chính xác làphải làm như thế nào
Mạng nơron xử lý thông tin theo cách thức giống như bộ não conngười Mạng được tạo nên từ một số lượng lớn các phần tử xử lý được kết nốivới nhau làm việc song song để giải quyết một vấn đề cụ thể Các mạng nơronhọc theo mô hình, chúng không thể được lập trình để thực hiện một nhiệm vụ
cụ thể Các mẫu phải được chọn lựa cẩn thận nếu không sẽ rất mất thời gian,thậm chí mạng sẽ hoạt động không đúng Điều hạn chế này là bởi vì mạng tựtìm ra cách giải quyết vấn đề, thao tác của nó không thể dự đoán được
Các mạng nơron và các máy tính truyền thống không cạnh tranh nhaumà bổ sung cho nhau Có những nhiệm vụ thích hợp hơn với máy tính truyềnthống, ngược lại có những nhiệm vụ lại thích hợp hơn với các mạng nơron.Thậm chí rất nhiều nhiệm vụ đòi hỏi các hệ thống sử dụng tổ hợp cả hai cáchtiếp cận để thực hiện được hiệu quả cao nhất (thông thường một máy tínhtruyền thống được sử dụng để giám sát mạng nơron)
2.1.4 Nơron sinh học và nơron nhân tạo
2.1.4.1 Nơron sinh học
Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não conngười bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên cácđường truyền Mỗi đường truyền này dài khoảng hơn một mét Các nơron cónhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn cónhững khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử
lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đườngnày tạo nên hệ thống giao tiếp của bộ não
Trang 24Hình 2.5: Cấu trúc của một nơron sinh học điển hình.
Mỗi nơron sinh học có 3 thành phần cơ bản:
• Các nhánh vào hình cây ( dendrites)
• Thân tế bào (cell body)
• Sợi trục ra (axon)
Các nhánh hình cây truyền tín hiệu vào đến thân tế bào Thân tế bàotổng hợp và xử lý cho tín hiệu đi ra Sợi trục truyền tín hiệu ra từ thân tế bàonày sang nơron khác Điểm liên kết giữa sợi trục của nơron này với nhánh
hình cây của nơron khác gọi là synapse Liên kết giữa các nơron và độ nhạy
của mỗi synapse được xác định bởi quá trình hóa học phức tạp Một số cấutrúc của nơron được xác định trước lúc sinh ra Một số cấu trúc được pháttriển thông qua quá trình học Trong cuộc đời cá thể, một số liên kết mới đượchình thành, một số khác bị hủy bỏ
Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu
đầu vào, xử lý các tín hiệu này và cho ra một tín hiệu output Tín hiệu output
này sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác
Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơronnhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não
Trang 252.1.4.2 Nơron nhân tạo
Một nơron là một đơn vị xử lý thông tin và là thành phần cơ bản củamột mạng nơron Cấu trúc của một nơron được mô tả trên hình dưới
Hình 2.6: Nơron nhân tạo
Các thành phần cơ bản của một nơron nhân tạo bao gồm:
♦ Tập các đầu vào: Là các tín hiệu vào (input signals) của nơron, các
tín hiệu này thường được đưa vào dưới dạng một vector N chiều
♦ Tập các liên kết: Mỗi liên kết được thể hiện bởi một trọng số (gọi là
trọng số liên kết – Synaptic weight) Trọng số liên kết giữa tín hiệu vào thứ j với nơron k thường được kí hiệu là wkj Thông thường, các trọng số này được
khởi tạo một cách ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhậtliên tục trong quá trình học mạng
♦ Bộ tổng (Summing function): Thường dùng để tính tổng của tích các
đầu vào với trọng số liên kết của nó
♦ Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được
đưa vào như một thành phần của hàm truyền
♦ Hàm truyền (Transfer function) : Hàm này được dùng để giới hạn
phạm vi đầu ra của mỗi nơron Nó nhận đầu vào là kết quả của hàm tổng vàngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi nơron được giới hạntrong đoạn [0,1] hoặc [-1, 1] Các hàm truyền rất đa dạng, có thể là các hàmtuyến tính hoặc phi tuyến Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng
Trang 26bài toán và kinh nghiệm của người thiết kế mạng Một số hàm truyền thường
sử dụng trong các mô hình mạng nơron được đưa ra trong bảng 2.1
♦ Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa
là một đầu ra
Trong đó: x1, x2, , xp: là các tín hiệu vào; (wk1, wk2, , wkp) là các trọng số liên kết của nơron thứ k; uk là hàm tổng; bk là một ngưỡng; f là hàm truyền và yk là tín hiệu đầu ra của nơron
Như vậy tương tự như nơron sinh học, nơron nhân tạo cũng nhận cáctín hiệu đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổngcác tích thu được rồi gửi kết quả tới hàm truyền), và cho một tín hiệu đầu ra(là kết quả của hàm truyền)
Bảng 2.1: Một số hàm truyền thông dụng
Trang 27Saturating Linear
1
x x
e
f x
e
-
-=+
2.1.4.3 Mô hình mạng nơron
Mặc dù mỗi nơron đơn lẻ có thể thực hiện những chức năng xử lýthông tin nhất định, sức mạnh của tính toán nơron chủ yếu có được nhờ sự kếthợp các nơron trong một kiến trúc thống nhất Một mạng nơron là một môhình tính toán được xác định qua các tham số: kiểu nơron (như là các nút nếu
ta coi cả mạng nơron là một đồ thị), kiến trúc kết nối (sự tổ chức kết nối giữacác nơron) và thuật toán học (thuật toán dùng để học cho mạng)
Về bản chất một mạng nơron có chức năng như là một hàm ánh xạ F: X
→ Y, trong đó X là không gian trạng thái đầu vào (input state space) và Y là không gian trạng thái đầu ra (output state space) của mạng Các mạng chỉ đơn
giản là làm nhiệm vụ ánh xạ các vector đầu vào x ∈ X sang các vector đầu ra
y ∈ Y thông qua “bộ lọc” (filter) các trọng số Tức là y = F(x) = s(W, x), trong
đó W là ma trận trọng số liên kết Hoạt động của mạng thường là các tính toánsố thực trên các ma trận
a Các kiểu mô hình mạng nơron
Cách thức kết nối các nơron trong mạng xác định kiến trúc (topology) của mạng Các nơron trong mạng có thể kết nối đầy đủ (fully connected) tức
Trang 28là mỗi nơron đều được kết nối với tất cả các nơron khác, hoặc kết nối cục bộ
(partially connected) chẳng hạn chỉ kết nối giữa các nơron trong các tầng
khác nhau Người ta chia ra hai loại kiến trúc mạng chính:
♦ Tự kết hợp (autoassociative): là mạng có các nơron đầu vào cũng là
các nơron đầu ra Mạng Hopfield là một kiểu mạng tự kết hợp
Hình2.7: Mạng tự kết hợp
♦ Kết hợp khác kiểu (heteroassociative): là mạng có tập nơron đầu vào
và đầu ra riêng biệt Perceptron, các mạng Perceptron nhiều tầng (MLP:MultiLayer Perceptron), mạng Kohonen, … thuộc loại này
Hình 2.8: Mạng kết hợp khác kiểu
Ngoài ra tùy thuộc vào mạng có các kết nối ngược (feedback
connections) từ các nơron đầu ra tới các nơron đầu vào hay không, người ta
chia ra làm 2 loại kiến trúc mạng
Trang 29♦ Kiến trúc truyền thẳng (feedforward architechture): là kiểu kiến trúc
mạng không có các kết nối ngược trở lại từ các nơron đầu ra về các nơron đầuvào; mạng không lưu lại các giá trị output trước và các trạng thái kích hoạtcủa nơron Các mạng nơron truyền thẳng cho phép tín hiệu di chuyển theomột đường duy nhất; từ đầu vào tới đầu ra, đầu ra của một tầng bất kì sẽkhông ảnh hưởng tới tầng đó Các mạng kiểu Perceptron là mạng truyềnthẳng
Hình 2.9: Mạng truyền thẳng
♦ Kiến trúc phản hồi (Feedback architecture): là kiểu kiến trúc mạng có
các kết nối từ nơron đầu ra tới nơron đầu vào Mạng lưu lại các trạng tháitrước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vàomà còn phụ thuộc vào các trạng thái trước đó của mạng Mạng Hopfield thuộcloại này
Trang 30Hình 2.10: Mạng phản hồi
b Perceptron
Perceptron là mạng nơron đơn giản nhất, nó chỉ gồm một nơron, nhậnđầu vào là vector có các thành phần là các số thực và đầu ra là một trong haigiá trị +1 hoặc -1
Hình 2.11: Perceptron
Đầu ra của mạng được xác định như sau: mạng lấy tổng có trọng số cácthành phần của vector đầu vào, kết quả này cùng ngưỡng b được đưa vào hàmtruyền (Perceptron dùng hàm Hard-limit làm hàm truyền) và kết quả của hàmtruyền sẽ là đầu ra của mạng
Perceptron cho phép phân loại chính xác trong trường hợp dữ liệu cóthể phân chia tuyến tính (các mẫu nằm trên hai mặt đối diện của một siêuphẳng) Nó cũng phân loại đúng đầu ra các hàm AND, OR và các hàm có
Trang 31dạng đúng khi n trong m đầu vào của nó đúng (n ≤ m) Nó không thể phânloại được đầu ra của hàm XOR
c Mạng nhiều tầng truyền thẳng (MLP)
Mô hình mạng nơron được sử dụng rộng rãi nhất là mô hình mạngnhiều tầng truyền thẳng (MLP: Multi Layer Perceptron) Một mạng MLP tổngquát là mạng có n (n≥2) tầng (thông thường tầng đầu vào không được tínhđến): trong đó gồm một tầng đầu ra (tầng thứ n) và (n-1) tầng ẩn
Hình 2.12: Mạng MLP tổng quát
Kiến trúc của một mạng MLP tổng quát có thể mô tả như sau:
♦ Đầu vào là các vector (x1, x2, , xp) trong không gian p chiều, đầu ralà các vector (y1, y2, , yq) trong không gian q chiều Đối với các bài toánphân loại, p chính là kích thước của mẫu đầu vào, q chính là số lớp cần phânloại Xét ví dụ trong bài toán nhận dạng chữ số: với mỗi mẫu ta lưu tọa độ(x,y) của 8 điểm trên chữ số đó, và nhiệm vụ của mạng là phân loại các mẫunày vào một trong 10 lớp tương ứng với 10 chữ số 0, 1, …, 9 Khi đó p là kíchthước mẫu và bằng 8 x 2 = 16; q là số lớp và bằng 10
♦ Mỗi nơron thuộc tầng sau liên kết với tất cả các nơron thuộc tầng liềntrước nó
Trang 32♦ Đầu ra của nơron tầng trước là đầu vào của nơron thuộc tầng liền sau
nó
Hoạt động của mạng MLP như sau: tại tầng đầu vào các nơron nhận tínhiệu vào xử lý (tính tổng trọng số, gửi tới hàm truyền) rồi cho ra kết quả (làkết quả của hàm truyền); kết quả này sẽ được truyền tới các nơron thuộc tầng
ẩn thứ nhất; các nơron tại đây tiếp nhận như là tín hiệu đầu vào, xử lý và gửikết quả đến tầng ẩn thứ 2;…; quá trình tiếp tục cho đến khi các nơron thuộctầng ra cho kết quả
Một số kết quả đã được chứng minh:
♦ Bất kì một hàm Boolean nào cũng có thể biểu diễn được bởi một mạngMLP 2 tầng trong đó các nơron sử dụng hàm truyền sigmoid
♦ Tất cả các hàm liên tục đều có thể xấp xỉ bởi một mạng MLP 2 tầng sửdụng hàm truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính chocác nơron tầng ra với sai số nhỏ tùy ý
♦ Mọi hàm bất kỳ đều có thể xấp xỉ bởi một mạng MLP 3 tầng sử dụnghàm truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính cho cácnơron tầng ra
2.2 HUẤN LUYỆN VÀ XÂY DỰNG MẠNG NƠRON
2.2.1 Các phương pháp học
Khái niệm: Học là quá trình thay đổi hành vi của các vật theo một cách
nào đó làm cho chúng có thể thực hiện tốt hơn trong tương lai
Một mạng nơron được huyấn luyện sao cho với một tập các vector đầuvào X, mạng có khả năng tạo ra tập các vector đầu ra mong muốn Y của nó.Tập X được sử dụng cho huấn luyện mạng được gọi là tập huấn luyện
(training set) Các phần tử x thuộc X được gọi là các mẫu huấn luyện
Trang 33(training example) Quá trình huấn luyện bản chất là sự thay đổi các trọng số
liên kết của mạng Trong quá trình này, các trọng số của mạng sẽ hội tụ dầntới các giá trị sao cho với mỗi vector đầu vào x từ tập huấn luyện, mạng sẽcho ra vector đầu ra y như mong muốn
Có ba phương pháp học phổ biến là học có giám sát (supervised
learning), học không giám sát (unsupervised learning) và học tăng cường
(Reinforcement learning):
♦ Học có giám sát:
Hình 2.13: Mô hình huấn luyện mạng có giám sát
Là quá trình học có sự tham gia giám sát của một “thầy giáo” Cũnggiống như việc ta dạy một em nhỏ các chữ số Ta đưa ra một số “1” và bảovới em đó rằng đây là số “1” Việc này được thực hiện trên tất cả các mẫu chữcái Sau đó khi kiểm tra ta sẽ đưa ra một chữ số bất kì (có thể viết hơi khác đi)và hỏi em đó đây là chữ gì?
Với học có giám sát, tập mẫu huấn luyện được cho dưới dạng D = {(x,t) |(x,t) ∈ [IRN x RK]}, trong đó: x = (x1, x2, , xN) là vector đặc trưng N chiềucủa mẫu huấn luyện và t = (t1, t2, , tK) là vector mục tiêu K chiều tương
Trang 34ứng, nhiệm vụ của thuật toán là phải thiết lập được một cách tính toán trênmạng như thế nào đó để sao cho với mỗi vector đặc trưng đầu vào thì sai sốgiữa giá trị đầu ra thực sự của mạng và giá trị mục tiêu tương ứng là nhỏ nhất.Chẳng hạn mạng có thể học để xấp xỉ một hàm t = f(x) biểu diễn mối quan hệtrên tập các mẫu huấn luyện (x, t)
Như vậy với học có giám sát, số lớp cần phân loại đã được biết trước.Nhiệm vụ của thuật toán là phải xác định được một cách thức phân lớp saocho với mỗi vector đầu vào sẽ được phân loại chính xác vào lớp của nó
Học có giám sát trong các mạng nơron
Học có giám sát có thể được xem như việc xấp xỉ một ánh xạ: X→ Y,trong đó X là tập các vấn đề và Y là tập các lời giải tương ứng cho vấn đề đó.Các mẫu (x, y) với x = (x1, x2, , xn) X, y = (yl, y2, , ym)∈Y được chotrước Học có giám sát trong các mạng nơron thường được thực hiện theo cácbước sau:
♦ Bước 1: Xây dựng cấu trúc thích hợp cho mạng nơron, chẳng hạn có
(n + 1) nơron vào (n nơron cho biến vào và 1 nơron cho ngưỡng x0), m nơronđầu ra, và khởi tạo các trọng số liên kết của mạng
♦ Bước 2: Đưa một vector x trong tập mẫu huấn luyện X vào mạng
♦ Bước 3: Tính vector đầu ra o của mạng
♦ Bước 4: So sánh vector đầu ra mong muốn y (là kết quả được cho
trong tập huấn luyện) với vector đầu ra o do mạng tạo ra; nếu có thể thì đánhgiá lỗi
♦ Bước 5: Hiệu chỉnh các trọng số liên kết theo một cách nào đó sao cho
ở lần tiếp theo khi đưa vector x vào mạng, vector đầu ra o sẽ giống với y hơn
♦ Bước 6: Nếu cần, lặp lại các bước từ 2 đến 5 cho tới khi mạng đạt tới
trạng thái hội tụ Việc đánh giá lỗi có thể thực hiện theo nhiều cách, cách
Trang 35dùng nhiều nhất là sử dụng lỗi tức thời: Err = (o - y), hoặc Err = |o - y|; lỗi trung bình bình phương (MSE: mean-square error): Err = (o- y)2/2;
Có hai loại lỗi trong đánh giá một mạng nơron Thứ nhất, gọi là lỗi rõ
ràng (apparent error), đánh giá khả năng xấp xỉ các mẫu huấn luyện của một mạng đã được huấn luyện Thứ hai, gọi là lỗi kiểm tra (test error), đánh giá
khả năng tổng quá hóa của một mạng đã được huấn luyện, tức khả năng phảnứng với các vector đầu vào mới Để đánh giá lỗi kiểm tra chúng ta phải biếtđầu ra mong muốn cho các mẫu kiểm tra
Thuật toán tổng quát ở trên cho học có giám sát trong các mạng nơron cónhiều cài đặt khác nhau, sự khác nhau chủ yếu là cách các trọng số liên kếtđược thay đổi trong suốt thời gian học Trong đó tiêu biểu nhất là thuật toánlan truyền ngược
2.2.2 Thuật toán lan truyền ngược
Ta sử dụng một số kí hiệu sau:
- j: nơron thứ j (hay nút thứ j)
- Xj: vector đầu vào của nút thứ j
- Wj: vector trọng số của nút thứ j
- x ji: đầu vào của nút thứ j từ nút thứ i
- w ji: trọng số trên xji
- b j: ngưỡng tại nút thứ j
- o j: đầu ra của nút thứ j
- t j: đầu ra mong muốn của nút thứ j
Trang 36- Downstream(j): Tập tất cả các nút nhận đầu ra của nút thứ j làm mộtgiá trị đầu vào
- η: tốc độ học
- f: hàm truyền với f(x) = 1 / (1 + e -x )
Thuật toán lan truyền ngược được mô tả như sau:
Bước 1: Khởi tạo trọng số bởi các giá trị ngẫu nhiên nhỏ
Bước 2: Lặp lại cho tới khi thỏa mãn điều kiện kết thúc
Với mỗi mẫu, thực hiện các bước sau:
2.1 Tính đầu ra o j cho mỗi nút j: