Phân tích công thức ước tính khả năng chịu chọc thủng của các tấm bê tông cốt FRP

Kết quả là, có nhiều nghiên cứu khác nhau đã được thực hiện để điều tra khả năng ứng dụng và điều chỉnh các phương thức tiếp cận thựcnghiệm hiện có để dự tính khả năng c

Trang 1

LỜI CẢM ƠN

Luận văn được hoàn thành với sự hướng dẫn tận tình, chu đáo của thầy

TS Hoàng Nhật Đức Tôi xin bày tỏ sự biết ơn chân thành đến Quý thầy vàkhoa Sau đại học - Trường Đại học Duy Tân đã tạo điều kiện học tập, nghiêncứu tốt nhất cho tôi

Xin cảm ơn đến cơ quan, bạn bè đồng nghiệp, gia đình và những ngườithân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi để tôihoàn thành nhiệm vụ học tập

Đà Nẵng, ngày 18 tháng 6 năm 2018

Học viên

Lê Công Hải

Trang 2

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi và được sựhướng dẫn khoa học của TS Hoàng Nhật Đức Các nội dung nghiên cứu, kếtquả trong đề tài này là trung thực và chưa công bố dưới bất kỳ hình thức nàotrước đây Những số liệu trong các bảng biểu phục vụ cho việc phân tích,nhận xét, đánh giá được chính tác giả thu thập từ các nguồn khác nhau có ghi

rõ trong phần tài liệu tham khảo Ngoài ra, trong luận văn còn sử dụng một sốnhận xét, đánh giá cũng như số liệu của các tác giả khác, cơ quan tổ chứckhác đều có trích dẫn và chú thích nguồn gốc Nếu phát hiện có bất kỳ sự gianlận nào tôi xin hoàn toàn chịu trách nhiệm về nội dung luận văn của mình

Trang 3

MỤC LỤC

Trang 4

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG

Bảng 2.1: Một số hàm truyền thông dụng

Bảng 1 : Mô tả thống kê các biến

Bảng 2 Kết quả tính toán MAPE

Bảng 3 Kết quả tính toán RMSE

Bảng 4: So sánh sai số kết quả

DANH MỤC BIỂU ĐỒ

Biểu đồ 3.1 Phân phối của các biến số

Biểu đồ 3.2 Phân phối của biến đầu ra

Biểu đồ 3.3 Tương quan giữa các biến số đầu vào

Biểu đồ 3.4 Kết quả tính toán MAPE

Biểu đồ 3.5 Kết quả tính toán RMSE

Biểu đồ 3.6 Biểu đồ thể hiện mức độ tương quan, kết quả tính toán sau 20 lầnchạy

Biểu đồ 3.7 Kết quả tính toán sau 20 lần chạy (So sánh giữa thí nghiệm và

mô phỏng)

Trang 5

MỞ ĐẦU

1 MỤC TIÊU NGHIÊN CỨU VÀ TÍNH CẤP THIẾT CỦA ĐỀ TÀI

Trong xây dựng, sợi gia cường polyme (FRP) ngày càng được sử dụngnhiều do có độ bền và độ cứng, tính chất cơ nhiệt tốt, khả năng chống ăn mòn,trọng lượng nhẹ, và độ bền vượt trội, tính ăn mòn của cốt thép là yếu tố quantrọng ảnh hưởng đến sự suy giảm và rút ngắn tuổi thọ của kết cấu bê tông cốtthép Cốt FRP thay thế cho cốt thép truyền thống trong kết cấu chịu lực đã tạođiều kiện để nâng cao năng suất của quá trình xây dựng, cải thiện hiệu suấtcủa kết cấu bê tông, giảm chi phí bảo dưỡng và có thể kéo dài thời gian hoạtđộng của kết cấu

Sàn phẵng làm việc hai phương là một trong những loại kết cấu phổ biếngiúp đơn giản hóa kết cấu, tiết kiệm không gian kiến trúc, giảm chiều cao xâydựng và chịu lực lớn Việc tính toán khả năng chịu chọc thủng tại các cột đỡlà mối quan tâm lớn trong quá trình thiết kế kết cấu này, các kết nối cột đỡdạng tấm dễ bị ảnh hưởng bởi lực cắt lớn và điều này làm mất khả năng chịulực Đặc biệt là khi cốt thép bị ăn mòn do độ ẩm và các yếu tố phá hủy kháctrong môi trường hoạt động, tình trạng mất khả năng chịu lực cắt có thể xảy ra

ở những kết nối dạng tấm này, theo đó, chúng có thể dẫn đến toàn bộ kết cấu

bị sụp đổ

Vì lý do như vậy, thanh định hình FRP gần đây được xem là sản phẩmthay thế hiệu quả cho các loại thép thanh truyền thống trong các tấm bê tôngphẳng và tấm bê tông có trụ đỡ, vấn đề này đã được nghiên cứu rộng rãi trongnhiều tài liệu Kết quả là, có nhiều nghiên cứu khác nhau đã được thực hiện

để điều tra khả năng ứng dụng và điều chỉnh các phương thức tiếp cận thựcnghiệm hiện có để dự tính khả năng chịu cắt của tấm bê tông cốt FRP

Các phương pháp bằng công thức cũng như thực nghiệm theo tiêu chuẩncủa viện bê tông Hoa kỳ (ACI 31.811), tiêu chuẩn Anh Quốc (BS-97)và mộtsố tác giả như El-Ghandour và các cộng sự, Matthys và Taerwe , tuy nhiên

Trang 6

qua tìm hiểu của tác giả nhận thấy các phương pháp trên khi thực hiện trêncùng một bài toán thiết kế cho ra kết quả rất khác biệt nhau, các sai số lớn,mặt khác công thức có nhiều thông số gây khó khăn khi thực hiện thiết nhiềubài toán thiết kế khác nhau

Cần có một giải pháp ứng dụng bằng phần mền mấy tính giúp việc tínhtoán dễ dàng hơn và cho độ chính xác tin cậy, giải pháp trí tuệ nhân tạo, mạng

nơ ron nhân tạo có thể là một lựa chọn đúng đắn

Trong nghiên cứu này, tác giả nghiên cứu ứng dụng mạng nơ ron thầnkinh nhân tạo trong mô phỏng khả năng chịu cắt của sàn bê tông cốt sợi pô-li-

me gia cường Mô hình mạng nơ ron thần kinh nhân tạo được sử dụng nhằmnâng cao khả năng dự báo khả năng chịu cắt của sàn bê tông, từ đó giúp íchcho việc thiết kế các kết cấu sàn bê tông cốt sợi Polyme

2 PHẠM VI NGHIÊN CỨU

Thu thập và nghiên cứu các phương pháp tính toán khả năng chiụ cắt củatấm bê tông cốt sợi gia cường polyme bằng công thức cũng như thực nghiệm,và nghiên cứu một phương pháp mới là phương pháp “ứng dụng mạng nơ ronthần kinh nhân tạo” để lập mô hình dự báo khả năng chịu cắt các tấm bê tôngcốt sợi gia cường Polyme

3 KHÁI QUÁT VỀ PHƯƠNG PHÁP NGHIÊN CỨU

- Nghiên cứu lý thuyết tính toán và mô phỏng số trên phần mềm máytính,

- Phân tích công thức ước tính khả năng chịu chọc thủng của các tấm bêtông cốt FRP

- Thiết lập bộ dữ liệu thu thập về các thử nghiệm chịu uốn, cắt

- Xây dựng Mạng lưới nơ-ron nhân tạo (ANN)

- Xây dựng mô hình hồi quy đề xuất dựa trên cân bằng thích nghi sửdụng để dự đoán khả năng chọc thủng của các khối bê tông cốt FRP

- Viết lập trình ứng dụng bằng ngôn ngữ Matlab

-Áp dụng mạng ANN phân tích khả năng chụ cắt của tấm bê tông cốtsợi FRP trên số liệu cụ thể và kiểm chứng kết quả

Trang 7

4 BỐ CỤC CỦA LUẬN VĂN

Nội dung chính của luận văn được tổ chức thành 5 chương có nội dungđược mô tả như dưới đây

Mở đầu: Chương này giới thiệu tổng quan về đề tài, mục tiêu, phạm vivà phương pháp nghiên cứu của đề tài

Chương 1: Chương này trình bày về các phương pháp tính toán khả năngchiụ cắt của tấm bê tông cốt gia cường bằng vật liệu cốt sợi polyme bằngcông thức cũng như thực nghiệm theo tiêu chuẩn của viện bê tông Hoa kỳ(ACI), tiêu chuẩn Anh Quốc (BS) và một số tác giả khác, đưa ra nhận định kếtluận chương

Chương 2: Chương này trình bày những lý thuyết cơ bản về mạng ron nhân tạo Cung cấp một cách nhìn tổng quát nhất, và những vấn đề về quátrình huấn luyện mạng và thuật toán học của mạng nơ ron thần kinh nhân tạo,trình bày việc ứng dụng các thuật toán của mạng Nơ ron thần kinh nhân tạođược lập trình bằng ngôn ngữ Matlab để xây dựng mô hình huấn luyện môphỏng khả năng chịu cắt của tấm bê tông cốt FRP

nơ-Chương 3: Áp dụng mạng ANN phân tích dữ liệu về tấm bê tông cốtFRP, so sánh kết quả với các phương pháp khác để kiểm chứng kết quả

Kết luận: Tổng kết những kết quả đã đạt được của luận văn và hướng phát triển nghiên cứu tiếp theo

Trang 8

CHƯƠNG I: TỔNG QUAN VỀ KẾT CẤU BÊ TÔNG GIA CƯỜNG BỞI

CỐT SỢI POLYME

1.1 Tấm bê tông cốt sợi gia cường polyme

Độ bền lâu dài của kết cấu bê tông cốt thép luôn là mối quan tâm lớntrong ngành xây dựng Một trong những yếu tố chính làm giảm độ bền và rútngắn tuổi thọ của các kết cấu bê tông cốt thép là tính ăn mòn của cốt thép Do

đó, việc sử dụng vật liệu cốt sợi gia cường Polyme (FRP) để thay thế théptrong các kết cấu bê tông cốt thép, đặc biệt hiệu quả khi sử dụng thiết kế cáctấm sàn chịu lực cắt chọc thủng lớn, tấm sàn các công trình ngầm, sàn mặtcầu vượt biển, các kết cấu sàn chịu lực lớn làm việc trong môi trường ăn mòncao…

Vật liệu FRP ngày càng được sử dụng trong xây dựng vì có ưu điểm là

tỷ lệ độ cứng-trọng lượng và độ bền-trọng lượng cao, có đặc tính cơ nhiệt tốt,chống ăn mòn, trọng lượng nhẹ và độ bền cao Việc ứng dụng vật liệu mớinày đã tạo cơ hội tăng hiệu quả xây dựng, tăng cường hiệu suất kết cấu, giảmchi phí bảo trì và kéo dài tuổi thọ của kết cấu Nhược điểm của nó là khó giacông uốn tạo hình do độ cứng lớn

Vật liệu FRP có sẵn ở nhiều dạng, chẳng hạn như thanh, lưới, tấm vàsợi cuộn Ngoài ra, các vật liệu này có thể được ứng dụng trong nhiều kết cấu,bao gồm dầm, cột, tấm và mặt cầu Các nghiên cứu tổng quát đã được tiếnhành để điều tra và nắm bắt hoạt động của các thành phần của tấm bê tông cốtFRP

Trang 9

Hình 1.1: Sản phẩm từ cốt thép FRP (nguồn: Internet)

Khi thiết kế các tấm sàn bê tông phẳng có cột đỡ, chịu lực lớn cần xemxét tới khả năng chịu cắt của tấm bê tông này Trong nhiều thập kỷ qua, khảnăng chịu cắt của các tấm bê tông gia cố bằng thép thông thường đã đượcnghiên cứu kỹ lưỡng và một số mô hình thiết kế khác nhau đã được đề xuất(Elshafey và các cộng sự, 2011)

Trang 10

1.2 Một số công trình sữ dụng vật liệu bê tông cốt FRP

Hình 1.2: Sử dụng Bê tông cốt FRP thi công Gara đổ xe ở Canada

(nguồn: Internet)

Trang 11

Hình 1.3: Sử dụng Bê tông cốt FRP thi công Cầu ở Canada (nguồn:

Internet)

Trang 12

Hình 1.4 Thi công mặt Cầu bằng Bê tông cốt FRP (nguồn: Internet)

Trang 13

1.3 Các phương pháp tính toán cường độ chịu cắt của các khối bê tông cốt FRP dựa trên công thức.

1.3.1 Phân tích công thức ước tính khả năng chịu uốn, cắt của các tấm bê tông cốt FRP.

Khả năng kháng cắt của bê tông có ảnh hưởng đến khả năng chịu cắtcủa các tấm bê tông gia cường phẳng làm việc hai phương, các phương trìnhthiết kế hiện có đã áp dụng cho các phần bê tông gia cường bằng FRP cónguồn gốc từ các mẫu đã từng áp dụng trước đây cho các dạng bê tông cốtthép tương ứng, với những điều chỉnh nhất định nhằm cân nhắc việc thay thếthép bằng FRP Phần nội dung dưới đây sẽ xem xét các phương pháp dựa trêncông thức để dự đoán khả năng chịu lực cắt của các tấm bê tông được giacường bằng FRP; Hệ thống các đơn vị sử dụng trong tất cả các công thức làSI

1.3.1 Viện bê tông Hoa Kỳ, theo Tiêu chuẩn (ACI 31.811):

Công thức thiết kế giải thích việc truyền lực cắt trong các tấm bê tôngcốt FRP ở hai phương:

d b f

vi của vùng chịu cắt của tấm bê tông quanh gối tựa, cách mặt cột khoảng

cách d/2, và d là chiều cao vùng chịu cắt trung bình của tấm bê tông.

1.3.2 Tiêu chuẩn Anh (BS 8110-97):

Đề xuất một công thức tính khả năng chịu cắt cho tấm bê tông cốt FRP nhưsau:

Trang 14

d b

f d

s

3 / 1 4 / 1 3 /

25 ( )

400 ( ) 100 ( 79

1.3.3 Phương pháp El-Ghandour và các cộng sự:

Dựa trên cơ sở các thí nghiệm, El-Ghandour và các cộng sự đã đề xuất điềuchỉnh phương trình của ACI bằng cách nhân phương trình này với (E ^ / Es)1/3 để giải thích việc sử dụng các thanh FRP như dưới đây:

d b E

E f

s

f c

3 / 1 ' ( ) 33

0

=

Trong đó: Ef và Es tương ứng là mô đun tấm bê tông gia cường bằng tấm

FRP Young và mô đun cố thép Young

El-Ghandour và các cộng sự đã điều chỉnh phương trình thiết kế của

BS 8110-97 và đề xuất một công thức thay thế để có được cường độ chịu cắtcủa tấm bê tông gia cường bằng FRP như sau:

d b

f d

3 / 1 4 / 1 3 /

25 ( )

400 ( )) ( 8 1 100 ( 79

=

1.3.4 Phương pháp Matthys và Taerwe:

Matthys và Taerwe đưa ra phương trình cải tiến của BS 8110-97 như sau:

Trang 15

d b d

f E

E

c s

f s

'

)

100 ( 36 1

ρ

=

Ospina và các cộng sự giới thiệu một dạng phương trình cải tiến do Matthysvà Taerwe đề xuất; Đối với dạng phương trình này, căn bậc ba của hệ số mô-đun được thay thế bằng căn bậc hai Công thức thiết kế này được trình bày

như dưới đây:

d b E

E f

s

f c

s

3 / 1 ' ) ( 77

=

1.3.5 Phương pháp của Tiểu Ban ACI440H:

Một phương trình thiết kế do tiểu ban ACI440H đề xuất bởi để thực hiện cáctính toán đối với các tấm bê tông cốt thép hai phương Phương trình này đãxem xét ảnh hưởng của độ cứng cường lực để giải thích cho việc truyền lực

cắt trong các tấm bê tông hai phương như sau:

c b f

Trong đó: k được xác định trong phương trình dưới đây:

f f f

f f

) ( 2

Đối với phương trình, cần lưu ý rằng ρf = Ef/Ec biểu thị tỷ lệ mô-đun và

Trang 16

1.4 Khảo sát kết quả các phương pháp tính toán cường độ chịu cắt của các khối bê tông cốt FRP dựa trên công thức

Sữ dụng các công thức mục 1.3 tính toán bài toán kiểm tra chọc thủng với cáctấm bê tông cốt FRP trên cột đỡ hình tròn, chữ nhật và vuông, so sánh với kếtquả thực nghiệm để đánh giá kết quả

Dữ liệu đầu vào của bài toán: (xem phụ lục 1)

Trang 17

Kết quả tính toán lực cắt theo công thức: (xem phụ lục 2)

Để đánh giá kết quả dựa vào các thong số sai số căn quân phương (RMSE),sai số tuyệt đối trung bình (MAPE), và hệ số xác định (R2) đã được tính toán

Bảng kết quả khảo sát sai số tính toán

Ghandour và các cộng sự

El-(1999)

Ghandour và các cộng sự

El-(2000)

Mytthys và

Taerwe (2000)

Ospina và các cộng sự

(2003)

ACI 440H

RMSE 196.61 158.38 188.94 151.27 201.58 117.51 342.52 MAPE 28.88 28.02 28.86 17.07 24.13 15.48 56.02

Công thức do Ospina và các cộng sự đề xuất là phương pháp dựa trêncông thức hiệu quả nhất, RMSE, MAPE, và R2 trong phương pháp này tương

ứng là 117.51, 15.48 và 0,91, các công tức khác đều cho kết quả sai số tương

đối lớn và sự chênh kết quả giữa các công thức cũng lớn (10%-300%)

1.5 Kết luận chương: Nghiên cứu các ứng dụng của vật liệu cốt sợi Polyme,

kết cấu bê tông cốt sợi gia cường FRP, các phương pháp tính toán chịu cắttheo công thức theo các tiêu chuẩn quốc tế và một số tác giả nhà khoa họcnổi tiếng đề xuất Khảo sát sai số kết quả tính toán trên dữ liệu thựcnghiệm nhận thấy các phương pháp tính toán theo công thức cho ra kết quảkhác nhau, chênh lệch kết quả ở mức lớn và các sai số kết quả so với thựcnghiệm cũng rất lớn, gây khó khăn cho nhà thiết kế trong lựa chọn cáchtính cũng như nghiên cứu ứng xữ kết cấu, từ đó đặt ra yêu cầu nghiên cứu

Trang 18

cách thức tiếp cận mới bằng trí tuệ nhân tạo, mạng nơ ron thần kinh nhântạo, cho kết quả nhanh chống, chính xác và tiện lợi là rất cần thiết.

CHƯƠNG II: MẠNG NƠ RON THẦN KINH NHÂN TẠO

2.1 Giới thiệu Mạng nơron thân kinh nhân tạo

2.1.1 Mạng nơron nhân tạo là gì?

Định nghĩa: Mạng nơron nhân tạo (Artificial Neural Network) gọi tắt là

mạng nơron là một mô hình xử lý thông tin phỏng theo cách thức xử lý thôngtin của các hệ nơron sinh học (Tran T-H, Hoang N-D, 2016)

Nó được tạo lên từ một số lượng lớn các phần tử (gọi là phần tử xử lý hay nơron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết)

làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó Một mạng nơron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhận

dạng mẫu, phân loại dữ liệu, ) thông qua một quá trình học từ tập các mẫu

huấn luyện.Về bản chất học chính là quá trình hiệu chỉnh trọng số liên kếtgiữa các nơron

Trang 19

Hình 2.1: Một mạng nơ-ron là một nhóm các nút nối với nhau, tương tự mạng các nơ-ron trong não người (nguồn: Internet).

2.1.2 Lịch sử phát triển mạng nơron

Những nghiên cứu về bộ não của con người đã được tiến hành từ rất lâuvà những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hìnhhóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suynghĩ đã trở thành hiện thực Nathanial Rochester sau nhiều năm làm việc tạicác phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để môphỏng một mạng nơron Trong thời kì này tính toán truyền thống đã đạt đượcnhững thành công rực rỡ trong khi đó những nghiên cứu về nơron còn ở giaiđoạn sơ khai Mặc dù vậy những người ủng hộ triết lý “thinking machines”(các máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình

Hình 2.2: Nơron than kinh não người(nguồn: Internet).

Trang 20

Hình 2.3: Mô phỏng mạng nơron thần kinh não người(nguồn: Internet).

Hình 2 4: Sơ đồ tổ chức hệ mạng nơ ron thần kinh nhân tạo

Dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence)vào năm 1956 đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhântạo lẫn mạng nơron Tác động tích cực của nó là thúc đẩy hơn nữa sự quantâm của các nhà khoa học về trí tuệ nhân tạo và quá trình xử lý ở mức đơngiản của mạng nơron trong bộ não con người

MẠNG NƠ RON NHÂN TẠO

Truyền thẳng

Nhiều

lớp

ART Hop

-fiel d

Ánh xạ đặc trưng

Brain stare – in Box

Máy Boltz -mam

Một lớp

Cobeth Gross - berg

Trang 21

Những năm tiếp theo nhà sinh học chuyên nghiên cứu về nơron Frank

Rosenblatt cũng bắt đầu nghiên cứu về Perceptron, sau thời gian nghiên cứu

này Perceptron đã được cài đặt trong phần cứng máy tính và được xem như làmạng nơron lâu đời nhất còn được sử dụng đến ngày nay Perceptron mộttầng rất hữu ích trong việc phân loại một tập các đầu vào có giá trị liên tụcvào một trong hai lớp, Perceptron tính tổng có trọng số các đầu vào, rồi trừtổng này cho một ngưỡng và cho ra một trong hai giá trị mong muốn có thể.Tuy nhiên Perceptron còn rất nhiều hạn chế, những hạn chế này đã được chỉ

ra trong cuốn sách về Perceptron của Marvin Minsky và Seymour Papert viếtnăm 1969

Năm 1974 Paul Werbos đã phát triển và ứng dụng phương pháp học lantruyền ngược (back-propagation) Tuy nhiên phải mất một vài năm thì phươngpháp này mới trở lên phổ biến Các mạng lan truyền ngược được biết đếnnhiều nhất và được áp dụng rộng dãi nhất nhất cho đến ngày nay

Thật không may, những thành công ban đầu này khiến cho con ngườinghĩ quá lên về khả năng của các mạng nơron Chính sự cường điệu quá mức

đã có những tác động không tốt đến sự phát triển của khoa học và kỹ thuậtthời bấy giờ khi người ta lo sợ rằng đã đến lúc máy móc có thể làm mọi việccủa con người Những lo lắng này khiến người ta bắt đầu phản đối các nghiêncứu về mạng neuron, thời kì tạm lắng này kéo dài đến năm 1981

Năm 1982 trong bài báo gửi tới viện khoa học quốc gia, John Hopfieldbằng sự phân tích toán học rõ ràng, mạch lạc, ông đã chỉ ra cách thức cácmạng nơron làm việc và những công việc chúng có thể thực hiện được Cốnghiến của Hopfield không chỉ ở giá trị của những nghiên cứu khoa học mà còn

ở sự thúc đẩy trở lại các nghiên cứu về mạng neuron

Trang 22

Cũng trong thời gian này, một hội nghị với sự tham gia của Hoa Kỳ vàNhật Bản bàn về việc hợp tác/cạnh tranh trong lĩnh vực mạng nơron đã được

tổ chức tại Kyoto, Nhật Bản Sau hội nghị, Nhật Bản đã công bố những nỗ lựccủa họ trong việc tạo ra máy tính thế hệ thứ 5 Tiếp nhận điều đó, các tạp chíđịnh kỳ của Hoa Kỳ bày tỏ sự lo lắng rằng nước nhà có thể bị tụt hậu tronglĩnh vực này Vì thế, ngay sau đó, Hoa Kỳ nhanh chóng huy động quĩ tài trợcho các nghiên cứu và ứng dụng mạng neuron

Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức các cuộc họp hàng nămvề mạng neuron ứng dụng trong tin học (Neural Networks for Computing) Ngày nay, không chỉ dừng lại ở mức nghiên cứu lý thuyết, các nghiêncứu ứng dụng mạng nơron để giải quyết các bài toán thực tế được diễn ra ởkhắp mọi nơi Các ứng dụng mạng nơron ra đời ngày càng nhiều và ngàycàng hoàn thiện hơn Điển hình là các ứng dụng: xử lý ngôn ngữ (LanguageProcessing), nhận dạng kí tự (Character Recognition), nhận dạng tiếng nói(Voice Recognition), nhận dạng mẫu (Pattern Recognition), xử lý tín hiệu(Signal Processing), Lọc dữ liệu (Data Filtering)

2.1.3 So sánh mạng nơron với máy tính truyền thống

Mạng nơron có cách giải quyết các vấn đề khác so với máy tính truyềnthống Các máy tính truyền thống sử dụng cách tiếp cận theo hướng giải thuật,tức là máy tính thực hiện một tập các chỉ lệnh để giải quyết một vấn đề Vấnđề được giải quyết phải được biết và phát biểu dưới dạng một tập chỉ lệnhkhông nhập nhằng Những chỉ lệnh này sau đó phải được chuyển sang mộtchương trình ngôn ngữ bậc cao và chuyển sang mã máy để máy tính có thểhiểu được

Trừ khi các bước cụ thể mà máy tính cần tuân theo được chỉ ra rõ ràng,máy tính sẽ không làm được gì cả Điều đó giới hạn khả năng của các máytính truyền thống ở phạm vi giải quyết các vấn đề mà chúng ta đã hiểu và biết

Trang 23

chính xác cách thực hiện Các máy tính sẽ trở lên hữu ích hơn nếu chúng cóthể thực hiện được những việc mà bản thân con người không biết chính xác làphải làm như thế nào

Mạng nơron xử lý thông tin theo cách thức giống như bộ não conngười Mạng được tạo nên từ một số lượng lớn các phần tử xử lý được kết nốivới nhau làm việc song song để giải quyết một vấn đề cụ thể Các mạng nơronhọc theo mô hình, chúng không thể được lập trình để thực hiện một nhiệm vụ

cụ thể Các mẫu phải được chọn lựa cẩn thận nếu không sẽ rất mất thời gian,thậm chí mạng sẽ hoạt động không đúng Điều hạn chế này là bởi vì mạng tựtìm ra cách giải quyết vấn đề, thao tác của nó không thể dự đoán được

Các mạng nơron và các máy tính truyền thống không cạnh tranh nhaumà bổ sung cho nhau Có những nhiệm vụ thích hợp hơn với máy tính truyềnthống, ngược lại có những nhiệm vụ lại thích hợp hơn với các mạng nơron.Thậm chí rất nhiều nhiệm vụ đòi hỏi các hệ thống sử dụng tổ hợp cả hai cáchtiếp cận để thực hiện được hiệu quả cao nhất (thông thường một máy tínhtruyền thống được sử dụng để giám sát mạng nơron)

2.1.4 Nơron sinh học và nơron nhân tạo

2.1.4.1 Nơron sinh học

Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não conngười bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên cácđường truyền Mỗi đường truyền này dài khoảng hơn một mét Các nơron cónhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn cónhững khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử

lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đườngnày tạo nên hệ thống giao tiếp của bộ não

Trang 24

Hình 2.5: Cấu trúc của một nơron sinh học điển hình.

Mỗi nơron sinh học có 3 thành phần cơ bản:

• Các nhánh vào hình cây ( dendrites)

• Thân tế bào (cell body)

• Sợi trục ra (axon)

Các nhánh hình cây truyền tín hiệu vào đến thân tế bào Thân tế bàotổng hợp và xử lý cho tín hiệu đi ra Sợi trục truyền tín hiệu ra từ thân tế bàonày sang nơron khác Điểm liên kết giữa sợi trục của nơron này với nhánh

hình cây của nơron khác gọi là synapse Liên kết giữa các nơron và độ nhạy

của mỗi synapse được xác định bởi quá trình hóa học phức tạp Một số cấutrúc của nơron được xác định trước lúc sinh ra Một số cấu trúc được pháttriển thông qua quá trình học Trong cuộc đời cá thể, một số liên kết mới đượchình thành, một số khác bị hủy bỏ

Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu

đầu vào, xử lý các tín hiệu này và cho ra một tín hiệu output Tín hiệu output

này sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác

Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơronnhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não

Trang 25

2.1.4.2 Nơron nhân tạo

Một nơron là một đơn vị xử lý thông tin và là thành phần cơ bản củamột mạng nơron Cấu trúc của một nơron được mô tả trên hình dưới

Hình 2.6: Nơron nhân tạo

Các thành phần cơ bản của một nơron nhân tạo bao gồm:

♦ Tập các đầu vào: Là các tín hiệu vào (input signals) của nơron, các

tín hiệu này thường được đưa vào dưới dạng một vector N chiều

♦ Tập các liên kết: Mỗi liên kết được thể hiện bởi một trọng số (gọi là

trọng số liên kết – Synaptic weight) Trọng số liên kết giữa tín hiệu vào thứ j với nơron k thường được kí hiệu là wkj Thông thường, các trọng số này được

khởi tạo một cách ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhậtliên tục trong quá trình học mạng

♦ Bộ tổng (Summing function): Thường dùng để tính tổng của tích các

đầu vào với trọng số liên kết của nó

♦ Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được

đưa vào như một thành phần của hàm truyền

♦ Hàm truyền (Transfer function) : Hàm này được dùng để giới hạn

phạm vi đầu ra của mỗi nơron Nó nhận đầu vào là kết quả của hàm tổng vàngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi nơron được giới hạntrong đoạn [0,1] hoặc [-1, 1] Các hàm truyền rất đa dạng, có thể là các hàmtuyến tính hoặc phi tuyến Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng

Trang 26

bài toán và kinh nghiệm của người thiết kế mạng Một số hàm truyền thường

sử dụng trong các mô hình mạng nơron được đưa ra trong bảng 2.1

♦ Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa

là một đầu ra

Trong đó: x1, x2, , xp: là các tín hiệu vào; (wk1, wk2, , wkp) là các trọng số liên kết của nơron thứ k; uk là hàm tổng; bk là một ngưỡng; f là hàm truyền và yk là tín hiệu đầu ra của nơron

Như vậy tương tự như nơron sinh học, nơron nhân tạo cũng nhận cáctín hiệu đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổngcác tích thu được rồi gửi kết quả tới hàm truyền), và cho một tín hiệu đầu ra(là kết quả của hàm truyền)

Bảng 2.1: Một số hàm truyền thông dụng

Trang 27

Saturating Linear

1

x x

e

f x

e

-

-=+

2.1.4.3 Mô hình mạng nơron

Mặc dù mỗi nơron đơn lẻ có thể thực hiện những chức năng xử lýthông tin nhất định, sức mạnh của tính toán nơron chủ yếu có được nhờ sự kếthợp các nơron trong một kiến trúc thống nhất Một mạng nơron là một môhình tính toán được xác định qua các tham số: kiểu nơron (như là các nút nếu

ta coi cả mạng nơron là một đồ thị), kiến trúc kết nối (sự tổ chức kết nối giữacác nơron) và thuật toán học (thuật toán dùng để học cho mạng)

Về bản chất một mạng nơron có chức năng như là một hàm ánh xạ F: X

→ Y, trong đó X là không gian trạng thái đầu vào (input state space) và Y là không gian trạng thái đầu ra (output state space) của mạng Các mạng chỉ đơn

giản là làm nhiệm vụ ánh xạ các vector đầu vào x ∈ X sang các vector đầu ra

y ∈ Y thông qua “bộ lọc” (filter) các trọng số Tức là y = F(x) = s(W, x), trong

đó W là ma trận trọng số liên kết Hoạt động của mạng thường là các tính toánsố thực trên các ma trận

a Các kiểu mô hình mạng nơron

Cách thức kết nối các nơron trong mạng xác định kiến trúc (topology) của mạng Các nơron trong mạng có thể kết nối đầy đủ (fully connected) tức

Trang 28

là mỗi nơron đều được kết nối với tất cả các nơron khác, hoặc kết nối cục bộ

(partially connected) chẳng hạn chỉ kết nối giữa các nơron trong các tầng

khác nhau Người ta chia ra hai loại kiến trúc mạng chính:

♦ Tự kết hợp (autoassociative): là mạng có các nơron đầu vào cũng là

các nơron đầu ra Mạng Hopfield là một kiểu mạng tự kết hợp

Hình2.7: Mạng tự kết hợp

♦ Kết hợp khác kiểu (heteroassociative): là mạng có tập nơron đầu vào

và đầu ra riêng biệt Perceptron, các mạng Perceptron nhiều tầng (MLP:MultiLayer Perceptron), mạng Kohonen, … thuộc loại này

Hình 2.8: Mạng kết hợp khác kiểu

Ngoài ra tùy thuộc vào mạng có các kết nối ngược (feedback

connections) từ các nơron đầu ra tới các nơron đầu vào hay không, người ta

chia ra làm 2 loại kiến trúc mạng

Trang 29

♦ Kiến trúc truyền thẳng (feedforward architechture): là kiểu kiến trúc

mạng không có các kết nối ngược trở lại từ các nơron đầu ra về các nơron đầuvào; mạng không lưu lại các giá trị output trước và các trạng thái kích hoạtcủa nơron Các mạng nơron truyền thẳng cho phép tín hiệu di chuyển theomột đường duy nhất; từ đầu vào tới đầu ra, đầu ra của một tầng bất kì sẽkhông ảnh hưởng tới tầng đó Các mạng kiểu Perceptron là mạng truyềnthẳng

Hình 2.9: Mạng truyền thẳng

♦ Kiến trúc phản hồi (Feedback architecture): là kiểu kiến trúc mạng có

các kết nối từ nơron đầu ra tới nơron đầu vào Mạng lưu lại các trạng tháitrước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vàomà còn phụ thuộc vào các trạng thái trước đó của mạng Mạng Hopfield thuộcloại này

Trang 30

Hình 2.10: Mạng phản hồi

b Perceptron

Perceptron là mạng nơron đơn giản nhất, nó chỉ gồm một nơron, nhậnđầu vào là vector có các thành phần là các số thực và đầu ra là một trong haigiá trị +1 hoặc -1

Hình 2.11: Perceptron

Đầu ra của mạng được xác định như sau: mạng lấy tổng có trọng số cácthành phần của vector đầu vào, kết quả này cùng ngưỡng b được đưa vào hàmtruyền (Perceptron dùng hàm Hard-limit làm hàm truyền) và kết quả của hàmtruyền sẽ là đầu ra của mạng

Perceptron cho phép phân loại chính xác trong trường hợp dữ liệu cóthể phân chia tuyến tính (các mẫu nằm trên hai mặt đối diện của một siêuphẳng) Nó cũng phân loại đúng đầu ra các hàm AND, OR và các hàm có

Trang 31

dạng đúng khi n trong m đầu vào của nó đúng (n ≤ m) Nó không thể phânloại được đầu ra của hàm XOR

c Mạng nhiều tầng truyền thẳng (MLP)

Mô hình mạng nơron được sử dụng rộng rãi nhất là mô hình mạngnhiều tầng truyền thẳng (MLP: Multi Layer Perceptron) Một mạng MLP tổngquát là mạng có n (n≥2) tầng (thông thường tầng đầu vào không được tínhđến): trong đó gồm một tầng đầu ra (tầng thứ n) và (n-1) tầng ẩn

Hình 2.12: Mạng MLP tổng quát

Kiến trúc của một mạng MLP tổng quát có thể mô tả như sau:

♦ Đầu vào là các vector (x1, x2, , xp) trong không gian p chiều, đầu ralà các vector (y1, y2, , yq) trong không gian q chiều Đối với các bài toánphân loại, p chính là kích thước của mẫu đầu vào, q chính là số lớp cần phânloại Xét ví dụ trong bài toán nhận dạng chữ số: với mỗi mẫu ta lưu tọa độ(x,y) của 8 điểm trên chữ số đó, và nhiệm vụ của mạng là phân loại các mẫunày vào một trong 10 lớp tương ứng với 10 chữ số 0, 1, …, 9 Khi đó p là kíchthước mẫu và bằng 8 x 2 = 16; q là số lớp và bằng 10

♦ Mỗi nơron thuộc tầng sau liên kết với tất cả các nơron thuộc tầng liềntrước nó

Trang 32

♦ Đầu ra của nơron tầng trước là đầu vào của nơron thuộc tầng liền sau

nó

Hoạt động của mạng MLP như sau: tại tầng đầu vào các nơron nhận tínhiệu vào xử lý (tính tổng trọng số, gửi tới hàm truyền) rồi cho ra kết quả (làkết quả của hàm truyền); kết quả này sẽ được truyền tới các nơron thuộc tầng

ẩn thứ nhất; các nơron tại đây tiếp nhận như là tín hiệu đầu vào, xử lý và gửikết quả đến tầng ẩn thứ 2;…; quá trình tiếp tục cho đến khi các nơron thuộctầng ra cho kết quả

Một số kết quả đã được chứng minh:

♦ Bất kì một hàm Boolean nào cũng có thể biểu diễn được bởi một mạngMLP 2 tầng trong đó các nơron sử dụng hàm truyền sigmoid

♦ Tất cả các hàm liên tục đều có thể xấp xỉ bởi một mạng MLP 2 tầng sửdụng hàm truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính chocác nơron tầng ra với sai số nhỏ tùy ý

♦ Mọi hàm bất kỳ đều có thể xấp xỉ bởi một mạng MLP 3 tầng sử dụnghàm truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính cho cácnơron tầng ra

2.2 HUẤN LUYỆN VÀ XÂY DỰNG MẠNG NƠRON

2.2.1 Các phương pháp học

Khái niệm: Học là quá trình thay đổi hành vi của các vật theo một cách

nào đó làm cho chúng có thể thực hiện tốt hơn trong tương lai

Một mạng nơron được huyấn luyện sao cho với một tập các vector đầuvào X, mạng có khả năng tạo ra tập các vector đầu ra mong muốn Y của nó.Tập X được sử dụng cho huấn luyện mạng được gọi là tập huấn luyện

(training set) Các phần tử x thuộc X được gọi là các mẫu huấn luyện

Trang 33

(training example) Quá trình huấn luyện bản chất là sự thay đổi các trọng số

liên kết của mạng Trong quá trình này, các trọng số của mạng sẽ hội tụ dầntới các giá trị sao cho với mỗi vector đầu vào x từ tập huấn luyện, mạng sẽcho ra vector đầu ra y như mong muốn

Có ba phương pháp học phổ biến là học có giám sát (supervised

learning), học không giám sát (unsupervised learning) và học tăng cường

(Reinforcement learning):

♦ Học có giám sát:

Hình 2.13: Mô hình huấn luyện mạng có giám sát

Là quá trình học có sự tham gia giám sát của một “thầy giáo” Cũnggiống như việc ta dạy một em nhỏ các chữ số Ta đưa ra một số “1” và bảovới em đó rằng đây là số “1” Việc này được thực hiện trên tất cả các mẫu chữcái Sau đó khi kiểm tra ta sẽ đưa ra một chữ số bất kì (có thể viết hơi khác đi)và hỏi em đó đây là chữ gì?

Với học có giám sát, tập mẫu huấn luyện được cho dưới dạng D = {(x,t) |(x,t) ∈ [IRN x RK]}, trong đó: x = (x1, x2, , xN) là vector đặc trưng N chiềucủa mẫu huấn luyện và t = (t1, t2, , tK) là vector mục tiêu K chiều tương

Trang 34

ứng, nhiệm vụ của thuật toán là phải thiết lập được một cách tính toán trênmạng như thế nào đó để sao cho với mỗi vector đặc trưng đầu vào thì sai sốgiữa giá trị đầu ra thực sự của mạng và giá trị mục tiêu tương ứng là nhỏ nhất.Chẳng hạn mạng có thể học để xấp xỉ một hàm t = f(x) biểu diễn mối quan hệtrên tập các mẫu huấn luyện (x, t)

Như vậy với học có giám sát, số lớp cần phân loại đã được biết trước.Nhiệm vụ của thuật toán là phải xác định được một cách thức phân lớp saocho với mỗi vector đầu vào sẽ được phân loại chính xác vào lớp của nó

Học có giám sát trong các mạng nơron

Học có giám sát có thể được xem như việc xấp xỉ một ánh xạ: X→ Y,trong đó X là tập các vấn đề và Y là tập các lời giải tương ứng cho vấn đề đó.Các mẫu (x, y) với x = (x1, x2, , xn) X, y = (yl, y2, , ym)∈Y được chotrước Học có giám sát trong các mạng nơron thường được thực hiện theo cácbước sau:

♦ Bước 1: Xây dựng cấu trúc thích hợp cho mạng nơron, chẳng hạn có

(n + 1) nơron vào (n nơron cho biến vào và 1 nơron cho ngưỡng x0), m nơronđầu ra, và khởi tạo các trọng số liên kết của mạng

♦ Bước 2: Đưa một vector x trong tập mẫu huấn luyện X vào mạng

♦ Bước 3: Tính vector đầu ra o của mạng

♦ Bước 4: So sánh vector đầu ra mong muốn y (là kết quả được cho

trong tập huấn luyện) với vector đầu ra o do mạng tạo ra; nếu có thể thì đánhgiá lỗi

♦ Bước 5: Hiệu chỉnh các trọng số liên kết theo một cách nào đó sao cho

ở lần tiếp theo khi đưa vector x vào mạng, vector đầu ra o sẽ giống với y hơn

♦ Bước 6: Nếu cần, lặp lại các bước từ 2 đến 5 cho tới khi mạng đạt tới

trạng thái hội tụ Việc đánh giá lỗi có thể thực hiện theo nhiều cách, cách

Trang 35

dùng nhiều nhất là sử dụng lỗi tức thời: Err = (o - y), hoặc Err = |o - y|; lỗi trung bình bình phương (MSE: mean-square error): Err = (o- y)2/2;

Có hai loại lỗi trong đánh giá một mạng nơron Thứ nhất, gọi là lỗi rõ

ràng (apparent error), đánh giá khả năng xấp xỉ các mẫu huấn luyện của một mạng đã được huấn luyện Thứ hai, gọi là lỗi kiểm tra (test error), đánh giá

khả năng tổng quá hóa của một mạng đã được huấn luyện, tức khả năng phảnứng với các vector đầu vào mới Để đánh giá lỗi kiểm tra chúng ta phải biếtđầu ra mong muốn cho các mẫu kiểm tra

Thuật toán tổng quát ở trên cho học có giám sát trong các mạng nơron cónhiều cài đặt khác nhau, sự khác nhau chủ yếu là cách các trọng số liên kếtđược thay đổi trong suốt thời gian học Trong đó tiêu biểu nhất là thuật toánlan truyền ngược

2.2.2 Thuật toán lan truyền ngược

Ta sử dụng một số kí hiệu sau:

- j: nơron thứ j (hay nút thứ j)

- Xj: vector đầu vào của nút thứ j

- Wj: vector trọng số của nút thứ j

- x ji: đầu vào của nút thứ j từ nút thứ i

- w ji: trọng số trên xji

- b j: ngưỡng tại nút thứ j

- o j: đầu ra của nút thứ j

- t j: đầu ra mong muốn của nút thứ j

Trang 36

- Downstream(j): Tập tất cả các nút nhận đầu ra của nút thứ j làm mộtgiá trị đầu vào

- η: tốc độ học

- f: hàm truyền với f(x) = 1 / (1 + e -x )

Thuật toán lan truyền ngược được mô tả như sau:

Bước 1: Khởi tạo trọng số bởi các giá trị ngẫu nhiên nhỏ

Bước 2: Lặp lại cho tới khi thỏa mãn điều kiện kết thúc

Với mỗi mẫu, thực hiện các bước sau:

2.1 Tính đầu ra o j cho mỗi nút j:

Định dạng
Số trang	73
Dung lượng	1,86 MB