Trong bối cảnh phát triển mạnh mẽ của khoa học và công nghệ, trí tuệ nhân tạo (AI) đã trở thành một công cụ không thể thiếu trong nhiều lĩnh vực, từ y học, tài chính, giao thông đến kỹ thuật xây dựng. Trong đó, địa kỹ thuật - một lĩnh vực quan trọng của ngành kỹ thuật xây dựng và giao thông - cũng đang chứng kiến sự thay đổi đáng kể nhờ vào sự ứng dụng của trí tuệ nhân tạo. Việc khai thác dữ liệu lớn, xây dựng các mô hình học máy và học sâu -một thành phần quan trọng của trí tuệ nhân tạo, giúp nâng cao độ chính xác trong phân tích, dự báo và thiết kế các công trình nền đất, nền móng, cũng như trong đánh giá rủi ro địa kỹ thuật. Cuốn sách chuyên khảo "Ứng dụng trí tuệ nhân tạo trong phân tích địa kỹ thuật" được biên soạn nhằm giới thiệu những tiến bộ trong việc ứng dụng trí tuệ nhân tạo vào các bài toán địa kỹ thuật. Nội dung sách tập trung vào các phương pháp hiện đại như mạng nơ-ron nhân tạo (ANN), máy vector hỗ trợ (SVM), hệ thống suy luận mờ thích ứng (ANFIS), và các kỹ thuật tối ưu hóa tiến tiến nhằm xây dựng các mô hình dự báo có độ chính xác cao dựa trên cơ sở dữ liệu được thu thập và xây dựng từ các đề tài và dự án thực tế liên quan đến các bài toán như: dự báo hệ số cố kết của đất, dự báo chỉ số nén của đất, dự báo các tham số đặc trưng sức chống cắt của đất, và dự báo sức chịu tải của cọc. Bên cạnh việc trình bày cơ sở lý thuyết, sách cũng giới thiệu một số kết quả nghiên cứu điển hình và ứng dụng thực tế trong lĩnh vực địa kỹ thuật tại Việt Nam. Đặc biệt, cuốn sách hướng đến việc cung cấp công cụ hữu ích cho các nhà nghiên cứu, kỹ sư và sinh viên trong việc áp dụng trí tuệ nhân tạo vào thực tiễn, từ đó góp phần nâng cao độ chính xác, tối ưu hóa thời gian và giảm chi phí trong phân tích và thiết kế công trình.
Trang 2PHAM THAI BINH
Trang 3LOI NOI DAU
Trong bối cảnh phát triển mạnh mẽ của khoa học và công nghệ, trí tuệ nhân tạo (AI) đã
trở thành một công cụ không thê thiếu trong nhiễu lĩnh vực, từ y học, tài chính, giao thông
đến kỹ thuật xây dựng Trong đó, địa kỹ thuật - một lĩnh vực quan trọng của ngành kỹ thuật
xây dựng và giao thông - cũng đang chứng kiến sự thay đổi đáng kể nhờ vào sự ứng dụng
của trí tuệ nhân tạo Việc khai thác dữ liệu lớn, xây dựng các mô hình học máy và học sâu -
một thành phần quan trọng của trí tuệ nhân tạo, giúp nâng cao độ chính xác trong phân
tích, dự báo và thiết kế các công trình nên đất, nền móng, cũng như trong đánh giá rủi ro
địa kỹ thuật
Cuốn sách chuyên khảo "Ứng dụng trí tuệ nhân tạo trong phân tích địa kỹ thuật" được biên soạn nhằm giới thiệu những tiến bộ trong việc ứng dụng trí tuệ nhân tạo vào các bài toản địa kỹ thuật Nội dung sách tập trung vào các phương pháp hiện đại như
mạng nơ-ron nhân tạo (ANN), máy vector hỗ trợ (SVM), hệ thống suy luận mờ thích ứng (ANFIS), và các kỹ thuật tối ưu hóa tiến tiến nhằm xây dựng các mô hình dự báo có độ
chính xác cao dựa trên cơ sở dữ liệu được thu thập và xây dựng từ các đề tài và dự án thực tế liên quan đến các bài toán như: dự báo hệ số có kết của đất, dự báo chỉ số nén của đất, dự báo các tham số đặc trưng sức chống cắt của đất, và dự báo sức chịu tải của cọc Bên cạnh việc trình bày cơ sở lý thuyết, sách cũng giới thiệu một só kết quả nghiên cứu điển hình và ứng dụng thực tế trong lĩnh vực địa kỹ thuật tại Việt Nam Đặc biệt, cuốn sách hướng đến việc cung cáp công cụ hữu ích cho các nhà nghiên cứu, kỹ sư và sinh viên
trong việc áp dụng trí tuệ nhân tạo vào thực tiễn, từ đó góp phân nâng cao độ chính xác,
tối wu hóa thời gian và giảm chỉ phí trong phân tích và thiết kế công trình
Tác giả hy vọng cuốn sách này sẽ là một tài liệu tham khảo hữu ích, giúp độc giả tiếp
cận với những công nghệ tiên tiến trong lĩnh vực địa kỹ thuật và mở ra nhiều hướng
nghiên cứu, ứng dụng mới Chúng tôi xin gửi lời cảm ơn sâu sắc đến các đông nghiệp,
chuyên gia và nhà khoa học đã đóng góp ý kiến và hỗ trợ trong quá trình biên soạn cuốn
sách này
Trong lan xuất ban dau tiên này mặc dù đã có nhiều cố gang song chắc chắn cuồn sách
không thể tránh khỏi những thiếu sót nhất định Tác giá và Nhà xuất bản trân trọng lắng
nghe ý kiến đóng góp của bạn đọc để trong lần tái bản sau sách được hoàn thiện hơn!
Tác giả
Trang 4Chuong 1
GIOI THIEU CHUNG VE DIA KY THUAT
VÀ TRÍ TUỆ NHÂN TẠO
Chương 1 đóng vai trò mở đầu, cung cấp cái nhìn tổng quan về hai lĩnh vực nền tảng là địa kỹ thuật và trí tuệ nhân tạo, qua đó làm cơ sở lý thuyết và định hướng ứng dụng cho các chương chuyên sâu tiếp theo Phần đầu của chương tập trung trình bày khái niệm, lịch
sử phát triển và cách tiếp cận nghiên cứu trong địa kỹ thuật, một chuyên ngành quan trọng của kỹ thuật xây dựng, liên quan đến hành vi cơ học của đất và đá khi tương tác với kết
cấu công trình Các thách thức trong thực tiễn địa kỹ thuật như điều kiện địa chất phức
tạp, tính không đồng nhất của vật liệu và sự giới hạn của mô hình truyền thống cũng được
đề cập nhằm làm rõ nhu cầu ứng dụng các công nghệ tiên tiến như trí tuệ nhân tạo Tiếp theo, chương đi sâu vào phần giới thiệu về trí tuệ nhân tạo, bao gồm định nghĩa, lịch sử phát triển, các thành phần cấu thành, đặc biệt nhân mạnh vào phương pháp học máy
(machine learning) - trụ cột của các ứng dụng trí tuệ nhân tạo hiện đại hiện đại Chương 1
cũng trình bày các bước cơ bản trong việc ứng dụng học máy cho một bài toán kỹ thuật Phần tiếp theo, Chương 1 giới thiệu các công cụ và phần mềm phỏ biến trong mô hình hóa
kỹ thuật trí tuệ nhân tạo, bao gồm: MATLAB, Python, WEKA, SPSS Modeler,
RapidMiner, Orange, và Google Colab, phân tích thế mạnh, phạm vi sử dụng và mức độ phù hợp với từng nhóm đối tượng Cuối cùng, chương tổng hợp một số nghiên cứu điển hình về ứng dụng trí tuệ nhân tạo trong địa kỹ thuật Các nghiên cứu này minh ching cho
tiềm năng to lớn của trí tuệ nhân tạo trong việc nâng cao độ chính xác, tự động hóa và tiết kiệm thời gian trong phân tích địa kỹ thuật, đồng thời mở ra định hướng phát triển cho các
chương tiếp theo
1.1 GIOI THIEU VE DIA KY THUAT
1.1.1 Khái niệm về địa kỹ thuật
Địa kỹ thuật (Geotechnical Engineering) là một nhánh quan trọng của kỹ thuật xây
dựng, tập trung vào việc nghiên cứu hành vi của đất và các vật liệu liên quan dưới tác động của tải trọng và môi trường [I] Địa kỹ thuật ứng dụng các nguyên lý của cơ học dat,
cơ học đá, thủy lực và địa chất đề thiết kế và xây dựng nền móng, công trình hạ tang như
đê điều, đường hầm, cầu công, đường giao thông và các công trình dân dụng khác [1] Địa kỹ thuật đóng vai trò then chốt trong ngành xây dựng và phát triển hạ tầng, đảm bảo sự an toàn, bền vững và hiệu quả kinh tế cho các công trình Nghiên cứu địa kỹ thuật
Trang 5lý nước ngầm và phòng chống sạt lở
Địa kỹ thuật có thể xem xét và nghiên cứu đến nhiều vấn đề có liên quan đến cơ học đất và nền móng trong xây dựng công trình như: nghiên cứu các tính chất cơ lý của đất,
nghiên cứu nhận diện và phân loại đất; nghiên cứu ồn định mái dốc, nghiên cứu sự phân
bố ứng suất ở trong đất, nghiên cứu phân tích lún của nền đất, nghiên cứu khả năng đầm
chặt của đất, nghiên cứu sức chịu tải và chuyên Vị của cọc và móng cọc, nghiên cứu sức
chịu tải và chuyên vị của móng nông, và các bài toán khác có liên quan [1, 2] 1.1.2 Lịch sử hình thành ngành địa kỹ thuật
Ngành địa kỹ thuật, hay còn gọi là cơ học đất và cơ học đá, là một nhánh quan trọng
của kỹ thuật xây dựng, chuyên nghiên cứu về tính chất cơ học của đất, đá và ảnh hưởng
của chúng đến các công trình xây dựng Ngành này có nguồn gốc từ những quan sát thực
nghiệm từ thời cổ đại và phát triển mạnh mẽ qua nhiều thé ky, đặc biệt từ thế kỷ 18 đến
nay [1, 2]
* Giai đoạn sơ khai - Trước thé ky XVIII
Từ thời kỳ cổ đại, con người đã biết áp dụng các nguyên tắc cơ bản của địa kỹ thuật vào xây dựng Các nền văn minh như Ai Cập, Lưỡng Hà, Hy Lạp và La Mã đã xây dựng
nhiều công trình lớn như kim tự tháp, đê điều, kênh đào, cầu và hệ thông đường sá Tuy nhiên, vào thời điểm đó, các quyết định thiết kế chủ yếu dựa trên kinh nghiệm thực tế và
thử nghiệm đơn giản thay vì các nguyên tắc khoa học
Ví dụ, người Ai Cập đã biết cách lựa chọn vị trí đất nền phù hợp để xây dựng kim tự
tháp, trong khi người La Mã phát triển hệ thống cầu cống và đường sá bền vững bằng
cách cải thiện nền móng Tuy nhiên, chưa có một lý thuyết khoa học nào chính thức về cơ
học đất và đá
* Giai đoạn hình thành các nguyên lý cơ học đất (Thế kỷ XVII - XIX) Mặc dù các kỹ thuật xây dựng đã phát triển từ sớm, cơ học đất như một ngành khoa học chỉ bắt đầu hình thành vào thé ky XVIII và XIX Một số nhà khoa học tiên phong đã nghiên cứu và xây dựng các lý thuyết quan trọng:
* Charles Coulomb (1736 - 1806): Ông là người đặt nền móng cho ngành cơ học đất với lý thuyết về áp lực đất và sự cân bằng giới hạn trong năm 1776 Coulomb sử
dụng các nguyên lý toán học để mô tả cách đất tác động lên tường chắn và nền
móng công trình
¢ Karl von Terzaghi (1883 - 1963): Được coi là “cha đẻ của cơ học đất hiện đại”,
ông đã phát triển lý thuyết về cố kết đất và ứng suất thấm vào đầu thế kỷ XX
Công trình của Terzaghi đã giúp kỹ sư hiểu rõ hơn về cách đất nén chặt theo thời
gian và ảnh hưởng của nước đến độ ồn định của nền móng.
Trang 6Vào thế kỷ XX, ngành địa kỹ thuật phát triển mạnh mẽ nhờ vào sự kết hợp giữa lý thuyết và thực nghiệm Các kỹ sư và nhà khoa học đã nghiên cứu sâu hơn về tính chất của
đất, đá và ảnh hưởng của chúng đến các công trình xây dựng Một số cột mốc quan trọng bao gồm:
«— Những năm 1920- 1930: Các nghiên cứu của Karl Terzaghi về cơ học đất được áp dụng rộng rãi, giúp ngành địa kỹ thuật trở thành một lĩnh vực khoa học độc lập
«ˆ Những năm 1950 - 1970: Sự phát triển của các phương pháp thí nghiệm trong phòng và thực địa giúp cải thiện đáng kể khả năng đánh giá tính chất cơ học của
đất Các kỹ thuật như thí nghiệm nén có kết, thí nghiệm cắt trực tiếp và phương
pháp phân tích phần tử hữu hạn (FEM) ra đời
«— Những năm 1980 - 2000: Sự phat trién cia máy tính và công nghệ số hóa giúp kỹ
sư địa kỹ thuật mô phỏng chính xác hơn các hiện tượng như sạt lở đất, lún sụt và
ổn định mái dốc Các phần mềm chuyên dụng như PLAXIS, GeoStudio và FLAC
trở thành công cụ không thể thiếu trong ngành
* Giai đoạn phát triển mới trong thế kỷ XXAI - Hướng tới trí tuệ nhân tạo và công
nghệ tiên tiễn
Ngày nay, ngành địa kỹ thuật tiếp tục phát triển với sự kết hợp của các công nghệ hiện đại như trí tuệ nhân tạo và hệ thống thông tin địa lý (GIS) Các kỹ sư có thể sử dụng trí tuệ
nhân tạo để phân tích dữ liệu lớn về địa chất, dự đoán nguy cơ sạt lở, lún sụt hoặc tính
toán, thiết kế nền và móng tối ưu cho các công trình xây dựng
Ngoài ra, công nghệ cảm biến thời gian thực, như cảm biến địa kỹ thuật (geotechnical
sensors) và radar giám sát dịch chuyền, giúp cải thiện khả năng dự báo và kiểm soát rủi ro
trong các dự án xây dựng Ngành địa kỹ thuật hiện đại không chỉ tập trung vào xây dựng
công trình mà còn đóng vai trò quan trọng trong bảo vệ môi trường, quản lý tài nguyên
thiên nhiên và giảm thiểu tác động của biến đổi khí hậu
1.1.3 Cách tiếp cận trong nghiên cứu và phân tích địa kỹ thuật
Các cách tiếp cận trong nghiên cứu và phân tích địa kỹ thuật ngày càng đa dạng, từ phương pháp thực nghiệm truyền thống, mô hình toán học, phân tích số, đến các công nghệ tiên tiễn như trí tuệ nhân tạo Việc lựa chọn phương pháp phù hợp phụ thuộc vào
mục tiêu nghiên cứu, điều kiện địa chất và nguồn lực sẵn có Mỗi cách tiếp cận có ưu
điểm riêng và thường được kết hợp đề đạt hiệu quả tối ưu trong phân tích địa kỹ thuật
* Cách tiếp cận thực nghiệm
Cách tiếp cận thực nghiệm dựa vào việc thực hiện các thí nghiệm trong phòng thí nghiệm và ngoài hiện trường đề xác định các tính chất cơ lý của đất và đá Các thí nghiệm trong phòng như phân tích thành phần hạt, thí nghiệm Atterberg, thí nghiệm nén một trục
Trang 7của nền đất dưới tác động của tải trọng Bên cạnh đó, các thí nghiệm hiện trường như xuyên tiêu chuẩn (SPT), xuyên tĩnh (CPT), cắt cánh (VST) và nén tĩnh tại hiện trường
(PLT) giúp đánh giá độ chặt, sức chịu tải và độ bền của nền đất ngay trong điều kiện tự nhiên Phương pháp thực nghiệm có độ chính xác cao nhưng thường tốn kém và mất
nhiều thời gian, đòi hỏi phải được thực hiện cân thận đề giảm thiêu sai số
* Cách tiếp cận lý thuyết và phân tích số
Cách tiếp cận lý thuyết dựa trên các mô hình toán học và phương pháp phân tích cơ học
đất để dự báo ứng xử của nền đất dưới các điều kiện tải trọng khác nhau Các mô hình cổ
điển như lý thuyết đàn hồi, lý thuyết dẻo, và lý thuyết cố kết được sử dụng để tính toán độ lún, sức chịu tải và độ ôn định của nền đất Tuy nhiên, do sự không đồng nhất và phi tuyến
tính của đất, các mô hình này thường được kết hợp với phương pháp phân tích số để nâng
cao độ chính xác Phân tích số sử dụng các phương pháp tính toán như phương pháp phần
tử hữu hạn (FEM - Finite Element Method) và phương pháp phần tử rời rạc (DEM - Discrete Element Method) để mô phỏng ứng xử của đất trong các điều kiện thực tế Các
phần mềm như Plaxis, FELAC, GeoStudio cho phép phân tích độ bền của mái dốc, ổn định
nền móng và ảnh hưởng của nước ngầm đến công trình Phương pháp này có ưu điểm là có
thể mô phỏng nhiều kịch bản khác nhau, tiết kiệm chỉ phí so với thí nghiệm thực tế, nhưng
lại yêu cầu đữ liệu đầu vào chính xác và kỹ năng chuyên sâu trong xử lý mô hình số
* Cách tiếp cận sử dụng trí tuệ nhân tạo
Sự phát triển của trí tuệ nhân tạo đang mở ra một hướng đi mới trong nghiên cứu địa kỹ
thuật Các thuật toán trí tuệ nhân tạo thường được sử dụng để phân tích dữ liệu địa kỹ thuật và dự đoán các đặc tính của đất dựa trên dữ liệu thực nghiệm Các thuật toán này có khả năng xử lý một lượng lớn dữ liệu trong thời gian ngắn, giúp tối ưu hóa quá trình dự báo và giảm bớt sự phụ thuộc vào các thí nghiệm thực tế Ứng dụng trí tuệ nhân tạo trong địa kỹ thuật cũng có thể được thay trong việc dự báo lún nền móng, đánh giá nguy cơ sạt
lở đất và tối ưu hóa thiết kế công trình Tuy nhiên, một thách thức lớn của phương pháp này là cần có một tập dữ liệu lớn và đáng tin cậy để đào tạo mô hình Nếu dữ liệu không
đủ hoặc không chính xác, mô hình trí tuệ nhân tạo có thể đưa ra các dự đoán sai lệch, ảnh
hưởng đến kết quả nghiên cứu
1.1.4 Những thách thức trong nghiên cứu và thực hành địa kỹ thuật Nghiên cứu lĩnh vực địa kỹ thuật luôn phải đối mặt với nhiều thách thức phức tạp do điều kiện địa chất biến đổi, ảnh hưởng của môi trường và những hạn chế về công nghệ Các kỹ sư địa kỹ thuật không chỉ phải hiểu rõ về đặc tính của đất và đá mà còn phải tìm cách cải thiện phương pháp nghiên cứu và ứng dụng thực tế để nâng cao hiệu qua và độ an
toàn của công trình Một số thách thức chính khi nghiên cứu địa kỹ thuật được trình bày
cụ thể sau đây:
Trang 8Một trong những thách thức lớn nhất trong địa kỹ thuật là sự đa đạng và biến đổi khong
đồng nhất của điều kiện địa chất Đặc tính cơ lý của đất có thể thay đổi đáng kể ngay
trong cùng một khu vực do ảnh hưởng của thành phần khoáng vật, lịch sử địa chất và các
yếu tố môi trường Điều này gây khó khăn trong việc dự báo hành vi của đất dưới tác động của tải trọng và các yếu tố ngoại cảnh Các phương pháp thí nghiệm hiện trường và
mô hình hóa số dù tiên tiễn đến đâu cũng không thẻ hoàn toàn mô phỏng chính xác mọi điều kiện thực tế Do đó, các kỹ sư phải luôn điều chỉnh và tối ưu hóa phương pháp thiết
kế để phù hợp với từng khu vực cụ thể
Biến đổi khí hậu đang ngày càng có tác động mạnh mẽ đến địa kỹ thuật, gây ra những
thách thức lớn trong nghiên cứu và thực hành Sự gia tăng của mưa lớn, lũ lụt và nhiệt độ
cực đoan có thể làm thay đổi đáng ké tinh chất cơ lý của đất, ảnh hưởng đến sự ổn định
của công trình Ví dụ, hiện tượng xói mòn, sạt lở đất và hóa lỏng đất ngày càng phổ biến,
đặc biệt là ở các khu vực có địa hình phức tạp như miền núi và vùng ven biển Các công trình xây dựng phải đối mặt với nguy cơ lún sụt và mất ôn định do sự thay đổi của mực nước ngầm Điều này đòi hỏi các kỹ sư phải phát triển các phương pháp thiết kế linh hoạt
và tích hợp các giải pháp chống chịu thiên tai vào quá trình xây dựng
Một vấn đề lớn khác trong nghiên cứu địa kỹ thuật là sự hạn chế của đữ liệu về đặc
điểm cơ lý của đất và đá Việc thu thập dữ liệu thực địa đòi hỏi chi phí cao, thời gian dài
và gặp nhiều khó khăn về kỹ thuật Các thí nghiệm hiện trường như xuyên tiêu chuẩn
(SPT), xuyên tinh (CPT) hay cat cánh (VST) thường chỉ cung cấp dữ liệu cục bộ, trong khi các phép đo trong phòng có thể không phản ánh chính xác điều kiện thực tế Ngoài ra,
việc xử lý và phân tích dữ liệu địa kỹ thuật cũng là một thách thức do sự phức tạp và không đồng nhất của đất Các phương pháp truyền thống thường mắt nhiều thời gian và
chỉ phí tiến hành thí nghiệm
Mặc dù công nghệ địa kỹ thuật đã có những bước phát triển đáng kể, nhưng vẫn còn nhiều hạn chế trong việc mô phỏng chính xác hành vi của đất và nền móng dưới các điều
kiện tải trọng khác nhau Các phần mềm mô phỏng như Plaxis, FLAC, GeoStudio có thé
hỗ trợ phân tích địa kỹ thuật, nhưng vẫn cần dữ liệu đầu vào chính xác để đảm bảo tính kha thi của mô hình Hơn nữa, một số mô hình số vẫn chưa thể mô phỏng chính xác các hiện tượng phức tạp như trượt lở đất, hóa lỏng đất đo động đất hay tác động của nước ngầm trong dài hạn Điều này đòi hỏi các nhà nghiên cứu phải tiếp tục cải tiền thuật toán, phát triển các phương pháp thí nghiệm mới và tích hợp nhiều nguồn dữ liệu hơn để nâng cao độ chính xác của dự báo địa kỹ thuật
Gần đây, sự phát triển của các phương pháp nghiên cứu, công nghệ trí tuệ nhân tạo
đang góp phần giải quyết nhiều vấn dé trong cuộc sống, nhưng vẫn cần có những cải tiến đáng ké để nâng cao độ chính xác và hiệu quả của các giải pháp địa kỹ thuật Trong bối cảnh đô thị hóa nhanh chóng và nhu cầu phát triển hạ tầng bền vững, việc tiếp tục nghiên
cứu, đổi mới công nghệ và đào tạo chuyên môn là điều cần thiết để đối phó với những
thách thức trong lĩnh vực địa kỹ thuật.
Trang 91.2 GIỚI THIEU VE TRi TUE NHAN TAO
1.2.1 Khái niệm về trí tuệ nhân tạo
Trí tuệ nhân tao (Artificial Intelligence - ATI) là một lĩnh vực của khoa học máy tính tập trung vào việc phát triển các hệ thống có khả năng thực hiện những nhiệm vụ đòi hỏi trí
thông minh của con người [3] Các hệ thống AI có thể học hỏi từ đữ liệu, đưa ra quyết
định, suy luận, nhận diện mẫu và giải quyết vấn đề một cách tự động Mục tiêu chính của
AI là mô phỏng khả năng nhận thức và tư duy của con người, từ đó tạo ra các công nghệ
có thê hỗ trợ hoặc thay thế con Tigười trong nhiều lĩnh vực khác nhau [3]
Hình 1.1 Trí tuệ nhân tạo mô phỏng trí thông mình của con người [4]
1.2.2 Lịch sử hình thành và phát triển của trí tuệ nhân tạo
Mặc dù AI chỉ chính thức được định danh vào giữa thế kỷ XX, nhưng ý tưởng về các
cỗ máy có thé suy nghĩ, học hỏi và ra quyết định đã xuất hiện từ hàng thé ky trước Lịch
sử hình thành và phát triển của AI trải qua nhiều giai đoạn, từ những nền tảng lý thuyết ban đầu đến các đột phá công nghệ gần đây, đưa AI trở thành một trong những lĩnh vực quan trọng nhất của thời đại kỹ thuật số [3]
* Giai đoạn sơ khai (Trước 1950) - Nền móng lý thuyết
Trước khi AI chính thức được nghiên cứu như một ngành khoa học độc lập, nhiều nhà triết học, toán học và nhà khoa học máy tính đã đặt nền móng cho sự phát triển của trí tuệ nhân tạo Từ thời cổ đại, Aristotle (384 - 322 TCN) đã nghiên cứu về logic và suy luận,
đưa ra các nguyên tắc lập luận có thể được áp đụng trong các hệ thống tính toán hiện đại
10
Trang 10Vào thé ky XVII, René Descartes va Gottfried Wilhelm Leibniz phat trién khai niém về
máy móc tự động và logic toán học, giúp hình thành ý tưởng rằng tư duy của con người có thể được mô phỏng bằng các quy tắc tính toán
Sang thé ky XX, su ra đời của máy tính điện tử đánh dâu bước tiễn quan trọng trong
lĩnh vực AI Nhà toán học người Anh Alan Turing (1912 - 1954) là một trong những
người tiên phong khi đề xuất khái niệm Máy Turing năm 1936 [5], một mô hình lý thuyết
có thể thực hiện mọi phép toán có thể tính toán được Năm 1950, Turing xuất bản bài báo
Computing Machinery and Intelligence [6], trong đó ông đặt ra câu hỏi “Máy có thể suy nghĩ không?” và đề xuất bài kiểm tra Turing (Turing Test) dé xác định liệu một máy tính
có thể thể hiện trí thông minh giống con người hay không Đây được coi là một trong những dấu mốc quan trọng mở đường cho sự phát triển của AI sau này,
* Giai đoạn khởi đầu (1950 - 1970) - Sự ra đời của AI
Thuật ngữ “Artificial Intelligence” (Trí tuệ nhân tạo) chính thức được giới thiệu tại Hội
nghị Dartmouth năm 1956 do nhà khoa học máy tính John McCarthy tổ chức Hội nghị này quy tụ nhiều nhà nghiên cứu hàng đầu thời bấy giờ, như Marvin Minsky, Claude
Shannon và Nathaniel Rochester, đánh dấu sự ra đời của AI như một lĩnh vực nghiên cứu
chính thức
Trong thập niên 1950 và 1960, nhiều chương trình AI đầu tiên được phát triển, trong đó
có Logic Theorist của Allen Newell và Herbert A Simon (1955), có khả năng chứng minh
các định lý toán học Một hệ thống khác là Perceptron (1958), một mô hình mạng nơ-ron
nhân tạo sơ khai do Frank Rosenblatt phát triển, đặt nền móng cho học sâu (Deep
Learning) sau này
Cũng trong thời kỳ này, Joseph Weizenbaum phát triển ELIZA (1966), một chatbot có thể mô phỏng cuộc trò chuyện với con người bằng cách sử dung các quy tắc đơn giản dé
phản hồi người dùng Dù còn sơ khai, ELIZA đã chứng minh tiềm năng của AI trong việc
giao tiếp bằng ngôn ngữ tự nhiên Tuy nhiên, AI thời kỳ này chủ yếu dựa trên các quy tắc lập trình cứng (rule-based), chưa thể xử lý các vấn đề phức tạp như con người
* Giai đoạn trì trệ (1970 - 1980) - Mùa đông AI đầu tiên
Sau những thành công ban đầu, AI nhanh chóng đối mặt với những thách thức lớn Các
hệ thống AI thời đó gặp nhiều hạn chế do sức mạnh tính toán còn yếu, dữ liệu huấn luyện
hạn chế, và quan trọng nhất là các mô hình suy luận logic không thể mở rộng đề giải quyết các vấn đề thực tế phức tạp
Chính phủ Mỹ, vốn là nguồn tài trợ chính cho các nghiên cứu AI, dần mất kiên nhẫn
khi AI không thể đạt được những kỳ vọng ban đầu Việc cắt giảm ngân sách dẫn đến giai
đoạn “Mùa đông AI” (AI Winter) vào những năm 1970 [7], khi hầu hết các nghiên cứu về
AI bị đình trệ Đây là thời kỳ khó khăn đối với cộng đồng AI, nhưng cũng là thời gian để
các nhà nghiên cứu tìm kiếm những hướng đi mới
Trang 11AI dần hồi sinh vào đầu thập niên 1980 với sự phát triển của hệ chuyên gia (Expert Systems) - các hệ thống có thể đưa ra quyết định dựa trên tập hợp các quy tắc logic [8] Các
hệ chuyên gia như MYCIN (trong y học) [9] và XCON (trong công nghiệp) [10] chứng
minh rằng AI có thể được ứng dụng trong các lĩnh vực cụ thể, mang lại giá trị thực tiễn Bên cạnh đó, mạng nơ-ron nhân tạo (Artifcial Neural Networks - ANNs) được tái
khám phá nhờ thuật toán truyền ngược (Backpropagation), giúp cải thiện đáng kể khả
năng học của các hệ thống AI Dù chưa thực sự phổ biến, mạng nơ-ron đã đặt nền móng
cho sự bùng nổ của AI trong những thập kỷ tiếp theo
* Giai đoạn bùng nỗ (1990 - 2010) - Học máy và dữ liệu lớn
Nhờ sự phát triển của máy tính và sự gia tăng của dữ liệu số, AI bước vào thời kỳ phát
triển mạnh mẽ với học máy (Machine Learning - ML) Các thuật toán như Support Vector Machines (SVM), Random Forest, và Deep Learning bắt đầu được nghiên cứu và ứng dụng rộng rãi
Một cột mốc quan trọng là vào năm 1997, khi siêu máy tính Deep Blue của IBM đánh bại đại kiện tướng cờ vua Garry Kasparov [I1], chứng tỏ khả năng vượt trội của AI trong
các trò chơi chiến lược Tiếp đó, vào năm 2006, Geoffrey Hinton và đồng nghiệp phát
triển mô hình Deep Learning [12], mở ra một kỷ nguyên mới trong lĩnh vực AI
* Kỷ nguyên AI hiện đại (2010 - nay) - Trí tuệ nhân tạo mạnh mế
Những năm gần đây, AI đạt được những bước đột phá nhờ vào sự phát triển của Deep Learning và Big Data Các hệ thống AI không chỉ giỏi trong trò chơi mà còn có thể nhận
diện hình ảnh, hiểu ngôn ngữ tự nhiên và thực hiện các tác vụ phức tạp như sáng tạo nội
dung và lái xe tự hành
Một trong những thành tựu nôi bật là vào năm 2016, khi AlphaGo của Google DeepMind đánh bại kỳ thủ cờ vây huyền thoại Lee Sedol [13], chứng minh rằng AI có thể học từ dữ
liệu ở mức độ cao hơn nhiều so với trước đây
AI ngày nay đã trở thành một phần quan trọng của đời sống, với các ứng dụng trong y
tế (chân đoán bệnh), giao thông (xe tự lái), tài chính (giao dịch tự động), và nhiều lĩnh vực khác
* Tương lai của AI
Trong tương lai, AI sẽ tiếp tục phát triển theo nhiều hướng khác nhau, bao gồm AI tổng quát (AGI - Artificial General Intelligence), noi máy tính có thể tư duy và học hỏi giống
như con người Đồng thời, các vấn đề về đạo đức AI, tính minh bạch và an toàn cũng sẽ trở thành trọng tâm nghiên cứu để đảm bảo rằng AI phục vụ lợi ích của nhân loại một
cách bền vững
Trang 12Nội dung của trí tuệ nhân tạo bao gồm việc xây dựng và tối ưu hóa các thuật toán và
mô hình cho phép máy móc có thể học hỏi từ dữ liệu, đưa ra quyết định, và giải quyết các
vấn đề một cách tự động và thông minh Nội dung của trí tuệ nhân tạo bao gồm nhiều
nhánh, trong đó nồi bật là hệ thống chuyên gia, học máy, xử lý ngôn ngữ tự nhiên, thị giác máy tính, và robotics (Hinh 1.2) [3, 14] Cu thé:
* Hệ thông chuyên gia (Expert System) là một trong những lĩnh vực quan trong của trí
tuệ nhân tạo (AI), được thiết kế để mô phỏng quá trình ra quyết định của con người dựa
trên tri thức chuyên ngành và lập luận logic Những hệ thống này có khả năng phân tích thông tin, đưa ra các khuyến nghị hoặc giải pháp giống như một chuyên gia thực thụ trong
lĩnh vực cụ thé
Machine Learning
Hệ chuyên gia Người © ae
Expert systems Robotics
Xử lý ngôn ngữ tự nhiên Natural language processing
Hinh 1.2 Cac ngi dung chinh cua AI [15]
* Học máy (Machine Learning) tập trung vào việc phát triên các thuật toán và mô
hình cho phép máy móc học hỏi từ đữ liệu và cải thiện hiệu suất của chúng theo thời gian
mà không cần phải lập trình lại một cách rõ ràng
* Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) tập trung vào việc cho phép máy móc hiểu, diễn giải, và phản hồi các văn bản hoặc âm thanh bằng ngôn ngữ
tự nhiên của con người NLP là cầu nối giữa máy tính và ngôn ngữ của con người, và có nhiều ứng dụng quan trọng: Tìm kiếm thông tin, dịch máy, tóm tắt văn bản
* Thị giác máy tinh (Vision systems) 1a việc cho phép máy móc nhận điện và hiểu được thông tin từ hình ảnh và video, tương tự như cách mà con người sử dụng thị giác đê
nhận diện và phân tích thế giới xung quanh
* Người máy (Robotics) nghiên cứu việc thiết kế, chế tạo, và vận hành các robot có thể
thực hiện các nhiệm vụ tự động Robots học kết hợp nhiều lĩnh vực khác nhau như cơ học, điện tử, và AI để tạo ra các hệ thống robot có khả năng tương tác với môi trường và thực
hiện các nhiệm vụ phức tạp
Trang 13Bản chất của các kỹ thuật trí tuệ nhân tạo trong việc giải quyết bất kỳ van đề kỹ thuật nao là tìm hiểu bằng các ví dụ về đầu vào và đầu ra dữ liệu được cung cấp cho chúng để các mối quan hệ giữa các dữ liệu được nắm bắt, ngay cả khi các mối quan hệ cơ bản
không được biết hoặc ý nghĩa vật lý khó giải thích Do đó, các mô hình trí tuệ nhân tạo là
các mô hình dựa trên đữ liệu chỉ dựa vào dữ liệu để xác định cấu trúc và tham số chỉ phối một hiện tượng (hoặc hệ thống) và không đưa ra bất kỳ giả định nào về hành vi vật lý của
hệ thống Điều này trái ngược với hầu hết các mô hình dựa trên vật lý sử dụng các nguyên tắc đầu tiên (ví dụ: các quy luật vật lý) để rút ra các mối quan hệ cơ bản của hệ thống,
thường được đơn giản hóa một cách chính đáng với nhiều giả định và đòi hỏi kiến thức trước về bản chất của các mối quan hệ giữa các dữ liệu Đây là một trong những lợi ích
chính của kỹ thuật AI khi so sánh với hầu hết các phương pháp thống kê và thực nghiệm
ƒ chưa biết có liên quan đến biến đầu vào x với biến đầu ra y Nếu mi quan hệ giữa x và y
là phi tuyến tính, phân tích hồi quy thống kê chỉ có thể được áp dụng thành công nếu kiến thức trước về bản chất của phi tuyến tính tồn tại Ngược lại, kiến thức trước đây về bản chất của phi tuyến tính là không cần thiết cho các mô hình trí tuệ nhân tạo Trong thế giới thực, có khả năng gặp phải các vấn đề phức tạp và phi tuyến tính cao, và trong các tình huống như vậy, các phân tích hồi quy truyền thống là không thỏa đáng
Nhìn chung, bản chất của trí tuệ nhân tạo có thể được hiểu qua ba khía cạnh chính: khả
năng học hỏi từ dữ liệu, tự động điều chỉnh và tối ưu hóa hành vi, và cải thiện hiệu suất theo thời gian [3] Cu thé:
* Khả năng học hỏi từ dữ liệu: Trí tuệ nhân tạo hoạt động dựa trên việc khai thác và
phân tích một lượng lớn đữ liệu để học hỏi và rút ra các mẫu hoặc quy luật Các thuật toán học máy là công cụ chủ yếu để trí tuệ nhân tạo có thể học từ dữ liệu
* Tự động điều chỉnh và tối ưu hóa hành vi: Trí tuệ nhân tạo có khả năng tự động điều chỉnh hành vi dựa trên kinh nghiệm tích lũy Các hệ thống trí tuệ nhân tạo có thể tự cải thiện hiệu suất của chúng thông qua việc tối ưu hóa các tham số hoặc cấu hình của mô
hình dựa trên phản hồi từ môi trường
* Cải thiện hiệu suất theo thời gian: Trí tuệ nhân tạo không chỉ hoạt động tốt với các
nhiệm vụ mà nó đã được lập trình để thực hiện, mà còn có khả năng cải thiện hiệu suất
qua thời gian thông qua việc học hỏi và điều chỉnh liên tục
14
Trang 14Hoc may (Machine Learning - ML) 1a mét linh vuc quan trong cua tri tuệ nhân tạo, trong đó các thuật toán giúp hệ thông tự học từ đữ liệu đê thực hiện dự đoán hoặc quyét
định mà không cân lập trình trực tiêp Băng cách khai thác các mô hình thông kê, học máy
có thê phát hiện các mâu trong đữ liệu và cải thiện hiệu suât theo thời gian
Học máy có thể được chia thành bốn nhóm chính [3] (Hình 1.3):
1 Học có giám sát (Supervised Learning)
2 Học không giám sát (Unsupervised Learning)
3 Học bán giám sát (Semi- Supervised Learning)
4 Học tăng cường (Reinforcement Learning)
Học Paton
TC
Hình 1.3 Các nhóm phương pháp học máy
* Học có giám sát là phương pháp trong đó mô hình được huấn luyện trên một tập dữ
liệu có nhãn, tức là mỗi đầu vào (input) đều có một đầu ra mong muốn (output) Mục tiêu của thuật toán là học cách ánh xạ từ đầu vào sang đầu ra dựa trên các ví dụ trong tập huấn
luyện Học có giám sát có thể giải quyết hai dạng bài toán chính:
«Bài toán phân loại (Classication): Dự đoán các biến đầu ra đầu ra được gán
nhãn phân loại, ví dụ như bài toán phân loại nhị phân trong dự báo không gian sạt
lở đất có hai biến phân loại là “sạt lở đất” thường được gán là “I” và “không sạt
lở đất” thường được gán là “0”; hoặc bài toán phân loại đa biến sử dụng trong phân loại đất
+ Bài toán hôi quy (Regression): Dự đoán biễn đầu ra là các giá trị liên tục, ví dụ
như dự đoán giá trị của các tham số sức chống cắt của đất, dự đoán giá trị sức chịu tải của móng nông, hoặc giá trị sức chịu tải của cọc đóng
Trang 15đầy đủ và chất lượng, có thể dé dàng diễn giải kết quả với các loại mô hình học máy đơn giản, và có thể ối ưu hóa tốt cho các bài toán dự báo Tuy nhiên, nhược điểm của học có
giám sát là cần một lượng lớn đữ liệu có nhãn đảm bảo đây đủ, có tính đại diện và đảm bảo độ tin cậy, một số mô hình phức tạp đòi hỏi thời gian huấn luyện lâu với đữ liệu lớn,
và một số mô hình hiệu suất không tốt nếu dữ liệu bị nhiễu hoặc mất cân bằng
* Học không giám sát là phương pháp mà mô hình không có dữ liệu đầu ra cụ thể mà phải tự tìm ra cấu trúc và mẫu trong dữ liệu Học không giám sát chủ yếu gồm hai nhóm
bài toán:
» - Bài toán phân cụm (Clustering): Chia đữ liệu thành các nhóm có đặc điểm tương đồng, như phân nhóm khách hàng Bài toán này có thể áp dụng cho việc phân loại đối tượng trên ảnh, sử dụng để nhận diện tự động các vị trí sạt lở đất khi phân tích anh vé tinh
+ Bài toán giảm chiều dữ liệu (Dimensionality reduction): Giảm số lượng đặc trưng trong đữ liệu mà vẫn giữ được thông tin quan trọng Bài toán này có thể được sử dụng để loại trừ bớt các tham số đầu vào không quan trọng, giúp cải thiện hiệu suất
của mô hình dự báo
Ưu điểm của học không giám sát là có thể giải quyết bài toán mà không cần dữ liệu có nhãn, có thể khám phá các mẫu dữ liệu ân mà con người không thấy Tuy nhiên, nhược điểm của học không giám sát là khó đánh giá độ chính xác và kết quả của bài toán có thể không trực quan
* Học máy bán giám sát là một phương pháp kết hợp giữa học máy có giám sát và
không giám sát, trong đó hệ thống sử dụng cả dữ liệu có nhăn và không có nhãn để huấn
luyện mô hình Phương pháp này đặc biệt hữu ích khi có một lượng dữ liệu quá lớn hoặc
đữ liệu có mức độ đa dạng cao, khiến việc gán nhãn thủ công trở nên khó khăn hoặc tốn
kém Trong những trường hợp này, thuật toán sẽ tự động đưa ra dự đoán và xây dựng các
mô hình tổng quát dựa trên cả hai loại dữ liệu đầu vào
Bằng cách tận dụng một lượng nhỏ dữ liệu có nhãn để hướng dẫn quá trình học, hệ
thống có thể trích xuất thông tin từ tập dữ liệu lớn không gán nhãn, giúp cải thiện khả năng phân loại và nhận dạng đặc trưng Học máy bán giám sát trở thành một giải pháp
hiệu quả khi không có đủ dữ liệu gán nhãn để huấn luyện các mô hình học có giám sát
một cách đầy đủ
* Học tăng cường là một phương pháp học máy mà trong đó một tác nhân (agent) học
cách thực hiện các hành động tối ưu trong một môi trường (environment) thông qua quá
trình thử - sai và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt Thay vì dựa trên tập dữ liệu huấn luyện có định như học có giám sát, học tăng cường cho phép hệ thống
học hỏi bằng cách tự tương tác với môi trường và dần dần cải thiện hiệu suất theo thời 16
Trang 16lược mới và khai thác (exploitation) các chiến lược tối ưu đề đạt được phần thưởng cao nhất Ví dụ: Học tăng cường có thê giúp điều chỉnh các yếu tố như độ dốc, hệ thống thoát
nước, hoặc vật liệu gia cố đề tối ưu hóa hệ số an toàn của mái dốc
Ưu điểm của học tăng cường là có thể liên tục cập nhật và cải thiện chiến lược theo
thời gian, giúp hệ thống tự tối ưu hóa, các mô hình có thể học hỏi từ các quyết định trong
quá khứ và điều chỉnh chính sách để đạt hiệu suất tốt hơn Tuy nhiên, nhược điểm của học
tăng cường là yêu cầu một số lượng lớn lần thử nghiệm để tìm ra chính sách tối ưu, điều
này có thê gây tốn kém trong các mô hình thực tế Ngoài ra, các thuật toán học tăng cường
có nhiều siêu tham số cần được tối ưu hóa để đảm bảo hội tụ và hiệu suất cao 1.2.6 Các bước cơ bản ứng dụng học máy
Các bước cơ bản trong ứng dụng học máy được thẻ hiện như trong Hình 1.4:
Hình 1.4 Sơ đô các bước ứng dụng học may (https://aptech.fpt.edu.vn/machine-learning html)
Bước I: Xây dựng cơ sở dữ liệu
Đề các mô hình học máy đưa ra các dự đoán, phân tích chính xác, cần thiết phải cung cấp một bộ dữ liệu cho máy học Các đữ liệu có thể được thu thập từ nhiều nguồn khác
nhau, có thể từ các kết quả thực nghiệm hoặc kết quả của các mô phỏng số Tuy nhiên, cần lưu ý rằng, các dự liệu này cần phải được thu thập và xây dựng từ những nguồn chính thống, đảm bảo đầy đủ về số lượng và chất lượng để các mô hình học máy có thể học
được một cách chính xác và đưa ra những kết quả đúng đắn, có hiệu suất cao hơn
Bước 2: Xử lý tiền dữ liệu
Bước tiền xử lý khi ứng dụng học máy dùng để chuẩn hóa các dữ liệu vừa thu thập
được, giúp loại bỏ các thuộc tính không cần thiết, những đữ liệu bị hỏng, thiếu Đồng thời
bước này sẽ tiến hành gán nhãn, mã hóa các đặc trưng, trích xuất những đặc trưng và rút
gọn bộ dữ liệu mà vẫn đảm bảo kết quả đầu ra Các dữ liệu có thể được chia thành các tập
con khác nhau với các tỷ lệ phù hợp được sử dụng để huấn luyện mô hình và dé đánh giá, kiêm chứng mô hình
Trang 17Mô hình học máy ở bước này được huấn luyện trên cơ sở sử dụng dữ liệu đào tạo được xây dựng ở các bước trước đó Mục tiêu của bước này là để mô hình học tập được các quy
luật, các mẫu từ các dữ liệu được cung cấp
Bước 4: Đánh giá mô hình
Sau khi đã tiến hành huấn luyện mô hình, bước tiếp theo trong ứng dụng học máy
đó là đánh giá hiệu suất mô hình vừa được đào tạo Tuy thuộc vào từng các loại độ đo
khác nhau mà mô hình vừa huấn luyện được đánh giá là tốt hay không tốt khác nhau
Về cơ bản, độ chính xác của mô hình vừa huấn luyện đạt trên 80% duge cho là đảm
bảo hiệu quả
Bước 5: Cải thiện mô hình
Trong bước cải thiện này, những mô hình học máy sau khi đã được đánh giá nếu không
đạt được hiệu suất theo như yêu cầu mong đợi thì sẽ được tiến hành lại Bước 3 cho đến
khi độ chính xác đạt đúng kỳ vọng cần thiết
1.43 CÔNG CỤ/PHẢN MÈM MÔ HÌNH HÓA CÁC KỸ THUẬT TRÍ TUỆ NHÂN TẠO
Các công cụ và phần mềm ứng dụng kỹ thuật trí tuệ nhân tạo đóng vai trò quan trọng
trong nghiên cứu, phát triển và ứng dụng thực tiễn, đặc biệt trong các lĩnh vực kỹ thuật và
địa kỹ thuật Các công cụ này không chỉ giúp xây dựng và huấn luyện mô hình học máy,
mà còn hỗ trợ xử lý dữ liệu, trực quan hóa kết quả, đánh giá hiệu suất và triển khai ứng
dụng vào thực tế (Bảng 1.1)
Một trong những phần mềm phổ biến nhất là MATLAB, đặc biệt với các bộ công
cụ mở rộng như Neural Network Toolbox, Fuzzy Logic Toolbox, và Machine
Learning Toolbox MATLAB phù hợp với các kỹ sư và nhà nghiên cứu nhờ giao diện trực quan, khả năng mô phỏng mạnh mẽ và hệ sinh thái công cụ phong phú, đặc biệt
hiệu quả khi triển khai các mô hình như ANN, ANFIS, hoặc SVM trong các bài toán
kỹ thuật thực nghiệm
Bên cạnh đó, Python hiện là ngôn ngữ lập trình hàng đầu trong lĩnh vực AI nhờ vào
tính linh hoạt cao và cộng đồng phát triên mạnh mẽ Với các thư viện mã nguồn mở như scikit-learn, TensorFlow, Keras, PyTorch, Python cho phép xây dựng từ các mô hình học máy cơ bản đến các mô hình học sâu tiên tiến Ngoai ra, thu vién pandas va NumPy hỗ trợ mạnh mẽ trong xử lý dữ liệu, trong khi A⁄2ipiotlib và Seaborn phục vụ tốt cho VIỆC trực
quan hóa kết quả
Đối với những người không chuyên về lập trình, các phần mềm như WEKA, SPSS Modeler, RapidMiner va Orange mang lại giải pháp tiếp cận dé dàng hơn WEKA là công
cụ mã nguồn mở hỗ trợ đa dạng thuật toán học máy và được sử dụng phổ biến trong giảng
Trang 18phân tích thống kê và mô hình hóa dự báo, được sử dụng rộng rãi trong các lĩnh vực kinh
tế, xã hội và kỹ thuật ứng dụng RapidMiner và Orange cung cấp môi trường kéo — tha thân thiện, cho phép người đùng xây dựng quy trình học máy mà không cần lập trình, rất phù hợp với đào tạo, nghiên cứu ứng dụng và phân tích dữ liệu thực tế
Ngoài ra, Google Colab là một nền tảng điện toán đám mây miễn phí cho phép chạy
mã Python, tích hợp sẵn các thư viện học máy và học sâu Đây là công cụ lý tưởng cho nghiên cứu và thử nghiệm mô hình AI có yêu cầu tính toán cao, nhờ khả năng sử dụng
GPU/TPU mà không cần phần cứng chuyên dụng
Bảng 1.1 Công cụ/phần mềm ứng dụng trí tuệ nhân tạo
.„ |Mô phỏng, trực quan, | Chi phi ban quyền Kỹ sư, nhà nghiên cứu MATLAB | T Fung 01" | 18 tro tot ANN/ANFIS | cao bình |, x Z kỹ thuật
Python Cao Mạnh về Al/Deep Can kiến thức lập Nhà phát triển, nghiên
learning, linh hoạt trình cứu AI
WEKA Thấp Đơn giản, trực quan, Khả năng tùy biến Người mới học, giảng
dé str dung han ché vién
SPSS Thá Kéo - thả, mạnh Ít linh hoạt với mô Nhà phân tích dữ liệu, Modeler p về phân tích thông kê hình phức tạp doanh nghiệp
` Thấp - |H6 tro AI, phân tích dữ | Giới hạn thuật toán |Phân tích dữ liệu ứng RapidMiner gi om i À aa
Trung bình | liệu không cần code hiện đại dụng
k Trực quan, dé giảng Hạn chế mô hình sâu, | Giáo dục, sinh viên, Orange Thap a x ie mm"
dạy, mã nguôn mở xử lý lớn nghiên cứu cơ bản Google _ | Trung bình |Miễn phí, hỗ trợ GPU, |Phụ thuộc Internet, |Nghiên cứu AI, Colab - Cao tích hợp thư viện AI giới hạn bộ nhớ mô hình deep learning
1.4 MỘT SỐ NGHIÊN CỨU ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG ĐỊA
KỸ THUẬT
1.4.1 Ứng dụng cho bài toán dự báo các chỉ tiêu cơ lý cúa đất
Chỉ tiêu cơ lý cũng như ứng xử cơ học của đất là một lĩnh vực đã thu hút sự quan tâm
của nhiều nghiên cứu Các chỉ tiêu cơ lý quan trọng của đất như độ chặt, sức chống cắt, độ
cỗ kết, chỉ số nén, hệ số thấm, độ trương nở ., là các chỉ số thường tốn nhiều thời gian và
công sức đề tiễn hành thí nghiệm xác định ở trong phòng hoặc ngoài hiện trường, được các
nhà nghiên cứu quan tâm và ứng dụng các mô hình trí tuệ nhân tạo để dự báo Cụ thể,
Niyogi, et al [16] đã ứng dụng và so sanh 03 mô hình trí tuệ nhân tạo khác nhau gồm có: máy vec tơ hỗ trợ (SVM), rừng ngẫu nhiên (RF) và mạng thần kinh học sâu (DNN) để dự
báo cường độ chống cắt của đất đất laterit có nguồn gốc bazan thu thập đọc theo quốc lộ 66,
Trang 19đất với các tham số đầu vào được xem xét gồm có: trọng lượng đơn vị, khối lượng thể tích
khô lớn nhất, giới hạn chảy, chỉ số đẻo và độ ẩm tối ưu Kết quả của nghiên cứu cho thay
các mô hình trí tuệ nhân tạo được áp dụng có độ chính xác rất cao (R’ > 0.9); trong đó, mô hình DNN (RỂ = 0.99) có độ chính xác cao nhất so với hai mô hình con lai (SVM va RF)
Một số nghiên cứu khác ứng dụng trí tuệ nhân tạo trong dự báo cường độ chống cắt của đất
với các bộ cơ sở dữ liệu và các mô hình khác nhau được thể hiện ở Bảng 1.2 [17]
Bảng 1.2 Một số nghiên cứu khác ứng dụng trí tuệ nhân tạo
trong dự báo cường độ chống cắt của đất [17]
Tài liệu Số mẫu Biến đầu vào Mô hình AI| R? |RMSE
Elsawy và 111 Độ ẩm tự nhiên, trọng lượng thê tích Fine 0.96 1.65 đồng nghiệp khô đơn vị, giới hạn chảy, chỉ số dẻo, Gaussian
[I8] chỉ số độ cứng, hệ số rỗng, trọng lượng SVR
riêng và cường độ cắt xuyên nhanh
Zhang vadéng| 304 Ứng suất hữu hiệu theo phương thang | XGBoost | 0.92 | 2.38
nghiép [19] đứng, ứng suất tiền cố kết, giới hạn
chảy, giới hạn dẻo và độ âm tự nhiên
được sử dụng đề đánh giá chính xác độ trương nở của đất và các mô hình mạng thần kinh
có thể cung cấp những cải tiến đáng kể về độ chính xác dự đoán so với các mô hình thống
kê; Romero and Pamukcu [21] đã chỉ ra rằng các mạng lưới thần kinh có thể đặc trưng và
ước tính hiệu quả mô đun kháng cắt của vật liệu dang hat; Gribb and Gribb [22] va Najjar
and Basheer [23] đều sử dụng các mô hình ANN đề ước tính tính thâm của lớp đất sét; Najjar, et al [24] cũng giới thiệu mô hình ANN đề dự báo về độ đầm chặt của đất
1.4.2 Ứng dụng trí tuệ nhân tạo cho bài toán móng nông
Ứng dụng trí tuệ nhân tạo trong một số bài toán liên quan đến móng nông đã được nghiên cứu và phân tích bởi một số tác giả trên thế giới Cụ thé, Sivakugan, et al [25] đã
sử dụng thuật toán mạng thần kinh nhân tạo (Artificial Neural Network - ANN) đề dự báo
độ lún của móng nông trên nên đất rời Một mô hình ANN đã được huấn luyện với 79 bộ
số liệu khác nhau với năm thông số đầu vào là áp lực đáy móng, chỉ số SPT, chiều rộng
móng, hình dạng móng và độ sâu của móng Kết quả thu được được so sánh với các
phương pháp được đề xuất bởi Terzaghi và Peck [26] và Schmertmann [27] Kết qua So
sánh cho thấy các phương pháp truyền thống của phương pháp Terzaghi - Peck và Schmertmann cho giá trị ước tính cao hơn giá trị thực tế lần lượt là 2.18 lần và 3.39 lần
Trong khi đó các dự đoán sử dụng thuật toán ANN rất gần với các giá trị thực tế
20
Trang 20tác giả đã tiến hành thu thập 272 bộ số liệu khác nhau để mô hình hóa Các thông số đầu
vào của mô hình bao gồm chiều rộng móng, chiều dài móng, áp lực đáy móng và hệ số nén lún của đất Kết quả dự báo bởi thuật toán ANN được so sánh với ba phương pháp truyền thống phổ biến nhất là các phương pháp của Meyerhof [29], Schultze và Sherif [30] và Schmertmann [27] Hiệu suất của mô hình và các phương pháp được đánh giá thông qua
các chỉ số thống kê định lượng như hệ số xác định (R?), căn bậc hai của trung bình của bình
phương lỗi (RMSE), và trung bình sai số tuyệt đối (MAE) Kết quả khẳng định thuật toán
ANN có khả năng dự báo vượt trội so với các phương pháp truyền thống (Bảng 1.3)
Trang 21
Giá trị lún dự báo (mm)
R? 0.98 0.189 0.74 0.9 RMSE (mm) 3.9 27 23.8 45.2 MAE (mm) 2.6 20.8 11.1 29.5
Bên cạnh độ lún thì sức chịu tải của móng nông cũng là một thông số được các nha
nghiên cứu quan tâm Soleimanbcigi and Hataf [31] đã phát triển một mô hình ANN đề dự
đoán khả năng chịu lực tối đa của nền móng nông trên nền đất gia có, xây dựng trên dữ liệu gồm 351 bó số liệu thu thập từ các thí nghiệm trong phòng và ngoài hiện trường Kết quả mô hình được so sánh với ba phương pháp truyền thống, bao gồm các phương pháp của Huang và Tatsuoka [32], Huang và Meng [33] và Zhao và đồng nghiệp B4] Các thông số đầu vào của mô hình bao gồm chiều rộng móng, hình dạng móng (tỷ số chiều
dài/chiều rộng của móng), tỷ lệ chiều sâu móng/chiều rộng móng, góc ma sát trong của đất, trọng lượng đơn vị của đất, số lượng gia cố, tý lệ độ sâu của lớp gia cố đầu tiên/chiều
rộng móng, tỷ lệ khoảng cách theo phương đứng của các lớp gia cố/chiều rộng móng, tỷ lệ chiều rộng cốt thép/chiều rộng móng và độ cứng của gia có Hiệu quả dự báo của 4 phương pháp được so sánh định lượng thông qua các chỉ tiêu bao gồm hệ số tương quan r, RMSE và MAE, như giới thiệu trong Bảng 1.4 Dễ thay rằng dự báo bằng ANN vượt trội hơn các phương pháp truyền thống về hiệu suất dự báo Ngoài ra để đánh giá tầm quan trong của các biến đầu vào, các tác giả đã tiến hành phân tích độ nhạy và nhận thấy rằng chiều rộng móng, số lớp gia cố và khoảng cách theo phương đứng của các gia cỗ có tác động nhiều hơn đến sức chịu tải so với các yếu tố đầu vào khác
Bảng 1.4 So sánh hiệu suất dự báo sức chịu tái của móng nông bằng thuật toán ANN
và các phương pháp truyền thống [31]
Phương pháp R? RMSE (kPa) | MAE (kPa) Huang and Tatsuoka [32] 0.897 129.3 76.6 Huang and Meng [33] 0.0003 347.8 238.1 Zhao và đồng nghiệp [34] 0.348 150.7 128.6 ANN[3I] 0.962 45.7 28.2
Trang 22
hạn của móng băng trên nền đất cát chịu tải nghiêng lệch tâm Mô hình ANN được xây dựng dựa trên 78 bộ dữ liệu thu được từ chương trình thí nghiệm trong phòng Mô hình
ANN đã được phát triển để dự đoán hệ số giảm sức chịu tải, được định nghĩa là tỷ số của sức chịu tải của móng chịu tải trọng nghiêng lệch tâm với sức chịu tải của móng chịu tải
thắng đứng trung tâm Các đầu vào mô hình ANN bao gồm tỷ lệ lệch tâm (độ lệch tâm/chiều rộng móng), tỷ lệ chôn sâu móng (độ sâu chôn móng/chiều rộng móng) và tỷ lệ nghiêng của tải trọng (nghiêng tải/góc ma sát trong của đất) Các dự đoán từ mô hình ANN được đem so sánh với phương pháp dự đoán thực nghiệm đề xuất bởi Patra, et al [36] Hệ số tương quan RŸ cho các bộ dữ liệu kiểm tra là 0.995, cho thấy mức độ chính xác cao Khả năng dự báo của mô hình ANN cũng dễ thấy tốt hơn so với các phương trình
thực nghiệm được sử dụng để so sánh Các phân tích độ nhạy khác nhau cũng được thực
hiện để đánh giá các tham số ảnh hưởng nhiều đến hệ số giảm sức chịu tải Kết quả cho thấy rằng tỷ lệ nghiêng tải trọng là tham số đầu vào quan trọng nhất, sau đó là tý lệ lệch tâm và tỷ lệ chôn sâu móng
Một số nghiên cứu khác cũng sử dụng thuật toán ANN thành công để dự báo sức chịu
tải của móng nông như Behera, et al [37] hay Kalinli, et al [38]
Không chỉ có thuật toán ANN mà một số thuật toán khác như lập trình đi truyền
(Genetic programming - GP) hay máy vec tơ hỗ trợ (Support Vector Machines - SVM) cũng được các nhà nghiên cứu sử dụng Cụ thể, Adarsh, et al [39] đã phát triển hai mô
hình trí tuệ nhân tạo GP và SVM đề dự đoán sức chịu tải của móng nông trên nền đất rời (Bang 1.5)
Bang 1.5 So sánh hiệu suất dự báo sức chịu tải của móng nông
băng thuật toán GP, SVM, ANN, FIS và các phương pháp khác [39]
Phương pháp R RMSE (kPa) | MARE (kPa) Meyerhof [40] 0.9410 269.947 22.068 Hansen [41] 0.9366 287.099 20.015 Vesic [42] 0.9456 302.269 28.515 ANN [39] 0.9951 62.620 13.314 SVM [39] 0.9806 130.102 9.453 FIS [39] 0.9899 98.002 19.456
GP [39] 0.9972 44.967 7.682
Trong nghiên cứu nảy, các mô hình được huấn luyên và kiểm chứng trên cơ sở 96 bộ
dữ liệu với các yếu tố đầu vào của mô hình là chiều rộng móng, chiều sâu chôn móng, tỷ
lệ chiều dài/ chiều rộng móng, trọng lượng thẻ tích của và góc ma sát trong của đất được thu thập từ các kết quả thực nghiệm Các kết quả mô hình được so sánh với ba phương pháp lý thuyết của Meyerhof [40], Hansen [41], và Vesie [42], cũng như thuật toán ANN
Trang 23và hệ thống suy luận mờ thích ứng (FIS) Đánh giá thống kê kết quả cho thấy mô hình GP
và ANN có hiệu suất dự báo tương tự nhau Trong đó, GP có hiệu suất tốt hơn so với các
phương pháp lý thuyết và các mô hình trí tuệ nhân tạo khác (SVM và FIS)
Một ứng dụng thành công khác cho việc sử dung GP va EPR để dự đoán sức chịu tải
của nền móng nông được thực hiện bởi Tsai, et al [43] và Pan, et al [44]
1.4.3 Ứng dụng trí tuệ nhân tạo cho bài toán móng cọc
Ứng đụng trí tuệ nhân tạo đã được thực hiện cho bài toán phân tích lún của móng cọc
và dự báo sức chịu tải của cọc sử dụng trong móng Cụ thé, Nejad, et al [45] da str dung
mô hình ANN để dự báo độ lún của móng cọc sử dụng số liệu đầu vào là bộ tham số bao gồm: phương pháp thí nghiệm, loại cọc, các tham số vật liệu của cọc, biện pháp thi công
cọc, etc Khoảng 1013 bộ dữ liệu, thu được từ các tài liệu đã xuất bản, đã được sử dụng để
phát triển mô hình Kết quả dự báo được so sánh với bốn phương pháp truyền thống bao gồm các phương pháp của Vesic [46], Poulos and Davis [47], Das [48] và phương pháp t-
z phi tuyến của Reese và đồng nghiệp [49] Kết quả chỉ ra rằng mô hình ANN có khả năng
dự đoán độ lún của cọc với độ chính xác cao với của hệ số xác định R? bằng 0.945 với các
giá trị độ lún lên tới 185mm, đồng thời mô hình ANN có khả năng dự báo vượt trội so với
các phương pháp còn lại
Với sức chịu tải của móng cọc, Goh [50] đã xây dựng một mô hình ANN đề dự báo sức kháng thân của cọc trong đất sét dựa trên 65 bộ dữ liệu thu thập hiện trường Các thông số đầu vào của mô hình là chiều dài cọc, đường kính cọc, ứng suất trung bình có hiệu và sức
kháng cắt không thoát nước của đất sét Kết quả thu được được so sánh với các kết quả thu được bằng phương pháp Semple and Rigden [51] và phương pháp B bởi Burland [52] Hiệu quả dự báo của các phương pháp tính được so sánh thông qua các chỉ tiêu định lượng như giới thiệu trong Bảng 1.6 Có thể thấy rõ rằng phương pháp ANN cho hiệu quả
dự báo tốt hơn hẳn so với các phương pháp thông thường
Bang 1.6 Hiệu suất dự báo sức kháng ma sát thành bên của móng cọc bằng thuật toán ANN và các phương pháp truyền thống [50]
R? 0.914 0.783
0.496
Goh [53] sau đó, đã phát triển một mô hình ANN khác để ước tính khả năng chịu tải giới hạn của cọc đúc sẵn đóng vào đất rời Trong nghiên cứu này, 94 bộ dữ liệu được sử dụng được lấy từ kết quả thử tải trọng thực tế trên các cọc bằng gỗ, bê tông đúc sẵn và cọc thép được đóng vào đất cát Các yếu tố đầu vào của mô hình ANN là trọng lượng búa,
chiều cao rơi búa, chiều dài cọc, trọng lượng cọc, diện tích mặt cắt ngang của cọc, hệ
24
Trang 24ảnh hưởng nhiều đến kết quả đầu ra là hê thống cọc, loại búa và trọng lượng búa Nghiên
cứu này cũng đã so sánh kết qua thu được với kết quả dự báo bằng các quan hệ phổ biến
sau: công thức của Wellington [54], công thức của Hiley [55] và công thức Janbu [56]
Thực hiện phân tích hồi quy đề xác định hệ số tương quan của kết quả dự báo so với kết quả đo được thực tế của mô hình ANN và các phương pháp truyền thống được giới thiệu trong Bảng 1.7 Có thể thấy rằng mô hình ANN cho kết quả dự báo là tốt hơn so với các phương pháp khác
Bảng 1.7 Hiệu suất dự báo sức chịu tái giới hạn của cọc đúc sẵn trong đất rời bằng thuật toán ANN và các phương pháp truyền thống [53]
R?
0.931 0.377
Kiefa [57] đã giới thiệu ba mô hình ANN đươc gọi tắt là GRNNMI, GRNNM2 va
GRNNM3 để dự đoán sức kháng của các cọc đúc sẵn đóng vào đất rời dựa trên dữ liệu
kiểm tra của 59 cọc thu thập bởi Darrag [58] Mô hình đầu tiên được phát triển đề ước tính tổng sức kháng của cọc Mô hình thứ hai được sử dụng đề ước tính sức chịu tải mũi cọc trong khi mô hình cuối cùng được sử dụng đề ước tính sức kháng thân cọc Các thông số đầu vào của hai mô hình đầu tiên bao gồm 5 thông số sau: góc ma sát của đất xung quanh
cọc, góc ma sát của đất ở đầu cọc, ứng suất thang đứng có hiệu tại mũi cọc, chiều dài cọc
và diện tích mặt cắt ngang cọc Riêng đối với mô hình để dự báo sức kháng thân cọc thì
sử dụng 4 thông số đầu vào như sau: chỉ số xuyên tiêu chuẩn trung bình của đất dọc thân
cọc, góc ma sát của đất xung quanh cọc, chiều đài cọc và đường kính cọc Kết quả thu
được bởi các mô hình này được so sánh với bốn kỹ thuật thực nghiệm khác được đề xuất
bởi Meyerhof [59], Coyle và Castello [60], Viện dầu khí Hoa Kỳ [61] và Randolph [62] Kết quả dự báo sức kháng tông của cọc đạt giá trị của hệ số xác định rất cao (R? = 0,95)
đôi với mô hình ANN trong khi chỉ dao động trong khoảng 0,52 đến 0,63 đối với các
phương pháp còn lại Các so sánh này tương tự cũng được thực hiện đối với hai thông số
sức kháng thân và Sức chịu tải mũi cọc Có thể đưa ra một nhận xét chung là các đữ liệu
dự báo bởi mô hình ANN tốt hơn nhiều so với các phương pháp khác
25
Trang 25TAI LIEU THAM KHAO
B M Das and K Sobhan, "Principles of geotechnical engineering,” 1990
C Venkatramaiah, Geotechnical engineering New Age International, 1995
P H Winston, Artificial intelligence Addison-Wesley Longman Publishing Co., Inc., 1984
E Parlak "The leading countries in the artificial intelligence race have been determined." Kimdeyir (accessed
A Benko and C S Lanyi, "History of artificial intelligence," in Encyclopedia of Information Science and Technology, Second Edition: IGI global, 2009, pp 1759-1762
A M Turing, "Computing Machinery and Intelligence," Mind, vol 49, pp 433-460, 1950
L N Yasnitsky, "Whether be new “Winter” of artificial intelligence?," in Integrated Science in Digital Age: ICIS 2019, 2020: Springer, pp 13-17
K L Clark, F McCabe, and F McCabe, PROLOG: a language for implementing expert systems Imperial College of Science and Technology Department of Computing, 1980
R Lachman, "Expert systems: a cognitive science perspective," Behavior Research Methods, Instruments, & Computers, vol 21, no 2, pp 195-204, 1989
J J Sviokla, "An examination of the impact of expert systems on the firm: the case of XCON," MIS Quarterly, pp 127-140, 1990
D Goodman and R Keene, "Man versus machine: Kasparov versus deep blue," JICGA Journal, vol 20, no 3, pp 186-187, 1997
G E Hinton, S Osindero, and Y.-W Teh, "A fast learning algorithm for deep belief nets," Neural computation, vol 18, no 7, pp 1527-1554, 2006
H Yu, "From Deep Blue to DeepMind: What AlphaGo Tells Us," Predictive Analytics and Futurism, vol 13, no 1, pp 42-45, 2016
M Soori, B Arezoo, and R Dastres, "Artificial intelligence, machine learning and deep learning in advanced robotics, a review," Cognitive Robotics, vol 3, pp 54-70, 2023
M S Ralph and R George, Principles of Information Systems (13thedition) Course Tachnology, 2018
A Niyogi, T A Ansari, S K Sathapathy, K Sarkar, and T Singh, "Machine learning algorithm for the shear strength prediction of basalt-driven lateritic soil," Earth Science Informatics, vol 16, no 1, pp 899-917, 2023
C Fang, Y Li, and Y Shi, "Enhancing undrained shear strength prediction: a robust hybrid machine learning approach with naive Bayes modeling," Journal of Engineering and Applied Science, vol 72, no 1, p 16, 2025
M B Elsawy, M F Alsharekh, and M Shaban, "Modeling undrained shear strength of
sensitive alluvial soft clay using machine learning approach," Applied Sciences, vol 12,
no 19, p 10177, 2022.
Trang 26Y M Najjar, I A Basheer, and R Mcreynolds, "Neural modeling of Kansas soil swelling," Transportation Research Record, vol 1526, no 1, pp 14-19, 1996
S Romero and S Pamukcu, "Characterization of granular systems by digital signal processing of low strain wave response," Zransportation research record, vol 1548, no
Y M Najjar, I A Basheer, and W A Naouss, "On the identification of compaction characteristics by neuronets," Computers and Geotechnics, vol 18, no 3, pp 167-187,
1996
N Sivakugan, J Eckersley, and H Li, "Settlement predictions using neural networks,"
Australian Civil Engineering Transactions, vol 40, pp 49-52, 1998
K Terzaghi, R B Peck, and G Mesri, Soil mechanics in engineering practice John wiley & sons, 1996
J H Schmertmann, "Static cone to compute static settlement over sand," Journal of the Soil Mechanics and Foundations Division, vol 96, no 3, pp 1011-1043, 1970
M A Shahin, M B Jaksa, and H R Maier, Predicting the settlement of shallow foundations on cohesionless soils using back-propagation neural networks Department
of Civil and Environmental Engineering, University of Adelaide ., 2000
GG Meyerhof, "Shallow foundations," Journal of the Soil Mechanics and Foundations Division, vol 91, no 2, pp 21-31, 1965
E Schultze and G Sherif, "Prediction of settlements from evaluated settlement observations for sand," in Proceedings eighth international conference on soil mechanics and foundation engineering, 1973, vol 1, no 3, pp 225-230
A Soleimanbeigi and N Hataf, "Predicting ultimate bearing capacity of shallow foundations on reinforced cohesionless soils using artificial neural networks," Geosynthetics International, vol 12, no 6, pp 321-332, 2005
C.-C Huang and F Tatsuoka, "Bearing capacity of reinforced horizontal sandy ground," Geotextiles and Geomembranes, vol 9, no 1, pp 51-82, 1990
C.-C Huang and F Meng, "Deep-footing and wide-slab effects in reinforced sandy ground," Journal of Geotechnical and Geoenvironmental Engineering, vol 123, no 1,
pp 30-36, 1997
Trang 27R Behera, C Patra, N Sivakugan, and B Das, "Prediction of ultimate bearing capacity
of eccentrically inclined loaded strip footing by ANN: Part II," International Journal of Geotechnical Engineering, vol 7, no 2, pp 165-172, 2013
C Patra, R Behara, N Sivakugan, and B Das, "Ultimate bearing capacity of shallow strip foundation under eccentrically inclined load, Part I," International Journal of Geotechnical Engineering, vol 6, no 3, pp 343-352, 2012
R Behera, C Patra, N Sivakugan, and B Das, "Prediction of ultimate bearing capacity
of eccentrically inclined loaded strip footing by ANN, part I," International Journal of Geotechnical Engineering, vol 7, no 1, pp 36-44, 2013
A Kalinli, M C Acar, and Z Giindiiz, "New approaches to determine the ultimate bearing capacity of shallow foundations based on artificial neural networks and ant colony optimization," Engineering Geology, vol 117, no 1-2, pp 29-38, 2011
S Adarsh, R Dhanya, G Krishna, R Merlin, and J Tina, "Prediction of ultimate bearing capacity of cohesionless soils using soft computing techniques," /nternational Scholarly Research Notices, vol 2012, 2012
G G Meyerhof, "Some recent research on the bearing capacity of foundations," Canadian geotechnical journal, vol 1, no 1, pp 16-26, 1963
B Hansen, "A general formula for bearing capacity," Danish Geotechnical Institute Bulletin, p 38, 1961
A S Vesié, "Analysis of ultimate loads of shallow foundations," Journal of the soil
mechanics and foundations division, vol 99, no 1, pp 45-73, 1973
H.-C Tsai, Y.-Y Tyan, Y.-W Wu, and Y.-H Lin, "Determining ultimate bearing capacity
of shallow foundations using a genetic programming system," Neural Computing and Applications, vol 23, no 7, pp 2073-2084, 2013
C.-P Pan, H.-C Tsai, and Y.-H Lin, "Improving semi-empirical equations of ultimate bearing capacity of shallow foundations using soft computing polynomials," Engineering Applications of Artificial Intelligence, vol 26, no 1, pp 478-487, 2013
F P Nejad, M B Jaksa, M Kakhi, and B A McCabe, "Prediction of pile settlement using artificial neural networks based on standard penetration test data," Computers and geotechnics, vol 36, no 7, pp 1125-1133, 2009
A S Vesic, "Design of pile foundations," NCHRP synthesis of highway practice, no 42,
1977
H G Poulos and E H Davis, Pile foundation analysis and design (no Monograph) Wiley (John) & Sons, 1980.
Trang 28A Wellington, "The iron wharf at Fort Monroe, VA," Transactions, pp 129-137, 1892
A Hiley, "The efficiency of the hammer blow, and its effects with reference to piling," Engineering, vol 2, p 673, 1922
N Janbu, "Une analyse energetique du battage des pieux a l'aide de parametres sans dimension," Norwegian Geotech Inst, pp 63-64, 1953
M A Kiefa, "General regression neural networks for driven piles in cohesionless soils,"
Journal of Geotechnical and Geoenvironmental Engineering, vol 124, no 12, pp 1177-
Trang 29
Chuong 2
MỘT SÓ MÔ HÌNH TRÍ TUỆ NHÂN TẠO
TRONG PHÂN TÍCH ĐỊA KỸ THUẬT
Chương 2 tập trung trình bày một số mô hình trí tuệ nhân tạo tiêu biểu được ứng dụng
trong phân tích địa kỹ thuật Phần đầu của chương giới thiệu ba mô hình cơ bản gồm: máy
vector hỗ trợ (SVM), mạng thần kinh nhân tạo (ANN) và hệ thống suy luận mờ thích ứng
(ANFIS), đây là những kỹ thuật cơ bản và phổ biến với khả năng học và mô phỏng mạnh
mẽ Tiếp theo, chương trình bày các mô hình lai giữa trí tuệ nhân tạo và các thuật toán tối
ưu hóa như tối ưu hóa bầy đàn (PSO) và tối ưu hóa di truyền (GA), từ đó hình thành các
mô hình ANFIS-PSO và ANFIS-GA với khả năng cải thiện hiệu suất và độ chính xác
vượt trội Những mô hình lai này ngày càng được ứng dụng nhiều trong bối cảnh dữ liệu thực địa ngày càng lớn và đa chiều Cuối cùng, chương giới thiệu các chỉ số đánh giá hiệu suất mô hình học máy như R?, RMSE và MAE, giúp định lượng mức độ phù hợp giữa giá trị dự đoán và giá trị thực tế, từ đó hỗ trợ lựa chọn mô hình tối ưu trong phân tích và thiết
kế địa kỹ thuật Chương này là cơ sở lý thuyết quan trọng nhằm triển khai hiệu quả các
mô hình học máy trong việc áp dung giải quyết các bài toán địa kỹ thuật trong các chương tiép theo
2.1 LY THUYET MÔ HÌNH TRÍ TUỆ NHÂN TẠO CƠ BẢN TRONG PHÂN TÍCH ĐỊA KỸ THUẬT
2.1.1 Mô hình máy vector hỗ trợ (SVM)
* Giới thiệu chung về SVM
Máy Vector Hỗ Trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng phổ biến trong các bài toán phân loại và hồi quy SVM được phát triển bởi Vladimir Vapnik và cộng sự vào những năm 1990 và nhanh chóng trở thành một trong những thuật toán mạnh mẽ nhất trong học máy [1] SVM hoạt động bằng cách tìm một siêu phẳng tối ưu để phân tách các nhóm đữ liệu trong không gian đặc trưng Nếu dữ liệu
có thể phân tách tuyến tính, thuật toán tìm một siêu phẳng có margin lớn nhất đề phân biệt hai nhóm dữ liệu Hình 2.1 Trong không gian hai chiều, siêu phẳng này là một đường thẳng, còn trong không gian ba chiều, nó là một mặt phẳng
Trong thực tế, đữ liệu của một số bài thường không thể phân tách tuyến tính do sự
phức tạp của điều kiện tự nhiên Do đó, SVM sử dụng biên mềm (Soft Margin SVM), cho phép một số điểm dữ liệu vi phạm margin để mô hình đạt được tính tổng quát tốt hơn
Trang 30siêu phẳng tuyến tính trở nên không khả thi SVM khắc phục vấn đề này bằng cách sử
dung thu thuat kernel (Kernel Trick) để ánh xạ dữ liệu từ không gian ban đầu sang không
gian có số chiều cao hơn, nơi nó có thể phân tách tuyến tính
Hình 2.1 Minh họa thuật toán máy vector hỗ tre (SVM) [2]
Không chỉ giới hạn ở phân loại, SVM còn được mở rộng cho bài toán hồi quy Trong hồi quy SVM, mô hình không tìm cách phân loại đữ liệu mà có gắng tìm một hàm hồi quy tối ưu sao cho sai số dự đoán nằm trong một ngưỡng e Điều này giúp SVM có thể bỏ qua những nhiễu nhỏ trong dữ liệu đo đạc, đồng thời tập trung vào xu hướng chính của dữ liệu Trong phạm vi của cuốn sách này, tác giả tập trung mô tả chỉ tiết về kỹ thuật máy vector hỗ trợ áp dụng cho bài toán hồi quy được ứng dụng đề giải quyết một số bài toán liên quan đến địa kỹ thuật được trình bày ở các chương sau
* Máy vector hỗ trợ hồi quy
Máy vector hỗ trợ hồi quy được sử dụng cho các bài toán dự báo một biến phụ thuộc
với giá trị thực liên tục dựa trên một hoặc nhiều biến dự đoán Mục tiêu của phân tích hồi quy là có thể xây dựng được hàm số biểu diễn mối quan hệ giữa biến phụ thuộc với các biến độc lập Khác với các phương pháp hồi quy truyền thống, vốn phụ thuộc vào các giả
định về mô hình có thể không chính xác (ví dụ: phân phối dữ liệu tuyến tính) Máy vector
hỗ trợ hồi quy là một kỹ thuật học máy trong đó mô hình học được mức độ quan trọng của từng biến trong việc đặc trưng hóa mối quan hệ giữa đầu vào và đầu ra Nguyên lý toán học của mô hình máy vector hỗ trợ hồi quy được mô tả như sau [2, 3]:
- Với bài toán hồi quy tuyến tính:
Xét bài toán xắp xi tập hợp các vector huấn luyện:
Trang 31(Mp Dore Vn %mX ER" VER Q.1)
với một hàm tuyến tính:
#Œœ)=(w:x)+b (2.2)
để tối thiểu hóa hàm mục tiêu:
trong đó: C là một giá trị cho trước, § 1a bién slack được đưa vào đề biểu thị độ lệch của
điểm đữ liệu so với hai ranh giới phân chia (Hình 2.2 và Hình 2.3), nghiệm của
bài toán được tìm bằng cách tối đa hóa hàm:
Hình 2.2: Hỏi quy SVM tuyến tính với các biến slack & duoc sie dụng để xử lý dữ liệu nhiễu
tại các ranh giới của các ngưỡng siêu phẳng £ [3]
32
Trang 32Máy vector hỗ trợ (SVM) anh xa vector đầu vào x vào một không gian đặc trưng có số chiều cao thông qua một phép biến đổi phi tuyến Trong không gian này, một siêu phẳng phân tách tối ưu được xây dựng,
Với C là một giá trị cho trước, nghiệm của bài toán được xác định bởi:
Giải phương trình (2.8) với các ràng buộc trong phương trình (2.9) đề xác định các nhân tử Lagrange: #,Z”, khi đó hàm hồi quy được xác định như sau:
0= (a, ~a;}X(x,x)+Pb
trong đó:
b=—— : (z=Z7)[#(x,.x,)+&(x,.x,)]
(2.10) (2.11)
Trong trường hợp các hàm kernel bao hàm một hệ số điều chỉnh (bias term), các rang buộc về đăng thức có thể được bỏ qua, khi đó b được tính hợp vào trong hàm kernel và
hàm hồi quy được xác định bởi:
£0) =D (a, -a) K(x)
Hình 2.3: Hoi quy SVM phi tuyến các biến slack & duoc sit dụng đề xử lý dữ liệu nhiễu
tại các ranh giới của các ngưỡng siêu phẳng € [3]
(2.12)
Trang 33- Ham kernel tinh (Linear kernel):
Ham kernel tuyén tinh được sử dụng khi dữ liệu có thể được phân tách tốt trong khong gian gôc mà không cân ánh xạ phi tuyên:
k(x,,x,) =x, (2.13)
- Ham kernel da thitc (Polynomial kernel):
Hàm kernel đa thức mở rộng khả năng của SVR bằng cách ánh xạ dữ liệu sang không gian có số chiều cao hơn với bậc đa thức:
k(x„x,)=(x/x,+r)f (2.14) trong đó: ở là bậc của đa thức, r là một hệ số điều chỉnh (bias term), giúp kiểm soát mức
độ ảnh hưởng của các thành phần bậc thấp
- Hàm kernel Gaussian (Radial Basis Function - RBF kernel):
Ham kernel RBF 1a mét trong những kernel phổ biến nhất do khả năng mô hình hóa các quan hệ phi tuyến phức tạp Nó sử dụng hàm mũ để đo độ tương tự giữa hai điểm dữ liệu
- Hàm kernel Sigmoid (Sigmoid kernel):
Hàm kernel Sigmoid mô phỏng cách hoạt động của một neuron trong mạng nơ-ron nhân tạo và có thể được sử dụng như một biến thể của mô hình mạng nơ-ron
k(x„x,) = tanh(yx,x,+ r) (2.16)
* Ưu nhược điểm của SVM
- Ưu điểm:
Một trong những ưu điểm nỗi bật của SVM là khả năng tìm được siêu mặt phân tách
tối ưu giữa các lớp dữ liệu bằng cách tối đa hóa khoảng cách (margin) giữa chúng, từ đó
giúp tăng khả năng tông quát hóa và giảm nguy cơ overfitting Nhờ vào khái niệm vector
hỗ trợ (support vectors) - là những điểm dữ liệu gần ranh giới phân tách nhất - SVM tập trung vào các điểm dữ liệu "quyết định" nhất để xây dựng mô hình, giúp cải thiện hiệu
quả phân loại Một lợi thế lớn khác của SVM là việc sử dụng hàm kernel (kernel trick),
cho phép mô hình ánh xạ dữ liệu đầu vào lên không gian chiều cao hơn đề xử lý các bài toán phi tuyến một cách hiệu quả mà không cần tính toán trực tiếp trong không gian đó Nhờ đó, SVM có thể áp dụng cho nhiều bài toán phức tạp như phân loại văn bản, nhận dạng chữ viết, phát hiện gian lận, hay phân tích chuỗi sinh học
Trang 34SVM cũng có một số nhược điểm nhất định Trước hết, khi làm việc với các tập đữ liệu lớn hoặc có số chiều quá cao, thời gian huấn luyện của SVM có thể rất chậm do chỉ phí
tính toán cao, đặc biệt nếu sử dụng các kernel phi tuyến nhu RBF (Radial Basis Function) SVM cũng rất nhạy cảm với việc lựa chọn siêu tham số như hệ số phạt (C), hệ số gamma
trong kernel RBE, hay chính loại kernel sử dụng - nếu không được tối ưu hóa đúng cách,
mô hình có thẻ dẫn đến kết quả kém hoặc quá khớp với đữ liệu huấn luyện Một điểm hạn
chế khác của SVM là khó diễn giải kết quả, đặc biệt trong trường hợp sử dụng các kernel phi tuyến, khiến cho mô hình trở thành một “hộp đen”, tương tự như mạng nơ-ron nhân
tạo Ngoài ra, SVM không hoạt động hiệu quả khi dữ liệu chứa nhiều nhiễu hoặc khi hai
lớp đữ liệu không thể phân tách rõ ràng, vì trong những trường hợp đó việc tìm một siêu
mặt phân tách tối ưu sẽ trở nên khó khăn và kém chính xác Cuối cùng, SVM không thích
hợp để làm việc trực tiếp với dữ liệu không cân bằng (imbalanced data), trừ khi có những điều chỉnh nhất định như sử dụng trọng số mẫu (sample weighting) hoặc kỹ thuật tái cân
bang đữ liệu
2.1.2 Mô hình mạng thần kinh nhân tạo (ANN)
* Giới thiệu chung về ANIN
Mạng thần kinh nhân tạo (Artificial Neural Network - ANN) là một phương pháp học máy lấy cảm hứng từ cấu trúc và hoạt động của não bộ con người Ý tưởng về ANN xuất
hiện tit nim 1943 khi Warren McCulloch va Walter Pitts dé xuất mô hình toán học đầu tiên mô phỏng hoạt động của neuron sinh học Đến năm 1958, Frank Rosenblatt phat trién
Perceptron, một mô hình mạng neuron đơn giản đặt nền tảng cho ANN hiện đại ANN
phát triển mạnh mẽ vào những năm 1980 và 1990 nhờ thuật toán lan truyền ngược (Backpropagation), giúp cập nhật trọng số và cải thiện hiệu suất học Ngày nay, ANN có
nhiều kiến trúc khác nhau như mạng truyền thăng (FNN), mang tich chap (CNN) và mạng
hồi tiếp (RNN), ứng dụng rộng rãi trong nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên và
các bài toán dự báo dựa trên dữ liệu hồi quy
Mạng ANN bao gồm nhiều nơ-ron nhân tạo kết nói với nhau theo từng lớp, tạo thành
một hệ thống xử lý thông tin mạnh mẽ Cấu trúc cơ bản của ANN gồm lớp đầu vào, các
lớp ân và lớp đầu ra Mỗi nơ-ron thực hiện phép tính bằng cách nhân trọng số với đầu vào,
cộng với hệ số điều chỉnh (bias term), sau đó áp dụng một hàm kích hoạt để tạo ra đầu ra
phi tuyến Nhờ khả năng học các quan hệ phi tuyến, mạng ANN có thể giải quyết nhiều bài toán hồi quy mà các phương pháp truyền thống như hồi quy tuyến tính không thể xử lý hiệu quả Trong phạm vi của cuốn sách nảy, tác giả tập trung mô tả chỉ tiết về kỹ thuật
mạng ANN áp dụng cho bài toán hồi quy được ứng dụng đê giải quyết một số bài toán
liên quan đến địa kỹ thuật được trình bày ở các chương sau
Trang 35Mô hình xử lý thông tin của con người được biểu diễn theo Hình 2.4 [4, 5] Thông tin
từ môi trường được đưa về não bộ của con người thông qua các giác quan và sẽ được bộ
não xử lý Quá trình này được chia ra thành các khối như qd) khối tin hiéu dién tuong tu;
(2) khối phân tích và tiền xử lý; (3) khối nhận điện bằng đặc trưng và (4) phân chia ra thành các nhóm thông tin khác nhau Trong não bộ của con người chứa đến hơn 100 tỉ noron thần kinh (tế bào thần kinh) với chức năng chính truyền dẫn các xung điện Nơron
là đơn vị cơ bản cầu tạo hệ thống thần kinh và là một phần quan trong nhất của não
Tín hiệu Phân tích Nhận 5 điện và tiền diện bằng Phân tương tự xử lý đặc trưng nhóm
>
Hình 2.4 Mô hình xử lý thông tin cua con nguoi [5]
Cấu tạo của một nơron thật trong não người được minh họa trong Hình 2.5 Một
noron gồm có thân noron (cell body) là nơi xử lý các tín hiệu được đưa vào từ các giác quan Các dây hình nhánh cây (dendrites) là nơi nhận các xung điện vào trong nơron và các sợi trục (axons) là một dây dài đưa xung điện ra sau quá trình xử lý từ thân của nơron Giữa các đây hình nhánh cây và các sợi trục có một liên kết với nhau gọi là khớp thần kinh (synapse)
Soi trục
Nhánh
Thân tế bào
Khe synap
Hình 2.5 Cầu tạo của một neural thật trong não người [Š}
(dendrites: nhánh, Axon: sợi trục, cell body: cơ thể tế bào, synapse: lớp thân kinh)
Dựa vào cấu tạo của một noron thật trong não người, các nghiên cứu đã đưa ra mô hình cấu tạo của nơron nhân tạo trong Hình 2.6 Trong đó xị, Xa đến x„ lần lượt là các đầu vào
(input data) cua mang noron nhân tạo Tổng của các đầu vào này sau khi nhân với một trọng
số nhất định và trừ đi ngưỡng cần so sánh để được sự chính xác cao, sẽ kí hiệu là giá trị n F
là ham ding dé loc ngưỡng giá trị n và kết quả đầu ra của mạng nơron nhân tạo là a
36
Trang 36Hình 2.6 Mô hình neural nhân tạo [6]
Nhìn chung, mạng ANN có thể có nhiều cấu trúc khác nhau, nhưng một ANN cơ bản thường bao gồm ba loại lớp chính (Hình 2.7):
- Lớp đầu vao (Input layer): Nhan dit liéu đầu vào từ tập dữ liệu huấn luyện Mỗi nơ-
ron trong lớp này đại điện cho một đặc trưng (feature) của đữ liệu
- Lớp ân (idden layers): Thực hiện các phép tính trên đữ liệu bằng cách sử dụng trọng
số, hệ số bù và hàm kích hoạt Số lượng lớp ẩn và số nơ-ron trong mỗi lớp quyết định độ
* Mạng ANN hồi quy
Mang ANN hồi quy có thể học từ dữ liệu đề tìm ra mối quan hệ giữa các biến độc lập
đầu vào (inputs) và một biến phụ thuộc đầu ra liên tục (output) Quá trình hoạt động của
mạng ANN hồi quy có thể được chia thành các bước chính như sau:
Giả sử một bài toán hồi quy cần dự đoán giá trị y dựa trên các biến đầu vào x„x¿, x„
Dữ liệu huấn luyện bao gồm tập hợp z mẫu:
=I
trong dé: x = (x.x2, x”')la vector đặc trưng của mẫu thứ ¡;
Trang 37m là số lượng mẫu huấn luyện;
n là số lượng đặc trưng (số biến đầu vào)
Mục tiêu của ANN là tìm một hàm hồi quy ánh xạ: ƒ:]R" —>ÏR sao cho sai số giữa giá trị thực y và giá trị dự đoán ? là nhỏ nhất
e Bước 1: Lan truyền tiến (Forward Propagation):
- Lan truyền đữ liệu từ lớp đầu vào đến lớp an:
Dữ liệu đầu vào x được đưa vào lớp đầu vào và truyền qua các lớp ân Mỗi nơ-ron trong một lớp thực hiện phép toán:
a(“Ð là đầu ra của nơ-ron thứ ¿ từ lớp trước;
p0 là hệ số điều chỉnh (bias term) tại nơ-ron thir
oO
Sau đó, một ham kích hoat f(z) duge ap dung dé tao dau ra a cia no-ron:
- Lan truyền đữ liệu từ lớp ân đến lớp đầu ra:
Sau khi dữ liệu được truyền qua tất cả các lớp an, lớp cuối cùng (lớp đầu ra) thực hiện
một phép toán tương tự:
?= 3) wI9a#-Ð +pU) (2.20) + Với bài toán hồi quy, khi lớp đầu ra sử dụng hàm kích hoạt tuyến tính:
l+e
trong đó: e là hằng số Euler (~ 2.718)
Trang 38ca I
+ Với bài toán hồi quy, khi lớp đầu ra sử dụng hàm kích hoạt ReLU:
#(z) = max (0, z) (2.25) khi đó, giá trị dy doan } cua mô hình ANN hồi quy là:
e Bước 2: Tính toán sai số bằng ham mat mat (Loss Function):
Mô hình ANN sử dụng hàm mất mát để đo lường sự khác biệt giữa giá trị thực y và
giá trị dự đoán ÿ Một số hàm mắt mát phổ biến trong hồi quy:
MSE (Mean Squared Error - Sai số bình phương trung bình):
e Bước 3: Lan truyền ngược (Backpropagation) và cập nhật trọng số:
Sau khi tính toán sai số, thuật toán lan truyền ngược (Backpropagation) được sử dụng
đề cập nhật trọng sô nhằm giảm sai sô
- Tinh toán Gradient của hàm mắt mát:
Gradient của hàm mắt mát L theo trọng số W va bias b” được tính bằng quy tắc chuỗi:
ôL _ôL ôÿ ôzU
ôL _ôL oy az!”
- Cp nhat trong s6 bang Gradient Descent:
Trang 39voi 7 1a téc d6 hoc (learning rate)
* Ưu nhược điểm của ANN
- Ưu điểm:
ANN có nhiều ưu điểm vượt trội, đặc biệt trong việc học và mô hình hóa các mối quan
hệ phi tuyến phức tạp giữa các biến đầu vào và đầu ra Khả năng tự học của ANN cho
phép mô hình trích xuất đặc trưng, học từ đữ liệu, và cải thiện hiệu suất theo thời gian mà
không cần phải lập trình chỉ tiết từng quy tắc Đây là một công cụ cực kỳ hữu hiệu trong
các bài toán dự báo, phân loại, nhận dạng mẫu, xử lý ảnh, ngôn ngữ tự nhiên và nhiều lĩnh
vực khác trong khoa học và kỹ thuật ANN có khả năng xử lý song song và học được từ cả
dữ liệu có nhiễu hoặc thiếu sót, đồng thời có thể được mở rộng thành các kiến trúc học sâu
(Deep Learning) để giải quyết những vấn đề cực kỳ phức tạp với độ chính xác cao Một
điểm mạnh nữa của ANN là tính linh hoạt, có thể ap dụng cho nhiều loại dữ liệu đầu vào
khác nhau (số, hình ảnh, văn bản) và không yêu cầu giả định trước về phân bố của dữ liệu như nhiều mô hình thống kê truyền thống
- Nhược điểm:
ANN cũng tồn tại không ít nhược điêm Trước hết, mạng nơ-ron thường được xem là
mô hình “hộp đen” (black-box), nghĩa là quá trình học và suy điễn bên trong rất khó giải
thích, dẫn đến hạn chế trong việc diễn giải kết quả hoặc kiêm chứng các mối quan hệ học được Điều này đặc biệt bất lợi trong các lĩnh vực cần tính minh bạch và giải thích cao như y tế, tài chính, hay ra quyết định chính sách Ngoài ra, ANN yêu cầu lượng đữ liệu
lớn để đạt được hiệu suất tốt; nếu đữ liệu không đủ hoặc không đại diện, mô hình dễ bị
overfitting hoặc học sai lệch Việc huấn luyện ANN đôi khi đòi hỏi chỉ phí tính toán cao,
đặc biệt với các mạng lớn hoặc mạng sâu, khiến cho quá trình học tốn thời gian và tài nguyên phần cứng Bên cạnh đó, ANN khá nhạy cảm với cách thiết kế kiến trúc mạng (số lớp, số nơ-ron, hàm kích hoạt, tốc độ học, v.v.), và việc lựa chọn các siêu tham số thường phải thông qua quá trình thử - sai hoặc tối ưu hóa phức tạp Ngoài ra, ANN không thể tự
diễn giải được kiến thức dưới dạng luật hay logic như các mô hình mờ hoặc mô hình lai,
dẫn đến khó khăn trong việc áp dụng vào các hệ thông cần khả năng diễn đạt rõ ràng
2.1.3 Mô hình hệ thống suy luận mờ thích ứng (ANEIS)
* Giới thiệu về ANFIS
Mạng thần kinh nhân tạo (ANN) có khả năng học từ dữ liệu tốt, nhưng hoạt động như một “hộp đen” và khó giải thích Ngược lại, hệ mờ có thể diễn đạt tri thức theo cách con
Trang 40này phụ thuộc nhiều vào chuyên gia và khó tối ưu hóa khi dữ liệu lớn Hệ thống suy luận
mờ thích ứng hay còn gọi là ANFIS (Adaptive Neuro-Fuzzy Inference System) ra đời như một sự kết hợp lý tưởng: sử dụng mạng neuron dé học và hiệu chỉnh tham số của hệ mờ, giúp mô hình vừa chính xác vừa đễ diễn giải Cụ thể, ANFIS là một mô hình trí tuệ nhân tạo lai, kết hợp giữa hai phương pháp tính toán thông minh: mạng thần kinh nhân tạo (Artificial Neural Network - ANN) va hé thống suy luận mờ (Fuzzy Inference System - FIS) Mô hình này được đề xuất lần đầu tiên bởi Tiến si Jyh-Shing Roger Jang vao nam
1993 [7] Mục tiêu cua ANFIS 1a tan dung khả năng học dữ liệu của mang neuron và khả năng xử lý thông tin mơ hồ, phi tuyến của logic mờ để xây dựng một hệ thống thông
minh, vừa có thể học từ dữ liệu, vừa có thể diễn giải được bằng ngôn ngữ con người thông qua các luật mờ
Nhờ khả năng xử lý linh hoạt các bài toán phi tuyến và không chắc chắn, ANFIS đã
được ứng dụng rộng rãi trong nhiều lĩnh vực Mô hình ANFIS có thể áp dung cho các bài toán phân loại và hồi quy Trong phạm vi của cuốn sách này, tác giả tập trung mô tả chỉ tiết về kỹ thuật ANFIS áp dụng cho bài toán hồi quy được ứng dụng dé giải quyết một số bài toán liên quan đến địa kỹ thuật được trình bày ở các chương sau
* Cấu trúc của hệ mờ - Noron
Câu trúc của thuật toán ANFIS thường được xây dựng dựa trên nền tảng của hệ suy
luận mờ kiểu Sugeno - một loại FIS có đầu ra là hàm tuyến tính hoặc hằng số Mô hình
ANEIS có kiến trúc gồm 5 lớp xử lý [8], mô phỏng cả cơ chế lan truyền tiến của mạng
neuron và suy luận mờ (Hình 2.8):
Lớp 1 Lớp2 Lớp 3 Lớp4 Lops
Hình 2.8 Cầu trúc của thuật toán ANFIS [8]
- Lớp 1 (Fuzzification): Làm mờ dữ liệu đầu vào bằng cách tính giá trị độ thành viên theo các hàm mờ (thường là Gaussian, bell-shaped hoặc hàm tam giác)
- Lớp 2 (Rule Layer): Tinh d6 manh (firing strength) cia tig luat mờ bằng cách nhân
độ thành viên của các biên đầu vào
- Lớp 3 (Normalization): Chuẩn hóa độ mạnh của mỗi luật bằng cách chia cho tổng độ
mạnh tât cả các luật
- Lớp 4 (Consequent): Tính giá trị đầu ra cho từng luật theo mô hình tuyến tính
41