Các máy tính thông thường hiện nay có thể giải được nhưng với tốc độ hạn chế, một số trường hợp không đáp ứng được với ứng dụng trong thời gian thực.. Việc áp dụng công nghệ mạng nơron t
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả nghiên cứu được trình bày trong luận văn là hoàn toàn trung thực, không vi phạm bất cứ điều gì trong luật
sở hữu trí tuệ và pháp luật Việt Nam Nếu sai, tôi hoàn toàn chịu trách nhiệm trước pháp luật
Thái nguyên, ngày 14 tháng 4 năm 2016
Tác giả luận văn
Phạm Thanh Hải
Trang 2LỜI CẢM ƠN
Tôi xin bày tỏ lòng cảm ơn chân thành tới thầy giáo, TS Vũ Đức Thái, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tôi trong suốt quá trình làm luận văn tốt nghiệp
Tôi xin cảm ơn các thầy, cô giáo đã giảng dạy tôi trong suốt thời gian học tập tại trường và các cán bộ Phòng Đào tạo đã tạo điều kiện giúp đỡ tôi hoàn thành luận văn này
Tôi xin chân thành cảm ơn sự quan tâm giúp đỡ của gia đình, bạn bè
và tập thể lớp Cao học K13C đã cổ vũ động viên tôi hoàn thành tốt luận văn của mình
Tuy đã có những cố gắng nhất định nhưng do thời gian và trình độ có hạn nên luận văn này còn nhiều thiếu sót và hạn chế nhất định Kính mong nhận được sự góp ý của thầy cô và các bạn
Thái nguyên, ngày 14 tháng 4 năm 2016
Học viên Phạm Thanh Hải
Trang 3MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
DANH MỤC CÁC CHỮ VIẾT TẮT iii
DANH MỤC CÁC BẢNG vi
DANH MỤC CÁC HÌNH vii
MỤC LỤC iii
MỞ ĐẦU 1
CHƯƠNG 1 VẤN ĐỀ GIẢI PHƯƠNG TRÌNH TRUYỀN NHIỆT BẰNG CÔNG NGHỆ MẠNG NƠ RON TẾ BÀO 3
1.1 Giới thiệu về phương trình đạo hàm riêng 3
1.1.1 Các khái niệm cơ bản về phương trình đạo hàm riêng 3
1.1.2 Phân loại các phương trình đạo hàm riêng tuyến tính cấp hai với hai biến độc lập 4
1.1.3 Phương pháp sai phân Taylor 4
1.1.4 Bài toán sai phân 6
1.2 Phương trình truyền nhiệt 2 chiều 8
1.3 Công nghệ mạng nơron tế bào 12
1.3.1 Các định nghĩa về mạng nơ ron tế bào 12
1.3.2 Kiến trúc chuẩn về công nghệ mạng nơ ron tế bào 13
1.3.3 Các dạng kiến trúc mạng CNN 14
1.3.4 Một số ứng dụng của công nghệ CNN 20
CHƯƠNG 2 GIẢI PHƯƠNG TRÌNH TRUYỀN NHIỆT HAI CHIỀU 24
2.1 Mối quan hệ giữa mạng CNN và phương trình đạo hàm riêng [12] 24
2.2 Phương pháp giải phương trình đạo hàm riêng bằng công nghệ mạng nơ ron tế bào 28
2.2.1 Mẫu và thiết kế mẫu 28
Trang 42.2.2 Ứng dụng máy tính CNN-UM trong một số bài toán đơn giản 29
2.2.3 Sự ổn định của mạng CNN 37
2.3 Phương trình truyền nhiệt hai chiều và các ràng buộc 48
2.3.1 Thành lập phương trình truyền nhiệt 48
2.3.2 Điều kiện ban đầu và điều kiện biên 51
2.4 Giải phương trình truyền nhiệt 2 chiều bằng CNN 52
2.4.1 Phân tích sai phân Taylor phương trình truyền nhiệt hai chiều 52
2.4.2 Thiết kế mẫu CNN cho phương trình truyền nhiệt hai chiều 52
2.4.3 Kiến trúc điện tử cuả mạng nơ ron giải phương trình truyền nhiệt hai chiều 53
2.5 Kết luận 55
CHƯƠNG 3 CÀI ĐẶT MÔ PHỎNG GIẢI PHƯƠNG TRÌNH TRUYỀN NHIỆT HAI CHIỀU 56
3.1 Xây dựng bài toán 56
3.2 Các kết quả tính toán 57
KẾT LUẬN 67
TÀI LIỆU THAM KHẢO 69
Trang 5DANH MỤC CÁC CHỮ VIẾT TẮT
CNN Cellular Neural Network Công nghệ mạng nơron tế bào
PDE Partial Difference Equation Phương trình đạo hàm riêng
FPGA Field Programmable Logic Array Ma trận cổng logic lập trình
được VLSI Very Large Scale Intergrated Chip tích hợp mật độ cao
VHDL Very High Description Language Ngôn ngữ đặc tả phần cứng dù
Trang 6DANH MỤC CÁC BẢNG
Bảng 3.1 Giá trị ban đầu của nhiệt độ trong tấm phẳng thực nghiệm 58
Bảng 3.2: Giá trị của các điểm biên được xác định 59
Bảng 3.3 Giá trị của các điểm biên được xác định 60
Bảng 3.4 Kết quả tính toán sau 10 giây 61
Hình 3.4 Giá trị nhiệt độ sau 10 giây 61
Bảng 3.5 Giá trị của các điểm biên được xác định 62
Hình 3.5 : Giá trị nhiệt độ sau 5 giây 62
Bảng 3.6 Giá trị của các điểm biên được xác định 63
Bảng 3.7 Giá trị của các điểm biên được xác định 64
Bảng 3.8 Kết quả tính toán sau 10 giây 65
Trang 7DANH MỤC CÁC HÌNH
Hình 1.1: Kiến trúc CNN chuẩn 13
Hình 1.2: Kiến trúc làm việc của mạng CNN 13
Hình 1.3 Một số kiến trúc CNN không chuẩn 14
Hình 1.4 Kiến trúc CNN hai chiều 3 lớp 15
Hình 1.5: CNN không gian bất biến với 3 láng giềng 17
Hình 1.6 Mô tả cấu trúc tương tác của CNN tổng quát 18
Hình 1.7: CNN hồi tiếp bằng 0: C(0,B,z) 19
Hình 1.8: Mạch điện của CNN có hồi tiếp bằng 0 C(0,B,z) 19
Hình 1.9: CNN đầu vào bằng 0, C(A,0,z) 19
Hình 1.10: Mạch điện CNN đầu vào bằng 0:C(A,0,z) 20
Hình 2.1: Mạch CNN hai lớp Lớp u có ảnh hưởng đến lớp v 25
Hình 2.2: Lưới sai phân 2 chiều 25
Hình 2.3: Mô hình mạch cho bài toán giải hệ PDE 28
Hình 2.4: Kiến trúc tế bào mở rộng thêm vào 3 khối (LLM, GW, GCL) 30
Hình 2.5: Tế bào mở rộng có thêm hai khối cell khác nhau 30
Hình 2.6 Thủ tục SUBSET như một hàm 31
Hình 2.7: Lưu đồ xử lý của bài toán dò biên 32
Hình 2.8: Quá trình nạp TEM1 (a,b) 34
Hình 2.9: Nạp kết quả vào LLM3 35
Hình 2.10: Ảnh kết quả xử lý bỏ đi các điểm ảnh cô lập 36
Hình 2.11: Giá trị ban đầu của phương trình 37
Hình 2.12: Ảnh kết quả nghiệm của phương trình 37
Hình 2.13 Đặc trưng của mạch phi tuyến tính trong mạch ô tương đương 43
Hình 2 14: Mạch tương đương vững chắc của một ô trong một nơron tế bào 44
Trang 8Hình 2.15: Các tuyến động và các điểm cân bằng của mạch tương đương với
các giá trị khác nhau của g(t) 47
Hình 2.16: Sao chép khuôn mẫu của một khối tương tác toán tử 48
Hình 2.16: Sơ đồ khối CNN 2D cho giải phương trình truyền nhiệt 54
Hình 2.17: Khối xử lý số học của mạng CNN giải phương trình truyền nhiệt 54 Hình 3.1 Tấm phẳng làm thực nghiệm 56
Hình 3.2: Giá trị nhiệt độ ban đầu 59
Hình 3.3: Giá trị nhiệt độ sau 5 giây 60
Hình 3.4 Giá trị nhiệt độ sau 10 giây 61
Hình 3.5 : Giá trị nhiệt độ sau 5 giây 62
Hình 3.6 : Giá trị nhiệt độ sau 10 giây 63
Hình 3.7: Giá trị của nhiệt độ sau 5 giây 64
Hình 3.8 : Giá trị nhiệt độ sau 10 giấy 65
Trang 9
MỞ ĐẦU
Trong nhiều bài toán khoa học các đại lượng biến thiên phức tạp theo nhiều tham số không gian, thời gian và các điều kiện ngoại cảnh Để giải quyết các bài toán trên thường đưa đến việc giải phương trình vi phân, thậm chí là phương trình vi phân đạo hàm riêng
Phương trình vi phân có nhiều loại, có nhiều cách giải khác nhau như: phương pháp giải tích, phương pháp sai phân với các công thức sai phân đã tiến hành cài đặt trên máy vi tính Các máy tính thông thường hiện nay có thể giải được nhưng với tốc độ hạn chế, một số trường hợp không đáp ứng được với ứng dụng trong thời gian thực
Việc áp dụng công nghệ mạng nơron tế bào CNN vào giải phương trình đạo hàm riêng với tốc độ cao là cần thiết và có nhiều triển vọng trong tương lai đáp ứng cho các bài toán trong thời gian thực
Do đó, em đã chọn “Nghiên cứu ứng dụng công nghệ mạng nơ ron tế bào
vào giải phương trình truyền nhiệt hai chiều” nhằm mục tiêu tìm hiểu công
nghệ mạng nơ ron tế bào và tìm hiểu phương pháp, kỹ thuật thuật thực hiện giải phương trình truyền nhiệt hai chiều bằng công nghệ này Để thực hiện mục tiêu này, đề tài này tập trung nghiên cứu các nội dung sau:
Chương 1: Vấn đề giải phương trình truyền nhiệt bằng công nghệ mạng nơ ron tế bào: Nghiên cứu công nghệ mạng nơron tế bào, các phương
trình đạo hàm riêng, phương trình truyền nhiệt hai chiều và các ứng dụng thực
tiễn
Chương 2: Giải phương trình truyền nhiệt hai chiều: Đề xuất phương
pháp giải và xây dựng mô hình bài toán phương trình truyền nhiệt hai chiều được giải bằng công nghệ mạng nơ ron tế bào
Chương 3: Mô phỏng thực nghiệm: Mô phỏng tính toán kết quả trên
Matlab, đánh giá so sánh kết quả
Trang 10Luận văn nghiên cứu với mục tiêu tìm hiểu một công nghệ mới ứng dụng trong việc giải phương trình đạo hàm riêng trong lĩnh vực tính toán khoa học
Đó là một nhu cầu rất quan trọng trong thời đại phát triển khoa học công nghệ ngày nay, khi mà hầu hết các hiện tượng lý hoá sinh trong tự nhiên được biểu diễn bởi các phương trình phi tuyến phức tạp mà phương trình đạo hàm riêng chiếm số lượng lớn Việc giải phương trình truyền nhiệt hai chiều là một ứng dụng trong lĩnh vực vật lý hiện
Trong nội dung của luận văn chắc sẽ không tránh khỏi những thiếu sót, em rất mong quý thầy cô và các bạn đọc quan tâm, đóng góp ý kiến, để luận văn được hoàn thiện hơn
Trang 11CHƯƠNG 1 VẤN ĐỀ GIẢI PHƯƠNG TRÌNH TRUYỀN NHIỆT BẰNG CÔNG
NGHỆ MẠNG NƠ RON TẾ BÀO
1.1 Giới thiệu về phương trình đạo hàm riêng
1.1.1 Các khái niệm cơ bản về phương trình đạo hàm riêng
Định nghĩa: Phương trình đạo hàm riêng là phương trình có chứa đạo hàm
riêng của hai hay nhiều hơn hai biến phải tìm [7,8] Ví dụ:
0 x
Cấp của phương trình: Là cấp của đạo hàm cấp cao nhất Ví dụ cấp của (1.1) là cấp 1; cấp của (1.2) là cấp 2
Phương trình đạo hàm riêng được gọi là tuyến tính nếu hàm phải tìm và các đạo hàm của nó chỉ xuất hiện với luỹ thừa bậc nhất và không có tích của chúng với nhau
Dạng tổng quát của phương trình tuyến tích cấp hai đối với hàm hai biến x,y là:
Trang 121.1.2 Phân loại các phương trình đạo hàm riêng tuyến tính cấp hai với hai
biến độc lập
Dạng tổng quát của phương trình đạo hàm riêng tuyến tính cấp hai, trong
đó hàm u ( x , y ) chưa biết phụ thuộc hai biến độc lập (x,y) là
) , ( ) , ( )
, ( )
, ( )
, ( )
, ( 2
)
,
2 2
2
2
y x G u y x F y
u y x E x
u y x D y
u y x C y x
u y x B
những phép biến đổi thích hợp có thể đưa về một trong ba dạng sau:
a) Nếu AC B2 0 trong một miền nào đó thì bằng các phép biến đổi thích
hợp có thể đưa phương trình (1.4) trong miền ấy về dạng
2 2
u D u u
b) Nếu AC B2 0 trong một miền nào đó thì phương trình (1.4) trong miền
ấy có thể đưa về dạng
2 2
u D u u
c) Nếu AC B2 0 trong một miền nào đó thì phương trình (1.4) trong miền
u D
1.1.3 Phương pháp sai phân Taylor
Trong các phần trước ta đã xét các phương pháp tìm nghiệm tường
minh của bài toán dưới dạng các công thức sơ cấp, các tích phân hoặc các
chuỗi hàm đối với một số ít trường hợp [5,7] Còn đại đa số trường hợp khác,
Trang 13đặc biệt là đối với các bài toán có hệ số biến thiên, các bài toán phi tuyến, các bài toán trên miền bất kỳ thì nghiệm tường minh của bài toán không có, hoặc
có nhưng rất phức tạp Trong những trường hợp đó việc tính nghiệm phải dựa vào các phương pháp giải gần đúng
Để giải quyết vấn đề nêu trên thì trong phạm vi bài giảng đưa ra phương pháp sai phân để giải quyết vấn đề đó
Để tiện trình bày phương pháp ta xét một bài toán cụ thể sau
u t
Ta chia miền Q thành ô bởi những đường thẳng T x x i, t t j, mỗi điểm
x , i t j được gọi là một nút và ký hiệu là i , j Mục tiêu của phương pháp
là tìm nghiệm gần đúng của bài toán tại các nút i , j
Trong đó:
h gọi là bước đi không gian
Trang 14 gọi là bước đi thời gian
Tập tất cả các nút i , j tạo thành một lưới sai phân trên QT
u t
x u t
x
u
j i j
i j
1 1
h o t x x
u h
t x u t x u t
x
u
j i j
i j
i j
1.1.4 Bài toán sai phân
Bài toán đặt ra là phải tìm nghiệm gần đúng v i j u ( xi, tj)
* Xuất phát từ ( , 1) ( , ) ( , ) ()
u t
x u t
x u
j i j
i j
1 1
h o t x x
u h
t x u t x u t
x u
j i j
i j
i j
u t
x t
u
j i j
2
2
1 1
1
j i
j i
j i
j i
v v v
Trang 15M j
t g v t
( )
j i
j i
j i
v1, , 1 thì tính được j 1
i
v với các điều kiện đầu cho giá trị ở lớp thời gian đầu tiên j 0, các giá trị trên biên cho ở
(1.14)
* Nếu ta xuất phát từ ( , 1) ( , ) ( , 1) ()
u t
x u t
x u
j i j
i j
,(),(2),
1 2
2 2
1 1 1
1 1
h o t
x x
u h
t x u t
x u t
x u
j i j
i j
i j
2
1 1 1
x u t
x t
u
j i j
2
1 2
1 1 1
1 1 1
j i
j i
j i
j i
j
h
v v
v v v
1
0,1
Trang 161.2 Phương trình truyền nhiệt 2 chiều
Phương trình nhiệt: Là một phương trình đạo hàm riêng miêu tả sự
biến thiên của nhiệt độ trên một miền cho trước qua thời gian [7,8]
Mô tả bài toán: Giả sử ta có một hàm số u miêu tả nhiệt độ tại bất kì vị
trí (x, y) nào đó Hàm số này sẽ thay đổi theo thời gian khi nhiệt truyền đi ra khắp không gian Phương trình nhiệt được sử dụng để xác định sự thay đổi của hàm số u theo thời gian
Một trong những tính chất của phương trình nhiệt là định luật maximum nói rằng giá trị lớn nhất của u hoặc là ở thời gian trước đó hoặc là ở cạnh biên của miền đang xét Điều này đại khái nói rằng nhiệt độ hoặc nhiệt độ đến từ một nguồn nào đó hoặc là từ thời gian trước đó chứ không được tạo ra từ không
có gì cả Đây là một tính chất của phương trình vi phân parabolic và không khó chứng minh
Một tính chất khác nữa là ngay cả nếu như u không liên tục tại thời gian khởi đầu t = t0, thì nhiệt độ sẽ ngay lập tức trơn ngay tức khắc sau đó cho các giá trị t > t0 Chẳng hạn, nếu một thanh kim loại có nhiệt độ 0 và một thanh khác có nhiệt độ 100 và được gắn với nhau đầu này với đầu kia, thì
Trang 17ngay lập tức nhiệt độ tại điểm nối là 50 và đồ thị của nhiệt độ chạy trơn từ 0 đến 100 Về mặt vật lý điều này là không thể được, vì như vậy là thông tin được truyền đi với vận tốc vô hạn, sẽ phá vỡ luật nhân quả Đây là một tính chất của phương trình nhiệt hơn là bản thân của sự truyền nhiệt Tuy nhiên, cho nhiều mục đích thực tế, sự khác nhau là có thể bỏ qua
Phương trình nhiệt được sử dụng trong xác suất và để diễn tả bước ngẫu nhiên (random walks) Nó cũng được áp dụng trong toán tài chính vì lý
(1.17)
với:
u=u ( t, x, y) là một hàm số theo thời gian và không gian;
là mức độ thay đổi của nhiệt độ tại một điểm nào đó theo thời gian;
Trang 18 đạo hàm bậc 2 (lưu chuyển nhiệt) của nhiệt độ theo
hướng x, y, theo thứ tự
k là một hệ số phụ thuộc vào vật liệu phụ thuộc vào độ dẫn nhiệt, mật
độ và dung tích nhiệt
Phương trình nhiệt là hệ quả của định luật Fourier cho dẫn nhiệt
Nếu môi trường truyền đi không phải là toàn bộ không gian, để giải phương trình nhiệt chúng ta cần phải xác định các điều kiện biên cho hàm
số u Để xác định tính duy nhất của các nghiệm trong toàn bộ không gian chúng ta cần phải giả thiết một chặn trên với dạng hàm mũ, điều này là hợp với các quan sát từ thí nghiệm
Nghiệm của phương trình nhiệt được đặc trưng bởi sự tiêu tán dần của nhiệt độ ban đầu do một dòng nhiệt truyền từ vùng ấm hơn sang vùng lạnh hơn của một vật thể Một cách tổng quát, nhiều trạng thái khác nhau và nhiều điều kiện ban đầu khác nhau sẽ đi đến cùng một trạng thái cân bằng Do đó,
để lần ngược từ nghiệm và kết luận điều gì đó về thời gian sớm hơn hay các điều kiện ban đầu từ điều kiện nhiệt hiện thời là hết sức không chính xác ngoài trừ trong một khoảng thời gian rất ngắn
Phương trình nhiệt là một ví dụ phổ biến của phương trình vi phân parabolic
Sử dụng toán tử Laplace, phương trình nhiệt có thể tổng quát thành
với toán tử Laplace được lấy theo biến không gian
Phương trình nhiệt miêu tả sự tiêu tán nhiệt, cũng như nhiều quá trình tiêu tán khác, như là tiêu tán hạt hoặc là sự lan truyền của thế năng phản ứng trong tế bào thần kinh Mặc dù không có bản chất tiêu tán, một số bài toán trong cơ học lượng tử cũng được miêu tả bằng một phương trình tương
tự như là phương trình nhiệt Nó cũng có thể được sử dụng để mô phỏng các
Trang 19hiện tượng xảy ra trong tài chính, như là Black-Scholes hay là các quá trình Ornstein-Uhlenbeck Phương trình này, và các phương trình phi tuyến tương
tự khác, được sử dụng trong phân tích ảnh
Phương trình nhiệt, về mặt kỹ thuật, là vi phạm thuyết tương đối hẹp, bởi vì nghiệm của nó đã lan truyền nhiễu loạn đi tức khắc
Điều kiện biên và điều kiện ban đầu:
* Điều kiện ban đầu và điều kiện tham số đầu vào:
Trong vật lý ta biết rằng muốn xác định được nhiệt độ tại mọi điểm trong vật ở mọi thời điểm, ngoài phương trình (1.17) ta còn cần phải biết phân
bố nhiệt độ trong vật ở thời điểm đầu và chế độ nhiệt độ ở biên s của vật Điều kiện biên có thể cho bằng nhiều cách
* Cho biết nhiệt độ tại mỗi điểm P của biên S u|S 1(P,t)
* Tại mọi điểm của biên s cho biết dòng nhiệt n
u k q
2 P t n
( 2
Như vậy bài toán truyền nhiệt trong một vật rắn, đồng chất truyền nhiệt đẳng hướng đặt ra như sau: Tìm nghiệm của phương trình (1.17) thoả mãn điều kiện đầu u t0 (x,y,z)
và một trong các điều kiện biên
(1.18)
(1.19)
(1.20)
Trang 201.3 Công nghệ mạng nơron tế bào
1.3.1 Các định nghĩa về mạng nơ ron tế bào
Khi phát triển lý thuyết về mạng nơron tế bào, các nhà nghiên cứu đã đưa ra một số định nghĩa có tính hình thức về kiến trúc mạng [10,11]:
Định nghĩa 1: Hệ mạng nơron tế bào – CNN:
a) Là ma trận 2-, 3- hoặc n- chiều của những phần tử động giống nhau (gọi là
tế bào - cell)
b) Mỗi tế bào có hai thuộc tính:
- Chỉ tương tác trong vùng có bán kính là r
- Mọi biến trạng thái là tín hiệu có giá trị liên tục
Định nghĩa 2: CNN là mạch phi tuyến động kích thước lớn được tạo bởi cặp
các phần tử liên kết với nhau, phân bố đều trong không gian mà mỗi phần tử
là một mạch tích hợp gọi là cell Mạng này có thể có cấu trúc hình chữ nhật, lục giác đều, cầu v.v Hệ CNN cấu trúc MxN được định nghĩa một cách toán học theo 4 đặc tả sau:
1) CNN là phần tử động học nghĩa là trạng thái điện áp của tế bào thay đổi theo thời gian tùy theo tương tác giữa nó và các láng giềng
2) Luật tiếp hợp trong CNN biểu diễn sự tương tác cục bộ trong từng cặp lân cận trong các tế bào láng giềng, mỗi tế bào có: Điều kiện ban đầu; Điều kiện biên
Nr(i,j) = {C(k,l)|max{|k-i|,|l-j|} r, 1 k M, 1 l M}
Trang 21Mẫu vô tính có ý nghĩa là ta có thể sử dụng để mô tả hình dạng hình học
và đưa ra phương pháp thiết kế đơn giản
1.3.2 Kiến trúc chuẩn về công nghệ mạng nơ ron tế bào
Một kiến trúc công nghệ mạng nơ ron tế bào chuẩn là một mảng hình chữ nhật MxN các cell (C(i,j)) với toạ độ Đề các (i,j); i = 1,…,M; j = 1,…,N
Mạng nơ ron tế bào được L.O Chua và L Yang đưa ra năm 1988 có kiến trúc chuẩn là một mảng hai chiều các tế bào (cell) mà mỗi tế bào là một chip xử lý, các tế bào chỉ có liên kết cục bộ với các tế bào láng giềng Các tế bào có cấu tạo giống hệt nhau gồm các điện trở, tụ tuyến tính; các nguồn dòng tuyến tính và phi tuyến Cho đến này kiến trúc mạng CNN đã được phát triển
đa dạng phức tạp trong nhiều ứng dụng khác nhau nhưng vẫn hoạt động dựa trên nguyên tắc mà Chua và Yang đưa ra
Hình 1.2: Kiến trúc làm việc của mạng CNN
Trang 221.3.3 Các dạng kiến trúc mạng CNN
Phân loại theo hình trạng
Về mặt hình trạng mạch (topology) chúng ta có thể phân loại CNN thành các mô hình khác nhau Ngoài kiến trúc chuẩn như đã giới thiệu trên, sau đây chúng ta xét một số mô hình tiêu biểu:
+ CNN không đồng nhất: (NUP – CNN) có hai loại tế bào được mô tả bởi ô
trắng và đen trong Hình 1.8.a Cấu trúc NUP-CNN có chứa hơn một kiểu tế bào trên lưới trong khi các tế bào tương tác với nhau là biến không gian
+ CNN đa lân cận (MNS-CNN: Multiple Neighborhood Size – CNN): CNN
có hai kiểu lân cận như Hình 1.3 Mọi chip trong mạch có cấu tạo phần cứng giống nhau nhưng chia làm hai lớp lưới (P, S) Lưới P có các lân cận r=1; lưới S là lớp trên hoặc dưới của lưới P có r=3 Kiến trúc MNS-CNN có chứa những lớp có những lưới và lân cận khác nhau, chúng mô phỏng theo hệ thống tế bào tự nhiên Trường hợp đặc biệt của MNS-CNN với hai kiểu lân cận chỉ chứa một chip trong lớp S, và mọi chíp khác đều kết nối tới con chíp này Như đã nói CNN có cấu tạo rất linh hoạt tùy theo yêu cầu giải quyết xử
lý của mỗi bài toán, do vậy người ta cũng đưa ra mô hình MSN-CNN Loại MSN-CNN không phổ biến chỉ sử dụng trong một số trường hợp đặc biệt cho những bài toán thích hợp
Hình 1.3 Một số kiến trúc CNN không chuẩn (a) Không đồng nhất; (b) Đa lân cận
(b)
(a)
Trang 23+ Kiến trúc CNN đa lớp: Như đã xét ở phần trước, một lớp CNN đơn, mỗi tế
bào chỉ có một biến trạng thái Với bài toán có nhiều biến trạng thái (như giải
hệ phương trình vi phân có nhiều biến) người ta cần một hệ có nhiều lớp gọi
là cấu trúc đa lớp Trong cấu trúc CNN đa lớp có nhiều biến trạng thái cho mỗi đầu vào Khái niệm đa lớp nhấn mạnh đến sự tương tác giữa các biến trong một lớp, giữa các lớp Có thể hình dung một hệ CNN đa lớp là kết hợp của nhiều lớp đơn xếp chồng lên nhau, ngoài tương tác giữa các tế bào trong một lớp còn có tương tác giữa các lớp
Khi có nhiều biến trạng thái ta có thể chọn nhiều kiểu tương tác đồng thời cho mỗi biến trạng thái khác nhau Thuộc tính này làm cho CNN cực kỳ linh hoạt và cho phép chúng ta giải quyết những bài toán xử lý phức tạp
Một cách tổng quát trong CNN đa lớp, kích thước và hình trạng liên kết
có thể khác nhau giữa các lớp Ký hiệu mỗi lớp kj trong đó k kích thước của lớp (nếu k = 2 nghĩa là ở lớp j có là ma trận 2 chiều MxN), j là chỉ số của lớp Xét một hệ CNN hai chiều 3 lớp (Hình 1.4) có ký hiệu các lớp là 21, 22,
23 trong đó mỗi lớp là các ma trận 3x5 Tuy nhiên, để đơn giản hoá ta coi kích thước của các lớp là giống nhau nên ta có thể bỏ chỉ số k, chỉ còn chỉ số
Hình 1.4 Kiến trúc CNN hai chiều
21
22
23
Trang 24j (j) với mọi j{1,2, n} Ta thấy mỗi tế bào ta xét trong Hình 1.1 không chỉ liên kết với các tế bào trong lớp mà còn liên kết với các tế bào trong lớp trên
và dưới Một cách tổng quát chúng ta có thể coi kích thước của các lân cận của mỗi tế bào ở mỗi lớp là tùy ý
Phân loại theo thời gian xử lý:
-Discrete-Time Cellular Neural Network (DT-CNN): Xử lý các tín hiệu rời
rạc theo thời gian
-Continuous-Time Cellular Neural Network (CT-CNN): Xử lý các tín hiệu
liên tục theo thời gian
Phân loại theo tín hiệu đầu vào:
+ CNN tuyến tính (Linear CNN): Tín hiệu đưa vào xử lý là tín hiệu tuyến
tính CNN loại này được sử dụng cho xử lý các tín hiệu tuyến tính rất phù hợp cho một số thao tác cơ bản trong xử lý ảnh tuyến tính Mẫu CNN tuyến tính được ký hiệu:
A(i,j;l,k); B(i,j;k,l) + CNN phi tuyến (Non-Linear Cellular Neural Network-NLCNN): Tín hiệu
đưa vào sử lý là tín hiệu phi tuyến trong một số ứng dụng như giải phương trình vi phân, xử lý ảnh phi tuyến người ta sử dụng CNN phi tuyến Bản chất của CNN phi tuyến khác với CNN tuyến tính là nguồn dòng điều khiển Ixy và
Ixu được xác định bởi mẫu phi tuyến có ký hiệu:
+ CNN trễ: Trong quá trình xử lý có những lúc cần tạo ra những tín hiệu trễ
và người ta sử dụng CNN trễ Bản chất trễ ở đây được thực hiện với các mẫu
trễ và các tín hiệu vào/ra trễ, điện áp là hàm của biến thời gian trễ (T- t)
Tham số trễ thời gian t có thể được điều khiển thông qua các phần tử mạch (điện trở R, tụ điện C) mẫu trễ được ký hiệu:
Trang 25( , ; , )
A i j k l và B i j k l( , ; , )
+ CNN hỗn độn (chaos): Một số trường hợp mạch CNN làm việc ở trạng thái
phi tuyến và có dao động không tuần hoàn trở thành trạng thái hỗn độn (chaos) Hiện tượng này trái ngược với trạng thái hoạt động bình thường của CNN Hiện nay, vấn đề này vẫn được tiếp tục nghiên cứu để ứng dụng cho một số bài toán như mã hóa, bảo mật
.Phân loại theo tương tác:
+ CNN không ghép cặp: Là hệ CNN mà các tế bào có tương tác với tế bào
láng giềng nhưng không truyền thông tin cho nhau mà chỉ xử lý độc lập nghĩa
là không có hiện tượng lan truyền tín hiệu trong toàn hệ
+ CNN ghép cặp: Trái với CNN không ghép cặp hệ CNN này các tế bào trong
quá trình xử lý có truyền thông tin cho nhau để xử lý có tính toàn cục Với nhiều bài toán xử lý các thông tin trạng thái thay đổi liên tục có ảnh hưởng đến nhau thông qua hàm trạng thái thì CNN ghép cặp được sử dụng nhất là trong cấc bài toán giải phương trình đạo hàm riêng
Đầu vào U Trạng thái X Đầu ra Y
Hình 1.5: CNN không gian bất biến với 3 láng giềng
Trang 26Chúng ta xét trường hợp tổng quát được mô tả trực quan về tương tác giữa các tế bào thông qua mẫu trong Hình 1.5 với hệ CNN có đủ các tham số Cấu trúc luồng tín hiệu của một CNN với 3x3 láng giềng, 2 bóng hình nón bóng mầu tím là biểu tượng của trọng số bổ sung của điện áp đầu vào (giá trị của ma trận trọng số B) và bóng mầu vàng là biểu tượng của trọng số hồi tiếp
từ đầu ra (giá trị của ma trận trọng số A) của tế bào C(k,l)S1(i,j) tới trạng thái điện áp của tế bào trung tâm C(i,j) Cấu trúc hệ thống của tế bào C(i,j) được mô tả trong Hình 1.5 Mũi tên in đậm đánh dấu đường dữ liệu song song từ đầu vào và đầu ra của các tế bào láng giềng ukl và ykl Mũi tên trên các đường mảnh theo thứ tự biểu thị ngưỡng, đầu vào, trạng thái và đầu ra, z,
x x BU z
Cấu trúc luồng tín hiệu của hồi tiếp bằng 0 với 3x3 láng giềng (Hình1.6) Hình nón là biểu tượng của trọng số bổ sung của điện áp đầu vào của các tế bào C(k,l)S1(i,j) tới tế bào trung tâm C(i,j)
Trang 27Mô hình mạch điện của lớp C(0,B,z) như trong Hình 1.8:
+ Lớp đầu vào bằng 0 C(A,0,z): Một CNN thuộc lớp đầu vào bằng 0 C(A,0,z) nếu và chỉ nếu tất cả các mẫu phần tử dẫn nhập là 0, tức là B ≡ 0, mỗi tế bào của CNN đầu vào bằng 0 được miêu tả bởi phương trình trạng thái:
Hình 1.8: Mạch điện của CNN có hồi tiếp bằng 0
Đầu vào U Trạng thái X Đầu ra Y
Hình 1.7: CNN hồi tiếp bằng 0: C(0,B,z)
Đầu vào U Trạng thái X Đầu ra Y
Hình 1.9: CNN đầu vào bằng 0, C(A,0,z)
Trang 28Cấu trúc luồng tín hiệu của CNN đầu vào bằng 0 với 3x3 láng giềng Hình nón màu vàng là biểu tượng của trọng số bổ sung của điện áp đầu ra của các
tế bào láng giềng C(k,l)Sr(k,l) tới tế bào trung tâm C(i,j) Mô hình mạch điện được mô tả trong Hình 1.10 sau:
1.3.4 Một số ứng dụng của công nghệ CNN
Các ứng dụng của công nghệ CNN được chia thành các nhóm chính [9]:
- Các ứng dụng xử lý ảnh tốc độ cao: Đây là một trong những ứng dụng chủ yếu trong nhiều lĩnh vực của cuộc sống mà các hệ camera thông thường không đáp ứng được
- Các ứng dụng đòi hỏi xử lý dữ liệu lớn trong thời gian thực: giải phương trình vi phân đạo hàm riêng, tạo sóng phi tuyến, xử lý dòng tín hiệu video, tối
ưu hoá hệ thống truyền dữ liệu băng hẹp, điều khiển các hệ chuyển mạch ATM, v.v…
- Trong công nghiệp và giao thông vận tải-ô tô:
+ Phân tích bề mặt nhãn in, dệt, phân tích kết cấu sợi tốc độ cao, kiểm tra các lỗi và vị trí lỗi của các sản phẩm, các nhãn, rubăng, vải… ngay trong quá trình sản xuất
+ Kiểm tra bề mặt trong công nghiệp chế tạo giấy, nhôm, sắt, các chỗ rối, các chỗ rách, hỏng, những chỗ nhăn, các vết đen của giấy có thể được nhận ra
Trang 29và xác định vị trí trong quá trình sản xuất Cần nhấn mạnh rằng việc kiểm tra này là kiểm tra không tiếp xúc
+ Phát hiện ánh sáng có thời gian tồn tại ngắn: dùng khi cần kiểm tra độ cách điện cho sứ ở điện áp cao cũng như kiểm tra xuất hiện tia lửa điện khi đóng điện Trong những loại hình công việc này các camera CNN có thể phân loại tia lửa điện với tốc độ hơn 50.000fps
+ Phân tích hình dáng và kích thước: Kiểm tra, phân loại số lượng lớn các vật nhỏ như các viên thuốc, hạt ngũ cốc, các đai ốc, đinh ốc v.v… + Đo tốc độ và giám sát kích thước những vật chuyển động nhanh không cần tiếp cận
+ Trong công nghệ ô tô: dùng các sensor phân tích tình huống trong chế
độ thời gian thực, làm sensor thông minh điều khiển các túi khí bảo vệ, các gương chiếu hậu thông minh
- Trong y tế: phân tích thời gian thực chuỗi DNA, điện tâm đồ 2D thời gian thực, điện tâm đồ 3D trực tuyến, chế tạo mắt nhân tạo
- Trong quân sự:
+ Sử dụng trong các thiết bị không người lái
+ Theo dõi nhiều đối tượng: có thể thực hiện hợp nhất các ảnh từ nhiều nguồn camera khác nhau trong thời gian thực, phát hiện mục tiêu di động Nhận dạng đa mục tiêu trong lĩnh vực giám sát và an ninh
+ Phân tích địa hình thời gian thực v.v…
Trong xu thế hiện nay các ngành khoa học đều có sự đan xen, thừa kế lẫn nhau Do tiềm năng về năng lực tính toán và khả năng ứng dụng rộng rãi trong nhiều lĩnh vực của cuộc sống, công nghệ CNN đã ngày càng thu hút được sự quan tâm của nhiều nhà nghiên cứu khoa học trên thế giới Các hướng nghiên cứu trong thời gian tới về công nghệ CNN vẫn bao gồm cả lý
Trang 30thuyết và thực nghiệm, cả cơ bản và ứng dụng, ngoài các vấn đề đang thực hiện sẽ có thêm các hướng sau:
- Các thuật toán CNN phục vụ cho nghiên cứu miễn dịch
- Các nguyên lý xử lý cặp sóng cho các ứng dụng dò tìm mục tiêu khó khăn
- Camera võng mạc, có thể đảo mắt trơn tru, lập trình được và hiển thị thời gian thực việc nhận biết mục tiêu
- Công nghệ nano thực hiện các mảng sensor ứng dụng riêng và các nguyên tắc tính toán sóng tế bào bao gồm các mảng transito nano từ, các mảng hoá
- Mã hoá và đo nội dung thông tin trong các luồng không gian-thời gian và các bước xử lý
- Khai thác nguyên tắc của sự tăng độ nhạy của cảm giác trong cả thời gian và không gian
- Các nguyên tắc xử lý xúc giác tương tác và các hệ thống mô phỏng cho các tác vụ khó như cầm giữ các đối tượng mỏng manh, mở các trang sách của quyển sách… thính giác động tìm nhận ra các hiệu ứng âm thanh bất thường cũng như các cảm nhận sự bùng nổ, gãy vỡ…
- Quan sát mức độ rộng hoặc toàn cầu Mạng sensor kích hoạt di động phân
bố trong không gian
- Trí thông minh nhân tạo qua tổng hợp nhiều sensor, ví dụ nhận dạng viết bằng tay qua các mẫu hình thái ngôn ngữ
- Trong xu thế hiện nay các ngành khoa học đều có sự đan xen, thừa kế lẫn nhau Do tiềm năng về năng lực tính toán và khả năng ứng dụng rộng rãi trong nhiều lĩnh vực của cuộc sống, công nghệ CNN đã ngày càng thu hút được sự quan tâm của nhiều nhà nghiên cứu khoa học trên thế giới Các hướng nghiên cứu trong thời gian tới về công nghệ CNN vẫn bao gồm cả lý thuyết và thực nghiệm, cả cơ bản và ứng dụng, ngoài các vấn đề đang thực hiện sẽ có thêm các hướng sau:
Trang 31- Các thuật toán CNN phục vụ cho nghiên cứu miễn dịch
- Các nguyên lý xử lý cặp sóng cho các ứng dụng dò tìm mục tiêu khó khăn
- Camera võng mạc, có thể đảo mắt trơn tru, lập trình được và hiển thị thời gian thực việc nhận biết mục tiêu
- Công nghệ nano thực hiện các mảng sensor ứng dụng riêng và các nguyên tắc tính toán sóng tế bào bao gồm các mảng transito nano từ, các mảng hoá
- Mã hoá và đo nội dung thông tin trong các luồng không gian-thời gian và các bước xử lý
- Khai thác nguyên tắc của sự tăng độ nhạy của cảm giác trong cả thời gian và không gian
- Các nguyên tắc xử lý xúc giác tương tác và các hệ thống mô phỏng cho các tác vụ khó như cầm giữ các đối tượng mỏng manh, mở các trang sách của quyển sách… thính giác động tìm nhận ra các hiệu ứng âm thanh bất thường cũng như các cảm nhận sự bùng nổ, gãy vỡ…
- Quan sát mức độ rộng hoặc toàn cầu Mạng sensor kích hoạt di động phân
bố trong không gian
- Trí thông minh nhân tạo qua tổng hợp nhiều sensor, ví dụ nhận dạng viết bằng tay qua các mẫu hình thái ngôn ngữ
Trang 32CHƯƠNG 2 GIẢI PHƯƠNG TRÌNH TRUYỀN NHIỆT HAI CHIỀU
2.1 Mối quan hệ giữa mạng CNN và phương trình đạo hàm riêng [12]
- Dạng phương trình đạo hàm riêng (PDE) dạng 1D trong không gian:
Ta có hệ phương trình PDE với 2 ẩn u, v:
(2.2) Sai phân (2.1):
Sai phân (2.2):
- Mối quan hệ giữa PDE và mạng CNN cho ta các mẫu với từng hàm
u, v và mạng CNN trường hợp này có hai lớp 1D mỗi lớp tính toán cho một ẩn hàm:
Trang 33trình toán học
Hình 2.1: Mạch CNN hai lớp Lớp u có ảnh hưởng đến lớp v
Tuy nhiên, theo hệ phương trình Navier – Stokes với dạng phương trình
đạo hàm riêng có hai biến không gian (x,y) và một biến thời gian (t) chúng ta phân tích bài toán dẫn đến phải xây dựng hệ CNN 2D Giả sử có dạng phương trình PDE:
với các điều kiện biên và điều kiện ban đầu tương ứng và giả thiết phương trình có nghiệm ổn định Các biểu thức , , được xác định như ở ví dụ trên Chọn lưới sai phân hai chiều với bước sai phân x, y (Hình 2.2)
Hình 2.2: Lưới sai phân 2 chiều
vi-1 vi vi+1
ui-1 ui ui+1
Lớp v Lớp u
Trang 34Khai triển Taylor cho tế bào tại vị trí C(i,j) được dạng sai phân tương ứng:
(2.4)
Từ phương trình sai phân so sánh với phương trình trạng thái của CNN
ta được các mẫu CNN dạng 2D như sau:
- Dạng hệ PDE có đạo hàm của hai hàm cùng xuất hiện [14,15]
Cho PDE có dạng :
(2.5)
(2.6) Sai phân vế phải của (2.5):
Trang 35Về mạch CNN cũng có dạng hai lớp một lớp cho hàm u, một lớp cho hàm v, (những tế bào biểu diễn bởi hình bình hành có màu là có giá trị mẫu khác không; tế bào khác có giá trị mẫu bằng 0 Những đường liên kết đậm thể hiện có tương tác đường mảnh thể hiện không có tương tác (Hình 2.3)
Trang 36
Hình 2.3: Mô hình mạch cho bài toán giải hệ PDE
2.2 Phương pháp giải phương trình đạo hàm riêng bằng công nghệ mạng
nơ ron tế bào
2.2.1 Mẫu và thiết kế mẫu
Giả sử chúng ta xét với bài toán xử lý ảnh, một lệnh của ngôn ngữ là toán tử định nghĩa mẫu như sau [1,13]:
TemplateName(InputImage,InitialStateImage,OutputImage,TimeInterval,boun daryCond)
Trong đó: TemplateName: tên mẫu; InputImage: ảnh vào;
OutputImage: ảnh ra sau khi đã xử lý; TimeInterval: thời gian xử lý là
thời gian thay đổi giá trị điểm ảnh (hay trạng thái của tế bào biểu diễn điểm
ảnh đó); BoundaryCond: điều kiện biên
Ví dụ mẫu dò biên như sau:
EDGE(LLM1,LLM2,LLM3,10,-1)
Có nghĩa là: Lệnh (mẫu) dò biên EDGE áp dụng cho ảnh vào, trạng thái khởi tạo, và ảnh ra xác định bởi các tham số vào (LLM1) lưu trữ bởi LLM2, đưa ra bởi LLM3, tại thời điểm 10 giây, giá trị biên là -1
Trang 37Trong xử lý ảnh, nhiều trường hợp chúng ta phải xác định có điểm
“đen” nào trong tập các điểm “trắng” không, chúng ta gọi toán tử GW(.) để kiểm tra thuộc tính này, GW(.) được định nghĩa như sau:
Cho trước một ảnh nhị phân P có chứa MxN điểm (pixel):
1 (yes) nếu tất cả các pixel của P là trắng (1) GW(P) =
-1 (No) nếu ít nhất một pixel là đen (-1); có một số trường hợp ta chấp nhận giá trị (0) giống như trong máy tính PC
Hàm này được ứng dụng trong nhiều các phép xử lý lô gic khác mà có kết quả ứng với hai giá trị nhị phân (True/False)
2.2.2 Ứng dụng máy tính CNN-UM trong một số bài toán đơn giản
* Bài toán so sánh ảnh
Xác định xem có phải S1 là tập con của S2 không với S1 là ảnh P1; S2 là ảnh P2 Giả thiết xét một ảnh ta chỉ quan tâm đến điểm đen (điểm trắng coi như là nền) Nếu mọi điểm đen của ảnh P1 trùng với phần đen của P2 thì ta nói
P1 thuộc P2 và suy ra S1 S2 Chúng ta định nghĩa sau đây thủ tục con của hàm SUBSET1(.,.,.)
có khuôn dạng: SUBSET1(P1,P2,Y), trong đó: P1,P2: là ảnh nhị phân kích thước MxN những điểm đen là tập liên quan; Y: giá trị lô gic (1;-1 hay Yes, No)
Thuật toán:
Cho trước P1, P2 Thuật toán xử lý gồm 3 bước:
p3:= NOT(P1)
P1:= P3 AND P2
IF P1 chỉ chứa những điểm trắng THEN
Y:=1 (Yes) ELSE Y:=-1 (No)
Kết cấu mạch phần cứng
Trang 38Để thi hành thuật toán này trên CNN chúng ta cần thêm một khối phần cứng trong mỗi một tế bào và hai khối phần cứng cho cả hệ thống Một tế bào
mở rộng gồm các khối Local Logic Memory (LLM) với 3 ô nhớ lưu trữ Global White tester (GW) và Global Clock (GCL) như trong Hình 2.4
Nếu chúng ta có 2 mảng tế bào khác nhau, một thi hành lệnh NOT; một thi hành lệnh AND kết cấu như Hình 2.5 dưới đây:
Hình 2.4: Kiến trúc tế bào mở rộng thêm vào 3 khối (LLM, GW, GCL)
Hình 2.5: Tế bào mở rộng có thêm hai khối cell khác nhau
TEM1 (LOGNOT); TEM2 (LOGAND)
Trang 39
Hình 2.6 Thủ tục SUBSET như một hàm (TEM1 là LOGNOT;TEM2 là LOGAND)