Trong số các hướng nghiên cứu nhằm triển khai các hệ thống thông minh ở giai đoạn tới, mạng nơron giữ một vai trò quan trọng trong việc phát triển các giải pháp nhận dạng, dự báo…Mạng nơ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-
LUẬN VĂN THẠC SĨ KHOA HỌC ỨNG DỤNG MẠNG NƠRON NHÂN TẠO DỰ BÁO PHỤ TẢI NGẮN HẠN HỆ THỐNG ĐIỆN MIỀN BẮC NGÀNH: CễNG NGHỆ THễNG TIN MÃ SỐ: CHU NGHĨA Người hướng dẫn khoa học: PGS.TS NGUYỄN ĐỨC NGHĨA HÀ NỘI 2007 Mục lục Danh mục các từ viết tắt 3
Mở đầu 4
CHƯƠNG I 7
PHụ TảI Hệ THốNG ĐIệN MIềN BắC và bài toán dự báo 7
1.1 Phụ tải Hệ thống điện miền Bắc 7
1.1.1 Giới thiệu chung về HTĐ miền Bắc 7
1.1.2 Tầm quan trọng của dự báo phụ tải 10
1.1.3 Những yếu tố ảnh hưởng đến phụ tải ngắn hạn 11
1.1.4 Mục tiêu và phạm vi nghiên cứu dự báo phụ tải 15
1.2 Bài toán dự báo phụ tải 16
1.2.1 Đặc điểm đồ thị phụ tải HTĐ miền Bắc 16
1.2.2 Dự báo phụ tải ngắn hạn cho 24h tiếp theo 19
CHƯƠNG II 23
Tổng quan Về MạNG NƠRON NHÂN TạO 23
2.1 Lịch sử phát triển của mạng nơron nhân tạo 23
2.2 Cơ sở lý thuyết mạng nơron 26
2.3 Bộ não và nơron sinh học 27
2.4 Mô hình mạng nơron nhân tạo 30
2.4.1 Mô hình một nơron nhân tạo 30
3.4.2 Mô hình mạng nơron nhân tạo 33
Chương III 40
ứng dụng mạng nơron ánh xạ đặc trưng tự tổ chức Kohonen trong bài toán phân loại ngày 40
3.1 Sự cần thiết phân loại đồ thị phụ tải 40
3.1.1 Tập hợp các kiểu đồ thị phụ tải đặc trưng 40
3.1.2 Sự cần thiết phân loại ngày bằng phương pháp mạng nơron 42
3.2 Mạng nơron ánh xạ đặc trưng tự tổ chức Kohonen 43
3.2.1 Cấu trúc mạng 44
3.2.2 Huấn luyện mạng 45
3.2.3 Sử dụng mạng 47
3.3 Xây dựng mạng Kohonen để phân loại ngày 48
3.3.1 Thiết kế cấu trúc mạng 48
3.3.2 Huấn luyện mạng 49
3.3.3 Xây dựng cấu trúc phần mềm mô phỏng mạng Kohonen phân loại ngày 52
3.3.4 Kết quả sử dụng mạng Kohonen phân loại ngày 52
3.3.5 Phân tích kết quả phân loại ngày trong tháng 2/2006, tháng 5/2006 54
CHƯƠNG iV 58
Trang 2ứNG DụNG MạNG NƠRON NHIềU LớP LAN TRUYềN NGƯợC SAI Số Dự
BáO PHụ TảI Ngắn hạn THEO NHIệT Độ MÔI TRƯờNG 58
4.1 Các khái niệm cơ bản về mạng nơron nhiều lớp lan truyền ngược sai số (Back propagation neural network) 58
4.1.1 Kiến trúc mạng truyền thẳng .59
4.1.2 Huấn luyện mạng 60
4.1.3 Sử dụng mạng 64
4.1.4 Nghiên cứu sự hội tụ và độ phức tạp của quá trình huấn luyện mạng 64
4.1.5 Một số vấn đề về mạng nơron nhiều lớp 67
4.2 ứng dụng mạng nơron nhiều lớp lan truyền ngược sai số xây dựng bài toán dự báo phụ tải hệ thống điện 68
4.2.1 Các bước xây dựng bài toán dự báo phụ tải .68
4.2.2 Xây dựng cấu trúc phần mềm mô phỏng mạng nơron lan truyền ngược sai số ứng dụng trong bài toán dự báo đỉnh và đáy đồ thị phụ tải .72
4.2.3 Dự báo phụ tải cho 24 giờ trong ngày 85
CHƯƠNG V 99
Hệ thống phần mềm dự báo phụ tải ngắn hạn cho hệ thống điện miền bắc 99
5.1 Giới thiệu về cơ sở dữ liệu .99
5.2 Đặc tả các chức năng 100
5.2.1 Truy vấn dữ liệu 100
5.2.2 Phân loại dữ liệu 101
5.2.3 Chuẩn hoá dữ liệu 101
5.2.4 Huấn luyện mạng 101
5.2.5 Dự báo phụ tải 101
5.3 Hướng dẫn sử dụng 102
5.3.1 Truy vấn dữ liệu 102
5.3.2 Phân loại dữ liệu 103
5.3.3 Chuẩn hoá dữ liệu 103
5.3.4 Huấn luyện mạng 104
5.3.5 Dự báo 104
CHƯƠNG vI 106
so sánh với một số kết quả đ∙ có và Đánh giá kết quả 106
6.1 So sánh với một số phương pháp đã có 106
6.2 Đánh giá kết quả 111
KếT LUậN 114
Tài liệu tham khảo 116
Phụ lục i 118
Phụ lục II 120
Tóm tắt luận văn 123
Summary 124
Danh mục các từ viết tắt
ANN Mạng nơron nhân tạo DBPT Dự báo phụ tải HTĐ Hệ thống điện HTĐ1 Trung tâm Điều độ Hệ thống điện miền Bắc MSE Trung bình tổng bình phương sai số SSE Tổng bình phương sai số
CNTT Công nghệ thông tin
ĐTPT Đồ thị phụ tải
Trang 3Mở đầu
Trong những năm gần đây, do nhu cầu năng lượng không ngừng biến
đổi và tăng lên rõ rệt theo thời gian nên ngành Điện lực đã và đang xây dựng
rất nhiều các nhà máy điện để đáp ứng nhu cầu tiêu thụ điện năng trong cả
nước Vì vậy, một trong những vấn đề quan trọng mà ngành Điện lực cần phải
giải quyết tốt là bài toán dự báo phụ tải ngắn hạn và dài hạn
Cho đến nay tuy đã có nhiều phương pháp luận trong việc giải quyết bài
toán dự báo, song bài toán này luôn là một bài toán khó Hiện nay, trong
ngành Điện lực Việt Nam bài toán dự báo phụ tải được giải quyết chủ yếu nhờ
sử dụng các phương pháp dự báo truyền thống mang tính kinh nghiệm thuần
tuý Trong số các hướng nghiên cứu nhằm triển khai các hệ thống thông minh
ở giai đoạn tới, mạng nơron giữ một vai trò quan trọng trong việc phát triển
các giải pháp nhận dạng, dự báo…Mạng nơron nhân tạo là kỹ thuật xử lý
thông tin có triển vọng ứng dụng trong việc giải quyết bài toán dự báo Kết
hợp chặt chẽ với logic mờ, mạng nơron nhân tạo có thể giúp giải quyết hiệu
quả hơn các bài toán phức tạp
Nhờ các ưu điểm như có cấu trúc xử lý song song, khả năng học và ghi
nhớ, khả năng tự tổ chức và tổng quát hoá, mạng nơron nhân tạo ANN
(Artificial Newal Networks) đã được nghiên cứu và ứng dụng thành công
trong rất nhiều lĩnh vực như xấp xỉ hàm nhận dạng mẫu, dự báo… Luận văn
này chủ yếu tập trung tìm hiểu về mạng nơron nhân tạo và nghiên cứu ứng
dụng giải quyết bài toán dự báo phụ tải ngắn hạn cho hệ thống điện miền Bắc
Mục đích của luận văn là phát triển các phương pháp để giải bài toán dự
báo phụ tải ngắn hạn Đối tượng cụ thể của nghiên cứu là dự báo phụ tải cho
24 giờ sau nhằm đưa ra các thông số cần thiết cho công tác vận hành và lập
phương thức điều hành hệ thống điện
Luận văn bao gồm sáu chương và hai phụ lục
Chương I – Phụ tải hệ thống điện miền Bắc và bài toán dự báo:
Trình bày tổng quan về HTĐ miền Bắc Phát biểu bài toán dự báo phụ tải, nêu phạm vi, tầm quan trọng của bài toán, các yếu tố ảnh hưởng đến phụ tải ngắn hạn
Chương II – Tổng quan về mạng nơron nhân tạo: Trình bày các khái
niệm cơ bản về mạng nơron nhân tạo: cơ sở lý thuyết và mô hình mạng
Chương III – ứ ng dụng mạng nơron ánh xạ đặc trưng tự tổ chức Kohonen trong bài toán phân loại ngày: Trình bày các khái niệm cơ bản về
mạng nơron ánh xạ đặc trưng tự tổ chức Kohonen, đề xuất cấu trúc mạng để giải quyết bài toán, xây dựng cấu trúc phần mềm và phân tích đánh giá kết quả đạt được
Chương IV – ứ ng dụng mạng nơron nhiều lớp lan truyền ngược sai
số trong bài toán dự báo phụ tải theo nhiệt độ môi trường: Trình bày các
khái niệm cơ bản về mạng nơron nhiều lớp lan truyền ngược sai số, đưa ra các bước xây dựng bài toán, đề xuất cấu trúc mạng, xây dựng cấu trúc phần mềm,
đánh giá kết quả và so sánh với một số phương pháp đã có
Chương V - Hệ thống phần mềm dự báo phụ tải ngắn hạn cho Hệ thống điện miền Bắc: Giới thiệu về cơ sở dữ liêụ, đặc tả các chức năng của
hệ thống và hướng dẫn sử dụng phần mềm
Chương VI - So sánh với một số kết quả đã có và đánh giá kết quả:
So sánh phương pháp dự báo phụ tải ngắn hạn của Hệ thống điện miền Bắc sử dụng mạng nơron nhân tạo với một số phương pháp dự báo truyền thống
Đánh giá kết quả đạt được và khả năng ứng dụng của phần mềm
Phụ lục I – Phần mềm mô phỏng mạng Kohonen trong bài toán phân loại kiểu ngày
Trang 4Phụ lục II – Phần mềm mô phỏng mạng nơron lan truyền ngược sai số
ứng dụng trong bài toán dự báo đỉnh và đáy đồ thị phụ tải
Em xin chân thành cảm ơn PGS.TS Nguyễn Đức Nghĩa đã hướng dẫn và cho
em những ý kiến quý báu, em xin chân thành cảm ơn các thầy cô giáo khoa
Công nghệ Thông tin – Trường Đại học Bách khoa Hà Nội đã trang bị kiến
thức giúp em hoàn thành luận văn này
CHƯƠNG I PHụ TảI Hệ THốNG ĐIệN MIềN BắC và bài toán dự báo
Chương này đề cập đến các vấn đề sau:
• Giới thiệu chung về HTĐ miền Bắc
• Tầm quan trọng của dự báo phụ tải
• Những yếu tố ảnh hưởng đến phụ tải ngắn hạn
• Mục tiêu và phạm vi nghiên cứu dự báo phụ tải
• Đặc điểm đồ thị phụ tải HTĐ miền Bắc
• Dự báo phụ tải ngắn hạn cho 24h tiếp theo
1.1 Phụ tải Hệ thống điện miền Bắc 1.1.1 Giới thiệu chung về HTĐ miền Bắc
Ranh giới của Hệ thống điện miền Bắc được tính từ Hà tĩnh trở ra, là một vùng có vị trí địa lý tương đối phức tạp, trải dài và nằm sát bờ biển, có nhiều đồi núi, có nhiều vùng khí hậu khác nhau, kinh tế các khu vực trên toàn miền Bắc phát triển không đồng đều dẫn đến công suất phụ tải ở các khu vực
có sự chênh lệch lớn Phụ tải chủ yếu tập trung ở vùng đồng bằng, các thành phố lớn có công nghiệp phát triển Tại những vùng này phụ tải cao điểm và thấp điểm chênh lệch nhau không lớn lắm Pmin/Pmax khoảng 0.7 do phụ tải công nghiệp tại các khu vực này phát triển Đối với những vùng miền núi hoặc sản xuất nông nghiệp, công nghiệp không phát triển thì Pmin/Pmax khoảng 0.3
do phụ tải vào cao điểm chủ yếu là phụ tải sinh hoạt, điều nay gây khó khăn rất lớn trong vận hành kinh tế hệ thống điện Vào thấp điểm của hệ thống ta không khai thác cao được các nguồn điện rẻ tiền còn vào cao điểm của hệ thống ta phải chạy các nguồn điện đắt tiền để phủ đỉnh, có khi còn phải hạn chế phụ tải vào cao điểm do nguồn điện không đáp ứng được nhu cầu của phụ tải Các thành phần cấu thành phụ tải được thể hiện ở biều đồ sau:
Trang 5Trên biểu đồ ta thấy phụ tải Quản lý & Tiêu dùng dân cư, Công nghiệp
& xây dựng chiếm tỷ trọng lớn, đến 90% tổng công suất phụ tải
Theo thống kê, mức độ tăng trưởng phụ tải hệ thống điện từ năm 2001
– 2005 là rất cao Bảng 1.1 và bảng 1.2 dưới đây thể hiện tốc độ tăng trưởng
phụ tải về sản lượng của các năm trên
Bảng 1.1: Sản lượng điện tiêu thụ của HTĐ miền Bắc từ năm 2001-2005
2001 2002 2003 2004 2005 HTĐ miền Bắc 10.765.767,2 12.251.947,5 14.215.228,6 16.008.894,1 18.057.297,9
Các hoạt động khác 4.32%
Do đó phụ tải cao điểm và thấp điểm chính là hai giá trị đặc biệt trên đồ thị phụ tải ngày và là mối quan tâm hàng đầu của người lập quy hoạch và thiết
kế hệ thống điện Khi phụ tải thấp thì tỉ lệ tổn thất tăng do tổn hao không tải
Trang 61.1.2 Tầm quan trọng của dự báo phụ tải
Như chúng ta biết tháng 5/2005 sản lượng điện tiêu thụ đột biến trong
khi đó nguồn tài nguyên nước tại thời điểm đó bị thiếu hụt dẫn đến ảnh hưởng
lớn đến nền kinh tế Việt Nam Vì vậy dự báo phụ tải điện đóng vai trò hết sức
quan trọng đối với việc quy hoạch, đầu tư, phát triển nguồn điện và vận hành
hệ thống điện Nhu cầu tiêu thụ điện năng phụ thuộc vào khả năng phát triển
của nền kinh tế quốc dân nếu dự báo phụ tải quá thấp so với nhu cầu thực tế
thì dẫn đến kết quả nguồn dự phòng thấp, không đáp ứng đầy đủ nhu cầu điện
cho sản xuất công nghiệp và tiêu dùng, còn nếu dự báo phụ tải quá cao sẽ phải
huy động các nguồn đắt tiền gây lãng phí cho nền kinh tế nước nhà
Dự báo phụ tải dài hạn (khoảng 10-20 năm) nhằm mục đích cung cấp
dữ liệu cho công tác quy hoạch và đầu tư phát triển HTĐ Còn dự báo phụ tải
ngắn hạn (trong vòng 30 ngày) có nhiệm vụ đảm bảo vận hành hệ thống điện
an toàn và kinh tế Đối với dự báo dài hạn có tính chất chiến lược thì chỉ nêu
lên những phương hướng phát triển chủ yếu mà không yêu cầu xác định chỉ
tiêu cụ thể
Các chức năng quan trọng trong kế hoạch vận hành HTĐ như phân phối
nguồn một cách kinh tế, hiệu quả, lên kế hoạch bảo dưỡng và sửa chữa,
thường được thực hiện nhờ việc dự báo phụ tải, vì vậy dự báo phụ tải đóng vai
trò đặc biệt quan trọng đối với điều độ viên, những người hoạch định kế
hoạch, lên phương thức vận hành HTĐ
Trong công tác vận hành, việc lập phương thức ngày, phương thức tuần
của Trung tâm Điều độ, hay dự báo phụ tải báo trước một giờ, một ngày, một
tuần là những công việc tối cần thiết Những phương thức vận hành cơ bản
trong ngày như huy động nguồn, phối hợp nguồn, truyền tải công suất giữa
các miền, giải quyết các công tác sửa chữa trên lưới điện và đánh giá mức độ
an toàn HTĐ đều đòi hỏi phải có dự báo phụ tải tương đối chính xác
Trong thực tế vận hành HTĐ Việt Nam nói chung và HTĐ miền Bắc nói riêng, phụ tải cao điểm (phụ tải cao nhất trong ngày Pmax) và thấp điểm (phụ tải thấp nhất trong ngày Pmin) là hai điểm đặc biệt trong đồ thị phụ tải ngày và được quan tâm nhiều nhất trong vận hành Phụ tải cao điểm quyết
định việc huy động các nguồn nhiệt điện, tua-bin khí, diesel dự phòng nhằm
đảm bảo đủ nguồn phủ đỉnh và dự phòng nóng, tăng độ an toàn cung cấp điện Phụ tải thấp điểm quyết định việc phối hợp và điều chỉnh các nguồn tua-bin khí, nhiệt điện, thủy điện nhằm đảm bảo vận hành kinh tế, tránh nhà máy thuỷ
điện Hoà Bình vận hành trong vùng công suất không cho phép về kỹ thuật, trong đó dự báo phụ tải lúc cao điểm Pmax là quan trọng nhất trong ngày Dự báo chính xác phụ tải cao điểm có hiệu quả lớn về kinh tế vào mùa lũ khi cần khai thác tối đa nguồn thủy điện, trong khi nước các hồ chứa đang xả thì các nguồn điện khác huy động chỉ nhằm mục đích an toàn, bù điện áp và phủ
đỉnh Nếu sai số dự báo phụ tải lúc cao điểm giảm 2%, Điều độ Quốc Gia (ĐĐQG) có thể tiết kiệm được khoảng 80 MW nguồn tuabin khí chạy dầu đắt tiền chạy phủ đỉnh lúc cao điểm, góp phần đáng kể vào việc tăng hiệu quả vận hành HTĐ và tiết kiệm được hàng trăm triệu đồng trên mỗi giờ cho ngành
điện nói riêng và cho cả nền kinh tế Quốc dân nói chung
Hạn chế phụ tải lúc cao điểm cũng thường xảy ra trong mùa lũ khi thiếu nguồn phủ đỉnh Tính chính xác được lượng công suất thiếu để chủ động cắt phụ tải những khu vực không quan trọng, tránh cắt thừa hoặc cắt thiếu, tránh
sa thải phụ tải do bảo vệ tần số thấp tác động cũng có ý nghĩa lớn trong vận hành, giảm thiệt hại do cắt điện
1.1.3 Những yếu tố ảnh hưởng đến phụ tải ngắn hạn
Để tìm ra được phương pháp dự báo tối ưu đối với bài toán dự báo phụ tải ngày của HTĐ miền Bắc với sai số nhỏ, ta cần xác định được các yếu tố
ảnh hưởng đến phụ tải ngày, ví dụ: thứ của các ngày trong tuần, ngày lễ, các
Trang 7Hình 1.2 Đồ thị phụ tải các ngày đặc trưng trong tuần
đặc điểm của ngày cần dự báo, như nhiệt độ trong ngày… Chính vì vậy để
nâng cao độ chính xác của quá trình dự báo phụ tải ta cần phải xét đến các yếu
tố chủ yếu ảnh hưởng đến phụ tải
Qua thực tế vận hành cho thấy phụ tải của lưới điện Việt Nam nói
chung và miền Bắc nói riêng phụ thuộc chủ yếu vào các yếu tố chính sau:
1 Thứ của ngày trong tuần
Có quy luật giữa phụ tải và ngày trong tuần
- Phụ tải thấp nhất trong đêm thứ 2
- Đồ thị phụ tải các ngày làm việc thường có dạng giống nhau
- Phụ tải ngày nghỉ cuối tuần giảm
2 Các ngày đặc biệt trong năm
Ngày đặc biệt trong năm như các ngày lễ tết, 30/4, 1/5, 2/9 phụ tải các ngày này giảm đáng kể so với ngày thường Phụ tải các ngày sát với các ngày này cũng bị ảnh hưởng, ta có thể thấy rõ điều đó trên đồ thị phụ tải HTĐ miền Bắc ngày lễ 1/5/2006 và ngày làm việc bình thường 3/5/2006 Dự báo phụ tải trong các ngày đặc biệt không được áp dụng như ngày thông thường mà phải tách biệt bằng phương pháp riêng dựa vào sự thay đổi phụ tải của các ngày này so với các ngày dạng này của các năm trước đó
3 Thời tiết trong ngày
Bao gồm các thông số tự nhiên: nhiệt độ, độ ẩm, tốc độ gió, cường độ sáng, trong đó nhiệt độ có ảnh hưởng lớn nhất, nhiệt độ tăng thì phụ tải tăng
và ngược lại vì nước ta là nước nhiệt đới Chỉ có trường hợp đặc biệt ở miền Bắc khi nhiệt độ quá lạnh, phụ tải tăng do sử dụng các thiết bị sưởi ấm
Đồ thị phụ tải
0 500 1000 1500 2000 2500 3000 3500
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Giờ
Ngày 3/5 Ngày 1/5Hình 1.3 Đồ thị phụ tải HTĐ miền Bắc hai ngày 1/5, 3/5
Trang 84 Truyền hình trực tiếp các sự kiện thể thao văn hoá
Công suất tiêu thụ vào các giờ tuyền hình trực tiếp bóng đá quốc tế, giải
bóng đá có đội tuyển Việt Nam tham gia tăng đột ngột từ 150 - 200 MW Các
điều độ viên thường dự báo phụ tải những ngày này theo kinh nghiệm những
ngày tương tự trước đó Ví dụ: khi dự báo đồ thị phụ tải ngày có truyền hình
trực tiếp Worldcup 2006, ta dựa vào đồ thị phụ tải trong ngày cũng có truyền
hình trực tiếp Worldcup 2006 trước đó để dự báo
Hình 1.5 Đồ thị phụ tải HTĐ miền Bắc có truyền hình trực
tiếp Worldcup 2006 và ngày bình thường
Hình 1.4 Đồ thị phụ tải ngày hai ngày có nhiệt độ khác
5 Kế hoạch sửa chữa lớn trong ngày có cắt điện
Trong quá trình thực hiện kế hoạch sửa chữa lớn, như cắt điện đường dây đang vận hành để kéo đường dây mới, sửa chữa trạm 220Kv, 500Kv phải cắt tải diện rộng dẫn đến điện năng tiêu thụ vào các ngày này giảm một cách
đáng kể Dự báo phụ tải những ngày này phải tính toán khấu trừ phụ tải giảm
do ngừng cung cấp điện Dạng của đồ thị phụ tải trong ngày có cắt điện diện rộng cũng mang đặc thù riêng, thay đổi tuỳ thuộc vào thời gian, vùng , miền cắt điện
Qua quá trình vận hành thực tế và dữ liệu thống kê, các điều độ viên, các chuyên viên chuyên phân tích về phụ tải hệ thống điện đi đến kết luận: Nhiệt độ môi trường, đặc thù của các ngày trong tuần, ngày lễ, ngày tết là các yếu tố ảnh hưởng lớn nhất đến giá trị phụ tải ngày
1.1.4 Mục tiêu và phạm vi nghiên cứu dự báo phụ tải
• Mục tiêu của luận văn
Nghiên cứu áp dụng kỹ thuật mạng nơron để dự báo phụ tải cao điểm (Pmax), thấp điểm đêm (Pmin) và phụ tải ngày (24 giờ) của HTĐ miền Bắc theo dữ liệu phụ tải quá khứ, nhiệt độ môi trường và một số các yếu tố ảnh hưởng khác
• Phạm vi nghiên cứu
Dự báo luôn giữ vai trò quan trọng trong nhiều lĩnh vực, quyết định kế hoạch sản xuất, hướng đầu tư phát triển trong tương lai do đó có rất nhiều các mô hình toán học áp dụng cho dự báo Cũng như các dự báo khác, dự báo phụ tải ngày cũng phải dựa vào dữ liệu thống kê, phân tích và áp dụng thuật toán
để xác định mối quan hệ giữa phụ tải và các yếu tố ảnh hưởng, từ đó dự báo phụ tải dựa trên các yếu tố ảnh hưởng đó
Trang 9Trước đây, các mô hình toán học truyền thống hay được áp dụng cho dự
báo như: hồi qui tuyến tính (linear regression), san bằng hàm mũ (exponential
smoothing), san trung bình (moving averages), hệ số ngẫu nhiên (stochatic)
Gần đây, với sự phát triển của việc nghiên cứu một số thuật toán dựa trên trí
tuệ của con người (artificial intelligence), mạng nơron nhân tạo (artificial
neural networks) đã được áp dụng trong dự báo và được đánh giá cao Đây là
mô hình phi tuyến với nhiều ưu điểm và đang được áp dụng rộng rãi Mạng
nơron nhân tạo được xây dựng trên cơ sở mô phỏng hoạt động của hệ thống
nơron thần kinh sinh học do đó mạng nơron nhân tạo có một số đặc điểm như
bộ não con người, đó là khả năng học được những gì đã được dạy Quá trình
học này được gọi là quá trình huấn luyện Trong quá trình này các mẫu thể
hiện quan hệ giữa các biến ngẫu nhiên được đưa vào trong mạng nơron, mạng
nơron sẽ nhận biết được quan hệ giữa các biến ngẫu nhiên đó sau khi kết thúc
quá trình huấn luyện Chính do đặc điểm này mà mạng nơron được ứng dụng
rất nhiều trong lĩnh vực dự báo Đặc biệt đối với bài toán dự báo phụ tải ngắn
hạn thì đây là mô hình được đánh giá cao hơn hẳn các mô hình trước đó và
hiện nay mô hình này đang được áp dụng phổ biến ở một số nước phát triển
trong dự báo phụ tải
Nghiên cứu phương pháp dự báo phụ tải ngày là nghiên cứu và áp dụng
các phương pháp toán học để tìm quan hệ giữa phụ tải ngày và các yếu tố chủ
yếu ảnh hưởng đến phụ tải ngày Thuật toán áp dụng cho dự báo phụ tải theo
nhiệt độ phải dựa trên dự báo thời tiết ngày hôm sau gồm các thông tin như:
nhiệt độ cao nhất và thấp nhất trong ngày, nắng hay mưa, giông bão
1.2 Bài toán dự báo phụ tải
1.2.1 Đặc điểm đồ thị phụ tải HTĐ miền Bắc
Phụ tải của HTĐ miền Bắc có các thành phần điện Quản lý & Tiêu dùng
dân cư và Công nghiệp & xây dựng chiếm tỷ trọng lớn Bảng 1.3 thống kê sản
lượng tiêu thụ của từng ngành trong ba năm 2003 đến 2005 Có thể nhận thấy rằng, tỉ trọng điện tiêu thụ trong quản lý & tiêu dùng dân cư rất lớn làm chế
độ tiêu thụ điện năng xấu đi, hệ số phụ tải giảm, gây nhiều khó khăn cho việc
đảm bảo an toàn cung cấp điện
Bảng 1.3 Tỉ trọng sản lượng điện tiêu thụ của các thành phần kinh tế
đông, chứng tỏ sản lượng điện sinh hoạt tiêu thụ rất lớn so với các ngành khác
Trang 10Trong quá trình vận hành của điều độ, phụ tải cao điểm (Pmax) và phụ tải
thấp điểm (Pmin) là hai điểm quan trọng nhất trong ngày Phụ tải cao điểm và
thấp điểm quyết định huy động nguồn và điều chỉnh phối hợp nguồn thuỷ
điện, nhiệt điện, diesel…
• Vào thời điểm cao điểm
Điều độ Quốc Gia phải huy động các nguồn điện đắt tiền như các nhà
máy diesel, tua bin khí cho việc khởi động và nâng công suất, trong trường
hợp sự cố thiếu nguồn, điều độ viên cần phải dự báo công suất thiếu để chuẩn
bị trước phương án cắt tải sau đó phối hợp với các điều độ miền phân bổ các
công suất cần phải cắt cho các Điều độ lưới điện phân phối Cắt tải có chuẩn
bị trước sẽ ít gây thiệt hại về kinh tế hơn cắt tải do rơ le tần số thấp tác động
Đặc biệt rất đảm bảo an toàn đối với các nhà máy sản xuất công nghiệp nặng
• Vào giờ thấp điểm (phụ tải thường thấp hơn giờ cao điểm 2-3 lần)
Cần điều chỉnh cắt giảm các nguồn điện đắt tiền như nguồn tua bin khí
chạy dầu, nhiệt điện sao cho thoả mãn chỉ tiêu kinh tế
Nếu dự báo càng chính xác Pmin, Pmax, thì có thể huy động và điều chỉnh
nguồn hợp lý, dẫn đến vận hành hệ thống an toàn, hiệu quả và kinh tế hơn
1.2.2 Dự báo phụ tải ngắn hạn cho 24h tiếp theo
Dự báo phụ tải lưới điện cho 24h tiếp theo nhằm đưa ra các giá trị phụ tải dự báo theo từng giờ của ngày tiếp theo sát với thực tế vận hành, trong đó giảm sai số là vấn đề mang tính chiến lược trong quá trình dự báo
Trong quá trình phân tích, so sánh đồ thị phụ tải của miền Bắc và các miền khác trong một thời gian dài cho thấy kiểu đồ thị phụ tải ngày chủ yếu bị
ảnh hưởng bởi thói quen tổ chức sinh hoạt, cách phân công sắp xếp công việc của khách hàng, từ đó ta thấy ĐTPT có mối liên quan chặt chẽ với môi trường hoạt động, ngày làm việc, ngày nghỉ, lễ, tết,… của cả cộng đồng dân cư Còn
đáy và đỉnh phụ tải là hàm của biến thời tiết như nhiệt độ, lượng mưa, độ ẩm…
Bài toán dự báo phụ tải HTĐ có thể chia thành hai bài toán nhỏ:
• Bài toán dự báo đỉnh và đáy ĐTPT ngày cần dự báo
• Bài toán xác định dạng ĐTPT ngày cần dự báo
1.2.2.1 Các dạng của đồ thị phụ tải
Xét đồ thị phụ tải HTĐ trên hình 1.7, đây là đồ thị phụ tải của Công ty
điện lực I các ngày 14/5/2006 (chủ nhật) và ngày 15/5/2006 (Thứ hai) được xây dựng theo giá trị phụ tải 24h trong ngày ĐTPT hai ngày điễn hình này có dạng tương tự như ĐTPT ngày của HTĐ miền Bắc, ta thấy các giá trị phụ tải phân bố trên ĐTPT không đồng đều Đặc biệt độ chênh lệch giữa hai giá trị
Pmax và Pmin là rất lớn
Trang 11CN 14/05/2006 T2 15/05/2006
- Gọi giá trị phụ tải đỉnh là Pmax
- Gọi giá trị phụ tải đáy là Pmin
- Gọi giá trị phụ tải giờ thứ i là P(i) với i=1ữ24 ứng với 24h trong ngày
Ta cần đưa ĐTPT trên về dạng ĐTPT ngày chuẩn, muốn vậy ta phải
quy chuẩn hoá phụ tải của từng giờ theo công thức sau:
Pn(i)=
minmaxmin)
P P P i P
ư
ư
Pn(i): là phụ tải quy chuẩn hoá của giờ thứ i
Dựa vào công thức trên ta tính được giá trị phụ tải quy chuẩn hoá của
24h trong ngày, đồ thị này còn được gọi là véctơ ĐTPT
Hình 1.8 ĐTPT hai ngày (CN,T2) của Cty điện lực I đã chuẩn hoá
Hình 1.8 là ĐTPT ngày được chuẩn hoá theo biến i và Pn(i) ĐTPT đã
được quy chuẩn vẫn giữ nguyên dạng biến thiên ban đầu, các giá trị được quy chuẩn nằm trong khoảng từ 0 ữ1, với Pnmax=1, Pnmin= 0
1.2.2.2 Đỉnh và đáy của đồ thị phụ tải
Hai giá trị phụ tải đặc biệt trong ngày mà được các kỹ sư vận hành cũng như người làm phương thức ngày quan tâm nhiều nhất đó là, phụ tải cao điểm
và phụ tải thấp điểm Đây cũng chính là mục tiêu quan trọng hàng đầu trong bài toán dự báo phụ tải điện Tính kinh tế, hiệu quả, phương thức vận hành, cũng như hướng đầu tư phát triển trong tương lai của HTĐ phụ thuộc rất lớn vào việc dự báo và độ chính xác của việc dự báo hai giá trị này Có nhiều
phương pháp có thể áp dụng để dự báo P max và P min như dự báo theo phương pháp ngoại suy theo thời gian, phương pháp hồi quy tuyến tính… Trong luận văn này chúng ta chỉ nghiên cứu phương pháp DBPT sử dụng mạng nơron nhân tạo
Sau khi đã xác định được hai giá trị quan trọng nhất P max và P min trên
ĐTPT thì các giá trị phụ tải khác trong ngày sẽ được xác định theo mối quan
hệ của chúng Vậy nếu biết được dạng đồ thị phụ tải quy chuẩn, tức là các giá
Trang 12trị Pn(i), xác định được P max và P min trong ngày ta sẽ tính được phụ tải của từng
giờ theo công thức 1.1
1.2.2.3 Dự báo phụ tải cho 24h
Khi ta đã dự báo được P max và P min trong ngày nếu ta xác định được đồ
thị phụ tải quy chuẩn tức là xác định được các giá trị Pn(i) với i=1ữ24 ta sẽ xác
định được phụ tải của từng giờ trong ngày Từ công thức (1.1) ta xác định
được công thức 1.4 sau:
P(i) = Pmin + (Pmax – Pmin ) Pn(i) (1.4)
Qua các phân tích nêu trên có thể đi đến kết luận: Để dự báo được phụ
tải từng giờ cho một ngày cụ thể, ta cần dự báo được giá trị phụ tải đỉnh Pmax
và phụ tải đáy Pmin của ngày đó và tìm ra véctơ ĐTPT Pn(i) của ngày cần dự
báo
Tóm lại cũng như các dự báo khác, dự báo phụ tải ngày phải dựa vào số
liệu thống kê, phân tích và áp dụng các thuật toán để xác định mối quan hệ
giữa phụ tải và các yếu tố ảnh hưởng, từ đó xây dựng phương pháp dự báo phụ
tải ngày dựa trên các yếu tố ảnh hưởng đã được nêu
Phần tiếp theo, ta sẽ nghiên cứu phương pháp giải quyết bài toán dự báo
phụ tải thông qua việc sử dụng các loại mạng nơron nhân tạo Việc phân tích
đặc điểm riêng, yêu cầu và mục đích từng bài toán sẽ là cơ sở để chọn loại
mạng nơron nhân tạo thích hợp vào việc giải quyết từng bài toán
CHƯƠNG II Tổng quan Về MạNG NƠRON NHÂN TạO
Mạng nơron nhân tạo là một lĩnh vực được đề xuất và nghiên cứu vào
cuối thập kỷ 1800 khi người ta cố gắng mô tả hoạt động của trí tuệ con người
ý tưởng này bắt đầu được áp dụng cho các mô hình tính toán từ mạng Perceptron và đến nay đã có nhiều ứng dụng trong thực tế, đặc biệt là trong lĩnh vực dự báo, nhận dạng, điều khiển… Ví dụ, mạng nơron nhân tạo có thể
sử dụng để nhận dạng ký tự thông qua khả năng học từ kinh nghiệm hoặc từ tập mẫu, trong khi các phương pháp truyền thống phải tiêu tốn nhiều thời gian cho việc làm mảnh ký tự, khả năng nhận dạng sẽ không cao khi chất lượng quét của scanner tồi hoặc bản thân ký tự được lấy từ văn bản mờ hoặc có nhiều nét đứt Cách tiếp cận mạng nơron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo ra các thiết bị có thể kết hợp khả năng song song cao của bộ não với tốc độ tính toán cao của máy tính
2.1 Lịch sử phát triển của mạng nơron nhân tạo
Trí tuệ nhân tạo (Artificial Intelligence) hay tạo cho máy móc khả năng suy luận, phán đoán và cảm nhận như con người là một trong những tham vọng to lớn của loài người Tham vọng này đã có từ lâu và cùng với sự ra đời của máy tính, con người từng bước đưa kiến thức của mình vào máy, biến chúng trở thành những công cụ thực sự có trí tuệ Mạng nơron nhân tạo là một
bộ phận của ngành khoa học trí tuệ nhân tạo, là lĩnh vực tin học nghiên cứu ứng dụng máy tính điện tử thông minh hoạt động theo cơ chế mô phỏng tư duy của con người Mạng nơron nhân tạo có cấu trúc tương tự như bộ não tuy nhiên số nơron trong mạng nơron nhân tạo là hữu hạn tuỳ thuộc vào nhu cầu thực tế của bài toán, còn đối với bộ não con người số nơron lên tới xấp xỉ 15 tỉ nơron Mạng nơron có khả năng học và tái tạo lại những gì đã được dạy, chính
Trang 13vì đặc điểm này mà mạng nơron đang được phát triển rất mạnh mẽ và đang
được ứng dụng rất nhiều trong thực tế, đặc biệt là trong lĩnh vực dự báo, nhận
dạng, điều khiển… Con người bắt đầu nghiên cứu mạng nơron vào cuối thập
kỷ 1800 khi người ta cố gắng mô tả hoạt động của trí tuệ con người, ý tưởng
này bắt đầu được áp dụng cho các mô hình tính toán từ mạng Perceptron
Đầu thập kỷ 1950 Friedrich Hayek là người đầu tiên khẳng định ý
tưởng về trật tự tự phát trong não xuất phát từ các mạng phân tán gồm các đơn
vị đơn giản (nơron) Cuối thập kỷ 1940, Donnald Hebb đưa ra giả thuyết đầu
tiên về một cơ chế thần kinh mềm dẻo (neural plasticity) Hebbian learning
được coi là một quy tắc 'điển hình' của học không có giám sát Nó (và các biến
thể) là mô hình thời kỳ đầu của long term potentiation (tạo tiềm lực dài hạn)
Perceptron là một bộ phân loại tuyến tính dành cho việc phân loại dữ
= w'x + b Các tham số của nó được thích nghi với một quy tắc tùy biến
(ad-hoc) tương tự với xuống dốc ngẫu nhiên (stochastic steepest gradient descent)
Perceptron chỉ có thể phân loại hoàn hảo một tập dữ liệu mà các lớp khác
nhau là (linearly separable) trong không gian đầu vào Nó thường thất bại
hoàn toàn đối với dữ liệu không chia tách được Sự phát triển của thuật toán
này ban đầu đã tạo ra một số hứng khởi, phần vì mối quan hệ của nó đối với
các cơ chế sinh học Sau này, phát hiện về điểm yếu này đã làm cho các mô
hình Perceptron bị bỏ mặc cho đến khi các mô hình phi tuyến được đưa ra
Cognitron (1975) là một mạng nơron đa tầng thời kỳ đầu với một thuật
toán huấn luyện Các chiến lược thần kinh khác nhau sẽ khác nhau về cấu trúc
thực sự của mạng và các phương pháp thiết lập trọng số cho các kết nối Mỗi
dạng có các ưu điểm và nhược điểm riêng Mạng có thể lan truyền thông tin
chỉ theo một hướng, hoặc thông tin có thể được đẩy đi đẩy lại cho đến khi tại
một nút xuất hiện sự tự kích hoạt và mạng sẽ dừng tại một trạng thái kết thúc
Mạng nơron nhiều lớp lan truyền ngược sai số đã được Rosenblatt và một số tác giả khác mô tả từ những năm 50, nhưng họ chủ yếu chỉ nghiên cứu sâu về mạng Perceptron một lớp Sở dĩ như vậy là do không tìm được cách thay đổi trọng số liên kết tại các lớp ẩn Ngay cả khi đã biết được sai số tại các
đầu ra, nhưng người ta vẫn chưa hình dung được các sai số đó được phân bố như thế nào tại các nơron ẩn Minsky và Papert đã chỉ ra rằng khó có thể tổng quát hoá luật học đối với mạng một lớp sang mạng nhiều lớp, có hai lý giải chính cho vấn đề này Thứ nhất, thuật giải học của mạng nhiều lớp có thể không hiệu quả, hoặc không hội tụ về điểm cực trị tổng thể trong không gian véctơ trọng số Mặt khác, các nghiên cứu trong lý thuyết tính toán đã chỉ ra rằng trong trường hợp tồi nhất quá trình học các hàm tổng quát từ mẫu học không phải lúc nào cũng giải quyết được Các nguyên tắc cơ bản trong luật học đối với mạng nhiều lớp đã được Bryson và Ho đề xuất từ năm 1969, nhưng phải tới giữa năm 1980 vấn đề này mới được quan tâm trở lại bởi công trình nghiên cứu của Rumelhart năm 1986
Mạng truyền ngược (backpropagation) có lẽ đã là nguyên nhân chính
của sự tái xuất của mạng nơron từ khi công trình "Learning Internal
Representations by Error Propagation" (học các biểu diễn bên trong bằng cách lan truyền lỗi) được xuất bản năm 1986 Mạng truyền ngược ban đầu sử dụng nhiều tầng, mỗi tầng gồm các đơn vị tổng trọng số có dạng g = f(w'x + b), trong đó f là một hàm sigmoid Huấn luyện được thực hiện theo kiểu
xuống dốc ngẫu nhiên Việc sử dụng quy tắc tính nguyên hàm cho hàm hợp
(chain rule) khi tính toán các thay đổi thích hợp cho các tham số dẫn đến một thuật toán có vẻ truyền ngược lỗi, đó là nguồn gốc của thuật ngữ truyền ngược Tuy nhiên, về bản chất đây chỉ là một dạng xuống dốc, việc xác định
các tham số tối ưu cho một mô hình thuộc dạng này không đơn giản, không thể dựa vào các phương pháp xuống dốc để có được lời giải tốt mà không cần một xuất phát điểm tốt Ngày nay, các mạng có cùng kiến trúc với mạng
Trang 14truyền ngược được gọi là các mạng Perceptron đa tầng Thuật ngữ này không
hàm ý bất cứ giới hạn nào đối với loại thuật toán dùng cho việc học
Mạng truyền ngược đã tạo ra nhiều hứng khởi và đã có nhiều tranh cãi
về quy trình học đó có thể được thực hiện trong bộ não hay không Một phần
vì khi đó chưa tìm ra cơ chế truyền tín hiệu ngược Nhưng lý do quan trọng
nhất là chưa có một nguồn tín hiệu 'dạy' hay tín hiệu 'đích' đáng tin cậy
2.2 Cơ sở lý thuyết mạng nơron
Mạng nơron nhân tạo là một lĩnh vực nghiên cứu rộng lớn và chỉ mới
phát triển mạnh khoảng 20 năm gần đây Nó được nghiên cứu và phát triển
dựa trên nhiều lĩnh vực khoa học khác nhau bao gồm: Sinh học, sinh lý học,
toán học, tin học
- Nơron sinh lý học: Các nơron nhân tạo đều có cấu trúc dựa các mô hình
nơron sinh vật Các nhà nghiên cứu đã chọn phương pháp nghiên cứu
đặc tính đáp ứng nơron với các xung kích thích từ thấp đến cao, từ một
đơn thể đến một mạng nhiều lớp, từ các khu thần kinh trung ương đến
các cơ cấu thần kinh chấp hành
- Sinh lý học nơron: Các nhà sinh lý học nơron nghiên cứu cách nhận
thức, các hành vi, cách tổ chức của não người để giải quyết những bài
toán phức tạp, đòi hỏi sáng tạo Rất nhiều các thuật học được bắt nguồn
từ những nghiên cứu về sinh lý học
- Cơ sở toán học: Toán học là một công cụ không thể thiếu trong quá
trình nghiên cứu khoa học nói chung và mạng nơron nói riêng
- Công nghệ thông tin: Biễu diễn và xử lý nhanh các vấn đề đã được
nghiên cứu, là yếu tố thúc đẩy các ứng dụng và kỹ thuật mạng nơron
nhân tạo phát triển nhanh chóng
2.3 Bộ não và nơron sinh học
Các nhà nghiên cứu sinh học cho ta thấy rằng các nơron (tế bào thần kinh) là đơn vị cơ sở đảm nhiệm những chức năng xử lý nhất định trong hệ thần kinh, bao gồm não, tuỷ sống và các dây thần kinh Mỗi nơron có một phần thân với nhân bên trong (gọi là soma), một đầu thần kinh ra (gọi là sợi trục axon) và một hệ thống dạng cây các dây thần kinh vào (gọi là dendrite) Các dây thần kinh vào tạo thành một lưới dày xung quanh thân tế bào, chiếm diện tích khoảng 0.25 mm2, còn dây thần kinh tạo thành trục dài có thể từ 1
cm đến hàng mét Đường kính của thân tế bào thường chỉ là 10-4m Trục dây thần kinh ra cũng có thể phân nhánh các dây thần kinh theo dạng cây để nối với các dây thần kinh vào hoặc trực tiếp với nhân tế bào các nơron khác thông qua các khớp nối (gọi là synapse) Thông thường, mỗi nơron có thể gồm vài chục cho tới vài trăm ngàn khớp nối để nối với các nơron khác Người ta ước lượng rằng lưới các dây thần kinh ra cùng với các khớp nối bao phủ diện tích khoảng 90% bề mặt nơron (hình 2.1)
Hình 2.1 Cấu tạo nơron sinh học
Trang 15Các tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của
các nơron là tín hiệu điện và được thực hiện thông qua các quá trình phản ứng
và giải phóng các chất hữu cơ Các chất này được phát ra từ các khớp nối dẫn
tới các dây thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào Khi
điện thế này đạt tới một ngưỡng nào đó, sẽ tạo ra một xung điện dẫn tới trục
dây thần kinh ra Xung này được truyền theo trục, tới các nhánh rẽ khi chạm
tới các khớp nối có các nơron khác sẽ giải phóng các chất truyền điện, có hai
loại khớp nối: khớp nối kích thích (excitatory) hoặc khớp nối ức chế
(inhibitory)
Phát hiện quan trọng nhất trong ngành nghiên cứu về bộ não là các liên kết
khớp thần kinh khá mềm dẻo, có thể biến động và chỉnh đổi theo thời gian tuỳ
thuộc vào dạng kích thích Hơn nữa, các nơron có thể sản sinh các liên kết
mới với các nơron khác và đôi khi lưới các nơron có thể di chuyển từ vùng này
sang vùng khác trong bộ não Các nhà khoa học cho rằng đây chính là cơ sở
quan trọng để giải thích cơ chế học của bộ não con người
Phần lớn các quá trình xử lý thông tin đều xảy ra trên vỏ não Toàn bộ vỏ
não được bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với
đường kính khoảng 0.5mm, độ cao 4mm Mỗi đơn vị cơ sở này chứa khoảng
2000 nơron Người ta chỉ ra rằng mỗi vùng não có những chức năng nhất định
Điều rất đáng ngạc nhiên là các nơron rất đơn giản trong cơ chế làm việc,
nhưng mạng nơron liên kết với nhau lại có khả năng tính toán, suy nghĩ, tính
toán nghi nhớ, và điều khiển Có thể điểm qua những chức năng cơ bản của bộ
não như sau:
- Bộ nhớ được tổ chức theo các bó thông tin và truy nhập theo nội dung
(có thể truy xuất thông tin dựa theo giá trị các thuộc tính của đối tượng);
- Bộ não có khả năng tổng quát hoá, có thể truy xuất các tri thức hay các mối liên kết chung của các đối tượng tương ứng với một khái niệm chung nào đó;
- Bộ não có khả năng dung thứ lỗi theo nghĩa có thể điều chỉnh hoặc tiếp tục thực hiện ngay khi có những sai lệch do thông tin bị thiếu hoặc không chính xác Ngoài ra, bộ não còn có thể phát hiện và phục hồi các thông tin mất dựa trên sự tương tự giữa các đối tượng;
- Bộ não có khả năng xuống cấp và thay thế dần, khi có trục trặc tại các vùng não (do bệnh, chấn thương) hoặc bắt gặp những thông tin hoàn toàn mới lạ, bộ não vẫn có thể tiếp tục làm việc;
- Bộ não có khả năng học
Dễ dàng thấy rằng bộ não con người có thể lưu giữ nhiều thông tin hơn các máy tính hiện đại; Tuy rằng điều này không phải đúng mãi mãi, vì bộ não tiến hoá chậm, trong khi đó nhờ những tiến bộ trong công nghệ vi điện tử, bộ nhớ máy tính được nâng cấp rất nhanh Hơn nữa, sự hơn kém về bộ nhớ trở nên hoàn toàn thứ yếu so với sự khác biệt về tốc độ tính toán và khả năng tính toán song song Các bộ vi xử lý có thể tính 108 lệnh trong một giây, trong khi
đó mạng nơron xử lý chậm hơn, cần khoảng vài miligây để kích hoạt Tuy nhiên, bộ não có thể kích hoạt hầu như cùng một lúc tại rất nhiều nơron khớp nối, trong khi đó ngay cả máy tính hiện đại cũng chỉ có một số hạn chế các bộ
vi xử lý song song Nếu chạy một mạng nơron nhân tạo trên máy tính, phải tốn hàng trăm lệnh máy để kiểm tra một nơron có được kích hoạt hay không (tiêu phí khoảng10-8 x 10 giây trên nột nơron) Do đó, cho dù bộ vi xử lý có thể tính toán nhanh hơn hàng triệu lần so với các nơron bộ não, nhưng xét tổng thể bộ não lại tính toán nhanh hơn hàng tỷ lần
Cách tiếp cận mạng nơron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo ra các thiết bị có thể kết hợp khả năng song song cao của bộ não và tốc độ
Trang 16tính toán cao của máy tính Tuy vậy, cần phải có một khoảng thời gian dài nữa
để các mạng nơron nhân tạo có thể mô phỏng các hành vi sáng tạo của bộ não
con người Chẳng hạn, bộ não có thể thực hiện một nhiệm vụ khá phức tạp như
nhận ra khuôn mặt người quen sau không quá một giây, trong khi đó một máy
tính tuần tự phải thực hiện hàng tỷ phép tính (khoảng10 giây) để thực hiện
cùng một thao tác đó, nhưng với chất lượng kém hơn nhiều, đặc biệt trong
trường hợp thông tin không chính xác, đầy đủ
2.4 Mô hình mạng nơron nhân tạo
Mạng nơron nhân tạo (Artificial Neural Network) bao gồm các nút (đơn
vị xử lý, nơron) được nối với nhau bởi liên kết nơron Mỗi liên kết kèm theo
một trọng số nào đó, đặc trưng cho đặc tính kích hoạt/ ức chế giữa các nơron
Có thể xem các trọng số là phương tiện để lưu thông tin dài hạn trong mạng
nơron và nhiệm vụ của quá trình huấn luyện (học) mạng là cập nhật các trọng
số khi có thêm các thông tin về các mẫu học, hay nói một cách khác, các
trọng số được điều chỉnh sao cho dáng điệu vào ra của nó mô phỏng hoàn toàn
phù hợp môi trường đang xem xét
Trong mạng, một số nơron được nối với môi trường bên ngoài như các đầu
ra, đầu vào
1
a là thành phần tuyến tính của nơron Hàm kích hoạt f (hàm chuyển)
đóng vai trò biến đổi từ a sang tín hiệu đầu ra z
z =f(a) Trong đó:
xi: Các tín hiệu đầu vào
wi: Các trọng số tương ứng với các đầu vào n: số đầu vào của nơron
a: Tổng trọng số của mỗi nơron
f: hàm kích hoạt z: là đầu ra của nơron, đây là thành phần phi tuyến của nơron
Hàm kích hoạt f thường có 3 dạng hay dùng trong thực tế
• Hàm dạng bước:
1 nếu x ≥ 0
f(x)=
0 nếu x < 0 hoặc
Trang 17ở đây ngưỡng đóng vai trò làm tăng tính thích nghi và khả năng tính toán
của mạng nơron Sử dụng ký pháp véctơ, X = (x1, x2, …,xn) véctơ tín hiệu vào,
W = (w1,w2, …,wn) véctơ trọng số, khi đó ta có
Z = f(a), a =WS Trường hợp xét ngưỡng, ta biểu diễn véctơ mới X’ = (x1,x2, …,xn, θ), W
= (w1,w2, …,wn, -1)
1 -1
3.4.2.1 Phân loại các mạng nơron Theo kiểu liên kết nơron: Ta có mạng nơron truyền thẳng (feel-
forward Neural Network) và mạng nơron qui hồi (recurrent NN) Trong mạng nơron truyền thẳng, các liên kết nơron đi theo một hướng nhất định, không tạo thành đồ thị có chu trình (Directed Acyclic Graph) với các đỉnh là các nơron, các cung là các liên kết giữa chúng Ngược lại, các mạng qui hồi cho phép các liên kết nơron tạo thành chu trình Vì các thông tin ra của các nơron được truyền lại cho các nơron đã góp phần kích hoạt chúng, nên mạng qui hồi còn
có khả năng lưu giữ trạng thái trong của nó dưới dạng ngưỡng kích hoạt ngoài các trọng số liên kết nơron
Trang 18
Theo số lớp: Các nơron có thể tổ chức lại thành các lớp sao cho mỗi
nơron của lớp này chỉ được nối với các nơron ở lớp tiếp theo, không cho phép
các liên kết giữa các nơron trong cùng một lớp, hoặc từ nơron lớp dưới lên
nơron lớp trên ở đây cũng không cho phép các liên kết nơron nhảy qua một
lớp
Dễ dàng nhận thấy rằng các nơron trong cùng một lớp nhận được tín
hiệu từ lớp trên cùng một lúc, do vậy về nguyên tắc chúng có thể xử lý song
song Thông thường lớp nơron vào chỉ chịu trách nhiệm truyền đưa tín hiệu
vào, không thực hiện một tính toán nào nên khi tính số lớp của mạng, người ta
không tính lớp vào Ví dụ, mạng nơron ở hình 2.6 có hai lớp: một lớp ẩn và
• Mạng nơron như một công cụ tính toán:
Giả sử mạng nơron NN có n nơron vào và m nơron ra, khi đó với mỗi véctơ các tín hiệu vào X = (x1,…,xn ), sau quá trình tính toán tại các nơron ẩn,
ta nhận được kết quả ra Z =( z1, z2, ,zm).Theo nghĩa nào đó mạng nơron làm việc với tư cách một bảng tra, mà không cần biết dạng phụ thuộc hàm tường minh giữa Z và X khi đó có thể viết:
Z=Tinh(X, NN ) Các nơron trên cùng một lớp có thể tính toán đồng thời, do vậy độ phức tạp tính toán nói chung sẽ phụ thuộc vào số lớp mạng
Các thông số cấu trúc mạng nơron bao gồm
+ Số tín hiệu vào, số tín hiệu ra
Trang 19+ Các trọng số liên kết nơron
• Mạng nơron như một hệ thống thích nghi có khả năng học (huấn
luyện) để tinh chỉnh các trọng số liên kết cũng như cấu trúc của mạng sao cho
phù hợp với các mẫu học (samples) Có ba loại kỹ thuật học
(i) Học có giám sát (supervised learning) hay còn gọi học có thầy;
(ii) Học không có giám sát (unsupervised leraning) hay còn gọi học
không có thầy
(iii) Học tăng cường
Trong học có giám sát, mạng được cung cấp một tập mẫu học {(XS,DS)}
theo nghĩa XS là tín hiệu vào, thì kết quả ra đúng của hệ phải là DS ở mỗi lần
học, véctơ tín hiệu vào XS được đưa vào mạng, sau đó so sánh sự sai khác giữa
các kết quả ra đúng DS với kết quả tính toán ZS Sai số này sẽ được dùng để
hiệu chỉnh lại các trọng số liên kết trong mạng Quá trình cứ tiếp tục cho đến
khi thỏa mãn một tiêu chuẩn nào đó Có hai cách sử dụng tập mẫu học: Hoặc
dùng các mẫu lần lượt, hết mẫu này đến mẫu khác, hoặc sử dụng đồng thời tất
cả các mẫu một lúc Các mạng với cơ chế học không giám sát được gọi là các
mạng tự tổ chức Các kỹ thuật học trong mạng nơron có thể nhằm vào hiệu
chỉnh các trọng số liên kết (gọi là tham số) hoặc điều chỉnh, sửa đổi cấu trúc
của mạng bao gồm số lớp, số nơron, kiểu và trọng số các liên kết (gọi là học
cấu trúc) Cả hai mục đích học này có thể thực hiện đồng thời hoặc tách biệt
Học tham số: Giả sử có k nơron trong mạng và mỗi nơron có đúng l liên
kết vào với các nơron khác Khi đó, ma trận trọng số liên kết W sẽ có kích
thước kxl Các thủ tục học tham số nhằm mục đích tìm kiếm ma trận W sao
cho
ZS = Tinh ( XS, W) đối với mọi mẫu học S = (XS, DS) (2.1)
Học cấu trúc: Với học tham số ta giả định rằng mạng có một cấu
trúc cố định Việc học cấu trúc của mạng truyền thẳng gắn với yêu cầu tìm ra
số lớp của mạng L và số nơron trên mỗi lớp nj Đối với các mạng hồi qui còn phải xác định thêm các tham số ngưỡng θ của các nơron trong mạng Một cách tổng quát phải xác định bộ tham số P = ( L,n1… ,n1, θ1,….,θk), ở đây k =
∑ nj sao cho:
YS = Tinh ( XS,P) đối với mọi mẫu học s = (XS, DS) (2.2)
Về thực chất, việc điều chỉnh các véctơ tham số W trong (2.1) hay P trong (2.2) đều qui về bài toán tìm kiếm tối ưu trong không gian tham số Do vậy, có thể áp dụng các cơ chế tìm kiếm kinh điển theo gradient hay các giải thuật di truyền, lập trình tiến hoá
3.4.2.3 Khả năng tính toán và biểu diễn phụ thuộc dữ liệu của mạng nơron
Mạng nơron truyền thẳng chỉ đơn thuần tính toán các tín hiệu ra dựa trên các tín hiệu vào và các trọng số liên kết nơron đã xác định rõ trong mạng
Do đó chúng không có trạng thái bên trong nào khác ngoài véctơ trọng số W
Đối với mạng qui hồi, trạng thái trong của mạng được lưu giữ tại các ngưỡng của các nơron, các mạng qui hồi có thể không ổn định, thậm chí rối loạn theo nghĩa, khi cho véctơ giá trị đầu vào X nào đó, mạng cần phải tính toán rất lâu,
Trang 20thậm chí có thể lặp vô hạn trước khi đưa ra được kết quả mong muốn Quá
trình học của mạng qui hồi cũng phức tạp hơn nhiều Tuy vậy, các mạng qui
hồi có thể cho phép mô phỏng các hệ thống tương đối phức tạp trong thực tế
3.4.2.4 Xác định cấu trúc mạng tối ưu
Như ta đã đề cập phần trên, lựa chọn sai cấu trúc mạng có thể dẫn tới
hoạt động mạng trở nên kém hiệu quả Nếu chọn mạng quá nhỏ có thể chúng
không biểu diễn được sự phụ thuộc dữ liệu mong muốn Nếu chọn mạng quá
lớn để có thể nhớ được tất cả các mẫu học dưới dạng bảng tra, nhưng hoàn
toàn không thể tổng quát được cho những tín hiệu vào chưa biết trước Nói
cách khác, cũng giống như trong các mô hìng thống kê, các mạng nơron có
thể đưa tới tình trạng quá thừa tham số
Bài toán xác định cấu trúc mạng tốt có thể xem như bài toán tìm kiếm
trong không gian tham số Một cách làm là sử dụng giải thuật di truyền, tuy
vậy, không gian tham số có thể rất lớn và để xác định một trạng thái W ( hoặc
P) trong không gian đòi hỏi phải huấn luyện mạng, do vậy rất tốn thời gian
Có thể áp dụng tư tưởng tìm kiếm leo đồi (hill-climbing) nhằm sửa đổi một
cách có lựa chọn, mang tính địa phương cấu trúc mạng hiện có Có hai cách
làm:
+ Hoặc bắt đầu với một mạng lớn, sau đó giảm nhỏ xuống;
+ Hoặc bắt đầu với một mạng nhỏ, sau đó tăng dần lên
Một kỹ thuật khác có thể áp dụng gọi là “tổn thương tối ưu“ nhằm loại
bỏ một số liên kết trọng số trong mạng dựa trên các tiếp cận lý thuyết thông
tin, đơn giản nhất là các liên kết có trọng số bằng 0 Quá trình cứ tiếp tục như
vậy Kỹ thuật này có thể loại trừ 3/4 các liên kết, do đó nâng cao đáng kể hiệu
Trang 21Chương III ứng dụng mạng nơron ánh xạ đặc trưng tự tổ chức
Kohonen trong bài toán phân loại ngày
Bài toán phân loại ngày trong dự báo phụ tải ngắn hạn cho hệ thống
điện là một bài toán rất quan trọng để phân loại các dữ liệu đầu vào và dự
báo các kiểu ngày tiếp theo Trong một số phần mềm dự báo phụ tải ngắn hạn
trước đây, chưa có phần mềm nào thực hiện vấn đề phân loại dữ liệu, mà việc
phân loại dữ liệu đầu vào đều được thực hiện thủ công bằng kinh nghiệm
Trong chương này tôi trình bày các khái niệm cơ bản về mạng nơron
ánh xạ đặc trưng tự tổ chức Kohonen, sau đó phát biểu bài toán, đề xuất cấu
trúc mạng, cách ứng dụng kỹ thuật “mạng nơron ánh xạ đặc trưng tự tổ chức
Kohonen” để giải quyết bài toán Xây dựng phần mềm và phân tích đánh giá
kết quả đạt được Chương trình được viết bằng phần mềm Matlab.
3.1 Sự cần thiết phân loại đồ thị phụ tải
3.1.1 Tập hợp các kiểu đồ thị phụ tải đặc trưng
Trong các bài toán dự báo nói chung và dự báo phụ tải hệ thống điện
nói riêng, để đạt được kết quả dự báo chính xác cao và thời gian huấn luyện
ngắn, ta cần phải phân loại được các loại dữ liệu đầu vào Đặc biệt đối với bài
toán dự báo phụ tải ta cần phân dạng kiểu ngày dự báo vì qua số liệu thống kê
và thực tế vận hành cho thấy tồn tại một vài dạng đồ thị phụ tải đặc trưng phụ
thuộc vào các tính chất của ngày nghiên cứu
Đồ thị phụ tải trong ngày làm việc của các tháng giống nhau trong các
năm giống nhau thường có dạng giống nhau Dưới đây là đồ thị phụ tải của
ngày làm việc trong tháng 2 năm 2005, 2006 và các ngày làm việc trong tháng
Đồ thị phụ tải
0 500 1000 2000 3000
6 năm 2005, 2006 của hệ thống điện Miền Bắc (Hình 3.1) Qua đồ thị phụ tải
ta thấy các ngày làm việc trong cùng một tháng của hai năm có dạng giống nhau Đồ thị phụ tải của tháng 2 có dạng hoàn toàn khác với tháng 6 và ta cũng thấy rằng giá trị phụ tải của ngày nghỉ bao giờ cũng nhỏ hơn ngày làm việc bình thường, dạng đồ thị của các ngày này cũng có sự thay đổi Đối với các ngày truyền hình trực tiếp các sự kiện thể thao văn hoá đồ thị phụ tải cũng
có dạng tương tự như các ngày có cùng sự kiện trước đó Dạng của đồ thị phụ tải trong ngày có cắt điện diện rộng cũng mang đặc thù riêng tuỳ thuộc vào thời gian, vùng cắt điện Những ngày này nếu áp dụng các phương pháp dự báo thường cho kết quả chính xác không cao
Từ 22 đến 24/02/2005
Từ 9 đến 11/05/2005
Từ 22 đến 24/02/2006
Trang 22Tóm lại để kết quả dự báo phụ tải chính xác cao ta cần phân loại các đồ
thị phụ tải của các ngày trong năm thành một số nhóm, mỗi nhóm bao gồm
các ngày có các dạng đồ thị phụ tải tương tự Những ngày có dạng đồ thị phụ
tải tương tự được định nghĩa là những ngày có cùng kiểu ngày
3.1.2 Sự cần thiết phân loại ngày bằng phương pháp mạng nơron
Trước đây, bằng kinh nghiệm vận hành lâu năm các kỹ sư điều hành và
các cán bộ lập phương thức có thể phân biệt được các kiểu ngày gốc đặc trưng
trong quá khứ và dự đoán các kiểu ngày tiếp theo Tuy nhiên, trong quá trình
biến đổi không ngừng của xã hội, cơ cấu kinh tế và tỉ trọng giữa các ngành
công nghiệp thay đổi, thói quen sinh hoạt của khách hàng thay đổi sẽ xuất
hiện một số kiểu ngày mới mà các chuyên gia với kinh nghiệm của mình có
thể đưa ra nhận định với độ chính xác không cao Hơn nữa sẽ có một số kiểu
ngày nào đó có thể hầu như không xuất hiện, thậm chí biến mất hoàn toàn mà
không được loại trừ khỏi tập hợp các kiểu ngày gốc đặc trưng Đó chính là
nhược điểm lớn trong quá trình dự báo dạng đồ thị phụ tải dựa vào kinh
nghiệm của chuyên gia
số kiểu ngày trong dạng gốc hoặc loại bỏ một số ngày không còn xuất hiện nữa Trong suốt quá trình huấn luyện mạng, khi đưa các tập mẫu vào mạng, ta cần phải thu được kết quả gì, bao nhiêu kiểu ngày đầu ra? Quá trình học như vậy gọi là học không giám sát
Trong phần tiếp theo, ta sẽ đi sâu nghiên cứu mạng nơron ánh xạ đặc trưng tự tổ chức Kohonen và ứng dụng nó để phân loại ngày
3.2 Mạng nơron ánh xạ đặc trưng tự tổ chức Kohonen
Cách xử lý thông tin của các mạng nơron thông thường chỉ quan tâm tới giá trị và dấu của các thông tin đầu vào, mà chưa quan tâm khai thác các mối liên hệ có tính chất cấu trúc trong lân cận của các vùng dữ liệu mẫu hay toàn thể không gian mẫu
Chẳng hạn, với hai phần: 1 tam giác, 1 hình chữ nhật, ta có thể tạo thành ngôi nhà khi chúng được phân bố kề giáp với nhau theo một tật tự nhất
định
Teuvo kohonen (1989) đã đề xuất một ý tưởng rất đáng chú ý về ánh xạ các đặc trưng tự tổ chức (theo nghĩa không cần có mẫu học) nhằm bảo toàn các trật tự sắp xếp các mẫu trong không gian biểu diễn nhiều chiều sang một không gian mới các mảng nơron (một hoặc hai chiều) Trong mạng Kohonen,
Hình 3.2 Ví dụ về mối liên hệ có tính chất lân cận
Trang 23các véctơ tín hiệu vào gần nhau sẽ được ánh xạ sang các nơron trong mạng lân
cận nhau
3.2.1 Cấu trúc mạng
Mạng kohonen rất gần gũi với kiểu cấu trúc mạng nơron sinh học cả về
cấu tạo lẫn cơ chế học Mạng kohonen thuộc vào nhóm mạng một lớp, các
nơron được phân bố trong mặt phẳng hai chiều theo kiểu lưới vuông, hay lưới
lục giác (hình 3.3)
Phân bố này phải thoả mãn yêu cầu: Mỗi nơron có cùng số nơron trong
từng lớp láng giềng, ý tưởng cơ bản của Kohonen là các đầu vào tương tự nhau
sẽ kích hoạt các nơron gần nhau về khoảng không gian Mối quan hệ tương tự
(theo khoảng cách) có thể tổng quát hoá cho một lớp đối tượng rộng các quan
hệ tương tự giữa các tín hiệu đầu vào
`
Một cách trực quan, có thể xem thuật giải huấn luyện mạng Kohonen
nhằm biến đổi không gian tín hiệu vào sang mạng nơron giống như các thủ tục
kiểu “làm trơn” hay “tạo hình” dữ diệu
Tất cả các nơron ở lớp kích hoạt có liên kết đầy đủ với lớp vào Điểm
quan trọng nhất trong mạng Kohonen là với một véctơ tín hiệu vào, nó chỉ cho
phép các phản hồi có tính địa phương, nghĩa là đầu ra của mỗi nơron không
Hình 3.3 Lưới các nơron trong mặt phẳng hai chiều
được nối với tất cả các nơron khác mà chỉ với một số nơron lân cận Sự phản hồi mang tính địa phương của những điều chỉnh (nếu có) tạo ra hiệu ứng là các nơron gần nhau về vị trí sẽ có hành vi tương tự khi có những tín hiệu giống nhau được đưa vào
Hình 3.4 Liên kết giữa tín hiệu đầu vào tới một nơron ra
Tín hiệu vào
Trọng số liên kết wij
Trang 24Mỗi đầu vào i được kết nối với nơron đầu ra j thông qua một trọng số
wij Giá trị đầu ra aj được gán cho nút đầu ra j theo các biến đầu vào và trọng
w
1
(3.1) Tại mỗi thời điểm chỉ có nơron duy nhất C trong lớp kích hoạt được lựa
chọn sau khi đã đưa vào mạnh các tín hiệu Xs Nơron này được chọn theo một
trong hai nguyên tắc sau:
Nguyên tắc 1 Nơron C có tín hiệu ra cực đại
=
= min(∑(X siưW ji 2) (3.3) Sau khi đưa vào một tập các véctơ X(1), X(2),…,X(K), các véctơ đầu
vào với các đặc điểm tương tự được gán cho đơn vị đầu ra giống hoặc gần
giống nhau Như vậy đây là quá trình véctơ đầu vào tự tổ chức trong quá trình
học và in vào sơ đồ đầu ra Sự sắp xếp của nút đầu ra thông qua một véctơ đầu
vào tương ứng dựa trên các đặc điểm nêu trên nên loại mạng nơron này được
gọi là mạng ánh xạ đặc trưng tự tổ chức Kohonen
Sau khi xác định được nơron C, các trọng số wci được hiệu chỉnh nhằm
làm cho đầu ra của nó lớn hơn hoặc gần hơn giá trị trọng số mong muốn Do
vậy, nếu tín hiệu vào xsi với trọng số wci cho kết quả ra quá lớn thì phải giảm
trọng số và ngược lại Các trọng số của các nơron láng giềng cũng phải được
hiệu chỉnh giảm tuỳ thuộc vào khoảng cách lân cận Nc tính từ C Với khoảng
lân cận Nc thì số nơron lân cận với nút c là (2Nc+1)2 được phân bố trong một
Với luật học này các nơron lân cận sẽ được cập nhật tương tự nhau và như thế sẽ phù hợp với sự kiện đáp ứng đầu vào lân cận Trên thực tế khoảng lân cận Nc và hằng số η sẽ được thay đổi trong quá trình học Bắt đầu Nc rất lớn
và η tương đối và sau đó giảm cả hai
Theo kinh nghiệm, cần phải tạo ra phân bố ngẫu nhiên các trọng số trong khoảng -0.1 đến 0.1 hoặc -1/m đến 1/m, ở đây m là số trọng số của mạng và chuẩn hoá dữ liệu vào, ra bằng -1 hoặc 1
Tuy nhiên cũng phải chú ý một điều là việc lựa chọn tiêu chuẩn chuẩn hoá, định cỡ dữ liệu phụ thuộc rất nhiều vào bản chất bài toán
3.2.3 Sử dụng mạng
Giả sử đã huấn luyện mạng để nhận được ma trận trọng số W Khi đưa vào mạng một véctơ X, toàn bộ ma trận W lại được cập nhật theo các công Hình 3.5 Phân bố giữa nơron trung tâm và các nơron theo lưới vuông
Trang 25thức (3.4) hoặc (3.5) tuỳ thuộc vào việc xác định nơron trung tâm C sử dụng
theo nguyên tắc 1 hay nguyên tắc 2
Như vậy, mạng Kohonen cho chúng ta biết được sự phân bố và quan hệ
tương đối về mặt “địa lý” giữa các mẫu trong không gian biểu diễn
3.3 Xây dựng mạng Kohonen để phân loại ngày
3.3.1 Thiết kế cấu trúc mạng
Với đặc thù của bài toán dự báo phụ tải, dữ liệu đầu vào gồm có 24 giá
trị tương ứng với 24h (N=24),vì vậy ta chọn đầu vào X= (X1, X2, …XN) Chọn
lớp đầu ra gồm M= 19x19 nơron với Y = (Y1, Y2, …YM)
Các nơron đầu ra được sắp xếp trên một mạng kẻ ô hình bàn cờ, mỗi
nơron được mô tả bằng một hệ toạ độ chữ nhật Để đơn giản trong mô hình
này, ta đánh số thứ tự các nơron theo tuần tự và so sánh vị trí tương quan cụ
X(1), X(2), ….X(n) phụ thuộc vào số ngày mà chúng ta dựa vào phân dạng Bước tiếp theo ta chọn các giá trị trọng số ban đầu wij (i=1, 2,… 24); j = (1, 2,…, M) và chiều dài khoảng lân cận là Nc Theo Kohonen thì các trọng số liên kết bắt đầu từ các giá trị nhỏ ngẫu nhiên trong khoảng –0.1 đến 0.1 Sau khi đã xác định được các trọng số ban đầu W’’ij bước tiếp theo ta cần quy chuẩn hoá
để thu được chiều dài véctơ đơn vị theo công thức (3.7)
wij =
'
ij ij
w
w
(3.7)
Nói cách khác trọng số được quy chuẩn sao cho:
Hình 3.6 Sắp xếp các nơron đầu ra của mạng
Trang 26i i
Thông thường đối với bài toán phân loại ngày được phân loại theo từng
tháng, vì vậy số véctơ ĐTPT đầu vào là X(1), X(2), …, X(k) với k = 28,29,
30,31 (phụ thuộc vào số ngày trong tháng đang xét) Mỗi lượt đưa các véctơ
X(1), X(2), …, X(k) vào mạng gọi là một tác động Giả sử ta chọn khoảng lân
cận của Nơron C là Nc=3, và ứng với mỗi Nc số lần tác động của đầu vào là I
= 20 lần Khi đó các trọng số liên kết cho nút C và các nút lân cận sẽ liên tục
được chỉnh theo công thức (3.5) và được chuẩn hoá theo công thức (3.7) để
thoả mãn điều kiện (3 8)
Trong quá trình thu hẹp khoảng lân cận tức là giảm dần Nc, ta sử dụng
4 giá trị khác nhau của Nc (3,2,1,0) Nếu tương ứng mỗi Nc có 20 tác động thì
trong một quá trình huấn luyện sẽ có 80 tác động
Hình (3.7) là sơ đồ trình tự các bước của thuật toán tạo lập mạng ánh xạ
đặc trưng tự tổ chức Kohonen cho bài toán phân loại ngày
Trang 273.3.3 Xây dựng cấu trúc phần mềm mô phỏng mạng Kohonen phân loại
ngày
Căn cứ vào thuật toán đã trình bày trong phần trước và cấu trúc của
mạng ta xây dựng phần mềm mô phỏng cho bài toán phân loại các kiểu ngày
của ĐTPT Chương trình được viết bằng phần mềm Matlab, toàn bộ chương
trình được đưa ra trong phần phụ lục 1
Mạng mô phỏng là loại mạng một lớp bao gồm 24 nút đầu vào và 361
nút đầu ra được phân bố trên mặt phẳng hai chiều theo lưới vuông thoả mãn
yêu cầu Mỗi nơron ở lớp ra có cùng số nơron trong từng lớp lân cận Tất cả
các nơron lớp ra có liên kết đầy đủ với lớp vào Mô hình mạng Kohonen là
mạng nơron học không giám sát, để kiểm tra quá trình làm việc của mạng và
nghiên cứu ảnh hưởng của kích thước bước cập nhật η=0.001 tới sơ đồ đầu ra,
ta đưa vào mạng tập hợp các mẫu vào nằm trong một số nhóm đã biết trước,
với mong muốn ở đầu ra mạng có thể phân các mẫu đầu ra giống nhau vào
chung một nhóm Trong phần tiếp theo là kết quả phân loại ngày của tháng
2/2006 và tháng 5/2006
3.3.4 Kết quả sử dụng mạng Kohonen phân loại ngày
Dưới đây xin giới thiệu một vài nghiên cứu điển hình về phân loại
ĐTPT tại hệ thống điện Miền Bắc
1 Chạy thử mạng với thông số tháng 5/2006 với Nc =5
Bảng 3.1 Kết quả dự báo ứng với thông số NI = 150, η= 0.01
Bảng 3.2 NI = 150, η= 0.005
2 Chạy thử mạng với thông số tháng 2/2006 với Nc =5 Bảng 3.3 Kết quả dự báo ứng với thông số NI = 150, η= 0.01
Trang 28Bảng 3.4 NI = 150, η= 0.008
3.3.5 Phân tích kết quả phân loại ngày trong tháng 2/2006, tháng 5/2006
Đối với bài toán phân loại ngày, qua quá trình huấn luyện cho thấy
chọn khoảng lân cận NC = 5 số lần tác động NI = 100 – 200 lần, kích thước
cập nhật cỡ η=0.005 – 0.01 thì cho kết quả tương đối tốt
• Phân tích kết quả phân loại ngày trong tháng 5/2006 với Nc=5,
NI=150, η = 0.005
Ta nhận thấy các ngày thứ 7, Chủ nhật trong tháng có cùng kiểu ngày
và cùng kích hoạt các nơron 249, 268, 287 và 270 Thứ hai 1/5 là ngày lễ, phụ
tải trong ngày này có dạng giống như ngày chủ nhật và kích hoạt nơron 268
Như vậy ta xếp vào chủ nhật, thứ bảy, ngày lễ vào nhóm có cùng kiểu ngày
249
268 270
287
Xét các ngày thứ ba đến thứ sáu, các nơron kích hoạt đầu ra khá đa
dạng bao gồm 243, 244, 262, 281,…, nhưng lại được sắp xếp gần nhau về mặt
không gian (như bảng dưới đây) Như vậy, ĐTPT của các ngày làm việc được
xếp vào một loại hay cùng kiểu ngày
• Phân tích kết quả chạy mạng tháng 2/006 với các tham số NI =150, NC=5 và η=0.008
Ta thấy các ngày thứ bảy, chủ nhật, trong tháng có ĐTPT đầu vào gần giống nhau và cùng kích hoạt các nơron 139, 158, 177 và 140, các nơron phân
bố rất gần nhau trong không gian Như vậy, có thể sắp xếp thứ bảy, chủ nhật vào một nhóm có cùng kiểu ngày
Trang 29139 140
158
177 Các ngày thứ hai không phải là ngày nghỉ nhưng sát với ngày nghỉ chủ
nhật chúng có cùng dạng ĐTPT và khác với ĐTPT của ngày làm việc bình
thường Nguyên nhân này có thể do tâm lý và thói quen làm việc ít hơn, họp
hành…Những ngày này, phần mềm kích hoạt các nơron số 54, 73 và chúng
được phân bố rất gần nhau trong không gian
54
73 Xét các ngày làm việc bình thường khác từ thứ ba đến thứ sáu, các
nơron kích hoạt ở đầu ra khá đa dạng bao gồm 275, 276, 277… nhưng cũng
được sắp xếp rất gần nhau về mặt không gian Như vậy, ĐTPT của các ngày
làm việc được xếp vào một loại, hay cùng một nhóm có cùng kiểu ngày
Nhóm 1: Bao gồm các ngày thứ bảy,chủ nhật và ngày lễ
Nhóm 2: Bao gồm các ngày thứ hai trong tuần
Nhóm 3: Bao gồm các ngày làm việc bình thường từ thứ ba đến thứ sáu
Như vậy: Mạng ánh xạ đặc trưng tự tổ chức Kohonen với cấu trúc như
đã trình bày ở phần trên, mạng hoàn toàn có đủ khả năng phân loại ngày một cách dễ dàng, nhanh chóng và hiệu quả Phát hiện được một số kiểu ngày mới như các ngày có sự cố lớn, phải cắt điện đột xuất do thiên tai… đồng thời cũng có thể loại bỏ được một kiểu ngày nào đó hầu như không xuất hiện hoặc thậm chí biến mất hoàn toàn mà không được loại trừ khỏi tập hợp các kiểu ngày gốc đặc trưng Thông thường những ngày đặc biệt như trên các chuyên gia với kinh nghiệm của mình có thể không phát hiện và cập nhật được kịp thời
Trang 30CHƯƠNG iV ứNG DụNG MạNG NƠRON NHIềU LớP LAN TRUYềN NGƯợC
SAI Số Dự BáO PHụ TảI Ngắn hạn THEO NHIệT Độ
MÔI TRƯờNG
Chương này trình bày các khái niệm cơ bản về mạng nơron nhiều lớp
lan truyền ngược sai số, sau đó đưa ra các bước xây dựng bài toán, đề xuất
cấu trúc mạng, ứng dụng kỹ thuật “mạng nơron nhiều lớp lan truyền ngược
sai số” để giải quyết bài toán Xây dựng phần mềm, đánh giá kết quả và so
sánh với một số phương pháp đã có Chương trình được viết bằng phần mềm
Matlab và ngôn ngữ VBA được tích hợp trong phần mềm Excel
4.1 Các khái niệm cơ bản về mạng nơron nhiều lớp lan truyền ngược sai
số (Back propagation neural network)
Rosenblatt và các tác giả khác cũng đã miêu tả các mạng truyền thẳng
nhiều lớp từ cuối những năm 50, nhưng họ chủ yếu nghiên cứu sâu về mạng
Perceptron một lớp Sở dĩ như vậy là do không tìm được cách thay đổi trọng số
liên lạc tại các lớp ẩn Quả thật, ngay cả khi đã biết được sai số tại đầu ra,
người ta vẫn chưa hình dung được các sai số đó được phân bố như thế nào tại
các nơron ẩn Trong cuốn sách về mạng Perceptron xuất bản năm 1969,
Minsky và Paprt đã chỉ ra rằng khó có thể tổng quát hoá luật học đối với mạng
một lớp sang mạng nhiều lớp Có 2 lý giải chính cho vấn đề này, thứ nhất,
thuật giải học của mạng nhiều lớp có thể không hiệu quả, hoặc không hội tụ
về điểm cực trị tổng thể trong không gian véctơ trọng số Mặt khác, các
nghiên cứu trong lý thuyết tính toán đã chỉ ra rằng trong trường hợp tồi nhất
quá trình học các hàm tổng quát từ mẫu học không phải lúc nào cũng giải
quyết được Các nguyên tắc cơ bản trong luật học đối với mạng nhiều lớp đã
được Bryson và Ho đề xuất từ năm 1969, nhưng phải tới giữa năm 1980 vấn
đề này mới được quan tâm trở lại bởi công trình nghiên cứu của Rumelhart năm 1986 Một thống kê cho thấy 90% ứng dụng mạng nơron trong công nghệ hoá học sử dụng mô hình này
4.1.1 Kiến trúc mạng truyền thẳng
Mạng truyền thẳng nhiều lớp bao gồm một lớp vào, một hoặc nhiều lớp
ẩn và một lớp ra Trong đó các nơron lớp thứ i được nối đầy đủ với các nơron lớp thứ i+1, các nơron trong cùng một lớp không liên kết với nhau Các nơron
đầu vào có nhiệm vụ tiếp nhận các dữ liệu đầu vào và chuyển cho lớp ẩn kế tiếp Trong nhiều ứng dụng thực tế, để đơn giản, người ta thường sử dụng mạng có một lớp ẩn, số nơron trong lớp ẩn được xác định dựa trên kinh nghiệm, hoặc dựa trên kỹ thuật tìm kiếm khác nhau Hình 4.1 là cấu trúc của mạng truyền thẳng 2 lớp
• Lớp vào: Là các nơron nhận các biến đầu vào xi với i=1,2…n, n là số biến đầu vào Các nơron lớp vào nhận giá trị các biến đầu vào, dữ liệu của tất cả các nơron ở lớp đầu vào được tính toán rồi chuyển kết quả cho các nơron lớp ẩn
• Lớp ẩn: Bao gồm các nơron yj với j=1,2 m Các nơron lớp ẩn nhận tín hiệu từ nơron lớp vào qua bộ trọng số W1
• Lớp ra: Bao gồm các nơron đưa ra giá trị zk với k=1,2 l Các nơron lớp
ra nhận tín hiệu từ nơron lớp ẩn qua bộ trọng số W2 Mỗi nơron đầu ra tương ứng với 1 biến đầu ra
Trong mạng lan truyền ngược tín hiệu được lan truyền từ lớp vào đến lớp
ra và mạng thực hiện ánh xạ để tính giá trị cho các biến đầu ra dựa vào các giá trị biến đầu vào Ban đầu giá trị các biến vào được chuyển cho các nơron lớp vào của mạng, dữ liệu của tất cả các nơron ở lớp đầu vào được tính toán rồi
Trang 31chuyển kết quả cho các nơron lớp ẩn Cuối cùng mỗi nút ẩn gửi kết quả đến tất
cả các nơron ra Giá trị của các nút đầu ra chính là giá trị của các biến đầu ra
cần xác định
4.1.2 Huấn luyện mạng
Mạng nơron nhiều lớp lan truyền ngược sai số chỉ có thể ở hai trạng thái
đó là trạng thái học và trạng thái ánh xạ Bản chất của trạng thái ánh xạ do
mạng thực hiện tùy thuộc vào giá trị của các trọng số trong mạng Lan truyền
ngược là một phương pháp cho phép xác định tập trọng số tốt nhất của mạng,
đây là một quá trình lặp đi lặp lại nhiều lần trong hai quá trình ánh xạ và lan
truyền ngược sai số Hai quá trình này được thực hiện trên tập mẫu cố định
Hai quá trình này được gọi là huấn luyện mạng Trong trạng thái học, thông
tin lan truyền theo hai chiều nhiều lần để huấn luyện các trọng số Quá trình
huấn luyện mạng được bắt đầu với tập trọng số tuỳ ý, có thể là các giá trị ngẫu
nhiên nhỏ và tiến hành lặp đi lặp lại Mỗi lần lặp được gọi là một thế hệ, trong
mỗi thế hệ mạng điều chỉnh các trọng số sao cho sai số giảm dần Quá trình
điều chỉnh nhiều lần sao cho trọng số dần dần đạt được tập hợp các giá trị tối
Mỗi khi đưa một mẫu Xs = ( x1,…….,xn) vào mạng, ta thực hiện các công việc sau:
1 Lan truyền mẫu Xs qua mạng để có Zs = T( Xs ) Hàm T(.) là hàm phi tuyến phụ thuộc vào cấu trúc mạng nơron
• Lớp ẩn Y:
- Tổng thông tin đầu vào của lớp ẩn Y có trọng số là:
aj = ∑=n i i