Giới thiệu tổng quan về đề tài Trong luận văn này trình bày Mạng nơron mạng nơron nhân tạo và mạng nơron nhân tạo mờ, các bài toán dự báo, ứng dụng các bài toán dự báo dự báo chỉ số tiê
Trang 1ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN - -
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học PGS.TS ĐOÀN VĂN BAN
Thái Nguyên - 2010
Trang 2MỤC LỤC
MỞ ĐẦU 4
CHƯƠNG I: BÀI TOÁN DỰ BÁO CHỈ SỐ TIÊU DÙNG 7
1.1 Giới thiệu chung 7
1.2 Khái niệm giá tiêu dùng 8
1.3 Chỉ số tiêu dùng 8
1.4 Phương pháp tính chỉ số giá tiêu dùng 9
1.5 Quy trình thực hiện dự báo 13
1.6 Đánh giá hiệu quả của mô hình dự báo [10] 16
1.7 Phương pháp dự báo với mạng nơron 17
1.8 Kết luận 18
CHƯƠNG 2: MẠNG NƠRON NHÂN TẠOVÀ MẠNG NƠRON MỜ 20
2.1 Mạng nơron nhân tạo 20
2.1.1 Giới thiệu 20
2.1.2 Các nơron sinh học và bộ não con người 20
2.1.3 Mô hình mạng nơron nhân tạo 26
2.1.4 Phân loại cấu trúc mạng nơron nhân tạo 29
2.1.5 Các hình thức học của mạng nơron 31
2.1.6 Một số phương pháp huấn luyện mạng nơron nhân tạo 33
2.2 Tập mờ 39
2.2.1 Giới thiệu 39
2.2.2 Khái niệm tập mờ 40
2.2.3 Các phép toán trên tập mờ 43
2.2.4 Hệ thống suy luận mờ 48
2.3 Mạng nơron mờ 49
2.3.1 Lý do kết hợp giữa mạng nơron với lý thuyết mờ 49
2.3.3 Một số phương pháp mờ hoá mạng nơron 51
2.4 Mạng nơron nhân tạo mờ và bài toán dự báo 52
2.4.1 Thuật toán lan truyền ngược 52
Trang 32.4.2 Một số cải tiến của thuật toán lan truyền ngược 55
2.5 Kết luận 69
CHƯƠNG 3: ỨNG DỤNG DỰ BÁO CHỈ SỐ TIÊU DÙNG 71
3.1 Đặt vấn đề 71
3.2 Môi trường cài đặt 71
3.3 Xử lý dữ liệu 71
3.4 Thuật toán la truyền ngược giải bài toán dự báo 73
3.4.1 Mô hình của bài toán dự báo chỉ số giá tiêu dùng 73
3.4.2 Các bước trong thuật toán lan truyền ngược 73
3.5 Xây dựng chương trình 74
3.5.1 Giao diện và các chức năng của chương trình 74
3.5.2 Một số kết quả khi chạy thử nghiệm chương trình 78
KẾT LUẬN 81
TÀI LIỆU THAM KHẢO 82
PHỤ LỤC 84
Trang 4MỞ ĐẦU
I- Đặt vấn đề:
1 Giới thiệu tổng quan về đề tài
Trong luận văn này trình bày Mạng nơron (mạng nơron nhân tạo và mạng nơron nhân tạo mờ), các bài toán dự báo, ứng dụng các bài toán dự báo dự báo chỉ số tiêu dùng
2 Lý do chọn đề tài
Hiện nay cùng với sự phát triển mạnh mẽ về mọi mặt của các nước trên thế giới thì tình hình lạm phát và khủng hoảng kinh tế là những vấn đề mà hầu hết các quốc gia đều gặp phải, đặc biệt trong hai năm trở lại đây toàn nhân loại cùng phải chèo lái để vượt qua khủng hoảng kinh tế toàn cầu Giá cả, dịch vụ hàng hóa luôn biến động theo thời gian, tuy nhiên nếu giá cả thay đổi quá nhanh nó sẽ ảnh hưởng lớn đến nền kinh tế, đẩy đất nước lâm vào tình trạng khủng hoảng
Chỉ số giá tiêu dùng (CPI) là chỉ tiêu kinh tế quan trọng phản ánh mức độ lạm phát của nền kinh tế, nó đo lường sự biến động của giá tiêu dùng Sự tăng giảm của chỉ số tiêu dùng liên quan nhiều yếu tố trực tiếp và gián tiếp như: lượng hàng hóa dịch vụ được sản xuất, cung cấp ra thị trường, giá thành sản xuất, sức mua của dân, …
CPI quan trọng như vậy nhưng vấn đề tính toán nó thì không hề đơn giản Nó đòi hỏi sự đầu tư đúng đắn của các doanh nghiệp, các địa phương và các quốc gia
để sao cho có thể thu được các kết quả chính xác từ đó đưa ra những quyết sách cho việc điều chỉnh nền kinh tế phát triển bền vững Và hơn nữa, nếu có thể dự báo trước được chỉ số tiêu dùng thì chắc chắn những người cần đến nó sẽ chủ động hơn
và có thể đưa ra những phương án và quyết sách phù hợp giúp giảm thiểu tình trạng khủng hoảng kinh tế trong nước, trên thế giới Vì thế việc dự báo đúng đắn diễn biến của chỉ số tiêu dùng là việc cần thiết
Bài toán dự báo là bài toán khó, độ phức tạp tính toán lớn Tuy nhiên do sự cần thiết bài toán này mà các quốc gia, các tổ chức khoa học, … đã đầu tư nghiên cứu giải quyết Có nhiều phương pháp dự báo được sử dụng trong các mô hình dự
Trang 5báo khác nhau Mỗi phương pháp đều có ưu điểm, nhược điểm riêng Ứng dụng mạng nơron nhân tạo trong các mô hình dự báo cũng đã được thử nghiệm Trong
khuôn khổ luận văn thạc sỹ, tôi chọn đề tài nghiên cứu: “Mạng nơron và ứng dụng
dự báo chỉ số tiêu dùng”
II- Nội dung nghiên cứu
1 Mục tiêu nghiên cứu và tính cấp thiết của đề tài
Đề tài nghiên cứu về mạng nơron, và ứng dụng mô hình dự báo để đưa ra dự báo về chỉ số tiêu dùng
Tính cấp thiết của đề tài: Tình trạng lạm phát và khủng hoảng kinh tế xảy ra toàn cầu, do đó nếu có thể dự báo trước được chỉ số tiêu dùng thì chắc chắn những người cần đến nó sẽ chủ động hơn và có thể đưa ra những phương án phù hợp giúp giảm thiểu tình trạng khủng hoảng kinh tế trong nước và trên thế giới
2 Phạm vi nghiên cứu và ứng dụng
- Bài toán dự báo
- Mạng nơron nhân tạo
- Nghiên cứu các mạng nơron nhân tạo, mạng nơron nhân tạo mờ
- Nghiên cứu xây dựng mô hình dự báo mờ với ứng dụng mạng nơron nhân tạo
- Ứng dụng dự báo chỉ số tiêu dùng CPI
4 Phương pháp nghiên cứu
- Quan sát, điều tra, thu thập dữ liệu cần cho bài toán dự báo
- Nghiên cứu tài liệu, tổng hợp các kết quả của các nhà nghiên cứu liên quan đến lĩnh vực nghiên cứu
- Thực nghiêm, tham khảo ý kiến tư vấn từ các chuyên gia
Trang 65 Các kết quả dự kiến đạt được
- Giới thiệu tổng quan về chỉ số tiêu dùng, bài toán dự báo chỉ số tiêu dùng
- Trình bày Mạng nơron, các mô hình dự báo
- Cài đặt thử nghiệm chương trình dự báo chỉ số tiêu dùng
III - Bố cục luận văn
Luận văn được trình bày trong 3 chương, có phần mở đầu, phần kết luận, phần mục lục, phần tài liệu tham khảo Các nội dung cơ bản của luận văn được trình bày theo cấu trúc như sau:
Chương 1: Bài toán dự báo chỉ số tiêu dùng
Khái quát về chỉ số tiêu dùng, phương pháp để tính chỉ số tiêu dùng, quy trình thực hiện dự báo chỉ số tiêu dùng Qua đó đánh giá tính hiệu quả của mô hình
dự báo Giới thiệu về phương pháp dự báo sử dụng mạng nơron
Chương 2: Mạng nơron nhân tạo và mạng nơron nhân tạo mờ
Mạng nơron nhân tạo, mô hình mạng nơron nhân tạo, cấu trúc mạng nơron nhân tạo với các nơron sinh học Các hình thức học của mạng nơron và phương pháp huấn luyện mạng nơron
Khái niệm về tập mờ, mạng nơron mờ Mạng nơron nhân tạo mờ với bài toán
dự báo Sử dụng thuật toán Lan truyền ngược để giải bài toán dự báo
Chương 3: Ứng dụng dự báo chỉ số tiêu dùng
Chỉ số tiêu dùng là một trong những thông số phản ánh tình trạng lạm phát của một quốc gia Việc đưa ra giải pháp để dự báo được chỉ số tiêu dùng là rất quan trọng
Thiết lập cơ sở dữ liệu đầu vào, sử dụng thuật toán lan truyền để giải bài toán
dự báo
Các form chính của chương trình, quy trình cài đặt, phân tích đánh giá kết quả đặt được và độ chính xác của thuật toán và chương trình cài đặt so với thực tế
Trang 7CHƯƠNG I: BÀI TOÁN DỰ BÁO CHỈ SỐ TIÊU DÙNG
1.1 Giới thiệu chung
Chỉ số tiêu dùng là một chỉ tiêu kinh tế quan trọng, thường được sử dụng trong phân tích kinh tế, đánh giá tình hình lạm phát, quan hệ cung cầu, là cơ sở tham khảo cho việc điều chỉnh lãi suất ngân hàng, tiên lương, tính toán điều chỉnh tiền công trong các hợp đồng sản xuất kinh doanh, …
Dự báo là một phát biểu về tương lai, mỗi phát biểu như vậy có một cơ sở chắn chắn nhất định Các dự báo được xây dựng bằng nhiều phương pháp, kiểm chứng qua hệ thống biểu thức đánh giá
Dự báo chỉ số tiêu dùng là một bái toán đã được tìm hiểu từ lâu Tuy nhiên, ở Việt Nam việc dự bó chỉ số giá tiêu dùng cho đến nay mới chỉ là những hình thức
dự báo dựa vào việc thống kê số liệu, dựa vào những nhận đình biến động kinh tế trước đó, cũng như những quy luật đã có trong năm mà chưa có một phương pháp
- Mỗi doanh nghiệp căn cứ vào số liệu dự báo chỉ số tiêu dùng, có thể điều chỉnh quy mô sản xuất, giá hàng hoá của mình cho phù hợp cũng như tình toán được giá nhân công hợp lý với mức chi tiêu của công nhân
- Với mỗi người dân số liệu dự báo về chỉ số tiêu dùng giúp họ có thể tính toán, điều chỉnh được mức chi tiêu của mình cho phù hợp
Mạng Nơron nhân tạo là một mô hình mô phỏng hoạt động của các nơron sinh học, nó có khả năng học và từ đó có thể ứng dụng nó để giải quyết các bài toán dự báo
Trang 81.2 Khái niệm giá tiêu dùng
Giá tiêu dùng là giá mà người tiêu dùng mua hàng hoá hoặc chi trả cho các dịch vụ trực tiếp cho đời sống hàng ngày Giá tiêu dùng được biểu diện bằng giá bán lẻ hàng hoá trên thị trường và giá phục vụ sinh hoạt đời sống, không bao gồm đất đai, giá hàng hoá bán cho sản xuất và các công việc có tính chất sản xuất kinh doanh
Để tính chỉ số giá tiêu dùng thì cần phải thi thập giá của các mặt hàng và các dịch vụ đại diện, phổ biến tiêu dùng của dân cư theo danh mục xác định - thường goi là “rổ” hàng hoá, dịch vụ
tệ, lãi suất ngân hàng,…
Chỉ số giá tiêu dùng là chỉ tiêu tương đối phản ánh xu hướng và mức độ biến động giá của “rổ” hàng hoá, dịch vụ tiêu dùng đại diện nói trên, khi giá của các mặt hàng, nhóm hàng trong “rổ” có thay đổi
Chỉ số giá tiêu dùng là số tương đối so sánh mức độ biến động giá của các mặt hàng đại diện trong kỳ báo cáo so với kỳ gốc Giá của rổ hàng hoá của kỳ gốc được quy định là 100 và giá của các kỳ khác được biểu diện bằng tỷ lệ phần trăm so với giá kỳ gốc Ví dụ: Tháng 4/2003 so với tháng 3/2003, giá của toàn bộ các mặt hàng trong danh mục đại diện tăng 0,2% thì Chỉ số giá là 100,2%
Hiện nay, Chỉ số giá tiêu dùng được tính hàng tháng, cho 3 gốc: Tháng trước, cùng kỳ năm trước và 12 tháng năm trước
Cần chú ý là Chỉ số giá tiêu dùng không phản ánh mức giá mà đo lường mức
độ biến động giá giữa hai khoảng thời gian Ví dụ: Chỉ số giá tháng 4/2003 so với tháng 3/2003 của nhóm hàng “Thiết bị đồ dùng gia đình” là 100,5% và Chỉ số giá
Trang 9nhóm hàng “Dược phẩm, Y tế” là 101,3% không có nghĩa là “hàng y tế” đắt hơn
“thiết bị đồ dùng gia đình” mà chỉ là: so với tháng 3, giá các mặt hàng y tế tăng mạnh hơn giá các mặt hàng thiết bị đồ dùng gia đình
Như vậy, Chỉ số giá tiêu dùng chính là một chỉ tiêu thống kê phản ánh xu hướng và mức độ biến động giá cả chung của một số lượng cố định các loại hàng hoá dịch vụ đã được chọn đại diện cho tiêu dùng, phục vụ cho đời sống bình thường của người dân CPI được sử dụng như đại diện cho thông số về lạm phát ở nhiều quốc gia, ở Việt Nam, CPI được Tổng cục thống kê bắt đầu tính toán và sử dụng CPI để phản ánh mức độ tăng giá tiêu dùng chung từ năm 1998 (trước 1998 sử dụng chỉ số giá bán lẻ - RPI) Từ đó đến nay, số lượng và quyền số các mặt hàng trong rổ hàng hoá để tính CPI được cập nhật và mở rộng 5 năm một lần, thời điểm được chọn làm năm gốc cũng thay đổi theo Năm gốc:
1.4 Phương pháp tính chỉ số giá tiêu dùng
Chỉ số giá tiêu dùng được tính từ giá bán lẻ hàng hoá và giá dịch vụ tiêu dùng (rổ hàng hoá và dịch vụ đại diện) với quyền số là cơ cấu chi tiêu của các hộ gia đình
CPI của nước ta đã và đang được tính cho cả nước, 8 vùng kinh tế và 64 tỉnh, thành phố trực thuộc Trung ương Một thành phần quan trọng để tính CPI là quyền
Trang 10số Quyền số tính chỉ số giá tiêu dùng được sử dụng cố định trong 5 năm và tính cho năm gốc so sánh (đồng nhất với năm cập nhật danh mục mặt hàng, dịch vụ đại diện) Trong thời kỳ 2006-2010 năm gốc so sánh là năm 2005, do đó giá kỳ gốc theo danh mục mặt hàng, dịch vụ đại diện mới, quyền số để tính chỉ số giá tiêu dùng đều phải là số liệu của năm 2005
Quyền số năm 2005 được tổng hợp từ kết quả cuộc điều tra mức sống dân cư năm 2004 của Tổng cục Thống kê Ngoài ra, năm 2005 Tổng cục Thống kê đã tiến hành điều tra mẫu bổ sung tại 10 tỉnh, thành phố để phân chia các nhóm chi tiêu nhỏ hơn theo yêu cầu tính chỉ số giá tiêu dùng
Trong điều kiện về vật chất, kỹ thuật, nguồn kinh phí hiện nay và cũng phù hợp với phương pháp của nhiều nước, Chỉ số giá tiêu dùng ở nước ta được tính theo công thức Laspeyres - với quyền số và giá kỳ gốc là năm 2005 và sẽ cố định khoảng
i
i i
n
i
i
t i t
p
p q
p
q p I
1
0
0 i
1
0 0 1
0 0
P : Giá mặt hàng i trong kỳ báo cáo t;
i i
q p
q p
1
0 0
0 0 0
i
W
Trang 11Công thức (1.1) tính CPI dài hạn (kỳ báo cáo so với kỳ gốc) Công thức này đã được áp dụng nhiều năm và có nhiều ưu điểm như cách tính dễ hiểu, ngắn gọn nhưng cũng có một số nhược điểm khi giải quyết vấn đề chọn mặt hàng mới thay thế mặt hàng cũ không còn bán trên thị trường, hàng thời vụ hoặc hàng thay đổi chất lượng do mọi so sánh đều phải thông quan một kỳ gốc đã chọn (ví dụ kỳ gốc
2000, kỳ gốc 2005, …)
Để khắc phục những nhược điểm trên, hiện nay CPI được tính theo công thức Laspeyres chuyển đổi - hay phương pháp so sánh với kỳ gốc ngắn hạn Công thức này hoàn toàn tương thích với công thức Laspeyres gốc Dạng tổng quát như sau:
t i t
i t
p
p W
I
1
1 1
1
*
i
t i i
t i
p
p W
W
Chú ý: Điểm mới trong công thức (1.2) là thay cho việc tính chỉ số cá thể mặt hàng kỳ báo cáo so trực tiếp với kỳ gốc bằng việc tính chỉ số cá thể mặt hàng kỳ báo cáo so với kỳ trước sau đó nhân với chỉ số cá thể mặt hàng đó ở kỳ trước so với năm gốc
1 2
1 1
2 0
i
t i i
i i
i i
t i
p
p p
p p
p p
p p
p
Đẳng thức trên có thể viết như sau:
1 0
1 0
I : Là chỉ số cá thể mặt hàng i tháng báo cáo so với tháng trước;
Công thức (1.2) có thể viết như sau:
Trang 12t pi i t
I I
W I
1
1 0
1 0 0
Thu thập giá bán lẻ của các mặt hàng và dịch vụ đại diện
Tính giá bình quân hàng tháng theo từng khu vực (thành thị, nông thôn) của các tỉnh thành phố
Tính chỉ số giá cấp tỉnh/thành phố theo từng khu vực thành thị, nông thôn
và chung cả tỉnh
Tính chỉ số giá cả nước theo từng khu vực thành thị, nông thôn và chung cả nước
- Tính chỉ số giá các vùng kinh tế: Tính CPI khu vực nông thôn và thành thị
của các vùng (8 vùng) từ báo cáo CPI khu vực nông thôn và thành thị của các tỉnh trong vùng, sau đó tính CPI vùng chung cho cả hai khu vực (8 vùng)
- Tính chỉ số giá cả nước: Tính CPI khu vực nông thôn và thành thị cả nước từ
CPI khu vực nông thôn và thành thị của 8 vùng, sau đó tính chỉ số giá chung
cả nước từ chỉ số giá của hai khu vực
Công thức tổng quát như sau:
k t
V
W
W I
I
0
1
0 0 0
*
(1.5)
Trang 13I : Là chỉ số kỳ báo cáo của tỉnh k so với kỳ gốc;
k: Là tỉnh tham gia tính chỉ số, m là sô tỉnh tham gia tính chỉ số giá;
1.5 Quy trình thực hiện dự báo
Dự báo là một quá trình khá phức tạp, về cơ bản nó sẽ được tiến hành theo các bước như sơ đồ sau (hình 1.1) [8]:
5 Trình bày kết quả dự báo
6 Theo dõi kết quả dự báo
Kết thúc
Trang 14Bước 1: Lập kế hoạch
Khâu đầu tiên trong quy trình dự báo là lập kế hoạch Khi lập kế hoạch thì việc trước tiên là xác định mục tiêu Xác định mục tiêu là xác định xem kết quả dự báo sẽ được sử dụng như thế nào Mục tiêu chung của dự báo là để lập kế hoạch và
có những quyết định hành động hợp lý Mục tiêu của dự báo Chỉ số giá tiêu dùng là giúp chính phủ, các doanh nghiệp và các cá nhân có được tầm nhìn và quyết sách hợp lý trong việc đề ra các định hướng phát triển đất nước, trong kinh doanh và trong chi tiêu cho cuộc sống hàng ngày Khi các mục tiêu tổng quát đã rõ, ta phải xác định xem cần phải dự báo những thông tin gì Trong khuôn khổ luận văn này, nội dung dự báo ở đây là các thông số về Chỉ số giá tiêu dùng bao gồm: Lương thực, thực phẩm; Đồ ướng và thuốc lá; May mặc, giầy dép, mũ nón; Nhà ở và vật liêu xây dựng; Thiết bị và đồ dùng gia đình; Dược phẩm, y tế; Phương tiện đi lại, bưu điện; Giáo dục; Văn hoá, thể thao, giải trí; Hàng hoá và dịch vụ khác; Chỉ số giá vàng; Chỉ số giá đô la Mỹ Cũng nằm trong bước lập kế hoạch, ta cần xác định khoảng thời gian dự báo là gì Với bài toán dự báo Chỉ số giá tiêu dùng, ta tiến hành
dự báo Chỉ số giá tiêu dùng của tháng sau tháng hiện tại Ta cũng có thể dự báo chỉ
số giá tiêu dùng của quý kế tiếp hoặc dự báo chỉ số giá tiêu dùng của năm tiếp
Bước 2: Thu thập dự liệu
Bước tiếp theo trong quy trình dự báo là thu thập số liệu Hình dưới mô tả từng bước trong quá trình thu thập số liệu:
Hình 1.2: Quá trình thu thập số liệu
Dữ liệu có thể thu thập từ các nguồn dữ liệu Sau đó dữ liệu này có thể tổng hợp và phân loại nếu đó là các dữ liệu có các đặc trưng cho từng ứng dụng [6] Tiếp theo, dữ liệu được xử lý để làm đầu vào cho bộ phận dự báo
Số liệu từ
các nguồn
dư liệu
Thu thập, phân loại và
xử lý số liệu
Dữ liệu đầu vào
Trang 15Bước 3: Lựa chọn mô hình dự báo
Việc quyết định xem mô hình dự báo nào là thích hợp liên quan đến nhiều yếu tố: Dữ liệu đầu vào, các yêu cầu về thời gian, yêu cầu về kết quả đầu ra, tài nguyên sẵn có, … Tuy nhiên, quy trình lựa chọn mô hình dự báo có thể được mô ta như hình 1.3
Chiến lược dự báo:
- Tiền định (Deterministic): Dựa trên mối quan hệ mật thiết giữa hiện tại và tương lai Các mô hình Time Series thích hợp với chiến lược này
- Triệu chứng (Symptomatic): Dựa trên những dấu hiệu hiện tại để dự báo cho tương lai
- Hệ thống (Systematic): Dựa trên ý tưởng cho rằng xu hướng phát triển trong tương lai sẽ tuân thủ theo một quy tắc nào đó, chẳng hạn các lý thuyết về kinh tế - xã hội
Hình 1.3: Qua trình lựa chọn mô hình dự báo
Vấn đề dự báo cụ thể
Các tổ chức
dự báo hiện thời
Chiến lược
dự báo
Tính chất chung của
mô hình
Yêu cầu về thời gian
Yêu cầu về kết quả đầu
Tập các mô hình sơ bộ được chọn
Các mô hình được chọn lựa
Trang 16Bước 5: Trình bày kết quả dự báo
Khi dự báo thành công thì công việc tiếp theo là tìm cách trình bày kết quả
dự báo đó một cách hợp lý Có nhiều cách trình bày kết quả dự báo như: Có thể thông qua bảng biểu, đồ thị hay hình ảnh minh họa, có thể trình bày ở dạng viết hoặc dạng nói, trình bày tại một vị trí hay trên các phương tiện thông tin đại chúng,
… Dù bằng cách này hay cách khác thì những kết quả dự báo phải đảm bảo ngắn ngọn, rõ ràng, thể hiện được sự tin cậy của dự báo và phải bằng ngôn ngữ mà người nghe hiểu được
Bước 6: Theo dõi kết quả dự báo
Khi đã thu được kết quả dự báo thì cần phải theo dõi sự đáng tin cậy của kết quả dự báo này Muốn làm được điều đó cần tính độ lệch giữa giá trị dự báo với giá trị thực và phải thống nhất được sự sai lệch trong phạm vi cho phép Độ sai lệch giữa kết quả dự báo và số liệu thực là bao nhiêu thì phụ thuộc vào sự thống nhất giữa người sử dụng và người xây dựng chương trình dự báo Đây là công việc rất quan trọng khi tiến hàng xây dựng bài toán dự báo
1.6 Đánh giá hiệu quả của mô hình dự báo [10]
Một mô hình có thể khớp rất tốt với các số liệu quá khứ Tuy nhiên, khi số liệu dự báo thật so sánh với số liệu tương lai mà không được dùng cho việc khớp để lấy tham số thì kết quả rất khác nhau Vì thế, việc so sánh các giá trị dự báo với dữ liệu thật sẽ cho hiệu quả của mô hình và kết quả dự báo
Thường chúng ta không thể đợi cho đến khi có số liệu tương lai để so sánh, đánh giá dự báo Cách tốt nhất là bỏ lại một số dữ liệu cuối cùng của chuỗi dữ liệu
Giả sử có một chuỗi dữ liệu: Y 1 ,Y 2,… , Y T+1,… Y T+m; trong đó m là số dữ liệu cuối sẽ
được để dành và T dữ liệu còn lại được đưa vào mô hình để dự báo Thông thường
dự báo trước một bước (one step ahead) được so sánh với giá trị thực Sai số dự báo trước một bước sẽ là:
Trang 17
e t t m
e p
e SSE
i
y n
SSE n
R2 là hệ số khớp của dữ liệu Nếu R2 = 1 thì ta có mô hình khớp tuyệt đối Đối với mỗi dự báo, giá trị R2 càng gần càng tốt
1.7 Phương pháp dự báo với mạng nơron
Bài toán dự báo có nhiều phương pháp giải quyết khác nhau, không có phương pháp nào tốt nhất cho mọi bài toán Mỗi phương pháp dự báo đều có ưu điểm và nhược điểm riêng, vì thế việc lựa chọn phương pháp nào để thực hiện tuỳ thuộc vào từng bài toán cụ thể Đối với bài toán dự báo Chỉ số giá tiêu dùng, luận văn này nghiên cứu phương pháp dựa trên mạng nơron
Trang 18Về lý thuyết, các mạng nơron và các hệ thống mờ là các hệ thống tương đương theo nghĩa chúng có khả năng chuyển đổi được Tuy nhiên trong thực tế, mỗi
hệ thống lại có những ưu nhược điểm riêng
Mạng nơron là các bộ xấp xỉ đa năng, chúng có lợi điểm so với các cách tiếp cận truyền thống là không yêu cầu dữ liệu đầy đủ Mạng nơron thích hợp với những bài toán ở đó các mối quan hệ giữa dữ liệu rất biến động không tuyến tính, hay sự độc lập các biến,
Tóm lại, mạng nơron có những ưu điểm sau: Có thể xấp xỉ một hệ phi tuyến động với độ chính xác bất kỳ; có khả năng miễn nhiễu và khả năng dung sai cao, chẳng hạn mạng có thể nhận các dữ liệu bị sai lệch hoặc không đầy đủ mà vẫn hoạt động được; có khả năng thích ứng, mạng có thể học và điều chỉnh trong quá trình hoạt động, đây là điểm đáng chú ý nhất của mạng nơron trong ứng dụng dự báo, đặc điểm này của mạng cho phép ta hi vọng xây dựng được một hệ có thể học tập để nâng cao khả năng phân tích và dự báo trong khi hoạt động Ngoài ra, mạng nơron còn có khả năng tổng quát hoá tốt phần lớn mạng
1.8 Kết luận
Với những ước muốn biết trước điều gì sẽ xảy ra trong tương lai của con người để có những biện pháp xử lý, ứng phó thích hợp nhằm tránh được những khó khăn, rủi ro và vượt qua những khó khăn đó, bài toán dự báo là bài toán rất quan trọng Đối với mỗi quốc gia, sự pháp triển kinh tế của họ gắn liền với cuộc sống tương lai Kinh tế chậm phát triển thậm trí suy thoát hay khủng hoảng sẽ dẫn tới sự tụt hậu, khó khăn và trì trệ trong cuộc sống Nhằm chống lại những khó khăn và làm giảm nguy cơ lạm phát cũng như sự khủng hoảng của các nền kinh tế thì bài toán nhận biết hay dự báo trước chỉ số giá tiêu dùng là bài toán vô cùng quan trọng
Để giải quyết bài toán dự báo có nhiều phương pháp khác nhau đã được sử dụng Tuy nhiên, với những thế mạnh của mạng nơron thì phương pháp ứng dụng mạng nơron trong dự báo thể hiện nhiều ưu điểm Hơn nữa, khi ứng dụng mạng nơron để dự báo người ta còn có thể kết hợp nó với lôgic mờ trong qua trình xử lý
dữ liệu nhằm mang lại kết quả dự báo chính xác hơn
Trang 19Trong khuôn khổ luận văn này, hướng ứng dụng mạng nơron và mạng nơron
mờ cho mô hình dự báo được thể hiện và có ứng dụng cụ thể cho việc dự báo Chỉ số giá tiêu dùng của Việt Nam theo tháng, theo quý và theo năm
Trang 20CHƯƠNG 2: MẠNG NƠRON NHÂN TẠO
Ở Việt nam, mạng nơron được chú ý nghiên cứu từ những năm 1980, nó đi vào ứng dụng trong các lĩnh vực tin học, điện tử viễn thông, đo lường điều khiển, Một số chíp nơron đã được sử dụng trong kỹ thuật lọc và một số ứng dụng khác Mạng nơron nhân tạo có khả năng giải quyết nhiều bài toán mà con người có thể giải quyết được, ví dụ như nhận dạng, dự báo, chuẩn đoán bệnh, nghiên cứu khách hàng, kiểm tra độ tin cậy của máy móc, quản lý rủi ro và hỗ trợ việc ra quyết định,
Để có thể bắt chước được sự thông minh của con người, vấn đề đặt ra là phải xây dựng được các mô hình tính toán mô phỏng được các hoạt động của bộ não người Mạng nơron là một mô hình như vậy
Như vậy, cơ sở xây dựng mạng nơron nhân tạo chính là cố gắng mô phỏng lại các quá trình diễn ra trong các nơron sinh học nên trước khi tìm hiểu về mạng nơron nhân tạo chúng ta tìm hiểu cơ chế hoạt động của nơron sinh học
2.1.2 Các nơron sinh học và bộ não con người
2.1.2.1 Nơron sinh học
Nơron sinh học có nhiều dạng khác nhau như dạng hình tháp, dạng tổ ong, dạng rễ cây Tuy khác nhau về hình dạng, nhưng chúng có cấu trúc và nguyên lý hoạt động chung Một tế bào nơron gồm bốn phần như hình vẽ 2.1 dưới đây
Trang 21Hình 2.1: Cấu trúc Nơron sinh học
Các nhánh và rễ: Các nhánh và rễ là các bộ phận nhận thông tin, các đầy
nhạy hoặc đầu ra của các nơron khác bám vào rễ hoặc nhánh của một nơron Khi các đầu vào từ ngoài này có sự chênh lệch về nồng độ K+
, Na+ hay Cl- so với nồng
độ bên trong của nó thì xảy ra hiện tượng thấm từ ngoài vào trong thông qua một cơ chế màng thấm đặc điểm Hiện tượng thẩm thấu như vậy nên tạo một cơ chế truyền đạt thông tin với hàng nghìn hàng vạn liên kết khác nhau Mức độ thẩm thấu được đặc trưng bởi cơ chế màng tượng trưng bằng một tỷ lệ Tỷ lệ đó được gọi là tỷ trọng
hay đơn giản gọi là trọng số
Thân thần kinh (Soma): Thân thần kinh chứa các nhân và cơ quan tổng hợp
protein Các ion vào được tổng hợp và biến đổi Khi nồng độ các ion đạt đến một giá trị nhất định, xảy ra quá trình phát xung (hay kích thích) Xung đó được phát ở các đầu ra của nơron Dây dẫn đầu ra xung được gọi là dây thần kinh
Dây thần kinh (Axon): Dây thần kinh là đầu ra Đó là phương tiện truyền
dẫn tín hiệu Dây thần kinh được cấu tạo gồm các đốt và có thể dài từ vài micro mét đến vài mét tuỳ từng kết cấu cụ thể Đầu ra này có thể truyền tín hiệu đến các nơron khác
Khớp thần kinh (Synape): Khớp thần kinh là bộ phận tiếp xuc của đầu ra
nơron với rễ, nhánh của các nơron khác Chúng có cấu trúc màng đặc biệt để tiếp nhận các tín hiệu khi có sự chênh lệch về nồng độ ion giữa bên trong và bên ngoài Nếu độ lệch về nồng độ càng lớn thì việc truyền các ion càng nhiều và ngược lại
Thân (soma)
Nhánh
đầu ra
Dây thần kinh (axon) Đầu vào synape
Trang 22Mức độ thẩm thấu của các ion có thể coi là một đại lượng thay đổi tuỳ thuộc vào nồng độ
2.1.2.2 Bộ não người
Hình 2.2: Các đường thị giác của bộ não
Mắt cảm nhận ánh sáng xung quanh chúng ta và chuyền chúng thành các xung điện, sau đó đưa về bộ nhớ qua các dây thần kinh Tại phía sau của mắt, một lưới dây thần kinh từ giác mạc tạo thành các dây thần kinh cảm quang Hai lưới dây
thần kinh cảm quang gặp nhau tại một miền có tên là giao thoa thị giác (optic
chiasm) Tại miền này hai dây tạo thành một lưới, và được chia làm hai vùng cảm quang đi tới bên trái và bên phải của não Tất cả các miền này mang tín hiệu từ hai mắt và não tổng hợp được hình ảnh thực sự
Vùng của não cho các đáp ứng của hình ảnh gọi là vỏ não thị giác (hình 2.2)
Nếu mỗi vùng của não nhận được hai hình ảnh của vật thể, mỗi ảnh lấy từ một mắt với một góc nhìn khác nhau nhỏ thì kết quả ta sẽ nhận được một hình ảnh ba chiều hay còn gọi là hình ảnh nổi Tại não, một số khổng lồ các liên lạc của các tế bào thần kinh tạo ra xử lý thông tin
Trang 23Hình 2.3: Sơ đồ đơn giản hoá của tế bào thần kinh
Hình 2.3 là một sơ đồ đơn giản hoá của tế bào thần kinh Nó bao gồm một tế bào (soma) với dây thần kinh vào (dendrites) và dây thần kinh ra (axons) Các dây thần kinh vào nhận các tín hiệu kích thích hoặc các tín hiệu kiềm chế Các tín hiệu kích thích làm tăng và các tín hiệu kiềm chế làm chậm khả năng phát tín hiệu của thần kinh Các dây thần kinh đưa ra tín hiệu đến một tế bào khác Thông tin được chuyển qua các hình hành cuối khớp thần kinh (synaptic -end bulbs) và nhận bởi dây thần kinh vào thông qua vùng chuyển tiếp Hình hành cuối khớp thần kinh và vùng chuyển tiếp được chia ra bằng một lỗ hở vào khoảng một phần triệu inch, và chuyển tiếp tín hiệu qua lỗ hổng này bởi cơ chế hoá điện (hình 2.4) Phần cuối hành
và miền chuyển tiếp được gọi là khớp thần kinh (synapse) Tín hiệu đi trong dây
thần kinh vào và dây thần kinh ra như một dòng điện
Có rất nhiều kiểu dây thần kinh trong não và một số lớn các tế bào trạng thái
và chức năng Một số hạn chế các xung mà có khả năg làm quá tải mạch cảm biến Một số đưa tin tức tổng hợp đến bề mặt não, một số khác nhận tín hiệu đưa vào
Dây thần kinh vào
(dendrites)
Dây thần kinh ra
(Axon)
Hình hành cuối khớp thần kinh
(synaptic -end bulbs)
Nhánh dây thần kinh ra
(Axon branch)
Tế bào
(soma) Dây thần kinh
vào Tế bào
Trang 24mở các tuyến tiếp nhận cho phép các ion natri đi vào trong tâm tế bào và tạo ra xung điện trong tâm tế bào làm mở các ion kali đi ra Dòng của các ion kích thích các mang của tâm tế bào và tạo ra xung điện trong tế bào trung tâm
Phần lớn các quá trình xử lý thông tin đều xảy ra trên vỏ não Toàn bộ vỏ não được bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với đường kính khoảng 0,5 mm, độ cao 4 mm Mỗi đơn vị cơ sở này chứa khoảng 2000 nơron
Người ta chỉ ra rằng mỗi vùng não có những chức năng nhất định Điều rất đáng ngạc nhiên chính là các nơron rất đơn giản trong cơ chế làm việc, nhưng mạng các nơron liên kết với nhau lại có khả năng tính toán, suy nghĩ, ghi nhớ và điều khiển Có thể điểm qua những chức năng cơ bản của bộ não như sau:
- Bộ nhớ được tổ chức theo các bó thông tin và truy nhập theo nội dung (có thể truy xuất thông tin dựa theo giá trị các thuộc tính của đối tượng)
Dây thần kinh ra
(Axon)
Túi khớp thần kinh
(Synaptic vesicles)
Trang 25- Bộ não có khả năng tổng quát hoá, có thể truy xuất các tri thức hay các mối liên kết chung của các đối tượng tương ứng với một khái niệm chung nào đó
- Bộ não có khả năng dung thứ lỗi theo nghĩa có thể điều chỉnh hoặc tiếp tục thực hiện ngay khi có những sai lệch do thông tin bị thiếu hoặc không chính xác Ngoài ra, bộ não còn có thể phát hiện và phục hồi các thông tin bị mất dựa trên sự tương tự giữa các đối tượng
- Bộ não có khả năng xuống cấp và thay thế dần dần Khi có những trục trặc tại các vùng não (do bệnh, chấn thương) hoặc bắt gặp những thông tin hoàn toàn mới lạ, bộ não vẫn có thể tiếp tục làm việc
- Bộ não có khả năng học và thích nghi với môi trường
Đơn vị tính CPU với 105
Thời gian xử lý 10-8 giây 10-3 giây
Thông lượng 109 bit/giây 1014 bit/giây
Cập nhật thông tin 105
bit/giây 1014 nơron/giây
Dễ dàng thấy rằng bộ não con người có thể lưu giữ nhiều thông tin hơn các máy tính hiện đại tuy rằng điều này không phải đúng mãi, bởi lẽ bộ não tiến hoá chậm, trong khi đó nhờ những tiến bộ trong công nghệ vi điện tử, bộ nhớ máy tính được nâng cấp rất nhanh Hơn nữa, sự hơn kém về bộ nhớ trở nên hoàn toàn thứ yếu
so với sự khác biệt về tốc độ tính toán và khả năng xử ký song song Các bộ vi xử lý
có thể tính 108
lệch trong một giây, trong khi đó mạng nơron xử lý chậm hơn, cần khoảng vài minigiây để kích hoạt Tuy nhiên bộ não có thể kích hoạt hầu như cùng một lúc tại rất nhiều nơron và khớp nối, trong khi đó ngay cả máy tính hiện đại cũng chỉ có một số hạn chế các bộ vi xử lý song song Nếu chạy một mạng nơron nhân tạo trên máy tính, phải tốn hàng trăm lệnh máy tính để kiểm tra một nơron có được kích hoạt hay không (tiêu phí khoảng 10-8
x 102 giây/nơron) Do đó, mặc dù
Trang 26bộ vi xử lý có thể tính toán nhanh hơn hàng triệu lần so với các nơron bộ não, nhưng xét tổng thể bộ não lại tính toán nhanh hơn hàng tỷ lần
Cách tiếp cận mạng nơron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo ra các thiết bị có thể kết hợp khả năng song song cao của bộ não với tốc độ tính toán cao của máy tính Tuy vậy, cần phải có một khoảng thời gian dài nữa để các mạng nơron nhân tạo có thể mô phỏng được các hành vi sáng tạo của bộ não con người Chẳng hạn, bộ não có thể thực hiện một nhiệm vụ khá phức tạp như nhận ra khuôn mặt người quen sau không quá 1 giây trong khi đó một máy tính tuần tự phải thực hiện hàng tỷ phép tính (khoảng 10 giây) để thực hiện cùng thao tác đó, nhưng với chất lượng kém hơn nhiều, đặc biệt trong trường hợp thông tin không chính xác, không đầy đủ
2.1.3 Mô hình mạng nơron nhân tạo
Trên cơ sở mô hình nơron sinh học tổng quát, người ta đề xuất mô hình nơron nhân tạo Mô hình nơron nhân tạo được xây dựng từ ba thành phần chính: Bộ tổng các liên kết đầu vào, động học tuyến tính, bộ phi tuyến (hình 2.5) [5]
Hình 2.5: Mô hình Nơron nhân tạo
Để mô phỏng một nơron ta có thể coi nó như một hệ thống nhiều đầu vào và một đầu ra [10] (xem hình 2.5)
Trang 27v(t) =
k k
k x t
Trong đó:
v(t): Tổng tất cả các đầu vào mô tả toàn bộ thế năng tác động ở thân nơron
vào từ các đầu nhạy thần kinh hoặc từ các nơron khác đưa vào
vào ngoài tới nơron hiện tại; k=1,…,m; m là số đầu vào
y(t): Đầu ra nơron mô tả tín hiệu đưa ra
: Hằng số, còn được gọi là ngưỡng, nó dùng để xác định ngưỡng kích thích hay ức chế
Phần động học tuyến tính:
Đầu vào của phần động học là v(t) Đầu ra của nó u(t) gọi là đầu ra tương tự
Hàm truyền tương ứng của phần động học tuyến tính có thể mô tả dưới dạng:
s V
s U
ra u(t) = v(t)
)()(
t v dt
t
du ( ) u(t) v(t)
dt
t du
T u(t) = v(t-T)
Bảng 2.1: Một số hàm H(s) thường dùng cho mô hình nơron nhân tạo
Các hàm phi tuyến:
Phần này sử dụng hàm quan hệ phi tuyến f(.) cho đầu ra y, để chặn tín hiệu ở
đầu ra Các hàm đầu ra thông thường là các hàm có giới hạn ngưỡng phù hợp với đặc điểm đầu ra Các hàm đầu ra của nơron sinh học Hàm dạng này thường gọi là hàm kích hoạt (activation) thể hiện đặc điểm kích hoạt hay ức chế của một nơron
Trang 28) ) ( ( )) (
Mạng nơron là một mô hình toán học dựa trên cấu trúc nơron sinh học
Mạng nơron gồm một số lượng lớn các nơron được kết nối qua lại chặt chẽ
Các đáp ứng của mạng nơron thể hiện khả năng tính toán lớn
Một nơron có thể đáp ứng theo kích thích đầu vào của nó và đáp ứng hoàn toàn phụ thuộc vào các thông số bên trong của nơron đó
Mạng nơron có khả năng học, có khả năng nhớ và tổng quát hoá từ các dữ liệu đã học bằng cách điều chỉnh các trọng số đầu vào
Do các đặc trưng trên nên mạng nơron nhân tạo còn được gọi là mô hình xử lý phân tán song song hoặc mô hình tự cấu trúc hoặc hệ thống Neuromorphic Nhờ khả năng xử lý song song nên khả năng tính toán của mạng nơron nhanh hơn tốc độ tính toán của máy tính Bởi vì, dù tốc độ tính toán của mỗi nơron rất chậm nhưng mạng nơron tính toán song song cho nên chỉ cần qua một số chu kỳ tính của nơron thì mạng đã cho kết quả của phép tính một hàm số phi tuyến phức tạp bất kì Đây là ưu điểm quan trọng để ứng dụng mạng nơron trong các hệ xử lý, tính toán
Trang 29Tên hàm Công thức tương ứng Đặc tính
Bước nhảy đơn vị f(x)=
0 x if 0
0 x if 1
0 x if 1
1 x 1 - if 0
0 x if 1
Bảng 2.2: Một số hàm phi tuyến được sử dụng trong các mô hình nơron
2.1.4 Phân loại cấu trúc mạng nơron nhân tạo
Cũng như các nơron sinh học, các nơron nhân tạo có thể liên kết với nhau để tạo thành mạng nơron nhân tạo Có nhiều các liên kết các nơron nhân tạo thành mạng, mỗi cách liên kết cho một loại mạng nơron nhân tạo khác nhau Có nhiều cách để phân loại các lớp mạng, dựa vào các cách phân loại ta có các loại mạng khác nhau
Dựa vào số lớp có trong mạng:
- Mạng một lớp là tập hợp các phần tử nơron có đầu vào và đầu ra trên mỗi một phần tử Nếu mạng nói các đầu ra của phần tử này với đầu vào của phần tử kí gọi là mạng liên kết (autoassociative)
x
f
1 -1
x
f
1 -1
x
f
Trang 30- Mạng nhiều lớp gồm một lớp đầu vào và một lớp đầu ra riêng biệt Các lớp nằm giữa lớp đầu vào và lớp đầu ra gọi là các lớp ẩn (hidden layers)
Dựa vào đường truyền tín hiệu trong mạng:
- Mạng truyền thẳng là mạng hai hay nhiều lớp mà quá trình truyền tín hiệu từ đầu ra lớp này đến đầu vào lớp kia theo một hướng
- Mạng phản hồi là mạng trong đó một hoặc nhiều đầu ra của các phần tử lớp sau truyền ngược tới đầu vào lớp trước
- Mạng tự tổ chức là mạng có khả năng sử dụng những kinh nghiệm quá khứ
để thích ứng với những biến đổi của môi trường (không dự báo trước) Loại mạng này thuộc nhóm tự học, thích nghi không cần có tín hiệu chỉ đạo từ ngoài
Trong mỗi lớp mạng lại có nhiều mạng với các tên gọi và các đặc trưng khác nhau Một số mô hình mạng nơron cơ bản được mô tả trong hình 2.6
Trang 31Hình 2.6: Năm mô hình kết nối mạng cơ bản:
(a): Mạng truyền thẳng một lớp
(b): Mạng truyền thẳng nhiều lớp
(c): Nơron tự phản hồ.i (d): Mạng phản hồi một lớp
(e): Mạng phản hồi nhiều lớp
Như vậy, mạng nơron nhân tạo có cấu trúc khác nhau tuỳ theo số lớp, số phần
tử trong mỗi lớp và cách tổ chức
2.1.5 Các hình thức học của mạng nơron
Mạng nơron xây dựng theo kiến trúc máy tính chỉ mới giải quyết về phần cứng Do đó, để mạng hoạt động được thì mạng phải được dạy học Luật chia làm hai loại:
Học theo cấu trúc: Sử dụng các luật biến đổi để tăng hoặc giảm số lớp nơron,
thêm hoặc bớt các phần tử nơron Tức là xác định số lớp và số nơron trong mỗi lớp
Học theo tham số: Học để chỉnh các giá trị trọng số, đảm bảo cho đầu ra
mong muốn trên cơ sở các đầu vào hoặc đầu rạ Tức là xác định tham số của hàm kích hoạt ặ) và các trọng số Wij
Bản thân hai hình thức học trên lại chia thành ba kiểu: học có thầy (giám sát), học không có thầy (không có giám sát) và học củng cố (được biểu diễn trong hình 2.7)
Phân loại theo tiêu chí khác ta có:
Trang 32- Học có giám sát: Có yêu cầu giá trị của đầu ra (đầu ra mong muốn) để so
sánh với đầu ra tính toán
- Học củng cố: Có yêu cầu giá trị đầu ra, nhưng không chi tiết (ví dụ đầu ra chỉ
được đánh giá từ “đúng/sai” hoặc “được/không”)
- Học không giám sát: Không yêu cầu giá trị đầu ra
Dạng chung cho học tham số, với là hằng số học, r là tín hiệu học
Wi( t ) rx ( t ) (2.5)
Hình 2.7: Các luật học
(a): Học có giám sát; (b): Học củng cố; (c): Học không giám sát
Nếu coi cấu trúc mô hình mạng là phần xương thịt là thể xác của mạng nơron thì các luật học là phần trí tuệ thông minh của mạng nơron chính vì vậy các công trình nghiên cứu luật học đã chiếm số lượng lớn trong mấy chục thập kỷ qua
Mạng Nơron
w
y đầu ra thực
y đầu ra thực
Tín hiệu củng cố
x
đầu vào
tín hiệu củng cố
(a)
Mạng Nơron
w
Tạo tín hiệu lỗi
y đầu ra thực
d đầu ra mong muốn
x
đầu vào
tín hiệu lỗi
Trang 332.1.6 Một số phương pháp huấn luyện mạng nơron nhân tạo
2.1.6.1 Luật học Hebbian
Luật học Hebbian là luật học đơn giản tín hiệu r được xác định thông qua các
nơron đầu ra [17] Chúng ta có:
) W
Đối với mỗi thành phần W ij hiệu chỉnh một lượng xác định bởi:
j T
i x x W
ij co x
W
Luật học Hebbian được mô phỏng như hình vẽ 2.8 dưới đây
Hình 2.8: Minh hoạ luật học Hebbian
Đây là hình thức học không thầy Luật học này yêu cầu các trọng số khởi tạo bằng 0
2.1.6.2 Luật học Perceptron
Đối với luật học Perceptron, tín hiệu học là sự khác giữa giá trị đầu ra mong muốn và đầu ra thực tế (Rosenbaltt 1958) Như vậy, ở đây là học có thầy và tín hiệu học tương đương với:
)(d i O i
Trang 34Với O i được xác định bởi hàm dấu O i sgn(w i t x) O i và d i là đầu ra mong muốn như hình vẽ (2.9)
Trọng số trong phương pháp này, w i và w ij được xác định:
d W x x c
wi i sgn( i T )
T i i
Phép cộng được áp dụng khi d i =1 và sgn(w i T x)1, phép trừ được khi
ra ở dạng lưỡng cực trong trường hợp khác nó không còn đúng
Hình 2.9: Minh hoạ luật học Perceptron
Sự hiệu chỉnh trọng số sẽ kết thúc khi đầu ra thực trung với đầu ra mong muốn Luật học Perceptron là luật học quan trọng của học giám sát Các trọng số sẽ được khởi tạo với giá trị bất kỳ Mạng sẽ hội tụ sau một số hữu hạn phép lặp
Ưu điểm lớn nhất của Luật học Perceptron là tính đơn giản của luật học, trong trường hợp dữ liệu học được chuẩn hoá về dạng nhị phân lưỡng cực thì luật học rất trong sáng xem công thức cập nhật trọng số (2.11) ở trên
Trang 352.1.6.3 Luật học Delta
Luật học Delta được giới thiệu bởi McClelland và Rumelhart năm 1986 [18] Luật học Delta là luật học với hàm kích hoạt liên tục Ở đây là học có giám sát Tín hiệu học của luật này được gọi là Delta và được xác định bởi:
rd i f(w i T x)f,(w i T x) (2.12) Giới hạn f(w i T x) là đạo hàm của hàm kích hoạt f(net) với net= T
i
w Minh họa luật học Delta như hình vẽ 2.10 dưới đây
Luật học có được từ biểu thức trung bình bình phương lỗi cực tiểu giữa O i và
Như vậy, chúng ta xác định các trọng trên cơ sở tối thiểu trung bình bình
phương E(w)
Hình 2.10: Minh họa luật học Delta
Biểu thức trên có thể viết lại:
2 1
2
1
x w f d
Trang 36 j
T i i i ij
x x w f O d W
E ,
với j = 1 , 2, …, n; (2.14b)
Từ đó, để cực tiểu hoá hàm lỗi yêu cầu các trọng số thay một lượng w i tỷ lệ
âm với E(w)
w i ( i i) ,( i)
Hoặc, đối với trọng số thành phần (w ij) công thức trên trở thành:
j i i
mong muốn (có giá trị d i ) và giá trị đầu ra thực net i = w i T x (hình vẽ 2.11)
Hình 2.11: Hình hoạ luật học Widrow-Hoff
Tín hiệu học đối với luật học Widrow-Hoff được xác định như sau:
Trang 37)(d w x
r i i T ; i=1,2,…,n (2.17) Vector trọng số được hiệu chỉnh theo luật học này được xác định bởi:
x x w d
w i ( i i T )
hoặc, với các trọng số thành phần w ijđược hiệu chỉnh bởi:
j T i i
2.1.6.5 Luật học tương quan (Correlation)
Trong luật học tổng quát, thay thế tín hiệu học r = d i chúng ta thu được luật học tương quan (hình vẽ 2.12) với vector trọng số và các trọng số thành phần được hiệu chỉnh bởi:
x d
j i
Trang 38Đây là luật học đơn giản Luật học tương quan có thể được hiểu là trường hợp
đặc biệt của luật học Hebbian với hàm kích hoạt nhị phân và mỗi O i =d i Ở đây là
học có giám sát Các trọng số được hiệu chỉnh dựa trên đầu ra mong muốn và đầu vào chứ không phụ thuộc vào dạng hàm kich hoạt Các trọng số được khởi tạo giá trị ban đầu bằng 0
2.1.6.6 Luật học Người thắng nhận được tất cả (Winner-Take-All)
Luật học Winner-Take-All khác với các luật học được thảo luận ở trên Ở đây
là học không giám sát Học được sử dụng cho các thuộc tính tĩnh của đầu vào [7] Học trong một tầng cơ bản dựa trên một nơron như thể hiện ở (hình vẽ 2.13)
Hình 2.13: Minh họa luật học Winner-Take-All
Nơron thứ i có đầu ra lớn nhất đối với vector đầu vào x Nơron này được định nghĩa là nơron chiến thắng Vector trọng số w j =[w 1j ,…,w ij ,…,w nj ] T sẽ được hiệu
chỉnh thông qua nơron chiến thắng
Như hình vẽ trên các trọng số liên kết với nơron thứ i được tô đậm nét Ở đây là học không giám sát Chỉ các trọng số liên kết với nơron chiến thắng sẽ được hiệu chỉnh bởi:
Trang 39Nơron chiến thắng là nơron tại đó có mức kích hoạt lớn nhất các nơron trên
cùng một tầng (p là số lượng nơron trên tầng chúng ta xem xét) Chúng xác định
bởi:
w i T xmax(w i T x)k1, ,p (2.21)
Các trọng số được khởi tạo ngẫu nhiên
Hình 2.14: Minh hoạ luật học Outstart
Luật học thiết kế như hình 2.14 Vector trọng số được hiệu chỉnh theo công thức:
Các trọng số thành phần được hiệu chỉnh tương ứng bởi:
w ij (d i w ij) (2.22b)
với là hằng số học
Luật học Outstart là học có giám sát Các thành phần đầu ra mong muốn (d i )
được dùng để hiệu chỉnh các trọng số từ các nơron liên kết trực tiếp
2.2 Tập mờ
2.2.1 Giới thiệu
Như đã biết, trong những suy luận đời thường cũng như các suy luận khoa học, logic toán học đóng một vai trò rất quan trọng Ngày nay, xã hội càng phát triển thì nhu cầu của con người ngày càng cao Do đó, sự tiến bộ của khoa học cũng rất cao Suy luận logic nguyên thủy hay logic rõ với hai giá trị đúng, sai hay 1, 0 đã
d 1
d i
d p
Trang 40không giải quyết được hết các bài toán phức tạp nảy sinh trong thực tế Ví dụ: quần
áo như thế nào thì được gọi là dày, là mỏng để máy giặt biết được mà có chế độ tự động sấy khô cho hợp lý?
Những bài toán như vậy ngày một nhiều hơn trong các lĩnh vực điều khiển tối ưu, nhận dạng hệ thống…Nói chung là trong các quá trình quyết định nhằm giải các bài toán đối với các dữ liệu không đầy đủ, hoặc không được định nghĩa một cách rõ ràng (trong điều kiện thiếu thông tin chẳng hạn)
Một cách tiếp cận mới đã mang lại nhiều kết quả thực tiễn và đang tiếp tục phát triển đó là cách tiếp cận của lý thuyết tập mờ, do giáo sư Lotfi Zadeh của trường đại học California – Mỹ đề ra năm 1965 [19] Công trình này thực sự đã khai sinh một ngành khoa học mới là lý thuyết tập mờ và đã nhanh chóng được các nhà nghiên cứu công nghệ mới chấp nhận ý tưởng Một số kết quả bước đầu và hướng nghiên cứu tiếp theo góp phần tạo nên những sản phẩm công nghiệp đang được tiêu thụ trên thị trường Lý thuyết tập mờ ngày càng phong phú và hoàn chỉnh, đã tạo nền vững chắc để phát triển logic mờ Có thể nói logic mờ (Fuzzy logic) là nền tảng
để xây dựng các hệ mờ thực tiễn; ví dụ: trong công nghiệp sản xuất xi măng, sản xuất điện năng, các hệ chuyên gia trong y học giúp chuẩn đoán và điều trị bệnh, các
hệ chuyên gia trong xử lý tiếng nói, nhận dạng hình ảnh,… Công cụ chủ chốt của logic mờ là tiền đề hóa và lập luận xấp xỉ với phép suy diễn mờ
Trong phần này, mục đích chính là giới thiệu khái niệm tập mờ, logic mờ, tập trung đi vào các phép toán cơ bản và bước đầu đi vào lập luận xấp xỉ với phép suy diễn mờ