Cũng từ kết quả trên cho thấy, phạm vi bài toán dự báo này thì hằng số học thích hợp nhất có thể chọn là 0.7...81 Vấn đề 3: Việc lựa chọn khoảng khởi tạo trọng số...81 Cũng qua việc th
Trang 1ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN - -
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học PGS.TS ĐOÀN VĂN BAN
Thái Nguyên - 2010
Trang 2MỤC LỤC
MỞ ĐẦU 6
CHƯƠNG I: BÀI TOÁN DỰ BÁO CHỈ SỐ TIÊU DÙNG 9
1.1 Giới thiệu chung 9
1.2 Khái niệm giá tiêu dùng 10
1.3 Chỉ số tiêu dùng 10
1.4 Phương pháp tính chỉ số giá tiêu dùng 11
1.5 Quy trình thực hiện dự báo 15
1.6 Đánh giá hiệu quả của mô hình dự báo [10] 18
1.7 Phương pháp dự báo với mạng nơron 19
1.8 Kết luận 20
CHƯƠNG 2: MẠNG NƠRON NHÂN TẠO 22
VÀ MẠNG NƠRON MỜ 22
2.1 Mạng nơron nhân tạo 22
2.1.1 Giới thiệu 22
2.1.2 Các nơron sinh học và bộ não con người 22
2.1.3 Mô hình mạng nơron nhân tạo 28
2.1.4 Phân loại cấu trúc mạng nơron nhân tạo 31
2.1.5 Các hình thức học của mạng nơron 33
2.1.6 Một số phương pháp huấn luyện mạng nơron nhân tạo 34
2.2 Tập mờ 41
2.2.1 Giới thiệu 41
2.2.2 Khái niệm tập mờ 42
2.2.3 Các phép toán trên tập mờ 45
2.2.4 Hệ thống suy luận mờ 49
2.3 Mạng nơron mờ 51
2.3.1 Lý do kết hợp giữa mạng nơron với lý thuyết mờ 51
2.3.3 Một số phương pháp mờ hoá mạng nơron 53
2.4 Mạng nơron nhân tạo mờ và bài toán dự báo 54
2.4.1 Thuật toán lan truyền ngược 54
2.4.2 Một số cải tiến của thuật toán lan truyền ngược 57
2.5 Kết luận 71
CHƯƠNG 3: ỨNG DỤNG DỰ BÁO CHỈ SỐ TIÊU DÙNG 73
3.1 Đặt vấn đề 73
3.2 Môi trường cài đặt 73
3.3 Xử lý dữ liệu 73
3.4 Thuật toán la truyền ngược giải bài toán dự báo 75
3.4.1 Mô hình của bài toán dự báo chỉ số giá tiêu dùng 75
3.4.2 Các bước trong thuật toán lan truyền ngược 75
3.5 Xây dựng chương trình 76
3.5.1 Giao diện và các chức năng của chương trình 76
3.5.2 Một số kết quả khi chạy thử nghiệm chương trình 80
Trong quá trình chạy thử nghiệm chương trình với bộ dữ liệu về chỉ số tiêu dùng từ năm 2006 đến 2008 tôi nhận thấy những vấn đề sau: 80
Vấn đề 1: Việc lựa chọn số nơron lớp ẩn 80
Trang 3Số nơron lớp ẩn là một trong những nhân tố ảnh hưởng đến khả năng hội tụ của mạng Thực tế cho thấy với việc cố định các thông số khởi tạo mạng như sau: Hằng số học 0.5; Sai số cho phép = 0.0005; Số vòng lặp tối đa = 200000 và khoảng khởi tạo trọng số từ
-0.8 đến 0.8 kết quả thu được như sau: 80
Sô nơron lớp ẩn 80
Số vòng lặp 80
15 80
Không hội tụ 80
21 80
Không hội tụ 80
22 80
Không hội tụ 80
23 80
188234 80
24 80
162579 80
25 80
174325 80
26 80
89419 80
30 80
104364 80
35 80
127648 80
50 80
109984 80
Với 10 mẫu thự nghiệm như trên cho thấy, với số nơron lớp ẩn nhỏ hơn 15 thì mạng không hội tụ, việc huấn luyện mạng không thành công Cũng theo kết quả cho thấy mạng khởi tạo nên có số nơron lớp ẩn là 26 Nếu chọn mạng có số nơron lớp ẩn lớn hơn nữa, trên lý thuyết có thể tốc độ hội tụ sẽ nhanh hơn tuy nhiên không gian bộ nhớ để xử lý lại quá lớn 80
Như vậy, trong phạm vi bài toán dự báo chỉ số giá tiêu dùng thì việc khởi tạo số lượng nơron lớp ẩn bằng 26 là khá phù hợp với những yêu cầu cũng như kết quả thu được sau khi huấn luyện mạng 80
Vấn đề 2: Việc lựa chọn hằng số học cho mạng 81
Qua thực nghiệm trên 10 mẫu với việc cố định số nơron đầu vào là 26, sai số cho phép là 0.0005, khoảng khởi tạo trọng số là -0.8 đến 0.8 và số vòng lặp tối đa là 200000 đã thu được kết quả như sau: 81
Hằng số học 81
Số vòng lặp 81
0.1 81
Không hội tụ 81
0.2 81
Không hội tụ 81
0.3 81
Không hội tụ 81
0.4 81
Trang 40.5 81
168463 81
0.6 81
103837 81
0.7 81
89419 81
0.8 81
97864 81
0.9 81
Không hội tụ 81
1.0 81
Không hội tụ 81
Bảng kết quả thực nghiệm trên đã cho thấy, việc lựa chọn hằng số học hoàn toàn ảnh hưởng đến tốc độ, khả năng hội tụ của mạng Cũng từ kết quả trên cho thấy, phạm vi bài toán dự báo này thì hằng số học thích hợp nhất có thể chọn là 0.7 81
Vấn đề 3: Việc lựa chọn khoảng khởi tạo trọng số 81
Cũng qua việc thử nghiệm chạy chương trình ứng với việc khởi tạo các khoảng trọng số khác nhau còn các tham số khởi tạo mạng như: Số nơron lớp ẩn là 26; Sai số cho phép là 0.0005; Số vòng lặp tối đa là 200000 và hằng số học là 0.5 được cố định cho thấy: 81
Với các khoảng khởi tạo trọng số khác nhau thì kết quả thu được là khả năng hội tụ của mạng cũng khác nhau 81
Từ kết quả thực nghiệm rút ra: Trong quá trình huấn luyện mạng muốn mạng hội tụ được thì giá trị của các trọng số phải là các số khác nhau và nên nằm trong khoảng [-1,1], sự chênh lệch giữa các trọng số khởi tạo phải ở mức vừa phải Cũng từ thực nghiệm cho thấy khoảng khởi tạo ứng với bài toán này là [-0.8,0.8] 81
3.6 Kết luận 81
Việc ứng dụng mạng nơron để giải bài toán dự báo chỉ số tiêu dùng là một phương pháp tương đối khả quan Quá trình cài đặt chương trình dự báo chỉ số tiêu dùng bằng thuật toán lan truyền ngược trên mạng nơron đã thu được một số kết quả: 82
Người sử dụng có thể xây dựng được một mạng nơron với số lượng nơron lớp ẩn, hằng số học, sai số, … để phục vụ cho quá trình huấn luyện mạng 82
Với những giá trị của mạng khởi tạo được thiết lập, người sử dụng có thể tiến hành huấn luyện mạng để thu được kết quả phục vụ cho mục đích chính của chương trình là dự báo 82
Sau khi huấn luyện thành công mạng, kết quả thu được đó kết hợp với số liệu về chỉ số giá tiêu dùng cho tháng tiếp theo 82
KẾT LUẬN 83
Mạng nơron là một mô hình được xây dựng nhằm mục đích bắt chước sự thông minh của con người, do đó trong nhiều năm qua con người đã không ngừng nghiên cứu để tìm cách xây dựng được các mô hình tính toán mô phỏng được hoạt động của bộ não con người Mạng nơron là một mô hình như vậy 83
Căn cứ vào những kết quả thu được của việc tìm hiểu, xây dựng mạng nơron cho thấy mạng nơron nhân tạo có khả năng giải quyết nhiều bài toán mà con người có thể giải quyết được, ví dụ: nhận dạng, dự báo, chuẩn đoán bệnh, kiểm tra độ tin cậy của máy móc và quản lý rủi ro, … 83
Trang 5Có nhiều phương pháp dự báo được sử dụng trong các mô hình dự báo khác nhau Mỗi phương pháp đều có ưu điểm, nhược điểm của nó Ứng dụng mạng nơron nhân tạo trongcác mô hình dự báo cũng đã được thử nghiệm trong những năm gần đây 83 CPI là một chỉ số kinh tế rất quan trọng với mọi tầng lớp trong xã hội, nó phản ánh tình trạng lạm phát của nền kinh tế ở mỗi đất nước Việc dự báo chính xác chỉ số tiêu dùng sẽđem lại những lợi ích to lớn cho các quốc gia trên thế giới 83 Trong khuôn khổ luận văn này tôi đã tiến hành tìm hiểu về mạng nơron cùng với nhữngthuật toán xây dựng nó Tôi đã tìm hiểu về thuật toán lan truyền ngược bởi những ưu điểm nội trội của thuật toán khi áp dụng vào giải bài toán dự báo Luận văn đã xây dựng chương trình dự báo chỉ số tiêu dùng với thuật toán là lan truyền ngược với độ chính xáckhoảng 83% 83 Với thời gian, điều kiện không cho phép, cùng với sự am hiểu về lĩnh vực kinh tế của bản thân còn nhiều hạn chế, nên chương tình ứng dụng chỉ dừng lại việc dự báo chỉ số giá tiêu dùng của tháng sau so với tháng hiện tại 83 Hướng phát triển của tác giả là sẽ tìm hiểu sâu hơn về lĩnh vực kinh tế, từ đó có thể tiến hành xây dựng hoàn chỉnh bài toán dự báo chỉ số giá tiêu dùng cho quý, hay năm tới Bên cạnh đó tác giả sẽ tìm hiểu thêm những nhân tố bên ngoài tác động và làm biến đổi chỉ số giá tiêu dùng của các thời điểm trong năm, mờ hoá các dữ liệu đó để có thể thu được kết quả dự báo chính xác và mềm dẻo hơn 83
TÀI LIỆU THAM KHẢO 84
Trang 6MỞ ĐẦU
I- Đặt vấn đề:
1 Giới thiệu tổng quan về đề tài
Trong luận văn này trình bày Mạng nơron (mạng nơron nhân tạo và mạngnơron nhân tạo mờ), các bài toán dự báo, ứng dụng các bài toán dự báo dự báo chỉ sốtiêu dùng
2 Lý do chọn đề tài
Hiện nay cùng với sự phát triển mạnh mẽ về mọi mặt của các nước trên thếgiới thì tình hình lạm phát và khủng hoảng kinh tế là những vấn đề mà hầu hết cácquốc gia đều gặp phải, đặc biệt trong hai năm trở lại đây toàn nhân loại cùng phảichèo lái để vượt qua khủng hoảng kinh tế toàn cầu Giá cả, dịch vụ hàng hóa luônbiến động theo thời gian, tuy nhiên nếu giá cả thay đổi quá nhanh nó sẽ ảnh hưởnglớn đến nền kinh tế, đẩy đất nước lâm vào tình trạng khủng hoảng
Chỉ số giá tiêu dùng (CPI) là chỉ tiêu kinh tế quan trọng phản ánh mức độlạm phát của nền kinh tế, nó đo lường sự biến động của giá tiêu dùng Sự tăng giảmcủa chỉ số tiêu dùng liên quan nhiều yếu tố trực tiếp và gián tiếp như: lượng hànghóa dịch vụ được sản xuất, cung cấp ra thị trường, giá thành sản xuất, sức mua củadân, …
CPI quan trọng như vậy nhưng vấn đề tính toán nó thì không hề đơn giản
Nó đòi hỏi sự đầu tư đúng đắn của các doanh nghiệp, các địa phương và các quốcgia để sao cho có thể thu được các kết quả chính xác từ đó đưa ra những quyết sáchcho việc điều chỉnh nền kinh tế phát triển bền vững Và hơn nữa, nếu có thể dự báotrước được chỉ số tiêu dùng thì chắc chắn những người cần đến nó sẽ chủ động hơn
và có thể đưa ra những phương án và quyết sách phù hợp giúp giảm thiểu tình trạngkhủng hoảng kinh tế trong nước, trên thế giới Vì thế việc dự báo đúng đắn diễnbiến của chỉ số tiêu dùng là việc cần thiết
Bài toán dự báo là bài toán khó, độ phức tạp tính toán lớn Tuy nhiên do sựcần thiết bài toán này mà các quốc gia, các tổ chức khoa học, … đã đầu tư nghiêncứu giải quyết Có nhiều phương pháp dự báo được sử dụng trong các mô hình dự
Trang 7báo khác nhau Mỗi phương pháp đều có ưu điểm, nhược điểm riêng Ứng dụngmạng nơron nhân tạo trong các mô hình dự báo cũng đã được thử nghiệm Trong
khuôn khổ luận văn thạc sỹ, tôi chọn đề tài nghiên cứu: “Mạng nơron và ứng dụng
dự báo chỉ số tiêu dùng”.
II- Nội dung nghiên cứu
1 Mục tiêu nghiên cứu và tính cấp thiết của đề tài
Đề tài nghiên cứu về mạng nơron, và ứng dụng mô hình dự báo để đưa ra dựbáo về chỉ số tiêu dùng
Tính cấp thiết của đề tài: Tình trạng lạm phát và khủng hoảng kinh tế xảy ratoàn cầu, do đó nếu có thể dự báo trước được chỉ số tiêu dùng thì chắc chắn nhữngngười cần đến nó sẽ chủ động hơn và có thể đưa ra những phương án phù hợp giúpgiảm thiểu tình trạng khủng hoảng kinh tế trong nước và trên thế giới
2 Phạm vi nghiên cứu và ứng dụng
- Bài toán dự báo
- Mạng nơron nhân tạo
- Nghiên cứu các mạng nơron nhân tạo, mạng nơron nhân tạo mờ
- Nghiên cứu xây dựng mô hình dự báo mờ với ứng dụng mạng nơron nhân tạo
- Ứng dụng dự báo chỉ số tiêu dùng CPI
4 Phương pháp nghiên cứu
- Quan sát, điều tra, thu thập dữ liệu cần cho bài toán dự báo
- Nghiên cứu tài liệu, tổng hợp các kết quả của các nhà nghiên cứu liên quanđến lĩnh vực nghiên cứu
- Thực nghiêm, tham khảo ý kiến tư vấn từ các chuyên gia
Trang 85 Các kết quả dự kiến đạt được
- Giới thiệu tổng quan về chỉ số tiêu dùng, bài toán dự báo chỉ số tiêu dùng
- Trình bày Mạng nơron, các mô hình dự báo
- Cài đặt thử nghiệm chương trình dự báo chỉ số tiêu dùng
III - Bố cục luận văn
Luận văn được trình bày trong 3 chương, có phần mở đầu, phần kết luận, phần mụclục, phần tài liệu tham khảo Các nội dung cơ bản của luận văn được trình bày theocấu trúc như sau:
Chương 1: Bài toán dự báo chỉ số tiêu dùng
Khái quát về chỉ số tiêu dùng, phương pháp để tính chỉ số tiêu dùng, quytrình thực hiện dự báo chỉ số tiêu dùng Qua đó đánh giá tính hiệu quả của mô hình
dự báo Giới thiệu về phương pháp dự báo sử dụng mạng nơron
Chương 2: Mạng nơron nhân tạo và mạng nơron nhân tạo mờ
Mạng nơron nhân tạo, mô hình mạng nơron nhân tạo, cấu trúc mạng nơronnhân tạo với các nơron sinh học Các hình thức học của mạng nơron và phươngpháp huấn luyện mạng nơron
Khái niệm về tập mờ, mạng nơron mờ Mạng nơron nhân tạo mờ với bài toán
dự báo Sử dụng thuật toán Lan truyền ngược để giải bài toán dự báo
Chương 3: Ứng dụng dự báo chỉ số tiêu dùng
Chỉ số tiêu dùng là một trong những thông số phản ánh tình trạng lạm phátcủa một quốc gia Việc đưa ra giải pháp để dự báo được chỉ số tiêu dùng là rất quantrọng
Thiết lập cơ sở dữ liệu đầu vào, sử dụng thuật toán lan truyền để giải bài toán
dự báo
Các form chính của chương trình, quy trình cài đặt, phân tích đánh giá kết quảđặt được và độ chính xác của thuật toán và chương trình cài đặt so với thực tế
Trang 9CHƯƠNG I: BÀI TOÁN DỰ BÁO CHỈ SỐ TIÊU DÙNG
1.1 Giới thiệu chung
Chỉ số tiêu dùng là một chỉ tiêu kinh tế quan trọng, thường được sử dụng trongphân tích kinh tế, đánh giá tình hình lạm phát, quan hệ cung cầu, là cơ sở tham khảocho việc điều chỉnh lãi suất ngân hàng, tiên lương, tính toán điều chỉnh tiền côngtrong các hợp đồng sản xuất kinh doanh, …
Dự báo là một phát biểu về tương lai, mỗi phát biểu như vậy có một cơ sởchắn chắn nhất định Các dự báo được xây dựng bằng nhiều phương pháp, kiểmchứng qua hệ thống biểu thức đánh giá
Dự báo chỉ số tiêu dùng là một bái toán đã được tìm hiểu từ lâu Tuy nhiên, ởViệt Nam việc dự bó chỉ số giá tiêu dùng cho đến nay mới chỉ là những hình thức
dự báo dựa vào việc thống kê số liệu, dựa vào những nhận đình biến động kinh tếtrước đó, cũng như những quy luật đã có trong năm mà chưa có một phương pháp
- Mỗi doanh nghiệp căn cứ vào số liệu dự báo chỉ số tiêu dùng, có thể điềuchỉnh quy mô sản xuất, giá hàng hoá của mình cho phù hợp cũng như tình toánđược giá nhân công hợp lý với mức chi tiêu của công nhân
- Với mỗi người dân số liệu dự báo về chỉ số tiêu dùng giúp họ có thể tính toán,điều chỉnh được mức chi tiêu của mình cho phù hợp
Mạng Nơron nhân tạo là một mô hình mô phỏng hoạt động của các nơron sinhhọc, nó có khả năng học và từ đó có thể ứng dụng nó để giải quyết các bài toán dựbáo
Trang 101.2 Khái niệm giá tiêu dùng
Giá tiêu dùng là giá mà người tiêu dùng mua hàng hoá hoặc chi trả cho cácdịch vụ trực tiếp cho đời sống hàng ngày Giá tiêu dùng được biểu diện bằng giábán lẻ hàng hoá trên thị trường và giá phục vụ sinh hoạt đời sống, không bao gồmđất đai, giá hàng hoá bán cho sản xuất và các công việc có tính chất sản xuất kinhdoanh
Để tính chỉ số giá tiêu dùng thì cần phải thi thập giá của các mặt hàng và cácdịch vụ đại diện, phổ biến tiêu dùng của dân cư theo danh mục xác định - thườnggoi là “rổ” hàng hoá, dịch vụ
tệ, lãi suất ngân hàng,…
Chỉ số giá tiêu dùng là chỉ tiêu tương đối phản ánh xu hướng và mức độ biếnđộng giá của “rổ” hàng hoá, dịch vụ tiêu dùng đại diện nói trên, khi giá của các mặthàng, nhóm hàng trong “rổ” có thay đổi
Chỉ số giá tiêu dùng là số tương đối so sánh mức độ biến động giá của các mặthàng đại diện trong kỳ báo cáo so với kỳ gốc Giá của rổ hàng hoá của kỳ gốc đượcquy định là 100 và giá của các kỳ khác được biểu diện bằng tỷ lệ phần trăm so vớigiá kỳ gốc Ví dụ: Tháng 4/2003 so với tháng 3/2003, giá của toàn bộ các mặt hàngtrong danh mục đại diện tăng 0,2% thì Chỉ số giá là 100,2%
Hiện nay, Chỉ số giá tiêu dùng được tính hàng tháng, cho 3 gốc: Tháng trước,cùng kỳ năm trước và 12 tháng năm trước
Cần chú ý là Chỉ số giá tiêu dùng không phản ánh mức giá mà đo lường mức
độ biến động giá giữa hai khoảng thời gian Ví dụ: Chỉ số giá tháng 4/2003 so vớitháng 3/2003 của nhóm hàng “Thiết bị đồ dùng gia đình” là 100,5% và Chỉ số giá
Trang 11nhóm hàng “Dược phẩm, Y tế” là 101,3% không có nghĩa là “hàng y tế” đắt hơn
“thiết bị đồ dùng gia đình” mà chỉ là: so với tháng 3, giá các mặt hàng y tế tăngmạnh hơn giá các mặt hàng thiết bị đồ dùng gia đình
Như vậy, Chỉ số giá tiêu dùng chính là một chỉ tiêu thống kê phản ánh xuhướng và mức độ biến động giá cả chung của một số lượng cố định các loại hànghoá dịch vụ đã được chọn đại diện cho tiêu dùng, phục vụ cho đời sống bình thườngcủa người dân CPI được sử dụng như đại diện cho thông số về lạm phát ở nhiềuquốc gia, ở Việt Nam, CPI được Tổng cục thống kê bắt đầu tính toán và sử dụngCPI để phản ánh mức độ tăng giá tiêu dùng chung từ năm 1998 (trước 1998 sử dụngchỉ số giá bán lẻ - RPI) Từ đó đến nay, số lượng và quyền số các mặt hàng trong rổhàng hoá để tính CPI được cập nhật và mở rộng 5 năm một lần, thời điểm đượcchọn làm năm gốc cũng thay đổi theo Năm gốc:
1.4 Phương pháp tính chỉ số giá tiêu dùng
Chỉ số giá tiêu dùng được tính từ giá bán lẻ hàng hoá và giá dịch vụ tiêu dùng(rổ hàng hoá và dịch vụ đại diện) với quyền số là cơ cấu chi tiêu của các hộ giađình
CPI của nước ta đã và đang được tính cho cả nước, 8 vùng kinh tế và 64 tỉnh,thành phố trực thuộc Trung ương Một thành phần quan trọng để tính CPI là quyền
Trang 12số Quyền số tính chỉ số giá tiêu dùng được sử dụng cố định trong 5 năm và tính chonăm gốc so sánh (đồng nhất với năm cập nhật danh mục mặt hàng, dịch vụ đạidiện) Trong thời kỳ 2006-2010 năm gốc so sánh là năm 2005, do đó giá kỳ gốctheo danh mục mặt hàng, dịch vụ đại diện mới, quyền số để tính chỉ số giá tiêu dùngđều phải là số liệu của năm 2005.
Quyền số năm 2005 được tổng hợp từ kết quả cuộc điều tra mức sống dân cưnăm 2004 của Tổng cục Thống kê Ngoài ra, năm 2005 Tổng cục Thống kê đã tiếnhành điều tra mẫu bổ sung tại 10 tỉnh, thành phố để phân chia các nhóm chi tiêu nhỏhơn theo yêu cầu tính chỉ số giá tiêu dùng
Trong điều kiện về vật chất, kỹ thuật, nguồn kinh phí hiện nay và cũng phùhợp với phương pháp của nhiều nước, Chỉ số giá tiêu dùng ở nước ta được tính theocông thức Laspeyres - với quyền số và giá kỳ gốc là năm 2005 và sẽ cố định khoảng
i
i i
n i
i
t i t
p
p q
p
q p I
0 i
1
0 0 1
i i
q p
q p
1
0 0
0 0 0
i
W
Trang 13Công thức (1.1) tính CPI dài hạn (kỳ báo cáo so với kỳ gốc) Công thức này đãđược áp dụng nhiều năm và có nhiều ưu điểm như cách tính dễ hiểu, ngắn gọnnhưng cũng có một số nhược điểm khi giải quyết vấn đề chọn mặt hàng mới thaythế mặt hàng cũ không còn bán trên thị trường, hàng thời vụ hoặc hàng thay đổichất lượng do mọi so sánh đều phải thông quan một kỳ gốc đã chọn (ví dụ kỳ gốc
2000, kỳ gốc 2005, …)
Để khắc phục những nhược điểm trên, hiện nay CPI được tính theo công thứcLaspeyres chuyển đổi - hay phương pháp so sánh với kỳ gốc ngắn hạn Công thứcnày hoàn toàn tương thích với công thức Laspeyres gốc Dạng tổng quát như sau:
i
t
p
p W
i
t i i
t i
p
p W
W
Chú ý: Điểm mới trong công thức (1.2) là thay cho việc tính chỉ số cá thể mặthàng kỳ báo cáo so trực tiếp với kỳ gốc bằng việc tính chỉ số cá thể mặt hàng kỳ báocáo so với kỳ trước sau đó nhân với chỉ số cá thể mặt hàng đó ở kỳ trước so với nămgốc
1 2
1 1
2 0
i
t i i
i i
i i
t i
p
p p
p p
p p
p p
p
Đẳng thức trên có thể viết như sau:
1 0
Công thức (1.2) có thể viết như sau:
Trang 14t pi i
I
1
1 0
1 0
Thu thập giá bán lẻ của các mặt hàng và dịch vụ đại diện
Tính giá bình quân hàng tháng theo từng khu vực (thành thị, nông thôn)của các tỉnh thành phố
Tính chỉ số giá cấp tỉnh/thành phố theo từng khu vực thành thị, nông thôn
và chung cả tỉnh
Tính chỉ số giá cả nước theo từng khu vực thành thị, nông thôn và chung cảnước
- Tính chỉ số giá các vùng kinh tế: Tính CPI khu vực nông thôn và thành thị
của các vùng (8 vùng) từ báo cáo CPI khu vực nông thôn và thành thị củacác tỉnh trong vùng, sau đó tính CPI vùng chung cho cả hai khu vực (8vùng)
- Tính chỉ số giá cả nước: Tính CPI khu vực nông thôn và thành thị cả nước từ
CPI khu vực nông thôn và thành thị của 8 vùng, sau đó tính chỉ số giá chung
cả nước từ chỉ số giá của hai khu vực
Công thức tổng quát như sau:
k t
k t
V
W
W I
0 0 0
*
(1.5)
Trang 15k: Là tỉnh tham gia tính chỉ số, m là sô tỉnh tham gia tính chỉ số giá;
1.5 Quy trình thực hiện dự báo
Dự báo là một quá trình khá phức tạp, về cơ bản nó sẽ được tiến hành theo cácbước như sơ đồ sau (hình 1.1) [8]:
5 Trình bày kết quả dự báo
6 Theo dõi kết quả dự báo
Kết thúc
Trang 16Bước 1: Lập kế hoạch
Khâu đầu tiên trong quy trình dự báo là lập kế hoạch Khi lập kế hoạch thìviệc trước tiên là xác định mục tiêu Xác định mục tiêu là xác định xem kết quả dựbáo sẽ được sử dụng như thế nào Mục tiêu chung của dự báo là để lập kế hoạch và
có những quyết định hành động hợp lý Mục tiêu của dự báo Chỉ số giá tiêu dùng làgiúp chính phủ, các doanh nghiệp và các cá nhân có được tầm nhìn và quyết sáchhợp lý trong việc đề ra các định hướng phát triển đất nước, trong kinh doanh vàtrong chi tiêu cho cuộc sống hàng ngày Khi các mục tiêu tổng quát đã rõ, ta phảixác định xem cần phải dự báo những thông tin gì Trong khuôn khổ luận văn này,nội dung dự báo ở đây là các thông số về Chỉ số giá tiêu dùng bao gồm: Lươngthực, thực phẩm; Đồ ướng và thuốc lá; May mặc, giầy dép, mũ nón; Nhà ở và vậtliêu xây dựng; Thiết bị và đồ dùng gia đình; Dược phẩm, y tế; Phương tiện đi lại,bưu điện; Giáo dục; Văn hoá, thể thao, giải trí; Hàng hoá và dịch vụ khác; Chỉ sốgiá vàng; Chỉ số giá đô la Mỹ Cũng nằm trong bước lập kế hoạch, ta cần xác địnhkhoảng thời gian dự báo là gì Với bài toán dự báo Chỉ số giá tiêu dùng, ta tiến hành
dự báo Chỉ số giá tiêu dùng của tháng sau tháng hiện tại Ta cũng có thể dự báo chỉ
số giá tiêu dùng của quý kế tiếp hoặc dự báo chỉ số giá tiêu dùng của năm tiếp
Bước 2: Thu thập dự liệu
Bước tiếp theo trong quy trình dự báo là thu thập số liệu Hình dưới mô tảtừng bước trong quá trình thu thập số liệu:
Hình 1.2: Quá trình thu thập số liệu.
Dữ liệu có thể thu thập từ các nguồn dữ liệu Sau đó dữ liệu này có thể tổnghợp và phân loại nếu đó là các dữ liệu có các đặc trưng cho từng ứng dụng [6] Tiếptheo, dữ liệu được xử lý để làm đầu vào cho bộ phận dự báo
Số liệu từ
các nguồn
dư liệu
Thu thập, phân loại và
xử lý số liệu
Dữ liệu đầu vào
Trang 17Bước 3: Lựa chọn mô hình dự báo
Việc quyết định xem mô hình dự báo nào là thích hợp liên quan đến nhiềuyếu tố: Dữ liệu đầu vào, các yêu cầu về thời gian, yêu cầu về kết quả đầu ra, tàinguyên sẵn có, … Tuy nhiên, quy trình lựa chọn mô hình dự báo có thể được mô tanhư hình 1.3
Chiến lược dự báo:
- Tiền định (Deterministic): Dựa trên mối quan hệ mật thiết giữa hiện tại vàtương lai Các mô hình Time Series thích hợp với chiến lược này
- Triệu chứng (Symptomatic): Dựa trên những dấu hiệu hiện tại để dự báo chotương lai
- Hệ thống (Systematic): Dựa trên ý tưởng cho rằng xu hướng phát triển trongtương lai sẽ tuân thủ theo một quy tắc nào đó, chẳng hạn các lý thuyết vềkinh tế - xã hội
Hình 1.3: Qua trình lựa chọn mô hình dự báo.
Bước 4: Tiến hành dự báo
Sau khi đã lập xong kế hoạch dự báo, chuẩn bị đầy đủ dữ liệu dự báo cũngnhư lựa chọn được mô hình dự báo phù hợp ta tiến hành dự báo dựa trên dữ liệu và
Vấn đề dự báo cụ thể
Các tổ chức
dự báo hiện thời
Chiến lược
dự báo
Tính chất chung của
mô hình
Yêu cầu về thời gian
Yêu cầu về kết quả đầu ra
Tài nguyên
Lớp các mô
hình sơ bộ
Các điều kiện đầu vào
Tập các mô hình sơ bộ được chọn
Các mô hình được chọn lựa
Trang 18Bước 5: Trình bày kết quả dự báo
Khi dự báo thành công thì công việc tiếp theo là tìm cách trình bày kết quả
dự báo đó một cách hợp lý Có nhiều cách trình bày kết quả dự báo như: Có thểthông qua bảng biểu, đồ thị hay hình ảnh minh họa, có thể trình bày ở dạng viếthoặc dạng nói, trình bày tại một vị trí hay trên các phương tiện thông tin đại chúng,
… Dù bằng cách này hay cách khác thì những kết quả dự báo phải đảm bảo ngắnngọn, rõ ràng, thể hiện được sự tin cậy của dự báo và phải bằng ngôn ngữ mà ngườinghe hiểu được
Bước 6: Theo dõi kết quả dự báo
Khi đã thu được kết quả dự báo thì cần phải theo dõi sự đáng tin cậy của kếtquả dự báo này Muốn làm được điều đó cần tính độ lệch giữa giá trị dự báo với giátrị thực và phải thống nhất được sự sai lệch trong phạm vi cho phép Độ sai lệchgiữa kết quả dự báo và số liệu thực là bao nhiêu thì phụ thuộc vào sự thống nhấtgiữa người sử dụng và người xây dựng chương trình dự báo Đây là công việc rấtquan trọng khi tiến hàng xây dựng bài toán dự báo
1.6 Đánh giá hiệu quả của mô hình dự báo [10]
Một mô hình có thể khớp rất tốt với các số liệu quá khứ Tuy nhiên, khi sốliệu dự báo thật so sánh với số liệu tương lai mà không được dùng cho việc khớp đểlấy tham số thì kết quả rất khác nhau Vì thế, việc so sánh các giá trị dự báo với dữliệu thật sẽ cho hiệu quả của mô hình và kết quả dự báo
Thường chúng ta không thể đợi cho đến khi có số liệu tương lai để so sánh,đánh giá dự báo Cách tốt nhất là bỏ lại một số dữ liệu cuối cùng của chuỗi dữ liệu
được để dành và T dữ liệu còn lại được đưa vào mô hình để dự báo Thông thường
dự báo trước một bước (one step ahead) được so sánh với giá trị thực Sai số dự báotrước một bước sẽ là:
1
− + +
Trang 19e p
i
y n
SSE n
1.7 Phương pháp dự báo với mạng nơron
Bài toán dự báo có nhiều phương pháp giải quyết khác nhau, không cóphương pháp nào tốt nhất cho mọi bài toán Mỗi phương pháp dự báo đều có ưuđiểm và nhược điểm riêng, vì thế việc lựa chọn phương pháp nào để thực hiện tuỳthuộc vào từng bài toán cụ thể Đối với bài toán dự báo Chỉ số giá tiêu dùng, luậnvăn này nghiên cứu phương pháp dựa trên mạng nơron
Trang 20Về lý thuyết, các mạng nơron và các hệ thống mờ là các hệ thống tươngđương theo nghĩa chúng có khả năng chuyển đổi được Tuy nhiên trong thực tế, mỗi
hệ thống lại có những ưu nhược điểm riêng
Mạng nơron là các bộ xấp xỉ đa năng, chúng có lợi điểm so với các cách tiếpcận truyền thống là không yêu cầu dữ liệu đầy đủ Mạng nơron thích hợp với nhữngbài toán ở đó các mối quan hệ giữa dữ liệu rất biến động không tuyến tính, hay sựđộc lập các biến,
Tóm lại, mạng nơron có những ưu điểm sau: Có thể xấp xỉ một hệ phi tuyếnđộng với độ chính xác bất kỳ; có khả năng miễn nhiễu và khả năng dung sai cao,chẳng hạn mạng có thể nhận các dữ liệu bị sai lệch hoặc không đầy đủ mà vẫn hoạtđộng được; có khả năng thích ứng, mạng có thể học và điều chỉnh trong quá trìnhhoạt động, đây là điểm đáng chú ý nhất của mạng nơron trong ứng dụng dự báo, đặcđiểm này của mạng cho phép ta hi vọng xây dựng được một hệ có thể học tập đểnâng cao khả năng phân tích và dự báo trong khi hoạt động Ngoài ra, mạng nơroncòn có khả năng tổng quát hoá tốt phần lớn mạng
1.8 Kết luận
Với những ước muốn biết trước điều gì sẽ xảy ra trong tương lai của conngười để có những biện pháp xử lý, ứng phó thích hợp nhằm tránh được những khókhăn, rủi ro và vượt qua những khó khăn đó, bài toán dự báo là bài toán rất quantrọng Đối với mỗi quốc gia, sự pháp triển kinh tế của họ gắn liền với cuộc sốngtương lai Kinh tế chậm phát triển thậm trí suy thoát hay khủng hoảng sẽ dẫn tới sựtụt hậu, khó khăn và trì trệ trong cuộc sống Nhằm chống lại những khó khăn vàlàm giảm nguy cơ lạm phát cũng như sự khủng hoảng của các nền kinh tế thì bàitoán nhận biết hay dự báo trước chỉ số giá tiêu dùng là bài toán vô cùng quan trọng
Để giải quyết bài toán dự báo có nhiều phương pháp khác nhau đã được sửdụng Tuy nhiên, với những thế mạnh của mạng nơron thì phương pháp ứng dụngmạng nơron trong dự báo thể hiện nhiều ưu điểm Hơn nữa, khi ứng dụng mạngnơron để dự báo người ta còn có thể kết hợp nó với lôgic mờ trong qua trình xử lý
dữ liệu nhằm mang lại kết quả dự báo chính xác hơn
Trang 21Trong khuôn khổ luận văn này, hướng ứng dụng mạng nơron và mạng nơron
mờ cho mô hình dự báo được thể hiện và có ứng dụng cụ thể cho việc dự báo Chỉ sốgiá tiêu dùng của Việt Nam theo tháng, theo quý và theo năm
Trang 22CHƯƠNG 2: MẠNG NƠRON NHÂN TẠO
Ở Việt nam, mạng nơron được chú ý nghiên cứu từ những năm 1980, nó đivào ứng dụng trong các lĩnh vực tin học, điện tử viễn thông, đo lường điều khiển, Một số chíp nơron đã được sử dụng trong kỹ thuật lọc và một số ứng dụng khác.Mạng nơron nhân tạo có khả năng giải quyết nhiều bài toán mà con người cóthể giải quyết được, ví dụ như nhận dạng, dự báo, chuẩn đoán bệnh, nghiên cứukhách hàng, kiểm tra độ tin cậy của máy móc, quản lý rủi ro và hỗ trợ việc ra quyếtđịnh,
Để có thể bắt chước được sự thông minh của con người, vấn đề đặt ra là phảixây dựng được các mô hình tính toán mô phỏng được các hoạt động của bộ nãongười Mạng nơron là một mô hình như vậy
Như vậy, cơ sở xây dựng mạng nơron nhân tạo chính là cố gắng mô phỏng lạicác quá trình diễn ra trong các nơron sinh học nên trước khi tìm hiểu về mạng nơronnhân tạo chúng ta tìm hiểu cơ chế hoạt động của nơron sinh học
2.1.2 Các nơron sinh học và bộ não con người
2.1.2.1 Nơron sinh học
Nơron sinh học có nhiều dạng khác nhau như dạng hình tháp, dạng tổ ong,dạng rễ cây Tuy khác nhau về hình dạng, nhưng chúng có cấu trúc và nguyên lýhoạt động chung Một tế bào nơron gồm bốn phần như hình vẽ 2.1 dưới đây
Trang 23Hình 2.1: Cấu trúc Nơron sinh học
Các nhánh và rễ: Các nhánh và rễ là các bộ phận nhận thông tin, các đầy
nhạy hoặc đầu ra của các nơron khác bám vào rễ hoặc nhánh của một nơron Khi
độ bên trong của nó thì xảy ra hiện tượng thấm từ ngoài vào trong thông qua một cơchế màng thấm đặc điểm Hiện tượng thẩm thấu như vậy nên tạo một cơ chế truyềnđạt thông tin với hàng nghìn hàng vạn liên kết khác nhau Mức độ thẩm thấu đượcđặc trưng bởi cơ chế màng tượng trưng bằng một tỷ lệ Tỷ lệ đó được gọi là tỷ trọng
hay đơn giản gọi là trọng số.
Thân thần kinh (Soma): Thân thần kinh chứa các nhân và cơ quan tổng hợp
protein Các ion vào được tổng hợp và biến đổi Khi nồng độ các ion đạt đến mộtgiá trị nhất định, xảy ra quá trình phát xung (hay kích thích) Xung đó được phát ởcác đầu ra của nơron Dây dẫn đầu ra xung được gọi là dây thần kinh
Dây thần kinh (Axon): Dây thần kinh là đầu ra Đó là phương tiện truyền
dẫn tín hiệu Dây thần kinh được cấu tạo gồm các đốt và có thể dài từ vài micro métđến vài mét tuỳ từng kết cấu cụ thể Đầu ra này có thể truyền tín hiệu đến các nơronkhác
Khớp thần kinh (Synape): Khớp thần kinh là bộ phận tiếp xuc của đầu ra
nơron với rễ, nhánh của các nơron khác Chúng có cấu trúc màng đặc biệt để tiếpnhận các tín hiệu khi có sự chênh lệch về nồng độ ion giữa bên trong và bên ngoài.Nếu độ lệch về nồng độ càng lớn thì việc truyền các ion càng nhiều và ngược lại
Thân (soma)
Nhánh
đầu ra
Dây thần kinh (axon)
Đầu vàosynape
Trang 24Mức độ thẩm thấu của các ion có thể coi là một đại lượng thay đổi tuỳ thuộc vàonồng độ.
2.1.2.2 Bộ não người
Hình 2.2: Các đường thị giác của bộ não
Mắt cảm nhận ánh sáng xung quanh chúng ta và chuyền chúng thành cácxung điện, sau đó đưa về bộ nhớ qua các dây thần kinh Tại phía sau của mắt, mộtlưới dây thần kinh từ giác mạc tạo thành các dây thần kinh cảm quang Hai lưới dây
thần kinh cảm quang gặp nhau tại một miền có tên là giao thoa thị giác (optic
chiasm) Tại miền này hai dây tạo thành một lưới, và được chia làm hai vùng cảmquang đi tới bên trái và bên phải của não Tất cả các miền này mang tín hiệu từ haimắt và não tổng hợp được hình ảnh thực sự
Vùng của não cho các đáp ứng của hình ảnh gọi là vỏ não thị giác (hình 2.2).
Nếu mỗi vùng của não nhận được hai hình ảnh của vật thể, mỗi ảnh lấy từ một mắtvới một góc nhìn khác nhau nhỏ thì kết quả ta sẽ nhận được một hình ảnh ba chiềuhay còn gọi là hình ảnh nổi Tại não, một số khổng lồ các liên lạc của các tế bàothần kinh tạo ra xử lý thông tin
Trang 25Hình 2.3: Sơ đồ đơn giản hoá của tế bào thần kinh
Hình 2.3 là một sơ đồ đơn giản hoá của tế bào thần kinh Nó bao gồm một tếbào (soma) với dây thần kinh vào (dendrites) và dây thần kinh ra (axons) Các dâythần kinh vào nhận các tín hiệu kích thích hoặc các tín hiệu kiềm chế Các tín hiệukích thích làm tăng và các tín hiệu kiềm chế làm chậm khả năng phát tín hiệu củathần kinh Các dây thần kinh đưa ra tín hiệu đến một tế bào khác Thông tin đượcchuyển qua các hình hành cuối khớp thần kinh (synaptic -end bulbs) và nhận bởidây thần kinh vào thông qua vùng chuyển tiếp Hình hành cuối khớp thần kinh vàvùng chuyển tiếp được chia ra bằng một lỗ hở vào khoảng một phần triệu inch, vàchuyển tiếp tín hiệu qua lỗ hổng này bởi cơ chế hoá điện (hình 2.4) Phần cuối hành
và miền chuyển tiếp được gọi là khớp thần kinh (synapse) Tín hiệu đi trong dây
thần kinh vào và dây thần kinh ra như một dòng điện
Có rất nhiều kiểu dây thần kinh trong não và một số lớn các tế bào trạng thái
và chức năng Một số hạn chế các xung mà có khả năg làm quá tải mạch cảm biến.Một số đưa tin tức tổng hợp đến bề mặt não, một số khác nhận tín hiệu đưa vào
Dây thần kinh vào
(dendrites)
Dây thần kinh ra
(Axon branch)
Tế bào
(soma) Dây thần kinh vào
Tế bào
Trang 26mở các tuyến tiếp nhận cho phép các ion natri đi vào trong tâm tế bào và tạo raxung điện trong tâm tế bào làm mở các ion kali đi ra Dòng của các ion kích thíchcác mang của tâm tế bào và tạo ra xung điện trong tế bào trung tâm.
Phần lớn các quá trình xử lý thông tin đều xảy ra trên vỏ não Toàn bộ vỏnão được bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với đườngkính khoảng 0,5 mm, độ cao 4 mm Mỗi đơn vị cơ sở này chứa khoảng 2000 nơron
Người ta chỉ ra rằng mỗi vùng não có những chức năng nhất định Điều rấtđáng ngạc nhiên chính là các nơron rất đơn giản trong cơ chế làm việc, nhưng mạngcác nơron liên kết với nhau lại có khả năng tính toán, suy nghĩ, ghi nhớ và điềukhiển Có thể điểm qua những chức năng cơ bản của bộ não như sau:
- Bộ nhớ được tổ chức theo các bó thông tin và truy nhập theo nội dung (cóthể truy xuất thông tin dựa theo giá trị các thuộc tính của đối tượng)
Dây thần kinh ra
(Axon)
Túi khớp thần kinh
(Synaptic vesicles)
Trang 27- Bộ não có khả năng tổng quát hoá, có thể truy xuất các tri thức hay các mốiliên kết chung của các đối tượng tương ứng với một khái niệm chung nào đó.
- Bộ não có khả năng dung thứ lỗi theo nghĩa có thể điều chỉnh hoặc tiếp tụcthực hiện ngay khi có những sai lệch do thông tin bị thiếu hoặc không chính xác.Ngoài ra, bộ não còn có thể phát hiện và phục hồi các thông tin bị mất dựa trên sựtương tự giữa các đối tượng
- Bộ não có khả năng xuống cấp và thay thế dần dần Khi có những trục trặctại các vùng não (do bệnh, chấn thương) hoặc bắt gặp những thông tin hoàn toànmới lạ, bộ não vẫn có thể tiếp tục làm việc
- Bộ não có khả năng học và thích nghi với môi trường
nối thần kinh
Dễ dàng thấy rằng bộ não con người có thể lưu giữ nhiều thông tin hơn cácmáy tính hiện đại tuy rằng điều này không phải đúng mãi, bởi lẽ bộ não tiến hoáchậm, trong khi đó nhờ những tiến bộ trong công nghệ vi điện tử, bộ nhớ máy tínhđược nâng cấp rất nhanh Hơn nữa, sự hơn kém về bộ nhớ trở nên hoàn toàn thứ yếu
so với sự khác biệt về tốc độ tính toán và khả năng xử ký song song Các bộ vi xử lý
khoảng vài minigiây để kích hoạt Tuy nhiên bộ não có thể kích hoạt hầu như cùngmột lúc tại rất nhiều nơron và khớp nối, trong khi đó ngay cả máy tính hiện đạicũng chỉ có một số hạn chế các bộ vi xử lý song song Nếu chạy một mạng nơronnhân tạo trên máy tính, phải tốn hàng trăm lệnh máy tính để kiểm tra một nơron có
bộ vi xử lý có thể tính toán nhanh hơn hàng triệu lần so với các nơron bộ não,nhưng xét tổng thể bộ não lại tính toán nhanh hơn hàng tỷ lần
Trang 28Cách tiếp cận mạng nơron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo
ra các thiết bị có thể kết hợp khả năng song song cao của bộ não với tốc độ tính toáncao của máy tính Tuy vậy, cần phải có một khoảng thời gian dài nữa để các mạngnơron nhân tạo có thể mô phỏng được các hành vi sáng tạo của bộ não con người.Chẳng hạn, bộ não có thể thực hiện một nhiệm vụ khá phức tạp như nhận ra khuônmặt người quen sau không quá 1 giây trong khi đó một máy tính tuần tự phải thựchiện hàng tỷ phép tính (khoảng 10 giây) để thực hiện cùng thao tác đó, nhưng vớichất lượng kém hơn nhiều, đặc biệt trong trường hợp thông tin không chính xác,không đầy đủ
2.1.3 Mô hình mạng nơron nhân tạo
Trên cơ sở mô hình nơron sinh học tổng quát, người ta đề xuất mô hình nơronnhân tạo Mô hình nơron nhân tạo được xây dựng từ ba thành phần chính: Bộ tổngcác liên kết đầu vào, động học tuyến tính, bộ phi tuyến (hình 2.5) [5]
Hình 2.5: Mô hình Nơron nhân tạo
Để mô phỏng một nơron ta có thể coi nó như một hệ thống nhiều đầu vào vàmột đầu ra [10] (xem hình 2.5)
Trang 29v(t): Tổng tất cả các đầu vào mô tả toàn bộ thế năng tác động ở thân nơron.
x k (t): Các đầu vào ngoài, k=1,2,…,m; m: là số lượng đầu vào mô tả tín hiệu
vào từ các đầu nhạy thần kinh hoặc từ các nơron khác đưa vào
w k : Trọng số liên kết vào ngoài, là hệ số mô tả mức độ liên kết giữa các đầu
vào ngoài tới nơron hiện tại; k=1,…,m; m là số đầu vào.
y(t): Đầu ra nơron mô tả tín hiệu đưa ra.
hay ức chế
Phần động học tuyến tính:
Đầu vào của phần động học là v(t) Đầu ra của nó u(t) gọi là đầu ra tương tự.
Hàm truyền tương ứng của phần động học tuyến tính có thể mô tả dưới dạng:
U(s) = H(s).V(s) (2.2) Hay H(s) = ( )
( )s V
s U
(2.3)Dưới đây là bảng liệt kê một số hàm truyền thương được dùng cho phần tửđộng học tuyến tính
)(
t v dt
t
du = ( ) u(t) v(t)
dt
t du
Bảng 2.1: Một số hàm H(s) thường dùng cho mô hình nơron nhân tạo.
Các hàm phi tuyến:
Phần này sử dụng hàm quan hệ phi tuyến f(.) cho đầu ra y, để chặn tín hiệu ở
đầu ra Các hàm đầu ra thông thường là các hàm có giới hạn ngưỡng phù hợp vớiđặc điểm đầu ra Các hàm đầu ra của nơron sinh học Hàm dạng này thường gọi làhàm kích hoạt (activation) thể hiện đặc điểm kích hoạt hay ức chế của một nơron
1
) ) ( ( )) (
Với u(t) = v(t) ở (2.1).
Hàm phi tuyến ở đây được chia thành hai nhóm:
Nhóm hàm bước nhảy
Trang 30 Mạng nơron là một mô hình toán học dựa trên cấu trúc nơron sinh học.
Mạng nơron gồm một số lượng lớn các nơron được kết nối qua lại chặt chẽ
Các đáp ứng của mạng nơron thể hiện khả năng tính toán lớn
Một nơron có thể đáp ứng theo kích thích đầu vào của nó và đáp ứng hoàntoàn phụ thuộc vào các thông số bên trong của nơron đó
Mạng nơron có khả năng học, có khả năng nhớ và tổng quát hoá từ các dữliệu đã học bằng cách điều chỉnh các trọng số đầu vào
Do các đặc trưng trên nên mạng nơron nhân tạo còn được gọi là mô hình xử lýphân tán song song hoặc mô hình tự cấu trúc hoặc hệ thống Neuromorphic Nhờkhả năng xử lý song song nên khả năng tính toán của mạng nơron nhanh hơn tốc độtính toán của máy tính Bởi vì, dù tốc độ tính toán của mỗi nơron rất chậm nhưngmạng nơron tính toán song song cho nên chỉ cần qua một số chu kỳ tính của nơronthì mạng đã cho kết quả của phép tính một hàm số phi tuyến phức tạp bất kì Đây là
ưu điểm quan trọng để ứng dụng mạng nơron trong các hệ xử lý, tính toán
<
≥
0 x if 0
0 x if 1
Hàm dấu (sgn)
x
f 1 0
f
Trang 310 x if 1
1 x 1 - if 0
0 x if 1
1
2
− + e−λx
Bảng 2.2: Một số hàm phi tuyến được sử dụng trong các mô hình nơron.
2.1.4 Phân loại cấu trúc mạng nơron nhân tạo
Cũng như các nơron sinh học, các nơron nhân tạo có thể liên kết với nhau đểtạo thành mạng nơron nhân tạo Có nhiều các liên kết các nơron nhân tạo thànhmạng, mỗi cách liên kết cho một loại mạng nơron nhân tạo khác nhau Có nhiềucách để phân loại các lớp mạng, dựa vào các cách phân loại ta có các loại mạngkhác nhau
Dựa vào số lớp có trong mạng:
- Mạng một lớp là tập hợp các phần tử nơron có đầu vào và đầu ra trên mỗimột phần tử Nếu mạng nói các đầu ra của phần tử này với đầu vào của phần tử kígọi là mạng liên kết (autoassociative)
- Mạng nhiều lớp gồm một lớp đầu vào và một lớp đầu ra riêng biệt Các lớpnằm giữa lớp đầu vào và lớp đầu ra gọi là các lớp ẩn (hidden layers)
Dựa vào đường truyền tín hiệu trong mạng:
- Mạng truyền thẳng là mạng hai hay nhiều lớp mà quá trình truyền tín hiệu từđầu ra lớp này đến đầu vào lớp kia theo một hướng
- Mạng phản hồi là mạng trong đó một hoặc nhiều đầu ra của các phần tử lớpsau truyền ngược tới đầu vào lớp trước
x
f 1
-1
x
f 1
-1
x f
Trang 32- Mạng tự tổ chức là mạng có khả năng sử dụng những kinh nghiệm quá khứ
để thích ứng với những biến đổi của môi trường (không dự báo trước) Loại mạngnày thuộc nhóm tự học, thích nghi không cần có tín hiệu chỉ đạo từ ngoài
Trong mỗi lớp mạng lại có nhiều mạng với các tên gọi và các đặc trưng khácnhau Một số mô hình mạng nơron cơ bản được mô tả trong hình 2.6
Trang 33Hình 2.6: Năm mô hình kết nối mạng cơ bản:
(a): Mạng truyền thẳng một lớp.
(b): Mạng truyền thẳng nhiều lớp.
(c): Nơron tự phản hồ.i (d): Mạng phản hồi một lớp.
(e): Mạng phản hồi nhiều lớp.
Như vậy, mạng nơron nhân tạo có cấu trúc khác nhau tuỳ theo số lớp, số phần
tử trong mỗi lớp và cách tổ chức
2.1.5 Các hình thức học của mạng nơron
Mạng nơron xây dựng theo kiến trúc máy tính chỉ mới giải quyết về phầncứng Do đó, để mạng hoạt động được thì mạng phải được dạy học Luật chia làmhai loại:
Học theo cấu trúc: Sử dụng các luật biến đổi để tăng hoặc giảm số lớp nơron,
thêm hoặc bớt các phần tử nơron Tức là xác định số lớp và số nơron trong mỗi lớp
Học theo tham số: Học để chỉnh các giá trị trọng số, đảm bảo cho đầu ra
mong muốn trên cơ sở các đầu vào hoặc đầu ra Tức là xác định tham số của hàm
Bản thân hai hình thức học trên lại chia thành ba kiểu: học có thầy (giám sát),học không có thầy (không có giám sát) và học củng cố (được biểu diễn trong hình2.7)
Phân loại theo tiêu chí khác ta có:
- Học có giám sát: Có yêu cầu giá trị của đầu ra (đầu ra mong muốn) để so
sánh với đầu ra tính toán
- Học củng cố: Có yêu cầu giá trị đầu ra, nhưng không chi tiết (ví dụ đầu ra chỉ
được đánh giá từ “đúng/sai” hoặc “được/không”)
- Học không giám sát: Không yêu cầu giá trị đầu ra.
) ( )
Wi = η
Trang 34Hình 2.7: Các luật học
(a): Học có giám sát; (b): Học củng cố; (c): Học không giám sát
Nếu coi cấu trúc mô hình mạng là phần xương thịt là thể xác của mạng nơronthì các luật học là phần trí tuệ thông minh của mạng nơron chính vì vậy các côngtrình nghiên cứu luật học đã chiếm số lượng lớn trong mấy chục thập kỷ qua
2.1.6 Một số phương pháp huấn luyện mạng nơron nhân tạo
2.1.6.1 Luật học Hebbian
Luật học Hebbian là luật học đơn giản tín hiệu r được xác định thông qua các
nơron đầu ra [17] Chúng ta có:
) W
yđầu ra thực
Tạo tín hiệu đánh giá
yđầu ra thực
Tín hiệu củng cố
x
đầu vào
tín hiệu củng cố
(a)
Mạng Nơronw
Tạo tín hiệu lỗi
yđầu ra thực
dđầu ramong muốn
x
đầu vào
tín hiệu lỗi
Trang 35Đối với mỗi thành phần ∆W ij hiệu chỉnh một lượng xác định bởi:
j
T
i x x W
ij co x
W =
Luật học Hebbian được mô phỏng như hình vẽ 2.8 dưới đây
Hình 2.8: Minh hoạ luật học Hebbian
Đây là hình thức học không thầy Luật học này yêu cầu các trọng số khởi tạobằng 0
2.1.6.2 Luật học Perceptron
Đối với luật học Perceptron, tín hiệu học là sự khác giữa giá trị đầu ra mongmuốn và đầu ra thực tế (Rosenbaltt 1958) Như vậy, ở đây là học có thầy và tín hiệuhọc tương đương với:
)(d i O i
i i
T i i
Trang 36Nếu dữ liệu vào, ra dạng nhị phân lưỡng cực thì chúng ta có thể viết lại côngthức (2.10a) dưới dạng đơn giản như sau:
ra ở dạng lưỡng cực trong trường hợp khác nó không còn đúng
Hình 2.9: Minh hoạ luật học Perceptron.
Sự hiệu chỉnh trọng số sẽ kết thúc khi đầu ra thực trung với đầu ra mongmuốn Luật học Perceptron là luật học quan trọng của học giám sát Các trọng số sẽđược khởi tạo với giá trị bất kỳ Mạng sẽ hội tụ sau một số hữu hạn phép lặp
Ưu điểm lớn nhất của Luật học Perceptron là tính đơn giản của luật học, trongtrường hợp dữ liệu học được chuẩn hoá về dạng nhị phân lưỡng cực thì luật học rấttrong sáng xem công thức cập nhật trọng số (2.11) ở trên
2.1.6.3 Luật học Delta
Luật học Delta được giới thiệu bởi McClelland và Rumelhart năm 1986 [18].Luật học Delta là luật học với hàm kích hoạt liên tục Ở đây là học có giám sát Tínhiệu học của luật này được gọi là Delta và được xác định bởi:
[d f(w x)]f,(w x)
i
T i
i −
Neuron i
net i
Trang 37Giới hạn f(w T x)
i
luật học Delta như hình vẽ 2.10 dưới đây
d i như sau:
2)(
Hình 2.10: Minh họa luật học Delta.
Biểu thức trên có thể viết lại:
( )
12
1
x w f d
x x w f O d W
âm với E(w).
i
Trang 38x net f O d
w i = ( i − i) ,( i)
j i i
i (hình vẽ 2.11)
Hình 2.11: Hình hoạ luật học Widrow-Hoff.
Tín hiệu học đối với luật học Widrow-Hoff được xác định như sau:
w T
i i
Trang 39Trong luật học này các trọng số được khởi tạo ngẫu nhiên Luật học này cònđược gọi là luật LMS (Least Mean Square).
Do luật học Widrow-Hoff dùng phương pháp hạ gradient nên nó dễ dàngkhái quát hoá cho mạng nhiều lớp Trong một số trường hợp luật học rơi vào tình
sau một số hữu hạn bước lặp
2.1.6.5 Luật học tương quan (Correlation)
học tương quan (hình vẽ 2.12) với vector trọng số và các trọng số thành phần đượchiệu chỉnh bởi:
x d
w i =η i
j i
ij d x
w =η
Hình 2.12: Minh hoạ luật học Correclation
Đây là luật học đơn giản Luật học tương quan có thể được hiểu là trường hợp
học có giám sát Các trọng số được hiệu chỉnh dựa trên đầu ra mong muốn và đầuvào chứ không phụ thuộc vào dạng hàm kich hoạt Các trọng số được khởi tạo giátrị ban đầu bằng 0
2.1.6.6 Luật học Người thắng nhận được tất cả (Winner-Take-All)
Neuron i
y i d
i
Trang 40Luật học Winner-Take-All khác với các luật học được thảo luận ở trên Ở đây
là học không giám sát Học được sử dụng cho các thuộc tính tĩnh của đầu vào [7].Học trong một tầng cơ bản dựa trên một nơron như thể hiện ở (hình vẽ 2.13)
Hình 2.13: Minh họa luật học Winner-Take-All.
Nơron thứ i có đầu ra lớn nhất đối với vector đầu vào x Nơron này được định
chỉnh thông qua nơron chiến thắng
Như hình vẽ trên các trọng số liên kết với nơron thứ i được tô đậm nét Ở đây là họckhông giám sát Chỉ các trọng số liên kết với nơron chiến thắng sẽ được hiệu chỉnhbởi:
)( i
Nơron chiến thắng là nơron tại đó có mức kích hoạt lớn nhất các nơron trên
cùng một tầng (p là số lượng nơron trên tầng chúng ta xem xét) Chúng xác định
bởi:
p k
T i