Chương II: TRÌNH BÀY CÁC QUY TRÌNH HỌC MẠNG NƠRON
2.10 Phương pháp huấn luyện MLP (Multi Layer Perceptron)
20
Perceptron: mạng 1 lớp đầu vào và một lớp đầu ra, không có hidden layer
Mạng perceptron không thể phân loại các dữ liệu có phân tách phi tuyến (XOR function) 2.10.2 Khắc phục hạn chế của Perceptron 1 lớp
Thực tế có nhiều mạng đa lớp có thể giải quyết bài toán XOR Một lời giải:
→Thiết kế 2 neuron để tạo ra hai bao đóng
→Thêm một neuron sau đó để kết hợp hai bao đóng lại thành một (toán tử AND) 2.10.3 Mạng đa tầng
Mạng với 1 tầng ẩn có thể biểu diễn bất kỳ hàm Boolean nào
Khả năng của mạng nhiều tầng đã được khám phá từ lâu, tuy nhiên chỉ đến những năm 80 người ta mới biết cách để huấn luyện các mạng này
Mạng nhiều tầng, mỗi tầng có hàm kích hoạt tuyến tính thì vẫn chỉ có thể biểu diễn các hàm tuyến tính
Để biểu diễn các hàm phi tuyến thì các hàm kích hoạt phải là hàm phi tuyến 2.10.4 Giải thuật huấn luyện mạng MLP
Giải thuật GD được sử dụng
Tuy nhiên việc tính toán Gradient của hàm mục tiêu trên tất cả các tầng là rất phức tạp
Giải thuật Backpropagation cho một giải pháp hiệu quả và đơn giản để tính toán đạo hàm của hàm mục tiêu theo trọng số và bias ở các tầng khác nhau
CHƯƠNG 3 : CÁC ỨNG DỤNG MẠNG NƠRON
Mạng nơ ron nhân tạo được ứng dụng cho rất nhiều lĩnh vực như: tài chính, giao dịch, phân tích kinh doanh, lập kế hoạch cho doanh nghiệp và bảo trì sản phẩm. Neural
Network còn được sử dụng khá rộng rãi cho những hoạt động kinh doanh khác như: dự báo thời tiết, và tìm kiếm các giải pháp nhằm nghiên cứu tiếp thị, đánh giá rủi ro và phát hiện gian lận. Dưới đây là một số ví dụ :
Nơron vào thị trường tài chính : Chương trình dự báo hoạt động rất tốt đối với việc dự báo trong thời gian ngắn hạn, với tỉ lệ chính xác thường xuyên đạt ngưỡng trên 90%.
Chương trình hoạt động gần như chính xác khi ta muốn dự đoán được kết quả trong 1 tuần trở lại đây. Nó sẽ giúp ích rất nhiều cho nhà đầu tư đưa ra quyết định đầu tư của mình với mục đích sinh lời và hạn chế rủi ro sao cho thấp nhất. Với mô hình Neural Network này ta thấy rằng việc dự đoán giá trong thời gian ngắn thì kết quả cho ra độ chính xác cao và độ chính xác sẽ giảm dần nếu dự đoán trong khoản thời gian càng rộng. Chương trình sẽ dự đoán tương đối chính xác giá của ngày mai, hay tháng sau, và sẽ giảm dần độ chính xác nếu dự đoán theo quý, và đặc biệt chương trình không còn chính xác nữa nếu dự đoán phiên giao dịch đóng cửa cuối cùng của năm (xác suất chính xác rất thấp).
Nơron vào dự đoán giá vàng :Các thuật toán giúp xử lý nhanh chóng lượng dữ liệu khổng lồ dễ hỏng. Trên thị trường giá vàng, các điều kiện thay đổi liên tục và nhanh chóng. Điều này có nghĩa là để dự đoán các sự kiện trong tương lai trên thị trường, cần có một hệ thống đáng tin cậy và nhanh chóng. Các thuật toán cung cấp lợi ích này. Các thuật toán có thể sử
21
dụng dữ liệu được xử lý trước, giảm không gian lưu trữ dữ liệu và tăng tốc độ tính toán. Sau khi tính toán các giá trị đầu vào, ta sẽ nhận được các giá trị đầu ra. Giá trị mà ta mong muốn đã biết trước. Sự chênh lệch giữa giá trị đầu ra và giá trị mong muốn được gọi là lỗi, tức là ta sẽ lấy hai giá trị trừ cho nhau. Mục đích của việc làm trên là để tìm ra lỗi càng nhỏ càng tốt ( Nếu không có sự chênh lệch giữa hai giá trị thì là hoàn hảo) bằng cách điều chỉnh các thông số đầu vào, tiếp tục tính giá trị đẩu ra và so sánh với giá tri mong muốn, và điều chỉnh các thông số dừng phù hợp.
Nơron vào dự báo thời tiết : Thu thập dữ liệu từ các năm trước, giới hạn 4 tham số chính ảnh hưởng đến thời tiết là: nhiệt độ, độ ẩm, mây và mưa. Mỗi yếu tố có những thuộc tính và độ phụ thuộc khác nhau. Ví dụ tùy thuộc vào từng tháng mà nhiệt độ sẽ có những giá trị khác nhau.
Nếu tháng đó rơi vào mùa mưa thì nhiệt độ có thể thấp (<25.5 độ C); trung bình
(25.5 độ C–27.0 độ C), ngược lại nhiệt độ cao (>27.0 độ C)… Dựa trên các đặc điểm đó ta xây
dựng bài toán:
Với bốn yếu tố chính ảnh hưởng đến thời tiết trên, ta có thể phân chia mỗi yếu tố thành các trường hợp cụ thể như sau:
- Biến nhiệt độ (kí hiệu ND), có các khoảng giá trị: thấp nếu ND từ 0 đến 25.5;
trung bình ND từ 25.5 đến 27.0; cao ND từ 27.0 đến 45;
- Biến độ ẩm (kí hiệu ĐA):Thấp nếu ĐA từ 0 – 80; Cao nếu ĐA từ 80 - 100.
- Biến lượng mưa (kí hiệu M): Không mưa (0); Rải rác: M từ 1 đến 2; Nhỏ: M từ 3 đến 50; lớn: M từ 51 đến 1000.
- Biến lượng mây (MA). Ít nếu MA từ 0 đến 20; Nhiều: MA từ 20 đến 30; Rất nhiều nếu lượng mây lớn hơn 30.
Nơron vào dự đoán chất lượng nước đầu ra của hệ thống xử lý nước thải :
Mạng Nơron mô hình cấu trúc được sử dụng khai thác rộng rãi đề nghiên cứu, tính toán trong nhiều lĩnh vực khác nhau. Trong lĩnh vực môi trường, lý thuyết mạng nơron được dùng để tính toán và dự đoán kết quả đầu ra của hệ thống xử lý nước thải hoặc đánh giá khả năng tái sử dụng nguồn nước sau khi xử lý... Trong bài báo này tác giả muốn giới thiệu với bạn đọc mô hình mạng nơron được phát triển để tính toán và dự đoán chất lượng nước đầu ra của hệ thống xử lý nước thải Nhà máy sữa Cô gái Hà Lan. Các thông số dược quan trắc hằng ngày bao gồm: độ kiềm pH, lưu lượng Q, nhu cầu oxy hóa học COD và nồng độ chất rắn lơ lửng . Cấu trúc của mô hình mạng nơron được xác định thông qua các bước luyện và kiểm tra mô hình. Thực tế cho thấy sai số trung bình của hai chương trình không chênh lệch nhiều.
Như vậy kết quả tính toán các thông số chất lượng nước đầu ra của mô hình mạng nơron nhân tạo là chấp nhận được.