10Les points importants entre l’état de l’art et les modèles réalisés III CHAPITRE : LA CONSTRUCTION DES MODÈLES 11Les données utilisées 11.1Les types de données utilisées dans notre tra
Trang 1UNIVERSITE NATIONALE DU VIETNAM, HANOI
INSTITUT FRANCOPHONE INTERNATIONAL
APEDO KODZO SITSOFE DEGNON
DIAGNOSTIC DE PANNES DE ROBOTS MOBILES PAR "DEEP LEARNIG"
MÔ HÌNH HỌC SÂU CHO CHUẨN ĐOÁN LỖI CỦA
ROBOT DI ĐỘNG
MÉMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE
HANOI - 2018
Trang 2UNIVERSITE NATIONALE DU VIETNAM, HANOI
INSTITUT FRANCOPHONE INTERNATIONAL
APEDO KODZO SITSOFE DEGNON
DIAGNOSTIC DE PANNES DE ROBOTS MOBILES PAR "DEEP LEARNIG"
MÔ HÌNH HỌC SÂU CHO CHUẨN ĐOÁN LỖI
CỦA ROBOT DI ĐỘNG
Specialite : SYSTEMES INTELLIGENTS ET MULTIMEDIA
Code : Programme pilote
MÉMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE
Sous la direction de : Le chargé de
recherche, PhD Nicolas TRICOT
à IRSTEA Clermont-Ferrand
HANOI - 2018
Trang 3ATTESTATION SUR L’HONNEUR
J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que lesdonnées et les résultats qui y sont présentés sont exacts et n’ont jamais été publiésailleurs La source des informations citées dans ce mémoire a été bien précisée
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi
Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được aicông bố trong bất kỳ công trình nào khác Các thông tin trích dẫn trong Luận văn
đã được chỉ rõ nguồn gốc
APEDO Kodzo Sitsofe Degnon
Trang 4Le travail présenté dans ce mémoire a été réalisé au sein duLabo-ratoire Institut National de Recherche en Sciences etTechnologies pour l’Environnement et l’Agriculture (IRSTEA), sur
le Campus des Cézeaux d’Aubière
Je remercie mes Encadrants de stage, Mr Nicolas TRICOTChargé de recherche et encadrant principal, Mr Roland LENAIN chefd’équipe de ROMEA, ainsi que le Thésard Mr Mahmoud ALMASRI, quim’ont permis de faire ce stage dans une coopération plus que parfaite.Leur sou-tien, leur suivi, leur orientation, leur disponibilité et leur conance m’ont permis d’apprendre dans un cadre convivial et ayantpermis mon épa-nouissement tout au long de ce stage
J’adresse également mes remerciements à mes parents, mafamille et mes amis qui m’ont soutenu et encouragé régulièrementtout au long de ce stage
Trang 51 Introduction générale
stage
2.1 Présentation générale d’IRSTEA
2.2 Structure interne
2.3 Présentation du secteur d’accueil
2.3.1 L’unité de recherche TSCF
2.3.2 L’équipe ROMEA
I CHAPITRE : PRÉSENTATION DU PROBLÈME 3 Introduction 4 Problématique 5 Diagnostic de pannes de robots mobiles par "Deep Learning" 17 5.1 Sujet du stage
5.2 Travail demandé par le projet
II CHAPITRE : ÉTAT DE L’ART 6 Introduction à l’existant 7 Etude des articles 7.1 Les travaux réalisés sur les 71 articles 7.2 Les 16 articles retenus
7.3 Les points de sélection et de classi cation des 7 articles 7.4 Les sept articles classés
7.5 Le tableau de classement des sept articles 8 Les modèles réalisés dans les 7 articles retenus 8.1 Les Autoencodeurs
8.1.1 8.1.2 8.2 Les réseaux de croyances profondes 8.2.1 8.2.2 9 Les fonctions d’activations 9.1 La fonction tanh
9.2 La fonction Relu (Recti ed Linear Unit) 2 9.3 La fonction Sigmọde
Trang 610Les points importants entre l’état de l’art et les modèles réalisés
III CHAPITRE : LA CONSTRUCTION DES MODÈLES
11Les données utilisées
11.1Les types de données utilisées dans notre travail
11.2Descriptifs de nos variables
11.3Description de nos classes
12Les modèles de bases 12.1Le modèle basé sur l’encodeur
12.2La construction de l’encodeur
12.3Le modèle classi eur
12.4La construction du classi eur
13Les modèles découlant de l’encodeur et du classi eur 13.1Le modèle encodeur-classi eur
13.2Le modèle classi eur
14La compilation des modèles 15Ajustement de modèle IV CHAPITRE : EXPÉRIMENTATIONS ET ANALYSES 16Études de la qualité des données 16.1La quantité des données
16.2La validation croisée de nos bases
17La création et les tests sur des modèles 17.1La création des modèles
17.1.1Le modèle Encodeur-Classi eur
17.1.2Le réseau DBN
17.1.3Le réseau classi eur
17.2Les tests des réseaux
17.2.1Le test avec le reste des bases non utilisées
17.2.2Le test sur Gazebo
18Le diagnostic de la provenance des mauvais résultats 18.1Études menées sur les données
3 18.2Les douze modèles
Trang 718.3Explication et comparaison des résultats
18.3.1La base 1
18.3.2La base 2
18.3.3La base 3
18.3.4La base 4
18.3.5La base 5
18.3.6La base 6
18.3.7Conclusion tirée de la comparaison et des tests
19La nouvelle base et les nouveaux modèles 19.1Les classes perturbatrices
19.1.1Le modèle DBN
19.1.2Le modèle Encodeur_Classi eur
19.1.3Classi eur
19.2Conclusion sur les résultats des trois modèles
20Les modèles conçus avec la nouvelle base et les résultats 20.1Le modèle DBN
20.2Le modèle Encodeur_Classi eur
20.3Classi eur
20.4Conclusion sur les nouveaux modèles créés
V CHAPITRE : CONCLUSIONS ET PERSPECTIVES 21Conclusion et perspectives 21.1Conclusion
21.2Les perspectives
4
Trang 8LISTE DES FIGURES
1 Implantation géographique des diverses centres d’IRSTEA 10
2 Organigramme de IRSTEA Clermont 12
3 Les embranchements du Machine Learning 15
4 Première partie des 71 articles de l’état de l’art 19
5 Deuxième partie des 71 articles de l’état de l’art 20
6 Troisième partie des 71 articles de l’état de l’art 21
7 Quatrième partie des 71 articles de l’état de l’art 21
8 Première partie des 7 articles retenus 24
9 Deuxième partie des 7 articles retenus
10 Troisième partie des 7 articles retenus
11 Représentation d’un autoencodeur
12 Représentation d’une unité du DBN 28
13 Représentation simple de la machine de Boltzmann 29
14 Equation de la fonction TanH
15 Représentation de la fonction Tangente hyperbolique
16 Equation de la dérivée de la fonction Tangente
17 La représentation de la courbe Relu 31
18 Représentation de la fonction Sigmọde 33
19 Architecture du classi eur 46
20 Architecture de l’encodeur 46
21 Architecture du classi eur associé a l’encodeur
22 Courbe de la fonction de perte du DBN pour 7 classes
23 Courbe de la précision du DBN pour 7 classes
24 Matrice de confusion du modèle DBN pour 7 classes
25 Courbe de la fonction de perte de l’E_C pour 7 classes
26 Courbe de la fonction de précision de l’E_C pour 7 classes 50
27 Matrice de confusion du modèle E_C pour 7 classes 51
28 Courbe de la fonction de perte du classi eur pour 7 classes 51
29 Courbe de la précision du modèle classi eur pour 7 classes 51
30 Matrice de confusion du modèle classi eur pour 7 classes 51 31 Courbe de la fonction de perte du DBN pour 20 classes 52
32 Courbe de la précision du modèle DBN pour 20 classes 53
33 Matrice de confusion du modèle DBN pour 20 classes 53
34 Courbe de la fonction de perte de l’E_C pour 20 classes 54
35 Courbe de la fonction de précision de l’E_C pour 20 classes 54 36 Matrice de confusion du modèle E_C pour 20 classes 55
37 Courbe de la fonction de perte du classi eur pour 20 classes 55
38 Courbe de la précision du modèle classi eur pour 20 classes 56
Trang 95
Trang 10Le bon fonctionnement de tout appareil électronique ou mécanique repose sur une durée plus ou moins longue suivant l’utilité et l’utilisation Au cours de leur utilisation surviennent des pannes ou des dysfonctionne-ments qui peuvent dépendre d’un ou plusieurs éléments simultanément Ces pannes sont souvent constatées ou pas après dysfonctionnement ; et la détection de la cause exacte est souvent di cile Dans ce mémoire, nous décrivons comment nous avons mené nos recherches pour le diagnostic de pannes de robots mobiles grâce aux réseaux de neurones A l’aide des capteurs qui sont sur le robot, dans une simulation sur Gazebo, nous géné- rons 34 variables jugées nécessaires qui, ensemble dé nissent un état de fonctionnement du robot Nous avons au total 20 cas de fonctionnements, dont un cas d’état normal sans panne L’algorithme (encodeur), apprend les caractéristiques dans un premier temps et sa sortie est mise en entrée d’un Classi eur pour avoir les classes en sortie Ce résultat décrit l’état du robot suite aux données reçues La détection se fait en temps réel avec une très bonne précision, montrant la performance du modèle conçu.
Mots clés : Diagnostics, défauts, robots mobiles, résidus, réseaux
de neu-rones(Deep Learning), Autoencodeur(encodeur,decodeur), classi cation multi-classes et multi-label
Trang 11The proper functioning of any electronic or mechanical device is sed on a longer or shorter duration depending on the utility and use Du- ring their use there are failures or malfunctions that may depend on one
ba-or mba-ore elements simultaneously These failures are often noted ba-or not after malfunction ; and the detection of the exact cause is often di cult In this thesis, we describe how we conducted our research for the diagnosis
of mobile robot failures through neural networks Using the sensors that are on the robot, in a simulation on Gazebo, we generate 34 variables deemed necessary which together de ne a running state of the robot We have a total of 20 cases of operation, including a normal case without failure The algorithm (encoder), learns the characteristics in a rst time and its output is put in input of a Classi er to have the classes in exit This result describes the state of the robot following the received data The detection is done in real time with a very good precision, showing the performance of the model created.
Keywords : Diagnostics, defects, mobile robots, residues, neuralnetworks (Deep Learning), Autoencoder (encoder, decoder), multi-class and multi-label classi cation
Trang 121 Introduction générale
Aujourd’hui, la nécessité dans la production, dans la réalisation des tâches et le travail continu pour des rendements meilleurs qu’hier, re- présentent de grands dé s entre les défaillances des systèmes, les pannes de machines, le temps d’exécution et le seuil de la productivité.
Un dé-réglage ou un dysfonctionnement dans le comportement nominal
de ces systèmes peut conduire à des conséquences sérieuses pouvant être né-fastes pour l’humain et l’environnement De plus, le fait de résoudre ces problèmes peut s’avérer parfois très cỏteux La présence des machines ou des robots à usage domestique ou industriel ont en un point, des élé-ments communs susceptibles de rencontrer des dysfonctionnements selon l’environnement, l’impact de l’homme ou à l’usure du temps Ces dysfonc-tionnements ont des conséquences parfois irréversibles et qui engendrent des pertes et dégâts irréparables.
A n de réduire à presque rien ces dégâts ou de carrément les éviter, il est mieux de mettre en place, des moyens de surveillance du fonctionnement suivant toutes les activités menées a n de détecter le plus tơt possible des futures pannes imminentes et d’en ap-porter une correction.
Ainsi, pour toutes ces cas de pannes, il peut y avoir des cas
de sur-veillance de fonctionnement ou des défauts qui serontproches selon les méthodes à mettre en œuvre De façon plusobjective, la surveillance des pannes découle sur deux aspects :
— La mise en place de méthodes pour la détection de pannes dans un but de préserver la sécurité de l’utilisateur, préserver
le bon fonction-nement de la machine ou de l’outil
— Maintenir une productivité et un fonctionnement continus
dans les excellents états de fonctionnement pouvant être
représentés de façon linéaire
Ce mémoire divisé en 5 chapitres, se présente comme suit :
— Le premier chapitre décrit la problématique dans son ensemble,l’ob-jectif visé partant du général au particulier dans le cas qui nous concerne, les robots mobiles
— Le deuxième chapitre parle de toutes les démarches mises
en œuvres pour la réalisation du travail de recherche jusqu’à
la dé nition des solutions et méthodes choisies
— Le troisième chapitre aborde les démarches pour la
réalisation des solutions ainsi que leur mise en place
Trang 13— Le quatrième chapitre parle des di érents types de tests e ectués pour l’approbation des données utilisées et des résultats obtenus.
— En n, le dernier chapitre parle des conclusions, apports et des pers-pectives de notre travail sur toute sa démarche en montrant
en n l’utilité de nos solutions dans d’autres domaines et surtout lespossi-bilités d’application de notre solution à d’autres cas
Trang 142 Présentation du Laboratoire de recherche IRSTEA, lieu du stage2.1 Présentation générale d’IRSTEA
IRSTEA (Institut National de Recherche en Science etTechnologies pour l’Environnement et l’Agriculture) est unétablissement public à ca-ractère scienti que et technologiqueimplanté en France et reparti dans 10 centres (voir gure 1)
IRSTEA travaille sur les enjeux majeurs d’une agricultureresponsable et de l’aménagement des territoires Ce centre derecherche est divisé en trois départements dont les thèmes derecherche sont les Eaux, les Éco-technologies et les Territoires
Figure 1 – Implantation géographique des diverses centres d’IRSTEA
La stratégie de l’organisation scienti que et technique d’IRSTEA :
• 3 départements de recherche : Eaux, Territoires, Écotechnologies ;
• 4 domaines stratégiques :
— Risques naturels, sanitaires et environnementaux ;
— Bio-économie et économie circulaire des bio-ressources
et des ef-uents : des technologies aux acteurs ;
— Gestion adaptative des ressources dans les territoires sous contrainte du changement global ;
Trang 15— Biodiversité : dynamique et gestion des écosystèmes et services écosystémiques.
• 10 Axes Directeurs de Département
2.2 Structure interne
Le centre de Clermont-Ferrand, se compose de 90 agents dont 60 in-génieurs/chercheurs Le centre accueille également chaque année environ 22 doctorants et post-doctorants ainsi que 40 stagiaires de l’enseignement supérieur Il béné cie d’un budget annuel moyen de 3.56 millions d’euro Le centre dispose de deux sites : un pôle scienti que et universitaire si-tué sur le campus des Cézeaux à Aubière (63), et un site
de recherche et d’expérimentation (équipé d’une exploitation agricole et d’un atelier de prototypage mécanique) situé à Montoldre (03) Vous trouverez ci-dessous l’organigramme du Centre de Clermont-Ferrand.
Trang 16Figure 2 – Organigramme de IRSTEA Clermont
Trang 172.3 Présentation du secteur d’accueil
2.3.1 L’unité de recherche TSCF
IRSTEA est composé actuellement de 19 unités de recherchedont L’unité de recherche (UR) Technologies et Systèmesd’information pour les agrosystèmes (TSCF) Cette unité s’intéresse
à la sécurité et aux per-formances des agroéquipements a apporterdes solutions concrètes aux besoins d’une agriculture productive etécologiquement responsable Ses activités qui relèvent dudépartement Écotechnologies d’IRSTEA, sont conduites dans lecadre des thèmes de recherche « INSPIRE » et « MO-TIVE »
2.3.2 L’équipe ROMEA
Au sein de l’unité de recherche TSCF, l’équipe « Robotique et lité pour l’Environnement et L’Agriculture » (ROMEA) [réf : 2] conçoit des systèmes recon gurables et à autonomie partagée, a n d’accroître les performances et la sécurité des engins œuvrant en milieux naturels, en particulier dans l’agriculture Dirigée par Mr Roland LENAIN, cette équipe concentre ses recherches sur trois principaux axes :
Mobi-— La conception de dispositifs de sécurité, de la conception mécanique à la réalisation de dispositifs d’assistance ;
— La perception de l’environnement et la modélisation du
comporte-ment et de l’interaction d’un robot avec son utilisateur
— Le développement d’algorithmes avancés de commandes ou tance, en prenant en compte les phénomènes perturbateurs et les in- certitudes liées à l’évolution en milieux tout-terrain.
Trang 18La science des données ou Machine Learning est un vastedomaine qui se résume sur notre Figure 3 :
Dans notre cas qui fait référence directe à ce rapport, il s’agit dutraite-ment de données provenant des capteurs qui sont sur unrobot permettant de recueillir des informations sur le fonctionnement
de celui-ci en temps réel Ces données générées font l’objet de cequi suit dans ce document Le travail réalisé ici fut concentré surl’apprentissage profond (Deep Lear-ning) C’est un sous domaine duMachine Learning qui a montré sa force avec les pratiquesstatistiques et probabilistes face à toutes sortes de don-nées
Aujourd’hui, grâce au Deep Learning, l’expression Intelligence Articielle a trouvé sa dé nition dans toutes les domaines scienti ques
Trang 19Figure 3 – Les embranchements du Machine Learning
Trang 204 Problématique
L’équipe ROMEA de Clermont-Ferrand, axée sur la conception de robots mobiles à but agricole, possède plusieurs prototypes de robots des- tinés à plusieurs tâches Ces robots (Maître et Suiveur), sont destinés à suivre un humain dans ses déplacements dans un champ tout en détectant leur position, les éventuels obstacles mais aussi la personne Dans l’exé- cution de leur tâche, les robots renvoient des informations par le biais des plusieurs capteurs positionnés sur les composants du robot notamment :
— GPS;
— Les (4) roues ;
— L’Inertial Measurement Unit (IMU)
Ces capteurs renvoient des signaux numériques qui sont bien iden-ti
és selon les types d’informations Ces informations arrivent en temps réel et constituent, si elles sont stockées, une base permettant de connaître en temps réel ou di éré, les états de fonctionnement, de position , etc.
Dans les multiples tests e ectués en prototypage ou en environnementréel, force est de constater qu’il apparaît des défauts liés à plusieurscom-posantes du robot, liés à l’impact de l’environnement réel, liés ausol, lié à la détection de la position réelle, etc
Suite à des analyses et des études menées ne pouvant pas détecter toutes les causes des défauts ou tout l’exactitude des moments
ou ceux-ci surviennent, un projet a été mis au point pour la détection des pannes par rapport aux informations recueillies Ces informations appelées ré-sidus(les résidus sont des sorties d’équations de paramètres
et de com-mandes du robot), vont permettre, par plusieurs moyens de calculs statis-tiques et probabilistes, de détecter la présence de pannes dans les données Cette étude a pour objectif de trouver un ou plusieurs seuils pour lequel, les valeurs se trouvant au-dessus ou en-dessous seraient dé nies comme données précurseuses de défauts ou non ou des signes de défauts pro-venant d’un composant référencé selon le résidu in uencé Il y a eu des résultats appréciables avec quelques cas de défauts suite aux techniques utilisées notamment le ltre de KALMAN, et d’autres cas qui n’ont pas fait l’objet de détection Il fut constaté aussi que certains défauts réels ne faisaient pas actes de diagnostic par le programme existant et que des quelques rares cas de fonctionnement normaux étaient confondus à des cas de pannes.
Plusieurs expériences ont été menées dans le but du diagnostic et
de l’isolement des défauts dont l’un était le ltre de KALMAN Le ltre de
Trang 21estime les états d’un système dynamique à partir d’une série demesures incomplètes ou bruitées Le ltre de Kalman est utilisédans une large gamme de domaines technologiques (radar, visionélectronique, commu-nication .) C’est un thème majeur del’automatique et du traitement du signal.
5 Diagnostic de pannes de robots mobiles par "Deep Learning"5.1 Sujet du stage
Le développement des robots mobiles permettant de réaliser des tâches dangereuses, complexes, répétitives et/ou fastidieuses (le
déplacement d’un objet lourd d’un point à un autre par exemple) est un sujet prégnant dans les contextes agricoles et industriels Ces robots
réalisent des tâches clai-rement identi ées tout en évoluant dans un
environnement complexe et dynamique Cependant, dans certaines
situations (présence de nombreux obstacles prévus ou imprévus dans le cadre d’une tâche de suivi de trajec-toire, dysfonctionnement d’un
composant physique du robot, ), l’intel-ligence embarquée ne permet pas
de trouver de solutions permettant de mener à bien les tâches à e ectuer.
Dans l’objectif de répondre à ce genre de situation, des travaux de cherche sont en cours Leur première ambition est de dé nir une méthode de diagnostic et d’isolation de tout type de défaut pouvant apparaître sur un robot C’est dans ce contexte que ce stage s’inscrit Le Deep Learning est une méthode récente d’apprentissage automatique, basée sur des ré-seaux
re-de neurones arti ciels Elle permet d’obtenir re-des résultats probants dans re-de nombreux domaines comme la reconnaissance des formes Y Le-Cun et Al[2], la reconnaissance de paroles N Jaitly et Al[3], la reconnais-sance vocale continue T.N Sainath et Al[4], le diagnostic médical A.M Abdel et Al[5], la détection de position S Li, Z.Q Liu et Al[6] ou encore le suivi en ligne des objets Y Chen et Al[7] Certaines de ces applications ont des points communs avec le domaine du diagnostic qui nous intéresse C’est pourquoi nous pensons qu’elles pourraient donner des résultats pro- metteurs dans notre domaine.
5.2 Travail demandé par le projet
L’objectif nal de l’étude est de détecter et isoler une liste prédé nie de défauts qui pourraient se produire sur un robot mobile L’application de la méthode du Deep Learning sur des résidus générés à partir d’équations
Trang 22régissant la dynamique du robot est le cœur de cette étude Nous aurons à :
— Faire une étude bibliographique sur les di érentes architectures exis-tantes de méthodes de l’apprentissage profond ;
— Synthétiser les résultats de cette recherche et classer les architectures en fonction de leur capacité à répondre à notre problématique (appli-cation sur des équations de redondance analytique et sur les ltres de Kalman, détection de
dépassement de seuils, calculs en temps réel, ) ;
— Appliquer la(les) architecture(s) sélectionnée(s) sur les
Trang 23Nous avions fait au début de notre état de l’art, desrecherches d’ar-ticles avec des mots clés par le biais du moteur
de recherche interne a IRS-TEA appelé Sherlock, qui sert à larecherche documentaire multi-sources et qui nous a amené à uneliste exhaustive de 71 articles toutes catégories confondues
La liste a ensuite été classé, selon les termes et mots clés ayant servis.
Figure 4 – Première partie des 71 articles de l’état de l’art
Trang 24Figure 5 – Deuxième partie des 71 articles de l’état de l’art
Trang 25Figure 6 – Troisième partie des 71 articles de l’état de l’art
Figure 7 – Quatrième partie des 71 articles de l’état de l’art Suite à ces articles trouvés, lus et analysés, nous avons réduit la liste a n de ne conserver que les articles les plus intéressants, ceux-ci faisant l’objet de notre prise de position sur les solutions envisageables.
Trang 267 Etude des articles
7.1 Les travaux réalisés sur les 71 articles
Dans la lecture de chaque article, nous recherchons le plus souvent
à comprendre le résumé, identi er les mots clés, l’introduction et la conclu-sion a n de recueillir le contexte général, le but et la solution nale Cette façon de lire les articles nous a permis de voir ceux parmi lesquels
le sujet allait dans le sens de notre recherche mais dont le contenu n’est pas axé sur les mêmes idées que nos attentes Ainsi nous avons restreint
la liste à des articles pertinents, des articles qui ont fait l’objet de tests après lecture et ce via des critères comme :
— La date de publication de l’article,
— Les apparitions du nombre de mots clés dans l’article,
— Les méthodes utilisées,
— Le modèle utilisé de réseaux de neurones,
— Les modèles comparatifs
7.2 Les 16 articles retenus
Dans la phase de sélection des articles les plus pertinents, nous avions retenu une liste de 16 articles qui cadrent parfaitement avec le contexte de notre problématique Ainsi, dans l’étude complète de ces 16 articles, nous avons également fait un classement suivant les paramètres précités de sorte
à nous limiter uniquement aux 7 premiers Dans cette classi - cation, nous avons pris la décision de partir de ces articles pour orienter notre recherche
de solution qui malgré les di érences de cas de pannes entre les articles et notre problématique, nous serviraient pour avancer.
7.3 Les points de sélection et de classi cation des 7 articles
Nous avons sélectionné de nos 16 articles précédemment retenus, les 7 meilleurs articles suivant une étude et critères bien dé nis.
— La date de publication de l’article,
— Les algorithmes utilisés,
— Les types de données utilisées,
— La taille des données utilisés,
— Les résultats obtenus en matière de taux de précision ,
Trang 277.4 Les sept articles classés
Les 7 articles classés étaient :
1. A neural network constructed by deep learning technique and its ap-plication to intelligent fault diagnosis of machines ;
2. Fault diagnosis based on deep learning ;
3. Fault Detection and Diagnosis Based on KPCA-CDBNs Model ;
4. A novel deep autoencoder feature learning method for rotatingma-chinery fault diagnosis ;
5. Autoencoder based fault diagnosis for grinding system ;
6. Failure diagnosis using deep belief learning based health state classi-cation ;
7. Comparison of deep neural network architectures for fault detection in Tennessee Eastman process
7.5 Le tableau de classement des sept articles
Le tableau suivant résume toutes les études menées sur les sept ar-ticles
Trang 29Figure 9 – Deuxième partie des 7 articles retenus
Trang 30Figure 10 – Troisième partie des 7 articles retenus
Trang 318 Les modèles réalisés dans les 7 articles retenus
Parmi les articles retenus, les 7 premiers, 5 des travaux ont été sés à l’aide des Autoencodeurs (le premier article est de Feng Jia et Al [12],
réali-le deuxième articréali-le est de Chenglin Wen et Al [13], le quatrième est de Shao, Haidong et Al.[15], le cinquième est de Qu Xing-yu et Al.[16] et le septième est de Gavneet Singh Chadha et Al.[18]) Les deux autres avec le Deep Belief Network (le troisième article est de Rongyu Li et Al.[14] et le sixième article est de Prasanna Tamilselvan[17]) Un autre article (Pei Cao
et Al.[19]), était basé sur la technique de l’apprentissage par trans-fert (Transfer Learning) et avait la meilleur performance toutefois, nous avons chercher a ne pas l’implémenter car cela ne nous permettra pas de connaître la qualité de nos données et le modèle robuste qu’il fallait.
Les modèles qui prédominaient dans notre état de l’art furent lesAutoen-codeurs, suivi des Deep Belief Network(DBN)
8.1 Les Autoencodeurs
Un Autoencodeur selon Qu Xing-yu et Al [8], est un type de réseau
de neurones arti ciels utilisés pour apprendre des codages de données e
- caces dans un apprentissage non supervisé(apprentissage dont les classes ne sont pas connus) Le but d’un autoencodeur est d’apprendre une re-présentation (codage) d’un ensemble de données, généralement pour une réduction de la dimension et pouvoir reproduire ces données.
Figure 11 – Représentation d’un autoencodeur 8.1.1 Le fonctionnement d’un autoencodeur
Un Autoencodeur apprend à compresser les données de la couche d’entrée en un code court, puis à décompresser ce code pour obtenir un résultat proche des données d’origine Cela oblige l’autoencodeur à s’en- gager dans la réduction de la dimensionnalité, par exemple en apprenant
Trang 32à ignorer le bruit Certaines architectures de réseaux de neurones lisent des couches autoencodeur fragmentées et empilées pour la recon- naissance d’images Le premier autoencodeur peut apprendre à coder des caractéristiques simples telles que les angles, le second à analyser la sor-tie de la première couche, puis à coder des caractéristiques moins locales etc., jusqu’à ce que le codeur nal retrouve toute l’entrée dans un code qui correspond à une description de l’entrée.
de-8.2 Les réseaux de croyances profondes
8.2.1 La composition d’un réseau de croyance profonde(DBN)
Un DBN est un ensemble de réseaux simples, tels que les auto-encodeurs, qui ont été formés par couche dans une procédure non supervisée Les RBM sont les composants des DBN Les DBN composés d’autoencodeurs sont
également appelés autoencodeurs empilés, Geo rey Hinton [9].
Figure 12 – Représentation d’une unité du DBN
Trang 33Ce processus peut être poursuivi pour plusieurs RBM En quence, chaque RBM apprend des fonctionnalités plus complexes Parexemple, dans une application de vision par ordinateur, l’une des pre-mières couches RBM peut apprendre des caractéristiques simples,telles que la reconnaissance des bords Les couches RBM suivantespeuvent ap-prendre un groupe d’autres aspects telle que des formes,tandis que les couches supérieures peuvent apprendre à reconnaîtredes objets, tels que des visages, etc Au cours de la deuxième étape,
consé-un ajustement discrimi-nant utilisant la rétropropagation est e ectué surl’ensemble du DBN pour modi er les poids Grâce au pré-entraînement, les poids ont une bonne initialisation, ce qui permet à larétropropagation d’optimiser rapidement les poids
Figure 13 – Représentation simple de la machine de Boltzmann
Bien étudiés et comparés sur plusieurs points, un Autoencoder et un DBN sont presque similaires dans leurs fonctionnements La di érence réside au niveau du DBN par sa couche de sortie qui est dotée d’un classi- eur Mais il est aussi important de montrer que les Autoencodeurs sont simples à construire Avec les librairies autour de l’analyse des données aujourd’hui, on a plus de simplicité pour construire un réseaux de neu-rones Les DBN sont des réseaux de neurones typiques comme les couches
Trang 34d’encodage des Autoencodeurs qui ont une couche de sortie avec
la fonc-tion d’activation classi eur
9 Les fonctions d’activations
Dans les réseaux de neurones arti ciels , la fonction d’activation d’un nœud dé nit la sortie de ce nœud à partir d’une entrée ou d’un en-semble d’entrées Un circuit de puces informatiques standards peut être vu comme
un réseau numérique de fonctions d’activation pouvant être "ON"
(1) ou "OFF" (0), en fonction de l’entrée Ceci est similaire au tement du perceptron linéaire dans les réseaux de neurones.Cependant, seul les fonctions d’activation non linéaires permettent à
compor-de tels réseaux compor-de calculer compor-des problèmes non triviaux en utilisantseulement un petit nombre de noeuds, Hinkelmann Knut[10]
Notre encodeur fut conçu simplement vu qu’il s’agissait des donnéesnu-mériques et non d’images, donc pas de conversion ou depixellisation ni d’ajout de bruits gaussiens Les fonctions d’activation denotre Encodeur se résumaient aux fonctions tanh et relu
9.1 La fonction tanh
La fonction « tanh » ou fonction tangente Hyperbolique a pour
équa-tion :
Figure 14 – Equation de la fonction TanH
Figure 15 – Représentation de la fonction Tangente hyperbolique
Trang 35Figure 16 – Equation de la dérivée de la fonction Tangente
C’est une fonction qui varie entre [-1 ;1], P Baldi et
Al[11] Pour tout X appartenant à ]-1; 0[; lafonctionY = [ 1; 0[;
P ourtoutXappartenant]0; +1[; lafonctionY =]0; +1];
X = 0; y = 0;
La fonction tangente hyperbolique passe graduellement d’une leur –1 à une valeur 1 Elle peut donc être utilisée pour représenter unphénomène de transition progressive, « douce », entre deux états
va-9.2 La fonction Relu (Recti ed Linear Unit)
La fonction d’activation ReLU est évidemment la fonctiond’activa-tion non linéaire la plus utile que nous puissions utiliser.Lorsque nous obtenons une entrée positive, la dérivée n’est que de
1, il n’y a donc pas d’e et de compression que nous rencontrions surles erreurs rétropropa-gées de la fonction sigmọde Des recherchesont montré que les ReLU permettent une formation beaucoup plusrapide pour les grands réseaux La plupart des frameworks tels queTensor ow et Keras simpli ent l’uti-lisation de ReLU sur les couchesmasquées, nous évitant ainsi de les im-plémenter nous-même
f(x) = x+ =max(0,x)
Figure 17 – La représentation de la courbe Relu
La fonction ReLU est f(x) = max (0, x) Cela est généralement
Trang 36ap-pliqué élément par élément à la sortie d’une autre fonction, tellequ’un produit matrice-vecteur Dans les utilisations MLP, les unités
de redres-sement remplacent toutes les autres fonctionsd’activation, à l’exception peut-être de la couche de lecture
Les ReLU améliorent notamment les réseaux de neurones en accélé-rant la formation Le calcul du gradient est très simple (0 ou 1 en fonction du signe de x) En outre, l’étape de calcul d’une unité ReLU est simple ; Tous les éléments négatifs sont dé nis sur 0.0, pas d’exponentielle, pas d’opération de multiplication ou de division Les gradients des réseaux tangents logistiques et hyperboliques sont plus petits que la partie po-sitive de ReLU Cela signi e que la partie positive est mise à jour plus rapidement au fur et à mesure que la formation progresse Cependant, cela a un cỏt Le gradient 0 sur le cơté gauche à son propre problème, appelé "neurones morts", dans lequel une mise à jour de gradient dé nit les valeurs entrantes sur une ReLU de sorte que la sortie soit toujours égale à zéro ; Les unités ReLU modi ées telles que ELU (ou Leaky ReLU, ou PReLU, etc.) peuvent minimiser cela.
9.3 La fonction Sigmọde
Elle représente la fonction de répartition de la loi logistique Elle est souvent utilisée dans les réseaux de neurones parce qu’elle est dérivable,
ce qui est une contrainte pour l’algorithme de rétro-propagation de Wer-bos.
La forme de la dérivée de sa fonction inverse est extrêmement simple et facile à calculer, ce qui améliore les performances des algorithmes.
Le neurone sigmọde utilise des poids (weights) pour chaquevariable d’en-trée ainsi qu’un seuil biais (bias) par neurone
f(x) =
Trang 37Figure 18 – Représentation de la fonction Sigmọde
La fonction sigmọde utilisée ici nous permet de récupérer toutesles sorties de nos modèles Cette fonction permet d’avoir toutes lessorties contrairement à la fonction Softmax qui ne renverrait que lemaximum des résultats Ainsi, avec la fonction Sigmọde, nouspourrions dé nir un seuil selon le taux qui nous indiquerait la présence
de panne(s) quand les valeurs sont au dessus du seuil ou pas depanne(s) si les valeurs sont en dessous du seuil
9.4 Les fonctions présentées
Les fonctions d’activations ci-dessus présentées ont faitl’objet de notre travail Ces fonctions ont étés utilisées pour leursspéci cités, leurs fonctionnalités, leurs correspondances à notrevision sur les résultats es-comptés de notre projet
10 Les points importants entre l’état de l’art et les modèles sés
réali-Les recherches bibliographiques et analyses d’articles suite à notre état de l’art nous a montré plusieurs modèles construits et di érentes mé- thodes utilisées Ces travaux sont fait avec des méthodes de traitements d’images avec des modèles comme les réseaux de neurones appelés les Au-toencodeurs (A_E_D) et les réseaux neuronaux appelés les réseaux neu-ronaux à croyances profondes ou Deep Belief Network (DBN).
Les réseaux de neurones pour l’analyse des images se construisent sur les caractéristiques extraites des images Les images ne sont que des combinaisons de lignes et colonnes de pixels qui dé nissent ce que nous voyons a l’œil nu Les pixels allant de l’ordre de 0 à 255 L’analyse se base
Trang 38sur les variations de couleurs ou du niveau de gris des images dé
ni par les pixels Ainsi, pour traiter ces images converties enpixels par les tech-niques de traitement d’images, ces dernierssont aplatis, transformées en variables après normalisation puismis en entrée du modèle construit pour le traitement
Trang 39Troisième partie
CHAPITRE : LA CONSTRUCTION DES MODÈLES
11 Les données utilisées
11.1 Les types de données utilisées dans notre travail
Dans notre travail, nous nous sommes concentré sur lesdonnées nu-mériques que nous recevons des capteurs et lesentrons dans notre mo-dèle Nous avons recueillis les donnéesdirectement sous format numé-rique ( oat)
Nous avons utilisé les données numériques contrairement aux images utilisées dans l’état de l’art La facilité de calcul, de traitement et de
construc-tion des modèles suivant les données numériques nous ont
poussé à ne plus revenir sur les images pour la construction des modèles mais uni-quement la visualisation des variables par classes pour voir
comment se présente nos données Les données sont générées dans un simulateur GA-ZEBO avec des commandes d’ordre d’angle de rotations, de vitesses four-nies à chaque unités motrices du robot.
11.2 Descriptifs de nos variables
Les données provenant des capteurs ainsi que des combinaisons de commandes et de valeurs permettent d’avoir au total 34 variables qui sont :
Trang 40w : commande de la vitesse angulaire ;
v : commande de la vitesse linéaire ;
vr1, vr2 : vitesses des roues droites avant et arrière respecitvement ;
vl1, vl2 : vitesses des roues gauches avant et arrière respecitvement,
Ces vitesses sont mesurées par les odomètres(encodeurs) ;
theta_point : vitesse angulaire mesurée par le IMU (Unertial
Measure-ment Unit, ou centrale inertielle) ;
vr = (vr1+vr2)/2 ;
vl = (vl1+vl2)/2 ;
L = l’axe entre les deux roues ;
vg = vitesse linéaire calculée en se basant sur le gps (Vg = delta(position_gps)/delta(t)) ;