1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Diagnostic de pannes de robots mobiles par deep learnig ,mô hình học sâu cho chuẩn đoán lỗi của robot di động

86 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 86
Dung lượng 3,73 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

10Les points importants entre l’état de l’art et les modèles réalisés III CHAPITRE : LA CONSTRUCTION DES MODÈLES 11Les données utilisées 11.1Les types de données utilisées dans notre tra

Trang 1

UNIVERSITE NATIONALE DU VIETNAM, HANOI

INSTITUT FRANCOPHONE INTERNATIONAL

APEDO KODZO SITSOFE DEGNON

DIAGNOSTIC DE PANNES DE ROBOTS MOBILES PAR "DEEP LEARNIG"

MÔ HÌNH HỌC SÂU CHO CHUẨN ĐOÁN LỖI CỦA

ROBOT DI ĐỘNG

MÉMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE

HANOI - 2018

Trang 2

UNIVERSITE NATIONALE DU VIETNAM, HANOI

INSTITUT FRANCOPHONE INTERNATIONAL

APEDO KODZO SITSOFE DEGNON

DIAGNOSTIC DE PANNES DE ROBOTS MOBILES PAR "DEEP LEARNIG"

MÔ HÌNH HỌC SÂU CHO CHUẨN ĐOÁN LỖI

CỦA ROBOT DI ĐỘNG

Specialite : SYSTEMES INTELLIGENTS ET MULTIMEDIA

Code : Programme pilote

MÉMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE

Sous la direction de : Le chargé de

recherche, PhD Nicolas TRICOT

à IRSTEA Clermont-Ferrand

HANOI - 2018

Trang 3

ATTESTATION SUR L’HONNEUR

J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que lesdonnées et les résultats qui y sont présentés sont exacts et n’ont jamais été publiésailleurs La source des informations citées dans ce mémoire a été bien précisée

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi

Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được aicông bố trong bất kỳ công trình nào khác Các thông tin trích dẫn trong Luận văn

đã được chỉ rõ nguồn gốc

APEDO Kodzo Sitsofe Degnon

Trang 4

Le travail présenté dans ce mémoire a été réalisé au sein duLabo-ratoire Institut National de Recherche en Sciences etTechnologies pour l’Environnement et l’Agriculture (IRSTEA), sur

le Campus des Cézeaux d’Aubière

Je remercie mes Encadrants de stage, Mr Nicolas TRICOTChargé de recherche et encadrant principal, Mr Roland LENAIN chefd’équipe de ROMEA, ainsi que le Thésard Mr Mahmoud ALMASRI, quim’ont permis de faire ce stage dans une coopération plus que parfaite.Leur sou-tien, leur suivi, leur orientation, leur disponibilité et leur conance m’ont permis d’apprendre dans un cadre convivial et ayantpermis mon épa-nouissement tout au long de ce stage

J’adresse également mes remerciements à mes parents, mafamille et mes amis qui m’ont soutenu et encouragé régulièrementtout au long de ce stage

Trang 5

1 Introduction générale

stage

2.1 Présentation générale d’IRSTEA

2.2 Structure interne

2.3 Présentation du secteur d’accueil

2.3.1 L’unité de recherche TSCF

2.3.2 L’équipe ROMEA

I CHAPITRE : PRÉSENTATION DU PROBLÈME 3 Introduction 4 Problématique 5 Diagnostic de pannes de robots mobiles par "Deep Learning" 17 5.1 Sujet du stage

5.2 Travail demandé par le projet

II CHAPITRE : ÉTAT DE L’ART 6 Introduction à l’existant 7 Etude des articles 7.1 Les travaux réalisés sur les 71 articles 7.2 Les 16 articles retenus

7.3 Les points de sélection et de classi cation des 7 articles 7.4 Les sept articles classés

7.5 Le tableau de classement des sept articles 8 Les modèles réalisés dans les 7 articles retenus 8.1 Les Autoencodeurs

8.1.1 8.1.2 8.2 Les réseaux de croyances profondes 8.2.1 8.2.2 9 Les fonctions d’activations 9.1 La fonction tanh

9.2 La fonction Relu (Recti ed Linear Unit) 2 9.3 La fonction Sigmọde

Trang 6

10Les points importants entre l’état de l’art et les modèles réalisés

III CHAPITRE : LA CONSTRUCTION DES MODÈLES

11Les données utilisées

11.1Les types de données utilisées dans notre travail

11.2Descriptifs de nos variables

11.3Description de nos classes

12Les modèles de bases 12.1Le modèle basé sur l’encodeur

12.2La construction de l’encodeur

12.3Le modèle classi eur

12.4La construction du classi eur

13Les modèles découlant de l’encodeur et du classi eur 13.1Le modèle encodeur-classi eur

13.2Le modèle classi eur

14La compilation des modèles 15Ajustement de modèle IV CHAPITRE : EXPÉRIMENTATIONS ET ANALYSES 16Études de la qualité des données 16.1La quantité des données

16.2La validation croisée de nos bases

17La création et les tests sur des modèles 17.1La création des modèles

17.1.1Le modèle Encodeur-Classi eur

17.1.2Le réseau DBN

17.1.3Le réseau classi eur

17.2Les tests des réseaux

17.2.1Le test avec le reste des bases non utilisées

17.2.2Le test sur Gazebo

18Le diagnostic de la provenance des mauvais résultats 18.1Études menées sur les données

3 18.2Les douze modèles

Trang 7

18.3Explication et comparaison des résultats

18.3.1La base 1

18.3.2La base 2

18.3.3La base 3

18.3.4La base 4

18.3.5La base 5

18.3.6La base 6

18.3.7Conclusion tirée de la comparaison et des tests

19La nouvelle base et les nouveaux modèles 19.1Les classes perturbatrices

19.1.1Le modèle DBN

19.1.2Le modèle Encodeur_Classi eur

19.1.3Classi eur

19.2Conclusion sur les résultats des trois modèles

20Les modèles conçus avec la nouvelle base et les résultats 20.1Le modèle DBN

20.2Le modèle Encodeur_Classi eur

20.3Classi eur

20.4Conclusion sur les nouveaux modèles créés

V CHAPITRE : CONCLUSIONS ET PERSPECTIVES 21Conclusion et perspectives 21.1Conclusion

21.2Les perspectives

4

Trang 8

LISTE DES FIGURES

1 Implantation géographique des diverses centres d’IRSTEA 10

2 Organigramme de IRSTEA Clermont 12

3 Les embranchements du Machine Learning 15

4 Première partie des 71 articles de l’état de l’art 19

5 Deuxième partie des 71 articles de l’état de l’art 20

6 Troisième partie des 71 articles de l’état de l’art 21

7 Quatrième partie des 71 articles de l’état de l’art 21

8 Première partie des 7 articles retenus 24

9 Deuxième partie des 7 articles retenus

10 Troisième partie des 7 articles retenus

11 Représentation d’un autoencodeur

12 Représentation d’une unité du DBN 28

13 Représentation simple de la machine de Boltzmann 29

14 Equation de la fonction TanH

15 Représentation de la fonction Tangente hyperbolique

16 Equation de la dérivée de la fonction Tangente

17 La représentation de la courbe Relu 31

18 Représentation de la fonction Sigmọde 33

19 Architecture du classi eur 46

20 Architecture de l’encodeur 46

21 Architecture du classi eur associé a l’encodeur

22 Courbe de la fonction de perte du DBN pour 7 classes

23 Courbe de la précision du DBN pour 7 classes

24 Matrice de confusion du modèle DBN pour 7 classes

25 Courbe de la fonction de perte de l’E_C pour 7 classes

26 Courbe de la fonction de précision de l’E_C pour 7 classes 50

27 Matrice de confusion du modèle E_C pour 7 classes 51

28 Courbe de la fonction de perte du classi eur pour 7 classes 51

29 Courbe de la précision du modèle classi eur pour 7 classes 51

30 Matrice de confusion du modèle classi eur pour 7 classes 51 31 Courbe de la fonction de perte du DBN pour 20 classes 52

32 Courbe de la précision du modèle DBN pour 20 classes 53

33 Matrice de confusion du modèle DBN pour 20 classes 53

34 Courbe de la fonction de perte de l’E_C pour 20 classes 54

35 Courbe de la fonction de précision de l’E_C pour 20 classes 54 36 Matrice de confusion du modèle E_C pour 20 classes 55

37 Courbe de la fonction de perte du classi eur pour 20 classes 55

38 Courbe de la précision du modèle classi eur pour 20 classes 56

Trang 9

5

Trang 10

Le bon fonctionnement de tout appareil électronique ou mécanique repose sur une durée plus ou moins longue suivant l’utilité et l’utilisation Au cours de leur utilisation surviennent des pannes ou des dysfonctionne-ments qui peuvent dépendre d’un ou plusieurs éléments simultanément Ces pannes sont souvent constatées ou pas après dysfonctionnement ; et la détection de la cause exacte est souvent di cile Dans ce mémoire, nous décrivons comment nous avons mené nos recherches pour le diagnostic de pannes de robots mobiles grâce aux réseaux de neurones A l’aide des capteurs qui sont sur le robot, dans une simulation sur Gazebo, nous géné- rons 34 variables jugées nécessaires qui, ensemble dé nissent un état de fonctionnement du robot Nous avons au total 20 cas de fonctionnements, dont un cas d’état normal sans panne L’algorithme (encodeur), apprend les caractéristiques dans un premier temps et sa sortie est mise en entrée d’un Classi eur pour avoir les classes en sortie Ce résultat décrit l’état du robot suite aux données reçues La détection se fait en temps réel avec une très bonne précision, montrant la performance du modèle conçu.

Mots clés : Diagnostics, défauts, robots mobiles, résidus, réseaux

de neu-rones(Deep Learning), Autoencodeur(encodeur,decodeur), classi cation multi-classes et multi-label

Trang 11

The proper functioning of any electronic or mechanical device is sed on a longer or shorter duration depending on the utility and use Du- ring their use there are failures or malfunctions that may depend on one

ba-or mba-ore elements simultaneously These failures are often noted ba-or not after malfunction ; and the detection of the exact cause is often di cult In this thesis, we describe how we conducted our research for the diagnosis

of mobile robot failures through neural networks Using the sensors that are on the robot, in a simulation on Gazebo, we generate 34 variables deemed necessary which together de ne a running state of the robot We have a total of 20 cases of operation, including a normal case without failure The algorithm (encoder), learns the characteristics in a rst time and its output is put in input of a Classi er to have the classes in exit This result describes the state of the robot following the received data The detection is done in real time with a very good precision, showing the performance of the model created.

Keywords : Diagnostics, defects, mobile robots, residues, neuralnetworks (Deep Learning), Autoencoder (encoder, decoder), multi-class and multi-label classi cation

Trang 12

1 Introduction générale

Aujourd’hui, la nécessité dans la production, dans la réalisation des tâches et le travail continu pour des rendements meilleurs qu’hier, re- présentent de grands dé s entre les défaillances des systèmes, les pannes de machines, le temps d’exécution et le seuil de la productivité.

Un dé-réglage ou un dysfonctionnement dans le comportement nominal

de ces systèmes peut conduire à des conséquences sérieuses pouvant être né-fastes pour l’humain et l’environnement De plus, le fait de résoudre ces problèmes peut s’avérer parfois très cỏteux La présence des machines ou des robots à usage domestique ou industriel ont en un point, des élé-ments communs susceptibles de rencontrer des dysfonctionnements selon l’environnement, l’impact de l’homme ou à l’usure du temps Ces dysfonc-tionnements ont des conséquences parfois irréversibles et qui engendrent des pertes et dégâts irréparables.

A n de réduire à presque rien ces dégâts ou de carrément les éviter, il est mieux de mettre en place, des moyens de surveillance du fonctionnement suivant toutes les activités menées a n de détecter le plus tơt possible des futures pannes imminentes et d’en ap-porter une correction.

Ainsi, pour toutes ces cas de pannes, il peut y avoir des cas

de sur-veillance de fonctionnement ou des défauts qui serontproches selon les méthodes à mettre en œuvre De façon plusobjective, la surveillance des pannes découle sur deux aspects :

— La mise en place de méthodes pour la détection de pannes dans un but de préserver la sécurité de l’utilisateur, préserver

le bon fonction-nement de la machine ou de l’outil

— Maintenir une productivité et un fonctionnement continus

dans les excellents états de fonctionnement pouvant être

représentés de façon linéaire

Ce mémoire divisé en 5 chapitres, se présente comme suit :

— Le premier chapitre décrit la problématique dans son ensemble,l’ob-jectif visé partant du général au particulier dans le cas qui nous concerne, les robots mobiles

— Le deuxième chapitre parle de toutes les démarches mises

en œuvres pour la réalisation du travail de recherche jusqu’à

la dé nition des solutions et méthodes choisies

— Le troisième chapitre aborde les démarches pour la

réalisation des solutions ainsi que leur mise en place

Trang 13

— Le quatrième chapitre parle des di érents types de tests e ectués pour l’approbation des données utilisées et des résultats obtenus.

— En n, le dernier chapitre parle des conclusions, apports et des pers-pectives de notre travail sur toute sa démarche en montrant

en n l’utilité de nos solutions dans d’autres domaines et surtout lespossi-bilités d’application de notre solution à d’autres cas

Trang 14

2 Présentation du Laboratoire de recherche IRSTEA, lieu du stage2.1 Présentation générale d’IRSTEA

IRSTEA (Institut National de Recherche en Science etTechnologies pour l’Environnement et l’Agriculture) est unétablissement public à ca-ractère scienti que et technologiqueimplanté en France et reparti dans 10 centres (voir gure 1)

IRSTEA travaille sur les enjeux majeurs d’une agricultureresponsable et de l’aménagement des territoires Ce centre derecherche est divisé en trois départements dont les thèmes derecherche sont les Eaux, les Éco-technologies et les Territoires

Figure 1 – Implantation géographique des diverses centres d’IRSTEA

La stratégie de l’organisation scienti que et technique d’IRSTEA :

• 3 départements de recherche : Eaux, Territoires, Écotechnologies ;

• 4 domaines stratégiques :

— Risques naturels, sanitaires et environnementaux ;

— Bio-économie et économie circulaire des bio-ressources

et des ef-uents : des technologies aux acteurs ;

— Gestion adaptative des ressources dans les territoires sous contrainte du changement global ;

Trang 15

— Biodiversité : dynamique et gestion des écosystèmes et services écosystémiques.

• 10 Axes Directeurs de Département

2.2 Structure interne

Le centre de Clermont-Ferrand, se compose de 90 agents dont 60 in-génieurs/chercheurs Le centre accueille également chaque année environ 22 doctorants et post-doctorants ainsi que 40 stagiaires de l’enseignement supérieur Il béné cie d’un budget annuel moyen de 3.56 millions d’euro Le centre dispose de deux sites : un pôle scienti que et universitaire si-tué sur le campus des Cézeaux à Aubière (63), et un site

de recherche et d’expérimentation (équipé d’une exploitation agricole et d’un atelier de prototypage mécanique) situé à Montoldre (03) Vous trouverez ci-dessous l’organigramme du Centre de Clermont-Ferrand.

Trang 16

Figure 2 – Organigramme de IRSTEA Clermont

Trang 17

2.3 Présentation du secteur d’accueil

2.3.1 L’unité de recherche TSCF

IRSTEA est composé actuellement de 19 unités de recherchedont L’unité de recherche (UR) Technologies et Systèmesd’information pour les agrosystèmes (TSCF) Cette unité s’intéresse

à la sécurité et aux per-formances des agroéquipements a apporterdes solutions concrètes aux besoins d’une agriculture productive etécologiquement responsable Ses activités qui relèvent dudépartement Écotechnologies d’IRSTEA, sont conduites dans lecadre des thèmes de recherche « INSPIRE » et « MO-TIVE »

2.3.2 L’équipe ROMEA

Au sein de l’unité de recherche TSCF, l’équipe « Robotique et lité pour l’Environnement et L’Agriculture » (ROMEA) [réf : 2] conçoit des systèmes recon gurables et à autonomie partagée, a n d’accroître les performances et la sécurité des engins œuvrant en milieux naturels, en particulier dans l’agriculture Dirigée par Mr Roland LENAIN, cette équipe concentre ses recherches sur trois principaux axes :

Mobi-— La conception de dispositifs de sécurité, de la conception mécanique à la réalisation de dispositifs d’assistance ;

— La perception de l’environnement et la modélisation du

comporte-ment et de l’interaction d’un robot avec son utilisateur

— Le développement d’algorithmes avancés de commandes ou tance, en prenant en compte les phénomènes perturbateurs et les in- certitudes liées à l’évolution en milieux tout-terrain.

Trang 18

La science des données ou Machine Learning est un vastedomaine qui se résume sur notre Figure 3 :

Dans notre cas qui fait référence directe à ce rapport, il s’agit dutraite-ment de données provenant des capteurs qui sont sur unrobot permettant de recueillir des informations sur le fonctionnement

de celui-ci en temps réel Ces données générées font l’objet de cequi suit dans ce document Le travail réalisé ici fut concentré surl’apprentissage profond (Deep Lear-ning) C’est un sous domaine duMachine Learning qui a montré sa force avec les pratiquesstatistiques et probabilistes face à toutes sortes de don-nées

Aujourd’hui, grâce au Deep Learning, l’expression Intelligence Articielle a trouvé sa dé nition dans toutes les domaines scienti ques

Trang 19

Figure 3 – Les embranchements du Machine Learning

Trang 20

4 Problématique

L’équipe ROMEA de Clermont-Ferrand, axée sur la conception de robots mobiles à but agricole, possède plusieurs prototypes de robots des- tinés à plusieurs tâches Ces robots (Maître et Suiveur), sont destinés à suivre un humain dans ses déplacements dans un champ tout en détectant leur position, les éventuels obstacles mais aussi la personne Dans l’exé- cution de leur tâche, les robots renvoient des informations par le biais des plusieurs capteurs positionnés sur les composants du robot notamment :

— GPS;

— Les (4) roues ;

— L’Inertial Measurement Unit (IMU)

Ces capteurs renvoient des signaux numériques qui sont bien iden-ti

és selon les types d’informations Ces informations arrivent en temps réel et constituent, si elles sont stockées, une base permettant de connaître en temps réel ou di éré, les états de fonctionnement, de position , etc.

Dans les multiples tests e ectués en prototypage ou en environnementréel, force est de constater qu’il apparaît des défauts liés à plusieurscom-posantes du robot, liés à l’impact de l’environnement réel, liés ausol, lié à la détection de la position réelle, etc

Suite à des analyses et des études menées ne pouvant pas détecter toutes les causes des défauts ou tout l’exactitude des moments

ou ceux-ci surviennent, un projet a été mis au point pour la détection des pannes par rapport aux informations recueillies Ces informations appelées ré-sidus(les résidus sont des sorties d’équations de paramètres

et de com-mandes du robot), vont permettre, par plusieurs moyens de calculs statis-tiques et probabilistes, de détecter la présence de pannes dans les données Cette étude a pour objectif de trouver un ou plusieurs seuils pour lequel, les valeurs se trouvant au-dessus ou en-dessous seraient dé nies comme données précurseuses de défauts ou non ou des signes de défauts pro-venant d’un composant référencé selon le résidu in uencé Il y a eu des résultats appréciables avec quelques cas de défauts suite aux techniques utilisées notamment le ltre de KALMAN, et d’autres cas qui n’ont pas fait l’objet de détection Il fut constaté aussi que certains défauts réels ne faisaient pas actes de diagnostic par le programme existant et que des quelques rares cas de fonctionnement normaux étaient confondus à des cas de pannes.

Plusieurs expériences ont été menées dans le but du diagnostic et

de l’isolement des défauts dont l’un était le ltre de KALMAN Le ltre de

Trang 21

estime les états d’un système dynamique à partir d’une série demesures incomplètes ou bruitées Le ltre de Kalman est utilisédans une large gamme de domaines technologiques (radar, visionélectronique, commu-nication .) C’est un thème majeur del’automatique et du traitement du signal.

5 Diagnostic de pannes de robots mobiles par "Deep Learning"5.1 Sujet du stage

Le développement des robots mobiles permettant de réaliser des tâches dangereuses, complexes, répétitives et/ou fastidieuses (le

déplacement d’un objet lourd d’un point à un autre par exemple) est un sujet prégnant dans les contextes agricoles et industriels Ces robots

réalisent des tâches clai-rement identi ées tout en évoluant dans un

environnement complexe et dynamique Cependant, dans certaines

situations (présence de nombreux obstacles prévus ou imprévus dans le cadre d’une tâche de suivi de trajec-toire, dysfonctionnement d’un

composant physique du robot, ), l’intel-ligence embarquée ne permet pas

de trouver de solutions permettant de mener à bien les tâches à e ectuer.

Dans l’objectif de répondre à ce genre de situation, des travaux de cherche sont en cours Leur première ambition est de dé nir une méthode de diagnostic et d’isolation de tout type de défaut pouvant apparaître sur un robot C’est dans ce contexte que ce stage s’inscrit Le Deep Learning est une méthode récente d’apprentissage automatique, basée sur des ré-seaux

re-de neurones arti ciels Elle permet d’obtenir re-des résultats probants dans re-de nombreux domaines comme la reconnaissance des formes Y Le-Cun et Al[2], la reconnaissance de paroles N Jaitly et Al[3], la reconnais-sance vocale continue T.N Sainath et Al[4], le diagnostic médical A.M Abdel et Al[5], la détection de position S Li, Z.Q Liu et Al[6] ou encore le suivi en ligne des objets Y Chen et Al[7] Certaines de ces applications ont des points communs avec le domaine du diagnostic qui nous intéresse C’est pourquoi nous pensons qu’elles pourraient donner des résultats pro- metteurs dans notre domaine.

5.2 Travail demandé par le projet

L’objectif nal de l’étude est de détecter et isoler une liste prédé nie de défauts qui pourraient se produire sur un robot mobile L’application de la méthode du Deep Learning sur des résidus générés à partir d’équations

Trang 22

régissant la dynamique du robot est le cœur de cette étude Nous aurons à :

— Faire une étude bibliographique sur les di érentes architectures exis-tantes de méthodes de l’apprentissage profond ;

— Synthétiser les résultats de cette recherche et classer les architectures en fonction de leur capacité à répondre à notre problématique (appli-cation sur des équations de redondance analytique et sur les ltres de Kalman, détection de

dépassement de seuils, calculs en temps réel, ) ;

— Appliquer la(les) architecture(s) sélectionnée(s) sur les

Trang 23

Nous avions fait au début de notre état de l’art, desrecherches d’ar-ticles avec des mots clés par le biais du moteur

de recherche interne a IRS-TEA appelé Sherlock, qui sert à larecherche documentaire multi-sources et qui nous a amené à uneliste exhaustive de 71 articles toutes catégories confondues

La liste a ensuite été classé, selon les termes et mots clés ayant servis.

Figure 4 – Première partie des 71 articles de l’état de l’art

Trang 24

Figure 5 – Deuxième partie des 71 articles de l’état de l’art

Trang 25

Figure 6 – Troisième partie des 71 articles de l’état de l’art

Figure 7 – Quatrième partie des 71 articles de l’état de l’art Suite à ces articles trouvés, lus et analysés, nous avons réduit la liste a n de ne conserver que les articles les plus intéressants, ceux-ci faisant l’objet de notre prise de position sur les solutions envisageables.

Trang 26

7 Etude des articles

7.1 Les travaux réalisés sur les 71 articles

Dans la lecture de chaque article, nous recherchons le plus souvent

à comprendre le résumé, identi er les mots clés, l’introduction et la conclu-sion a n de recueillir le contexte général, le but et la solution nale Cette façon de lire les articles nous a permis de voir ceux parmi lesquels

le sujet allait dans le sens de notre recherche mais dont le contenu n’est pas axé sur les mêmes idées que nos attentes Ainsi nous avons restreint

la liste à des articles pertinents, des articles qui ont fait l’objet de tests après lecture et ce via des critères comme :

— La date de publication de l’article,

— Les apparitions du nombre de mots clés dans l’article,

— Les méthodes utilisées,

— Le modèle utilisé de réseaux de neurones,

— Les modèles comparatifs

7.2 Les 16 articles retenus

Dans la phase de sélection des articles les plus pertinents, nous avions retenu une liste de 16 articles qui cadrent parfaitement avec le contexte de notre problématique Ainsi, dans l’étude complète de ces 16 articles, nous avons également fait un classement suivant les paramètres précités de sorte

à nous limiter uniquement aux 7 premiers Dans cette classi - cation, nous avons pris la décision de partir de ces articles pour orienter notre recherche

de solution qui malgré les di érences de cas de pannes entre les articles et notre problématique, nous serviraient pour avancer.

7.3 Les points de sélection et de classi cation des 7 articles

Nous avons sélectionné de nos 16 articles précédemment retenus, les 7 meilleurs articles suivant une étude et critères bien dé nis.

— La date de publication de l’article,

— Les algorithmes utilisés,

— Les types de données utilisées,

— La taille des données utilisés,

— Les résultats obtenus en matière de taux de précision ,

Trang 27

7.4 Les sept articles classés

Les 7 articles classés étaient :

1. A neural network constructed by deep learning technique and its ap-plication to intelligent fault diagnosis of machines ;

2. Fault diagnosis based on deep learning ;

3. Fault Detection and Diagnosis Based on KPCA-CDBNs Model ;

4. A novel deep autoencoder feature learning method for rotatingma-chinery fault diagnosis ;

5. Autoencoder based fault diagnosis for grinding system ;

6. Failure diagnosis using deep belief learning based health state classi-cation ;

7. Comparison of deep neural network architectures for fault detection in Tennessee Eastman process

7.5 Le tableau de classement des sept articles

Le tableau suivant résume toutes les études menées sur les sept ar-ticles

Trang 29

Figure 9 – Deuxième partie des 7 articles retenus

Trang 30

Figure 10 – Troisième partie des 7 articles retenus

Trang 31

8 Les modèles réalisés dans les 7 articles retenus

Parmi les articles retenus, les 7 premiers, 5 des travaux ont été sés à l’aide des Autoencodeurs (le premier article est de Feng Jia et Al [12],

réali-le deuxième articréali-le est de Chenglin Wen et Al [13], le quatrième est de Shao, Haidong et Al.[15], le cinquième est de Qu Xing-yu et Al.[16] et le septième est de Gavneet Singh Chadha et Al.[18]) Les deux autres avec le Deep Belief Network (le troisième article est de Rongyu Li et Al.[14] et le sixième article est de Prasanna Tamilselvan[17]) Un autre article (Pei Cao

et Al.[19]), était basé sur la technique de l’apprentissage par trans-fert (Transfer Learning) et avait la meilleur performance toutefois, nous avons chercher a ne pas l’implémenter car cela ne nous permettra pas de connaître la qualité de nos données et le modèle robuste qu’il fallait.

Les modèles qui prédominaient dans notre état de l’art furent lesAutoen-codeurs, suivi des Deep Belief Network(DBN)

8.1 Les Autoencodeurs

Un Autoencodeur selon Qu Xing-yu et Al [8], est un type de réseau

de neurones arti ciels utilisés pour apprendre des codages de données e

- caces dans un apprentissage non supervisé(apprentissage dont les classes ne sont pas connus) Le but d’un autoencodeur est d’apprendre une re-présentation (codage) d’un ensemble de données, généralement pour une réduction de la dimension et pouvoir reproduire ces données.

Figure 11 – Représentation d’un autoencodeur 8.1.1 Le fonctionnement d’un autoencodeur

Un Autoencodeur apprend à compresser les données de la couche d’entrée en un code court, puis à décompresser ce code pour obtenir un résultat proche des données d’origine Cela oblige l’autoencodeur à s’en- gager dans la réduction de la dimensionnalité, par exemple en apprenant

Trang 32

à ignorer le bruit Certaines architectures de réseaux de neurones lisent des couches autoencodeur fragmentées et empilées pour la recon- naissance d’images Le premier autoencodeur peut apprendre à coder des caractéristiques simples telles que les angles, le second à analyser la sor-tie de la première couche, puis à coder des caractéristiques moins locales etc., jusqu’à ce que le codeur nal retrouve toute l’entrée dans un code qui correspond à une description de l’entrée.

de-8.2 Les réseaux de croyances profondes

8.2.1 La composition d’un réseau de croyance profonde(DBN)

Un DBN est un ensemble de réseaux simples, tels que les auto-encodeurs, qui ont été formés par couche dans une procédure non supervisée Les RBM sont les composants des DBN Les DBN composés d’autoencodeurs sont

également appelés autoencodeurs empilés, Geo rey Hinton [9].

Figure 12 – Représentation d’une unité du DBN

Trang 33

Ce processus peut être poursuivi pour plusieurs RBM En quence, chaque RBM apprend des fonctionnalités plus complexes Parexemple, dans une application de vision par ordinateur, l’une des pre-mières couches RBM peut apprendre des caractéristiques simples,telles que la reconnaissance des bords Les couches RBM suivantespeuvent ap-prendre un groupe d’autres aspects telle que des formes,tandis que les couches supérieures peuvent apprendre à reconnaîtredes objets, tels que des visages, etc Au cours de la deuxième étape,

consé-un ajustement discrimi-nant utilisant la rétropropagation est e ectué surl’ensemble du DBN pour modi er les poids Grâce au pré-entraînement, les poids ont une bonne initialisation, ce qui permet à larétropropagation d’optimiser rapidement les poids

Figure 13 – Représentation simple de la machine de Boltzmann

Bien étudiés et comparés sur plusieurs points, un Autoencoder et un DBN sont presque similaires dans leurs fonctionnements La di érence réside au niveau du DBN par sa couche de sortie qui est dotée d’un classi- eur Mais il est aussi important de montrer que les Autoencodeurs sont simples à construire Avec les librairies autour de l’analyse des données aujourd’hui, on a plus de simplicité pour construire un réseaux de neu-rones Les DBN sont des réseaux de neurones typiques comme les couches

Trang 34

d’encodage des Autoencodeurs qui ont une couche de sortie avec

la fonc-tion d’activation classi eur

9 Les fonctions d’activations

Dans les réseaux de neurones arti ciels , la fonction d’activation d’un nœud dé nit la sortie de ce nœud à partir d’une entrée ou d’un en-semble d’entrées Un circuit de puces informatiques standards peut être vu comme

un réseau numérique de fonctions d’activation pouvant être "ON"

(1) ou "OFF" (0), en fonction de l’entrée Ceci est similaire au tement du perceptron linéaire dans les réseaux de neurones.Cependant, seul les fonctions d’activation non linéaires permettent à

compor-de tels réseaux compor-de calculer compor-des problèmes non triviaux en utilisantseulement un petit nombre de noeuds, Hinkelmann Knut[10]

Notre encodeur fut conçu simplement vu qu’il s’agissait des donnéesnu-mériques et non d’images, donc pas de conversion ou depixellisation ni d’ajout de bruits gaussiens Les fonctions d’activation denotre Encodeur se résumaient aux fonctions tanh et relu

9.1 La fonction tanh

La fonction « tanh » ou fonction tangente Hyperbolique a pour

équa-tion :

Figure 14 – Equation de la fonction TanH

Figure 15 – Représentation de la fonction Tangente hyperbolique

Trang 35

Figure 16 – Equation de la dérivée de la fonction Tangente

C’est une fonction qui varie entre [-1 ;1], P Baldi et

Al[11] Pour tout X appartenant à ]-1; 0[; lafonctionY = [ 1; 0[;

P ourtoutXappartenant]0; +1[; lafonctionY =]0; +1];

X = 0; y = 0;

La fonction tangente hyperbolique passe graduellement d’une leur –1 à une valeur 1 Elle peut donc être utilisée pour représenter unphénomène de transition progressive, « douce », entre deux états

va-9.2 La fonction Relu (Recti ed Linear Unit)

La fonction d’activation ReLU est évidemment la fonctiond’activa-tion non linéaire la plus utile que nous puissions utiliser.Lorsque nous obtenons une entrée positive, la dérivée n’est que de

1, il n’y a donc pas d’e et de compression que nous rencontrions surles erreurs rétropropa-gées de la fonction sigmọde Des recherchesont montré que les ReLU permettent une formation beaucoup plusrapide pour les grands réseaux La plupart des frameworks tels queTensor ow et Keras simpli ent l’uti-lisation de ReLU sur les couchesmasquées, nous évitant ainsi de les im-plémenter nous-même

f(x) = x+ =max(0,x)

Figure 17 – La représentation de la courbe Relu

La fonction ReLU est f(x) = max (0, x) Cela est généralement

Trang 36

ap-pliqué élément par élément à la sortie d’une autre fonction, tellequ’un produit matrice-vecteur Dans les utilisations MLP, les unités

de redres-sement remplacent toutes les autres fonctionsd’activation, à l’exception peut-être de la couche de lecture

Les ReLU améliorent notamment les réseaux de neurones en accélé-rant la formation Le calcul du gradient est très simple (0 ou 1 en fonction du signe de x) En outre, l’étape de calcul d’une unité ReLU est simple ; Tous les éléments négatifs sont dé nis sur 0.0, pas d’exponentielle, pas d’opération de multiplication ou de division Les gradients des réseaux tangents logistiques et hyperboliques sont plus petits que la partie po-sitive de ReLU Cela signi e que la partie positive est mise à jour plus rapidement au fur et à mesure que la formation progresse Cependant, cela a un cỏt Le gradient 0 sur le cơté gauche à son propre problème, appelé "neurones morts", dans lequel une mise à jour de gradient dé nit les valeurs entrantes sur une ReLU de sorte que la sortie soit toujours égale à zéro ; Les unités ReLU modi ées telles que ELU (ou Leaky ReLU, ou PReLU, etc.) peuvent minimiser cela.

9.3 La fonction Sigmọde

Elle représente la fonction de répartition de la loi logistique Elle est souvent utilisée dans les réseaux de neurones parce qu’elle est dérivable,

ce qui est une contrainte pour l’algorithme de rétro-propagation de Wer-bos.

La forme de la dérivée de sa fonction inverse est extrêmement simple et facile à calculer, ce qui améliore les performances des algorithmes.

Le neurone sigmọde utilise des poids (weights) pour chaquevariable d’en-trée ainsi qu’un seuil biais (bias) par neurone

f(x) =

Trang 37

Figure 18 – Représentation de la fonction Sigmọde

La fonction sigmọde utilisée ici nous permet de récupérer toutesles sorties de nos modèles Cette fonction permet d’avoir toutes lessorties contrairement à la fonction Softmax qui ne renverrait que lemaximum des résultats Ainsi, avec la fonction Sigmọde, nouspourrions dé nir un seuil selon le taux qui nous indiquerait la présence

de panne(s) quand les valeurs sont au dessus du seuil ou pas depanne(s) si les valeurs sont en dessous du seuil

9.4 Les fonctions présentées

Les fonctions d’activations ci-dessus présentées ont faitl’objet de notre travail Ces fonctions ont étés utilisées pour leursspéci cités, leurs fonctionnalités, leurs correspondances à notrevision sur les résultats es-comptés de notre projet

10 Les points importants entre l’état de l’art et les modèles sés

réali-Les recherches bibliographiques et analyses d’articles suite à notre état de l’art nous a montré plusieurs modèles construits et di érentes mé- thodes utilisées Ces travaux sont fait avec des méthodes de traitements d’images avec des modèles comme les réseaux de neurones appelés les Au-toencodeurs (A_E_D) et les réseaux neuronaux appelés les réseaux neu-ronaux à croyances profondes ou Deep Belief Network (DBN).

Les réseaux de neurones pour l’analyse des images se construisent sur les caractéristiques extraites des images Les images ne sont que des combinaisons de lignes et colonnes de pixels qui dé nissent ce que nous voyons a l’œil nu Les pixels allant de l’ordre de 0 à 255 L’analyse se base

Trang 38

sur les variations de couleurs ou du niveau de gris des images dé

ni par les pixels Ainsi, pour traiter ces images converties enpixels par les tech-niques de traitement d’images, ces dernierssont aplatis, transformées en variables après normalisation puismis en entrée du modèle construit pour le traitement

Trang 39

Troisième partie

CHAPITRE : LA CONSTRUCTION DES MODÈLES

11 Les données utilisées

11.1 Les types de données utilisées dans notre travail

Dans notre travail, nous nous sommes concentré sur lesdonnées nu-mériques que nous recevons des capteurs et lesentrons dans notre mo-dèle Nous avons recueillis les donnéesdirectement sous format numé-rique ( oat)

Nous avons utilisé les données numériques contrairement aux images utilisées dans l’état de l’art La facilité de calcul, de traitement et de

construc-tion des modèles suivant les données numériques nous ont

poussé à ne plus revenir sur les images pour la construction des modèles mais uni-quement la visualisation des variables par classes pour voir

comment se présente nos données Les données sont générées dans un simulateur GA-ZEBO avec des commandes d’ordre d’angle de rotations, de vitesses four-nies à chaque unités motrices du robot.

11.2 Descriptifs de nos variables

Les données provenant des capteurs ainsi que des combinaisons de commandes et de valeurs permettent d’avoir au total 34 variables qui sont :

Trang 40

w : commande de la vitesse angulaire ;

v : commande de la vitesse linéaire ;

vr1, vr2 : vitesses des roues droites avant et arrière respecitvement ;

vl1, vl2 : vitesses des roues gauches avant et arrière respecitvement,

Ces vitesses sont mesurées par les odomètres(encodeurs) ;

theta_point : vitesse angulaire mesurée par le IMU (Unertial

Measure-ment Unit, ou centrale inertielle) ;

vr = (vr1+vr2)/2 ;

vl = (vl1+vl2)/2 ;

L = l’axe entre les deux roues ;

vg = vitesse linéaire calculée en se basant sur le gps (Vg = delta(position_gps)/delta(t)) ;

Ngày đăng: 30/10/2020, 21:17

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w