Le présent document est le fruit d’une expérience de 6 mois au sein del’INRA dont la thématique porte sur : l’analyse des mesures en continu de la température internechez le porc : reche
Trang 1UNIVERSITÉ NATIONALE DU VIETNAM, HANO¨ I
INSTITUT FRANCOPHONE INTERNATIONAL
Emmanuel GNOFAM
Analyse des mesures en continu de la température interne chez le porc : recherche
de prédicteurs des réponses des animaux face à un stress thermique
Phân tích các phép đo liên tục nhiệt độ bên trong của lợn : tìm kiếm các mô hình
dự đoán phản ứng của động vật đối với ứng suất nhiệt
MÉMOIRE DE FIN D’ÉTUDES DU MASTER INFORMATIQUE
Sous la direction de :
M David RENAUDEAU
HANOI – 2020
Trang 2Emmanuel GNOFAM
Analyse des mesures en continu de la température interne chez le porc : recherche
de prédicteurs des réponses des animaux face à un stress thermique
Phân tích các phép đo liên tục nhiệt độ bên trong của lợn : tìm kiếm các mô hình
dự đoán phản ứng của động vật đối với ứng suất nhiệt
MÉMOIRE DE FIN D’ÉTUDES DU MASTER INFORMATIQUE
Sous la direction de :
M David RENAUDEAU
HANOI – 2020
Trang 3Attestation sur l’honneur
J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que les données et lesrésultats qui y sont présentés sont exacts et n’ont jamais été publiés ailleurs La source des
informations citées dans ce mémoire a bien été précisée
Signature de l’étudiant
Emmanuel GNOFAM
Trang 4♥ A mes très chers parents
Autant de phrases et d’expressions aussi éloquentes soient-elles ne sauraient exprimer ma titude et ma reconnaissance Vous avez toujours été présents à mes côtés pour me soute-nir,m’encourager, me conseiller et m’orienter au bon chemin Que DIEU le tout puissant vouspréserve, vous accorde santé, bonheur, quiétude de l’esprit et vous protège de tout mal
gra-♥ A mes très chères familles
Vous n’avez jamais cessé de me réconforter, de m’aider et de me diriger
♥ A tous mes professeurs
C’est une grande fierté pour moi d’être votre étudiant En témoignage de mon respect et de magrande affection
♥ A mon encadrant de stage
Je voudrais vous adresser ma gratitude, mes sincères reconnaissances pour tout ce que vous aviezfait pour moi durant mon stage.Votre patience, votre disponibilité et surtout la confiance quevous avez porté à mon égard m’a beaucoup aidé dans l’avancement de mes travaux En troismots, je dirai : vous m’aviez formé
♥ A tous mes amis
J’ai l’honneur d’avoir des amis si gentils, fidèles, sincères et qui n’ont jamais hésité de partageravec moi mes soucis, mon malheur et mon bonheur
♥ Je dédie ce travail
Trang 5Il m’a été très difficile de rédiger cette partie par souci d’oublier les personnes qui m’ont été trèschères Je tiens à exprimer dans un premier temps mes profondes gratitudes à Dieu qui m’a donné
la santé, la force et le courage de pouvoir réaliser ce document Aussi, mes remerciements vont à :
• Nos parents M GNOFAM N Bilighan et Mlle ALI BOUAI Afoua pour leurs conseils, leursoutien moral, financier et spirituel ;
• Monsieur Ngô Tu Lap, Docteur et Directeur de l’Institut Francophone International (IFI),pour sa foi en ce centre et les efforts qu’il y déploie ;
• Monsieur Ho Tưong Vinh, Enseignant chercheur et Directeur Adjoint et Responsable desEtudes du Master Systèmes Intélligents et Multimédia IFI, pour sa foi en ce centre etefforts qu’il y déploie ;
• Monsieur Nguyen Hong Quang, Enseignant chercheur et Responsable du Etudes du MasterRéseaux et Systèmes communicants d’IFI, pour sa foi en ce centre et efforts qu’il y déploie ;
• Madame Florence Gondret, Directrice de l’INRA Saint Gilles pour sa foi en cet Institut etefforts qu’il y déploie ;
• Monsieur David RENAUDEAU, Docteur et Responsable d’équipe "Alimentation et tion" pour les efforts qu’il y déploie ;
Nutri-• Tout le personnel Enseignant, Administratif et Technique de l’IFI pour leur disponibilité
et soutien durant notre période de formation ;
• Tous nos camarades de l’Institut Francophone International Je réalise chaque jour quec’est une chance de partager ma vie avec des gens aussi formidables, qui m’ont tous aidés,parfois même de manière inconsciente, à franchir les différentes étapes jusqu’à aujourd’hui
Trang 7Le stage est une période de concrétisation des acquis et des connaissances requises pendant desannées de formation Il reste un facteur essentiel qui contribue à l’amélioration et au développe-ment de la personnalité du stagiaire Aussi, lui permet-il de devenir un praticien après avoir été
un théoricien Dans ce sens, j’ai effectué mon stage de mémoire pour l’obtention du diplôme demaster recherche en systèmes intelligents et multimédia au sein de INRA (Institut National de laRecherche Agronomique ) Le présent document est le fruit d’une expérience de 6 mois au sein del’INRA dont la thématique porte sur : l’analyse des mesures en continu de la température internechez le porc : recherche de prédicteurs des réponses des animaux face à un stress thermique.Après une brève étude sur l’analyse mathématique des rythmes nycthéméraux de la températurecorporelle du porc, j’ai choisi l’équation mathématique à utiliser pour construire le modèle Pourcela, j’ai utilisé un modèle mixte contenant la régression non linéaire et les modèles cosinor àune, deux , trois et quatre composantes Après l’ajustement du modèle mixte sur un animal,j’ai retenu le meilleur modèle (cosinor à 4 composantes + nls) pour le reste des animaux Pour lavalidation du modèle, j’ai utilisé le RSS "Residual Sum Square" comme méthode de validation Pour terminer, j’ai regardé sur les paramètres du modèle, l’impact du facteur sexe et l’influence
de ces paramètres sur la réponse de l’animal par la technique de l’analyse de la sensitivité
Trang 8The internship is a period of realization of the acquired knowledge and skills required during years
of training It remains an essential factor that contributes to the improvement and development
of the trainee’s personality It therefore allows him to become a practitioner after having been
a theorist In this sense, I completed my thesis internship for the master’s degree in research inintelligent systems and multimedia at INRA (Institut National de la Recherche Agronomique).This document is the result of a 6 months experience at INRA whose theme is : Analysis
of continuous measurements of internal temperature in pigs : search for predictors of animalresponses to heat stress After a brief study on the mathematical analysis of the nycthemeralrhythms of pig body temperature, I choose the mathematical equation which i use to constructthe model To do this, I used a mixed model containing non-linear regression and cosine modelswith one, two, three and four components on a single animal After adjusting the mixed model
to an animal, I choose the best model for the rest of the animals For the validation of themodel, I used the validation method : the RSS "Residual Sum Square" Finally, I looked on theparameters of the model, the impact of the gender factor and the influence of these parameters
on the animal’s response using the sensitivity analysis technique
Trang 10Table des matières
1 Introduction générale 1
1.1 Contexte 1
1.2 Problématique 1
1.3 Objectifs 1
1.4 Plan 1
I Présentation de l’IFI et de l’INRA 2 1 Introduction 3
2 Présentation du cadre d’étude : IFI 3
2.1 Objectifs 4
2.2 Conditions d’accès et mode de recrutement 4
2.3 Organigramme de l’IFI 4
2.4 Formation 5
2.4.1 Parcours systèmes intelligents et multimédia 5
2.4.2 Parcours systèmes et réseaux communicants 5
2.4.3 Master en Banque, Finance et Fintech 5
2.4.4 Master en Information - Communication, Spécialité Communi-cation digitale et éditoriale 5
3 Présentation du cadre de stage : INRA 6
3.1 Objectifs 6
3.2 Organisation de PEGASE 7
3.3 Syslait – Les systèmes laitiers 7
3.4 Sysporc – Le porc dans les systèmes d’élevage 7
3.5 Lactation – Physiologie de la lactation 7
3.6 Adaptation – Physiologie de l’adaptation, nutrition et santé 8
3.7 Croissance – Physiologie de la croissance et qualité des produit 8
3.8 GG – Génétique et génomique 8
3.9 Alinut – Alimentation et nutrition 8
4 Conclusion 8
II Etat de l’art 9 1 Introduction 10
2 Procédures d’analyses des rythmes nycthéméraux 10
Trang 112.1 Inspection visuelle 10
2.2 Détection de la rythmicité 10
2.3 Estimation des paramètres 10
3 Modèles Mathématiques 11
4 Choix et évaluation du modèle 14
5 Conclusion 15
III Données, Matériels et Méthodes 16 1 Introduction 17
2 Données 17
3 Chargement des données 18
3.1 Définition du répertoire de travail 18
3.2 Chargement 19
4 Prétraitement des données 19
4.1 Transformation des données 19
4.1.1 Supression de certaines lignes 19
5 Analyse descriptive univariée 19
5.1 Indicateurs statistiques pour variables quantitatives 19
5.1.1 Représentation graphique de la varaible temperature 20
5.2 Compléments pour les variables quantitatives discrètes 20
5.2.1 Représentation graphiques pour variable Sexe 21
5.3 Graphiques des moyennes de température 21
5.3.1 Période de lactation 21
5.3.2 Période de Post sevrage 22
5.3.3 Période d’engraissement 22
5.3.4 Cycle de vie du porc 3343 23
6 Étapes de réalisation de projet 24
6.1 Choix du nombre de composantes pour le modèle cosinor 24
7 Conclusion 26
IV Résultats 27 1 Introduction 28
2 Interprétation des résultats 28
2.1 Ajustement du modèle sur l’animal "3343" durant son cycle de vie 29
2.2 Ajustement d’un modèle non linéaire unique à plusieurs sujets 30
2.2.1 Phase de lactation 31
2.2.2 Phase de post sevrage 33
2.2.3 Phase d’engraissement 35
3 Moyenne des paramètres pour tous les animaux 37
4 Validation du modèle 38
5 Évolution du mésor en fonction des animaux et du sexe 39
Trang 126 Impact des facteurs sur les paramètres du modèle 40
6.1 Impact du sexe sur les paramètres du modèle 40
6.1.1 Impact du sexe sur le mésor 40
6.1.2 Impact du sexe sur l’Amplitude1 41
6.1.3 Impact du sexe sur la phase1 41
6.1.4 Impact du sexe sur la période1 42
7 Analyses de sensibilité séquentielles à une seule variable 42
8 Conclusion 43
9 Conclusion générale 44
Trang 13Table des figures
I.1 IFI, vue de satellite 3
I.2 Organigramme IFI [4] 4
I.3 UMR PEGASE, vue de satellite 6
I.4 Organisation générale de INRA [9] 7
II.1 Les 4 paramètres fondamentaux d’un rythme biologique [3] 11
III.1 Site d’implantation sur l’animal de la capsule [13] 17
III.2 Distribution de la température des animaux 20
III.3 Moyenne de température des animaux pendant la lactation 22
III.4 Moyenne de température par heure et par animal pendant le post sevrage 22
III.5 Moyenne de température par heure et par animal(porc) pendant l’engraissement 23 III.6 Moyenne de température pour l’animal 3343 du 27/10/2016 au 21/03/2017 24
III.7 la réponse de l’animal 3343 25
III.8 Variabilité interindividuelle des animaux en engraissement 26
IV.1 Ajustement du modèle sur l’animal 3343 pendant toute sa vie 30
IV.2 modèle général de la réponse de tous les animaux pendant l’engraissement 31
IV.3 Prédiction de tous les animaux avec facet_wrap pendant la lactation 32
IV.4 Récapitulatif des moyennes de paramètres estimés pendant la lactation 33
IV.5 Prédiction de tous les animaux pendant le post-sevrage 34
IV.6 Récapitulatif des moyennes de paramètres estimés pendant le post-sevrage 35
IV.7 Prédiction de tous les animaux pendant l’engraissement 36
IV.8 Récapitulatif des paramètres moyens estimés pendant l’engraissement 37
IV.9 Moyenne des paramètres pour tous les animaux 38
IV.10Évaluation du modèle pour chaque animal 39
IV.11Évolution du mésor pour chaque animal selon sexe et en fonction de l’âge 40
IV.12Influence des paramètres sur la réponse de l’animal 43
Trang 14Liste des sigles et acronymes
INRA Institut National de Recherche Agronomique
IFI Institut Francophone International
VNU Vietnam National University
RSS Residual Sum Square
phi la phase i, avec i définissant les différentes phases prises par chaque porc.
Trang 151.2 Problématique
♥ Pourquoi modéliser la réponse de l’animal ?
Nous voulons aider les éleveurs dans la prise de décision en concevant un modèle qui résumel’intégralité de l’information sur les rythmes nycthéméraux de la température corporelle
1.3 Objectifs
Les objectifs du stage sont de modéliser la réponse de l’animal, de regarder d’une part sur lesparamètres du modèle, l’impact de certains facteurs (sexe etc.) et d’autre part l’impact desparamètres (Mesor, Amplitude, Phase, Période) sur la réponse de l’animal
1.4 Plan
Notre stratégie est :
• de faire un état de l’art des modèles mathématiques disponibles pour modéliser les rythmesnycthéméraux de la température interne du porc : étudier leurs avantages et inconvénients ;
• de modéliser la réponse d’un animal en utilisant le meilleur modèle retenu ;
• de regarder sur les paramètres du modèle, l’impact de certains facteurs (sexe,etc.) et ensuiteajuster le modèle à tous les animaux du jeu de données
Trang 16Chapitre I
Présentation de l’IFI et de l’INRA
Trang 171 Introduction
Dans ce chapitre, je vais présenter d’une manière générale, mon cadre d’étude (Institut phone International) et mon cadre de stage de fin de formation (Institut National de RechercheAgronomique)
Franco-2 Présentation du cadre d’étude : IFI
L’Institut Francophone International (IFI) a été créé en 1993 sur la base du développement
de l’Institut de la Francophonie pour l’Informatique,et de l’intégration du Pôle UniversitaireFran¸cais à Hanoi, fondé en 2006 Il se situe dans l’enceinte de l’Université Nationale du Vietnam(Hanoi) Officiellement nommé "Institut Francophone International" à compter du 18 novembre
2014, l’IFI est un organisme international de recherche et de formation de haute qualité, rattaché
à l’Université Nationale du Vietnam, Hanoi Il a pour mission d’apporter un appui logistique
et technique en informatique aux différentes entreprises, laboratoires de recherche etc Il offreaussi un cadre de formation en informatique Cette offre de formation est constituée de deux(02) filières à savoir : le Système Intelligents et Multimédia (SIM) et Réseau et Systèmes Com-municants (RSC) Depuis sa création en 2009, l’IFI forme ses étudiants en vue de l’obtentiond’un double diplôme de master recherche La figure I.1 indique une vue satellite de l’InstitutFrancophone International
Figure I.1 – IFI, vue de satellite
Trang 182.1 Objectifs
Etant une école de rénommée en informatique, l’IFI a pour principaux objectifs de :
• doter les étudiants de connaissances en Intelligence artificielle, machine learning, deep ning, traitement d’images et de vidéos, vision par ordinateur, modélisation et simulationdes systèmes complexes, fouille de données, etc ;
lear-• former les étudiants aux méthodes et à la pensée de la recherche scientifique, et sontcapables de résoudre indépendamment les problèmes techniques
2.2 Conditions d’accès et mode de recrutement
• Conditions d’accès :
Licence (BAC +3) en informatique ou dans une spécialité proche (Mathématiques, Physiques).Langue fran¸caise : au moins de DELF B2 (selon le Cadre européen commun de référence pourles langues) ou équivalent (TCF 400 ), sauf les candidats provenant de pays ó le fran¸cais est
la langue principale ou officielle, et pour ce qui ont déjà un diplơme universitaire de la langueFran¸caise
• Mode de recrutement : évaluation du dossier et entretien de recrutement
2.3 Organigramme de l’IFI
L’Institut Francophone International est constitué d’une direction et des divisions La directionest composée d’une Direction , d’un conseil scientifique, des services, des laboratoires et presse
et des centres comme l’indique plus clairement l’organigramme I.2 ci-dessous
Figure I.2 – Organigramme IFI [4]
Trang 192.4 Formation
L’IFI offre, pour sa formation, (04) filières au choix : les systèmes intelligents et multimédia,systèmes et réseaux communicants, master en banque finance et fintech , master en information
- communication, spécialité communication digitale et éditoriale
Le master informatique : option systèmes intelligents et multimédia combine des connaissancesissues de différents domaines d’études en Informatique (modélisation et simulation, intelligenceartificielle, fouille de données, interaction homme-machine, génie logiciel, etc.) Le programmevise à concevoir et à construire des systèmes intelligents d’aide à la décision basés sur l’ex-ploitation des informations multimédia Le programme s’oriente vers l’amélioration du potentielscientifique, intellectuel et de la vision des étudiants en réponse aux innovations croissantes dans
le domaine de la science et de la technologie, en particulier dans la révolution industrielle 4.0.[8]
Le master informatique : option réseaux systèmes communicants combine des connaissances sues de différents domaines d’études (réseaux avancés stockage, cloud et virtualisation, sécuritédes réseaux, réseaux ad-hoc avances, réseaux sans fil et mobile, administration des systèmes etdes réseaux, etc.) Le programme vise à concevoir et à construire des plateformes de communi-cation durable qui assurent un service transparent et permanent Le programme s’oriente versl’amélioration du potentiel scientifique, intellectuel et de la vision des étudiants en réponse auxinnovations constantes dans le domaine de la science et de la technologie, en particulier dans larévolution industrielle 4.0 [7]
Ce parcours a pour objectifs de fournir aux étudiants des connaissances approfondies et les plusrécentes dans le secteur bancaire et financier à l’ère d’industrie 4.0 Le programme Fintech enpartenariat entre IFI et EM Normandie est le premier mis en œuvre au Vietnam et le deuxième
en Asie Il y a la participation des enseignants et experts internationaux ayant de grandesexpériences de formation et de conseil provenant des centres mondiaux en marché financier et
Trang 20com aider les diplômés en fran¸cais et en Sciences humaines et sociales souhaitant travailler dans ledomaine de communication à ajouter des connaissances de communication digitale et éditorialeainsi que des techniques informatiques utilisées dans ce domaine ;
- aider les diplômés en Sciences et en Sciences technologiques à ajouter des connaissances decommunication ;
- aider les diplômés en Journalisme-Éditation, les correspondants et les éditeurs à moderniserleur procédure professionnelle.[6]
L’UMR 1348 Physiologie, Environnement et Génétique pour l’Animal et les Systèmes d’Élevage(PEGASE) existe depuis le 1er janvier 2012 L’UMR 1348 dépend des deux départements derecherche INRA Physiologie Animale et Systèmes d’Élevage (PHASE) et Génétique Animale(GA), ainsi que du département d’enseignement et de recherche Agrocampus Ouest ProductionsAnimales, Agroalimentaire, Nutrition (P3AN) L’image 3 ci-dessous indique une vue satellite del’UMR PEGASE
Figure I.3 – UMR PEGASE, vue de satellite
Trang 213.2 Organisation de PEGASE
Les recherches de l’UMR PEGASE sont soutenues par l’équipe gestion d’unité, informatique etdocumentation pour les équipes (Guide), dirigée par Florence Gondret (RH, missions, secrétariat,informatique, documentation scientifique ) La figure I.4 ci-dessous représente l’organisation del’UMR PEGASE
Figure I.4 – Organisation générale de INRA [9]
Ci-dessous, une petite description des sept (7) différentes équipes qu’on retrouve à l’INRA desaint Gilles
3.3 Syslait – Les systèmes laitiers
L’équipe « Syslait » concentre ses recherches sur les problématiques actuelles de l’élevage laitier(compétitivité, autonomie, environnement ), et étudie de nouvelles approches stratégiquesvisant à améliorer l’efficience d’utilisation des ressources, du fonctionnement du troupeau, etdes systèmes de production
3.4 Sysporc – Le porc dans les systèmes d’élevage
L’équipe « Sysporc » travaille au développement de systèmes et d’outils contribuant à gence de pratiques innovantes et durables, en tenant en compte des contraintes de l’élevageporcin (compétitivité, impact environnemental, limitation des ressources, bien-être animal )
l’émer-3.5 Lactation – Physiologie de la lactation
L’équipe « Lactation » s’attache à produire de nouvelles connaissances sur les mécanismesbiologiques de production du lait, pour proposer de nouvelles stratégies d’élevage intégrant lesdifférentes dimensions de la durabilité
Trang 223.6 Adaptation – Physiologie de l’adaptation, nutrition et santé
L’équipe « Physiologie de l’adaptation, nutrition et santé animales » étudie la réponse adaptative
de l’animal dans différentes conditions d’élevage du porc afin de proposer les pratiques les plusadaptées, non seulement en terme de production, mais aussi en terme de santé et de bien-être
3.7 Croissance – Physiologie de la croissance et qualité des produit
L’équipe « Physiologie de la croissance et qualités des produits» étudie la croissance des animauxd’élevage et plus particulièrement la plasticité des tissus musculaires et adipeux , non seulementpour proposer de nouvelles stratégies d’élevage visant à améliorer l’efficience de la croissance,mais aussi pour améliorer ou garantir la qualité des produits carnés
3.8 GG – Génétique et génomique
L’équipe « Génétique et Génomique » examine certains caractères génétiques (constitution,mobilisation des réserves énergétiques) des volailles comme le poulet et le canard, dans le but
de répondre aux limitations croissantes des ressources alimentaires réservées à l’élevage
3.9 Alinut – Alimentation et nutrition
L’équipe « Alimentation et Nutrition » vise à apporter de nouvelles connaissances sur la nutritiondes animaux d’élevage (porcs, ruminants, veaux et volailles) pour proposer de nouvelles solutionsalimentaires, et ainsi contribuer non seulement à une réduction des coˆuts de production, maisaussi à l’amélioration de la qualité des produits, dans un contexte ó les exigences sociétalessont de plus en plus prégnantes
L’Institut Francophone International (IFI) est une institution de l’Université Nationale du nam ayant pour mission de former les étudiants en master international C’est aussi un cadre deformation disposant de quatres filières : systèmes intelligents et multimédia, systèmes et réseauxcommunicants, banque finance et fintech, communication digitale et éditoriale Il accueille aussides stagiaires en fin de formation De même, INRA est un laboratoire de recherche Fran¸cais quioffre des stages de recherche à tout étudiant désirant travailler dans ledit domaine Pour mapart, j’ai fait mon stage de fin de formation dans l’équipe Alinut (Alimentation et nutrition)
Trang 23Viet-Chapitre II
Etat de l’art
Trang 241 Introduction
Ce chapitre est consacré à l’étude mathématique des rythmes nycthéméraux de la températurecorporelle du porc En effet, nous devrons comprendre premièrement les équations mathéma-tiques et ensuite les implémenter en fonction de la solution que nous voulons obtenir Pour cela,nous allons en premier lieu aborder les procédures d’analyse des rythmes nycthéméraux de latempérature corporelle, ensuite l’étude des modèles mathématiques existants dans la bibliogra-phie, puis des techniques d’évaluation de notre modèle
Ci-dessous les étapes d’analyses et de modélisation en workflow
1- Etapes d’analyses :
-Chargement des données ;
-Inspection visuelle ;
-Prétraitement des données ;
-Analyse descriptive univariée ;
-Détection de la rythmicité ;
-Estimation des paramètres
2 Etapes de modélisation :
- Application du modèle de régression non linéaire sur l’ensemble des animaux ;
- Application des modèles à une, deux, trois quatre composantes sur un animal ;
- Choix du modèle à 4 composantes ;
- Modèle retenu : Modèle mixte (Régression non linéaire et cosinor à 4 composantes) ;
- Evaluation du modèle : RSS
2.1 Inspection visuelle
La première étape dans une analyse des données temporelles consiste à faire une inspectionvisuelle des données (time plot) En effet, celle-ci guide la sélection des méthodes d’analysesnumériques
2.2 Détection de la rythmicité
La détection de la rythmicité est une étape très importante dans le choix de méthode à utiliserpour la modélisation
2.3 Estimation des paramètres
Plusieurs procédures d’analyse de données calculent les paramètres rythmiques en même tempsqu’elles évaluent l’existence de la rythmicité, mais les deux tâches peuvent être considérées sé-parément à des fins didactiques Quatre principaux paramètres sont souvent utilisés pour modé-
Trang 25liser les rythmes nycthéméraux de la température corporelle La figure II.1 ci-dessous illustre lesparamètres fondamentaux d’un rythme.
Figure II.1 – Les 4 paramètres fondamentaux d’un rythme biologique [3]
• Le mésor (M) : il correspond à la moyenne des valeurs de température obtenues par unité
de temps pour la période considérée ;
• L’amplitude (A) : elle correspond à la moitié de la variabilité totale, donc de la différenceentre le pic et le creux de la variable étudiée ;
• La phase ou (acrophase) φ : elle correspond à la localisation du sommet de la variation
dans l’échelle du temps pour la période considérée ;
• La période T : elle correspond à l’intervalle de temps mesuré entre deux épisodes ou
accidents qui vont se reproduire, identique à eux-mêmes ;
Il existe dans la bibliographie toute une liste de méthodes mathématiques pour la modélisationdes rythmes nycthéméraux de la température corporelle du porc Je cite pour cela :
• Cosinor and cosine fit :
Ce modèle est basé sur le raisonnement suivant : étant donné que les rythmes circadiens peuventêtre considérés comme des rythmes lisses avec ajout de bruit, un modèle constitué de courbes
en cosinus avec des périodes connues (24 heures seules ou avec des termes harmoniques ajoutés)peut être ajusté par la méthode des moindres carrés aux données comme une estimation de laconfiguration du rythme régulier L’analyse du Cosinor permet de mesurer quatre paramètres
de l’onde sinuso¨ıdale calculée : M, A, Phase (φ), T, qui sont les propriétés d’un rythme pour
une période donnée L’équation mathématique du modèle cosinor s’écrit sous forme :
(II.1) y(t) = M + A ∗ cos(2 ∗ π ∗ t/T + φ) + e(t)
ó e(t) indique l’erreur en fonction du temps Le modèle cosinor dispose de quelques avantagesqui sont entre et autres : il est bien adapté pour les données non équidistantes , il est bien adapté
Trang 26pour les données en série indépendantes , il utilise la méthode des moindres carrées et permet
de définir la fonction sinuso¨ıde qui se rapproche le plus de la série temporelle observée, il permetd’obtenir les différents paramètres d’une aire avec les intervalles de confiance, le cosinor estinsensible au bruit introduit dans les données , il est utilisable pour les données non équirépartiesdans le temps , il analyse des séries temporelles de différentes origines , il détecte les différentsrythmes d’un ensemble de séries de données , il effectue différentes sortes d’analyses spectrales.Toutefois, l’inconvénient majeur retenu est que cette méthode nécessite que l’on connaisse àpriori la période sur la quelle on veut l’appliquer
• Modèle de régression harmonique (analyse harmonique) :
La méthode d’estimation des périodes est réalisée par analyse spectrale , qui calcule la densitéspectrale de puissance de la série temporelle dans le domaine fréquentiel S’il existe des cycles
de longueur de période circadienne dans la série chronologique, la courbe de densité spectraleindique des pics à chaque fréquence associée Avec les périodes obtenues à partir de l’analysespectrale L’analyse harmonique fournit les estimations de trois paramètres (amplitude, phase
et moyenne) décrivant les patterns rythmiques Soit X = (Xt)t=1, ,T une série temporelle Lemodèle de régression harmonique est un modèle fondé sur la décomposition :
2 Soit par la méthode du maximum de vraisemblable
L’analyse harmonique dispose d’un avantage clé qui est que la rythmicité biologique peut être,ainsi, validée statistiquement dans sa significativité contre la probabilité de P < 0.05 que l’effetd’oscillation est due aux effets du hasard.[1] L’inconvénient majeur retenu est identique à celui
de tous les rythmes biologiques : connaissance de la période à priori
• Lomb – Scargle periodogram :
Trang 27Ce modèle ressemble au périodogramme de Enright sur certains points Il dispose des avantagessuivants : il permet l’analyse de données collectées à intervalles précis, il permet également d’ana-lyser des ensembles de données destinés à comporter des observations équidistantes, mais pourlesquels une ou plusieurs valeurs sont manquantes en raison d’une défaillance de l’équipement
ou d’autres problèmes Toutefois, l’inconvénient retenu est sa fiabilité moyenne c’est à dire larépétabilité moyenne dans la détermination des résultats exacts
• Enright periodogram :
Il subdivise à plusieurs reprises les données en segments de différentes périodes et calcule unindice de variabilité pour chacune d’elles Cette méthode a souvent été utilisée pour distinguerles rythmes bruyants des oscillations aléatoires lorsque la période est connue En parlant desavantages, on retient que les séries chronologiques dépendantes des séries avec des mesureséquidistantes sont disponibles De plus, le test de « significance » pourrait utiliser la statistique
F pour comparer les variabilités entre classes et parmi les classes, testant ainsi l’hypothèse nulled’égalité des moyennes de classe Par contre l’inconvénient est le même que le modèle de LombScargle periodogram ie la répétabilité moyenne dans la détermination des résultats exacts
• Analyse de Fourier :
L’analyse de Fourier (également appelée « analyse spectrale ») repose sur la vision naire de Fourier selon laquelle toute série chronologique, quelle que soit sa forme ou sa régularité,peut être décrit par une série d’ondes sinuso¨ıdales et cosinuso¨ıdes de fréquences différentes End’autres termes,la théorie de Fourier est basée sur le fait que chaque signal stationnaire peutêtre décomposé en une somme de sinuso¨ıdes simples de fréquence croissante La transformation
révolution-de Fourier consiste à décomposer une fonction selon ses fréquences L’équation mathématique
de la transformée de Fourier est :
• Histogramme et periodogramme
L’article "Analysis of the circadian rhythm of body temperature" de ROBERTO REFINETTIprésente des méthodes de calcul et d’évaluation statistique de la période, de l’amplitude, duniveau moyen et de la forme générale du rythme circadien de la température corporelle Lapériode est analysée par la procédure du périodogramme, tandis que les autres paramètres(amplitude, phase, mésor) sont analysés par la méthode de l’histogramme L’auteur s’oppose
du fait que la majorité des méthodes d’analyse des rythmes nycthéméraux de la température
Trang 28corporelle suppose que les rythmes ont une forme cosinudale or en réalité tous les rythmes n’ontpas cette forme [12] L’avantage retenu est que les deux procédures sont simples à mettre enœuvre et relativement insensible aux points de données parasites ; cette technique ne tient pascompte du fait que le rythme de la température corporelle se rapproche d’une onde cosinus Toutefois, elle n’est pas applicable dans le cas du rythme à plusieurs périodes comme le cas denotre travail.
• Nouveau modèle d’équations différentielles
L’article "A statistical model of the human core-temperature circadian rhythm" de EMERY N.BROWN et All présente un modèle qui relie directement les modèles de simulation basés sur deséquations différentielles et les méthodes d’analyse de régression harmonique et permet l’analysestatistique des propriétés statiques et dynamiques du stimulateur circadien à partir de donnéesexpérimentales [2]
Les paramètres du modèle sont : free run, forced desynchrony, constant routine Les principauxmarqueurs sont : la température centrale, les taux plasmatiques de cortisol, les taux plasmatiques
de mélatonine L’équation du modèle de Van der pol s’écrit sous la forme ci-dessous :
ó le nombre d’harmoniques est égale à 2 ou 3 Le choix de d = 2 découle de l’analyse de
la régression harmonique dans le cadre du protocole de routine constante Le choix de d=3, découle de la régression harmonique équivalent à la représentation asymptotique en série del’oscillateur de Van der Pol Ce modèle a pour avantage de combiner la régression harmonique etles équations différentielles et donc permet l’analyse des propriétés statistiques et dynamiques.Pour étudier les propriétés dynamiques, on utilise l’équation différentielle et pour étudier lespropriétés statistiques, on utilise la régression harmonique à cause de la structure sinuso¨ıdale deces séries de données Par contre l’inconvénient qui en découle est la connaissance de la période
Trang 29• Évaluation : pour évaluer le modèle, j’ai utilisé l’estimation des écarts résiduels (RSS).
Ce chapitre a été consacré à l’état de l’art sur les modèles mathématiques existants dans lachronobiologie et spécifiquement les modèles des rythmes nycthéméraux de la température cor-porelle du porc J’ai pour cela, étudié les modèles : cosinor, régression harmonique, histogramme
et periodogramme, transformée de fourrier, modèles d’équations différentielles, enright gram etc et j’ai choisi le modèle cosinor pour modéliser la réponse de l’animal Ce choix est dˆu
periodo-au fait que les courbes suivent une allure cosinuso¨ıdale et que ce modèle est le plus utilisé dans
le domaine de la chrono biologie Dans le chapitre suivant je parlerai des données, du matériel
et des méthodes utilisées pour réaliser ce projet
Trang 30Chapitre III
Données, Matériels et Méthodes
Trang 311 Introduction
Ce chapitre est consacré à l’étude générale du jeu de données utilisé pendant le stage Il consiste
en la présentation des données, au pré-traitement des données, en une brève analyse descriptive
et des étapes de réalisation du projet
Les données sont collectées par les capteurs implantés dans le cou de l’animal durant l’hiver
2016 comme l’indique la figure III.1
Figure III.1 – Site d’implantation sur l’animal de la capsule [13]
J’ai eu deux bases de données infoc_porc de 24 observations et 11 variables et t_corporelle de 807
383 observations et 5 variables en ma disposition pendant le stage J’ai crée la base de donnéesmerge_reprise qui est la fusion de infoc_porc et de t_corporelle Elle contient les variables :Date_Utc, Id, Time, Température et Rep, N_truie, Porc, Sexe, Date_naiss, Poids_naiss, Date1,Poids1, Bloc, Ordre Je fais une description détaillée de ces variables dans les lignes suivantes :
• Date : c’est une variable de type Factor : elle représente la date de la mesure de la rature : je l’ai converti en format Date pour une manipulation facile
tempé-• Heure : c’est une variable de type Factor : elle représente l’heure de la mesure de latempérature
• Id : c’est une variable nominale : elle identifie de fa¸con unique le porc
• Time : c’est une variable quantitative discrète de type « Integer » : elle désigne le temps
en seconde auquel la température a été collectée
Trang 32• Temperature : c’est une variable numérique de type factor Elle désigne la températuremesurée sur l’animal à une date et heure donnée.
• Sample : c’est une variable numérique de type « Integer » Elle représente les lignes du jeu
de données
• Rep : c’est une variable numérique de type « Integer » Elle désigne le type tation 1- signifie la première expérience, 2-signifie la seconde expérience
d’expérimen-• N_truie : c’est une variable numérique de type « Integer » Elle identifie de fa¸con unique
la truie (la mère du porc étudiée )
• Porc : c’est une variable numérique de type « Integer » Elle désigne de fa¸con unique lenuméro du porc
• Sexe : c’est une variable numérique de type « Integer » Elle désigne le sexe du porc :3-signifie que l’animal est du sexe femelle et 1-signifie que l’animal est du sexe mâle
• Date_naiss : c’est une variable de type Factor : elle représente la date de naissance : jel’ai converti au format Date
• Poids_naiss : c’est une variable de type Factor : elle désigne le poids à la naissance
• Date1 : c’est une variable de type factor Elle désigne la date à laquelle la capsule a étéintroduite dans le cou de l’animal : nous l’avions converti au type Date
• Poids1 : c’est une variable de type factor : elle désigne le poids au moment ó l’on aintroduit la capsule dans le cou de l’animal
• Bloc : c’est une variable numérique de type « Integer » : un bloc regroupe un frère et unesoeur
• Ordre : c’est une variable ordinale de type « Integer » : elle désigne l’ordre d’opération
3.1 Définition du répertoire de travail
Pour définir le répertoire de travail dans lequel nous voulons stocker notre script r, j’ai utilisé lacommande suivante :
setwd("C:/Users/egnofam/Documents/stage_analyse_temporelle/donnees/good_data")
Cette fonction contient comme paramètre le seul chemin d’accès au répertoire que j’ai choisi
Trang 333.2 Chargement
J’ai importé les données depuis le répertoire de travail grâce aux lignes de commande ci-dessous :info_porc<-read.csv2("info_porc.csv") #chargement du fichier infoc_porc
t_corporelle<-read.csv2("t_corporelle.csv") #chargement du fichier t_corporelle
4.1 Transformation des données
j’ai transformé les colonnes Date_naiss, Date1, Date_Utc, Date qui étaient de type factor entype Date pour pouvoir effectuer les calculs Ensuite, j’ai calculé l’âge de tous les animaux
J’ai supprimé les jours ó les animaux ont été abattu (puisque après abattage il y avait toujours
le capteur dans le cou) ce qui renvoyait toujours les températures erronées J’ai aussi suppriméles lignes ó la date (Date) est supérieure à la date (date1+1) En effet, la date1 désigne ladate à laquelle la capsule a été implantée dans le cou de l’animal et la date représente la date àlaquelle la capsule a été activée (activé ne veut pas forcement dire qu’elle est implantée dans lecou de l’animal)
5 Analyse descriptive univariée
Cette étape est l’analyse descriptive des données numériques en r J’ai pour cela visualisé le jeu
de données qui contient 14 variables et calculé certains indicateurs statistiques
5.1 Indicateurs statistiques pour variables quantitatives
La moyenne de température, l’écart type, le standard déviation et les quartiles sont donnés par
la commande summary suivante :
Trang 345.1.1 Représentation graphique de la varaible temperature
Un histogramme d’une série statistique est donné par la fonction hist() :
hist(merge_reprise$Temperature, breaks =100, freq = TRUE,
main = "distribution de la temperature", xlab="temperature interne, C",",
ylab=’frequence",col = "darkred")
L’histogramme III.2 ci-dessous représente la distribution de la moyenne de température de tousles animaux en fonction de la fréquence d’apparition de la température Il en résulte que lesmoyennes de température suivent une distribution normale
Figure III.2 – Distribution de la température des animaux
• Type des variables :
Pour connaˆıtre les types de ces derniers, j’ai utilisé la commande str comme ci-dessous :
#structure of temperature
str(merge_reprise$Temperature)
5.2 Compléments pour les variables quantitatives discrètes
J’ai généré un tableau des effectifs pour chacune des valeurs de la variable sexe
table(merge_reprise$Sexe)
393509 367523
Trang 355.2.1 Représentation graphiques pour variable Sexe
Les graphiques c1 et c2 ci-dessous représentent l’effectif en fonction du sexe J’ai pour cela utilisé
le diagramme en barre et le diagramme circulaire Un diagramme en barre des effectifs est réalisé
via la commande barplot()
barplot(table(merge_reprise$Sexe),col="darkred",main="Distribution du sexe",xlab="sexe",ylab="Effectifs")
Un diagramme circulaire est réalisé au moyen de la fonction pie()
5.3 Graphiques des moyennes de température
Dans cette partie, je décris les moyennes de température par animal et par heure pour les trois
périodes de leur vie à savoir : la période de lactation, la période du post-sevrage et celle de
l’engraissement
La figure 8 ci-dessous illustre les moyennes de température par animal et par heure sur les
porcelets Je constate sur cette figure qu’il n’y a pas de rythme ou du moins que le rythme est
peu marqué En fait, les porcelets en lien avec l’allaitement mangent toutes les 45 minutes Par
conséquent de petits pics de températures apparaissent en moyenne toutes les 45 minutes Ce
qui explique la non rythmicité des porcelets
Trang 36Figure III.3 – Moyenne de température des animaux pendant la lactation
La figure 9 ci-dessous illustre les moyennes de température par animal et par heure pendant lepost-sevrage J’observe que la fréquence des prises alimentaires diminue (moins de repas)
Figure III.4 – Moyenne de température par heure et par animal pendant le post sevrage
La figure III.5 ci-dessous illustre les moyennes de température par animal et par heure pendantl’engraissement Je constate de belles courbes de température désignées par deux pics pour la
Trang 37plus part des animaux Cette bonne cyclicité se justifie par le fait que les animaux à ce stadedonné ne mangent que deux fois la plus part du temps.
Figure III.5 – Moyenne de température par heure et par animal(porc) pendant l’engraissement
Le cycle de vie du porc regroupe les 3 périodes à savoir la lactation, le post sevrage et graissement Le graphique III.6 ci-dessous illustre les moyennes de température par heure et parâge de 5 à 146 jours du porc dont l’Id est "3343" J’observe que plus le porc est jeune moins onaper¸coit la rythmicité et plus, il grandit, on aper¸coit de belles courbes de température
Trang 38l’en-Figure III.6 – Moyenne de température pour l’animal 3343 du 27/10/2016 au 21/03/2017
6 Étapes de réalisation de projet
6.1 Choix du nombre de composantes pour le modèle cosinor
L’étude de la bibliographie et l’allure des courbes observées (forme sinuso¨ıdale) m’a permis dechoisir le modèle cosinor pour la modélisation La figure III.7 ci-dessous illustre la moyenne detempérature de l’animal " 3343" en fonction de l’heure Sur cette même figure, l’on observe enabscisse, le temps (heure) et en ordonnée la moyenne de température