sta-1.2 Objectif du stage 31.2 Objectif du stageDans le cadre du projet SIAS, ce stage a pour objectifs de : Etudier les approches de composition existantes et les systèmes d'adaptation
Trang 1Institut de la Francophonie pour l'Informatique
Institut National des Télécommunications
MÉMOIRE DE FIN D'ÉTUDES MASTER EN INFORMATIQUE
Moteurs de composition pour le système d'information
sémantique et adaptatif
DO Ngoc Kien Responsable de stage : Amel BOUZEGHOUB
Ce stage a été réalisé au sein de l'équipe Base des données du département Informatique de
l'Institut National des Télécommunications
GET/INT
13 septembre 2006
Trang 2Je tiens tout particulièrement à remercier Amel Bouzeghoub pour sa proposition de ce sujet
de stage, son encadrement, ses aides et ses précieux conseils pendant 6 mois de mon stage
Je tiens également à remercier Guy Bernard de m'avoir accueilli chaleureusement dansl'équipe de recherche de l'Institut National des Télécommunications (INT)
Je voudrais aussi remercier toutes les personnes qui m'ont aidé et supporté, je pense plusparticulièrement à Bruno Defude et Serge Garlatti pour leurs conseils judicieux ainsi que lesmembres du projet SIAS qui m'ont accompagné dans cette formidable expérience
Mes plus sincères remerciements vont également à tous les professeurs et les personnels
de l'Institut de la Francophonie pour l'Informatique (IFI) pour m'avoir enseigné et donné descours de très bonne qualité pendant mes études à l'IFI
Enn, je remercie ma famille, mes parents et mes amis pour leur soutien, soit-il scientique,humain ou spirituel Sans eux, mon travail n'aurait pas abouti
Trang 3L'évolution actuelle des systèmes d'information (SI) va vers plus de personnalisation et
de réutilisation dans un environnement informatique marqué par la répartition et les logies du web (dont les services web) La notion de composition de ressources (documents,présentations, composants, services web ) devient centrale Ce stage s'intéresse aux systèmesd'information adaptatifs et sémantiques vues comme des systèmes dynamiques, distribués etadaptatifs fondés sur des mécanismes de composition et des modèles sémantiques L'idée prin-cipale est donc de chercher à mieux analyser la notion de composition pour être capable dedénir ensuite des moteurs de composition beaucoup plus réutilisables et exibles
techno-Mots-clefs : Sémantique web, adaptation, services web, composition, système d'informationsémantique, ontologies, métadonnées
Trang 4Keywords : Semantic web, adaptation, web services, composition, semantic informationsystem, ontologies, metadata.
Trang 5Table des matières
1.1 Problématique 1
1.2 Objectif du stage 3
1.3 Environnement de travail 3
1.4 Contribution de stage 3
1.5 Organisation du mémoire 4
2 Systèmes de composition existants 5 2.1 Scarce 5
2.1.1 Ontologies 6
2.1.2 Architecture 6
2.1.3 Composition et Adaptation 7
2.1.4 Discussion 8
2.2 Système de composition de ressources pédagogiques 8
2.2.1 Ontologies 9
2.2.2 Architecture 9
2.2.3 Composition et Adaptation 10
2.2.4 Discussion 11
2.3 KMP 11
2.3.1 Ontologies 12
Trang 62.3.2 Architecture 12
2.3.3 Composition et Adaptation 12
2.3.4 Discussion 12
2.4 Système de composition de Web services 13
2.4.1 Ontologies 13
2.4.2 Architecture 13
2.4.3 Composition et Adaptation 14
2.4.4 Discussion 15
2.5 Conclusion 16
3 Modèle de l'utilisateur et techniques d'adaptation 18 3.1 Modélisation de l'utilisateur 18
3.1.1 Représentation 18
3.1.2 Initialisation 23
3.1.3 Construction 25
3.1.4 Feed-back 25
3.2 Adaptation et Recommandation 26
3.2.1 Adaptation dans les systèmes de recherche adaptative 26
3.2.2 Adaptation dans les systèmes hypermédia 26
3.2.3 Recommandation 29
3.3 Conclusion 30
4 Proposition d'un moteur de composition et d'adaptation générique 32 4.1 Scénario workow 33
4.1.1 Architecture du système 34
4.1.2 Discussion 36
4.2 Proposition de moteur de composition générique 36
4.2.1 Graph générique 37
4.2.2 Architecture générale 39
4.2.3 Processus de composition générique 41
4.3 Conclusion 44
Trang 75 Réalisation 46
5.1 Moteurs d'inférence 46
5.1.1 Ontobroker 47
5.1.2 JESS 49
5.1.3 Autres moteurs d'inférence 51
5.1.4 Conclusion 51
5.2 Implantation de moteur de composition générique 52
5.2.1 Architecture générale 52
5.2.2 Métadonnées de graphe en F-Logique 54
5.2.3 Implantation de Graphe 54
5.2.4 Algorithme d'instanciation de graphe 56
5.3 Application de moteur générique 58
5.3.1 Composition de document virtuel 58
5.3.2 Composition des services web 61
5.3.3 Composition des ressources pédagogiques 64
5.4 Conclusion 65
6 Conclusions et perspectives 67 6.1 Conclusion 67
6.2 Perspectives 68
Trang 8Table des gures
2.1 L'architecture de SCARCE 7
2.2 L'architecture du système de composition des ressources pédagogiques 10
2.3 Un exemple d'une ressource composée dans SIMBAD 10
2.4 L'architecture de Trader des services web 14
3.1 un exemple de modèle de recouvrement 20
3.2 Schéma de modèle de l'utilisateur multi dimensionnel [8] 22
3.3 Un modèle de l'utilisateur multi dimensionnel [8] 23
3.4 Techniques d'adaptation dans le système hypermédia 27
4.1 Un workow 34
4.2 L'architecture basée sur la norme de WFMC 35
4.3 Le graphe générique 37
4.4 Le diagramme classe du graph 38
4.5 L'architecture générale 40
4.6 Création de graphe 41
4.7 Instanciation de graphe 43
4.8 Consommation de graphe 45
5.1 L'architecture de Ontobroker 48
5.2 Utiliser Jess avec OWL 50
5.3 L'architecture à 5 couches en général 52
5.4 L'architecture de moteur de composition générique à 5 couches 53
5.5 Le diagramme de classe du graphe 55
5.6 Le diagramme de classe des noeuds 56
Trang 95.7 Les classes de gestion des graphes 575.8 La anciene et nouvelle structure de code source de Scarce 605.9 Application du moteur générique pour la composition des services web 625.10 Architecture de composition de services web utilisant le moteur d'exécution work-
ow 645.11 Architecture de composition de services web utilisant la composition logique etphysique de Scarce 65
Trang 10Actuellement, les communautés Adaptive hypermédia, services web (W3C, Web sémantique
et Web Intelligence), documents numériques (ACM Symposium on Document Engineering,documents virtuels), E-learning (réseaux d'excellences Prolearn) abordent une problématiquecommune sous des angles diérents : le besoin de réutiliser des ressources (documents, présenta-tions, composants, services web ) indexées par des métadonnées sémantiques et les ontologiescorrespondantes pour la conception des nouveaux systèmes d'informations fondés sur le websémantique et les standards du W3C La notion même de "moteur de composition" devient dèslors centrale et permet d'aborder le problème de manière plus conceptuelle
L'idée du projet SIAS incitatif est donc de chercher à mieux analyser la notion de tion pour être capable de dénir ensuite des moteurs de composition beaucoup plus réutilisables
composi-et exibles Ensuite, c'est de proposer une nouvelle manière de concevoir des SIAS fondée sur lacomposition La notion de composition est centrale dans notre vision et la plupart des projetsexistants au GET dans notre domaine ont déjà développé un, voire même plusieurs moteurs de
1 Site web du projet : http ://sias.enstb.org
2 Groupe des Ecoles des Télécommunications Site web : http ://www.get-telecom.fr
3 Institut National de Télécommunication Site web : http ://www.int-evry.fr
4 École Nationale Supérieure des Télécommunications de Bretagne Site web : http ://www.enst-bretagne.fr
Trang 111.1 Problématique 2
composition comme les projets SIMBAD5 et Scriptures6
Il est nécessaire d'unier toutes les propositions déjà faites autour d'un unique moteur decomposition susamment exible Un premier travail à faire est d'étudier ce qui diérencie etunie les approches basées sur la composition de ressources plutôt statiques (comme des docu-ments) de celles basées sur la composition de programmes (comme les services web) Chacunedes approches propose un modèle de composition fondé sur certains principes fondamentaux.L'adéquation de ceux-ci aux domaines d'application visés garantit sa réutilisation comme l'envi-ronnement de conception de SIAS, mais xe aussi les limites de celui-ci Une autre dimension estcelle du domaine d'application (e-learning, journalisme, ) A un certain niveau d'abstraction,trois principes de composition peuvent être étudiés :
1 La composition de ressources statiques qui sont organisées à priori et sélectionnées miquement à partir de leurs métadonnées ;
dyna-2 La composition de web services qui sont également organisées à priori et sélectionnéesdynamiquement à partir de leurs métadonnées décrivant aussi leurs comportements ;
3 La composition dynamique de services web qui génère le schéma de composition en tion des requêtes des clients lors de l'exécution
fonc-Cette analyse doit ensuite nous conduire à proposer une modélisation ne de la notion decomposant et de composition Plusieurs modèles devront être explorés ici à diérents niveaux,même si nous privilégions à priori les modèles issus du sémantique web
Actuellement, chaque équipe est penchée sur sa propre problématique et ses mécanismesparticuliers de composition sans aborder nécessairement le problème de "moteur de compositiongénérique" L'innovation de ce projet réside donc dans l'étude même de la notion de composi-tion, de la réutilisation et de la exibilité des moteurs de composition et de ses impacts sur laconception des systèmes d'information de demain Notre principale innovation et contributionconsiste à généraliser les diérentes avancées de ces équipes et à les intégrer dans un cadreunié
5 SIMBAD (Semantic Interoperability for Mobile collaBorative and ADaptive application) est un projet de l'INT qui s'intéresse à la description et à la composition de ressources pédagogiques et de workows.
6 Scriptures est un projet de l'ENSTB qui s'est intéressé à la composition de ressources multimédia tiques avec le moteur de composition SCARCE [15] appliqué au journalisme, au E-learning et au Knowledge management.
Trang 12sta-1.2 Objectif du stage 31.2 Objectif du stage
Dans le cadre du projet SIAS, ce stage a pour objectifs de :
Etudier les approches de composition existantes et les systèmes d'adaptation et nalisation ;
person- Proposer un modèle de composition générique ;
Appliquer le modèle proposé à la composition de documents virtuels(DV), de servicesweb(SW) et de ressources pédagogiques(RP)
1.3 Environnement de travail
Les travaux de recherche qui sont présentés dans ce rapport ont été menés au sein de l'équipe
de base de données, du département Informatique (INF) - un des neuf départements de l'INT,situé à Evry, France Cette équipe regroupe plusieurs enseignants-chercheurs de l'INT travaillantdans le domaine des bases des données, des technologies web, des services et workow
L'équipe a acquis de très bonnes compétences dans la manipulation complexe de ressources
et de services dans un environnement réparti à grande échelle et dynamique (projet GETSIMBAD) Une thèse s'intéressant particulièrement à la composition dynamique de ressources et
à la personnalisation des contenus a été soutenue en 2005 L'INT a participé avec les principaleséquipes de recherche en EIAH7 française (le laboratoire TRIGONE de Lille entre autre) à l'AS-Plateforme du RTP39 [13] Les spécications d'un portail de mutualisation d'outils (pouvantêtre vus comme des " services ") pour la communauté EIAH a permis d'identier les bonnespratiques en matière d'ingénierie des EIAH facilitant ainsi la réutilisation et la composition desservices oerts par la communauté
1.4 Contribution de stage
La principale contribution de ce travail est la proposition d'un modèle de compositiongénérique basé sur les systèmes de composition existants et sa réalisation et son applicationpour la composition de DV, RP et SW
7 Environnements Informatiques pour l'Apprentissage Humain
Trang 131.5 Organisation du mémoire 41.5 Organisation du mémoire
Après avoir présenté de manière succincte le contexte et la problématique de ce stage, jeprésente maitenant l'organisation générale du mémoire La suite du mémoire est composé de 5chapitres regroupés en 2 parties :
Première partie : Etat de l'art
Dans cette partie, je présente un état de l'art des systèmes de composition et d'adaptation
Je me focalise sur deux aspects : la composition et l'adaptation au prol d'utilisateur
Le chapitre 2 fait la synthèse des systèmes de composition existants Scarce, KMP,SIMBAD et SW en mettant en évidence leur points forts et faibles
Le chapitre 3 décrit le modèle de l'utilisateur ainsi que des techniques principales dans
un système d'adaptation et personnalisation
Deuxième partie : Proposition et Réalisation de moteur de composition rique
géné-Dans cette partie, je dénis mon modèle de composition générique et son implantation
Le chapitre 4 présente ma proposition de moteur de composition générique et tecture générale du modèle de composition
l'archi- Le chapitre 5 illustre l'implantation de l'architecture générale de moteur de compositiongénérique proposée ainsi que ses applications dans les trois domaines étudiés à savoir :les documents virtuels, les services web et les ressources pédagogiques
Enn, le chapitre 6 donne quelques conclusions et les perspectives du travail
Trang 14Chapitre 2
Systèmes de composition existants
Dans ce chapitre, notre objectif est d'examiner le principe de composition en faisant des thèses sur les systèmes de composition existants comme SCARCE, le système de composition deressources pédagogique SIMBAD, le système de composition des services web Nous présentonsleurs fonctionnalités, leurs architectures respectives et nous dressons une étude comparative deses systèmes
syn-Actuellement, la notion de composition est très populaire et devient centrale dans plusieurssystèmes d'informations La construction de logiciel basée sur des composants existe depuislongtemps Le nouveau système obtenu est établi plus rapidement et de façons plus économique
en assemblant des composants plutôt de le développer à partir de zéro Les systèmes que nousallons étudier est de construire la nouvelle ressource à partir des ressources existants Cettecomposition est basée sur la technologie Sémantique Web1 et l'Ontologie 2
2.1 Scarce
SCARCE3 est un moteur de composition exible pour le document virtuel (ICCARS4) basésur la technologie Web Sémantique [15, 17] Un document virtuel est construit à partir del'ensemble des fragments selon une structure narrative prédénie par l'auteur
1 Le Web actuel est essentiellement syntaxique, dans le sens que la structure des documents (ou ressources
au sens large) est bien dénie, mais que son contenu reste quasi inaccessible aux traitements machines Seuls les humains peuvent interpréter leurs contenus La nouvelle génération de Web - Le Web sémantique - a pour ambition de lever cette diculté Les ressources du Web seront plus aisément accessibles aussi bien par l'homme que par la machine, grâce à la représentation émantique de leurs contenus.[19]
2 Une ontologie est une spécication formelle explicite d'une conceptualization partagée.[17]
3 SemantiC and Adaptive Retrieval and Composition Engine
4 Integrated and Collaborative Computer Assisted Reporting System (http ://iccars.enst-bretagne.fr)
Trang 152.1 Scarce 6
2.1.1 Ontologies
SCARCE est fondé sur les quatres ontologies suivantes :
Ontologie du domaine : C'est l'ontologie qui représente l'ensemble des concepts dudomaine et aussi leurs relations Cette ontologie peut décrire le contenu des fragments etaussi des connaissances, préférences de l'utilisateur
Ontologie de l'application : C'est l'ontologie qui représente les notions et les termesdans l'application Par exemple, dans cette application de composition de document vir-tuel, on a des notions comme AdaptationMethod, DirectGuidance, TypeDocument, Ar-ticle, Report
Un schéma de méta-données : Les métadonnées5sont structurées selon un schéma demétadonnés Ce schéma permet de rechercher, gérer et utiliser des informations hétéro-gères Le schéma de métadonnées est composé de diérentes sections (général, cycle de vie,technique, journalisme, classication, méta-données et droits), chaque section correspond
à un point de vue particulier sur la ressource
Ontologie de l'utilisateur : Le modèle de l'utilisateur dans Scarce est assez complet.C'est un modèle multidimensionnels Il contient 5 dimensions : Données personnelles,Préférences, Connaissances, Historique, Session Scarce utilise le modèle du domaine pourmodéliser les connaissances de l'utilisateur Les connaissances de l'utilisateur sont une listed'éléments (concept, niveau)
2.1.2 Architecture
Un document virtuel est généré automatiquement au moment de la consultation Le teur Scarce a utilisé la structure narrative pour assurer la sémantique du document virtuel.Une structure narrative est un type de graphe orienté avec des noeuds et des relations sé-mantiques entre les noeuds Elle contient aussi un ensemble de règles d'appartenance pourfaire l'adaptation basée sur le stéréotype de l'utilisateur Le moteur de composition va générerdynamiquement les pages web dont le contenu est personnalisé (cf.gure.2.1)
Trang 16exis-La composition sémantique a des fonctions de recherche, de choix et d'organisation desinformations de façon sémantique et adaptée à l'utilisateur En fait, il instancie les structuresnarratives à partir de l'ensemble des fragments.
La composition logique assemble les informations fournie par la composition sémantique en
un chier XML La particularité de la composition logique est de faire l'adaptation de tation (contenu personnalisé) et de navigation (inspiré des systèmes hypermédia adaptatifs)
présen-La composition physique (présentation) transforme le chier XML fournie par la tion logique en page web HTML grâce à XSLT Cette page web est achée dans le navigateur
composi-de l'utilisateur avec un contenu personnalisé
5 Une métadonnée est l'information additionnelle qui décrit les données auxquelles elle est associée
Trang 172.2 Système de composition de ressources pédagogiques 8
La composition est fondée sur l'évaluation des fragments pour un type d'utilisateur culier selon les règles d'appartenance (adaptation basée sur les règles)
parti-Scarce a utilisé l'adaptation de navigation dans l'application d'hypermédia pour permettre
à l'utilisateur de naviguer à travers le document virtuel
Cependant, les relations dans la structure narrative et la description de fragment sontsimples La structure narrative contient seulement des relations hiérarchiques et le seul contenudes fragments sont décrits par le métadonnées La technique de composition dans Scarce estaussi simple Il est donc dicile d'appliquer ses techniques de composition et d'adaptation àl'autres domaines De plus, les codes source de Scarce ne sont pas claires et structurés
Le moteur de Scarce a été appliqué dans le projet Candle7et KMP (présenté dans la section2.3)
2.2 Système de composition de ressources pédagogiques
Le système de composition de ressources pédagogiques est pour but de fournir des sources pédagogiques ou des cours personnalisés à l'apprenant en sappuyant sur son modèle.L'article[13] présente une théorie sur la description des ressources pédagogiques élémentaires
res-et aussi de ressources composées (ex : un cours) en assemblant des ressources élémentaires Lesystème pédagogique adaptif présenté par Duitama se compose de méthodes d'évaluation desressources et de diérents modèles
6 Le langage F-Logic est un langage déductif de base de données orientée objets qui combine la sémantique déductive et l'expressivité des langages de bases de données déductives avec la richesse de modélisation des modèles de données orientés objets.[17]
7 Collaborative And Network Distributed Learning Environment (http ://www.candle.eu.org)
Trang 182.2 Système de composition de ressources pédagogiques 9
2.2.1 Ontologies
Il y a trois ontologies dans ce système :
Modèle du domaine : Il s'agit de décrire l'ensemble des concepts pour un domaine
de connaissances donné comme l'informatique Les concepts sont reliés par des relations(hiérarchiques, background )
Modèle de l'apprenant : Il est similaire au modèle de l'utilisateur dans Scarce C'estégalement un modèle multi-dimensionnel avec 2 dimensions : les préférences (nom, email,préférés ) et les connaissances (un vecteur d'élément (rôle, niveau, concept)) En com-paraison avec le modèle de l'utilisateur de scarce, la représentation des connaissances esttrès proche
Modèle des ressources (méta-données) : Il s'agit de décrire les ressources giques en utilisant le modèle du domaine Chaque ressource possède les parties suivantes :
pédago- Prérequis est l'ensemble des triplets (concept, rôle, niveau)
Contenu décrit le contenu des ressources C'est également un ensemble des triplets(concept, rôle, niveau)
Fonction d'acquisition met à jour le modèle d'apprenant Elle est aussi un ensemble
de triplets (concept, rôle, niveau)
Caractéristiques éducatives LOM8 ont d'autres caractéristiques factuelles sousforme d'un ensemble (prédicat, valeur)
En comparaison avec le métadonnées décrivant les fragment dans Scarce, le contenu d'unfragment est aussi l'ensemble des concepts du domaine mais le fragment ne possède pas deprérequis ni de fonction d'acquisition
2.2.2 Architecture
Ce système comprend trois niveaux : Domaine, Composant et Utilisateur (cf.gure.2.2).Comme j'ai présenté dans la section précédente, le domaine est représenté par une ontologie Leniveau composant contient les ressources élémentaires ou les ressources composées L'utilisateur
va rechercher et manipuler ces ressources
8 Learning Object Metadata est un standard de l'IEEE qui fournit un moyen ecace de repérer et d'indexer des objets d'apprentissage.
Trang 192.2 Système de composition de ressources pédagogiques 10
Fig 2.2 L'architecture du système de composition des ressources pédagogiques
2.2.3 Composition et Adaptation
Composition
Sa thèse a présenté la composition statique des ressources pédagogiques Cette compositionest représentée par un graphe avec des noeuds (ressources) et les opérateurs entre les noeuds
Un exemple d'une ressource pédagogique composée est montrée dans la gure 2.3
Fig 2.3 Un exemple d'une ressource composée dans SIMBADDuitama a décrit trois types d'opérateurs : ALT, SEQ et PAR Il présente aussi la notiond'échecs lorsque l'apprenant n'a pas acquis le ou les concepts développé(s) par un composant.Avant de livrer la ressource composée à l'utilisateur, le système génère tous les cheminspossibles Les techniques d'adaptation sont appliquées sur ces chemins pour donner une listeordonnées à l'utilisateur
Une ressource composée peut avoir des noeuds intentionnels Les noeuds intentionnels sontreprésentés par une requête Au moment de l'exécution, le système traite la requête pour obtenirles ressources adéquates Ce type de noeud est similaire au noeud dans la structure narrative
Trang 202.3 KMP 11dans Scarce.
Adaptation
Étant donné que le système proposé par Duitama est orienté vers la recherche adaptive
de ressources pédagogiques, la technique d'adaptation employée est extraite des techniquesd'adaptation des systèmes de recherche adaptifs
Cette adaptation est basée sur des règles selon le stéréotype de l'utilisateur Il y a 3 types
de règles :
Des règles pour la ré-écriture des requêtes ;
Des règles pour la ré-écriture des prérequis qui gurent dans les requêtes ;
Des règles pour le ltrage des résultats des requêtes
2.2.4 Discussion
Le première concerne l'aspect pédagogique qui n'est pas ou très peu traité En eet, les teractions entre l'apprenant et l'enseignant ne sont pas traités Seule la composition de ressourcepuis l'adaptation à un apprenant sont développés
in-Dans ce système, l'utilisateur ne peut pas dénir ses règles d'adaptation lui-mêmes pour le
ltrage des ressources obtenues
Une autre limitation liée au type d'adaptation ó seules l'adaptation au niveau de sances de l'apprenant et à ses préférences sont exploitées Il n'y a pas d'adaptation de présen-tation et d'exécution des ressources De plus, les codes source ne sont pas disponibles
connais-Par contre, les modèles (de l'utilisateur, du domaine et de ressources) sont bien représentés
et URIs pour indiquer des entités, des concepts, des propriétés et des relations.
10 RDFS(RDF Schema) est une langue pour donner dénir une carte conceptuelle des vocabulaires de RDF qui permet de créer des vocabulaires de métadonnées, qui indique également comment manipuler et marquer les éléments.
Trang 212.3 KMP 12
réseau inter-rmes et inter-institutions dans le domaine des télécommunications
L'objectif de KMP est de construire une solution innovante de gestion des connaissancespartagées entre diérents acteurs, au sein d'une même communauté de pratique Cette solutionrepose sur l'analyse, la conception, la réalisation et l'évaluation d'un prototype de service web decompétences, de type hypermédia adaptatif Il s'agit d'un moteur de composition dynamique desite web à partir d'une spécication fondée sur les connaissances explicites d'une communauté
de pratiques Ce prototype sera une composante d'un portail web destiné à une communautéd'entreprises, d'institutionnels et d'organismes académiques impliqués dans le domaine destélécommunications ; la communauté étudiée dans l'application est la Telecom Valley
KMP est réalisé à INRIA et aussi à ENST-B (Brest)
L'architecture de KMP est basée sur celle de Scarce La composition sémantique est
simpli-ée et le mécanisme de composition logique et physique est utilisé pour la gestion des requêtes
de l'utilisateur
2.3.3 Composition et Adaptation
En fait, KMP annonce l'utilisation de la structure narrative pour gérer la chaîne de valeurs
de Télécom Valley mais en réalité il ne l'utilise pas Il n'y a donc pas de composition dansKMP L'adaptation à ce jour n'est pas encore réalisé
2.3.4 Discussion
Ce projet est une application de l'architecture de Scarce Cependant, il n'y a pas de position et d'adaptation qui sont pourtant les points forts de Scarce
Trang 22com-2.4 Système de composition de Web services 132.4 Système de composition de Web services
Actuellement, il existe de plus en plus des travaux de recherche sur la composition de servicesweb pour créer de nouveaux services web[28, 20, 2, 25] L'idée de la composition des servicesweb est de créer un nouveau service web en combinant des services existants en se basant surleurs comportements pour répondre aux besoins de l'utilisateur
2.4.1 Ontologies
Pour rechercher les services de manière sémantique, il faut annoter des services web Lelangage OWL-S (OWL pour la description des services web) est actuellement le plus utilisédans ce domaine
Oussama Kassem Zein[28] a proposé un modèle de métadonnées pour les services websqui contient 3 dimensions : propriétés statiques (comme localisation, nom, ), propriétés dyna-miques (enchaînement des opérations) et l'interface (description des opérations, leur paramètres
et attributs)
Moussa Lo et Fabien Gandon[20] ont utilisé OWL-S11 pour faire l'annotation des servicesweb Ils ajoutent une élément " semanticType " dans OWL-S pour annoter la sémantique desopérations dans les services web Cette modication sert à trouver et composer des servicesweb
2.4.2 Architecture
L'architecture de l'application de composition des services web est basée sur le modèleTrader de Oussama et Broker de Moussa Lo et Fabien Gandon Deux modèles-là sont trèsproches
Le modèle Trader utilise Ontobroker comme moteur d'inférence pour stocker les tions du service web Grâce à cela, Trader peut rechercher en utilisant de la sémantique surOntobroker pour trouver les services web satisfaisants aux besoins de l'utilisateur Exporter est
descrip-le fournisseur des services web Importer est descrip-le consommateur de services web Tout d'abord,Exporter inscrit tous les services web qu'il fournit à Trader (cf.gure.2.4 (1)) Ensuite, Traderles annotent et les stockent dans Ontobroker (cf g 2.3 (2)) Des que Importer reçoit une re-
11 OWL est une recommandation de W3C qui décrit les services web.
Trang 232.4 Système de composition de Web services 14
quête il la transmet à Trader (cf.gure.2.4(3)) Trader consulte Ontobroker qui lui renvoie lesservices web satisfaisants la requête(cf.gure.2.4 (4, 5)) Trader transmet la description des ser-vices web trouvés à Importer (cf.gure.2.4 (6)) Importer utilise cette description pour appelerdirectement Expoter an d'il exploite les services web (cf.gure.2.4 (6, 7))
Fig 2.4 L'architecture de Trader des services webDans le cas ó Trader ne trouve pas les services web correspondant aux besoins de l'utilisa-teur, il va procéder à la composition de services existants pour fournir à l'utilisateur un serviceweb composé
2.4.3 Composition et Adaptation
Composition
La composition des services web se classe en 3 types :
La composition statique est la composition des services web qui est dénie au moment
de compilation ;
La composition semi-dynamique est la composition dont le schéma des types deservices web est prédéni Au moment de l'exécution, le système va chercher les instancesdes services web qui satisfont les types des services web puis les utiliser ;
La composition dynamique est la composition des services web au moment de
Trang 24l'exé-2.4 Système de composition de Web services 15
cution C'est-à-dire qu'à partir de la demande de l'utilisateur, le système va chercher etgénérer dynamiquement le schéma de composition de type service web et ensuite cher-cher des instances des services web à exécuter Par exemple, dans l'article de Moussa
Lo et Fabien Gandon, un système de composition de web services est proposé et réalisé
en se basant sur le moteur d'inférence Corese celui de Oussama est basé sur le moteurd'inférence Ontobroker
En comparaison avec la composition de documents virtuels et de ressources pédagogiques,
le type de composition utilisé correspond à la composition semi-dynamique de services webest similaire A partir d'un schéma prédénit, au moment de l'exécution on va chercher lesressources pour instancier ce schéma
La composition dynamique des services web semble être très diérente de la composition
de documents virtuels et de ressources pédagogiques Dans cette composition, l'utilisateur prime sa demande, le système compose des services web dynamiquement en se basant sur lesdescriptions des services web existants Oussama a réalisé la composition dynamique en faisantdes requêtes en F-logique pour trouver le schéma de composition qui satisfait aux besoins del'utilisateur Moussa a écrit les règles dans Corese pour établir les chemins de compositionqui satisfait aux besoins de l'utilisateur Les deux approches utilisent la même technique decomposition
ex-Adaptation
Dans les applications de composition de services web, l'aspect d'adaptation au modèle del'utilisateur se résume à l'adaptation de la demande des entrées et sorties de l'utilisateur Deplus l'autre aspect d'adaptation, le plus important et le plus complexe ,à savoir, l'adaptation
au contexte de l'exécution de services web n'est pas traité
2.4.4 Discussion
Dans cette section, nous avons présenté la composition de services web Les ressourcesassemblées sont ici les services web élémentaires Deux services web peuvent être composés s'ilssatisfont la condition de types "Input-Ouput" Grâce aux métadonnées de services web, on peutconstruire des règles d'inférences pour déduire automatiquement si la condition est veriée
La composition des services web est diérente par rapport à la composition de documents
Trang 252.5 Conclusion 16
virtuel et de ressources pédagogiques En eet, la composition dynamique de services web génère
un schéma de composition selon les besoins de l'utilisateur, alors que dans la composition dedocuments virtuels et de ressources pédagogiques, le schéma de composition est prédénit.2.5 Conclusion
Nous avons étudié dans ce chapitre la notion de composition ainsi que des systèmes baséssur des techniques de composition diérentes La plupart de système réalisent la composition en
se basant sur la recherche sémantique Ils utilisent plusieurs descriptions (métadonnées) pourannoter le et les composent On peut distinguer deux types de composition :
La composition selon un schéma pré-dénit (Scarce, Simbad, ) L'auteur dénit leschéma de composition (ex : une ressources composée) A chaque fois qu'une ressourcecomposée est sollicitée, le système assigne des ressources élémentaires au schéma prédéni
La composition dynamique Il n'y a pas de schéma prédénit En réponse à une requête
de l'utilisateur, si le système ne trouve pas de ressources satisfaisants, il va composer lesressources existants La composition dynamique des services web se fait en 2 étapes :
Composer les types de services web pour avoir un schéma de composition
Composer des instances de services web selon le schéma qui a été fait dans la premièreétape
Nous avons constaté que chaque type de composition convient à une application diérente Lepremier type de composition est approprié au domaine pédagogique parce que l'enseignant oul'auteur du cours peut prédénir les étapes à suivre ou le schéma du cours selon ses connais-sances pédagogiques Le système fait la composition selon ce schéma-là Le deuxième type
de composition est approprié l'application de composition de services web A partir du type
de service souhaité par l'utilisateur ainsi que les entrées/sorties de celui-ci, le système génèreautomatiquement le schéma de composition
Une autre propriété commune aux systèmes étudiées (Scarce, Simbad) est le fait d'intégrer
un mécanisme d'adaptation L'adaptation peut se faire au moment de la composition commepour Scarce, ou au moment de l'exécution comme pour Simbad L'adaptation est utilse lorsque
le nombre de ressources satisfaisant une requête est important Le système choisit alors la
"meilleure" ressource, c'est-à-dire la ressource la mieux adaptée au prol de l'utilisateur Dans
Trang 262.5 Conclusion 17
le cas ó l'adaptation intervient au moment de la composition, la nouvelle ressource est "bien"construite et adaptée mais n'est pas réutilisable Lorsque l'adaptation intervient après le pro-cessus de composition, plusieurs ressources alternatives sont alors possibles La prise en compte
du prol de l'utilisateur va permettre de choisir l'alternative la mieux adaptée Les diérentesalternatives générées (graphe d'achage) peuvent être réutilisées dans d'autres contexte Nousallons présenter dans le chapitre suivant le modèle de l'utilisateur ainsi que les techniquesd'adaptation
Trang 27l'utilisa-Nous présentons tout d'abord diérentes modèles d'utilisateur et ensuite les techniques liées
au prol de l'utilisateur (techniques d'initialisation, de construction et de mis à jour du prol del'utilisateur)(la section 3.1) Nous abordons ensuite les principales techniques d'adaptation et
de recommandation (la section 3.2) Enn, nous terminons ce chapitre par quelques remarques.3.1 Modélisation de l'utilisateur
An de permettre l'adaptation et la personnalisation, il est important de répondre à quelquesquestions Tout d'abord, comment représenter le prol de l'utilisateur dans l'ordinateur (dansquel modèle) ? D'ó proviennent des informations pour le construire ? Et par quelle méthode ?
Trang 283.1 Modélisation de l'utilisateur 19
Nous citons ici les approches principales pour modéliser le prol utilisateur le modèle toriques, le modèle vectoriel, le modèle multi-dimensionnel, les réseaux de neurone ou les pro-babilités bayésiennes
his-Modèle historique
Le système stocke les informations historiques de l'utilisation (ex : les activités, interaction
de l'utilisateur : la liste de courriels ou transactions sur Internet) comme un modèle d'utilisateur
Ce modèle est le plus utilisé dans le domaine du E-commerce comme Amazon.com Il est facile
à construire mais dicile à utiliser Les techniques de fouille des données sont appliquées pourobtenir des connaissances sur l'utilisateur à partir des informations historiques
Modèle vectoriel
Ce modèle est très populaire Dans ce modèle, chaque item (article, document, livre, unélément des informations ) est représenté par un vecteur Un élément de ce vecteur est un mot
ou un terme associé à un poids Ce poids soite une valeur booléenne ou un chire Dans le cas
de booléen, il signie que le mot ou le terme apparaît dans l'item ou non Si le poids est unchire, il exprime la fréquence ou la probabilité du mot ou du terme dans l'item Par exemple,
un prol de l'utilisateur qui s'intéresse à la musique peut être représenté par le vecteur suivant
Le poids de chaque mot correspond à sa fréquence d'apparition dans les documents
("Rock", 0.8), ("Pop", 0.7)Modèle de recouvrement
De plus en plus de systèmes adaptatifs utilisent ce modèle pour le prol de l'utilisateur[12, 13, 9] Ce modèle est fondé sur l'hypothèse qu'une connaissance des l'utilisateurs peutêtre simplement un sous-ensemble de celle d'un expert L'idée principale qu'on exprime leprol de l'utilisateur comme sous-ensemble de modèle du domaine en mettant des valeursaux concepts Chaque valeur est une estimation du niveau de connaissances ou intérêts del'utilisateur sur le concept Ce modèle est facile à mettre à jour mais dicile à initialisersurtout comment déterminer le niveau de connaissances de l'utilisateur On peut analyser lesactions de l'utilisateur pour augmenter ou diminuer les poids sur les concepts
Par exemple :
Trang 293.1 Modélisation de l'utilisateur 20
Fig 3.1 un exemple de modèle de recouvrementDans cette gure, le modèle du domaine contient les concepts : C1, C2, C3, et des relationsentre les concepts Le modèle de l'utilisateur est déni par une partie du modèle du domaine.Dans cet exemple, l'utilisateur a des connaissances sur les concepts C1, C2, C3 et C4
Modèle multi-dimensionnel
Un prol d'utilisateur peut contenir plusieurs types d'informations : données phiques, intérêts, but, information historique Chaque type d'information-là est une dimensiondans le modèle multi dimensionnel
démogra-Ce type de prol de l'utilisateur est le plus utilisé dans les applications adaptives et enparticulier les applications pédagogiques Dans le moteur Scarce, l'utilisateur est représentépar 5 dimensions : Section personnelle, préférences, connaissances, historique et sessions Dans
le domaine pédagogique, plusieurs normes de prol de l'apprenant qui suivent le modèle dimensionnel) exisent On peut citer :
multi- PAPI1 développé par IEEE Elle est créée pour la communication dans les systèmescollaboratifs PAPI a 6 dimensions : l'information personnelle, les relations entre les ap-
1
Trang 303.1 Modélisation de l'utilisateur 21
prenants et le groupes, la sécurité, les préférences, les informations d'éducation (certicats,
diplôme, rapports ), les informations sur les projets et les travaux réalisés
IMS LIP2 contient des informations semblables à celles trouvées dans le CV d'une
personne et plus sur l'expérience des études de l'apprenant Il contient 11 dimensions :
Identication, But, Étude, Activité, Accessibilité, Intérêt, Aliation, Sécurité, Relation
entre des éléments de données, Compétence, Certicats
eduPerson est une spécication de Internet2 (www.internet2.com) et Educause (www.educause.edu).Cette norme est très détaillée par rapport à l'autres normes Elle est semblable à PAPI
et IMS LIP Le but est d'échanger des informations, des données concernant l'apprenant
entre les universités Elle contient 43 éléments classés dans deux catégories : les attributs
générales (ex : nom, email, ) et les nouveaux attributs (eduPersonAliation,
eduPerso-nEntitlement, eduPersonNickname, )
Dolog LP3 est le modèle d'apprenant suggéré par P.Dolog en RDF Le but est de fournir
le service de personnalisation dans les systèmes d'éducation Ce modèle est basé sur la
combinaison de deux normes : PAPI et IMS LIP et il contient 5 dimensions : identication,
préférence, information sur des études, organisation, calendrier
FOAF4 est aussi un modèle de l'utilisateur en RDF Il a été développé pour les
commu-nautés et groupes sociaux Il contient aussi 5 dimensions pour décrire une personne
On voit bien que les modèles PAPI, Dolog LP et IMS LIP se concentrent sur l'activité et
les accomplissements de l'apprenant Ces modèles sont donc employés pour la personnalisation
dans les systèmes d'éducation adaptatifs Le système qui utilise eduPerson est bien de transférer
et rassembler les données de l'utilisateur entre les établissements PAPI, Dolog LP et IMP LIP
peuvent faire cela mais ils n'ont pas autant de détails que eduPerson Parmi les normes citées
précédement, FOAF est le seul modèle qui décrit les relations entre les apprenants par la
élément "knows" Donc, ce modèle est pour construire les réseaux sociaux d'apprenant L'autre
avantage de FOAF est que la représentation de FOAF est en RDF Il est ainsi facile à étendre
An de faciliter l'utilisation de modèle multidimensionnel, Mokrane Bouzeghoub et Dimitre
Kostadinov [8] ont proposé un ensemble de dimensions ouvertes, capables d'accueillir la
plu-2 Information Management System - Learning Information Package
3 Dolog Learner Prole [4]
4 Friend of a Friend
Trang 313.1 Modélisation de l'utilisateur 22
part des informations caractérisant un prol ainsi qu'une plate-forme de gestion des prols del'utilisateur
Fig 3.2 Schéma de modèle de l'utilisateur multi dimensionnel [8]
Dans cette plate-forme, chaque dimension contient un ensemble d'attributs (simple, plexes) Quelques dimensions sont organisées en sous dimensions selon la nature de leurs at-tributs Un attribut du prol est déni par un nom, un type, une expression de préférence etune sémantique La construction et l'ajout des dimensions pour le prol de l'utilisateur sontainsi facilités dans cette plate-forme Un exemple de prol d'utilisateur de 6 dimensions estconstruit
com-Les six dimensions sont :
Données personnelles : identité de l'utilisateur, données démographique, contacts sonnels, Ces informations sont stables et ne changent pas beaucoup
per- Domaine d'intérêt : C'est le domaine d'expertise ou son périmètre d'exploitation Ilpeut être présenté par l'ensemble de concepts, ou de termes du domaine Si on utiliseune ontologie pour représenter le domaine, on peut proter de la capacité d'inférence
du moteur d'inférence de l'ontologie pour obtenir la sémantique associée à chaque termed'intérêt de l'utilisateur ;
Trang 323.1 Modélisation de l'utilisateur 23
Fig 3.3 Un modèle de l'utilisateur multi dimensionnel [8]
Qualité attendu : Ce sont les préférences sur l'origine de l'information, sa précision, safraîcheur, sa durée de validité et le temps de réponse ;
Préférences de livraison : La présentation de résultat, préférences esthétiques
Sécurité : Droits d'accès au système
Historique des interactions de l'utilisateur :
Ce système fournit également des opérateurs qui nous permettent de manipuler les prols del'utilisateur comme : Créer un prol, valider le prol avec le modèle générique, comparer deuxprols
3.1.2 Initialisation
Cette étape est très importante dans tous les systèmes d'adaptation Elle est liée au blème : Comment initialiser un prol d'utilisateur Si cette initialisation est bien traitée, lesystème peut donner les bonnes réponses au nouveau utilisateur Cependant, on ne perd pasbeaucoup de temps pour cette étape parce que les préférences et les connaissances de l'utilisa-teur changent suivant
pro-On distingue deux types d'initialisation : l'initiation explicite et l'initialisation implicite.Initialisation explicite
Un nouveau prol d'utilisateur peut être construit de façon vide, manuelle ou stéréotype.Vide
Trang 33Le système regroupe les utilisateurs en classes en fonction de leurs informations personnelles(ex : le cas du système de journaux adaptifs[5]) Les informations utilisées sont les données dé-mographiques comme données personnelles, données géographiques, les certicats des études d'utilisateur L'inconvénient de cette approche est qu'elle a besoin de toutes les informationspersonnelles d'utilisateur mais parfois qui ne sont pas toujours disponibles Il est en eet dicile
de classier les utilisateurs en se basant sur des informations manquées
Initialisation implicite
Dans ce cas, le prole d'utilisateur est construit à partir des données sur les interactionsd'utilisateur avec le système Par exemple, si un utilisateur sauvegarde un document sur sondisque dur, c'est une preuve qu'il s'intéresse à ce document et il a l'intention de l'utiliserdans l'avenir D'une manière similaire, si un utilisateur utilise beaucoup de temps pour lireune page Web ou il suit beaucoup de liens dans cette page, on peut en déduire que c'estune page intéressante pour lui Les techniques utilisées ici sont des techniques de fouille dedonnées L'avantage de cette approche est qu'elle ne demande pas beaucoup d'eorts de lapart des utilisateurs Cependant elle n'est pas aussi précise que la première approche Quelquessystèmes ont choisi de combiner ces deux approches pour obtenir de meilleures performances
Trang 343.1 Modélisation de l'utilisateur 25
3.1.3 Construction
Technique d'extraction des informations
Dans l'approche basée sur le modèle vectoriel, chaque item (document) est représenté par
un vecteur La construction de ce vecteur se fait en deux étapes : sélection des caractéristiques(les mots qui n'apportent pas de sens dans le document sont supprimés) et indexation desinformations (la fréquence d'apparition de mot dans le document : TF-IDF est utilisée).Apprentissage non supervisé
Dans cette technique, les articles ou des documents sont divisés en les catégories diérentes.Chaque catégorie représente un domaine d'intérêt de l'utilisateur
Apprentissage supervisé
Cette technique utilise des classicateurs pour classer des documents dans les classes dénis Par exemple dans le système de Speretta, un prol utilisateur est une ontologie avecdes concepts pondérés Chaque fois qu'il y a un nouveau document, un classicateur est utilisépour déterminer le concept attaché avec ce document Le poids du concept sélectionné est alorsaugmenté
pré-3.1.4 Feed-back
Certaines parties du prol d'utilisateur changent souvent par exemple les concepts préférés
Il est de ce fait nécessaire d'avoir des techniques pour mettre à jour automatiquement le prolutilisateur Ces techniques sont basées sur les informations issues du feed-back de l'utilisateur
Il y a deux types de feed-back : explicit et implicite
Feed-back explicit
L'utilisateur peut attribuer des notes aux concepts, indiquant ainsi son degré de rence Cette technique est simple mais elle rencontre quelques problèmes notamment parce quel'utilisateur ne donne pas de feed-back surtout lorsqu'ils sont négatifs
Trang 35préfé-3.2 Adaptation et Recommandation 26Feed-back implicit
Comme la technique d'initiation implicite, le système surveille les interactions entre sateur et le système Avec cette technique, on ne demande pas à l'utilisateur de donner explici-tement un feed-back Cette technique génère beaucoup de données et consomme beaucoup decalculs Aussi, dans les systèmes récents, on combine deux techniques pour réduire considéra-blement les eorts de l'utilisateur pour obtenir un résultat acceptable
l'utili-3.2 Adaptation et Recommandation
3.2.1 Adaptation dans les systèmes de recherche adaptative
Expansion des requêtes
La technique la plus utilisée pour la recherche adaptative est la reformulation des requêtes del'utilisateur [7] A partir de la requête initiale de l'utilisateur, on peut ajouter des informations,des contraintes, des conditions pour générer une nouvelle requête dont le résultat est adapté auprol de l'utilisateur Dans le système de composition de ressources pédagogiques de la thèse deDuitama [21], un mécanisme de re-écriture de requêtes a été réalisé pour faire de la recherchesémantique des ressources pédagogiques
Re-ordonnancement des résultats de larecherche
Cette approche est l'inverse de l'approche ci-dessus Quand l'utilisateur fait une requêtesur le système, le système l'exécute Après avoir obtenu des résultats, il utilise le prol del'utilisateur pour ordonner les résultats et donner la liste des meilleurs résultats à l'utilisateur.Dans ce cas, on peut appliquer la technique de ltrage par contenu
Visualisation personnelle des résultats de recherche
En se basant sur les préférences de l'utilisateur comme la couleur préférée, la taille , lesystème présente le résultat adapté Il s'agit de l'adaptation de la présentation et de navigation(ex : La composition logique dans Scarce)
3.2.2 Adaptation dans les systèmes hypermédia
Les systèmes hypermédia adaptatif[10] fournissent aux utilisateurs les liens et les
Trang 36informa-3.2 Adaptation et Recommandation 27
les interactions entre l'utilisateur et le système sont observées L'adaptation dans ce systèmeest l'adaptation de navigation des liens et présentation de pages web
Fig 3.4 Techniques d'adaptation dans le système hypermédia
Il y a deux catégories de l'adaptation :
Adaptation de présentation
L'adaptation de présentation modie les informations présentent dans une page web pouracher leur contenu adapté à une ou plusieurs caractéristiques de l'utilisateur comme le but,les connaissances, les préférences On distingue les adaptations principales suivantes :
Explication additionnelle, prérequise et comparative : l'explication additionnelleconsiste à présenter quelques parties des documents à certaines quelques conditions L'ex-plication prérequise permet d'ajouter des informations explicative si l'utilisateur ne sa-tisfait pas le niveau de connaissances pour comprendre le page courante, le système va
Trang 373.2 Adaptation et Recommandation 28
ajouter les informations nécessaires Dans l'explication comparative, le système ajouteles informations comparatives entre les concepts connus de l'utilisateur et les concepts setrouvant dans les documents On a deux techniques pour ce type de l'explication :
Inclusion continuelle des fragments : Cette technique est employée dans le systèmeAHA À partir du modèle utilisateur et des concepts dans le modèle de domaine, lesystème détermine quels fragments devraient être montrés
Stretchtext : Cette technique est employée dans MetaDoc Dans chaque fragment,
il existe une partie qui contient des informations spéciales (informations courtes) Lesystème détermine quels fragments devraient "être étirés" et quels fragments devraient
" être rétrécis " (seul l'information courte du fragment est montrée) Cette décisionest prise seulement au moment de la présentation initiale du fragment Après cela,l'utilisateur peut étirer ou rétrécir des fragments par des clics de souris Le systèmepeut surveiller les actions de l'utilisateur pour mieux prévoir quels fragments à étirer
ou rétrécir dans la page suivante
Explication variantes : Le système gère les diérentes versions du fragment Avecchaque utilisateur, le système détermine quelle est la meilleure version de présentation
du fragment pour l'utilisateur Selon le modèle de l'utilisateur, la longueur ou la type de
la présentation (texte, images, vidéo, sons, ) et tout autre aspect peut être modié
Tri des informations : Le système trie les fragments selon leur pertinence avec lisateur Ainsi, l'ordre de la présentation des fragments peut devoir être changé selon
l'uti-le modèl'uti-le de l'utilisateur Par exempl'uti-le, quelques utilisateurs peuvent préférer voir unexemple avant une dénition
Adaptation de navigation
Le système classe les liens et aide l'utilisateur à choisir le lien qui contient les informations
le plus pertinentes et le plus proches avec objectifs et le prol de l'utilisateur Les techniques
de ce type d'adaptation sont suivantes :
Guidage direct : à la n de chaque page Web, le système suggère à l'utilisateur laprochaine " meilleure " page à l'utilisateur particulier en fonction de l'utilisateur ;
Tri : Les liens sont présentées du plus pertinent au moins pertinent par rapport au modèle
de l'utilisateur Cette technique est très utile dans les systèmes de recherche documentaire
Trang 383.2 Adaptation et Recommandation 29
et dans les systèmes d'éducation ;
Masquage : Parfois les liens dans un page Web sont cachés pour un utilisateur particulierparce qu'on considère que ces liens sont non pertinents à ce moment-là pour lui Il y a 3types de masquage ; adaptation :
Masquage des liens : Ceci peut être fait en présentant le lien en tant que " textenormal " La couleur par défaut employée par le système AHA est le noir pour des liensindésirables
Désactivation des liens : Les liens inadéquats (non pertinents) sont désactivés Cesliens-là sont peut-être visibles si on combine cette technique d'adaptation avec d'autrescomme l'annotation
Suppression des liens : Les liens inadéquats sont supprimés
Annotation : Les liens sont présentés diéremment selon leur pertinence avec le modèle
de l'utilisateur On peut utiliser la couleur ou les textes pour faire l'annotation
3.2.3 Recommandation
Cette section présente les techniques de recommandation Il existe deux approches cipales : Filtrage par le contenu et ltrage collaboratif L'objectif de ces approches est derecommander les items susceptibles intéressé par l'utilisateur
prin-Filtrage par les informations démographique
Cette approche utilise les données démographiques comme âge, genre, de l'utilisateur pourgénérer les relations entre un item avec une classe de l'utilisateur
Filtrage par le contenu
Dans cette approche, le système cherche les items dont les contenus sont similaires auxitems préférés dans le passé déjà stocké qui sont considéré comme un prol de l'utilisateur.Cette approche est basée sur la comparaison du contenu de l'item et du prol de l'utilisateur
Le problème principal de cette approche est comment extraire les caractéristiques du contenud'item (image, sons ou texte, documents ) Cela réduit la performance De plus, la nouvellechose ne sera pas recommandée aux utilisateurs parce que le système a tendance à chercher lesitems semblable aux items déjà choisis par ces derniers
Trang 393.3 Conclusion 30Filtrage collaboratif
La diérence entre le ltrage par contenu et le ltrage collaboratif est que le ltrage parcontenu est appliqué pour un seul utilisateur, par contre le ltrage collaboratif est appliqué àune communauté de l'utilisateur Le principe du ltrage collaboratif est basé sur les réactionsdes autres utilisateurs Le système recommande à un utilisateur les items préférés des autresutilisateurs qui ont des prols proches de lui Par conséquent, au lieu de calculer la similaritéentre le prol et l'item (dans l'approche ltrage par contenu), cette approche calcule la similaritéentre les prols des utilisateurs
Les systèmes collaboratifs ont le problème qu'on appelle "démarrage froids" Cela signieque le système vient de démarrer, il n'y a pas encore de votes disponibles pour que le systèmepuisse donner des recommandations Un autre problème est que si le nombre des utilisateursest trop petit par rapport avec les éléments dans le système Dans ce cas, il n'y a pas assez dedonnées pour donner faire une prédiction C'est pour cette raison que quelques systèmes ontchoisi de combiner ces deux méthodes pour bénécier des avantages et limiter les inconvénientsdes deux méthodes
Méthode hybride
En combinant les deux approches précédentes, on peut créer un système de recommandationplus ecace comme Fab[6] Dans un système hybride, on évite deux problèmes principaux : ledémarrage froids de système collaboratif et non recommandation de le cas ó le système de
ltrage par contenu ne propose pas de nouvelle chose
3.3 Conclusion
Dans ce chapitre, une introduction sur le prol de l'utilisateur et les techniques d'adaptationest présentée La modélisation de l'utilisateur n'est pas nouvelle mais a gagné l'attention deschercheurs en raison des multiples applications qui nécessite cette modélisation La techniqued'adaptation et de recommandation rend le système plus utile à l'utilisateur Le système nedonne que les informations adéquates et utiles et les personnalise selon le modèle et le but del'utilisateur Ces techniques sont utilisées dans plusieurs domaines mais surtout dans le domained'éducation et de recherche d'information Grâce à ces techniques, on peut développer un mo-
Trang 403.3 Conclusion 31
teur de recherche qui donne le meilleur résultat aux utilisateurs ou créer des cours adaptés auxconnaissances et préférences de chaque apprenant Un système adaptatif et de recommandationcontient normalement trois composants :
du domaine Nous avons également intégré les techniques d'adaptation (de présentation, denavigation) ainsi que les techniques de recommandation