Au contraire, les pages sont présentées la même façon, la conséquence que ils contiennent des redondances donc les consulteurs ne peuvent pas toujours comprendre le contenu Le système hy
Trang 1Institut de la francophonie pour
l'Informatique
Ecole Nationale Supérieure des Télécommunications de
Breatage - Département LUSSI
Mémoire de fin d’études
Principes fondamentaux de SCARCE:
vers un modèle de tâche
Réalisé par Dinh Van Hoan
Professeur Serge Garlatti
Hanọ, 03 Octobre 2004
Trang 2Remerciements
Je voudrais remercier ici
L’IFI - Institut de la Francophonie pour l’Informatique - ó j’ai fait mon DEPA pendant toutes deux années et qui m’a aidé à venir en France pour faire le stage de fin d’études
M Serge Garlatti, mon encadrant, avec tous mes sentiments, qui m’a acompagné pendant toute la durée du stage avec son talent, ses conseils et ses implications de tout son ceur comme père pour les enfants
Je remercie tout particulièrement M Serge Garlatti, l’ami, le père qui m’a soutenu tout au long du stage, les vélos, le motard et les plats délicieux italiens
Je tiens à remercier Jean-Luis, Bui Huy Duc, Nguyen Thi Ngoc Tu, les collègues que j’ai pu comprendre plus de choses en discustant avec eux, et je aussi remercie particulièrement à Jean-Luis de corriger des fautes d’orthographe pour mon rapport
Enfin, j’amerais remercier mes parents et mes amis pour leurs soutiens et leurs encouragements
Trang 3Résumé
De nos jours, le System Adaptative d’Information basé sur Web (AWIS) utilise le Web pour fournir les contenus de type différents, les outils de navigation différents et la présentation correspondant au besoin d’utilisateur En utilisant le moteur de composition flexible SCARCE, une méthodologie fondée sur les ontologies et une architecture générique, sont proposées, qui peut-être utilisé dans plusieurs contextes Cette architecture est utilisée dans le projet ICCARS, CANDLE et KMP Parmi eux, KMP est considéré comme cas exceptionnel Il contient un nouveau type d’interface Homme-Machine, dans laquelle l’utilisateur joue non seulement un rôle du lecteur mais Ils s’interagissent aussi avec le système Pour cela, nous avons proposé avec le système KMP, une modélisation basée sur le modèle de tâches en utilisant un processus comme le processus de résolution par planification hiérarchique Ceci permet non seulement de gérer efficacement les ressources dans ce cas les compétences mais rend possible en même temps une coopération entre le système et son utilisateur
Le modèle de tâches n’est pas dédié à un type spécifique de problèmes, comme par exemple KMP Nous proposons avec ce modèle un moyen générique de modéliser le modèle d’usage qui permet a priori de décrire une série des applications et KMP comme cas
Mot Clés
System Adaptative, Moteur de composition, Web sémantique, Méta-données, Modèle d’utilisateur
Trang 4Abstract
Nowadays, adaptive web information systems are partially the Web to provide different kinds of content, navigation tools and layout according to user needs We focus on AWIS for which users shares a common knowledge to work together For us, AWIS design is an intensive knowledge driven process basing on the methodology and architecture used in the flexible composition engine called SCARCE that is used in many project likes ICCARS, CANDLE and KMP The key issues for reusing the content : interoperability and W3C standards, consistency of the delivered document and the distinct specification and management of AWIS components The main benefit of this approach is: i)
We have generic AWIS architecture which is reusable in very different contexts; ii) this architecture is tuned to the explicit knowledge of communities and provides a method for AWIS design We propose
a generic model by using the task model for solving the problem of a new type of Human Computer Interface – the interaction between users and system - which can not be solved by SCARCE and the application KMP is an example
Keywords
Adaptive Web Information Systems, Composition Engine, Semantic Web, Metadata, User Model
Trang 5Table des matières
1 Introduction 6
2 Revue bibliographique 7
3 Analyse de SCARCE 11
3.1 Introduction _ 11 3.2 Analyse _ 11 3.3 Re-engineering _ 16 3.4 Conclusion 16
4 Etude des principes fondamentaux 17
4.1 Document virtuel adaptatif fondé sur les ontologies _ 17 4.2 Principe _ 18 4.3 Modèle de document 18 4.4 Modèle d’adaptation 20 4.5 Partie dépendantes du moteur de composition _ 23
4.5.1 Moteur de Composition Sémantique 23
4.5.2 Moteur de composition logique 25
4.6 Conclusion 26
5 Modélisation d’un site web fondé sur le modèle de tâches 26
5.1 Introduction _ 26 5.2 Eléments de base _ 27
5.2.1 Tâches 27
5.2.2 Méthode 27
5.2.3 Entité 28
5.3 Modèle de tâches _ 28
5.3.1 La nouvelle interaction Homme/Machine 28
5.3.2 Distinction tâches abstraites - tâches atomiques 29
Trang 61 Introduction
De nos jours, grâce au développement de l’Internet, les informations sont très diverses avec le volume énorme Parmi ces informations, trouver celles dont on a besoin est toujours difficile Donc le système hypermédia est devenu, de plus en plus, populaire comme outils pour guider l’utilisateur à accéder aux informations D’une part, il fourni la facilité de naviguer à travers l’hyperespace D’autre part, ensemble des avantages, la structure de l’application hypermédia cause encore des problèmes d’utilisabilité :
9 Un système hypermédia présente toujours une page exactement de la même façon à tous les utilisateurs Cet approche est nommé « un pour tous » donc il y a pas la différence entre les utilisateurs
9 La navigation dans une manière que l’auteur n’est pas anticipé aussi pose le problème de compréhension de l’utilisateur En effet, pour chaque page, l’auteur assume sur la compétence requise avance de consultation Au contraire, les pages sont présentées la même façon, la conséquence que ils contiennent des redondances donc les consulteurs ne peuvent pas toujours comprendre le contenu
Le système hypermédia adaptatif (SHA) a pour but de surmonter ce problème en fournissant un support de navigation adaptative et un contenu adaptatif L‘adaptation (ou la personnalisation) est basée sur le modèle d’utilisateur qui présente les aspects concernés comme connaissance, compétence, intérêt… Le système collectionne les informations de l’utilisateur en suivant ses activités d’usage, particulièrement en observant le comportement de navigation de l’utilisateur En fait, un hypermédia adaptatif est une alternative à l’approche traditionnelle « un pour tous » en développement de système hypermédia adaptatif Le système hypermédia construit un modèle de buts, préférence et connaissance
de l’utilisateur individuel et utilise ce modèle à travers l’interaction de l’usager afin de s’adapter à cet utilisateur Par exemple, un étudiant qui suit un cours en ligne dans un système hypermédia adaptatif
va recevoir une représentation qui est adapté parfaitement à sa connaissance (De Bra and Calvi, 1998)
et puis être suggéré un ensemble de liens pour le suivit du processus (Brusilovsky et al 1998a) Une encyclopédie électronique va personnalisé le contenu d’un article pour augmenter la connaissance des invités et leur intérêt (Milosavljevic, 1977) Un musé virtuel adapte la représentation de tous les objets invités au parcours dans le musé d’utilisateur individuel (Oberlander et al., 1998) En effet, les utilisateurs ne sont pas tous intéressés par les mêmes informations Ils n'ont pas les mêmes attentes, acquis, antécédents et connaissances La compréhension d'un document repose sur une organisation,
un contenu, des modes d'interaction et une présentation adaptée à leurs besoins Parmi les problèmes qui se posent, on peut citer : l'accès à l'information pertinente, la navigation dans un grand espace d'information, la compréhension du document ou du site Web, et l'utilisabilité Dans l'avenir, l'adaptation/personnalisation sera l'un des points clés des services Web pour les entreprises et les particuliers
Face au vaste ensemble d’information sur Internet, le web de troisième génération est né pour améliorer la recherche d’information : meilleurs précision et rappel, favoriser d’une part le partage et
la réutilisation des connaissances des documents par l’utilisation d’ontologies, de mécanismes d’inférence de l’association de méta données sémantiques aux connaissances et documents D’autre part, acquérir et filtrer les informations concernants puis les composer dans une figure cohérente concordant à la référence d’utilisateur Le web sémantique est un web interprétable par les machines, qui permet à l’ordinateur d’exploiter le contenu d’une page web de façon à automatiser ou sémi-automatiser certains processus et par conséquent aider l'utilisateur dans sa tâche en se basant sur des description sémantique Ces descriptions sont vues comme un facteur principal pour trouver une solution dans l’espace d’information énorme ó la plupart des ressources du web ne peuvent actuellement être trouvées que par des correspondances syntaxiques (Brusilovsky et Tasso, 2004) Ces méta-donnés sémantiques fourniront un nouveau niveau d’intelligence du web
Un Document Virtuel Personnalisable (DVP) est une bonne approche pour la personnalisation, l'automatisation et la réutilisation En effet, un document virtuel personnalisable compose dynamiquement des documents à partir d'informations provenant de sources diverses, qui satisfont au
Trang 7mieux à des besoins utilisateurs La composition est découpée en trois étapes, la sélection de l'information, son organisation et son assemblage en un document réel Le document réel est le document qui est effectivement présenté à l'utilisateur Dans le cadre des travaux précédents (projet de ICCARS, CANDLE et la thèse de Iksal), la spécification déclarative et la composition sémantique d’un document virtuel personnalisable ont été étudiées et implémentées Ils nous permettent d’avoir un processus de génération dynamiquement des documents et la personnalisation du contenu en utilisant
le profil de l’utilisateurs
L’objectif de ce stage est d’analyser dans un premier temps l’Environnement Hypermédia Adaptatif SCARCE au sein de la version ICCARS adaptatif, afin de faciliter le développement d’une nouvelle application basée sur cet environnement Dans cette partie, on a besoin également d’analyser le code source et de restructurer une nouvelle structure plus compréhensive qui rend la possibilité de ré-utilisation plus facile Ensuite, d’étudier des principes fondamentaux de SCARCE regroupés dans: Le Modèle de Document, le Modèle d’Adaptation et les autres parties dépendantes de l’application En fin, de faire l’extension de ces principes pour d’autres types d’application (projet KMP,…) dans lesquelles une nouvelle interaction Homme-Machine doit être modélisée
La contribution principale de ce stage est de synthétiser des approches courrant sur le problème de modèle de document, son extension correspondant au nouveau besoin, nouveau type d’application dans le système hypermédia adaptatif, et de la mise en cohérence au niveau de concept entre les composants différents dans l’environnement de SCARCE, de réaliser quelque parties pratique afin de valider le modèle
Ce stage est réalisé dans le cadre du projet KMP (Knowledge Management Portal) au Laboratoire LUSSI, un nouveau nom du laboratoire IASC (Intelligence Artificielle et Science Cognitif), laboratoire de recherche de l’Ecole Nationale Supérieure des Télécommunication de Bretagne, situé à Brest, France L’ENST Bretagne est une des grandes écoles d’ingénieurs dont l’enseignement est dédié aux sciences et technologies de l’information et de la télécommunication Elle est également un centre de recherche de haut niveau dans ce domaine Membre du Groupe des Ecoles des Télécommunication (GET), elle est présente dans tous les projets nationaux et européens liés aux technologies de l’information et de la télécommunication
Ce rapport se compose de sept parties dont trois parties principales D’abord, l’introduction présente les informations générales sur le problématique du stage, le contexte et l’organisation du rapport La partie suivante est une revue bibliographique sur le système hypermédia adaptatif La troisième partie
a pour but d’analyser l’environnent de SCARCE dont la partie pratique de re-engineering est plus importante Cette partie est associée au résultat pratique qui a utilisé comme skeleton de l’application KMP Puis, la quatrième va se concentrer sur les principes fondamentaux : le modèle de document et
le modèle de l’adaptation Ensuite, la cinquième présente un modèle de document appliqué au KMP Il
a non seulement pour but de le valider mais aussi de démontrer la possibilité de la généricité du principe qui peut être appliqué aux séries d’application Enfin, la conclusion et la référence sont présentées dans les dernières parties
2 Revue bibliographique
En effet, La compréhension d’un document est souvent caractérisée par la construction mentale d’une représentation, d’un modèle de ce document La lisibilité du document peut être définie comme l’effort mental nécessaire au processus de construction d’un modèle [Kaheneman 1973][Thuring et al 1995], Ainsi qu’elle est devenu un des nouveaux enjeux du Web Evidemment que la compréhension est facilitée par la personnalisation des documents Un document qui ajuste au lecteur au sens de la représentation cohérente et la connaissance requise suffisante est toujours facile à comprendre En effet, la gestion de la dynamicité et de l’adaptation est réalisée au sein des travaux menés sur les Document Virtuels Personnalisables Les Documents Virtuel ont pour objectif de réutiliser le Web et héritent des Hypermédia Flexibles [Oberlander et Milosavljevic 1997] qui ont les capacités de génération dynamique en fonction de l’utilisateur
En principe, un document DVP peut être considéré comme un ensemble d’élément (ou fragment) associé à des mécanismes de filtrage, d’organisation et d’assemblage en respectant un modèle de
Trang 8l’utilisateur et des principes narratifs [Ranwez et Crampes 1999] En effet, un DVP est fondé sur deux étapes principales qui sont indissociables : le spécification de la composition La spécification d’un DVP, c’est l’ensemble des informations nécessaires au système pour composer le document Cette étape dépend bien évidement des principes mis en œuvre dans la composition A côté, la composition
a pour objet la construction d’un document réel à partir d’une spécification et des critères de personnalisation définis dans le modèle utilisateur, qui s’agit d’un ensemble de données persistantes qui caractérisent un utilisateur ou un groupe d’utilisateur particulier [Brusilovsky 1996] [Rich 1989] Souvent lorsqu’il s’agit du Web, les DVP sont présentés aux lecteurs sous la forme d’un hypermédia
En fait, les recherches sur le Hypermédia adaptatif ont commencé au début des années 90s En ce moment, les deux parties principales – Hypertexte et Modèle Utilisateur – ont étés réalisées afin de surmonter le problème de l’hypertexte statique sur les divers applications et commencer à exploiter différentes façon pour adapter des sorties aux individuels [Bocker et al.1990 ; Brusilovsky et al 1993 ; Kaplan et al.1993] On peut lister beaucoup de systèmes qui sont développés dans ce sens du Système Hypermédia Adaptable Toutefois, il est important de connaître la différence entre un hypermédia adaptable et un hypermédia adaptatif D’une part, l’utilisateur renseigne un profil au travers de boîtes
de dialogue ou questionnaire et le système propose une version de l’hypermédia correspondante D’autre part, dans un hypermédia adaptatif, le système observe le comportement de l’utilisateur et utilise ses observations afin d’adapter la représentation des informations L’évolution des préférences
et de la connaissance de l’utilisateur est alors déduite des accès aux pages web
A partir de l’année 1996, l’Hypermédia Adaptatif est avancé considérablement avec plusieurs recherches et les systèmes Hypermédia Adaptatifs sont étudiées et implémentés [Brusilovsky and De Bra, 1998, 1999 ; Brusilovsky et al 1997 ; Milosavljevic et al., 1997 ; Brusilovsky et al, 1998] Dans les quelles s’agissent du système, méthode et technique pour concevoir le Système Hypermédia Adaptatif Les SHA sont constaté d’utiliser sur plusieurs types – Hypermédia éducationnel, Système d’information en ligne, Système d’aide en ligne, « Information Retrieval » (IR) hypermédia… parmi lesquels les deux premiers sont les plus populaires Le choix du Web comme plate-forme de développement est devenu standard, il s’appelle le système « Web-based »
Trang 9Méthode et technique d’adaptation
Dans la cartographie des techniques d’adaptation présentée dans la figure 2, la taxonomie de Brusilovsky [“Adaptive hypermedia” 2001], une version mis à jour [“Methods and Techniques of Adaptive Hypermedia” Brusilovsky - 1996] elle se compose de deux parties: l’interface et l’interaction d’utilisateur considéré comme : Représentation Adaptative et Navigation Adaptatif
La Navigation Adaptative est concentrée sur l’aspect de hyperliens de navigation comme génération, apparence, placement…
La Présentation Adaptative basé sur les fragments d’information qui peuvent être traités et rendus dans divers manières à partir de la référence d’utilisateur En général, la Navigation Adaptative a pour objet
la présentation des liens et la Présentation Adaptative est pour le contenue
Figure 2 –Taxonomie des techniques d’adaptation
Fragments conditionnels
Présentation multimédia adaptative
Pages et fragments variants Présentation
adaptative de texte
Requête
Strechtext Tri de fragments Adaptation de
base de frames Méthode pour
Adaptation de carte
Suppression
Modélisation Utilisateur
Dans un SHA, la modélisation utilisateur joue un rôle très important (voir figure 1) afin de répondre à
la question : « A quoi, on s’adapte ?» En effet, le modèle utilisateur est « une source de connaissances, une base de données sur un utilisateur » [McTear, 1993] De nos jours, non seulement les caractéristiques sont considérées mais c’est aussi les données d’usage et d’environnement [Garlatti
et al., 1999 ; Kobsa et al., 1999] L’association à cette modélisation, le modèle utilisateur qui prend en charge de disposer les informations et aussi d’évaluer la pertinence des fragments Dans ce contexte, le SHA de SWAN [Garlatti et al 1999] est démontré parfaitement en utilisant le modèle de tâches hiérarchiques
Figure 1 – Modélisation Utilisateur dans le système adaptatif classique
Trang 10
Un utilisateur modelant le système est un système qui montre le comportement adaptatif au sujet de
utilisateur au
En bref, nous distinguons trois pro du modèle d'utilisateur, la mise à
lisateur disponible en utilisant
son interaction avec l'utilisateur En général, l'adaptabilité comporte l'utilisation de l'analyse par accroissement de comportement d’usage pour acquérir le modèle utilisateur d'une part Elle comporte également l'adaptation du comportement de système au modèle d'utilisateur d'autre part
Le système de client utilise le moteur d'adaptation en alimentant le comportement d'
système d'adaptation Le modèle d'utilisateur est mis à jour dans la réaction aux comportements d’utilisateur Enfin le modèle d'utilisateur est employé pour le système d'adaptation En tant que tel le modèle d'utilisateur est une partie principale d'un système adaptatif Cependant un modèle d'utilisateur n'apparaît pas hors de l'air mince Le modèle doit être d'abord initialisé avant d'être employé pour l'adaptation de système
Figure 2 - Moteur d’adaptation
cessus différents: l’initialisation jour du modèle utilisateur, et le système d’adaptation Ces trois processus sont décrits dans la figure 2
et Les trois processus ensemble sont inclus dans le moteur d'adaptation
Le processus d'initialisation du modèle d’utilisateur rend le modèle d'uti
le processus d’acquisition pour obtenir les informations sur l’utilisateur qui est effectué par le questionnaire, apprentissage,… Ensuite, Le modèle d'utilisateur va être mis à jour pendant le temps d'exécution du système au sein de l’interaction entre l’utilisateur et le système De la même façon le processus d’adaptation va utiliser le modèle d’utilisateur pour adapter le système
Modèle utilisateur
Initialisation
Système a
Acquisition
Observation directeInterviews
Traiter
Adaptation
Traiter
Système
Trang 113 Analyse de SCARCE
3.1 Introduction
Dans le contexte de Web, nous pouvons nommer au moins 3 sites web qui commencent avec le mot
« My » comme « My Yahoo – http://yahoo.com », « My MSN – http://msn.com » et « My Netscape – http://netscape.com » Parmi les services Web existant sur l’Internet, est-ce qu’il n’existe que 3 ou encore d’autre ? En effet, ils sont le service à la demande, qui fournissent la possibilité d’adapter au besoin de l’utilisateur On appelle le problème d’adaptation ou personnalisation et le service qui confond au gens de problème est le service web adaptatif
Un service web adaptatif est capable de traiter les besoins différents d’utilisateur afin d’améliorer l’utilisabilité et la compréhension du document hypermédia On voit bien que aujourd’hui l’espace d’information d’un hypermédia n’est pas limité dans un dépôt local mais plus étendu avec des ressources distribuées Afin de répondre à ce nouveau besoin, le service web qui doit prendre en compte la création et la maintenance doit être capable de (i) sélectionner les ressources asociées à travers Internet en respectant le besoin d’utilisateur – l’organisation est conforme à son profil (ii) réutiliser, partager les ressources dans le sens que des ressources vont être partager pour un ensemble d’utilisateur qui ont les mêmes intérêts et (iii) fournir la méthode pour faciliter le processus de création
et maintenance Le problème est que comment peut-on les modéliser et générer automatiquement ou bien dynamiquement et baser sur quelle approche qui nous permet de réaliser ce service
Concentrer sur la réutilisabilité et la génération dynamiquement de document réel, Le Document Virtuel peut être vu comme une méthode pour concevoir et maintenir le service web adaptatif En acceptant le besoin d’utilisateur comme un des entrées, le moteur de composition peut manipuler le document réel qui correspond à certain utilisateur ou un groupe d’utilisateur avec le même stéréotype
En fait, ce moteur se compose de trois étapes (i) sélectionner des ressources, puis (ii) les organiser et enfin (iii) les rassembler Une fois qu’on a un document réel caractérisé par ses ressources distribuées
et personnalisées à travers l’hyperespace donc un problème intuitive qu’on doit assurer : (i) la consistance, la cohérence et puis (ii) la compréhension
Pour résoudre cette difficulté, SCARCE (SemantiC and Adaptative Retrival and Composition Environment) est proposé ; un environnement flexible d’hypermédia adaptatif basé sur l’approche de document virtuel et l’évolution du web sémantique, on est capable de créer et maintenir le service dans lequel on résoudre le problème de sélection, organisation et filtrage au niveau sémantique - spécifications déclaratives Ces trois spécifications sont des paramètres du moteur de composition et sont appelées document générique
La spécification de sélection est basée sur le schéma de métadonnés, il est d’une part utilisé pour le processus de sélection, d’autre part, pour faire le filtrage sur les informations sélectionnées Et l’organisation est explicitement combinée à la sélection pour garantir la cohérence entres les parties Cela est fait à l’aide du savoir-faire de l’auteur qui sait parfaitement l’adaptation à qui et comment par
sa structure narrative présenté sous forme d’un graphe orienté dans lequel il y a une seule racine, des nœuds contenant la spécification de sélection et les arcs caractérisés par la relation sémantique
La spécification de filtrage est définie par les propriétés sémantiques associées à un document générique Cette spécification a pour but d’évaluer les ressources sélectionnées en utilisant des règles d’appartenance et puis en les mettant dans des classes correspondantes De plus, elle permet de choisir
la technique de navigation adaptative (direct guidance, annotation, hiding, sorting et partial hiding)
qui correspond à un certain utilisateur
3.2 Analyse
Moteur de composition sémantique
En général, pour un document papier ou bien électronique (sur web) on peut considérer qu’il y a trois vues différentes qui peuvent coexistées : sémantique, logique et physique D’abord, c’est celle du contenu d’un document qui s’agit des informations impliquées par l’auteur et sa structure implicite Qui apporte le sens d’un document La structure sémantique peut définir le plan du site dans un
Trang 12document hypermédia ou être vu comme un l’arbre de connaissance dans l’approche de P.Brusilovsky Puis, la structure logique reflète l’organisation syntaxique d’un document et finalement, la partie physique décrit comment le document être apparu
Figure 1 - Architecture du moteur de composition
Selon les trois vues différentes, le moteur de composition adaptative est divisé en trois : composition sémantique, composition logique et composition physique (Figure 1) Cette approche est liée fortement à l’architecture de sémantique web (Figure 2)
Firure x – Architecture du Web sémantique
(i) Niveau sémantique auquel la composition sémantique joue le rôle de sélection,
organisation et filtrage en utilisant la logique, les ontologies, le Flogic
(ii) Niveau logique dont le gabarit est encodés sous forme de fichier XML
(iii) Niveau physique qui prend en charge la convertion des fichiers XML en HTML en
Trang 13Les ontologies
et les facts
Requête/Résultat OntoBroker
Figure – Interaction entre Ontobroker et Le moteur de composition
Figure – Structure du composition sémantique
Liste de modules pour un projet donné
FORALL R_FirstModID <- EXISTS R_ProjTitle, R_MetaID InfosProject(\"" +
projectID + "\", R_ProjTitle, R_FirstModID, R_MetaID)
En utilisant une interface de OntoBroker – IEngine (Classe 6)qui fournie les fonctions de base pour gérer le service d’inférence de OntoBroker, la composition sémantique est capable d’interroger vers la base de connaissances OntoBroker et de récupérer le résultat sous forme des vecteurs
Un document générique se compose de l’espace d’information dans ce cas, l’espace d’information est considéré comme un ensemble de fragments, et un graphe générique dans lequel les nœuds contiennent la spécification de contenue et les arcs sont caractérisés par la relation sémantique, un ensemble de classes d’équivalence et ses règles d’appartenance, les stéréotype d’utilisateur, les techniques adaptatives Cette partie va être étudiée plus en détail dans la partie suivante
Un graphe sémantique est une instance de graphe générique, celle qui représente la structure narrative adaptée à l’utilisateur ; à son profil et au stéréotype du groupe auquel il appartient
Trang 14Figure 3 – Document générique
Dans la composition sémantique, le cœur du système, on peut diviser en deux packages, interdépendants dans le sens ó chaque fois qu’on change l’interface d’un package cela cause la modification des appels dans un autre package La composition sémantique se compose globalement
de trois packages principaux (i) le service de composition sémantique (Figure ), il fournie les méthodes au moteur de composition permettant de manipuler les document génériques (ii) le moteur
de composition (Figure ) qui construit le graphe sémantique étape par étape à partir d’un graphe générique qui est caractérisé par un utilisateur Les nœuds sont calculés au moment de l’exécution en utilisant le principe de Document Virtuel Cela permet la flexibilité de contenue du document réel et
de représentation aux lecteurs en fonction de ses activités et de son profil C’est pourquoi on l’appel
« moteur de composition adaptative »
Le moteur de composition adaptative est en fait une partie de la composition sémantique qui non seulement prend en compte le stéréotype de l’utilisateur – un ensemble de utilisateur portent les mêmes caractéristiques, afin de choisir la technique de navigation (Hiding, Partial Hiding, …), mais aussi filtre les ressources par une mesure d’évaluation (Figure ) Dans notre cas, les ressources sont les fragments qui sont associées aux données ou contiennent une spécification à partir de laquelle les données peuvent être dérivées
author
hasSub href
Figure - Modélisation de ressources
Trang 15La composition logique et physique
Le but de la composition logique et physique est de convertir le graphe sémantique en document réel
La navigation et l’accès à la ressource sont basés sur le graphe sémantique qui est géré par le moteur
de composition sémantique Dans chaque nœud, il y a un gabarit – une page XML correspondant avec son contenu et son outil de navigation en fonction de l’utilisateur De plus, la composition physique
va prendre cette page XML comme entrée et la convertir en HTML en utilisant le processeur de XSLT
Au niveau d‘un nœud dont le contenu dépend de sa spécification A priori, le spécification de contenu est très divers donc on a besoin de différentes façons pour présenter un document qui est manipulé par
un nœud
On prend un exemple le site web de eBay, la page d’accueil se compose des liens, des boutons, des textes, des menus, des images… (Figure)
Figure – Page d’accueil de eBay et celle de personnalisation
Cela présente un nœud dans le graphe sémantique au niveau physique - sur l’écran Ou nous pouvons continuer à naviguer sur le site ou au niveau d’un concepteur ce sont les passages d’un nœud au nœud suivant Avec les composants de même natures comme les boutons, les menus, les liens…mais avec une structure et une organisation différente, la page « mon eBay » est totalement différente (Figure) Donc nous avons en fait besoin de la correspondance entre un nœud dans un graphe sémantique et un gabarit de page afin de bien présenter le document réel
Au point de vue de la mis en page, la présentation d’un document se compose des composants, qui sont eux mêmes associés à leur type ( Le type de menu déroulant est différent par rapport au type d’une liste des liens ) Et pour chaque type de composant, il faut avoir un gabarit correspondant Donc dans une application, il y a peut-être plusieurs gabarits qui sont associés à un certain nœud au niveau sémantique
Trang 16Figure – Page Web de ICCARS
En effet, dans les cas de CANDLE ou ICCARS les documents sont des cours et des dossiers thématiques en ligne, et ils sont présentés par un seul gabarit Ces documents sont calculés au cours
de l’exécution pas à pas Un pas contient le processus de récupération de contenue et le calcul du pas suivant Où l’utilisateur peut y aller à partir d’interaction de l’utilisateur Un gabarit XML décrit une page web générique qui s’est composée de plusieurs composants dynamiques (navigation local, global , le panel de contenue…) Dans lequel la navigation local contient les liens qui sont présentés pour les pages suivantes, les pages précédentes et la position courante En utilisant le même gabarit donc la mis
en page dans CANDLE et ICCARS sont identique au sens de la présentation
Au niveau du code source, il existe encore des problèmes sur la structuration des packages, modules et les méthodes, sur la redondance, la compatibilité de l’application avec la nouvelle version de OntoBroker, version 3.7 – une base de données déductive Cette partie est présentée en détail dans le rapport technique du projet KMP – la première phase du stage
3.4 Conclusion
On voit bien qu’il existe deux problèmes dans cette plate-forme Premièrement, la dépendant entre le moteur de composition sémantique et la base de connaissance Ontobroker et deuxièmement, le problème de faire la correspondance au niveau logique entre un nœud et un gabarit Nous allons détailler les solutions dans la partie suivante
Trang 174 Etude des principes fondamentaux
De nos jours, le Système d’Information Adaptatif basé sur Web (AWIS) est de plus en plus utilisé Il utilise le web comme une partie de l’espace d’information AWIS nous fournie le contenu, les outils
de navigation, la présentation par rapport au besoin d’utilisateur En effet, concentrer sur AWIS dans lequel les utilisateurs sont des communautés qui partagent les connaissances communes On remarque que la connaissance explicite de la communauté est le point clés pour automatiser le AWIS en gardant
la consistance et la compréhension La spécification et la gestion de contenu – sélection, organisation
et les stratégies d’adaptation – filtrage sont séparés et basés sur les connaissances communes Donc la conception de AWIS a été considéré comme « knowledge driven process » [Iskal et Garlatti, 2004] Baser sur le moteur de composition flexible SCARCE basé sur une approche de sémantique web La méthodologie contient d’abord l’organisation sémantique de ressources, ensuite la spécification déclarative d’adaptation et enfin le moteur de composition sémantique, qui nous permet de concevoir une architecture de AWIS plus générique qui est utilisable dans les cas divers
Par la modification de la spécification de la sélection, de l’organisation et du filtrage au niveau sémantique qui sont liés à la modification des ontologies, on peut également générer une nouvelle application de type AWIS A la limite de SCARCE, ce principe a été validé dans le cadre de deux projets ICCARS et CANDLE
4.1 Document virtuel adaptatif fondé sur les ontologies
La génération de documents sémantiquement cohérents dans le cadre des DVP est nécessaire afin d'améliorer la compréhension du document par le lecteur Les DVP sont des documents électroniques composés d'un espace d'information et d'une ou plusieurs organisations - ou parcours de lecture - pour cet espace d'information La séparation du contenu - l'espace d'information, de la structure - l'organisation, et de la présentation du document favorise la réutilisation, le partage de contenu ou de structure, et permet une gestion particulière de l'adaptation pour chacun Dans un document électronique, le contenu et l'organisation de ce contenu peuvent évolués, et le lecteur peut demander à relire le document tel qu'il était lors de sa précédente consultation, c'est pourquoi il est nécessaire de gérer les différentes versions d'un document
L'organisation de l'information au sein d'un document correspond à un graphe orienté dont le contenu des noeuds et les relations entre ces nœuds sont typés selon le savoir-faire de l'auteur du document La cohérence sémantique du document est véhiculée par son espace d'information ainsi que par les types des contenus et des relations de l'organisation Elle est renforcée dans les documents orientés auteur, car l'auteur sélectionne et organise le contenu du document selon son savoir-faire L'organisation de l'information correspond alors à une structure narrative explicite sur l'espace d'information du document
Figure 3 – Structure des ontologies
Otologie générale
En utilisant une approche fondée sur des ontologies pour répondre au besoin de modélisation et de représentation, on propose la définition suivante : Un Document Virtuel Adaptatif se compose d’un
Modèle utilisateur
Otologie
Document
Métadonnnées
Ontologie domaine
Document
Métadonnnées
Espace d’information
Trang 18ensemble de ressources, les métadonnées correspondantes, les ontologies différentes (figure 3) et un moteur de composition adaptatif qui est capable de sélectionner, filtrer les ressources nécessaires, d’organiser et de rassembler les fragments d’information et de non-information (fragment qui contient
la spécification du contenue ou bien une requête)
4.2 Principe
Au niveau sémantique, les ontologies portent un rôle central pour modéliser une nouvelle application (figure 3), par exemple : l’ontologie de méta données décrit l’index, la structure de ressources, donc la valeur est dans le domaine et parfois dans l’ontologie de document L’ontologie de domaine représente les connaissances sur un domaine spécifique ou bien un groupe des connaissances qui caractérisent le domaine L’ontologie de document contient le modèle de document et le modèle de l’adaptation
Un AWIS est considéré comme un document virtuel adaptatif basé sur les ontologies En effet cette approche est basée sur le moteur de composition adaptatif dans lequel la sélection, le filtrage et l’organisation sont résolus au niveau sémantique, la partie d’assemblage est réalisée au niveau logique
et enfin la présentation au niveau physique Ce principe nous permet de construire une classe d’application adaptative de type AWIS en gardant la cohérence et aussi l’indépendance entre les composants (sémantique, logique et physique - figure 4)
En fait, le principe est inspiré des principes fondamentaux de SCARCE dans lequel les processus d’organisation, sélection et filtrage sont comme suit :
9 Organisation est combinée avec le processus de sélection L’organisation est basée sur un graphe générique orienté, qui a une seule racine, des nœuds ; chaque nœud contient une spécification (appelé nœud générique) – et des arcs qui présentent la relation sémantique entre les nœuds (appelé arc générique) Le graphe générique représente non seulement l’organisation mais aussi la structure de l’application Et il est décrit dans l’ontologie de document
9 Sélection est le processus de récupération des informations sur un ensemble de ressources indexées par le schéma de méta données Les méta données ont pour objet d’une part de retirer les informations, et d’autre part de filtrer les informations dont un sous ensemble de méta donnée est utilisé pour la spécification de sélection et un autre pour la spécification de filtrage
9 Filtrage est basé sur les méthodes de navigation adaptative en poursuivant le principe comme suit :
o D’abord, les ressources sélectionnées sont évaluées, ce processus va mettre chaque ressource dans une classe correspondante accordée à la class de règles Cette classe est déclarée dans l’ontologie de document en venant de la communauté pratique En fait, c’est très difficile à classifier en plusieurs classes au point de vue de l’utilisateur donc
un maximum de cinq classes est défini
o Enfin, une technique d’adaptation est choisie pour l’utilisateur, ses préférences et le stéréotype associé à une technique de navigation adaptative (figure 2)
4.3 Modèle de document
L’ontologie de document se compose d’un modèle de document, un modèle d’adaptation, un ensemble d’instance de fragment atomique, de fragment abstrait et de relation sémantique et un document générique Les deux modèles appartiennent à SCARCE et les autres dépendent de la communauté pratique dans laquelle les membres partagent des connaissances
Le modèle de document est basé sur le concept de Fragment abstract (figure 4) qui peut être organisé à partir d’une ou plusieurs structures Une structure est une collection de nœuds génériques, dont un est
la racine Un nœud générique est un objet abstrait appartenant à une structure et se lie au autre par la relation sémantique En effet, l’ensemble de relation sémantique est caractérisé par la communauté
Trang 19pratique qui doit être prédéfinie pour un nouveau type d’application Par exemple, un sous ensemble
de relation sémantique de RST est prédéfinie pour ICCARS et CANDLE
Figure 4 – Modèle de document
GenericDo cument
*
+hasEvaluation 1
+hasAdaptation
AbstractFr agment
GenericNode
*
*
* +isComposeOf *
Un ensemble de nœud générique et les relations sémantiques correspondantes forment une organisation de AWIS Au moment de l’exécution, un nœud générique contient une spécification de contenu, qui peut être considérée comme processus de récupération des informations utilisant une description posé par l’auteur correspond aux méta données, pour envoyer une requête vers une base de données intelligente En effet le calcul de la spécification du nœud est un processus en 4 étapes :
Etape 1 : Le calcul de la description détaillée des fragments
Au sens de limité de l’espace d’information liée au fragment donné Il s’agit de calculer pour chacun des fragments choisis par l’auteur ou bien la requête au fonction de l’utilisateur la liste de concept qui permettent de décrire son contenu Evidemment que ce calcul utilise les concepts renseignés dans les métas donnés et recherche leurs supper-concepts
Soit D l'ontologie de domaine, Cf l'ensemble des concepts décrivant le fragment f de la liste F des fragments choisis par l'auteur ou bien généré par le système au fonction d’utilisateur , et Lf la liste des concepts et de leurs super-concepts décrivant le fragment f
D
Etape 2 : Le calcul du noyau
Le noyau N correspond à l'ensemble des concepts du domaine qui sont communs à tous les fragments (Même chose avec les types de contenus communs)
N c L c
Etape 3 : Rechercher les fragments correspondant au noyau
Il s'agit de rechercher dans l'espace d'information E du document l'ensemble S des fragments qui s'apparient avec le noyau N
Trang 20S f L c N c E
Etape 4 : Affiner la spécification si nécessaire
Si S ≠ F alors il est nécessaire d'affiner la spécification avec d'autres métadonnées (sections Générale, Cycle de vie, et Technique) jusqu'à obtention de l'équivalence entre les ensembles L'ordre des méta données utilisées dépend de la discrimination qu'elles permettent de faire Par exemple, si tous les fragments choisis par l'auteur pour le nœud ont justement été rédigés par un même auteur, on ajoutera dans la spécification l'auteur des fragments
4.4 Modèle d’adaptation
Le modèle d’adaptation se compose de la classe équivalente, ses règles d’appartenance, un ensemble
de méthode d’adaptation et leurs stéréotypes Un document générique contient des règles d’adaptation qui sont les instances de l’élément différents du modèle d’adaptation Une règle d’appartenance est une comparaison entre les caractéristiques d’utilisateur (l’ontologie d’utilisateur) et les fragments indexés (l’ontologie de méta données)
Le système est conçu pour prendre en compte cinq stratégies de navigation adaptative et la présentation adaptative qui en découle [Brusilovsky 1996] [De Bra et Calvi 1998] Une stratégie de navigation adaptative classe et filtre les liens du document hypermédia Les cinq stratégies de navigation adaptative mises en œuvre sont les suivantes :
9 L'annotation : Chaque lien est présenté différemment en fonction du niveau de pertinence qui lui est associé Une image ou un code de couleur peut être associé à un lien à partir d'une évaluation du lien qui prend en compte les caractéristiques du lecteur On pourra, par exemple, mettre un feu vert devant les liens les plus recommandés pour le lecteur, un feu orange pour ceux qu'il peut consulter mais avec lesquels il aura des difficultés et un feu rouge pour ceux qui ne lui correspondent pas Les liens sont donc classés
9 Le guidage direct : Le système détermine le "meilleur lien suivant" à partir du fragment courant Les liens sont donc filtrés
9 Le tri : Les liens sont triés en fonction de leur niveau de pertinence pour un utilisateur particulier Le système placera le lien le plus pertinent au sommet de la liste Les liens sont donc classés
9 Le masquage : Les liens estimés les plus pertinents sont retenus pour l'utilisateur Les liens sont donc filtrés
9 Le masquage partiel : Le système affiche les liens qui possèdent un niveau de pertinence compris dans un intervalle choisi par l'auteur Les liens sont donc filtrés et classées Les liens retenus sont ensuite annotés
Pour chacune des stratégies d'adaptation, l'auteur spécifie un stéréotype de lecteur Si le modèle utilisateur s'apparie avec le stéréotype alors le lecteur peut bénéficier de la stratégie d'adaptation correspondante
Pour toutes les stratégies d'adaptation, il est nécessaire d'évaluer la pertinence de chaque lien ou du fragment pointé par ce lien afin de le classer et/ou de le filtrer Généralement, les hypermédias adaptatifs proposent un maximum de 5 classes Au delà, le lecteur éprouve des difficultés à se repérer Nous avons choisi d'évaluer les fragments pointés par un lien L'auteur peut choisir de 2 à 5 classes, disjointes et totalement ordonnées, de liens pour un document générique Ces cinq classes sont : Très mauvais, Mauvais, Intéressant, Bon et Très bon Pour chaque classe choisie par l'auteur, les propriétés nécessaires et suffisantes d'appartenance sont spécifiées
Les classes sont utilisées de la façon suivante pour la gestion des stratégies d'adaptation :
9 L'annotation : Toutes les classes sont conservées
9 Le guidage direct : Il nécessite de la part de l'auteur un critère de sélection du meilleur fragment parmi ceux qui sont le mieux classés
Trang 219 Le tri : Toutes les classes sont conservées et l'ordonnancement se fait de la meilleure à la moins bonne
9 Le masquage : La meilleure classe parmi celles qu'a choisies l'auteur pour son document est conservée
9 Le masquage partiel : Toutes les classes meilleures qu'une classe pivot et cette classe pivot sont conservées La classe pivot est spécifiée par l'auteur
Pour chaque document générique, les propriétés sémantiques suivantes sont spécifiées :
9 Le stéréotype de lecteur pour chacune des stratégies d'adaptation
9 Les propriétés des stratégies d'adaptation
9 Les différentes classes d'évaluation et leurs règles d'appartenance
Toutes ces propriétés sont déclarées dans le modèle de document - ontologie de l'application
Les stratégies d'adaptation
Dés lors qu'un système propose plusieurs stratégies d'adaptation, les utilisateurs peuvent spécifier celle qui leur convient le mieux Dans notre cas, le lecteur peut classer les stratégies selon ses préférences, mais l'auteur peut aussi imposer des stratégies à des stéréotypes de lecteur En effet, l'auteur est capable d'évaluer si un certain ensemble de lecteurs aura besoin d'être plus accompagné (guidage direct) qu'un autre dans la lecture du document
Les préférences du lecteur ne sont prises en compte qu'après un premier filtre sur les stratégies d'adaptation effectué par l'auteur Un lecteur peut donc bénéficier d'une stratégie d'adaptation si son modèle et le stéréotype associé à la stratégie s'apparient Pour la définition des stéréotypes de lecteurs, l'auteur utilise des caractéristiques provenant du modèle utilisateur comme, par exemple dans ICCARS, l'âge ou l'activité professionnelle, ou encore des caractéristiques plus fines comme la connaissance ou le niveau de connaissance de tel ou tel concept de l'ontologie du domaine
Grammaire de définition de stéréotype
Stereotype ::= Condition_Booleenne |
Condition_Booleenne Condition_Supplementaire+ ;
Condition_Booleenne ::= (Objet Comparateur Valeur) |
Operateur_Unaire (Objet Comparateur Valeur) ;
Condition_Supplementaire ::= Operateur_Binaire Condition_Booleenne ;
Operateur_Unaire ::= NOT ;
Operateur_Binaire ::= AND | OR ;
Objet ::= USER_PROPERTIES;
Comparateur ::= = | < | > | <= | >= | <> | IN ;
Valeur ::= STRING | NUMBER | CONCEPT | LEVEL;
La grammaire (Table 6.1) détaille le mode d'écriture du stéréotype par l'auteur Ce stéréotype est traduit automatiquement par le système dans le langage de la F-Logic [OntoPrise 2002]
Un exemple de stéréotype et sa signification :
9 ANNOTATION = "((AGE < 18) OR (JOB = Student)) AND (LOCATION IN Bretagne)"
9 L'annotation est réservée aux lecteurs de moins de 18 ans ou étudiants qui vivent en Bretagne Les différents "Objets" (USER_PROPERTIES) utilisés pour l'élaboration du stéréotype sont des caractéristiques du modèle utilisateur On peut potentiellement utiliser toutes les propriétés d'un modèle utilisateur, depuis des caractéristiques telles que l'âge ou l'activité, jusqu'à l'historique comme par exemple, le fait d'avoir déjà consulté tel ou tel fragment ou document La connaissance du lecteur est représentée par un modèle de recouvrement en référence à l'ontologie du domaine Pour cette
Trang 22caractéristique, la condition porte sur le niveau de connaissance que possède le lecteur sur un concept
de l'ontologie de domaine Dans ICCARS par exemple, le lecteur pourrait être "Novice" sur la
"peinture antifouling"
La présentation adaptative est obtenue par l'utilisation de stratégies de navigation adaptative En effet,
la navigation adaptative agit sur les liens
Etant donné que la granularité de recherche est identique à celle de la réutilisation, un fragment ne peut être que conservé ou supprimé Lorsqu'il y a filtrage des liens - guidage direct, masquage et masquage partiel, les fragments correspondants aux liens supprimés ne sont pas conservés Il y a donc présentation adaptative (ou adaptation du contenu) et modification de la structure narrative
L'évaluation des fragments
Les stratégies de navigation adaptative nécessitent l'affectation des fragments aux différentes classes
Le système évalue les fragments à partir de conditions nécessaires et suffisantes d'appartenance à ces classes, ces conditions sont définies par l'auteur Nous proposons un maximum de cinq classes, sachant que l'auteur est libre de choisir entre 2 et 5 classes pour son document
Ces classes sont ordonnées et mutuellement exclusives, elles sont les suivantes : Très mauvais, Mauvais, Intéressant, Bon et Très bon
Les conditions (ou règles) d'appartenance à une classe sont définies par des expressions booléennes qui peuvent prendre en compte un stéréotype de lecteur (des propriétés du modèle utilisateur), un sous-ensemble des méta données dédié aux fragments variants et un niveau de connaissance des concepts
de l'ontologie du domaine - calculé à partir des méta données et du modèle utilisateur (Pourcentage de concepts connus, pourcentage de concepts de niveau suffisant)
La grammaire (Table 6.2) détaille le mode d'écriture de la règle d'appartenance à une classe par l'auteur Cette règle est traduite automatiquement par le système dans le langage de la F-Logic La règle est une condition
Grammaire de définition de règle d'évaluation
Regle ::= Condition_Booleenne |
Condition_Booleenne Condition_Supplementaire+ ;
Condition_Booleenne ::= (Objet Comparateur Valeur) |
Operateur_Unaire (Objet Comparateur Valeur) ;
Condition_Supplementaire ::= Operateur_Binaire Condition_Booleenne ;
Operateur_Unaire ::= NOT ;
Operateur_Binaire ::= AND | OR ;
Objet ::= USER_PROPERTIES | METADATA | PCTAGEKNOWN | PCTAGEGOODLEVEL ;
Comparateur ::= = | < | > | <= | >= | <> | IN ;
Valeur ::= STRING | NUMBER | CONCEPT | LEVEL;
qui doit être satisfaite par le fragment et par le lecteur pour que la classe correspondante soit associée
au fragment
Un exemple de règle et sa signification :
9 Good = "(JOB = Fisherman) AND (PCTAGEKNOWN >= 75)"
9 Le fragment est évalué à Bon si le lecteur est un pêcheur et qu'il connaît au moins 75% des concepts du domaine qui indexent le fragment
La règle d'appartenance peut utiliser potentiellement toutes les caractéristiques de l'utilisateur (USER_PROPERTIES), mais aussi toutes les métadonnées associées au fragment (METADATA), de l'auteur au type de document en passant par le média concerné Pour le niveau de connaissance, nous distinguons deux cas possibles : Le concept connu et le concept pour lequel