Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris.. Recherchant des solutions pour l’image de docume
Trang 1Maître de conférences à Université de Nancy 2 Chercheur à l’équipe QGAR, INRIA Lorraine
Nancy, France
Nancy, juin - novembre 2004
Trang 2Je tiens à remercier profondément mon responsable, Monsieur Salvatore Tabbone, professeur associé à l’Université de Nancy 2, chercheur au LORIA, qui a accepté de diriger mon stage de fin d’études, a aussi consacré beaucoup de temps pour m’aider lors
de mon stage
Je voudrais remercier particulièrement tous les professeurs à l’Institut de la Francophonie pour l’Informatique (IFI) pour leur soutien, ce qui m'a permis de pouvoir bien effectuer mon stage de fin d'études
Je remercie également les membres de l’équipe QGAR qui m’ont beaucoup aidée durant mon séjour à Nancy
Un grand merci à tous mes amis à l’IFI et au LORIA pour leurs encouragements, leurs aides et la sympathie qu'ils m’ont données tout au long de mon stage
J'adresse, enfin, mes remerciements sincères à ma famille pour ses stimulations
Trang 3RESUME
La binarisation des images a suscité beaucoup de travaux de recherche ces dernières décennies Cependant, il n’existe pas une solution idéale qui est affectée à tous les différents types d’images Durant mon stage, nous nous sommes intéressés à définir une approche de binarisation qui s’applique à des documents graphiques Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris Cette méthode repose sur la coopération entre une approche de seuillage global et une approche de seuillage local
La méthode se compose de deux étapes La technique de seuillage global est affectée à la première étape et a pour but d’éliminer la partie du fond de l’image La deuxième est basée sur la segmentation hiérarchique floue de Gadi et Benslimane pour rendre l’objet dans l’image plus net Dans cette étape, les traitements sont effectués sur les données des zones de tailles différentes du résultat intermédiaire en prenant le principe de l’arbre quaternaire La classification finale d’un pixel sera déterminée grâce à
la fonction d’agrégation à partir de ses différents degrés d’appartenance qui sont calculés
à tous les niveaux de l’arbre La méthode proposée a donné des résultats intéressants en appliquant sur l’ensemble des images de test Son efficacité est démontrée par une étude comparative avec d’autres méthodes et par des mesures de performance
Mots clés : binarisation local adaptatif, binarisation coopérative, image de
documents, arbre quaternaire, sous-ensembles flous, fonction d’appartenance
Trang 4ABSTRACT
Binarization of the images has been a subject of an intense research interest for a long time However, there is not a perfect solution, which can apply for all the various kinds of images Therefore, during my training course, we define a method working effectively on image of graphic documents After testing different solutions, we propose a binarization method for the gray level image of documents This method is considered to
be the cooperation between a global and a local thresholding technique
The method presented is based on two stages The global thresholding is used in the first stage to give a preliminary result Then, a second based on the fuzzy hierarchical segmentation refines the result by analyzing local characteristics In this stage, the treatments are carried out on the data zones with different sizes by taking the quadtree principle on the preliminary result The classification of a pixel depends on its final degree
of membership calculated from its various degrees determined by the node local information at all quadtree levels
The method suggested gives remarkable results by applying it to a set of images that be used tested Its effectiveness is shown in comparing with other methods
Keywords: adaptive local thresholding, cooperative binarization, document image,
quadtree, fuzzy set, membership function
Trang 5TABLE DE MATIERES
REMERCIEMENTS 2
RESUME 3
ABSTRACT 4
LISTE DE FIGURES 6
LISTE DE TABLEAUX 6
CHAPITRE 1 : INTRODUCTION 7
1.1.PROBLEMATIQUE 7
1.2.OBJECTIF 8
1.3.STRUCTURE DU RAPPORT 8
1.4.LIEU DE STAGE 8
CHAPITRE 2 : ETAT DE L’ART 9
2.1.GENERALITE 9
2.1.1 Segmentation 9
2.1.2 Binarisation 9
2.1.3 Sous-ensemble flou 11
2.2.METHODES DE SEUILLAGE GLOBAL 13
2.2.1 Méthode de Otsu 14
2.2.2 Méthodes se basant sur l’entropie 15
2.3.SEGMENTATION HIERARCHIQUE FLOUE 17
CHAPITRE 3 : METHODE PROPOSEE 20
3.1.PRINCIPE DE LA METHODE 20
3.2.ETAPE DE SEUILLAGE GLOBAL 20
3.3.ETAPE DE RAFFINAGE 21
3.3.1 Construction de l’arbre quaternaire 22
3.3.2 Calcul des degrés d'appartenance de chaque pixel 25
3.3.3 Décision de degré d'appartenance final 26
CHAPITRE 4 : EVALUAT IONS 28
4.1.RESULTATS EXPERIMENTAU X 28
4.2.MESURES DE PERFORMANCE 34
4.2.1 Mesure de contraste 34
4.2.2 Mesure d’homogénéité 35
4.3.AVANTAGES ET INCONVENIENTS 35
CHAPITRE 5 : CONCLUSIONS 37
REFERENCES 38
Trang 6LISTE DE FIGURES
Figure 2.1 : Fonction d’appartenance linéaire 13
Figure 2.2 : Fonction S de Zadeh 13
Figure 2.3 : Un problème de la méthode de Gadi et Benslimane 18
Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…) 19
Figure 3.1 : Principe de la méthode proposée 20
Figure 3.2 : Image originale – jaures_patie1.tif 21
Figure 3.3 : Image intermédiaire de jaures_patie1.tif 21
Figure 3.4 : Image binaire de jaures_patie1.tif après la première étape 21
Figure 3.5 : Structure tridimensionnelle de l’arbre quaternaire 23
Figure 3.6 : Quadrillage de l’image intermédiaire 25
Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif 27
Figure 4.1 : Image originale jaures.tif 28
Figure 4.2 : Image originale harchure.tif 28
Figure 4.3 : Image originale plan2.tif 28
Figure 4.4 : Image originale extraire_1.tif 28
Figure 4.5 : Résultats de l’image jaures.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 30
Figure 4.6 : Résultats de l’image harchure.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 31
Figure 4.7 : Résultats de l’image plan2.tif en appliquant : 32
Figure 4.8 : Résultats de l’image extrait_1.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 33
LISTE DE TABLEAUX Tableau 4.1 : Performances quantitatives 35
Tableau 4.2 : Comparaison du temps de calculs 36
Trang 7CHAPITRE 1 : INTRODUCTION 1.1 Problématique
Au sein de développements forts de la science, on ne peut pas nier le rôle de l’image numérique, un support important des applications dans de très nombreux domaines tels que la médecine, le multimédia, la robotique Parmi une série d’opérations effectuées sur les images, le traitement d’images est considéré comme une étape de base et indispensable dans toutes ces applications et a suscité de nombreuses recherches Il peut être vu comme préalable à la reconnaissance de formes, à l’analyse
de scènes, à l’intelligence artificielle La segmentation, un traitement de base ayant pour but de partitionner l’image en des régions homogènes qui représentent normalement les objets, est un problème classique mais très considéré C’est évident qu’il n’existe pas toujours une solution idéale pour tous les cas Plusieurs solutions ont été proposées pour résoudre ce problème de segmentation d’images du plus général au plus particulier Cependant, chaque méthode a ses avantages et ses inconvénients tels que la manipulation des paramètres [Trier,1995a], la complexité de calcul [Cheng,1999b] [Tao,2003]
Problème
Dans l’analyse d’images de documents et la reconnaissance de symboles, la binarisation est toujours une des premières étapes utilisées avant l’étape de reconnaissance Elle a donc une grande influence sur la performance des étapes suivantes et sur le résultat final C’est une technique importante dans les applications de traitement d’images
Une image de documents graphiques contient généralement du graphique mais également du texte qui sont quelques fois assez proches Le texte risque donc de fusionner des différentes parties du graphique à cause du changement faible d’intensité des pixels du fond et ceux de l’objet Recherchant des solutions pour l’image de documents graphiques, nous essayons de trouver une méthode automatique de binarisation simple et efficace qui sépare le fond et l’objet dans des images aux niveaux
de gris
Remarque
Travaillant avec l’image de documents graphiques, nous supposons toujours que l’image contient l’objet noir (des lignes, des textes) sur le fond blanc
Trang 81.3 Structure du rapport
Mon rapport se compose de cinq parties Quelques mots d’introduction de mon stage sont dans la première partie La deuxième est consacrée à une présentationgénérale des techniques de segmentation d’images surtout la binarisation Des brèves descriptions de quelques méthodes y sont aussi présentées La troisième partie est dédiée à la description détaillée de la méthode proposée L’analyse de résultats et les mesures d’évaluations sont abordées dans la quatrième Ce rapport se termine par la conclusion (cinquième partie)
1.4 Lieu de stage
Laboratoire
Le LORIA (Laboratoire Lorraine de Recherche en Informatique et ses Applications) est une Unité Mixte de Recherche - UMR7503 – constituée par plusieurs établissements : Centre National de Recherche Scientifique (CNRS), Institut National Polytechnique de Lorraine (INPL), Institut National de Recherche en Informatique et en Automatique (INRIA), Université Henri Poincaré Nancy 1 (UPH), Université Nancy 2
Equipe
Mon stage, qui a duré six mois, s’est déroulé au sein de l’équipe QGAR (Querying Graphics through Analysis and Recognition) de l’INRIA lorraine sous la responsabilité de Salvatore Tabbone (Maître de conférences à l’université de Nancy 2) C’est une équipe spécialisée dans l’analyse de documents à forte composante graphique Les objectifs sont l’indexation et la recherche d’informations dans le contexte de la documentation technique
Le site http://www.loria.fr vous fournira des informations plus détaillées sur le laboratoire La présentation plus détaillée de l’équipe se trouve dans les sites webs http://www.loria.fr/equipes/qgar et http://www.inria.fr/recherche/equipes/qgar.en.html
Trang 9CHAPITRE 2 : ETAT DE L’ART 2.1 Généralité
2.1.1 Segmentation
La segmentation, un traitement essentiel des images, consiste à créer une partition
de l’image en des sous-ensembles appelés régions Ri Une région est un ensemble de pixels qui possèdent des propriétés communes telles que l’intensité, la texture, etc Le but
de la segmentation est d’extraire de l’image originale un certain nombre d’entités différentes appelées objets ou régions Comme c’est extrêmement difficile d’avoir un algorithme idéal qui fonctionne correctement dans tous les cas, des nombreuses méthodes sont proposées En bref, on peut les classifier en deux grandes approches,
l’approche « frontière » et l’approche « région » [Horaud,1993]
La première, l’approche « frontière », est basée sur la forte variation d’intensité ou
sur la discontinuité des propriétés de deux ensembles connexes de points Elle regroupe les techniques de détections de contours En général, cette approche ne conduit pas directement à une segmentation de l’image à cause de la continuité rare des contours Il faut donc procéder à une fermeture de contours si on souhaite une partition complète de l’image Les régions sont définies comme l’intérieur d’une ligne fermée
Par contre, des méthodes appartenant à l’approche « région » sont construites
grâce à la similarité des points en évaluant des critères prédéfinis pour les regrouper directement en régions Le seuillage, la croissance de région, la division-fusion sont des exemples de méthodes différentes de segmentation région
Il existe également des méthodes qui se basent à la fois sur les propriétés des
frontières et sur les propriétés de la région, on les appelle approche collaboration
2.1.2 Binarisation
Définition : la binarisation (le seuillage) est la technique de classification la plus
simple ó les pixels de l’image sont partagés par un seul seuil s en deux classes : ceux
qui appartiennent au fond et ceux qui appartiennent à la scène (l’objet) L’image est alors
Trang 10séparée en deux classes de façon à ce que l’information comprise entre 0 et s est retenue
et l’autre non, ou vice-versa
Soit l’image I (M x N), supposons que f(x, y) représente le niveau de gris du pixel aux coordonnées (x, y),0≤ x≤M,0≤ y≤ N et s est le seuil choisi, les pixels de l’objet sont ceux ayant le niveau de gris inférieur à s et les autres ayant le niveau de gris supérieur à s sont des pixel du fond Alors, l’image binarisée G est déterminée par les
pixels (x, y) dont la valeur est :
Selon [Horaud,1993], il existe trois grandes techniques de sélection du seuil s : global, local et dynamique Comme il y a des différentes façons de déterminer le seuil s, il
peut être considéré comme une fonction sous forme de s=t((x,y),p(x,y), f(x,y)) ó
p(x, y) représente des propriétés locales du point (x, y) Si s ne dépend de que la valeur f(x, y) du point, le seuil est global, s’il dépend en plus de p(x, y), s est un seuil local Et si
s dépend à la fois de (x, y), de p(x, y) et de f(x, y), on dit le seuil dynamique ou bien
adaptatif
Dans la méthode de binarisation globale un seuil unique est calculé à partir d’une
mesure globale sur toute l’image Il nous permet de décider l’appartenance d’un pixel à l’objet ou au fond Les méthodes de Otsu [Otsu,1978], de Kapur [Kapur,1985], de Pun [Pun,1980], ou de Cheng et Chen [Cheng, 1998b] peuvent être tenues comme des représentants de cette approche Chacun a de différentes stratégies pour atteindre leur but Par exemple, la méthode décrite dans [Otsu,1978] essaie de maximiser la variance entre deux classes, tandis que d’autres méthodes dans [Kapur,1985] [Pun,1980] [Cheng,1998b] [ Mello,2000] se basent sur la théorie de maximum d’entropie ou d’entropie floue
Pour la binarisation locale, la classification d’un pixel dépend non seulement du
pixel soi-même mais aussi de ses informations locales Dans [Cheng,1999b], c’est la moyenne des pixels du voisinage qui est prise en compte lorsqu’on construit l’histogramme de deux dimensions Dans [Cheng,1998a], les informations locales sont
inclues dans le homogramme qui indique le degré d’homogénéité correspondant à
chaque niveau de gris dans l’image La détermination du seuil se base sur cet
homogramme Sachant l’importance des informations du voisinage pour la classification,
Sue Wu et Adnan Amin [Wu,2003] proposent une méthode de seuillage en deux étapes pour l’image de documents Après l’étape de seuillage global sur l’image entière, le seuillage sur des sous-images qui contiennent des composants connectées est effectué
La méthode donne de bons résultats sur l’ensemble des images d’enveloppe postale
s y x f si y
x g
) , ( 0
) , ( 1
) , (
Trang 11La méthode de Trier et Taxt [Trier,1995a] et celle de Gadi et Benslimane
[Gadi,2000] peuvent être considérées comme deux exemples de technique de seuillage locale adaptative Dans [Trier,1995a], les auteurs ont appliqué des modifications sur la
méthode de White & Rohrer afin d’obtenir une bonne méthode de binarisation pour l’image de documents Une de leurs modifications est la façon de classifier des pixels ‘0’ dans l’image d’étiquettes à trois niveaux ‘+’, ‘-‘, ‘0’ qui est le résultat de l’opérateur gradient Le pixel étiqueté ’0’ sera classé dans la classe à la quelle la majorité de ses 8 pixels voisins appartiennent Avec cette méthode, on peut obtenir des résultats satisfaisants en essayant des différentes solutions des paramètres Cependant, c’est la difficulté de la manipulation de nombreux paramètres qui cause un grand inconvénient de cette approche Dans [Gadi,2000], la classification d’un pixel dépend de ses degrés d’appartenance calculés dans des régions locales qui sont créées par le découpage de l’image originale selon le principe de l’arbre quaternaire En principe, il nous fournira un résultat intéressant sur l’image de documents graphiques si il n’y a pas de problème de sur-découpage
Comme les informations spatiales et les informations du voisinage des points ne sont pas prises en considération dans l’approche globale, cette approche possède un avantage sur le temps d’exécution mais elle n’est appropriée qu’à des images simples Pour d’autres images, les deux approches locales sont toujours appréciées Elles donnent généralement de meilleurs résultats que l’approche globale mais au prix de la complexité Dans deux parties ci-dessous, des descriptions courtes des méthodes qui sont abordées dans le chapitre trois sont présentées
2.1.3 Sous-ensemble flou
Généralité
Dans la vie quotidienne, nous nous trouvons dans de nombreuses situations ó les informations dont nous disposons sont imprécises ou bien incertaines Le sens des mots dans la langue est un exemple : des mots tel que « cher » « pas trop cher » « tơt »
« tard » « possible » ne donnent pas des informations exactes L’être humain est habitué à ces informations Chacun analyse donc le contexte et prend sa propre décision
Le monde scientifique n’est pas exceptionnel, plusieurs problèmes doivent travailler sur les données incertaines, incomplètes tels que le système d’exploitation de bases de connaissances, le système d’aide à la décision… Dans ces cas, ces types d’informations sont représentés et traités grâce à la logique floue dont la théorie des sous-ensembles flous
Soit Ω un ensemble de n éléments, Ω = { x1, x2, , xn} Supposons qu’on a besoin
de chercher des éléments satisfaisant une propriété quelconque α L’ensemble Ω se divise en deux sous-ensembles A et B A contient des éléments possédant α, tant dis que
Trang 12les autres appartiennent au sous-ensemble B, le complément de A dans Ω En vue de la logique classique, un élément n’appartient à qu’un sous-ensemble, A ou B Ça veut dire qu’un élément n’a que deux possibilités, soit il a cette propriété, soit il ne la possède pas absolument Cependant, il est possible qu’il existe dans Ω des éléments qu’on ne sait pas toujours s’ils satisfont α ou qu’ils ne la possèdent qu’avec un certain degré Dans ce cas,
il vaut mieux prendre le sous-ensemble flou pour représenter ces informations
Sous-ensemble flou :
Un sous-ensemble flou A de l’espace observée Ω est caractérisé par une fonction d’appartenance µA(x ) qui associent un élément x de Ω avec un nombre réel,µA(x ), dans l’intervalle [0, 1] et qui quantifie le degré d’appartenance de l’élément x au sous-ensemble A Généralement, un sous-ensemble flou est définit comme une collection des pairs en ordre (µA(x ), x)
Fonction d’appartenance :
] 1 , 0 [ ) ( : x ∈ Ω → A x ∈
µ
Chaque élément dans un sous-ensemble A possède un degré qui estime dans quelle mesure l’appartenance de l’élément dans le A Ce degré est déterminé par la fonction d’appartenance Il existe des différentes fonctions La plus simple est la fonction linéaire :
et celle qui est la plus connue et la plus utilisée est la fonction S de Zadeh :
ó (a, c) la région floue, b un point au milieu de a et c, b = (a+c) /2
La sélection de la fonction d’appartenance dépend de chaque application
i i
c x a a c a x
a x x
A
1
0 )
c x b a c
c x
b x a a
c
a x
a x
x S
A
1
2 1 2 0
) ( )
2
µ
Trang 13Figure 2.1 : Fonction d’appartenance linéaire
Figure 2.2 : Fonction S de Zadeh
Application dans la binarisation d’images
Pour le seuillage des images, le but principal est d’obtenir deux classes « blanc » et
« noir » à partir de l’image originale à niveaux de gris Cependant, il n’y aucune assurance pour une classification grâce à un seuil quelconque La question se pose toujours si un point est vraiment « noir » ou « blanc » ? La théorie de sous-ensembles flous est devenue une solution En définissant un intervalle flou, la fonction d’appartenance nous permet d’obtenir deux sous ensembles flous représentant le « noir » et le « blanc » de l’image
2.2 Méthodes de seuillage global
Le seuillage global consiste à partitionner l’image en deux classes grâce à un seuil optimal qui est calculé à partir d’une mesure globale sur toute l’image L’histogramme est une mesure utilisée le plus souvent dans les méthodes de seuillage Dans ce cas, le seuil attendu est celui qui correspond à la vallée de l’histogramme, celui qui distingue le plus possible les deux classes : fond et objet
Trang 14[ max] ( )
arg
max min,
t s
t optimal η
∈
=
,)(
Définition : On définit l’histogramme des niveaux de gris d’une image comme étant
la fonction h : [ 0 L − 1 ] → Νqui associe à chaque niveau de gris entre 0 et L-1 la quantité
de pixels de l’image qui possèdent cette intensité lumineuse [Braviano,1995]
L’histogramme d’une image peut être représenté par un vecteur dont chaque composante est un nombre de pixels de niveau de gris correspondant à son indice Il permet de fournir effectivement une estimation de la densité de probabilité des valeurs des pixels sur l’image observée
1 , 0 , )
s optimal est celui qui maximise une des fonctions suivantes :
Si l’on choisitη (t), alors
Où 2, T, W2
B
T δ δ
δ sont successivement la variance totale de l’image, la variance
inter-classes (between-class variance) et la variance intra-inter-classes (within-class variance)
: la moyenne totale de tous les points dans l’image
Où :
• p i : la probabilité d’occurrence du niveau de gris i dans l’image
• P fond(t),P objet(t): la somme des probabilités d’occurrence des niveaux de gris
des pixels du fond et celle de l’objet en prenant le seuil t
•
) (
) ( )
2
t
t t
δ
δ
) (
) ( )
2
t
t t
)()()
2
t t
t T W
B δ δ
δ = −
) (
* ) ( )
(
* ) ( )
2
t t
P t t
i h image
l dans pixels de
nombre
i gris de niveau le
dont pixels de
nombre
p i
*
)(
=
)(1
)(,)
(
max 1 min
t P p
t P p t
t i i fond
t
i i objet = ∑ = ∑ = −
+
=
=
Trang 15• δ2fond( t ), δobjet2 ( t ) : la variance de la classe fond et la variance de la class objet
• [min, max] est l’intervalle dynamique de l’image
Cette méthode est simple à implanter et donne de bons résultats en général Cependant, dans les cas des images de documents, les résultats ne sont pas nets, deux différents objets peuvent être confondus
2.2.2 Méthodes se basant sur l’entropie
Selon la théorie de l’information, l’entropie est une mesure de quantité d’information d’un système Soit un ensemble fini S = { s1, s2, , sk} d’événements indépendants, et pi la probabilité d’occurrence de chaque élément si, l’entropie est définie par :
Plus l’entropie est grande, plus on obtient des informations Plusieurs méthodes de segmentation d’images l’ont utilisée dans le but de maximiser la qualité de l’information obtenue du résultat final [Pun,1980] [Kapur,1985] [Cheng,1998b] [Mello,2000] [Braviano,1995]
Si l’ensemble S est considéré comme un ensemble flou avec le degré d’appartenance correspondant à chaque élément dans S µS( si), i = 1 , k , appelé la
fonction d’appartenance (membership function), l’entropie floue de l’ensemble S est
définie par :
1 ) (
de binarisation
fond
t i
i fond
objet i
i objet
P
p i t
m P
p i t
(,
*)
(
fond
t i
i fond fond
objet
t
i
i objet objet
P
p m
i t
P
p m
2 2
min
2 2
*)(
)(,
*)(
p ó
k p p p
p p H
1 2
1, , , ) *log(
i S floue S s p p H
1
log
*
*)()
Trang 16Méthode de Pun :
Le seuil est choisi tel que la fonction H =H objet +H fond est maximale
ópiest la probabilité d’occurrence du niveau de gris i dans l’image
Méthode de Kapur :
Dans ce cas, la distribution de probabilité de l’objet P t et la distribution de probabilité
du fond (1 - P t) sont prises encompte en déterminant l’entropie de la partition
Méthode de Cheng et Chen [Cheng,1998b]:
Différant de ces deux méthodes précédentes, l’entropie d’une partition est calculée
en prenant des probabilités d’occurrence de sous-ensembles (objet et fond) La théorie de sous-ensembles flous est comptée de plus dans son calcul Alors, dans ce cas, l’entropie d’une partition est :
)(
et µ objet fond est toujours la fonction d’appartenance du niveau de gris i à la classe objet / fond
Méthode de Mello et Lins [Mello,2000] :
C’est une méthode qui se spécialise pour l’image de documents historiques
Supposons que t soit la couleur apparaissant le plus souvent dans l’image Prenons cette valeur comme le seuil initial de l’image, les valeurs d’entropie de l’objet Hb et du fond Hw sont déterminées comme dans [Pun,1980] Un pixel i dont la couleur est couleur(i) sera classé comme le fond si :
)
*
*(256/)
couleur ≥ + sinon il sera classé comme l’objet
Les deux facteurs mw et mb sont déterminés par expériences en évaluant l’entropie
de l’image entière et dédiés particulièrement à un type d’images observé
max
1 1
t i
i i
t
i
i i
t fond objet
t optimal H H p p p p
s
1 log
* 1 log
* (
max max
1 1
t
i t
i t
i t
i t
i t
fond objet
t optimal
P
p P
p P
p P
p H
H s
∑
=
= t
i i
t p P
ó
0
)log
*log
*()(log
*)(
2 1
fond fond
Objet Objet
i
i
i P A P P P P A
0
*)(,
*)(
L
i
i fond fond
L
i
i objet Objet i p P i p P
Trang 172.3 Segmentation hiérarchique floue
Décrite dans [Gadi,2000], cette méthode est comme une représentante de l’approche locale adaptative Elle est basée sur un principe hiérarchique pour résoudre le problème d’éclairage non uniforme Sous l’hypothèse que l’image ne contient que deux
classes : l’objet et le fond, le principe de cette méthode est de récupérer le plus possible des pixels à la classe objet
La méthode se compose de 2 étapes :
♦ Fuzzification :
- Construction de l’arbre quaternaire : l’image originale est divisée
consécutivement en quatre sous images de taille de plus en plus petite en évaluant le critère d’homogénéité Chaque sous-image est associée à un nœud de l’arbre quaternaire Si une sous-image satisfait le critère d’homogénéité, la division n’est plus nécessaire, elle devient un nœud terminal dans l’arbre Au cas contraire, cette sous-image est décomposée en quatre Le processus continue jusqu’à ce que tous les nœuds dans l’arbre soient des terminaux
La condition pour que le critère d’homogénéité soit satisfait sur une région, c’est qu’il n’y a plus de « différence significative » entre cette région et ses quatre filles Cette condition est vérifiée par le test statistique de Fisher
α
) 1 ( 4
;
3 −
> F k
f : sous-image est non homogène
f : l’estimation du critère d’homogénéité sur la sous-image évaluée (voir
partie 3.3 pour plus détaillé)
α
) 1 ( 4
;
3 k−
F : la valeur prédéfinie de la distribution F avec 3 et 4(k-1) degrés de
liberté
- Calcul des degrés d’appartenance : Les degrés d’appartenance de tous les
pixels sont calculés à chaque niveau de l’arbre
ó la moyenne et l’écart type sont déterminés dans la région contenant pixel (x, y) au niveau k
♦ Défuzzification :
- Décision : Après avoir fait des différentes évaluations de l’appartenance de
chaque pixel à une des deux classes, la fonction d’agrégation t-conorme de Zadeh est affectée à la détermination de la mesure d’appartenance finale à
la classe objet
( x y moyenne ecart type moyenne moyenne ecart type )
S
k y
x, ) ( , ); _ , , _
µ
Trang 18et le degré d’appartenance final au fond :
- Défuzzification : il s’agit de mettre au point des pixels à deux classes
Evaluations :
Cette méthode est proposée pour résoudre le problème d’éclairage non uniforme sur l’image Mais elle ne fonctionne bien que sur l’image dont le fond est vraiment uniforme Au cas contraire, des pixels du fond sont mis facilement à l’objet
Un autre problème réside au problème de découpage En fait, le test statistique est très sensible aux bruits, alors l’image est trop découpée De plus, la fonction max utilisée dans la partie de défuzzification accentue les bruits En conséquence, les faux pixels sont classés facilement comme les pixels de l’objet L’affectation de cette méthode à l’image
jaures_partie1.tif (figure 3.2) donne un résultat inattendu (figure 2.3)
a) Le découpage b) L’image binarisée, avec h = max(…)
Figure 2.3 : Un problème de la méthode de Gadi et Benslimane
En considérant des images de documents graphiques, on constate que s’il n’y pas
de grande variation d’intensité des pixels appartenant à l’objet et pour diminuer l’effet
négatif du découpage, l’opérateur d’agrégation min(…) est plus convenable que l’opérateur max (figure 2.4) Alors, quand on fait des tests sur l’image de documents, l’opérateur d’agrégation min est pris au lieu de max à l’étape de décision .
( ( , ), ( , ), , ( , ))max
),(), ,,(),,()
,(
1 1
0
1 1
0
y x y
x y
x
y x y
x y
x h y x
l O O
O
l O O
O f
µ
µ µ
µ µ
),(1),(x y O f x y
f
µ = −
fond classe y
x y
x y
x
objet classe y
x y
x y
x
f F f
O
f F f
) , ( ) , ( ) , (
µ µ
µ µ
Trang 19Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…)