Binarisation d’images de documents graphiques

Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris.. Recherchant des solutions pour l’image de docume

Trang 1

Maître de conférences à Université de Nancy 2 Chercheur à l’équipe QGAR, INRIA Lorraine

Nancy, France

Nancy, juin - novembre 2004

Trang 2

Je tiens à remercier profondément mon responsable, Monsieur Salvatore Tabbone, professeur associé à l’Université de Nancy 2, chercheur au LORIA, qui a accepté de diriger mon stage de fin d’études, a aussi consacré beaucoup de temps pour m’aider lors

de mon stage

Je voudrais remercier particulièrement tous les professeurs à l’Institut de la Francophonie pour l’Informatique (IFI) pour leur soutien, ce qui m'a permis de pouvoir bien effectuer mon stage de fin d'études

Je remercie également les membres de l’équipe QGAR qui m’ont beaucoup aidée durant mon séjour à Nancy

Un grand merci à tous mes amis à l’IFI et au LORIA pour leurs encouragements, leurs aides et la sympathie qu'ils m’ont données tout au long de mon stage

J'adresse, enfin, mes remerciements sincères à ma famille pour ses stimulations

Trang 3

RESUME

La binarisation des images a suscité beaucoup de travaux de recherche ces dernières décennies Cependant, il n’existe pas une solution idéale qui est affectée à tous les différents types d’images Durant mon stage, nous nous sommes intéressés à définir une approche de binarisation qui s’applique à des documents graphiques Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris Cette méthode repose sur la coopération entre une approche de seuillage global et une approche de seuillage local

La méthode se compose de deux étapes La technique de seuillage global est affectée à la première étape et a pour but d’éliminer la partie du fond de l’image La deuxième est basée sur la segmentation hiérarchique floue de Gadi et Benslimane pour rendre l’objet dans l’image plus net Dans cette étape, les traitements sont effectués sur les données des zones de tailles différentes du résultat intermédiaire en prenant le principe de l’arbre quaternaire La classification finale d’un pixel sera déterminée grâce à

la fonction d’agrégation à partir de ses différents degrés d’appartenance qui sont calculés

à tous les niveaux de l’arbre La méthode proposée a donné des résultats intéressants en appliquant sur l’ensemble des images de test Son efficacité est démontrée par une étude comparative avec d’autres méthodes et par des mesures de performance

Mots clés : binarisation local adaptatif, binarisation coopérative, image de

documents, arbre quaternaire, sous-ensembles flous, fonction d’appartenance

Trang 4

ABSTRACT

Binarization of the images has been a subject of an intense research interest for a long time However, there is not a perfect solution, which can apply for all the various kinds of images Therefore, during my training course, we define a method working effectively on image of graphic documents After testing different solutions, we propose a binarization method for the gray level image of documents This method is considered to

be the cooperation between a global and a local thresholding technique

The method presented is based on two stages The global thresholding is used in the first stage to give a preliminary result Then, a second based on the fuzzy hierarchical segmentation refines the result by analyzing local characteristics In this stage, the treatments are carried out on the data zones with different sizes by taking the quadtree principle on the preliminary result The classification of a pixel depends on its final degree

of membership calculated from its various degrees determined by the node local information at all quadtree levels

The method suggested gives remarkable results by applying it to a set of images that be used tested Its effectiveness is shown in comparing with other methods

Keywords: adaptive local thresholding, cooperative binarization, document image,

quadtree, fuzzy set, membership function

Trang 5

TABLE DE MATIERES

REMERCIEMENTS 2

RESUME 3

ABSTRACT 4

LISTE DE FIGURES 6

LISTE DE TABLEAUX 6

CHAPITRE 1 : INTRODUCTION 7

1.1.PROBLEMATIQUE 7

1.2.OBJECTIF 8

1.3.STRUCTURE DU RAPPORT 8

1.4.LIEU DE STAGE 8

CHAPITRE 2 : ETAT DE L’ART 9

2.1.GENERALITE 9

2.1.1 Segmentation 9

2.1.2 Binarisation 9

2.1.3 Sous-ensemble flou 11

2.2.METHODES DE SEUILLAGE GLOBAL 13

2.2.1 Méthode de Otsu 14

2.2.2 Méthodes se basant sur l’entropie 15

2.3.SEGMENTATION HIERARCHIQUE FLOUE 17

CHAPITRE 3 : METHODE PROPOSEE 20

3.1.PRINCIPE DE LA METHODE 20

3.2.ETAPE DE SEUILLAGE GLOBAL 20

3.3.ETAPE DE RAFFINAGE 21

3.3.1 Construction de l’arbre quaternaire 22

3.3.2 Calcul des degrés d'appartenance de chaque pixel 25

3.3.3 Décision de degré d'appartenance final 26

CHAPITRE 4 : EVALUAT IONS 28

4.1.RESULTATS EXPERIMENTAU X 28

4.2.MESURES DE PERFORMANCE 34

4.2.1 Mesure de contraste 34

4.2.2 Mesure d’homogénéité 35

4.3.AVANTAGES ET INCONVENIENTS 35

CHAPITRE 5 : CONCLUSIONS 37

REFERENCES 38

Trang 6

LISTE DE FIGURES

Figure 2.1 : Fonction d’appartenance linéaire 13

Figure 2.2 : Fonction S de Zadeh 13

Figure 2.3 : Un problème de la méthode de Gadi et Benslimane 18

Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…) 19

Figure 3.1 : Principe de la méthode proposée 20

Figure 3.2 : Image originale – jaures_patie1.tif 21

Figure 3.3 : Image intermédiaire de jaures_patie1.tif 21

Figure 3.4 : Image binaire de jaures_patie1.tif après la première étape 21

Figure 3.5 : Structure tridimensionnelle de l’arbre quaternaire 23

Figure 3.6 : Quadrillage de l’image intermédiaire 25

Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif 27

Figure 4.1 : Image originale jaures.tif 28

Figure 4.2 : Image originale harchure.tif 28

Figure 4.3 : Image originale plan2.tif 28

Figure 4.4 : Image originale extraire_1.tif 28

Figure 4.5 : Résultats de l’image jaures.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 30

Figure 4.6 : Résultats de l’image harchure.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 31

Figure 4.7 : Résultats de l’image plan2.tif en appliquant : 32

Figure 4.8 : Résultats de l’image extrait_1.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 33

LISTE DE TABLEAUX Tableau 4.1 : Performances quantitatives 35

Tableau 4.2 : Comparaison du temps de calculs 36

Trang 7

CHAPITRE 1 : INTRODUCTION 1.1 Problématique

Au sein de développements forts de la science, on ne peut pas nier le rôle de l’image numérique, un support important des applications dans de très nombreux domaines tels que la médecine, le multimédia, la robotique Parmi une série d’opérations effectuées sur les images, le traitement d’images est considéré comme une étape de base et indispensable dans toutes ces applications et a suscité de nombreuses recherches Il peut être vu comme préalable à la reconnaissance de formes, à l’analyse

de scènes, à l’intelligence artificielle La segmentation, un traitement de base ayant pour but de partitionner l’image en des régions homogènes qui représentent normalement les objets, est un problème classique mais très considéré C’est évident qu’il n’existe pas toujours une solution idéale pour tous les cas Plusieurs solutions ont été proposées pour résoudre ce problème de segmentation d’images du plus général au plus particulier Cependant, chaque méthode a ses avantages et ses inconvénients tels que la manipulation des paramètres [Trier,1995a], la complexité de calcul [Cheng,1999b] [Tao,2003]

Problème

Dans l’analyse d’images de documents et la reconnaissance de symboles, la binarisation est toujours une des premières étapes utilisées avant l’étape de reconnaissance Elle a donc une grande influence sur la performance des étapes suivantes et sur le résultat final C’est une technique importante dans les applications de traitement d’images

Une image de documents graphiques contient généralement du graphique mais également du texte qui sont quelques fois assez proches Le texte risque donc de fusionner des différentes parties du graphique à cause du changement faible d’intensité des pixels du fond et ceux de l’objet Recherchant des solutions pour l’image de documents graphiques, nous essayons de trouver une méthode automatique de binarisation simple et efficace qui sépare le fond et l’objet dans des images aux niveaux

de gris

Remarque

Travaillant avec l’image de documents graphiques, nous supposons toujours que l’image contient l’objet noir (des lignes, des textes) sur le fond blanc

Trang 8

1.3 Structure du rapport

Mon rapport se compose de cinq parties Quelques mots d’introduction de mon stage sont dans la première partie La deuxième est consacrée à une présentationgénérale des techniques de segmentation d’images surtout la binarisation Des brèves descriptions de quelques méthodes y sont aussi présentées La troisième partie est dédiée à la description détaillée de la méthode proposée L’analyse de résultats et les mesures d’évaluations sont abordées dans la quatrième Ce rapport se termine par la conclusion (cinquième partie)

1.4 Lieu de stage

Laboratoire

Le LORIA (Laboratoire Lorraine de Recherche en Informatique et ses Applications) est une Unité Mixte de Recherche - UMR7503 – constituée par plusieurs établissements : Centre National de Recherche Scientifique (CNRS), Institut National Polytechnique de Lorraine (INPL), Institut National de Recherche en Informatique et en Automatique (INRIA), Université Henri Poincaré Nancy 1 (UPH), Université Nancy 2

Equipe

Mon stage, qui a duré six mois, s’est déroulé au sein de l’équipe QGAR (Querying Graphics through Analysis and Recognition) de l’INRIA lorraine sous la responsabilité de Salvatore Tabbone (Maître de conférences à l’université de Nancy 2) C’est une équipe spécialisée dans l’analyse de documents à forte composante graphique Les objectifs sont l’indexation et la recherche d’informations dans le contexte de la documentation technique

Le site http://www.loria.fr vous fournira des informations plus détaillées sur le laboratoire La présentation plus détaillée de l’équipe se trouve dans les sites webs http://www.loria.fr/equipes/qgar et http://www.inria.fr/recherche/equipes/qgar.en.html

Trang 9

CHAPITRE 2 : ETAT DE L’ART 2.1 Généralité

2.1.1 Segmentation

La segmentation, un traitement essentiel des images, consiste à créer une partition

de l’image en des sous-ensembles appelés régions Ri Une région est un ensemble de pixels qui possèdent des propriétés communes telles que l’intensité, la texture, etc Le but

de la segmentation est d’extraire de l’image originale un certain nombre d’entités différentes appelées objets ou régions Comme c’est extrêmement difficile d’avoir un algorithme idéal qui fonctionne correctement dans tous les cas, des nombreuses méthodes sont proposées En bref, on peut les classifier en deux grandes approches,

l’approche « frontière » et l’approche « région » [Horaud,1993]

La première, l’approche « frontière », est basée sur la forte variation d’intensité ou

sur la discontinuité des propriétés de deux ensembles connexes de points Elle regroupe les techniques de détections de contours En général, cette approche ne conduit pas directement à une segmentation de l’image à cause de la continuité rare des contours Il faut donc procéder à une fermeture de contours si on souhaite une partition complète de l’image Les régions sont définies comme l’intérieur d’une ligne fermée

Par contre, des méthodes appartenant à l’approche « région » sont construites

grâce à la similarité des points en évaluant des critères prédéfinis pour les regrouper directement en régions Le seuillage, la croissance de région, la division-fusion sont des exemples de méthodes différentes de segmentation région

Il existe également des méthodes qui se basent à la fois sur les propriétés des

frontières et sur les propriétés de la région, on les appelle approche collaboration

2.1.2 Binarisation

Définition : la binarisation (le seuillage) est la technique de classification la plus

simple ó les pixels de l’image sont partagés par un seul seuil s en deux classes : ceux

qui appartiennent au fond et ceux qui appartiennent à la scène (l’objet) L’image est alors

Trang 10

séparée en deux classes de façon à ce que l’information comprise entre 0 et s est retenue

et l’autre non, ou vice-versa

Soit l’image I (M x N), supposons que f(x, y) représente le niveau de gris du pixel aux coordonnées (x, y),0≤ x≤M,0≤ y≤ N et s est le seuil choisi, les pixels de l’objet sont ceux ayant le niveau de gris inférieur à s et les autres ayant le niveau de gris supérieur à s sont des pixel du fond Alors, l’image binarisée G est déterminée par les

pixels (x, y) dont la valeur est :

Selon [Horaud,1993], il existe trois grandes techniques de sélection du seuil s : global, local et dynamique Comme il y a des différentes façons de déterminer le seuil s, il

peut être considéré comme une fonction sous forme de s=t((x,y),p(x,y), f(x,y)) ó

p(x, y) représente des propriétés locales du point (x, y) Si s ne dépend de que la valeur f(x, y) du point, le seuil est global, s’il dépend en plus de p(x, y), s est un seuil local Et si

s dépend à la fois de (x, y), de p(x, y) et de f(x, y), on dit le seuil dynamique ou bien

adaptatif

Dans la méthode de binarisation globale un seuil unique est calculé à partir d’une

mesure globale sur toute l’image Il nous permet de décider l’appartenance d’un pixel à l’objet ou au fond Les méthodes de Otsu [Otsu,1978], de Kapur [Kapur,1985], de Pun [Pun,1980], ou de Cheng et Chen [Cheng, 1998b] peuvent être tenues comme des représentants de cette approche Chacun a de différentes stratégies pour atteindre leur but Par exemple, la méthode décrite dans [Otsu,1978] essaie de maximiser la variance entre deux classes, tandis que d’autres méthodes dans [Kapur,1985] [Pun,1980] [Cheng,1998b] [ Mello,2000] se basent sur la théorie de maximum d’entropie ou d’entropie floue

Pour la binarisation locale, la classification d’un pixel dépend non seulement du

pixel soi-même mais aussi de ses informations locales Dans [Cheng,1999b], c’est la moyenne des pixels du voisinage qui est prise en compte lorsqu’on construit l’histogramme de deux dimensions Dans [Cheng,1998a], les informations locales sont

inclues dans le homogramme qui indique le degré d’homogénéité correspondant à

chaque niveau de gris dans l’image La détermination du seuil se base sur cet

homogramme Sachant l’importance des informations du voisinage pour la classification,

Sue Wu et Adnan Amin [Wu,2003] proposent une méthode de seuillage en deux étapes pour l’image de documents Après l’étape de seuillage global sur l’image entière, le seuillage sur des sous-images qui contiennent des composants connectées est effectué

La méthode donne de bons résultats sur l’ensemble des images d’enveloppe postale

s y x f si y

x g

) , ( 0

) , ( 1

) , (

Trang 11

La méthode de Trier et Taxt [Trier,1995a] et celle de Gadi et Benslimane

[Gadi,2000] peuvent être considérées comme deux exemples de technique de seuillage locale adaptative Dans [Trier,1995a], les auteurs ont appliqué des modifications sur la

méthode de White & Rohrer afin d’obtenir une bonne méthode de binarisation pour l’image de documents Une de leurs modifications est la façon de classifier des pixels ‘0’ dans l’image d’étiquettes à trois niveaux ‘+’, ‘-‘, ‘0’ qui est le résultat de l’opérateur gradient Le pixel étiqueté ’0’ sera classé dans la classe à la quelle la majorité de ses 8 pixels voisins appartiennent Avec cette méthode, on peut obtenir des résultats satisfaisants en essayant des différentes solutions des paramètres Cependant, c’est la difficulté de la manipulation de nombreux paramètres qui cause un grand inconvénient de cette approche Dans [Gadi,2000], la classification d’un pixel dépend de ses degrés d’appartenance calculés dans des régions locales qui sont créées par le découpage de l’image originale selon le principe de l’arbre quaternaire En principe, il nous fournira un résultat intéressant sur l’image de documents graphiques si il n’y a pas de problème de sur-découpage

Comme les informations spatiales et les informations du voisinage des points ne sont pas prises en considération dans l’approche globale, cette approche possède un avantage sur le temps d’exécution mais elle n’est appropriée qu’à des images simples Pour d’autres images, les deux approches locales sont toujours appréciées Elles donnent généralement de meilleurs résultats que l’approche globale mais au prix de la complexité Dans deux parties ci-dessous, des descriptions courtes des méthodes qui sont abordées dans le chapitre trois sont présentées

2.1.3 Sous-ensemble flou

Généralité

Dans la vie quotidienne, nous nous trouvons dans de nombreuses situations ó les informations dont nous disposons sont imprécises ou bien incertaines Le sens des mots dans la langue est un exemple : des mots tel que « cher » « pas trop cher » « tơt »

« tard » « possible » ne donnent pas des informations exactes L’être humain est habitué à ces informations Chacun analyse donc le contexte et prend sa propre décision

Le monde scientifique n’est pas exceptionnel, plusieurs problèmes doivent travailler sur les données incertaines, incomplètes tels que le système d’exploitation de bases de connaissances, le système d’aide à la décision… Dans ces cas, ces types d’informations sont représentés et traités grâce à la logique floue dont la théorie des sous-ensembles flous

Soit Ω un ensemble de n éléments, Ω = { x1, x2, , xn} Supposons qu’on a besoin

de chercher des éléments satisfaisant une propriété quelconque α L’ensemble Ω se divise en deux sous-ensembles A et B A contient des éléments possédant α, tant dis que

Trang 12

les autres appartiennent au sous-ensemble B, le complément de A dans Ω En vue de la logique classique, un élément n’appartient à qu’un sous-ensemble, A ou B Ça veut dire qu’un élément n’a que deux possibilités, soit il a cette propriété, soit il ne la possède pas absolument Cependant, il est possible qu’il existe dans Ω des éléments qu’on ne sait pas toujours s’ils satisfont α ou qu’ils ne la possèdent qu’avec un certain degré Dans ce cas,

il vaut mieux prendre le sous-ensemble flou pour représenter ces informations

Sous-ensemble flou :

Un sous-ensemble flou A de l’espace observée Ω est caractérisé par une fonction d’appartenance µA(x ) qui associent un élément x de Ω avec un nombre réel,µA(x ), dans l’intervalle [0, 1] et qui quantifie le degré d’appartenance de l’élément x au sous-ensemble A Généralement, un sous-ensemble flou est définit comme une collection des pairs en ordre (µA(x ), x)

Fonction d’appartenance :

] 1 , 0 [ ) ( : x ∈ Ω → A x ∈

µ

Chaque élément dans un sous-ensemble A possède un degré qui estime dans quelle mesure l’appartenance de l’élément dans le A Ce degré est déterminé par la fonction d’appartenance Il existe des différentes fonctions La plus simple est la fonction linéaire :

et celle qui est la plus connue et la plus utilisée est la fonction S de Zadeh :

ó (a, c) la région floue, b un point au milieu de a et c, b = (a+c) /2

La sélection de la fonction d’appartenance dépend de chaque application

i i

c x a a c a x

a x x

A

1

0 )

c x b a c

c x

b x a a

c

a x

x S

A

1

2 1 2 0

) ( )

2

µ

Trang 13

Figure 2.1 : Fonction d’appartenance linéaire

Figure 2.2 : Fonction S de Zadeh

Application dans la binarisation d’images

Pour le seuillage des images, le but principal est d’obtenir deux classes « blanc » et

« noir » à partir de l’image originale à niveaux de gris Cependant, il n’y aucune assurance pour une classification grâce à un seuil quelconque La question se pose toujours si un point est vraiment « noir » ou « blanc » ? La théorie de sous-ensembles flous est devenue une solution En définissant un intervalle flou, la fonction d’appartenance nous permet d’obtenir deux sous ensembles flous représentant le « noir » et le « blanc » de l’image

2.2 Méthodes de seuillage global

Le seuillage global consiste à partitionner l’image en deux classes grâce à un seuil optimal qui est calculé à partir d’une mesure globale sur toute l’image L’histogramme est une mesure utilisée le plus souvent dans les méthodes de seuillage Dans ce cas, le seuil attendu est celui qui correspond à la vallée de l’histogramme, celui qui distingue le plus possible les deux classes : fond et objet

Trang 14

[ max] ( )

arg

max min,

t s

t optimal η

∈

=

,)(

Définition : On définit l’histogramme des niveaux de gris d’une image comme étant

la fonction h : [ 0 L − 1 ] → Νqui associe à chaque niveau de gris entre 0 et L-1 la quantité

de pixels de l’image qui possèdent cette intensité lumineuse [Braviano,1995]

L’histogramme d’une image peut être représenté par un vecteur dont chaque composante est un nombre de pixels de niveau de gris correspondant à son indice Il permet de fournir effectivement une estimation de la densité de probabilité des valeurs des pixels sur l’image observée

1 , 0 , )

s optimal est celui qui maximise une des fonctions suivantes :

Si l’on choisitη (t), alors

Où 2, T, W2

B

T δ δ

δ sont successivement la variance totale de l’image, la variance

inter-classes (between-class variance) et la variance intra-inter-classes (within-class variance)

: la moyenne totale de tous les points dans l’image

Où :

• p i : la probabilité d’occurrence du niveau de gris i dans l’image

• P fond(t),P objet(t): la somme des probabilités d’occurrence des niveaux de gris

des pixels du fond et celle de l’objet en prenant le seuil t

•

) (

) ( )

2

t

t t

δ

) (

) ( )

2

t

t t

)()()

2

t t

t T W

B δ δ

δ = −

) (

* ) ( )

(

* ) ( )

2

t t

P t t

i h image

l dans pixels de

nombre

i gris de niveau le

dont pixels de

nombre

p i

*

)(

=

)(1

)(,)

(

max 1 min

t P p

t P p t

t i i fond

t

i i objet = ∑ = ∑ = −

+

=

Trang 15

• δ2fond( t ), δobjet2 ( t ) : la variance de la classe fond et la variance de la class objet

• [min, max] est l’intervalle dynamique de l’image

Cette méthode est simple à implanter et donne de bons résultats en général Cependant, dans les cas des images de documents, les résultats ne sont pas nets, deux différents objets peuvent être confondus

2.2.2 Méthodes se basant sur l’entropie

Selon la théorie de l’information, l’entropie est une mesure de quantité d’information d’un système Soit un ensemble fini S = { s1, s2, , sk} d’événements indépendants, et pi la probabilité d’occurrence de chaque élément si, l’entropie est définie par :

Plus l’entropie est grande, plus on obtient des informations Plusieurs méthodes de segmentation d’images l’ont utilisée dans le but de maximiser la qualité de l’information obtenue du résultat final [Pun,1980] [Kapur,1985] [Cheng,1998b] [Mello,2000] [Braviano,1995]

Si l’ensemble S est considéré comme un ensemble flou avec le degré d’appartenance correspondant à chaque élément dans S µS( si), i = 1 , k , appelé la

fonction d’appartenance (membership function), l’entropie floue de l’ensemble S est

définie par :

1 ) (

de binarisation

fond

t i

i fond

objet i

i objet

P

p i t

m P

p i t

(,

*)

(

fond

t i

i fond fond

objet

t

i

i objet objet

P

p m

i t

P

p m

2 2

min

2 2

*)(

)(,

*)(

p ó

k p p p

p p H

1 2

1, , , ) *log(

i S floue S s p p H

1

log

*

*)()

Trang 16

Méthode de Pun :

Le seuil est choisi tel que la fonction H =H objet +H fond est maximale

ópiest la probabilité d’occurrence du niveau de gris i dans l’image

Méthode de Kapur :

Dans ce cas, la distribution de probabilité de l’objet P t et la distribution de probabilité

du fond (1 - P t) sont prises encompte en déterminant l’entropie de la partition

Méthode de Cheng et Chen [Cheng,1998b]:

Différant de ces deux méthodes précédentes, l’entropie d’une partition est calculée

en prenant des probabilités d’occurrence de sous-ensembles (objet et fond) La théorie de sous-ensembles flous est comptée de plus dans son calcul Alors, dans ce cas, l’entropie d’une partition est :

)(

et µ objet fond est toujours la fonction d’appartenance du niveau de gris i à la classe objet / fond

Méthode de Mello et Lins [Mello,2000] :

C’est une méthode qui se spécialise pour l’image de documents historiques

Supposons que t soit la couleur apparaissant le plus souvent dans l’image Prenons cette valeur comme le seuil initial de l’image, les valeurs d’entropie de l’objet Hb et du fond Hw sont déterminées comme dans [Pun,1980] Un pixel i dont la couleur est couleur(i) sera classé comme le fond si :

)

*

*(256/)

couleur ≥ + sinon il sera classé comme l’objet

Les deux facteurs mw et mb sont déterminés par expériences en évaluant l’entropie

de l’image entière et dédiés particulièrement à un type d’images observé

max

1 1

t i

i i

t

i

i i

t fond objet

t optimal H H p p p p

s

1 log

* 1 log

* (

max max

1 1

t

i t

fond objet

t optimal

P

p P

p H

H s

∑

=

= t

i i

t p P

ó

0

)log

*log

*()(log

*)(

2 1

fond fond

Objet Objet

i

i P A P P P P A

0

*)(,

*)(

L

i

i fond fond

L

i

i objet Objet i p P i p P

Trang 17

2.3 Segmentation hiérarchique floue

Décrite dans [Gadi,2000], cette méthode est comme une représentante de l’approche locale adaptative Elle est basée sur un principe hiérarchique pour résoudre le problème d’éclairage non uniforme Sous l’hypothèse que l’image ne contient que deux

classes : l’objet et le fond, le principe de cette méthode est de récupérer le plus possible des pixels à la classe objet

La méthode se compose de 2 étapes :

♦ Fuzzification :

- Construction de l’arbre quaternaire : l’image originale est divisée

consécutivement en quatre sous images de taille de plus en plus petite en évaluant le critère d’homogénéité Chaque sous-image est associée à un nœud de l’arbre quaternaire Si une sous-image satisfait le critère d’homogénéité, la division n’est plus nécessaire, elle devient un nœud terminal dans l’arbre Au cas contraire, cette sous-image est décomposée en quatre Le processus continue jusqu’à ce que tous les nœuds dans l’arbre soient des terminaux

La condition pour que le critère d’homogénéité soit satisfait sur une région, c’est qu’il n’y a plus de « différence significative » entre cette région et ses quatre filles Cette condition est vérifiée par le test statistique de Fisher

α

) 1 ( 4

;

3 −

> F k

f : sous-image est non homogène

f : l’estimation du critère d’homogénéité sur la sous-image évaluée (voir

partie 3.3 pour plus détaillé)

α

) 1 ( 4

;

3 k−

F : la valeur prédéfinie de la distribution F avec 3 et 4(k-1) degrés de

liberté

- Calcul des degrés d’appartenance : Les degrés d’appartenance de tous les

pixels sont calculés à chaque niveau de l’arbre

ó la moyenne et l’écart type sont déterminés dans la région contenant pixel (x, y) au niveau k

♦ Défuzzification :

- Décision : Après avoir fait des différentes évaluations de l’appartenance de

chaque pixel à une des deux classes, la fonction d’agrégation t-conorme de Zadeh est affectée à la détermination de la mesure d’appartenance finale à

la classe objet

( x y moyenne ecart type moyenne moyenne ecart type )

S

k y

x, ) ( , ); _ , , _

µ

Trang 18

et le degré d’appartenance final au fond :

- Défuzzification : il s’agit de mettre au point des pixels à deux classes

Evaluations :

Cette méthode est proposée pour résoudre le problème d’éclairage non uniforme sur l’image Mais elle ne fonctionne bien que sur l’image dont le fond est vraiment uniforme Au cas contraire, des pixels du fond sont mis facilement à l’objet

Un autre problème réside au problème de découpage En fait, le test statistique est très sensible aux bruits, alors l’image est trop découpée De plus, la fonction max utilisée dans la partie de défuzzification accentue les bruits En conséquence, les faux pixels sont classés facilement comme les pixels de l’objet L’affectation de cette méthode à l’image

jaures_partie1.tif (figure 3.2) donne un résultat inattendu (figure 2.3)

a) Le découpage b) L’image binarisée, avec h = max(…)

Figure 2.3 : Un problème de la méthode de Gadi et Benslimane

En considérant des images de documents graphiques, on constate que s’il n’y pas

de grande variation d’intensité des pixels appartenant à l’objet et pour diminuer l’effet

négatif du découpage, l’opérateur d’agrégation min(…) est plus convenable que l’opérateur max (figure 2.4) Alors, quand on fait des tests sur l’image de documents, l’opérateur d’agrégation min est pris au lieu de max à l’étape de décision .

( ( , ), ( , ), , ( , ))max

),(), ,,(),,()

,(

1 1

0

1 1

0

y x y

x y

x

y x y

x y

x h y x

l O O

O

l O O

O f

µ

µ µ

),(1),(x y O f x y

f

µ = −

fond classe y

x y

x

objet classe y

x y

x

f F f

O

f F f

) , ( ) , ( ) , (

µ µ

Trang 19

Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…)

Định dạng
Số trang	39
Dung lượng	2,4 MB