1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Binarisation d’images de documents graphiques

46 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 46
Dung lượng 3,28 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris.. Recherchant des solutions pourl’image de documen

Trang 1

Institut de la Francophonie Laboratoire Lorrain de Recherche en

p o u

r l’

I n f o r m a ti q u e

Informatique

et ses Applications

RAPPORT DE STAGE DE FIN D’ETUDES

Sujet :

Binarisation d’images

de documents graphiques

Trang 2

Etudiante :

Nancy, juin - novembre 2004

Trang 3

Je tiens tout d’abord à exprimer toutes mes reconnaissances sincères à Madame Hélène Kirchner, Directrice du LORIA (Laboratoire Lorrain de Recherche en Informatique et ses Applications) et de l’INRIA Lorraine, pour m’avoir accueillie chaleureusement au sein de son laboratoire, et à Monsieur Karl Tombre, responsable de l’équipe QGAR (Querying Graphics through Analysis and Recognition), qui m’a reçue dans son équipe de recherche et m’a donné des conditions favorables pour travailler.

Je tiens à remercier profondément mon responsable, Monsieur SalvatoreTabbone, professeur associé à l’Université de Nancy 2, chercheur au LORIA, qui aaccepté de diriger mon stage de fin d’études, a aussi consacré beaucoup de tempspour m’aider lors de mon stage

Je voudrais remercier particulièrement tous les professeurs à l’Institut de laFrancophonie pour l’Informatique (IFI) pour leur soutien, ce qui m'a permis de pouvoirbien effectuer mon stage de fin d'études

Je remercie également les membres de l’équipe QGAR qui m’ont beaucoup aidée durant mon séjour à Nancy

Un grand merci à tous mes amis à l’IFI et au LORIA pour leurs encouragements, leurs aides et la sympathie qu'ils m’ont données tout au long de mon stage.

J'adresse, enfin, mes remerciements sincères à ma famille pour ses stimulations.

Page 2

Trang 4

La binarisation des images a suscité beaucoup de travaux de recherche ces dernières décennies Cependant, il n’existe pas une solution idéale qui est affectée à tous les différents types d’images Durant mon stage, nous nous sommes intéressés à définir une approche de binarisation qui s’applique à des documents graphiques Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris Cette méthode repose sur la coopération entre une approche de seuillage global et une approche de seuillage local.

La méthode se compose de deux étapes La technique de seuillage global est affectée à

la première étape et a pour but d’éliminer la partie du fond de l’image La deuxième est basée sur la segmentation hiérarchique floue de Gadi et Benslimane pour rendre l’objet dans l’image plus net Dans cette étape, les traitements sont effectués sur les données des zones de tailles différentes du résultat intermédiaire en prenant le principe de l’arbre quaternaire La classification finale d’un pixel sera déterminée grâce à la fonction d’agrégation à partir de ses différents degrés d’appartenance qui sont calculés

à tous les niveaux de l’arbre La méthode proposée a donné des résultats intéressants

en appliquant sur l’ensemble des images de test Son efficacité est démontrée parune étude comparative avec d’autres méthodes et par des mesures de performance

Mots clés : binarisation local adaptatif, binarisation coopérative, image de

documents, arbre quaternaire, sous-ensembles flous, fonction d’appartenance

Page 3

Trang 5

Binarization of the images has been a subject of an intense research interest for a long time However, there is not a perfect solution, which can apply for all the various kinds of images Therefore, during my training course, we define a method working effectively on image of graphic documents After testing different solutions, we propose a binarization method for the gray level image of documents This method is considered to be the cooperation between a global and a local thresholding technique.

The method presented is based on two stages The global thresholding is used

in the first stage to give a preliminary result Then, a second based on the fuzzyhierarchical segmentation refines the result by analyzing local characteristics In thisstage, the treatments are carried out on the data zones with different sizes by takingthe quadtree principle on the preliminary result The classification of a pixel depends

on its final degree of membership calculated from its various degrees determined bythe node local information at all quadtree levels

The method suggested gives remarkable results by applying it to a set of imagesthat be used tested Its effectiveness is shown in comparing with other methods

Keywords: adaptive local thresholding, cooperative binarization, document image, quadtree, fuzzy set, membership function.

Page 4

Trang 6

TABLE DE MATIERES

REMERCIEMENTS 2

RESUME 3

ABSTRACT 4

LISTE DE FIGURES 6

LISTE DE TABLEAUX 6

CHAPITRE 1 : INTRODUCTION 7

1.1 PROBLEMATIQUE 7

1.2 OBJECTIF 8

1.3 STRUCTURE DU RAPPORT 8

1.4 LIEU DE STAGE 8

CHAPITRE 2 : ETAT DE L’ART 9

2.1 GENERALITE 9

2.1.1 Segmentation 9

2.1.2 Binarisation 9

2.1.3 Sous-ensemble flou 11

2.2 METHODES DE SEUILLAGE GLOBAL 13

2.2.1 Méthode de Otsu 14

2.2.2 Méthodes se basant sur l’entropie 15

2.3 SEGMENTATION HIERARCHIQUE FLOUE 17

CHAPITRE 3 : METHODE PROPOSEE 20

3.1 PRINCIPE DE LA METHODE 20

3.2 ETAPE DE SEUILLAGE GLOBAL 20

3.3 ETAPE DE RAFFINAGE 21

3.3.1 Construction de l’arbre quaternaire 22

3.3.2 Calcul des degrés d'appartenance de chaque pixel 25

3.3.3 Décision de degré d'appartenance final 26

CHAPITRE 4 : EVALUAT IONS 28

4.1 RESULTATS EXPERIMENTAUX 28

4.2 MESURES DE PERFORMANCE 34

4.2.1 Mesure de contraste 34

4.2.2 Mesure d’homogénéité 35

4.3 AVANTAGES ET INCONVENIENTS 35

CHAPITRE 5 : CONCLUSIONS 37

REFERENCES 38

Page 5

Trang 7

LISTE DE FIGURES

Figure 2.1 : Fonction d’appartenance linéaire 13

Figure 2.2 : Fonction S de Zadeh 13

Figure 2.3 : Un problème de la méthode de Gadi et Benslimane 18

Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…) 19

Figure 3.1 : Principe de la méthode proposée 20

Figure 3.2 : Image originale – jaures_patie1.tif 21

Figure 3.3 : Image intermédiaire de jaures_patie1.tif 21

Figure 3.4 : Image binaire de jaures_patie1.tif après la première étape 21

Figure 3.5 : Structure tridimensionnelle de l’arbre quaternaire 23

Figure 3.6 : Quadrillage de l’image intermédiaire 25

Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif 27

Figure 4.1 : Image originale jaures.tif 28

Figure 4.2 : Image originale harchure.tif 28

Figure 4.3 : Image originale plan2.tif 28

Figure 4.4 : Image originale extraire_1.tif 28

Figure 4.5 : Résultats de l’image jaures.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 30

Figure 4.6 : Résultats de l’image harchure.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 31

Figure 4.7 : Résultats de l’image plan2.tif en appliquant : 32

Figure 4.8 : Résultats de l’image extrait_1.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 33

LISTE DE TABLEAUX Tableau 4.1 : Performances quantitatives 35

Tableau 4.2 : Comparaison du temps de calculs 36

Page 6

Trang 8

CHAPITRE 1 : INTRODUCTION 1.1 Problématique

Au sein de développements forts de la science, on ne peut pas nier le rôle del’image numérique, un support important des applications dans de très nombreuxdomaines tels que la médecine, le multimédia, la robotique Parmi une séried’opérations effectuées sur les images, le traitement d’images est considéré commeune étape de base et indispensable dans toutes ces applications et a suscité denombreuses recherches Il peut être vu comme préalable à la reconnaissance deformes, à l’analyse de scènes, à l’intelligence artificielle La segmentation, untraitement de base ayant pour but de partitionner l’image en des régions homogènesqui représentent normalement les objets, est un problème classique mais trèsconsidéré C’est évident qu’il n’existe pas toujours une solution idéale pour tous lescas Plusieurs solutions ont été proposées pour résoudre ce problème desegmentation d’images du plus général au plus particulier Cependant, chaqueméthode a ses avantages et ses inconvénients tels que la manipulation desparamètres [Trier,1995a], la complexité de calcul [Cheng,1999b] [Tao,2003]

Problème

Dans l’analyse d’images de documents et la reconnaissance de symboles, labinarisation est toujours une des premières étapes utilisées avant l’étape dereconnaissance Elle a donc une grande influence sur la performance des étapessuivantes et sur le résultat final C’est une technique importante dans les applications

de traitement d’images

Une image de documents graphiques contient généralement du graphique maiségalement du texte qui sont quelques fois assez proches Le texte risque donc defusionner des différentes parties du graphique à cause du changement faibled’intensité des pixels du fond et ceux de l’objet Recherchant des solutions pourl’image de documents graphiques, nous essayons de trouver une méthodeautomatique de binarisation simple et efficace qui sépare le fond et l’objet dans desimages aux niveaux de gris

Remarque

Travaillant avec l’image de documents graphiques, nous supposons toujours que l’image contient l’objet noir (des lignes, des textes) sur le fond blanc

Page 7

Trang 9

1.2 Objectif

Ce stage se situe dans la problématique de la segmentation d’images et dechercher une méthode simple mais efficace pour l’image de documents graphiquesafin de séparer clairement le fond et l’objet Autrement dit, il s’agit de trouver uneméthode de binarisation qui peut déterminer automatiquement et efficacement le seuilpour chaque point de l’image

1.3 Structure du rapport

Mon rapport se compose de cinq parties Quelques mots d’introduction de monstage sont dans la première partie La deuxième est consacrée à une présentationgénérale des techniques de segmentation d’images surtout la binarisation Desbrèves descriptions de quelques méthodes y sont aussi présentées La troisièmepartie est dédiée à la description détaillée de la méthode proposée L’analyse derésultats et les mesures d’évaluations sont abordées dans la quatrième Ce rapport setermine par la conclusion (cinquième partie)

1.4 Lieu de stage

Laboratoire

Le LORIA (Laboratoire Lorraine de Recherche en Informatique et ses Applications) est une Unité Mixte de Recherche - UMR7503 – constituée par plusieurs établissements : Centre National de Recherche Scientifique (CNRS), Institut National Polytechnique de Lorraine (INPL), Institut National de Recherche en Informatique et en Automatique (INRIA), Université Henri Poincaré Nancy 1 (UPH), Université Nancy 2.

Equipe

Mon stage, qui a duré six mois, s’est déroulé au sein de l’équipe QGAR(Querying Graphics through Analysis and Recognition) de l’INRIA lorraine sous laresponsabilité de Salvatore Tabbone (Maître de conférences à l’université de Nancy2) C’est une équipe spécialisée dans l’analyse de documents à forte composantegraphique Les objectifs sont l’indexation et la recherche d’informations dans lecontexte de la documentation technique

Le site http://www.loria.fr vous fournira des informations plus détaillées sur lelaboratoire La présentation plus détaillée de l’équipe se trouve dans les sites webshttp://www.loria.fr/equipes/qgar et http://www.inria.fr/recherche/equipes/qgar.en.html

Page 8

Trang 10

CHAPITRE 2 : ETAT DE L’ART 2.1 Généralité

2.1.1 Segmentation

La segmentation, un traitement essentiel des images, consiste à créer unepartition de l’image en des sous-ensembles appelés régions Ri Une région est unensemble de pixels qui possèdent des propriétés communes telles que l’intensité, latexture, etc Le but de la segmentation est d’extraire de l’image originale un certainnombre d’entités différentes appelées objets ou régions Comme c’est extrêmementdifficile d’avoir un algorithme idéal qui fonctionne correctement dans tous les cas, desnombreuses méthodes sont proposées En bref, on peut les classifier en deux

grandes approches, l’approche « frontière » et l’approche « région » [Horaud,1993].

La première, l’approche « frontière », est basée sur la forte variation d’intensité ou sur

la discontinuité des propriétés de deux ensembles connexes de points Elle regroupe les techniques de détections de contours En général, cette approche ne conduit pas directement

à une segmentation de l’image à cause de la continuité rare des contours Il faut donc procéder à une fermeture de contours si on souhaite une partition complète de l’image Les régions sont définies comme l’intérieur d’une ligne fermée.

Par contre, des méthodes appartenant à l’approche « région » sont construites

grâce à la similarité des points en évaluant des critères prédéfinis pour les regrouperdirectement en régions Le seuillage, la croissance de région, la division-fusion sontdes exemples de méthodes différentes de segmentation région

Il existe également des méthodes qui se basent à la fois sur les propriétés des

frontières et sur les propriétés de la région, on les appelle approche collaboration «

région-frontière ».

Pour des images de documents graphiques, la valeur d’intensité des pixels appartenant

à l’objet est assez différente de la valeur d’intensité des pixels appartenant au fond Donc, la technique de seuillage est devenue un outil simple mais efficace dans les applications de traitement d’images de documents Il a attiré de nombreuses recherches ayant pour but de trouver un algorithme qui optimise le seuil tels que les approches dans [Otsu, 1978] [Trier, 1995a] [Cheng,1999b] [Cheriet,1998] …

2.1.2 Binarisation

Définition : la binarisation (le seuillage) est la technique de classification la plus simple

ó les pixels de l’image sont partagés par un seul seuil s en deux classes : ceux qui

appartiennent au fond et ceux qui appartiennent à la scène (l’objet) L’image est alors

Page 9

Trang 11

séparée en deux classes de façon à ce que l’information comprise entre 0 et s est

retenue et l’autre non, ou vice-versa

Soit l’image I (M x N), supposons que f(x, y) représente le niveau de gris dupixel aux coordonnées (x, y), 0 ≤ x M ,0 y N et s est le seuil choisi, les pixels de l’objet sont ceux ayant le niveau de gris inférieur à s et les autres ayant le niveau de gris supérieur à s sont des pixel du fond Alors, l’image binarisée G est déterminée par

les pixels (x, y) dont la valeur est :

Selon [Horaud,1993], il existe trois grandes techniques de sélection du seuil s :

global, local et dynamique Comme il y a des différentes façons de déterminer le seuil

ó p(x, y) représente des propriétés locales du point (x, y) Si s ne dépend de que la valeur f(x, y) du point, le seuil est global, s’il dépend en plus de p(x, y), s est un seuil local Et si s dépend à la fois de (x, y), de p(x, y) et de f(x, y), on dit le seuil dynamique ou bien adaptatif.

Dans la méthode de binarisation globale un seuil unique est calculé à partir

d’une mesure globale sur toute l’image Il nous permet de décider l’appartenance d’unpixel à l’objet ou au fond Les méthodes de Otsu [Otsu,1978], de Kapur [Kapur,1985],

de Pun [Pun,1980], ou de Cheng et Chen [Cheng, 1998b] peuvent être tenues commedes représentants de cette approche Chacun a de différentes stratégies pouratteindre leur but Par exemple, la méthode décrite dans [Otsu,1978] essaie demaximiser la variance entre deux classes, tandis que d’autres méthodes dans[Kapur,1985] [Pun,1980] [Cheng,1998b] [ Mello,2000] se basent sur la théorie demaximum d’entropie ou d’entropie floue

Pour la binarisation locale, la classification d’un pixel dépend non seulement du pixel

soi-même mais aussi de ses informations locales Dans [Cheng,1999b], c’est la moyenne des pixels du voisinage qui est prise en compte lorsqu’on construit l’histogramme de deux

dimensions Dans [Cheng,1998a], les informations locales sont inclues dans le homogramme

qui indique le degré d’homogénéité correspondant à chaque niveau de gris dans l’image La

détermination du seuil se base sur cet homogramme Sachant l’importance des informations

du voisinage pour la classification, Sue Wu et Adnan Amin [Wu,2003] proposent une méthode

de seuillage en deux étapes pour l’image de documents Après l’étape de seuillage global sur l’image entière, le seuillage sur des sous-images qui contiennent des composants connectées est effectué La méthode donne de bons résultats sur l’ensemble des images d’enveloppe postale.

Page 10

Trang 12

La méthode de Trier et Taxt [Trier,1995a] et celle de Gadi et Benslimane[Gadi,2000] peuvent être considérées comme deux exemples de technique de

seuillage locale adaptative Dans [Trier,1995a], les auteurs ont appliqué des modifications sur la méthode de White & Rohrer afin d’obtenir une bonne méthode de

binarisation pour l’image de documents Une de leurs modifications est la façon declassifier des pixels ‘0’ dans l’image d’étiquettes à trois niveaux ‘+’, ‘-‘, ‘0’ qui est lerésultat de l’opérateur gradient Le pixel étiqueté ’0’ sera classé dans la classe à laquelle la majorité de ses 8 pixels voisins appartiennent Avec cette méthode, on peutobtenir des résultats satisfaisants en essayant des différentes solutions desparamètres Cependant, c’est la difficulté de la manipulation de nombreux paramètresqui cause un grand inconvénient de cette approche Dans [Gadi,2000], alclassification d’un pixel dépend de ses degrés d’appartenance calculés dans desrégions locales qui sont créées par le découpage de l’image originale selon le principe

de l’arbre quaternaire En principe, il nous fournira un résultat intéressant sur l’image

de documents graphiques si il n’y a pas de problème de sur-découpage

Comme les informations spatiales et les informations du voisinage des points ne sont pas prises en considération dans l’approche globale, cette approche possède un avantage sur

le temps d’exécution mais elle n’est appropriée qu’à des images simples Pour d’autres images, les deux approches locales sont toujours appréciées Elles donnent généralement de meilleurs résultats que l’approche globale mais au prix de la complexité.

Dans deux parties ci-dessous, des descriptions courtes des méthodes qui sontabordées dans le chapitre trois sont présentées

2.1.3 Sous-ensemble flou

Généralité

Dans la vie quotidienne, nous nous trouvons dans de nombreuses situations ó les informations dont nous disposons sont imprécises ou bien incertaines Le sens des mots dans

la langue est un exemple : des mots tel que « cher » « pas trop cher » « tơt »

«tard » « possible » ne donnent pas des informations exactes L’être humain est habitué à ces informations Chacun analyse donc le contexte et prend sa propre décision.

Le monde scientifique n’est pas exceptionnel, plusieurs problèmes doiventtravailler sur les données incertaines, incomplètes tels que le système d’exploitation

de bases de connaissances, le système d’aide à la décision… Dans ces cas, cestypes d’informations sont représentés et traités grâce à la logique floue dont la théoriedes sous-ensembles flous

Soit Ω un ensemble de n éléments, Ω ={x1,x2, ,x n} Supposons qu’on a besoin

de chercher des éléments satisfaisant une propriété quelconque α L’ensemble Ω se divise en deux sous-ensembles A et B A contient des éléments possédant α , tant dis que

Page 11

Trang 13

les autres appartiennent au sous-ensemble B, le complément de A dans Ω En vue de la logique classique, un élément n’appartient à qu’un sous-ensemble, A ou B Ça veut dire qu’un élément n’a que deux possibilités, soit il a cette propriété, soit il ne la possède pas absolument Cependant, il est possible qu’il existe dans Ω des éléments qu’on ne sait pas toujours s’ils satisfont α ou qu’ils ne la possèdent qu’avec un certain degré Dans ce cas, il vaut mieux prendre le sous-ensemble flou pour représenter ces informations.

Sous-ensemble flou :

Un sous-ensemble flou A de l’espace observée Ω est caractérisé par unefonction d’appartenance µA(x) qui associent un élément x de Ω avec un nombre réel,

µA (x) , dans l’intervalle [0, 1] et qui quantifie le degré d’appartenance de l’élément x

au sous-ensemble A Généralement, un sous-ensemble flou est définit comme unecollection des pairs en ordre ( µA(x) , x).

µA ( x) = í x-a

et celle qui est la plus connue et la plus utilisée est la fonction S de Zadeh :

ìï

ó (a, c) la région floue, b un point au milieu de a et c, b = (a+c) /2

La sélection de la fonction d’appartenance dépend de chaque application.

Trang 14

Page 12

Trang 15

Figure 2.1 : Fonction d’appartenance linéaire

S1

0.5

x

Figure 2.2 : Fonction S de Zadeh

Application dans la binarisation d’images

Pour le seuillage des images, le but principal est d’obtenir deux classes « blanc » et

«noir » à partir de l’image originale à niveaux de gris Cependant, il n’y aucune assurance pour une classification grâce à un seuil quelconque La question se pose toujours si un point est vraiment « noir » ou « blanc » ? La théorie de sous-ensembles flous est devenue une solution En définissant un intervalle flou, la fonction d’appartenance nous permet d’obtenir deux sous ensembles flous représentant le « noir » et le « blanc » de l’image.

2.2 Méthodes de seuillage global

Le seuillage global consiste à partitionner l’image en deux classes grâce à unseuil optimal qui est calculé à partir d’une mesure globale sur toute l’image.L’histogramme est une mesure utilisée le plus souvent dans les méthodes deseuillage Dans ce cas, le seuil attendu est celui qui correspond à la vallée del’histogramme, celui qui distingue le plus possible les deux classes : fond et objet

Page 13

Trang 16

Définition : On définit l’histogramme des niveaux de gris d’une image comme

étant la fonction h: [0 L−1]→ Ν qui associe à chaque niveau de gris entre 0 et L-1

la quantité de pixels de l’image qui possèdent cette intensité lumineuse

[Braviano,1995]

L’histogramme d’une image peut être représenté par un vecteur dont chaque

composante est un nombre de pixels de niveau de gris correspondant à son indice Il

permet de fournir effectivement une estimation de la densité de probabilité des valeurs

des pixels sur l’image observée

h(i ) = n i ,i = 0, L 1 , ón ile nombre de pixels de niveau de grisidans l’image

2.2.1 Méthode de Otsu

Le principe de la méthode de Otsu est de trouver un seuil optimal qui maximise

la différence entre deux classes Il est effectué en se basant sur la variance Le seuil

optimal s optimal est celui qui maximise une des fonctions suivantes :

λ(t) =

δ2 (t )

B

δW2 (t )

Si l’on choisitη (t) , alors

Où δTB T , δW2 sont successivement la variance totale de l’image, la variance

inter-classes (between-class variance) et la variance intra-classes (within-class variance).

dB2 (t ) T2 (t ) −δW2 (t)

max 2

· P fond (t ), P objet (t ) : la somme des probabilités d’occurrence des niveaux de

grisdes pixels du fond et celle de l’objet en prenant le seuil t.

Trang 17

· [min, max] est l’intervalle dynamique de l’image.

Cette méthode est simple à implanter et donne de bons résultats en général.Cependant, dans les cas des images de documents, les résultats ne sont pas nets,deux différents objets peuvent être confondus

2.2.2 Méthodes se basant sur l’entropie

Selon la théorie de l’information, l’entropie est une mesure de quantité d’informationd’un système Soit un ensemble fini S={s1,s2, ,s k} d’événements indépendants, et pi

la probabilité d’occurrence de chaque élément si, l’entropie est définie par :

de segmentation d’images l’ont utilisée dans le but de maximiser la qualité del’information obtenue du résultat final [Pun,1980] [Kapur,1985] [Cheng,1998b][Mello,2000] [Braviano,1995]

Si l’ensemble S est considéré comme un ensemble flou avec le degréd’appartenance correspondant à chaque élément dans S µS ( s i ), i = 1,k , appelé la

fonction d’appartenance (membership function), l’entropie floue de l’ensemble S est

Trang 18

Page 15

Méthode de Pun :

Le seuil est choisi tel que la fonction H = H objet

s optimal= max (H objet + H fond)= max (−å p i * log p i−å p i * log p i )

Dans ce cas, la distribution de probabilité de l’objet P t et la distribution de probabilité

du fond (1 - P t) sont prises en compte en déterminant l’entropie de la partition

Méthode de Cheng et Chen [Cheng,1998b]:

Différant de ces deux méthodes précédentes, l’entropie d’une partition estcalculée en prenant des probabilités d’occurrence de sous-ensembles (objet et fond)

La théorie de sous-ensembles flous est comptée de plus dans son calcul Alors, dans

ce cas, l’entropie d’une partition est :

Méthode de Mello et Lins [Mello,2000] :

C’est une méthode qui se spécialise pour l’image de documents historiques

Supposons que t soit la couleur apparaissant le plus souvent dans l’image.

Prenons cette valeur comme le seuil initial de l’image, les valeurs d’entropie de l’objet

Hb et du fond Hw sont déterminées comme dans [Pun,1980] Un pixel i dont la couleur est couleur(i) sera classé comme le fond si :

couleur (i) / 256 ³ (mw * Hw + mb * Hb) sinon il sera classé comme l’objet

Les deux facteurs mw et mb sont déterminés par expériences en évaluant

l’entropie de l’image entière et dédiés particulièrement à un type d’images observé

Trang 19

Page 16

Trang 20

2.3 Segmentation hiérarchique floue

Décrite dans [Gadi,2000], cette méthode est comme une représentante del’approche locale adaptative Elle est basée sur un principe hiérarchique pourrésoudre le problème d’éclairage non uniforme Sous l’hypothèse que l’image ne

contient que deux classes : l’objet et le fond, le principe de cette méthode est de récupérer le plus possible des pixels à la classe objet.

La méthode se compose de 2 étapes :

¨ Fuzzification :

- Construction de l’arbre quaternaire : l’image originale est divisée

consécutivement en quatre sous images de taille de plus en plus petite enévaluant le critère d’homogénéité Chaque sous-image est associée à unnœud de l’arbre quaternaire Si une sous-image satisfait le critèred’homogénéité, la division n’est plus nécessaire, elle devient un nœudterminal dans l’arbre Au cas contraire, cette sous-image est décomposée

en quatre Le processus continue jusqu’à ce que tous les nœuds dansl’arbre soient des terminaux

La condition pour que le critère d’homogénéité soit satisfait sur une région, c’est qu’il n’y a plus de « différence significative » entre cette région et ses quatre filles Cette condition est vérifiée par le test statistique de Fisher.

f F α − : sous-image est homogène

3;4 (k 1)

f > F α − : sous-image est non homogène

3;4( k 1)

f : l’estimation du critère d’homogénéité sur la sous-image évaluée (voir

partie 3.3 pour plus détaillé)

m (k x,y) = S((x, y); moyenne ecart _ type, moyenne, moyenne + ecart _ type)

ó la moyenne et l’écart type sont déterminés dans la région contenant pixel (x, y) au niveau k.

¨ Défuzzification :

- Décision : Après avoir fait des différentes évaluations de l’appartenance

de chaque pixel à une des deux classes, la fonction d’agrégation

t-conorme de Zadeh est affectée à la détermination de la mesured’appartenance finale à la classe objet

Page 17

Trang 21

Un autre problème réside au problème de découpage En fait, le test statistique est très sensible aux bruits, alors l’image est trop découpée De plus, la fonction max utilisée dans la partie de défuzzification accentue les bruits En conséquence, les faux pixels sont classés facilement comme les pixels de l’objet L’affectation de cette méthode à l’image

jaures_partie1.tif (figure 3.2) donne un résultat inattendu (figure 2.3).

a) Le découpage

Figure 2.3 : Un problème de la méthode de Gadi et Benslimane.

En considérant des images de documents graphiques, on constate que s’il n’ypas de grande variation d’intensité des pixels appartenant à l’objet et pour diminuer

l’effet négatif du découpage, l’opérateur d’agrégation min(…) est plus convenable que l’opérateur max (figure 2.4) Alors, quand on fait des tests sur l’image de documents, l’opérateur d’agrégation min est pris au lieu de max à l’étape de décision .

Page 18

Trang 22

Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…)

Page 19

Trang 23

CHAPITRE 3 : METHODE PROPOSEE 3.1 Principe de la méthode

L’histogramme de l’image de document contient deux modes : une forte correspondant

au fond et une faible correspondant à l’objet Cependant ce qui est important est celui de l’objet Une méthode de seuillage global peut éliminer facilement la mode du fond mais cela

ne veut pas dire qu’on a bien obtenu l’objet qui se compose de lignes et aussi de caractères.

La frontière entre l’objet et le fond n’est pas toujours claire surtout dans les zones ó les caractères et les lignes sont proches Donc, obtenir l’objet dont les composants sont clairs et nets est le but final de notre méthode.

La méthode proposée peut être considérée comme la combinaison del’approche globale et l’approche locale Elle se compose de deux étapes Utilisant latechnique de seuillage global, la première étape a pour but d’éliminer la plupart dufond qui domine l’image observée et de garder la partie importante contenant l’objet

La deuxième étape consiste à raffiner le résultat de l’étape précédente pour rendrel’objet plus net Une variation de la méthode de binarisation locale adaptative[Gadi,2000] est appliquée dans cette étape

Image intermédiaire

II

Binarisation

Figure 3.1 : Principe de la méthode proposée

Dans les parties ci-dessous, on va prendre ces notations suivantes :

g(x, y) : le niveau de gris du pixel (x, y) de l’image originale I.

g I (x, y) : le niveau de gris du pixel (x, y) de l’image intermédiaire I I

g F (x, y) : le niveau de gris du pixel (x, y) du résultat final I F

3.2 Etape de seuillage global

Une méthode de seuillage global nous aide à chercher un seuil pour toute l’image En principe, n’importe quelle méthode de seuillage globale peut être appliquée à cette étape Toutefois, une méthode simple est toujours une bonne sélection à priori Alors, dans ce cas, nous avons choisi la méthode de Otsu comme une solution possible.

Page 20

s

Ngày đăng: 30/10/2020, 21:18

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w