Activités durant ma thèse

CADRE DE LA THÈSE: Ma thèse est une thèse en cotutelle entre le laboratoire GSCM_LRIT de la Faculté des Sciences de Rabat et l'Ecole Polytechnique de l'Université de Nantes faisant partie du projet STIC franco-marocain.

PRÉSENTATION :

Mon sujet de thèse intitulé : "La navigation dans les bases d'images : prise en compte des attributs de texture" se focalise sur la description et l'interprétation des images en se basant sur la texture. Je peux résumer mes contributions dans cette thèse selon deux axes :

  1. L'extraction des attributs pertinents pour une description optimale de la texture. Pour cela, je me suis appuyée sur des techniques de sélection des features tels que l'entropie, l'information mutuelle, ReliefF, algorithmes génétiques, etc. Nous avons proposé dans ce cadre, deux mesures basées sur la corrélation de Pearson et la corrélation partielle. Ce dernier modèle donne de meilleurs performances comparés aux autres. Pour une évaluation objective, nous avons fait appel aux approches de classification telles que SVM, réseaux bayésiens et arbres de décision (C4.5).
  2. Le "fossé sémantique" est le défi actuel qu'affronte les différents systèmes de recherche d'images(CBIR). Il s'agit en fait de tenir compte des intentions des utilisateurs pour une meilleure et efficace recherche. Cela dit, que pour chaque ensemble d'images classifiées par l'utilisateur, il lui faut correspondre un terme, une sémantique répondant à l'attente de l'utilisateur. Dans ce sens, nous avons interprété ce problème de sémantique en un problème de discrétisation de variables continues en intervalles discrets dont chaque intervalle correspondra à un terme spécifique (propriété) regroupant un ensemble d'images partageant cette même propriété. Plusieurs approches de discrétisation supervisée (One-rule, entropie) et non-supervisée (k-means, k-medoids, FCM, GG) ont été utilisées. Ici, nous avons proposé une métrique semi-supervisée basée la distance maximale et en tenant compte du jugement de l'expert durant la phase de validation.

Pour une recherche rapide et ciblée ne nécessitant aucune formulation de requêtes, ni un bouclage en attente d'atteindre l'image souhaitée, nous avons proposé d'utiliser les treillis de Galois. Cette technique permet la construction de la hiérarchie de nos bases d'images au préalable. La navigation au sein de cette hiérarchie se fait à l'aide d'une interface HTML accessible aux utilisateurs non-experts.

Mes contributions en thèse se sont focalisées autour de l'extraction des descripteurs et la réduction du fossé sémantique:

  • Proposition d'une métrique basée sur la corrélation pour la sélection des features appliquée à l'extraction de la texture
  • Proposition d'une mesure semi-supervisée pour la discrétisation des variables continues basée sur la distance maximale et intégrant le jugement d'un expert

Comme extension de ce travail étant donné que la recherche d’images par contenu visuel et sémantique est toujours un problème ouvert, je prévois plusieurs champs (possibilité d'extension) :

    • Explorer d’autres approches d’analyse de texture et élargir le spectre des attributs en combinant d’autres éventuellement (couleur, forme, …) ;
    • Proposer d’autres métriques de sélection et d’extraction des attributs pertinents. Actuellement, je travaille sur le passage de la corrélation adopté dans ce travail à l’information mutuelle ou entropie ;
    • Adopter des approches probabilistes ou modèles graphiques pour l’interprétation et la modélisation des images excluant ainsi l’hypothèse d’égalité entre attributs ;
    • Modéliser le besoin des utilisateurs afin de raffiner la recherche sémantique des images.

MOTS-CLÉS : recherche d'images, analyse de texture, interprétation des images, extraction des features, fossé sémantique, classification, logique floue, treillis de Galois