Titre: Application assistée par ordinateur pour les malvoyants par acquisition et reconnaissance d’images statiques et dynamiques
Auteurs: Enmar KHALIS
Ecole: LIRMM
Résumé: Les visages sont des objets spéciaux d’intérêt considérable. Développer des systèmes automatisés de détection et de reconnaissance des visages est utile dans une variété de domaines d’application, y compris l’aide aux personnes ayant une déficience visuelle et la gestion des collections d’images à grande échelle. Ce mémoire se concentre sur l’émulation de cette approche en utilisant différents types d’informations contextuelles pour améliorer la performance des différentes méthodes de détection de visage et reconnaissance faciale.
Dans ce travail, l’algorithme de reconnaissance de visage est présenté sur la base d’un mixte de loi Manhattan doublement tronqué et multi variée avec transformation discrète en cosinus (DCT) et le modèle binaire locale (LBP). Ici, l’image faciale d’entrée est transformée au domaine de configuration binaire locale. L’image de la configuration binaire locale obtenue est divisée en blocs qui ne se chevauchent pas. Puis à partir de chaque bloc, des coefficients DCT sont calculées et des vecteurs de caractéristiques sont extraits. Du fait que le vecteur de caractéristique suit une loi Manhattan doublement tronqué et multi variée, l’image du visage est ainsi modélisée. En utilisant l’algorithme Expectation Maximisation, les paramètres du modèle sont estimés. L’initialisation des paramètres du modèle se fait en utilisant l’algorithme K-means.. De plus, l’efficacité du système de reconnaissance faciale développé est évaluée en effectuant des expériences avec des bases de données d’image de visage du personnel. La performance mesure environ un tiers du taux d’erreur total (1/3). Finalement, une étude comparative de l’algorithme développé avec une partie du l’algorithme précédemment existant a révélé que ce système fonctionne mieux lorsque les informations locale et globale du visage sont utilisées.
Extrait du sommaire:
Résumé 5
Introduction 6
1. Introduction générale 6
1.1 Systèmes de reconnaissance faciale 6
1.2 Difficulté de la vision par ordinateur 6
2 Présentation du laboratoire de recherche (LISMMA) 8
2.1 Statut et partenaires industriel et universitaire 8
2.2 Equipes en activité et les thématiques et les axes de recherches 9
3 Choix du stage 13
Chapitre 1 Handicapés malvoyants 15
1-1 Définition et Généralités 15
1-2 Causes de déficience visuelle 16
1-3 Qui est affecté par la déficience visuelle? 17
1-4 Incidence de la déficience visuelle sur le développement 18
Chapitre 2 MATLAB 24
2-1 Qu’est-ce que MATLAB? 24
2-2 Le système MATLAB 25
2-3 Interprétation VS compilation 26
2-4 Pourquoi choisir MATLAB? 27
2-5 Faiblesses de MATLAB 28
2-6 Mise en route MATLAB 28
2-7 Figures, courbes et graphiques 36
2-8 Traitement de l’image 44
2-8.1 Qu’est-ce que l’image numérique?
2-8.2 Traiter les images numériques avec des algorithmes informatiques 45
2-8.3 Formats d’image supportés par Matlab 45
2-8.4 Aspects du traitement de l’image 46
2-8.5 Types d’images numériques 46
2-8.6 Comment convertir entre différents formats 47
2-8.7 Commandes générales utilisées dans le traitement de l’image 49
Chapitre 3 Algorithmes / Méthodes 57
3-1 Méthode de Viola et Jones 57
3-2 Cascade Object Detector 62
3-3 Local Binary Pattern (LBP) 64
3-4 Suivi de points dans une vidéo à l’aide de l’algorithme de Kanade-Lucas-Tomasi
(KLT) 71
3-5 APPLICATION 75
Perspectives 83
Conclusions 85
Bibliographique 86
Télécharger le fichier PDF: Application assistée par ordinateur pour les malvoyants par acquisition et reconnaissance d’images statiques et dynamiques