Thèse deschenes

François Deschênes

Estimation simultanée et coopérative d'indices visuels de profondeur

pour la perception tridimensionnelle

Résumé :

Dans le domaine de la vision par ordinateur, la perception tridimensionnelle d’une scène réelle permet à un système de comprendre les relations 3D qui existent entre les différents objets de l’espace. À ce jour, de nombreuses applications novatrices, notamment en médecine, au cinéma, en robotique et en aérospatial, ont pu être développées grâce à ce concept. La perception 3D implique généralement l’estimation de la profondeur, c’est-à-dire la distance séparant la surface d’un objet et le capteur. Sur le plan visuel, cela s’effectue généralement grâce à l’extraction de caractéristiques pertinentes contenues dans une ou plusieurs images, communément appelées indices de profondeur. Parmi celles-ci, nous retrouvons entre autres les ombrages, le mouvement, le flou, la disparité, etc. La majorité des techniques existantes calculent ces indices de manière indépendante en se basant sur des hypothèses simplistes (e.g. correspondance spatiale parfaite, intensité constante, etc.). Or, de telles hypothèses impliquent un contrôle parfait de l’environnement et du système d’acquisition, ce qui est habituellement difficile et même insuffisant dans la pratique. En ce sens, nous nous intéressons à l’estimation des variations radiométriques associées au flou et des transformations géométriques apparentes (disparités binoculaires, mouvement 2D, disparités reliées au zoom, etc.) entre deux images acquises par une caméra évoluant dans le temps et l’espace. Plus précisément, nous proposons une classe d’approches permettant d’estimer ces indices de profondeur dans le domaine spatial à partir des images, mais également de leurs dérivées partielles. Ces approches ont été testées et validées sur de nombreuses images de synthèse et réelles. Les résultats obtenus confirment l’obtention de solutions denses et précises. Les indices ainsi calculés peuvent donc ensuite servir à une reconstruction 3D de grande précision de scènes réelles.

Mots clés :

Perception 3D, Extraction de caractéristiques, Indices de profondeur, Modèle unifié, Flou, Disparité binoculaire, Mouvement 2D, Disparité associée au zoom, Homotopie, Transformée d’Hermite.