Face Vision

Vision utilizza un classificatore di output strutturato basato sui Modelli di parti deformabili. La qualità della configurazione dei punti di riferimento per l'immagine data viene misurata . La massimizzazione di f è risolta dalla programmazione dinamica , grazie alla forma dei vincoli del grafico (grafico aciclico diretto). L'accuratezza del rilevatore è misurata in termini di deviazione relativa definita come distanza tra le posizioni del punto di riferimento della verità stimata e divisa per la dimensione della faccia. La dimensione del viso è definita come la distanza tra il centro della bocca e il punto medio tra i centri degli occhi. L'accuratezza geometrica è misurata dallo spostamento medio della caratteristica relativa e dallo spostamento massimo relativo della caratteristica a cui viene misurata in termini di deviazione, relativa, definita come distanza tra le posizioni del punto di riferimento stimato e divisa per la dimensione della faccia. La dimensione del viso è definita come la distanza tra il centro della bocca, e il punto medio tra i centri degli occhi. L'accuratezza geometrica è misurata dallo spostamento medio della caratteristica relativa e dallo spostamento massimo relativo della caratteristica e viene confrontata con tre rivelatori concorrenti in termini di precisione delle posizioni stimate. Nello specifico viene confrontato con i parametri basati sui seguenti approcci: modelli di aspetto attivo, rilevatori basati su modelli deformabili e binari formati indipendentemente per ciascun punto di riferimento.