Qu'est-ce que VALL-E?
VALL-E est une plateforme développée par Microsoft, qui permet de simuler n'importe quelle voix à partir d'un enregistrement audio de trois secondes.
Une version démo est disponible à cette adresse.
Source de l'image : Adobe Stock
Le principe de fonctionnement de VALL-E est simple : il suffit de parler pendant trois secondes pour que la plateforme « apprenne » la voix du locuteur.
Elle pourra ensuite, à partir d'un texte, générer un discours oral en reproduisant le timbre de voix ainsi que le ton et l'émotion du locuteur. (Source: lesnumeriques)
« Étant donné que VALL-E peut synthétiser la parole en conservant l'identité du locuteur, l'utilisation de la plateforme peut comporter des risques, comme l'usurpation d'identité vocale ou l'usurpation de l'identité d'un locuteur spécifique. [...] Il est donc impossible de s'assurer que le locuteur approuve l'utilisation de sa voix [...] » (Source: démo de VALL-E)
Source de l'image : Adobe Stock
Source de l'image : Adobe Stock
La plateforme pourrait notamment s'avérer utile pour la création de balados, l'édition de vidéos et pour produire de la musique.