Microsoft a récemment développé une intelligence artificielle capable d’imiter n’importe quelle voix à partir d’une quantité de donnée extrêmement faible.
Afin d’enrichir le modèle d’intelligence artificielle, 60 000 heures de conversation en anglais lui ont été transmise. Et le résultat est plutôt stupéfiant.
Une fois l’IA entraînée, il suffit d’un enregistrement de seulement trois secondes minimum pour qu’elle reproduise la voix de n’importe qui, sur n’importe quel texte. En plus de reproduire le timbre de voix, Vall-E joue avec la tonalité selon plusieurs facteurs, y compris les émotions.
L’intelligence artificielle Vall-E se définit par un modèle de langage pour la synthèse vocale (Text-To-Speech), soit une technologie grâce à laquelle un robot ou un ordinateur peut lire du texte à voix haute.
Ce projet d’IA conçu par Microsoft est cependant controversé en raison des risques associés à une utilisation malveillante. Les risques éthiques sont majeurs, et les possibilités d’utilisation malsaine ne manquent pas. C’est pourquoi Microsoft ne prévoit pas de rendre l’outil accessible pour le moment.