Real-Time Voice Cloning
Jemine, Corentin
Promoteur(s) : Louppe, Gilles
Date de soutenance : 26-jui-2019/27-jui-2019 • URL permanente : http://hdl.handle.net/2268.2/6801
Détails
Titre : | Real-Time Voice Cloning |
Titre traduit : | [fr] Clonage de la voix en temps réel |
Auteur : | Jemine, Corentin |
Date de soutenance : | 26-jui-2019/27-jui-2019 |
Promoteur(s) : | Louppe, Gilles |
Membre(s) du jury : | Geurts, Pierre
Fonteneau, Raphaël |
Langue : | Anglais |
Nombre de pages : | 37 |
Mots-clés : | [fr] voix [fr] audio [fr] text-to-speech [fr] tts [fr] neurone [fr] réseau [fr] deep [fr] deep learning [fr] machine learning [fr] transfert [fr] generation [en] voice [en] audio [en] transfer [en] generation [en] text-to-speech [en] tts [en] neural [en] network [en] deep [en] deep learning [en] machine learning |
Discipline(s) : | Ingénierie, informatique & technologie > Sciences informatiques |
Public cible : | Professionnels du domaine Etudiants Grand public |
Institution(s) : | Université de Liège, Liège, Belgique |
Diplôme : | Master en science des données, à finalité spécialisée |
Faculté : | Mémoires de la Faculté des Sciences appliquées |
Résumé
[en] Recent advances in deep learning have shown impressive results in the domain of text-to-speech. To this end, a deep neural network is usually trained using a corpus of several hours of professionally recorded speech from a single speaker. Giving a new voice to such a model is highly expensive, as it requires recording a new dataset and retraining the model. A recent research introduced a three-stage pipeline that allows to clone a voice unseen during training from only a few seconds of reference speech, and without retraining the model. The authors share remarkably natural-sounding results, but provide no implementation. We reproduce this framework and open-source the first public implementation of it. We adapt the framework with a newer vocoder model, so as to make it run in real-time.
Fichier(s)
Document(s)
Annexe(s)
Citer ce mémoire
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.