Abstract:
Cette thèse aborde le problème de la réduction du bruit de la parole, qui représente
un défi majeur dans le traitement audio. Les signaux de parole bruyants peuvent
dégrader considérablement les performances de nombreuses applications basées sur
la parole, telles que la reconnaissance vocale, la communication vocale et l’améliora-
tion de la voix. L’hypothèse principale sous-jacente à ce travail est que les techniques
d’apprentissage auto-supervisé peuvent être efficacement exploitées pour réduire le
bruit de la parole sans avoir besoin de grands ensembles de données . Les princi-
paux objectifs sont d’explorer les possibilités des méthodes auto-supervisées pour
la réduction du bruit de la parole, de mettre en œuvre et d’évaluer des algorithmes
capables de supprimer le bruit de la parole tout en maintenant la qualité de base
de la parole. L’approche de recherche comprend l’examen de la littérature sur les
méthodes traditionnelles et modernes, la mise en œuvre d’un modèle d’apprentissage
auto-supervisé, la préparation et le prétraitement des données audio, ainsi que la
formation et l’évaluation du modèle. Les résultats de ce travail suggèrent que l’ap-
prentissage auto-supervisé pourrait être une direction prometteuse pour résoudre
le problème de la réduction du bruit de la parole, en particulier dans les environ-
nements où l’obtention de données annotées est rare ou coûteuse. Ce modèle peut
être intégré dans diverses applications basées sur la parole pour améliorer leurs per-
formances et leur robustesse dans les environnements bruyants. Les futures orien-
tations de recherche pourraient inclure l’exploration de techniques auto-supervisées
plus avancées et l’étude de la transférabilité des représentations apprises à d’autres
tâches de traitement du son.