Result: Approche Hybride pour l'Inversion de la Compression Dynamique en Traitement Audio à l'aide de l'Apprentissage Profond
Further Information
La compression de la dynamique du signal (abr. angl. DRC) est un effet audio non linéaire couramment utilisé en studio et en production musicale. Inverser cet effet est essentiel pour restaurer la dynamique originale d'un signal ainsi que sa qualité audio. Dans ce travail, nous proposons une approche hybride combinant un modèle paramétrique d'inversion de la compression dynamique avec des réseaux de neurones profonds. Cette combinaison permet à la fois une estimation robuste des paramètres du compresseur et une restauration plus fidèle du signal audio. Notre méthode repose sur deux architectures neuronales : l'une pour estimer la classe du compresseur et l'autre pour estimer directement ses paramètres. Les évaluations comparatives menées sur plusieurs jeux de données montrent une amélioration significative de la restauration audio par rapport aux méthodes de l'état de l'art.
Dynamic range compression (DRC) is a nonlinear audio effect commonly used in studios and music production.Reversing this effect is essential for restoring a signal’s original dynamic range and audio quality. In this work, we propose ahybrid approach combining a parametric dynamic range compression inversion model with deep neural networks. This combinationenables both robust estimation of compressor parameters and more faithful restoration of the audio signal. Our method relies on twoneural architectures: one to estimate the compressor class and the other to directly estimate its parameters. Comparative evaluationsconducted on several datasets show significant improvements in audio restoration when compared to some state-of-the-art methods.