Extension spectrale d'un signal de parole de la bande téléphonique à la bande AM
February 26, 2016 · Declared Dead · 🏛 arXiv.org
"No code URL or promise found in abstract"
Evidence collected by the PWNC Scanner
Authors
Jean-Marc Valin
arXiv ID
1602.08185
Category
cs.SD: Sound
Cross-listed
cs.MM
Citations
0
Venue
arXiv.org
Last Checked
4 months ago
Abstract
This document proposes a bandwidth extension system producing a wideband signal from a narrowband speech signal. The extension is performed independently for high and low frequencies. High-frequency extension uses the excitation-filter model. Extension of the excitation is performed in the time domain using a non-linear function, while the spectral envelope is extended in the cepstral domain using a multi-layer perceptron. Low-band extension is based on the sinusoidal model. The amplitude of sinusoids is also estimated using a multi-layer perceptron. The results show that the sound quality after extension is higher than that of narrowband speech, with a significant variation across listeners. Some of the techniques, including excitation extension, are of interest in the field of speech coding. ----- Le présent mémoire propose un système d'extension de la bande permettant de produire un signal en bande AM à partir d'un signal de parole en bande téléphonique. L'extension est effectuée de façon indépendante pour les hautes fréquences et les basses fréquences. L'extension des hautes fréquences utilise le modèle filtre-excitation. L'extension de l'excitation est réalisée dans le domaine temporel par une fonction non linéaire, alors que l'extension de l'enveloppe spectrale s'effectue dans le domaine cepstral par un perceptron multi-couches. L'extension de la bande basse utilise le modèle sinusoïdal. L'amplitude des sinusoïdes est aussi estimée par un perceptron multi-couches. Les résultats obtenus montrent que la qualité sonore après extension est supérieure à celle de la bande téléphonique, avec une importante différence entre les auditeurs. Certaines techniques développées, dont l'extension de l'excitation, présentent un certain intérêt pour le domaine du codage de la parole.
Community Contributions
Found the code? Know the venue? Think something is wrong? Let us know!
📜 Similar Papers
In the same crypt — Sound
🔮
🔮
The Ethereal
R.I.P.
👻
Ghosted
Multi-talker Speech Separation with Utterance-level Permutation Invariant Training of Deep Recurrent Neural Networks
R.I.P.
👻
Ghosted
The fifth 'CHiME' Speech Separation and Recognition Challenge: Dataset, task and baselines
R.I.P.
👻
Ghosted
TasNet: time-domain audio separation network for real-time, single-channel speech separation
R.I.P.
👻
Ghosted
SampleRNN: An Unconditional End-to-End Neural Audio Generation Model
R.I.P.
👻
Ghosted
MidiNet: A Convolutional Generative Adversarial Network for Symbolic-domain Music Generation
Died the same way — 👻 Ghosted
R.I.P.
👻
Ghosted
Federated Learning: Strategies for Improving Communication Efficiency
R.I.P.
👻
Ghosted
In-Datacenter Performance Analysis of a Tensor Processing Unit
R.I.P.
👻
Ghosted
Deep Convolutional Neural Networks for Computer-Aided Detection: CNN Architectures, Dataset Characteristics and Transfer Learning
R.I.P.
👻
Ghosted