Générateur de ton
L'utilisation d'un générateur de ton lors de la décompression permet de contrôler très finement les fréquences (double précision), comme les magnitudes et les phases.
Les tons peuvent être générés en parallèle, donc la génération est compatible avec la programmation GPU.
Le contrôle très fin des fréquences permet de faire des décalages de hauteur (pitch shifts en Anglais) en temps réel avec très peu d'opérations supplémentaires.
Cette puissante fonctionnalité pourra être utilisée notamment en cas de pertes auditives profondes dans certaines zones de fréquence, lors des communications vocales.
Contrôle des fréquences sur mesure
Il est prévu d'utiliser un fichier texte XML permettant de définir des paramètres personnalisés pour les fréquences qu'on souhaite contrôler:
- Ratio de décalage (pour le décalage des fréquences).
- Seuil de décalage (aucun décalage en dessous du seuil, en Hz).
- Offset de décalage (pour addition, en Hz).
- Largeur d'une bande de fréquences (pour composition, en Hz).
Composition
Avec la composition, le ratio de décalage et le décalage sont appliqués à une bande dont les fréquences sont ajoutées aux fréquences d'origine.
Donner une valeur nulle à la largeur de la bande si aucune composition ou une valeur strictement positive pour une composition.
Réduction de bruit
On peut compléter et utiliser les bandes de l'arrière plan pour réduire le bruit contenu dans un signal.
Plus d'Informations
L'utilitaire pshift.exe
Sous windows, à partir de la version 7 des codecs, une utilitaire (pshift.exe) est fourni. Cet utilitaire permet de tester les fonctions de décalages de fréquence.
A partir d'un fichier WAVE mono, il encode puis décode avec le codec choisi. Lors de la décompression, il applique les paramètres choisis pour les décalages. L'utilitaire play.exe ou tout autre lecteur de fichier WAVE peut être utilisé pour lire le fichier de sortie.
L'utilitaire pshift.exe permet de connaître les paramètres qui correspondent à vos propres besoins. Lancer l'utilitaire sans paramètre pour avoir la liste de tous les paramètres disponibles.
Fonctionnalité Auto-Tune (contrôle de tonalité)
Il est prévu l'ajout d'un paramètre ("note") à l'utilitaire pshift.exe.
Si note=0, le paramètre ratio de décalage est actif (valeur par défaut).
Si note=-1, le paramètre ratio de décalage n'est pas utilisé. La fréquence fondamentale de la trame (si elle existe) est déplacée vers la note musicale la plus proche. Le même ratio de déplacement appliqué à la fréquence fondamentale est appliqué aux autres fréquences.
Si note=valeur, le paramètre ratio de décalage n'est pas utilisé. La fréquence fondamentale de la trame (si elle existe) est déplacée vers la note musicale égale à "valeur". Le même ratio de déplacement appliqué à la fréquence fondamentale est appliqué aux autres fréquences.
Notes
Le générateur de ton peut être utilisé pour tous les codecs.
Les calculs augmentent avec le nombre de tons à générer et la taille des tampons audio. La programmation GPU peut être utilisée si nécessaire.
En changeant la valeur d'une simple variable, le générateur de ton peut être activé ou désactivé pour un codec.
Les algorithmes de décimation et de sélection des points dans le domaine des fréquences sont très utiles pour diminuer de manière significative les calculs.
Les propriétés liées à iFFT (inverse FFT) comme les convolutions rapides ou la 3D rapide ne sont plus applicables. En outre, les codecs HQ (VLC HQ 16 et VLC HQ 48) ne sont plus quasi sans perte en énergie avec la définition du LTAS (Spectre Moyen à Long Terme, Long-Term Average Spectrum en Anglais).
Sans le support de la programmation GPU (qui est prévu), les calculs augmentent sensiblement pour les codecs utilisant les fréquences d'échantillonnage supérieures à 16 kHz (VLC 32, VLC 48, ...).
Nous utilisons iFFT pour ces codecs. Ceci entraîne une perte de précision pour les fréquences modifiées (les fréquences deviennent des multiples de la largeur des bins FFT).
Néanmoins, ces pertes sont insignifiantes pour des fréquences assez élevées.
Si le ratio de décalage est négatif, les fréquences deviennent plus petites.
Si le ratio de décalage est positif, les fréquences deviennent plus grandes.
Si le ratio de décalage est nul, il n'y a pas de changement.
Le ratio de décalage est donné par la formule:
r = 2^(s/12) où:
s = nombre de demi-tons.
^ = puissance.
Le codec VLC HQ 48 cherche les plus grands points jusqu'à 24 kHz. Même si on n'a pas de problème d'audition, à partir de 16 kHz, les fréquences deviennent de moins en moins audibles.
Le décalage de hauteur permet d'entendre au mieux les fréquences supérieures. On peut par exemple choisir un seuil entre 12 et 16 kHz et un ratio de décalage entre -1 et -12 demi-tons.
Pour un seuil de 16 kHz et un ratio de dcalage de -12 demi-tons:
- 16 kHz devient 8 kHz.
- 20 kHz devient 10 kHz.
- 24 kHz devient 12 kHz.
Les points pris en compte pour la compression constituent l'enveloppe spectrale modulant les magnitudes par défaut des points déplacés.
Le seuil doit être plus grand que 1000-1500 Hz pour éviter des distorsions indésirables.
Il faut mettre le seuil à zéro pour éviter la modulation des magnitudes avec l'enveloppe spectrale et pour des algorithmes plus sophistiqués (si d'autres sons que la voix ou effets audio recherchés, moyennant une légère mise en mémoire tampon).
L'utilitaire pshift.exe supporte les codecs PCM non compressés (pcm8, pcm16, pcm32 et pcm48, pour les fréquences d'échantillonnage de 8, 16, 32 et 48 kHz).
Pour les traitements, les transformations FFT et inverse FFT sont effectués côté décodeur.
Page d'Ecoute
|
|
Voix d'Homme d'Origine Fréquence d'Echantillonnage de 16 kHz
Cliquez Ici pour Ecouter WAV MP3
Voix d'Homme d'Origine Fréquence d'Echantillonnage de 8 kHz
Cliquez Ici pour Ecouter WAV MP3
|
Voix de Femme d'Origine Fréquence d'Echantillonnage de 16 kHz
Cliquez Ici pour Ecouter WAV MP3
Voix de Femme d'Origine Fréquence d'Echantillonnage de 8 kHz
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -2 demi-tons
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -2 demi-tons
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -4 demi-tons
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -4 demi-tons
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -8 demi-tons et un décalage de -100 Hz
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -8 demi-tons et un décalage de -100 Hz
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Composition
Superposition des fréquences supérieures à 2000 Hz et inférieures à 3000 Hz avec un ratio de -3 demi-tons et un décalage de -500 Hz
(Largeur Composition = 1000 Hz)
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
Composition
Superposition des fréquences supérieures à 2000 Hz et inférieures à 3000 Hz avec un ratio de -3 demi-tons et un décalage de -500 Hz
(Largeur Composition = 1000 Hz)
Après compression et décompression par le codec VLC à 8000 bps
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC 8 à 12250 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Son d'Oiseau d'Origine Fréquence d'Echantillonnage de 48 kHz
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
Son de Piano et Voix de Femme d'Origine Fréquence d'Echantillonnage de 48 kHz
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Décalage des fréquences supérieures à 1500 Hz avec un ratio de -8 demi-tons et un décalage de 0 Hz
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
Décalage des fréquences supérieures à 2000 Hz avec un ratio de -8 demi-tons et un décalage de 0 Hz
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Son 1 de Guitare Electrique d'Origine 48 kHz Sampling Rate
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
Son 2 de Guitare Electrique d'Origine 48 kHz Sampling Rate
Cliquez Ici pour Ecouter WAV MP3
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Décalage des fréquences supérieures à 0 Hz avec un ratio de -4 demi-tons et un décalage de 0 Hz
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
Décalage des fréquences supérieures à 0 Hz avec un ratio de -4 demi-tons et un décalage de 0 Hz
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
|
|
Décalage des fréquences supérieures à 0 Hz avec un ratio de +4 demi-tons et un décalage de 0 Hz
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
Décalage des fréquences supérieures à 0 Hz avec un ratio de +4 demi-tons et un décalage de 0 Hz
Après compression et décompression par le codec VLC HQ 48 à 96000 bps
Cliquez Ici pour Ecouter WAV MP3
|
Infographie