CODER EN WMA, le meilleur des formats audio (tests perso)

CODER EN WMA, le meilleur des formats audio (tests perso) - Traitement Audio - Video & Son

Marsh Posté le 18-03-2006 à 10:36:58    

Vitesse moyenne attribuée en codage VBR 50 et qualité des pistes originelles  
 
Rappelons-le, le mode VBR 50 crée des fichiers dont les fréquences plafond dépassent rarement 14 kHz. Il est néanmoins intéressant de connaître le lien entre la qualité du fichier source et la vitesse de transmission moyenne que le codec applique automatiquement au fichier.  
Nous allons ici analyser chaque bitrate par tranches de 10 kb/s à partir de 40 kb/s. Le lecteur utilisé est Windows Media Série 9 et le système d’exploitation Microsoft Windows XP Professionnel.  
 
§1.      Fichier dont la vitesse de transmission (bitrate) moyenne est < à 40 kb/s  
 
Le fichier d’origine a une qualité médiocre et manque totalement d’effets stéréo. Les aigus dépassent difficilement la barre de 11kHz, alors que les basses peuvent être percutantes.  
 
§2.        Fichier dont le bitrate moyen est compris entre 40 et 49 kb/s  
 
Soit le fichier originel atteint péniblement des fréquences > à 11,5 kHz (les effets stéréo sont alors peu marqués), soit il atteint à peine 12,5 kHz (il y a alors absence d’effets stéréo). Néanmoins, l’inverse peut se produire : pour le premier cas, il peut y avoir absence d’effets stéréo, alors que pour la deuxième hypothèse, ceux-ci peuvent être peu marqués.  
 
§3.      Fichier créé dont le bitrate moyen est compris entre 50 et 59 kb/s  
 
Le fichier source contient un certain nombre de signaux aux alentours de 12 kHz. Parfois, dès l’origine, les basses sont atténuées, créant l’illusion que les aigus sont éclatants. D’ailleurs, en général, les fichiers créés dans cette marge de bitrates accusent un son clair.  
Autre possibilité : le son contient des signaux aux alentours de 13 kHz, mais est monophonique.  
 
§4.      Fichier créé, de vitesse moyenne comprise entre 60 et 69 kb/s  
 
Le fichier source contient un grand nombre de fréquences aux alentours de 12,5 kHz. L’effet stéréo est souvent assez présent. Si le fichier est exceptionnellement monophonique, c’est qu’il contient un maximum de fréquences au-delà de 14 kHz.  
 
§5.      Fichier créé dont la vitesse de transmission moyenne est comprise entre 70 et 79 kb/s  
 
Le morceau original contient beaucoup de fréquences aux alentours de 13 kHz. À cette frange de bitrates, le fichier possède toujours des effets stéréo plus ou moins marqués. De plus, ledit fichier est souvent très peu distant de l’original en termes de qualité d’écoute globale. En mode VBR 50, la gamme de bitrates 70-79 kb/s est optimale.  
 
§6.      Fichier dont le bitrate moyen est compris entre 80 et 89 kb/s  
 
Le fichier source renferme beaucoup d’aigus aux voisinages de 14 kHz et une stéréo assez marquée.  
 
§7.      Fichier dont le bitrate moyen est > à 90 kb/s  
 
Le fichier source est très riche en aigus > à 14 kHz. Il a un son plus éclatant que celui des fichiers codés à la marge de bitrates moyenne 80-89 kb/s. En outre, dans la frange 90 kb/s et au-delà, les effets stéréo sont souvent multiples et prononcés.  
 
§8.      Remarques :  
 
Seront généralement codés à des vitesses au-delà de 80 kb/s :  
 
- Des fichiers source contenant une débauche d’aigus allant jusqu’à créer des déformations sonores.  
 
- Des fichiers contenant beaucoup de bruits de fond (crépitements parfois gênants dus à une mauvaise extraction audio, souffle d’une cassette, parasites divers, …. C’est que les bruits de fond sont chaotiques, donc difficiles à compresser (car peu redondants). Ils contiennent par ailleurs beaucoup d’aigus.  
 
- Des fichiers avec effet surround exagéré nuisant à la qualité globale du morceau. En effet, la stéréo complexifie le codage. Lorsqu’elle est excessive, elle engendre des bruits de fond qui, nous l’avons dit, sont de nature chaotique et riches en aigus (surtout moyens et extrêmes).  
 
- Des fichiers source au volume saturé avec suramplification des basses, des aigus et/ou des bruits de fond. De tels fichiers sont souvent désagréables à l’écoute.  
 
Convertir en WMA selon le type de sources audio  
 
Pourquoi j’ai porté mon choix sur le format WMA ?  
 
- Le MP3 est certes performant dans les hautes vitesses de transmission (> à 128 kb/s), mais est nul dans les bas bitrates (pertes en aigus et déformations sonores permanentes)  
- Le MP3 Pro est très intéressant aux bas bitrates, mais encode avec lenteur et n’est pas très compatible  
- L’OGG VORBIS est très performant dans les basses vitesses, mais manque également de compatibilité  
- Le WMA est à croisée de chemin entre le MP3 et l’OGG, mais marche avec Windows et plusieurs platines de salon, voire avec certains baladeurs, sans adaptation matérielle ou logicielle  
 
Quel lecteur et quel Windows utiliser ?  
 
Je vous recommande de posséder le lecteur Windows Media Série 9 et son codeur. Ces deux programmes se retrouvent gratuitement dans le site de Microsoft depuis début 2003. Comme système d’exploitation, Windows XP (toutes versions) est obligatoire. En effet, certains codecs ne sont accessibles qu’aux possesseurs de cet OS (comme Windows Media Audio Professionnel que nous n’aborderons pas ici, Windows Media Lossless). De plus, le codeur Windows Media Série 9 ne marche qu’avec deux Windows : 2000 (toutes versions) et XP (toutes versions).  
 
§1.    Pour enregistrer de la musique à l’identique de l’original  
 
Utilisez le codec Windows Media sans perte (Lossless), accessible au codeur comme au lecteur Windows Media. Les fichiers créés n’accusent aucune perte par rapport au son d’origine, mais leur taille mémoire est très importante, car le taux de compression est très bas (rapport général de 2 sur 1).  
 
§2.    Pour une qualité de fichier très proche de l’original  
 
Codez vos morceaux en VBR 90 ou en VBR 98, ce qui correspond, dans le lecteur Windows Media, respectivement aux options « Qualité haute » et « Qualité optimale ». VBR 90 code les sons jusque environ 18 kHz, tandis que VBR 98 atteint des fréquences voisines de 20 kHz !  
 
§3.    Pour une qualité assez proche de l’original  
 
Utilisez VBR 75 qui correspond à la « Qualité moyenne » de Windows Media Player, mais à « Bonne qualité audio » au niveau du codeur. Cette option permet au codec d’atteindre des fréquences sonores voisines de 16 kHz, ce qui est bon si l’on vise une qualité proche de celle d’un CD audio sans trop de pertes audibles.  
VBR 75 est un excellent compromis qualité/taille disque dur lorsqu’on possède un disque dur de plus de 30 Go de capacité.  
 
§4.    Pour une qualité légèrement proche de l’original  
Usez de VBR 50 qui correspond à l’option « Qualité moyenne » au niveau du codeur et à « Basse qualité » dans Windows Media Player. Ce mode code à une fréquence musicale plafond voisine de 14 kHz. L’oreille attentive remarquera une baisse assez audible de certains aigus et de certaines basses. La qualité sonore globale correspond à celle d’une cassette audio originale, avec quelques basses en moins.  
VBR 50 convient particulièrement à un archivage courant, surtout lorsqu’on possède un disque dur de 30 Go et moins de capacité.  
 
§5.     Pour le codage des fréquences essentiellement vocales en haute qualité  
 
Utilisez VBR 10, option uniquement accessible au niveau du codeur. Ce mode atteint péniblement des fréquences de 10 kHz, mais peut reproduire assez correctement les fréquences au-delà du strict spectre vocal sans trop de déformations audibles, là où le MP3 sonne vraiment creux et code en mono.  
VBR 10 convient parfaitement aux enregistrements dans lesquels la voix est prédominante, mais où néanmoins la musique se retrouve occasionnellement. Ex : le journal de RFI.  
 
§6.     Pour coder uniquement des fréquences vocales  
 
Je vous propose deux modes de codage : Windows Media Audio Voice à 20 kb/s et WMA CBR à 20 kb/s. Les deux modes codent en mono.  
Windows Media Audio Voice code plus nettement la voix, mais engendre beaucoup d’effets de résonance. WMA CBR à 20 kb/s produit une voix moins éclatante, mais aussi moins déformée par la résonance. Les deux options codent des fréquences inférieures à 7 kHz et conviennent au codage de la voix seule.  
Notons que WMA à 20 kb/s est plus compatible que Windows Media Audio Voice. L’un comme l’autre ne sont accessibles qu’à partir du codeur.  
 
Coder des fichiers son déjà compressés  
 
§1.     Compression du fichier à un bitrate inférieur à son bitrate d’origine  
 
Pour éviter une dégradation trop audible de qualité, le fichier d’origine doit avoir un bitrate (vitesse de transmission) d’au moins 128 kb/s. Si le fichier d’origine a un bitrate plus bas, sa compression à une vitesse de transmission inférieure à son bitrate donnera des résultats décevants (pertes audibles des aigus et des basses, avec parfois effets de résonance).  
Une dégradation de qualité audio peut également se faire ressentir lorsque le fichier est compressé à un bitrate non pas inférieur, mais égal à son bitrate d’origine, si ledit bitrate est inférieur à 192 kb/s.  
 
§2.     Compression du fichier à un bitrate supérieur à son bitrate d’origine  
 
Cette opération, ne vous y trompez pas, n’améliore aucunement la qualité du fichier source. En effet, toute compression audio (même celle dite sans perte de qualité) a pour effet de supprimer les fréquences dites inutiles, surtout les hautes fréquences. Or, il demeure des hautes fréquences résiduelles même après compression. Lorsqu’un tel fichier est de nouveau compressé à bitrate plus élevé, les hautes fréquences vestiges peuvent être définitivement perdues, ainsi que certaines basses fréquences. La perte de qualité est parfois audible, mais de manière moins prononcée que dans le §1.  
Ainsi, un codage à bitrate plus élevé dégrade la qualité du fichier. À la rigueur, la compression sans perte conservera la qualité du fichier, mais ne pourra pas l’améliorer.  
Par « hautes fréquences résiduelles », j’entends ici celles qui, pour un mode de codage donné, se retrouvent comme « par accident » dans le fichier résultat de la compression. Ex : si, en mode VBR 50, il subsiste des fréquences supérieures à 14 kHz.  

Reply

Marsh Posté le 18-03-2006 à 10:36:58   

Reply

Marsh Posté le 18-03-2006 à 12:56:14    

wma imperator a écrit :

En effet, toute compression audio (même celle dite sans perte de qualité) a pour effet de supprimer les fréquences dites inutiles, surtout les hautes fréquences.


 :heink:  
Hmm le principe du "lossless" est d'appliquer une compression classique de données avec des routines de calcul optimisées pour l'audio (vraiment pour simplifier), et non pas une compression visant à perdre du signal. Je n'ai jamais entendu parler de "rabotage sauvage" de fréquences mais bien d'une restitution à l'identique après compression-décompression.. Il n'est nullement question de gagner ou perdre en qualité (ni en gagner d'ailleurs effectivement) vu que le checksum total du fichier avant compression sera identique à celui après compression/décompression.
Tu est sûr de toi sur ce coup la ? (sinon, sources... ) ;)  
http://en.wikipedia.org/wiki/Audio [...] ompression
 
le principe (utilisé notamment par FLAC)
http://en.wikipedia.org/wiki/Linear_prediction
http://en.wikipedia.org/wiki/Golomb_coding
 
 
Sinon l'initiative des tests est toujours à encourager, mais pourtq'un test d'audition soit parfait (impossible), il faudrait mentionner le type d'écoutes utilisées, les conditions d'écoute (acoustique de la pièce etc...), le temps d'écoute, et SURTOUT le matériel utilisé pour le test (enregistrement symphonique, cris d'animaux communément appelé trash métal, pop, musique electro-acoustique... ?)... Ensuite bien entendu, des graphes à l'oscillo représentent un "plus" incontestable, ce que l'on appelle communément des "spectrogrammes".
 
Simplement parceque:
1) l'oreille humaine se fatigue comme n'importe quel autre organe,  
2) le son que l'humain percoit est composé en trés grande partie des diffractions et réfractions de l'environnement d'écoute, sa position par rapport aux transducteurs, vertical et horizontale, et surtout conditionné par la capacité de son oreille à réagir aux différentes fréquences, ce qui est un facteur pour le moins trés trés variable. Selon la nature des matériaux originaires de ces réfractions (murs, fenêtres...), les fréquences se trouvent atténuées, absorbées, amplifiées... faussant de plus une écoute objective du signal "pur".  
3) la réponse en fréquence des transducteurs peut colorer le signal énormément, et fausser toute étude. un MP3 semblant de mauvaise qualité sur une chaîne hifi pourrait s'avérer trés agréable sur un système de monitoring studio par exemple. Tout celà bien sur pour minimiser au maximum,et surtout relativiser, la subjectivité de tels tests d'écoute.


Message édité par angturil le 18-03-2006 à 13:22:06
Reply

Marsh Posté le 18-03-2006 à 15:05:20    

Reply

Marsh Posté le 18-03-2006 à 18:06:53    

Non non j'insiste.. "Trash" comme déchet ;)
(ceci dit tu as raison il y a bien une faute dans ce que j'avais ecrit)

Reply

Marsh Posté le 18-03-2006 à 19:37:25    


J'ai pas envie de faire une mauvaise propagande du format Lossless de Microsoft, mais j'ai pu effectuer un test avec Audacity. WMA lossless est bel et bien d'un codec qui supprime les très hautes fréquences, même si, à l'audition, il n'y paraît guère. Je m'explique:
 
- Demandez à audacity de generer un son de 20 kHz
- Enregistrez ce son au format Wav, 48 kHz, Stéréo, histoire de conserver la qualité (à ce taux, en effet, le Wave n'occasionne pas de perte même fréquentielles)
-Visualisez le spectre du son créé, en poussant le FFt jusque 20 Khz et en gardant ledit spectre en mémoire (par exemple en effectuant une capture d'écran)
- Codez le fichier en WMa lossless à l'aide d'un convertisseur
-Reencodez le fichier Lossless en Wav et ouvrez-le avec Audacity
-Demandez à Audacity de visualiser le spectre sonore en poussant la limite à 20 kHz. vous verrez des troncatures patentes de signal, comparativement au premier spectre du fichier Wave original.
 
Je vous enverrai des captures d'écran bientôt...
 

Reply

Marsh Posté le 19-03-2006 à 11:15:45    

Citation :

- Le MP3 est certes performant dans les hautes vitesses de transmission (> à 128 kb/s), mais est nul dans les bas bitrates (pertes en aigus et déformations sonores permanentes)  


Teste donc à 96kbps, tu pourrais être surpris...

Reply

Marsh Posté le 19-03-2006 à 20:00:00    

Je confirme : le MP3 à 96 kb/s a un son fort amputé en aigus, même en Lame 3.98. De plus, la métallisation du son en écoute avec casque est presque effrayante...

Reply

Marsh Posté le 19-03-2006 à 22:15:22    

Tu trouves le mp3 (Lame) metallique à 96kbps et pas le wma? C'est assez inhabituel.

Reply

Marsh Posté le 19-03-2006 à 23:13:31    

Je suis toujours surpris de voir comment certains se focalisent sur une voie et une seule, proclament haut et fort que leur choix est le meilleurs, quitte à diaboliser les autres (pas trop encore ici).
 
Bref, que tu trouves le WMA correspondant à tes gouts, soit. Mais de là à dire que c'est le meilleur des formats audio qd tous les tests comparatifs sérieux (comme par ex ceux de Roberto: http://www.rjamorim.com/test/ ) ont plutot tendance à le mettre en queue de peloton. Mais il s'agit là seulement de la qualité audio.
 
A bas débit, bien que cela ne soit pas le meilleur en qualité, le WMA garde l'énorme avantage de la compatibilité, notamment sur les baladeurs.
 
Tu devrais donc AMHA renommer ton topic pour que le titre soit plus précis.
 
Pour ma part, je refuse de faire du WMA, mais plus pour des raisons idéologiques. J'aimerais que Microsoft envahissent le moins possible le monde de l'audio-video. L'excellence marketing de MS me fait peur quant à nos libertés.
Je préfère donc le MPC en HQ (~ 200k) et le MP3@128k pour mon baladeur.
Cela étant, chacun emploie le format qu'il préfère.

Reply

Marsh Posté le 21-03-2006 à 08:30:19    

wma imperator a écrit :

Je confirme : le MP3 à 96 kb/s a un son fort amputé en aigus, même en Lame 3.98. De plus, la métallisation du son en écoute avec casque est presque effrayante...


Constat intéressant, mais peu étayé. Quels échantillons, et combien ? Quelles conditions de tests : aveugle, pas aveugle, ABX ? Tu peux t'inspirer de ce test pour une évaluation plus rigoureuse des formats audios.
Personnellement, je trouve MP3 et WMA forts contrastés à ce débit : souvent moyens, parfois bons et parfois mauvais. Ce qui réussit à l'un peut être le talon d'achille de l'autre : d'où la nécessité de varier au maximum le type d'échantillons.

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed