Nos travaux mettent en lumière certaines erreurs faites sur la distorsion thermique: certains pensent lutter avec succès contre elle avec de simples montages cascode. Nos mesure montrent que ce circuit ne permet de réduire les phénomènes de mémoire que d'un facteur 10 au mieux (chiffre confirmé par le calcul théorique); nos essais ont montré qu'à ce niveau, ils restaient très audibles. Des circuits spéciaux que nous avons développés permettent une réduction de la distorsion thermique supérieure à un facteur 1000; cette réduction semble nécessaire pour s'affranchir des effets sonore de cet handicap des transistors. D'aucuns proposent de lutter contre la distorsion thermique en soignant le refroidissement des transistors ou en tenant compte de la température du transistor; malheureusement les phénomènes thermoélectriques responsables du phénomène interviennent au niveau des jonctions, au cur des transistors et ces dispositifs qui interviennent au mieux à la périphérie du transistor ne saurait intervenir que sur la mémoire à relativement long terme (à l'échelle du phénomène) alors que celle-ci n'a plus qu'une faible amplitude et que ses effets principaux ont déjà eu lieu. Au pire, ils perturbent le fonctionnement du circuit.
Notre connaissance des phénomènes réellement mis en jeu dans les circuits, associée à une métrologie nouvelle permet, à la grande surprise des audiophiles, la conception de circuits bons à l'écoute sans essais subjectifs préalables. La rationalité est plus efficace que l'empirisme ou la recopie stérile du passé. Cette dernière peut conduire à des erreurs. L'utilisation de tubes électroniques n'est pas un moyen magique pour obtenir des appareils de bonne qualité: il existe même sur le marché des amplificateurs à tube qui ont un son exécrable. La réplique des anciens amplificateurs n'est pas toujours absolument fidèle, et nos études nous rendent sceptiques quant à leur qualité sonore à la suite des quelques évolutions mineures qui ont eu lieu (pour des raisons industrielles ou par zèle maladroit?).
L'entendiez vous ainsi?
En ce qui concerne la psychoacoustique, deux points ont retenu mon attention. Premièrement, la constatation des erreurs de raisonnement auxquelles conduisait, en électronique, l'utilisation, en dehors de leur conditions de validité, des théories de Fourier, m'a conduit à m'interroger sur l'emploi des signaux sinusoidaux en psychoacoustique. Sans être un spécialiste de ce domaine, il m'a semblé qu'il y avait là aussi une tendance à utiliser la sinusoide comme un signal élémentaire permettant de tout analyser, et que cela induisait certaines erreurs par absence de rigueur. L'audition est un phénomène très non-linéaire, déjà au niveau le plus élémentaire et à faible niveau. L'existence d'un seuil de perception est là pour le prouver sans contestation possible.
L'utilisation de signaux sinusoidaux est sans doute justifiée en audiométrie, mais vouloir utiliser ces signaux comme signaux élémentaires pour comprendre la perception auditive est ,à mon sens, une erreur. Je pense que les processus mis en uvre font rapidement intervenir, comme dans la vision, la reconnaissance des formes et que ce traitement (totalement inconscient) est essentiellement non-linéaire. Nous ne ressentons qu'une information recrée sans avoir accès à la perception brute. Ainsi la vision nous présente un monde resynthétisé dans notre champ perceptif, sans que nous ayons conscience des petits mouvements que font nos yeux pour acquérir les informations présentées de manière continue par la vision. Il y a des illusions sonores comme il y a des illusion d'optique. Il devient alors évident qu'on ne peroit pas le monde réel mais son interprétation qui est manifestement erronée dans ces cas-là.
Il y a de nombreux points communs entre les traitements utilisés par la vision et l'audition; il y a beaucoup à apprendre sur l'audition en prenant connaissance des études faites pour la vision. Ces études sont nombreuses. Il est admis que la vision est un processus complexe et on n'utilise pas la notion de signal élémentaire. Pour l'audition, c'est tout le contraire: peu d'études, une conception simpliste de l'audition et beaucoup les sinusoides. Je pense toutefois qu'il y a deux différences essentielles entre l'audition et la vision: d'abord l'audition est prisonnière du temps, l'objet sonore (à quelques exceptions près, souvent des artefacts de la civilisation) n'existe que dans la fugitivité. On ne sait pas s'arrêter sur un son. Les moyens d'enregistrement permettent de revenir sur un son, de le répéter, pas de le figer. Le jugement porté sur un son fait forcement intervenir la mémoire, un son peru dans sa durée est aussi un souvenir. Le second point qu'il me semble important de noter est que l'audition intervient dans notre cerveau à un niveau plus élémentaire: La vision semble plus proche du rationnel, de l'intelligence, l'audition plus proche de l'affectif. Le son sait mieux nous émouvoir, c'est la raison d'être de la musique (et de la reproduction électroacoustique).
En second, je crains qu'il ne faille revoir ce qui a été dit sur la perception de la distorsion, car les études faites sur la perception de la distorsion pour les signaux non-sinusoidaux, sont entachées des erreurs des mesures traditionnelles de la distorsion non-linéaire. Notre meilleure compréhension des phénomènes de distorsion, nos appareils de mesure originaux et nos propres expériences nous autorisent probablement une appréhension de ce problème plus conforme à la réalité.
La perception de la distorsion n'est pas un problème simple et sa complexité est encore accrue si on veut traiter non seulement le peru mais aussi le ressenti. Ceux qui auraient voulu que ce problème soit simplement linéaire et qu'il suffise d'ajouter les effets des perceptions des différentes distorsions pour obtenir la perception globale vont être déus. En effet, ce serait si simple s'il suffisait d'ajouter les valeurs des distorsions des éléments d'une chaîne pour obtenir un chiffre correspondant bien au jugement global subjectif!
Je crains que ce ne soit plus compliqué. D'abord, la distorsion est pluriforme, il y a plusieurs types de distorsion avec leurs effets propres et leurs interactions entre elles. Une quantification commune à tous les types de distorsions n'est pas évidente. Traditionnellement, on utilise l'énergie des signaux pour la quantification de la distorsion. Cette approche n'est pas satisfaisante car elle considère que l'audition travaille principalement sur des niveaux d'énergie. Je pense que l'oreille travaille plutôt sur de l'information et que la nuisance des distorsions s'exprimerait en accroissement de l'entropie plutôt qu'en énergie: l'oreille sait apprendre et saura gérer une déformation réversible (par apprentissage) qui modifie l'information sans en détruire une partie; au contraire elle aura du mal à démêler les effets conjugués de plusieurs distorsions, car difficilement réversibles.
Ensuite la perception de la distorsion est hautement non-linéaire avec des effets de seuils et des effets de masques. L'audition ne se réduit pas à une analyse spectrale mécanique. C'est un processus mettant en uvre des traitements complexes, intelligents, qui savent "apprendre" et reconnaître. Heureusement ces traitements sont inconscients. On ne prend connaissance que d'une partie leurs résultats (les effets subliminaux, bien connus pour la vision, existent aussi pour l'audition et montrent les limites du champ de la conscience dans la perception). Ces traitements consomment de l'énergie et si ils font trop fonctionner la machine nerveuse, ils fatiguent. Trop de distorsion rend l'écoute d'une chaîne fatiguante, c'est un signe qui ne trompe pas.
Cette perception non-linéaire se traduit par deux seuils importants: en dessous du premier seuil, la distorsion est réversible, elle reste inconsciente. Au dessus de ce seuil la distorsion n'est perue que comme une modification de la perception plus ou moins évidente; l'objet sonore recréé dans notre champ perceptif est modifié mais sa fugacité rend cette modification discrète. Au delà du second seuil, on peroit un son désagréable, l'objet sonore est peru comme fortement déforme ou mutilé par un son qui lui semble extérieur; cette sensation est nettement reconnue et souvent prise comme étant la seule distorsion perue.
La tolérance de l'oreille à la distorsion et ses limites, qui se manifestent dans ces deux seuils, correspondent à la capacité des traitements mis en jeu, à construire (en temps réel) à partir des informations brutes et entachées de nombreuses erreurs (y compris celle du capteur) et d'informations contenues en mémoire ou provenant des autres sens, un objet sonore satisfaisant ou non. Ces traitements sont peu affectés par une seule distorsion, alors que la combinaison de deux distorsions aura des effets que n'auront aucune des distorsions seules. Une distorsion seule restera inconsciente, alors qu'elle sera rendue perceptible par la présence d'une autre. En plus de cet effet d'émergence, on constate aussi des effets de masque. Dans ce cas, une distorsion supplémentaire en masque une autre ou en atténue les effets (une tache se remarque plus sur une veste neuve, elle attirera plus l'il, elle choquera plus; sur une veste plus fatiguée, elle peut passer inaperue). La conséquence de ces phénomènes de masque et d'émergence est que, dans un certain contexte, une distorsion ne s'entendra pas, alors que dans d'autres cas elle s'entendra nettement. C'est une des grandes difficulté rencontrées par les analyses faites à l'oreille
Perception des différentes distorsions
Nous classons les distorsions en trois types qui sont par ordre de nocivité croissante:
- Les distorsions de type mécanique : Ce sont les distorsions linéaires comme celle produites mécaniquement auxquelles notre oreille est constamment confrontée dans la vie normale. Par exemple, les différentes fréquences des signaux provenant d'une source sonore présentent de grandes variations d'amplitude en fonction de la position de nos oreilles. L'oreille sait parfaitement gérer cela et présente à notre conscience le même objet sonore pour peu qu'il soit connu et présent dans sa base de données. Elle gère ainsi les distorsions générés par les locaux qui ne sont perues comme telles que lorsqu'elles sont très importantes ou qu'elles font intervenir des résonances ou des échos (problème bien connu des salles de spectacle lié à leur grande taille), c'est à dire des distorsion temporelles peu réversibles.
C'est pour cela qu'ajouter, dans une enceinte, une résonance dans le bas du spectre pour obtenir une courbe de réponse jugée plus linéaire aux mesure sinusoidales est ressenti de manière négative; l'enceinte perd en neutralité et fait toujours le même "boum-boum" quand la zone de fréquence concernée est sollicitée par le signal.
Les distorsions générés par les locaux dont nous n'avons guère conscience, sont bien connues des preneurs de son; ils savent que le placement des micros a une influence sur le son qu'on ne souponne pas en déplaant nos oreilles. C'est un problème parce qu'il semble que l'oreille ne sache assez bien gérer qu'une seule cause de distorsion linéaire. En reproduction sonore, elle doit gérer l'univers de la prise de son, les enceintes et sa position dans le local d'écoute. Selon les configurations cela se passe plus ou moins bien et engendre des problèmes connus.
- Les distorsions électronique analogiques : Ce sont la distorsion non-linéaire classique correspondant à une fonction de transfert stable, la distorsion de mémoire on encore les filtrages trop raides. A part la saturation répétée ou mal maîtrisée, on franchi rarement le second seuil de perception. Entre les deux seuils, les modifications du signal sonore sont perues de plusieurs manières:
- disparition de détails (le système auditif ne sait plus interpréter une partie des signaux reus, ceux-ci disparaissent du champ perceptif, les détails sont gommés). La note de violon est toujours perue comme une note de violon, mais les petites modulations liées au jeu de l'archet se fondent dans une valeur moyenne. Le trait est plus gros et peut sembler plus riche et donner l'impression qu'il y a plus de matière sonore.
- réduction du relief. Les sons semblent issus d'un univers plus restreint, on perd une certaine profondeur de l'espace sonore. Les extinctions des notes sont abrégés.
- modification du timbre. l'oreille a l'impression que la balance tonale est modifiée, que telle ou telle partie du spectre est atténué ou renforcée.
- modification du rythme, disparition des nuances ( probablement lié à l'accroissement des temps de traitement dans un contexte temps réel, le signal est plus difficile à reconnaître). Ce point est très critique pour la reproduction musical car ces nuances sont porteuses d'informations essentielles dans l'interprétation affective du son: le musicien qui s'exprimait avec ses tripes devient plus philosophe et semble maintenant attendre la pause casse-crote.
- Les distorsions électronique numériques : les traitements numériques du son semblent non seulement engendrer des distorsions de type analogiques, mais celles-ci pouvant avoir un caractère plus agressif et peuvent donner des sons étranges. Ils ont aussi un pouvoir de fatigue important. Nous avons des études en cours sur ce point.
La complexité des effets conjugués de toutes les distorsions font qu'il est très difficile de juger à l'oreille des effets d'une modification d'un circuit, ou du remplacement de l'ensemble des distorsions d'un appareil, par l'ensemble des distorsions d'un autre. Pourtant certains ne s'en tirent pas trop mal, ce sont les Oreilles d'or. Il est possible avec des dons naturels (une oreille sensible et une bonne capacité d'analyse) et beaucoup d'expérience, de ne pas être trop piégés par ses oreilles, mais nombreux sont ceux qui se laissent abuser par leur perception. La difficulté n'est pas d'entendre (je crois que beaucoup entendent beaucoup) mais d'analyser ce qu'on entend, pas ce qu'on ressent.
La manière dont on ressent ce qu'on entend, est très variable. C'est aussi valable pour les effets de la distorsion. Cela fait intervenir la connaissance de l'objet sonore, la culture de l'auditeur, ses options esthétiques et ses choix par confort intellectuel ainsi que sa position psychologique par rapport au message sonore et à son contenu émotionnel. C'est très compliqué. On remarquera que les musiciens sont, ou très exigeants parce qu'ils ont une conscience accru des imperfections de la reproduction sonore (ainsi le grand chef Celibidache considérait que les enregistrements trahissaient son travail musical) ,ou très tolérants et capable de se satisfaire de reproduction de mauvaise qualité, parce qu'ils savent reconstituer les objets sonore; ce qu'il entendent n'est qu'un support qu'il savent très bien compléter sans même bien s'en rendre compte, un peu comme ils entendent la musique en lisant une partition.
La distorsion n'est pas toujours ressentie négativement: elle est souvent appréciée comme un enrichissement par les musiciens qui utilisent l'électronique dans leurs instruments. Certaines personnes aiment écouter leur chaîne hi-fi à un niveau élevé; cela correspond à une gestion de la distorsion de leur amplificateur de puissance; la plupart des amplificateurs distordent et le son varie avec le réglage du niveau. Le niveau utilisé est un compromis entre deux désagréments: à trop fort niveau, la distorsion de la saturation est désagréable, à faible niveau, la distorsion (bien que plus faible) est jugée plus désagréable, le son est peru comme moins riche. Un amplificateur qui ne distord pas délivre un son qui ne varie pas avec le réglage de niveau, on ne ressent pas le besoin de pousser le niveau et toutes les nuances restent audibles à faible niveau.
Le son des tubes (une distorsion harmonique assez élevée combinée à une distorsion de mémoire faible, pour les meilleurs d'entre eux: les circuits mono-triode) correspond à une distorsion dominante agréable qui masque les autres. Ils engendre un univers sonore un peu flou, ressenti comme chaud, cotonneux, simple, rassurant. Il peut être jugé comme musical car ce flou devient un espace de liberté qui permet de mieux ressentir l'objet sonore comme on aime qu'il soit.
Quand on veut améliorer la qualité de la reproduction musicale, je pense qu'il faut rechercher la distorsion minimale. Il ne faut pas chercher à compenser (par exemple, favoriser une distorsion qui anesthésie la musique pour moins ressentir une distorsion qui donne l'impression d'accélérer le jeu). Cette stratégie peut donner l'impression d'une amélioration, mais elle atteint rapidement ses limites (on ne peut plus améliorer la chaîne de reproduction) et conduit à une écoute qui fatigue. Il ne faut pas, non plus, rechercher une distorsion agréable qui simplifie les choses en douceur.
La qualité en hi-fi, c'est un peu comme sa place dans la salle de concert; une mauvaise reproduction qui fait perdre des informations correspond aux mauvaises places où on entend moins bien, d'où on repart un peu fatigué d'avoir tendu l'oreille. Une très bonne reproduction correspond aux meilleurs places, on entend plus de choses. Certes, entendre dans un disque ou au concert la mécanique du piano ou les grincements des chaises, ce n'est pas important, mais tout entendre cela veut aussi dire entendre tous les instruments que le compositeurs a voulu, cela veut dire entendre les moindre nuances du jeu des artistes, profiter de ce qui fait un grand interprète. Cela est important pour la valeur artistique, pour l'émotion ressentie pour Celibidache, c'était capital!
Je ne pense pas qu'une chaîne puisse être trop fidèle, donner trop d'informations. Une chaîne qui distord modifie le contenu du signal sonore, altère le message musical que le preneur de son a capturé, trahit le contenu émotionnel, éloigne des interprète. Une chaîne doit être la meilleure possible, même si certains disques doivent en souffrir parce qu'ils montrerons alors toutes leurs faiblesses. Si ils ont un réel contenu artistique, il ne peuvent rien gagner au flou d'une mauvaise reproduction, au contraire ce maquillage qui peut donner une impression favorable leur fait perdre un peu de leur âme. En hi-fi, la technique doit servir la musique.