Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Les Cahiers de l'ACME

Une équipe de chercheurs de l’Université de Rochester (USA) invente une technologie de reproduction du son par modélisation physique 1.000 fois plus économique que le MP3

9 Avril 2008, 14:52pm

Publié par Vinciane Baudoux

Attention : malgré la date de publication du communiqué officiel qui l'annonçait - le mercredi 1er avril en l'occurence - et malgré son caractère spectaculaire, l'information suivante est absolument authentique ; notre équipe a bien entendu pris soin d'effectuer les vérifications d'usage :

Des chercheurs de l’Université de Rochester (New York, USA) sont parvenus à enregistrer de la musique dans un fichier numérique d’une taille 1.000 fois inférieure à celle d’un fichier MP3 standard contenant la même information.


La musique, un solo de clarinette d’une durée de 20 secondes extrait d’une sonate de Brahms, occupe moins d’1 Ko de stockage numérique. Cette prouesse a été rendue possible grâce à deux innovations : la recréation conjointe, dans un ordinateur, de la modélisation d’une clarinette réelle, et de celle du jeu d’un clarinettiste.

Cet exploit, qui a été annoncé le 1er avril 2008 lors de l’International Conference on Acoustics Speech and Signal Processing à Las Vegas (Californie, USA), n’est pas encore la reproduction parfaite d’une interprétation réelle, mais les chercheurs disent ne plus en être très éloignés.

Le professeur Mark Bocko (c) University of RochesterSelon Mark Bocko (photo (c) University of Rochester), professeur en ingénierie électrique et informatique à l’Université de Rochester et co-inventeur de la nouvelle technologie, « il s’agit pour l’essentiel d’un système de reproduction de la musique à échelle humaine. Les être humains ne peuvent faire bouger leur langue, respirer et mouvoir leurs doigts qu’à une certaine vitesse, donc en théorie il n’est pas vraiment nécessaire d’échantillonner la musique plusieurs milliers de fois par seconde, comme on le fait sur un CD. Je pense que nous avons peut-être trouvé la quantité d’information minimale strictement nécessaire à la reproduction d’un fragment musical. »

Lorsqu’il rejoue la musique, l’ordinateur reproduit littéralement la performance originale, sur base de tout ce qu’il « sait » concernant les clarinettes et le jeu des clarinettistes.
Xiaoxiao Dong et Mark Sterling, deux doctorants travaillant sous l’égide de Mark Bocko, ont collaboré avec lui pour mesurer les paramètres d’une clarinette affectant la production sonore, depuis la variation de la pression de la colonne d’air dans l’embouchure en fonction du doigté employé, jusqu’à la façon dont le son se diffuse depuis l’instrument. Ils ont ensuite programmé un modèle informatique de la clarinette, un instrument virtuel entièrement conçu sur base des mesures acoustiques réalisées dans le monde physique.
L’équipe s’est alors attelée à la tâche de créer un clarinettiste virtuel. Les chercheurs ont modélisé la façon dont le clarinettiste interagit avec son instrument, en tenant compte des doigtés employés, de la force du souffle et de la pression des lèvres, afin de déterminer comment ces paramètres influençaient le son de la clarinette virtuelle.

Ensuite, explique le professeur Bocko, il s’agit de laisser l’ordinateur « écouter » le jeu d’une vraie clarinette pour qu’il déduise et enregistre les différentes actions nécessaires à la création d’un son spécifique. Le son original est alors reproduit en introduisant l’enregistrement des actions de l’instrumentiste dans le modèle informatique.

Clarinette réelle et virtuelle - représentation temporelleReprésentation en 3D du spectre de fréquences de la clarinette réelle et virtuelleActuellement, les résultats obtenus donnent  une reproduction très proche de l’original, même si elle demeure encore imparfaite (illustrations : à gauche, la comparaison de la représentation temporelle en deux dimensions du son originel de la performance réelle avec de la version synthétisée par modélisation de l'extrait musical ; à droite, la représentation en 3D du spectre de fréquences des  clarinettes réelle et modélisée).
Comme l’explique le professeur Bocko, « Nous continuons à travailler, en particulier sur le ‘jeu de langue’, c’est-à-dire sur la façon dont l’interprète touche la anche avec la langue lors de l’attaque des notes dans les passages joués staccato. Dans le cas de musique composée de notes tenues ou liées, le procédé donne d’excellents résultats et il est difficile de distinguer les sons synthétisés des sons originaux. »

Au fur et à mesure que le procédé s’affine, les chercheurs imaginent déjà qu’il sera possible de fournir aux musiciens travaillant sur ordinateur des façons plus intuitives de créer de la musique expressive, en incluant les actions d’un musicien virtuel dans les programmes de synthèse numérique. Et bien que l’appareil vocal humain soit d’une très grande complexité, le Professeur Bocko pense qu’en théorie, la méthode pourrait aussi être appliquée au chant.

Actuellement, le procédé ne permet de « traiter » qu’un seul instrument à la fois, mais une autre équipe de chercheurs du laboratoire de recherche musicale de l’Université de Rochester - en l’occurrence, celle constituée par la chercheuse post-doc Gordana Velikic et par Dave Headlam, professeur de théorie musicale à l’Eastman School of Music, rattachée à l’Université -  a inventé un procédé permettant de séparer les différents instruments présents dans le même mixage ; combinés l’un à l’autre, ces deux procédés pourraient offrir un procédé d’enregistrement extrêmement économique en terme de capacité de stockage numérique.

Le professeur Bocko est convaincu que la qualité de reproduction obtenue va continuer à s’améliorer au fur et à mesure que les mesures acoustiques et les algorithmes de synthèse qui en découlent vont devenir plus précis ; selon lui, le procédé permettrait d’obtenir le taux de compression le plus élevé mathématiquement possible.
Pour lui, la technique d’enregistrement du futur consisterait donc à « reproduire » le jeu des interprètes, plutôt qu’à l’« enregistrer » au sens habituel du terme.

Si vous désirez en savoir plus, vous pouvez télécharger l’article scientifique complet (en anglais) publié le
26 mars dernier par le professeur Bocko et son équipe.

Et pour que vous puissiez juger par vous-même du résultat de cette technique pour le moins innovante, vous pouvez écouter :
- Un extrait de la performance originelle du clarinettiste enregistrée de façon 
« classique »
- Un extrait de la reproduction virtuelle par modélisation de cette performance
[(c) des extraits sonores : University of Rochester ; pour des raisons pratiques, les deux extraits sont présentés ici au format WAV]


Renseignements :
University of Rochester
Jonathan Sherwood
Courriel : jonathan.sherwood@rochester.edu
Tél. : [00 1] (0) 585 273 47 26
Commenter cet article
G
Si ce n'est pas un canular, celà ressemble beaucoup à ce que l'on faisait averc un Mini-Moog des années 80. Les formes d'ondes "triangulaires" de la clarinette et complexes de la cloche étaient alors dans les plus "réalistes"...Presque autant que celles-ci.Quel progrés !!!
Répondre
E
à l'écoute ça ressemble quand même beaucoup à un canular ;)
Répondre