Après avoir réalisé que le marché manquait de véritables réponses impulsionnelles offrant un tracking de spatialisation pour l'audio 3D, nous avons décidé d'expérimenter et de créer la première bibliothèque commerciale de réponses impulsionnelles ambisoniques d'ordre supérieur. Dans cet article, nous vous offrons un aperçu des coulisses de cette aventure.
Microphones :
La première grande question était de savoir quels microphones utiliser. Nous avons testé plusieurs configurations. Concernant l'ambisonie de premier ordre, il existe quelques options (comme l'Oktava MK-4012 par exemple, ou le célèbre Sennheiser Ambeo VR). Lorsque nous avons commencé le projet, nous n'étions pas encore tout à fait sûrs du format dans lequel nous devions enregistrer ces IR. Comme vous le savez peut-être, il existe d'autres formats audio 3D que nous aurions pu utiliser. Bien sûr, nous avons également effectué des tests avec la configuration ORTF 3D de Schoeps, laquelle offrait une très bonne sonorité. Mais aaprès avoir testé ces IR dans un environnement de production, nous avons remarqué la présence d'artefacts sonores que nous n'avons pas pu corriger. De plus, il nous a été impossible de faire correspondre notre travail avec nos pistes de référence (nous y reviendrons plus tard) aussi bien qu'avec une configuration ambisonique. Sans oublier qu'une configuration de microphones plus petite serait plus pratique pour réaliser des IR dans des petits environnements comme des casques, des boîtes ou des voitures. Cependant, le principal problème des microphones ambisoniques était que leur résolution spatiale ne serait pas suffisante pour l'audio 3D. Mais cela n'est vrai que pour le FOA (« First Order Ambisonics » ou ambisonie de premier ordre). Nous avons donc commencé à chercher des options pour des enregistrements HOA (« High Order Ambisonics » ou ambisonie d'ordre supérieur). La liste est plutôt courte.
L'Eigenmike de mhAcoustics nous a finalement donné la flexibilité nécessaire pour cette bibliothèque. Il s'agit d'un réseau de microphones coïncidents avec 32 capsules. Le grand avantage de l'Eigenmike est que si vous enregistrez les 32 capsules (en format A), vous pouvez ensuite calculer de nombreux formats différents. Au bout du compte, vous disposez d'un enregistrement vous permettant d'avoir votre ambisonie 1er - 3ème ordre, mais vous êtes également libre de générer d'autres formats microphoniques, notamment mono, stéréo ou surround. Pour les réponses impulsionnelles stéréo, nous avons utilisé un format ORTF calculé à partir de la source à 32 canaux.
Le résultat avait une sonorité très naturelle et l'Eigenmike a apporté de nombreux avantages pratiques (installation, taille) tout en nous offrant plus de possibilités pour augmenter la résolution spatiale, par rapport aux microphones ambisoniques ordinaires. Même si nous préférons toujours l'ORTF3D à l'ambisonique en général pour les enregistrements surround et VR, l'Eigenmike a été notre choix pour ce projet en particulier.
Sous-marin
Choix de la source sonore :
Si vous voulez enregistrer une réponse impulsionnelle, vous devez exciter l'espace que vous voulez capturer. Nous connaissons tous la méthode consistant à tirer avec un pistolet, comme nous l'avons fait pour notre bibliothèque d'IR d'environnements extérieurs. Cette méthode n'est pas envisageable si vous souhaitez réaliser une session dans une église ou, plus généralement, dans un environnement intérieur. Utiliser ce genre d'impulsion comporte toujours des variables aléatoires naturelles. Le sweep est définitivement quelque chose de plus reproductible et de plus fiable scientifiquement. Vous pouvez également utiliser un signal MLS (Minimum Length Sequence), ce que nous avons aussi testé. En comparaison, le rapport signal/bruit du sweep était bien meilleur.
Ce qui nous amène à l'étape suivante. Les haut-parleurs :
Les premiers critères qui viennent à l'esprit lorsqu'on pense à un haut-parleur approprié pour restituer des réponses impulsionnelles sont a.) la réponse en fréquence et b.) la puissance nécessaire pour exciter des pièces plus grandes.
Au début, nous avons fait quelques essais avec des enceintes omnidirectionnelles. Mais aucune ne répondait à nos besoins. L'une des raisons était la réponse fréquentielle. Le domaine d'application de ce type de haut-parleurs est généralement l'acoustique des bâtiments. La réponse en fréquence ne va que jusqu'à un maximum de 10 kHz, puis chute rapidement. Lorsque nous avons essayé de récupérer ces fréquences en les égalisant en postproduction, nous n'avons pas obtenu la perception spatiale que nous souhaitions. Quel que soit notre choix, nous en sommes toujours revenus à des moniteurs de studio ordinaires. La plupart des lieux enregistrés ont été équipés de Genelec 1030, les autres plus petits de Yamaha HS-50, lesquels sonnaient étonnamment bien. Nous avons également essayé différentes configurations de haut-parleurs et nous avons découvert que les configurations que nous aimions le plus étaient à deux haut-parleurs : l'un pointant vers le réseau de microphones et l'autre à l'opposé. L'ajout d'un haut-parleur orienté à l'opposé du microphone nous a donné un peu plus de profondeur dans la perception spatiale et moins de premières réflexions. Les premières réflexions peuvent facilement être ajoutées en cours d'exécution avec des réverbérations algorithmiques, ce qui aide également à localiser en temps réel des sources sonores dans l'espace. C'est dans cette optique que nous avons d'abord essayé les haut-parleurs omnidirectionnels, mais nous avons trouvé qu'utiliser deux haut-parleurs dans deux directions constituaient la meilleure solution sur le plan sonore et technique.
Haut-parleurs et tunnel
Enregistrement dans un garage
Test de haut-parleurs omnidirectionnels
Dès que nous avons commencé à nous déplacer pour enregistrer les réponses impulsionnelles, nous avons réalisé qu'il n'est pas toujours facile d'avoir accès à une alimentation électrique adéquate. Nous n'y avions pas pensé au départ, car il était prévu d'enregistrer uniquement des IR en environnement intérieur pour cette bibliothèque de réponses impulsionnelles. Mais si vous voulez organiser une session dans un ancien tunnel, vous devez être autonome. Nous nous sommes procuré la Hyundai Portable Power Station HPS-600, laquelle répondait à nos besoins et nous permettait d'alimenter deux haut-parleurs (à haut volume), le microphone, l'interface audio et un MacBook, le tout en restant dans une configuration portative.
Équipement portatif
Assurance qualité :
Il n'existe pas de bonne ni de parfaite réponse impulsionnelle. Le matériel d'enregistrement colore le signal, et la position du(des) haut-parleur(s) et du microphone modifie toujours la perception de la pièce. En ce qui concerne le positionnement, nous avons principalement décidé à l'oreille, en fonction du lieu.
Le processus fastidieux côté logiciel, qui s'est avéré assez long (déconvolution, conversion du format A au format B, importation/exportation des pistes, etc.), a de grandes chances de générer des artefacts sonores indésirables. Dans le pire des cas, cela peut rendre une IR inutilisable. Pour nous assurer de la fiabilité de nos résultats, nous avons enregistré des pistes de référence dans chaque lieu. Ainsi, avant de capturer la réponse impulsionnelle, nous avons toujours joué quatre genres de musique différents (funk, classique, rock, voix) et les avons enregistrés avec le microphone placé exactement dans la même position. Cela nous a permis de comparer ultérieurement notre piste de référence comprenant l'ambiance réelle, à la version simulée d'une convolution avec notre réponse impulsionnelle.
Pour obtenir une bonne réponse impulsionnelle, il faut une certaine distance entre le microphone et le haut-parleur. En effet, il faut éviter autant que possible le son direct du haut-parleur. Nous avons toujours essayé de trouver le meilleur équilibre entre la distance, le gain du micro, le volume du haut-parleur et les murs environnants, afin d'obtenir un bon rapport signal/bruit. Dans la piste de référence originale, il est possible d'entendre ce bruit, mais gardez à l'esprit qu'il y a 32 canaux audio sommés en un signal binaural.
Nous avons ensuite trouvé un moyen d'appliquer simultanément une suppression du bruit sur les 32 canaux des réponses impulsionnelles, ce qui n'était pas si facile au départ. Nous avions donc maintenant nos pistes de référence enregistrées avec du bruit audible, et nous pouvions les comparer avec les enregistrements de référence traités dans une convolution avec la réponse impulsionnelle correspondante. Si nous n'avions pas eu de bruit de fond dans la piste originale, il aurait été assez difficile de distinguer un signal de l'autre. Nous avons procédé à des séances d'écoute à l'aveugle et les suppositions étaient correctes à 50/50. Cela signifie qu'avec notre groupe de test composé de professionnels de l'audio, aucune différence significative n'a été détectée et nous sommes extrêmement satisfaits de nos résultats.
Les lieux :
Notre objectif principal était de capturer des espaces offrant des possibilités de conception sonore immersive créatives, en priorisant majoritairement les jeux vidéo et la postproduction. Même si certains espaces se sont également révélés très appropriés dans des contextes musicaux. Nous avons couvert une large liste d'environnements, comprenant des églises, des tunnels, des couloirs et des lieux du quotidien tels que des cuisines ou des salles de bains. Nous avons également exploré des endroits vraiment atypiques comme un sous-marin, ou des choses plus expérimentales en utilisant des boîtes et des casques.
Pour nous, cela a été une aventure passionnante. Nous espérons que la bibliothèque HOA Impulse Response vous aidera à créer une acoustique convaincante, à rendre vos lieux plus émotionnels et plus crédibles, et peut-être même plus créatifs.
Commentaires