Le son est le premier facteur d’immersion

6 juin 2026. Publié par Benoît Labourdette.
  10 min
 |  Télécharger en PDF

On associe l’immersion à l’image qui nous entoure, à l’écran sphérique, au casque. Je défends ici l’idée inverse, et je la déroule à travers une histoire de l’immersion prise par l’angle du son, des panoramas du XVIIIe siècle au Dolby, en passant par les penseur·euses du son et par mes propres ateliers. C’est le son qui nous immerge, et c’est par lui qu’il faut commencer, du côté du public comme du côté de celles et ceux qui créent.

Devant l’image, dans le son

Quand on entre dans une salle de cinéma, on s’assoit face à un écran qui se trouve à une certaine distance, dans un certain cadre, et quelle que soit sa taille on reste devant lui. Le son, lui, ne se tient pas devant nous. Il vient de partout, il occupe le volume de la salle, il nous prend de toutes parts sans nous laisser de position extérieure. On peut détourner les yeux de l’écran, on ne peut pas détourner les oreilles. C’est le son qui fait qu’on est dedans, et non devant.

Cette idée est nourrie de ma pratique de cinéaste et de pédagogue, où je constate, atelier après atelier, que le travail du son décide pour une large part si une œuvre nous prend ou nous laisse dehors. L’industrie du cinéma le sait d’ailleurs depuis longtemps, puisque toute l’histoire technique des salles, j’y reviendrai, n’a pas eu d’autre objet que de construire cette immersion par les oreilles, bien plus efficacement qu’on n’a jamais su le faire par les yeux dans une salle ordinaire.

Entrer dans la salle les yeux fermés

C’est pourquoi, quand j’anime un atelier sur l’immersion, je commence souvent par le son, et parfois littéralement les yeux fermés. Lors d’une séance avec des enseignant·es, avant de les faire entrer dans la salle obscure, je leur ai demandé de fermer les yeux et je les ai guidé·es par la main. « L’immersion, c’est d’abord le son », leur ai-je expliqué, « parce que le son, on est toujours immergé dedans ». Entrer dans l’immersion par l’oreille, et non par l’œil, déplace d’emblée la manière dont on comprend ce dont il s’agit.

Cette approche rejoint les travaux de Michel Chion sur l’audio-vision, où le son n’est pas un accompagnement de l’image mais participe pleinement à la construction de l’espace. Ce qu’on croit voir, on l’entend autant qu’on le voit, le son façonne la profondeur, la matière, la présence de ce qui est à l’écran. Faire éprouver l’immersion sonore avant toute image, c’est prendre cette idée au sérieux, et la faire vivre plutôt que l’énoncer.

Filmer par sa fenêtre en racontant un souvenir

La distinction que je trace ici entre l’image et le son est en réalité assez technique, et même un peu fausse au regard de ce qui se passe dans le cerveau. Nous recevons d’un côté de la lumière, que l’œil convertit en influx électriques le long du nerf optique, et de l’autre des variations de pression de l’air, que l’oreille interne convertit elle aussi en signaux électriques. Mais les deux domaines ne cessent de communiquer. On voit une image et elle fait un son dans la tête, on écoute quelqu’un·e raconter et on voit ce qu’il ou elle raconte. Des images naissent du son, des sons naissent des images, et ce que nous percevons est toujours un mélange des deux.

J’en ai fait l’expérience avec des milliers de films. Depuis 2009, je propose à des personnes de filmer ce qu’elles voient par une fenêtre de chez elles, une image à peu près fixe où il ne se passe presque rien, en racontant pendant ce temps un souvenir important qu’elles ont envie de partager. De cette consigne est née en 2020, pendant le premier confinement, la plateforme « Par ma fenêtre ». Comme il n’y a pas grand-chose à voir à l’écran, les images qui se forment dans notre tête quand on regarde ces films viennent de la voix, et non de l’image. On voit beaucoup d’images en les regardant, mais ce ne sont pas celles qui sont à l’écran. Et ce qui m’étonne toujours, c’est qu’il se passe quand même de petites choses dans l’image, un oiseau qui traverse, un arbre qui bouge, à des instants d’une justesse troublante par rapport au récit. Ce qui immerge, dans ces films, tient moins à l’image qu’à ce que la voix fait naître en nous, et à la rencontre des deux.

Le panorama avait un siècle d’avance sur le cinématographe

L’histoire des spectacles éclaire cette inversion des priorités, parce que l’immersion n’a pas attendu le cinéma. En 1787, le peintre Robert Barker dépose un brevet pour le panorama, une rotonde où les spectateur·rices, placé·es au centre sur une plateforme, sont entouré·es d’une immense toile peinte circulaire dont les bords leur sont cachés, si bien qu’ils et elles ne voient plus que la baie de Naples ou la bataille représentée. En 1798, Étienne-Gaspard Robert, dit Robertson, installe ses fantasmagories dans une chapelle désaffectée de Paris, où des projections de lanterne magique sur des écrans de fumée, accompagnées de bruits dans l’obscurité totale, font surgir des spectres au milieu du public. En 1822, Daguerre ouvre son diorama, où des toiles gigantesques changent d’aspect sous des jeux de lumière. Tout le XIXe siècle a ainsi fabriqué des dispositifs d’immersion visuelle, qui furent des spectacles de masse.

Quand le cinématographe arrive en 1895, il propose tout autre chose, un cadre, un écran plat, une image frontale qu’on regarde depuis sa chaise, et le plus souvent sans aucun son lié aux images, juste un peu de musique, ou le commentaire d’un·e bonimenteur·euse à côté. Du point de vue de l’immersion, c’est un net recul par rapport au panorama. Et pourtant le cinéma a enterré ces anciens dispositifs immersifs, pour une raison qui tient à ce qu’André Bazin a nommé, en 1945, l’ontologie de l’image photographique. L’image cinématographique est un enregistrement mécanique du réel, la trace de quelque chose qui s’est vraiment trouvé devant l’objectif, et qui se donne comme telle. On aurait pu, à ce titre, appeler le cinématographe réalité virtuelle, puisqu’il nous met en présence d’une trace du monde. Il y a là quelque chose qui défie la mort, le mouvement de la vie dont la trace peut être répétée indéfiniment, et cette fascination a suffi à mettre l’immersion de côté pour longtemps. L’enveloppement du public, le cinéma ne l’a reconquis que bien plus tard, et il l’a reconquis par le son.

Des projections foraines jamais silencieuses

Cette reconquête commence par un fait que l’historiographie a longtemps masqué, le cinéma dit muet n’a jamais été silencieux. Martin Barnier, dans « Bruits, cris, musiques de films. Les projections avant 1914 » (Presses universitaires de Rennes, 2010), reconstitue l’environnement sonore des premières projections, et c’est un vacarme. Sur les champs de foire, les machines à vapeur qui produisent l’électricité vrombissent à côté de la tente, les bonimenteur·euses crient pour attirer le public, et à l’intérieur les bruiteur·euses, les conférencier·ères, les chanteur·euses, les orchestres de toutes tailles rivalisent avec les applaudissements, les huées et les commentaires des spectateur·rices. Le public de la Belle Époque baignait dans le son, et chaque séance avait son propre paysage sonore, à chaque fois unique. L’arrivée du parlant en 1927 fixe ce foisonnement sur la pellicule, mais en mono, sur un seul haut-parleur derrière l’écran, et l’histoire du son en salle devient alors celle d’une lente reconquête de l’espace.

Le coup stratégique du Dolby Stereo

Cette reconquête s’accélère sous la pression de la télévision. Dans les années 1950, à mesure que le petit écran entre dans les foyers et vide les salles, l’industrie cherche à offrir ce que la télévision ne peut pas donner, et invente l’écran large associé à un son multicanal, le Cinerama en 1952, le CinemaScope en 1953 avec ses pistes magnétiques. Mais le son magnétique coûte cher à installer, et la plupart des salles dans le monde y renoncent et reviennent au son optique mono. C’est là qu’intervient Ray Dolby, dont l’invention première était la réduction du bruit de fond des enregistrements magnétiques. Appliquée au cinéma, son ingéniosité tient en un point décisif, le Dolby Stereo fait tenir quatre canaux, gauche, centre, droite et surround, à l’emplacement de l’unique piste optique mono, par un encodage que vient déplier un simple décodeur posé sur le projecteur. La même copie se projette en mono dans une salle non équipée, et se déploie en son enveloppant dès qu’une salle a installé le décodeur et les enceintes. Les exploitant·es peuvent donc passer au spectacle immersif progressivement, sans investissement massif et sans changer de copies.

« A Star Is Born » inaugure ce procédé en 1976, mais c’est « Star Wars », en 1977, qui crée la demande. Pour la première fois dans une salle ordinaire, le vaisseau passe au-dessus des têtes, le son se déplace dans la salle et enveloppe le public, et les exploitant·es convertissent leurs salles pour pouvoir projeter le film dans ces conditions. On comptait une poignée de salles équipées à la sortie du film, et six mille dans le monde en moins de dix ans. Le Dolby numérique 5.1 prolonge le mouvement à partir de 1992, jusqu’aux dizaines de canaux des systèmes actuels. Ce qui a fait revenir le public, et le fait encore, c’est en grande partie cette immersion par les oreilles, et l’on retrouve la même logique dans le succès des expériences immersives d’aujourd’hui, où la promesse d’être enveloppé suffit souvent à attirer, indépendamment de la valeur artistique de ce qu’on y vit.

Être dans la musique, avec Günther Anders

Les philosophes du son donnent des mots à cette expérience. Au tout début des années 1930, le jeune Günther Anders, formé par Husserl et passé par la musique, rédige des recherches sur les « situations musicales » qui resteront inédites de son vivant et qui ont été publiées en français sous le titre « Phénoménologie de l’écoute » (Éditions de la Philharmonie de Paris, 2020). Anders y décrit ce qui distingue l’expérience musicale de la contemplation d’un tableau. Devant un tableau, je reste un sujet face à un objet, je peux m’approcher ou m’éloigner, prendre mon temps. Dans la musique, ce face-à-face se défait, celle ou celui qui écoute se trouve dans la musique, emporté·e par son temps, transformé·e dans son état même. Anders s’intéresse à cette transformation de l’être dans l’écoute, et c’est, il me semble, la description la plus juste de ce que j’appelle ici immersion. On n’est pas devant le son comme devant une image, on est dedans, et ce dedans nous modifie.

L’objet sonore de Schaeffer et la couleur du son d’Adorno

Pierre Schaeffer, dans son « Traité des objets musicaux » (1966), apporte un autre outil, l’écoute acousmatique. Le mot vient des disciples de Pythagore, qui écoutaient l’enseignement du maître caché derrière une tenture, et Schaeffer le reprend pour nommer la situation devenue ordinaire avec la radio et l’enregistrement, entendre un son sans voir ce qui le produit. Détaché de sa source, le son devient un objet sonore qu’on peut écouter pour lui-même, pour son grain et sa matière, ce que Schaeffer appelle l’écoute réduite. Les œuvres immersives vivent presque entièrement dans ce régime acousmatique, les sources y sont invisibles, et c’est l’une des raisons, je crois, de leur puissance, un son sans origine visible n’est localisé nulle part, donc il est partout.

Theodor W. Adorno, de son côté, a consacré ses derniers cours de Darmstadt, en 1966, à ce que l’allemand nomme Klangfarbe, la couleur du son, c’est-à-dire le timbre. Ces textes, réunis en français dans « La fonction de la couleur dans la musique » (Contrechamps, 2021), suivent l’émancipation progressive du timbre, longtemps tenu pour un habillage des hauteurs et des harmonies, jusqu’à devenir au XXe siècle un matériau de construction à part entière. Cette pensée du timbre rejoint directement ma pratique. Quand je compose ma caisse d’instruments pour un atelier, kalimbas, guiro, triangle, métallophones, je ne choisis pas des notes, je choisis des couleurs sonores, et c’est par leurs timbres que les participant·es fabriquent le climat d’une scène, joyeux ou inquiétant.

La mise en garde de Jonathan Sterne

Il faut pourtant se garder d’en faire une métaphysique des sens. Jonathan Sterne, dans « Une histoire de la modernité sonore » (La Découverte, 2015, traduction de « The Audible Past », 2003), a montré que l’opposition entre une ouïe qui serait par nature immersive et subjective, et une vision qui serait par nature distante et objective, est une litanie héritée de sources notamment théologiques, récitée de livre en livre sans avoir jamais été vraiment questionnée. Je prends cette mise en garde au sérieux. Ce que je défends ici ne porte pas sur une essence éternelle de l’oreille, mais sur des dispositifs concrets et sur des pratiques, un écran cadre et tient à distance, des haut-parleurs entourent et enveloppent, et dans l’état actuel de nos techniques et de nos usages, c’est le son qui accomplit l’immersion que l’image promet. Mon constat est situé dans cet état des techniques, et il pourra évoluer avec lui.

Muzak, ou la face politique de l’immersion sonore

Cette puissance du son a aussi une histoire politique, qu’il serait imprudent d’ignorer. Juliette Volcler, dans « Contrôle. Comment s’inventa l’art de la manipulation sonore » (La Découverte, 2017), retrace le parcours d’Harold Burris-Meyer, ingénieur du son américain presque oublié. Burris-Meyer commence dans les années 1930 par le théâtre, où il expérimente des dispositifs sonores destinés à intensifier les émotions du public, jusqu’à chercher à provoquer des réactions collectives, parfois à l’aide d’infrasons qui mettent les spectateur·rices en émoi sans qu’ils et elles en devinent la cause. L’industrie prend ensuite le relais, et Burris-Meyer devient vice-président de la société Muzak, qui diffuse dans les usines des programmes musicaux conçus pour soutenir les cadences de production, puis dans les boutiques des ambiances destinées à orienter les comportements d’achat, une musique faite pour être entendue sans être écoutée. La guerre enfin réquisitionne ces savoir-faire, leurres sonores et harcèlement acoustique.

Si le son se prête si bien à la manipulation, c’est pour la raison même qui en fait le premier facteur d’immersion, on ne peut pas s’en abstraire, et il agit sur le corps avant d’arriver à la conscience. Cette histoire donne au travail du son un enjeu d’éducation critique, qui me semble inséparable de l’enjeu créatif. Apprendre à fabriquer une ambiance sonore, c’est aussi apprendre à reconnaître celles qu’on nous fabrique, dans les boutiques comme dans les films.

Le cerveau mélomane et les corps qui se synchronisent

Les neurosciences décrivent aujourd’hui ce que le corps fait avec le son. Le neurologue Pierre Lemarquis, dans « Les pouvoirs de la musique sur le cerveau des enfants et des adultes » (Odile Jacob, 2021), rassemble les travaux qui établissent comment la musique sculpte le cerveau de l’enfant, en soutenant l’acquisition du langage, la motricité, la mémoire, la confiance en soi, et continue d’agir à l’âge adulte. Le neuroscientifique Stefan Koelsch a montré de son côté que faire de la musique en groupe synchronise des processus physiologiques entre les membres du groupe, les rythmes cardiaques se rapprochent, les respirations se calent les unes sur les autres, les niveaux d’attention s’alignent. J’ai vu cette synchronisation opérer en atelier, le tempo des cris d’un personnage de démon se calait sur celui des percussions, la respiration de l’actrice trouvait le rythme de la kalimba.

Le son est une vibration, une onde de pression qui touche le corps entier et pas seulement le tympan, ce qu’on éprouve physiquement devant un caisson de basses ou un gong. Les pratiques de sonothérapie, avec leurs bols et leurs gongs, travaillent directement cette dimension vibratoire et les états émotionnels qu’elle induit, et sans me prononcer sur leurs protocoles thérapeutiques, je constate qu’elles prennent au sérieux ce fait physique que l’audiovisuel néglige, le son est un toucher à distance. Dans ma propre pratique des instruments, je sais que ces vibrations partagées soudent le groupe, et cette cohésion compte énormément dans les moments de création. On parle ici de l’immersion du côté du public, mais elle se travaille tout autant du côté de celles et ceux qui créent.

Le chœur d’ambiance sonore, fabriquer l’immersion ensemble

J’ai décrit en détail dans « Le chœur d’ambiance sonore » une méthode qui repose sur cette idée. Dans un récent projet de films en réalité virtuelle avec des collégien·nes, la caméra à 360 degrés filmait tout l’espace, ce qui occupait un certain nombre d’élèves devant l’objectif, mais pas tout le monde. J’ai proposé aux autres de prendre des instruments simples, kalimbas, percussions, guiro, triangle, de se dissimuler hors champ, derrière un meuble ou un paravent, et de fabriquer en direct l’ambiance sonore de la scène, en ajustant leur jeu à ce qu’ils et elles voyaient, et en baissant le volume dès que quelqu’un·e parlait. La musique se retrouve dans le film sans avoir été ajoutée au montage, avec la justesse un peu imparfaite du direct, et elle se réinvente à chaque prise.

Ce déplacement change beaucoup de choses. Au lieu d’avoir des participant·es actif·ves devant la caméra et d’autres qui attendent, chacun·e tient une part réelle de l’œuvre, et cette part est justement celle qui fabrique l’immersion future des spectateur·rices. En se plaçant autour des micros, à différentes distances, les élèves apprennent concrètement comment se fabrique une immersion sonore, et ils et elles le font avec leur corps, en l’inscrivant dans l’espace. Construire par le son la place de chaque chose dans la scène, c’est aussi, pour chacun·e, construire mentalement sa propre place dans l’espace, et donc sa place tout court. Le psychanalyste Didier Anzieu parle, dans « Le moi-peau » (1985), d’une enveloppe sonore primaire, antérieure au langage, qui constitue chez le bébé le premier sentiment d’être contenu dans un monde habitable. Le chœur d’ambiance sonore fabrique consciemment une enveloppe de ce type, et les élèves éprouvent, dans leurs mains et dans leur corps, que l’immersion n’est pas une propriété magique des casques, qu’elle se fabrique, et qu’ils et elles savent la fabriquer.

Commencer par le son

L’audio reste trop souvent la cinquième roue du carrosse de l’audiovisuel. On soigne l’image, le cadrage, le montage, et le son vient après, comme une finition, alors que l’immersion vécue par le public se décide en amont, dans la manière même dont l’œuvre est fabriquée. Sergio Leone l’avait compris. Pour « Il était une fois dans l’Ouest » (1968), il a fait composer la musique par Ennio Morricone avant le tournage, et il la diffusait sur le plateau pendant les prises. Le cinéma italien de cette époque postsynchronisait les dialogues et les bruitages, ce qui laissait les cinéastes parler et faire jouer de la musique pendant qu’on tournait, et Leone allait jusqu’à tourner de longues séquences qu’il adaptait ensuite à la partition. Quand on voit ces images, elles sont comme fusionnées avec la musique, parce qu’elles ont été faites avec elle et parfois par elle. La musique nous immerge dans l’image, d’autant mieux que cette image est née pendant qu’elle jouait. C’est l’une des forces de ces films, et une puissance qui paraît presque inexplicable tant qu’on ne sait pas comment elle a été produite. Pour la scène d’ouverture, Leone a même renoncé à la musique composée et n’a gardé que les bruits, la goutte d’eau, le moulin à vent, la mouche, le train qui approche, et cette ambiance sonore faisait à elle seule un grand morceau de musique.

C’est ce que j’expérimente dans mes ateliers, où le son est fabriqué entièrement pendant le tournage, et où l’on ne peut donc rien arranger après. Cette contrainte, qu’on pourrait croire pénalisante, est justement ce qui donne au résultat sa justesse et sa force, parce que l’immersion s’y construit dans le même geste que l’image, par des personnes présentes à ce qui se joue. Travailler le son de façon incarnée, le faire entendre avant l’image, le confier aux mains des participant·es pendant qu’on crée, c’est lui rendre la place qui est la sienne. Il faut oser le faire. Si l’on tient vraiment à l’immersion, c’est par là qu’il faut commencer, parce que c’est par là qu’on est dedans.

L’image est devenue un langage que tout un chacun « parle » au quotidien, beaucoup plus qu’avant la démocratisation des outils numériques. Ainsi les enjeux des images touchent plus que jamais notre existence de façon très directe, aux niveaux psychologique, sociologique, politique, artistique... Il me semble essentiel de ne pas faire l’économie d’une pensée critique sur les images, leurs technologies, leurs usages. Pour penser, rien de tel qu’expérimenter, chercher, conceptualiser, mettre en commun. Je partage ici des ressources, projets et expériences autour des images, je l’espère utiles, dans les domaines éducatif, artistique, philosophique...


QR Code d'accès à cette page
qrcode:https://www.benoitlabourdette.com/la-recherche-et-l-innovation/recherche-sur-l-image/le-son-est-le-premier-facteur-d-immersion