Université d'automne « Musique(s) et cinéma(s) »

Le son : les jeux de construction de la bande sonore

François Thomas, professeur en études cinématographiques, université Rennes 2

J'aborderai deux points principaux : les conceptions de la postsynchronisation et du bruitage ; les relations des sons entre eux au sein de la bande sonore et les différentes façons d'analyser celle-ci.

Disons tout de suite que, quelles que soient les conditions d'enregistrement, le son d'un film est une construction. La manipulation est là dès la prise de son initiale. Que ce soit à l'enregistrement, au montage son ou au mixage, on opère toujours une sélection des sons, donc une hiérarchie. Même le son direct du documentaire n'est pas dépourvu d'intervention. Celle-ci est implicite dans le choix du micro, sa position, le volume pour lequel il est réglé. Le son enregistré n'est pas vraiment "reproduit", il est d'emblée "interprété"et déformé. En fonction du choix du micro, en fonction de son emplacement, de son orientation et de ses déplacements, l'inscription du son dans l'espace n'est pas la même. Certains micros privilégient la source sonore qui est devant eux, d'autres captent très fortement toute l'ambiance du lieu. Le son direct enregistré sur le plateau est déjà souvent un mélange, opéré à partir de plusieurs micros placés dans le décor. Le comédien peut ainsi être enregistré par un micro HF (micro sans fil) qui garantit l'intelligibilité du texte mais ne restitue pas l'acoustique du lieu et auquel on ajoute un micro sur la perche qui redonne un sentiment de volume et d'espace.

Il demeure que l'enregistrement, en règle générale, est chargé de donner à la voix ou aux autres matières sonores davantage de présence et d'intelligibilité. Le dialogue, ou autre son, que l'on enregistre alors est sorti de son contexte spatial ; on pourrait le placer dans des décors tout à fait différents. L'important n'est pas la fidélité à l'espace, mais l'efficacité dramatique. Les sons doivent être immédiatement reconnaissables. Ils doivent apparaître cohérents au spectateur. Le souci n'est pas celui du réalisme, mais celui du vraisemblable.

Son direct ou postsynchronisation : des esthétiques nationales

Son direct ou postsynchronisation (ou dégradé entre les deux) : les choix correspondent à des esthétiques individuelles de réalisateurs, sans doute, mais sur fond de choix national majoritaire.
En France, où le son direct est perçu comme le garant de l'authenticité, nous avons même des inconditionnels du direct comme Éric Rohmer ou Jacques Rivette qui se refusent au moindre ajout a posteriori. Sinon, la postsynchronisation est plutôt perçue comme un palliatif, un mal nécessaire. Aux États-Unis, on estime que 60 à 70 % du dialogue d'un film est du son direct.

Dans d'autres pays, comme en Inde, les films sont très majoritairement postsynchronisés. On peut trouver à ce choix les avantages suivants : la postsynchronisation coûte moins cher sur le tournage et permet d'aller plus vite sans tenir compte des bruits parasites (il faut alors pouvoir faire revenir les comédiens en auditorium, ou renoncer à les faire s'enregistrer eux-mêmes), on peut diriger les comédiens pendant la prise, tourner plus aisément en décors naturels, utiliser des comédiens étrangers qui ne parlent pas la langue du film, voire tourner avec un scénario provisoire et réécrire le dialogue après coup. Le cas national le plus intéressant est sans doute celui de l'Italie.

Le cas italien…

En Italie, une politique délibérée de Mussolini au début des années 1930 a imposé que les films étrangers soient doublés. L'Italie s'est refusée au sous-titrage. Le but était triple : donner du travail aux Italiens, renforcer le protectionnisme culturel, contribuer à compléter l'unification encore récente de l'Italie par le biais d'un nivellement par la langue (dans ce pays de grandes traditions dialectales, le fascisme luttait contre les dialectes et voulait imposer une langue unique, l'italien). La puissance d'une corporation spécialisée de doubleurs a incité d'emblée à systématiser la postsynchronisation.

En 1968, un manifeste signé Antonioni, Bellochio, Bertolucci, Lattuada, Pasolini, Rosi, les Taviani et beaucoup d'autres cinéastes d'écoles très différentes a protesté contre l'abus systématique de la postsynchronisation. Celle-ci, accusait-il, compromet les valeurs expressives du film. Les acteurs, habitués à être doublés par d'autres, acquièrent "un détachement croissant à l'égard du personnage qu'ils jouent". Certains cinéastes, bientôt, parviendront à imposer le son direct : Rosi, Ferreri…Les deux attitudes existent aujourd'hui, mais le tournage bruyant où le metteur en scène dirige à haute voix les comédiens pendant la prise reste prédominant.

Les partis que les Italiens ont tirés de la postsynchronisation sont cependant très divers.
Prenons d'abord l'exemple de Vittorio De Sica, un des hérauts du néo-réalisme. Contrairement à ce que pourrait laisser penser l'étiquette "néo-réalisme", quasiment tous les films de ce mouvement sont postsynchronisés. Au lendemain de la Seconde Guerre mondiale, enregistrer hors du studio était techniquement difficile, les néo-réalistes travaillaient sans caméras synchronisées, avec des micros non directionnels, et ils s'inscrivaient dans une tradition technique que, sur ce point, ils n'ont pas cherché à bouleverser.

Il n'est donc qu'à se référer au film le plus connu de De Sica, Le Voleur de bicyclette (1948). Si l'on montre isolément le passage, juste avant la fin du film, où l'enfant rejoint son père arrêté par la foule pour avoir dérobé une bicyclette et s'écrie à quatre reprises "Papa ! ", on remarque aisément qu'une des exclamations est off et que les trois autres sont asynchrones, "à côté des lèvres". De Sica procédera avec la même insouciance à l'égard d'un réalisme audiovisuel minimal pendant toute sa carrière.

Voyons l'ouverture de son dernier film, Le Jardin des Finzi Contini (1970). Il y fait dialoguer des personnages en plein air, à vélo, comme s'ils étaient confinés dans une pièce et pour cause, coupons l'image et nous avons l'impression d'être dans un studio d'enregistrement avec des comédiens immobiles devant un micro. De Sica ne prend pas en considération l'éloignement respectif des différents personnages par rapport à la caméra, ne change rien à la présence du dialogue quand les personnages tournent le dos à la caméra ou se déplacent dans l'axe de la caméra. Des zooms avant, des zooms arrière très prononcés, qui font passer d'une taille de plan à une autre très éloignée, n'affectent en rien le volume du dialogue. Les vélos ne font pour ainsi dire aucun bruit. Ni les rues, ni les sentiers du parc ne dégagent la moindre ambiance : c'est le vide sonore. Si cette esthétique étonne, c'est qu'elle accompagne un découpage sage, classique, qui laisse amplement le temps de repérer le côté artificiel du mixage, et que nous sommes habitués à d'autres conventions.

Avec Federico Fellini, nous avons affaire à un style radicalement différent. Le raisonnement implicite est le suivant : si l'on ne peut pas faire aussi bien que le son direct à la postsynchronisation, pourquoi ne pas faire autre chose ? Fellini adopte ce parti pris dès ses premiers films encore marqués par le néo-réalisme.

Prenons une séquence un quart d'heure après le début des Nuits de Cabiria (1957). Après que la prostituée Cabiria a tenté de se suicider car son amoureux l'a abandonnée, nous retrouvons, sur une petite place près d'une rue mal famée, tout un groupe d'amateurs de la nuit que rejoint Cabiria. Les répliques ne sont pas toutes synchrones, loin de là. La confusion des voix entremêlées est faite entièrement à la postsynchronisation. Le plus étonnant, si nous prêtons attention au ballet des véhicules qui circulent du début à la fin de la scène, c'est que les voitures et les motos tantôt font du bruit, tantôt n'en font aucun, suivant que Fellini a besoin ou non de signaler leur présence.

On entend la Vespa de livraison qui amène Cabiria un peu après le début de la scène, et dans le dernier plan on entendra la voiture qui emmène la jeune femme et la moto des deux amis qui la suivent. Mais, entre ces deux points, quantité de motos traversent l'image de gauche à droite ou inversement sans produire le moindre son, alors que l'on entend clairement au même moment une consœur de Cabiria de l'autre côté de la rue, tout au fond de l'image. On entend, au milieu de la profondeur de champ, une prostituée racoler le conducteur d'une voiture qui s'est arrêtée à sa hauteur…mais on n'entend ni les propos de son interlocuteur qui refuse l'offre, ni même l'arrivée ou le départ de sa voiture. Ou bien, si l'on entend malgré tout telle moto, il suffit qu'elle sorte du cadre pour que le son disparaisse non pas progressivement mais d'un seul coup, niant le hors-champ. Les portières des voitures arrêtées claquent à contretemps (si elles étaient synchrones, l'asynchronisme des voix, peut-on penser, paraîtrait plus artificiel). Le spectateur a-t-il le temps d'objecter quoi que ce soit à cette liberté de tous les instants ?

Avec Fellini, nous avons donc une postsynchronisation et un bruitage créateurs. Pour lui, le son enregistré sur le plateau n'est qu'un "son témoin"provisoire. Pendant la prise, chaque comédien parle sa propre langue, son propre dialecte, avec des dialogues approximatifs, voire en récitant simplement une série de chiffres (François Truffaut a montré cela dans une scène de La Nuit américaine où s'opposent les méthodes italienne et française, la première étant illustrée par un certain "Federico"). Fellini monte d'abord son film avec le son du tournage. Puis il écrit un nouveau dialogue qu'il enregistre avec d'autres comédiens, à l'image, sans "bande rythmo", ce qui rend hasardeux le synchronisme. Comme le dit Bertrand Philbert qui a travaillé avec lui, "aucune phrase, sauf par hasard, n'est synchrone"(Cinématographe n°96, janvier 1984, p. 29). C'est au point que des personnages peuvent échanger des répliques la bouche fermée. Il suffit de comparer la version française et la version italienne d'un film de Fellini pour constater que la première recherche beaucoup plus le synchronisme. Tout cela paraît naturel à l'écran : la règle fellinienne est que le découpage et le montage ne mettent pas en valeur le contenu du dialogue, donc le spectateur n'est pas tenté de guetter les défauts de synchronisme.

…et un exemple français

J'ai dit tout à l'heure que, en France, le son direct était généralement privilégié. Mais, les exemples de postsynchronisation créatrice y existent aussi. Je m'arrêterai sur le cas du premier long métrage de Jacques Rozier, Adieu Philippine (1960-1963). L'apparence de spontanéité y est telle que les Cahiers du cinéma, dans un dictionnaire des nouveaux cinéastes français, ont pu écrire : "Après ce film, tous les autres paraissent faux"(n°138, décembre 1962, p. 81).

Rozier, sur le plateau d'Adieu Philippine, pousse ses interprètes à improviser une partie des dialogues. Il tourne sans ingénieur du son, mais enregistre avec un petit magnétophone non synchrone un son témoin qui se révèlera inaudible à plus de 50 %. Il passe cinq mois à essayer de lire sur les lèvres des personnages pour déchiffrer le texte improvisé qui doit servir à la postsynchronisation. En réalité, comme chez Fellini, il s'agira surtout d'inventer en auditorium.

Prenons la scène où le protagoniste discute avec trois amis devant l'entrée d'un café, puis celle où le quatuor, dans un garage, examine la voiture qu'il va acheter en se cotisant. Si l'on regarde ces deux scènes en coupant le son, elles sont, à l'image, très plates, quotidiennes. Mais remettons le son et nous constatons qu'une énergie inimitable est donnée à la postsynchronisation : voix flûtées, interjections extravagantes, syllabes démesurément allongées…Rozier, aussi, ajoute le dialogue quand il veut : quand les personnages sont de dos, hors champ, etc., sans se sentir lié par la présence des visages à l'écran. Les bruitages, aussi, sont vivants.

Bref, Rozier montre comment faire du naturel avec de l'artificiel. Il déclare ainsi : "je suis pour le doublage des dialogues parce que je me suis aperçu qu'avec du temps, on peut faire un travail très précis, et qu'on domine davantage son film. Les acteurs sont dans le noir, dans un état d'hypnose, et peuvent s'extérioriser sans complexes"(Cahiers du cinéma, n°148, octobre 1963, p. 37).

Associer les sons, ou bien les dissocier ?

Que faire de l'hétérogénéité de la bande sonore, qui réunit ces quatre composantes apparemment disparates que sont la voix, la musique, le bruit et le silence ? (Le silence est bien un élément sonore : le mixeur ne laisse pas la pellicule son vierge, il insère un peu de souffle ou il puise dans le "silence plateau"propre au lieu de tournage.) Les cinéastes peuvent choisir de dissocier les sons, ou bien de les associer.

Ils peuvent en effet aborder le son de quatre manières distinctes :

  1. Adopter pour chacune des quatre catégories de son une démarche spécifique. On considère les catégories sonores comme indépendantes les unes des autres, sans ménager entre elles de véritables points de contact.
  2. Tenter de rapprocher les catégories sonores, voire de les confondre. On cherche alors à réduire l'écart des sonorités, à musicaliser la voix ou le bruit, à réduire la voix et la musique à une rumeur, ou à assimiler, lors d'effets ponctuels, un bruit à du dialogue. Les quatre catégories ont en effet des frontières mouvantes. Des "bruits"sont en réalité produits musicalement. Cette recherche de l'entre-deux peut être patente comme elle peut être déguisée. Prenons nos exemples chez les frères Coen. Au début de Blood Simple (1983), le bruit de l'essuie-glace de la voiture du couple adultère est en réalité clairement fourni par la musique de Carter Burwell. Dans Barton Fink (1991), certains des grondements dans le hall lors de l'arrivée du protagoniste à l'hôtel sont eux aussi des "bruitages musicaux", mais cette fois impossibles à identifier, sans doute, si Burwell n'avait pas expliqué dans un entretien que l'on entend des violons, des trombones basses et des échantillonnages de piano préparés qui se font passer pour des bruitages.
  3. Appliquer aux différentes catégories sonores une règle identique. Le cas est probablement unique : Jacques Rivette, dans Duelle et Noroît, deux films tournés en 1975, a étendu le principe du son direct à la "musique directe". Dans ces films, plutôt que d'ajouter la musique après coup, Rivette demande à un ou plusieurs musiciens, filmés en même temps que les comédiens, d'improviser en direct pendant les prises. Dans Duelle, Jean Wiener et son piano occupent un coin discret dans les intérieurs les plus divers, comme le trio de Noroît (flûte, basse et percussions) dans les différentes salles du château où se situe une grande part de l'action. Ni Wiener ni les instrumentistes de Noroît ne participent en quoi que ce soit à l'action.
  4. Faire entrer les différentes catégories sonores dans une composition homogène, chercher à former un tout cohérent, construit, structuré. C'est par exemple ce qu'a fait Alain Robbe-Grillet (avec une recherche de sérialisme) dans les films où il a confié la création de la "partition sonore"à Michel Fano. Des films, ou des parties de films, battent en brèche la discontinuité habituelle de la bande sonore, multiplient les points de contact entre les sons, aboutissant à l'interdépendance d'éléments indissociables les uns des autres. Cette dernière voie est beaucoup plus fréquente qu'on ne le croit. Mais la difficulté est que ces rapports entre sons, généralement, sont cachés.

Le même dilemme se pose bien sûr pour les analystes du son : faut-il dissocier les sons, ou bien les associer ?
La première voie consiste à aborder séparément, dans un film donné, le système des dialogues, le système des bruits, le système de la musique (la cohérence de la partition musicale et/ou celle des musiques préexistantes empruntées), voire le système des silences.

Attardons-nous surtout sur la seconde voie. Elle part de la constatation que ce n'est pas toujours l'image qui commande la répartition des sons, loin de là, mais qu'un son est inséré aussi en fonction de sa relation à d'autres sons, contigus ou éloignés. Les bruits, par exemple, ne sont pas seulement impliqués par ce qui figure à l'écran ou par le décor sonore que l'on peut supposer hors champ. Ils sont aussi impliqués (ou ils peuvent l'être) par les autres sons avec lesquels ils entrent en relation. Composer de la musique destinée à être entendue en même temps que le dialogue, par exemple, est tout un art ignoré. À supposer (et encore) que la bande sonore ne soit pas la restitution brute du son direct, sans autre intervention ni manipulation, les sons d'une séquence sont, dans le détail, dosés les uns par rapport aux autres. Ils entretiennent des relations tangibles.

Ces "interactions sonores", pour les appeler ainsi, peuvent être clairement audibles, non déguisées. Donnons-en deux exemples, appartenant l'un au cinéma classique, l'autre au cinéma moderne.
Écoutons d'abord dans Baby Doll (1956) d'Elia Kazan un relais flagrant entre la musique de Kenyon Hopkins et une réplique de Vaccaro, le personnage interprété par Eli Wallach. L'effet est d'autant plus marqué qu'il vient après plusieurs minutes dépourvues de musique. Vaccaro vient de jouer un jeu trouble avec la jeune Baby Doll : tout en laissant paraître auprès de celle-ci qu'il soupçonne son mari d'être l'auteur d'un incendie criminel, il a entrepris des manœuvres de séduction. Doublement ébranlée, Baby Doll le quitte pour rentrer chez elle, mais, sur le seuil, il la retient pour une dernière question : "Vous croyez aux fantômes, Mme Meighan ? "La musique fait son entrée dans l'intervalle entre cette phrase et la suivante qu'ajoute Vaccaro : "Moi oui, je crois aux esprits malins."La mélodie se fait enveloppante le temps de la réponse de Baby Doll : "De quels esprits malins parlez-vous ? "Puis la réponse de Vaccaro est ponctuée, mot après mot, d'une série d'accords brutaux ascendants : "Des esprits de violence (ponctuation), de ruse (ponctuation), de malveillance (ponctuation), de cruauté (ponctuation), de traîtrise (ponctuation), de destruction (ponctuation)."Et retour à la mélodie enveloppante sur la réponse embarrassée de Baby Doll : "Ce sont des caractéristiques humaines."La musique a donné sa véhémence à la réplique de Vaccaro de telle sorte qu'elle paraît émaner de lui.

Écoutons maintenant une des multiples facéties sonores d'Une femme est une femme (1961) de Jean-Luc Godard. Lorsque Angela (Anna Karina) gagne le dancing où elle travaille, la musique de Michel Legrand est sans cesse coupée puis remise, pour céder la place aux dialogues entre deux tronçons musicaux. Au cours d'un plan large, la musique s'interrompt abruptement pour céder cette fois la place à un bruit, celui, outrageusement mixé au premier plan, de la fermeture Éclair de la robe d'une des strip-teaseuses qu'abaisse un client…puis la musique reprend son cours comme si de rien n'était. Tout le film est du même ordre : les jeux sonores sont dévoilés, ostensibles.
Les sons, donc, dans beaucoup de films, ne restent pas étrangers les uns aux autres. Ils se relaient, se heurtent, se superposent et se chevauchent sans cesse. Cela aussi bien à l'intérieur des séquences que dans les transitions entre séquences.

L'art de la transition sonore

Je prendrai deux exemples de la façon dont les cinéastes peuvent jeter des ponts sonores reliant les séquences pour mieux affermir la structure de leur film.

Commençons par Chaînes conjugales (1949) de Joseph L. Mankiewicz.
Le point de départ dramatique est le suivant. Dans une petite ville américaine, trois amies se retrouvent à l'embarcadère pour accompagner une excursion d'enfants en remontant la rivière. Juste avant qu'elles montent à bord, survient un coursier qui leur remet une lettre de la quatrième amie qu'elles attendaient. Celle-ci leur annonce qu'elle est désolée de ne pouvoir les rejoindre…car elle quitte la ville avec un de leurs époux. Le timing est parfait, les amies doivent monter à bord sans avoir le temps de se ruer sur la cabine téléphonique du quai. Pendant l'excursion, chacune d'elles s'interroge à tour de rôle (est-ce mon mari ? ), lançant chaque fois un retour en arrière qui illustrera les failles de leur mariage.

Chacun de ces trois retours en arrière est introduit par des transitions sonores particulièrement inventives pour l'époque, et les deux premiers sont également conclus par ces transitions. Il s'agit de truquages sonores. Les questions lancinantes, en voix intérieure, de chacune des trois épouses sont répétées par le bruit ou par la musique qui les intègre à son rythme :

  1. Le moteur du ferry reprend en écho les "Est-ce Brad ? "de la première épouse.
  2. Les deux interrogations de la deuxième épouse ("Pourquoi George n'est-il pas parti à la pêche ? Pourquoi ce complet bleu ? ") sont chacune reproduites par une phrase musicale du second concerto pour piano de Brahms, qui jouera un rôle important dans le retour en arrière.
  3. L'interrogation de la troisième épouse ("Tu n'as peut-être pas tout ce que tu voulais, après tout ? ") est redoublée par le bruit de l'eau qui goutte d'un tuyau et qui l'intègre dans son rythme obsédant, scandé.

Prenons ensuite l'exemple de Citizen Kane (1941) d'Orson Welles. Dans ce film, lui aussi fondé sur le retour en arrière, ce sont des dizaines de transitions qui recourent à des procédés ingénieux. Contentons-nous d'un passage très dense qui forge trois transitions successives entre les quatre scènes suivantes : au terme de la première rencontre du patron de presse Charles Foster Kane avec la modeste vendeuse de partitions Susan Alexander, celle-ci accepte de chanter pour lui un aria du Barbier de Séville de Rossini en s'accompagnant au piano ; Susan chante le même aria dans un salon plus luxueux, s'accompagnant sur un meilleur piano quelques mois plus tard (nous comprenons que Kane a entrepris de la faire chanter plus professionnellement) ; Leland, employé et meilleur ami de Kane, prononce un discours électoral en faveur de ce dernier qui se présente à une élection de gouverneur ; Kane tient un rallye politique à Madison Square Garden.

Transition 1 - Fondu enchaîné : L'aria que chante Susan se poursuit comme si de rien n'était, mais…en italien et non plus en anglais. La transition d'une langue à l'autre s'effectue par un tour de passe-passe pendant les vocalises sur le o du second "Lindor" :

Yes, Lindor shall be mine
I have sworn it for weal or woe
Yes, Lindo-o-o-o-o-o-or
Lo giurai, la vincerò.

Oui, Lindor sera mien
Je l'ai juré pour le meilleur et pour le pire
Oui, Lindor
Je l'ai juré, je vaincrai.

Si l'on se reporte à la partition de Rossini, on découvre que les vocalises n'y figurent pas : "Sì, Lindoro mio sarà"("Oui, Lindor sera mien") est traduit par les seuls mots "Yes, Lindor"de façon à permettre ces vocalises. Cela n'a pourtant rien d'étonnant pour un amateur d'opéra puisque ce type d'arias était à l'époque surchargé de fioritures par ses interprètes virtuoses.

Transition 2 - Fondu enchaîné : Les applaudissements que Kane adresse à Susan à la fin de la saynète précédente sont relayés par ceux, plus fournis, des auditeurs assemblés autour de Leland.

Transition 3 - À la fin de la saynète précédente, les applaudissements s'arrêtent pour détacher les derniers mots de l'orateur :
"Je veux parler de Charles Foster Kane, le progressiste combatif, l'ami des travailleurs, le prochain gouverneur de cet État, qui a entrepris [fin des applaudissements] cette campagne…"

Fondu enchaîné : Kane, d'abord invisible (la caméra cadre un énorme portrait de lui surmontant la tribune avant de redescendre sur lui), complète la phrase de Leland :
…avec un seul but : signaler et rendre publiques la malhonnêteté et la pure et simple infamie de l'appareil politique de "Boss"Jim W. Gettys.

L'extrême résonance de la voix de Kane amplifiée par la réverbération de la salle gigantesque balaie le son étriqué du discours de son supporter. La continuité des deux scènes est renforcée par l'apparition rapide des applaudissements des auditeurs de Kane.
On mesure la complexité de la mise en œuvre de ces transitions qui ont été prises en compte pour la direction d'acteurs au stade du tournage avant d'être matérialisées au montage son et au mixage.

L'habillage sonore des séquences

Le même Citizen Kane servira à montrer comment l'on peut "habiller"par le son une séquence au moyen d'interactions sonores. Je prends un exemple très court qui illustrera notamment les fonctions de soulignement ou de ponctuation que le bruit peut exercer à l'égard du dialogue.

Juste avant, se sont affrontés dans l'appartement de Susan quatre personnages : Kane, sa femme Emily, sa maîtresse Susan, et son adversaire politique Gettys venu exercer un chantage (il menace de révéler l'adultère) pour amener Kane à se retirer de la course électorale. Kane a refusé et descend l'escalier à la suite de Gettys pour lui hurler rageusement son mépris. Suit notre scène, longue d'une vingtaine de secondes. Gettys et Emily échangent de brèves formalités sur le pas de la porte : "Êtes-vous en voiture, Mme Kane ? "- "Oui, merci."- "Bonsoir."- "Bonsoir."

Regardons d'abord l'extrait sans le son. On pourrait s'attendre, soit au vide sonore de beaucoup de films hollywoodiens qui ne font entendre rien d'autre que le dialogue et un minimum d'actions visibles à l'écran, soit à une ambiance rue assez présente. Le choix de Welles est différent : il monte quatre coups de klaxons, alors qu'on n'entend pas un seul bruit de moteur dans la scène. Un bruit unique suffit pour colorer la scène et donner une profondeur à l'image (c'est un décor sonore hors champ), mais il est décliné en différents types d'utilisation, et il est chaque fois rigoureusement placé en fonction du dialogue ou de la musique.

Klaxon n°1 - Lorsque Kane, dans l'escalier, hurle à son adversaire : "je vais vous envoyer à Sing Sing ! Sing Sing, Gettys ! Sing Sing ! ", son dernier "Sing Sing ! "est victime d'un jeu sonore. Le début en est assourdi car un changement de plan le fait entendre de l'extérieur de la maison, puis la fin est coupée net par le claquement de la porte d'entrée que Gettys referme derrière lui, et ce "Sing Si…"est complété par un coup de klaxon moqueur hors champ dont la sonorité prolonge celle de la voix filtrée de Kane. Ce premier klaxon a au moins trois fonctions : il sert de transition entre la scène d'extérieur et celle d'intérieur ; il porte un commentaire sur le protagoniste vaincu ; et il remplit l'intervalle entre le hurlement de Kane et la première réplique de Gettys sur le pas de la porte.

Klaxon n°2 - Aigu et prolongé, il souligne la première réplique de Gettys ("Êtes-vous en voiture, Mme Kane ? ") dont il épouse très exactement les contours.

Klaxon n°3 - Dédoublé, beaucoup plus grave, il ponctue la réponse d'Emily ("Oui, merci").

Klaxon n°4 - Prenant le relais du "Bonsoir"final d'Emily, un dernier klaxon aigu, émanant de la même voiture supposée que le deuxième, sur , est suivi par un do musical de même intensité. Ce do ouvre la musique qui opère la transition avec la scène suivante, mais il peut encore passer pour un ultime son de klaxon : la musique, peu mélodique, ne s'affirme pas comme telle avant la première étape d'un crescendo qui semble naître du bruit.

Chacun des quatre klaxons, donc, a un rôle à jouer en fonction du dialogue, et le premier et le dernier servent à la transition avec les séquences précédente et suivante.
Le bruit, la musique peuvent servir aussi à détacher une partie du texte : couper abruptement un bruit ou une musique juste avant de derniers mots menaçants, persifleurs ou lourds de sens leur donne une plus grande résonance. Sans que la liste de procédés soit exhaustive, on peut déjà composer la bande sonore à l'infini avec seulement ces trois grands principes : ponctuer un mot ou une réplique ; souligner un fragment de réplique ou une réplique entière ; détacher une partie du texte. Tout dépendra des ingrédients que l'on mettra en présence.

Tous les films, bien sûr, ne vont pas aussi loin qu'Une femme est une femme ou que Citizen Kane dans la multiplication des jeux sonores. Analyser le son, cela peut cependant être s'attacher à la double organisation du son dans un film. Un son est inséré en fonction de sa relation à une image comme de sa relation à d'autres sons : à nous de découvrir, film après film, comment se répartit l'équilibre entre ces deux aspects que certains cinéastes dissocient et d'autres non.

 

Actes de l'université d'automne - Musique(s) et cinéma(s) octobre 2003

Mis à jour le 15 avril 2011
Partager cet article
fermer suivant précédent