Université d'automne « Musique(s) et cinéma(s) »

Problématique : Chico, Groucho, Harpo, du classicisme à la postmodernité

Laurent Juillier, professeur d'esthétique, université de Metz

On ne s'étonnera pas de remarquer que tous les spectacles d'images animées répertoriés au cours de l'histoire se soient déroulés avec accompagnement sonore (musique et/ou bruits). L'eidophusikon de Philippe-Jacques de Loutherbourg ou le fantascope d'Etienne-Gaspard Robertson, puis le praxinoscope d'Emile Reynaud (pour ne parler que d'ancêtres du spectacle cinématographique, dès 1780 pour le premier) donnaient lieu à des séances pleinement audiovisuelles. Il n'est jusqu'au fameux récit fait par Pline l'Ancien de la course au réalisme chez les peintres de l'Antiquité, qui ne se soit soldé par un triomphe de la collaboration audio-visuelle : plus fort que les raisins de Zeuxis et que le rideau de Parrhasios, le happening des trompettes, qui n'étaient pas seulement bien peintes, mais soufflées en coulisse par de zélés assistants, emporta la palme de la représentation illusionniste.

Plus encore que la peinture, la lanterne magique ou les théâtres d'ombre, le cinéma a besoin du sonore, moins peut-être pour "faire vrai"que pour tempérer l'inquiétante étrangeté de ses représentations biomécaniquement exactes d'êtres humains auxquels il manque une de leurs trois dimensions - ce qu'on appelle des spectres (Maxime Gorki parla de visite au royaume des ombres, et les Chinois utilisent le vocable quelque peu frankensteinien d'ombres électriques pour qualifier le cinéma).

Huit différences, de divers ordres - physiologique (1 à 4), technique (5 et 6), socioculturel (7 et 8) - font de ce mariage pourtant réussi, celui d'une carpe et d'un lapin :

  1. Notre système perceptivo-cognitif est capable de constater que le son voyage, alors que la lumière va trop vite pour lui.
  2. Nous entendons à 360°.
  3. Nous ne possédons pas sur les oreilles de capuchons protecteurs pouvant permettre, comme les paupières, de suspendre le flux des stimuli.
  4. Nous clignons souvent de l'œil, pas des oreilles, ce qui nous rend plus disposés à remarquer les ruptures dans le flux sonore des films que dans le flux visuel.
  5. La raison 1 se retrouve au cœur de la conception des machines audiovisuelles, à qui l'on peut imposer un arrêt sur image, pas un "arrêt sur son".
  6. Le dispositif utilise pour ses duplicata du monde la matière même de l'original : du son pour représenter du son.
  7. Nous ne savons manifestement pas bien tirer parti des informations transmises aux niveaux supérieurs pour accéder à l'identification des sources sonores, en tous cas pas aussi bien que dans le cas du visuel, et aucune culture au monde ne semble particulièrement décidée à lutter contre cela. Ce qui a permis à la corporation des bruiteurs d'exister, même dans des spectacles in vivo comme le cirque ou le théâtre.
  8. La pratique amateur de la prise de sons est beaucoup moins répandue que les pratiques de photographe et de caméscopeur, ce qui contribue à entretenir des moyennes de capacité d'expertise très différentes selon que l'on aborde le sonore ou le visuel.

La machine-cinéma et le corps du spectateur posent, dès le premier film, un champ des possibles où l'on compte trois grandes variations, qu'actualisent plus ou moins, au cours de l'histoire, les interactions entre la réception (dans l'espace public) et la fabrication (du côté des créateurs). Au lieu de découper l'histoire du parlant en "époques"(classique, moderne, postmoderne), j'entends la découper de façon synchronique en me servant d'états du système perceptivo-cognitif : homéostasie, computation, vertige. On peut reprendre, de Gilles Deleuze, la description des Marx Brothers et la tirer dans notre sens, au prix de certains ajustements.

Chico est du côté de l'"action, des duels avec le milieu". Chico est tourné vers l'extérieur, contrairement à ses frères. Il "monte des coups", organise des rencontres. On placera ici la vision du cinéma comme instrument de connaissance, la leçon de vie hollywoodienne ("L'exercice a été profitable, monsieur"). Groucho se pose en grand maître du "raisonnement"(Deleuze). Il se trouve du côté des jeux de langage, un langage qui tournerait en circuit fermé sans jamais référer à d'autres objets que lui-même. Le mot "Texas"n'est pas intéressant en ce qu'il réfère à un État de l'Union, mais parce qu'il ressemble oralement à "taxes"(La soupe aux canards). Harpo se trouve du côté des "affects célestes et des pulsions infernales". Il représente la relation directe que les images de cinéma peuvent entretenir avec le corps du spectateur, un corps transformé en cible, en résonateur, en boîte noire chère aux béhavioristes, avec un seul mot d'ordre, satisfaire à ses désirs pulsionnels. Comme les héros des films-concerts postmodernes, Harpo ne parle pas. Mais il n'est pas l'innocent qui vient de naître, il a tout sous son manteau, là aussi comme le cinéma postmoderne de l'allusion et du clin d'œil.

Le cinéma qui s'accorde à nos pulsions est sans doute de ce côté : vertige du tour de manège (dès les Lumière qui embarquent la caméra en train), de la sidération par saturation de la pulsion scopique (tout voir ! ), et du blocage du sens par accumulation (plans inférieurs à la demi-seconde, disponibilité immédiate de toutes les images sur les écrans des ordinateurs reliés entre eux, "renvoi sans fin"des signifiés les uns aux autres jusqu'à ce que la circularité les vide de sens). Harpo penche parfois dangereusement vers l'autisme ; lorsqu'il a des relations avec les autres c'est pour les instrumentaliser.


Chico ou le classicisme

Le cinéma classique s'est institutionnalisé par le biais d'un système d'essais et d'erreurs régulé par le système des previews précédant la sortie publique, des remakes et des sequels mis en chantier après lecture du box-office, et par les discours des journaux corporatifs des techniciens. Le principal moteur de cette course à l'accessibilité, surtout aux États-Unis, est d'ordre économique. L'institutionnalisation a visé, entre autres choses, à réguler les sutures mentales qu'opère le spectateur d'un plan à l'autre, sur les bases des performances de notre appareil perceptivo-cognitif, performances qui dénotent une remarquable faculté à anticiper le comportement de l'organisme qu'il pilote. Il s'ensuit que détecter un faux-raccord, par exemple, n'implique pas de faire appel à une quelconque "grammaire du cinéma", mais signifie exercer nos simples talents naturels de perception. Torben Grodal n'hésite pas à écrire que "le style classique hollywoodien n'est pas qu'un style parmi d'autres", mais qu'il est "motivé par la structure de notre esprit"….

Il a fallu une bonne dizaine d'années au cinéma pour trouver des solutions visant à absorber en douceur le choc du parlant, à supposer qu'il l'ait jamais fait, puisqu'il se trouva de fins connaisseurs du muet pour penser que ce mariage de la carpe et du lapin ne pourrait jamais réussir. Il est d'ailleurs frappant de constater la ressemblance entre la diatribe de l'un de ces connaisseurs, Rudolf Arnheim :
"J'ai l'impression que quelque chose ne va pas, que nous avons affaire à des ingrédients qui sont incapables d'une véritable existence commune en raison de principes intrinsèquement contradictoires"
et la fameuse tirade de Pierrot le fou :
"On a des machines pour voir, c'est les yeux ; des machines pour écouter, les oreilles ; une machine pour parler, la bouche... J'ai l'impression que c'est des machines séparées. Y'a pas d'unité".

Le moyen principal de "tranquilliser"un spectateur pour qui la simulation repose sur l'équilibre homéostatique a été le recours au concept de causalité verticale. Dès l'enfance, on nous habitue à un naturalisme audiovisuel qui présuppose un son pour chaque chose et une cause (visible) pour chaque son. C'est pourquoi tout le cinéma narratif classique, dont une partie du pouvoir évocateur repose sur l'effet de réel, est très attentif à ne faire entendre que des sons à l'identification aisée, et dont la source sera mentalement rangée par le spectateur à un endroit précis et prévu. À l'inverse, ce cinéma-là aura grand soin de faire entendre des sons lorsqu'une source sonore active sera vue à l'écran, à moins de mettre en place de solides conventions visant à faire accepter au spectateur l'absence de son ou l'absence de son "adéquat".

Cette "variation"des réglages du dispositif est basée sur la propension de l'être humain à pratiquer l'écoute causale et, pré-câblage bien connu, sur sa faculté d'extraire les sons qui s'offrent à lui au lieu de rester passivement à ouïr globalement, en s'y laissant baigner, le bruissement du monde. Le système auditif semble prioritairement fait pour répondre aux demandes de l'écoute causale. Très tôt, dit Pierre Schaeffer, l'homme préhistorique a dû apprendre à fuir à la moindre branche qui craque, puis peut-être à différencier une branche qui craque naturellement d'une autre qui craque sous le poids de quelque animal menaçant ou qui signale un fruit qui tombe. Le dispositif fondera donc la plus grande partie de son pouvoir illusionniste sur sa capacité à faire croire que le lien qui soude images et sons est lui aussi, comme dans la vie quotidienne, un lien causal : c'est le mensonge de la causalité verticale.

Une seconde stratégie consiste en l'équilibre entre le point de vue et le "point d'ouïe"(Bailblé préfère ce terme à "point d'écoute"parce que ce dernier connote une attention que le spectateur n'a pas forcément au moment de l'occurrence des données). Le microphone, d'abord pensé comme l'oreille de la personne imaginaire dont l'œil est la caméra, va être placé tout près de cette dernière. Mais, très vite une polémique agite le monde du cinéma, concernant la taille des plans, visuel et sonore : quand on passe d'un plan général à un gros plan, le son doit-il augmenter de volume ou bien rester le même ? On peut dire que le débat qui occupe les partisans de l'une ou l'autre réponse consiste en une opposition entre perspective naturaliste et réalisme sonore psychologique.

La perspective naturaliste réalise l'objectivation de la perception spatiale des sons. Aux hiérarchisations spatiales subjectives que nous établissons dans la vie quotidienne et qui contredisent parfois les mesures des machines (il se peut très bien que nous entendions "au premier plan"un son qui possède une dynamique inférieure à tel autre dont nous pensons qu'il constitue le "fond"), techniciens et artistes du cinéma classique monophonique vont donner un équivalent objectif, corroboré cette fois par les résultats des mesures (si les spectateurs entendent tel son au premier plan, c'est qu'il est effectivement mixé en avant). Attendu que le visuel primait de toute façon sur un univers sonore vu comme une attraction supplémentaire, il revenait au son de se conformer à l'espace construit par l'image, et jusqu'au milieu des années trente il ne fut question que de perspective naturaliste chez les ingénieurs du son, du moins à Hollywood.
Entre 1928 et 1938, la tendance s'inversa, et le naturalisme céda peu à peu la place au "réalisme psychologique", qui se caractérise par la volonté de donner la priorité à l'intelligibilité. Sous l'influence de la radio, on se mit à donner au son une qualité de "gros plan"quelle que soit sa contrepartie visuelle.

Une troisième variation à but homéostatique a consisté à mettre en place un système d'espaces imaginaires enchâssés de façon à pouvoir utiliser des sons interdits à une prise en charge par la causalité verticale (musique de fosse, voix off...). Si la musique ne signifie pas grand-chose par elle-même, on donne ici de l'importance aux accords parfaits et à la "préparation"pavlovienne de leur venue à coups d'accords de dominante. Le générique de Police Python 357 illustre parfaitement cette "direction de spectateur"via l'harmonie. Cependant que Ferrot, le héros interprété par Yves Montand, prépare son petit-déjeuner, s'habille et confectionne des cartouches, une musique dissonante déroule ses austères méandres. Puis, à mesure qu'il va être prêt à sortir au-dehors, les accords de dominante arrivent. Enfin, à l'instant précis, filmé en gros plan, où Ferrot glisse dans son holster l'arme qui donne son titre au film, retentit le seul accord parfait (mineur) de toute la séquence : c'est que Ferrot ne se sent bien qu'avec son engin au côté...

Groucho ou la modernité

Le créateur moderne réfléchit (il se filme parfois en train de réfléchir à voix haute : Duras, Godard) et réfléchit (métafiction, métacognition, dernière image du générique du Mépris : symétrie parfaite des caméras, la nôtre et celle de la fiction).

La bande-son moderne est affranchie des conventions. Elle n'est plus soumise à l'image, ce qui peut se traduire par un refus absolu de toute causalité verticale (chez Duras, son et image peuvent aller chacun de leur côté, raconter des choses différentes) ou à l'inverse par un respect absolu de la procédure d'enregistrement simultané de l'image et du son (chez Straub & Huillet, l'affranchissement se traduisant par l'acceptation de bruits accidentels captés par les machines)

Chez Jacques Tati, l'entreprise va plus loin que la simple volonté de conduire le spectateur à apprécier le bruit pour ses seules qualités "musicales ". Le bruit est non seulement digne d'être lu comme un objet esthétique, mais il est digne d'être le support d'un langage, lorsque deux groupes (étrangers ou enfants et adultes) ont besoin d'échanger des informations. Monsieur Hulot, qui sait goûter et maîtriser le bruit et vit selon le (faux) désordre qui caractérise cette classe de sons, semble construit comme la négation anticipée de l'être vivant tel que le décrivent les béhavioristes. Bien que Tati ne se berce pas d'illusions (Mon oncle s'ouvre sur un bruit de marteau-piqueurs : le "vieux monde"fantaisiste dans lequel vit Hulot n'en a plus pour longtemps), il est toujours possible à l'être humain de substituer aux cadres trop restrictifs des manières de percevoir plus libres (ici, plus proches de l'enfance).


Harpo ou la postmodernité

Nous datons la naissance du cinéma post-moderne à la sortie de La guerre des étoiles (1977) parce que ce film réunit les caractéristiques visuelles et narratives de ce style, mais aussi parce qu'il est le premier film à être présenté commercialement en système sonore Dolby. C'est que le film-concert est encore plus dépendant que les autres des conditions de projection. Il nécessite un véritable arsenal technologique multipistes pour produire ses stimuli en direction du corps des spectateurs, arsenal qui semble parfois revêtir plus d'importance que le contenu du film : "si vous y allez pour la salle", disait en novembre 1987 la publicité annonçant l'ouverture du cinéma Max Linder à Paris, "n'oubliez pas de regarder le film". C'est pourquoi le dispositif télévisuel classique, fatal à la production directe des sensations, évolue vers le "Home Cinema Theater". Le déplacement de la hiérarchie son / image dans le sens du concert a plusieurs conséquences. L'un des effets du dispositif multipistes est de dissocier la bande-son et la bande-image, favorisant une réception du film sur le mode du "son et lumière". Si cet effet est déjà assez sensible lorsqu'une salle moderne diffuse un film classique, il est particulièrement important quand le film a été conçu tout exprès pour une réception de ce type.

Lorsqu'en 1903, Claude Debussy commence la partition de La mer, il semble avoir à l'esprit des associations entre notes et images ; c'est le mouvement d'ensemble de la surface de l'eau, les variations infinies des reflets lumineux sur l'onde qui le fascinent. Il tente de "traduire"(les guillemets sont évidemment indispensables) des impressions visuelles. Il se place du côté du sujet, non de l'objet, comme les Impressionnistes ou même, en ce début de vingtième siècle, comme Louis Lumière, dont J.-L. Godard dit qu'il est le dernier des Impressionnistes. Lorsqu'Éric Serra compose le score du Grand Bleu, en revanche, il se place du côté de l'objet. Au jeu des correspondances debussystes héritées de Baudelaire va se substituer une démarche en termes de stricte analogie. L'abondance de sons graves et de réverbération qui caractérise l'écoute sub-aquatique va se retrouver transposée point par point sur la bande-son, des cris de dauphins sans doute échantillonnés venant ça et là accentuer la volonté imitative (le tout sur fond de mélodie tonale indispensable à un film qui ne sera rentabilisé qu'en étant vu par le "grand public").

Pour Debussy, en 1903, il s'agit d'un choix esthétique, mais pour les concepteurs-son du cinéma sonore, il s'agira longtemps d'une obligation. Une disparité technologique interdira cinquante années durant au cinéma de transposer à sa dimension sonore les effets illusionnistes qu'il multiplie sur le plan visuel. Cette contrainte - excédant le champ musical - aura des conséquences en termes de réalisme : les deux sensations les plus couramment éprouvées par un auditeur quelconque, et qui concernent la variation de dynamique et la localisation des sources sonores tout autour de lui dans les six directions de l'espace, le cinéma ne va pas pouvoir les rendre directement. Tout ce temps, la dynamique sonore sera rabotée aux deux extrêmes (du côté des pianissimi par le souffle ambiant, du côté des fortissimi par la puissance d'amplification / diffusion), et les cinéastes donneront au spectateur l'impression d'une dynamique élevée en filmant simplement la réaction d'un personnage (pour caricaturer, il grimace ou se bouche les oreilles) et l'impression de la présence d'une source sonore englobante en usant simplement de réverbération.

Les performances des systèmes d'enregistrement / reproduction sonore ne permettaient pas de procéder autrement, jusqu'à ce que la fin des années soixante-dix voit l'apparition puis la généralisation des systèmes multipistes. Il sera possible alors de délivrer des sons couvrant toute l'échelle dynamique et d'imiter de façon illusionniste la présence de sources englobantes. On aboutira à l'effet de bain procuré par les films-concerts, et qui donne au spectateur la sensation de flotter au centre d'un magma dont les sons, surtout les sons graves à grande dynamique, touchent directement, comme l'eau du bain - et même de façon bien plus intrusive qu'elle - son corps entier.
Ce flottement repose également sur un certain nombre d'indéterminations, notamment concernant l'appartenance des sons à un univers (flou de la frontière entre diégétique, c'est-à-dire monde de l'histoire, et extra-diégétique), et leur mode de production (est-ce de la flûte ou du synthétiseur ? etc.).

 

 

 

 

Actes de l'université d'automne - Musique(s) et cinéma(s) octobre 2003

Mis à jour le 15 avril 2011
Partager cet article
fermer suivant précédent