Theo Van Leeuwen. Speech, Music, Sound.
Londres: Macmillan, 1999. 231 p.

Description, critique et évaluation
par Martine Rhéaume
dans le cadre du cours
Tendances dans l'étude de la musique populaire,
Faculté de musique, Université de Montréal, décembre 2003

Version PDF (à conseiller)Annexes 2, 3, 5, 6 et 1Annexe 4Annexe « System Network of Timing »

Introduction

Nous présentons ici une revue littéraire du livre Speech, Music, Sound de Theo Van Leeuwen publié à Londres aux éditions Macmillan en 1999. En première partie, nous proposerons une description du livre, d'abord en faisant ressortir sa structure globale et l'idée principale qui lui sert de fil conducteur, puis en survolant les aspects traités. La seconde partie apportera une vision critique de l'ouvrage, tant du côté de la forme que de celui du contenu, et proposera une utilisation du livre au sein des tendances dans l'étude de la musique populaire.

A. Description de Speech, Music, Sound

I. Structure globale
a) Le livre et l'auteur

Le livre Speech, Music, Sound est divisé en huit chapitres auxquels s'ajoutent une Annexe explicative des « system networks », un Glossaire, une Bibliographie et un Index. Les six chapitres centraux portent chacun sur un des six aspects que van Leeuwen considère communs à la fois à la parole, la musique et les autres sons, c'est-à-dire : la perspective (chapitre 2), le temps (chapitre 3), les sons en relation (chapitre 4), la mélodie (chapitre 5), la qualité vocale et le timbre (chapitre 6) et la modalité1 (chapitre 7). Le chapitre 1 est consacré à l'énonciation de la méthodologie utilisée ainsi qu'à l'introduction et l'explication de certains termes et certaines notions théoriques dont l'auteur fera usage tout au long du livre. Quant au chapitre 8, intitulé Afterword, van Leeuwen y synthétise sa vision globale des rapports entre parole, musique et autres sons et des significations qu'on peut leur donner en faisant des liens avec son approche sémiotique de la communication par l'image2.

Avant d'aller plus loin, il est important de dire quelques mots sur l'auteur. Contrairement à la tendance générale dans l'étude de la musique populaire, Theo van Leeuwen n'est ni un musicologue ou un ethnomusicologue, ni un anthropologue, ni un sociologue et n'est pas non plus impliqué dans ce qu'il est convenu d'appeler les Cultural Studies, à défaut d'avoir un équivalent français satisfaisant. Van Leeuwen est plutôt un musicien de jazz amateur, un cinéaste et, au moment de la publication de l'ouvrage, était professeur de Théorie de la communication au London College of Printing3. Il utilise une approche sémiotique pour proposer des pistes de significations pour la parole, la musique et les sons, certes, mais cette approche est basée sur ce qu'il connaît le mieux en sémiotique des médias : l'image. Il est important de savoir cela afin de bien comprendre le but visé par l'ouvrage : « [to] fill a gap in the theory units of both largely vocationally orientated courses in film, video, sound and multimedia design, and in more theoretically orientated courses in communication, media and film studies »4. Le livre est donc non seulement conçu comme un cours, mais comme un cours de premier cycle pour des non-musiciens et non-musicologues5.

b) Les chapitres

Tous les chapitres de contenu, soit les chapitres 2 à 7, sont construits de la même façon. L'auteur livre d'abord ses idées théoriques en rapport avec le paramètre traité dans le chapitre et résume la théorie à un ou plusieurs endroits (voir summary, Annexe 2), selon la densité théorique de ce qu'il propose et les divisions qu'il opère à l'intérieur du chapitre. Il établit ensuite un system network, c'est-à-dire un réseau construit de façon taxinomique et plus ou moins dichotomique en cela qu'il divise la plupart du temps en deux les composantes du paramètre dont il traite [bien qu'à des niveaux éloignés de spécificité il puisse y avoir jusqu'à cinq choix] et classe les phénomènes sonores d'après ces dichotomies et pluritomies. Les system networks, c'est la manière pour l'auteur d'exprimer sa systématicité ; on peut les définir comme une représentation graphique et synthétique, comme on le verra plus loin. Après la construction de son system network, van Leeuwen l'applique à un exemple concret qu'il analyse selon le système qu'il s'est construit ; il propose ensuite une série d'exercices pour que le lecteur-étudiant expérimente le system network en question.

Prenons maintenant à titre d'exemple de system network celui du chapitre 2 intitulé Perspective.

A system network of aural perspective and social distance. S, M, S, p. 30

 

Notons qu'ici, comme dans tous les system networks, l'accolade { signifie un choix possible simultané, la parenthèse carrée [ , un choix dichotomique [un son est soit statique, soit dynamique, il ne peut être les deux à la fois, alors qu'il peut tout à fait donner une impression d'immersion et créer une distance sociale] et la flèche à double tête ? , un choix gradué [la distance sociale d'un son peut se situer à mi-chemin entre personnel et informel].

Référons-nous également à la Table des matières « complétée » (Annexe 2) afin de mieux comprendre la structure des chapitres. Dans cette annexe, nous avons ajouté les sous-titres à la table des matières afin d'y voir d'un seul coup d'?il la structure et le contenu des chapitres. Dans le chapitre 2 sur lequel nous nous penchons à ce point-ci, van Leeuwen énonce d'abord des critères plus généraux de la perspective sonore [Annexe 2, chapitre 2, points 1. Perspective and social distance, et 2. Perspective and the soundscape] qu'il résume en 6 points en page 22-23. Cette première section du chapitre et ce résumé explicitent déjà certains aspects du system network, soit toute la partie supérieure, c'est-à-dire les éléments spécifiques qui découlent d'un son créant une perspective entre le son et l'auditeur. L'auteur explique ensuite comment un son peut suggérer une distance sociale [An. 2, ch. 2, point 3. Sound and social distance] qu'il résume en quatre points (p. 27) ; on trouve définis dans cette section et ce résumé la distance sociale que crée un son par rapport à l'auditeur et les choix gradués de distances possibles, soit toute la section du bas du system network. Le point 4 de son chapitre, l'immersion sonore - qu'il semble considérer comme non-analysable, vu le cul-de-sac qu'amène ce type de relation sonore dans son system network - est associée avec le « lofi soundscape » de Murray Schafer, qu'il cite judicieusement dans cette section en page 29.

À l'intérieur de son exemple [An. 2, ch. 2, point 5. An example : perspective and social distance in the radio play, p. 29], il introduit son premier system network, reproduit ci-haut à l'exemple 1, qu'il applique à l'analyse d'une pièce de radio-théâtre. Avant de regarder comment il découpe son analyse, lisons ensemble sa définition de system network : « The distinctions introduced in this chapter can be summarized in the form of a `system network' (Figure 2.2). The assumption is that any sound must relate to the listener in one of the ways mapped out in the network, in other words, that for any sound a `choice' must have been made from the ressources of the systems of perspective and social distance »6. La matière des chapitres peut donc se résumer via les system networks qu'il en déduit, si on y comprend bien les termes utilisés. Devrions-nous avoir un blanc de mémoire concernant un terme ou l'autre, il nous suffira d'aller lire le résumé [summary] correspondant. Afin d'inclure ce système dans une vue concrète, l'auteur applique le system network du chapitre 2 à la pièce de radio-théâtre Wild Honey diffusée à l'Australian Broadcasting Commission en 1992 (p. 31). Cet exemple, comme tous les exemples en fin de chapitre, est rendu sous la forme d'un synopsis de cinéma. Nous verrons en B-I une suggestion sur la forme des exemples.

Le chapitre 2, comme chaque chapitre, se termine avec une série d'exercices pédagogiques qui présupposent un certain environnement technique. Ces exercices permettent généralement d'appliquer le system network établi sur les trois types de sons traités tout au cours du livre, soit la parole, la musique et les autres sons.

c) L'appareil critique

L'annexe concernant les system networks est pratique et bien construite et permet à l'auteur d'expliquer sa façon de fonctionner à partir d'un terrain qu'il connaît bien : l'image. Le glossaire, la bibliographie et l'index sont construits comme il se doit, selon les règles de l'art.

II. Fil conducteur et aspects traités

Theo van Leeuwen explique sa méthodologie et le but de son ouvrage dans l'introduction au chapitre 1. Son but est d'intégrer la parole, la musique et les sons en explorant le terrain commun qui existe entre ces phénomènes7. Pour ce faire, il se base sur les travaux de linguistes - Saussure, Barthes, Halliday - et de musicologues - Tagg, Schafer - sur des courants artistiques - Russolo, le Dadaisme - ainsi que sur ses propres travaux en sémiotique de l'image. Avant d'introduire son approche concernant les system networks, il décrit les ressources sémiotiques qui sont à portée de main aujourd'hui pour construire et analyser des significations pour les sons, sous la forme de la parole, de la musique ou autres. Il écrit : « A new discipline of `sound design' is emerging. [...] A semiotics of sound [...] takes the form of an annotated catalogue of the sound treasures Western culture has collected over the years »8. Il indique par la suite que la méthode d'analyse qu'il propose ne se veut pas une grammaire, un code, mais bien un champ de possibilités desquelles on peut choisir. Une phrase, qui se trouve au chapitre 8, aurait eu ici une place plus pertinente à propos de la notion de signification (meaning) : « sign producer and sign interpreter are involved in the same kind of activity, making meaning, and use the same semiotics principles to do so. »9 ; selon lui, le « meaning » qu'il propose est intersubjectif, c'est-à-dire qu'il fournit des outils pour qu'étudiants et autres lecteurs se « fabriquent » des significations. La notion de « meaning » s'inscrit dans une perspective technicienne. Pour l'auteur, on place un son, un bruit, une musique avec une intention de communication. Dans un contexte musical, cela signifierait qu'on peut trouver un sens explicite à chaque section d'une pièce.

En début de sous-section, nous avons vu que le but de van Leeuwen est d'explorer le terrain commun entre la parole, la musique et les sons. Ce terrain commun se divise, selon l'auteur, en six paramètres qui se résument chacun par un system network. Ces six paramètres sont la perspective, le temps, les sons en relation, la mélodie, la qualité vocale et le timbre, et enfin la modalité. Comme la plupart de ces termes sont parfaitement clairs et que l'auteur lui-même considère que ses chapitres peuvent être résumés par les system networks qu'il a construits, nous renvoyons à l'Annexe 3, Montage des system networks, en guise de résumé du contenu.

Un terme cependant pose problème : modalité. Voici la signification que lui donne l'auteur : « The term `modality' refers to the degree of truth assigned to a given sound event. The term `truth' takes on a somewhat different meaning depending on whether it pertains to presentation or representation »10, alors qu'en musique, ce terme a une signification bien précise et, qui plus est, est loin d'être rare ou spécialisé. Nous traiterons de cette non concordance en section B-I.

B. Vision critique de Speech, Music, Sound

I. Forme et contenu
a) Le titre et ce qui s'y cache

Le titre Speech, Music, Sound indique bien à quelle enseigne l'auteur se loge malgré ses prétentions. En effet, dès le début du cinéma parlant, on a commodément partagé les tâches entre la piste de parole en synchronisation avec l'image, la piste de musique enregistrée séparément et montée en parallèle et la piste de bruitage et d'ambiance, enregistrée séparément également. Cette séparation se remarque facilement sur les appareils de montage de cinéma où les pellicules à engrenage sont mécaniquement synchronisées. On « entend » ce montage en parallèle dans les westerns traduits où, par exemple, dans un bar, le dialogue est en français tandis que les échanges aux tables sont en anglais. Bref, pour l'exportation, on disposait de la piste universelle comprenant la musique et les effets sonores et localement, on ajoutait la piste linguistique dans la langue désirée sans avoir à toucher le reste du montage sonore. Cette technique est en quelque sorte devenue une théorie quand H.M. Tremaine a commencé à publier son Audio Cyclopedia (1955 et éditions successives jusqu'en 1977). Depuis ce temps et jusqu'à tout récemment, quand on réfléchit sur le son dans les médias, la théorie ressemble à la technologie. D'ailleurs, c'est ce même Tremaine qui avait publié dans son Audio Cyclopedia un tableau des instruments à privilégier pour exprimer un sentiment en particulier. Les dessins animés avant l'ère de l'informatique se référaient à cette codification très sûre et efficace. Or notre auteur communie bien davantage à ce contexte technico-médiatique qu'aux théories qu'il évoque. La linguistique, la sémiotique et la musique forment un cadre théorique, soit, à condition de percevoir que c'est d'abord par nécessité technique et par commodité de la pratique que tout cela est venu. Probablement que la perspective d'en faire un cours et de situer cela en contexte académique a transformé l'auteur de technicien et de musicien de jazz amateur en professeur qui s'inspire de théories et notamment de la systémique pour faire ?uvre pédagogique.

b) Les system networks

Il est évident que les system networks proposés par van Leeuwen ont une certaine utilité : ils permettent au lecteur-étudiant de réviser rapidement des concepts dont il a lu la théorie et lui donnent également un outil pratique d'analyse à appliquer à son entourage et aux messages sonores qu'il reçoit. Cependant, bien que le but visé soit tout autre, nous craignons que ces schémas à appliquer, ce prêt-à-analyser, ne soit pris au pied de la lettre par l'étudiant de premier cycle auquel l'ouvrage semble s'adresser, c'est-à-dire qu'il trouve là un système gagnant, qui fonctionne à tout coup et qui donne cent pourcent de réponses scientifiquement exactes cent pourcent du temps. Il est évident, comme nous l'avons vu plus haut, que l'auteur met le lecteur en garde contre cette facilité en lui indiquant - mais aussi tard que dans la conclusion - qu'il s'agit pour lui de créer ses propres significations à partir des bases qu'il a jetées pour lui ; cela ne veut pas dire pour autant que le piège soit totalement évité.

Ce type de division dichotomique et taxinomique existe depuis fort longtemps. La technique à la fois la plus ancienne et la plus semblable que nous ayons pu trouver est celle de Pierre de la Ramée (1515-1572), aussi connu sous le nom de Petrus Ramus, un philosophe et mathématicien humaniste français, qui s'est notamment inscrit contre la pensée d'Aristote, et qui avait développé une technique de schématisation basée sur la dialectique, qui permettait une mémorisation efficace et rapide. Afin de mesurer la correspondance entre les deux techniques, consultons l'Annexe 4. La vie de Cicéron selon Petrus Ramus. Ce type de schéma avait alors été critiqué par les contemporains de Ramus bien qu'il ait eu une certaine résonance du côté des pays Protestants.

Nous nous permettrons également d'apporter aux system networks une critique qui s'apparente aux critiques faites à l'épitomé de Ramus de l'Annexe 4: certaines dichotomies semblent plutôt drastiques, hermétiques, sans espace pour la nuance. Reprenons à ce sujet notre exemple-phare de system network, celui du chapitre 2, reproduit plus haut à l'exemple 1[on peut également consulter cet exemple à l'Annexe 3. Montage des system networks ] . Au second niveau de précision, on voit la division Immersive et Perspectival où seuls les sons qui créent une perspective peuvent amener à une analyse plus précise, passant par la division statique/dynamique pour apporter graduellement les notions de « Figure », « Ground » et « Field » (premier plan, décor sonore [littéralement plancher, fond] et champ sonore)11. Cette division entre immersion et perspective semblant un peu fermée, rapportons-nous au contenu du chapitre, au point 4- Immersion, où il écrit clairement « Perspective and hierarchization disappear »12, ce qui en apparence justifie la division que l'on retrouve dans le system network. Il donne ensuite trois différents exemples possibles d'immersion sonore : 1- « this is also the condition of the lofi urban environment », 2- « the car, with speakers in every corner, can become a cocoon of booming bass sounds » et enfin, 3- son exemple de la trame sonore du film The Piano, dont l'effet de « foregrounding of the inner emotions and [...] backgrounding of the sounds of the world around us »13 peut être recréé via le baladeur. À travers ces exemples d'immersion, nous voyons pourtant une forme de perspective plutôt évidente : dans un environnement urbain, même lointain, certains sons ressortent plus que d'autres - les klaxons, le bruit strident d'un autobus qui freine - et se trouvent donc au premier plan, ou du moins dans un plan sonore plus rapproché. Également, un marcheur écoutant la musique de son baladeur se crée une immersion de premier plan à travers laquelle, s'il porte un certain intérêt à ne pas devenir sourd, il entend un décor sonore dans lequel il est également en situation d'immersion ; serait-il trop absorbé par sa musique pour se concentrer sur les dangers du monde qui l'entoure que le klaxon d'une voiture aurait tôt fait, par un mouvement dynamique de proximité croissante, de se retrouver lui aussi au premier plan sonore de notre marcheur. Peut-être aurait-il fallu indiquer après Immersive, comme il est fait après Perspectival dans le system network, les mêmes possibilités de choix statique/dynamique. Ce n'est qu'un exemple qui tente de démontrer la limite de ce système dichotomique, autrement relativement bien fait et donnant des outils intéressants pour une analyse sémiotique de base des sons, paroles et musiques qui nous entourent.

Toujours au sujet des system networks, puisqu'ils sont sinon l'âme, du moins le corps de cet ouvrage, nous avons encore un bémol à apporter, mais malheureusement, il sera ici difficile de proposer une suggestion. Advenant le cas où nous supposons que chaque system network offre une analyse complète de chaque paramètre commun à la parole, la musique et les autres sons (perspective, temps, sons en relation, mélodie, qualité vocale et timbre, modalité), comment serait-il possible d'analyser complètement un événement sonore en considérant l'ensemble de ces paramètres ? Le modèle ressemblant à un synopsis de film que l'auteur utilise pour rendre compte de ses analyses ne tiendrait plus la route, puisqu'il demanderait beaucoup trop d'espace et perdrait énormément en clarté, alors que ce n'est déjà pas sa plus grande qualité, comme nous le verrons au point suivant.

Pour réaliser une telle analyse, il faudrait d'abord appliquer à l'événement sonore étudié tous les system networks, simultanément ou l'un à la suite de l'autre. Serait-il possible de créer un seul méta-system network qui les engloberait tous ? Nous pensons que non, même si par un avancement soudain de la science il était possible de représenter un objet dans plus de trois dimensions. Même la technique informatique de l'hypertexte, qui permet plus ou moins d'ajouter une troisième dimension aux deux présentes dans une version papier, ne donnerait ici aucun résultat satisfaisant, puisque les hyperliens passant d'un paramètre à un autre ne donneraient jamais une vision globale. Si on laisse de côté cet hypothétique et impossible méta-system network, comment pourrait-on, selon le modèle de compte-rendu d'analyse de van Leeuwen, réaliser une analyse d'un événement sonore selon tous les paramètres explicités dans le livre. Si on juxtapose six analyses effectuées à partir des six system networks, nous aurons à la fois un problème d'espace et de clarté. Voyons pourquoi à la lumière de l'exemple qu'il propose dans le chapitre sur les sons en interaction (ch. 4) où il analyse le duo « Bess, You Is My Woman Now » de l'opéra Porgy and Bess de Gershwin (p. 86 à 89, voir Annexe 5). Dans la première colonne du tableau, l'auteur divise le duo en divers événements sonores, événements qu'il qualifie avec un à trois mots (mais parfois même aucun) dans la seconde colonne ; dans la dernière, il explique brièvement les relations entre les sons et qualifie, encore une fois, ces relations. Ces colonnes, qui ne portent d'ailleurs pas de titre, ne sont pas très claires mais elles ne sont encore, heureusement, que deux. Pourtant, pour faire une analyse de ce duo selon tous les paramètres du livre, donc pour en faire une analyse complète, il faudrait 12 colonnes regroupées par deux (où souvent la première qualifie et la seconde explique) et adjointes à la colonne de division des événements sonores ; ce compte-rendu d'analyse ne pourrait être efficace parce qu'à la fois trop flou et pas assez concis. C'est ici que la technique développée par van Leeuwen trouve sa plus grande faille, parce qu'aussi précise que soit une analyse partielle, elle n'est toujours qu'un chemin vers une analyse complète, c'est-à-dire une compréhension complète d'un phénomène, sonore ou autre.

c) Les exemples

Nous l'avons vu dans la première section de cet essai, chaque chapitre se termine par un exemple qui permet à van Leeuwen d'appliquer le system network qu'il vient de construire. Prenons comme exemple type celui auquel nous avons déjà référé plus haut, c'est-à-dire le duo « Bess, You Is My Woman » de Porgy and Bess, analysé en fin de chapitre 4 (pp. 86-89) et reproduit ici à l'Annexe 5. Cet exemple a un défaut majeur duquel découle tous les autres : il n'y a aucun repère temporel, alors que le qualificatif premier de la musique - et en y pensant bien, de la parole et des autres sons également - est qu'il s'agit d'un objet qui se déroule dans le temps, qui ne peut être saisi en entier à un instant précis et qui, ainsi, fait constamment référence à la mémoire de l'auditeur. Il est possible que ce soit la forme choisie - qui s'apparente à un synopsis de film, pour en avoir vu quelques-uns - qui ait poussé l'auteur à mettre de côté le repère temporel, bien que dans les synopsis, une colonne est toujours réservée au minutage. Qui plus est, les colonnes de l'exemple ne portent pas de titre, ce n'est donc qu'en lisant une bonne partie de ce qu'elles contiennent qu'on peut déduire à quoi elles sont dédiées. L'absence de repère par rapport au temps et de titre aux colonnes met en péril la clarté de l'exemple et sa convivialité, or la convivialité est cruciale lorsqu'on s'adresse à des étudiants de niveau collégial ou de début de premier cycle universitaire.

Nous nous permettons donc de proposer ici deux solutions, la première inspirée de Philip Tagg dans son livre Fernando the Flute (1991) et la seconde, de Serge Lacasse dans sa thèse de doctorat "Listen to My Voice": The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression (2000). La première proposition se base sur le tableau d'occurrence des musèmes (Table of musematic occurrence), dont on trouve un exemple, appliqué à la chanson « Fernando » de ABBA, à l'Annexe 6. En modifiant ce tableau pour y rendre compte de l'analyse de « Bess You Is My Woman » faite par van Leeuwen, on pourrait mettre dans la première rangée [chez Tagg : Intro., Verse 1, etc.] les éléments de la première colonne [chez van Leeuwen : 1. Group melody (strings), 2. Solo melody (cello), etc.], avoir dans la rangée suivante le temps de chaque section14 et dans les autres, ce que van Leeuwen met dans ses deux dernières colonnes, sans oublier le déroulement temporel et la légende - qui chez Tagg rapporte le lecteur à un tableau précédent - qui pourrait rapporter aux sections du chapitre ou au system network correspondant.

La seconde proposition se base sur la ligne temporelle de Serge Lacasse dans son analyse de « Front Row » d'Alanis Morissette reproduite à l'Annexe 6. La transformation est simple : on inscrit sur la ligne de déroulement temporel les éléments de la première colonne de van Leeuwen, et aux second et troisième niveaux, on inscrit les éléments des deux colonnes de droite. Ces propositions ont un point en commun : l'inclusion du phénomène de déroulement temporel. Nous avons choisi de prendre ces deux exemples comme base pour notre proposition parce qu'ils rendent tous deux compte de cet aspect sans mettre de côté les autres éléments qu'ils souhaitent intégrer dans le tableau ni mettre en péril leur clarté.

d) Musique et non musicien : problème rencontré

L'auteur n'est pas un musicien professionnel, cela devrait-il l'empêcher d'écrire sur la musique ? Nous croyons que non. Cependant, lorsqu'on écrit sur un sujet dont on entrevoit la multitude des termes techniques, un auteur se doit de vérifier s'il ne fait pas un mauvais usage de certains termes. Nous en avons parlé en A, le chapitre 6 s'intitule Modality, modalité. C'est un terme musical extrêmement simple et courant qui, adjoint à d'autres qualificatifs, décrit l'échelle sonore dans laquelle se déroule une partie - courte ou longue - d'une pièce musicale. Le lecteur musicien consultant la table des matières pour la première fois est porté à se demander comment la notion musicale de modalité peut être appliqué à la parole et aux sons, curiosité qui sera déçue, puisque la modalité de van Leeuwen réfère au degré de « vérité » qu'on accorde à un son donné15. S'il est vrai que le livre ne s'adresse pas aux musiciens, il ne faut pas oublier que les musiciens seront probablement portés à le lire. Dans ce type de conflit, deux solutions s'offrent à l'auteur : ne pas utiliser le mot modalité - ce qui aurait peut-être été difficile, puisque ce doit être un mot qu'il utilise également dans ses ouvrages sur l'image - ou alors avertir, dès la première occurrence du mot, qu'il sera pris dans un certain sens et non dans le sens musicalement convenu.

e) Approche pédagogique

L'approche pédagogique est certainement le plus grande qualité de Speech, Music, Sound. L'auteur n'amène pas de théories particulièrement nouvelles, mais il s'applique pour qu'avant tout, le lecteur comprenne. Rien n'est laissé au hasard : toutes les techniques utilisées dans les ouvrages de vulgarisation16 sont employées afin qu'aucun concept n'échappe au lecteur. La théorie est simple, concise, claire, fréquemment illustrée de courts exemples concrets tout à fait à propos et les résumés en sont complets et clairs, en un mot conviviaux. Malgré les questionnements qu'on peut apporter au sujet des system networks, ils n'en demeurent pas moins un excellent outil pédagogique de par leur construction visuelle logique et leur concision. Les exercices, bien que certains présupposent un environnement technique relativement élaboré, sont plutôt intéressants et appropriés puisqu'ils permettent au lecteur-étudiant d'appliquer immédiatement la théorie qu'il n'a eu d'autre choix que de comprendre.

L'approche pédagogique ressemble en plusieurs points à celle du livre Ear Cleaning de R. Murray Schafer, livre malheureusement absent de la bibliographie de van Leeuwen. Le livre de Schafer propose, à peu près sous le même forme que celui qui nous occupe, une solution alternative pour les professeurs enseignant l'approche de la musique en première année de baccalauréat au Canada anglais, ce qui correspond en termes d'âge et de scolarité à la dernière année du niveau collégial québécois, donc à un niveau pré-universitaire avancé. C'est à un public correspondant que s'adresse Speech, Music, Sound.

II. Speech, Music, Sound et les tendances dans l'étude de la musique populaire

Il est évident que le livre Speech, Music, Sound n'est pas un grand incontournable de la littérature sur l'étude de la musique populaire, mais il faut garder à l'esprit que ce n'est pas là le but visé par l'auteur. Un chercheur se penchant sur l'étude de la musique populaire sera tôt ou tard appelé à transmettre son savoir à des étudiants plus ou moins avancés, et dans des domaines plus ou moins connexes. À l'instar de Ear Cleaning de Murray Schafer, Speech, Music, Sound propose une approche simple, mais tout à fait efficace, qui pourrait servir de guide à un cours d'introduction à la sémiotique des sons à un niveau collégial. Un tel cours aurait toute légitimité et ne serait pas, ainsi, considéré comme simple. Il n'est jamais trop tôt pour une initiation à la sémiotique des sons, et celle apportée par van Leeuwen est claire, efficace, mais surtout, conviviale.

C'est donc ici l'approche pédagogique et la convivialité qui permettront à Speech, Music, Sound de se créer une place toute particulière au sein de la tendance dans l'étude de la musique populaire, en parallèle avec les Cultural studies et les études musicologiques. Dans l'élaboration d'une science, il ne faut pas oublier les néophytes ; il ne faut pas oublier de les former et de les informer, parce que ce sont peut-être eux qui, plus tard, fourniront des ouvrages permettant l'enrichissement de cette science. Van Leeuwen s'acquitte de cette tâche de façon simple et brillante et pourra servir de guide à d'autres ouvrages pédagogiques sur des sujets peut-être plus directement axés sur l'étude de la musique populaire.

 

Bibliographie

Lacasse, Serge. "Listen to My Voice": The Evocative Power of Vocal Staging in Recorded Rock Music and Other Forms of Vocal Expression. Liverpool : PhD, Institute for Popular Music In Liverpool, 2000.

McKnight, Cliff, et al. Hypertext in Context. Cambridge : Cambridge University Press, 1991.

Schafer, R. Murray. Ear Cleaning. Toronto : Berandol Music Limited, 1967.

Tagg, Philip. Fernando the Flute (2nd edition). New York : Mass Media Music Scholar's Press, 2000.

Tremaine, Howard M. Audio Cyclopedia (2nd edition). Indianapolis : H. W. Sams, 1969

Van Leeuwen, Theo. Speech, Music, Sound. Londres : Macmillan, 1999.


1. Sur la notion de modalité chez Leeuwen, voir section A-II et section B-I.

2. À ce sujet, voir l'Annexe 1: Bibliographie choisie de l'auteur.

3. Il est présentement directeur du Centre for Language and Communication au School of English, Language and Communication de l'Université Cardiff au Pays de Galles.

4. Theo van Leeuwen, Speech, Music, Sound. Londres: Macmillan, 1999. Couverture arrière du livre.

5. Nous verrons en B-II qu'il est cependant possible d'en tirer quelque chose en musicologie.

6. Theo van Leeuwen, op. cit., p. 29.

7. Id., p. 1.

8. Ibid., p. 6.

9. Ibid., p. 193

10. Ibid., p. 180

11. Ces notions sont empruntées au monde de l'image et des sons en parallèle, notamment au monde de la télévision ; l'auteur traite du son, mais en tant que rayon de l'image et de la technique.

12. Theo van Leeuwen, op. cit., p. 28.

13. Ibid., p. 29.

14. Dans le Table of Musematic Occurrence reproduit à l'Annexe 6, Tagg inscrit également les numéros de mesure dans cette rangée. Selon l'optique de van Leeuwen, qui s'adresse à des étudiants a priori non musiciens, cette information n'est pas nécessaire et pourrait brouiller les pistes.

15. Theo van Leeuwen, op. cit., p. 180.

16. Nous pensons, par exemple, à la très populaire série des livres ...for Dummies ou des Idiot's Guide to...