curva melodica

di Cinzia Avesani e Barbara Gili Fivela - Enciclopedia dell'Italiano (2010)

curva melodica

Cinzia Avesani e Barbara Gili Fivela

Definizione

L’espressione curva melodica si riferisce all’andamento continuo delle variazioni di altezza tonale, prodotte simultaneamente con i foni di un enunciato e realizzate entro un’unità linguistica per convogliare significati a livello di frase (➔ intonazione; ➔ prosodia). Dal punto di vista percettivo, la curva melodica contribuisce all’impressione di maggiore o minore musicalità di una lingua (➔ cantata, voce). Dal punto di vista fonetico, corrisponde ad un continuum di variazione che si manifesta come una sequenza di porzioni ascendenti e discendenti, di massimi e minimi, nel tracciato di frequenza fondamentale (➔ fonetica acustica, nozioni e termini di), accompagnate da allungamenti nella durata di foni e sillabe, e talvolta da pause.

Rappresentazione fonetica della curva melodica

L’altezza tonale (ingl. pitch) è generalmente definita come la sensazione uditiva per la quale i suoni si dispongono su una scala (musicale) che va da alto a basso. Nei suoni complessi (quasi-)periodici, come quelli del parlato, il correlato acustico dell’altezza è la frequenza fondamentale, o F0 (F-zero), la frequenza alla quale si realizza l’armonica più bassa del suono complesso, normalmente espressa in Hz.

fig. 1

Nei suoni del parlato, la F0 è determinata dalla velocità di vibrazione delle corde vocali: quanto maggiore è la velocità con cui le corde vocali oscillano, tanto maggiori sono la F0 dell’onda sonora complessa prodotta e l’altezza tonale percepita (benché, per valori al di sopra dei 500 Hz, non ci sia una corrispondenza lineare). Se la misuriamo per ogni ciclo del segnale quasi-periodico prodotto in un enunciato e ne riportiamo i valori in uno spazio cartesiano, con la F0 in ordinata e il relativo valore temporale in ascissa, la sequenza lineare dei valori rappresenterà la curva (o contorno) di F0 dell’enunciato (nella curva di F0 è quindi implicitamente rappresentata anche la durata dei segmenti dei quali viene calcolata la frequenza; tuttavia, la durata è ricavabile con più precisione dalla forma d’onda, solitamente riportata con la curva di F0: cfr. fig. 1).

Tra le tecniche per rilevare l’andamento della frequenza fondamentale di un enunciato la più comune consiste nel calcolare la F0 a partire dal segnale acustico, con programmi computazionali che ne calcolano automaticamente i valori e li visualizzano come sequenze nel tempo. I valori possono essere rappresentati secondo scale di tipo acustico (in Hz) o di tipo psico-acustico, che rispetto alle prime rispecchiano più fedelmente l’impressione uditiva dei cambiamenti di altezza. A questo secondo tipo appartengono la scala in semitoni, di tipo logaritmico, e quelle in Bark o in ERB (Equivalent rectangular bandwidth), di tipo semilogaritmico.

La rappresentazione acustica della curva melodica, qualunque sia la scala scelta, riflette una serie continua di variazioni indotte sia da eventi intonativi di tipo linguistico, sia da fatti di tipo paralinguistico (emozioni, attitudini del parlante), sia dalla natura dei foni dell’enunciato sul quale viene calcolata. Variazioni spurie possono essere indotte nel contorno di F0 anche dagli stessi algoritmi di calcolo, quando compiono errori di analisi come nella fig. 1 (con un errore di computazione pari a un salto di ottava nella F0 della vocale finale).

Interpretazione linguistica della curva melodica

Le modulazioni melodiche che percepiamo possono rappresentare variazioni di tipo categoriale oppure graduale. Il parlante può decidere di realizzare o meno un movimento intonativo su una determinata porzione di enunciato, e scegliere anche il tipo di movimento: ad es., può produrre un movimento discendente, ascendente, discendente-ascendente, oppure può modificare il modo in cui uno stesso movimento intonativo è realizzato, per es. scegliendo di espandere l’estensione della salita di un movimento ascendente o di realizzare l’intero movimento su un livello di frequenza (in ingl. pitch range) globalmente maggiore.

Le modulazioni della curva melodica hanno varie funzioni, linguistiche e paralinguistiche (➔ paralinguistici, fenomeni). Tra le prime, le principali sono:

(a) indicare quali siano le parole prominenti nell’enunciato e quale sia la loro prominenza relativa;

(b) indicare come debba esser suddiviso il flusso parlato in unità prosodiche (➔ prosodia), che possono corrispondere a enunciati successivi o a costituenti prosodici interni all’enunciato;

Da un punto di vista strutturale, la prima funzione, definita accentuale, è realizzata attribuendo un particolare movimento intonativo alla sillaba tonica della parola; la seconda funzione, detta scansione intonativa, è realizzata da una serie di fenomeni di giuntura che, singolarmente o nel loro insieme, concorrono a definire la presenza di un confine prosodico: pause, allungamenti della durata dei foni e delle sillabe finali della parola che precede il confine, movimenti intonativi discendenti o ascendenti su quelle stesse sillabe; la terza funzione è realizzata mediante la combinazione di particolari configurazioni melodiche (accentuali e di confine) o mediante variazioni globali della curva melodica.

Nei paragrafi seguenti descriveremo le caratteristiche principali della curva melodica dell’italiano alla luce di queste categorie e delle loro funzioni. I dati riportati sono relativi alle varietà su cui sono state compiute indagini approfondite e riguardano principalmente l’italiano parlato a Torino, Milano, Firenze, Pisa, Siena, Lucca, Roma, Napoli, Catanzaro, Bari, Lecce e Palermo (per una panoramica, cfr. Sorianello 2006 e ➔ intonazione).

Prominenze intonative e accenti tonali

Innalzamenti e abbassamenti di tono presenti nella curva melodica possono dare prominenza agli elementi linguistici in corrispondenza dei quali sono prodotti. Rappresentano il correlato fonetico principale degli accenti tonali, eventi melodici che si realizzano in relazione a domini prosodici specifici (in italiano e in molte altre lingue si tratta della ➔ sillaba).

fig. 2

Dal punto di vista fonetico le caratteristiche degli eventi tonali, accenti compresi, sono definite nei termini della loro sincronizzazione (o allineamento) rispetto agli elementi del dominio prosodico di riferimento e dei foni (per es., la sillaba, il nucleo vocalico) e nei termini dell’altezza tonale relativa (ingl. scaling) con cui vengono realizzati nell’intervallo di frequenze utilizzato dal parlante. Gli accenti intonativi corrispondono a innalzamenti e abbassamenti di tono, che normalmente si associano a sillabe metricamente ‘forti’ (come quelle toniche, caratterizzate dalla presenza di accento lessicale) e che possono variare per quanto riguarda la loro sincronizzazione con esse o per le loro caratteristiche di altezza tonale relativa (fig. 2).

Nel quadro teorico (tecnicamente denominato autosegmentale-metrico) cui si farà riferimento negli esempi proposti (Pierrehumbert 1980; Ladd 1996), gli accenti, come gli eventi di confine (cfr. § 2.2), sono definiti in base a due livelli tonali primitivi: alto (A; ingl. H, high) e basso (B; ingl. L, low); possono inoltre essere monotonali – alti (H*) o bassi (L*) – oppure bitonali – ascendenti (L+H*, L*+H) e discendenti (H+L*, H*+L) (l’asterisco indica l’associazione del tono alla sillaba prominente).

L’analisi delle varietà di italiano ha evidenziato differenze nel tipo di accento tonale utilizzato in relazione all’espressione di una stessa funzione linguistica (inteso quindi come unità fonologica), ma anche la presenza di variazioni fonetiche – di allineamento o di altezza relativa – nella realizzazione di uno stesso accento.

fig. 3

Le differenze sono evidenti nel caso di accenti che veicolino la focalizzazione (➔ focalizzazioni), ossia la prominenza prosodica che segnala una prominenza informativa. Ad es., l’accento tonale tipico delle frasi assertive italiane (e di molte lingue romanze) è realizzato solitamente alla fine del costituente che si intende presentare come informazione rilevante (il cosiddetto focus informativo). Si tratta di un accento discendente, riscontrato ad es. nelle varietà parlate a Napoli, Bari, Palermo, Firenze, Siena e Pisa (fig. 2, schema 1, e fig. 3, dove è indicato come H+L*).

fig. 4

Le caratteristiche di allineamento di questo accento non sono state studiate a fondo, ma le sue caratteristiche di altezza tonale relativa possono cambiare a seconda della varietà considerata (cfr. anche § 2.3) e in base alla forza illocutiva dell’enunciato (➔ illocutivi, tipi): ad es., nella varietà di Pisa l’altezza alla quale inizia la fase di discesa è direttamente proporzionale alla forza con la quale un parlante intende veicolare il messaggio (fig. 4).

fig. 5

Nel caso di focalizzazione contrastiva – ossia quando l’accento indica che il costituente deve essere opposto a un altro, normalmente corrispondente a una parte delle conoscenze condivise dei parlanti – si osserva una varietà estrema nei tipi di accenti riscontrati nelle varietà di italiano: ad es., l’accento contrastivo è ascendente-discendente nelle varietà di Palermo, Bari e Pisa (fig. 2, schema 2, e fig. 5, dove l’accento è analizzato come H*+L); nelle varietà parlate a Firenze, Siena e Napoli, invece, l’accento è ascendente (fig. 2, schema 3; fonologicamente: L+H*).

fig. 6

In tutte le varietà quindi è presente una componente tonale alta, ma la sua sincronizzazione con la sillaba accentata è molto diversa a seconda della varietà (anticipata in un caso e ritardata nell’altro). Tuttavia, anche quando gli accenti siano fonologicamente equivalenti, si riscontrano differenze fonetiche a seconda della varietà di italiano considerata. Ad es., l’accento contrastivo realizzato da parlanti di Pisa e di Bari è ascendente-discendente (analizzato in entrambi i casi come H*+L), ma è realizzato con un innalzamento tonale che in media inizia più tardi nella varietà di Pisa rispetto a quella di Bari (fig. 6).

Scansione intonativa

fig. 7

fig. 9

Il flusso parlato è suddiviso in unità prosodiche delimitate dalla presenza di fenomeni di giuntura (pause, allungamenti di sillabe e foni, movimenti intonativi sulla sillabe finali di parola). Tali unità sono denominate in letteratura in vario modo: gruppi di senso, gruppi di respiro, unità tonali, sintagmi fonologici, sintagmi intonativi. Nella curva melodica, il più evidente indice di confine di unità tonale è la pausa (fig. 7), ma non è affatto raro il caso in cui la scansione sia affidata solo a un forte dislivello tonale tra sillabe contigue (normalmente atone) che non può essere attribuito alla funzione accentuale dell’intonazione (fig. 9). Se il confine è segnalato solo da un movimento tonale, ha una forza minore: la percezione di un confine sarà infatti più forte quanto maggiore è il numero di fenomeni di giuntura concomitanti.

fig. 8

In tutte le varietà di italiano studiate i confini delle unità tonali sono realizzati con movimenti tonali discendenti o ascendenti (fig. 8, a sinistra) oppure statici, alti o bassi (fig. 8, a destra) la cui altezza in Hz può variare a seconda della varietà (ad es., i valori medi dei movimenti discendenti o bassi alla fine di un’unità tonale sono maggiori nell’italiano parlato a Milano che in quello di Roma e Catanzaro).

In diverse teorie prosodiche recenti si distinguono due livelli di unità prosodiche identificate dai fenomeni di giuntura: unità maggiori (sintagmi intonativi), delimitate da pause, allungamenti e toni di confine maggiore (indicati con H% o L%, nella teoria autosegmentale-metrica), e unità minori (sintagmi intermedi), delimitate dalla presenza di toni di confine minore (indicati con H- o L-) o di allungamenti nella durata dei foni.

L’enunciato Gianni è in poltrona e si sta leggendo un bel giallo (fig. 9), ad esempio, è suddiviso in due unità prosodiche minori, il cui confine è indicato dalla sola presenza di un movimento intonativo ascendente sulla sillaba atona finale di poltrona.

I confini delle unità prosodiche coincidono spesso con i confini delle unità sintattiche e possono delimitare costituenti di rango e natura diversi, quali ad es.: soggetti preverbali e costituenti dislocati (come nel caso della dislocazione a sinistra con ripresa pronominale nella fig. 7; ➔ dislocazioni), delimitati da innalzamenti o abbassamenti di tono; costituenti focalizzati, delimitati da abbassamenti di tono, come nell’italiano parlato a Firenze, Pisa, Torino, Bari, Palermo; clausole coordinate (fig. 9) o subordinate, delimitate entrambe da innalzamenti o abbassamenti di tono.

fig. 10

fig. 11

In tutte le varietà di italiano, la posizione di un confine tonale nella curva melodica contribuisce a disambiguare il significato di una frase che può avere due letture diverse. Ad es., la frase fece in modo di trovare la donna con i binocoli ha due significati diversi: grazie all’uso dei binocoli, ha trovato la donna (a; fig. 10) e fece in modo di trovare la donna che aveva i binocoli (b; fig. 11). La frase può essere scandita in due sintagmi intermedi in entrambe le letture. Ma solo se il confine prosodico cade dopo donna, come nella fig. 10, il significato inteso è (a); altrimenti, il significato è (b).

Modalità

fig. 12

Uno dei ruoli fondamentali svolti dall’intonazione, grazie alla variazione delle caratteristiche della curva melodica nel suo complesso, è quello di indicare la ➔ modalità della frase. Nelle varietà di italiano analizzate, le frasi assertive risultano caratterizzate da accenti tonali discendenti seguiti da andamenti bassi al confine (così a Torino, Milano, Firenze, Pisa, Bari, Lecce, Palermo: fig. 12, schema 1), talvolta prevalentemente bassi o realizzati nella porzione bassa dell’intervallo di frequenze utilizzato dal parlante (così a Roma: fig. 12, schema 2). La variabilità diatopica è principalmente legata a differenze fonetiche di altezza relativa dei picchi e dei minimi tonali che compongono gli accenti (ad es. questa è maggiore nell’italiano parlato a Pisa che a in quello di Firenze).

figg. 13

Il tipo di andamento tonale alla fine di un enunciato ha un’importanza particolare per indicare la modalità di una frase. In assenza di marche morfologiche o sintattiche che ne indichino la modalità è solo grazie al tipo di movimento intonativo finale che il parlante può segnalare se un enunciato deve essere considerato un’asserzione o una domanda polare (con risposta sì / no). Nel primo caso il movimento finale sarà discendente, nel secondo ascendente (o comunque conterrà una porzione ascendente nella parte finale dell’enunciato: cfr. la coppia minima nelle figg. 13 e 14). Questo può estendersi sulle sillabe atone postoniche finali oppure realizzarsi sulla parte finale della stessa sillaba che contiene l’ultimo accento intonativo se, come nel caso delle figg. 13 e 14, la parola finale di enunciato è un monosillabo tonico.

fig. 15

In molte varietà (per es., nell’italiano parlato a Torino e Milano; Firenze, Pisa, Siena, Lucca; Perugia e Roma; Lecce) il tratto intonativo che specifica la modalità interrogativa contiene una componente tonale alta al confine, e può essere realizzato sia con un movimento ascendente (fonologicamente: L-H%, fig. 14) sia con movimento ascendente-discendente (fonologicamente: H-L%, fig. 15).

fig. 16

In altre varietà, soprattutto meridionali, la componente tonale alta caratterizza invece l’accento intonativo finale della domanda polare e non necessariamente il suo confine: così a Napoli (fig. 16), Bari, Cosenza, Catanzaro e Palermo, dove l’accento intonativo finale è obbligatoriamente ascendente (fonologicamente: L+H* / L*+H) mentre le sillabe atone postoniche possono avere un movimento discendente (fonologicamente: L-L%).

Domande polari e asserzioni sono anche caratterizzate da escursioni tonali diverse, maggiori nelle domande polari che nelle asserzioni (per es., a Torino). Lo stesso tipo di movimento può subire dei cambiamenti di ordine fonetico, che costituiscono degli indici diatopici, sia nella sincronizzazione alla sillaba interessata sia nell’escursione del movimento: ad es., i parlanti pisani producono un’escursione tonale maggiore sulla sillaba tonica dei parlanti di Siena.

Le domande aperte, caratterizzate sintatticamente dalla presenza di una parola interrogativa (chi, perché, quando ecc.), mostrano un andamento melodico finale di tipo discendente

(fonologicamente: L-L%) nella maggior parte delle aree geografiche esaminate (costituiscono eccezioni Roma e Lecce); le domande aperte dunque possono avere un contorno melodico tipologicamente uguale a quello delle assertive. Indagini fonetiche mostrano però che, benché le specificazioni tonali finali siano basse in entrambi i casi, l’altezza media del contorno finale nelle domande aperte è superiore a quello riscontrato nelle assertive della stessa varietà (così a Milano, Roma e Catanzaro). Come già osservato per le domande polari, i valori melodici finali possono inoltre essere diversi a seconda della varietà di italiano considerata (ad es., il movimento discendente che si realizza a partire dal picco intonativo associato alla sillaba tonica è maggiore nella varietà di Catanzaro che in quella di Milano). Infine, nelle domande aperte è molto diversificata arealmente anche la tipologia dell’accento intonativo che precede il movimento intonativo finale.

Per la curva melodica delle modalità imperativa ed esclamativa la letteratura fornisce dati meno sistematici, che non permettono di avere un panorama completo della variazione diatopica. Gli enunciati imperativi sono caratterizzati da un andamento ascendente-discendente, fonologicamente analizzabile come un accento intonativo, con componente alta o bassa, seguito da toni di confine bassi (es. H+L* L-L% a Pisa e Lucca; L* L-L%, a Napoli; H* L-L%, a Firenze). Tra gli enunciati imperativi, ordini e istruzioni sembrano differenziarsi in base ad altre caratteristiche prosodiche, come la velocità di eloquio (così nel parlato spontaneo di Firenze).

Le analisi disponibili per la curva melodica di enunciati esclamativi evidenziano che una caratteristica importante è l’ampiezza dell’intervallo di frequenze utilizzato, maggiore rispetto a quella che caratterizza enunciati assertivi. Variazioni sistematiche nell’ampiezza dell’estensione melodica sono state osservate anche in relazione a enunciati che comunicano incredulità: molto più ampie rispetto a quelle degli enunciati assertivi, come ad es. nel parlato di Bari e di Pisa.

Studi

Ladd, Robert D. (1996), Intonational phonology, Cambridge, Cambridge University Press.

Pierrehumbert, Janet B. (1980), The phonology and phonetics of English intonation, (PhD Thesis), Massachusetts Institute of Technology (rist. Bloomington, Indiana University Linguistics Club, 1987).

Sorianello, Patrizia (2006), Prosodia. Modelli e ricerca empirica, Roma, Carocci.

GRAMMATICA in Lingua