vocali
Insieme alle ➔ consonanti, le vocali (dal lat. (litteram) vocālem «lettera provvista di voce») sono una delle due fondamentali categorie di foni linguistici (➔ fonetica; ➔ fonologia).
Per definire le vocali occorre innanzi tutto identificare le loro differenze fonetiche e fonologiche rispetto alle consonanti. Per quanto concerne il meccanismo di produzione, sono diverse le modalità con cui le due categorie vengono articolate: le consonanti sono prodotte con un’occlusione o un restringimento in qualche punto delle cavità superiori all’interno del canale fonatorio; le vocali, invece, sono articolate senza alcuna chiusura o costrizione: durante la loro produzione l’aria fuoriesce in maniera relativamente libera attraverso la bocca (vocali orali) o attraverso la bocca e il naso (vocali nasali).
Secondo una definizione fonologica, le vocali si distinguono dalle consonanti per come vengono impiegate nell’organizzazione della sequenza: di solito le consonanti stanno ai margini della ➔ sillaba (come, ad es., [p] e [r] nella prima sillaba della parola parte), mentre le vocali occupano una posizione centrale, il cosiddetto nucleo (o centro sillabico).
Per certe classi di foni non è tuttavia facile l’attribuzione all’una o all’altra categoria. Si pensi per esempio alle consonanti prodotte con articolazione aperta, ovvero alle approssimanti dell’italiano [j] e [w] (➔ semivocali) e alle ➔ laterali [l] e [ʎ]: rispetto alle vocali sono articolate più rapidamente, ma come le vocali hanno dal punto di vista acustico una struttura formantica (➔ fonetica acustica, nozioni e termini di) ben riconoscibile. Parimenti, anche il criterio di sillabicità presenta qualche punto controverso: alcuni foni, pur essendo più brevi delle vocali vere e proprie, hanno caratteristiche ad esse molto simili e tuttavia non possono costituire nucleo sillabico (si pensi alla semivocale [i̯] di tuoi); altri foni non vocalici come le liquide e le ➔ vibranti in alcune lingue possono ricorrere in posizione di nucleo sillabico (si pensi all’ingl. [lɪtl̩] little «piccolo») e sono pertanto indicati con il simbolo dell’alfabeto IPA per segnalare la sillabicità [ˌ](➔ alfabeto fonetico; ➔ trascrizione fonetica).
Pike (1943), cercando di risolvere le contraddizioni summenzionate e separando le considerazioni di natura fonetica da quelle di natura fonologica, introdusse le categorie di vocoide e contoide. Una classificazione fonetica distingue i vocoidi dai contoidi in base a criteri squisitamente articolatori (ovvero, per i primi, articolazione aperta, non laterale, non completamente nasale, non vibrata) e acustici (presenza, nei vocoidi, di durata maggiore, di sonorità intrinseca, e assenza di frizione). Una classificazione fonologica oppone le vocali alle consonanti sulla base di considerazioni funzionali (ad es., la posizione nella sillaba), spesso dipendenti dal sistema fonologico del singolo idioma.
Nella produzione delle vocali gli articolatori orali (lingua, mandibola, labbra) assumono una configurazione che permette all’aria di fuoriuscire liberamente. Dal momento che le vocali producono nel tratto vocale un restringimento minore delle consonanti, le vocali non possono essere agevolmente descritte attraverso il luogo di articolazione come invece è possibile fare per le consonanti. Sono piuttosto descritte secondo un astratto ‘spazio vocalico’, i cui punti sono posti in relazione con la posizione del dorso della lingua (➔ fonetica articolatoria, nozioni e termini di).
Lo spazio vocalico è dunque quella parte della cavità orale utilizzata per produrre le vocali. Diversamente dalle consonanti, il cui spazio articolatorio è caratterizzato da zone di discontinuità, le vocali sono una categoria piuttosto compatta: occupando uno spazio più ristretto, gli atteggiamenti articolatori possibili in un’area di pochi centimetri quadrati hanno luogo in un continuum di difficile suddivisione (Mioni 2001: 77). Le differenze tra i diversi timbri vocalici dipendono da piccoli spostamenti della lingua, così descritti nella pratica fonetica: (a) innalzamenti o abbassamenti del corpo della lingua; (b) avanzamenti o arretramenti del corpo della lingua. A queste due manovre fondamentali si aggiungono diversi atteggiamenti delle labbra (arrotondamento labiale ~ mancanza di arrotondamento labiale).
All’interno dello spazio vocalico sono individuate per convenzione alcune posizioni che rappresentano i foni vocalici primari. Si tratta delle cosiddette vocali cardinali, ideate dal fonetista inglese Daniel Jones (1881-1967): sono timbri vocalici di riferimento intersoggettivo, la base per descrivere i foni effettivamente attestati nelle lingue (proprio come i punti cardinali permettono di definire anche posizioni intermedie). In primo luogo, attraverso un esame radiografico delle posizioni del dorso della lingua, Jones individuò i punti estremi dello spazio vocalico, oltre i quali si ha un’articolazione consonantica (fig. 1).
Con il massimo avanzamento e il massimo innalzamento del dorso della lingua è possibile produrre [i]; un ulteriore innalzamento porterebbe alla produzione dell’approssimante [j]: la vocale è dunque descritta come chiusa (in relazione alla distanza tra lingua e palato) e anteriore (in relazione alla posizione del punto più alto della lingua).
Con il massimo avanzamento e il massimo abbassamento viene realizzata [a]; un maggiore avanzamento porterebbe alla produzione dell’approssimante [ɹ]: la vocale è pertanto aperta (la distanza tra la lingua e il palato è massima) e anteriore.
Con il massimo abbassamento e il massimo arretramento del dorso si ha [ɑ], vocale aperta e posteriore (un maggiore arretramento produrrebbe la fricativa uvulare [] o la fricativa faringale [ʕ]).
Il massimo arretramento e il massimo innalzamento permettono di articolare [u], vocale chiusa e posteriore: oltre, esistono le approssimanti [w] o [ɯ], oppure le fricative [ʍ ɣ].
A partire da questi quattro punti è possibile suddividere lo spazio vocalico e individuare tutti gli altri timbri. Alle principali posizioni delle articolazioni vocaliche furono attribuiti valori numerici e simboli fonetici (fig. 2): la serie primaria (1-8) è distinta dalla serie secondaria (9-16) sulla base della posizione delle labbra. Le due posizioni ulteriori (17-18) rappresentano i punti più alti del centro della lingua.
Il metodo delle vocali cardinali consente di individuare tutti i fonemi vocalici delle lingue ma si rivela meno adeguato nella descrizione precisa dei foni, specie se si hanno finalità dialettologiche e sociofonetiche. La fonetica sperimentale (§ 4) consente descrizioni più fini e attendibili e, quel che più conta, verificabili dagli specialisti (mediante sofisticate tecniche come la RX-cinematografia, la RX-chimografia, l’elettropalatografia, l’elettrochimografia, la labiografia, la spettrografia, il rilevamento dei flussi d’aria orale e nasale, l’ecografia).
Sulla base dei movimenti articolatori, le vocali vengono descritte secondo tre parametri principali:
(a) la posizione verticale della lingua (ovvero, la misura del suo innalzamento, dal basso verso l’alto);
(b) la posizione orizzontale della lingua (ovvero, verso quale zona – palato, prevelo, velo del palato – si sposta la parte più alta della lingua);
(c) l’arrotondamento delle labbra.
A ciascuno di questi parametri – così come a ciascuno dei parametri secondari che tratteremo più avanti – è associato un tratto distintivo, ovvero una proprietà astratta, per lo più di natura binaria, che consente di analizzare e rappresentare i fonemi di una lingua in maniera economica (➔ fonologia).
Il parametro posizione verticale della lingua indica il grado di innalzamento della lingua (dal basso verso l’alto) nella cavità orale. Articolando, nell’ordine, [i], [e], [ɛ] fino ad [a] la lingua si abbassa progressivamente; lo stesso accade pronunciando [u], poi [o], poi [ɔ] e infine [ɑ]. I gradi di innalzamento sono dunque i seguenti: alto [i u], medio-alto [e o], medio-basso [ɛ ɔ], basso [a ɑ]. L’altezza della lingua può essere descritta anche con i termini chiuso, semichiuso, semiaperto, aperto (etichette che si riferiscono piuttosto all’apertura della bocca, allo spazio tra lingua e palato e all’apertura delle labbra): secondo questa tassonomia, le vocali chiuse sono [i u], le semichiuse [e o], le semiaperte [ɛ ɔ] e le aperte [a ɑ].
Anche se nelle ultime versioni dell’alfabeto IPA (➔ alfabeto fonetico) le vocali sono ancora classificate secondo il parametro dell’apertura/chiusura, la tassonomia basata sui gradi di altezza della lingua è preferibile, dal momento che risulta fondata univocamente sugli spostamenti della lingua dalla posizione di riposo.
Oltre che in senso verticale, la lingua si muove anche in senso orizzontale. Il grado di avanzamento o di arretramento della lingua permette di distinguere le vocali in anteriori, centrali, posteriori. Nelle vocali anteriori la parte predorsale della lingua si innalza verso il palato; nelle vocali posteriori il dorso della lingua si solleva verso il velo del palato. Le vocali [i e ɛ a] sono anteriori; le vocali [u o ɔ ɑ] sono posteriori. Le prime sono dette anche palatali (la lingua si avvicina al palato); le seconde sono chiamate anche velari (la lingua si accosta al velo). Per alcuni studiosi, la vocale [a] non è anteriore ma centrale (o prevelare). Le vocali centrali (prevelari) sono articolate in un’area centrale dello spazio vocalico. Al centro è collocata la vocale centrale generica (ovvero priva di ulteriori specificazioni) [ə], detta schwa (o ➔ scevà; il nome si riferisce a una vocale centrale dell’antico ebraico). Esiste anche una vocale centrale più bassa, detta schwa basso [ɐ].
I contrasti in altezza sono più rilevanti dei contrasti nella dimensione anteriore/posteriore: sono rarissime le lingue in cui tre vocali siano in opposizione solo sull’asse orizzontale (anteriore, centrale, posteriore), mantenendo intatte le altre dimensioni. Le vocali anteriori sono leggermente più numerose di quelle posteriori (40% ~ 37.8%): le articolazioni vocaliche che sfruttano l’asse anteriore sarebbero dunque favorite, perché più aderenti alla morfologia del tratto orale (Maddieson 1984), dal momento che gli articolatori hanno una maggiore mobilità proprio nella parte anteriore, dove anche gli effetti acustico-percettivi sono maggiori. Allo stesso modo, gli inventari consonantici esibiscono un numero più alto di consonanti anteriori. Sono molto meno comuni le vocali centrali (22.5%).
Nella produzione delle vocali è rilevante anche il tipo di apertura labiale: durante l’articolazione le labbra possono essere protruse o distese. Una vocale arrotondata, ovvero prodotta con protrusione delle labbra, è detta anche procheila (dal gr. prókheilos «dalle labbra sporgenti», comp. di pró «avanti» e khêilos «labbro») o labializzata; al contrario, una vocale non arrotondata è detta aprocheila (o non labializzata). Tra le vocali cardinali primarie, quelle arrotondate sono [u o ɔ ɒ], tutte posteriori; quelle non arrotondate sono [i e ɛ a] nella serie anteriore e [ɑ] nella posteriore.
Tra le lingue del mondo (Maddieson 1984: 124), le vocali non arrotondate sono più frequenti di quelle arrotondate (61.5% ~ 38.5%). Una tendenza ‘naturale’ collega l’arrotondamento delle labbra a una posizione della lingua nella parte posteriore della cavità orale: le vocali anteriori sono solitamente non arrotondate mentre quelle posteriori sono solitamente arrotondate. Eppure, in alcune lingue esistono suoni che contravvengono a questo accoppiamento.
Nella descrizione delle vocali sono talvolta utilizzati i «tratti minori di qualità vocalica» (Ladefoged & Maddieson 1996: 298-322) quali, ad es., la nasalità, l’avanzamento della radice della lingua, la faringalizzazione, la rotacizzazione, la fricativizzazione, la desonorizzazione, la lunghezza, la dittongazione, il carattere cricchiato (creaky) o sussurrato (breathy) del suono. In alcuni di questi casi, l’articolazione può coinvolgere parti dell’apparato fonatorio normalmente non implicate nella produzione delle vocali: ad es., nelle vocali rotacizzate svolge un ruolo la punta della lingua. La nasalizzazione è il tratto minore più diffuso; gli altri riguardano particolari gesti della lingua (avanzamento o arretramento della radice), ovvero diverse tipologie di fonazione (che sfruttano differenti tipi di qualità di voce, insieme alla possibilità di creare opposizioni tra vocali sonore e desonorizzate), o anche differenze temporali (lunghezza ~ brevità).
La posizione del palato molle è implicata nell’opposizione orale ~ nasale: il palato molle è innalzato nelle vocali orali ed è abbassato per le vocali che hanno subito nasalizzazione (➔ nasali). Nell’alfabeto IPA le vocali nasali sono contrassegnate con una tilde [ ˜ ] sopra la vocale. La distinzione è fonologicamente pertinente in francese (ad es., lot /lo/ «partita (di merce)» ~ long /lõ/ «lungo»), in portoghese e anche in alcuni dialetti piemontesi, lombardi, liguri, emiliani, veneti. Non è rilevante per l’italiano, poiché non esistono coppie minime (➔ coppia minima) basate sulla presenza o assenza di nasalizzazione: le vocali orali dell’italiano tendono a nasalizzarsi in prossimità di consonanti nasali, per effetto di coarticolazione (➔ variante combinatoria).
L’avanzamento della radice della lingua (in sigla ATR, Advanced tongue root) è un’altra manovra che permette di creare opposizioni vocaliche. Articolatoriamente, il contrasto [±ATR] si manifesta attraverso differenze nella posizione della radice della lingua, nell’ampiezza della cavità faringale e nella posizione della laringe: una vocale [+ATR] è prodotta con un avanzamento della radice della lingua, attraverso una cavità faringale più ampia e mediante l’abbassamento della laringe; al contrario, una vocale [–ATR] è articolata mediante l’arretramento della radice della lingua, una cavità faringale più ristretta e un innalzamento della laringe. Molti studiosi hanno cercato di istituire un parallelismo fra questo parametro e l’opposizione teso ~ rilassato, opposizione che tuttavia non pare avere un correlato fonetico ben preciso e che rimanda piuttosto al dominio fonologico (Trumper 1975). Risulta più utile associare al concetto di tensione quello di periferia dello spazio vocalico: vocali tese occupano posizioni più periferiche rispetto alle controparti rilassate, vocali rilassate tendono a situarsi all’interno dello spazio occupato dalle vocali tese (Lindau 1978). La tensione si accompagna inoltre a una maggiore lunghezza.
Le vocali sono tipicamente foni sonori. Esistono tuttavia anche vocali sorde, sia come allofoni condizionati dal contesto (ad es., le vocali atone adiacenti a consonanti sorde, come in alcuni dialetti meridionali non estremi: [ˈspusə̥] sposi; ➔ meridionali, dialetti), sia come realizzazioni stilisticamente connotate (in certi stili, l’ultima vocale di una produzione sonora viene desonorizzata). Come per le consonanti, il diacritico [ ̥ ] segnala la desonorizzazione.
La lunghezza della vocale può essere distintiva, come in latino (➔ latino e italiano) oppure contestualmente determinata (➔ variante combinatoria), come in italiano, ove le vocali in sillaba aperta non finale sono in genere più lunghe di quelle in sillaba chiusa (➔ vocale breve). Solitamente il contrasto fonologico è tra vocale lunga e vocale breve (per es., lat. pālus «palo» ~ pălus «palude»); molto rari sono gli idiomi che fanno uso di tre contrasti di lunghezza. Nell’alfabeto IPA la lunghezza viene indicata con i seguenti diacritici: [ ː ] per la vocale lunga, [▼] per la semilunga, [ ̆] per la extra-breve.
Le vocali possono infine essere caratterizzate sia da una articolazione costante (quelle che in inglese sono definite pure vowels), sia da un cambiamento timbrico (le cosiddette gliding vowels) e da una tendenza più o meno marcata alla dittongazione, senza necessariamente raggiungere un dittongo vero e proprio. La discriminazione tra vocale lunga e ➔ dittongo non è comunque semplice da stabilire. I dittonghi ricorrono in circa 1/3 delle lingue del mondo.
Di seguito si riportano in sintesi i tre parametri articolatori principali e le categorie fonetiche ad essi associati (va notato che i tratti di altezza e arretramento non sono binari):
(a) altezza: [alto] [medio-alto] [medio] [medio-basso] [basso];
(b) arretramento: [anteriore] [centrale] [posteriore];
(c) arrotondamento: [arrotondato] [non arrotondato].
Anche solo considerando questi tre parametri e trascurando le caratteristiche cosiddette secondarie, esisterebbero trenta vocali differenti. Tuttavia, tutte le combinazioni non sono ugualmente probabili: anzi, alcune sono reputate così improbabili da essere considerate impossibili, come ad es. cinque gradi di altezza nelle vocali posteriori non arrotondate. Esistono inoltre rilevanti asimmetrie nell’interazione di questi parametri: le vocali basse sono di solito centrali e le vocali centrali sono generalmente basse; le vocali anteriori alte sono più frequenti delle posteriori alte (Maddieson 1984: 124-125). Infine, ci sono differenze fonetiche che non possono essere colte sulla base di queste tassonomie. È celebre il confronto tra vocalismo italiano e vocalismo yoruba (un idioma africano) compiuto da Ferrari Disner (1983) e ripreso da Ladefoged (1984): le due lingue hanno il medesimo inventario fonologico (cioè i simboli utilizzati per le sette vocali sono i medesimi), ma l’italiano ha una distribuzione simmetrica, lo yoruba no. Dietro i medesimi simboli, dunque, ci sono differenze fonetiche che trovano la loro origine nella diacronia delle lingue, nelle differenze fisiche, nelle valenze sociolinguistiche associate a una certa distribuzione rispetto a un’altra.
La struttura acustica delle vocali (➔ fonetica acustica, nozioni e termini di) è caratterizzata, sul sonogramma a banda larga, dalla presenza di zone di frequenza (le cosiddette formanti) in cui le armoniche sono particolarmente intense (visivamente sono bande nere più o meno parallele all’asse del tempo). Si tratta di frequenze di risonanza prodotte dal canale epilaringeo, zone di concentrazione di energia sonora, caratterizzate da una chiara struttura di linee verticali che rappresentano le vibrazioni delle pliche vocali.
Le differenze tra le vocali appaiono più rigorosamente definibili in termini acustici e percettivi, anziché articolatori (Mioni 1986: 46): rispetto a una complicata descrizione articolatoria (la qualità vocalica è realizzata dall’interazione complessa di più articolatori), una descrizione basata sulle frequenze formantiche offre un sufficiente correlato acustico del timbro. Esistono rapporti sistematici tra parametri articolatori e parametri acustici: è possibile prevedere con buona approssimazione la struttura formantica di una vocale conoscendone le caratteristiche articolatorie; viceversa, è possibile risalire alle caratteristiche articolatorie della vocale a partire dai suoi valori formantici. Le formanti rappresentano infatti le conseguenze acustiche dei mutamenti di forma assunti dagli organi fonoarticolatori durante l’articolazione delle singole vocali. Esse sono determinate dalla dimensione, dalla lunghezza, dalla forma, e dalla estremità del tratto sopralaringale; sono inoltre una funzione della lunghezza del canale epilaringeo: all’aumentare della lunghezza, diminuisce l’altezza delle formanti, che negli uomini sono appunto più basse rispetto a quelle di donne e bambini.
Un suono vocalico può dunque essere caratterizzato acusticamente come un insieme di formanti: come provano test percettivi applicati all’italiano (Ferrero & Magno Caldognetto 1976), per l’identificazione di una vocale sono sufficienti la prima formante (quella con la frequenza più bassa) e la seconda formante (la successiva). La prima formante (abbreviata F1) è direttamente proporzionale al grado di apertura della cavità orale: una bassa F1 indica una vocale chiusa, mentre una elevata F1 indica una vocale aperta (fig. 3). Il movimento articolatorio che più incide sui valori di F1 è l’apertura della mandibola.
Il tratto articolatorio di altezza vocalica è messo in parallelo con l’inverso della frequenza di F1; tuttavia i correlati acustici dell’altezza hanno natura relativa e non assoluta, essendo in parte idiolinguistici e per certi versi anche idiosincratici (cfr. Lindau & Ladefoged 1986: 469). Lingue differenti possono avere, per una stessa vocale, valori della prima formante anche molto diversi tra loro: la posizione di una vocale nello spazio acustico dipende anche dal numero e dalla tipologia delle vocali nel sistema fonologico.
La seconda formante (F2) è collegata al grado di avanzamento della lingua: più sono elevati i valori di F2 (e maggiore è la distanza relativa tra F1 e F2) più anteriore è la vocale, mentre più bassi sono i valori di F2 (e minore è la distanza relativa tra F1 e F2) più la vocale è posteriore. Lo spostamento della massa della lingua all’indietro e l’arrotondamento delle labbra causano una diminuzione di F2. Contrariamente a quanto avviene per F1, il movimento articolatorio che più influenza F2 riguarda la lingua: i valori più alti di F2 sono ottenuti per la lingua in posizione palatale, e si abbassano considerevolmente se il corpo della lingua scende verso la faringe. La correlazione tra i valori di F2 e il grado di anteriorità/posteriorità è comunque meno buona rispetto a quella tra F1 e il grado di altezza vocalica (Ladefoged 1975: 173); piuttosto, c’è una correlazione migliore tra grado di arretramento e distanza spettrale (F2-F1): tale distanza è grande nelle vocali anteriori e piccola nelle vocali posteriori. Rivestono un ruolo secondario le formanti più alte: la terza formante (F3) è spesso utilizzata, insieme alla seconda, per discriminare le vocali rotacizzate, quelle nasalizzate, e quelle anteriori arrotondate. L’apporto di F3 in particolare contribuisce direttamente alla distinzione tra vocali anteriori arrotondate e vocali anteriori non arrotondate.
La capacità delle due formanti più basse di rappresentare lo spazio acustico non è priva di aspetti problematici, dal momento che le formanti possono mutare in base ad altri tratti articolatori. Ad es., la protrusione delle labbra allunga il canale epilaringeo e abbassa tutte le formanti (specialmente la seconda e la terza). L’arrotondamento, inoltre, smorza o indebolisce le formanti più alte, dal momento che riduce l’apertura labiale (per questo, le vocali labiali sono percepite come più ‘scure’). Vocali ‘scure’ sono in genere quelle con una bassa F2 o con una piccola differenza tra F1 e F2; al contrario, nelle vocali ‘chiare’ (o palatali) la distanza tra le due formanti è molto elevata (bassa F1, alta F2). La somiglianza tra il tradizionale quadrilatero articolatorio e le rappresentazioni grafiche che si basano sui valori della prima e della seconda formante (§ 5) è dunque forte (e sorprendente) ma per certi aspetti superficiale.
Ad ogni buon conto, le formanti più basse sono tra gli indicatori acustici più ‘robusti’ e sono molto resistenti alla distorsione che può verificarsi quando si lavora con il parlato non di laboratorio; inoltre, la loro misurazione non è troppo difficoltosa. In particolare, la prima formante è favorita nel contrasto vocalico rispetto alle formanti più alte: se i sistemi vocalici hanno sviluppato margini di sicurezza per garantire un certo livello di differenziazione percettiva nella comunicazione sotto rumore, dovrebbero sfruttare F1 più delle altre formanti, dal momento che questa è più intensa e dotata di un maggiore potere discriminante, in quanto statisticamente più resistente al rumore (Lindblom 1986: 22). La supremazia di F1, e quindi delle distinzioni di altezza, rispetto a F2, e cioè alla dimensione anteriore/posteriore, è confermata anche dal punto di vista tipologico (§ 1): le distinzioni basate sul grado di apertura sono maggiori rispetto alle distinzioni di tipo anteriore/posteriore.
Solo un sottoinsieme di tutte le possibili combinazioni formantiche è associato a vocali umane (Liljencrants & Lindblom 1972). I sistemi vocalici non sono combinazioni casuali di suoni. Al contrario, le lingue tendono a utilizzare uno stesso insieme ristretto di qualità sonore, sulla base di due principali criteri di selezione: la semplicità articolatoria e la distinzione percettiva (Boë 1997). A quanto risulta, i sistemi vocalici vanno da un minimo di tre elementi a un massimo di 24, il sistema più frequente ne ha cinque: /i e a o u/ (Maddieson 1984: 126). È probabile che il principio della (massima) distanza (articolatoria, acustica, percettiva) giochi un ruolo importante nella costruzione dei sistemi vocalici: vocali di una lingua apportano più efficacemente differenze nel significato nella misura in cui sono più dissimili tra loro. Nei sistemi costituiti da tre vocali i foni più frequenti sono infatti [i a u], nella cui produzione il canale orale e quello faringeo raggiungono la massima espansione e il massimo restringimento: la vocale [a] ha la F1 più alta, mentre [i] e [u] hanno la F1 più bassa; [i] ha la F2 più alta mentre [u] ha la F2 più bassa (Maddieson 1984: 125).
L’aspetto irregolare dello spazio vocalico (così come è rappresentato nella fig. 1) non ne permette una agevole utilizzazione a fini descrittivi. Per questa ragione l’IPA rappresenta lo spazio vocalico mediante una forma geometrica trapezoidale (figg. 4 e 5), il cosiddetto trapezio vocalico, che ha il vantaggio di una «schematizzazione geometrica» (Mioni 2001: 81), ma ha anche alcuni inconvenienti (ad es., non mostra l’abbassamento della serie posteriore rispetto alla serie anteriore, né il maggiore arretramento delle vocali posteriori intermedie rispetto a quelle estreme). Comunque, l’insieme di tutte le posizioni che il dorso della lingua può assumere durante l’articolazione delle vocali, visibile per es. ai raggi X o attraverso gli ultrasuoni, assume davvero un aspetto trapezoidale.
Anche se nella manualistica è frequente la disposizione triangolare per rappresentare i singoli sistemi vocalici, l’utilizzo del trapezio è più aderente alla realtà fisica dell’apparato fonatorio (nella parte anteriore della cavità orale lo spazio è maggiore rispetto a quella posteriore). Inoltre, la disposizione a trapezio permette di rappresentare vocali basse anteriori e posteriori. I confini del trapezio segnalano anche i limiti fisici alla produzione delle vocali: se la lingua si muove oltre quei confini, avvicinandosi maggiormente ai vari organi della cavità orale (come gli alveoli, il velo, il palato), si avranno articolazioni non vocaliche ma consonantiche (§ 2).
Dal momento che lo spazio vocalico è continuo, l’effettiva coincidenza tra la vocale di una certa lingua e il punto simbolizzato nella figura è un fatto abbastanza casuale. Anche per questa ragione, rispetto alla tradizionale rappresentazione IPA (fig. 4), alcuni fonetisti (ad es. Luciano Canepari, Alberto M. Mioni) non collocano le vocali di riferimento in punti precisi del trapezio ma all’interno, così da delineare un’area approssimativa di realizzazione per ciascun fono, come mostrano i due trapezi della fig. 5.
Nella rappresentazione che si basa su dati acustici (solitamente, come si è visto, utilizzando F1 e F2) è molto frequente il ricorso alle cosiddette aree di esistenza, disegnate manualmente (in cui ogni punto corrisponde a una effettiva misurazione: fig. 6), ovvero rappresentate mediante ellissi equiprobabili di dispersione, o anche centroidi:
Ogni punto del grafico rappresenta una vocale, misurata di solito nella parte stabile del segmento (il cosiddetto steady state), ovvero la sezione meno soggetta a influssi coarticolatori da parte dei segmenti vicini.
Come mostra la fig. 6, il grafico F1/F2 offre un modo comodo di rappresentare un sistema vocalico: ogni membro del sistema ha una posizione specifica nel grafico e i diversi punti formano una configurazione. Lingue con poche vocali avranno pochi punti nel grafico, lingue con molte vocali, al contrario, avranno un grafico più pieno. Nella rappresentazione delle vocali su di un piano cartesiano (con F1 sull’asse delle y, e con F2 sull’asse delle x), l’origine degli assi è invertita (ovvero sono invertiti i valori dei due assi) per ottenere una raffigurazione dello spazio vocalico più vicina al tradizionale quadrilatero della fonetica classica, con le vocali anteriori chiuse sull’angolo sinistro in alto e le vocali aperte verso il centro del diagramma.
I punti che compongono un certo sistema vocalico possono occupare posizioni più o meno periferiche nello spazio acustico e articolatorio: la cosiddetta riduzione vocalica indica il passaggio da un sistema caratterizzato da posizioni per certi versi estreme e iperarticolate (➔ pronuncia) a un sistema indebolito, più ridotto e meno periferico (➔ indebolimento).
Si è soliti distinguere due tipologie differenti di riduzione vocalica: una di tipo fonetico (acustica e non strutturale) e una di tipo fonologico (lessicale e strutturale). La prima, dal carattere gradiente, è legata a fattori stilistici: stili di eloquio informali sono di solito ipoarticolati, mentre stili di eloquio formali risultano maggiormente iperarticolati. È inoltre connessa anche a variabili più strettamente linguistiche quali, ad es., la tipologia della parola (rispetto alle parole lessicali, quelle funzionali sono solitamente soggette a riduzione maggiore) e la frequenza d’uso (parole più frequenti sono in genere più ridotte di parole meno frequenti).
La seconda, dal carattere più propriamente fonologico e strutturale, è invece categoriale e appare legata a variabili di tipo accentuale (➔ prosodia), cioè alla presenza o assenza di accenti lessicali. La riduzione del grado accentuale nel passaggio dal sistema tonico a quello atono produce una neutralizzazione di alcuni contrasti fonologici, spesso mediante lo schwa. Nei sistemi vocalici delle lingue del mondo, il numero delle vocali atone è infatti sempre inferiore o, più raramente, uguale a quello delle vocali toniche.
Gli effetti della riduzione vocalica sono stati osservati in molteplici condizioni e sotto differenti punti di vista, come ad es.:
(a) presenza ~ assenza di accento;
(b) parlato lento ~ parlato veloce;
(c) parlato letto ~ parlato (più o meno) spontaneo;
(d) parole lessicali ~ parole funzionali.
Il minimo della riduzione è previsto quando la vocale è accentata, nel parlato lento, in quello letto, nelle parole lessicali e nelle forme iperarticolate, che in quanto tali tendono a sfruttare al massimo lo spazio vocalico disponibile. Il massimo della riduzione, invece, con un conseguente restringimento generale dello spazio vocalico, ovvero una più ridotta distanza tra vocali, è atteso in assenza di accento, nel parlato veloce, in quello spontaneo, in parole funzionali (➔ post-tonica, posizione).
Il tema della riduzione vocalica intesa come ‘bersaglio mancato’ ha come primo e imprescindibile punto di riferimento il modello di Lindblom (1963) (➔ pronuncia) secondo cui, in presenza di riduzioni temporali, gli organi articolatori non sono in grado di raggiungere il bersaglio previsto. In questo quadro, la centralizzazione può essere uno tra gli esiti acustici possibili, ma non l’unico: la riduzione si presenta come un fenomeno assimilatorio, poiché le formanti vengono alterate in base all’ambiente segmentale circostante. In ogni caso, le conseguenze fonetiche della riduzione vocalica sono ancora oggetto di dibattito scientifico: per taluni si tratta di una complessiva centralizzazione verso la posizione dello schwa, per altri sono forme di assimilazione contestuale.
Il sistema vocalico dell’italiano di base fiorentina ha sette vocali fonologiche sotto accento e cinque vocali fuori accento. Il vocalismo tonico ha quattro gradi di altezza, poiché all’interno del grado medio ci sono due tipi di vocali: uno semichiuso (medio-alto), indicato con /e/ e /o/, e uno semiaperto (medio-basso), indicato con /ɛ/ e /ɔ/. Nelle figg. 7 e 8 sono rappresentati i sistemi tonico e atono:
Le vocali sono disposte in maniera simmetrica, con le vocali anteriori in numero uguale alle vocali posteriori. La struttura è pertanto triangolare, dal momento che il sistema prevede una sola vocale bassa, considerata centrale nelle rappresentazioni tradizionali dell’italiano, in contrasto con la tassonomia dell’IPA, che la definisce anteriore (cfr. Schmid 1999: 129). Mancano vocali anteriori arrotondate (presenti però in alcuni dialetti settentrionali): le vocali anteriori sono esclusivamente non arrotondate e le vocali posteriori sono esclusivamente arrotondate. Manca anche una vocale media centrale (presente nelle parlate meridionali non estreme).
L’opposizione fonologica tra le vocali italiane è ricavabile dalla seguente serie subminima (cioè una serie non perfetta di coppie minime): piste ~ péste «orme» ~ pèste «morbo epidemico» ~ póste (dal verbo porre) ~ pòste «servizio pubblico per la corrispondenza» ~ buste (Mioni 2001: 172). L’opposizione tra le vocali semichiuse e semiaperte /ɛ/ ~ /e/ è presente nelle seguenti coppie minime: è (verbo) ~ e (congiunzione); venti «numerale» ~ venti «spostamenti di masse d’aria»; quella fra /ɔ/ ~ /o/ in botte «percosse» ~ botte «recipiente per il vino»; ho (verbo) ~ o (congiunzione).
Il vocalismo atono è costituito da cinque fonemi. Vengono neutralizzate le opposizioni /ɛ/ ~ /e/ e /ɔ/ ~ /o/: p[ɛ]sca ma p[e]scare, p[ɔ]rto ma p[o]rtare. Non c’è tuttavia accordo sullo statuto delle vocali medie (cfr. Mioni 1993: 122; Schmid 1999: 133; Mioni 2001: 175): per alcuni sarebbero vocali semichiuse; per altri sarebbero foni intermedi tra [e] e [ɛ] e tra [o] e [ɔ]; per altri, infine, il timbro della vocale atona dipenderebbe dal timbro della vocale nella sillaba seguente per un effetto di armonia vocalica (per cui lavoro è realizzato [laˈvoro] ma tesoro è reso [teˈzɔrɔ]).
Esistono limitazioni distribuzionali nell’asse posteriore: sotto accento, non è possibile avere in italiano la vocale posteriore semichiusa in fine di parola (non fanno eccezione neppure i prestiti adattati come bordò [borˈdɔ] e paltò [palˈtɔ]), né sono possibili parole uscenti in [u] atono (salvo pochissime voci o varianti piuttosto colte, quali [ˈʣulu] zulu e [ˈtabu] tabu).
Nell’italiano contemporaneo, il vocalismo tonico tende ad essere pentavocalico, ovvero a mantenere sette timbri con le semiaperte in alternanza più o meno libera con le semichiuse.
Per quanto concerne i vocalismi regionali (➔ italiano regionale), in alcuni vocalismi meridionali non estremi (campano, pugliese, lucano, ecc.; ➔ meridionali, dialetti) le atone medie, soprattutto finali, e talvolta l’atona bassa sono realizzate come vocale centrale indistinta [ə]: [rəˈʧevərə] «ricevere». Tale tratto raggiunge anche l’italiano regionale, che presenta vocali più spostate verso il centro dello spazio vocalico: [i̽ e̽ o̽]. Ne sono un esempio le voci dell’italiano regionale di Napoli [ˈsposo̽] sposo, [ˈspɔsɐ] sposa, [ˈsposi̽] sposi, [ˈspɔse̽] spose (da confrontare, rispettivamente, con i dialettali [ˈsposə], [ˈspɔsɐ], [ˈspusə], [ˈspɔsə]).
Per quanto riguarda gli aspetti di durata, in molte varietà regionali del Nord la vocale tonica ha una maggiore lunghezza rispetto all’italiano standard (De Mauro 19702: 379); addirittura, si osserva una tendenza ad allungare tutte le vocali toniche a prescindere dalla struttura sillabica (Schmid 1999: 167). L’allungamento allofonico (➔ allofoni) in sillaba aperta sembra meno marcato proprio nella varietà toscana. Nel parlato connesso, nel Centro-Sud è frequente l’➔ elisione della vocale atona finale davanti a vocale della parola seguente: cinq[a]nni «cinque anni», sempr[a]vanti «sempre avanti». Nello standard l’elisione avviene soprattutto quando le due vocali a contatto hanno il medesimo timbro e sono entrambe atone (er[a]ntico «era antico»), oppure in certe espressioni fisse e cristallizzate (brav’uomo, d’ora in poi); tuttavia il fenomeno mostra un certo regresso. Nelle parlate settentrionali, viceversa, l’elisione è piuttosto rara (Canepari 19832: 55-56).
Indicazioni dettagliate sui vocalismi di tutte le regioni d’Italia, con suddivisioni anche subregionali, sono in Canepari (19832 e 19992). Una rassegna che ripercorre gli studi sperimentali sulle vocali d’Italia in una prospettiva geografica e stilistica è offerta in Calamai (2003).
Per l’italiano parlato, in Minnaja & Paccagnella (1977) la frequenza delle vocali è la seguente: /e o i a u/ per il sistema atono e /a e ɛ i o ɔ u/ per quello tonico; nelle frequenze di Bortolini et al. (1978) circa 2/3 del totale delle vocali censite è rappresentato, nell’ordine, dalle atone /a i e o/. In parte diverso è l’ordine di frequenza di Batinti (1993) sul lessico basico: /a e o i u ɛ ɔ/. Sulla base del corpus romano del LIP, Chiari (2002) elabora il seguente ordine: /a e o i ɛ u ɔ/ (in entrambi i casi, nelle semichiuse sono compresi anche i valori dei due timbri atoni).
Per l’italiano scritto, l’ordine di frequenza (relativo piuttosto a ➔ grafemi) individuato da Minnaja & Paccagnella (1977: 249) è il seguente: ‹a e i o u›; quello riportato in Batinti (1992) mostra l’ordine ‹a e o i u›. Nonostante alcune discrepanze, dovute anche alle differenze nei disegni sperimentali e alla tipologia dei corpora utilizzati (➔ corpora di italiano), la vocale più frequente appare /a/ e le vocali meno frequenti sono quelle posteriori (in particolare la posteriore chiusa), insieme – ove siano individuabili – alle semiaperte, le quali risentono di varie limitazioni distribuzionali.
Nella grafia sono rilevabili due punti di mancata corrispondenza tra grafema e fonema. I due timbri tonici medi, anteriori e posteriori, sono rappresentati da un unico grafema (rispettivamente, ‹e› e ‹o›) senza ulteriori distinzioni di altezza. Nel caso delle vocali chiuse, il medesimo grafema segnala anche l’articolazione semivocalica o semiconsonantica (➔ semivocali). Il grafema ‹i› ha pertanto quattro valori: indica la vocale [i], la semivocale [i̯], la semiconsonante [j] e ha un valore diacritico nei digrammi e trigrammi ‹sci + Vocale›; ‹ci + a, o, u› e, talvolta, ‹ci + e›; ‹gi + a, o, u› e, talvolta, ‹gi + e›, ‹gl[i]›, ‹gn[i]›. Non è un caso che le maggiori difficoltà nelle grafie semicolte si incontrino proprio nei plurali in -cie, -gie (camicie, ciliegie ma facce, piogge) dove è particolarmente accentuato il carattere convenzionale e ‘antifonetico’ della scrittura (Maraschio 1993: 142-145; ➔ ortografia).
L’➔ accento grafico segnala la presenza di accento tonico solo nelle parole ossitone e, in maniera facoltativa, nei casi di omografi (princìpi «origini, leggi, valori etici» ~ prìncipi «titolo nobiliare»; pèsca «frutto» ~ pésca «attività del pescare»). Più spesso, viene lasciato al contesto, linguistico o extralinguistico, il compito di disambiguare il messaggio. La forma dell’accento grafico è grave nei tre casi in cui non si distingue il grado di apertura: ‹à ì ù› (città, sì, tribù). Solo per le toniche ossitone (cioè, perché, andò) o nei casi in cui sia necessario disambiguare il significato (còrso «abitante della Corsica» ~ córso «participio passato di correre»), le vocali semiaperte sono trascritte con l’accento grave (‹è ò›), quelle semichiuse con l’accento acuto (‹é ó›).
Questo tipo di accentazione tradizionale degli ossitoni (presente nella tipografia italiana antica) è ora in concorrenza con un altro sistema accentuativo (Camilli 19653: 119, 183-186; Serianni 2000: 41; ➔ ortografia), il quale prevede l’accento acuto per tutte le vocali chiuse (‹í é ó ú›) e quello grave per quelle aperte (‹à è ò›). Del resto, l’accentazione si è stabilizzata in tempi molto recenti (Maraschio 1993: 144-145): soltanto nel Novecento è stato fissato l’uso dell’accento sui monosillabi in funzione disambiguante (da ~ dà, e ~ è, la ~ là, ecc.).
Comunque, i tentativi di introdurre in maniera sistematica simboli disambiguanti sono tutti falliti, anche se hanno accompagnato la storia della grammatica. Già Leon Battista ➔ Alberti aveva proposto di distinguere le vocali semiaperte da quelle semichiuse; Gian Giorgio ➔ Trissino introdusse due simboli provenienti dall’alfabeto greco per le semiaperte (‹ɛ› per /ɛ/ e ‹ω› per /ɔ/), in seguito parzialmente modificati: in considerazione della supposta pronuncia originaria del greco, ‹ω› venne a indicare /o/, causando la perdita di simmetria con ‹ɛ› e un aumento considerevole di parole con questo simbolo eccentrico (vista la maggiore frequenza di /o/ rispetto a /ɔ/ nel lessico italiano). Anche Claudio Tolomei, Pier Francesco Giambullari e successivamente Daniello Bartoli proposero una distinzione grafica tra semiaperte e semichiuse. Nel secolo scorso, alla neonata Società ortografica italiana (1910) Goidànich propose di usare, a scopo distintivo, l’accento grave sulle vocali semiaperte. Neppure le proposte più recenti (ad opera di Malagoli, Castellani, Pieraccioni) hanno attecchito (Maraschio 1993: 226).
Batinti, Antonio (1992), Il sistema grafico dell’italiano. Proposte per ricerche statistiche nel lessico basico, Perugia, Guerra.
Batinti, Antonio (1993), Il sistema fonologico dell’italiano. Proposte per ricerche statistiche nel lessico basico, Perugia, Guerra.
Boë, Louis-Jean (1997), Sciences phonétiques et relations forme/substance: 2. Du poids de la substance sur la forme aux réarticulations scientifiques, in Construction des théories du son, «Histoire épistémologie langage» 19, 2, pp. 5-25.
Bortolini, Umberta et al. (1978), Statistics for a stochastic model of spoken Italian, in Proceedings of the twelfth international congress of linguists (Vienna, August 28-September 2, 1977), edited by W.U. Dressler & W. Meid, Innsbruck, Institut für Sprachwissenschaft der Universität Innsbruck, pp. 580-586.
Calamai, Silvia (2003), Vocali d’Italia. Una prima rassegna, in Voce canto parlato. Studi in onore di Franco Ferrero, a cura di P. Cosi et al., Padova, Unipress, pp. 49-58.
Camilli, Amerindo (19653), Pronuncia e grafia dell’italiano, a cura di P. Fiorelli, Firenze, Sansoni (1a ed. 1941).
Canepari, Luciano (19832), Italiano standard e pronunce regionali, Padova, CLEUP (1ª ed. 1980).
Canepari, Luciano (19992), Il MaPI. Manuale di pronuncia italiana, Bologna, Zanichelli (1ª ed. Manuale di pronuncia italiana, con un pronunciario di oltre 30.000 voci, 1992).
Chiari, Isabella (2002), Ridondanza e linguaggio. Un principio costitutivo delle lingue, prefazione di T. De Mauro, Roma, Carocci.
Crystal, David (1993), Enciclopedia Cambridge delle scienze del linguaggio, a cura di P.M. Bertinetto, Bologna, Zanichelli.
De Mauro, Tullio (19702), Storia linguistica dell’Italia unita, Bari, Laterza (1a ed. 1963).
Ferrari Disner, Sandra (1983), Vowel quality: the relation between universal and language specific factors, «UCLA working papers in phonetics», 58.
Ferrero, Franco E. (1972), Caratteristiche acustiche dei fonemi vocalici italiani, «Parole e metodi» 3, pp. 9-31.
Ferrero, Franco E. & Magno Caldognetto, Emanuela (1976), Risultati sperimentali di una prova di percezione di suoni vocalici sintetici, in Studi di fonetica e fonologia. Atti del Convegno internazionale di studi (Padova, 1-2 ottobre 1973), a cura di R. Simone, U. Vignuzzi & G. Ruggiero, Roma, Bulzoni, pp. 95-116.
Ladefoged, Peter (1975), A course in phonetics, New York, Harcourt Brace Jovanovich.
Ladefoged, Peter (1984), “Out of chaos comes order”; physical, biological, and structural patterns in phonetics, in Proceedings of the Tenth International congress of phonetic sciences, edited by M.P.R. van den Broecke & A. Cohen, Dordrecht, Foris, pp. 83-95.
Ladefoged, Peter & Maddieson, Ian (1996), The sounds of the world’s languages, Oxford, Blackwell.
Liljencrants, Johan & Lindblom, Björn (1972), Numerical simulation of vowel quality systems: the role of perceptual contrast, «Language» 48, pp. 839-862.
Lindau, Mona (1978), Vowel features, «Language» 54, pp. 541-563.
Lindau, Mona & Ladefoged, Peter (1986), Variability of feature specifications, in Invariance and variability in speech processes, edited by J.S. Perkell & D.H. Klatt, Hillsdale (N.J.), L. Erlbaum, pp. 464-479.
Lindblom, Björn (1963), Spectrographic study of vowel reduction, «The journal of the Acoustical Society of America» 35, pp. 1773-1781.
Lindblom, Björn (1986), Phonetic universal in vowel systems, in Experimental phonology, edited by J.J. Ohala & J.J. Jaeger, Orlando (Flo.), Academic Press, pp. 13-44.
Maddieson, Ian (1984), Patterns of sounds, Cambridge, Cambridge University Press.
Maraschio, Nicoletta (1993), Grafia e ortografia, in Storia della lingua italiana, a cura di L. Serianni & P. Trifone, Torino, Einaudi, 3 voll., vol. 1° (I luoghi della codificazione), pp. 139-227.
Minnaja, Carlo & Paccagnella, Laura (1977), Variazioni dell’entropia linguistica dell’italiano scritto e calcolo di un’entropia fonematica, «Rendiconti del seminario matematico della Università di Padova» 57, pp. 247-265.
Mioni, Alberto M. (1986), Fonetica articolatoria: descrizione e trascrizione degli atteggiamenti articolatori, in Trattato di foniatria e logopedia, a cura di L. Croatto, Padova, La Garangola, 1983-1988, 4 voll., vol. 3° (Aspetti fonetici della comunicazione), pp. 15-88.
Mioni, Alberto M. (1993), Fonetica e fonologia, in Introduzione all’italiano contemporaneo, a cura di A.A. Sobrero, Roma - Bari, Laterza, 2 voll., vol. 1º (Le strutture), pp. 101-139.
Mioni, Alberto M. (2001), Elementi di fonetica, Padova, Unipress.
Pike, Kenneth (1943), Phonetics. A critical analysis of phonetic theory and a technique for the practical description of sounds, Ann Arbor, University of Michigan Press.
Schmid, Stephan (1999), Fonetica e fonologia dell’italiano, Torino, Paravia.
Serianni, Luca (2000), Italiano. Grammatica, sintassi, dubbi, con la collaborazione di A. Castelvecchi; con un glossario di G. Patota, Milano, Garzanti (1a ediz. 1997).
Trumper, John (1975), Obiezioni sistematiche all’uso dei tratti teso/rilassato nell’analisi di sistemi vocalici e di rotazioni vocaliche, «Lingua e contesto» 2, pp. 1-86.