consonanti
Per i grammatici antichi, il termine consonante (gr. stoikhêion [o grámma] sýmphōnon, lat. littera consonans) indicava una lettera che (per es., gr. β, γ, δ, lat. b, c, d) si riteneva non potesse essere pronunciata senza l’appoggio di una vocale contigua. Secondo una logica simile, in fonologia le consonanti sono elementi che, da soli, non possono costituire una ➔ sillaba rappresentandone il nucleo. Tuttavia, una definizione fonologica del termine consonante non può prescindere dal concetto di funzione, dato che esistono anche consonanti con caratteristiche fonetiche simili a quelle delle ➔ vocali, che possono cioè costituire il nucleo sillabico, svolgendo dunque una funzione vocalica (così /l/ in inglese, nella parola bottle).
In fonetica le consonanti sono segmenti fonici, sordi o sonori, realizzati grazie alla fuoriuscita di aria dalla cavità orale, ed eventualmente da quella nasale, dopo il superamento di un ostacolo di entità variabile (una stretta o una chiusura; ➔ fonetica articolatoria, nozioni e termini di, § 2) presente nell’apparato fonatorio a partire dalla laringe. Secondo la proposta di Pike (1943), per indicare questi elementi in ambito fonetico si potrebbe utilizzare il termine contoide, riservando consonante al livello fonologico. I contoidi possono quindi essere non sillabici, come nel caso delle consonanti tipiche, o sillabici, quando rappresentino il nucleo della sillaba.
I parametri principali per definire i foni, e quindi anche le consonanti, sono la direzione del flusso d’aria, l’organo che la genera, la configurazione della glottide, il ruolo delle cavità nasali, il luogo e il modo di articolazione. Questi parametri sono utilizzati per fornire una definizione articolatoria delle consonanti (e sono alla base della codifica utilizzata nei sistemi di trascrizione fonetica, come l’IPA (International Phonetic Alphabet; ➔ alfabeto fonetico).
La realizzazione dei foni può sfruttare sia il flusso d’aria in uscita dall’apparato fonatorio (egressivo) sia il flusso d’aria in entrata (ingressivo). Il primo è dovuto a una compressione dell’aria, che ne determina la spinta verso l’esterno (per es., ad opera dei polmoni); il secondo è causato da una rarefazione dell’aria nell’apparato fonatorio, in seguito alla quale l’aria esterna vi entra (per es., mediante la creazione di una cavità a livello orale).
L’organo che genera il flusso d’aria è quindi costituito dall’apparato polmonare. In questo caso, con una variazione del volume della cavità toracica e la conseguente compressione o rarefazione dell’aria in essi contenuta, i polmoni forniscono la spinta iniziale perché si generi il flusso d’aria necessario alla fonazione. Il flusso egressivo d’aria polmonare è sfruttato per la realizzazione dei suoni di tutte le lingue del mondo; il flusso ingressivo è tipicamente utilizzato per fenomeni paralinguistici (➔ paralinguistici, fenomeni).
Organo generatore può anche essere la laringe, struttura cartilaginea entro la quale si trovano le pliche (o corde) vocali, dalla cui disposizione dipende che i foni siano sordi o sonori. La laringe può essere chiusa per l’accostamento delle pliche vocali (e chiusura della glottide) e, qualora questa chiusura si accompagni a un’ulteriore occlusione nel canale epilaringeo (più raramente a un forte restringimento), ad es. in corrispondenza delle labbra, si realizza una camera d’aria indipendente. Abbassandosi o sollevandosi, la laringe determina l’allungamento o l’accorciamento della camera d’aria così formata e una conseguente rarefazione o compressione dell’aria in essa contenuta: nel primo caso si produrranno consonanti implosive, nel secondo consonanti eiettive.
Un altro organo che può generare il flusso d’aria, in alternativa ai polmoni ed alla laringe, è la lingua. La parte posteriore della lingua (in particolare, il postdorso) può sollevarsi sino ad aderire al palato molle, isolando così la cavità orale rispetto alla faringe e al resto dell’apparato fonatorio. La creazione di una seconda occlusione all’interno della cavità orale, ad es. in corrispondenza delle labbra o dei denti, permette la creazione di una cavità d’aria indipendente, entro cui si genera una rarefazione grazie all’abbassamento e arretramento della lingua stessa: quando la seconda occlusione è rilasciata, l’aria esterna entra nella cavità orale, determinando la realizzazione dei click (o consonanti avulsive), foni prodotti con flusso d’aria ingressivo (benché sia fisiologicamente possibile, non si conoscono lingue in cui il flusso d’aria sia egressivo; Laver 1994).
Come si evince anche dai simboli impiegati nel sistema di trascrizione IPA (fig. 1), le consonanti implosive sono sonore in quanto l’abbassamento della laringe e delle pliche vocali determina una fuoriuscita di aria egressiva che, anche involontariamente, provoca la messa in vibrazione delle pliche vocali, che così si aprono e chiudono. Le consonanti eiettive e i click, al contrario, sono per lo più sordi in quanto la laringe è del tutto esclusa dalla loro articolazione (benché si possa produrre contemporaneamente, o immediatamente dopo, un flusso d’aria egressivo polmonare che determina sonorità: Laver 1994; Mioni 2001). Consonanti implosive, eiettive e click non sono molto diffuse e non hanno valore fonologico in italiano (benché possano ricorrere nel parlato). Queste consonanti sono invece diffuse in altre lingue, ove possono anche avere valore distintivo: esistono fonemi implosivi in molte lingue dell’Asia, dell’Africa e delle Americhe, eiettivi nelle lingue del Caucaso, dell’America settentrionale e centrale e click in lingue dell’Africa meridionale.
Le articolazioni consonantiche più diffuse nelle lingue del mondo sono quelle pneumoniche prodotte con flusso d’aria egressivo. I simboli IPA corrispondenti (fig. 2) forniscono le informazioni fondamentali per la definizione delle consonanti, alle quali sarà dedicata la parte restante di questo paragrafo: la configurazione della glottide (per la differenziazione di foni sordi e sonori; riportati a sinistra e a destra, rispettivamente, in ciascuna casella), il ruolo delle cavità nasali (per la differenziazione tra foni orali e nasali), il luogo e il modo di articolazione (per la diversificazione ulteriore dei foni; come indicato dalla ripartizione dei simboli rispetto alla prima riga orizzontale e rispetto alla prima colonna verticale a sinistra, dove sono riportati rispettivamente i luoghi e i modi articolatori).
Di fondamentale importanza per la caratterizzazione dei foni è la configurazione della glottide, ossia l’area compresa tra le pliche vocali (il punto in cui è possibile il maggior restringimento della laringe). La glottide può assumere configurazioni diverse, alcune delle quali permettono specifiche modalità di fonazione, come bisbiglio o mormorio. Tuttavia, le differenze principali tra foni consonantici sono determinate dalla configurazione di apertura e di sonorità: queste permettono, rispettivamente, la realizzazione di foni sordi e sonori (sono comunque possibili anche l’occlusione e il restringimento della glottide nelle occlusive e fricative glottidali: vedi sotto). La configurazione di sonorità, nella quale si realizza un primo ostacolo alla fuoriuscita dell’aria a livello laringeo, accomuna quindi le consonanti sonore e le ➔ vocali; queste ultime, tuttavia, sono caratterizzate dall’assenza di un ostacolo alla fuoriuscita dell’aria al di sopra della laringe.
Per la definizione delle consonanti va inoltre tenuto in conto il ruolo delle cavità nasali. Nell’articolazione dei foni orali, infatti, l’aria fuoriesce solo dalla cavità orale, poiché il velo palatino, innalzandosi, aderisce alla parete rinofaringale e impedisce il coinvolgimento delle cavità nasali. Nell’articolazione dei foni nasali, invece, l’abbassamento del velo palatino rende possibile il passaggio di parte dell’aria fonatoria nelle cavità nasali, che svolgono quindi un ruolo attivo nella fonazione (➔ nasali).
I foni consonantici sono infine caratterizzati dal modo e dal luogo di articolazione. Questi si individuano facendo riferimento alla nozione di diaframma, lo spazio presente tra due pareti contrapposte, almeno una delle quali è mobile e costituisce l’articolatore attivo. Il luogo di articolazione è il punto in cui si crea il diaframma, mentre il modo di articolazione è il grado di avvicinamento delle due pareti. Il diaframma, infatti, può essere in posizione di apertura, di stretta, di chiusura parziale o di chiusura totale.
Nella posizione di apertura, l’aria può fuoriuscire liberamente. Nella posizione di stretta, la vicinanza delle pareti determina un restringimento e quindi l’aria fuoriesce creando una certa turbolenza. Nella posizione di chiusura parziale, l’articolatore tocca la parete fissa solo nella parte centrale e l’aria può uscire dai lati, senza turbolenza; infine, nel caso di chiusura totale, le pareti sono a contatto tra loro e impediscono il passaggio dell’aria.
Per l’articolazione delle consonanti sono rilevanti gli ultimi tre tipi di diaframma (il diaframma in posizione di apertura interessa invece le vocali). Inoltre un fono consonantico può anche essere caratterizzato da una successione di diversi gradi di apertura a seconda delle diverse fasi che, idealmente, si individuano nella realizzazione di un fono: l’impostazione, la tenuta, la soluzione (benché, a causa dei fenomeni di coarticolazione, nell’analisi del parlato non sia possibile distinguerle).
Il modo occlusivo si realizza mediante la chiusura totale del diaframma, in modo che l’aria non fuoriesca per tutta la fase di impostazione e tenuta dell’articolazione; l’aria si accumula in corrispondenza del diaframma ch iuso fino alla brusca apertura del diaframma stesso, al momento del rilascio dell’occlusione (fig. 3; per es., [p] e [t] in [p]ollo e [t]asso).
Il modo nasale somiglia al modo occlusivo per quanto riguarda l’occlusione a livello orale, ma si produce con l’abbassamento del velo palatino e il coinvolgimento delle cavità nasali; per tutta la durata del fono l’aria fuoriesce dalle cavità nasali e, nella fase di rilascio dell’occlusione, fuoriesce anche dalla cavità orale, benché in quantità limitata (fig. 4; per es., [m] e [n] in [m]are e [n]ido).
Il modo vibrante si produce mediante la realizzazione o di una breve chiusura (monovibrante) o di una rapida successione di chiusure del diaframma alternate ad aperture (polivibrante) (fig. 5; per es., [r] in [r]ame).
Il mod o fricativo si produce realizzando una posizione di stretta diaframmatica per tutta la durata del fono e permettendo la fuoriuscita dell’aria attraverso il restringimento generato, con conseguente turbolenza (fig. 6; per es., [f] e [s] in [f]aro e [s]eme). Nella tabella IPA si identifica anche il modo fricativo laterale quando l’aria fuoriesce in modo turbolento ai lati della lingua, il cui apice tocca gli alveoli superiori nella parte centrale. Tra le articolazioni fricative (anche dette spiranti o costrittive) si può individuare la sottoclasse delle sibilanti, composta essenzialmente da foni coronali (per es., [s], [z], [ʃ], [ʒ]), con caratteristiche uditive e acustiche simili a quelle di un sibilo (Ladefoged & Maddieson 1996).
Le affricate corrispondono alla successione di una chiusura e di una stretta diaframmatica. La prima viene mantenuta durante la fase di impostazione e tenuta del fono, come nel caso delle occlusive, mentre la seconda caratterizza la fase di rilascio, in modo analogo a quanto avviene per le fricative. Nelle affricate quindi il rilascio piuttosto lento dell’occlusione genera una posizione di stretta diaframmatica (fig. 7; per es., [ʦ] e [ʣ] in an[ʦ]i e [ʣ]ona). Affricate, occlusive e fricative sono chiamate anche ostruenti, poiché sono prodotte opponendo un ostacolo rilevante all’uscita dell’aria.
Il modo approssimante si verifica quando il diaframma sia in una posizione di stretta di entità inferiore rispetto a quella occorrente per una fricativa (infatti l’aria fuoriesce senza che si crei turbolenza) e di entità di poco superiore rispetto a quella riscontrata nell’articolazione di una vocale (peraltro le approssimanti sono anche considerate non contoidi, ossia voicoidi non sillabici: Pike 1943) (fig. 8; per es., [w] e [j] in [w]ovo e p[j]ano; ➔ semivocali).
Nel modo laterale, l’aria fuoriesce in modo non turbolento ai lati della lingua, che si è spostata in avanti in modo che la punta tocchi gli alveoli superiori nella parte centrale, subito dietro agli incisivi superiori ([l] in [l]ana). Nel sistema IPA il modo laterale è considerato approssimante laterale ed è distinto dal modo fricativo laterale, caratterizzato da una stretta diaframmatica maggiore.
Approssimanti, nasali e liquide (vibranti e laterali, secondo una terminologia che risale alla grammatica latina) sono anche dette sonoranti poiché sono sonore. Approssimanti, fricative e liquide sono anche note come continue, perché il flusso d’aria che esce dalla cavità orale può essere prolungato nel tempo.
I modi articolatori consonantici (e le vocali) si ordinano secondo una scala di sonorità (o di forza consonantica), che rispecchierebbe una tendenza osservata nell’organizzazione della sillaba. In diverse lingue del mondo, i segmenti sembrano ordinati nelle sillabe in modo che la sonorità (intesa come intensità acustica) aumenti dai margini verso il nucleo sillabico e, specularmente, la forza consonantica diminuisca. Benché si tratti solo di una tendenza ed esistano eccezioni, i modi articolatori possono essere disposti lungo un continuum agli estremi del quale sono le consonanti occlusive (sorde), dotate di massima forza consonantica e minima sonorità, e le vocali (basse), dotate di minima forza consonantica e massima sonorità (fig. 9).
Il luogo articolatorio, per convenzione, è solitamente identificato con la parete fissa rispetto alla quale si osserva la creazione del diaframma (fatti salvi i casi in cui il diaframma sia realizzato tra due pareti mobili – per es. labbra o pliche vocali – e con l’eccezione delle articolazioni retroflesse, per le quali si fa riferimento alla posizione dell’articolatore mobile, la lingua) (fig. 10).
Nel luogo bilabiale, il diaframma è realizzato tra le due labbra ([p] e [m] in [p]alla e [m]ela). Nel luogo labiodentale, la parete fissa è rappresentata dagli incisivi superiori e l’articolatore dal labbro inferiore ([f] e [v] in [f]oro e [v]aso). Nel luogo dentale, il diaframma è realizzato tra la punta della lingua e la parte posteriore degli incisivi superiori (per realizzazioni particolari di foni normalmente prodotti in corrispondenza del luogo alveolare), oppure tra gli incisivi superiori ed inferiori, dove viene spinta la punta della lingua ([θ] e [ð], in posizione iniziale nelle parole inglesi thing e that).
Nel luogo alveolare, il diaframma è prodotto tra la punta della lingua e gli alveoli superiori ([t] e [s] in [t]oro e [s]ale). Nel luogo postalveolare (o palatoalveolare), l’articolatore è la corona della lingua e la parete fissa è la parte posteriore degli alveoli superiori ([ʃ] in [ʃ]ivolo). Nelle articolazioni retroflesse il diaframma si realizza incurvando la punta della lingua verso il palato. Le retroflesse sono talvolta dette anche cacuminali (o invertite o cerebrali), mentre andrebbero distinte in quanto sono sublaminali, cioè prodotte con la parte inferiore della lingua, mentre le cacuminali sono apico-palatali, ossia articolate con l’apice della lingua ([ɖ] in [ˈbɛɖɖu] bello in dialetto siciliano). Nel luogo palatale (➔ palatali), il diaframma è creato tra il dorso della lingua ed il palato duro ([ɲ] e [ʎ] in [ɲ]omo e fo[ʎ]i). Nel luogo velare (➔ velari), l’articolatore è la parte posteriore rispetto al dorso della lingua e la parete fissa è il palato molle ([k] e [g] in [k]ane e [g]ola). Nel luogo uvulare, il diaframma è generato tra la parte posteriore rispetto al dorso della lingua e l’ugola ([ʀ], la vibrante tipica del francese, realizzata anche come variante libera della vibrante alveolare in italiano; es. ca[r]o e ca[ʀ]o). Nel luogo faringale, il diaframma si realizza tra la radice della lingua e la parete della faringe (non viene utilizzato nella lingua italiana, mentre caratterizza alcune lingue, come le lingue semitiche; per es. in arabo [’ħasan] «bello» o nome di persona). Nel luogo epiglottidale, il diaframma si realizza nell’area dell’epiglottide, grazie allo spostamento della radice della lingua (non è usato in italiano, ma si trova in alcune lingue, per es. in un dialetto della lingua caucasica nord-orientale Agul). Infine, nelle articolazioni glottidali, il diaframma è realizzato tra le pliche vocali; questo luogo di articolazione viene utilizzato in alcune varietà di italiano in seguito a fenomeni di indebolimento consonantico come la ➔ gorgia toscana (fi[h]o fico) o in seguito a fenomeni di articolazione secondaria (v. sotto), come nella produzione di consonanti aspirate (ma[tth]ina mattina).
Nella descrizione delle caratteristiche articolatorie delle consonanti si fa talvolta riferimento anche alla parte della lingua coinvolta nell’articolazione: se è l’apice, le articolazioni si dicono apicali; se è la parte immediatamente posteriore, la lamina della lingua, si dicono laminali; se è coinvolta almeno una delle due parti, le consonanti si dicono coronali.
Nell’articolazione di alcuni foni si possono creare contemporaneamente anche più diaframmi in luoghi articolatori diversi. Se i due diaframmi sono della stessa entità si ha doppia articolazione, mentre quando un diaframma è di entità minore rispetto a un altro si parla di articolazione secondaria, rispetto all’articolazione primaria corrispondente al diaframma di entità maggiore (di doppia articolazione sono i click, v. sopra; esempio di articolazione primaria / secondaria è l’occlusiva velare sorda all’inizio della parola quando, realizzata con articolazione primaria velare e articolazione secondaria labiale, ossia con protrusione e arrotondamento delle labbra per assimilazione regressiva; ➔ assimilazione).
Altro aspetto rilevante per la produzione di foni consonantici è la durata. Una diversa combinazione dei parametri appena descritti determina di per sé differenti caratteristiche di lunghezza dei foni. Ma la diversa durata ha in alcune lingue funzione distintiva e, a parità di contesto fonico, individua parole dal significato diverso: per es., in italiano, fato ~ fatto, dove la presenza di una occlusiva alveolare sorda breve oppure lunga (in altre parole, di una consonante scempia o geminata) comporta parole dal significato diverso: si veda § 6). Nel sistema di trascrizione IPA, la variazione di durata è indicata col diacritico ː (per es. [ˈfatːo]; fig. 1) (➔ quantità fonologica; ➔ fonologia).
Negli studi di fonetica è frequente il riferimento a dati acustici, data la diffusione delle nozioni di acustica tra i fonetisti e la facilità di uso di programmi per l’analisi acustica di materiali sonori (➔ fonetica acustica, nozioni e termini di). Anche le caratteristiche articolatorie sono state oggetto di indagini strumentali, ma, soprattutto nel panorama italiano, la diffusione dell’hardware e del software necessari è più limitata, così come il numero di studi compiuti. In questo paragrafo saranno brevemente discusse le principali tipologie di indagine strumentale relative all’articolazione dei foni consonantici (e non, ad es., ad aspetti fisiologici della loro produzione, ossia aerodinamici o dell’attività muscolare relativa).
Fino agli anni Settanta del XX secolo, le considerazioni di tipo articolatorio si basavano prevalentemente sull’auto-osservazione, sulla palatografia o linguografia statica e sullo studio di immagini radiografiche. Nel primo caso si utilizzavano specchi, mentre per la palatografia o linguografia statica si cospargeva una parte della cavità orale (normalmente la lingua o il palato, meno frequentemente i denti o le labbra) di polvere scura (per es., di carbone vegetale) che veniva poi asportata nella zona di contatto necessaria all’articolazione del fono studiato; mediante specchi si potevano fotografare gli articolatori, visualizzando le zone in cui la polvere era stata asportata e, simmetricamente, quelle alle quali aveva aderito. Un altro metodo consisteva nell’utilizzo di immagini radiografiche e riprese cineradiografiche, ricavate per determinare la conformazione del tratto vocale durante la produzione dei suoni linguistici.
Attualmente le informazioni di tipo articolatorio sono ricavate per mezzo di elettropalatografi, articulografi elettromagnetici, sistemi optoelettronici, ecografi. Gli elettropalatografi ricavano dati relativi all’entità del contatto tra lingua e palato durante l’articolazione. Funzionano grazie a palati artificiali nei quali siano inseriti appositi elettrodi che permettono di rilevare in quali zone avvenga il contatto e quale sia l’intensità dello stesso (fig. 11). Gli articulografi elettromagnetici permettono di ricavare informazioni di tipo cinematico, registrando il movimento di articolatori, come le labbra e la lingua, sui quali siano stati posti specifici elettrodi. La posizione degli elettrodi viene rilevata all’interno del campo magnetico creato dallo strumento (fig. 12). I sistemi optoelettronici ricavano dati analoghi, ma relativi ai soli articolatori esterni.
Questi strumenti digitalizzano il segnale video acquisito per mezzo di apposite telecamere che identificano la posizione di marker di materiale riflettente incollato sugli articolatori esterni, come le labbra. Gli ecografi forniscono principalmente immagini 2D o ricostruzioni 3D e 4D (ossia a tre dimensioni, nel tempo) relative al movimento della lingua. Le immagini corrispondono a sezioni sagittali (in senso antero-posteriore) o coronali (frontali) della lingua e sono ricavate mediante normali sonde ecografiche poste sotto la mandibola del parlante (fig. 13).
I numerosi studi di fonologia non sempre riportano descrizioni concordanti circa l’inventario dei fonemi consonantici dell’italiano. Il principale punto di disaccordo riguarda lo status fonologico delle consonanti geminate (o doppie): per es.[ˈfatːo] fatto ~ [ˈfaːto] fato). Altri aspetti problematici possono riguardare lo status di segmenti come le affricate alveolari sonore, le fricative alveolari sonore, le approssimanti palatali e le labiovelari, qui considerate come fonemi (rispettivamente, /ʣ/, /z/, /j/ e /w/).
In questo paragrafo sarà fornito un elenco ragionato di fonemi e ➔ allofoni consonantici riconosciuti nella varietà standard di italiano, benché lo standard rappresenti un’astrazione rispetto alle varietà effettivamente utilizzate (➔ italiano standard); in seguito saranno discusse le principali varianti regionali e dialettali, rimandando il lettore alle voci specifiche per approfondimenti.
Il sistema fonologico dell’italiano standard è composto da 23 consonanti, per alcune delle quali esistono ➔ allofoni. Esse sono:
occlusive
bilabiali sorde e sonore: /p/, /b/ (/ˈpalla/ ~ /ˈbalːa/);
alveolari sorde e sonore: /t/, /d/ (/ˈtare/ ~ /ˈdare/);
velari sorde e sonore: /k/, /g/ (/ˈkara/ ~ /ˈgara/).
nasali
bilabiali: /m/ (/ˈmano/ ~ /ˈnano/);
alveolari: /n/ (/ˈnɔdo/ ~ /ˈmɔdo/);
palatali: /ɲ/ (/aˈɲɛlːo/ ~ /aˈnɛlːo/).
Per le nasali esistono allofoni come la nasale labiodentale [ɱ] e la nasale velare [ŋ], varianti combinatorie che si realizzano, per effetto di ➔ assimilazione regressiva, prima di consonanti labiodentali ([ˈaɱfora]) e velari ([ˈaŋkora]).
(poli)vibranti
alveolari: /r/ (/ˈrado/ ~ /ˈdado/).
fricative
labiodentali sorde e sonore: /f/, /v/ (/ˈfaro/ ~ /ˈvaro/);
alveolari sorde e sonore: /s/, /z/ (/ˈfuso/ «arnese usato per la filatura a mano» ~ /ˈfuzo/ «participio del verbo fondere»).
Tuttavia, in molte varietà di italiano la distribuzione di [s] e [z] è diversa rispetto a quanto è riportato per lo standard e l’opposizione ha uno scarso rendimento funzionale: sono poche le coppie minime (➔ coppia minima) basate sulla commutazione di [s] e [z] e, analizzando la distribuzione dei due foni, si osserva che somigliano a varianti combinatorie (➔ variante combinatoria) di uno stesso fonema poiché compaiono in contesti diversi, fatto salvo il contesto intervocalico; postalveolari o palatoalveolari sorde: /ʃ/ (/ˈʃatto/ ~ /ˈfatto/).
affricate
alveolari sorde e sonore: /ʦ/, /ʣ/ (/ˈratːsa/ «gruppo di individui della stessa specie» ~ /ˈradːza/ «pesce»).
Anche questa opposizione ha uno scarso rendimento funzionale in quanto sono poche le coppie minime individuate dalla commutazione di [ʦ] e [ʣ];
postalveolari o palatoalveolari sorde e sonore: /ʧ/, /ʤ/ (/ʧeˈlato/ ~ /ʤeˈlato/).
laterali
alveolari: /l/ (/ˈli/ ~ /ˈʎi/);
palatali: /ʎ/ (/ˈʎi/ ~ /ˈli/).
approssimanti
palatali: /j/ (/ˈspjanti/ «indicativo presente di spiantare» ~ /spiˈanti/ «participio presente di spiare»);
labiovelari: /w/ (/laˈkwale/ la quale ~ /lakuˈale/ lacuale).
Sono poche le coppie minime che permettono di evitare di considerare le due approssimanti come varianti non sillabiche di /i/ ed /u/, come avviene tradizionalmente per le ➔ semivocali che, nei dittonghi discendenti (➔ dittongo), ricorrono dopo il nucleo della sillaba ([ˈsai̯] sai, [ˈpau̯za] pausa). Nella tradizione italiana, le approssimanti sono considerate semiconsonanti per la loro distribuzione, perché ricorrono prima del nucleo sillabico nei dittonghi ascendenti (per es. /ˈpjano/ piano, /ˈkwando/ quando).
Nel sistema consonantico dell’italiano la quantità (➔ quantità fonologica) ha valore distintivo ed è quindi fonologica, almeno in base ad alcune posizioni circa lo status fonologico delle consonanti geminate. La maggior parte delle consonanti può essere sia scempia sia geminata, con conseguente differenza di significato: /ˈkade/ ~ /ˈkadːe/, /ˈfuga/ ~ /ˈfugːa/). Delle otto consonanti che non subiscono geminazione, cinque (/ʦ/, /ʣ/, /ʃ/, /ɲ/, /ʎ/) sono sempre lunghe in posizione intervocalica ([laˈʃːia] la scia), mentre tre ricorrono sempre come scempie (/j/, /w/, /z/).
L’opinione più diffusa è che le geminate rappresentino sequenze di due consonanti identiche appartenenti a sillabe diverse: /ˈkad.de/ (dove «.» indica il confine sillabico). In passato sono però state avanzate altre ipotesi, tra cui quella secondo la quale la geminata è un unico fonema lungo che appartiene a un’unica sillaba: /ˈka.dːe/. Questa proposta non gode di gran favore perché, oltre a comportare un incremento del numero di fonemi consonantici, comporta una differenza nella struttura sillabica delle parole includenti geminate tale da implicare anomalie nelle regole di allungamento delle vocali toniche (le vocali toniche che precedono le geminate risulterebbero allungate, come quelle in sillaba aperta non finale, diversamente da quanto osservato anche sperimentalmente). Inoltre, considerare le geminate come un singolo fonema non renderebbe conto del fatto che le geminate italiane derivano spesso da nessi consonantici latini, per assimilazione: per es., factum > /ˈfatto/.
Le caratteristiche dell’italiano dipendono dall’evoluzione della lingua a partire dal latino volgare, seguendo un percorso che presenta aspetti simili nelle lingue romanze, seppur con esiti talvolta peculiari.
Tra i fenomeni principali ricordiamo la palatalizzazione (➔ palatali) delle alveolari e velari seguite da vocale anteriore, anche con affricazione: per es., vineam > vi[ɲ]a; filium > fi[ʎ]o; ceram [kɛram] > [ʧ]era; gelum [gɛlum] > [ʤ]elo. Diversi gradi di palatalizzazione hanno interessato anche i nessi formati da consonante e laterale (per es., planum > p[j]ano e, in modo analogo, i nessi bl, fl, cl, gl), mentre l’affricazione si è anche verificata in relazione ad alcuni fonemi specifici. Ad es., i fonemi /j/ e /w/ erano presenti in latino insieme agli allofoni vocalici [i], [u]. Nel latino tardo non erano più realizzati come approssimanti, ma forse come fricative, e in italiano la /j/ ha poi dato origine a un’affricata palatale: peius > pe[dːʒ]o; sanguis > sang[w]e.
In altri casi si è verificata una spirantizzazione, cioè una trasformazione in fricativa (o spirante). Ad es., le occlusive bilabiali e alveolari sonore sono conservate quando si trovavano in posizione iniziale di parola, ma all’interno di parola possono essersi trasformate in fricative per ➔ indebolimento (o lenizione: per es., caballŭm > ca[v]allo, ma pedem > pie[d]e). Altri casi di lenizione si sono verificati nei nessi composti da consonante sonora + vibrante: es. nigrum > ne[r]o.
Fenomeni di assimilazione sono all’origine di consonanti geminate, ad es. nel caso di nessi composti da vibrante e consonante all’interno di parola (dorsum > do[sːs]o), o da occlusiva bilabiale o velare e consonante alveolare (capsam > ca[sːs]a, noctem > no[tːt]e). In altri casi, le geminate derivano dall’allungamento della consonante (sēpiam > se[pːp]ia).
La derivazione dal latino volgare ha portato talvolta a esiti diversi nelle lingue romanze (si pensi, ad es., alle occlusive sorde, conservate in italiano ma indebolite nella parte occidentale dell’area romanza: sapere > sp. sa[β]er, fr. sa[v]oir, it. sa[p]ere), o anche nella stessa lingua. In Italia, ad es., si distinguono tre aree principali (➔ aree linguistiche) per le caratteristiche fonetiche e fonologiche della lingua: un’area settentrionale (a nord della linea che congiunge La Spezia e Rimini), un’area centrale (che comprende Toscana, Umbria settentrionale, Lazio settentrionale e Marche) e un’area meridionale (che include Abruzzo, Campania, Puglia, Calabria e Sicilia, a sud della linea Roma-Ancona). Già Rohlfs (1937), infatti, aveva individuato un insieme di tratti che permettevano di differenziare tre aree, identificando i margini della zona centrale.
Nell’area settentrionale, alcuni aspetti che caratterizzano i dialetti locali e che spesso si riflettono nelle varietà di italiano, sono i seguenti:
(a) le consonanti finali di parola tendono a cadere già in latino classico (in partic., m# t#; s#) e nelle varietà settentrionali tendono a scomparire anche le vocali finali diverse da -a e -i: panem > pane > pan;
(b) le occlusive intervocaliche sono indebolite, risultando sonorizzate (*fratĕllu > lomb. [fraˈdɛl] «fratello»), spirantizzate (capĭllu > torinese [kaˈvɛj] «capelli») o soggette a dileguo (*fratĕllu > piem. [ˈfrel] «fratello»);
(c) si è realizzata la palatalizzazione dei nessi formati da consonante e laterale (plateam > lig. [ˈʧaʦa] ~ [ˈpjatːsa]; clamat > ven. [ˈʧama] ~ [ˈkjaːma]), e dei nessi -ct- (che non corrispondono a geminate dovute ad assimilazione; es. lactem > lomb. [ˈlaʧ], piem. e lig. [ˈlajt] «latte»).
Analogamente, nell’area meridionale le caratteristiche principali del consonantismo sono le seguenti:
(a) i nessi -nd- e -mb- sono soggetti ad assimilazione totale progressiva (rom. mo[nːn]o ~ mo[nd]o; pio[mːm]o ~ pio[mb]o), ma non nel Salento, nella Calabria meridionale e nelle varietà della Sicilia nord-orientale; in Umbria, le realizzazioni cambiano a seconda delle località e della generazione alla quale appartiene il parlante;
(b) le consonanti sorde dopo nasale tendono a essere sonorizzate: [ˈtembo] tempo, [aŋˈgoːra] ancora.
Le principali isoglosse (➔ isoglossa) sono quindi individuate in base a tratti fonetici caratteristici. Tuttavia le varietà di lingua parlate in Italia, o anche nelle regioni, possono essere ulteriormente differenziate, o talvolta accomunate, dalla presenza di fenomeni allofonici o da realizzazioni specifiche dei fonemi consonantici.
In italiano è possibile trovare nessi biconsonantici (primo, apri o, assunta l’analisi bifonematica delle geminate, fatto), triconsonantici (amplio, strato), e pochi quadriconsonantici (perscrutare, tungsteno) in parole che sono spesso prestiti da lingue straniere o che appartengono a linguaggi settoriali (Chiari & Castagna 2005).
Nei nessi biconsonantici, si trovano spesso sequenze nelle quali il primo elemento è una nasale, seguita da quasi qualsiasi consonante a parte /ʃ/, /ɲ/, /ʎ/, /l/ e /r/ (impero); una vibrante, seguita da quasi qualsiasi consonante a parte le palatali (marmo, sport); una sibilante (sdegno), spesso parte di un nesso composto da soli elementi sordi (asta); una laterale (alto), che compare anche spesso come secondo elemento (merlo); una occlusiva o fricativa labiodentale (soprattutto /f/), seguita da vibrante (treno); rientrano negli ultimi due casi i nessi muta cum liquida, composti da ostruenti e vibranti o laterali. Inoltre si individuano spesso sequenze nelle quali compaiono consonanti geminate (sasso).
Nei nessi triconsonantici in posizione iniziale di parola è attiva una restrizione che prevede che il primo elemento sia /s/, seguito da una ostruente e una liquida (splende). Altrimenti è possibile individuare anche nessi eterosillabici nei quali il primo membro può essere, oltre che una sibilante (nostra), una nasale (sempre), una liquida (altro) o una geminata (applausi). Dagli esempi forniti si evince che la testa della sillaba può essere sia bi- che triconsonantica (blu, splende) e che la coda può essere biconsonantica (sport). Peraltro, indipendentemente dai nessi, una consonante può comparire a inizio sillaba, a fine sillaba, a inizio parola e, più raramente, a fine parola (soprattutto in parole funzionali, prestiti, latinismi e acronimi: il, boom, lapis, FIAT).
In alcune varietà di italiano, le sequenze di consonanti sono soggette a particolari fenomeni fonotattici (oltre ai fenomeni allofonici discussi sopra). Ad es., i parlanti del Sud Italia sonorizzano le affricate dopo laterale, così come in posizione intervocalica: al[ʣ]are ~ al[ʦ]are). In Sicilia e nel Salento la fricativa alveolare sorda /s/ può essere realizzata come postalveolare quando si trovi prima di occlusiva sorda: [ˈkwɛʃta ˈʃkwɔla] questa scuola. Processo simile si riscontra in Campania, ma non prima di consonante coronale ([ˈkwesta ˈʃkwo:la]). Nella varietà toscana (ma non a Firenze), romana e campana, la fricativa alveolare sorda dopo sonorante (nasale o liquida) è realizzata come affricata: [ˈpɛnʦo] penso. In alcune varietà meridionali, ad es. in Puglia, Basilicata e Molise, queste affricate sono anche sonorizzazione: [ˈpɛnʣo]. Tra i fenomeni principali in posizione intervocalica, il più comune è quello di indebolimento: fi[h]o fico nella gorgia toscana.
Nelle varietà del Nord, si osserva una generale tendenza allo ➔ scempiamento delle consonanti geminate ([ˈbɛla] ~ [ˈbɛlla]) e delle consonanti lunghe per posizione ([ˈfiʎo] ~ [ˈfiʎːo]). In alcune zone d’Italia, sono rese come scempie alcune consonanti specifiche, ad es. soprattutto nel Lazio la vibrante: [ˈbuːro] burro, [ˈgwɛra] guerra. Per converso, nell’area centro-meridionale, compreso il Lazio, oltre alle geminate vengono prodotte come lunghe /b/ e /ʤ/ intervocaliche ([ˈabːile] abile, [ˈadːʒile] agile), anche a confine di parola (oltre al fatto che in alcune varietà sono attestate comunque le geminate in posizione iniziale). Inoltre nelle varietà meridionali estreme parlate in Sicilia, Calabria e Puglia meridionali, le geminate occlusive sorde sono aspirate ([ˈfatːho]).
Circa i fenomeni che riguardano le consonanti in relazione alla struttura degli elementi prosodici, ricordiamo un fenomeno che riguarda la Toscana e il Lazio, così come alcune varietà meridionali (quelle parlate nella Sicilia orientale): l’assimilazione regressiva totale che interessa le sonoranti in fine di sillaba (in posizione di coda) e che porta alla loro assimilazione al segmento consonantico seguente, realizzato come lungo (/ilˈritmo/ > [iˈrːitmo], /konˈlui̯/ > [koˈlːui̯]). Anche nella varietà parlata a Roma si verifica un fenomeno fonotattico che interessa le consonanti in posizione di coda sillabica: il passaggio dalla laterale /l/ alla vibrante /r/, noto come rotacismo: /sulʤeˈlato/ sul gelato > [surdʒeˈlato]. La posizione di coda sillabica è soggetta a fenomeni fonologici anche nelle varietà settentrionali, in molte delle quali le nasali sono velarizzate quando compaiono in fine sillaba (molto spesso insieme alla vocale precedente: [ˈpeŋsa] pensa).
I processi allofonici interessano le consonanti anche all’inizio della sillaba (posizione di attacco) o della parola. In Sicilia e in alcune zone della Sardegna la vibrante viene allungata a inizio parola: [ˈsɔːno ˈrːikki] sono ricchi. In alcune varietà di italiano, quando sia forte l’interferenza del dialetto, si osservano anche realizzazioni retroflesse: ad es. in Sicilia, nel Sud della Calabria e della Puglia alcuni nessi che includono /r/ sono realizzati come retroflessi o cacuminali ([ˈʈɽɛːnɔ] treno), così come sono retroflessi altri elementi consonantici, come le alveolari geminate, attestati anche in Sardegna e Corsica ([ˈbeɖːu]).
Tra i fenomeni che interessano domini prosodici più ampi della sillaba è diffuso il raddoppiamento fonosintattico (➔ raddoppiamento sintattico). Si tratta di una regola di ➔ sandhi esterno che riguarda le varietà centro-meridionali di italiano e che determina, in contesti specifici, l’allungamento della consonante iniziale di parola: [meˈta pːaˈnino] metà panino.
L’italiano si caratterizza per una maggior frequenza dei foni vocalici rispetto a quelli consonantici (a parte la vocale /u/). Quanto ai foni consonantici, sono più frequenti le occlusive e le nasali rispetto agli altri modi di articolazione; tra i luoghi di articolazione, sono più frequenti i luoghi anteriori (alveolari) rispetto ai posteriori (in particolare, rispetto ai palatali). Se c’è un’opposizione di sonorità, le sorde sono generalmente più frequenti delle sonore; se si considerano le scempie e le geminate, le prime sono più frequenti delle seconde (Minnaja & Paccagnella 1977; Bortolini et al. 1978; sui nessi consonantici, v. Chiari & Castagna 2005 per dati ricavati da materiali appartenenti al corpus LIP, Lessico di frequenza dell’italiano parlato, De Mauro et al. 1993).
Bortolini, Umberta et al. (1978), Statistics for a stochastic model of spoken Italian, in Proceedings of the twelfth international congress of Linguists (Wien, August 28 - September 2 1977), editors W.U. Dressler & W. Meid, Innsbruck, Institut für Sprachwissenschaft der Universität Innsbruck, pp. 580-586.
Chiari, Isabella & Castagna, Silvia (2005), La fonotassi statistica dell’italiano e del tedesco: i nessi consonantici, in Parole e numeri. Analisi quantitative dei fatti di lingua, a cura di T. De Mauro & I. Chiari, Roma, Aracne, pp. 67-84.
Giannini, Antonella & Pettorino, Massimo (1992), La fonetica sperimentale, Napoli, Edizioni Scientifiche Italiane.
Grassi, Corrado, Sobrero, Alberto A. & Telmon, Tullio (1997), Fondamenti di dialettologia italiana, Roma - Bari, Laterza.
Ladefoged, Peter & Maddieson, Ian (1996), The sounds of the world’s languages, Oxford, Blackwell.
Laver, John (1994), Principles of phonetics, Cambridge, Cambridge University Press.
LIP 1993 = De Mauro, Tullio et al., Lessico di frequenza dell’italiano parlato, Milano, ETAS libri.
Minnaja, Carlo & Paccagnella, Laura (1977), Variazioni dell’entropia linguistica dell’italiano scritto e calcolo di un’entropia fonematica, «Rendiconti del seminario matematico della Università di Padova» 57, pp. 247-265.
Mioni, Alberto M. (2001), Elementi di fonetica, Padova, Unipress.
Muljačić, Žarko (1969), Fonologia generale e fonologia della lingua italiana, Bologna, il Mulino.
Nespor, Marina & Vogel, Irene (1986), Prosodic phonology, Dordrecht, Foris Publications.
Pike, Kenneth L. (1943), Phonemics, A technique for reducing languages to writing, Ann Arbor, University of Michigan Press.
Rohlfs, Gerhard (1937), La struttura linguistica dell’Italia, Leipzig, Keller (poi in Id., Studi e ricerche su lingua e dialetti d’Italia, Firenze, Sansoni, 1972, pp. 6-22).
Schmid, Stephan (1999), Fonetica e fonologia dell’italiano, Torino, Paravia.