semivocali
Le semivocali sono suoni di tipo vocalico che, nei dittonghi (➔ dittongo) e nei trittonghi (➔ trittongo), si combinano alle ➔ vocali propriamente dette. Una suddivisione più fine oppone le semivocali alle semiconsonanti sulla base della posizione rispetto alla vocale: se ricorrono prima (per es., fieno, questo) sono dette semiconsonanti, se ricorrono dopo semivocali (per es., noi, feudo). Questo gruppo di suoni, invero piuttosto controverso, rientra nelle articolazioni di tipo approssimante e può essere designato anche con il termine legamento o con la parola ingl. glide.
Il nome stesso è ambiguo: si tratta di suoni etichettabili come vocali (con una struttura formantica più o meno riconoscibile (cfr. § 4; ➔ fonetica acustica, nozioni e termini di) che tuttavia si comportano come consonanti. La rapidità e la brevità del gesto articolatorio (che spiega la designazione di glide «scivolamento») non possono essere considerate caratteristiche comuni a tutti gli elementi della classe, poiché questi suoni, proprio come le altre consonanti, possono essere anche geminati e contrastare fonologicamente con le corrispondenti brevi (Maddieson 2008): per questa ragione Ladefoged & Maddieson (1996: 322) preferiscono utilizzare l’etichetta di semivocale (vowel-like segments). Anche Mioni (2001: 102-103) sottolinea l’ambiguità del termine glide con cui si designano classi di foni molto diversi fra loro: i vocoidi non sillabici quali [w] e [j], le vocali instabili, le transizioni prodotte involontariamente nel passaggio tra un suono e un altro. Nella tradizione linguistica italiana (§ 5), i foni [w] e [j] sono considerati semiconsonanti per la loro distribuzione nei dittonghi.
Le semivocali vengono descritte in relazione alla vocale omorganica, cioè alla vocale più simile dal punto di vista articolatorio (➔ fonetica articolatoria, nozioni e termini di): [j], classificata semivocale palatale anteriore, è il corrispettivo approssimante di [i]; parimenti, [w], semivocale velare posteriore, è l’approssimante corrispondente a [u].
Semivocali che funzionano da consonanti sono molto diffuse tra le lingue del mondo. La semivocale più comune è /j/ (attestata nell’86,1% del campione di Maddieson 1984), seguita da /w/ (attestata nel 75,7%). La presenza di /w/ implica di solito quella di /j/, cioè se c’è la prima c’è l’altra. Le due semivocali sono strettamente collegate alle vocali corrispondenti: in pochissime lingue compare /j/ senza /i/, mentre in una percentuale leggermente maggiore di casi (7,3% rispetto a 2,5%) ricorre /w/ in assenza di /u/. Una ragione tipologica e una fonetica possono motivare la maggior frequenza di /j/: tra le lingue, fra le vocali periferiche /u/ è quella più spesso mancante, mentre /i/ è quella più diffusa; /i/ è in genere più breve di /u/, quindi risulta favorita nella formazione dei dittonghi. Le due semivocali divergono anche dal punto di vista della variabilità. Nei casi di presenza di /w/ e assenza di /u/, le vocali omorganiche a /w/ possono essere molteplici (/ɨ/, /ɯ/, /ʉ/, /o/, ecc.): da qui, probabilmente, una maggiore variabilità di /w/ rispetto a /j/ (Maddieson 1984: 94).
Le altre semivocali, più rare, possono esser suddivise in due gruppi: le varianti di /j/ o di /w/ e quelle con differenti luoghi di articolazione. Nel primo gruppo ci sono le varianti desonorizzate, laringalizzate e nasalizzate di /j/ e quelle desonorizzate e laringalizzate di /w/. Nel secondo gruppo compare l’approssimante labiopalatale [ɥ], presente, ad es., nel francese [lɥi] lui «lui» e in poche altre lingue: trattandosi del corrispondente approssimante della vocale anteriore arrotondata alta [y], è articolata nella zona palatale ma con arrotondamento labiale.
I dittonghi, un probabile universale fonetico-fonologico, sono costituiti dalla combinazione di una qualunque vocale, seguita o preceduta da una vocale in genere alta.
Le vocali alte (come [i], [u]), essendo al limite tra articolazione vocalica e quella consonantica, perdono più facilmente la loro sillabicità (diventano asillabiche) e vanno a costituire il primo o il secondo elemento di un dittongo, caratterizzandosi per un’articolazione generalmente più rapida e più chiusa (Maddieson 1984): nel processo di dittongazione è più economico che a ridursi siano i suoni relativamente più brevi e più chiusi (a parità di condizioni, la durata media di [a] è maggiore rispetto alla durata media di [i]; ➔ vocali). Sono però attestati elementi asillabici medi o bassi, ad es.; nei dittonghi ascendenti del romeno e in quelli del veneto centrale (cfr. Mioni 2001: 98). Del resto, negli stili informali dell’italiano si possono verificare fenomeni di sineresi (➔ sinalefe) che danno origine a nuovi dittonghi fonetici in presenza anche di vocali medie.
Dal punto di vista articolatorio, le semivocali appartengono alla categoria dei foni approssimanti, che possono essere considerati l’opposto di quelli occlusivi, poiché producono non una chiusura del tratto vocale, bensì un suo restringimento. La categoria fu postulata nel 1964 dal fonetista americano Peter Ladefoged, ma non è priva di problematicità, dal momento che raggruppa foni precedentemente localizzati in altre serie fonetiche (Mioni 2001: 51-54).
La distinzione, tradizionale nella romanistica, tra semivocali e semiconsonanti, rifletterebbe una reale differenza fonetica. La semivocale è l’elemento asillabico che nei dittonghi discendenti segue la vocale (per es., mai, feudo); la semiconsonante è l’elemento asillabico che nei dittonghi ascendenti precede la vocale (ad es., bianca, uomo): nel primo caso si ha una diminuzione del grado di apertura diaframmatica e di intensità sonora; nel secondo, avviene il contrario. La semivocale, più aperta della semiconsonante, è considerata vocale asillabica, mentre la semiconsonante è trattata come consonante approssimante (Mioni 1986: 56), anche se la classificazione fonetica e fonologica dell’elemento asillabico dei dittonghi è ancora molto controversa (§ 6).
I termini dittongo ascendente e dittongo discendente si riferiscono alla posizione, all’interno della ➔ sillaba, della vocale sillabica, l’elemento più prominente: ad es., in [ai̯] di mai e [ɛu̯] di feudo si passa da un elemento più intenso e più lungo, [a] e [ɛ], a uno meno intenso e meno lungo, rispettivamente [i̯] e [u̯]; al contrario, in [ja] di bianca o in [wɔ] di uomo si passa da un elemento meno intenso e più breve, [j] o [w], a uno più intenso e più lungo, rispettivamente, le vocali [a] e [ɔ]. Nell’alfabeto IPA (➔ alfabeto fonetico) l’elemento asillabico dei dittonghi ascendenti è trascritto mediante i simboli delle approssimanti [j w], mentre l’elemento asillabico dei dittonghi discendenti è indicato con la vocale corrispondente insieme al diacritico di asillabicità [u̯]. Quest’ultima notazione è presente soltanto nelle trascrizioni molto strette: parole come lei e noi possono essere trascritte anche [lɛi], [noi].
La differenza tra semiconsonanti e semivocali in senso stretto si verifica anche sul piano della sillaba, poiché si ha una diversa solidarietà strutturale tra gli elementi che costituiscono una sequenza bivocalica (Marotta 1987): la semiconsonante può appartenere all’attacco mentre la semivocale è parte della rima. Pertanto, solo nel caso di dittongo discendente il dittongo funziona come un’unità, legittimata dalla comune appartenenza dei due membri alla rima: la sequenza vocale-semivocale è dunque assimilabile a una sequenza vocale-vocale. Al contrario, le sequenze in cui l’elemento asillabico precede la vocale sono come sequenze consonante-vocale; nelle combinazioni consonante-semivocale-vocale la consonante e la semivocale fanno parte dell’attacco e mostrano una maggiore solidarietà rispetto a quella che lega semivocale e vocale.
Anche la struttura prosodico-sintattica e la velocità d’eloquio (➔ pronuncia) hanno peso diverso a seconda che nella sequenza ci sia una semiconsonante o una semivocale. Le semivocali in senso stretto sono più inclini delle semiconsonanti a riconvertirsi negli allofoni sillabici corrispondenti: i dittonghi discendenti in posizione finale di enunciato (dove di solito i segmenti subiscono allungamento) possono facilmente diventare iati. Al contrario, i dittonghi ascendenti appaiono più protetti dalla controtendenza verso lo iato, dal momento che sarebbero necessari allungamenti molto più consistenti e anormali rispetto a quelli che si realizzano nelle semivocali in senso stretto all’interno dei dittonghi discendenti. Con una bassa velocità d’eloquio, i dittonghi ascendenti non si trasformano mai negli iati corrispondenti (si limitano piuttosto ad allungare la vocale sillabica), mentre i dittonghi discendenti possono diventare iati. Viceversa, a velocità d’eloquio sostenuta, gli iati possono diventare dittonghi: lacuale può diventare [laˈkwale] ma la quale non può diventare [laˈkuale] (Bertinetto 1981: 158; Marotta 1987: 876).
Le differenze acustiche tra semivocali e vocali sono ancora oggetto di discussione. Taluni intendono le semivocali /j/ e /w/ come segmenti identici alle vocali /i/ e /u/ ad eccezione del loro ruolo nella sillaba. Le due classi di foni si distinguerebbero soprattutto per il parametro acustico dell’ampiezza o della prominenza, per la struttura sillabica o in base alle differenti velocità delle transizioni formantiche (cfr. Maddieson & Emmorey 1985 e il numero monografico di «Lingua» 2008).
Per altri, le semivocali sono prodotte con una maggiore chiusura del tratto vocale e pertanto dovrebbero essere contraddistinte anche da differenti valori formantici. I dati di Maddieson & Emmorey (1985) confermano questa seconda ipotesi per le semivocali /j/ e /w/, che acusticamente mostrano di essere più ‘consonantiche’ delle rispettive vocali (predominanza delle transizioni nel caso delle semivocali versus predominanza della parte stabile nelle vocali). Nelle vocali in genere i valori della prima formante sono più elevati delle semivocali corrispondenti e, viceversa, quelli della seconda meno elevati, il che vuol dire nel complesso un tratto vocalico più aperto nell’articolazione delle vocali che in quella delle semivocali omorganiche.
Le semivocali dell’italiano sono oggetto di disputa a livello di inventario fonematico: per Castellani (1980: 62) e Muljačić (1972: 59-60) le semivocali /i̯/, /u̯/ dovrebbero essere interpretate come allofoni delle vocali /i/ e /u/, mentre un ruolo autonomo rivestirebbero le semiconsonanti /j/ e /w/. Diversamente, Hall (1971: 22) considera sia le semivocali che le semiconsonanti varianti asillabiche di /i/ e /u/. A livello allofonico, taluni aggiungono [ɥ] (approssimante palatale accompagnato da protrusione delle labbra), indiziato di comparire nei trittonghi semiconsonante + semiconsonante + vocale, in parole come quiete, seguiamo (Marotta 1987: 880; Bertinetto & Loporcaro 2005: 139).
Non è esente da dubbi neppure la modalità con cui creare coppie minime (➔ coppia minima) a dimostrazione della fonematicità di questi elementi (Mioni 2001: 180). Le coppie minime e semiminime citate nella letteratura (ad es. Lepschy 1964: 61-62) per le opposizioni /j/ ~ /i/ e /w/ ~ /u/ – rispettivamente, /ˈspjanti/ (da spiantare) ~ /spiˈanti/ (da spiare); /ˈpjaːno/ (agg. e avv.) ~ /piˈaːno/ (da Pio); /laˈkwaːle/ la quale ~ /lakuˈaːle/ lacuale; e /aˈkːwisti/ acquisti ~ /akuˈisti/ acuisti; /ekwiˈta/ equità ~ /akuiˈta/ acuità – sono poche e hanno un carattere alquanto ricercato. In ragione delle differenze nella struttura fonotattica (le strutture sillabiche nei membri delle coppie non sono equivalenti), Schmid (1999: 139) propone una diversa prospettiva: «/j/ e /w/ non possono avere una distribuzione equivalente come /i/ e /u/ e dovrebbero essere contrapposte piuttosto a dei fonemi consonantici», come nelle coppie /ˈtwɔno/ ~ /ˈtrɔno/ e /ˈjɔdjo/ ~ /ˈpɔdjo/.
Il comportamento delle semivocali in italiano è stato indagato, sul versante fonologico, da Camilli (19653) e Marotta (1987). Non sono molti gli studi sperimentali e le indagini in merito alla discriminazione tra ➔ dittongo e ➔ iato, nonostante l’alta frequenza, nella fonotassi dell’italiano, delle sequenze vocaliche. Sul versante fonetico-acustico i principali lavori sono di Salza (1986, 1988, 1991) e Salza, Marotta & Ricca (1987); un’analisi elettropalatografica è in Calamai & Bertinetto (2006).
Il confronto fra vocali toniche, vocali atone e semivocali/semiconsonanti dimostra che le vocali atone e le semivocali presentano valori della seconda formante minori nel caso delle vocali anteriori e maggiori nel caso delle vocali posteriori; che, a livello di struttura formantica, la porzione stabile della semivocale, se esiste, è molto breve e presenta valori formantici diversi da quelli della corrispondente vocale sillabica; che, infine, le semiconsonanti hanno una chiara tendenza alla centralizzazione rispetto alle corrispondenti vocali omorganiche. La durata appare il parametro acustico principale per distinguere le semiconsonanti dalle semivocali vere e proprie, che sono lunghe: la durata media delle prime è di 50 ms, mentre quella delle seconde è di 80 ms (la vocale tonica ha un valore medio di 120 ms). Ne risulta una scala temporale a tre gradi con il fono breve rappresentato dalla semiconsonante, quello semilungo dalla semivocale, quello lungo dalla vocale tonica. Solo il fono prevocalico presenta un costante e significativo accorciamento, quello postvocalico ha una lunghezza analoga a quella di una vocale atona. Il processo di riduzione articolatoria è pertanto maggiormente marcato nel caso delle sequenze semiconsonante + vocale rispetto a quelle vocale + semivocale (Salza 1986; Salza, Marotta & Ricca 1987).
In italiano le semiconsonanti hanno una frequenza maggiore delle semivocali in senso stretto, dal momento che i dittonghi ascendenti sono più numerosi di quelli discendenti. Il dato è da mettere in relazione con l’evoluzione storica della lingua: la maggioranza dei dittonghi ascendenti è diretta continuazione delle vocali medie brevi latine in sillaba tonica; i dittonghi discendenti continuano la forma latina dotta oppure sono dovuti all’incontro tra morfemi, spesso finali di parola.
Non esistono i dittonghi ascendenti [ji wu], né i dittonghi discendenti [ii̯ uu̯], che avrebbero timbri uguali. Soprattutto nel caso della semivocale posteriore, ci sono dunque diverse lacune distribuzionali, mancando le combinazioni [iu̯ ɔu̯ ou̯]. Sono rari i dittonghi discendenti con [u̯], presenti solo nei prestiti o nei latinismi. I dittonghi discendenti con [i̯] sono talvolta realizzati come iati (cioè sono articolati separatamente in due sillabe diverse), a causa di fattori di tipo essenzialmente stilistico (come la velocità d’eloquio o l’enfasi).
Nel lessico basico /j/ è più frequente di /w/ (1,93% rispetto a 0,38% sul totale dei fonemi, secondo Batinti 1993). Per i gruppi vocalici bifonematici l’analisi sul campione romano del Lessico dell’italiano parlato (LIP) mostra come su 28 possibilità teoriche 21 combinazioni siano effettivamente realizzate e di queste tre siano decisamente rare (/eu̯/, /ɛu̯/, /wo/). Per le semiconsonanti, la combinazione più frequente appare /we/ (questo), con 2530 ricorrenze, seguita da /wa/ (quando), con 1037 ricorrenze, da /wi/ (quindi) con 750 ricorrenze e da /jo/ (azione), con 731 ricorrenze. Per le semivocali vere e proprie, /ai̯/ è il dittongo più frequente (mai), con 1257 ricorrenze, seguito da /ɛi̯/ (lei), con 546 ricorrenze, da /oi̯/ (noi), con 505 ricorrenze e da /ui̯/ (lui), con 475 ricorrenze (Chiari 2002: 220-221).
I trittonghi sono anch’essi rari e possono essere ascendenti-discendenti, oppure ascendenti. Nel primo caso, sono composti da semiconsonante + vocale + semivocale (miei [mjɛi̯], suoi [swɔi̯]), nel secondo caso da due semiconsonanti e una vocale: le due semiconsonanti contigue tautosillabiche, in contesto sia tonico (quiete), sia atono (colloquio), sono comunque piuttosto rare. Nella combinazione più frequente [w] precede [j]: la trascrizione fonetica più congrua sarà «[ɥj] e non [wj]» a causa di «un fenomeno di coarticolazione anticipatoria», tale che «la prima semiconsonante subisce l’influsso di quella seguente, palatalizzandosi, ma mantenendo la labializzazione quale tratto distintivo» (Marotta 1987: 880). Una tale sequenza sembra essere selezionata, almeno a livello lessicale, da una consonante velare precedente.
L’altra fonte di produzione della sequenza [ɥj] + vocale è nelle forme flesse in cui a una radice terminante in [w] si aggiunge un suffisso plurale [-jamo, -jate]. Sono possibili anche le combinazioni /uj + vocale (annuiamo, tatuiamo): in luogo del legamento velare si ha la corrispondente vocale omorganica, la cui realizzazione potrebbe essere [uja] oppure [uɥa]. L’altra possibile combinazione [jw] è tendenzialmente assente nel lessico italiano, tuttavia è recuperabile nella forma, dialettalmente marcata, mariuolo [ma-rjwɔ-lo], e nel lessema aiuola [ai-wɔ-la] ma anche [a-jwɔ-la], così come in voci in genere etichettate dalla lessicografia come antiquate (ramaiuolo, fumaiuola).
In italiano contemporaneo, [j] e [w] sono sempre più spesso considerate come consonanti (addirittura come le consonanti lunghe per posizione), soprattutto per il fono palatale. L’incertezza nella scelta dell’articolo determinativo dinanzi a parola che inizia con una di esse è, a questo proposito, illuminante: alcuni rifiutano forme elise come l’iodio, mentre utilizzano lo iodio (come lo gnocco e lo zio) e non il iodio; ugualmente, per i prestiti lo yacht è preferito rispetto a l’yacht o il yacht (cfr. Marotta 1993; Mioni 2001: 176-177; ➔ elisione; ➔ apostrofo).
L’approssimante velare mantiene invece il suo valore vocalico (l’uomo e non *il uomo o lo uomo), anche se la scelta dell’articolo davanti ai prestiti mostra una certa oscillazione (l’whisky e il whisky). Le sequenze con [w] sono state del resto oggetto di semplificazione nel toscano, specie centrale (➔ toscani, dialetti) ove, a livello di parlato corrente, [w] scompare davanti a /ɔ/ e, a livello rustico, davanti a ogni vocale che precede /k/ (b[ɔ]no «buono», [k]esto «questo»). Nella lingua, invece, il passaggio di [wɔ] → [ɔ] è stato accettato nei nessi in cui si è prodotto più anticamente, ovvero dopo occlusiva e vibrante (pruova → prova) e dopo fonema palatale (figliuolo → figliolo); mentre non è stato accolto nella sua forma incondizionata, che si è sviluppata nel fiorentino colto nell’Ottocento e che poi è diventata un tratto vernacolare (➔ monottongo).
Nell’area emiliana e romagnola [w] e [u̯] (➔ emiliano-romagnoli, dialetti) sono realizzati come approssimante labiodentale [ʋ]: [ˈʋwɔːmo] o [ˈʋɔːmo] uomo. Nelle varietà centrali (non di Toscana) e meridionali, /j/ intervocalico tende a rafforzarsi in [jj]: [maˈjːale] maiale. Nella forma rafforzata tende a sostituire la laterale palatale (per es. [ˈpajːa] paglia) nelle pronunce centro-meridionali. In molti dialetti e italiani regionali (Piemonte meridionale, Liguria, Lombardia, Veneto, Venezia Giulia, Emilia, Campania, Sicilia) il diacritico ‹i› presente nella grafia viene realizzato come [j] nei nessi affricata, nasale, sibilante palatale: si vedano, rispettivamente [ˈʧjeːko] cieco, [baˈɲːjamo] bagniamo, [ˈʃjenʦa] scienza (Telmon 1993: 108). Nelle regioni meridionali l’esito può essere anche di vocalizzazione piena, con trasformazione della struttura sillabica della parola: [ˈʃienʦa] e [ʃiˈenʦa]. La vocalizzazione delle approssimanti si verifica anche sull’asse posteriore: i bisillabi /ˈkwaːdro/ e /ˈpjaːno/ possono realizzarsi come trisillabi [kuˈaːdro], [piˈaːno].
I ➔ grafemi che indicano le semivocali (➔ ortografia) sono omografi a quelli che indicano le vocali chiuse: p‹i›eno come ‹i›rto, g‹u›anto come ‹u›nto. In più, il grafema ‹i› svolge una funzione diacritica nei digrammi e trigrammi ‹sci› + vocale (sciame); ‹ci + a, o, u› (cialda, ciottolo, ciuffo) e, talvolta, ‹ci + e› (cielo); ‹gi + a, o, u› (gianduia, gioco, giusto) e, talvolta, ‹gi + e› (ciliegie); ‹gli + vocale› (aglio); ‹gni + vocale› (segniamo). Le maggiori difficoltà nelle grafie semicolte si incontrano proprio nei plurali in -cie, -gie (camicie, ciliegie ma facce, piogge), dove è particolarmente accentuato il carattere convenzionale e ‘antifonetico’ della scrittura (Maraschio 1993: 142-145) (► -cie e -gie).
Nella storia dell’italiano si sono avute oscillazioni e incertezze nell’uso dei grafemi ‹i› e ‹j›. Fallirono i tentativi cinquecenteschi di indicare con ‹j› la semivocale (fjeno): il grafema fu utilizzato nella prima Crusca (➔ accademie nella storia della lingua) soprattutto per le desinenze plurali di nomi e aggettivi in -io (occhj). In seguito fu usato come semplice variante di ‹i› dopo un’altra -i (incendij) oppure come compendio della sequenza ‹-ii› (‹-ij›) (incendj), soluzione che trovò larga diffusione nel XVIII secolo (Maraschio 1993: 145-146), insieme all’utilizzo di ‹j› per [j] nelle sequenze bi- e trivocaliche in posizione iniziale (jattura) o intervocalica (gennajo), ma non postconsonantica (*pjeno). Grafie siffatte – divenute fortemente minoritarie nel secolo successivo – si ritrovano ancora nei testi di ➔ Luigi Pirandello. Non solo in posizione finale e interna di parola ma anche all’inizio (ieri in luogo di jeri) il grafema ‹j› è ormai pressoché sparito dall’uso (Migliorini 1990: 33-34), a eccezione dei nomi propri (Jacopo), dei toponimi (Jesi), dei cognomi (Jovine). In taluni cognomi, la grafia con ‹j› costituisce un allografo rispetto a quella con ‹i›, usato allo scopo di evitare interpretazioni maliziose: ‹Troja› rispetto a ‹Troia›.
Batinti, Antonio (1993), Il sistema fonologico dell’italiano. Proposte per ricerche statistiche nel lessico basico, Perugia, Guerra.
Bertinetto, Pier Marco (1981), Strutture prosodiche dell’italiano. Accento, quantità, sillaba, giuntura, fondamenti metrici, Firenze, Accademia della Crusca.
Bertinetto, Pier Marco & Loporcaro, Michele (2005), The sound pattern of standard Italian, as compared with the varieties spoken in Florence, Milan and Rome, «Journal of the International Phonetic Association» 35, 2, pp. 131-151.
Calamai Silvia & Bertinetto Pier Marco (2006), Per uno studio articolatorio dei glides palatale, labio-velare e labio-palatale dell’italiano, in Scienze vocali e del linguaggio. Metodologie di valutazione e risorse linguistiche. Atti del III convegno nazionale dell’Associazione italiana di scienze della voce (Trento, 29 novembre - 1° dicembre 2006), a cura di V. Giordani, V. Bruseghini & P. Cosi, Torriana, EDK, pp. 43-56.
Camilli, Amerindo (19653), Pronuncia e grafia dell’italiano, a cura di P. Fiorelli, Firenze, Sansoni (1a ed. 1941).
Castellani, Arrigo (1980), Fonotipi e fonemi in italiano, in Id., Saggi di linguistica e filologia italiana e romanza (1946-1976), Roma, Salerno Editrice, 3 voll., vol. 1°, pp. 49-69 (1a ed. in «Studi di filologia italiana» 14, pp. 435-453).
Chiari, Isabella (2002), Ridondanza e linguaggio. Un principio costitutivo delle lingue, prefazione di T. De Mauro, Roma, Carocci.
Hall, Robert A. jr. (1971), La struttura dell’italiano, Roma, Armando.
Ladefoged, Peter & Maddieson, Ian (1996), The sounds of the world’s languages, Oxford, Blackwell.
Lepschy, Giulio C. (1964), Note sulla fonematica italiana, «L’Italia dialettale» 27, pp. 53-67.
Maddieson, Ian (1984), Patterns of sounds, Cambridge, Cambridge University Press.
Maddieson, Ian (2008), Glides and gemination, «Lingua» 118, 2, pp. 1926-1936.
Maddieson, Ian & Emmorey, Karen (1985), Relationship between semivowels and vowels, crosslinguistic investigations of acoustic difference and coarticulation, «Phonetica» 42, 4, pp. 163-174.
Maraschio, Nicoletta (1993), Grafia e ortografia, in Storia della lingua italiana, a cura di L. Serianni & P. Trifone, Torino, Einaudi, 3 voll., vol. 1° (I luoghi della codificazione), pp. 139-227.
Marotta, Giovanna (1987), Dittongo e iato in italiano: analisi fonetico-fonologica per una difficile discriminazione, «Annali della Scuola Normale Superiore di Pisa» s. 3a, 17, pp. 847-887.
Marotta, Giovanna (1993), Selezione dell’articolo e sillaba in italiano: un’interazione totale?, «Studi di grammatica italiana» 15, pp. 255-296.
Migliorini, Bruno (1990), Innovazioni grammaticali e lessicali dell’italiano d’oggi, in Id., La lingua italiana del Novecento, a cura di M.L. Fanfani, con un saggio introduttivo di G. Ghinassi, Firenze, Le Lettere, pp. 31-61 (1a ed. 1938).
Mioni, Alberto M. (1986), Fonetica articolatoria: descrizione e trascrizione degli atteggiamenti articolatori, in Trattato di foniatria e logopedia, a cura di L. Croatto, Padova, La Garangola, 1983-1988, 4 voll., vol. 3° (Aspetti fonetici della comunicazione), pp. 15-88.
Mioni, Alberto M. (1993), Fonetica e fonologia, in Sobrero 1993, pp. 101-139.
Mioni, Alberto M. (2001), Elementi di fonetica, Padova, Unipress.
Muljačić, Žarko (1972), Fonologia della lingua italiana, Bologna, il Mulino.
Salza, Pier Luigi (1986), On distributional properties of non-syllabic vowels in Italian words, «Rassegna italiana di linguistica applicata» 3, pp. 77-95.
Salza, Pier Luigi (1988), Duration of Italian diphthongs and vowel clusters, «Language and speech» 31, pp. 97-113.
Salza, Pier Luigi (1991), Misura elettroacustica della durata segmentale in dittongo e iato dell’Italiano. Parte I-II, «Rivista italiana di acustica» 15, pp. 3-19; 35-55.
Salza, Pier Luigi, Marotta, Giovanna & Ricca, Davide (1987), Duration and formant of Italian bivocalic sequences, in Proceedings of the Eleventh international congress of phonetic sciences (ICPhS) (August 1-7, 1987, Tallinn, Estonia), Tallinn, Academy of Sciences of the Estonian SSR, 6 voll., vol. 3°, pp. 113-116.
Schmid, Stephan (1999), Fonetica e fonologia dell’italiano, Torino, Paravia.
Sobrero, Alberto A. (a cura di) (1993), Introduzione all’italiano contemporaneo, Roma - Bari, Laterza, 2 voll., vol. 2° (La variazione e gli usi).
Telmon, Tullio (1993), Varietà regionali, in Sobrero 1993, pp. 93-149.