lemma, tipi di
Da non confondere né con parola né con lessema, il lemma (dal lat. lemma, «argomento, tema», a sua volta dal gr. lē ̂mma, «premessa») è una «unità grafica che costituisce l’intestazione di un articolo o voce di dizionario o di enciclopedia» (cfr. fr. mot vedette, ted. Stichwort, ingl. headword; Beccaria 1994: ad vocem), tipograficamente riconoscibile perché stampata, all’inizio della voce stessa, in caratteri più evidenti (neretto o maiuscolo).
È detta anche esponente, entrata (Della Valle 2005: 83) oppure forma di citazione (Lyons 1968) in quanto viene convenzionalmente utilizzata per indicare o ‘citare’ in ordine alfabetico un’unità lessicale per mezzo di una forma canonica «che i parlanti [...] riconoscono come rappresentativa di un paradigma» (Landau 20012: 98). Ad es., l’infinito andare è il lemma corrispondente alle forme vado, andrai, andarono e altre morfologicamente e semanticamente affini.
Da qui il termine lemmatizzazione, che indica l’operazione di riduzione – generalmente da parte dei lessicografi (➔ lessicografia) o da parte di un programma informatico apposito (detto lemmatizzatore automatico) – delle diverse forme di un paradigma (➔ paradigmi) a un’unica forma di citazione o a un unico esponente.
Il criterio della lemmatizzazione può variare da lingua a lingua e da dizionario a dizionario: le lingue altamente flessive come latino, greco, arabo, ceco, russo, ad es., hanno paradigmi molto estesi da sottoporre a riduzione. Una differenza importante sta nel fatto che non è affatto comune la regola di lemmatizzare i verbi all’infinito: in latino, greco antico, e greco moderno, essi vengono infatti presentati alla prima persona singolare del presente indicativo, in arabo antico con la radice trilittera, in arabo moderno con la terza persona singolare maschile del passato, ecc.
Proprio i criteri soggiacenti alla lemmatizzazione determinano il numero di lemmi compresi in un’opera lessicografica, che non è direttamente proporzionale alla qualità dell’opera stessa (né alla sua capacità di rappresentare il lessico di una lingua): il multivolume Grande dizionario della lingua italiana (1961-2002) diretto da S. Battaglia e G. Barberi Squarotti annovera circa 160.000 lemmi, tanti quanti un popolare dizionario monovolume come il Dizionario della lingua italiana di Sabatini-Coletti (2008), mentre il GRADIT (Grande dizionario italiano dell’uso, di T. De Mauro ne ha circa 260.000.
L’alto numero di lemmi inclusi nel Grande dizionario italiano dell’uso è dovuto, ad es., alle molte categorie lemmatizzate: articoli, nomi, aggettivi, congiunzioni, interiezioni, fonosimboli, sigle, abbreviazioni, simboli, confissi, prefissi, suffissi, participi passati, participi presenti che siano anche aggettivi e nomi, avverbi in -mente, alterati (con -ino, -accio, ecc.) il cui significato non sia ricavabile dalla base della forma suffissata, forme irregolari di passato remoto, nomi propri di persona e luoghi componenti di polirematiche (➔ polirematiche, parole) femminili di nomi animati che abbiano un’uscita diversa dal maschile, alcuni lessemi complessi, cioè espressioni polirematiche costruite con lessemi semplici che non siano a lemma singolarmente (esotismi, locuzioni latine e altre locuzioni come ad hoc, lemme lemme, pied-à-terre, pop artist, pro capite, zig zag, ecc.).
Altre categorie vengono invece generalmente trattate come sottolemmi o lemmi secondari, cioè come elementi che, nonostante abbiano una propria autonomia semantica, non costituiscono vere e proprie unità lessicali, e quindi non possono essere registrati autonomamente come entrate in un dizionario, ma vengono relegati in posizione secondaria, in fondo alla trattazione del lemma da cui derivano, e segnalati di solito con una propria evidenza tipografica. È il caso di gran parte delle forme alterate dei nomi e degli aggettivi (diminutivi, vezzeggiativi, spregiativi – come fanciullino, ometto, cagnaccio – qualora questi risultino privi di un particolare significato che ne registri la trattazione in un lemma autonomo; ➔ alterazione), del participio presente e del participio passato (quando essi vengano usati con funzione di aggettivo o di nome, senza tuttavia avere un’autonomia semantica e d’uso che ne richieda una registrazione autonoma), o generalmente delle polirematiche (andare a ramengo, essere a cavallo, mettere sotto, ecc.).
Diverso il discorso per gli ➔ hapax, la cui riduzione a lemma può dipendere da più fattori, come ricorda Migliorini nel suo celebre saggio Che cos’è un vocabolario? (19613: 14-15), a cominciare dalla loro unicità, «[che] può essere reale (una parola foggiata da un autore e non più mai adoperata), o dipendere dalla perdita di altri esempi, e questa perdita può a sua volta essere irreparabile, o riparabile per mezzo di nuovi e più larghi spogli», per arrivare all’autorità di un autore rispetto ad altri, che determina la registrazione dei suoi hapax a prescindere dal loro carattere estemporaneo.
In generale, e secondo uno schema che tende a raggruppare le categorie per analogia di forma, i lemmi possono essere suddivisi in categorie (adattato da Atkins & Rundell 2008: 164):
(a) parole semplici: parole lessicali (nomi: bambino, cane, finestra, ecc.; aggettivi: emotivo, fragile; pericoloso, ecc.; verbi: fingere, giocare, rappresentare, ecc.; avverbi: molto, oggi, mai, ecc.; interiezioni: ahi, boh, toh, ecc.; e parole grammaticali (congiunzioni: e, ma, se, ecc.); preposizioni: con, sul, sotto, ecc.; pronomi: gli, lui, essi, ecc.; determinanti quali articoli, dimostrativi, numerali, possessivi, ecc.);
(b) abbreviazioni: ➔ sigle e acronimi (IVA, FIAT, NATO);
(c) affissi produttivi (euro-, multi-, -opoli, -teca);
(d) parole composte (aspirapolvere, reggicalze, portalettere, portauova);
(e) espressioni multiparola o polirematiche: ➔ collocazioni (cogliere l’opportunità, rischiare la vita) e verbi sintagmatici (venire via, scendere giù; ➔ sintagmatici, verbi), ➔ binomi irreversibili (bianco e nero, calma e gesso, acqua e sapone); similitudini (bianco come il latte, nero come la pece), espressioni idiomatiche (togliere le castagne dal fuoco, lavare i panni sporchi in casa; ➔ modi di dire; espressioni idiomatiche).
Come accennato, le espressioni multiparola – di frequenza estremamente variabile e difficilmente quantificabili nel lessico di una lingua – non sono di solito lemmatizzate nei dizionari italiani. Nondimeno, nel dibattito lessicografico la loro rilevanza è stata ampiamente riconosciuta (Moon 1998; Cowie 1999), soprattutto in opere destinate ad apprendenti di italiano come lingua seconda, che spesso non possono ricavare il significato di una polirematica dalla somma dei significati dei suoi costituenti lemmatizzati.
Alle espressioni multiparola andrebbe aggiunta probabilmente anche una varietà di elementi linguistici che i parlanti trattano come ‘unità’ ma che i dizionari (con l’interessante eccezione di Castoldi & Salvi 2003) non registrano: ➔ titoli di film o di opere in generale (anni di piombo, armata Brancaleone, ultima spiaggia, via col vento), espressioni del linguaggio politico (convergenze parallele, Roma ladrona) o giornalistico entrate nella vulgata (smemorato di Collegno, casalinga di Voghera, zona Cesarini, compagni di merende, furbetti del quartierino), frasi fatte più o meno scherzose prese da opere di diversa natura (amami Alfredo, va’ pensiero, bollenti spiriti, la sventurata rispose, non ti curar di lor ma guarda e passa), che nel loro insieme fanno parte della competenza lessicale e vengono trattate come lemmi.
Beccaria, Gian Luigi (dir.) (1994), Dizionario di linguistica e di filologia, metrica, retorica, Torino, Einaudi.
GRADIT = De Mauro, Tullio (dir.), Grande dizionario italiano dell’uso, Torino, UTET, 1999-2007, 8 voll.
Atkins, Sue B.T. & Rundell, Michael (2008), The Oxford guide to practical lexicography, Oxford, Oxford University Press.
Castoldi, Massimo & Salvi, Ugo (2003), Parole per ricordare. Dizionario della memoria collettiva. Usi evocativi, allusivi, metonimici e antonomastici della lingua italiana, Bologna, Zanichelli.
Cowie, Anthony P. (1999), Phraseology and corpora: some implications for dictionary-making, «International journal of lexicography» 12, 4, pp. 307-323.
Della Valle, Valeria (2005), Dizionari italiani. Storia, tipi, struttura, Roma, Carocci.
Landau, Sidney I. (20012), Dictionaries. The art and craft of lexicog-raphy, Cambridge, Cambridge University Press (1a ed. 1984).
Lyons, John (1968), Introduction to theoretical linguistics, Cambridge, Cambridge University Press (trad. it. Introduzione alla linguistica teorica, Roma - Bari, Laterza 1971).
Migliorini, Bruno (19613), Che cos’è un vocabolario?, Firenze, Le Monnier (1a ed. Roma, Edizioni della Bussola, 1946).
Moon, Rosamund (1998), Fixed expressions and idioms in English. A corpus-based approach, Oxford, Oxford University Press.