Vocabolario di base e frequenza nell’uso delle parole.

Nel 2016 Tullio De Mauro aggiornò la sua precedente ricerca sul ‘vocabolario di base della lingua italiana’ (NVdB), individuando le 7.500 parole che costituiscono il nostro ‘lessico quotidiano’, vale a dire il serbatoio linguistico cui la maggioranza degli italiani sembra attingere più frequentemente [i].
«È un elenco di circa 7500 parole selezionate per uso, frequenza e disponibilità e suddivise in tre categorie: 1 – lessico fondamentale (FO, circa 2000 parole ad altissima frequenza usate nell’86% dei discorsi e dei testi; nell’elenco sono formattate in grassetto); 2 – lessico di alto uso (AU, circa 3000 parole di uso frequente che coprono il 6% delle occorrenze; sono formattate come testo normale); 3 – lessico di alta disponibilità (AD, circa 2000 parole usate solo in alcuni contesti ma comprensibili da tutti i parlanti e percepite come aventi una disponibilità pari o perfino superiore alle parole di maggior uso; sono formattate in corsivo)» [ii].
Lo stesso De Mauro precisava che:
«Ciò che abbiamo finora chiamato uso è il prodotto della frequenza assoluta delle occorrenze di una parola in un campione di testi di una lingua, divisi in diverse categorie (testi scolastici, testi letterari, copioni cinematografici o teatrali eccetera), moltiplicata per la sua dispersione, cioè per il numero di categorie di testi in cui la parola occorre. La dispersione, cioè la presenza in più categorie diverse di testi, aiuta a correggere distorsioni che potrebbero aversi guardando solo alla frequenza.…» [iii] .
Da questa risorsa, fondamentale per la conoscenza del nostro patrimonio lessicale d’uso comune, si ricavano non solo interessanti indici statistici di frequenza nell’utilizzo delle parole dell’italiano corrente, ma anche alcune considerazioni sulle tendenze socio-linguistiche in atto. Un ecopacifista come me, ad esempio, andando a curiosare fra i 2.000 lemmi contrassegnati in neretto, in quanto considerati ‘fondamentali’, ha potuto utilizzare questo repertorio per ricercare quanta parte del nostro lessico quotidiano abbia a che fare con determinati contesti logici, quali “guerra e militarismo”, “pace” ed “ecologia”.
La presente ricerca ha richiesto la tabulazione dei 2.000 lemmi fondamentali in un’apposita tabella Excel, in modo da evidenziare – lettera per lettera – quali parole ricadessero in ciascuno di questi tre ambiti, calcolandone poi la rispettiva percentuale sul totale. Dall’insieme dei vocaboli in neretto sono stati esclusi quelli di scarso valore semantico (pronomi personali, aggettivi dimostrativi e possessivi, preposizioni, avverbi, congiunzioni) e pertanto il numero complessivo di quelli presi in esame è sceso a 1.768.
Sebbene le osservazioni seguenti siano frutto di una mia personale elaborazione del database pubblicato su Internazionale, ritengo comunque che possano dare un’idea abbastanza precisa di come il patrimonio linguistico maggiormente condiviso dagli italiani [iv] lasci trasparire determinate tendenze a rappresentare la realtà, alimentando particolari narrazioni. Nell’ambito degli studi di ecolinguistica [v], ad esempio, è molto diffuso l’impiego dei “corpus assisted discourse studies”, ossia dell’analisi linguistica fondata sull’utilizzo e l’elaborazione di repertori lessicali.
«Lo sforzo principale degli studi del discorso assistito da corpus è l’indagine e il confronto delle caratteristiche di particolari tipi di discorso, integrando nell’analisi le tecniche e gli strumenti sviluppati all’interno della linguistica dei corpora. Questi includono la compilazione di corpora specializzati e analisi di elenchi di frequenza di parole e cluster di parole, elenchi di parole chiave comparative e, soprattutto, concordanze […] Gli studi sul discorso assistito da corpus mirano a scoprire significati non ovvi, cioè significati che potrebbero non essere prontamente disponibili per la lettura a occhio nudo. Gran parte di ciò che ha significato nei testi non è aperto all’osservazione diretta […] Usiamo il linguaggio “semi-automaticamente”, nel senso che parlanti e scrittori compiono scelte semi-consce all’interno dei vari complessi sistemi sovrapposti di cui è composto il linguaggio» [vi].
In questo caso, un confronto statistico tra blocchi di parole fondamentali riguardanti determinati contesti può quindi risultare illuminante sul pensiero sottostante alle parole della lingua italiana più frequentemente utilizzate, stimolando considerazioni per nulla banali.
Dati emersi dalla mia ricerca sul NVdB dell’italiano

Ovviamente non tutte le osservazioni che si possono ricavare analizzando il mio database sono significative allo stesso modo. Alcune sono solo curiosità originate dall’evidenziazione di alcuni aspetti, come ad esempio la frequenza di determinate parole all’interno di uno specifico repertorio alfabetico. Ad esempio, non sembra che abbia un particolare significato il fatto che la maggior parte delle parole italiane da me selezionate nel citato ‘lessico fondamentale’ e riguardanti la guerra ed il militarismo inizino con le lettere S (40), R (32) e C (25). Altrettanto vale per l’osservazione che gran parte dei vocaboli ‘pacifici’ comincino per A o P (17), oppure per I ed R (10), o anche che il lessico ambientale si alimenti prevalentemente di parole inizianti con le lettere P (21), S (19) e C (12). Si tratta dunque di semplici constatazioni, anche se l’analisi etimologica delle parole ci porta talvolta ad osservare che fenomeni di natura fonetica, come l’onomatopea, possono aver condizionato il significato di alcuni vocaboli, soprattutto per quanto riguarda la loro radice primaria.
Le osservazioni oggettive che si possono trarre dalla mia ricerca mi sembrano indubbiamente più significative. Infatti, sebbene l’attribuzione di una parola ad un determinato campo semantico (guerra e militarismo – ecologia ed ambiente – pace e nonviolenza) sia frutto di una mia selezione, ciò che si ricava dall’analisi dei dati va al di là di impressioni personali, in quanto ne emerge un quadro abbastanza preciso delle caratteristiche del nostro lessico fondamentale.
Ma esaminiamo prima i risultati da un punto di vista meramente statistico, tenendo conto che l’entità totale di riferimento sono i 1.768 lemmi che ho ricavato dal 2.000 del NVdB (De Mauro 2016), eliminando quelli che – come precisato prima – mi sembravano semanticamente non particolarmente irrilevanti .
- Nel primo settore della mia classificazione – concernente le parole del vocabolario fondamentale italiano che ricadono nel campo semantico bellico-militare – si ritrovano 259 lemmi, pari al 14,6% del totale.
- Nel secondo ambito di ricerca – comprendente le parole che fanno riferimento all’ambiente ed all’ecologia – ricadono 124 lemmi, pari al 7,01%.
- Il terzo campo semantico preso in esame – vocaboli riferibili in modo diretto o indiretto alla pace, alla giustizia e ai diritti – registra infine la presenza di 152 lemmi, corrispondenti all’8,6%.
Già questi soli dati numerici rispecchiano una precisa realtà socioculturale, in cui il lessico di base più comune degli italiani è composto per un settimo da vocaboli appartenenti al linguaggio militare e guerresco, mentre per i ‘linguaggi di pace’ la maggior parte dei parlanti l’italiano dispongono e utilizzano meno di una parola su undici. Inoltre, per quanto riguarda ciò che si riferisce alla natura, agli elementi ambientali ed all’ecologia, il dato sembra ancor più allarmante. Infatti in questo contesto ricade solo il 7% del lessico italiano considerato ‘fondamentale’, vale a dire meno di una parola ogni quattordici. Sono solo dati statistici, ma è difficile non considerarne il valore ed il significato all’interno di un’analisi del discorso che punti a svelare i condizionamenti esercitati su un vocabolario che, oltre ad essere spesso piuttosto povero e limitato, attribuisce al linguaggio di guerra uno spazio addirittura doppio rispetto a quello riservato a quello riguardante il nostro imprescindibile rapporto con l’ambiente.
Alcune considerazioni in chiave ecopacifista

A questo punto mi sembra opportuno ricordare quanto scriveva l’ecolinguista Arran Stibbe sull’analisi critica del discorso e su ciò che si propone di rivelare.
«a) L’attenzione si concentra su discorsi che hanno (anche potenzialmente) un impatto significativo non solo sul modo in cui le persone trattano le altre, ma anche su come trattano i sistemi ecologici più ampi da cui dipende la vita. B) I discorsi vengono analizzati mostrando come gruppi di caratteristiche linguistiche si uniscono per formare particolari visioni del mondo e ‘codici culturali’… c) I criteri in base ai quali le visioni del mondo sono giudicate derivano da una filosofia ecologica (o ecosofia) esplicita o implicita. Un’ecosofia è informata sia da una comprensione scientifica di come gli organismi (compresi gli esseri umani) dipendono dalle interazioni con altri organismi e da un ambiente fisico per sopravvivere e prosperare, sia da un quadro etico per decidere perché la sopravvivenza e la prosperità sono importanti…»[vii].
Ebbene, dall’elaborazione dei dati della mia indagine emerge un preoccupante quadro verbale – e perciò stesso cognitivo – di quanto il vocabolario usato dall’86% degli italiani aiuti poco lo sviluppo della consapevolezza ecologica e l’impegno per la pace. A quest’ultimo ambito semantico, come già detto, ritroviamo solamente 1/12 del vocabolario di base della lingua italiana. Ciò non significa che tale rapporto sul piano del lessico rispecchi esattamente il nostro livello di coscienza pacifista, che invece la guerra in Ucraina sta paradossalmente facendo maturare. Il vero problema, però, è se si dispone di adeguati strumenti per esprimerlo ossia, per citare un noto libro [viii], se si hanno a sufficienza “le parole per dirlo”.
Viceversa, come ho avuto modo di sottolineare in altri contributi [ix], sembra che si faccia strada sempre più un linguaggio improntato ai sedicenti ‘valori militari’, sia a causa della crescente invadenza delle forze armate nelle istituzioni scolastiche italiane, sia per l’influenza della comunicazione mediatica che diffonde, in modo talvolta subdolo, modalità espressive ispirate a quel mondo.
Nell’impossibilità di pubblicare in questa sede l’intero database generato dalla mia ricerca, vorrei comunque offrire almeno un’idea di ciò che ne è emerso. Ad esempio, tra le parole registrate dal NVdB come quelle usate più frequentemente dagli italiani ritroviamo molti verbi che evocano direttamente la violenza della guerra e la retorica dell’eroismo militare (affrontare, ammazzare, attaccare, avanzare, battere, caricare, circondare, colpire, combattere, conquistare, difendere, distruggere, eliminare, imporre, intervenire, minacciare, morire, obbligare, occupare, opporre, provocare, resistere, ritirare, scoppiare, sottoporre, sparare, spaventare, uccidere etc.). Si tratta di una constatazione che preoccupa, dal momento che, in maggioranza non fanno certo parte del lessico quotidiano nè sembrano facilmente attribuibili ad altri contesti, sia pur in forma traslata.
Un secondo esempio di tale perniciosa tendenza si ricava dall’analisi dei sostantivi italiani più frequentemente usati, tra i quali ritroviamo abbastanza sorprendentemente termini riferibili prevalentemente alle forze armate, quali: arma, attacco, battaglia, capitano, carabiniere, carica, controllo, coraggio, difesa, dovere, eroe, esercito, forza, fronte, fuoco, generale, guerra, impresa, intervento, lotta, militare, missione, nazione, nemico, norma, nucleare, obiettivo, onore, pericolo, piano, pistola, principio, reazione, rischio, rispetto, servizio, sfida, soldato, squadra, strategia, superiore, tensione, trasmissione, ufficiale, valore, zona etc.
Se teniamo conto del fatto che la nuova edizione del lessico di base curata da De Mauro risale al 2016 e che in questi sette anni l’influenza dei militari sul piano socioculturale è molto aumentata, non possiamo non allarmarci per la frequenza di questa particolare terminologia nel linguaggio corrente di 8,6 italiani su 10.
La controprova è data dalla ricorrenza molto più ridotta in esso di termini che esprimano valori di pace, giustizia, tutela dei diritti umani e rifiuto della violenza nelle sue varie forme. Questa tipologia di parole, infatti, ricorre nel vocabolario di base fondamentale in misura estremamente limitata, poiché solo un lemma su dodici sembra ricadere in questo pur ampio campo semantico.
Vi ritroviamo, comunque, parecchi verbi che esprimono atteggiamenti nonviolenti, equi e solidali, come: accettare, accogliere, accompagnare, adottare, affidare, aiutare, appoggiare, apprezzare, comprendere, comunicare, consentire, consigliare, convincere, dedicare, distribuire, fidarsi, garantire, informare, inserire, intendere, interessare, manifestare, migliorare, offrire, ospitare, partecipare, perdonare, permettere, prestare, proporre, realizzare, riconoscere, ringraziare, rispettare, salvare, scegliere, soddisfare, sperare, sviluppare, trasmettere, utilizzare, valutare, visitare etc.
Una lingua di pace, come ho cercato di argomentare nel mio manuale ecopacifista [x], dovrebbe trasmettere concetti ispirati alla nonviolenza ed alla riconciliazione, alla valorizzazione delle diversità ed alla sostenibilità ambientale ed anche alla giustizia sociale ed alla solidarietà. Un lessico ecopacifista, infatti, è quello che sappia comunicare – ed aiutare ad instaurare – una positiva relazione tra gli uomini e tra questi ed il contesto naturale di cui fanno parte. Uno sguardo al settore del vocabolario di base dell’italiano che va in questa direzione ci mostra però un repertorio lessicale ancora troppo limitato, se è vero che soltanto una parola su quattordici comunica interesse per i valori ecologici.
Si tratta prevalentemente di sostantivi che si limitano a cogliere elementi geo-biologici dell’ambiente naturale e antropizzato, ad es.: acqua, albero, animale, atmosfera, bosco, campo, canale, cielo, costa, fiume, fonte, freddo, frutto, giardino, isola, lago, lupo, mare, montagna, natura, neve, paese, parco, pesce, pietra, pioggia, punta, radice, rosa, sera, sereno, sole, spazio, stagione, stella, terra, uccello, uomo, uovo, vento etc.
Si sono individuati anche altri vocaboli con una maggiore pregnanza dal punto di vista ecologico, in quanto lasciano trasparire un atteggiamento positivo verso il ciclo vitale e la ricerca di un’integrazione delle persone col proprio contesto ambientale. Si tratta però solo di pochi verbi (crescere, generare, produrre, raccogliere, rispettare, trasformare, vivere) e di alcuni nomi e aggettivi riferibilipiù esplicitamente a temi ecologici (ambientale, catena, fenomeno, materia, naturale, organismo, pianeta, riproduzione, salute, temperatura, territorio, universo, verde, vita).
Qualche conclusione da trarre…

Sempre più – e da più parti – comincia a manifestarsi l’esigenza di ripristinare ed accrescere un patrimonio lessicale che nel tempo è andato invece ad impoverirsi, riducendo la capacità delle persone di ‘leggere il mondo’, di comprenderlo e di agire in modo positivo e attivo per salvare ciò che possiede un autentico valore e per cambiare ciò che viceversa è frutto d’ingiustizia e di violenza. Un luninoso esponente di questa visione pragmatica del processo comunicativo e del ruolo dell’educazione in tal senso è stato don Milani, che ai suoi ragazzi della scuola di Barbiana aveva fatto capire che “la parola è la chiave fatata che apre ogni porta” perché “ci fa uguali”.
Ma se è vero che possedere solo 200 parole – come affermava il Priore – significa essere dominati da chi ne conosce 2.000, occorre forse ampliare la riflessione milaniana, andando oltre l’aspetto quantitativo (senza dubbio determinante) per affrontare anche quello qualitativo. Nel caso in esame, le 2.000 parole che il NVdB dell’Italiano ha riconosciuto come ‘fondamentali’ all’interno di quelle più frequentemente utilizzate dagli italiani, infatti, non soltanto costituiscono in ogni caso un misero patrimonio lessicale (anche se supportate dalle altre 3.000 parole del ‘lessico di alto uso), ma vanno analizzate più in profondità, per scoprire quale modello sociale e culturale rispecchiano e, inevitabilmente, contribuiscono a diffondere e perpetuare.
Paulo Freire, nel suo libro “L’educazione come pratica della libertà” [xi] proponeva a chi perseguiva l’educazione delle masse popolari un approccio molto particolare incentrato sulla lingua, non solo come indispensabile alfabetizzazione e prima tappa nella liberazione degli ‘oppressi’, ma soprattutto come formazione umana delle persone e veicolo di coscientizzazione sociale. La prima delle cinque fasi del processo di educazione linguistica proposto da Freire era, non a caso, l’individuazione delle parole più usate nel linguaggio comune dei gruppi con cui si voleva operare. La seconda era caratterizzata dall’individuazione delle ‘parole generatrici’ più adeguate a sviluppare in quelle comunità un’autentica consapevolezza di sé, dei propri limiti e dei propri bisogni.
«Le parole generative, le parole fondamentali, di cui Freire va alla ricerca, lette nella mia chiave, altro non sono che il sistema simbolico che organizza i discorsi di quella cultura Quando Freire si propone di alfabetizzare gli abitanti delle favelas […] egli vuole ricostruire il vocabolario di quelle persone, il loro sistema culturale, per costruire un percorso di alfabetizzazione alla loro cultura, […] È necessario avere la coscienza della propria cultura di riferimento per poter pienamente autoprogettarsi, scegliere, decidere, per poter pienamente servirsi della propria cultura, rifletterla, criticarla, modificarla, farla evolvere e con essa far evolvere se stessi…»[xii].
Dall’indagine di cui ho dato conto emerge piuttosto un allarmante livellamento socioculturale verso il basso, che però non sembra affatto casuale né poco significativo. Dalla base lessicale comune e più condivisa dagli italiani, in effetti, sembra emergere un universo di riferimento in cui le parole generatrici di una visione militarista e violenta sono il doppio di quelle che invece ci descrivono nella nostra relazione con l’ambiente. Si tratta di un dato significativo da non sottovalutare ma anzi da tener ben presente quando ci si propone di educare alla pace in senso lato, soprattutto se si persegue un progetto ecopacifista che dia spazio alla coscientizzazione ed alla formazione e non solo all’azione [xiii].
Note
[i] Tullio de Mauro, Nuovo vocabolario di base della lingua italiana, 2016. (Cfr. anche il Dizionario Online di Internazionale, https://dizionario.internazionale.it/
[ii] Licia, “Le 7500 parole del lessico di base dell’italiano” (29.12.2016), Terminologia etc., https://www.terminologiaetc.it/2016/12/29/vocabolario-base-italiano-demauro/
[iii] Tullio De Mauro, “Il Nuovo vocabolario di base della lingua italiana” (23.12.2016), Internazionale, https://www.internazionale.it/opinione/tullio-de-mauro/2016/12/23/il-nuovo-vocabolario-di-base-della-lingua-italiana
[iv] «Il NVdB si fonda sullo spoglio elettronico (controllato manualmente) di testi lunghi complessivamente 18.843.459 occorrenze raggruppati in sei categorie di estensione approssimativamente equivalente: stampa (quotidiani e settimanali), saggistica (saggi divulgativi, testi e manuali scolastici e universitari), testi letterari (narrativa, poesia), spettacolo (copioni cinematografici, teatro), comunicazione mediata dal computer (chat eccetera), registrazioni di parlato» (T. De Mauro, https://www.internazionale.it/opinione/tullio-de-mauro/2016/12/23/il-nuovo-vocabolario-di-base-della-lingua-italiana )
[v] Cfr. Ermete Ferraro (2022), Grammatica ecopacifista. Ecolinguistica e linguaggi di pace (Quad. Satyagraha n. 42), Pisa, Centro Gandhi Edizioni
[vi] “Corpus-assisted discourse studies”, Wikipedia, https://en.wikipedia.org/wiki/Corpus-assisted_discourse_studies (trad. mia)
[vii] Arran Stibbe (2014), “An Ecolinguistic Approach to Critical Discourse Studies”, in Critical Discourse Studies, 11.1, London, Routledge https://www.tandfonline.com/doi/full/10.1080/17405904.2013.845789
[viii] Cfr. Marie Cardinal (2001), Le parole per dirlo, Milano. Bompiani
[ix] Oltre al libro già citato (in particolare la IV parte, su “riferimenti e indicazioni per una grammatica ecopacifista”), cfr. anche alcuni miei articoli: Disarmiamo la nostra scuola (2019); Fenomenologia dello strumento militare (2020); Il militarismo eterno (2020); Una lapide al ‘militarismo noto’ (2021) e A rotta di…protocollo (2022), tutti pubblicati sul mio blog ( https://ermetespeacebook.blog/)
[x] Cfr. Ferraro 2022, in particolare alle pp. 112-118
[xi] Il testo originale “Paulo Freire (1967), Educaçao como pratica da liberdade, Paz e Terra, Rio de Janeiro, è stato così tradotto in italiano nelle edizioni Mondadori (Milano, 1977)
[xii] Ada Manfreda (2017), La parola che emancipa, l’apprendimento che trasforma. Le parole generative di Paulo Freire, http://siba ese.unisalento.it/index.php/sppe/article/download/18429/15729 , p. 54
[xiii] Cfr. anche: M.I.R. Italia (a cura del) 2021, La colomba e il ramoscello – Un progetto ecopacifista, Torino, Ed. Gruppo Abele.
Pingback: Verbi violenti troppo frequenti… | Ermete's Peacebook