vers. 1.1 – Text mining dell’Enciclica Laudato si’ del Santo Padre Francesco sulla Cura della Casa Comune

Negli scorsi cinque giorni ho ricevuto parecchi commenti positivi alla versione 1.0 dell’analisi, e quindi ero lì che pensavo…quale potrebbe essere la prossima versione?

La via più diretta sarebbe stata procedere nella lista dei termini più usati, tipo proporre la classifica “dal numero 11 al numero 20″… ma scendendo nella lista le cose si fanno più fumose, dato che le ambiguità semantiche si fanno più presenti. Ci vorrebbe un algoritmo più robusto.

Andando a pensare a parti del testo che sono meno ambigue, ho pensato di considerare la componente temporale dell’Enciclica, in particolare, gli anni. Questi sono indicati sia nel testo vero e proprio, che nei riferimenti bibliografici alla fine del testo.

Come nell’analisi precedente, dobbiamo considerare alcune cautele. Nel caso dell’analisi temporale, bisogna considerare che l’algoritmo se la cava bene a identificare singoli anni (così come altri termini legati al tempo…giorni della settimana ecc.). Tuttavia l’algoritmo non “capirà” i riferimenti temporali, tipo “cinque anni dopo la pubblicazione del documento X”, e così via.

Il grafico mostra il numero di occorrenze di un dato anno nel testo.

enciclica_anni

E’ chiara una tendenza crescente, il che ci dice che i riferimenti a documenti, protocolli ed eventi aumentano nel tempo. In parallelo, si nota che vi sono fasi, tipicamente verso la metà dei decenni, in cui il numero di occorrenze scende.

Sarà perché in quei periodo c’era effettivamente una minore attenzione per l’ambiente (seppure nel contesto di una tendenza crescente, anche nei minimi), oppure perché il Vaticano considera quei periodi come meno rilevanti nella cura della Casa Comune?

Vediamo dove ci porterà la prossima versione dell’algoritmo…

Come per l’articolo precedente: scrivete a info@pibinko.org per commenti , o se siete interessati a collaborare su questo tipo di analisi