La base dati


Premessa

La bonifica pontina, il prosciugamento delle terre paludose, l’appoderamento e la colonizzazione, la lotta alla malaria e la nascita delle “città nuove” sono stati oggetto di numerosi studi e ricerche, di divulgazione propagandistica e di analisi critiche, di opere artistiche e letterarie che nell’epopea raccontata da Antonio Pennacchi in Canale Mussolini hanno trovato la loro più avvincente e affascinante narrazione.

Poco s’è detto, e solo in modo tangenziale è stata toccata, invece, la questione dei bonificatori, dei lavoratori, degli operai che prestarono la loro opera nei lavori di bonifica.

Una lacuna, questa, che va riferita soprattutto alla scarsa disponibilità di attendibili fonti documentali di carattere seriale, suscettibili di verifiche e confronti di tipo quantitativo e qualitativo.

Con la pubblicazione online degli OPERAI DELLA BONIFICA PONTINA, l’Archivio di Stato di Latina colma, almeno in parte, questa lacuna. La colma esponendo dati da cui è possibile ricavare puntuali informazioni ed elaborazioni statistiche, ed offrendo un racconto corale fatto di tante microstorie di persone che, ispirandosi alla nota realizzazione di Ellis Island (l’immigrazione negli Stati Uniti dal 1892 al 1924 racchiusa in una banca dati di 22 milioni di record), evidenzia il gran numero di luoghi da cui provenivano gli operai della bonifica pontina: dai paesi più vicini, naturalmente, ma anche dall’Emilia, dal Veneto, dal Friuli, dalle regioni che in quegli anni erano maggiormente colpite dalla disoccupazione. Una varietà di genti e una contaminazione sociale e culturale, questa, che ancora oggi costituisce uno dei caratteri identitari della terra pontina.


Le fonti e la base dati

La base dati è costituita da una parte delle informazioni contenute nelle 80.381 schede paga associate ai 58.852 operai che il Consorzio di bonifica di Piscinara, di Littoria dal 1934, impiegò nei lavori di bonifica delle Pontine dal 1926 al 1949, ma in grandissima parte negli anni 1930-1939.

Le informazioni che costituiscono la base dati sono soltanto quelle contenute nella prima parte delle schede: qui sono registrati i dati anagrafici dell’operaio (cognome, nome, paternità, maternità, luogo e data di nascita), la sua provenienza e la data di assunzione. Come si potrà vedere dagli oggetti digitali associati ai dati informativi, le schede paga contengono inoltre, in una seconda parte, la registrazione delle quindicine, il lavoro svolto nell’arco di quindici giorni dall’operaio (date della quindicina, ore di lavoro, giornate di lavoro, paga oraria, importo, trattenute assicurative, causa della sospensione del lavoro, lavoro al quale l’operaio è stato adibito) mentre in una terza parte, nel verso della scheda, sono annotati, in modo sporadico in verità, gli eventi occorsi nel periodo lavorativo (infortuni, ricoveri, licenziamenti, abbandoni, sottoscrizione della ricevuta della tessera contenente l’importo delle marche assicurative).


La normalizzazione

La realizzazione della base dati ha incontrato notevoli difficoltà, tutte riconducibili al contesto di produzione dell’insieme documentale. Le schede paga risultano infatti dalle registrazioni di prime annotazioni ricavate per lo più dalle dichiarazioni degli operai, spesso distorte dalla restituzione dialettale (tipica la registrazione, come comune di nascita, di Castruciero in luogo Castrocielo), dalla approssimativa conoscenza dell’unità amministrativa che costituiva il comune di nascita (numerose le località registrate quali comuni), dalle differenti trascrizioni dello stesso termine. Né, tralasciando alcune rare correzioni, quelle registrazioni trovavano una qualche normalizzazione a seguito di verifiche e sistematici controlli negli uffici del Consorzio.

Pertanto, in un numero considerevole di casi, le schede paga restituiscono, per quello che è il medesimo dato, diverse varianti, dalle più semplici a quelle meno scontate.

Per rendere significativa la base dati è stato quindi necessario, in primo luogo, procedere alla normalizzazione dei luoghi di nascita, riconducendo le registrazioni dell’epoca alle attuali unità amministrative.

Ne è risultato che per 76.277 delle 80.381 schede è stato possibile indicare il luogo di nascita, articolandolo nella gerarchia di regione, provincia, comune e, quando compare, località. Delle altre schede che recano l’indicazione del luogo di nascita, 773 registrano la nascita all’estero e 121 in uno dei luoghi dell’Istria ceduti dall’Italia alla ex Jugoslavia a seguito del Trattato di Parigi del 1947, o della zona B del Territorio Libero di Trieste.

In 3.210 schede non è indicato il luogo di nascita: 2.047 sono prive del dato informativo, 28 sono risultate illeggibili, per 788 di esse la scarsa accuratezza della registrazione non ha consentito di individuare il comune di nascita mentre per 347 non è stato possibile determinarlo a causa della genericità dell’informazione (ad esempio: Casale, San Pietro, San Maurizio).

Ulteriore avvertenza: il ricondurre la registrazione originaria del luogo di nascita all’attuale unità amministrativa ha comportato, per 1.948 schede, il riferimento a due diversi comuni contigui: sono i casi in cui l’unità amministrativa coeva alla registrazione ha dato luogo, soprattutto nel secondo dopoguerra, alla ricostituzione dei comuni che in epoca fascista erano stati uniti (soprattutto, in 1.499 schede, la registrazione di Albanova come luogo di nascita, che rinvia ad entrambi gli attuali comuni di Casal di Principe e San Cipriano d'Aversa).

Minore impegno ha comportato l’individuazione dei luoghi di provenienza poiché in 62.458 schede esso coincide con il comune di nascita, in 9.916 di esse manca la registrazione e in molte delle altre schede essi sono costituiti da uno dei comuni dell’area pontina.

La seconda attività finalizzata alla normalizzazione della base dati è consistita nel collegare tra loro quelle schede che, pur presentando tra loro varianti, si riferivano al medesimo operaio. Senza poter contare, in questo caso, sulla sicura verificabilità della corretta individuazione del luogo di nascita o di provenienza, è stato necessario in questa fase procedere ad una prudente analisi di confronto dei dati di una scheda con quelli registrati nelle altre schede che presuntivamente potevano essere ricondotte al medesimo operaio.

Non sono state associate al medesimo operaio schede che, pur intestate ad omonimi, non offrivano altri elementi di confronto (soprattutto per la mancata registrazione della data e/o del luogo di nascita), mentre sono state ricondotte al medesimo operaio quelle schede in cui alle differenti varianti del cognome corrispondevano lo stesso nome personale, la stessa paternità, la stessa data e lo stesso luogo di nascita; ovvero, sono state collegate tra loro quelle schede in cui, a fronte di date di nascita differenti ma similari, risultavano convergenti gli altri dati identificativi.

Per i cognomi, che ovviamente costituiscono il primo dato per l’individuazione dell’operaio, le varianti vanno da quelle dipendenti dal tipo di trascrizione ad altre meno prevedibili (ad esempio: Lo Russo / Lorusso; Capolongo / Capolungo; Barbone / Barlone; Calentino / Tolentino; Ducci / Tucci).

Inutile aggiungere che altre numerose varianti sono state riscontrate nelle registrazioni del nome personale, del nome paterno, del cognome e nome della madre (registrato tuttavia soltanto in poco più di diecimila schede), della data e del luogo di nascita.


La pubblicazione online

Le varianti del cognome sono state esposte separando ognuna di esse con una barra obliqua, le varianti della data di nascita sono state separate dalla virgola mentre le altre varianti sono state riportate tra parentesi.

La difficoltà di una integrale restituzione dei dati che rispettasse il contenuto delle registrazioni e che al contempo ne consentisse una efficace normalizzazione è stata risolta esponendo l’universo informativo della base dati in quattro diverse modalità.

  1. La prima presenta ognuna delle 80.381 schede paga negli elementi informativi (faccette) che costituiscono i dati salienti della base dati (cognome, nome, sesso, anno di nascita, luogo di nascita, anno di assunzione, luogo di provenienza). Ogni valore è accompagnato dall’indicazione del suo peso relativo (numero di occorrenze). Per gli anni di nascita certamente errati è visualizzato, accanto all’anno, un asterisco.

  2. La seconda raggruppa per operaio le 80.381 schede paga: i dati dei 58.852 operai che ne risultano sono esposti in due diverse modalità, in forma sintetica e tabellare (Sintesi e Tabella).

  3. La terza, accessibile da ognuna delle unità informative presenti nella Sintesi o nella Tabella, espone, raggruppati per operaio, tutti i metadati delle schede tra loro collegate.

  4. La quarta è costituita dall’oggetto digitale associato al metadato descrittivo: essa ci restituisce la riproduzione del documento nella sua integralità e in tutte le sue parti.

Ne consegue che nella prima modalità, ove sono pubblicate le 80.381 schede, si dà conto delle registrazioni delle singole schede, tralasciando le varianti (ad esempio, l’operaio identificato con il numero 79965 lo si troverà in due diverse occorrenze, come Zingelli e come Zinzelli).

Nella seconda modalità, finalizzata a raggruppare le schede per operaio, sono esposte le informazioni relative al numero identificativo dell’operaio, al cognome, al nome personale e a quello paterno, alla maternità, alla data e al luogo di nascita, senza omettere tutte le loro varianti: del cognome (1320 occorrenze), del nome personale (760 occorrenze), di quello paterno e del nome e cognome della madre (596 occorrenze), della data di nascita (2641 occorrenze), del luogo di nascita (760 occorrenze, da riferire in gran parte alla mancata registrazione, in una delle schede, del luogo di nascita).

Nella terza modalità di esposizione dei dati, si torna a visualizzare le singole schede, raggruppate questa volta per operaio, e provviste di tutte le note esplicative omesse, per semplicità, nelle precedenti visualizzazioni.

Da qui, infine, si accede alla visualizzazione dell’oggetto digitale associato a ciascuna scheda.

Il sistema di consultazione e ricerca è piuttosto intuitivo: il box di ricerca per parola, posto in alto a destra, pesca in tutta la base dati, senza alcuna distinzione. Ricerche più specifiche sono invece possibili inserendo il termine da cercare nei box sottostanti ad ogni faccetta (cognome nome, sesso, anno di nascita, luogo di nascita, anno di assunzione, luogo di provenienza). È naturalmente possibile raffinare le ricerche aggiungendo al primo termine ulteriori filtri, e azzerare poi la ricerca mediante il pulsante “Ripristina”.

In ogni caso, accanto all’etichetta “Le schede paga”, la ricerca restituisce il numero delle schede trovate mentre accanto all’etichetta “Gli operai” essa restituisce il numero degli operai cui quelle schede sono associate.

Il sistema, infine, rende possibile, nella scheda Eventi, la visualizzazione del diagramma dell’andamento delle assunzioni, che toccano il loro apice nel 1932, mentre nella scheda Luoghi si ha invece la georeferenziazione dei luoghi di nascita individuati in modo univoco nella base dati.


L'impianto software

L'impianto software, interamente basato su componenti open source, riprende ed estende, personalizzandole, le funzionalità di base offerte da Exhibit, piattaforma libera sviluppata all’interno del progetto SIMILE dal Massachusetts Institute of Technology (MIT). Di seguito si fornisce una breve introduzione all’uso dell’applicativo a partire dalle sue funzionalità di navigazione e ricerca.

L’applicativo si presenta sostanzialmente suddiviso in due spazi funzionali ben distinti: la parte superiore della schermata è dedicata alla navigazione e alla ricerca, la parte inferiore alle diverse modalità di visualizzazione dei risultati.

Le potenzialità offerte dalla classificazione a faccette vengono sfruttate appieno per dare all’utente immediata contezza dell’universo informativo coperto dalla banca dati, attraverso una diretta esposizione delle classi di oggetti in essa rappresentate: ciascuna faccetta costituisce di fatto un indice di campo che espone a vista valori e frequenze, agendo sui quali è possibile impostare direttamente frasi di ricerca articolate e complesse.

All’inizio della navigazione, le informazioni disponibili si trovano integralmente esposte nelle liste di valori che compongono nel loro insieme le faccette; sulla base di ordinamenti personalizzabili. I valori formanti i vari indici sono affiancati da una cifra indicante la frequenza (numero di occorrenze) di quel singolo valore nella classe informativa di appartenenza; la cifra cambia man mano che si impongono scelte nella navigazione, indicando il numero di unità informative che presentano gli attributi selezionati nel sottoinsieme di risultati sottostanti. La scelta di un termine su una faccetta comporta una conseguente riconfigurazione del sistema: le liste si aggiornano presentando esclusivamente i valori corrispondenti alle opzioni impostate, restringendo progressivamente il focus sull’oggetto della interrogazione. Attraverso una input box collocata nella zona di ricerca, è possibile introdurre criteri di ricerca ulteriori, inserendo un termine di ricerca testuale aiutati da una funzionalità di completamento assistito del termine che si sta introducendo secondo la modalità “keyword in context”. è possibile inoltre agire su una barra del tempo per impostare un intervallo di date di riferimento entro cui si desidera confinare i risultati della ricerca.