
di Andrea Lara

Il seminario tenuto dal Professor Andrea Pergola durante la terza giornata della Bottega Digitale del LUDiCa è stato suddiviso in tre sezioni, ognuna incentrata su una diversa tematica.
Inizialmente ci si è concentrati sulla nascita, sullo sviluppo e sull’uso di Transkribus; in seguito l’attenzione si è spostata sull’impiego del software da parte di un team di ricerca del DH.UniCA; sono seguite dimostrazioni pratiche del suo utilizzo nel contesto delle confraternite, argomento chiave del LUDiCa 2025.
Transkribus è nato nel 2015, nell’ottica del progetto READ (Recognition and Enrichment of Archival Documents) tramite il contributo di finanziamenti dell’Unione Europea a dei ed è incentrato su un sistema di riconoscimento HTR (Handwritten Text Recognition) avanzato che supera i sistemi OCR (Optical Character Recognition) tradizionali; essendo infatti incentrato sul Machine Learning, il software può individuare, riconoscere e trascrivere testi ad una velocità superiore a qualsiasi essere umano.
Questa affermazione può apparire incredibile, ma essa ha un caveat importantissimo: il software non può prescindere dall’umano: ciò non deriva solamente dalla necessità dell’ inserimento del materiale di ricerca necessario per formare il Pattern Recognition del modello che si vuole creare, ma anche da fattori come il margine di errore inerente al Machine Learning, il layout del testo o le condizioni del supporto scrittorio.
A tal proposito durante la seconda parte del seminario, il Professor Andrea Pergola ha provveduto a fornire un esempio sull’uso di Transkribus nell’ottica del progetto di ricerca “Dai Feudi agli Usi Civici: la mappa archivistica per la storia della proprietà in Sardegna”, dove è stato impiegato un campione di unità archivistiche formato da 200 documenti provenienti da 10 comuni del Marchesato di Quirra composto da registri quadernati e da registri impropriamente digitalizzati per saggiare il funzionamento del software.
Va precisato che il modello del software impiegato era stato “addestrato” dal team di ricerca in tre fasi consistenti rispettivamente di: 25 documenti di 3 comuni diversi, 50 documenti di 5 comuni diversi e 100 documenti di 10 comuni diversi tutti facenti però parte del territorio del Marchesato di Quirra; una volta terminato il quale si è passati da un tasso di 60% di errori riscontrati usando solamente il modello italiano fornito da Transkribus ad un tasso di errori tra il 7% e il 9% tramite l’uso del modello del DH:UniCA.
Nella terza parte sono stati offerti esempi pratici di impiego, tramite l’analisi di 4 pergamene conservate all’interno del Mutseu, il museo storico della parrocchia di Sant’Eulalia a Cagliari derivanti dalla oggigiorno estinta Confraternita del Santissimo Crocifisso dell’Orazione e della Morte.
L’esperienza pratica ha mostrato le problematiche relative all’uso di Traskribus: un esperto di Paleografia e Diplomatica è in grado di compiere una trascrizione di un testo in maniera più rapida ed accurata rispetto all’IA del software; senza addestramento i moduli messi a disposizione non sono sufficientemente precisi da garantire una qualità accettabile della trascrizione delle fonti.
Solo allenando preventivamente il modello, sarà possibile trascrivere in forma automatica una grande quantità di fonti in brevissimo tempo.
L’incontro si è chiuso con un dibattito. I partecipanti e i loro interventi hanno evidenziato linteresse verso lo sviluppo di tali tecnologie, che comunque non può fare a meno del fattore umano e della sua professionalità.
Parafrasando Philip K. Dick: gli androidi ancora non sognano pergamene elettriche, ma chi può sapere cosa ci riserverà il futuro dell’Umanistica Digitale?
