Nel mondo in continua evoluzione della comunicazione digitale, la linguistica computazionale rappresenta uno degli incontri più affascinanti tra scienze umanistiche e tecnologia. Ma cosa significa esattamente? E, soprattutto, a cosa serve? In che modo può essere utile nell’analisi dei testi, nella critica letteraria e perfino in ambito giudiziario?
Cos’è la linguistica computazionale
La linguistica computazionale è la disciplina che studia i linguaggi naturali attraverso strumenti informatici. In altre parole, è quel settore che si occupa di insegnare alle macchine a comprendere, elaborare e generare il linguaggio umano, in tutte le sue sfumature. Se oggi possiamo dettare un messaggio al nostro smartphone o farci tradurre una pagina da una lingua all’altra, lo dobbiamo a questa branca interdisciplinare che unisce informatica, linguistica, intelligenza artificiale e statistica.
A cosa serve
Oltre alle applicazioni quotidiane come i correttori automatici, i traduttori online o gli assistenti vocali, la linguistica computazionale ha un impatto sempre più forte in campi come:
-
l’analisi del sentiment (per capire cosa pensano le persone su un certo argomento online),
-
l’elaborazione del linguaggio naturale (NLP) nei chatbot,
-
la creazione di sintesi automatiche di testi,
-
il riconoscimento vocale,
-
la traduzione automatica neurale,
-
la stilometria.
Ed è proprio quest’ultimo ambito a offrire spunti sorprendenti per chi si occupa di scrittura, editoria e letteratura.
Stilometria: l’impronta digitale dello stile
La stilometria è la scienza che studia lo stile linguistico attraverso l’analisi quantitativa. Detta più semplicemente: analizza testi per individuare tratti ricorrenti, schemi lessicali, costruzioni sintattiche e abitudini espressive che caratterizzano un autore o un’opera.
Oggi, grazie alla linguistica computazionale, gli strumenti stilometrici sono sempre più raffinati. Ma cosa permettono davvero di scoprire?
Risultati celebri: la stilometria in azione
La stilometria ha portato alla luce risultati clamorosi in diversi ambiti. Eccone alcuni tra i più noti:
-
Il caso Elena Ferrante: nel 2016, un’équipe dell’Università di Padova e della Columbia University ha usato tecniche stilometriche per confrontare i romanzi firmati Ferrante con le opere di vari autori napoletani contemporanei. Il software ha suggerito con alta probabilità che dietro lo pseudonimo si celasse Domenico Starnone, avvalorando ipotesi già circolanti.
-
I Federalist Papers: uno dei primi e più famosi esempi di uso della stilometria. Questi scritti politici americani del XVIII secolo erano firmati con pseudonimi. Grazie all’analisi computazionale dello stile, fu possibile distinguere con alta affidabilità i testi scritti da Alexander Hamilton da quelli di James Madison.
-
Il caso del “diario del mostro”: in ambito forense, la stilometria ha aiutato le indagini legate al cosiddetto Mostro di Firenze. Alcuni documenti sospetti, come lettere anonime e appunti, sono stati analizzati per verificare possibili compatibilità con la scrittura di sospettati. Pur non offrendo “prove assolute”, l’analisi stilometrica ha fornito elementi di supporto alle indagini tradizionali.
-
L’attribuzione di Lazarillo de Tormes: in Spagna, l’analisi computazionale ha cercato di risolvere il mistero dell’autore del famoso romanzo picaresco del Cinquecento. Vari candidati sono stati confrontati attraverso modelli stilometrici, restringendo il campo dei possibili autori.
Questi esempi dimostrano quanto la linguistica computazionale, e in particolare la stilometria, sia uno strumento potente per fare luce su testi anonimi o controversi, in ambito sia letterario sia giudiziario.
L’italiano al centro della rivoluzione linguistica
La lingua italiana, con la sua ricchezza morfosintattica e il suo lessico sfumato, rappresenta una sfida stimolante per la linguistica computazionale. Tuttavia, sono sempre di più i progetti (come ItWac, TDiT o PAISÀ) che mettono al centro l’italiano, arricchendo risorse, banche dati e modelli linguistici specifici per la nostra lingua.
La sfida dei prossimi anni sarà rendere questi strumenti sempre più accessibili, affidabili e integrati nelle pratiche di ricerca, analisi e scrittura.
Vuoi approfondire?
-
Per esplorare strumenti di stilometria online: Stylo (plugin per R)
-
Per esplorare corpora dell’italiano: PAISÀ, ItWac
-
Per l’elaborazione automatica dell’italiano: Istituto di Linguistica Computazionale “Antonio Zampolli” (ILC-CNR)