Sembra una storia uscita da un romanzo di Dan Brown, e invece è tutto vero: un manoscritto cifrato del XVIII secolo ha finalmente ceduto sotto i colpi degli analisti moderni, rivelando gli antichi rituali di una società segreta.
Stiamo parlando del cosiddetto Copiale, un manoscritto rilegato di 105 pagine, fittamente scritte con simboli astratti alternati a caratteri latini e greci, senza alcuno spazio per separare le parole. Le uniche indicazioni non cifrate che vi si trovano sono “Philipp 1866” (probabilmente il nome di un collezionista che lo acquistò) e, appunto, “Copiales 3”. Della sua storia si sa poco: codicologicamente datato approssimativamente tra il 1760 e il 1780, il volumetto di probabile provenienza berlinese è oggi in una collezione privata.
Il manoscritto presenta caratteristiche che hanno lasciato perplessi schiere di ricercatori, come il numero di simboli utilizzati, novantasette: troppi per un semplice cifrario a sostituzione (in cui a ogni lettera corrisponde un simbolo), ma troppo pochi perché rappresentino una modalità di codifica più complessa, come ad esempio un cifrario sillabico.
Il mistero è stato svelato da Kevin Knight, uno studioso d’informatica dell’Università della South California, in collaborazione con Beáta Megyesi e Christiane Schaefer, del dipartimento di linguistica e filologia dell’Università di Uppsala. Si trattava sì di un cifrario a sostituzione, ma con diverse aggiunte come omofoni, lettere nulle e logogrammi, utilizzate per rendere il sistema più robusto e indecifrabile[1].
Il libretto è stato trasformato in una sequenza di simboli che potessero essere letti da un computer, permettendo così una prima analisi delle frequenze delle lettere all’interno del manoscritto. Fu ad esempio identificato un gruppo di otto simboli, scritti con dimensioni maggiori rispetto alle altre lettere, che sembravano avere frequenze piuttosto basse all’interno del documento.
Fu anche verificato quante volte ogni simbolo era preceduto o seguito da ciascun altro, mediante la costruzione di “vettori di co-occorrenza”. In pratica: se la lettera x era preceduta due volte dalla a, cinque dalla b, eccetera... veniva creato un vettore della forma [2, 5, ...]. Questo procedimento fu ripetuto per ogni simbolo del cifrario.
In questo modo fu possibile creare un “diagramma di clustering”: un procedimento in qualche modo simile a quello della costruzione degli alberi filogenetici in biologia. Fu così evidente che alcuni simboli mostravano un comportamento molto simile: le lettere latine non accentate, ad esempio, sembravano formare un gruppo a sé, separato dagli altri.
Ipotizzando che fossero queste lettere a nascondere il messaggio (mentre tutte le altre avrebbero potuto avere una funzione di “nulle”, cioè di simboli senza significato inseriti al solo scopo di confondere le acque), Knight e il suo team lanciarono allora un robusto attacco informatico a tale sequenza di lettere, assumendo dapprima che il testo nascosto fosse scritto in tedesco, poi in latino, poi in tutti i maggiori linguaggi europei. Tutti i tentativi però fallirono, e l’ipotesi fu abbandonata.
Basandosi sul contesto, fu allora ipotizzato che la lingua del libretto fosse il tedesco. Formulare ipotesi sulla lingua di un documento può essere uno strumento molto importante per un crittoanalista, che in questo modo può sfruttare alcune caratteristiche specifiche della grammatica in questione, o particolari successioni di lettere. In italiano, ad esempio, la lettera Q è praticamente sempre seguita dalla U. Nel tedesco avviene una cosa simile con il gruppo CH, e Knight decise di concentrarsi su questo. Mediante una tavola di tutti i digrammi del manoscritto identificò un simbolo “ر” che era di solito seguita dalla “ħ”.
Questa prima identificazione ne permise altre, a cascata. Ad esempio, poiché la successione di lettere CHT è piuttosto comune in tedesco, e siccome il trigramma “رħ^” era uno dei più frequenti, fu possibile ipotizzare l’identificazione “^”=T. E così via. A questo punto tornò utile il diagramma costruito in precedenza, dato che raggruppava le lettere sulla base della similarità. Le cinque vocali con accento circonflesso sembravano ad esempio comportarsi tutte allo stesso modo, e quindi i ricercatori ipotizzarono che potessero trattarsi di “omofoni”, artificio spesso utilizzato nei codici segreti per rendere il messaggio più difficile da decrittare: ovvero di cinque simboli che identificavano tutti la medesima lettera, in questo caso la E.
Un frammento di testo decifrato chiarì finalmente la funzione delle lettere latine non accentate. I ricercatori si trovarono, infatti, davanti alla sequenza “?CERIMONIE? DER?AUFNAHME?”, dove al posto dei punti interrogativi si trovavano lettere latine. Fu quindi immediatamente chiara la soluzione dell’enigma: si trattava di “nulle”, cioè di lettere senza significato usate semplicemente per confondere le idee e come spaziatura tra le parole, l’esatto opposto della prima ipotesi di decifrazione.
Nel corso della decifrazione divennero evidenti alcuni trucchetti, che erano stati usati per rendere il codice più robusto: ad esempio era stato riservato un simbolo unico per alcuni gruppi di lettere molto frequenti in tedesco, come SCH o ST. Inoltre era stato previsto un simbolo, i due punti (:), per segnalare quando una lettera doveva essere raddoppiata: nella parola abschnitt (“sezione”), ad esempio, le due T finali erano scritte come “^:”.
Piano piano il testo emergeva dall’oscurità. A ogni simbolo era possibile assegnare il corrispondente significato, a eccezione di quel gruppo di otto simboli scritti con dimensioni maggiori rispetto al resto del testo.
Ma ormai il più era fatto: il significato di queste lettere ancora oscure era evidente dal contesto, in frasi come «il [simbolo 1] chiede al candidato se desideri diventare un [simbolo 2]». I logogrammi servivano quindi a indicare termini tecnici come loggia, gran maestro, e così via.
Il testo cifrato era relativo alle cerimonie e ai segreti di una società segreta della Germania settentrionale della metà del XVIII secolo, la Hocherleuchtete Oculisten-Gesellschaft, i cui rituali sono incentrati sulla simbologia dell’occhio. È descritta nei dettagli la cerimonia d’iniziazione: dopo le domande di rito, al candidato è mostrato un foglio bianco, e gli è chiesto di leggerlo. Quando egli ammette di non riuscirci, gli è consegnato un paio di occhiali, ed è sottoposto a un’“operazione oculistica” (in realtà, il prelevamento di un sopracciglio). Dopo di che il foglio bianco è sostituito con uno scritto, e il candidato può finalmente leggere gli “insegnamenti per gli apprendisti”.
Altre sezioni trattano il modo di riconoscersi fra gli appartenenti alla loggia, mediante gesti con le mani che variano da città a città (come l’indice posto sulla bocca, a Berlino, o il medio che tocca l’occhio destro mentre il pollice è sull’orecchio, a Francoforte), oppure mediante frasi (quando uno chiede «Chi è con Hans?», il confratello dovrebbe rispondere con un nome che inizia con la seconda lettera della persona usata nella domanda; ad esempio “È con Anton”). E altre cose del genere. Si tratta quindi di un documento storico eccezionale per capire la struttura e i rituali delle logge settecentesche, e magari anche della loro influenza sulla politica e sulla filosofia del tempo. Un piccolo gioiello che la moderna crittoanalisi ha saputo consegnarci.
Stiamo parlando del cosiddetto Copiale, un manoscritto rilegato di 105 pagine, fittamente scritte con simboli astratti alternati a caratteri latini e greci, senza alcuno spazio per separare le parole. Le uniche indicazioni non cifrate che vi si trovano sono “Philipp 1866” (probabilmente il nome di un collezionista che lo acquistò) e, appunto, “Copiales 3”. Della sua storia si sa poco: codicologicamente datato approssimativamente tra il 1760 e il 1780, il volumetto di probabile provenienza berlinese è oggi in una collezione privata.
Il manoscritto presenta caratteristiche che hanno lasciato perplessi schiere di ricercatori, come il numero di simboli utilizzati, novantasette: troppi per un semplice cifrario a sostituzione (in cui a ogni lettera corrisponde un simbolo), ma troppo pochi perché rappresentino una modalità di codifica più complessa, come ad esempio un cifrario sillabico.
Il mistero è stato svelato da Kevin Knight, uno studioso d’informatica dell’Università della South California, in collaborazione con Beáta Megyesi e Christiane Schaefer, del dipartimento di linguistica e filologia dell’Università di Uppsala. Si trattava sì di un cifrario a sostituzione, ma con diverse aggiunte come omofoni, lettere nulle e logogrammi, utilizzate per rendere il sistema più robusto e indecifrabile[1].
Il libretto è stato trasformato in una sequenza di simboli che potessero essere letti da un computer, permettendo così una prima analisi delle frequenze delle lettere all’interno del manoscritto. Fu ad esempio identificato un gruppo di otto simboli, scritti con dimensioni maggiori rispetto alle altre lettere, che sembravano avere frequenze piuttosto basse all’interno del documento.
Fu anche verificato quante volte ogni simbolo era preceduto o seguito da ciascun altro, mediante la costruzione di “vettori di co-occorrenza”. In pratica: se la lettera x era preceduta due volte dalla a, cinque dalla b, eccetera... veniva creato un vettore della forma [2, 5, ...]. Questo procedimento fu ripetuto per ogni simbolo del cifrario.
In questo modo fu possibile creare un “diagramma di clustering”: un procedimento in qualche modo simile a quello della costruzione degli alberi filogenetici in biologia. Fu così evidente che alcuni simboli mostravano un comportamento molto simile: le lettere latine non accentate, ad esempio, sembravano formare un gruppo a sé, separato dagli altri.
Ipotizzando che fossero queste lettere a nascondere il messaggio (mentre tutte le altre avrebbero potuto avere una funzione di “nulle”, cioè di simboli senza significato inseriti al solo scopo di confondere le acque), Knight e il suo team lanciarono allora un robusto attacco informatico a tale sequenza di lettere, assumendo dapprima che il testo nascosto fosse scritto in tedesco, poi in latino, poi in tutti i maggiori linguaggi europei. Tutti i tentativi però fallirono, e l’ipotesi fu abbandonata.
Basandosi sul contesto, fu allora ipotizzato che la lingua del libretto fosse il tedesco. Formulare ipotesi sulla lingua di un documento può essere uno strumento molto importante per un crittoanalista, che in questo modo può sfruttare alcune caratteristiche specifiche della grammatica in questione, o particolari successioni di lettere. In italiano, ad esempio, la lettera Q è praticamente sempre seguita dalla U. Nel tedesco avviene una cosa simile con il gruppo CH, e Knight decise di concentrarsi su questo. Mediante una tavola di tutti i digrammi del manoscritto identificò un simbolo “ر” che era di solito seguita dalla “ħ”.
Questa prima identificazione ne permise altre, a cascata. Ad esempio, poiché la successione di lettere CHT è piuttosto comune in tedesco, e siccome il trigramma “رħ^” era uno dei più frequenti, fu possibile ipotizzare l’identificazione “^”=T. E così via. A questo punto tornò utile il diagramma costruito in precedenza, dato che raggruppava le lettere sulla base della similarità. Le cinque vocali con accento circonflesso sembravano ad esempio comportarsi tutte allo stesso modo, e quindi i ricercatori ipotizzarono che potessero trattarsi di “omofoni”, artificio spesso utilizzato nei codici segreti per rendere il messaggio più difficile da decrittare: ovvero di cinque simboli che identificavano tutti la medesima lettera, in questo caso la E.
Un frammento di testo decifrato chiarì finalmente la funzione delle lettere latine non accentate. I ricercatori si trovarono, infatti, davanti alla sequenza “?CERIMONIE? DER?AUFNAHME?”, dove al posto dei punti interrogativi si trovavano lettere latine. Fu quindi immediatamente chiara la soluzione dell’enigma: si trattava di “nulle”, cioè di lettere senza significato usate semplicemente per confondere le idee e come spaziatura tra le parole, l’esatto opposto della prima ipotesi di decifrazione.
Nel corso della decifrazione divennero evidenti alcuni trucchetti, che erano stati usati per rendere il codice più robusto: ad esempio era stato riservato un simbolo unico per alcuni gruppi di lettere molto frequenti in tedesco, come SCH o ST. Inoltre era stato previsto un simbolo, i due punti (:), per segnalare quando una lettera doveva essere raddoppiata: nella parola abschnitt (“sezione”), ad esempio, le due T finali erano scritte come “^:”.
Piano piano il testo emergeva dall’oscurità. A ogni simbolo era possibile assegnare il corrispondente significato, a eccezione di quel gruppo di otto simboli scritti con dimensioni maggiori rispetto al resto del testo.
Ma ormai il più era fatto: il significato di queste lettere ancora oscure era evidente dal contesto, in frasi come «il [simbolo 1] chiede al candidato se desideri diventare un [simbolo 2]». I logogrammi servivano quindi a indicare termini tecnici come loggia, gran maestro, e così via.
Il testo cifrato era relativo alle cerimonie e ai segreti di una società segreta della Germania settentrionale della metà del XVIII secolo, la Hocherleuchtete Oculisten-Gesellschaft, i cui rituali sono incentrati sulla simbologia dell’occhio. È descritta nei dettagli la cerimonia d’iniziazione: dopo le domande di rito, al candidato è mostrato un foglio bianco, e gli è chiesto di leggerlo. Quando egli ammette di non riuscirci, gli è consegnato un paio di occhiali, ed è sottoposto a un’“operazione oculistica” (in realtà, il prelevamento di un sopracciglio). Dopo di che il foglio bianco è sostituito con uno scritto, e il candidato può finalmente leggere gli “insegnamenti per gli apprendisti”.
Altre sezioni trattano il modo di riconoscersi fra gli appartenenti alla loggia, mediante gesti con le mani che variano da città a città (come l’indice posto sulla bocca, a Berlino, o il medio che tocca l’occhio destro mentre il pollice è sull’orecchio, a Francoforte), oppure mediante frasi (quando uno chiede «Chi è con Hans?», il confratello dovrebbe rispondere con un nome che inizia con la seconda lettera della persona usata nella domanda; ad esempio “È con Anton”). E altre cose del genere. Si tratta quindi di un documento storico eccezionale per capire la struttura e i rituali delle logge settecentesche, e magari anche della loro influenza sulla politica e sulla filosofia del tempo. Un piccolo gioiello che la moderna crittoanalisi ha saputo consegnarci.
Note
1) Knight, K., Megyesi B., Schaefer, C. 2011. “The secrets of the Copiale Cipher”. Journal for research into freemasonry and fraternalism (2) 2, pp. 314-324, doi: 10.1558/JREF.v2i2.314; gli interventi degli autori nonché la riproduzione digitale e la trascrizione e traduzione del manoscritto sono disponibili all’url http://stp.lingfil.uu.se/%7Ebea/copiale/