Per l’edizione digitale dell’Area Medievale cimiteriale di san Matteo si è scelto di far riferimento a una codifica XML secondo lo standard TEI, utilizzando i moduli e gli elementi predisposti dalle Guidelines.
La Text Encoding Initiative
La TEI, acronimo di Text Encoding Initiative, istituita nel 1987, è un consorzio di istituzioni internazionali, di ambito linguistico e letterario, che ha sviluppato uno standard per la rappresentazione dei testi in formato digitale.
Il consorzio si pone l’obiettivo di sviluppare di una serie di linee guida per la codifica digitale al fine di garantire la portabilità dei testi, la facilità di archiviazione e la facilità di gestione di questi ultimi attraverso i supporti informatici.
Le Guidelines TEI descrivono uno schema di codifica, permettendo la buona riuscita della rappresentazione digitale di un testo, che può essere espresso in diversi linguaggi formali. Esse sono orientate alla creazione e allo scambio di informazioni testuali, ma riguardano anche altre tipologie di informazioni (quali immagini e suoni). Nel corso degli anni si sono succedute diverse versioni: la prima edizione, la TEI P1, si basava su SGML (Standard Generalized Markup Language); la versione più recente, utilizzata per la realizzazione della codifica dell’area medievale cimiteriale è la TEI P5, è stata pubblicata alla fine del 2007, basata su XML, schema RelaxNg (e DTD tradizionale).
Attraverso un testo di riferimento, le Guidelines for Electronic Text Encoding and Intherchange, il consorzio definisce un linguaggio di markup (in XML) che comprende un numero elevato di elementi, di tipo strutturale e semantico, definiti per mezzo di un certo numero di schemi di codifica, organizzati in una struttura modulabile e personalizzabile. Grazie a queste caratteristiche, ogni studioso ha la possibilità di sviluppare il proprio progetto partendo da una serie di linee guida, scegliendo i moduli necessari e modificando, in qualsiasi momento, le definizioni degli elementi. Tra le numerose e importanti novità è stato inserito un modulo per la descrizione dei manoscritti, che è stato ampiamente sfruttato per la codifica della Area medievale cimiteriale di san Matteo
Il teiHeader
Il manoscritto è stato codificato all’interno di un documento XML. Un documento XML è strutturato in modo gerarchico ed è composto da elementi. Ogni elemento rappresenta un componente logico del documento il cui contenuto può essere di tipo strutturale (in cui non può contenere del testo ma solo altri elementi), misto (dove sono presenti sia altri elementi sia il testo), e testuale (in cui l’elemento non può contenere altri elementi ma solo del testo). Esistono anche elementi vuoti ovvero senza nessun tipo di contenuto. Ad un elemento possono essere associate delle informazioni che prendono il nome di attributi. Gli elementi essendo organizzati in un albero con una radice singola chiamata root (radice) ogni documento XML è rappresentabile come una struttura gerarchica ad albero. Un documento che viene marcato attraverso il linguaggio XML deve rispettare sia delle regole sintattiche che delle regole semantiche.
Il <teiHeader> corrisponde all’intestazione dell’intero manoscritto, all’interno della quale sono stati inseriti tutti i metadati relativi alla provenienza, alla pubblicazione e alla descrizione sintetica del volume. Il <text> è il corpo del file XML e contiene i testi, così come sono stati predisposti nei documenti Word, e la bibliografia di riferimento all’interno dell’elemento <front>.
La struttura del file XML si presenta dunque così:
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title type=”main”> Mappa medievale cimiteriale di san Matteo</title>
<title type=”sub”>Edizione elettronica</title>
<principal></principal>
<respStmt>
<resp></resp>
<name></name>
</respStmt>
<respStmt>
<resp>Revisione alla codifica di:</resp>
<name></name>
</respStmt>
</titleStmt>
<publicationStmt>
<publisher></publisher>
<pubPlace></pubPlace>
<date></date>
<availability>
<p>Il progetto è realizzato per ….</p>
</availability>
</publicationStmt>
<sourceDesc>
<msDesc>
All’interno dell’intestazione TEI del documento è presente il <teiHeader>, dove vengono fornite informazioni descrittive e dichiarative che costituiscono un frontespizio elettronico posto prima in ogni testo conforme allo standard, e in successione avremo i seguenti elementi :
- l’elemento <fileDesc> contiene la descrizione bibliografica del file elettronico e avrà al suo interno: <titleStmt> nel quale viene inserito il titolo del lavoro e i suoi responsabili e <publicationStmt> che riporta le informazioni sulla pubblicazione e distribuzione del documento. Il titolo del file elettronico sarà il titolo della lista codificata seguito dalla specificazione edizione digitale;
- l’elemento <sourceDesc> contiene la descrizione relativa alla fonte da cui è derivato il documento elettronico che comprende <msDesc> che contiene un’esposizione del manoscritto e che a sua volta include <msIdentifier> in cui si trova l’informazione necessaria a identificare il manoscritto esaminato da cui sono stati estratti i nominativi delle sepolture individuali e in questo caso sono inserite le informazioni a proposito della sua collocazione fisica;
- l’elemento <encodingDesc> nel quale viene inserita la relazione che c’è tra il testo e la fonte da cui deriva. Contiene al suo interno l’elemento <projectDesc> il quale riporta la descrizione del fine o lo scopo per cui è stato prodotto il file elettronico.
Bibliografia all'interno di front e note critiche e di commento all'interno nel back
La bibliografia completa dell’edizione digitale è inserita all’interno di un <front>, allo stesso livello gerarchico del <text xml:id=”text”>. Le diverse voci sono racchiuse in un <listbibl> che contengono i vari <bliblStruct xml:id=””>. Nell’edizione sono presenti due tipi di note: le note di commento segnalate con numerazione progressiva e le note critiche segnalate con le lettere dell’alfabeto. I due tipi di note si trovano all’interno del <back> una corrispondenza di questo tipo : <ref target=”#Garzella1991″>GARZELLA 1991, pp. 113,100 14,137</ref>.
Tutti i <bibl> sono inseriti, a loro volta, all’interno di un’unica <listBibl>, l’elemento che può contenere una lista di citazioni bibliografiche di qualsiasi natura.
Di seguito è riportata la struttura completa del <front>:
<front>
<listBibl>
<biblStruct xml:id=””>
<monogr>
<author>
<persName>
<forename></forename>
<surname></surname>
</persName>
</author>
<title></title>
<imprint>
<pubPlace></pubPlace>
<date></date>
</imprint>
</monogr>
</biblStruct>
</front>
Per poi avere nel <back> :
Per le note critiche:
<div type=”note_critiche”>
<note n=”a” type=”critical” xml:id=”SM_note_a”></note>
</div>
E direttamente nel testo:
<ptr target=”#SM_note_a” type=”noteAnchor”/>
Mentre per le note di commento:
<div type=”note_commento”>
<note n=”1″ xml:id=”SM_note_1″>””</note>
</div>
E direttamente all’interno del testo:
<ptr target=”#SM_note_1″ type=”noteAnchor”/>
Bibliografia tra <front> e <back>
La bibliografia completa dell’edizione digitale è inserita all’interno di un <front>, allo stesso livello gerarchico del <text xml:id=”text”>. Le diverse voci sono racchiuse in un <listbibl> che contengono i vari <bliblStruct xml:id=””>. Nell’edizione sono presenti due tipi di note: le note di commento segnalate con numerazione progressiva e le note critiche segnalate con le lettere dell’alfabeto. I due tipi di note si trovano all’interno del <back> una corrispondenza di questo tipo : <ref target=”#Garzella1991″>GARZELLA 1991, pp. 113,100 14,137</ref>.
Tutti i <bibl> sono inseriti, a loro volta, all’interno di un’unica <listBibl>, l’elemento che può contenere una lista di citazioni bibliografiche di qualsiasi natura.
Di seguito è riportata la struttura completa del <front>:
<front>
<listBibl>
<biblStruct xml:id=””>
<monogr>
<author>
<persName>
<forename></forename>
<surname></surname>
</persName>
</author>
<title></title>
<imprint>
<pubPlace></pubPlace>
<date></date>
</imprint>
</monogr>
</biblStruct>
</front>
La codifica delle scritte obituarie
Le 272 scritte obituarie sono state codificate suddividendole in singoli div ciascuno marcato con il suo identificatore univoco <div n=”1″ xml:id=”SM_loc_001″ facs=”#SM_line_001″> in esso è contenuto un elemento p che ha come attributo style che può avere valori diversi come per esempio “writing-mode: horizontal-tb” xml:lang=”lat”, writing-mode: vertical-lr” xml:lang=”lat” oppure writing-mode: vertical-rl” xml:lang=”lat” che stanno a determinare l’orientamento di scrittura.
Una scritta obituaria codificata avrà questo tipo di struttura :
<div n=”1″ xml:id=”SM_loc_001″ facs=”#SM_line_001″>
<p style=”writing-mode: horizontal-tb” xml:lang=”lat”>
<choice>
<abbr>Sep</abbr>
<expan>Sep<ex>ulcrum</ex></expan>
</choice>
<persName>Phylippi
<choice>
<abbr>qdm</abbr>
<expan>q<ex>uon</ex>d<ex>a</ex>m</expan>
</choice>
<lb/>Lucchese de<placeName>
<choice>
<abbr>Sco</abbr>
<expan>S<ex>an</ex>c<ex>t</ex>o</expan>
</choice>
<lb/>Luca</placeName></persName><ptr target=”#SM_note_1″ type=”noteAnchor”/>.
</p>
</div>