S’anunciava en el resum del mes passat. La tasca d’anar incorporant localitzacions -més o menys genèriques- a les epigrafies del Corpus Ibèrica havia propiciat el pensar si no seria millor afegir la informació del jaciment on s’havien trobat cada una d’elles.
D’entrada, i seguint el principi de màxima simplicitat possible, la localització de cada epigrafia es va definir com una simple dada sense cap mena de format o limitació especial. No sabent quin seria l’ús real, millor començar amb lo més senzill. Però un cop incorporades un nombre significatiu de localitzacions, s’anava fent evident que es trobava a faltar una millor solució. I si es registrava el jaciment on s’havia trobat la peça amb l’epigrafia?
El problema era doble: per una banda, com normalitzar la identificació dels jaciments i/o localitzacions geogràfiques, i segona, la feinada que això podria implicar. Afortunadament, les dades en brut estan disponibles en la base de dades BDHesperia de la Complutense, de manera que si més no, hi havia una possibilitat real de fer-ho. Això és el que es presenta en aquest apunt.
Des de ja, el Corpus Ibèrica presenta una subsecció on es recullen els jaciments on s’han trobat testimonis epigràfics en ibèric nord-oriental.
En el moment d’escriure aquest apunt, ja hi han les dades dels primers 75, però encara falten gairebé 200 municipis per processar. Expliquem-ho amb detall.
Primer, la solució triada per la definició i gestió d’aquesta mena de dada. Sent geogràfica, s’ha optat per una estructuració en tres nivells, cada cop més amplis. 1) El jaciment. 2) El municipi on es troba i. 3) La seva comarca[1].
Els Monumenta Linguarum Hispanicarum (MLH) d’Untermann havien consagrat una distribució per zones geogràfiques i una notació en tres nivells. Una lletra per la zona (que pot ser força àmplia, la B per exemple, cobreix tota la Septimània), seguida d’un enter que indica el lloc (el 0 es reserva per peces d’origen incert), i un segon número, correlatiu per enumerar les peces allà trobades. Així, B.1 indica Enserune i B.1.1 la primera peça del lloc analitzada en els MLH. Els de la Complutense, han seguit un criteri gairebé idèntic, però amb unes zones geogràfiques i codis alfabètics diferents (no sempre coherents, tot sigui dit). En en el fons, la virtut essencial que comparteixen amb la notació d’Untermann és proporcionar un identificatiu únic a cada epigrafia. Així, la B.1.1 d’Untermann és la HER.02.001 a BDHesperia. Des del punt de vista codicològic, un simple número faria el mateix fet (per això en el Corpus Ibèrica cada entrada s’identifica per un enter entre 0 i 99999), però també és cert que si recordes que HER indica l’Erau, doncs tot això que tens de guanyat… 🙂
Tenint en compte que el Corpus Ibèrica ja tenia el problema codicològic solucionat d’entrada, semblava una mala idea seguir l’arbitrarietat geogràfica explícita d’identificar els llocs amb un número d’aquest dos model previs. La solució ha estat simple.
Crear una mena de dada nova en el Corpus: els jaciments, que segueix els mateixos principis emprats en tot el web. Una URL única per a cada jaciment (amb la forma https://cathalaunia.org/Iberika/Jxxxx, on xxxx és un enter entre entre 0 i 9999[2]), amb una pàgina on especificar el nom del jaciment, el municipi on es troba, i la seva comarca; aquestes dos darrers, amb enllaços a Wikipedia (i el jaciment, si se li coneix una URL d’accés públic, també). I una llista de les entrades del Corpus que s’hi han trobat.

El jaciment de Vieille-Toulouse i ses 34 entrades epigràfiques conegudes.
Una llista, en la que a semblança dels resultats de les Cerques, passant en ratolí per damunt mostra l’epigrafia. Així es poden veure en una única pàgina literalment totes les epigrafies del lloc juntes.
I com es fa també en altres dades del web, una pàgina general (Jaciments) on accedir al llistat de jaciments (i municipis) del Corpus.
Una llista de jaciments, alfabètica, per facilitar la consulta, seguida en la part inferior de la mateixa pàgina d’una llista de municipis – i els jaciments que s’hi han detectat -, també ordenada alfabèticament.
Llista de municipis i noms dels jaciments confegida inicialment a partir dels continguts de BDHesperia i que es va processant/readaptant un a un.
Un procès molt instructiu (recorda força la tasca d’anar localitzant les imatges de cada epigrafia), que permet correlacionar el contingut de les dues bases de dades i que propicia, creiem, millores significatives.
Per una banda, l’estandardització en la notació de les epigrafies que aporta l’oficialitat de BDHesperia, que en el cas del Corpus Ibèrica ja estava contemplada en la secció ‘Web‘ de cada entrada epigràfica.
En anotar les epigrafies de cada jaciment, s’aprofita, i si no hi era, es posa l’identificatiu de BDHesperia i l’enllaç corresponent. Desafortunadament, aquests enllaços s’han d’entrar un a un ja que incomprensiblement BDHesperia no proporciona una URL única per cada entrada que estigui basada en el seu identificatiu…!? Amb lo fàcil que seria quelcom com fer que HER.02.001 estigués a: ” http://hesperia.ucm.es/corpus/HER.02.001 ” o alguna cosa semblant. Doncs no, HER.02.001 està a: ” http://hesperia.ucm.es/consulta_hesperia/Generalidades.php?file=file_98.php&id=1410 ” ! Un desastre, que a efectes pràctics, vol dir que a la que el seny il·lumini els gestors i facin el que el sentit comú indica, caldrà canviar totes les referències que ara s’estan incorporant[3]… 😦
A més, aquesta tasca d’anar repassant municipi per municipi i jaciment per jaciment, està permetent detectar casos d’epigrafies que manquen en el Corpus. Són molt poques, i gairebé totes derivades d’obres de difícil localització, però el fet de tenir-les detectades, obre la porta a incorporar-les en un futur proper. Els continguts inicials del Corpus Ibèrica eren els del corpus de ibers.cat, però amb aquesta repassada a mà, s’hi han pogut afegir fins ara una desena d’entrades que sí es podien trobar sense massa dificultat (les que encara no s’ha pogut incorporar figuren en les llistes dels jaciments només amb el seu identificatiu de BDHesperia). També cal dir que hi ha entrades en el Corpus que no apareixen a BDHesperia; per exemple, aparentment, grafits d’una sola lletra no hi figuren[4], suposo que deu ser alguna limitació deliberada, però en tot cas tampoc sembla que sigui uniformement aplicada…
Següent pas
Un cop entrats els jaciments, el següent pas serà canviar les dades de cada epigrafia per incorporar-hi el jaciment de forma explícita. Però aquesta serà una tasca per definició automatitzable de manera que preocupa poc o gens. Més enllà, després, ajustar les pàgines dels glifs del Signari (per exemple, la O de tres travessers) i les dels glifs del Signari simplificat (com per exemple, els Ki/Gi) i poder tenir amb un cop d’ull a quins llocs es detecta cada glif i quines variants es coneixen a cada lloc. De fet, ara ja es pot anar consultant, perquè tot i que la dada explícita del jaciment encara no consta en la fitxa de cada epigrafia, sí s’anota en la seva localització genèrica.
Tot plegat més feina per fer, però si més no, amb l’al·licient d’estar incorporant dades rellevants. I aquesta, és una tasca (la codificació de coneixement) que per limitació estructural les màquines no poden fer[5].
Depèn de nosaltres, i només nosaltres…
Notes
- [1] Volgudament s’evita l’ús de coordenades geogràfiques. Per tot un seguit de motius, els dos primers: els jaciments són per definició llocs vulnerables, i en segon lloc, per no repetir una informació que ja està enllaçada. També s’eviten l’ús de mapes interactius: per ser de poca utilitat, i per evitar regalar dades a tercers (la gran majoria d’eines estan basades en serveis privats -Google, el més freqüent-, que no fan sinó registrar qui clica en quins llocs per vendre-ho a tercers).
- [2] Com ja es va indicar en apunts passats, les dades del web permeten l’accés per URLs abreujades, de manera que la forma ” https://cathalaunia.org/J30 “, és funcionalment idèntica a ” https://cathalaunia.org/Iberika/J0030 “. Codicològicament: per això serveix el prefix alfabètic redundant de les URLs ‘normals’ del web.
- [3] Al ser un procès mecanitzable, tot i ser massiu, només implica l’esforç de programar-lo.
- [4] Per exemple, el cas de la epigrafia de la imatge anterior, la I03450, on en el mateix article es descriuen varies marques més, però només les de més d’un signe consten a BDHesperia.
- [5] La diferencia entre informació i coneixement no és computable. Tot i que evidentment, no per això deixarem pas d’intentar-ho… 🙂