Paleografia Ibèrica Digital.

Aquest apunt és per comentar una novetat en el corpus Iberika de cathalaunia.org estretament relacionada amb el seu Signari. El tema venia de lluny però ha cristal·litzat aquesta setmana.

Ja des dels seus inics a l’any 2013, el corpus ha presentat una pàgina Signari on mostrar la pluralitat de glifs que defineixen la seva escriptura (amb la seva codificació numèrica) seguida de l’especificació d”una agrupació d’aquests mateixos glifs en ‘caràcters’ (parlant impròpiament) per facilitar fer cerques i altres manipulacions.

Signari de 207 glifs.

El contingut ha anat variant al llarg del temps seguint l’evolució de la definició del signari; dels 136 signes originals del seu corpus mare, el de na Carme J. Huertas, als 207 de l’actualitat; i fins aquesta setmana, això era tot el que es podia trobar: una llista de signes i codis. A partir d’ara però, cada un dels glifs es pot clicar per obrir una pàgina on recollir la informació que es disposa d’ell en el corpus, que no és pas poca. Mostrem per exemple, el glif 116, suposadament una variant de Ke, lo prou poc documentada com per poder capturar-ho tot en una sola imatge però amb tots els elements que volem comentar:

Informació disponible del glif 116.

En la part alta, les dades bàsiques: el seu aspecte, el seu codi numèric, el seu valor fonètic suposat, i el nombre d’entrades epigràfiques en els que figura. I a sota, una taula amb el desglòs de cada una de les epigrafies. Cada una amb el codi Iberika corresponent (enllaçat lògicament a l’entrada en qüestió), l’identificatiu, el suport, la data, la localització i les formes originals en les que apareix el glif. Tenir un corpus informatitzat permet això, poder dir en quines epigrafies apareix cada un dels seus signes.

No fa gaire es comentava, parlant de la variabilitat sígnica de l’ibèric nord-oriental, de la possibilitat de reconstruir quins signaris s’empraren en cada moment i context de la història de la Ibèria. La idea rera aquestes pàgines de glifs és proporcionar el lloc on presentar les dades necessàries per a tal tasca. No per què sigui un objectiu amb el que hi hagi una afinitat especial, més aviat el contrari, però sembla  indefugible[1] tot i les seves limitacions naturals. Mirem d’explicar-ho.

Certament, qui hagi revisat un nombre lo prou gran d’epigrafies ibèriques pot percebre modalitats i costums diferents, i si tenim el lloc i el moment en el qual es documenten cada un dels signes, hauria de ser  relativament fàcil descriure la modalitat (o modalitats) que s’empraren en cada context. La idea, en abstracte, no pot ser més encertada, però el problema és la seva definició formal, que estarà malauradament farcida d’ambigüitats. Per començar, molts objectes estan descontextualitzats, i per tant, no permeten ni una localització ni una datació que no sigui d’allò més genèrica. Tampoc del fet de trobar un objecte en un cert lloc en podem sovint derivar, ni la seva factura local (no deixen de ser bens mobles), ni menys que ho fos la seva escriptura si són marques fetes amb posterioritat a la seva fabricació. Tampoc l’eix temporal permet gaires alegries, les datacions amb uns mínims de garanties són malauradament minoria (les tècniques de datació han millorat molt, però el gruix de l’evidència, en ser anterior, no n’ha pogut fruir). El perill, és que davant la poca evidència disponible, es caigui en la temptació d’oblidar que ‘absència d’evidència no és evidència d’absència’, i per voler definir un context, es menystingui l’ambigüitat intrínseca de les dades. Si per exemple, tenim un glif documentat en 30 epigrafies, 20 d’elles del segle IIac i d’un context local relativament reduït i la resta sense data, podem estar temptats de creure que efectivament, va ser creat i emprat en aquell context del s.IIac, quan de fet, amb només que una de les altres 10 epigrafies resultés ser del segle IIIac desfaria la hipòtesi. El perill està en què en no saber-ho, ens fixem només en el que sí sabem, que no deixa de ser una inclinació natural de la ment. I com que, agradi o no, cal fer hipòtesis, i en aquesta mena de casos no acostuma a haver-hi gaires novetats que obliguin a replantejar-les sovint, la inèrcia porta a substituir el que originalment era una suposició en una ‘opinió de consens’ al cap d’un temps i d’un cert nombre de repeticions acrítiques en la literatura especialitzada. La pràctica historiogràfica està farcida d’exemples, i tot historiador sap que ha de desconfiar-ne sistemàticament, però això no és tan així en altres disciplines (en el que fa a l’avaluació geotemporal de les dades disponibles, s’entén). D’aquí les recances amb la idea de mirar de delimitar uns suposats modismes locals en una temàtica amb tantes ambigüitats estructurals: el perill d’autoreferenciar-se és molt gran.

Però tornant a lo concret, cal fer una observació d’estat actual. Aquestes pàgines de glifs mostren clarament la gran quantitat de dades que encara falten incorporar en el corpus. La majoria d’epigrafies no tenen ni localització geogràfica ni datació. El motiu està en què en origen, la missió principal del corpus era presentar una codificació el més semblant possible als originals (i aquesta era la informació que les dades d’ibers.cat proporcionava) , però un cop aquesta tasca ha estat raonablement encarrilada, es va fent patent la necessitat d’afegir la resta d’informacions bàsiques, especialment com diem: lloc i data. Per això, de moment, les columnes de Data i Lloc en la pàgines dels glifs, apareixen majoritàriament buides, cal encara una tasca sistemàtica d’anotació, ja que en origen no es disposava d’aquesta informació. És l’objectiu i la metodologia emprada a cathalaunia.org: presentar només dades bàsiques amb referències a fonts d’autoritat externes per si es vol anar més enllà[2]. En el cas de les epigrafies ibèriques, per a cada una es disposa d’una secció de Bibliografia (i en això, la tasca d’afegir les evidències gràfiques feta aquests darrers mesos n’ha permès incorporar-ne un mínim a una majoria d’entrades), una de Web, majoritàriament amb referències a la base de dades Hesperia (tot i que encara publica molt poques dades). I ara cal convertir les dades de Lloc a ser possible en enllaços a descripcions del context geogràfic o jaciment arqueològic (preferencialment de Wikipedia) que continguin les coordenades de la seva geolocalització[3]. Tot plegat es diu ràpid: només cal afegir lloc i data a més de 3.000 epigrafies…

Però més enllà d’aquestes mancances, les pàgines dels glifs, presenten una columna Formes, on s’aniran mostrant les formes que pren el glif en cada epigrafia, i aquí arribem, per fi, a la Paleografia Ibèrica Digital del títol.

Paleografia Digital

Dèiem que la cosa venia de fa un temps (i aquí tenim que passar a la primera persona). L’any 2015, en el magnífic bloc de n’Ainoa Castro, Littera Visigothica, dedicat a la paleografia visigòtica, l’autora comentava la seva disposició a aplicar la informàtica a la tasca paleogràfica d’identificar les diferents mans que confeccionaren un manuscrit determinat. Sent cathalaunia.org  el fruit de creuar Història i Computació, em va causar sorpresa el fet de no haver-hi pensat abans en una tal aplicació de la tecnologia. Certament sabia de webs especialitzats en manuscrits originals i altres aspectes relacionats amb la diplomàtica (sols cal mirar en la llista de ‘Adreces d’interès‘ de cathalaunia per trobar-ne uns quants), però per a la tasca concreta d’individualitzar els caràcters de cada escrivà, no. De manera que vaig mirar de seguir d’aprop el tema per mirar d’estar al dia i per si es podia ajudar d’alguna manera.

Els detalls, arribaren poc després en els següents apunts del bloc, i eren que certament ja existia una aplicació de paleografia digital anomenada DigiPal i que la tasca de l’autora en els propers temps seria adequar l’aplicació al context de la paleografia visigòtica[4]. El programa proporciona una sèrie de facilitats genèriques d’anotació d’escriptures manuals en entorns web, però està pensat per ser modificable per a cada context (les necessitats varien lògicament segons l’àmbit a estudiar, no és el mateix si estem parlant d’epigrafia carolina, o de miniatures, de llibres, o de pergamins, etc, etc).

Un comentari de professional del món de la computació. Sovint, els programes informàtics neixen d’una idea simple, a voltes mínima o fins i tot insubstancial, l’expressió de la qual ocupa una part petita quan no ínfima de tot el programa; la resta, el gruix de la feina (i dels problemes) és com arribar a poder fer funcionar aquest pinyol, aquest germen inicial. En el cas de la paleografia medieval, aquest ‘pinyol’ sembla estar en poder marcar de forma fàcil cada una de les lletres sobre les imatges dels manuscrits a estudiar. Els paleògrafs construeixen (fins ara manualment) llistes de com es dibuixaven cada una de les lletres o signes en cada original i per comparació caligràfica, les agrupen en sengles ‘mans’. El programa DigiPal facilita això: presentar una imatge d’un manuscrit per tal de poder marcar-ne una part, un rectangle, i dir: ‘això és una A‘, ‘això una g‘, ‘aquí hi ha una altra A‘, etc. I a partir d’aquesta informació base, anotar-la, categoritzar-la i agrupar-la i presentar-la segons les necessitats específiques del camp d’estudi. El projecte DigiPal està doncs pensat per crear derivats seus, per exemple, en el cas de n’Ainoa Castro, està construint (i ho comenta més que bé en el seu bloc) un ‘VisigothicPal‘.

De manera que la reacció fou pensar immediatament en un possible ‘IbèricPal‘.

La problemàtica de les escriptures ibèriques preromanes és molt diferent al de les l’escriptures medievals, però possiblement el program seria lo prou adaptable com per poder-ne fer una eina eficaç en aquest domini (potser a efectes pràctics, la dificultat a primera vista mes evident era la necessitat de poder indicar lletres ‘torçades’, és a dir, de marcar rectangles ‘girats’, una facilitat que la darrera vegada que ho vaig mirar, DigiPal encara no incorporava, però que estic segur que incorporarà ben aviat -és una facilitat massa convenient i genèrica com per ignorar-la-). Però tot i així, era evident que resultava una tasca excessiva per mirar d’afrontar-la des de cathalaunia.org, de manera que el tema s’arxivà en l’apartat dels: ‘Estaria bé‘.

Paral·lelament, el corpus i el signari de cathalaunia van evolucionar per fer-lo encara més semblant a les epigrafies originals, i quan el nombre de signes arribà als 188 (l’octubre del mes passat) es feu un recompte de covariacions (variacions d’un mateix signe en una mateixa epigrafia) on els resultats mostraven que la variabilitat de l’escriptura ultrapassava la proposta de dos signes per ‘caràcter’ que es fa modernament, i que en comptes d’uns cinquanta signes, calia contemplar-ne una forquilla entre 85 i 96. Resultats que sorprengueren a uns quants experts[5], reacció que de retruc, propicià la incorporació dels esquemes o calcs, de les epigrafies originals fetes per els estudiosos per poder verificar públicament la correcció de la transcripció presentada en el corpus Iberika i el seu grau de semblança. En fer això, indirectament, ja s’estava complint el primer requisit per poder diferenciar els glifs originals un a un: tenir una imatge de l’original per a cada entrada epigràfica.

Aquesta tasca de verificació ha fet augmentar fins a 207 el nombre de glifs necessaris (i hi han en cartera encara més incorporacions, tot i que ja d’abast quantitatiu molt limitat) quan farà unes poques setmanes, es plantejà la conveniència de rescatar aquella idea de la paleografia ibèrica digital de la carpeta dels ‘Estaria bé‘ per si seria convenient fer-la realitat. No, potser, per fer-ho amb les mateixes eines de DigiPal, que generarien un projecte diferenciat del de cathalaunia.org i de difícil integració (tan tècnica com estructural), sinó amb eines pròpies, ja nativament adaptades al context ibèric. En els projectes Pal, cal anar marcant a mà la posició de cada un dels caràcters, però en el cas del corpus Iberika tenim ja la transcripció feta… En imatges ho explicarem més ràpid.

Agafem una epigrafia, per exemple, la I00836, el seu esquema original dels Monumenta Linguarum Hispanicarum és:

I00836, esquema en els MLH.

I la transcripció del corpus Iberika és:

I00386 transcripció.

Només falta convertir-la a:

I00836 transcripció adaptada a l’original.

I tindrem les posicions de cada glif original (inclosa la seva rotació, inversió i/o redimensionament[6]). És a partir d’aquesta informació que en la pàgina de cada un dels glifs, podem anar mostrant l’aspecte original (en els esquemes) que tenen  en cada una de les epigrafies del corpus. Només cal dedicació, les eines ja estan plenament operatives. Això és el que ha cristal·litzat aquesta setmana, una idea que venia de feia un any i mig i que gairebé inesperadament ha trobat la seva expressió programàtica adient[7] per mirar de millorar encara més els continguts del corpus Iberika. A partir d’ara, i a mida que es vagin incorporant les dades que falten, es podrà avaluar fàcilment l’ús de cada un dels signes de l’ibèric nord-oriental (bé, millor dir: cum grano salis per lo comentat abans sobre la fiabilitat de les dades). És només un començament certament, no s’ha processat ni un 1% de les dades, però ves per on, ara el corpus també incorpora informació paleogràfica, i això, sí que no estava previst…!

Encara més feina a fer…

– Actualització 2017-V-9 –

El mètode d’anotació descrit en aquest apunt ha acabat prenent forma d’article: Vilaseca i Corbera, Joan : 2017 : “Epigrafia ibèrica digital” , qui vulgui la formalitat, allà ho trobarà.

 


Notes

  • [1] Preval el criteri de: sempre que es pugui s’ha de presentar la informació disponible.
  • [2] L’exemple més clar potser sigui el dels documents altmedivals del Fons Cathalaunia. On es presenta una versió del text lo prou fidel als originals com per permetre una avaluació eficaç, però sense pretendre en cap cas substituir les edicions crítiques dels texts, imprescindibles si es vol anar més al detall, i per les quals es procura aportar com a mínim un enllaç a una edició en línia si es coneix i en tot cas, una o més referències a les seves entrades bibliogràfiques corresponents.
  • [3] Observis que s’evita incorporar explícitament les coordenades en el web cathalaunia.org. El motiu és metodològic: sempre que sigui possible es mira d’evitar duplicar dades i es prefereix cercar referències en fonts d’autoritat externes per minimitzar la possibilitat de presentar dades errònies.
  • [4] És una rara satisfacció poder constatar que hi han investigadors en Humanitats que cobren per fer el que els hi agrada, tal i com hauria de ser (el retorn de la despesa en investigació cultural esta mes que ben estudiada). Per quan veurem això per els que investiguen la Cultura Catalana? Una Catalunya independent té objectivament el potencial de ser un referent en aquests àmbits, i el contrast amb la indigència induïda actual, és sagnant…
  • [5] I es poden continuar estranyant, ja que un nou recompte fet amb el signari de 207 glifs, ha confirmat que la variabilitat es manté, amb exemples documentats de tres i quatre variants d’un mateix ‘caràcter’ en una mateixa epigrafia.
  • [6] El terme matemàtic és transformacions afins, Tema que per experiència personal no puc dissociar del de la compressió fractal. Una de les fites de la computació de  finals del segle XX  que encara no ha tingut l’impacte esperable en la societat (es va demostrar que la descripció d’una imatge a partir de transformacions d’ella mateixa equivalia a la pròpia imatge, dir altrament, per enviar una imatge només cal enviar les seves transformacions, la seva ‘fórmula fractal’, i per tant, l’estalvi s’ample de banda resulta brutal (no però el cost computacional, especialment en la descompressió, la termodinàmica és la que és). No és un cas únic, hi han un grapat de tècniques de processament ‘revolucionàries’ que per un motiu o un altre encara no han tingut el ressò que era d’esperar.
  • [7] Evitem deliberadament entrar en el detall de la seva realització, que certament és molt més complex i punyetero del que sembla, aquest bloc tampoc és un lloc adient on parlar a fons de temes estrictament programàtics.
Anuncis
Aquesta entrada s'ha publicat en Ainoa Castro, Bibliografia, caligrafia, Carme J Huertas, cathlaunia.org, compressió fractal, corpus Iberika, covariacions, covariants, DigiPal, esquemes, Fons Cathalaunia, glifs, Iberika, ibers.cat, Littera Visigothica, Paleografia, Paleografia Digital, Paleografia Digital Ibèrica, Signari ibèric, transformaciós afins, VisigothicPal i etiquetada amb , , , , , , , , , , , , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s