2021-juny a cathalaunia.org

Marxa el juny i cal tornar a fer balanç mensual. A cathalaunia.org juny ha estat un mes intens i molt treballat. El focus ha continuat fixat en l’epigrafia ibèrica i en concret en la segmentació lèxica automatitzada. Activitat en bona mesura propiciada per l’assoliment de l’equinocci; a partir d’ara i fins que arribi l’hivern anirem de baixada a l’hemisferi nord…

Aquest bloc ha tingut una entrada nova on explicar el tema del tractament lèxic i les novetats que això ha comportat per el Corpus Ibèrika (segmentació inclosa) i una proposta de funcionament dels sil·làbics desprès de consonants per expandir el suposat mapa sonor de l’ibèric. Una entrada, que a més, ha rebut una actualització abans de tancar el mes per comentar el nou mètode de segmentació incorporat.

La Secció Ibèrica i Romana és doncs on s’han concentrat els canvis.

  1. S’ha afegit un nou mètode de segmentació lèxica automatitzada.
  2. S’han incorporat unes desenes d’entrades al Lèxic Manual (per completar la llista d’afixes descrits en la literatura).
  3. També s’ha creat una entrada dedicada als Ploms d’Arles. Un testimoni que ha semblat prou curiós com per donar-ne si més no, unes mínimes referències.
  4. A més, els responsables de la Base de dades Hesperia han incorporat les datacions que faltaven en les epigrafies d’Enserune, i ja consten a Ibèrika. Un pas més per completar les dades bàsiques. A la que posin al dia els continguts d’Azaila, ja no quedaran grans bosses d’epigrafies sense datació específica i/o referència web externa.

La Secció de l’Alta Edat Mitjana, tot i no tenir activitat significativa, sí que requereix un comentari sobre la presentació dels primers resultats del projecte CATCAR que es feu el passat dia disset a l’IEC. Comentari que s’ha de fer doncs, des de la primera persona.

L’avís arribà tres dies abans de l’acte adjuntant l’adreça per una trobada telemàtica a Zoom i un codi d’accés per fer-ne el seguiment per Internet (que a l’hora de la veritat no calia). L’acte començà amb puntualitat mediterrània (o sigui, un quart d’hora tard) i atès que està penjat a Internet, ens estalviarem la seva descripció (la versió penjada corregeix els petits problemes de so que hi hagueren, i arrodoneix un parell de talls en sec que es donaren amb sengles mutis i fossos en negre). Es presentaren dues menes de projectes: unes aplicacions per mòbil dedicades a la quitxalla i la base de dades CATCAR.  Sobre les iniciatives dedicades a la pedagogia infantil, ens estalviarem el comentari (en Bertran Russell ja ho va deixar prou clar), però sí cal fer cinc cèntims del que es va mostrar en la base de dades.

D’entrada, tot i presentar-ho com d’accés obert, el fet és que de moment no ho és. Preguntats, els responsables han dit posteriorment que encara està verificant-se i que ja es farà públic quan arribi el moment. La veritat, és que veient que durant la presentació no es feia esment en cap moment a com accedir-hi, ja es veia a venir. És un patró recurrent: la informació primer circula entre un cercle determinat d’interessats, i la resta, si li arriba, serà en segon terme (una concepció més pròpia dels temps de Gutenberg que de Turing, però molt estimada en el món funcionarial acadèmic).

La presentació, assajada i molt clara, estigué feta des de la informàtica i no des de la història. S’explicà que s’havia dissenyat una base de dades a partir dels continguts dels poc més de 5.000 documents dels Catalunya Carolíngia. I què s’hi recull? Doncs per el que sembla, les informacions que alguns experts han cregut que seria d’interès. L’èmfasi de la presentació girà al voltant de: bens i llocs, i com es poden interrelacionar i lo bé que va poder veure sobre el mapa les vinyes esmentades en els pergamins gracies a haver geolocalitzat tots i cada un dels topònims; però també de persones, i com es pot cercar per exemple per sexe i constatar que hi consten prop de 2.000 dones. En realitat, s’estaven confonent esments i individus i geolocalització de viles i esglésies amb les de les vinyes. Un discurs no gaire tècnic, més aviat dirigit a un públic no especialitzat.

Ja n’hem parlat altres vegades dels diferents models de presentació d’informació històrica a Internet i en particular del model de base de dades. Un model de relació cost/benefici força bo, però rígid. Si el que busques hi és, perfecte, sinó, res a fer-hi.  I és que el que no va haver-hi en tota la presentació, fou cap mena d’enfocament estratègic, tret de l’institucional, amb el rol a jugar per els Arxius Departamentals dels Pirineus Orientalsoh dear! – 🙂

Per exemple, l’accés als texts dels documents només es va mostrar reproduint les pàgines dels Catalunya Carolíngia. Espero que la versió final permeti copiar i enganxar els texts dels volums, perquè sinó, perdrà bona part de la seva utilitat. De fet, si l’objectiu primari és facilitar l’estudi de l’alta edat mitjana catalana, la manera més fàcil i efectiva seria penjar els PDFs dels volums en obert. Una acció  de cost nul (avui en dia per existir en paper, abans has d’existir en PDF) que tindria un impacte real i facilitaria la vida a tots els estudiosos (en realitat, els ‘professionals’ fan servir unes màquines anomenades fotocopiadores, presents en les respectives ‘institucions’, i es fan la seva pròpia versió en PDF per el que he pogut veure). Suposo que l’únic impediment per posar obres de referència en obert és el crematístic, però sincerament, si és així, és el negoci del Robert amb les cabres. Seria molt més eficient trobar un ‘pagano’ que abonés d’entrada els teòrics beneficis als autors de les obres (tot plegat poc estipendi, les tirades són petites) i posar a disposició del públic les obres així que estiguessin fetes (altres institucions ja fa temps que ho fan). Si més no, és el que es faria si la Cultura fos la prioritat.

Un altre miratge freqüent. Les bases de dades es diu que es posen en obert, però resulta que les dades només es poden accedir per formularis de cerca, o sigui, a pessigades. Si realment es vol la difusió, i els continguts són per el públic, al costat de les cerques caldria facilitar també la descàrrega de totes les dades (per exemple en formats CSV o XML convenientment compactats). De nou, el cost és mínim i l’efecte màxim. Això sí, perds la visibilitat, els clics i les visites (per cert, en la presentació es digué que es fan servir capes d’informació geogràfica de Google: hi ha alternatives de codi obert que evitarien que una empresa particular s’aprofiti d’una iniciativa pagada amb fons públics – el president de l’IEC explicà inicialment les dificultats estructurals de finançament dels treballs de l’entitat -).

Tampoc sembla que hi hagi gaire estratègia per el que fa a la publicació de les dades. Fa de mal dir, perquè la demostració fou breu i superficial, però no es veié per enlloc el principi de: ‘una URI per cada dada’, i sense això no hi pot haver-hi interconnectivitat fàcil. De fet, en la presentació es digué explícitament que el projecte naixia perquè si no ho feien ells algú altra ho faria…(!?) Mostrant a més de la manca d’estratègia, un desconeixement sagnant del camp que representa que treballen tot ignorant obertament el fet que hi ha gent que fa un bon grapat d’anys anys que procura que l’alta edat mitjana estigui present a Internet (el Fons Cathalaunia, per la part que ens toca, du més de 10 anys treballant-hi, i no és pas una iniciativa única en l’àmbit europeu).

L’altre gran absent en la presentació fou la Prosopografia. No semblà pas que hi hagués un plantejament teòric previ sobre la natura del projecte. És de suposar que historiadors experts hauran definit els conjunts de dades a registrar (les ‘fitxes’ o ‘taules’ de les bases de dades), però això és tot, en cap cas es parlà de la problemàtica prosopogràfica. És un defecte habitual, pocs projectes de ‘digitalització’ reflexionen sobre la seva natura i funció. L’execució esgota l’activitat i la teoria és absent. A més, la divisió entre historiadors/experts i informàtics no fa sinó empitjorar la qualitat del producte. L’historiador, desconeixent les possibilitats de la tècnica, com a molt, imagina el que a ell li agradaria trobar-hi i es dedica a recollir tota mena de detalls que en la seva opinió són molt importants (altra cosa serà el que n’opinin els futurs usuaris del sistema). El programador, es limitarà a intentar donar forma a les peticions dels historiadors i en el cas de projectes de bases de dades, guiarà el disseny de les dades, pensant en l’ús que l’historiador diu que cal que tinguin (segons la seva expertesa).

Desafortunadament, ni el programador ni l’historiador acostumen a tenir experiència en prosopografia, i cauen repetidament en una sèrie de defectes de disseny nascuts de la manca de comprensió de la disciplina. La Prosopografia neix de la conjunció de dues realitats (és un tema recurrent d’aquest bloc). Una, estàtica: els continguts dels documents, les seves literalitats. I una de dinàmica: la mirada, la pregunta que l’historiador vol fer als texts, sempre canviant i filla inevitablement del seu context particular. És la natura de la bèstia, la Història no és sols l’estudi dels fets passats (una noció filla d’una imago mundi moderna), sinó també de la seva evolució en el record (aspectes sovint indestriables). És per això que qualsevol projecte prosopogràfic amb voluntat de ser útil al llarg del temps, ha de operar a dos nivells diferents. Un, donant les eines de cerca dels texts més simples i lliures de dependències possibles per mirar d’incrementar la probabilitat de poder satisfer les futures demandes, que inevitablement seran imprevistes. I dos, bastint les dades de forma incremental, entenent que les necessitats d’un moment donat poden passar per recollir una mena de dades, però que en el futur és més que probable que calgui recollir-ne unes altres, i que per tant, cal evitar especialitzacions que comprometin l’estructura bàsica del sistema (quant més especialitzat el tractament, menys adaptable és). Pocs projectes s’arriben a fer aquesta mena de reflexions i acaben construint castells de cartes, tan bonics com efímers…

Tampoc a nivell històric es manifestà cap proposta estratègia. De fet, en limitar-se als continguts dels Catalunya Carolíngia, en la demostració, al mostrar sobre el mapa els bisbats altmedievals, les fronteres més enllà dels Pirineus quedaven obertes…!?. En realitat la ‘Catalunya carolíngia’ no era sinó la Gòtia, (el sud de la Gòtia per ser exactes), i si no s’estudia en el seu conjunt, el que es fa, és repetir un error sistèmic secular.

El gener passat, la notícia del projecte CATCAR es rebé en aquest bloc amb un: Al·leluia! La possibilitat d’una nova font d’autoritat que poder referenciar en el Fons Cathalaunia és sempre una bona nova; més, si és de casa. Lamentablement, el – poc – que s’ha mostrat fins ara no convida a ser tan optimista, de fet, hores d’ara no se sap ni si es podran enllaçar les dades de CATCAR. Esperem que quan el projecte estigui a l’abast del públic podem fer-ne una avaluació com cal i que aquesta pugui ser millor. Res agradaria més.

La Bibliografia, també ha tingut un paper en l’activitat del mes. Un petit allau inesperat de noves lectures ha tornat a omplir la cua dels perllegir, de manera que tot i la lectura feta, el mes marxa deixant-ne un escreix per digerir.

Per no variar, llistem les novetats del mes per seccions[1].

Secció Bibliografia de l’Època Prehistòrica

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta un total de 32.296 pàgines consultables.

 

Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.

 

Aquesta entrada s'ha publicat en Arxius Departamentals dels Pirineus Orientals, Azaila, bases de dades, BDHesperia, Bibliografia, Catalunya Carolíngia, CATCAR, cathalaunia.org, Corpus Ibèrika, CSV, Enserune, fonologia ibèrica, Fons Cathalaunia, Gòtia, IEC, Lèxic ibèric, PDF, Ploms d'Arles, prosopografia, segmentació textual, xml i etiquetada amb , , , , , , , , , , , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out /  Canvia )

Google photo

Esteu comentant fent servir el compte Google. Log Out /  Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out /  Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out /  Canvia )

S'està connectant a %s

Aquest lloc utilitza Akismet per reduir els comentaris brossa. Apreneu com es processen les dades dels comentaris.