Prosopografia altmedieval pràctica.

En el darrer apunt sobre models prosopogràfics ens havia quedat pendent comentar com es consulten les dades en el recull del Fons Cathalaunia. Això és el que farem en aquest apunt, i ho farem, anant de lo més general a lo més específic.

La manera més habitual d’accedir als continguts del web, la estadística, revela que ve de consultes individuals, majoritàriament adreçades a través dels grans cercadors d’Internet, com per altra banda, era ja previst de vell antuvi.

Deixant però, l’usuari circumstancial, en primer lloc, cal parlar dels mecanismes de consulta global en tot el web cathalaunia.org, que és quelcom més ampli que el Fons Cathalaunia.

Cerca Global

El web disposa d’una facilitat de cerca interna, que es troba en la cantonada superior-dreta de totes les pàgines:

ccat1És una facilitat de cerca en el texts de les pàgines del wiki, que ignora majúscules o minúscules, i que repassa totes les pàgines del web. Més enllà d’entrar un terme i mirar si existeix, aquesta cerca permet tot un grapat d’altres opcions, com cercar en un conjunt determinat de pàgines, cercar més d’un terme, etc, etc), Les instruccions per realitzar aquestes cerques més especialitzades, amb un quants exemples específics,  es troben en la pròpia pàgina de cercar (accessible des de l’enllaç ‘Cercar‘ de cada pàgina):

ccat2Des d’aquesta mateix pàgina, a més, es disposa d’una pàgina de Cerca Avançada, per realitzar, com l’anterior,  cerques en tot el web, però a partir d’expressions regulars. Aquí cal fer un petit incís per explicar què són les expressions regulars, ja que es tracta d’un tòpic molt familiars per els programadors, però molt desconegut per la gran majoria d’usuaris.

Quan es fa una cerca, el text que s’introdueix, indica el fragment textual a cercar. Una expressió regular és una notació especialitzada en la què certs caràcters no alfanumèrics tenen funcions especialitzades. No ens allargarem, ja que en tornarem a parlar un xic més endavant. Un exemple ho pot fer fàcilment entenedor. Si entro ‘girona’, indico que estic cercant pàgines on figuri aquesta seqüència de lletres, però si entro ‘g[ie]rona’, estic indicant que vull les pàgines on figuren ‘girona’ o ‘gerona’; és a dir, els caràcters que es posen entre ‘[]’, indiquen possibles valors per una mateixa lletra. Com els caràcters ‘[‘ i ‘]’, la notació, especifica tot un grapat d’altres usos especialitzats (per exemple, ‘.’ per ‘qualsevol caràcter’, \’ per indicar que el següent caràcter ha de ser entès literalment – per poder cercar també caràcters especialitzats -, etc, etc). No és el cas, de donar aquí l’especificació complerta, sols un apunt per entendre el principi.

El format dels resultats d’aquesta cerca avançada, és menys cuidat que els de la cerca ‘normal’, però és plenament funcional. Encara hi han força coses a polir en el web…

Ara bé, més enllà de les cerques globals, en tot el web, i centrant-nos en els aspectes estrictament prosopogràfics, és a dir, en les dades del Fons Cathalaunia, una primera facilitat que cal esmentar és l’exportació de dades en format XML.

Exportació en format XML

Aquesta funcionalitat ja ha estat comentada en aquest bloc altres vegades, i per tant, no repetirem els detalls, sols remarcar la idoneïtat d’aquest mètode per la recerca científica, tota vegada que genera un fitxer amb conjunt de dades autònom, sense dependències externes – i sense seccions com comentaris o agraïments -, sobre els que l’investigador pot realitzar les mesures i els estudis desitjats. És a dir, que si un altre investigador vol reproduir o verificar els resultats independentment, n’hi ha prou amb facilitar-li el fitxer XML original. És, per tant, un mètode que assegura la repetibilitat de l’experiment.

Tal va ser, per exemple, el mètode emprat en la confecció de la sèrie d’apunts – 10 en total – en aquest bloc sobre visualitzacions de dades prosopogràfiques de la Gòtia del segle X. El sistema permet exportar tota mena de dades, des de ítems individuals (un particular, un lloc, etc) a conjunts (tots els llocs, tots els documents d’uns anys, etc) i fins i tot ‘universos documentals’ (totes les dades relacionades documentalment amb un cert ítem o conjunt arbitrari d’ítems). Ara bé, més enllà de l’exportació de dades, i la cerca global, el Fons Cathalaunia disposa d’un conjunt de facilitats específiques per fer consultes especialitzades en línia. Per disseny, es van agrupar totes en una mateixa pàgina: el Selector.

El Selector

ccat4Un primer comentari general. En aquesta pàgina – com en altres del web – apareixen paraules en negreta sense cap motiu aparent. Es tracta d’un recurs visual per indicar que posant el cursor al damunt, es mostra una indicació d’ajuda. En la part superior de la pàgina tenim les opcions de cerca més habituals agrupades en un mateix formulari i utilitzant unes mateixes convencions; són aquestes les que cal mirar d’explicar.

Les dades del Fons Cathalaunia, s’estructuren en conjunts d’ítems de diverses menes, cada un d’ells, numerat des de 0, és a dir, que cada ítem té un codi propi, però les dades que contenen, són qualsevol cosa menys números, quantitats matemàtiques, ben al contrari, la immensa majoria d’informacions són estrictament textuals, polimòrfiques, i formalment, extremadament variades. Pensem per exemple amb com ho fem per mirar de localitzar un individuu en concret. El seu nom serà llatí amb gaire bé tota seguretat, però, sota quina forma? Guillelmi, Uuilelmus, Wilheim, Guillem?

En part per adreçar aquesta problemàtica, es va crear la secció d’Antroponímia, per poder agrupar – mecànicament – les identitats personals del Fons per ‘nom’. Però el problema persisteix, ja que molts dels noms no tenen traducció ‘moderna’ i per tant, el problema de localitzar quina grafia cal emprar per indicar un nom determinat entre els més de 4.000 que hi ha, és del tot similar (tot just el mes passat comentàvem que s’havia afegit una facilitat per accedir a les dades de manera directa, des de la mateixa URL, coses com: http://cathalaunia.org/Llocs/Barcelona, o http://cathalaunia.org/Noms/Ramon, però això sols cobreix els ítems més familiars).

La solució donada a la problemàtica de la variabilitat formal de les denominacions altmedievals, ha estat emprar, com en la Cerca Avançada, expressions regulars – amb alguns afegitons per fer-les un xic més fàcils -. La pròpia pàgina mostra les instruccions bàsiques.

ccat5 De l’explicació donada abans sobre les expressions regulars, sí cal destacar, per ser molt i molt emprada, l’afegitó de l’ús del caràcter ‘@’ per indicar un conjunt arbitrari de zero o més caràcters alfanumèrics), i la especificació entre cometes ‘”‘, per indicar paraula complerta. Aquesta mateixa mecànica es pot fer servir per cercar entre diferents menes d’ítems, concretament: Persones, Noms, Titulacions, Llocs i Documents.

ccat6En l’exemple anterior, si estem cercant una persona de nom Guillem i no sabem el seu codi numèric, podríem entrar, pensant en les diferents formes sota les que un Guillem pot aparèixer en els texts: [UVWG]@l@l@m – que traduït en paraules seria: ‘cerca identitats amb un nom que comenci per una U o una V o una W o una G, seguida de qualsevol cosa, seguit d’una l, seguit de qualsevol cosa, seguit d’una l, seguit de qualsevol cosa, seguit d’una m‘, que de fet, ve a resumir l’estructura consonàntica del mot, ja que en el cas de nom Guillem és força estable. Ja sols falta triar ‘De Persones‘ en la llista de menes d’ítems i prémer la tecla Enter o polsar el botó Cerca Codis. Cal remarcar que per defecte, en aquesta cerca, les majúscules es diferencien de les minúscules, a diferència de la Cerca Global, tota vegada que per convenció, els noms propis – tret dels gentilicis – s’escriuen amb la primera lletra en majúscula i la resta en minúscules. Fet molt adient, ja que permet fàcilment cercar ítems per el començament del seu nom; amb tot, si es marca la casella Maj==Min, llavors la cerca ignorarà la caixa en la comparació.

Immediatament sota aquest formulari es troba una Cerca per Lemes, que és una eina dissenyada per a les tasques d’identificació dels figurants d’un text en el moment de la seva introducció en el Fons; en el seu dia ja en vàrem parlar. S’aparta de l’anterior, en què espera la introducció d’una sèrie de noms llatins (els figurants en el nou text a incorporar), literalment, sense notació d’expressió regular, opcionalment juntament amb uns codis numèrics toponímics (els topònims del nou document coneguts d’antuvi) i genera per una banda, una llista amb totes les identitats amb un nom compatible amb algun dels especificats, i a partir d’aquí, cerca en quins documents es donen dos o més de les identitats, restringint el conjunt documental resultant als que també presentin algun del codis toponímics si així s’hagués especificat. Sona millor del que realment és, ja que per detectar tots els ‘Esteves’, a partir d’un ‘Stephanus’, la metodologia emprada és una simplificació mecànica amb limitada efectivitat (ni la Precisió ni el Record són especialment  elevats – o el que és el mateix, ni es detecten tots els Esteves, ni tots els trobats són Esteves -); amb tot, és una eina molt útil en les primeres fases del procés d’identificació.

El resultat, en tots els casos, serà una llista d’ítems desglossats i amb els seus codis numèrics corresponents, ja siguin llocs, identitats, documents o noms.

A partir d’aquí, comencen els creuaments. El Fons Cathalaunia, està estructurat al voltant de tres menes d’ítems bàsics: Documents, Llocs, i Gents. Els Documents són la font original d’on les identitats i els llocs treuen les dades, de manera que donat un conjunt d’un o més ítems d’una mena, que és el que la cerca anterior ens ha donat, podem fer-nos tota una sèrie de preguntes respecte al seu encreuament amb les altres dues menes de dades. Si tenim un conjunt de codis d’identitats, en quins documents apareixen? Amb quins llocs tenen relació? La part central de la pàgina serveix per això i consta de tres seccions, una per cada mena de dades, que són estructuralment molt semblants, ja que totes elles, el que esperen, no és un text, o una expressió regular, sinó un o més codis numèrics – que és el que la cerca anterior ens ha proporcionat, si no els sabíem de vell antuvi – separats per espais,

Com abans, la capçalera d’aquesta part mostra un petit ajut.

ccat7I per cada mena de dades, podem cercar un mateix conjunt de relacions amb les altres menes de dades, és a dir, quina mena de llistat volem calcular; de nou, una ajuda ens ho recorda.

ccat11Com que podem especificar un conjunt arbitrari d’un o més codis d’ítems, les possibilitats són vàries. Podem simplement llistar els elements comuns entre totes ells, o potser sols els que figuren en més d’un. Per a cada mena de dades tenim doncs una sèrie d’opcions disponibles. Si tenim un conjunt de codis de Documents, podem llistar:

ccat12Quina Gent hi figura, o quins Llocs, o  potser quines persones apareixen en més d’un document, o el mateix per el Llocs, o quines persones, o llocs,  apareixen en tots ells.

El mateix si el que tenim és un conjunt de codis de Gent.

ccat13Els diferents creuaments amb Documents i Llocs, amb l’afegit de la possibilitat de llistar les Relacions Documentals (les altres identitats del documents on apareixen esmentades) , ja sia compartides o totals.

I finalment si tenim un conjunt de codis de Llocs.

ccat8Podem generar els encreuaments semblants amb Documents i Gents.

Finalment, en aquesta secció, es disposa una facilitat per trobar Documents o Persones a partir d’un, o més, anys.

ccat9Les opcions permeten trobar els documents entre un marge o un conjunt indeterminat d’anys,  (per llistar els documents de cada any, el Fons ja disposa d’una pàgina pròpia,  Any a Any). Així com les identitats que representa que estaven en vida en aquestes dates, o bé ja eren traspassades, o totes elles conjuntament.

Finalment,en el fons del Selector, hi han tota una mena de llistats adhoc sota l’epígraf Valors definits, que bàsicament permeten extreure informacions que amb les opcions anteriors no són localitzables. Esmentem les més habituals.

ccat10Llistar els diferents anys d’encarnació o d’era hispànica, i per cada un, especificar els documents que els presenten. Llistar les localitzacions genèriques dels Documents, amb el seu desglòs. Desplegar totes i cada una de les tipologies toponímiques emprades en el Fons, i per cada una, els llocs on es documenten. El mateix per el que fa a les titulacions de les persones registrades en el Fons i les identitats que les utilitzaren.

Aquesta secció, permet respondre a una dificultat pròpia de tota codificació textual. En el cas per exemple de les tipologies toponímiques, el dubte és: quina forma utilitzem per indicar-les?  El terme llatí o una traducció? Si diem el primer, hi han casos que de tan habituals sembla poc hàbil, pensem amb ‘bisbat‘ o ‘comtat‘, però si diem sols traduccions és encara pitjor, ja que hi han termes que fins i tot han desaparegut; quelcom similar passa amb les titulacions dels personatges. La resposta en el cas del Fons Cathalaunia, va estar, ja de vell antuvi, una barreja: els més fàcils, traduïts, però la resta, en forma llatina[1];. Això, però, comporta el problema de saber quines són les formes concretes emprades – com passa en tota codificació -. Hi han pagi o pagus? preveres o presbiteri?. Aquests llistats són la resposta, ja que els enumeren tots, i posats a fer, n’especifiquen els ítems corresponents a cada un d’ells.

I fins aquí la descripció del conjunt d’eines de consulta que el Fons Cathalaunia, i el web cathalaunia.org actualment incorporen. No és un tema tancat – tot el web està obert a replantejament constant -, la idea és anar adaptant l’eina a les necessitats. En això estem.

 

 


Notes

Aquesta entrada s'ha publicat en antroponímia, cathalaunia.org, Cerca, cerca avançada, cerca lematitzada, expressions regulars, Fons Cathalaunia, prosopografia, Relacions documentals, Selector, xml i etiquetada amb , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s