2017-març a cathalaunia.org

Març ha estat un mes ibèricament pràctic, vull dir, pràcticament ibèric: vaja, pràctic i ibèric. En teoria, la idea era dedicar la primera meitat del mes a tancar el treball en el corpus Iberika i poder tornar a la tasca del Fons Cathalaunia ; en la pràctica, s’ha cruspit tot el mes i més que en vol.  Tampoc es tractava de tancar-ho del tot, només deixar les millores del corpus en un estat lo prou correcte com per no sentir el rossec de la feina pendent; doncs ni això. En teoria no s’havia de teoritzar sobre cap més aspecte de l’escriptura ibèrica, en la pràctica s’ha estat bona part del mes rumiant heurismes i procediments pràctics per definir el mapa de caràcters de l’ibèric nord-oriental algorítmicament. Anem al desglòs.

La secció Ibèrica i Romana ha vist elevar el percentatge d’entrades amb dibuix o esquema de la inscripció original fins el 85%. Com ja es va comentar, la idea és incorporar l’aspecte del text original per poder verificar la correcció (o si es vol , el grau de semblança) de la transcripció informatitzada que es presenta. És com una ‘cita’ però en gràfic: en comptes de dir que ‘tal diu tal a tal lloc’, aquí es mostra que ‘qual ha dibuixat això a tal lloc’ i/o que ‘tal qual ho ha fet altrament a tal altre’, tota vegada que cada imatge va enllaçada a l’entrada bibliogràfica corresponent a l’obra o article d’on prové. No deixa de ser el mateix que es fa en tot el web, donar dades, amb enllaços a fonts d’autoritat externes (bibliografies, enciclopèdies, museus, etc).

Aquesta tasca de verificació ha propiciat l’expansió del signari per tal de fer-lo encara més proper als originals del que ja era, i actualment presenta fins a 207 glifs diferents. Tampoc és l’estadi final, ja que hi han millores encara en cartera, però cada cop són de menor envergadura; per exemple: hi han més de seixanta glifs candidats a entrar, (la majoria detectats només en una o dues entrades), també n’hi han 3 dels 207 que finalment no s’han emprat, a més, hi ha encara un 15% del corpus per verificar i potser aparegui algun glif nou més, etc, etc. A la espera de definir quina serà la nova versió del signari, el que sí es fa en tot cas, és proporcionar la font iber.ttf amb l’estadi actual. A la que l’acumulació de canvis aconselli fer una nova revisió del signari també es proporcionarà una nova font (les versions són compatibles entre elles, ja que els canvis bàsicament, o afegeixen codis nous o en redefineixen de no emprats i per tant, són compatibles entre sí.

I per acabar-ho de rematar (o més ben dit, d’iberitzar) els amics de l’Institut d’Estudis Ibers de Terrassa van tenir l’amabilitat de programar aquest mes una xerrada en el seu curset anual sobre iberisme on es va poder comentar el funcionament de les eines de cerca del corpus ibèric de cathalaunia. Tenint en compte que la idea de fer el corpus nasqué precisament allí, fa anys, assistint a una xerrada de na Carme J. Huertas sobre codificació del signari ibèric, era una cita inevitable. A més, és un rar plaer, avui en dia poder gaudir d’un ambient de gent curiosa, participativa, amant de la temàtica i de ment oberta. Havent-hi anat unes quantes vegades (la gran majoria d’oient), no sabria dir si xalen més el ponents o els oients…

Aquest bloc, ha estat on s’ha visualitzat bona part de la tasca teorico-pràctica feta aquest mes.

  1. El fet d’haver ampliat el signari ha propiciat repetir el recompte de co-variants en una mateixa epigrafia que s’havia fet fa uns mesos (i que de fet, fou el detonant dels canvis haguts des de llavors). En el seu moment, es va constatar que la quantitat de variants d’un mateix caràcter era molt superior al que el desxiframent actual proposa (amb un màxim de dues variants) i es recomptaven casos de tres i fins quatre variants d’un mateix caràcter en una mateixa epigrafia. La reacció dels experts consultats fou de sorpresa, fins el punt de considerar-ho impossible i arribar a dir que havien de ser errors del corpus…! Com a resposta i per tallar d’arrel tota controvèrsia, s’incorporaren els esquemes de cada epigrafia i així tothom podrà verificar el grau de proximitat amb l’original. Doncs bé, un cop aproximat encara més a l’original i verificat un 85% del corpus, s’ha tornat a programar un recompte de covariants, i la magnitud de la variabilitat es manté. Els resultats del recompte s’han incorporat en una actualització al fons de l’apunt original, amb un pdf on poder consultar en línia cada un dels 397 casos d’entrades epigràfiques amb més d’una variant d’un mateix caràcter (286, si eliminem covariàncies ‘estétiques’), i s’ha fet notar que per el que fa a la manera de diferenciar gràficament les variants, l’allargament o adició d’un traç vertical inferior és quantitativament força més rellevant fins i tot que la marca dels signes del signari dual (l’adició d’un traç vertical central).
  2. El mes passat, en aquest bloc s’havia comentat un primer intent de classificació automàtica dels glifs ibèrics, però amb resultats poc satisfactoris, de manera que el que havia de servir per detectar les agrupacions de glifs, es reduí a un mètode per mesurar quantitativament l’abast de l’evidència de les agrupacions de glifs que proposen els filòlegs (un suport francament baix, tot sigui dit).
    En teoria, l’experiment havia fallat, en la pràctica, això esperonà més la curiositat per entendre els motius de tal fallada, i això ha propiciat una sèrie d’experiments per mirar d’entendre millor el problema i afinar les eines de mesura, de manera que els resultats han acabat convertint l’apunt del mes passat en el primer d’una mini-sèrie de tres.
    En el segon s’han comentat les proves que s’anaven fent per millorar el tractament del problema de la dispersió de les dades (el corpus ibèric és petit però amb molts signes diferents i una casuística molt sorollosa) a partir d’emprar el català (una escriptura ben coneguda) com a camp de proves, i posteriorment es desenvolupà una simplificació de les mesures de segmentació (modularitat) per tal de fer-les de més fàcil lectura.
    En el tercer i final, els mètodes aquests s’han aplicat a l’ibèric, i s’ha pogut contrastar les bondats del sistema (a grosso modo les vocals i consonants es detecten raonablement bé), i les seves limitacions (els sil·làbics no tant). Però més enllà de ser una via d’anàlisi interessant, el fet, és que fins i tot una mesura no del tot reeixida permet plantejar algunes interpretacions alternatives a uns quants glifs. Recordem-ho, fet a partir de mesures estrictament quantitatives, amb una informació del domini mínima (bàsicament només saber quin signes són separadors o metrològics).

La Bibliografia, amb tanta pràctica teòrica i tanta teoria practificada tampoc ha sortit ben parada. La lectura ha estat poca, pràcticament testimonial, (encara que en teoria, molt interessant, ja en parlarem en el seu moment, si Déu vol). La cua de ‘per llegir’ encara està en els 342 títols en escriure això. Terrible…

Com és habitual, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Alta Edat Mitjana:

A fi de mes, cathalaunia.org presenta 26.704 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.
Advertisements
Aquesta entrada s'ha publicat en agrupacions de glifs, Bibliografia, Carme J Huertas, cathlaunia.org, corpus Iberika, covariants, esquemes, estadística, Fons Cathalaunia, iber.ttf, Iberika, IEI, Signari ibèric, Xarxes i etiquetada amb , , , , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s