Els 100 signes de l’ibèric nord-oriental.

Ara farà poc més de quatre anys que en aquest bloc ens fèiem ressò de l’apertura d’una subsecció del web cathalaunia.org dedicada a recollir les epigrafies ibèriques conegudes. Llavors, aprofitàvem l’oportunitat per fer-ho emprant grafs per visualitzar dades sobre les seqüencies dels signes ibèrics. Quatre anys més tard, el recull d’epigrafia, creat en origen a partir de les dades del corpus de ibers.cat, després de canvis estructurals importants (per exemple: la codificació ha passat de 136 a 207 glifs/signes) es reanomena en Corpus Iberika, i per parlar-ne avui tornarem a mostrar grafs amb signes ibèrics. De fet, mirarem de mostrar com es poden disposar mecànicament els glifs ibèrics en ‘mapes de caràcters’, distribucions bidimensionals on signes de valor proper estiguin igualment propers espacialment.

Sobre el tema del nombre de ‘lletres’ de l’ibèric nord-oriental, ja n’hem parlat unes quantes vegades en aquest bloc, d’entrada, per mirar de fer entendre que la proposta actual de codificació per a Unicode es queda curta, molt curta[1]. Però el tema va més a l’arrel, al propi esquema de desxiframent actual i als seus problemes. Fa uns mesos, es va fer un recompte de co-variants (variants d’una mateixa ‘lletra’ que es detecten en un mateix testimoni epigràfic). Els resultats indicaven que caldria poc menys de 100 signes per mantenir la variabilitat estructural de l’evidència i es va fer un article per recollir-ho formalment. La reacció que es rebé fou d’incredulitat, les dades havien d’estar malament…[2]! Havent incorporat posteriorment a la majoria d’entrades del corpus (el 85%)  els esquemes o calcs publicats de les inscripcions que fan els experts que treballen les peces, com un mecanisme de verificació públic, es va tornar a fer el recompte, fa poc, i els resultats es mantenien. Ara és el cas de veure com una aproximació, també estrictament quantitativa però completament diferent, torna a donar una xifra similar. La formalitat del que aquí explicarem superficialment ha pres forma en un nou article, qui la vulgui allà la trobarà: Vilaseca i Corbera, Joan : 2017 : “Els caràcters de l’ibèric nord-oriental, una aproximació quantitativa”.

Mapes de caràcters.

Imaginem que volem disposar les lletres, els signes d’una escriptura, en un quadre. Les disposicions són òbviament innumerables, de manera que, per començar, afegim que volem que reflecteixin les característiques observables, i per exemple, diguem que fem que la mida de cada signe estigui d’acord amb la seva freqüència, i que signes més grans indiquin signes més comuns. Ens faltaria encara l’element clau, un criteri de disposició espacial. Si coneguéssim bé la natura dels signes – pensem que estem fent un quadre del català – podríem agrupar separadament vocals, majúscules, signes accentuats, etc, etc, però i si no ho sabem? És aquí que entren els grafs.

Imaginem que no sabem la natura dels signes però que en podem mesurar alguna mena de semblança entre ells (per exemple, cal·ligràfica). Si podem establir un grau de semblança – o de diferència si es prefereix – entre glifs, podem expressar en un valor numèric la relació que cada un d’ells té amb cada un dels altres signes. Diguem que cada lletra és un node i que els graus de semblança són les connexions i ja tenim un graf. Ara, un graf, no és un quadre, cal encara dissenyar un mètode per situar els nodes dins dels quadre. Es pot fer  a mà, i segur que quedaria millor, però no tindria gràcia, volem que ho faci la màquina. Una forma de fer-ho és imaginar que cada connexió és com una molla, un vector de força, és a dir, que els nodes del graf ‘volen’ estar a una certa distància dels altres (segons les connexions que tinguin – i evidentment, dels seus valors-). Aquí entra la programació i el que es coneix com algoritmes de distribució de forces, que no és més que simular que passaria si efectivament féssim materialment la prova[3]. Les maneres de fer-ho són innumerables també, però en general, el que cerquen és una distribució que minimitzi les discrepàncies entre els valors de les connexions i les distàncies entre els nodes dins del quadre[4]. Podria semblar que donats uns valors de connexió determinats, el resultat hauria de ser sempre el mateix, però el cert és que no, poden (i sovint hi han) moltes disposicions ‘correctes’ (i més encara de ‘mig correctes’). El que es fa, és situar inicialment els nodes en posicions aleatòries dins el quadre, deixar-los anar tots a l’hora i anar canviant les posicions de mica en mica, fins que no es moguin – gaire – (el que es coneix com tècniques de gradient o de ‘recuita simulada‘ (una traducció horrible!). Fem-ho unes quantes vegades, per assegurar que la disposició no és espúria (al partir de valor aleatoris, es poden donar situacions atípiques) i ja ho tenim: un mapa de lletres. Substituïm el criteri de semblança cal·ligràfic per un de distribucional (entre quins signes figura un determinat signe) i partim de les dades del corpus Iberika, i tindrem un mapa de caràcters de l’ibèric nord-oriental; quelcom similar a això:

Mapa de caràcters anotat de l’ibèric nord-oriental.

Bé, com es pot entendre, ens hem saltat unes quantes passes. Primer caldria presentar els glifs (els del signari de corpus Iberika), i com s’han agrupat (en les categories del signari simplificat del mateix corpus, que ve a ser una simplificació de les de la proposta per a Unicode).  En una matriu:

Categories i glifs emprats.
La columna Grups presenta el nombre de caràcters en la proposta per a Unicode.

I presentar el graf del qual s’ha derivat el mapa anterior.

El graf del mapa de caràcters anterior.
En format svg es pot fer el zoom que es vulgui.

I encara ens hem saltat un detall important. Si fem -només-  el que hem explicat abans, connectar tots els nodes/glifs a tots els altres, el resultat no seria aquest graf, seria més aviat quelcom així:

Tots contra tots.
La versió svg va amb colors.

Un graf també interessant, ja que podem observar una cosa que no es veia en l’altre: com s’agrupen les vocals per una banda, les consonants contínues per altra, mentre que la resta, està ben dispersada. Què és el que falta -en essència- per des d’aquí anar al graf i mapa d’abans? Doncs incorporar les incompatibilitats.

Per més que dos glifs tinguin distribucions semblants, si són d’aspecte diferent i apareixen junts en una mateixa epigrafia, han de ser diferents. El que es fa doncs, és, en el graf plenament connectat, anar i desconnectar els nodes/glifs que apareixen junts en alguna epigrafia del corpus. Així de simple. Bé, tampoc no del tot, no sempre… Com que el signari està pensat per ser força semblant als originals, recull formes que són molt properes, i que si es troben juntes pot ser que es tracti de variacions involuntàries, per exemple, degudes a la natura autògrafa de molts dels testimonis. En una imatge es veuen bé les semblances.

Glifs considerats ‘equivalents’.

Si trobem alguna parella de glifs que estigui en alguna d’aquestes ‘equivalències’ en mantenim la connexió (és com si fossin un mateix glif). Fent abstracció doncs d’aquests casos, el resultat és que un node només queda lligat i per tant es situa vers els glifs amb els que no co-apareix, i ho fa, segons el grau de semblança de les seves distribucions. En altres paraules, la disposició dels nodes en el graf és indirecta; si els glifs d’una certa ‘lletra’ trobem que se’ns ajunten és perquè el joc de forces vers la resta de glifs així els agrupa, no perquè hagin d’estar connectats entre ells. La proximitat no implica forçosament connexió, sols augment de probabilitat de semblança en les distribucions vers la resta de glifs.

O, parlant amb propietat, així seria si en comptes d’un espai euclidià i de dues dimensions ho féssim sobre un d’infinites (o un nombre lo prou gran per harmonitzar els factors de connexió), el fet d’haver-ho de fer en un espai n-dimensional, fa que el nombre de disposicions alternatives augmenti. El resultat és que un mateix graf pot presentar moltes disposicions depenent de la posició inicial. Dit així sona pitjor del que és. En la pràctica, la majoria de conjunts de dades generen disposicions que mantenen les posicions relatives, o bé que oscil·len entre un conjunt de situacions relatives en els casos més inestables. En la pràctica el que s’ha fet és fer 5 proves sobre un mateix graf, i analitzar-ne el conjunt[5].

O sigui, per cada prova, analitzar les 30 categories de la taula anterior una a una, mostrar la seva disposició i veure quins grups es formaven i amb quins glifs. El resultat, final, és:

89 Grups discernibles i els seus glifs més probables.
En gris els poc documentats (<=10), en vermell els rebutjats en el càlcul.

On resulta que el nombre de grups detectat és de 89, per xiripa, el mateix que s’havia detectat en les co-aparicions (cal entendre que la forquilla és força àmplia i poden haver-hi variacions menors, per exemple, per errors no detectats en les dades, o en la interpretació dels resultats) . El que no sembla probable que sigui casualitat és que dues mesures metodològicament tan diferents coincideixin en uns resultats tan propers!

El títol parla de 100 signes, és una simplificació, una xifra rodona, justificada si pensem que als 89 detectats cal sumar com a mínim separadors i metrològics. Vol dir el que hem explicat fins aquí, que existiren els 100 signes a l’hora? No ho sé. En tot cas, si es vol negar, caldrà donar una explicació a perquè dues mesures tan diferents fetes sobre el corpus (co-variants i distribució) donen resultats tan propers. És més, en una mirada global sobre el signari i les distribucions (la taula anterior) hom pot veure sense gaires dificultats una sèrie de regularitats globals que mal poden ser fruit de l’atzar.

Les tres majors potser serien:

  1. Els grups amb E, (E,Be,Te,Ke) tenen gaire bé el doble de glifs que la resta. No serà que hi havien 6 vocals base i no 5 ? Els grecs en tenien 7 i les diferenciaven (i amb dues es: èpsilon i eta -ε η- derivades de les he i het semítiques -ה‎ ח‎-). A casa nostra, a la Tolosa del s.II ac, tenim un exemple del seqüència …IOU (veure I02151 i la seva bibliografia[6])…
  2. L’element gràfic diferenciador quantitativament més important, no és com es podria pensar, l’adició d’un traç medial (marca del signari dual), sinó l’adició o extensió en la part inferior d’un traç vertical. El tenim entre els Ti i els To, però també entre bona part dels glifs de les vocals i consonants contínues. Fins ara no se’ls ha tingut en compte, però les seves distribucions són diferenciades, fet que exclou l’atzar.
  3. En el quadre d’abans, certament es poden trobar identificades les dualitats pròpies del signari dual, que veuen així provada numèricament la seva existència, el problema és que al seu costat apareixen divisions més complexes, per exemple, de 4 i no de 2, i de nou, no sembla raonable pensar que és tracti d’una casualitat. En altres termes, si el mètode emprat detecta les dualitats conegudes, hem de fer el cec a les demès, que a més, a voltes tenen un suport documental encara més potent? No sense uns motius ben clars.

Preguntes, preguntes que caldria que la Filologia respongués, però això sí, a partir de dades objectives i raonaments lògics.

El que hem comentat, aquestes mesures (co-varians i distribució) estan fetes sobre una foto momentània. El signari ibèric del corpus Iberika, té en el moment de fer la prova 207 glifs, però n’hi han més de 60 detectats esperant entrar, de manera que probablement per poder representar amb un grau de fidelitat alt els continguts futurs caldrien potser 300 glifs (poden semblar molts, però nosaltres amb una llengua de menys caràcters en fem servir força més, des de fa segles). Ara, cal entendre que l’evolució de les dades no és excusa de res, tota vegada que va en el sentit de reduir les ambigüitats i que els canvis afecten progressivament a un volum menor d’informació, Els més de seixanta glifs a afegir, que poden semblar molts respecte als 207 actuals, per exemple, o són hapax legomenon i aporten una informació nova, que no hi era abans, o són variants molt poc freqüents d’altres signes, i per tant fan la foto encara més precisa; però entre tots ells, no arribaran ni al 1% dels continguts existents. Tant de bo trobéssim una biblioteca en ibèric, o un bon grapat de ploms escrits, llavors sí que caldria refer aquests càlculs, però si això no passa, cal entendre que les variacions previsibles, per noves aportacions, o per correcció o millora de les dades, seran petites.

Una darrera pregunta sistèmica que no deixa de treure el cap en considerar els orígens de l’escriptura ibèrica.

Segurament en els seus inicis era ben sabut d’on van venir els seus introductors  o a qui imitaven si fou una iniciativa local. No fa gaire mostràvem un resum d’alfabets mediterranis del segle passat, on podem veure com la majoria de signes ibèrics tenen precedents clars.

Paleosignaris mediterranis.

Però al mateix temps, per poc que es miri els glifs ibèrics i les seves formes, un no pot deixar de notar les senyals d’un sistema estructurat (ni que sigui parcialment). Els 3 glifs bàsics de les As tenen un valor R en les seves formes especulars, l’equivalència cercle=rombe, símbols girats 90 o 180 graus, versions especulars, l’adició de traç inferior o medial, etc. No fa gaire també donàvem una distribució -casolana- dels glifs per semblança:

Glifs per estructura gràfica.
Verd=Blau+traç inferior.
Falta la Bi curta…

La pregunta és  ben simple: com es combinen aquestes dues evidències? Què és adoptat i què adaptat? Van venir uns signes ja llavors mil·lenaris i van ser sistematitzats aquí, o ja vingueren amb la seva part de sistematització? Realment en sabem tan poc del que hi havia a mitjans del primer mil·lenni abans de Crist com per no trobar precedències en el Mediterrani o l’Orient Mitjà…? I el que personalment potser trobo més interessant: què ens dirà tot això de la nostra Història?

 


Notes

  • [1] I el més trist és que tot apunta a que al consorci Unicode ja li sembla bé no donar un espai numèric adequat per expressar una escriptura desapareguda. Caldrien uns 300 code-points i en tenen pre-adjudicats unes desenes.
  • [2] I sense proves!
  • [3] És un tema que em resulta especialment proper per els records que em porta, de fa anys, parlant davant de la pantalla amb alguns dels primers que programaven aquests algoritmes sobre com mirar d’evitar els problemes dels mínims locals…
  • [4] Per fer-ho curt: les connexions o distancies no tenen perquè formar una mètrica. Tres punts en un pla, que no estiguin en línia, sempre formen un triangle, tres segments, no sempre.
  • [5] Això també és una simplificació, en realitat les 5 proves, s’han completat amb tres mesures més. Dues amb corpus més reduïts, però tipològicament més coherents, i una ignorant les ‘equivalències’ entre glifs. Per tal de tenir dades de les variacions majors a l’hora d’avaluar els resultats.
  • [6] I ens estalviem d’entrar en les batalletes i contraposicions sistemàtiques entre grups de diferents escoles, tan habituals i que vist de fora només fan que treure credibilitat a la disciplina.
Advertisements
Aquesta entrada s'ha publicat en cathlaunia.org, corpus Iberika, esquemes, estadística, grafs, ibèric nord-oriental, Iberika, ibers, mapes de caràcters, Signari ibèric i etiquetada amb , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s