Repeticions en el corpus d’epigrafia ibèrica nord-oriental.

Una de les primeres coses que es va fer un cop les més de 3.000 epigrafies[1] del corpus epigràfic ibèric nord-oriental havien estat introduïdes, va ser realitzar un buidat de totes les repeticions de grups de signes que s’hi poden trobar entre elles. Això es va fer tant a partir del signari complert, és a dir, diferenciant per exemple entre els diferents signes A, com a partir del signari simplificat, és a dir, no diferenciant entre les diferents As.

Un pas posterior, és anar entrada per entrada documentant la bibliografia disponible i anar recollir la informació rellevant que es pot trobar en la web. En aquest sentit, el recull Hesperia, s’espera que sigui una gran font d’informació un cop honorin la promesa d’accés obert que consta en les pàgines de presentació (actualment demana paraula de pas) ja que es podria lligar cada entrada del corpus amb les corresponents del seu recull. Vagi doncs des d’aquí la petició que l’accés públic incorpori – a semblança dels registres bibliogràfics – una URL única i estable per cada un dels registres.

Però el fet d’haver calculat totes les repeticions de signes que existeixen en el corpus, una de les primeres coses que ens permet és de detectar quines entrades epigràfiques s’assemblen a quines altres. No es tracta sols de casos de transcripcions lleugerament diverses d’un mateix grafit o de repeticions sistèmiques com en el cas de les entrades numismàtiques, la cerca sistemàtica feta permet detectar aquests casos i moltes altres repeticions parcials. Encara no està clar la manera de registrar en el corpus que una entrada és idèntica o molt propera a altres entrades. En el Fons Cathalaunia, entre identitats humanes  i entrades toponímiques homònimes s’ha utilitzat un recurs consistent en apuntar manualment la semblança d’una entrada amb una altra a base d’anotacions en el format : idem a X , Y , Z ?, on X, Y, i Z són les entrades que es consideren compatibles. En el cas però del registre epigràfic ibèric, aquest sistema, tot i  que s’ha començat a utilitzar no sembla el més adient, ja que la informació sobre la que descansen les semblances és molt i molt més estable que les que les fonamenten en els registres toponímics i censals de l’Alta Edat Mitjana Catalana del Fons. Aquest tema, està doncs encara en fase de plantejament i pendent d’una solució acceptable.

Tenim però ja calculades totes les semblances, així que parlem d’elles. Ens centrarem en les calculades a partir del signari simplificat, que tal vegada siguin les que resultin de major utilitat. Entre les 3.071 epigrafies del corpus, tenim 3.782 seqüències d’entre 2 i 23 signes (s’han exclòs les seqüències que contenen espais, i no s’han concatenat les línies de les epigrafies multilineals). El seu desglòs:

  • 2 – 668 seqüències repetides.
  • 3 – 1710 “
  • 4 – 770 “
  • 5 – 308 “
  • 6 – 144 “
  • 7 – 72 “
  • 8 – 49 “
  • 9 – 22 “
  • 10 – 11 “
  • 11 – 8 “
  • 12 – 6 “
  • 13 – 2 “
  • 14 – 1 “
  • 15 – 2 “
  • 16 – 1 “
  • 17 – 2 “
  • 19 – 1 “
  • 20 – 2 “
  • 21 – 1 “
  • 23 – 2 “

I per cada una tenim les epigrafies específiques on es detecten, i per tant, podem utilitzar els sistemes de visualització de grans volums de dades a base de grafs interactius (fitxers SVG) que hem estat utilitzant recentment tant per ‘visualitzar’ el cens de la Gòtia d’inicis del segle X, com per analitzar les agrupacions sígniques de l’ibèric nord-oriental.

El que farem serà fer grafs amb dues menes de nodes: uns de blavencs, que correspondran a cada una de les epigrafies implicades i uns de rogencs per indicar les seqüències de signes que es repeteixen. Els lligams entre ells, farem que reflecteixi el percentatge de l’epigrafia que és cobert per la semblança amb la idea que sigui màxim (100%) si l’epigrafia i la seqüència repetida són idèntiques. A més, farem que el rogencs dibuixin en ibèric la seqüencia en qüestió mentre que el blavencs mostrin el codi de l’entrada epigràfica (entre I00000 i I99999). Fent clic en aquests segons ens obrirà el registre corresponent a la seva entrada epigràfica, mentre que clicant sobre els rogencs ens obrirà la utilitat de cerca del corpus epigràfic preparada i apunt per realitzar llavors la cerca desitjada. L’algoritme de distribució emprat serà en tots els casos el Yfan-Hu proporcional.

Comencem per les seqüències més llargues, les d’entre 8 i 23 signes. Tenim 110 seqüències entre 193 epigrafies i un total de 281 connexions entre elles.

mp8-yf-400-th

110 Seqüències entre 8 i 23 signes, en 193 epigrafies.
Cliqueu per SVG interactiu associat.

Es poden apreciar clarament les agrupacions, que lògicament en cadenes sígniques tant llargues, són certament escasses, en concret: 64. Utilitzeu a fons el zoom en aquests grafs per una bona identificació i lectura[2].

Mirem ara d’incrementar el nombre de seqüències, incorporant al graf previ les de 7 i 6 caràcters:

mp6-yf-500-th

326 Seqüències entre 6 i 23 signes, en 616 epigrafies.
Cliqueu per SVG interactiu associat.

Aquí el nombre d’agrupacions visibles augmenta fins les 142, el nombre de seqüències arriba a 326 i el d’epigrafies al de 616, o una quinta part del total del corpus. Resulta ben evident els grups al voltant d’una sola seqüència (molts d’ells d’origen numismàtic). Però podem encara mirar d’anat més enllà i mirar de visualitzar totes les seqüències repetides de 4 o més signes:

mp4-yfml-2000-th

1404 Seqüències entre 4 i 23 signes, en 1300 epigrafies.
Cliqueu per SVG interactiu associat.

Aquí ja tenim un graf fortament connectat, i que amb 1.300 epigrafies (un 42% del total) i 1.404 seqüències comença a ser massiu i en el que les agrupacions si bé encara són discernibles, ja mostren un alt grau d’interconnexió que dificulta molt la lectura.

Deixarem doncs en aquest punt aquest apunt, per tal que l’usuari explori aquests grafs interactius per anar-hi trobant les ciutats, les expressions i les rareses que sense cap mena de dubte hi son capturades. Ja que de fet, l’objectiu de fer aquests grafs no era altra que ajudar en l’anàlisi de les repeticions existents en el corpus epigràfic ibèric i el d’aquest apunt, no és altra que compartir els materials de recerca amb qui així ho desitgi.

Notes

  • [1] Actualment: 3.071, per ser exactes.
  • [2] Per una navegació més fluïda, es recomana configurar el navegador que s’estigui utilitzant de manera que el zoom sigui aïllat per pàgina o pestanya i si cal, augmentar el percentatge màxim de zoom. En el Firefox, això es pot ajustar en la pàgina de configuració about:config modificant les entrades: browser.zoom.siteSpecific a false per tenir zoom individualitzat per pestanya i per incrementar el zoom efectiu, per exemple: posar zoom.minPercent a 10 i zoom.maxPercent, per exemple a 2000. i toolkit.zoomManager.zoomValues a .1,.2,.3,.5,.6,.7,.8,.9,1,1.1,1.2,1.33,1.5,1.7,2,2.4,3,4,6,8,10,12,14,16,18,20. On la primera indica fins un mínim d’un 10% d’allunyament, la segona un augment màxim de 20 cops (2000%), i la tercera – i també imprescindible – indica els factors a aplicar cada cop que es puja o baixa el nivell de zoom, en aquest cas entre .1 i 20.
Aquesta entrada s'ha publicat en estadística, Fons Cathalaunia, Hesperia, iber, Iberika i etiquetada amb , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s