Variabilitat sígnica de l’ibèric nord-oriental (3).

En l’apunt anterior ens havíem quedat  a les portes de crear un graf a partir del corpus en ibèric nord-oriental amb un node per cada un dels seus glifs i connectats segons el grau positiu de correlació de Pearson de la seva distribució, modulat per el factor de confiança F allí descrit[1]. El signari ibèric emprat defineix 207 signes però 6 són considerats separadors (línies verticals de punts), 4 són marques metrològiques i 3 no figuren el corpus, aixo deixa un signari hàbil de 194 glifs, xifra que es veurà encara més reduïda per els cassos sense connexions/correlacions superiors a 0.001[2]. El graf resultant (disposat amb l’algoritme ForceAtlas) presenta 155 nodes amb 1603 connexions.

El corpus ibèric 155 glifs, 1603 connexions.
Cliqueu per imatge a mida gran o en format svg.

Un graf que il·lustra molt bé la complexitat del problema. Per una banda, en una mirada superficial i segons el desxiframent actual, es poden percebre tres grups: a l’esquerra tenim les vocals, en la part més alta, un de consonants no oclusives i en la part dreta i poc dibuixat, n’hi ha un que és un autèntic tuttifrutti (potser nascut del pes de les evidències marginals?). Però més enllà d’aquestes agrupacions el graf presenta un alt nombre de nodes dispersos, tot i que la seva distribució està lluny de semblar aleatòria i de fet, planteja algunes possibilitats interessants. Fem un breu repàs.

Entre les vocals i les consonants contínues tenim agrupats tres variants amb forma de V i Y (codis 62,63 i 65 en el signari de cathalaunia) que per posició suggereix que podem estar davant d’un cas de doble sonoritat i que caldria desdoblar-les en una m? i una vocal (o/u?), o potser un sil·làbic?. També resulta estrany que si bé en general les vocals presenten una localització força clara, les is, tenen també variants en la dispersió del quadrant inferior/dreta. En la part central i aïllada dels tres grups més clars, figura el signe Ba (el més freqüent), amb dos Tis aprop, probablement aquesta disposició sigui provocada per el pes dels numerals en el corpus. En la línia de les 7h (com si el graf fos un rellotge) tenim un grup de tres signes Bo/Ta. En la de les 6h, trobem tres Pis. Entre les 4 i les 5h tenim fins a nou signes Ke, i ben curiosament, al seu costat el signe Ba corbat, que ens faria pensar si no hi han casos en que caldria llegir-lo com un Ke. Al costat dels Kes i fins les 3h trobem fins a 6 signes Be. Entre les 12 i les 3h tenim l’amàs dispers que dèiem, però en la part exterior de les 3h tenim tres variants de Ka, i en la de les 2h quatre Tes junts.

En conjunt, queda clar que tot i que a semblança del corpus en català els grups de consonants contínues i de vocals fan de fàcil delimitar, el problema està en la resta de signes que es comporten de manera ben diferent i que fa pensar efectivament en una natura dual, sil·làbica, funcionant com a consonant a una banda i com a vocal en l’altra. Sent la idea base comparar entre quins signes apareixen els glifs, queda clar que una escriptura alfabètica amb només dues menes de signes, serà més fàcil de detectar tota vegada que l’alternança és la pauta a esperar, mentre que la presència de signes compostos, multiplica les possibilitats, que sembla que és el que reflecteix el graf. Amb tot, la complexitat del graf fa pensar en alguna raó afegida, ja que no sembla evident que la presència de signes sil·làbics per se hagi de produir un graf més dispers…

Això per el que fa a la distribució espacial, provem ara amb l’altra eina, la modularitat, però en comptes d’intercalar les onze particions/mesures com hem fet en l’apunt anterior, el que farem serà deixar-les en nota[3] i fer servir el seu mapa resum (tècnica que s’ha descrit en una actualització del l’apunt anterior).

El resultat és força variat i el que farem serà marcar amb verd els glifs per els quals entre els glifs més propers – segons modularitat acumulada – es detecti una majoria de glifs equivalents segons el desxiframent actual, i amb vermell els que no sigui així, és a dir, els que resulten més interessants…!

Mapa de glifs propers per modularitat acumulada
(els nombres indiquen la quantitat d’agrupacions compartides).

En verd els que presenten majoria de glifs acords amb el desxiframent actual..
En vermell els que no.

Els comentem per ordre:

  1. En primer lloc el glif que sembla una E inclinada a l’esquerra (codi 41, 6 entrades) sembla ser una I.
  2. El signe espiga de 2 branques (codi 43, 17 entrades) segons això seria una O.
  3. Curiosament una de les Os de 2 travessers (codi 51, 5 entrades) sembla confondre’s amb una E, tot i que figura com a companya dels altres signes O…
  4. En els dos signes de L (codis 56 i 57, 374+537 entrades) apareixen com properes i formant un grup coherent entre ells amb un signe M (codi 60, 99 entrades) i un glif com una L especular (codi 59, 8 entrades).
  5. El signe de forma de F (codi58, 29 entrades), apareix com una E.
  6. La A amb forma de R oberta  (codi 61, 85 entrades) sembla funcionar com una O.
  7. El signe Ba (codi 83, 717entrades) situat al centre del graf no presenta cap glif proper amb sentit evident tot i que forma un grup coherent amb quatre glifs més: un Te (codi 103, 34 entrades), un Ki (codi 193, 18 entrades), una nasal (codi 239, 14 entrades) i un de desclassificat (codi 213 , 2 entrades).
  8. El Ba corbat (codi 84, 26 entrades) que per posició està proper a signes Ke, per modularitat ho esta de signes Ka, un altre exemple de classificació contradictòria.
  9. El Ta amb forma de creu de Sant Andreu (codi 87, 480 entrades), també en posició central en el graf, s’associa majoritàriament amb signes Ka,
  10. Tot i que els signes Ka més habituals semblen agrupar-se de manera correcta, la variant amb el traç afegir a l’esquerra (codi 91, 77 entrades) forma un grup coherent amb dos Tes (codis 101 i 102, 32+45 entrades) i un signe Be (codi 183, 1 entrada).
  11. Un altre grup estrany però coherent el formen dos signes Be (codis 95 i 186, 13+43 entrades), dues Is (codis 145 i 197, 12+22 entrades) i un signe Bo (codi 212, 4 entrades).
  12. El signe Te amb forma de rombe partit per una línia vertical (codi 107, 20 entrades) s’agrupa amb glifs de sibilants.
  13. Un dels grups coherents però sense sentit evident més grans està format per 8 signes (codis 127,219,206,203,195,189,161 i 128, 1+8+20+24+62+3+10+1 entrades).
  14. Un de més petit ajunta un signe Pi (codi 141, 4 entrades), una Be (codi 174, 3 entrades) i una O de quatre travessers (codi 185, 3 entrades).
  15. Les sibilants s’ajunten de manera quasi perfecte tret de d’una variant de la de forma de M (codi 142, 91 entrades) que ho fa amb les sibilants simples.
  16. Una hàpax de Te (codi 143, 1 entrada) s’ajunta amb signes Ti, en un grup que comentarem un xic més avall).
  17. Una variant de S poc habitual (codi 144, 19 entrades) amb tres signes Ka ben documentats (codis 88,89 i 90, 140+23+227 entrades).
  18. Un grups curiós està format per dos Kes poc freqüents (codis 169 i 204, 3+4 entrades) i dos Kis (codis 194 i 196, 8+23 entrades).
  19. Una tripleta també aparentment espúria esta formada per una I ben documentada (codi 180, 23 entrades) , un hàpax de Ke (codi 129, 1 entrada)  i un Tu poc freqüent (codi 233, 22 entrades) .
  20. El grup esmentat en el punt 11, apareix però en comptes d’un signe Bo, presenta una tercera I al grup (codi 182, 18 entrades).
  21. El signe Bo de sis puntes (codi 205, 58 entrades) apareix amb dos signes To (codis 207 i 209, 38+86 entrades).
  22. Un dels signes To (codi 210, 25 entrades) de branques inclinades s’agrupa amb un signe Ku (codi 236, 111 entrades).
  23. Peró el més curiós és que l’altre To que té una base puntual (codi 211, 25 entrades) s’ajunta amb un grups de signes Ti, amb els quals comparteix figura (de fet hi han variants de Ti – no registrades en el signari – que dibuixen l’asta no per baix sinó en la part alta del traç medial). De manera que potser sí calgui considerar-lo una forma de Ti i no de To.
  24. Un altre binomi inesperat és el format per un signe Ko (codi 217, 39 entrades) i un signe rar, una espiga de tres ramificacions (codi 240, 8 entrades).
  25. I el signe Ko semblant a l’anterior però sense traç medial, i encara més ben documentat (codi 220,366 entrades), es veu inclòs en un grups de tres signes Ku, (codis 236, 237 i 238, 111+101+80 entrades) més el signe To del punt 22.
  26. Hi ha un grup coherent de fins a 5 signes Tu que incorporen però dues excepcions, un signe Te(codi 222, 2 entrades) i un signe M? (codi 243, 5 entrades).
  27. El signe To en forma de V invertida (codi 235, 19 entrades) es veu ajuntat amb dos signes Bu (codis 224 i 225, 13+9 entrades). En la situació espacial es veia situat a prop del seu homòglif de valor Ka (codi 92, 8 entrades) i per tant, potser es tracta d’una lectura incorrecta.
  28. Un signe inusual i interpretat com una nasal (codi 241, 3 entrades) es veu però consistentment agrupat amb sibilants. Potser una altra assignació a contemplar?
  29. I finalment, un encert inesperat. Un signe com una R especular (codi 248, 10 entrades) usualment interpretada com una R es veu efectivament agrupat a altres glifs de R.

En les agrupacions per modularitat, tenim doncs fins a 103 glifs de 155 correctament agrupats, és a dir, un 66% d’encert. I el terç restant aporta algunes possibilitats de relectura que caldria verificar, en concret, els punts 1, 2, 3, 5, 6, 8, 12, 17, 23, 27, 28  de la llista anterior. Cal entendre que en ser una anàlisi estrictament quantitativa, ha de ser en tot cas la Filologia la que dictamini l’encert o l’error de tals possibilitats.

En conjunt, doncs tenim una barreja d’encerts i d’errades en la mesura de les distribucions dels diferents glifs del corpus ibèric segons la correlació de Pearson modulada per el factor de confiança F, si l’expressem com una xarxa formada per els seus signes connectats segon les correlacions entre les seves distribucions, i n’analitzem la seva disposició espacial i l’estructuració de les agrupacions per grau de modularitat.

Coda

On ens deixa aquest experiment? Doncs amb una certa ambivalència. El mètode descrit funciona perfectament en un corpus alfabètic com és el del català, i per tant, buida de contingut la primera objecció sistèmica que ens fèiem al començar (la derivada del fet que lletres diferents poden tenir distribucions semblants), no per què sigui falsa (les agrupacions espacials de vocals i consonants ho testimonia clarament) sinó per què amb una anàlisi quantitativa els detalls entre les diferents distribucions tenen un pes suficient com per discriminar entre signes propers. Queden però les altres dues.

I el fet és que la mateixa mesura aplicada al corpus ibèric es mostra d’entrada, limitada. La dispersió de les dades segurament està introduint un nivell de soroll que supera el del ordenament natural de l’escriptura, i no es pot descartar que no hagin més glifs de sonoritat múltiple per detectar i desdoblar (la segona objecció). Però segurament el factor principal sigui la dispersió deguda a la manca d’evidència (la tercera objecció) , tota vegada que es pot observar com la majoria de grups espuris i glifs mal situats per la modularitat estan formats per signes molt poc evidenciats. Una altra consideració genèrica a fer és que probablement sigui apropiat canviar la idea inicial de considerar només els glifs immediatament al costat d’un signe determinat. En signaris alfabètics, l’alternança vocal/consonant hauria de ser la norma, de manera que si el signe és vocàlic, cal esperar que la majoria de parelles que l’envolten siguin consonants i viceversa si el signe és una consonant. Aquest esquema tant regular – i que tan bé funciona en aquesta metodologia d’anàlisi – desapareix si tenim signes sil·làbics, ja que aquests podran aparèixer també tant abans com desprès i per tant això fa que les distribucions de les parelles que envolten a un signe determinat seran més complicades. Queda clar que cal seguir pensant, la bona nova és que certament, de vies a explorar no en falten…

En resum, i per tancar ni que sigui provisionalment aquesta inesperada minisèrie d’apunts, diríem que l’anàlisi quantitatiu del corpus (i en concret de les correlacions entre les distribucions dels glifs) es revela com una eina molt efectiva i amb un alt potencial d’ajut en l’estudi de l’escriptura ibèrica, amb la virtut estructural de ser completament objectiva.

 


Notes

  • [1] Per distribució entenem el recompte de entre quines parelles de signes es documenta cada un dels glifs del corpus. F és una F-mesura feta a partir del percentatge i la quantitat normalitzada de factors comuns entre dos distribucions.
  • [2] Els codis no presents en el graf son: 55, 64, 99, 100, 106, 117, 127, 128, 129, 130, 132, 133, 134, 135, 136, 137, 139, 162, 163, 164, 165, 168, 170, 171, 172, 175, 176, 177, 178, 179, 181, 188, 199, 202, 214, 215, 216, 218, 223, 229, 230.
  • [3] Els grafs de les particions per Modularitat del mapa-resum són:

    P=2. 3 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=1. 4 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.9. 7 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.8 8 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.7. 8 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.6. 10 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.5. 12 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.4. 14 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.3. 17 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.2. 25 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

    P=0.1. 34 grups.
    Cliqueu per gràfic de mida real o seguiu l’enllaç per format svg.

Advertisements
Aquesta entrada s'ha publicat en cathalaunia.org, coeficient de Pearson, comparació de variants, detecció de variants, epigrafia ibèrica, estadística, F-mesura, ForceAtlas, Gephi, ibèric nord-oriental, Iberika, modularitat, Signari ibèric i etiquetada amb , , , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s